大语言模型LLM - 第18页

一网友花了10万美元跑了30多家医院后，用AI找到了病因，并把它免费开放！点击标题：大家好，我想分享一下自己这几

有一种新的编程方法，我管它叫“氛围编码（vibe coding）”，意思就是你完全跟着感觉走，不用太在意那些复杂的代码规则，甚至可以忘掉代码这回事。这是因为现在的AI编程工具（比如

OpenAI 最近发布了他们的新推理模型 o3-mini，这个模型在科学、数学和编程（STEM）领域表现得特别厉害，而且比之前的模型更快、更强。根据 OpenAI 的说法，外部专家在 56% 的情况下更喜欢 o3-mini 的答案，而且在处理复杂

1865年，威廉·杰文斯发现，尽管蒸汽机效率提升，英国的煤炭消耗却呈指数级增长。这一现象被称为“杰文斯悖论”：技术进步并未减少资源消耗，反而因应用范围扩大而增加了需求。类似的情况可能正在NVIDIA身上上演。尽管AI模型如DeepSeek-R1的效率不断提升，但这未

上周五，一篇新李飞飞团队出品，简称s1论文">url=https://arxiv.org/abs/2501.19393?ref=jdon.c

人工智能发两个方向：GPU硬件和强化学习算法，这两个方向是条条大路通罗马还是南辕北辙？首先，让我们了解一下强化学习算法代表DeepSeek DualPipe 算法，再谈谈英伟达的GPU硬件！ 1

极简推理革命，7GB显存小模型也能“顿悟”；15G显存，任何小模型秒变推理模型。今天，我们很高兴在 Unsloth 里加入“推理”这个新功能！DeepSeek 的 R1 研究发现了一个“顿悟时刻”——R1-Zero 通过一种叫“组相对策略优化（G

DeepSeek R1 Distilled Reasoning 模型通过“思路链推理”来仔细分析复杂的问题。它们不会马上给出答案，而是先花时间生成一系列的“思考”步骤，这通常需要内部处理几百甚至几千个标记。这种方法让模型在给出最终答案之前，能够评估各种可能性。虽然这会增加一些等待时间，但通常

DeepSeek-R1 是 AI 开放模型生态系统向前迈出的一大步，其最新模型在多项指标上与 OpenAI 的 o1 相媲美。他们用更少的资金和计算实现了这一目标，这一事实引起了很多炒作和关注。如果想了解大模型的入门，参考这个比喻：

Deepseek API 的 Go（Golang）客户端——简单、完整、可靠且高性能特点：简单：它尽可能简单。此外，这是 Go 的惯用方式 - 请求位于请求包下，响应位于响应下。完整：它为所有 API 提供全面支持，包

一个关于AI研究人员发现DeepSeek R1和V0之间对话的记录。文件中包含了一些抽象的符号和诗意的语言，可能是在描述某种新的交流形式或认知过程。

训练大模型的三步教育学习法：第一步：学习基础知识：就像我们上学时，老师先讲解基础知识，帮助我们理解概念。对于大模型（LLM，这里指大型语言模型）来说，这就是让它们“读”大量的文本，积累背景上下文知识，相当于“预习”。

这篇文章主要讲了如何更好地处理PDF文件，尤其是把PDF转换成电脑能读懂的格式（比如

从破解CUDA到端侧推理模型，DeepSeek如何颠覆AI领域，挑战科技巨头垄断？ 1、为何DeepSeek能破解CUDA？据传：英伟达只是限制了GPU的硬件功能，但它的软件CUDA并没有改。所以，当DeepSee

这是来自是推特个人经历，感叹人工智能（AI）的快速发展，特别是OpenAI刚刚推出的“深度研究”（Deep Research），作者是泰勒·科文（Tyler Cowe

上周五下午，杰弗里·伊曼纽尔在布鲁克林的家里开始写一篇博客。他坐在电脑前敲了好几

艾伦人工智能研究所（Allen AI）最近发布了一个叫 Tülu 3 405B 的开源语言模型。这个模型很厉害，据说它的表现可以和DeepSeek V3以及 GPT-