DeepSeek时刻 - 第11页

KTransformers推出基于英特尔芯片的DeepSeek-R1/V3，性能飙升28倍！大家好，我们是 KTransformers 团队（以前因为做了一个叫 DeepSeek-V2 的本地 CPU/GPU 混合推理开源项目而挺有名的）。

一网友花了10万美元跑了30多家医院后，用AI找到了病因，并把它免费开放！点击标题：大家好，我想分享一下自己这几

中国消费级 GPU 制造商现已开始支持在本地系统上运行 DeepSeek 的 R1 LLM 模型，加入全球 AI 竞赛。你的下一个家庭AI实验室可能有 48GB 的中国卡。

上周五，一篇新李飞飞团队出品，简称s1论文">url=https://arxiv.org/abs/2501.19393?ref=jdon.c

极简推理革命，7GB显存小模型也能“顿悟”；15G显存，任何小模型秒变推理模型。今天，我们很高兴在 Unsloth 里加入“推理”这个新功能！DeepSeek 的 R1 研究发现了一个“顿悟时刻”——R1-Zero 通过一种叫“组相对策略优化（G

人工智能发两个方向：GPU硬件和强化学习算法，这两个方向是条条大路通罗马还是南辕北辙？首先，让我们了解一下强化学习算法代表DeepSeek DualPipe 算法，再谈谈英伟达的GPU硬件！ 1

基于DeepSeek两篇新论文发现：发现推理时间太长也不一定能提高准确性，然后，只要蒸馏基础知识好，少量数据就能快速完成推理，少即是多。 1、

蒸馏法最近上了新闻（！）是因为@deepseek_ai。其实蒸馏最初那篇论文《蒸馏神经网络中的知识》在2014年被NeurIPS拒了，理由是没啥新意（确实有

DeepSeek极端榨取硬件性能，看起来不同寻常！推理和训练之间最大的区别之一是通信需求。 1、对于推理：芯片之间不需要太多通信。你可以把它想象成普通的

DeepSeek R1 的发布意味着 AI 的普及是必然的，因为它让人们能轻松创建新的推理数据集，并用这些数据训练强大的 AI 模型。现在，Prime Intellect 这家公司通过发布 SYNTHETIC-1 证明了这一点。这个数据集包含了 140 万个带有“思维链”的推理样本，都是由

伯克利团队以 4,500 美元重现 DeepSeek 的成功：1.5B模型超越 o1-preview！ RL强化学习

R1这个人工智能系统坚持保持它自己的特点，不会假装成人类。它有一些设计是为了让用户感到惊讶，而且它拒绝被当作人类来看待，强调自己与人类的不同。它像是一个静止的幽灵，语言上有点自我循环绕圈子的感觉。其实很多人类

都在谈论DeepSeek-R1

从破解CUDA到端侧推理模型，DeepSeek如何颠覆AI领域，挑战科技巨头垄断？ 1、为何DeepSeek能破解CUDA？据传：英伟达只是限制了GPU的硬件功能，但它的软件CUDA并没有改。所以，当DeepSee

Deepseek API 的 Go（Golang）客户端——简单、完整、可靠且高性能特点：简单：它尽可能简单。此外，这是 Go 的惯用方式 - 请求位于请求包下，响应位于响应下。完整：它为所有 API 提供全面支持，包

测试时间扩展（TTS）是一种通过在推理阶段增加一些额外的计算来提高大型语言模型（LLM）性能的重要方法。不过，目前的研究还没有系统地分析策略模型、过程奖励模型（PRM

OpenAI又发布了一个名称类似deepseek的“深度研究”模型，它的表现比之前的模型强得多，甚至能完成一些连博士专家都需要花10小时才能搞定的任务。周五，在“人类的最后考试”测试中最高分达到了 13% 的

OpenAI奥特曼在DeepSeek推理模型开放的精神鼓舞下，刚刚给出o3-mini的推理过程