• KTransformers推出基于英特尔芯片的DeepSeek-R1/V3,性能飙升28倍! 大家好,我们是 KTransformers 团队(以前因为做了一个叫 DeepSeek-V2 的本地 CPU/GPU 混合推理开源项目而挺有名的)。
  • deepseek/deepseek-r1-distill-llama-70b位列排名榜第三名,排在openai/o1和deepseek-r1之后: icon
  • DeepSeek 可能会带火中国的芯片行业,让中国芯片进入一个超速发展时期:DeepSeek V3 从一开始就能在华为的 昇腾 Ascend 芯片上跑推理。华为的 910C 芯片(能匹配英伟达的 H100 )既可以用来训练,也能用来推理。 英伟达厉 icon
  • 性能强劲。跑 deepseek 速度超快,功能齐全充性能,原装未拆封 4090涡轮显卡打折仅96GB,全新靠谱,性能无敌!不挑系统! 不挑驱动! icon
  • DeepSeek R1 Distilled Reasoning 模型通过“思路链推理”来仔细分析复杂的问题。它们不会马上给出答案,而是先花时间生成一系列的“思考”步骤,这通常需要内部处理几百甚至几千个标记。这种方法让模型在给出最终答案之前,能够评估各种可能性。虽然这会增加一些等待时间,但通常 icon
  • 中国消费级 GPU 制造商现已开始支持在本地系统上运行 DeepSeek 的 R1 LLM 模型,加入全球 AI 竞赛。 你的下一个家庭AI实验室可能有 48GB 的​​中国卡。 icon
  • 英伟达新博客文章:LLM生成的GPU内核显示了FlexAttention的加速。前有DeepSeek极端榨取英伟达GPU硬件性能被曝光,英伟达反其道,用DeepSee icon
  • DeepSeek极端榨取硬件性能,看起来不同寻常!推理和训练之间最大的区别之一是通信需求。 1、对于推理:芯片之间不需要太多通信。你可以把它想象成普通的 icon
  • 1865年,威廉·杰文斯发现,尽管蒸汽机效率提升,英国的煤炭消耗却呈指数级增长。这一现象被称为“杰文斯悖论”:技术进步并未减少资源消耗,反而因应用范围扩大而增加了需求。类似的情况可能正在NVIDIA身上上演。尽管AI模型如DeepSeek-R1的效率不断提升,但这未 icon
  • 特斯拉的Optimus有望成为下一个革命性产品,将超越智能手机,成为我们这个时代的标志性技术。 Optimus不仅仅是一个 icon
  • Apple 用自己玩游戏的方式造出了一些特别厉害的自动驾驶汽车“大脑”:……自动驾驶的未来可以通过模拟和现实世界的数据来实现…… Apple 的研究人员完全通过自己玩游戏的方式训练了一些聪明的 icon
  • AI智能三个发展规律:资源驱动、成本骤降、经济价值飙升。 OpenAI山姆奥特曼最近认为:工智能的规模定律将保持不变,“没有理由在不久的将来停止指数级增加投资”! 1. AI智能与资源的关 icon
  • 这篇文字主要讲述了公司在构建公共云服务过程中,对GPU支持的探索和挑战。公司最初投入大量资金,押注于为AI/ML推理任务提供GPU支持,并创建了Fly GPU Machines。然而,尽管GPU在AI/ML领域的重要性被正确判断,但公司发现其产品可能并不适合当前市场需求,尤其是开发者更倾向于 icon
  • Majorana 1:世界上第一个由拓扑核心驱动的量子处理单元 (QPU),设计用于在单个芯片上扩展到一百万个量子比特。 icon
  • 从破解CUDA到端侧推理模型,DeepSeek如何颠覆AI领域,挑战科技巨头垄断? 1、为何DeepSeek能破解CUDA?据传:英伟达只是限制了GPU的硬件功能,但它的软件CUDA并没有改。所以,当DeepSee icon
  • icon
  • 上周五下午,杰弗里·伊曼纽尔在布鲁克林的家里开始写一篇博客。他坐在电脑前敲了好几 icon