DeepSeek或匹配华为昇腾AI芯片,寒武纪大涨


DeepSeek正在主动尝试使用华为自主研发的Ascend(昇腾)AI芯片进行新一代R2模型的训练工作。

本来 R2 模型应该在五月就荣耀登场,能够再次遥遥领先于全球开源大模型,但是现在遭遇成长中的阵痛:或因与华为 Ascend 芯片匹配优化等问题延期。开个玩笑:DeepSeek 当时信心满满,觉得换芯就像换个鼠标那么简单,结果一插上电源才发现,这手术台下藏着无数坑。

尽管DeepSeek在使用华为Ascend芯片进行模型训练过程中遇到了稳定性不足、芯片间通信效率偏低以及配套软件生态尚不完善等现实挑战,导致R2模型的训练未能一次性成功,进而影响了原定于5月的发布计划,但我们必须清醒认识到:任何重大技术的成熟都不是一蹴而就的。

美国Nvidia历经多年积累才建立起如今强大的CUDA生态和硬件优势,而中国在AI芯片领域起步较晚,正处于快速追赶阶段。

更令人振奋的是,华为第一时间派出工程师团队进驻DeepSeek办公现场,提供全方位技术支持,展现了中国企业间协同作战、共克时艰的强大凝聚力。这种“并肩作战”的场景,正是中国科技生态走向成熟的重要标志。

面对紧迫的研发周期与激烈的市场竞争,DeepSeek并未因理想受阻而停滞不前,而是采取了务实高效的“双轨策略”——使用Nvidia芯片完成模型训练,同时继续推进与华为Ascend芯片在推理阶段的适配工作。

训练需要极高的计算密度和系统稳定性,而推理则更注重能效比和部署成本,后者正是国产芯片未来大规模落地的关键场景。DeepSeek的做法既保证了产品进度,又为国产芯片积累了宝贵的适配经验。

DeepSeek R2虽有延迟,但据业内消息,该模型有望在未来几周内正式发布,届时或将全面支持国产平台运行。

但除了芯片问题,还有一个坑:数据标注比预想慢得多。就像工地原计划一周搬完砖,结果两周过去了还在搬第一块。国内媒体说 R2 可能最近几周就会发布,听起来像那些装修公司承诺“下个月就完工”,结果下一句永远是“再等一等”。

加州伯克利的 AI 研究员 Ritwik Gupta 说,DeepSeek 的核心概念早被阿里巴巴的 Qwen3 抄走了,而且人家做得更高效。换句话说,这就像你刚发明了一种炒饭手法,隔壁餐馆立马学会,还加了秘制酱料,最后客人都去隔壁吃。

Gupta 还说,华为 Ascend 芯片在训练阶段有“成长的烦恼”,虽然今天没有看到顶尖模型在华为芯片上训练,并不意味着未来不会发生。中国拥有全球最庞大的工程师队伍、最活跃的AI应用场景和最坚定的政策支持。随着华为、寒武纪等企业在芯片架构、互联技术、编译器和框架层面的持续投入,国产AI硬件的性能与稳定性正在以惊人的速度提升。

与此同时,英伟达Nvidia 在中美科技拉锯战中继续扮演“摇钱树+谈判高手”的角色:最近还同意给美国分一杯中国业务的税收,以便向中国卖出 H20 等更多芯片。Nvidia 说得很直白:“开发者是 AI 生态的灵魂,我们不可能拱手让人。” 说人话:“我既要赚钱,也要留住用户,不然损人不利己。”



极客辣评

OpenAI采购芯片是英伟达和AMD,这在商业上能避免依赖一家造成单点风险。这是任何一家大模型公司都要采取得商业战略。所以,从商业角度,DeepSeek两条腿走路,试验华为芯片 、甚至寒武纪芯片 等都是可行的。