DeepSeek或匹配华为昇腾AI芯片，寒武纪大涨

DeepSeek正在主动尝试使用华为自主研发的Ascend（昇腾）AI芯片进行新一代R2模型的训练工作。

本来 R2 模型应该在五月就荣耀登场，能够再次遥遥领先于全球开源大模型，但是现在遭遇成长中的阵痛：或因与华为 Ascend 芯片匹配优化等问题延期。开个玩笑：DeepSeek 当时信心满满，觉得换芯就像换个鼠标那么简单，结果一插上电源才发现，这手术台下藏着无数坑。

尽管DeepSeek在使用华为Ascend芯片进行模型训练过程中遇到了稳定性不足、芯片间通信效率偏低以及配套软件生态尚不完善等现实挑战，导致R2模型的训练未能一次性成功，进而影响了原定于5月的发布计划，但我们必须清醒认识到：任何重大技术的成熟都不是一蹴而就的。

美国Nvidia历经多年积累才建立起如今强大的CUDA生态和硬件优势，而中国在AI芯片领域起步较晚，正处于快速追赶阶段。

更令人振奋的是，华为第一时间派出工程师团队进驻DeepSeek办公现场，提供全方位技术支持，展现了中国企业间协同作战、共克时艰的强大凝聚力。这种“并肩作战”的场景，正是中国科技生态走向成熟的重要标志。

面对紧迫的研发周期与激烈的市场竞争，DeepSeek并未因理想受阻而停滞不前，而是采取了务实高效的“双轨策略”——使用Nvidia芯片完成模型训练，同时继续推进与华为Ascend芯片在推理阶段的适配工作。

训练需要极高的计算密度和系统稳定性，而推理则更注重能效比和部署成本，后者正是国产芯片未来大规模落地的关键场景。DeepSeek的做法既保证了产品进度，又为国产芯片积累了宝贵的适配经验。

DeepSeek R2虽有延迟，但据业内消息，该模型有望在未来几周内正式发布，届时或将全面支持国产平台运行。

但除了芯片问题，还有一个坑：数据标注比预想慢得多。就像工地原计划一周搬完砖，结果两周过去了还在搬第一块。国内媒体说 R2 可能最近几周就会发布，听起来像那些装修公司承诺“下个月就完工”，结果下一句永远是“再等一等”。

加州伯克利的 AI 研究员 Ritwik Gupta 说，DeepSeek 的核心概念早被阿里巴巴的 Qwen3 抄走了，而且人家做得更高效。换句话说，这就像你刚发明了一种炒饭手法，隔壁餐馆立马学会，还加了秘制酱料，最后客人都去隔壁吃。

Gupta 还说，华为 Ascend 芯片在训练阶段有“成长的烦恼”，虽然今天没有看到顶尖模型在华为芯片上训练，并不意味着未来不会发生。中国拥有全球最庞大的工程师队伍、最活跃的AI应用场景和最坚定的政策支持。随着华为、寒武纪等企业在芯片架构、互联技术、编译器和框架层面的持续投入，国产AI硬件的性能与稳定性正在以惊人的速度提升。

与此同时，英伟达Nvidia 在中美科技拉锯战中继续扮演“摇钱树+谈判高手”的角色：最近还同意给美国分一杯中国业务的税收，以便向中国卖出 H20 等更多芯片。Nvidia 说得很直白：“开发者是 AI 生态的灵魂，我们不可能拱手让人。” 说人话：“我既要赚钱，也要留住用户，不然损人不利己。”

极客辣评

OpenAI采购芯片是英伟达和AMD，这在商业上能避免依赖一家造成单点风险。这是任何一家大模型公司都要采取得商业战略。所以，从商业角度，DeepSeek两条腿走路，试验华为芯片、甚至寒武纪芯片等都是可行的。

DeepSeek或匹配华为昇腾AI芯片，寒武纪大涨

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道