AI基础设施、芯片和机器人

中国国产AI算力栈深度解析：进展、瓶颈与投资机会

#AI基础设施 #AI投资新闻 #DeepSeek时刻

2026-07-05 4K banq

别再吹国产AI芯片了！这5个死穴不解决，训练大模型还是得看老黄脸色

中国的AI芯片，真的能摆脱对英伟达的依赖吗？

政策强推下，国产算力已经打入政府、央企和电信市场，尤其在做AI推理时表现尚可。但在大模型训练这个真正的硬仗上，算力利用率、软件生态、高带宽内存这些坎，短期内还是迈不过去。

国产算力不是一块铁板，而是四个替代计划在同时跑

很多人聊国产算力，喜欢笼统地说“中国芯片”。但这就像把包子、披萨和煎饼都叫做“面食”一样，忽略了它们本质的区别。实际上，我们正在推进的是四个层级完全不同的替代计划，它们像四条跑道，有的飞机已经起飞，有的还在滑行。

第一个层面是信创和安可。这解决的是“能不能用”的问题，主要覆盖政府、央企的电脑、服务器和操作系统。在这个领域，只要产品基本可用，稳定性达标，就能进入采购名单。这跟技术是否全球领先是两码事，它更像是一次资格赛，而不是决赛。

第二个层面是AI加速卡，也就是我们常说的AI芯片。这个战场现在最热闹，也最烧钱。它瞄准的是国家级算力中心、电信云和那些国产大模型的推理集群。这里的逻辑是，只要政策要求必须用国产，哪怕性能差一点，也得硬着头皮上。

第三个层面是半导体制造的自主化。这包括晶圆代工、内存生产、设备、材料、EDA软件……这是最硬核的部分，也是差距最大的部分。一台光刻机、一瓶高纯度化学试剂，都可能成为卡脖子的地方。这个层面的进展，直接决定了前两个层面能走多远。

第四个层面是成熟制程和边缘计算。汽车、工业、物联网这些领域用的芯片，对制程要求没那么苛刻。我们在这个领域的基础相对扎实，替代进度也最快。这块更像是阵地战，靠的是规模和成本优势，而不是技术奇袭。

理解了这个分层，你就能明白为什么有些国产芯片公司能赚钱，有些却一直在烧钱。它们处于不同的赛道，面临的竞争和天花板完全不同。

政策这只手，正在强行扭转方向盘

现在国内采购AI芯片，已经不是“建议优先考虑”了。根据相关报道，国家已经明确要求，政府出资的数据中心项目，必须使用国产AI芯片。对于进度不到30%的项目，甚至需要把已经装好的外国芯片拆掉。这不是温水煮青蛙，这是直接关掉了煤气灶。

这个政策的力量是惊人的。它创造了一个刚性需求市场。根据行业数据，到2025年，国产GPU和AI芯片厂商已经拿下了国内AI加速服务器市场大约41%的份额。虽然英伟达NVIDIA还守着55%，但国产的进步速度肉眼可见。华为昇腾一家就出货了大约81.2万块加速卡，寒武纪、百度昆仑芯等也都有十几万块的出货量。

但请注意，这个市场是被政策“撑”起来的。这意味着一部分需求并非纯粹的市场行为。一些地方政府的算力中心，可能采购了芯片但利用率并不高。这种情况有点像早期的光伏产业，政策驱动的需求能催生巨头，也能制造泡沫。作为投资者，需要区分哪些公司是在做真生意，哪些只是在完成政治任务。

做推理够用，搞训练还是差点意思

这是目前国产AI芯片最真实的能力画像。通俗点说，如果你让AI看图识字、做内容审核或者跑一个已经训练好的模型（这叫推理），国产芯片已经可以顶上来了。因为推理任务相对固定，对芯片间通信和瞬时带宽的要求没那么变态，而且可以通过软件优化来弥补硬件的不足。

但如果你想从零开始训练一个大模型，比如一个万亿参数的“巨无霸”，情况就完全不同了。训练过程好比几百人合写一本长篇小说，每个人都在不停地修改、交流，如果某个人写字速度慢或者传递纸张的通道堵塞，整个团队的进度都会被拖垮。在大规模训练集群里，NVIDIA的强项不仅仅是算力峰值高，而是它的CUDA生态、网络互联和软件工具链让整个集群的“写作效率”极高。

国产芯片在训练上遇到的困境，首先是高带宽内存（HBM）的短板。这好比你家水龙头出水再大，水管细了也白搭。其次是软件生态，华为的CANN、寒武纪的Neuware，虽然在拼命追赶，但和CUDA相比，在开发工具、调试便利性和社区活跃度上还有差距。

一个很能说明问题的细节是：国产AI芯片最成熟的战场是推理。当模型架构固定后，国产芯片可以通过定制化优化，在成本上做到比NVIDIA更有竞争力。而在训练领域，目前我们还没有看到有公开证据表明，哪个国产集群能完全替代NVIDIA去训练一个顶尖水准的大模型。

真正的“死穴”不在芯片设计，在制造和材料

很多人以为我们缺的只是高端光刻机，这其实是个误解。光刻机固然重要，但它只是整个半导体产业链上的一个环节。如果把造芯片比作做满汉全席，光刻机是那口最贵的锅，但你没有高级的灶台（刻蚀机）、精准的调料勺（量测设备）、甚至没有新鲜的蔬菜（高纯度材料），照样做不出好菜。

目前我们最难以替代的五个瓶颈是：
第一，光刻、套刻精度和缺陷检测。这是决定芯片能不能造出来的根本。ASML的光刻机、KLA的检测设备，目前国内还没有能平替的选手。
第二，HBM和DRAM内存带宽。这是决定AI芯片性能上限的关键。我们的长鑫存储（CXMT）在普通DRAM上进展不错，但制造HBM需要把多个DRAM芯片堆叠起来，这涉及硅通孔（TSV）、晶圆减薄、散热等一系列复杂工艺，门槛高了一个数量级。
第三，对标CUDA的软件生态。这不只是写几个编译器那么简单，它是一个包含开发者、库、框架、社区在内的庞大系统。NVIDIA几十年的积累，很难在几年内被复制。
第四，先进制程的产能和良率。中芯国际（SMIC）能生产7nm级别的芯片，但产能、成本和良率，跟台积电（TSMC）还有相当大的距离。用多重曝光做出来的芯片，经济账算不过来。
第五，EDA软件和高端测试设备。没有Synopsys和Cadence的EDA工具，复杂芯片的设计几乎寸步难行；没有Advantest和Teradyne的测试机，芯片出了厂门都不知道好坏。

这些“死穴”决定了，在未来三到五年内，我们在前沿AI芯片领域，依然要依赖外国供应商。即便中国区收入波动，这些公司依然能凭借技术壁垒维持定价权。他们的优势是“物理学”和“生态学”层面的，不是单靠砸钱就能解决的。

谁是真正的赢家？谁又是纸老虎？

在这个大逻辑下，投资方向其实很清晰，主要分为三类。
第一类是确定性最高的“卖铲人”。无论哪家国产AI芯片最终胜出，他们都需要设备、材料、封装和测试。所以像中微公司（刻蚀机）、北方华创（综合设备）、长电科技（封装）这类公司，他们的需求是真实且持续的。他们赚的是国产化进程的钱，而不是某家特定芯片公司的钱。

第二类是系统级的“巨无霸”。华为是绕不开的存在。它集芯片、服务器、网络、软件、云服务和政企客户关系于一身，是国内最接近NVIDIA+台积电+ARM合体的玩家。只要自主化这条路走下去，华为就是战略核心。比如神州数码，旗下的神州鲲泰刚拿下了某国有大行3.71亿元的华为智算服务器采购大单

第三类是风险与机遇并存的“政策受益者”。寒武纪、海光信息等公司，已经证明了自己能拿到订单、产生收入。寒武纪2025年营收冲到约65亿人民币并实现盈利，这是一个里程碑。但它们的天花板在于，收入是可持续的吗？客户是多元化的吗？估值里有多少是稀缺性溢价，多少是真实的成长预期？这是需要仔细算的账。

很多国产AI芯片初创公司，可能会面临残酷的淘汰。华为的全栈优势会挤压独立GPU厂商的生存空间。未来大概率是少数几个巨头吃肉，大部分公司喝汤都困难。

做投资不是押注国运，是在押注“不可替代性”

说了这么多，核心结论其实就一句话：中国正在建立一个能独立运转的算力体系，但代价高昂，且短期内无法达到全球顶尖水平。

从投资角度看，最性感的策略不是无脑押注国产替代，而是精准识别出哪些环节“不可替代”。

不可替代的国内环节，是那些不管政策怎么变，只要建厂就得买的设备，只要生产就得用的耗材。
不可替代的国外环节，是那些我们想替代但三五年内就是替代不了的光刻机、EDA软件、高端HBM和测试设备。

两者之间，有一个巨大的价值洼地，那就是帮助国产芯片从“能用”变成“好用”的环节：比如提升良率的检测设备、降低功耗的先进封装、以及能让国产卡跑起来的软件优化服务。

这场算力自主的马拉松，比的不是前半程谁冲得猛，而是看谁能在后半程解决真正的工程和物理难题。政策可以创造市场，但无法创造物理学定律。当我们为国产芯片1%的进步欢呼时，也要清醒地认识到，NVIDIA们也在以更快的速度狂奔。追赶的意义，有时候不在于超越，而在于让你在谈判桌上，拥有不被“一刀切”的资格。

总结
与其相信国产AI芯片能一夜翻身，不如相信它正在真实地啃下一个个硬骨头。短期看政策采购，中期看HBM和软件突破，长期看制造和材料的地基。别把战略意义和投资价值画等号，也别低估老牌玩家的护城河深度。