中国的AI芯片,真的能摆脱对英伟达的依赖吗?
政策强推下,国产算力已经打入政府、央企和电信市场,尤其在做AI推理时表现尚可。但在大模型训练这个真正的硬仗上,算力利用率、软件生态、高带宽内存这些坎,短期内还是迈不过去。
国产算力不是一块铁板,而是四个替代计划在同时跑
很多人聊国产算力,喜欢笼统地说“中国芯片”。但这就像把包子、披萨和煎饼都叫做“面食”一样,忽略了它们本质的区别。实际上,我们正在推进的是四个层级完全不同的替代计划,它们像四条跑道,有的飞机已经起飞,有的还在滑行。
第一个层面是信创和安可。这解决的是“能不能用”的问题,主要覆盖政府、央企的电脑、服务器和操作系统。在这个领域,只要产品基本可用,稳定性达标,就能进入采购名单。这跟技术是否全球领先是两码事,它更像是一次资格赛,而不是决赛。
第二个层面是AI加速卡,也就是我们常说的AI芯片。这个战场现在最热闹,也最烧钱。它瞄准的是国家级算力中心、电信云和那些国产大模型的推理集群。这里的逻辑是,只要政策要求必须用国产,哪怕性能差一点,也得硬着头皮上。
第三个层面是半导体制造的自主化。这包括晶圆代工、内存生产、设备、材料、EDA软件……这是最硬核的部分,也是差距最大的部分。一台光刻机、一瓶高纯度化学试剂,都可能成为卡脖子的地方。这个层面的进展,直接决定了前两个层面能走多远。
第四个层面是成熟制程和边缘计算。汽车、工业、物联网这些领域用的芯片,对制程要求没那么苛刻。我们在这个领域的基础相对扎实,替代进度也最快。这块更像是阵地战,靠的是规模和成本优势,而不是技术奇袭。
理解了这个分层,你就能明白为什么有些国产芯片公司能赚钱,有些却一直在烧钱。它们处于不同的赛道,面临的竞争和天花板完全不同。
政策这只手,正在强行扭转方向盘
现在国内采购AI芯片,已经不是“建议优先考虑”了。根据相关报道,国家已经明确要求,政府出资的数据中心项目,必须使用国产AI芯片。对于进度不到30%的项目,甚至需要把已经装好的外国芯片拆掉。这不是温水煮青蛙,这是直接关掉了煤气灶。
这个政策的力量是惊人的。它创造了一个刚性需求市场。根据行业数据,到2025年,国产GPU和AI芯片厂商已经拿下了国内AI加速服务器市场大约41%的份额。虽然英伟达NVIDIA还守着55%,但国产的进步速度肉眼可见。华为昇腾一家就出货了大约81.2万块加速卡,寒武纪、百度昆仑芯等也都有十几万块的出货量。
但请注意,这个市场是被政策“撑”起来的。这意味着一部分需求并非纯粹的市场行为。一些地方政府的算力中心,可能采购了芯片但利用率并不高。这种情况有点像早期的光伏产业,政策驱动的需求能催生巨头,也能制造泡沫。作为投资者,需要区分哪些公司是在做真生意,哪些只是在完成政治任务。
做推理够用,搞训练还是差点意思
这是目前国产AI芯片最真实的能力画像。通俗点说,如果你让AI看图识字、做内容审核或者跑一个已经训练好的模型(这叫推理),国产芯片已经可以顶上来了。因为推理任务相对固定,对芯片间通信和瞬时带宽的要求没那么变态,而且可以通过软件优化来弥补硬件的不足。
但如果你想从零开始训练一个大模型,比如一个万亿参数的“巨无霸”,情况就完全不同了。训练过程好比几百人合写一本长篇小说,每个人都在不停地修改、交流,如果某个人写字速度慢或者传递纸张的通道堵塞,整个团队的进度都会被拖垮。在大规模训练集群里,NVIDIA的强项不仅仅是算力峰值高,而是它的CUDA生态、网络互联和软件工具链让整个集群的“写作效率”极高。
国产芯片在训练上遇到的困境,首先是高带宽内存(HBM)的短板。这好比你家水龙头出水再大,水管细了也白搭。其次是软件生态,华为的CANN、寒武纪的Neuware,虽然在拼命追赶,但和CUDA相比,在开发工具、调试便利性和社区活跃度上还有差距。
一个很能说明问题的细节是:国产AI芯片最成熟的战场是推理。当模型架构固定后,国产芯片可以通过定制化优化,在成本上做到比NVIDIA更有竞争力。而在训练领域,目前我们还没有看到有公开证据表明,哪个国产集群能完全替代NVIDIA去训练一个顶尖水准的大模型。
真正的“死穴”不在芯片设计,在制造和材料
很多人以为我们缺的只是高端光刻机,这其实是个误解。光刻机固然重要,但它只是整个半导体产业链上的一个环节。如果把造芯片比作做满汉全席,光刻机是那口最贵的锅,但你没有高级的灶台(刻蚀机)、精准的调料勺(量测设备)、甚至没有新鲜的蔬菜(高纯度材料),照样做不出好菜。
目前我们最难以替代的五个瓶颈是:
第一,光刻、套刻精度和缺陷检测。这是决定芯片能不能造出来的根本。ASML的光刻机、KLA的检测设备,目前国内还没有能平替的选手。
第二,HBM和DRAM内存带宽。这是决定AI芯片性能上限的关键。我们的长鑫存储(CXMT)在普通DRAM上进展不错,但制造HBM需要把多个DRAM芯片堆叠起来,这涉及硅通孔(TSV)、晶圆减薄、散热等一系列复杂工艺,门槛高了一个数量级。
第三,对标CUDA的软件生态。这不只是写几个编译器那么简单,它是一个包含开发者、库、框架、社区在内的庞大系统。NVIDIA几十年的积累,很难在几年内被复制。
第四,先进制程的产能和良率。中芯国际(SMIC)能生产7nm级别的芯片,但产能、成本和良率,跟台积电(TSMC)还有相当大的距离。用多重曝光做出来的芯片,经济账算不过来。
第五,EDA软件和高端测试设备。没有Synopsys和Cadence的EDA工具,复杂芯片的设计几乎寸步难行;没有Advantest和Teradyne的测试机,芯片出了厂门都不知道好坏。
这些“死穴”决定了,在未来三到五年内,我们在前沿AI芯片领域,依然要依赖外国供应商。即便中国区收入波动,这些公司依然能凭借技术壁垒维持定价权。他们的优势是“物理学”和“生态学”层面的,不是单靠砸钱就能解决的。
谁是真正的赢家?谁又是纸老虎?
在这个大逻辑下,投资方向其实很清晰,主要分为三类。
第一类是确定性最高的“卖铲人”。无论哪家国产AI芯片最终胜出,他们都需要设备、材料、封装和测试。所以像中微公司(刻蚀机)、北方华创(综合设备)、长电科技(封装)这类公司,他们的需求是真实且持续的。他们赚的是国产化进程的钱,而不是某家特定芯片公司的钱。
第二类是系统级的“巨无霸”。华为是绕不开的存在。它集芯片、服务器、网络、软件、云服务和政企客户关系于一身,是国内最接近NVIDIA+台积电+ARM合体的玩家。只要自主化这条路走下去,华为就是战略核心。比如神州数码,旗下的神州鲲泰刚拿下了某国有大行3.71亿元的华为智算服务器采购大单
第三类是风险与机遇并存的“政策受益者”。寒武纪、海光信息等公司,已经证明了自己能拿到订单、产生收入。寒武纪2025年营收冲到约65亿人民币并实现盈利,这是一个里程碑。但它们的天花板在于,收入是可持续的吗?客户是多元化的吗?估值里有多少是稀缺性溢价,多少是真实的成长预期?这是需要仔细算的账。
很多国产AI芯片初创公司,可能会面临残酷的淘汰。华为的全栈优势会挤压独立GPU厂商的生存空间。未来大概率是少数几个巨头吃肉,大部分公司喝汤都困难。
做投资不是押注国运,是在押注“不可替代性”
说了这么多,核心结论其实就一句话:中国正在建立一个能独立运转的算力体系,但代价高昂,且短期内无法达到全球顶尖水平。
从投资角度看,最性感的策略不是无脑押注国产替代,而是精准识别出哪些环节“不可替代”。
不可替代的国内环节,是那些不管政策怎么变,只要建厂就得买的设备,只要生产就得用的耗材。
不可替代的国外环节,是那些我们想替代但三五年内就是替代不了的光刻机、EDA软件、高端HBM和测试设备。
两者之间,有一个巨大的价值洼地,那就是帮助国产芯片从“能用”变成“好用”的环节:比如提升良率的检测设备、降低功耗的先进封装、以及能让国产卡跑起来的软件优化服务。
这场算力自主的马拉松,比的不是前半程谁冲得猛,而是看谁能在后半程解决真正的工程和物理难题。政策可以创造市场,但无法创造物理学定律。当我们为国产芯片1%的进步欢呼时,也要清醒地认识到,NVIDIA们也在以更快的速度狂奔。追赶的意义,有时候不在于超越,而在于让你在谈判桌上,拥有不被“一刀切”的资格。
总结
与其相信国产AI芯片能一夜翻身,不如相信它正在真实地啃下一个个硬骨头。短期看政策采购,中期看HBM和软件突破,长期看制造和材料的地基。别把战略意义和投资价值画等号,也别低估老牌玩家的护城河深度。