阿里、字节出海租用英伟达算力;DeepSeek联手华为攻坚国产替代

中国科技巨头借道东南亚训练AI模型,绕过美国芯片禁令;阿里、字节出海租用英伟达算力,DeepSeek联手华为攻坚国产替代,形成“训练出海、推理国产”双轨战略。

最近一条来自《金融时报》的重磅消息炸翻了全球AI圈——阿里巴巴、字节跳动等中国顶级科技公司,正悄悄把自家大模型的训练地点搬出中国,一路南下东南亚!

为什么?

原因很简单:他们想用上英伟达(NVIDIA)最顶级的AI芯片,而美国政府偏偏不让他们在中国本土用这些“算力怪兽”。

于是,新加坡、马来西亚的数据中心成了新的“AI炼丹炉”,中国企业租用当地设施,在法律边缘灵活走位,成功绕开美国出口管制,把自家大模型训练得又快又强。这不仅是技术突围,更是地缘政治博弈下的高智商操作!

美国芯片禁令逼出“AI出海潮”:合规即正义  

事情的导火索,还得从2024年4月说起。当时特朗普政府一纸行政令,限制英伟达专为中国市场设计的H20芯片出口——这本是NVIDIA为绕开禁令特别“阉割”后的产品,结果连这都不让卖了。中国企业瞬间断粮,训练下一代大模型几乎停摆。

但聪明人从不坐以待毙。据两位知情人士透露,阿里和字节迅速调整战略,把Qwen(通义千问)和Doubao(豆包)的训练任务转移到了东南亚的数据中心集群。

一位新加坡数据中心运营商直言:“来这里太合理了——你需要最好的芯片训练最尖端的模型,而且全程合法合规。”没错,关键就在这“合法”二字上。中国企业并不直接购买或运输芯片,而是与非中资控股的数据中心签订租赁协议,使用对方已部署的英伟达高端GPU集群。这种“算力租用”模式巧妙避开了美国对“中国实体直接获取先进芯片”的限制。

Qwen与豆包的全球崛起:开源+出海=弯道超车  

你可能不知道,过去一年,通义千问(Qwen)和豆包(Doubao)已经杀进全球大模型性能排行榜前列!更厉害的是,Qwen作为开源模型,被全球开发者疯狂下载、微调、部署,成了中国AI出海的“数字名片”。

为什么能这么快?答案就在那片被热带雨林包裹的数据中心里——它们用的正是和Meta、谷歌同款的英伟达H100甚至更新的Blackwell芯片。算力决定上限,数据决定下限,而中国企业用“地理位置切换”硬生生把上限拉回了国际一线水平。这不仅是技术胜利,更是商业模式的胜利:租用海外算力,训练开源模型,反向输出全球,形成正向飞轮。

更妙的是,这些海外数据中心不仅用于训练,还直接服务阿里云、字节云的国际客户,一举两得,加速抢占全球云计算市场份额。

DeepSeek的“国产孤勇者”:囤货+华为=中国芯突围样本  

当然,并非所有公司都选择出海。深度求索(DeepSeek)的AI初创公司,却选择了另一条路——死守本土,硬刚国产替代。

据内部人士透露,DeepSeek早在美国芯片禁令全面收紧前,就悄悄囤积了大量英伟达高端GPU,建成了国内少有的大规模训练集群。

更关键的是,他们和华为展开了深度绑定:华为直接派工程师常驻DeepSeek位于杭州的总部,共同优化昇腾(Ascend)芯片与AI框架的适配效率。这可不是普通合作,而是国家战略级的“软硬协同”实验——华为视DeepSeek为国产AI芯片生态的“关键试验田”,成败关乎整个中国AI训练基础设施的未来。

目前,DeepSeek的低成本高质量模型已在开发者社区引发热议,证明即便不用H100,中国团队也能做出世界一流的AI。

训练靠海外,推理靠国产:中国AI的“双轨制”战略  

有意思的是,中国企业玩的是“双轨制”:训练阶段用海外英伟达芯片冲性能,推理阶段则大规模切换回国产芯片。

为什么?因为推理(即用户提问后AI生成回答)对算力要求远低于训练,且成本敏感度更高。华为昇腾、寒武纪、壁仞等国产芯片虽然暂时追不上H100的训练效率,但在推理场景已足够用,且更便宜、更可控。更重要的是,推理负载正快速成为AI整体算力消耗的大头——用户越多,推理请求越密集。

所以,中国企业聪明地把“最烧钱的训练”放在海外,把“最频繁的推理”留在国内,既合规又经济。这种“训练出海、推理国产”的混合架构,或许将成为未来三年中国AI产业的标准范式。

数据不出境:中国AI出海的最大枷锁  

但别以为出海万能。这里有个致命限制:中国法律严禁企业将境内用户隐私数据或重要行业数据传输出境。

这意味着,如果某家银行想用阿里云定制一个专属金融大模型,用的是其内部交易数据,那么训练必须留在中国境内完成。这就逼着企业在本土用国产芯片硬扛——哪怕效果打点折扣。

于是,我们看到一种分裂局面:通用大模型可以全球训练、全球部署;行业专属模型则被牢牢锁在国内,依赖华为、寒武纪等国产算力。这种“数据主权”与“算力自由”的矛盾,将成为中国AI发展长期存在的结构性张力。

全球算力版图重构:中东、拉美成新战场  

东南亚只是开始。据行业消息,中国科技公司正加速布局中东、拉美等地的数据中心。阿联酋、沙特正大力补贴绿色数据中心建设,电价低、政策松、地缘中立,对中国企业极具吸引力。

阿里云已在迪拜设立区域总部,字节的TikTok AI服务也依赖当地节点。

未来,我们或将看到一个“去中心化”的中国AI训练网络:在新加坡跑基础模型,在迪拜服务欧洲客户,在智利覆盖拉美市场——真正实现“算力无国界,模型全球化”。而这一切的底层驱动力,正是美国芯片禁令意外催生的“被迫全球化”。

华为的阳谋:用生态绑定撬动国产替代  

回到国内,华为正下一盘大棋。它不再只是卖芯片,而是输出“昇腾+MindSpore+CANN”全栈AI解决方案,并通过与DeepSeek这样的明星初创公司深度合作,打造标杆案例。

一旦DeepSeek证明国产芯片能支撑商业级大模型训练,政府、国企、金融行业就会更有信心采购华为方案。

这本质上是一场“生态战争”:英伟达靠CUDA生态统治全球,华为则试图用全栈自研+政策支持+本土服务,构筑护城河。而DeepSeek,就是那块最关键的“磨刀石”。

未来已来:中国AI的“韧性创新”时代  

这场“训练出海”潮,表面看是绕开制裁的权宜之计,深层看却是中国科技企业韧性与创造力的集中爆发。没有H20?那就租用H100。不能运数据出境?那就开发数据脱敏与联邦学习技术。国产芯片不够强?那就提前囤货+联合攻坚。在这种“极限压力测试”下,中国AI产业反而加速进化出更灵活、更务实、更具全球视野的发展路径。或许,真正的技术自主,从来不是闭门造车,而是在开放与限制之间,找到那条最险但最快的路。