麦肯锡:新云Neocloud的GPU租赁模式前途不见得很光明!


新云Neocloud借AI算力饥渴快速入场,靠低价GPU和灵活服务俘获初创企业,但BMaaS模式盈利脆弱。未来能否突围,取决于能否向上游AI软件栈延伸、扎根主权计算或垂直领域,或与巨头共生共长。

本文由麦肯锡四位资深专家联合撰写——Massimo Mazza、Pankaj Sachdeva、Suren Arutyunyan 与 Tarik Alatovic,均长期深耕科技与人工智能基础设施战略领域。他们在芯片供应链、云计算演进、AI商业化落地等方向拥有深厚积累,曾主导多项全球AI基础设施投资与产业格局分析项目,其观点常被华尔街与硅谷视为AI基建风向标。

Neocloud是什么?别被名字唬住,它其实就是“GPU租赁新军”!

一群叫“Neocloud”的新玩家,他们专攻GPU吗,以“租赁”形式卖给AI公司!这群人被称作“新云”(Neocloud),本质是独立GPU即服务(GPUaaS)提供商。

他们的出现不是偶然,而是被两个结构性力量硬生生推出来的:
一是全球高端GPU芯片严重短缺,二
是像英伟达这样的芯片巨头想多开几个“出货口”来分散风险、扩大生态。

简单说,大厂吃肉,小厂喝汤,可汤都不够分了,于是有人干脆自己搭灶台煮汤,还美其名曰“GPU裸金属即服务”(Bare Metal as a Service,BMaaS)。听起来高大上,其实就是“你租我的GPU服务器,我连操作系统都不装,你自己折腾”。这种模式门槛低、启动快,不到三年全球冒出100多家Neocloud,光美国就有十几家做到“有点规模”,欧洲、中东、亚洲更是遍地开花,背后站着风投、私募,甚至主权财富基金。

为什么Neocloud能火?全是被“算力饥荒”逼出来的!

过去三年,大模型疯狂内卷,训练一次动辄上万块GPU,而英伟达的H100、B200产能根本追不上需求。结果呢?谷歌、微软、Meta这些云巨头靠着“年度大单”把80%以上的先进GPU全包了,中小企业和AI初创公司连GPU的影子都看不到。

这时候Neocloud登场了:合同灵活、部署快、还能按天计费,最关键的是——价格比三大云低30%甚至85%!你没看错,同样一块H100,在Neocloud上可能只要$2/GPU小时,而AWS On-Demand要$3.5以上。

对烧钱如流水的AI初创公司来说,这简直是救命稻草。更妙的是,Neocloud不用像传统云厂商那样从零建起整个技术栈,他们只要搞到GPU、搭好机架、接上网线,就能开业收租。这种“轻资产启动”模式,让一群技术极客+资本操盘手迅速占领市场空白。

而英伟达等芯片厂也乐见其成——他们给Neocloud优先供货、提供融资,甚至自己当“兜底买家”,目的就是让更多人用上GPU,形成生态闭环,顺便给云巨头制造点“竞争压力”。

投资人为什么疯狂押注Neocloud?他们赌的不是硬件,而是软件!

别误会,没人真以为靠租GPU能赚大钱。投资人看中的,是Neocloud未来“向上堆栈”的可能性。

目前主流的BMaaS模式,说白了就是“钢铁搬运工”——毛利率看似有65%,但扣除折旧、电费、运维、融资成本后,净利润薄如纸片,EBIT可能只剩8%。一旦GPU价格下跌10%,或者机柜利用率跌破80%,立刻亏钱。

所以,所有Neocloud都在悄悄布局第二曲线:打造AI原生软件栈。比如训练任务调度平台、分布式推理引擎、面向生物医药或金融行业的垂直模型工厂、开发者工具链,甚至托管式MLOps服务。

一旦这些软件层做起来,客户粘性大增,商业模式就从“硬件租赁”变成“软件订阅”,估值逻辑直接对标Snowflake或Databricks——市销率10倍起步!这才是资本愿意All in Neocloud的真正原因:他们赌的是“今天租GPU的公司,明天能变成AI时代的Red Hat”。

但现实很骨感:BMaaS模式根本撑不起长期盈利!

理想很丰满,现实却充满陷阱。

首先,GPU硬件贬值速度吓人。A100刚上市时$3.1/GPU小时,2025年已跌到$1.5;H100从$3.0降到$2.0。而下一代B200虽然现在要$4.4,但五年内大概率腰斩。这意味着Neocloud必须在GPU报废前快速回本,否则就是一堆废铁。

其次,资金压力巨大。一块B200服务器价格动辄几十万美元,建一个千卡集群要上亿美金。很多Neocloud靠债务融资扩张,但利息一压,本就不多的利润瞬间蒸发。更麻烦的是客户集中度过高——有些Neocloud超过一半收入来自一两家大客户(比如某云巨头),一旦对方砍单,立刻现金流断裂。

最后,BMaaS本质是同质化竞争。你租GPU,我也租GPU,除了价格还能拼啥?结果就是价格战愈演愈烈,利润越压越薄,连某些零售业都不如(有报告称GPU租赁净利率仅14-16%)。

更大的悖论:想活命就得得罪“金主爸爸”!

最讽刺的是,Neocloud的“金主”和“对手”竟是同一批人——云巨头。现在Neocloud的稳定收入,很大程度来自云巨头的“应急采购”:巨头自己GPU不够用,就临时向Neocloud租一批,既快速补缺,又不用记在自己资产负债表上。

可一旦Neocloud开始做AI软件栈——比如搞自己的模型训练平台或推理服务,就直接踩进AWS SageMaker、Azure ML的地盘。云巨头怎么可能容忍“租我服务器的人,转身卖我的竞品”?

这就像房东看着租客在自己房子里开连锁店,还抢自己生意。但Neocloud又不得不这么做,否则永远困在低毛利硬件租赁的泥潭里。这种结构性矛盾,让多数Neocloud陷入两难:不做软件,死于 commoditization;做软件,死于被断供。

历史经验也不乐观——2000年代初的“Cloud 1.0”时代,一堆小云厂商也曾风光一时,结果云巨头一扩产、一降价,90%的小玩家不是被收购就是消失。

破局之路只有三条:要么做专,要么做早,要么被收!

面对死局,麦肯锡给出三条生路,条条都充满博弈智慧。

第一条:扎根“主权计算”或垂直领域,做云巨头不愿碰的生意。比如中东某国要求所有AI训练必须在本地完成,数据不能出境——这时候Neocloud若能联合本地资本建数据中心,就天然避开与AWS竞争。又比如金融、医疗等强监管行业,需要超低延迟、高隔离性的推理服务,Neocloud可定制专用架构,而云巨头标准化产品反而不适用。这类“利基市场”虽小,但壁垒高、客户粘性强,足以养活一批精品Neocloud。

第二条:死磕AI初创公司,从Day 1陪跑到IPO。别贪大求全去抢企业客户,专注服务种子期AI团队。他们现在租你10块GPU,三年后可能变成独角兽,租你10000块。更重要的是,这种早期信任关系一旦建立,即便他们长大后有能力自建集群,也可能因“迁移成本太高”而继续用你。毕竟,云巨头对小客户是“批量处理”,而Neocloud可以“VIP服务”——半夜三点帮你调参数,这种人情味是标准化云服务给不了的。

第三条:接受被收购的命运,成为巨头生态的一环。不是所有Neocloud都要独立上市。有些技术强但资金弱的,可卖给电信运营商(如AT&T、中国移动)或芯片厂(如英伟达),变成其AI基础设施的“延伸臂”。历史上,Cloud 1.0时代的小云厂商大多被AWS或谷歌收购,整合进底层资源池。Neocloud也可能重演这一幕——不是失败,而是另一种成功。

终极判断:Neocloud不会消失,但会“分化”!

别被“Neocloud泡沫论”带节奏。

这波浪潮不会像Web2.0某些赛道那样一地鸡毛。AI算力需求到2030年预计达200吉瓦——相当于200座核电站的电力输出!如此庞大的市场,不可能只由三大云满足。Neocloud的未来不是“取代巨头”,而是“补位巨头”。那些能抓住主权计算、垂直场景、初创生态的Neocloud,会活成“AI时代的数字军火商”;而只会打价格战的,终究会被芯片迭代和巨头挤压淘汰。

历史不会简单重复,但会押韵。

Cloud 1.0教会我们:基础设施的终局从来不是“赢家通吃”,而是“分层共存”。

Neocloud若能从“GPU搬运工”进化为“AI赋能者”,就有机会在AI基建栈中占据不可替代的一层。毕竟,在AI这场军备竞赛里,有人造枪,有人卖弹,有人教打仗——而Neocloud,或许就是那个悄悄卖弹又教战术的人。

给中国创业者的启示:别只盯着模型,算力服务也有黄金赛道!

看到这里,国内AI创业者是不是该醒醒了?别再一窝蜂挤进“大模型创业”红海了!Neocloud的崛起说明:AI产业链上游——尤其是算力调度、异构资源管理、垂直领域MLOps——才是被严重低估的蓝海。

中国同样面临GPU卡脖子问题,华为昇腾、寒武纪等国产芯片急需生态配套。

如果能借鉴Neocloud模式,打造“国产GPU即服务”平台,既服务本土AI公司,又满足数据安全合规需求,完全可能跑出中国版Lambda Labs或CoreWeave。

更何况,中国有庞大的制造业、金融业、医疗AI场景,对专用算力的需求远未被满足。与其在模型层内卷,不如向下扎根,做AI时代的“水电煤”供应商。记住:当所有人追逐火焰时,卖铲子的人早已致富。

最后一句扎心真相:算力民主化,从来不是免费的!

很多人幻想“AI算力终将便宜如水电”,但现实是:先进算力永远稀缺,只是稀缺的形式在变。今天缺H100,明天缺B200,后天缺光子芯片。Neocloud的出现,看似让算力更“民主”,实则只是把稀缺资源重新分配——从巨头手中分流一部分给初创公司。

但这种分配本身,依然依赖资本、关系和先发优势。真正的“民主”,不是人人用得起GPU,而是人人都能高效利用手头算力。而这,恰恰是Neocloud下一步必须解决的命题:如何通过软件层,让1块GPU发挥10块的价值?这才是它们能否穿越周期的关键。否则,再炫酷的商业模式,也敌不过一块芯片的价格波动。