瑞银调查:中国开源模型杀入外企AI采购,千问被全球大行本地部署


中国AI模型杀进外企机房!千问被全球大行选中,美国大厂慌了?

瑞银集团发现:60% 的企业已经开始削减人工智能支出,转而采用成本更低的模式和开源的中国模式。

瑞银调查揭底:六成企业已动手管AI账单,但中国开源模型成了最大赢家。千问、DeepSeek组团杀入外企采购名单,有全球大行直接本地部署千问来平衡Claude开支。高价大模型被夹击,中国选手靠性价比正在改写游戏规则。

财务总监开始盯着令牌计数器过活,打工人的AI自由时代宣告结束

以前公司推AI跟发福利似的,恨不得每个人上班第一件事就是跟ChatGPT聊半小时。产品经理写需求先让AI润色三遍,程序员写代码每行都要问注释,市场部生成文案按斤算。那时候没人看账单,只看采纳率,谁管一个对话烧掉几毛钱。

现在风水轮流转。瑞银报告说六成企业已经设了"令牌护栏",这词儿听着像幼儿园围栏,实际就是给AI使用上了紧箍咒。有公司年预算半年烧穿,内部AI工具从五个砍到两个,跟公司食堂从四菜一汤变两荤一素一个道理。

最狠的案例是AWS Bedrock上单个用户月消耗三万五千美元。三万五,什么概念,够小公司养三个初级开发了。还有DevOps团队每周配额超支百分之两百,这帮人估计是拿AI写部署脚本写嗨了,忘了钱不是大风刮来的。

但这事得分两层看。有些公司把AI嵌进核心流程了,比如客服自动化、代码生成流水线,这种地方老板捏着鼻子也得认。真正挨刀的是那些"试试看"项目,什么让AI做市场分析报告啊,生成几百版广告语啊,ROI算不清楚的通通排队被砍。

Databricks老板管这叫"大减速带,不是小磕碰"。减速带嘛,车颠一下继续走,不是让你掉头回家。关键是颠这一下,有人系了安全带,有人脑袋撞车顶上了。中国开源模型就是那个偷偷给你递安全帽的。

CFO和CEO开始在公司内部拔河,员工成了被扯来扯去的绳子

这波AI成本管控最拧巴的地方在于,公司内部两头在较劲。CFO看着月度账单血压升高,CEO盯着AI采用率KPI睡不着觉。员工夹在中间,既要完成AI使用指标,又得琢磨怎么省令牌。

有公司把AI使用率和绩效挂钩。这下热闹了,程序员为了省令牌少问几个调试问题,结果bug多得修不完。客服人员不敢让AI处理复杂投诉,全转人工,人工成本又上来了。省了令牌,亏了时间,财务算总账的时候发现没省几个钱。

ROI清晰的场景压根不受影响。软件工程团队产出代码量明显上升,客服AI接听率压下来了,研发流程提速看得见摸得着。这种地方老板再抠门也不敢动,动了就是跟生产力过不去。

问题是很多公司压根没搞清楚钱烧哪儿了。瑞银调查发现大量企业连令牌流向图都没画出来,行业级数据更是稀碎。这就跟你信用卡刷爆了但账单全是模糊商户名一样,只能先统统冻结,回头慢慢对账。冻结期间,便宜好用的中国模型就成了临时替代方案,用着用着发现还挺香。

模型路由把顶级大模型从"随便用"变成"按需点菜",中国选项挤进货架

省钱最狠的技术手段不是限流,是搞"模型路由"。翻译成大白话就是:简单活儿扔给便宜模型,复杂推理才让大佬上场。这操作跟公司差旅标准一样,省内坐高铁二等座,跨国才让报商务舱。

价格差太离谱了。Anthropic家的Haiku 4.5,一百万输出令牌五美元。Opus 4.5,二十五美元。Fable/Mythos 5,五十美元。十倍差价,傻子才不分任务选模型。以前开发团队闭着眼上最强大脑,现在得先问自己一句:这破需求用得着最大上下文窗口吗?

但有个反直觉的点。高端模型一次生成高质量结果,可能比低端模型来回迭代五次更省钱。算"有效成本"而不是"单次成本",这才是正经财务思维。问题是高端模型得持续证明自己值这个溢价,每次涨价都得让客户觉得不亏。

这时候中国开源模型进场了。千问、DeepSeek、GLM这些选手输出令牌价格只有Claude和GPT的十分之一甚至更低。关键是性能差距在缩小,日常编码、文档处理、客服对话这些场景,中国模型已经够用了。企业算账的时候发现,把百分之六十的简单任务切给中国模型,账单直接腰斩。

千问被全球大行请进机房,中国开源模型首次进入外企核心生产环境

瑞银报告最炸的一条信息是:一家全球性大银行开始本地部署千问,用来平衡Claude这类高价模型的使用。这不是实验室试用,是正经生产环境。银行风控合规出了名的严,能让千问进机房,说明性能和安全性都过了硬门槛。

本地部署这招妙在哪。成本结构从"按令牌付费"变成"本地硬件扩容",用越多越划算。合规风险也下来了,数据不出机房,监管问起来心里不慌。以前用外部托管的美国模型,数据出境问题一堆,现在用中国开源模型本地跑,两条腿走路。

这不是孤例。瑞银团队调研发现,中国开源模型正批量进入企业采购短名单。阿里千问、深度求索、MiniMax、智谱GLM、月之暗面Kimi,组团出现在AWS Bedrock和Azure AI Foundry的模型目录里。云平台已经把中国模型变成标准货架商品了,企业点几下鼠标就能用。

对跨国公司来说,中国开源模型的意义不只是便宜。多模型策略本身就是风险管理,不能把所有鸡蛋放在OpenAI一个篮子里。中美两边都有开源备胎,地缘政治风险就被对冲掉了。千问进银行机房,打的正是这张牌。

云平台抢着上架中国模型,AWS和微软把千问DeepSeek摆上货架

AWS Bedrock现在的模型目录里,中国面孔越来越多。MiniMax、Kimi、千问、DeepSeek、GLM整整齐齐排在那儿,跟Claude、Llama做邻居。微软Azure AI Foundry也上了DeepSeek,还继续评估其他中国模型的性价比。

云平台心里的小算盘打得响。多模型生态越丰富,客户绑得越死。客户在Bedrock上同时调Claude和千问,路由策略跑顺了,迁移成本就高得吓人。云厂商才不在乎你用的是美国模型还是中国模型,只要推理跑在我这,钱就是我的。

这对中国模型厂商是个微妙的机会。开源模型免费或低价,直接收钱路子太窄。但通过云平台触达全球企业客户,积累使用数据和场景经验,这个价值比卖API大得多。宝马和阿里围绕千问的合作模式就是方向,做垂直场景深度定制,赚的是解决方案的钱。

更狠的是,中国模型厂商更新速度比美国同行还快。DeepSeek几个月就迭代一个大版本,千问的开源社区贡献者遍布全球。这种迭代速度压下来,美国高价模型想维持十倍价差会越来越难。

云和芯片反而坐得稳当,中国算力产业链跟着沾光

模型层打价格战,云和硬件层却坐得稳当。AWS、Azure、Google Cloud早就是多模型平台了,不吊死在一家模型供应商身上。客户从Claude切到千问,可能影响模型API收入,但只要推理负载还在云上,算力需求就在。

越搞成本管理,企业越可能把模型选型、部署、安全、计费全 consolidation 到云平台上。这反而强化了云厂商的绑定效应。中国云厂商如果能把千问、DeepSeek这些国产模型的服务链做顺了,出海抢单就有了差异化武器。

硬件层前景更乐观。中国AI芯片厂商虽然还没打进全球大厂核心训练集群,但推理场景的门槛低得多。千问这类开源模型被大量部署到本地和边缘设备,对国产推理芯片是实打实的增量需求。GB200、GB300固然香,但便宜好用的国产推理卡也有自己的生态位。

这轮令牌优化的意外后果是,中国算力产业链在推理侧找到了突破口。以前没机会进外企机房,现在借着开源模型和成本压力,大门开了一条缝。

软件公司两面受气,转头发现自己能当省钱管家

AI令牌支出涨了,企业预算池子就那么大。钱从哪挪,目前看是放缓招聘、砍外部IT服务、压缩SaaS和应用软件预算。Uber是典型,AI继续推,但靠放缓内部人头增长来对冲令牌成本。IT服务公司和某些SaaS厂商表现疲软,都用这个框架解释。

Salesforce、ServiceNow、Workday这类大席位制SaaS厂商处境最拧巴。客户预算被重新分配,自己还得从席位制许可向"席位加用量"混合定价转型。问题是客户刚被AI账单砸懵了,对另一种用量定价方案接受度断崖式下降。

但软件公司手里有反制牌。Palantir一个月前商推了AIP Evolve,帮客户给每个任务选最合适的模型、优化提示词、改进数据检索。有个案例里Evolve建议换模型,令牌成本降了百分之九十七,上线前三周采用率就冲到九十。

软件公司的结构性优势在"模型无关"定位,可以当中立编排平台,根据成本和性能动态分配工作负载给Claude、千问、Llama和各种小模型。跟多云数据库供应商一个路数,谁能帮客户省钱,谁就能从成本中心变成价值中心。中国开源模型批量入场,让路由策略的价差空间更大了,软件公司的优化效果也更明显。

增长故事没翻篇,翻的是赢家名单,中国选手第一次站上C位

目前最难算的账是令牌消耗增长到底会被砍掉多少。一个相对保守的假设是,如果公司原计划AI令牌支出从一百涨到一百五,优化后可能落在一百二到一百三,而不是跌回八十。增长速率被调低了,需求没反转。

瑞银Evidence Lab对大约一百三十家公司的调查显示,只有百分之八已经在生产环境大规模部署AI代理,百分之三十七在有限生产环境使用,百分之二十九还在试点,百分之二十六只是用Copilot或AI编码工具。AI代理驱动大规模令牌消耗的阶段才刚开个头。

法律AI公司Harvey的数据印证了这一点,令牌消耗从一月份的一万亿飙到五月份的十二到十三万亿。优化和扩张可以同时发生,企业花钱更精明,但AI用例还在往外炸。

这轮令牌优化和疫情后那波云软件预算回撤有本质区别。后者是对成熟使用水平的削减,前者是新技术的早期成本治理。结果不是AI需求消失,而是市场赢家重新洗牌。高价大模型面临收入增速压力,中国开源模型和路由工具成了最大受益者。云平台继续吃多模型红利,软件公司站上省钱助手的风口。

中国开源模型这次不是靠补贴或者政策,是靠实打实的性价比打进全球企业采购名单的。千问进银行机房这件事,比任何融资新闻都更有说服力。AI增长的基本面没动,但增长轨迹的争夺战里,中国选手第一次站上了牌桌中央。

总结

AI烧钱从粗放变精细,中国开源模型靠性价比杀进外企机房。千问被大行本地部署,DeepSeek上架AWS货架,美国高价大模型第一次感受到来自东方的价格压力。这场增长轨迹争夺战,赢家名单正在重写。


作者单位背景
瑞银集团证券研究部,Karl Keirstead团队