整场英伟达GTC 2026大会其实讲了一件特别简单但又特别吓人的事情。AI行业已经从卖零件升级到卖整个城市。以前大家讨论显卡,就像买显卡打游戏,今天讨论显卡,感觉像在建设电力系统、水利工程和高速公路。
黄仁勋的核心逻辑非常清楚:AI时代的竞争重点已经从单个模型升级到整套基础设施。算力、网络、推理系统、智能体平台、自动驾驶、游戏渲染,这些东西开始连成一整套工业体系。显卡只是入口,真正的目标是成为AI时代的电网公司。
你可能觉得显卡就是一块插在电脑上的大板子。但在黄仁勋眼里,显卡是发电机,是变压器,是整个AI世界的动力来源。以前卖显卡就像卖砖头,现在卖显卡是帮你把整栋楼盖好,水电煤全通,拎包入住。
一万亿美元订单:Blackwell直接进入工业级需求爆发
先看最震撼的一条数据:
Blackwell和Vera Rubin平台的订单规模达到一万亿美元,而且时间窗口只到2027年。上一年大家还在讨论五千亿美元已经很疯狂,现在直接翻倍。这个数字啥概念?相当于把全球前十大科技公司的现金储备加起来,还不够买这批货。
这件事的含义特别简单。AI算力已经从科技公司内部实验升级为整个产业的基础设施建设。云厂商、企业、研究机构,全都在拼命抢算力。就像当年互联网刚开始铺设光纤一样,谁先铺好网络,谁就掌握未来。只不过这次铺的不是光纤,是显卡。
黄仁勋用的词特别直接:demand is booming。翻译成中文就是需求炸了。不是慢慢增长,是直接爆炸。各大云厂商排队送钱,生怕晚了一步就抢不到货。显卡工厂已经不是在卖显卡,而是在生产AI时代的发电机。你想想第一次工业革命的时候,谁掌握了蒸汽机,谁就是世界老大。现在谁掌握了显卡,谁就是AI时代的地主。
Vera Rubin平台:AI算力进入超级计算机时代
接下来登场的是新一代平台Vera Rubin。名字来自著名天文学家Vera Rubin,这位科学家发现了暗物质存在的证据。黄仁勋起这个名字很有深意,因为整个AI产业现在真的有点像探索宇宙,看不见摸不着,但确实存在且能量巨大。
这个平台包括七种芯片、五种机架系统,还有一个完整的超级计算机架构。重点在于性能效率提升达到十倍。也就是同样的电力,可以跑出十倍的计算。这就像你家空调以前开一整天才能凉快,现在开一小时就够,电费直接打一折。
更夸张的是推理速度:700 million tokens per second。简单翻译一下,就是每秒可以生成七亿个token。
一个token大概相当于一个汉字或半个英文单词。
七亿个token啥概念?
《三体》三部曲总字数大概九十万字,换算成token大概一百多万。也就是说,这套系统一秒钟能生成七百套《三体》三部曲。
普通聊天机器人在这种系统上跑,感觉就像一群学生写作业,突然换成了印刷厂。以前你问AI一个问题,它要想半天才回答。以后你刚问完,它已经回答了,还顺便把你接下来想问的三个问题也回答了。
微软的Microsoft Azure已经开始部署第一套系统。今年晚些时候正式发货。整个云计算行业基本已经进入军备竞赛阶段。你买一台,我买十台,他买一百台,看谁先把算力堆满。
Groq 3 LPU:推理芯片开始挑战显卡
接下来一个很有意思的角色出现了。Groq 3 LPU。这是英伟达收购Groq之后推出的第一款产品。Groq这家公司原本是做AI芯片的,专门搞推理加速,被英伟达收入囊中之后,产品线直接起飞。
LPU的概念其实很简单。显卡擅长训练模型,就是让AI变聪明的那一步。LPU专门解决推理效率,就是让AI回答问题的那一步。AI系统的一个经典难题叫做latency-throughput tradeoff。简单说就是两件事情总是互相拉扯。
响应速度越快,吞吐量越低。就是你问问题它秒回,但一次只能服务一个人。吞吐量越高,响应速度越慢。就是它能同时服务一万个人,但每个人都要等半天才有回应。这就像食堂打饭,一个窗口出餐快但队伍排到门外,十个窗口出餐慢但每个人都能吃上饭。
Groq 3 LPU试图解决这个矛盾。一整个机架可以装256个LPU,而且推理吞吐量达到每兆瓦35倍提升。翻译成人话就是,同样一座数据中心电站,可以多跑几十倍AI请求。以前一度电够一百个人用AI,现在一度电够三千五百个人用。
AI服务的成本结构正在发生变化。以前用AI聊天可能很贵,因为推理消耗算力太多。以后用AI聊天可能比发短信还便宜,因为LPU把效率拉满了。你想想,如果AI比矿泉水还便宜,那会发生什么?每个App里都会住着一个AI,每台设备里都会藏着一个AI,你甚至意识不到自己在用AI,因为它无处不在。
DLSS 5:游戏渲染和AI正式合体
然后舞台突然画风一转。开始讲游戏技术DLSS 5。黄仁勋穿皮衣讲游戏的画风特别有喜感,但内容一点都不好笑。
DLSS的本质是用AI生成画面。以前游戏画面完全靠显卡实时渲染,像素点一个一个算出来,光影一层一层叠上去。现在AI可以预测和生成画面细节。英伟达给这个技术起了一个新名字:probabilistic rendering。
意思是概率渲染。电脑开始像艺术家一样猜画面。你玩射击游戏,枪口火焰一闪,AI根据前面几帧的画面,直接猜出下一帧火焰该长啥样,不用显卡重新算一遍。这就像你写作文,以前每个字都要查字典才能写,现在写顺了之后,写到一半就知道后面该接什么词。
现场展示的游戏包括Resident Evil Requiem和Starfield。画面确实惊人,有些效果甚至带点科幻感。生化危机里的僵尸,脸上的皱纹和血迹清晰到让人想吐。星空里的宇宙,星云效果细腻得像哈勃望远镜拍的。
当然观众反应也很真实。有人惊叹,有人怀疑。因为AI生成画面有时候确实离谱,比如光影太梦幻,像游戏角色突然进入滤镜世界。或者AI猜错了画面,本该出现一堵墙,结果猜成一扇门,你直接穿模掉进异次元。
不过趋势很明显。未来游戏画面很可能一半算出来,一半猜出来。显卡负责保证基础画面不崩,AI负责让画面更精致更流畅。你玩到的游戏,可能有一半是显卡渲染的,另一半是AI脑补的。
Nemoclaw:企业智能体开始出现标准系统
接下来进入AI企业系统部分。一个基于开源OpenClaw的Nemoclaw的项目被提出来。这就是火遍全网的大龙虾,英伟达给企业智能体准备了一套OpenClaw标准方案。
这个系统其实是OpenClaw的企业级参考架构。核心目标非常明确。企业想部署智能体,需要一整套标准基础设施。包括模型调用、任务调度、上下文管理、工具接口、安全机制等等。以前公司自己拼这些模块,就像自己装电脑。主板、CPU、散热器、风扇全要手动拼。现在英伟达开始提供整套主机方案。
企业部署AI系统的难度正在下降。以前你要请一群算法工程师,写几万行代码,调几个月参数,才能搞出一个能用的AI助手。现在你只要把Nemoclaw部署上去,填几个配置,AI助手就直接上线了。就像开网店,以前要从头写代码,现在用Shopify直接拖拽就行。
这意味着什么?意味着未来两年,你会看到无数公司突然有了自己的AI客服、AI销售、AI运营、AI财务。这些AI不会累,不会辞职,不会要求加薪,二十四小时在线,随叫随到。你打电话过去,对面可能是AI接的。你发邮件咨询,回你的可能是AI。你投诉商品问题,处理的也可能是AI。
而且这些AI不是那种一问三不知的蠢AI,是真的能办事的智能体。它们能调数据库,能查订单,能算价格,能审批流程,能写合同,能发发票。它们甚至能互相聊天,你的AI销售跟客户的AI采购讨价还价,两个AI谈完生意,人类只需要最后签个字。
Nemotron联盟:智能体经济开始形成生态
接着一个更有意思的东西出现了。Nemotron coalition。名字听起来像变形金刚里的反派组织,其实是一群AI公司组成的联盟。成员包括Perplexity、Mistral、Cursor这些AI圈当红炸子鸡。
这个联盟背后的思想非常简单。未来每家公司都会拥有自己的智能体团队。就像今天每家公司都有IT部门一样。IT部门负责修电脑、管网络、搞安全。智能体部门负责训练AI、部署AI、管理AI。
黄仁勋说了一句话非常关键:every company needs an agent strategy。翻译过来就是每家公司都得有个智能体战略。不是可选项,是必选项。就像二十年前每家公司都得有个网站,十年前每家公司都得有个App,现在每家公司都得有个AI战略。
你想想,如果你的竞争对手有十个AI员工,二十四小时不睡觉地干活,你还在用人类员工朝九晚五地工作,你怎么打得过?这就像别人用收割机收麦子,你还在用镰刀一把一把割。不是你想不想换机器的问题,是你不换就得饿死。
Nemotron联盟的任务就是让这个转型变得容易。成员公司共享技术,统一标准,互相兼容。你的AI跟我的AI能对话,就像微信和QQ能互发消息一样。这个生态一旦形成,AI就不再是单个公司的玩具,而是整个经济的基础设施。
自动驾驶大战:AI开始进入现实世界
AI不只在数据中心,也在汽车里。这部分演讲特别有意思,因为黄仁勋请来了Uber的CEO一起站台。两个大佬在台上聊自动驾驶,画风有点像两个老司机交流开车经验。
Uber宣布将在2028年前在28个城市部署英伟达Drive AV系统。这个系统属于自动驾驶平台。2028年听起来很远,其实也就两年后。两年后你在这些城市打车,来的可能是一辆没有司机的车。你上车,关门,车自己开走,全程没人跟你说话,安静得像坐灵车。
同时,尼桑Nissan、比亚迪BYD、现代Hyundai都在基于英伟达硬件开发Level 4自动驾驶车辆。Level 4代表什么?意思是大多数情况下车辆自己驾驶,人类只负责坐车。你可以在车上睡觉、看书、刷手机、化妆、吃泡面,车自己知道怎么开。
换句话说,显卡不仅在写代码、生成图片、回答问题,还在开车。你坐的车里,可能藏着几百块显卡,实时处理摄像头拍到的画面,识别行人、车辆、路标、红绿灯,预测下一秒会发生什么,然后决定刹车还是加速。
这个过程每秒发生几十次,每次都要在毫秒级别内完成。如果显卡算力不够,车就会反应迟钝。你想想,如果自动驾驶反应慢半秒,可能就撞上前面的车了。所以自动驾驶对算力的需求,比数据中心还变态。这也是为什么英伟达能成为自动驾驶的核心玩家,因为全世界能把算力堆到这个程度的,没几家。
Feynman架构:未来三年路线图已经锁定
大会最后抛出一个更长远的东西。2028年的Feynman架构。名字来自物理学家理查德·费曼,这位大佬以讲物理通俗易懂出名,黄仁勋可能也想让自己的技术变得更好懂。
这个平台包括新GPU、新CPU Rosa、下一代LPU,还有一种叫vertical blade rack的新机架结构。数据中心开始像高层建筑一样设计。服务器不只是横着摆,还开始往立体空间发展。以前一个机房能放一千台服务器,以后能放一万台,因为服务器开始叠着放。
最重要的信息在于路线图已经锁定。整个AI算力体系未来几年已经规划完成。你不会看到英伟达突然换个方向,也不会看到技术路线大改。就像修高铁,轨道铺好了,车造好了,剩下的就是按时刻表运行。
这对整个行业是个巨大的信号。云厂商可以放心投资,因为知道未来几年算力不会过时。软件公司可以放心开发,因为知道底层硬件会越来越强。创业公司可以放心融资,因为知道AI的基础设施已经稳定。整个生态进入加速阶段。
最终结论:英伟达正在建设AI时代的基础设施帝国
整场GTC大会讲完以后,一个非常清晰的画面浮现出来。英伟达的业务正在发生本质变化。显卡只是入口,真正的目标是建设AI经济的基础设施层。云计算平台、推理系统、企业智能体、自动驾驶、游戏渲染,这些东西全都围绕同一套算力体系。
就像互联网时代需要电信运营商一样,AI时代需要算力运营商。电信运营商铺光纤、建基站、收网费。算力运营商建数据中心、堆显卡、卖算力。英伟达想做的,就是成为全世界最大的算力运营商。
黄仁勋正在做的事情,就是把英伟达变成AI时代的电网公司。你用电的时候,不会去想电是哪家发电厂发的。你用AI的时候,也不会去想算力是哪家公司的显卡提供的。但背后那个庞大的基础设施,一直在默默运转。
如果这个战略成功,未来几十年所有AI系统背后都可能有一层看不见的英伟达基础设施。