芯片平面时代挤爆后:华为τ Scaling如何重构芯片立体化结构?

华为τ Scaling核心并非晶体管突然跨代进化,而是把芯片平面道路改成立体高架,通过空间折叠缩短信号路径,用设计和散热换取性能增长。

芯片的平面道路终于堵到动不了了

很多人看到华为芯片等效1.4纳米、能耗提升41%、密度冲到238兆每平方毫米这些数字,脑子里瞬间开始放烟花,感觉晶体管突然像吃了生长激素一样连跳三级。但真实情况更像你每天上班的那条路,以前是双向四车道,现在车越来越多,早高峰堵到红绿灯变成装饰品,于是城市管理者突然决定,咱们别修路了,直接在上面架高架桥吧。发动机还是那个发动机,轮胎还是那个轮胎,但汽车开始在天上飞着跑了,因为路从一张纸变成了一栋楼。

这就是华为这个τ Scaling(读作陶缩放,一种通过三维堆叠提升芯片密度的方法)干的事。芯片世界里的晶体管并没有突然变小,它们只是开始往上叠罗汉。以前所有电路都老老实实躺在同一层平面上,就像整个村子的人都住平房,去邻居家串门要走好几百米。现在华为说别平铺了,咱们把房子摞起来,你住三楼,我住四楼,串门直接走楼梯,距离从几百米缩成几米。所以那些神奇的数字,本质上不是汽车变快了,而是送货地址从城市另一边搬到了你头顶上。

电子快递员的送餐距离被暴力缩短

芯片干活有个特别烦人的隐形开销,叫跑路费。你可以把电子信号想象成外卖骑手,CPU核心是一个大型食堂,缓存是仓库,内存是郊区的大超市。一个指令想从食堂跑到仓库,以前在平面芯片上需要跨越很多街区,经过无数红绿灯和减速带,虽然实际距离可能只有几毫米,但在电子世界里这相当于骑手背着二十份麻辣烫横穿整个城市。

Logic Folding(逻辑折叠,一种将不同功能电路垂直堆叠的技术)干的事特别直接粗暴,它把整个城市的道路网折叠起来。以前食堂在城东,仓库在城西,骑手导航显示二十五公里。折叠以后食堂在一楼,仓库在二楼,骑手只需要坐电梯上一层楼。电子信号突然发现,今天不用骑电瓶车了,下楼取个快递就完事。这个变化带来的数据特别吓人,论文里写的时钟深度下降了百分之四十二,时钟线路缩短了百分之二十八,时钟偏移减少了百分之二十五,时钟缓冲器少了百分之五十六。

翻译成人话就是以前老板开个会,要先通知副总,副总通知经理,经理通知组长,组长再喊员工,等消息传到会议室,咖啡都凉了三轮。现在老板直接在公司大群里发语音,“全体注意,开会”,所有人同时抬头。芯片里那些缓存、逻辑单元、控制电路之间的通讯,以前要绕很多弯路,现在上下楼直通,延时掉下来像坐滑梯。

路变短以后顺手把电费也给省了

很多人以为性能提升全靠猛踩油门,电压往死里加,频率往死里超,最后芯片热得像刚烤好的红薯。但这次华为玩了个特别鸡贼的操作,路变短以后,车根本不用开那么快。原来送一单外卖需要三十分钟,你骑电瓶车得拧满把,电耗得飞快。现在送一单只需要十五分钟,你可以慢慢悠着骑,电耗自然就下来了。

芯片世界有个特别阴险的功耗公式,大概是这样的:功耗约等于电容乘以电压的平方再乘以频率。这里面最狠的角色是电压,因为它带个平方。电压从1伏降到0.92伏,看起来只降了百分之八,但功耗直接掉一大截,因为平方项会让数字变得很性感。就像你租房,房租从五千涨到五千五你感觉还好,但从五千五降到四千九你会开心一整天,平方项把这点变化放大了。

所以那百分之四十一的能效提升,大概率不是什么外星黑科技。它更像一个精明的会计发现,既然送货距离短了,我们就把送货时间拉长一点,电瓶车调成经济模式,电费账单自然就好看多了。原来跑3.1吉赫兹需要1伏电压硬扛,现在跑2.75吉赫兹只需要0.92伏,频率降了百分之十一,电压降了百分之八,平方项一乘,功耗哗啦就下来了。这就像你以前每天跑十公里累得像狗,现在每天只跑五公里,轻轻松松还能路上买个早餐。

热量开始像火锅店叠罗汉一样冒烟

但快乐的事一般持续不了太久,因为每个技术方案背后都有个收账的。这次收账的角色叫散热。以前芯片是一层楼,热了开空调吹风扇就行。现在华为把两层芯片叠在一起,相当于你在一家火锅店楼上又开了一家火锅店,而且两家共用同一个排烟管道。楼下涮牛油锅底,楼上涮麻辣锅底,整个建筑热得像火山口。

理论上热密度会直接翻倍,但因为功耗下降了不少,实际只上升了大概百分之四十。但这个数字已经很刺激了,因为热量这东西不像电子。电子看见路就能跑,信号沿着导线嗖嗖就过去了。热量特别像下班高峰的地铁站,所有人都往同一个出口挤。上层芯片的热量想往上跑,下层芯片的热量也想往上跑,两个热源在中间碰头,场面像春运期间的火车站售票大厅。

这也是为什么第一代方案只敢把百分之五十三的区域叠起来。工程师心里清楚,这事就像第一次吃九宫格火锅,先点个微辣鸳鸯锅探探底。看看肠胃能不能扛住,再决定下次要不要挑战变态辣。另外那百分之四十七的区域继续平铺,不是技术做不到,是怕热得把芯片烤成煎饼果子。

散热系统从电风扇进化成重症监护室

继续往下挖会发现事情越来越像科幻片。以前的散热方案特别简单粗暴,热了加风扇,再热加均热板,还热上石墨散热片,跟给发烧的额头贴退热贴一个道理。但未来芯片散热开始往医疗设备方向发展,各种名词听着像手术室里的仪器,什么封装内冷却、芯片内冷却、微机电系统散热风扇、微流体冷却。

这些技术本质上都是在芯片内部直接通冷却液,或者用微小的泵让液体在芯片内部循环。以后可能每个芯片区域都装了一个温度计,哪个地方突然发高烧,系统立刻知道,然后调度软件把那个区域的工作负载紧急搬家到隔壁凉快的地方。哪条通道堵了,冷却液就重点冲哪里。

未来的散热系统越来越像城市交通指挥中心。大屏幕上显示整个芯片的热力地图,核心A区红了,温度九十五度,系统大喊:“核心A太热了,任务紧急迁移到核心B!”以前风扇埋头傻吹,像个力气很大的搬运工。以后变成一群交警实时指挥,哪里堵点哪里,效率完全不是同一个级别。

往上叠楼层的收益开始像挤牙膏

看到路线图以后很多人容易激动。今天双层,明年三层,后年四层,感觉可以一直叠到摩天大楼。但现实世界一般不喜欢无限快乐这种剧本,因为收益会递减,痛苦会递增。

从一层变成两层,收益最大。因为平房突然变复式,使用面积直接翻倍,那种爽感就像租房从隔断间搬进loft。但从两层变三层,收益就开始缩水了,因为能折叠的逻辑区域越来越少,就像你叠衣服,第一件叠完省了一半空间,第二件再塞进去省了四分之一,到第五件你得使劲压才能关上衣柜门。

三层变四层继续缩水,四层变五层基本就是在拼积木了。与此同时,成本、设计复杂度、散热压力这三样东西开始坐火箭往上蹿。收益曲线慢慢变平,痛苦曲线越来越陡,两条线交叉的地方就是技术路线的天花板。工程师每天盯着热力图、时序分析报告和良率数据,头发掉落的速度大概能和芯片堆叠层数画出一条正相关曲线。这就像盖楼,盖到十层很开心,盖到二十层还行,盖到五十层你得考虑电梯够不够用、地基扛不扛得住、风一吹楼会不会晃。

华为提前把整个行业的未来问题拽到了今天

整个事情最后真正值得琢磨的地方,其实不是τ Scaling这个希腊字母名字。名字就像健身房的广告牌,看起来很猛,但真正值钱的是华为把行业未来十年要面对的问题提前搬到了今天。

英特尔、台积电、AMD其实都在往三维堆叠这个方向走,因为平面芯片世界已经挤到快爆炸了。以前像个小县城,修条路就能解决拥堵。后来变成大城市,修快速路、环线、地下通道,勉强能扛。再后来变成超级都市,车多到把所有路都塞满,你发现继续扩路的成本高到离谱,于是所有人同时抬头看天,说要不咱们往上修立交桥吧。

华为因为外部原因,先进工艺用不上,相当于被逼着提前爬上了这个楼梯。别人还在慢慢等电梯,它已经抓着消防水管往楼顶冲。这条路未来肯定有天花板,收益也会越来越慢,但它提前让整个行业看清楚一件事:平面时代快挤爆的时候,芯片世界迟早要从修马路进入盖高楼的时代。