芯粒+异构集成=算力核爆

“小芯片chiplet”和“混合组装”这两个词现在满天飞,新闻里、论文里、产品发布会上到处都是。虽然工程师们基本能看懂这些内容,但做报告的人讲到一半也常会卡壳

比如纠结某个芯片到底算不算“小芯片chiplet”,或者发现大家对“混合组装”的理解五花八门。问题就在于,这两个词到现在都没有统一的定义,导致各种细微差别让人越听越糊涂。

有些专家觉得,只要芯片之间有连接接口,就能叫“小芯片”。但说到“混合组装”,争议就更大了——同一个人讨论时可能根据不同标准变来变去。现在看这些争论可能觉得较真,但长远来看,明确的定义才能推动这种新技术的发展。

小芯片到底是什么?
多亏了混合组装技术(后面会细说),小芯片现在成了香饽饽。把原本集成在一块芯片上的系统拆成多个独立部件确实有意义。不过把多个芯片塞进一个封装可不是新鲜事,多芯片模块(MCM)几十年前就这么干了,只是通常用在不起眼的领域。

传统MCM里的零件,本来就是能单独卖的封装好的芯片。如果不用定制方案,这些零件直接拿来用也不需要新特性。

那小芯片是不是换汤不换药的老概念?虽然定义细节有分歧,但没人认为这只是新瓶装旧酒。关键区别在于(大多数情况下)小芯片需要专门的芯片间直连方式。新思科技的高性能计算IP专家Michael Posner说:“必须要有某种芯片间的连接接口。”

有人更严格,认为只有带标准化接口的才算数。标准化接口才是小芯片的门槛,否则就是普通MCM。

虽然不一定需要新接口,但小芯片确实能做到传统MCM达不到的高效表现。传统芯片要独立驱动电路板线路,需要大功率接口;而小芯片只需驱动几毫米距离,速度快功耗低,但没法单独封装使用。

小芯片理念的兴起,主要是为了应对高端芯片的成本问题——既贵又做不大。用小芯片能提高良率、降低成本,因为每个小模块可以用最适合的工艺制造,不用把整个系统硬塞进最先进的制程。

现在很多公司用自家方案实现芯片间高效数据传输,有人认为这就算小芯片。而追求标准化的人,则推崇UCIe和BoW这类新接口标准。就像现在的IP核生态一样,互操作性是小芯片普及的关键——确保不同厂家的小芯片能无缝协作。正因如此,有人认为标准化接口才是小芯片的核心特征。

不同视角的定义
Arm的观点更灵活,强调“拆分”而非接口。小芯片是未封装的芯片模块,专为与其他模块组合封装成系统而设计。通过优化各模块功能,既能避免制造超大芯片的良率问题,又能降低成本。

小芯片市场的出现让定义更复杂。现在‘小芯片’也指开放市场生态,所以用‘多芯片’来涵盖所有情况。但接口是必要条件。

小芯片就像封装内的乐高积木,每个模块专攻特定功能。从开机调试到供电管理,都要当成整体来设计,延迟也必须极低。”不过他认为小芯片不一定非要封装在一起:“有些场景直接焊到电路板上更划算。

该叫小芯片还是芯粒?
随着封装里塞进多个硅片,命名也成了问题。通常“芯片”指单个硅片,“封装”指整体产品。

传统芯片是测试封装后直接可用的产品,而小芯片是封装在同一芯片里的功能模块。

有人建议用“dielet芯粒”更准确,但拗口不如“chiplet”顺耳,只好将就。

模拟和光通信带来的难题
模拟芯片让定义更棘手。数字接口是标准化的,但模拟信号不需要——如果模拟芯片只处理外部信号,连内部接口都不用。那它还算小芯片吗?有人坚持必须有数字接口才算,但实际应用中,定义不该成为集成障碍。

光通信芯片更特殊——纯光子芯片连电接口都没有。如果死抠“标准化接口”的定义,这类芯片可能被排除在外,但这显然不合理。说到底,定义是为了方便沟通,不必过于教条。


异构集成/混合组装:更混乱的概念
“异构集成/混合组装”同样定义模糊。

30或40年来,我们一直在采用单片设计,这有巨大的优势。如果你有多个内核,把它们都放在一个SoC上,它们会更快、更小、更便宜,而且功耗更低。这种情况仍然存在。你可能无法做到这一点的唯一原因就是芯片太大了。

关于“异构集成/混合”的边界,各方分歧更大:

  • - 最宽松派:封装里有两个东西就算,哪怕一模一样
  • - 差异派:必须包含不同功能模块(如CPU+内存)
  • - 独立设计派:模块需来自不同设计项目
  • - 工艺节点派:必须混合不同制程(如5nm+22nm)
  • - 激进节点派:必须混合尖端和成熟工艺(如5nm+65nm)
  • - 材料派:必须混合不同材料(如硅+化合物半导体)

这些标准有的很脆弱——比如按节点差异定义,若将来工艺升级趋同,原本“异构.混合”的封装就变“同质”了,但实际制造过程毫无变化。联电的王博士认为:“即使工艺相同,若功能、设计理念和研发路线完全不同,也算混合组装。”

模拟芯片又成特例——它们通常不用先进工艺。当高压模块和纳米级模块共存时,会涉及复杂的多物理场问题,这才是混合组装的真正挑战。

IEEE的定义最包容:“将分别制造的组件集成为更高阶系统,从而提升整体功能和性能。”这几乎囊括了所有可能。


较真有必要吗?

争论定义到底值不值?对小芯片来说,如果是企业内部使用,自己定规矩就行。但若形成开放市场,名称就可能影响互操作性——不过只要文档齐全,没标准接口的模块也能用。

对异构集成/混合组装而言,当下各厂封装工艺差异大,名称暂时不影响实际。但如果未来工艺分化为“同质”和“异构”两条技术路线,

明确界定就有价值了。好在随着技术发展,实用需求自然会推动定义走向统一。

现阶段的关键是保持开放思维,为未来共识留出空间。


芯粒+异构集成=算力核爆
将超大芯片拆解为多个小芯粒(如CPU、GPU、IO等模块),各自用最优工艺制造(比如CPU用5nm,内存用成熟制程),再通过先进封装(如3D堆叠)重组,等效实现“超大规模芯片”的性能。

▶ 典型案例:

  • AMD的EPYC处理器(通过芯粒拼出128核CPU)
  • 英伟达的H100(GPU+光计算芯粒异构集成)

特点:

  • 存算一体:将内存与计算芯粒紧耦合,解决“内存墙”瓶颈(如HBM堆叠)。
  • 专用加速:集成AI、加密等定制芯粒,效率提升10-100倍。
  • 芯粒允许复用成熟模块(如IO芯粒),新功能仅需迭代部分单元,研发成本降低50%+。
  • 异构集成支持“混合工艺”(如5nm逻辑芯片+28nm模拟芯片),避免全系统升级的浪费。
  • 标准接口(如UCIe)让不同厂商的芯粒“即插即用”,加速技术组合创新。
  • 3D堆叠使晶体管等效密度超越单芯片10倍以上。
  • 芯粒间短距互联(如台积电CoWoS)功耗仅为PCB传输的1/10,AMD MI300X(CPU+GPU+内存芯粒异构)比前代性能提升8倍;特斯拉Dojo超算(芯粒化设计)训练速度提升4倍。

“芯粒+异构集成”本质是用系统级创新绕过物理限制,通过“分解-优化-重组”实现算力的非线性增长