中国团队推出全光生成式AI芯片LightGen,以全光三维架构、两百万级光子神经元和一次性全图生成能力,实现对A100百倍速度与能效优势,揭示生成式AI硬件换代的技术底牌。
今天所有大模型看似是算法竞争,本质却是电子算力在硬撑,从Transformer到扩散模型,核心操作是超大规模矩阵乘法与高维张量映射,而这些操作在硅基芯片上依赖电子迁移、电容充放电与频繁时钟同步,只要规模继续扩大,延迟、功耗和热密度就会同时爆炸,这不是工程调参能解决的问题,而是电子作为信息载体的物理极限正在被撞穿。
LightGen不是在GPU旁边外挂光互连,而是彻底抛弃电子计算路径,信息从输入、计算到输出全程由光子承载,计算过程依赖光的干涉、衍射与相位调制完成,这意味着计算速度直接逼近光速上限,同时几乎不产生焦耳热,从物理层面切断了“算力越强、能耗越高”的因果链条。
该芯片集成了超过200万个光子神经元,每一个神经元本质上是一个可调谐光学计算节点,能够执行线性变换、加权求和与非线性映射,这些操作并非通过指令序列完成,而是由光场在结构中自然演化完成,神经元数量直接对应并行计算宽度,而不是时分复用的“虚拟并行”。
传统GPU即便有上万个CUDA核心,本质仍然依赖时钟驱动和线程调度;而LightGen中,光子在同一时间通过整个神经网络结构,所有神经元同步参与计算,计算延迟几乎只等于光穿过芯片的传播时间,这也是其在生成任务中延迟骤降两个数量级的根本原因。
以往光子芯片受限于二维平面结构,只能处理局部patch;而LightGen采用三维层叠式光学网络,将神经元按深度方向堆叠,形成真正的三维计算体,这使得芯片能够在单次前向传播中处理完整高分辨率图像或视频帧,而不是拆分重组,从根源上避免语义断裂和空间不一致问题。
核心性能参数对比:速度、能效、密度同时跃迁
在对标测试中,LightGen在相同生成任务下实现约100倍于英伟达A100的处理速度,能耗降低至约百分之一,同时单位面积内的有效计算密度提升约100倍,这意味着在同等机柜空间和供电条件下,LightGen理论上可以提供两个数量级以上的生成吞吐能力。
GPU能耗的大头来自晶体管开关和电容充放电,而光计算中几乎不存在等效损耗,能量主要消耗在光源与调制器上,这也是为什么在高负载生成任务中,LightGen的能效曲线不会随着模型规模线性恶化,而电子芯片则会迅速失控。
在图像和视频生成实验中,LightGen在语义一致性、全局结构保持和细节连续性上,与稳定扩散、StyleGAN等电子计算模型持平甚至更优,其原因并不神秘:光学并行天然适合表达连续空间与全局约束,这与生成任务的数学结构高度匹配。
需要强调的是,LightGen并不是一个“推理加速器”,而是一个可以直接执行生成网络的计算平台,它不是替GPU跑同一套代码,而是用物理结构实现模型计算,这意味着未来的模型架构本身可能会围绕光计算重新设计,而不是简单移植。(让ChatGPT之类大模型重新写代码也很容易,自己给自己写代码!)
技术细节深挖:3D堆叠光子神经元如何实现“一图吞下”?
让我们稍微深入一点技术内核。
传统光子芯片(比如基于硅光的方案)通常是二维平面结构,每个光学元件(如调制器、波导)都铺在同一层硅片上。当处理一张大图时,芯片视场有限,只能分块处理再拼接,导致边缘模糊、纹理错位。
而LightGen采用创新的3D集成技术,将光子神经元垂直堆叠成多层结构——就像把无数个微型光学处理器摞成一座“光之塔”。
每一层负责不同尺度的特征提取:底层捕捉边缘和轮廓,中层识别纹理和结构,顶层整合语义和风格。所有层级通过垂直光波导互联,信息以光速在层间传递,无需光电转换。
这种架构天然支持全图并行处理,因此生成的图像不仅快,而且“浑然一体”,没有拼接痕。论文中展示的老虎、森林、海浪等图像,细节丰富度甚至超越了Stable Diffusion 3,而耗时仅为其1%。这种“视觉生成即推理”的能力,正是类脑计算的精髓。
可持续AI第一次不是口号:算力增长不再等于能源灾难
论文作者在《科学》期刊中明确提出,LightGen提供了一条“在不牺牲性能的前提下,把复杂AI带入日常应用”的新路径,核心关键词只有一个:可持续,以往每一代模型升级,背后都是数据中心能耗暴涨,而全光芯片如果能规模化,意味着算力增长第一次有可能不再和碳排放、散热成本死绑在一起,这对产业和社会层面都极其关键。
作者与团队背景:不是偶然爆点,而是长期积累的结果
论文第一作者陈逸同及其团队,长期从事光计算、光子集成与类脑计算研究,上海交通大学与清华大学在光电芯片和新型计算架构领域都有多年积累,这次成果并非实验室玩具,而是明确面向大规模语义生成任务设计的工程级原型,这也解释了为什么顶尖科学家敢直接对标产业界领袖英伟达,而不是只展示概念验证。
当然,LightGen目前仍是原型芯片,距离量产、生态适配、软件工具链成熟还有很长一段路要走,如何进一步扩大规模、如何与现有模型和训练流程衔接、如何解决制造良率与成本问题,都是下一阶段绕不开的现实挑战,但路线已经被清晰地画出来了,这一点本身就足够改变行业预期。
投资者必看:光芯片赛道或将引爆新一轮科技资本狂潮
对于关注硬科技投资的朋友来说,LightGen的出现绝非只是学术新闻,而是一个明确的产业信号。
过去五年,全球光计算初创公司融资已超50亿美元,但大多聚焦在光互联或模拟计算。
LightGen首次证明了“全光生成式AI芯片”的可行性,这将极大提振市场信心。可以预见,未来12个月内,国内外资本将疯狂涌入光子神经形态计算、3D光子集成、非线性光学材料等细分领域。
对中国而言,这更是打破半导体“卡脖子”困局的战略机遇——既然我们在传统CMOS工艺上追赶艰难,何不直接跳到下一代技术轨道?已有迹象表明,多家中国头部AI公司正在秘密接触相关团队,探讨技术转化可能。
对于二级市场投资者,关注具备光子芯片设计、III-V族材料、先进封装能力的A股/港股标的,或将成为下一波AI硬件行情的关键。
极客一语道破
科学界一向在语言上碾压产业界,产业界一直真的在从科学界汲取营养,这两者之间需要资本自由推动,资本是媒婆,资本注重行动力,而不是智能。