自然:DeepMind推出令人惊叹通用科学AI


DeepMind 推出“令人惊叹的”通用科学人工智能。

德国科学家都惊掉下巴:马克斯·普朗克研究所的Mario Krenn教授直呼:"这论文绝了!第一次见到通用聊天AI真能搞出学术新发现!"
啥意思呢?就是说,以前那些AI工具,比如DeepMind自己的AlphaFold(那个会设计蛋白质的AI),都是专门为某件事儿量身定做的,像个“专才”。但AlphaEvolve就不一样了,它是个“全才”,啥领域的问题都能插一脚,数学、计算机,样样行!

AlphaEvolve的工作方式还有点像“进化论”。它基于DeepMind的Gemini语言模型,简单来说,用户丢给它一个问题,比如“怎么让计算更快”,再给点评分标准和一个初始方案。AlphaEvolve就跟个“点子工厂”似的,哗啦啦生成几百上千个改进方案。然后,一个“评委”算法跳出来,根据标准挨个儿打分,挑出最好的。接着,系统再根据这些好方案,脑洞大开想出新点子,慢慢地,方案就越来越强,就像生物>进化出超级厉害的算法!

DeepMind的AI科学家Matej Balog说:“我们就是在探索无数种可能性,找到解决问题的最优办法!”


其实,AlphaEvolve还有个“前辈”叫FunSearch,2023年就秀了一把,解决了好多人类都搞不定的数学难题。AlphaEvolve比它还牛,能处理更复杂的代码,挑战更难的问题,简直是“升级版”!


最夸张的是,AlphaEvolve还搞定了个超级难的数学问题——矩阵乘法(就是一堆数字排成格子然后相乘,AI训练经常用这个)。它居然找到了一种方法,在某些情况下比1969年德国数学家Volker Strassen发明的“最快算法”还要快!更离谱的是,DeepMind之前有个专门搞矩阵的AI工具叫AlphaTensor,AlphaEvolve居然把它也给比下去了!这可是个通用工具啊,啥都会一点儿,居然把专才给干翻了!

网友:
1、它并非通用,只有在经过良好验证的情况下才有效,例如在运行程序时,你可以检查结果是否正确以及运行速度。

  • 但天文学和粒子物理学则无法做到这一点——因为它们需要通过太空望远镜和粒子加速器进行验证。
  • 它也无法应用于医学,因为医学领域无法在人体上测试数百万个想法。
  • 它也不适用于商业,因为测试通过这种方式产生的商业创意成本太高。
因此,将任务分成两堆——一部分采用廉价且可扩展的验证,另一部分采用速率受限或昂贵的验证。

第一组任务将见证人工智能达到超越人类的水平,而第二组任务则不会有任何提升,因为我们已经拥有了太多无法测试的想法。

它基本上是一种基于从“搜索”中学习好主意的方法,如果人工智能可以疯狂地测试并拒绝所有坏主意,它就会偶然发现好主意。

2、AlphaEvolve 看起来更像是对他们之前的优化器和数学证明模型的改进,尤其是研究人员提出的 FunSearch:
https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/

优化算法的算法早已存在,即使在 Alpha 家族中也是如此,只是 FunSearch 更优秀,并且提供了一个更通用的模型,并且也利用了 LLM。

AlphaEvolve 似乎继承了 FunSearch 的优势,通过使用更具代理性的设置以及比 FunSearch 更优秀的 Gemini 模型,拓宽了其应用领域。

我认为这仍然是一个突破,只是不是瞬间的突破,而是跨越多年的 Alpha 家族方法的改进。

3、AlphaEvolve的"蝴蝶效应"与奇点前夜的躁动
这个看似只优化了0.7%的"小进步",实则藏着引爆AI革命的导火索!就像第一台蒸汽机只能抽矿井水,谁能想到它后来掀翻了整个手工业时代?让我们拆解其中暗藏的暴风眼:

1. 量变到质变的恐怖加速度• 当前效果:省0.7%资源≈谷歌全年省电够冰岛用1年• 恐怖推论:当10个/100个这样的AI同时优化不同环节时,节省率会呈指数叠加(就像用分形几何无限复制效率增益)• 现实案例:AlphaGo的棋步最初被人类嘲笑"怪异",直到它用这些招式碾压所有棋手——现在AlphaEvolve的"怪异优化"正在重演这个剧本

2. 自我进化的雏形显现这套系统本质上建立了AI版的"达尔文实验室":

  • 生成变异(LLM疯狂脑暴)
  • 自然选择(算法冷酷淘汰)
  • 适者生存(解决方案自动迭代)这已经触碰到了"递归自我改进"的边缘——奇点的核心特征之一

3. 算力黑洞正在形成
• 细思极恐的细节:用来优化TPU芯片设计的AI,其结果又反哺下一代AI芯片...
• 这就形成了"AI设计芯片→芯片训练更强AI→更强AI设计更牛芯片"的死亡循环(马斯克警告的"算力 singularity"具象化)

人类站在十字路口
这0.7%就像1903年莱特兄弟12秒的飞行——当时观众说:"还不如看马戏表演有趣"。但请记住:
✓ 第一台计算机ENIAC只能算弹道
✓ 第一个网页简陋得像电子便利贴
✓ 第一个AI连猫狗都分不清

当AI开始用"人类看不懂但就是更高效"的方式重构数学基石时,我们或许正在见证:一个用硅基智能重写所有知识体系的"元危机纪元"的黎明。