DeepMind两天破解教授十年难题，科学家直呼不信但真香

#AI端侧 #AI智能体Agent #AI医疗

2026-06-23 3K banq

谷歌DeepMind搞了个AI搭档科学家，给个研究目标，它自己出方案，还让一堆智能体搞擂台赛比谁点子强。结果呢，有个教授花十年才弄明白的细菌基因转移新机制，这AI两天就猜出来了，还顺手多送了四个靠谱猜想，其中一个教授团队压根没想过，现在正忙着验证呢。

教授十年的活儿AI两天干完还带买四送一

这事得从伦敦帝国理工学院的何塞·佩纳德兹教授说起。他是微生物学专家，整天跟细菌打交道，研究它们怎么转移基因。细菌这玩意儿看着单细胞挺简单，其实贼精，它们之间传递基因就像在菜市场交换小纸条，有各种你想不到的招数。佩纳德兹教授在这个问题上深耕了整整十年，才终于把一种新的基因传递机制给捋清楚，发表了论文。

十年啊，从青丝到可能有点白发，多少个泡实验室的日夜，多少次失败重来，结果BBC采访他的视频里，记者转述AI系统的表现时，他自己都懵了。

DeepMind的AI搭档科学家拿到这个研究目标后，没日没夜地跑算法，两天，就两天，给出了一个假设。佩纳德兹教授第一反应是，这不可能，绝对是作弊了。他觉得自己平时用谷歌搜东西，用Gemini写邮件回消息，这些数据肯定被AI偷学了，不然它怎么可能凭空猜中答案。这就像你去参加猜谜比赛，对手是你家鹦鹉，结果它秒答了你花了十年才从图书馆查到的冷门知识，你肯定觉得它偷看了你的笔记。

但后来他发现，AI不是只蒙对了一个。它一口气提了五个假设，全都站得住脚，逻辑自洽，有根有据。顶级的那个恰好就是佩纳德兹教授验证过的正确答案，但剩下的四个里，有一个方向他们整个团队压根就没往那想过。这就好比你找宝藏，挖了十年挖到一箱金币，正乐呢，结果AI跑过来说，旁边还有四个箱子，你一看，其中一个里面装的是你完全没概念的外星货币。他现在正带着团队研究那个被AI点醒的新方向，之前完全在视野盲区里。

这个AI科学家到底怎么搞出这些脑洞的

DeepMind给这个系统起名叫AI搭档科学家，它干活的方式不像普通AI那样只是查资料总结。你给它一个研究目标，比如搞清楚某种细菌怎么抵抗药物，它先自己生成一个初步研究计划。然后关键来了，它会启动一个叫锦标赛的机制，让一群智能体互相PK，看谁能产生更牛的新假设。

每个智能体分工不同，有的专门负责挑刺，对已有想法进行反思，说这逻辑不通，那证据不足；有的则负责当变种人，在现有想法上搞演变，加点这个改点那个，看能不能变异出更好的点子。

这个锦标赛不是打一架就完事，它有点像那种持续淘汰晋级的选秀节目。多轮迭代下来，那些不靠谱的假设被淘汰，有潜力的被保留、被组合、被变异，最终胜出的就是经过系统内部严刑拷打后的精品。

整个过程模拟了科学共同体里那种同行评议加思想碰撞的流程，只不过速度被压缩到了极致。人的团队开个会，大家时间有限，精力有限，偏见还不少，但AI这边可以24小时不间断地让不同特长的智能体互相折磨，直到打磨出站得住脚的猜想。

这系统已经不光是纸上谈兵了。

DeepMind已经给一大票生物医学领域的学术研究者开放了早期访问权限，让他们真刀真枪地在实际研究里用。佩纳德兹教授那个案例就是其中之一，而且是被当成高光典范拿出来说的。它能预测一个还没发表的新机制，这说明它不是在那拼凑已知知识，而是真有点推演和创造的意思了。你可以说它是超级外挂，但人家这外挂是自己打怪升级练出来的推理能力，不是简单复制粘贴。

一开始谁都觉得是数据泄露闹的鬼

佩纳德兹教授在采访视频里那个表情，我看了好几遍，那种先震惊后怀疑再转为兴奋的转变特别真实。当BBC记者问他，听说AI两天就搞出你十年才找到的答案，你啥反应？他直接说，我不信，我觉得肯定是我用了谷歌产品，我的搜索记录、邮件、文档全被拿去训练AI了，这不明摆着透题吗。这种反应太正常了，换谁谁不嘀咕。你写十年小说，人家AI两天续了个一模一样的结局，你第一反应绝对是有人把我硬盘拷贝了。

但问题是，AI提供的另外四个假设打破了这个怀疑。如果只是数据泄露，那它应该只能抄袭到那个已经发表的正确答案，不可能连带着把其他四个还没被他们团队充分探索过的合理猜想也一起端出来。尤其里面还有一个是他们压根没想过的方向，数据里都没这号东西，它上哪泄露去。这就排除了单纯作弊的可能，说明这系统真有自己生成新知识的能力。

更让佩纳德兹教授激动的是，AI给出的五个假设不是那种模糊的方向性废话，而是具体到能直接指导实验操作的方案。他说这话的时候眼睛都亮了，因为他意识到这不只是省时间的问题，这是打开了新维度。他们团队十年专注一条路，虽然走通了，但思维多少有点固化。

AI像个愣头青一样从完全不同的角度切入，给出了他们因为各种思维定势而忽略的可能性。现在他们正忙着验证那个新方向，说不定又能发篇好文章。

科学发现的玩法可能要被彻底改写

想想传统的科研流程，一个教授带一帮博士生博士后，先读海量文献找准研究方向，然后设计实验，做出来结果再分析，分析完再写论文投稿，审稿人再挑刺返修，一套下来几年过去了。碰到那种需要灵感或者运气的问题，时间线拉得更长。佩纳德兹教授那十年就是活生生的例子。但AI搭档科学家这种玩法，直接把产生靠谱假设的阶段从以年为单位压缩到以天为单位。你给它目标，它出方案，智能体们打擂台出假设，然后人类科学家直接去验证最有希望的那几个。

这不光是提速的问题，更是改写了发现新知识的路径。以前是科学家冥思苦想加大量试错，现在变成AI大规模并行探索可能性空间，然后人类来做选择题和验证题。尤其像生物学这种系统极其复杂、变量多到爆炸的领域，人的脑力能同时考虑的假设非常有限，而AI可以同时跟踪、演变、淘汰成千上万个想法。那些因为太反直觉、太冷门而被人类忽略的角落，AI反倒可能因为没有任何偏见而一头扎进去。

当然这也不是说科学家要失业了。恰恰相反，AI提供的那些假设，尤其是第五个他们从没想过的方向，还得靠佩纳德兹教授这样的专家来判断哪个值得跟，然后设计实验去验证。AI负责天马行空，人负责去伪存真和落地执行。这更像是一种脑力外包，把最烧脑的猜谜环节交给AI，把人从重复试错里解放出来去干更高级的活，比如判断哪个谜值得猜，以及猜中后怎么用实验证明。

这系统背后是DeepMind憋的大招

DeepMind这公司在AI领域一直走硬核路线，从AlphaGo下围棋到AlphaFold预测蛋白质结构，再到现在的AI搭档科学家，路子越来越往科学发现本身上靠。他们上个月刚发了篇新论文专门讲这个系统，看来是技术成熟度到了一定阶段，敢拉出来溜了。给学术圈开放早期权限这步棋走得也聪明，让真正在一线搬砖的科学家去用，去挑毛病，去提需求，这比内部自己憋着迭代要快得多。

这个AI搭档科学家和普通的大语言模型区别在哪呢？
普通模型你问它问题，它给你个答案，但那个答案是基于它训练数据里的模式统计出来的，不一定有严格的逻辑推演和新的知识组合。
而这个系统引入了锦标赛机制，让多个智能体互相博弈，实际上是在模拟科学争论和思想演化的过程。
它产生假设的方式更接近人类科研里那种假说演绎法，只不过它能把候选假设的数量级和迭代速度拉满。

佩纳德兹教授的例子正好撞在DeepMind的宣传点上，能预测还没发表的发现，这广告效果比任何发布会都炸裂。你想啊，如果这系统真能在不同领域稳定输出这种级别的假设，那接下来的科研范式真要天翻地覆。

制药公司找靶点、农科院改良作物、环境科学搞污染治理，所有需要先猜后验的活儿，AI都能进来插一脚。而且它不怕失败，不会累，不会因为连续被拒稿就心态崩了，可以同时在几百个方向上并行推进。

作者单位：Google DeepMind，伦敦帝国理工学院