如何使用大模型实现突破性创新研究?


对于那些希望使用大模型LLM从事突破性科学研究的人来说:大模型尤其不适合从事这项工作。(如果你是一名研究人员,你一定已经注意到了这一点)。

突破性研究需要

  1. 朝着一个全新的、出乎意料的方向前进,而每个人在很久以前就认为这个方向是愚蠢的;或者
  2. 发现一些非同寻常的新实验数据,这意味着我们必须改变我们的理论

大模型无法进行实验,所以我们将重点关注第一条。

仅仅说 "LLM不会推理 "是没有用的,因为很明显,

  • LLM 会做一些人类会用到推理的事情。
但是,LLM 首先是:
  • 模糊子图匹配机器(*大规模*)。


换句话说(稍微简化一下),LLM 主要是通过模糊查找和插值在其训练集中发现的概念来工作的。
由于搜索的模糊性和训练集的规模,这可以产生一些非常令人印象深刻的结果。

每当我试图探讨一些哪怕是稍稍有悖于普遍接受的观念的问题时,大模型们总是重复那些普遍接受的观念。 作为一名研究人员,我发现这种行为比无益更糟糕。它给人的错误印象是,没有什么可探讨的。

公平地说,这不仅仅是大模型的问题。研究界也是如此。

例如,@planetmoney 的最新一期节目就采访了一位诺贝尔经济学奖得主,他在首次发表成果时被评审人称为 "江湖骗子"。
但有些人,有些时候,即使没有人支持他们,也能顽强地、创造性地探索出突破常规的想法。 比如卡塔林-卡里科(Katalin Karikó)。

因为 LLM 是模糊子图匹配器,所以它们只是对已有的内容进行插值,而且它们会对训练集中最常见的内容进行加权。(根据大多数人意见)

那么,如何在研究中利用大模型优势呢?
有两种好方法:

  1. 利用 LLMs 的大规模插值能力,向其输入大量半随机和/或不断变化的提示,并配备自动答案检查器,或者...
  2. 向 LLM 提供精心设计的想法集,让它帮助你考虑和构建这些想法的含义。告诉 LLM "我们只是在集思广益",可以帮助它转向插值不常见的子图。 例如,AlphaGeometry 成功运用了这些想法

总之:
LLM 在与人类结合时效果最佳。 这意味着最值得兴奋(或害怕)的是计算机+人类的力量,而不仅仅是计算机本身的力量。