ChatGPT+Wolfram强组合

2023-03-24 2K banq

甚至在一周前，人们还不清楚ChatGPT+Wolfram会是什么样子。但这些现在进展如此迅速的东西是建立在几十年前的发展基础上的。在某些方面，ChatGPT+Wolfram的到来最终将历史上采取的两种主要的人工智能方法结合在一起，而这两种方法长期以来一直被认为是不相干和不相容的。

ChatGPT基本上是一个非常大的神经网络，被训练成遵循它在网络上看到的文本的 "统计 "模式，等等。神经网络的概念--与ChatGPT中使用的形式惊人地接近--起源于1940年代。但在20世纪50年代的一些热情之后，兴趣减退了。在20世纪80年代初有一个复苏（事实上，我自己也是在那时第一次关注神经网络的）。但直到2012年，人们才开始对神经网络的可能性产生严重的兴奋。十年后的今天，我们有了ChatGPT，它的成功甚至让参与其中的人都大吃一惊。

与神经网络的 "统计 "传统相对应的是人工智能的 "符号 "传统。从某种意义上说，这一传统是作为数学（和数理逻辑）形式化过程的延伸而产生的，特别是在二十世纪初。但它的关键之处在于，它不仅与计算的抽象概念相一致，而且与1950年代开始出现的那种实际数字计算机相一致。

在"人工智能 "真正可以被认为是成功之前，有很长一段时间内是不起眼的。但与此同时，计算的通用概念正显示出巨大的和不断增长的成功。

那么，"计算 "与人们思考问题的方式可能有什么关系？
对我来说，一个关键的发展是我在1980年代初的想法(建立在早期数理逻辑的形式主义上)，即符号表达的转换规则可能是在相当于 "人类 "层面上表示计算的好方法。

当时我主要关注的是数学和技术计算，但我很快就开始想，类似的想法是否可以适用于 "通用人工智能"。我怀疑像神经网络这样的东西可能会有作用，但当时我只想出了一点所需的东西，而不是如何实现它。同时，符号表达式的转换规则的核心思想成为现在的Wolfram语言的基础，并使我们今天拥有的全面计算语言的长达数十年的发展过程成为可能。

从20世纪60年代开始，人工智能研究人员一直在努力开发能够 "理解自然语言 "的系统，以及 "表示知识 "和回答问题的系统。所做的一些工作变成了不太雄心勃勃但却实用的应用。
同时，由于我在20世纪90年代所做的相当于基础科学的哲学结论，我在2005年左右决定尝试建立一个通用的 "计算知识引擎"，它可以广泛地回答用自然语言提出的事实和计算问题。这样一个系统能否被建立起来并不明显，但我们发现--通过我们的底层计算语言和大量的工作--它可以。2009年，我们发布了Wolfram-Alpha。

从某种意义上说，Wolfram|Alpha之所以可能，是因为它在内部有一种清晰、形式的方式来表示世界上的事物，并对它们进行计算。对我们来说，"理解自然语言 "并不是什么抽象的东西；它是将自然语言转化为结构化计算语言的具体过程。

另一部分是集合所有的数据、方法、模型和算法来 "了解 "和 "计算 "这个世界。虽然我们已经大大实现了自动化，但我们仍然发现，要想最终 "把事情做对"，除了有真正的人类专家参与，别无选择。虽然在Wolfram|Alpha的自然语言理解系统中，有一点人们可能认为是 "统计人工智能"，但Wolfram|Alpha和Wolfram语言的绝大部分都是以硬性的、符号化的方式运作，至少让人联想到符号化人工智能的传统。(这并不是说Wolfram语言中的个别函数不使用机器学习和统计技术；近年来，越来越多的函数使用机器学习，Wolfram语言也有一个完整的内置框架来进行机器学习）。

正如我在其他地方所讨论的，似乎已经出现的是，"统计人工智能"，特别是神经网络，很适合我们人类 "快速完成 "的任务，包括自然语言和支撑它的 "思维"。但是，当人们建立更大的 "概念 "或计算 "塔 "时，就需要象征性的、在某种意义上 "更严格的计算 "方法。

而现在ChatGPT+Wolfram可以被认为是第一个真正大规模的统计+符号 "人工智能 "系统。
在Wolfram|Alpha（它成为像Siri智能助理这样的东西的原始核心部分）中，第一次出现了广泛的自然语言理解--"理解 "直接与实际的计算表示和计算相联系。

13年后的今天，我们在ChatGPT中看到，纯粹的 "统计 "神经网络技术，当从几乎整个网络中进行训练时，可以非常好地 "统计 "生成 "类似人类 "的 "有意义的语言"。而在ChatGPT+Wolfram中，我们现在能够利用整个堆栈：从ChatGPT的纯 "统计神经网络"，到Wolfram|Alpha的 "计算锚定 "自然语言理解，再到Wolfram语言的整个计算语言和计算知识。

当我们第一次建立Wolfram|Alpha时，我们认为，也许为了得到有用的结果，我们别无选择，只能与用户进行对话。但我们发现，如果我们能立即生成丰富的、"视觉可扫描 "的结果，我们只需要一个简单的 "假设 "或 "参数 "互动--至少对于我们期望用户寻求的那种信息和计算。(在Wolfram|Alpha笔记本版中，我们还是有一个强大的例子来说明如何用自然语言完成多步骤的计算)。

早在2010年，我们就已经开始尝试不仅从自然语言中生成典型的Wolfram|Alpha查询的Wolfram语言代码，而且生成 "整个程序"。然而，在当时，由于没有现代的LLM技术，这并没有达到所有的效果。现在我们可以在ChatGPT+Wolfram中首次实现了。

我认为现在正在发生的事情是一个历史性的时刻。半个多世纪以来，对于我们可能称之为 "人工智能 "的统计和符号方法在很大程度上是分开发展的。但现在，在ChatGPT+Wolfram中，它们正被结合在一起。虽然我们还只是刚刚开始，但我认为我们有理由期待这种结合的巨大力量--从某种意义上说，"类人工智能计算 "的新范式，因ChatGPT的到来而成为可能，现在又因其与Wolfram|Alpha和Wolfram Language在ChatGPT+Wolfram中的结合而成为可能。