谷歌:教会大语言模型学会算法推理


为了将算法作为一种技能教授给模型,我们开发了算法提示,它建立在其他基本原理增强方法(例如scratchpad思维链)的基础上。

算法提示从LLM大语言模型中提取算法推理能力,与其他提示方法相比有两个显着区别:

  • (1)它通过输出算法解决方案所需的步骤来解决任务,
  • (2)它以足够的细节解释每个算法步骤,因此LLM不会有任何误解。

什么是算法提示
让我们来看看两个数字的加法运算。

在scratchpad式提示符中,我们从右向左处理每个数字,并在每一步跟踪进位值(即如果当前数字大于 9,则在下一个数字上加 1)。然而,只看了几个进位值的例子,进位规则就含糊不清了。

我们发现,加入明确的等式来描述进位规则有助于模型关注相关细节,并更准确地解释提示。

我们利用这一洞察力开发了一种两数加法的算法提示,我们为每一步计算提供了明确的方程,并以非模棱两可的格式描述了各种索引操作。

下图中左上方是思维链;右上方是scratchpad,下方是算法提示:

详细点击标题。