草稿链:少写多思考
连贯的草稿提示让大模型能够用更少的文字更轻松地思考:少些字,多思考。
一种叫“草稿链Chain of Draft”(简称CoD)的新方法,可以帮助人工智能模型用更少的字和更快的速度完成复杂的任务,而且准确度还和以前的方法差不多。
草稿链CoD 能生成简短但信息丰富的中间结果,和现有的“思路链”(CoT)方法相比,完成任务需要的字数最多能减少92.4%,而且准确率一点都没降低。
草稿链CoD 的灵感来自人类的行为:我们通常不会把每个想法都详细写下来,而是只记下一些简短的要点,写打个草稿:草稿链CoD 就是模仿了这种策略。
例子:
问题: 杰森有20根棒棒糖。他给了丹尼一些。现在杰森有12根棒棒糖。杰森给了丹尼多少根棒棒糖?
答案: 8根
这是一个计算任务的例子。
问题: 杰森有20根棒棒糖。他给了丹尼一些。现在杰森有12根棒棒糖。杰森给了丹尼多少根棒棒糖?
答案: 让我们一步一步来推理:
- 一开始,杰森有20根棒棒糖。
- 给了丹尼一些后,杰森现在有12根棒棒糖。
- 要找出杰森给了丹尼多少根棒棒糖,我们需要算一下最初的数量和剩下的数量之间的差。
- 我们可以列一个简单的减法:20 - 12 = 给丹尼的棒棒糖。
- 算一下:20 - 12 = 8。所以,杰森给了丹尼8根棒棒糖。
这是用“思维链”方法的详细推理步骤。
问题: 杰森有20根棒棒糖。他给了丹尼一些。现在杰森有12根棒棒糖。杰森给了丹尼多少根棒棒糖?
答案: 20 - x = 12;x = 20 - 12 = 8。#8
这是用“草稿链Chain of Draft”方法,推理步骤明显缩短了。图片来自徐等人的研究。
虽然这三个例子的测试问题都一样,但不同之处在于系统的提示方式:
- 对于草稿链CoD,研究人员修改了“思路链”(CoT)的提示,把每个步骤限制在最多五个字。
- 简短的提示能用更少的资源达到类似的准确率
研究人员把草稿链CoD和详细的思维链CoT提示,以及没有解释步骤的标准提示进行了比较:
- 在算术、理解和符号推理任务中,草稿链CoD的准确率和详细的CoT差不多,但用的字数少了68%到86%。
比如,在解决涉及日期的理解任务时,和标准提示相比:
- 草稿链CoD把GPT-4o的准确率从72.6%提高到了88.1%,把Claude 3.5 Sonnet的准确率从84.3%提高到了89.7%。
- 草稿链用明显更少的token实现了相当的性能。
CoD降低了计算成本和响应时间
草稿链通过生成更短的中间推理步骤,直接减少了输出的token数量。而且,它还间接减少了输入的token数量,特别是在“少样本提示”场景中,初始输入提示里包含多个已解决的例子。
当用简洁的草稿链CoD格式创建这些“少样本”例子时,每个例子都变得更短,导致整体token数减少。输入和输出token的减少降低了计算成本,实现了更快的响应,这让CoD在大规模LLM实现和成本敏感的应用中特别有价值。
不过,简洁的提示并不适合所有任务。有些场景需要长时间的思考、自我纠正或外部知识检索。为了解决这些限制,研究人员建议把草稿链CoD和自适应并行推理或多级验证等方法结合起来。此外,这些发现可以为未来AI模型的训练提供参考,把紧凑的推理过程纳入训练数据集中。
草稿链方法来自Zoom Communications的研究团队,他们从2023年开始就推出了一款用于会议辅助的“AI Companion”。虽然AI应用中的响应延迟经常被忽视,但CoD在视频通话等实时场景中特别有用。
总结
三种不同的提示方法,用于指导人工智能模型回答问题:
1、标准提示(Standard):
- 直接回答问题。
- 不返回任何前言、解释或推理。
2、思路链提示(Chain-of-Thought):
- 逐步思考来回答问题。
- 在回答的最后返回答案,并用分隔符###标记。
3、草稿链提示(Chain-of-Draft):
- 逐步思考,但每个思考步骤只保留最少的草稿,最多5个字。
- 在回答的最后返回答案,并用分隔符###标记。