即将推出的GPT-4与GPT-3比较 - Alberto


GPT-4 发布的日子越来越近了。GPT-3 于大约两年前的 2020 年 5 月宣布。它是在 GPT-2 发布一年后发布的——这也是在原始 GPT 论文发表一年后发布的。
鉴于我们从 OpenAI 和 Sam Altman 获得的信息,以及当前趋势和语言 AI ​​的最新技术,这是我对 GPT-4 的预测:

模型尺寸: GPT-4 会比 GPT-3 大,但与目前最大的模型(MT-NLG 530B 和 PaLM 540B)相比不会很大。模型大小不会是一个显着特征。

最优性: GPT-4 将比 GPT-3 使用更多的计算。它将在参数化(最佳超参数)和缩放定律(训练令牌的数量与模型大小一样重要)方面实现新颖的最优性见解。

多模态: GPT-4 将是纯文本模型(不是多模态)。OpenAI 正在寻求将语言模型发挥到极致,然后完全跳到像 DALL·E 这样的多模态模型——他们预测未来将超越单模态系统。

稀疏性: GPT-4 遵循 GPT-2 和 GPT-3 的趋势,将是一个密集模型(所有参数都将用于处理任何给定的输入)。稀疏性将在未来变得更加占主导地位。

对齐: GPT-4 将比 GPT-3 更符合我们的要求。它将实施来自 InstructGPT 的学习,后者是通过人工反馈进行训练的。尽管如此,与人工智能保持一致还有很长的路要走,应该仔细评估努力,不应该大肆宣传。