文明2.0氛围:人工智能scaling扩展之争

人工智能研究员 François Chollet最近在谷歌工作十年后离开,创办了自己的公司。他的ARC-AGI 基准测试最近引起了轰动,因为OpenAI 的 o3 模型在其中表现良好。
他认为:
  • 投入更多的计算和数据来解决这个问题并不是答案。
  • 任何真正了解智能的人都可以只花费一百万美元的培训成本来开发 AGI。

托比·波伦 (Toby Pohlen) 离开 DeepMind,加入埃隆·马斯克 (Elon Musk) 的 xAI 并成为创始成员,他反驳了 Chollet的观点。

波伦表示:DeepMind 过去也认同 Chollet 的观点,认为大规模扩展scaling-law是没有必要的,但证据一直指向相反的方向。然而,即使是 xAI 的庞大集群(计划达到200,000 个 Nvidia GPU)也尚未兑现马斯克的承诺,这个承诺是:到 2024 年底实现“按各指标衡量,全球最强大的人工智能”。

Allen AI 的 Tim Dettmers最近规划了三条scaling-law扩展可能的路径:

  1. 传统数据中心扩展(可行约两年)、
  2. 动态扩展(导致专业化或灵活模型)
  3. 知识提炼(可能遵循与其他扩展方法完全不同的规则)。
但最终,Dettmers 看到了一场“完美风暴”正在酝酿 :物理限制和收益递减的结合可能意味着扩展scaling-law时代的终结。

这场争论开辟了一个新领域,即测试时推理计算扩展,这是OpenAI o-models背后的方法。

  • Hugging Face 研究人员最近验证了这一策略,该策略将大量计算能力转移到推理阶段,而不是预训练阶段。
虽然前景光明,但在 ARC 等基准上运行 o3 的高成本表明,我们正在用一个扩展挑战换取另一个扩展挑战。

这不仅仅是一场学术争论。OpenAI和 Nvidia英伟达等大型科技和人工智能公司的估值飙升,都是建立在“规模等于进步”的承诺之上的。如果对规模持怀疑态度的人是对的,那么我们面临的不仅仅是技术上的死胡同——我们可能会看到科技估值的大幅调整,这将给金融市场带来冲击。

微软投资800亿美金
如果你相信人工智能是下一代电力,那么这基本上就是一次强化版的工业革命。微软投入 800 亿美元表明,他们将自己视为人类进步下一阶段的基础设施支柱。这不仅仅是云和芯片;它是未来的基础,未来每款产品、服务和决策都会嵌入一些人工智能组件。

微软投资规模令人震惊:他们不只是为今天的模型而构建——他们押注于我们现在无法表达的能力的指数级需求。这就像在汽车出现之前投资高速公路,只是数字要多得多。

如果你把眼光放得足够远,其好处是不可否认的:生产力大幅提高、新兴产业、解决我们不知道我们能够解决的问题。

800 亿美元是各国的预算,而他们正准备把它投入到数据中心上。几乎相当于五大国际石油公司的 LTM 资本支出总和,沙特阿美 480 亿美元,中石油 400 亿美元……这只是前两名。

微软确实用行动兑现了诺言。

当国家级别投资资金被随意花在计算上时,你知道事情真的要变糟了;文明 2.0 的氛围。

地热数据中心将成为下一代建设
Meta 最近宣布,他们打算在 2027 年前投入运营新的地热数据中心。
Iron Mountain 拥有运营中的地热数据中心。
微软宣布在肯尼亚投资 10 亿美元建设地热数据中心。

不确定会有什么影响。我们拭目以待 

麦肯锡的数据显示,到 2030 年,全球对数据中心容量的需求可能会增长近四倍,从 2023 年的 55 吉瓦增至本世纪末的 219 吉瓦。 

麦肯锡预测的最低端是数据中心容量需求将增长两倍至 171 吉瓦,而高端预测则认为需求将增长 5.5 倍以上至 298 吉瓦,到 2030 年的复合年增长率为 27%。 

OpenAI 山姆奥特曼2025年1月5日发推: 
我一直想写一个六个单词字 它就是:near the singularity; unclear which side.靠近奇点;不清楚在哪一侧。

 (它应该要么是关于 1. 模拟假设,要么是关于 2. 无法知道起飞的关键时刻何时真正发生,但我喜欢它在很多其他方面也发挥作用。) 


网友评论:
起飞瞬间的静谧令人着迷。 一会儿我们就会到达它的另一边。 

回顾过去很容易确定……不确定我们如何在“当下”知道。