他认为:
- 投入更多的计算和数据来解决这个问题并不是答案。
- 任何真正了解智能的人都可以只花费一百万美元的培训成本来开发 AGI。
托比·波伦 (Toby Pohlen) 离开 DeepMind,加入埃隆·马斯克 (Elon Musk) 的 xAI 并成为创始成员,他反驳了 Chollet的观点。
波伦表示:DeepMind 过去也认同 Chollet 的观点,认为大规模扩展scaling-law是没有必要的,但证据一直指向相反的方向。然而,即使是 xAI 的庞大集群(计划达到200,000 个 Nvidia GPU)也尚未兑现马斯克的承诺,这个承诺是:到 2024 年底实现“按各指标衡量,全球最强大的人工智能”。
Allen AI 的 Tim Dettmers最近规划了三条scaling-law扩展可能的路径:
- 传统数据中心扩展(可行约两年)、
- 动态扩展(导致专业化或灵活模型)
- 知识提炼(可能遵循与其他扩展方法完全不同的规则)。
这场争论开辟了一个新领域,即测试时推理计算扩展,这是OpenAI o-models背后的方法。
- Hugging Face 研究人员最近验证了这一策略,该策略将大量计算能力转移到推理阶段,而不是预训练阶段。
这不仅仅是一场学术争论。OpenAI和 Nvidia英伟达等大型科技和人工智能公司的估值飙升,都是建立在“规模等于进步”的承诺之上的。如果对规模持怀疑态度的人是对的,那么我们面临的不仅仅是技术上的死胡同——我们可能会看到科技估值的大幅调整,这将给金融市场带来冲击。
微软投资800亿美金
如果你相信人工智能是下一代电力,那么这基本上就是一次强化版的工业革命。微软投入 800 亿美元表明,他们将自己视为人类进步下一阶段的基础设施支柱。这不仅仅是云和芯片;它是未来的基础,未来每款产品、服务和决策都会嵌入一些人工智能组件。
微软投资规模令人震惊:他们不只是为今天的模型而构建——他们押注于我们现在无法表达的能力的指数级需求。这就像在汽车出现之前投资高速公路,只是数字要多得多。
如果你把眼光放得足够远,其好处是不可否认的:生产力大幅提高、新兴产业、解决我们不知道我们能够解决的问题。
800 亿美元是各国的预算,而他们正准备把它投入到数据中心上。几乎相当于五大国际石油公司的 LTM 资本支出总和,沙特阿美 480 亿美元,中石油 400 亿美元……这只是前两名。
微软确实用行动兑现了诺言。
当国家级别投资资金被随意花在计算上时,你知道事情真的要变糟了;文明 2.0 的氛围。
地热数据中心将成为下一代建设。
Meta 最近宣布,他们打算在 2027 年前投入运营新的地热数据中心。
Iron Mountain 拥有运营中的地热数据中心。
微软宣布在肯尼亚投资 10 亿美元建设地热数据中心。
不确定会有什么影响。我们拭目以待
麦肯锡的数据显示,到 2030 年,全球对数据中心容量的需求可能会增长近四倍,从 2023 年的 55 吉瓦增至本世纪末的 219 吉瓦。
麦肯锡预测的最低端是数据中心容量需求将增长两倍至 171 吉瓦,而高端预测则认为需求将增长 5.5 倍以上至 298 吉瓦,到 2030 年的复合年增长率为 27%。
OpenAI 山姆奥特曼2025年1月5日发推:
我一直想写一个六个单词字 它就是:near the singularity; unclear which side.靠近奇点;不清楚在哪一侧。
(它应该要么是关于 1. 模拟假设,要么是关于 2. 无法知道起飞的关键时刻何时真正发生,但我喜欢它在很多其他方面也发挥作用。)
网友评论:
起飞瞬间的静谧令人着迷。 一会儿我们就会到达它的另一边。
回顾过去很容易确定……不确定我们如何在“当下”知道。