Deepseek引发AI投资回报反思
如果训练人工智能的成本降低了,那么投资人工智能的回报就会更高。
对于那些在科技、工业、公用事业和能源领域已经因为“人工智能基础设施”而成功的公司来说,最大的风险是,一个简化版的 r1 模型可以在高端工作站(比如 Mac Studio Pro)上本地运行。这意味着类似的模型大约两年后就能在超级手机上运行。
如果因为“足够好”而把推理任务转移到边缘设备上,那么我们将会生活在一个非常不同的世界,有非常不同的赢家——也就是我们见过的最大的 PC 和智能手机升级周期。
计算技术一直在集中化和分散化之间摇摆不定。
人工超级智能(ASI)
人工超级智能(ASI)非常接近了,但没人真正知道超级智能能带来多少经济回报。
如果一个价值 1000 亿美元的推理模型在 10 万多个 Blackwells(o5、Gemini 3、Grok 4)上训练而成,能够治愈癌症并发明曲速引擎,那么 ASI 的回报率将非常高,训练的花费和电力消耗也会稳步增长;戴森球将再次成为费米悖论的最佳解释。
希望 ASI 的回报率很高——那就太棒了。
- 这对于使用 AI 的公司来说都非常好:软件、互联网等。
- 从经济角度来看,这大大增加了分销和独特数据的价值——比如 YouTube、Facebook、Instagram 和 X 以及抖音营销和电商。
开源前沿模型可能会停止开放
美国实验室可能会停止发布他们的前沿模型,以防止对 r1 至关重要的提炼,尽管这方面的秘密可能已经完全被揭穿。也就是说,r1 可能足以训练 r2,等等。
针对对尖端 GPU 的限制了出口,却不对中国提炼尖端美国模型的能力采取任何措施,这有点可笑,显然违背了美国出口限制的目的。既然能免费拿到牛奶,为什么还要买牛呢?
Grok-3 即将到来
可能会对上述结论产生重大影响。这将是自 GPT-4 以来首次对预训练缩放定律进行重大测试。
- 就像通过强化学习(RL)将 v3 变成 r1 需要几周时间一样,
- 运行改进 Grok-3 推理能力所需的 RL 也可能需要几周时间。
基础模型越好,推理模型就应该越好,因为三个缩放定律是乘法的:
- 预训练、
- 训练后的 RL
- 推理期间的测试时间计算(RL 的一个函数)。
Grok-3 已经证明它可以完成 o1 以外的任务——参见 Tesseract 演示——超越多远将变得重要。
套用《双塔奇兵》中一位匿名兽人的话,肉可能很快就会回到菜单上。
时间会证明一切,“当事实摆在眼前时,我会改变主意。”
戴森球将重新成为费米悖论的最佳解释?
如果未来人类或者其他文明能够建造出“戴森球”这种超级厉害的能源装置,那么它可能会帮助我们解释“费米悖论”——也就是为什么我们还没发现外星人。
- 戴森球是一个假想的超级大工程,就是外星文明可能会用一堆太阳能板或者其他装置把一颗恒星(比如太阳)包起来,用来收集恒星的能量。这样就能获得超级多的能源,足够支撑一个超级发达的文明。
- 费米悖论是说,宇宙这么大,按理说应该有很多外星文明,但为什么我们还没发现他们?他们到底在哪?
如果外星文明真的存在,而且他们已经发展到能造戴森球的地步,那我们为什么还没发现他们呢?可能是因为戴森球会把恒星的光遮住,导致我们从地球上很难发现他们。
如果我们发现戴森球真的存在,或者我们自己未来能造出戴森球,那它可能就是解释费米悖论的关键——外星文明可能早就造了戴森球,只是我们还没发现而已。
ASI(人工超级智能)突破
训练 ASI 需要花很多钱和电。比如,可能需要用成千上万的超级计算机(比如 Blackwells、Gemini 3 这些)来训练它,电费账单会高得吓人。而且,随着 ASI 越来越强大,它需要的计算资源和电力也会越来越多。
但是如果ASI(新的戴森球)如果真能实现,它可能会带来超级大的回报。比如,它可能帮我们治愈癌症、发明曲速引擎(像科幻电影里那种超光速飞行技术),甚至解决能源问题。这些突破会让人类文明直接起飞,回报率当然高到离谱!
- 如果ASI戴森球实现,就不用担心能源问题
- 但是没有实现之前,能源是制约ASI戴森球实现的主要因素。