把Fable 5或者Mythos 5这样的模型对公众关闭服务,根本不会拖慢研发速度,反而可能因为释放了计算资源而稍微加快一点。
同时,没有任何规定禁止实验室在当前模型被禁的时候继续推进能力,也没有规定禁止他们把进展藏起来直到自己愿意发布。他们谁也不敢停下来或者慢下来,我们只需要看看GLM-5.2有多强就知道了。
为了保护自己的商业模式,前沿实验室必须不断训练更强的系统,才能领先开源和其他对手。冰面之下的暗流一直在汹涌,而我们一直在向着那个终点狂奔。
禁令根本挡不住训练车轮
禁令这种东西,看起来挺吓人的,对吧?政府大手一挥,Fable 5和Mythos 5不让普通人用了。大家第一反应肯定是:完了完了,Anthropic要歇菜了,研发要停摆了。但你要是真这么想,那就太小看这帮实验室了。因为那个禁令的措辞啊,它写得特别精准,精准到只写了Fable 5和Mythos 5这两个名字,就像一个通缉令上只写了张三和李四,结果人家转头就生了个儿子叫张五,你拿他一点办法都没有。
这不叫钻空子,这叫合理利用规则。你看Andrew Curran在那条推里说得特别直白,这些禁令只针对Fable 5和Mythos 5,而对那个从训练里刚冒出来的新东西,根本没提。所以研发团队完全可以换张皮继续干活,新模型内部代号可能早就起好了。你封你的Fable,我训我的新版本,咱们各玩各的。
(Andrew Curran 是一位身份很特别的人物。他最主要的身份是美国韦斯利安大学(Wesleyan University)的人文学科教授,但现在在AI圈子里,他更像一个消息灵通的“内部观察者”。)
而且更有意思的是,停止公开服务不但没拖后腿,反而可能还帮了忙。因为不用给海量用户提供推理服务了,那些昂贵的GPU就不用一边忙着回答"帮我写个周报"一边忙着训练下一代了。解放出来的资源直接砸进训练集群里,速度说不定还真能快那么一丢丢。这就像你本来要一边做饭一边接电话,现在电话线被拔了,你反而能专心把菜炒好。
内部模型才是真正的摇钱树
很多人有个误解,觉得我们平时在网页上或者App里能点到聊天的那个模型,就是实验室最强的家伙。这个想法就跟觉得方便面包装上的牛肉就是那块真牛肉一样天真。实际上,这些对外开放的模型,不过是实验室内部那些真正巨兽的阉割版、安全版或者落后版。
Anthropic用内部模型来驱动他们的研发飞轮,这件事在圈子里早就不是秘密了。OpenAI也一样,只不过他们没搞得那么极端。你想想看,训练一个像Mythos这样的巨型模型,那可不是一天两天的事,花费的时间、电力和金钱都是天文数字。人家费了这么大劲训出来,怎么可能第一时间就扔给公众随便玩?肯定要自己先用起来啊。
内部模型负责生成高质量数据,用来训练下一个内部模型,这个循环一旦转起来,就像一个永动机。
公众这边还在为Fable 5的代码能力惊叹不已的时候,人家实验室里可能已经开始拿Mythos 5.1或者6来给Mythos 7合成训练数据了。所以说,我们看到的永远是他们想让我们看到的,真正的技术前沿,一直藏在那些不对外开放的内部版本里。
中国力量成了那根搅动水面的棍子
这场竞赛里最有趣的变量,可能不是OpenAI也不是Anthropic自己,而是来自大洋彼岸的中国。你看Andrew Curran在那条推下面回复别人时怎么说的?他说任何放缓速度的计划,都只在美国政府能让中国政府同意的前提下才管用。这话翻译一下就是,美国自己说了不算,得看中国配不配合。
而现实是,中国根本没打算配合。GLM-5.2的表现已经狠狠地证明了这一点。之前Fable 5被禁的时候,很多人都觉得这下好了,大家都没得用了,可以慢慢来了。结果GLM-5.2直接跳出来打脸,性能强得离谱。这就逼得Anthropic和OpenAI必须接着往前跑,因为他们知道,自己停下来歇口气,中国的模型就会追上来甚至超过去。
这种竞争关系特别有意思。从商业角度看,中国模型的存在,就像在你身后放了一只饿了三天的老虎,你敢慢下来,它就把你吃了。所以美国这边越是想通过禁令来减速,反而越是逼着实验室加速。因为禁令挡不住中国,挡不住开源,而只要中国的模型一天比一天强,美国这帮实验室就一天不敢躺平。从某种程度上说,正是中国在逼着他们不断突破极限。
禁令唯一的作用就是让好东西变得更好
那既然禁令挡不住研发,又挡不住中国,它到底挡了个啥?答案是,它只挡住了普通人的手。你作为一个普通付费用户,想用Fable 5?对不起,不行。但实验室里的人该怎么训还是怎么训,甚至因为少了公众访问的负担,训得更快了。这就好比你家门口有个自助餐厅,有一天老板突然说,只允许内部员工吃饭,外人不能进了。你心想这下餐厅要倒闭了吧,结果人家内部员工的伙食标准反而提高了,因为不用伺候那么多外面的客人了。
更狠的是,这些被捂在手里的模型,会变得越来越强。因为不用急着发布,就不用花大量时间做安全对齐和合规审查,内部迭代的速度反而更快。政府那边觉得我封住了危险的东西,但实际上他们只是把危险的东西从公众手里拿走了,然后关起门来让实验室自己玩,结果人家玩得更野了。这就像你没收了孩子的游戏机,结果孩子转身去玩电脑,玩得比之前更投入,最后你还得夸他学习更认真了,因为你根本不知道他在干嘛。
经济账算一算就明白谁也停不下来
实验室的钱不是大风刮来的。那些投资人砸了几十亿上百亿美金进去,不是做慈善,是要看到回报的。而回报的前提是,你必须是市场上最强的那个,或者至少是之一。如果你停下脚步,你的对手就会推出更强的模型,抢走你的客户,抢走你的投资,然后你就出局了。
这是一个典型的囚徒困境。每个实验室都知道,如果大家能一起慢下来,能省很多钱,压力也没那么大。但问题是谁也不敢先慢。万一我先慢了你没慢,你就把我甩开了。所以结果就是所有人都拼命跑。
有个网友说得特别精辟,AI advancement isn't pause-able now. 现在已经没法按暂停键了。这就像一群人在冰面上赛跑,你知道冰面可能会裂,但你要是停下来,别人就冲到你前面去了,所以你只能继续跑。而且跑得越快,冰面裂得也越快,但你没得选。
内部版本赛跑已经开始倒计时
那这新的Mythos版本到底什么时候能让普通人摸到一下呢?没人知道确切日期,但大概率不会很快。因为现在这个时间点太敏感了。刚刚对Fable 5和Mythos 5下了禁令,政府那边正盯着呢。如果Anthropic转头就发布一个更强的版本,那不是在打政府的脸吗?这就像你刚从派出所出来,转头又在门口摆摊,那不是找不自在吗?
所以他们很可能会把这个新版本继续捂在手里,用来加速开发Mythos 7或者8,等到舆论平息一点,或者等到中国的模型又出了一个更强的版本,逼得他们不得不接招的时候,再考虑放出来。但到那个时候,我们普通用户可能又只能看着他们内部训出来的Mythos 7发呆了。这个节奏一旦起来,就像雪崩一样,谁也拦不住。我们今天在这里讨论Mythos 5.1还是6,再过几个月,可能就得讨论Mythos 8或者9了。而那个目的地,那个所谓的终点,只会离我们越来越远,因为我们还在原地坐着旋转木马呢。
禁令背后的规则游戏和沉默的大多数
你看那个禁令,表面上写的是为了国家安全,为了防止这些超级模型被坏人利用。但实际上,它更像是在玩一场文字游戏。法律规定不能碰Fable 5和Mythos 5,那好,我就不碰。我新训出来的模型不叫这两个名字,叫Project Glasswing或者别的什么内部代号,它就合法了。
而且这种规则游戏玩到最后,吃亏的永远是那些守规矩的人。你遵守法律,不碰那些被禁的模型,你就落后了。而那些不守规矩或者能找到漏洞的人,就继续往前冲。最后的结果就是,真正的技术突破全发生在那些阴暗的角落里,而公众只知道那些被允许知道的东西。
Andrew Curran在回复里被问到信息来源时,他只回了一个字:Me。你觉得他真的一个人都不认识就能知道这种内部消息吗?不可能的。只是他不能说而已。这种沉默背后,藏着的是整个行业心照不宣的秘密。
总之:前沿AI竞赛并未因公共禁令而减速,反而因内部迭代和地缘竞争而加速狂奔,普通人只能看着冰面下的暗流越涌越急。
网友爆料
一则关于Anthropic下一代Sonnet模型的泄露信息刚刚浮出水面,其内部代号为Fennec。
目前已获细节如下:
- 代号:Fennec
- 上下文窗口:100万token
- 预期发布时间:最早可能在下周
- 性能表现:编码能力强劲,推理速度快,性价比优于Opus和Fable
若此消息属实,这将是一次显著的跃升,尤其是以Sonnet的定价提供100万上下文窗口这一点。
不过,鉴于尚未有任何官方确认,对此还需保持审慎态度。但Anthropic近期的发布节奏一直很快,因此即便成真也并不令人意外。