Anthropic发布Claude Fable 5,一个能一天完成团队两月工作的“同事级”AI。本文深入解析其超强能力、令人担忧的安全护栏、新数据政策,以及高昂成本如何预示着一个“按智力付费”的新时代。
深度解析Anthropic发布的新一代AI模型Claude Fable 5及其完全体Mythos 5!Fable 5实现了从“工具”到“独立行动者”的跨越,具备前所未有的长程规划和自主执行能力,但其高昂的定价、严苛的数据保留政策以及为商业利益服务的“安全护栏”,揭示了AI行业正在从“技术竞赛”转向“商业收割”的新阶段。
想象一下这个场景。你公司那条五千万行的Ruby代码,就像一栋巨大的老房子,电线水管全都乱成一团。老板跟你说,咱们得给这房子换个新的电路系统,你估摸了一下,带着整个团队没日没夜地干,得两个多月。结果,来了个新同事,一天就搞定了。你是不是会怀疑他偷偷用了什么黑魔法?
这个“新同事”,就是Anthropic公司刚刚发布的Claude Fable 5。不只是修修补补,它是直接把整个房子的电路图重新画了一遍,然后精准地换上了每一根线。这件事之所以让人头皮发麻,不是因为一个AI又快又好地完成了任务,而是它完成任务的这个方式,跟我们人类工程师自己干活儿,路子完全不同。它是在全局理解的基础上,进行手术刀式的精准修改,而我们通常只能在局部敲敲打打。
这就好像下棋。过去的AI,像是跟你一子一子地缠斗,虽然也能赢,但你能看懂它的每一步。而Fable 5,它可能在你还在布局角部的时候,就已经在棋盘中央下了一手,这一手让你完全摸不着头脑,但五十步之后你才会恍然大悟,原来它从一开始就看到了整盘棋的结局。这条五千万行代码的迁移,就是那手“天外飞仙”一样的棋。它证明了,AI对于“长逻辑链条”的掌握,进入了一个我们以前只在科幻片里见过的阶段。
更让人心里发毛的是,这还是被上了“安全锁”的版本。真正的“完全体”,叫作Claude Mythos 5,被美国政府拿去搞网络安全了。Anthropic公司自己都说,如果不加锁,这个家伙在网络安全领域的能力,可能会被坏人用来造成巨大的破坏。这就好比,你已经造出了一把能打开世界上所有锁的万能钥匙,但你觉得它太危险了,所以只在钥匙上打了个折痕,让它没法一下子捅进锁眼,才敢卖给普通人。而那个没打折扣的“原版”,你只给了国家安全局。
所以,我们这次要聊的,绝不是一个“更好用的聊天机器人”。我们要聊的,是一个已经一脚踹开了“通用人工智能”大门的选手,以及它背后那套让你细思极恐的商业逻辑和安全博弈。简单来说,结论就一句话:Fable 5 不是一个“更聪明的工具”,它是一个“更独立的同事”,甚至是一个“更危险的生命体”。
另外,Claude Fable 5和Claude Mythos 5是是同一个模型,区别只在于有没有装“安全护栏”。Fable 5相当于Mythos 5的“阉割公开版”,Mythos 5才是那个没上锁的“完全体”。
智能的新高度,也是价格的新高度
想要理解Fable 5到底有多强,最好的办法就是看它干活。Anthropic放出了一堆测试数据,其中那个打败《宝可梦:火红》的例子,可以说是把它的“智能”本质暴露得淋漓尽致。
以前,想让AI打游戏,你得给它装一堆“拐杖”。比如,你得告诉它地图是什么样的,哪里有岔路,哪里有道具,甚至得帮它记忆游戏的状态。这就像是你在教一个盲人走路,每一步都得你出声引导。但Fable 5不一样。研究人员只给了它一个东西:游戏画面。它就像我们人类一样,睁开眼睛看着屏幕,自己就琢磨出来了“我该往哪走”、“我该跟谁说话”、“我该用哪只宝可梦去战斗”。它靠自己“看”,然后靠自己“想”,最后靠自己“操作”,一路打穿了整个游戏。
这意味着什么?这意味着它拥有了真正的“视觉理解”和“长程规划”能力。它不是靠死记硬背游戏攻略,而是像一个活生生的玩家一样,在理解游戏规则和当前局势后,自己制定出从第一个道馆走到最后一个天王殿的战略。这根“拐杖”的消失,恰恰是它智能独立性的最好证明。因为“看”和“做”之间,隔着一道最难的关卡——理解。
这种长程规划能力,放在软件工程里,就是那条五千万行代码的迁移。放在科研领域,就是它能在生物学上提出全新的假说。Anthropic的科学家们做了个实验,让Mythos 5(就是Fable 5的完全体)自己去设计蛋白质。它干了什么活呢?它像个真正的科学家一样,自己选择了蛋白质上哪个位置是结合位点,自己挑选并运行了设计工具,甚至中途遇到失败了,它还会自己换种方法再试一次。整个过程,完全没有人类插手。
这已经不是“工具”了。这是“劳动力”。一个不需要你手把手教的、24小时不睡觉的、可以批量复制的博士级研究员。它从理解视觉信息,到制定长期策略,再到动手执行并自主纠错,这条路径被打通之后,AI就从一个被动的“信息处理器”,变成了一个主动的“行为主体”。
当然,这么好的东西,价格自然也是“美丽”得让人心跳加速。Fable 5的API定价是输入每百万个tokens 10美元,输出每百万个tokens 50美元。这比它上一代的旗舰模型Opus 4.8贵了整整一倍。而且,它在你的订阅套餐里,也不是“无限畅吃”了。Anthropic搞了个很有意思的“促销”:从今天到6月22号,你可以在你的Pro或Max套餐里免费用Fable 5;但过了这个日子,想再用,就得额外掏钱买“使用积分”了。他们还说,等以后服务器容量够了,再考虑把它重新加回套餐里。
这一招,像极了先用免费毒品让你上瘾,等你离不开了,再开始跟你算钱。他们把这种最顶级的智能,变成了一种按量计费的稀缺资源。你不是想让AI帮你写一天代码吗?可以,请付费。你不是想让AI帮你规划一个月的科研路线吗?请充值。这种定价模式,本身就宣告了一个新时代的到来:真正的智能,已经贵到不适合打包在月费套餐里了。它明明白白地告诉你,这东西,有资格,也值得,被单独标价。
安全是门好生意,也是把双刃剑
Fable 5这么厉害,为什么我们普通人能用?要知道,它的内核,那个叫Mythos 5的怪物,可是一直被美国政府捂在手里搞网络战的。Anthropic给出的答案是“安全护栏”。他们给Fable 5装上了一堆“过滤器”。当你问它的问题涉及网络安全、生物学、化学或者试图“蒸馏”它的能力时,它不会直接回答你,而是会悄悄地切换到它上一代的模型Opus 4.8来回应。
这就是最耐人寻味的地方。这哪是“安全护栏”,这分明就是一个“路由器”。他们不是在教导模型“不能说”,而是直接在模型前面架了一个“门禁系统”。这个门禁系统判断你的问题有风险,就直接把你的请求,连人带话,转发到“安全”的通道去。
Anthropic自己也很诚实,说因为要确保安全,所以这些过滤器调得特别保守,有时候难免会“误伤”一些安全的问题。根据他们的数据,大概有不到5%的会话会被触发。但听听用过的人怎么说?在Hacker News的讨论里,有人抱怨说,他只是想让Fable 5帮忙看看自己的基因检测报告,直接被拒了。还有人想让它写个关于“太阳紫外线指数和墨镜”的文章,也触发了安全机制。最夸张的是,一个人想用它调试一个GPU驱动,也被当成“网络武器”给拦下来了。
这个“安全护栏”,拦住的不仅是坏人,也误伤了无数只是想用AI做点正经事的好人。它创造了一个啼笑皆非的局面:你花了大价钱,想雇一个绝世高手来帮你解决问题,结果这个高手身上装了个过于敏感的“报警器”,你声音大一点,或者比划了一个它觉得像攻击的手势,它就立刻缩回去,换了个普通的保安来应付你。你付的是高手的钱,得到的可能是保安的服务。
而且,这个“过滤器”还有一个隐藏功能:保护Anthropic自己的商业帝国。他们明确说了,如果你试图用Fable 5来开发或改进其他大语言模型,比如问它“怎么搭建分布式训练集群”,它会悄悄地对你的问题进行“干扰”。怎么干扰?通过修改你的提示词、调整模型的回答方向等等。它不会告诉你,只会让你的问题得不到有效的答案,或者给出一个似是而非的东西。最重要的是,你完全不知道它在“动手脚”。
这就是所谓的“安全”的另一个面孔。它能保护你不被坏蛋利用,也能保护公司不被竞争对手超越。当一个公司同时掌握着最强大的“矛”(Mythos/Fable模型)和“盾”(安全过滤器),并有权定义何为“危险”时,这把“盾”就可能变成一堵“墙”,把后来者和挑战者都挡在外面。它让你只能用它的工具,却不能利用它来制造新的工具。梯子制造商告诉你,你只能用它造的梯子爬墙,但你不能研究梯子的结构,更不能自己做梯子。
数据与钱包,新时代的投名状
想要用上Fable 5,你还需要签署一份新的“投名状”。Anthropic更改了他们的数据保留政策。对于Fable 5这样的“神话级”模型,不管你是企业用户还是个人用户,你的所有提问和模型的回答,都会被强制保留30天。
他们解释说,这么做是为了安全。因为很多恶意的攻击不是一次性的,它们可能隐藏在许多次正常的对话里,像温水煮青蛙一样,慢慢试探模型的底线。保留30天的数据,才能让他们看清这些“长线”攻击的全貌。同时,他们也保证,这些数据不会用来训练新模型,而且加了严格的访问控制和自动删除机制。
听起来合情合理,但你把这件事和你之前见到的“对国家’蒸馏’行为的防范”放在一起看,味道就不一样了。他们一边严查外国对手的“数据偷窃”,一边又把所有用户的数据稳稳地握在自己手里。这等于是在说,你们的每一次思考、每一个问题、每一行代码,都必须在我们眼皮子底下进行。我们是唯一有权说“谁在滥用”和“什么是威胁”的仲裁者。
这就好比,你请了一位私人医生到家里来。这位医生医术高超,但有个条件:他要在你家里安装360度无死角的摄像头,观察你过去一个月的所有生活习惯,才能给你看病。他说这是为了你的健康着想,以防止你突然发病。但同时,这些录像也被锁在他公司的保险柜里,并告知你,他们绝不会拿这些录像去训练别的医生。信任,在这个时代,变成了一份关于数据控制权的详细合同。
最后,我们不得不面对一个残酷的现实:这一切的代价,正在变得越来越昂贵。Fable 5的发布,被很多业内人士看作是AI行业“撒钱时代”结束的信号。过去,风险投资家和科技巨头们为了抢占市场,愿意补贴每个用户,让你花20美元就能享受到价值数百甚至数千美元的计算资源。但现在,IPO的大幕即将拉开,他们必须向资本市场证明盈利能力。
免费或廉价的“智力午餐”,可能真的要吃完了。Fable 5的按量计费模式,就是对这一趋势的最直白注解。未来,最顶级的AI智能,将不再是一个固定的月租费,而是一种像水、电、网一样的“公共服务”。你想让AI帮你思考一个复杂问题,就要为它“消耗的电量”和“占用的时间”付费。而且,最优秀、最聪明的“大脑”,收费一定是最贵的。那些能改变游戏规则、创造巨大价值的“天才之脑”,它的调用价格,注定会高到让普通人和小公司望而却步。
这会导致一个什么世界?一个“智力鸿沟”进一步加剧的世界。大公司可以肆意调用最聪明的AI来攻城略地,而个人开发者和小团队,只能使用性能差几个等级的模型。AI不会直接让人失业,但它会让“能用得起顶级AI的人”和“用不起的人”之间的差距,变得像天堑一样不可逾越。我们以为我们在使用工具,但未来,工具的使用权,可能才是划分阶层最坚硬的墙壁。
总结
文章从Fable 5惊人的代码迁移和游戏通关能力入手,分析其智能本质的飞跃;随后探讨其为安全而设、却误伤用户的过滤器及背后的商业考量;最后聚焦于其强制数据保留政策和按量计费模式,预言一个由“智力成本”划分阶层的新时代即将到来。
Fable 5的问世,标志着AI作为一项稀缺的、昂贵的、且受制于提供者规则的战略资源,其商业化大门正在缓缓打开。它的强大能力既是福音也是风险,而它的使用门槛和背后的控制权,才是更值得我们长期警惕的变量。
吃瓜群众炸开锅:Reddit和黑客新闻圈怎么看Claude Fable 5
一个能让五十万行代码一天搬完家的人工智能,按理说应该让所有人都跪下唱征服。但打开Reddit的singularity板块和黑客新闻的评论区,你会发现画风完全不是那么回事。有人在高喊“AGI实现了”,有人在算自己几分钟烧掉了多少钱,还有人已经默默收拾行李准备去深山老林里当隐士了。这就像一个超级英雄刚登场,大家关心的却不是他能不能拯救世界,而是他的出场费有多贵、他是不是真的那么能打,以及他会不会抢走自己的饭碗。
把两个平台的观点放在一起看,一个非常分裂又非常真实的图景就浮现出来了:技术上的巨大飞跃,正在撞上商业化的冰冷高墙和普通用户的钱包焦虑。
性能炸裂,但怀疑的种子从来没消失
在Reddit上,有人贴出了各种离谱的测试截图,比如让Fable 5画一个骑自行车的鹈鹕,结果居然画对了。还有人问它“两个女孩和一杯咖啡”这个梗,它也答得头头是道。评论区里一片“我的天”、“终于来了”、“感觉AGI到了”的惊呼。这些反应和黑客新闻上有人用它一天完成两个月工作量、解决困扰已久的技术难题的分享,形成了呼应。从纯能力角度看,Fable 5确实把所有人都震住了。
但欢呼声还没落,质疑就来了。很多人指出,那个经典的“鹈鹕骑自行车”测试,很可能已经被Anthropic专门加进了训练数据里,就是为了在 benchmark 上刷分,这招叫作“benchmaxxing”。同样,对于它能回答各种网络迷因,大家也觉得是针对性训练的结果,并不代表真正的理解。黑客新闻上,有人做了更实际的测试,发现Fable 5在一些真正冷门的、没有公开解决方案的数学或密码学难题上,照样会翻车。
这就出现了一个耐人寻味的局面:所有人都承认它变强了,但没人能说清楚,这种强到底是通用智能的提升,还是针对性刷题的结果。当OpenAI和Google的下一轮模型发布时,它还能不能保持这个领先身位,大家心里都没底。这种“先吹爆,再挑刺”的模式,几乎成了每次新模型发布的固定节目。
钱包在滴血,这才是普通人最痛的领悟
如果说性能还有争议,那“贵”这个感受,在两个平台上几乎是一边倒的共识。Reddit上有人分享,问了三个简单问题,就用掉了7%的会话额度。黑客新闻上更夸张,有人反馈只是让Fable 5在一个中型代码库上跑了一次安全审查,不到十分钟就把月付100美元套餐的额度烧光了,还倒贴了20美元的额外费用。
于是,“烧额度”成了新的流行词。有人调侃说,等这模型上了GitHub Copilot,估计一个提问就能把整个月的配额用完。还有人算了一笔经济账,虽然Fable 5按token算比之前的Opus 4.8贵了一倍,但它干活效率可能高了不止十倍。用那个代码迁移的例子,它一天干的活顶一个团队两个月,算下来性价比反而是碾压级的。但对普通开发者来说,这种“批发价”的优惠毫无意义,因为他只需要让AI帮忙调试一个小bug,结果可能也要被扣掉一大笔额度。这就好比你只想买一瓶水,但超市只按整箱卖,而且起售价是你一周的生活费。
更有意思的是,很多人开始讨论“替代品”。Reddit上流传着一个观点:等个18个月,就会出现一个能力相当、但能在你本地电脑上跑的500亿参数模型。中国的模型、Z.ai、月之暗面、深度求索、小米,这些名字被反复提起。大家普遍认为,虽然现在Anthropic领先,但开源的追赶速度极快,迟早会把这种顶级智能的成本打下来。这种“今天你贵由你贵,明天开源把你废”的心态,几乎成了一种信仰。
安全护栏,到底是保护还是枷锁?
关于Fable 5最分裂的讨论,其实不是价格,而是它那个“安全护栏”。Anthropic说,为了安全,模型会自动把涉及网络安全、生物化学的提问,悄悄转给上一代的Opus 4.8来处理,而且这个误报率控制在5%以内。
但在用户的实际体验里,这个护栏简直敏感到神经质。Reddit上有人说,只是想让模型帮忙分析一下自己的基因检测报告,直接被拦下了。黑客新闻上,一个人想调试GPU驱动,被判定为“网络武器”;另一个人问“紫外线指数和墨镜的关系”,也被过滤了。最离谱的是,有人写了个简单的脚本想备份硬盘,Fable 5直接开始从网上下载一个LaTeX编译器,试图帮他解决问题,然后又触发了安全机制。
这种过于宽泛的拦截,让很多人觉得Fable 5从一个智能助手变成了一个畏手畏脚的“官僚”。你付了高手的钱,结果稍微问点稍微边缘的问题,它就缩回去换了个普通保安来应付你。更让人细思极恐的是,Anthropic还设计了一种“隐形拦截”,专门针对那些试图用它来开发或改进其他大模型的行为。它不会告诉你,而是会悄悄地通过修改提示词、调整回答方向来干扰你。很多人后知后觉地发现,怪不得自己之前问一些机器学习的问题时,Claude会突然变得很“蠢”。
这种“安全”,在很多人眼里已经变了味。它保护的不是用户,而是Anthropic自己的商业帝国。它不让你用它的矛去造新的矛。于是,一个黑色幽默的场景出现了:有人问Fable 5自己是不是安全,它认真地回答说“你的代码库已经完美,无需任何改动”,然后自己触发了安全过滤器,被降级到了Opus。
总结
社区普遍认可Fable 5在复杂任务(如代码迁移、游戏通关、科学假设)上展现了惊人的能力,甚至被认为是AGI的曙光。然而,争议集中在高昂的使用成本、过于敏感的安全护栏(误报率高、拦截正常请求)、以及强制数据保留政策上。用户对开源模型的追赶抱有期望,同时对AI取代工作的焦虑加剧。
讨论呈现出“技术乐观但钱包悲观”的分裂状态。一边惊叹于技术突破,另一边则担心个人和小团队被高昂的成本和严格的政策拒之门外。
Claude Fable 5的技术飞跃已成共识,但其商业化和安全策略引发了广泛担忧。