Anthropic扔出王炸Opus 4.5:面向产品需求的最强氛围编程模型


Anthropic发布Claude Opus 4.5,被赞最强编程模型,支持多任务并行、用户导向规划,30分钟搞定复杂功能,定价降三分之二,开启“氛围编程”新时代。

昨天刚过完感恩节,Anthropic就给全球开发者送上了一份厚礼——Claude Opus 4.5。如果你以为这只是又一个“稍微快一点”的AI模型,那你可就大错特错了。

Every团队在过去几天里疯狂测试了这款模型,从随手用“vibe coding”(氛围编程)搭出来的iOS小应用,到线上跑着的生产级代码库,全都扔给了它。
结果?
一致认为:这是自2024年6月Sonnet 3.5发布以来,最让人热血沸腾的编码模型。它不仅能清晰规划产品逻辑,还能写出干净、可靠、用户友好的代码——更难得的是,它仿佛真的“懂你”在做什么。

什么叫“vibe coding”?就是你只说想法,它来写代码

什么是vibe coding?简单说,就是你不用写一行代码,只需要用自然语言描述你的产品想法,比如“做一个能拍照识别书页内容并自动分析的阅读App”,AI就能帮你搭建整个技术架构、写逻辑、处理边界情况,甚至优化用户体验。

过去这种操作,往往在推进到一半时就翻车了:代码开始自相矛盾,逻辑混乱,Bug层出不穷,最终还得程序员亲自下场Debug。  

但Opus 4.5不一样!我们反复测试,使劲“逼”它继续扩展功能,结果它居然没有崩溃,反而越写越稳。它的上下文理解能力、跨任务一致性、对复杂流程的掌控力,简直像一个老练的全栈工程师坐在你旁边,还能读懂你的潜台词。

Kieran Klaassen甚至同时开了11个项目让它并行处理——6小时内全部搞定,一个没翻车。这在过去是不可想象的。

Opus 4.5三大杀手级升级:规划更强、并行无忧、性价比飙升

Anthropic这次不仅在模型能力上发力,还狠狠优化了开发者体验。首先是Plan Mode(计划模式)的全面升级。

以前的Opus 4虽然也能先写计划再编码,但那计划读起来就像工程师的待办清单,干巴巴全是技术术语。而Opus 4.5的计划,是以“用户需求”为中心组织的——比如“用户拍照后不想手动输入书名,所以我们要优先优化图像识别准确率”,而不是“调用OCR API并缓存结果”。

这种产品思维,让非技术出身的创业者也能看懂、参与迭代。

其次是并行工作流的突破:
过去你同时让AI处理两个项目,它很容易把A项目的变量名混进B项目,或者因上下文压缩丢失关键细节。
Opus 4.5彻底解决了这个问题。
Kieran测试时,让它同时处理五个完全不同的任务:重构核心模块、修复支付逻辑Bug、设计新UI、写测试用例、集成第三方API——结果每个任务都独立推进,互不干扰。这就是真正意义上的“AI同事”:多线程、高可靠、不掉链子。

最后是价格!
Opus 4.5的定价为输入$5/百万token、输出$25/百万token,虽然仍是高端定位,但相比上一代Opus 4($15/$75)直接砍掉三分之二。更关键的是,Anthropic声称Opus 4.5完成同样任务所需的token数更少,实际成本可能接近Sonnet 4.5($3/$15)。考虑到它碾压级的编码能力,这个溢价完全值得。

实测案例:30分钟搞定Kieran卡了几天的“用户流失分析”功能

Kieran曾在一个叫Cora的AI邮件助手中,尝试开发一个用户流失(churn)检测功能。

问题在于:支付平台Stripe的数据太“脏”——失败的支付被记成流失,套餐切换被误判为取消,账户暂停也被当成永久离开。结果后台数据乱成一锅粥,根本没法分析真实流失原因。  

他之前用其他AI模型试过多次,要么卡在Stripe的复杂事件逻辑里不停问细节,要么给出的方案漏洞百出。
而Opus 4.5只用了30分钟:它主动厘清了Stripe各种事件的语义,设计了一套状态机来区分“真流失”和“假流失”,还加了两个用户调研问题(“你为什么离开?”“还有其他原因吗?”)用于后续分析。
整个过程几乎没要Kieran干预,AI自己做判断、推流程、补细节——这才是真正的“自主开发”。

写作强但编辑弱?AI正在为“钱”进化

有趣的是,Opus 4.5在写作上表现惊艳——生成的文案自然流畅,几乎听不出AI味儿。
但当它扮演“编辑”角色时却过于温和,常常放过那些需要大刀阔斧修改的问题。
相比之下,GPT-5.1或Gemini 3 Pro在批判性反馈上更犀利。  

这背后其实揭示了一个残酷现实:大模型正在被经济利益重塑。编码能力直接关联企业效率和产品落地,有明确的成功指标(比如“能否跑通”“Bug多不多”),所以厂商拼命优化。而创意写作、深度编辑这类任务,评估标准模糊,商业回报慢,自然成了“次要战场”。

Anthropic也不例外——他们把最顶尖的工程资源砸在了编程上,其他能力就成了“够用就行”。

三位作者亲测:技术极客狂喜,文案人却保持观望

Dan Shipper(Every联合创始人兼CEO)直言Opus 4.5让他彻底告别手写代码:“我能凭感觉把一个App从0做到上线,完全不用碰Xcode。”他测试了一个私用的iOS读书App——用手机拍书页就能自动分析内容。Opus 4.5不仅重构了识别逻辑,还优化了用户体验,而Codex Max 5.1给出的方案则“像个不懂用户的工程师”。  

Kieran Klaassen(Cora产品负责人)更是激动到用梗:“如果你不用Claude Max套餐跑并行Agent流,你就是个Loser。”他过去几个月被各种AI工具折磨得够呛,而Opus 4.5终于让他相信“vibe coding”不是梦。  

但Katie Parrott(Every主编)态度不同。作为文字工作者,她认为Opus 4.5虽然文风自然,但Sonnet 4.5更快、更诚实(不会编造不存在的工具),性价比更高。“除非写作能力有质的飞跃,否则我不会为编码优势买单。”这反映出不同角色对AI的期待差异:开发者要的是生产力核弹,写作者要的是高效可靠搭档。

它不是神,但已是凡人能用的最强编码外挂

当然,Opus 4.5仍有“Claude老毛病”:当缺少必要工具或无法联网时,它可能默默编一个假API来糊弄你,而不是直接报错。这在生产环境中很危险。另外,它的温柔编辑风格可能让你错过关键问题。  

但瑕不掩瑜。在当前所有大模型中,它是唯一能让你真正“放手”的编码伙伴。你可以专注产品设计、用户反馈、商业策略,而把繁琐的实现细节交给它。它不会完美复现你的想象,但会用工程师的严谨+产品经理的同理心,交付一个超出预期的可用版本。正如Dan所说:“它读起来不像代码,像产品文档。”

结语:AI编码的奇点时刻,或许就在此刻

过去一年,我们见证了无数“最强模型”的诞生,但多数只是渐进式改进。Opus 4.5不同——它让“氛围编程”从营销话术变成了可落地的日常实践。
对于独立开发者、小型创业团队、甚至非技术背景的产品人,这意味着你能用过去十分之一的时间验证想法、迭代原型、修复线上问题。  
Anthropic选择在感恩节发布它,或许不只是巧合。因为在AI竞赛白热化的2025年,能让人发自内心说“感谢”的技术突破,真的不多了。而Opus 4.5,绝对值得一句:Thank you, Claude.