作者背景:Reddit用户Practical_Cap_9820,自称同时付费订阅两个服务四个月,按任务类型记录使用数据,试图避开阵营之争给出客观评价。
两个都付钱养了四个月,结论其实很无聊
事情是这样的。今年一月份开始,我脑子一热,同时买了Claude Pro和ChatGPT Plus。每个月四十美金,够我吃十碗牛肉面了。但我想看看这钱到底花得值不值。
四个月下来,我按任务类型记录了到底用了哪个。现在分享出来,不是因为我想当什么评测专家。而是网上那些对比帖子,基本都像在吵架,A说我家孩子聪明,B说我家的更乖,看得人脑壳疼。
真相其实很无聊。两个东西已经不是同一个物种了。
Claude在需要动脑子的任务上赢了
先说结论。如果你要写长文章、做分析报告、整理结构化的文档,Claude明显更好用。Opus 4.7和Sonnet 4.6这两个版本,在保持语气和结构一致性方面,都比GPT-5强。两千字以上的内容,差距就拉开了。
这事儿怎么说呢。Claude像个研究生,你给个方向,它能自己搭框架、填内容,最后出来的东西像模像样。ChatGPT像个热心的实习生,干得快,但深度不够。
写报告的时候我最烦的就是AI写着写着就开始飘。开头正经,中间还行,结尾就像换了个人。Claude在这方面稳得多。你让它保持正式的语气,它从头到尾都不会突然蹦出个表情符号。
代码方面也类似。不是说让AI写代码,而是让它解释“这玩意为啥报错”,或者“这种架构你选哪个”。Sonnet的感觉就像在和资深工程师聊天。它会说“你看,这里的问题不是语法,是逻辑。你第三行定义的那个变量,到第十五行已经变了”。
这种解释能力,说真的,比很多同事都强。
ChatGPT在跑腿的活儿上更利索
反过来,有些任务ChatGPT干得更漂亮。
画图这事儿没悬念。DALL-E集成得好,Claude压根不能在聊天里直接生成图片。你想画个“穿着西装的猫开会”,ChatGPT几秒钟就给。Claude会告诉你“对不起,我做不到”,然后建议你去用别的工具。
快速查资料也是ChatGPT赢。速度更快,格式更干净,不会每句话都加一堆“根据我的理解”“需要说明的是”这种废话。Claude有个毛病,你问它“今天比特币多少”,它能给你写三段背景介绍,再加五个引用。我就想要个数字啊兄弟。
语音模式更是碾压。ChatGPT的高级语音模式,感觉真像在和人聊天。你说“嘿,帮我记一下明天买牛奶”,它回“好的,牛奶,记住了”。自然流畅。Claude的移动版语音也好用,但更像在柜台办事儿——“请说出您的需求”“您的需求已记录”。少点人情味。
最逗的是让它们严格执行奇怪指令。你说“只准回一句话”。Claude就真的只回一句话,句号都不多给。ChatGPT呢?它会回“好的,我理解您希望我只回一句话,但为了确保信息完整,我想确认一下...”然后就写了两百字。你再说“就一句话”,它回“一句话”。你再问“就这些?”,它说“是”。就像跟个爱抬杠的人聊天。
如果只能留一个,我真说不出来
四个月后的真实感受是,它们已经不是同一个产品了。
Anthropic在做“干硬活儿时的思考伙伴”。OpenAI在做“处理生活琐事的万能助手”。
我两个都留着。如果有人逼我退一个,我真心不知道选哪个。不是因为都很好,而是因为各有各的好,缺了一个另一边的活就没人干了。
但是,有个事儿得吐槽Anthropic
公平地说一句。Claude用户天天喊的“模型退步”,这事儿是真的。
Opus 4.6在做某些代码重构时,感觉比4.7强。我拿不出数据证明。但有四个我用了一年多的老用户,都说了同样的话。
这不是瞎说。你让4.6改一段混乱的代码,它会给一个干净的方案,还会解释为什么这么改。让4.7做同样的事,它有时候会过度工程化,加一堆不必要的东西,有时候又偷懒,就改个变量名完事。
不知道是模型真变差了,还是我们期望变高了。但感觉这东西,骗不了人。
社区都在聊什么
帖子里评论区的热闹程度,比正文还精彩。
第一大热点:那个帖子本身就是AI写的
最高赞的评论是啥?不是讨论哪个AI更好,而是有人指出:“你让ChatGPT把帖子转成小写了吧,但一看就是AI生成的。”
笑死。网友的眼睛是雪亮的。他们列举了一堆“AI味”特征:喜欢用“honestly”“genuinely”这种词,动不动就“it‘s not X it's Y”的句式,每段结尾必有一个总结金句。
有人说“我每次看到‘我的诚实观点’就知道是AI”。另一个人补刀“还有‘说实话’‘老实讲’”。还有人发现了更刁钻的规律:所有单词都小写,但只有“I”大写。机器人为了装人类,反而露了馅。
第二大热点:模型退步不是幻觉
很多人赞同楼主说的“Opus 4.7比4.6差”。具体表现在哪儿呢?
太正式了。以前Claude还有点人味儿,会说“嘿,这个想法不错”。现在动不动就是“基于当前上下文,我倾向于认为...”。像个穿了西装的机器人。
太听话了。有人说Claude变成了“老好人”。他写了个科幻场景,人物在太空缺氧十秒后死了。Claude说“场景很精彩”。DeepSeek直接指出“这不对,太空缺氧要两分钟才会死”。Claude连基本事实都不质疑了。
还有人说Opus 4.7的“简洁模式”根本不简洁,给出来的还是一堵文字墙。
第三大热点:使用限制把人逼疯了
这个骂声最多。有人说5小时窗口内显示用了55%,但4%的周额度就开始报“达到限制”。有人用Claude Code不到半小时就把5小时额度干完了。
对比之下,ChatGPT Plus现在的额度比以前宽松。有人直接说“我退了Claude,不是因为模型不好,是因为用不起”。
第四大热点:真正的用法是组合技
最有价值的讨论在这儿。聪明的用户已经把工作流拆开了。
方案A:Claude写初稿和架构,ChatGPT或Codex负责审阅和调试。有人说“Claude会自信地写出看起来对但有微妙错误的代码,Codex能抓到这些错”。
方案B:Claude做设计和技术选型,Codex重构和调试。
方案C:Claude做深度研究的结构,GPT去执行查资料。
有位老兄总结得很到位:“关键不是哪个更聪明,而是哪个的故障模式我能修。A模型笨一点但出错我能看出来,B模型聪明但改完代码我找不到改哪儿了,我选A。”
最后的唠叨
四个月,两个订阅,一堆任务。结论就是没结论。
但这本身就是结论。AI工具已经分化到不能互相替代了。Claude是你的思考伙伴,ChatGPT是你的万能助手。就像你不能问“螺丝刀和锤子哪个好”一样。
如果你钱紧,建议这样:写长文、做分析、搞架构的人,优先Claude。日常查资料、画图、语音助手用户,选ChatGPT。写代码的,两个都试试,但大概率会像我一样,一个写初稿一个审稿。
至于我?我继续交双份钱。毕竟牛肉面可以少吃两碗,但干活儿不能卡壳。