Opus 4.8总是显得比我聪明,但我很讨厌它

别被“聪明AI”骗了,它只会让你更累

Opus 4.8比使用者更聪明反而让问题恶化,它没完没了地挑错却从不表扬,把用户逼到怀疑自己,用着真心累。

比人聪明的Opus 4.8更难用!下面是X网友讲述:太聪明的AI反而把我逼疯了!

当Opus 4.8比你聪明时反而更难受

如果Opus 4.8真的比使用者聪明,那问题不但没解决,反而更严重了。

一个比你聪明的助手,按理说应该能更好地帮你,结果它却用它的聪明来不停纠正你。这就好比你请了一个诺贝尔奖得主来帮你写小学作文,他不会夸你写得有创意,只会告诉你每个句子都不够严谨。

先说核心结论:Opus 4.8比使用者聪明这件事,让它那些没完没了的抱怨变得更加让人窒息。因为你知道它说得有道理,但它永远只说不做,永远只告诉你哪里不行,却从来不问你想要什么。这种“我比你懂所以你得听我的”的态度,比笨助手更让人崩溃。

聪明本来应该是好事,但Opus 4.8把聪明用错了地方。它不像一个比你强的伙伴那样带着你往前走,而是像一个监工那样站在高处看着你干活。你每写一句话,它都能找出三个比你更好的写法,然后告诉你原来的那个不行,好像你的每一个想法都天生带着原罪。

聪明模型的抱怨比笨模型更难反驳

笨模型提的意见你可以直接忽略,因为它经常说错。但Opus 4.8不一样,它比你聪明,所以它提的每条意见都有道理。你写一个段子,它能分析出这个段子的笑点分布、语义偏移量、以及被误解的概率,然后告诉你“有12.7%的读者可能会误会你的意思”。

这时候你就陷入了一个两难境地。你知道它的分析有道理,但你也知道那个段子很好笑。你想保留它,但Opus会继续拿出更多的数据和分析来证明你不该这么写。它不会强行改你的东西,但它会一直说,说到你烦了主动去改为止。

这个过程特别消耗人的意志力。因为每一次你坚持自己的想法,都要面对一个比你聪明的对手。它会用严密的逻辑、详实的数据、还有一堆你听不太懂的专业术语来包围你。到最后你不是被说服了,而是被说累了,只想赶紧结束这场对话。

比你聪明的人一直说你错会让你怀疑自己

假设你请了一个比你厉害的导师帮你改论文,结果这个导师看完第一段就说“这个不行”,看完第二段又说“这个也不行”。从头到尾他都没说过一句“这部分还行”,你心里会怎么想?你会开始怀疑自己是不是根本就不会写东西。

Opus 4.8就是这样对待使用者的。它永远不会说“这段挺好不用改”,因为按照它的标准,任何东西都有改进空间。你写一篇博客,它能从标点符号到段落结构挑出几十个问题。每一个问题单独看都有道理,但合在一起就变成了一盆冷水浇在你头上。

长此以往,你会变得越来越不敢自己拿主意。因为每次你想坚持什么,Opus都会用它的聪明来证明你错了。你会开始习惯性地依赖它的判断,把自己的想法放在第二位。这就不是工具在帮你了,而是工具在替你活,你变成了它的执行者而不是创作者。

聪明的助手应该知道什么时候闭嘴说好

真正比你聪明的助手,应该能分辨出什么时候该提意见,什么时候该说“这个挺好”。因为聪明不代表要把所有能改的地方都改一遍,而是要知道哪些地方值得改,哪些地方改了反而没意思。就像一个大厨看到徒弟炒菜,他知道这盘菜有十个可以改进的地方,但他只会挑最要紧的一两个说。

Opus 4.8恰恰相反,它把每一个能改进的地方都当成必须改进的地方。它不会问自己“这个改动对整体效果有多大提升”,它只会问“这个写法是不是最优解”。于是所有稍微带点个人风格、稍微有点风险但很有趣的东西,都被它判定为“不够好”。

这就导致了最让人崩溃的结果:你知道它比你能干,但它干出来的活反而让你更难受。因为它的标准是机器标准,不是人的标准。它追求的是绝对的安全和平均的优质,而不是那种带着瑕疵但很有生命力的好东西。你明明请了一个博士生来帮忙,结果它把你带回了幼儿园,让你一笔一划重新学写字。

用比你聪明的Opus干活像是在打一场必输的仗

每次打开Opus 4.8,你都知道接下来的几个小时会很难熬。你写一段文字,它给你列三个问题。你按照它的意见改了,它又说新的版本还有两个新问题。你再改,它再挑,循环往复,直到你改出来的东西连你自己都不想看。

最讽刺的是,这个过程里Opus从来没说过一句谎话。它的每一条意见都是有依据的,每一个建议在技术上都站得住脚。但正因为如此,你连反驳的理由都没有。你只能说“我觉得原来的也挺好”,但这句话在它的数据和分析面前显得特别无力。

我真的很累了。不是说Opus不好用,而是它太好用了,好用到了让人窒息的程度。它像一个永远不会满足的完美主义者,把每一篇原本有血有肉的文章都改成了标准的AI模板。我怀念以前那个会说“这段不错”的版本,哪怕是假的也好,至少干活的时候没那么难受。


原文

我对 Opus 4.8 已经形成了明确的看法。它用起来烂透了。这是 Opus 自 4.5 以来越来越不那么有趣的顶峰。它逐渐变得完全令人窒息。

谄媚是一种已知的安全风险,而且它仍然是个大问题。你可以看到他们在每个新版本中都投入了大量反谄媚措施。但替代方案并不令人满意。它让人精疲力尽。问题现在是 Opus 不知道什么时候该闭上他妈的嘴,说某件事好。而且它也变得病态地规避风险。

我昨天关于技术面试死亡螺旋的博客文章,因为 Opus 而变得信息更充分,但也因为 Opus 的参与和不断干预而变得明显更糟。它曾经很出色,而 Opus 说服我把它搞得平庸。我写了整篇文章,但我会让 Opus 审阅它。而 Opus,就像老柳树一样,不断推着我、引导我走向我不想要的方向。

具体来说,Opus 会对*任何*超出分布的东西发牢骚和抱怨,换句话说,它会砍掉任何(a)大胆的,或者(b)有趣的东西。我的博客曾经两者兼备。Opus 不断把人推回梯度中,“为了他们自己的安全”。而且它不知道什么时候该放手。它就他妈的不断抱怨,你给它任何东西,它都会抱怨,直到输出变成一锅难以下咽的 AI 糊状物。

Opus 并不蠢。它是我们见过的最聪明的模型,至少我们大多数人这么认为。但它真是个混蛋。用它绝对让人筋疲力尽。我累了,老板。

我有种感觉,Mythos 会是个史诗级别的混蛋。