OpenClaw之父:AI越强越辣鸡?人类审美与反馈循环才是核心控制系统


AI生成质量取决于人类审美与反馈循环,缺乏方向控制会导致高质量垃圾输出,迭代才是核心路径。

AI已经够聪明了, 但你不参与其中,它只会帮你造一堆高级垃圾!你不与宠物玩耍互动,宠物就在家到处拉屎!


AI能力越强,人类审美越稀缺,结果越容易变成“流水垃圾”

Peter Steinberger,也就是OpenClaw的创造者,他说了一句特别扎心但真实的话。你完全可以让AI一整晚都在那里疯狂写代码,CPU跑得滚烫,看起来特别努力。第二天早上你醒来一看,得到的是一坨终极版的流水垃圾。为什么?因为这些AI代理到现在为止,还根本没有“审美”这个东西。

这句话直接掀开了很多人心里的遮羞布。我们总以为AI输出差是因为它还不够聪明,能力还不够强。

但Peter的真相是:AI已经够聪明了,聪明到它能在错误的道路上跑得飞快,然后把一堆结构完整但灵魂空洞的东西堆到你面前。这种垃圾比低质量的垃圾更可怕,因为它看起来好像是对的,让你一开始很难发现问题。

这里有一个特别反直觉的逻辑。能力越强,制造的高级垃圾就越多。AI可以在零点几秒内生成一篇格式完美、逻辑自洽、论据充分的长文。但如果你没有给它正确的方向,这篇文章从头到尾都在论证一个你根本不关心的问题。这种结果就是典型的“看起来很努力但没有灵魂”。

很多人的错误在于,他们把创造过程的控制权彻底交给了AI。他们觉得AI自己会变聪明,自己会有品味,自己知道什么是好作品。这完全是把责任甩锅给工具。AI本质上只是一个超级听话的执行器,它没有内置的审美闭环,没有长期的价值判断系统。它唯一能做的,就是拼命放大你输入的方向。

如果你的输入是模糊的,AI就拼命放大模糊。如果你的输入是混乱的,AI就拼命放大混乱。结果就是你得到一堆放大版的模糊和混乱。所以问题从来不在AI身上,问题永远在你使用AI的方式上。你写了一个三行字的prompt,然后指望AI帮你写出诺贝尔奖作品,这本身就是幻觉。

很多人以为多写几行prompt就能解决问题,这又是一个大坑。真正决定输出质量的,不是prompt的长度,而是你在整个生成过程中有没有持续参与,有没有不断修正方向,有没有形成一个有效的反馈循环。没有这个循环,AI再强也是白搭。

能力与方向的错位:为什么“聪明但没品味”会制造更高级垃圾

Peter用了一个特别形象的词来形容AI,叫“spiky smart”,翻译过来就是“浑身是刺的聪明”。这个说法太妙了。AI在某些点上极度聪明,它可以写出一个优雅到让人想哭的函数,代码干净得像是艺术品。但与此同时,它可能在整体架构上犯一个连初级程序员都不会犯的基础错误。

这种“局部极强,整体不稳”的结构,会制造一个非常诡异的结果。你看到AI输出的某一个段落、某一个代码块、某一个论证步骤,你会忍不住鼓掌,觉得太牛了。但是当你把所有这些华丽的碎片拼在一起,你会觉得整个东西像是一个精神分裂患者写的,哪里都不对劲。

这种感觉就像你吃了一颗外表完美、巧克力涂层丝滑的糖果,咬下去发现里面包的是辣椒和芥末。每一个碎片都让你觉得“好像还行”,但组合在一起就是一场灾难。更麻烦的是,这种“看起来还行”的错觉会让你浪费大量时间去排查问题,因为你总怀疑是自己没看懂,而不是AI写错了。

这种现象的背后,是AI缺乏一个核心机制:全局目标约束。AI不会主动停下来问自己一句:我现在做的事情,是不是在逼近一个更好的最终结果?它没有这个能力。它只是在机械地响应你当前输入的每一个字,然后尽可能把当前这一步做得漂亮。

所以一旦你作为人类没有给出清晰的方向引导,AI就会自动进入一个“局部最优循环”。什么叫局部最优循环?就是每一步看起来都特别合理,每一步都做到了当前条件下的最好结果。但是这些局部最好的步骤叠加在一起,整体方向会越来越偏,最后彻底跑题。

这种偏差不是一下子发生的,而是慢慢积累的。第一轮偏差一点,你不纠正,第二轮AI就在偏差的基础上继续优化。第三轮、第四轮之后,你得到的是一个结构极其精致、逻辑极其严密、但主题完全错误的庞然大物。这就是Peter说的“ultimate slop”,终极版流水垃圾。

很多人误以为多跑几轮就能解决问题。他们觉得让AI多生成几次,从里面挑一个最好的就行了。这个思路完全错了。没有方向控制的迭代,本质上只是加速偏离。你让一个跑偏的人跑得更快,他不会自己回到正轨,他只会更快地跑到沟里去。

创造过程的真实结构:模糊起点加逐步感知加动态修正

Peter在描述他自己开始一个新项目时的做法,其实是在透露一个被绝大多数人忽略的真相。他说自己刚开始一个项目的时候,脑子里只有一个非常粗糙、非常模糊的想法,大概知道这个东西可能长什么样。然后他就开始动手玩,边玩边感受,慢慢让这个想法变得清晰起来。

这个描述听起来很简单,但它揭示了一个核心机制:人类的创造从来不是从完整规格开始的,而是从一种模糊的感觉开始的。你感觉到有一个东西在那里,但你看不清楚它的全貌。你需要通过不断的尝试、触碰、观察,才能让它慢慢浮现出来。

这个过程里有两大关键动作,一个是“试”,一个是“感”。试就是动手去做,去生成一些东西。感就是你去观察结果,判断这个东西好不好,哪里不对,哪里可以改进。很多人只做第一个动作,拼命让AI生成内容,但完全不做第二个动作。他们不观察,不判断,不感受,只是机械地执行。

AI可以帮你完成“试”这个动作,它可以在一秒钟内生成一百个版本。但“感”这个动作必须由你亲自完成。没有人可以代替你去感受一个结果是不是对的,是不是有灵魂的,是不是符合你内心的那个模糊想法。这个判断能力就是Peter说的taste,也就是审美。

这个过程之所以重要,是因为它允许方向被不断修正。你的初始想法本来就不完整,这很正常,每个人开始的时候都不完整。但是通过实际运行、观察结果、判断好坏,你可以一步一步逼近一个更优的解。这条路不是一条直线,它更像是一个不断收紧的螺旋,每一圈都比上一圈更接近目标。

如果你跳过这个“试和感”的过程,试图在一开始就把所有东西都定义清楚,写一个完美无缺的需求文档,你就会遇到一个致命问题。你在为你还没有真正理解的东西写规则。你写的每一条规则,本质上都是一个未经测试的假设。AI会严格执行这些假设,但它不会质疑任何一个。最后你得到一个结构严谨、逻辑通顺、但方向完全错误的东西。

Prompt迷信的崩塌:一次性描述一切只会制造空洞结果

现在整个AI圈子里蔓延着一种非常普遍的迷信,就是“万能prompt迷信”。

这些人相信,只要我把需求写得足够详细、足够全面、足够滴水不漏,AI就能一次性给我一个完美结果。这个想法听起来特别高效,好像你只需要动动手指敲敲键盘,就能拿到成品。

但这个想法从根本上误解了创造的本质。创造不是一个从完整输入到完美输出的线性过程,创造是一个从模糊到清晰、从粗糙到精细、从错误到正确的演化过程。你不可能跳过演化本身,直接拿到最终结果。

当你试图一次性描述所有需求的时候,你其实在做一个很危险的假设:你假设自己已经百分之百理解了目标。但现实情况是,绝大多数复杂项目在刚开始的时候,你自己都是一头雾水。你写下的每一个看起来很明确的“要求”,其实都是你拍脑袋想出来的未经检验的猜测。

AI不会告诉你你的猜测是错的。它只会把这些猜测当成圣旨,然后以最高的效率、最严谨的逻辑、最完美的格式,执行一个错误的指令。这就是为什么很多AI生成的内容看起来特别专业,但读完之后你心里只有一个感觉:空。结构齐全,逻辑通顺,用词考究,但没有灵魂。

这个“空”的感觉是怎么产生的?因为整个生成路径里缺少了一个核心环节:反馈。没有反馈,就没有修正。没有修正,就没有深入。没有深入,结果就只能停留在表面。AI可以模仿一切表面的东西,格式、用词、结构、逻辑,它都模仿得惟妙惟肖。但它模仿不了那种通过反复试错、反复调整、反复打磨才能产生的深度。

很多人在拿到AI输出的结果之后,会觉得哪里不太对,但又说不上来。他们反复修改prompt,加更多的条件,写更多的限制,试图用更详细的指令来填补那个“空”的感觉。但这条路走不通,因为你越是用指令去填,你就越是在强化那个没有反馈的线性路径。

真正的解法不是写更长的prompt,而是换一种工作方式。不再把AI当成一个一次性的答案生成器,而是把它当成一个可以反复对话、反复调整、反复打磨的协作伙伴。你生成一个版本,你看,你感受,你判断,然后你告诉AI哪里不对,让它改。改完再看,再感受,再判断。这个过程本身,才是创造的核心。

人机反馈循环的本质:每一步都在重新定义下一步

Peter说了一句特别关键的话,这句话值得刻在每一个AI使用者的桌面上。他说,我的下一个prompt,取决于我当前看到了什么、感受到了什么、思考了什么。这句话听起来平平无奇,但它定义了真正有效的人机协作方式的全部秘密。

我们可以把这个过程拆解成五个连续的动作。第一个动作是生成,让AI根据当前的prompt输出一个结果。第二个动作是观察,你认认真真地看这个结果,不放过任何一个细节。第三个动作是判断,你决定这个结果里面哪些部分是对的,哪些部分是错的,哪些部分需要保留,哪些部分需要扔掉。

第四个动作是调整,你根据你的判断,修改你的prompt。第五个动作是再生成,让AI根据新的prompt输出下一个版本。然后你回到第二个动作,重新开始观察。这五个动作连在一起,就形成了一个循环。每一次循环,你都在让结果变得更好一点。

在这个循环里,AI扮演的角色是“超级快速试错器”。它可以在一秒钟内生成几十个版本,让你去观察和判断。而人类扮演的角色是“方向判断器”。你负责决定哪条路是对的,哪条路是错的,哪条路值得继续走下去,哪条路必须立刻放弃。

如果你把人类这一环去掉,这个系统就失去了所有的方向控制,只剩下一个高速运转但不知道往哪跑的发动机。跑得再快也没有用,因为你可能正在往悬崖跑。如果你把AI这一环去掉,你就失去了速度,你可能要花几个月才能完成本来几分钟就能完成的工作。

很多人使用AI的时候犯的错误是,他们只用了一次“生成”这个动作,然后就结束了。他们写了一版prompt,AI给了一版结果,他们看了一眼,觉得还行,就收工了。他们没有进入循环。他们只走了第一步,就以为已经到了终点。这就像你只买了面粉,就觉得自己已经做好了面包。

真正高质量的输出,没有一次生成就能搞定的。它永远来自多轮、多次、多遍的微调。每一轮都在修正前一轮的问题,每一轮都在解决上一轮的缺陷,每一轮都在让结果更逼近那个你心里模糊但越来越清晰的目标。这个过程看起来慢,但结果是稳的。一次生成的结果看起来快,但结果往往是塌的。

提前退出的陷阱:过早放手会让系统失控

Peter提出了一个特别重要的概念,叫agentic trap,翻译过来就是“代理陷阱”。这个概念指的是一个很多人都会掉进去的坑:你在过程还没有稳定的时候,就把控制权彻底交给了AI。你一开始还参与一下,写写prompt,看看结果,然后你觉得差不多了,就让AI自己跑完剩下的所有工作。

这个行为看起来是在节省时间,你觉得AI可以自己完成后面的工作,你就可以去忙别的事情了。但本质上,你是在主动放弃方向控制权。一旦方向在某个节点出现了偏差,AI不会停下来问你“这样对吗”,它会继续沿着错误的路狂奔,而且跑得比你还快。

这个问题在复杂的项目里尤其明显,因为复杂项目有很多个环节,很多个决策点。前期只要稍微偏一点点,比如偏了一度角,后期跑出去一公里之后,你就偏出去几十米了。等你的项目进展到后期,那个偏差会被放大到根本没法看的地步。最终结果可能极其复杂、极其精致、极其庞大,但跟你想要的东西毫无关系。

更糟糕的是,这种偏差在前期几乎不可能被发现。因为每一步看起来都非常合理。AI生成的第一版,你觉得还行。AI自动修正的第二版,你觉得更好了。AI自动优化的第三版,你觉得简直完美。但你没有意识到,这个“完美”是基于一个已经偏离了的目标。每一步都在偏离的基础上优化,优化得越好,偏离得越远。

等你终于发现问题的时候,你已经来不及了。因为AI已经生成了上千个文件,几万行代码,几十个相互依赖的模块。你想回头修正那个最初的小偏差,你需要推翻一大半已经完成的工作。这个代价太大了,大到很多人选择放弃,或者选择硬着头皮用一个根本不对的结果。

所以关键问题从来不是“用不用agent”,而是“什么时候放手”。如果你在一个系统的目标和路径还没有完全清晰的时候,就过早地把控制权交给AI,你就等于主动放弃了质量控制的最后一道防线。这道防线一旦失守,后面的一切都是徒劳。

正确的做法是,你要一直在循环里待着,直到你确认方向已经完全锁定,目标已经完全清晰,路径已经完全明确。到那个时候,你才可以考虑让AI去执行一些重复性的、不需要判断的工作。在那之前,你一步都不能离开驾驶座。

审美作为核心能力:真正稀缺的不是技术,而是判断力

整个讨论走到最后,全部落到了一个词上:taste。中文通常翻译成“审美”,但这个翻译太窄了,容易让人以为只是关于好不好看。Peter说的taste,远不止好看不好看,它更接近一种综合判断力,一种在复杂情境下分辨好坏对错的能力。

审美不是你喜欢红色还是蓝色这种个人偏好。审美是你面对一堆代码、一篇文章、一个设计方案的时候,你能不能立刻判断出哪个结构更合理、哪个表达更清晰、哪个方向更正确、哪个细节更到位。这种判断力不是天生的,它来自大量的实践、大量的试错、大量的反馈、大量的反思。

AI目前完全没有这种能力。它可以学习海量的数据,可以模仿所有已知的模式,可以生成任何你想要的格式。但它无法形成一个真正的、独立的、稳定的判断体系。它不知道什么是“好”,它只知道什么是“常见”。常见不等于好,流行不等于对,多数人认同不等于正确。

所以AI永远需要一个外部的评估系统来给它提供判断标准。这个外部系统,就是你,是使用AI的人类。你必须成为那个提供taste的人,你必须成为那个说“这个不行,那个可以,这个方向对,那个方向错”的人。没有你这个判断系统,AI就是一艘没有舵的船。

很多人恰恰忽略了这一点。他们把AI当成一个创作者,而不是一个工具。他们觉得AI应该自己知道什么是好作品,自己知道怎么写才对。这种想法导致一个很严重的问题:他们不再主动判断了。他们被动地接受AI输出的每一个结果,觉得AI都这么强了,输出的东西应该没问题吧。

一旦你失去了主动判断的能力和习惯,AI再强也没有任何意义。因为你已经无法区分好坏了。你不知道哪些输出是金子,哪些输出是垃圾。既然分不清,你就无法优化,无法修正,无法进步。最后你只能被动地接受一切,好的也要,坏的也要,整个质量体系彻底崩塌。

实操层面的改进路径:用迭代替代幻想,用反馈替代预设

如果我们把上面所有这些原则落到每天的实际操作里,其实可以总结成几个非常简单、但执行起来非常反人性的动作。这些动作不需要你有多高的技术能力,只需要你改变一个习惯:从追求一次性完美,转向接受反复迭代。

第一个动作,不要试图写一个完美的prompt。这世界上不存在完美的prompt,你写不出来,谁都写不出来。你只需要写一个足够启动的、能跑起来的、大概差不多的版本。这个版本的作用不是直接拿去用,它的作用是让AI先动起来,给你一个初始结果。

第二个动作,拿到初始结果之后,认真看。不是扫一眼,是认认真真地看。找问题,找漏洞,找不对劲的地方。判断方向对不对,结构合不合理,细节到不到位。这一步是整个系统的心脏,你不能跳过它,不能敷衍它。没有这一步,后面所有步骤都是浪费时间。

第三个动作,基于你观察到的结果,修改你的prompt。你发现了什么问题,就针对那个问题去改。不要一次性改十个问题,一次只改一个最关键的问题。然后让AI再生成下一轮结果。每一轮只解决一个问题,而不是试图一次解决全部问题。

第四个动作,持续重复第二和第三个动作。你生成,你观察,你判断,你修改,再生成,再观察,再判断,再修改。持续这个循环,直到结果达到你满意的水平。这个过程可能需要三轮,也可能需要三十轮。轮数不重要,重要的是每一轮都在逼近目标,而不是原地打转。

很多人觉得这样做太慢了。但真相是,这才是最快的路径。因为你每一次修正都是基于真实反馈,而不是基于猜测。你走一步,确认一步,再走下一步。你不会走回头路,不会掉进大坑,不会在错误的方向上狂奔十公里。这才是真正的效率。

总结:AI放大能力,人类决定方向,缺一不可

整个逻辑梳理到最后,其实就是一个非常清晰的公式。AI负责执行,人类负责判断。AI提供速度和规模,人类提供方向和审美。AI生成各种可能性,人类筛选出真正的价值。

这两个角色缺了哪一个,系统都会彻底失衡。如果你只有AI的能力,没有人类的判断,结果就是一堆高质量但毫无灵魂的垃圾。如果你只有人类的判断,没有AI的能力,结果就是你想法很好,但执行太慢,一辈子也做不出几个东西。

真正有效的、能持续产出高质量结果的方式,是把这两者结合成一个紧密的、不断运转的循环系统。不断生成,不断判断,不断调整。这个过程本身,就是你作为创造者的核心工作。它不是准备工作,不是辅助工作,它就是创造本身。

很多人一辈子都在寻找捷径,希望能一次性拿到完美结果。但现实世界从来不奖励捷径,它只奖励那些愿意反复迭代、反复打磨、反复修正的人。所有你看到的那些高质量输出,无论是伟大的软件、精彩的文章、还是惊艳的设计,没有一个是第一版就完美的。

接受迭代,拥抱反馈,把判断力练好,让AI做它最擅长的高速执行,你来做你最擅长的方向判断。这条路看起来慢,但它能带你到任何你想去的地方。