Codex Goals模式实战:给AI定目标让它自己干活到天亮

本文讲解如何用Codex的/goal指令让AI自动干活。核心是给AI一个能打分的目标,比如“把代码跑快20%”,而不是“让代码更好”。再配上快速测试和三个记录文件,AI就能自己干几天几夜不歇菜。

执行目标要让AI能打分

你给AI下指令,最怕说那种“你看着办”的话。比如你跟AI说“把我的代码弄好点”,它就懵了。什么叫好点?少几行?跑快一点?还是注释写得像诗?

这种指令下去,AI只有两种死法。第一种,它干几分钟就放弃,跟你说“我觉得差不多了”,但你打开代码一看,就改了个变量名。第二种更惨,它永远不睡觉,一直改一直改,改到天荒地老,最后把能跑的程序改崩了。

所以定目标的核心就一条:让AI能给自己打分。比如你说“把某个文件里的代码运行时间减少20%,而且不能搞挂现有的单元测试和集成测试”。AI一听就懂了,它的脑子里就有个进度条。跑一次测试,看看时间少了多少,没到20%就接着干,到了就收工。

这就像你让一个小孩去收拾房间。你说“把房间收拾干净”,他能把玩具塞到床底下就算完事。但你说“把地上的乐高全部放进蓝色箱子,把书全部竖着摆到第二层架子上,用时不超过15分钟”,他就知道干到什么程度能去看动画片。

有一次我自己搞一个论文改格式的活。ICML的格式要求写在一个LaTeX文件里,两百多条规则,什么页边距、字号、参考文献顺序,密密麻麻。AI根本没法对着这个打分。我就让Codex先把这些规则抽出来,做成一个检查清单,Markdown格式的,每一条前面有个方框。

然后我跟AI说:“你照着这个清单改,改完一条勾一条,论文的技术内容一个字都不许动。”AI就一条一条对着干,每勾掉一条就知道自己前进了一小步。两百条勾完,任务完成。这个方法妙在,原来模模糊糊的“改好格式”变成了一个可以数数的事。

测试要快得像泡面

AI干活的时候,需要反复测试自己的改动有没有用。你让它测试一次要花三天,那它一天也干不了几个活。你让它一分钟就能测完,它就能在一个小时里试六十种方案。

这就像你想学做菜。你要是每次炒完都得等烤箱预热半小时才能尝味道,那你一晚上也就练两三次。但你要是用微波炉高火两分钟就能出一盘,你一小时能试三十种调料组合。

我搞蛋白质结构模型优化的时候,全量训练一次要好几天。我就换了个小数据集,数据量不大但采样很全,跑一次只要几分钟。这样AI试错的速度从几天变成了几分钟,一天能跑上百次实验,最后找到的方案比原来好不少。

所以思路就是:找一切办法把测试这一步压缩到最短。减数据量、用小模型、只测关键模块,怎么快怎么来。测试快,AI就能在死之前多试很多条路。

给AI配三本笔记本让它的脑子不炸

AI连续干几天几夜,就算Codex有压缩上下文的能力,它的脑子也会乱。前面想过的东西后面就忘了,中间绕过弯它自己都不记得。

解决办法特别土但特别有用:让它往文件里写笔记。我一般给AI开三个Markdown文件。

第一个叫PLAN.md,是大纲。AI一开始想好大概分几步走,先干这个再干那个,写下来。你也往里塞点想法,比如“我觉得可以先试试改学习率”,引导一下方向。

第二个叫EXPERIMENTS.md,是实验记录。AI每试一个方案,就记一条:标题、试了什么、结果怎么样。这个文件最值钱,因为你和AI都能翻回去看之前踩过哪些坑。

第三个叫EXPERIMENT_NOTES.md,是草稿本。按时间顺序记AI的实时想法,比如“我试了改第二层的参数,好像没啥用,等一下再试试第四层”。这个主要给你看,你瞅一眼就知道AI的思路偏没偏。

有了这三个文件,AI就不用把所有东西硬记在脑子里。它需要的时候翻一下EXPERIMENTS.md,就知道“哦,之前试过A方案不行,那这次试B”。你需要的时候翻一下,就知道这家伙有没有在瞎改。

有一次我让AI优化一个排序算法,它自己在EXPERIMENTS.md里列了十几条记录。从“冒泡改快排,提升50%”到“并行分块,提升到80%但内存爆了”,清清楚楚。我一看就知道它试过什么路,死在哪,接下来该往哪边拐。

总结就是把三招串起来

所以玩转Codex的/goal模式,就三件事。

第一,目标要能打分。别说“变好”,要说“变快20%”或者“勾完两百条清单”。AI不懂模糊美学,它只懂数字和复选框。

第二,测试要快。把全量数据砍成小样,把几天跑完的训练缩到几分钟。AI试错的速度决定了它活干得漂不漂亮。

第三,给AI三个文件当外挂脑子。PLAN.md管方向,EXPERIMENTS.md管历史,EXPERIMENT_NOTES.md管碎碎念。有了这些,AI就能连着干几天不乱套。

这三样东西摆好,你就可以去睡觉了。AI会在你梦里继续跑测试、改代码、记笔记。早上起来你打开EXPERIMENTS.md一看,十几条记录躺着,最后一条写着“目标达成,收工”。

然后你就端着咖啡说一句:这家伙,比实习生靠谱。