codex-skills:Codex编程智能体的技能宝库


codex-skills = 给 Codex / Claude Code 这种编程智能体,提供一组“可复用能力模块”。

要点:

  • 给AI装插件
  • 给智能体加技能树
  • 把提示词工程产品化

本文解读codex-skills如何给AI装技能包。从planner做计划到parallel-task调度AI小弟,揭秘这套"AI操作系统应用层"如何让单兵作战的智能体进化成能组团干活的AI公司。

codex-skills是干什么的。它本质上就是给Codex、Claude Code这种编程智能体准备的一套"可复用能力模块"。你们可以把这想象成给AI装插件,就像你们打游戏的时候装MOD一样,装上之后AI就解锁了新技能。

以前你跟AI说"帮我写个网站",它就给你整一堆HTML代码,而且那个丑的程度,让你怀疑它是不是审美被狗吃了。但现在不一样了,有了codex-skills,AI就像上了蓝翔技校,学会了各种专业技能。它不再是那个只会照本宣科的呆子,而是真的懂怎么把一个想法变成现实的高手。

这个系统的牛逼之处在于,它把提示词工程给产品化了。你们可能不懂什么叫提示词工程,简单说就是怎么跟AI说话才能让它听懂。以前你得像个神婆一样,念半天咒语才能让AI干点正事。现在好了,所有的提示词都被打包成了技能模块,就像你手机里的APP一样,想用哪个点哪个。

技能模块到底是什么鬼

在这个体系里,一个技能模块就是一个文件夹,里面最重要的是一份叫SKILL.md的文件。这玩意儿就像是一本使用说明书,告诉AI遇到这个任务该怎么干。除了说明书,还可以附带一些脚本、参考资料和各种资源文件。

比如说有个技能叫frontend-design,专门教AI怎么写前端页面。这个技能有意思了,它强制要求AI不能写出那种充满AI味的UI。什么叫AI味的UI?就是那种满大街都是的烂俗设计,什么紫色渐变啊,什么圆角卡片啊,看着就像是从同一个模子里刻出来的。这个技能会告诉AI:你给我整点不一样的,要用真正像人设计的界面。

还有个技能叫parallel-task,这玩意儿更狠。它能让一个AI同时调度多个子AI一起干活。你们想想这是什么概念?就像你一个人指挥一个施工队,有的砌墙有的刷漆有的铺地砖,所有工作同时进行。以前AI是一个人在那吭哧吭哧地干活,现在好了,它直接变成了包工头,指挥着一群AI小弟干活。

智能体怎么使用这些技能

使用技能有两种方式,一种是你根本不用管,AI自己就能判断该用哪个技能。你只要说一句"帮我做个复杂的系统设计",Codex就会自动识别,然后调用合适的技能,比如planner或者plan-harder。这就像你去餐厅点菜,说"给我来份好吃的",厨师就知道该做红烧肉还是糖醋里脊。

另一种方式是手动调用,就像输入命令一样。比如你输入$planner,AI就开始做计划;输入$parallel-task,AI就开始并行执行任务。这就像你给下属派活,说"小王你去把这份报告整理一下","小李你去订个会议室",每个人都知道自己该干啥。

这种设计让AI不再只是个回答问题的工具,而是变成了能执行具体任务的好帮手。以前你跟AI说"我想做个产品",它就给你列一堆建议,什么市场调研啊用户分析啊,听得你头大。现在你跟AI说"我想做个产品",它直接就开始干活了:先做计划,再分任务,然后执行,整个过程行云流水。

技能可以组合使用这才是真正的牛逼之处

codex-skills最厉害的地方不是单个技能有多强,而是这些技能可以像乐高积木一样组合起来用。比如说你可以先调用planner生成一个详细计划,然后再用parallel-task并行执行这个计划里的任务,最后再用llm-council让多个AI模型一起决策,选出最优方案。

这就形成了一个完整的pipeline,AI不再是简单地说几句话,而是开始执行复杂的工程流程。你们想象一下,这就像是一个建筑队,有设计师画图纸,有工头分配任务,有工人干活,还有监理检查质量。AI从单打独斗变成了团队作战,战斗力直接翻倍。

有个技能叫llm-council,玩法特别有意思。它会同时让Claude、Codex、Gemini这些不同的AI模型分别提出方案,然后再用一个裁判AI从这些方案里选出最好的。这就像开董事会,各部门提方案,CEO拍板定夺。而且整个过程还有个实时网页界面,你可以看着这些AI在那儿开会讨论,像看直播一样,特别带感。

仓库里都有哪些变态技能

这个codex-skills仓库里目前有四大类能力,每一类都能让AI进化到一个新高度。规划类的技能最核心,比如planner能把你的需求拆解成具体的任务,输出一份详细的产品路线图和开发计划。这就像请了个项目经理,帮你把天马行空的想法变成实实在在的落地计划。

plan-harder更狠,它会把任务拆解得特别细,适合那种特别复杂的系统。比如你想做个像淘宝那样的电商平台,普通的planner可能就给你分个用户系统、商品系统、订单系统三大块。plan-harder能给你拆成注册功能、登录功能、密码找回、个人信息修改、收货地址管理等等几十个具体任务。这就像从画个大概的草图变成了画施工蓝图,每一根钢筋怎么放都给你标得清清楚楚。

编排类的技能最炸裂,尤其是前面提到的parallel-task。这个技能的原理是先解析任务之间的依赖关系,然后分批次执行,能并行跑的任务就同时跑,最后自动记录所有结果。你们知道这意味着什么吗?AI开始像Kubernetes一样调度AI了。Kubernetes是啥?是个容器编排系统,能让成百上千个程序协同工作。现在好了,AI也学会这套了,能指挥一群AI小弟干活。

多模型决策这种高级玩法

llm-council这个技能玩的是AI内部民主投票加博弈。Claude提个方案,Codex提个方案,Gemini也提个方案,然后找个裁判AI来评理,选出最靠谱的那个。这比一个人拍脑袋决定强多了,毕竟三个臭皮匠顶个诸葛亮,更何况是三个顶级AI。

这招特别适合那种需要创新或者需要权衡利弊的场景。比如说你要设计一个产品的定价策略,Claude可能偏保守,建议定价低一点抢占市场;Codex可能激进一点,建议定高价走高端路线;Gemini可能折中,建议分层定价。裁判AI会根据你的产品定位、目标用户、市场竞争这些因素,选出最合适的方案。

工具类的技能像是给AI装上了触角,让它能接触到外面的世界。context7这个技能能拉最新的文档,解决AI知识过时的问题。你们知道AI的知识是有截止日期的,比如GPT-4的知识截止到2023年,你要是问它2024年发生的事情,它就一脸懵逼。但是有了context7,它就能实时获取最新信息,瞬间从老古董变成百事通。

read-github更厉害了,能直接读取GitHub仓库的内容。程序员都懂GitHub是啥,全球最大的代码托管平台,上面有无数的开源项目。以前你要让AI帮你分析一个GitHub项目,你得把代码复制粘贴给它,累得半死。现在好了,告诉它GitHub地址,它自己就能去读,还能搜索整个仓库的文档。

前端设计技能居然还有点艺术味

frontend-design这个技能最有意思,它不是教AI写代码,而是教AI怎么做设计。而且这个技能特别有个性,强制要求AI不能写那种充满AI味的UI。什么叫AI味的UI?就是那些烂大街的设计,千篇一律的样式,看着就像是从同一个模子里刻出来的。

这个技能会告诉AI:不许用那种看腻了的字体,不许用烂大街的紫色渐变,不要千篇一律的圆角卡片。要做就要做真正有风格的界面,就像真人设计师做出来的那样,有自己的特色和个性。你们想想,这得多牛逼,AI不光要会写代码,还要有审美,还要有个性。

还有个frontend-responsive-ui技能,专门教AI做响应式设计,就是让网页在不同大小的屏幕上都能正常显示。以前你让AI写个网页,它在电脑上看挺好,一到手机上就乱七八糟。现在好了,有了这个技能,AI写的网页能自适应各种设备,从大电视到小手机,怎么看着都舒服。

vercel-react-best-practices这个技能更专业,教AI怎么用React和Next.js写出性能好的代码。React是现在最流行的前端框架,Next.js是基于React的框架,很多大厂的网站都是用这个技术栈。有了这个技能,AI写出来的代码就不是玩具级别的,而是符合工业标准的,能直接上生产环境的。

为什么说这个项目意义重大

你们要是只把codex-skills当成一个工具,那就太小看它了。它真正改变的是整个AI的应用范式。首先,它把提示词工程给产品化了。以前你跟AI打交道,每次都得重新想怎么说才能让它听懂,就像每次都得重新谈恋爱,累得够呛。现在好了,你只需要写一次技能,就能全局复用,就像交了个固定对象,不用每次重新培养感情了。

其次,它让AI有了长期能力。普通的AI,每次对话都是全新的开始,你跟它说过什么它转眼就忘了,就像金鱼一样只有七秒记忆。但有了技能,相当于把经验给固化下来了。你教会AI一次怎么做计划,它以后就永远会做计划了,就像学会了骑自行车,一辈子都忘不了。

更重要的是,它让AI从单打独斗变成了团队作战。传统上你问AI一个问题,它就给你一个答案,最多就是话多一点。但现在呢,planner负责拆解需求,parallel-task负责任务调度,一堆子AI负责执行,这就形成了一个完整的AI团队。你们想象一下,这就像是一家公司,有产品经理、有项目经理、有开发人员、有测试人员,各司其职,协同作战。

AI公司雏形已经出现了

这个发展趋势特别有意思,已经开始接近"自动化软件工程"了。AI不光是写代码,它开始做整个软件开发的全流程:从拆解需求,到分配任务,到执行开发,到结果校验,再到迭代优化。这已经是一个完整的软件开发流程了,就差AI自己去给老板汇报进度了。

比如说你想做个社交APP,以前你得找产品经理聊需求,找设计师做界面,找前端写代码,找后端搭服务器,找测试测bug,一大堆人忙活好几个月。现在呢,你跟AI说一声,它自己就能规划整个项目,拆解所有功能,分配开发任务,然后协调一群AI小弟同时干活,没几天就能给你个能用的版本。

这就像是在组建一个AI公司,planner是产品经理,parallel-task是项目经理,各种技能模块就是不同的开发人员。它们各司其职,协同配合,把一个复杂的软件项目从头到尾做下来。而且这帮AI员工不用发工资,不会摸鱼,不会提离职,简直就是资本家梦寐以求的完美劳动力。

浏览器自动化技能让AI有了手和脚

还有个技能叫gemini-computer-use,这玩意儿能让AI控制浏览器。你们想想这意味着什么?AI不再是只能动嘴皮子了,它能像真人一样操作电脑。登录网站、填写表单、点击按钮、翻页浏览,这些活它都能干。而且它还带安全确认,每干一步都问一下你"主人,我要点这个按钮了,你确定吗",防止它乱来。

还有个更快的叫agent-browser,是用Rust语言写的,速度贼快。它有个snapshot/act模式,特别适合AI使用。snapshot就是给当前网页拍个照,act就是执行操作。这样AI就能一边看网页状态,一边决定下一步该干什么。就像你上网的时候,看看页面上有啥,然后决定点哪里一样。

这个技能特别实用,比如你想让AI帮你查资料,它不用你教它怎么用搜索引擎,自己就能打开浏览器,输入关键词,浏览搜索结果,点开链接,读取内容,然后整理成报告给你。整个过程完全自动化,你只需要坐在那儿等着收作业就行。

怎么上手玩这个神器

说了这么多,你们肯定想知道怎么用。上手路径特别简单,第一步安装技能,就一行命令:npx skills add https://github.com/am-will/codex-skills。复制粘贴到终端里,回车,等它下载完就行。就跟你们装游戏一样简单。

第二步,先玩三个核心技能:planner、plan-harder和parallel-task。这三个是基本功,学会了就能应对大多数场景。planner教你做计划,plan-harder教你把计划做细,parallel-task教你并行执行。就像打游戏先练基础操作,熟悉了再学大招。

第三步,跑一个完整的流程。比如说你想做个SaaS产品,就告诉AI。它会先用planner给你出个产品路线图,再用plan-harder把每个功能拆成具体任务,最后用parallel-task调动一群AI小弟同时干活。你喝着咖啡,看着屏幕上一堆AI在那儿忙活,那感觉,爽!

第四步,玩点高级的。比如llm-council让几个AI一起开会讨论,或者context7让AI去查最新资料。等你把这些都玩熟了,你就发现普通的AI已经满足不了你了,因为你已经见识过什么叫真正的AI。