Claude Code装多动症ADHD技能:效率翻倍却被质疑


本周,独立研究员 Udit Akhouri 在 Reddit 的 r/ClaudeCode 版块上发布了一款新的第三方 Agent SDK 工具,标题是:“我给 Claude Code 加上了 ADHD(注意力缺陷多动症)……现在它的思维能力提升了 2 倍。”

正如GitHub上所描述的那样,ADHD 是一种基于 Claude Agent SDK 构建的编码代理技能;它“在不同的认知框架下展开平行发散的想法,进行评分,剔除陷阱,加深幸存者的理解”。

该工具在 GitHub 上已经获得了快速增长的流量,但一些研究人员仍然对其新颖性以及“性能提升 2 倍”的说法持怀疑态度。

怎么回事?

有个独立研究员弄了个新工具,给Claude Code加了点“多动症”属性。简单说,就是让AI在面对一个问题时,不再只走一条直线思路,而是同时想好几个完全不同方向,自己打分,砍掉没用的,再把最有希望的几条路往深了挖。听起来有点东西对吧?结果对外宣传是“思考效率翻倍”。

但我们仔细扒了扒,发现这个“翻倍”主要靠“能发现陷阱”这一项拉高了平均分。去掉这项,翻倍就缩水成了一点八五倍。而且人家作者自己也说了,这玩意儿适合头脑风暴和做计划,真到写代码环节,别指望它能帮你噼里啪啦敲键盘。

为啥要给AI“多动症”:解决AI想问题太死板

AI干活最大的毛病是什么?死脑筋。你给它一个问题,它就沿着一条路走到黑。就像你问路,正常人会告诉你“往东走两百米看到便利店左转”,但AI可能直接给你画一条直线,中间有堵墙它也不管。这不怪它,大模型的底层逻辑就是根据上文预测下文,跟滚雪球一样,一开始方向偏了,后面全歪。

那个叫Udit Akhouri的研究员自己天天用Claude Code搞科研,被这种“深但窄”的直线思维坑了无数次。他发现自己脑子天生就是跳脱型的——想事情能同时开好几个脑洞,最后挑最靠谱的那个落地。于是他就想:能不能让AI也这么干?别走独木桥了,改成撒网捕鱼。

结果就是他在GitHub上扔了个叫ADHD的技能包,基于Claude官方出的Agent SDK搭建。这个技能的核心操作就三步:先让AI分裂出好几个不同角度的小分队,每个分队自己瞎想;然后找个裁判给每个分队的成果打分,重点看谁发现了隐藏陷阱;最后只留下分最高的两三个,让它们继续往深了琢磨。

技术拆解:那个“多动症”到底在后台干了啥

如果你打开这个工具的后台,会发现它根本不是让AI真的得病,而是强行改变了AI的思考流程。正常情况下你问Claude一个问题,它吭哧吭哧给你一个答案。装了ADHD之后,你问一个问题,后台其实是这么跑的:

第一步,系统会复制出五个一模一样的AI副本,但每个副本的开场白不一样。比如你问“怎么给一个医疗诊所做数据安全方案”,第一个副本接到的指令是“从合规角度想”,第二个是“从黑客攻击路径想”,第三个是“从员工日常操作便利性想”,第四个是“从成本最低出发想”,第五个是“从未来三年技术升级想”。你看,同样的问题,五个思考框架。

第二步,每个副本自己闷头想,互相不聊天。这一步大概跑几秒钟,每个副本吐出一套完整方案。

第三步,来个总裁判。这个裁判也是个AI,它手里有一张打分表,看四点:想法够不够宽、有没有新鲜角度、挖出了几个别人容易掉进去的坑、这个方案实际用起来靠不靠谱。打分过程也是全自动的,不用人参与。

第四步,总分最低的那两三个副本直接杀掉,剩下的继续往下深挖一轮。这次深挖不是简单重复,而是让幸存者基于前一轮的结论再细化,比如把“从合规角度想”那个方案,细化成具体的服务器配置和员工培训流程。

第五步,最后只输出幸存者里得分最高的那个完整方案。

整个过程你肉眼看着好像AI只是给了一个答案,实际上后台已经悄悄掐了一架,死了好几个脑洞,活下来的那个是淘汰赛冠军。

那这个路子新不新:不新,但包装得聪明

搞AI的资深人士看到这个设计第一反应基本都是:这不新鲜啊。GPT Pro早就干了类似的事,人家同时跑好几个高参数配置的推理,最后挑得分最高的那个答案吐出来。还有CrewAI这种做“智能体团队”的框架,本质也是让不同角色的AI分头干活再汇总。所以你说这个ADHD是不是石破天惊的原创?不是。

但它有一个很鸡贼的卖点:透明。GPT Pro的并行推理你看不到中间过程,黑盒一样。CrewAI虽然分工明确,但你得自己配置每个角色的提示词,门槛不低。ADHD直接长在你本地的Claude环境里,中间每个副本的思考过程、裁判的打分明细,全部打印给你看。这就好比你点外卖,别的平台只告诉你“骑手已取餐”,这个平台告诉你骑手现在在哪个路口、等了几秒红灯、保温箱温度多少度。透明确实透明,但对最终结果有多大提升,不好说。

那个“效率翻倍”是怎么算出来的:全靠“发现陷阱”这一项拉分

作者自己贴出了测试数据,总共六个工程问题。比如其中一个问题是“设计一个给医院用的临床决策支持系统,要求能处理数据延迟和接口不稳定”。让裸奔的Claude Code和装了ADHD的Claude Code各自去搞,然后从五个维度打分:思路宽度、新颖程度、发现陷阱的能力、方案可操作性、对开发者有用程度。

结果出来后,五个维度里有四个ADHD赢了,只有一个“对开发者有用程度”基本打平。赢的那四个里,“发现陷阱”这一项领先最多,多了七点六七个点。你把五个维度的领先分数加起来平均,刚好得出一个二点五二倍。作者就对外喊“翻倍还多”。

但你把“发现陷阱”这一项拿掉,剩下四项的平均领先只有一点八五倍。而且一共才测了六个问题,这个样本量太小了。打个比方,你考了六门课,其中一门满分,其他五门刚及格,平均分看着还行,但你能说自己就是学霸吗?另外,打分用的是Claude家族里的另一个模型当裁判,自己人给自己人打分,有没有偏袒?专家们也指出这个问题,说至少要换别的裁判、换其他公司的模型重新测一遍,才能让人信服。

这玩意儿到底能干啥不能干啥:作者自己泼了冷水

最有意思的是作者自己的表态。别人都恨不得把工具吹上天,Udit Akhouri倒好,直接跟媒体说:这个ADHD适合头脑风暴和做规划,不适合写代码。你不是指望它帮你自动生成几百行代码,它擅长的恰恰是写代码之前的那个阶段——架构选型、技术方案对比、风险预判。等你把这些都想清楚了,真正撸起袖子写代码的时候,它反而帮不上什么忙。

这就很诚实了。因为目前市面上大多数AI编程助手都在拼“谁生成的代码行数多”、“谁跑通测试用例快”,这个ADHD反其道而行之,它在“想”这个环节使劲,在“做”这个环节隐身。那它的价值在哪?对一些需要做复杂技术决策的场景,比如你是个独立开发者,要选一个后端框架,或者你是个技术负责人,要给团队定数据存储方案,这种时候让它帮你横向扫一遍、挖出几个你没想到的坑,确实有用。

已经有人开始用了,但也有人担心烧钱

虽然争议不小,但GitHub上已经有两百八十多颗星,十二个分支。有一家叫Repowire的公司这周刚开始把它集成到自己的技术栈里。说明至少在小范围内,它确实解决了一部分人的痛点。

但另一个问题来了:这种“先分裂再合并”的玩法,极其消耗token。原来问一个问题,后台跑一次推理。现在问一个问题,后台跑五路并行推理,每路可能还深挖两轮,总token消耗直接翻好几倍。现在企业用大模型最头疼的就是账单,稍微不注意一个月烧掉几千美刀。有专家就泼冷水说,这个工具出现的时机不太妙,行业正在为token超支焦头烂额,你再来一个更耗token的方案,就算效果确实好一点,很多公司也不敢开这个口子。

为啥敢起名叫“多动症”:作者自己就是亲历者

最后说个八卦。这个工具起名叫ADHD,医学上叫注意缺陷多动障碍。正常人一听可能觉得你在调侃或者消费疾病。但作者自己透露,他本人就是ADHD的亲历者。他脑子里的思考方式从来不是线性的,而是同时蹦出好几个念头,经常走神,但也经常在走神中发现别人看不到的联系。他给AI设计这个并行思考的流程,其实就是模拟他自己的思维模式。他不是在玩梗,是在复刻自己的脑子。

当然,Anthropic公司(Claude的母公司)对这个事情没有回应。毕竟第三方开发者用他们的SDK做了个工具,还起了个医学相关名字,这事在合规和伦理上有没有风险,目前没人给说法。