事情是咋回事:有人被薅了2880万次羊毛
各位好,今天聊一个科技圈的大瓜,发生在美国AI公司Anthropic和中国电商巨头阿里巴巴之间。故事简单来说就是,Anthropic跳着脚说:“阿里你薅我羊毛!往死里薅那种!”而且薅得特别狠,据说一个多月薅了2880万次。
Anthropic,就是那个做出Claude大模型的公司,最近给美国参议院的一堆大佬写了封信,指名道姓说阿里巴巴搞事情。他们声称,从2026年4月22日到6月5日,阿里那边的人搞了差不多2.5万个假账号,疯狂调用Claude的API接口,进行了超过2880万次对话交互。
这28.8 million次交互的目的,不是让Claude帮忙写诗或者编段子,而是为了“偷师学艺”。Anthropic说,这是他们公司历史上遭遇过的“最大规模攻击”。阿里那边呢?目前还没吭声,可能还在想怎么回应这突如其来的“感谢信”吧。
说实话,这数字确实吓人,将近两万五千个假账号,平均每个账号要搞一千多次对话,想想那个画面,简直就是一群数字世界的“采花大盗”,夜以继日地围着Claude这朵“鲜花”转,把花蜜(也就是模型的能力)吸得一干二净,场面相当壮观。
啥是“蒸馏”:把大象装进冰箱,顺便把冰箱也学会
Anthropic在信里反复强调一个词——“蒸馏”(Distillation),搞得这词听起来像个很高级的黑魔法。其实它在AI圈是个非常普遍的技术活儿,咱用大白话讲,就是一种“知识搬家”或者“学霸带学渣”的游戏。
想象一下,有个超级学霸(大模型),他上知天文下知地理,但脑子特别大,走哪都得带个超级计算机,普通人根本用不起。这时候,有个聪明的学渣(小模型)说,我不需要学那么全,我就模仿学霸的解题思路和答题风格就行。学霸做了一道题,不仅给答案,还把思考过程、哪里可能是陷阱、哪种解法最优雅都写出来(这就是“软标签”)。学渣不看课本,天天看学霸的解题笔记,最后也能考个八九十分,但自己脑子小、跑得快、成本低。
Anthropic指控阿里干的就是这事儿:把Claude当成那个无所不能的“学霸”,然后用海量的对话去套它的话,把这些高质量的“学霸笔记”(输出结果)收集起来,去训练阿里自己的“通义千问”之类的“学渣”模型。这样就能以极低的成本,快速提升自家模型的能力,特别是软件工程和代理推理能力,这恰恰是Claude最有商业价值的部分。
而且,这招“蒸馏”在业内其实是公开的秘密。几乎所有AI实验室都会蒸馏自己的大模型,弄出个小号、便宜点的版本卖给客户。只不过呢,用别人的模型输出来训练自己的模型,这事儿有点像直接用别人的答案来写作业,虽然效果拔群,但终归是踩在了规则的红线上。
反击的子弹:一边骂街,一边自己也这么干过
最有意思的地方来了。Anthropic这边义正词严地控诉阿里“偷东西”,那边厢,它自己的屁股也不干净。这就好比一个曾经偷过东西的人,现在抓到别人偷东西,气急败坏地报警,场面确实有点黑色幽默。
还记得去年Anthropic那场轰动一时的版权官司吗?它被美国作家和音乐出版商们告了,索赔金额高得离谱。原因是啥?因为Anthropic在训练Claude的时候,从一些盗版书网站下载了超过700万本书,还搞了两万多首版权歌曲,联邦法官都认定这行为“本质上、不可挽回地构成侵权”。
这剧情是不是很熟悉?你训练我的时候,用的是从全人类那儿“借”来的知识,这里面有多少是合法授权的咱都不提了。现在我变强了,别人想用我的输出去训练,你就说这是“非法提取”、“大规模攻击”了?就连马斯克都忍不住在X上转发嘲讽:“他们竟敢‘偷窃’Anthropic从人类程序员那里偷走的东西?”
这波啊,这波叫“回旋镖”打到了自己脸上。一方面用海量数据喂出了自己的大模型,这其中不乏争议性的使用方式;另一方面又极力阻止别人用同样的逻辑来利用自己的产出。这种“只许州官放火,不许百姓点灯”的双标现场,实在是让人忍俊不禁。
环环相扣:从DeepSeek到“榜一大哥”的戏码
其实,阿里并不是第一个被Anthropic点名批评的“蒸馏惯犯”。早在今年2月,Anthropic就已经发过一篇长文,点名了中国另外三家AI公司:DeepSeek、月之暗面和MiniMax。当时说DeepSeek搞了15万次交互,月之暗面340万次,MiniMax更是高达1300万次。现在回头再看阿里这个“2880万次”,妥妥的新晋“榜一大哥”。
更有趣的是,美国商务部对这事儿反应神速。在Anthropic发信两天后,就直接把Anthropic最新的两个模型给禁了,理由是“怕被中国等国家的军事用户利用”。本来是想告状,结果自家最先进的武器被没收了,这找谁说理去?
这一连串事件,简直就是一场精心编排的大戏。Anthropic通过不断“揭发”中国公司,成功地把自己塑造成了一个“受害者”和“抗中先锋”的形象,试图向美国政府证明:看,我的技术太牛了,他们都在偷,你们得保护我啊!结果美国政府反手就是一个禁令,直接把它的“最强武器”给封存了,理由是这东西太危险,不能让坏人(包括被偷的你自己?)拿到。这可真是“搬起石头砸了自己的脚”,或者说,是“求锤得锤”。
总结
整件事看下来,就是一场关于AI技术、知识产权和大国博弈的混战。Anthropic指控阿里“蒸馏”这事儿,技术上可能是真的,因为这确实是快速追赶的捷径。但道德上,Anthropic的立场又非常尴尬,毕竟自家训练数据的“原罪”也没洗干净。而美国政府的介入,则让这场商业纠纷彻底变成了一场政治角力。只能说,在AI这个赛道上,大家都是摸着石头过河,谁的底裤都不太干净,就看谁先被揪出来游街示众了。
原文期刊
Reuters
发表日期
2026年6月25日
原文标题
Anthropic says Alibaba illicitly extracted Claude AI model capabilities
作者单位背景
Karen Freifeld (路边社记者)
Hacker News网友吵翻了天。
焦点不在技术本身,而在于AI公司拿别人数据训练时理直气壮,别人拿它的输出训练时就喊“小偷”,这双标场面实在过于好笑。从商业套利到地缘政治,讨论炸出了各种神评论。
这波操作像极了当年的乔布斯和盖茨
有网友翻出了一段硅谷经典老黄历,说这事特别像当年图形界面的恩怨。乔布斯跑去施乐PARC偷师,回来搞了Macintosh,后来比尔盖茨又搞了Windows,乔布斯气得跳脚骂街。盖茨回了一句:“咱俩都认识个叫施乐的土豪邻居,我翻墙进去偷电视,发现你已经把电视搬走了。”
这个类比一出来,评论区就炸了。大家纷纷表示,Anthropic现在扮演的就是当年乔布斯的角色,靠着“借鉴”全人类的知识(包括大量有版权争议的数据)喂大了Claude,现在别人想用它的输出来训练,它就急得直跺脚。有网友直接配了句台词:“你在绑架我已经合法偷来的东西!”
更损的是,有人翻出Anthropic去年因为用盗版书和歌曲训练,被作家和音乐人告上法庭,赔了15亿美元的事。这剧情简直完美闭环:你偷我的时候说这是“合理使用”,我偷你的时候你说是“非法提取”。这双标现场,让吃瓜群众看得津津有味。
七到九三折的“骨折价”到底怎么来的
一个高赞回复详细解释了这场“薅羊毛”的产业链。原来在中国,因为Claude和ChatGPT都被墙了,普通人想用就得翻墙,而且Anthropic还不收中国银行卡。这就催生了一个庞大的灰产——账号中间商。
这些中间商怎么赚钱呢?他们搞了几万个Claude订阅账号,把用户请求在各个账号之间轮流转,哪个账号没达到使用限额就用哪个。这套操作下来,他们能以官方API价格的7%到30%低价甩卖token。有网友举例说,某个叫yunwu.ai的网站,Opus 4.8直接打骨折,比官方价便宜93%。
而且这帮人不光卖token,还“一鱼两吃”。他们把用户的对话记录和推理链条收集起来,打包卖给想“蒸馏”Claude能力的中国AI实验室。这样一来,卖token已经亏不了多少钱,卖数据还能再赚一笔,甚至还能低于成本运营。有人把这套玩法总结成一句话:“先亏本卖会员,再卖你的聊天记录,最后用你的聊天记录训练自己的模型——一石三鸟。”
蒸馏不是你想蒸,想蒸就能蒸
有网友认真科普了“蒸馏”的两种玩法。一种是“傻大黑粗式”,疯狂问问题,把答案存下来当训练数据,主打一个量大管饱。另一种更高级,叫RLAIF,用一个模型去指导另一个模型的训练过程,相当于请了个私教手把手教。
评论区普遍认为,中国实验室搞的应该是第二种,因为效果更好。有篇论文还被翻出来了,伯克利的《模仿专有LLM的虚假承诺》发现,模仿虽然能快速拉近风格差距,但在能力上还是有很大鸿沟。不过立马有人打脸说,GLM 5.1在某些渗透测试任务上比它“蒸馏”的对象还强,蒸馏完了再微调,完全有可能反超。
但问题在于,这种“蒸馏”几乎是防不住的。有人悲观地表示:“你能做的只有拖慢他们的速度,别想完全挡住。”还有人预言,以后中国公司甚至不用自己建账号,直接搞个浏览器插件,在用户用Claude的时候悄悄把数据传回去就行。这招太狠了,根本没法防。
阿里到底是不是“幕后黑手”,网友意见分裂
Anthropic的信里点名阿里是主谋,但不少网友表示怀疑。有懂行的指出,这种账号池子和数据倒卖,通常是第三方中间商在搞,阿里可能只是“买家”之一。他们说,这些中间商把数据卖给各种实验室,阿里只是其中一个大客户。
不过也有人认为阿里脱不了干系。因为阿里的通义千问实验室本身就有动机和能力搞这种大规模蒸馏,而且Anthropic在信里说的是“与阿里和阿里通义实验室有关联的操作者”,措辞很谨慎,不是直接说阿里干的。
更有意思的是,有自称“半内部人士”的网友爆料说,中国实验室蒸馏Claude可能根本不用Anthropic官网,而是直接用亚马逊的Bedrock平台,因为官网限制太多,Bedrock反而好操作。如果这是真的,那Anthropic再怎么封账号也是白费力气,因为正规云平台的接口根本封不掉。
告状告到参议院,结果自家产品被禁了
这是整件事最讽刺的转折。网友发现,Anthropic在6月10日给参议院银行委员会写了举报信,痛陈阿里如何偷它的技术。结果两天后,美国商务部直接下了禁令,把Anthropic最新的Mythos和Fable模型给禁了,理由是担心被中国等国的军事用户利用。
网友们直接笑喷了:“Anthropic:我要告状!商务部:好的,把你家最厉害的武器没收了。”有人总结这叫“搬起石头砸了自己的脚”,还有人说是“求锤得锤”。本来想通过向政府表忠心,证明自己的技术很牛、很危险、需要保护,结果政府觉得太危险了,干脆连你一起封了。
但这背后也有更深层的解读。有网友分析,Anthropic可能是在下一盘大棋:通过把矛头对准中国,把“美国vs全世界”的叙事缩小成“美国vs中国”,这样就能争取到把Fable等模型卖给其他国家的许可。这招叫“卖惨换通行证”,先把自己包装成中国的受害者,再求政府网开一面。
网友们吵到最后,基本达成了一个共识:在AI这个赛道,谁也别装白莲花。Anthropic靠“借鉴”人类知识起家,现在又阻止别人“借鉴”它,这种既当运动员又当裁判的姿态,才是大家真正看不下去的。至于阿里的“蒸馏”到底算不算偷,那得看你坐在哪张桌子旁边了。