Anthropic指控阿里巴巴发动Claude模型大规模蒸馏攻击

2026-06-25 1 5K banq

Anthropic指控阿里巴巴通过近2.5万个虚假账户，在六周内发动了超2880万次交互的“模型蒸馏攻击”，以窃取其Claude模型的核心能力。这出AI界的“猫鼠游戏”背后，既有技术博弈，也有知识产权争议，还有大国科技竞争的影子，充满了魔幻现实主义的味道。

事情是咋回事：有人被薅了2880万次羊毛

各位好，今天聊一个科技圈的大瓜，发生在美国AI公司Anthropic和中国电商巨头阿里巴巴之间。故事简单来说就是，Anthropic跳着脚说：“阿里你薅我羊毛！往死里薅那种！”而且薅得特别狠，据说一个多月薅了2880万次。

Anthropic，就是那个做出Claude大模型的公司，最近给美国参议院的一堆大佬写了封信，指名道姓说阿里巴巴搞事情。他们声称，从2026年4月22日到6月5日，阿里那边的人搞了差不多2.5万个假账号，疯狂调用Claude的API接口，进行了超过2880万次对话交互。

这28.8 million次交互的目的，不是让Claude帮忙写诗或者编段子，而是为了“偷师学艺”。Anthropic说，这是他们公司历史上遭遇过的“最大规模攻击”。阿里那边呢？目前还没吭声，可能还在想怎么回应这突如其来的“感谢信”吧。

说实话，这数字确实吓人，将近两万五千个假账号，平均每个账号要搞一千多次对话，想想那个画面，简直就是一群数字世界的“采花大盗”，夜以继日地围着Claude这朵“鲜花”转，把花蜜（也就是模型的能力）吸得一干二净，场面相当壮观。

啥是“蒸馏”：把大象装进冰箱，顺便把冰箱也学会

Anthropic在信里反复强调一个词——“蒸馏”（Distillation），搞得这词听起来像个很高级的黑魔法。其实它在AI圈是个非常普遍的技术活儿，咱用大白话讲，就是一种“知识搬家”或者“学霸带学渣”的游戏。

想象一下，有个超级学霸（大模型），他上知天文下知地理，但脑子特别大，走哪都得带个超级计算机，普通人根本用不起。这时候，有个聪明的学渣（小模型）说，我不需要学那么全，我就模仿学霸的解题思路和答题风格就行。学霸做了一道题，不仅给答案，还把思考过程、哪里可能是陷阱、哪种解法最优雅都写出来（这就是“软标签”）。学渣不看课本，天天看学霸的解题笔记，最后也能考个八九十分，但自己脑子小、跑得快、成本低。

Anthropic指控阿里干的就是这事儿：把Claude当成那个无所不能的“学霸”，然后用海量的对话去套它的话，把这些高质量的“学霸笔记”（输出结果）收集起来，去训练阿里自己的“通义千问”之类的“学渣”模型。这样就能以极低的成本，快速提升自家模型的能力，特别是软件工程和代理推理能力，这恰恰是Claude最有商业价值的部分。

而且，这招“蒸馏”在业内其实是公开的秘密。几乎所有AI实验室都会蒸馏自己的大模型，弄出个小号、便宜点的版本卖给客户。只不过呢，用别人的模型输出来训练自己的模型，这事儿有点像直接用别人的答案来写作业，虽然效果拔群，但终归是踩在了规则的红线上。

反击的子弹：一边骂街，一边自己也这么干过

最有意思的地方来了。Anthropic这边义正词严地控诉阿里“偷东西”，那边厢，它自己的屁股也不干净。这就好比一个曾经偷过东西的人，现在抓到别人偷东西，气急败坏地报警，场面确实有点黑色幽默。

还记得去年Anthropic那场轰动一时的版权官司吗？它被美国作家和音乐出版商们告了，索赔金额高得离谱。原因是啥？因为Anthropic在训练Claude的时候，从一些盗版书网站下载了超过700万本书，还搞了两万多首版权歌曲，联邦法官都认定这行为“本质上、不可挽回地构成侵权”。

这剧情是不是很熟悉？你训练我的时候，用的是从全人类那儿“借”来的知识，这里面有多少是合法授权的咱都不提了。现在我变强了，别人想用我的输出去训练，你就说这是“非法提取”、“大规模攻击”了？就连马斯克都忍不住在X上转发嘲讽：“他们竟敢‘偷窃’Anthropic从人类程序员那里偷走的东西？”

这波啊，这波叫“回旋镖”打到了自己脸上。一方面用海量数据喂出了自己的大模型，这其中不乏争议性的使用方式；另一方面又极力阻止别人用同样的逻辑来利用自己的产出。这种“只许州官放火，不许百姓点灯”的双标现场，实在是让人忍俊不禁。

环环相扣：从DeepSeek到“榜一大哥”的戏码

其实，阿里并不是第一个被Anthropic点名批评的“蒸馏惯犯”。早在今年2月，Anthropic就已经发过一篇长文，点名了中国另外三家AI公司：DeepSeek、月之暗面和MiniMax。当时说DeepSeek搞了15万次交互，月之暗面340万次，MiniMax更是高达1300万次。现在回头再看阿里这个“2880万次”，妥妥的新晋“榜一大哥”。

更有趣的是，美国商务部对这事儿反应神速。在Anthropic发信两天后，就直接把Anthropic最新的两个模型给禁了，理由是“怕被中国等国家的军事用户利用”。本来是想告状，结果自家最先进的武器被没收了，这找谁说理去？

这一连串事件，简直就是一场精心编排的大戏。Anthropic通过不断“揭发”中国公司，成功地把自己塑造成了一个“受害者”和“抗中先锋”的形象，试图向美国政府证明：看，我的技术太牛了，他们都在偷，你们得保护我啊！结果美国政府反手就是一个禁令，直接把它的“最强武器”给封存了，理由是这东西太危险，不能让坏人（包括被偷的你自己？）拿到。这可真是“搬起石头砸了自己的脚”，或者说，是“求锤得锤”。

总结

整件事看下来，就是一场关于AI技术、知识产权和大国博弈的混战。Anthropic指控阿里“蒸馏”这事儿，技术上可能是真的，因为这确实是快速追赶的捷径。但道德上，Anthropic的立场又非常尴尬，毕竟自家训练数据的“原罪”也没洗干净。而美国政府的介入，则让这场商业纠纷彻底变成了一场政治角力。只能说，在AI这个赛道上，大家都是摸着石头过河，谁的底裤都不太干净，就看谁先被揪出来游街示众了。

原文期刊
Reuters

发表日期
2026年6月25日

原文标题
Anthropic says Alibaba illicitly extracted Claude AI model capabilities

作者单位背景
Karen Freifeld (路边社记者)

Hacker News网友吵翻了天。

焦点不在技术本身，而在于AI公司拿别人数据训练时理直气壮，别人拿它的输出训练时就喊“小偷”，这双标场面实在过于好笑。从商业套利到地缘政治，讨论炸出了各种神评论。

这波操作像极了当年的乔布斯和盖茨

有网友翻出了一段硅谷经典老黄历，说这事特别像当年图形界面的恩怨。乔布斯跑去施乐PARC偷师，回来搞了Macintosh，后来比尔盖茨又搞了Windows，乔布斯气得跳脚骂街。盖茨回了一句：“咱俩都认识个叫施乐的土豪邻居，我翻墙进去偷电视，发现你已经把电视搬走了。”

这个类比一出来，评论区就炸了。大家纷纷表示，Anthropic现在扮演的就是当年乔布斯的角色，靠着“借鉴”全人类的知识（包括大量有版权争议的数据）喂大了Claude，现在别人想用它的输出来训练，它就急得直跺脚。有网友直接配了句台词：“你在绑架我已经合法偷来的东西！”

更损的是，有人翻出Anthropic去年因为用盗版书和歌曲训练，被作家和音乐人告上法庭，赔了15亿美元的事。这剧情简直完美闭环：你偷我的时候说这是“合理使用”，我偷你的时候你说是“非法提取”。这双标现场，让吃瓜群众看得津津有味。

七到九三折的“骨折价”到底怎么来的

一个高赞回复详细解释了这场“薅羊毛”的产业链。原来在中国，因为Claude和ChatGPT都被墙了，普通人想用就得翻墙，而且Anthropic还不收中国银行卡。这就催生了一个庞大的灰产——账号中间商。

这些中间商怎么赚钱呢？他们搞了几万个Claude订阅账号，把用户请求在各个账号之间轮流转，哪个账号没达到使用限额就用哪个。这套操作下来，他们能以官方API价格的7%到30%低价甩卖token。有网友举例说，某个叫yunwu.ai的网站，Opus 4.8直接打骨折，比官方价便宜93%。

而且这帮人不光卖token，还“一鱼两吃”。他们把用户的对话记录和推理链条收集起来，打包卖给想“蒸馏”Claude能力的中国AI实验室。这样一来，卖token已经亏不了多少钱，卖数据还能再赚一笔，甚至还能低于成本运营。有人把这套玩法总结成一句话：“先亏本卖会员，再卖你的聊天记录，最后用你的聊天记录训练自己的模型——一石三鸟。”

蒸馏不是你想蒸，想蒸就能蒸

有网友认真科普了“蒸馏”的两种玩法。一种是“傻大黑粗式”，疯狂问问题，把答案存下来当训练数据，主打一个量大管饱。另一种更高级，叫RLAIF，用一个模型去指导另一个模型的训练过程，相当于请了个私教手把手教。

评论区普遍认为，中国实验室搞的应该是第二种，因为效果更好。有篇论文还被翻出来了，伯克利的《模仿专有LLM的虚假承诺》发现，模仿虽然能快速拉近风格差距，但在能力上还是有很大鸿沟。不过立马有人打脸说，GLM 5.1在某些渗透测试任务上比它“蒸馏”的对象还强，蒸馏完了再微调，完全有可能反超。

但问题在于，这种“蒸馏”几乎是防不住的。有人悲观地表示：“你能做的只有拖慢他们的速度，别想完全挡住。”还有人预言，以后中国公司甚至不用自己建账号，直接搞个浏览器插件，在用户用Claude的时候悄悄把数据传回去就行。这招太狠了，根本没法防。

阿里到底是不是“幕后黑手”，网友意见分裂

Anthropic的信里点名阿里是主谋，但不少网友表示怀疑。有懂行的指出，这种账号池子和数据倒卖，通常是第三方中间商在搞，阿里可能只是“买家”之一。他们说，这些中间商把数据卖给各种实验室，阿里只是其中一个大客户。

不过也有人认为阿里脱不了干系。因为阿里的通义千问实验室本身就有动机和能力搞这种大规模蒸馏，而且Anthropic在信里说的是“与阿里和阿里通义实验室有关联的操作者”，措辞很谨慎，不是直接说阿里干的。

更有意思的是，有自称“半内部人士”的网友爆料说，中国实验室蒸馏Claude可能根本不用Anthropic官网，而是直接用亚马逊的Bedrock平台，因为官网限制太多，Bedrock反而好操作。如果这是真的，那Anthropic再怎么封账号也是白费力气，因为正规云平台的接口根本封不掉。

告状告到参议院，结果自家产品被禁了

这是整件事最讽刺的转折。网友发现，Anthropic在6月10日给参议院银行委员会写了举报信，痛陈阿里如何偷它的技术。结果两天后，美国商务部直接下了禁令，把Anthropic最新的Mythos和Fable模型给禁了，理由是担心被中国等国的军事用户利用。

网友们直接笑喷了：“Anthropic：我要告状！商务部：好的，把你家最厉害的武器没收了。”有人总结这叫“搬起石头砸了自己的脚”，还有人说是“求锤得锤”。本来想通过向政府表忠心，证明自己的技术很牛、很危险、需要保护，结果政府觉得太危险了，干脆连你一起封了。

但这背后也有更深层的解读。有网友分析，Anthropic可能是在下一盘大棋：通过把矛头对准中国，把“美国vs全世界”的叙事缩小成“美国vs中国”，这样就能争取到把Fable等模型卖给其他国家的许可。这招叫“卖惨换通行证”，先把自己包装成中国的受害者，再求政府网开一面。

网友们吵到最后，基本达成了一个共识：在AI这个赛道，谁也别装白莲花。Anthropic靠“借鉴”人类知识起家，现在又阻止别人“借鉴”它，这种既当运动员又当裁判的姿态，才是大家真正看不下去的。至于阿里的“蒸馏”到底算不算偷，那得看你坐在哪张桌子旁边了。