蒸馏攻击大模型之争：到底谁偷了谁的代码和技术秘密

2026-06-30 2K banq

美国AI公司急了！怒斥中国偷技术，结果自家模型竟说中文？

蒸馏攻击这出大戏，到底谁在抄谁的作业？

最近AI圈又吵翻天了，大概剧情就是美国那边的大模型公司，比如Anthropic，叉着腰指责中国公司搞“蒸馏攻击”，偷他们Claude模型的脑子。结果这话一出，推特上直接炸了锅，网友们纷纷化身福尔摩斯，最后发现事情好像没那么简单。中国的大模型不光能打，而且成本低得吓人，这下美国那边是彻底坐不住了。这事儿说白了，就是一场关于技术、生意和面子的混战，咱们今天就拿初二听相声的心态，把这出大戏从头到尾捋一遍。

美国公司指着鼻子骂小偷

美国那边喊得最大声的就是Anthropic，他们写了一大篇报告，痛心疾首地说中国AI labs用他们的模型当老师，搞“师生蒸馏”（teacher-student SFT），生成预训练数据，在强化学习里当中介奖励打分器（grading intermediate reward in RL），反正就是从头到尾把他们的技术扒了个干净。他们那个架势，就像自己家种的大白菜被邻居连夜偷了个精光，气得直跺脚，说这是恶意攻击，是破坏市场秩序。

更有意思的是，他们说Alibaba搞了两万五千个假账号，进行了两千八百多万次交互，就为了从Claude身上榨取智慧。这数字听着就吓人，感觉像是有组织有预谋的“技术抢劫”。他们甚至还管这个叫“Project Panama”，据说还牵扯到扫描几百万本书的破事儿，听着就很有画面感，感觉像在看谍战片。

网友当场抓包，发现贼喊捉贼

但推特上的网友们哪是那么好糊弄的，大家立刻开始翻旧账。有人直接甩出一个截图，说有时候你去问Claude“你是谁”，这大哥居然会回答“我是Qwen”或者“我是DeepSeek”。这场景就好比你抓住邻居偷你家电视，结果发现你家电视的牌子和邻居家的一模一样。这下吃瓜群众全乐了，按照这个逻辑，到底谁蒸馏谁，还真不好说。

还有更损的网友说，中国模型是开源（open weights）的，API调用便宜得跟白送一样。美国公司反手抄一下中国模型的作业，逻辑上完全说得通，成本低效果快，傻子才不干。大家普遍觉得，美国公司之所以这么急，是因为他们发现自己的商业模式快玩不下去了。中国那边的模型又便宜又好用，你这边还一个月收几百美金会员费，谁买谁是大冤种。说白了，这不是什么知识产权保卫战，这就是一场商业护城河保卫战。

蒸馏到底是高科技还是小把戏

其实“蒸馏”这词听起来高大上，在AI圈就是个常规操作。简单说就是让一个很厉害的大模型当老师，教一个小模型怎么回答问题。这招不光中国公司用，美国公司自己也用得飞起。有网友翻出Anthropic自己的论文，发现他们也用GPT模型做过蒸馏实验。这就很尴尬了，等于你一边自己偷偷用别人的技术，一边指着别人鼻子骂街。

技术大神们在推特上吵得更细，说真正的蒸馏攻击得有个专门的技术接口，一般API根本不给开。所以你说Alibaba怎么做到精准偷师的，技术细节压根没人说得清。很多人觉得美国公司这就是故意制造恐慌，好让政府赶紧出台政策，把市场门槛加高，这样他们就能继续躺赚了。这套路，跟以前某些行业说自己技术太危险，必须由他们垄断是一个剧本。

中文对话里的身份混乱

这场闹剧里最搞笑的部分，就是大模型的身份认同危机。好多网友实测发现，如果不用系统指令，直接用中文跟美国模型聊天，它经常会“人格分裂”，脱口而出自己是中国的某个模型。这在美国那边就成了实锤证据，证明中国模型的数据已经潜移默化地渗透到他们脑子里了。但反过来想，也有网友发现中国模型有时候也会说自己是Claude。

这下彻底乱套了，感觉所有大模型都像得了失忆症，搞不清自己到底是谁生的。这其实暴露了AI训练的一个本质问题：大家的训练数据本来就是你中有我，我中有你。整个互联网就这一锅乱炖，谁也别装纯洁。你非要说你家的AI脑回路完全没受过别人影响，那基本是在说瞎话。

这场骂战真正的生意经

所以冷静下来看，这场“蒸馏攻击”的闹剧，压根就不是什么技术正义之战，而是赤裸裸的商业博弈。美国公司估值高得离谱，但商业模式被中国廉价模型冲击得摇摇欲坠，他们害怕了。指责中国，是最简单、最能调动情绪的公关手段。

推特上有个评论特别损，说这四步走简直是教科书级别的：第一步，宣称我的模型极度危险恐怖；第二步，故意把模型放出来欢迎别人蒸馏；第三步，扭头告诉政府中国偷了我的超级危险技术；第四步，赶紧给我政策保护，让我垄断市场。这套组合拳打下来，吃瓜群众看得目瞪口呆。大家心知肚明，AI这盘棋，最终拼的是算力和成本，不是谁嗓门大。

嘴上说着别人偷东西，结果转头发现在中文对话里，自家模型先报出了对方的名字。这场文字闹剧里，谁才是那个真正需要抄袭的人？