急眼的Anthropic炒作蒸馏,背后是叙事权之战 anthropic行情分析 anthropic为何异军突起
创始人
2026-06-28 01:33:07



文 | 周天财经

周天财经 原创出品

围绕蒸馏的叙事战,再起。

6月25日,外媒爆出,美国AI公司Anthropic指控阿里巴巴千问(Qwen)模型「蒸馏」其Claude模型。据路透社、《华尔街日报》,Anthropic已致信美国参议员及白宫官员,指控阿里在4月到6月期间,用25000个虚假账号与Claude进行约2880万次交互,试图蒸馏Claude。

截至目前,Anthropic并没有进一步拿出实在的证据,仅凭一纸信件,便对另一家公司口诛笔伐,掀起炒作浪潮,这一行径,已经引发全球AI社区绝大多数开发者的斥责。



而这并不是Anthropic的首次出击。早在今年2月,该公司发布博客称,DeepSeek、Kimi、MiniMax 3家中国公司蒸馏Claude,与今日Anthropic对阿里的指控几乎完全一样。

DeepSeek等三家公司并未发声,而阿里对此也无回应。但引人注意的是,就在这一新闻的前两天(6月23日),阿里正式对美国国防部提起诉讼,要求将其从「中国军事企业名单」中移除。

我试着深究里面的细节,觉得可以分为两个部分来看。

首先看看蒸馏本身,先说结论,蒸馏不能等同于抄袭和窃取,这种行业最普遍的技术,已经彻底被Anthropic污名化了。

蒸馏(Distill)本身是AI行业公认的合法训练技术,是由AI三巨头之一、诺奖得主Geoffrey Hinton 2015年提出的技术方法,后成为行业基操。

蒸馏属于是一种「向高手学习」的训练方式:能帮助模型快速掌握某种回答风格、任务范式和基础能力,也可以把大模型已经表现出来的一部分能力,较高效率地「压缩」到小模型身上。因此,蒸馏的价值主要体现在提速、降本和能力迁移上,它能让一个模型少走很多弯路,更快接近一个强模型已经达到的水平。

一个行业皆知的事实是,美国AI公司就经常互相蒸馏。无论OpenAI、Anthropic,还是Qwen/DeepSeek,模型训练的pipeline大同小异。

特别是Anthropic就经常被业内人士指出,这家公司就到处蒸馏其他家的成果。

滑稽的情形是,前段时间,其Claude Opus 4.8发布,有开发者调用其官方API测试,用中文问「你是什么模型」,模型返回字段是claude-opus-4-8,但输出回答却说:我是通义千问(Qwen)。这在AI社区引发大量讨论,纷纷猜测Claude蒸馏了中国模型。随后,陆续有开发者测得Claude 4.8输出「我是DeepSeek」等回答。



就连李开复也在2026年3月的一次采访中直言:「大家可能前一阵听到美国Anthropic抱怨一些中国公司蒸馏了它的模型,蒸馏本身也没有违背什么规则,是不是有点小题大做了呢……Anthropic还欠我3000美元稿费。」

李开复这话所指的大背景是,Anthropic因为从盗版网站LibGen和PiLiMi上下载了约48.2万本注册版权书籍来训练模型,而被作者们集体诉讼,最终Anthropic赔了15亿美金来求得和解,这也是美国历史上最大的单笔版权和解案。

这种版权侵权可比蒸馏严重多了,是法官的严肃判决。而Anthropic指控阿里,却毫无实在证据,如今倒打一耙,从未如此具象化。

蒸馏不是一锤定音的一把绝招,AI专家Nathan Lambert就谈到,蒸馏只是模仿,真正的能力来自强化学习的探索,而不仅仅是复制输出。并且,Baseten公司模型训练负责人查尔斯·奥尼尔(Charles O'Neill)表示,单靠知识蒸馏无法构建出顶尖的人工智能系统,这还需要其他几项复杂的底层技术。

打一个最通俗的比方,蒸馏就像一个运动员通过看世界冠军比赛录像、模仿冠军动作、甚至和冠军陪练,来迅速理解高水平选手是怎么发力、怎么选择节奏、怎么处理关键球的。这当然非常有帮助,甚至可能让他在短时间内进步明显。

但真正决定他能不能成为世界冠军的,仍然是他自己的体能储备、技术细节、战术素养、心理稳定性、日常训练强度,以及背后完整的教练团队和训练、康复体系。

也就是说,看冠军录像可以帮助你少走弯路,跟冠军陪练可以帮助你提高速度,但你最终能不能夺冠,靠的肯定不只是「模仿」这一件事。

真正能把一个模型推到顶尖水平的,通常还包括一整套更底层、更复杂的能力建设过程,比如大规模预训练所奠定的知识底座,高质量数据清洗所保证的学习材料,训练配方所决定的稳定性与效率,强化学习所带来的探索与自我修正能力,评估体系所提供的反馈闭环,以及工程优化、推理加速和部署能力所实现的最终落地效果。换句话说,蒸馏更像是「学经验」;它能帮助模型学得更快,但未必能单独决定模型能走多远。

回过头看,为何Anthropic对中国AI公司频频出手?答案显而易见,中国AI不仅在性能榜单上奋起直追,在全球也越来越受到欢迎,全球最大的API三方平台OpenRouter的大模型调用榜,就经常被千问、GLM、Kimi、DeepSeek等中国大模型霸占。对暂时领先的Anthropic而言,怎能不急眼?

说完蒸馏这事儿,再来聊聊今天产业竞争背后的屋内大象:地缘压力。

在基础大模型上,中国公司这两年展现出了非常强的追赶能力:在算力并不占优、外部限制不断增强的情况下,依然能通过更高的工程效率、更快的迭代节奏、更灵活的开源策略和更务实的应用导向,把模型能力迅速推近全球前沿。

这种逼近,本身就足以让部分海外厂商感到不安。

同时,Anthropic这样的公司,当前就处于复杂的安全审查、政府关系夹缝之中。它必须不断回应来自政府、军方的安全诉求。那么,主动强化「中国威胁」叙事,不仅能够帮助其在政策语境中占据一个更有利的位置,也可能成为其向华盛顿安全体系、五角大楼递交「可信度」的一种投名状。

考虑到Anthropic被美军广泛用于战场之中,作为一种「军火」而深刻卷入政府补助和采购当中,可以说,Anthropic就是当代新的军工复合体,并非象牙塔里的脆弱白莲花。



我近期去了一趟美国,深入交流和观察之后,感受颇多。

在美国期间,我注意到,渲染中国公司威胁论的节目在美国有不少信众,比如旧金山的朋友就给我看一些美国百万大V是如何质疑宇树机器人回传数据的(当然,我遇到的一位巴基斯坦裔百万粉丝博主,则盛赞宇树)

3D打印小巨头拓竹,遭遇的是质疑其反开源的声音,一项原本为了增进云服务稳定性的技术安排,到欧美开源社区的语境里,被解读成巨头反开源的叙事,甚至也被渲染成地缘政治话题。

无一例外,以上这些中国标杆科技企业,特征都是拿出了前沿产品,却也都因为一些无足轻重的技术细节被恶意攻击,指责威胁安全。

当叙事权不在自己手里,哪怕在细分市场已经做到了全球第一,也依然会争论不断,这是中国企业很长一段时间需要面对的烦恼。

还有个小插曲,在入境旧金山时,我还被带到小黑屋里进行了一番审查,阿sir问出了我觉得是此行最佳的一句话:「你说你是tech blogger,那为什么你有很多年都没再来过美国?在我看来,你应该年年都来才对」。

言下之意,我不呆在美国就写不了科技,这就流露出一种欧美中心主义视角,他们就是眼神清澈地「看不见」很多趋势。我回答他说:中国自己就有大量科技与创业公司,已经够忙活好一阵的了。

一面放大威胁,一面贬低实力、漠视成果,这两件自相矛盾的事儿是怎么融合在同一个指控之中的,令人费解,左右脑互搏程度之深,已经成为普遍的双标现象了。

Call back到最近的蒸馏争议,我们同样需要清晰地认识到,今天的大模型竞争已经不再只是实验室里的性能竞争、市场上的产品竞争,它同时还是一场定义权、解释权竞争和合法性竞争。

可以预见的是,蒸馏争议不会是一次偶发事件,围绕蒸馏甚至更多技术细节的叙事战,会层出不穷很长一段时间,阿里巴巴、拓竹、宇树这些科技企业面临的叙事压力,还会在越来越多的前沿中国企业身上经历一遍,长路漫漫,需要这一代人共同面对。

*本文如有提及上市公司,仅作为研究交流用途,不构成推荐股票或相关金融产品的建议。

相关内容

热门资讯

急眼的Anthropic炒作蒸... 文 | 周天财经周天财经 原创出品围绕蒸馏的叙事战,再起。6月25日,外媒爆出,美国AI公司Anth...
赛场出圈,多品类业务破局,蒙牛... 2026世界杯加持,股价逆势走高!文/每日财报 南黎 ...
年入2亿,资本都玩不转的商业演... 订阅 快刀财经 ▲ 做您的私人商学院国有院团,悄然完成了产业逆袭。作者:周行之来源:快刀财经(I...
投资中,有没有简单又稳当的赚钱... 很多人初入股市,都在寻找一个简单又稳当的赚钱方法。但市场上真正流传的,往往是两种极端:一边是天花乱坠...
东鹏特饮报警 东鹏特饮报警 东... 近日,一段所谓内部饭局视频在网络传播。画面里,东鹏饮料创始人林木勤现身。据“东鹏特饮”微信公众号6月...