急眼的Anthropic炒作蒸馏，背后是叙事权之战 anthropic行情分析 anthropic为何异军突起_股票证券

急眼的Anthropic炒作蒸馏，背后是叙事权之战 anthropic行情分析 anthropic为何异军突起

创始人

2026-06-28 01:33:07

文 | 周天财经

周天财经原创出品

围绕蒸馏的叙事战，再起。

6月25日，外媒爆出，美国AI公司Anthropic指控阿里巴巴千问（Qwen）模型「蒸馏」其Claude模型。据路透社、《华尔街日报》，Anthropic已致信美国参议员及白宫官员，指控阿里在4月到6月期间，用25000个虚假账号与Claude进行约2880万次交互，试图蒸馏Claude。

截至目前，Anthropic并没有进一步拿出实在的证据，仅凭一纸信件，便对另一家公司口诛笔伐，掀起炒作浪潮，这一行径，已经引发全球AI社区绝大多数开发者的斥责。

而这并不是Anthropic的首次出击。早在今年2月，该公司发布博客称，DeepSeek、Kimi、MiniMax 3家中国公司蒸馏Claude，与今日Anthropic对阿里的指控几乎完全一样。

DeepSeek等三家公司并未发声，而阿里对此也无回应。但引人注意的是，就在这一新闻的前两天（6月23日），阿里正式对美国国防部提起诉讼，要求将其从「中国军事企业名单」中移除。

我试着深究里面的细节，觉得可以分为两个部分来看。

首先看看蒸馏本身，先说结论，蒸馏不能等同于抄袭和窃取，这种行业最普遍的技术，已经彻底被Anthropic污名化了。

蒸馏（Distill）本身是AI行业公认的合法训练技术，是由AI三巨头之一、诺奖得主Geoffrey Hinton 2015年提出的技术方法，后成为行业基操。

蒸馏属于是一种「向高手学习」的训练方式：能帮助模型快速掌握某种回答风格、任务范式和基础能力，也可以把大模型已经表现出来的一部分能力，较高效率地「压缩」到小模型身上。因此，蒸馏的价值主要体现在提速、降本和能力迁移上，它能让一个模型少走很多弯路，更快接近一个强模型已经达到的水平。

一个行业皆知的事实是，美国AI公司就经常互相蒸馏。无论OpenAI、Anthropic，还是Qwen/DeepSeek，模型训练的pipeline大同小异。

特别是Anthropic就经常被业内人士指出，这家公司就到处蒸馏其他家的成果。

滑稽的情形是，前段时间，其Claude Opus 4.8发布，有开发者调用其官方API测试，用中文问「你是什么模型」，模型返回字段是claude-opus-4-8，但输出回答却说：我是通义千问（Qwen）。这在AI社区引发大量讨论，纷纷猜测Claude蒸馏了中国模型。随后，陆续有开发者测得Claude 4.8输出「我是DeepSeek」等回答。

就连李开复也在2026年3月的一次采访中直言：「大家可能前一阵听到美国Anthropic抱怨一些中国公司蒸馏了它的模型，蒸馏本身也没有违背什么规则，是不是有点小题大做了呢……Anthropic还欠我3000美元稿费。」

李开复这话所指的大背景是，Anthropic因为从盗版网站LibGen和PiLiMi上下载了约48.2万本注册版权书籍来训练模型，而被作者们集体诉讼，最终Anthropic赔了15亿美金来求得和解，这也是美国历史上最大的单笔版权和解案。

这种版权侵权可比蒸馏严重多了，是法官的严肃判决。而Anthropic指控阿里，却毫无实在证据，如今倒打一耙，从未如此具象化。

蒸馏不是一锤定音的一把绝招，AI专家Nathan Lambert就谈到，蒸馏只是模仿，真正的能力来自强化学习的探索，而不仅仅是复制输出。并且，Baseten公司模型训练负责人查尔斯·奥尼尔（Charles O'Neill）表示，单靠知识蒸馏无法构建出顶尖的人工智能系统，这还需要其他几项复杂的底层技术。

打一个最通俗的比方，蒸馏就像一个运动员通过看世界冠军比赛录像、模仿冠军动作、甚至和冠军陪练，来迅速理解高水平选手是怎么发力、怎么选择节奏、怎么处理关键球的。这当然非常有帮助，甚至可能让他在短时间内进步明显。

但真正决定他能不能成为世界冠军的，仍然是他自己的体能储备、技术细节、战术素养、心理稳定性、日常训练强度，以及背后完整的教练团队和训练、康复体系。

也就是说，看冠军录像可以帮助你少走弯路，跟冠军陪练可以帮助你提高速度，但你最终能不能夺冠，靠的肯定不只是「模仿」这一件事。

真正能把一个模型推到顶尖水平的，通常还包括一整套更底层、更复杂的能力建设过程，比如大规模预训练所奠定的知识底座，高质量数据清洗所保证的学习材料，训练配方所决定的稳定性与效率，强化学习所带来的探索与自我修正能力，评估体系所提供的反馈闭环，以及工程优化、推理加速和部署能力所实现的最终落地效果。换句话说，蒸馏更像是「学经验」；它能帮助模型学得更快，但未必能单独决定模型能走多远。

回过头看，为何Anthropic对中国AI公司频频出手？答案显而易见，中国AI不仅在性能榜单上奋起直追，在全球也越来越受到欢迎，全球最大的API三方平台OpenRouter的大模型调用榜，就经常被千问、GLM、Kimi、DeepSeek等中国大模型霸占。对暂时领先的Anthropic而言，怎能不急眼？

说完蒸馏这事儿，再来聊聊今天产业竞争背后的屋内大象：地缘压力。

在基础大模型上，中国公司这两年展现出了非常强的追赶能力：在算力并不占优、外部限制不断增强的情况下，依然能通过更高的工程效率、更快的迭代节奏、更灵活的开源策略和更务实的应用导向，把模型能力迅速推近全球前沿。

这种逼近，本身就足以让部分海外厂商感到不安。

同时，Anthropic这样的公司，当前就处于复杂的安全审查、政府关系夹缝之中。它必须不断回应来自政府、军方的安全诉求。那么，主动强化「中国威胁」叙事，不仅能够帮助其在政策语境中占据一个更有利的位置，也可能成为其向华盛顿安全体系、五角大楼递交「可信度」的一种投名状。

考虑到Anthropic被美军广泛用于战场之中，作为一种「军火」而深刻卷入政府补助和采购当中，可以说，Anthropic就是当代新的军工复合体，并非象牙塔里的脆弱白莲花。

我近期去了一趟美国，深入交流和观察之后，感受颇多。

在美国期间，我注意到，渲染中国公司威胁论的节目在美国有不少信众，比如旧金山的朋友就给我看一些美国百万大V是如何质疑宇树机器人回传数据的（当然，我遇到的一位巴基斯坦裔百万粉丝博主，则盛赞宇树）

3D打印小巨头拓竹，遭遇的是质疑其反开源的声音，一项原本为了增进云服务稳定性的技术安排，到欧美开源社区的语境里，被解读成巨头反开源的叙事，甚至也被渲染成地缘政治话题。

无一例外，以上这些中国标杆科技企业，特征都是拿出了前沿产品，却也都因为一些无足轻重的技术细节被恶意攻击，指责威胁安全。

当叙事权不在自己手里，哪怕在细分市场已经做到了全球第一，也依然会争论不断，这是中国企业很长一段时间需要面对的烦恼。

还有个小插曲，在入境旧金山时，我还被带到小黑屋里进行了一番审查，阿sir问出了我觉得是此行最佳的一句话：「你说你是tech blogger，那为什么你有很多年都没再来过美国？在我看来，你应该年年都来才对」。

言下之意，我不呆在美国就写不了科技，这就流露出一种欧美中心主义视角，他们就是眼神清澈地「看不见」很多趋势。我回答他说：中国自己就有大量科技与创业公司，已经够忙活好一阵的了。

一面放大威胁，一面贬低实力、漠视成果，这两件自相矛盾的事儿是怎么融合在同一个指控之中的，令人费解，左右脑互搏程度之深，已经成为普遍的双标现象了。

Call back到最近的蒸馏争议，我们同样需要清晰地认识到，今天的大模型竞争已经不再只是实验室里的性能竞争、市场上的产品竞争，它同时还是一场定义权、解释权竞争和合法性竞争。

可以预见的是，蒸馏争议不会是一次偶发事件，围绕蒸馏甚至更多技术细节的叙事战，会层出不穷很长一段时间，阿里巴巴、拓竹、宇树这些科技企业面临的叙事压力，还会在越来越多的前沿中国企业身上经历一遍，长路漫漫，需要这一代人共同面对。

*本文如有提及上市公司，仅作为研究交流用途，不构成推荐股票或相关金融产品的建议。

上一篇：赛场出圈，多品类业务破局，蒙牛凭硬核实力走出港股消费独立行情赛场出圈，多品类业务破局，蒙牛凭硬核实力走出港股消费独立行情

下一篇：没有了

急眼的Anthropic炒作蒸馏，背后是叙事权之战 anthropic行情分析 anthropic为何异军突起

相关内容

热门资讯