文 | 阑夕
火山引擎每年都举办的FORCE原动力大会,今年可能是声量最高的一集。
截至6月,豆包大模型日均Token调用量已经达到了180万亿,哪怕跟AI行业集中爆发的2025年比起来,也有超过10倍的增长,丝毫未见放缓迹象。
那个盼了多年的行业拐点,终于近在咫尺了。
10x的指数级增速,对应的必然是Token消耗规模的空前爆发,这已经是不被怀疑的事实,Anthropic也证明了,以Token计价的商业模式,可以纯靠卖模型,卖成全球最赚钱的公司之一。
这是外部形势的归因,但如果只有外部形势,可能还得不出「小赢不算赢」的结论。
而内部发展的作用,则更加显眼。
IDC每半年都会发布一次中国MaaS市场的统计报告,从2024年开始,火山引擎的调用量就占到了接近半壁江山,排名稳在第一。
这不是重点,重点在于,随着各家大厂反应过来并相继入局,MaaS赛道的拥挤必然分摊火山引擎的独大优势,这是最基础的数学规律。
但情况恰好相反,在IDC发布的2025年全年报告里,火山引擎在中国MaaS市场的调用量竟然还在涨,从2024年的46.4%,攀升到了49.5%⋯⋯
要知道,这个49.5%还建立在两个不利条件之上:
第一,统计口径只限于云厂商对外部客户提供的公有云服务,并不包括自有业务,也就是字节系产品的Token消耗,不算在内,换句话说,豆包遥遥领先的用户规模,甚至被剔出去了;
第二,统计时限截止于2025年,我们都知道,改写视频大模型历史进程的Seedance 2.0,是在今年年初才发布的,这个消耗大户,也没有机会体现在IDC的报告里。
这就很让人感到窒息了。
叠加多重因素,火山引擎的这届大会,才显得格外吸引瞩目,不只是客户要来商谈业务、同行要来打探「敌情」,整个AI行业的参与者,也都不愿错过字节旗下模型矩阵的「上新日」:
Coding和Agent能力都有长足进步的Seed 2.1,首次实现4K分辨率的Seedance 2.0,即将发布的新一代顶级视频模型Seedance 2.5,值得期待的图片模型Seedream 5.0 Pro,支持多模态生成的音频模型SeedAudio 1.0⋯⋯
硅基滚烫,群模闪耀。
我想说的是,字节把最重要的旗舰模型版本都放在了火山引擎的活动上发布,这意味着以MaaS平台为「Token经济」的贸易港,成了一种共识。
「Token经济」这个概念并不新鲜,AI公司——尤其是最近一年以来——特别热衷于谈论它,虽然解释起来未必能为己用,但确实可以服务于「在电梯里做俯卧撑」的叙事,上升即繁荣。
不过「Token经济」之于云厂商,就更接近于底层的商业逻辑了,Token的意义,本质上是一套全新的计费单位,站在历史的周期来看,它一点儿都不陌生。
工业时代的Token,是「千瓦时」,高速传输的电力,为大规模生产行为赋予了高度的确定性,整个现代文明,都依赖用电量这个资源消耗的尺度,富足的城市,一定灯火通明。
数字时代的Token,是「字节」,从桌面带宽到移动流量,所有的信息交换,都被度量为KB、MB、GB等字节单位,由此滋生了覆盖全球的光纤和卫星,以及连接数十亿人口的通信运营商。
那么可以预见的AI时代,Token又将撑起怎样的经济体系?
还是拿火山引擎的明星商品Seedance 2.0模型为例,短短半年不到的时间,AI视频就从昂贵的玩具,变成能接入广告、电商、影视这些行业生产流程的必备工具,甚至在具身智能这样的前沿产业也有所应用。
在此之前,视频生成更像是带有猎奇属性的社交话题,新鲜是新鲜,但一致可控、镜头语言这些都无从谈起,更遑论有什么二次加工的价值了。
到了Seedance 2.5,视频模型再次往前精进了一步,单段视频最长30秒、全模态素材联合输入、局部编辑能力,这些都让AI视频更像可以被灵活调度的生产线,而非一台只会抽卡的机器。
这意味着视频生产里,过去最昂贵也最不稳定的部分——试错、改版、适配、复用——都压缩到了模型调用里面。
发现了吗,这个画面,就很像十九世纪末期的电气化,各个工厂、车间、矿山全都优先配套电力能源,哪里能够稳定供电,哪里就能成为新的工业中心。
是的,相比起来,内容创作只是一个初级应用场景,但它提供了一个管中窥豹的视角,让关注远方的人,看到Token经济化的可能性。
比如那些需要大规模使用Seedance 2.0投入生产的公司,市面上的消费级AI应用无法满足需求,火山引擎就是唯一的采购渠道,所谓一秒钟多少钱的成本体感,其实就是用Token来计价。
这么说吧,「Token经济」已经不是一种设想了,它是正在发生的事实。
在前天的大会上,火山引擎还披露了几个关键数据,大多数人会被日均180万亿次的Token调用量所惊讶,相比豆包大模型刚刚诞生的两年前增长了足有1500倍,但还有一个实际意义更加震动的数字,更值得关注:
在火山引擎的服务对象中,年均消耗1万亿Token的企业,超过了200家。
头部大户的高消耗,是不意外的,但扩大到200家则意味着,对于Token的用量需求,以及千万级的财务预算,必然下沉到了细分市场的非互联网赛道,比如传媒、金融、汽车等等,这才是火山引擎更大的机遇。
超过50个品牌的汽车、8成以上的系统重要性银行、9成以上的头部券商、所有的C9高校、Top 10手机公司里的9家⋯⋯已有一个算一个,全在火山引擎上消费Token。
而且有些AI应用场景,是有人味的,并不只有冷冰冰的降本增效。
众所周知,咖啡茶饮的市场热度与日俱增,随着门店的遍地开花,卫生隐患也开始屡见不鲜,从徒手手打奶茶,到冰块菌落超标,年轻人喝得提心吊胆,品牌商卖得胆战心惊。
常规的管理共识当然是把压力层层传导给基层店员,用严苛的惩罚制度去倒逼员工不敢犯错,但在火山引擎,库迪咖啡结合豆包视觉理解模型和AI Agent平台「扣子」,搭建了一套智能巡检系统,覆盖到了全国1.8万家门店。
从员工着装、营销物料摆放,到客区整洁、工区设备清洗,只有在发现问题的时候,系统才会发出提醒,这么一来,库迪咖啡既达到了「零容错」的目的,确保自己不出卫生风险,又不会把所有负担都给员工扛,用一种反人性去保障另一种人性。
这就是在把Token转化为生产力之后,能够拿到的确定性结果,提前适应的企业,也已经学会了「把Token用在刀刃上」。
AI焦虑当然是客观存在的,且不可避免的引起了唯Token论的风潮,就连原生的互联网大厂都难以幸免:
4月的时候,Meta还在公司内部发起Token消耗排行榜,鼓励员工如同竞技游戏那样向上冲段,2个月过去后,Meta已经顶不住了,决定开发控制员工浪费Token的后台,CTO委婉建议员工在跑任务前一定要先想清楚是否有在创造价值⋯⋯
这就是「钟摆效应」,企业会在错失和克制之间游移,最后找到一个相对理智的坐标,火山引擎每天和这些企业打交道,在理解力这块,大抵可以说是无出其右。
作为先后经历了桌面互联网和移动互联网两轮完整周期的老登,我们都还记得对于流量的敏感,无论是「图多杀猫」的警告,还是「30块5MB」的流量包,这种必然走过的历程,通向的终点一定是「脱敏」,就像现在不会有人还会出门在外就把蜂窝网络关掉,以免跑出不知情的账单。
所以可以预见的是,眼下被玩成各种热梗的Token消耗段子,一定只是切换商业逻辑的过渡产物,而火山引擎为各个行业提供的动能转化,尤其是强调Token调用规模的计算方式,都是在指向那个明确的终局思维:
相比单纯评估Token消耗量, 更应关注Token消耗真正转化为可量化的业务成果,而火山引擎是为后者服务的。
奔驰的车机语音究竟来自谁的声音、库迪咖啡的后厨如何满足卫生条件⋯⋯用户未必需要知道具体答案,但也正是这种润物细无声的渗透,在让陪跑千行百业的基础设施,从这一代云计算平台里长出来,并用Token度量新的经济气象。