记者丨宁晓敏
实习生丨汗青
出品丨鳌头财经
每年6月的中高考季,语文作文题目便会成为热点议题,今年的热点又多了一个——大模型挑战高考数学题。
近日,多家媒体对市面上的大模型进行了高考数学卷的测试,鳌头财经梳理测试结果发现,国产大模型在多个维度表现优异,分数排名优于Grok3、OpenAI等海外大模型,其中字节旗下的豆包在多个测试中成为“状元”。
根据测试结果,字节旗下的豆包、阿里旗下的通义、百度旗下的文心、腾讯旗下的元宝在客观题上表现相当,拉开差距的是主观题,最终豆包以145的总分位列第一,多次迭代的腾讯元宝则以137分的成绩位列第五。
元宝不仅在“高考成绩”上输给了豆包,在能体现用户规模的App Store排行榜上,元宝也与豆包差距明显。截至6月16日,豆包位列免费榜第1,元宝则排在第34位。
今年春节过后,借着DeepSeek带来的大模型风潮,腾讯元宝在提升模型能力和抢占流量入口上不遗余力,但从当下的产品表现看,元宝似乎进行入了瓶颈期。
2.8亿买量 全家托举 腾讯为元宝“拼了”
相较于一众大厂,腾讯对于自研大模型的推出较晚,大模型App的发布也相应迟了不少。2023年9月,腾讯推出了自研大模型混元,直到去年5月,基于混元大模型的腾讯元宝才得以面世,彼时百度的文心一言、字节的豆包、阿里巴巴的通义千问早已发布多时。
今年年初DeepSeek大火后,腾讯采取小步快跑的方式加速元宝进入市场,首先做得便是提升能力。从2月13日接入DeepSeek-R1满血版开始,元宝在35天内进行了30次更新,几乎是三天迭代一个版本,不仅全量上线了深度思考模型“混元T1”,还陆续上线了图片分享、对话导出长图、搭载“快思考”大模型Turbo S等功能。
除了提升大模型App的基础能力,腾讯还加大了对流量入口的争夺。
腾讯通过买量提升元宝的曝光度。DataEye数据显示,元宝在2月18日至23日期间投放素材环比增长345.1%,单日素材投放量超过豆包和月之暗面旗下的Kimi;另有数据显示,整个二月份腾讯花在元宝买量上的金额达2.81亿元。
真金白银的付出取得了一定效果,2月22日,元宝超越豆包成为App Store免费榜第二名;3月3日,元宝超越DeepSeek登上榜首。
在此之后,腾讯加速了元宝接入腾讯生态的进程。3月份,腾讯元宝与腾讯文档打通;4月份,元宝入驻微信;5月份,元宝相继打通了腾讯新闻、微信读书、腾讯地图等应用。
“腾讯对于元宝的推广分为两个方向,增强基础能力和抢占入口,其中抢占C端入口更为重要,随着AI落地应用场景的扩大,大模型厂商们对于C端入口的抢夺愈发激烈,本就失去先发优势的腾讯需要借助资金和生态优势‘补课’。”行业分析人士向鳌头财经表示。
然而“补课”并没有完全弥补腾讯元宝的后发劣势,QuestMobile数据显示,截至去年12月豆包月活量为7523万,腾讯元宝为211万;到了今年3月份,元宝靠着买量实现了月活2636万,豆包的这一数据则为1.01亿,DeepSeek更高,达到了1.8亿。
随着后续元宝买量力度的下降,其在App Store的排名也直线下滑,截至发稿时,其在效率榜中排名第5,前两名分别为豆包和DeepSeek;在免费总榜中跌至第34位,豆包仍是第1,DeepSeek排在第8。
元宝还能维持业务优先吗?
在外界看来,腾讯在任何时候都能通过高投入买量和生态托举实现元宝的快速起量,为何在今年才做这一件事。
“还是源于DeepSeek的爆火。”前述行业分析人士向鳌头财经表示,“腾讯不想在大模型C端入口的争夺中一而再再而三的落后,同时借助搭载DeepSeek的噱头,元宝在推广中也能节约不少成本。”
承接DeepSeek带来的流量,腾讯元宝实现了C端入口的迅速卡位,但对于元宝能力的质疑也随之而来。
鳌头财经梳理用户反馈发现,不少用户反映元宝在内容生成上并不如DeepSeek全面,“本想找个DeepSeek不卡顿的平替,但使用后发现不是‘满血版’是‘阉割版’”“联网模式强制关联公众号等内容,AI幻觉比其他大模型严重”“生成的内容中不仅有无中生有的,甚至还有广告”。在流量平台上,关于元宝类似的使用评价比比皆是。行业内人士向鳌头财经解释到,数据幻觉是大模型常有的问题,不同大模型引用来源不一样确实会在内容生成上存在差异,元宝对于微信生态中公众号、视频号的引用可能会放大这一幻觉。
如此的表现,或将会影响元宝的留存率,尤其是在与竞争对手用户重合率较高的情况下。QuestMobile数据显示,今年一月份元宝活跃用户与豆包的用户重合率超过40%,换言之,谁将这部分用户留住,谁在真正的抢到了大模型的C端入口。
比在用户心中失宠更危险的是在集团内部失宠。今年1月份,腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群),在外界看来,将应用App从基础大模型中分拆出来,一定程度上提高了元宝的业务优先级,也能更好地发挥腾讯战略、组织、资源的协同效果。
腾讯的一贯做法是将资源和技术能力投入到能快速创造回报的场景中,比如广告和游戏。今年一季报发布后,腾讯CEO马化腾对外表示,“AI能力已经对效果广告与长青游戏等业务产生了实质性的贡献。腾讯亦加大了对元宝应用与微信内的AI等新AI机遇的投入。我们相信,在AI战略投入阶段,现有高质量收入带来的经营杠杆,将有助于消化这些AI相关投入产生的额外成本,保持财务稳健。”
换言之,腾讯更加看重的是通过AI提升现有核心业务的效率和用户价值,而腾讯元宝作为一款免费工具,如果在用户规模、留存等维度不及预期,其业务优先级又能维持多久?