
豆包手机短暂闪耀背后,千问元宝们还能否成为超级AI入口?
©️懂财帝出品 · 作者|嘉逸
国内互联网生态圈,只给了豆包AI手机一天半的Showtime。
期间豆包手机可以通过接入系统的手机Agent(智能体)实现相对复杂的跨应用操作,如对比外卖价格并下单、给老板的朋友圈点赞并留言、完成B站的“大考”等。
整个流程除了支付等重要动作需要人来操作,其余都可以让AI挂在后台自动执行,基本满足了大众对于手机Agent的初步想象。
但这一技术触及了互联网大厂们的“逆鳞”,一圈数字世界的“高墙”很快拦到了豆包手机用户们的面前。
手机发布的次日晚间,就有用户反映“无法登录微信”,显示为“登录环境存在异常”,需要更换设备。之后在淘宝、闲鱼、大麦等阿里系应用中,频繁出现闪退或强制登出;农行、建行等银行App则以“风险环境”为由中止登录和支付。
目前豆包手机虽可以正常使用微信、支付宝等App,但已经“泯然众机矣”——手机无法再通过内置AI来操作这些App,使用体验相比之前大打折扣。
面对这场风波,业内人士的回应相对冷淡,甚至带着些“意料之中”的意味。
腾讯回应称:“没有什么特别的动作,可能是中了本来就有的安全风控措施[1]。”手机厂商也有高管出来表态,认为如果坚持这么做手机,最多“三世而亡”。
豆包手机一时成了互联网上的众矢之的,大家都从用户隐私、数据安全、法律合规的问题上对它提出质疑。只有老互联网人、去年被Pony马钦点为“大网红”的周鸿祎最实诚,直言“豆包手机冲垮了互联网大厂的护城河[2]。”
实际上,豆包手机遭遇“互联网生态墙”围堵的背后,是各大厂商对下一代流量入口的争夺。
01 | 互联网巨头抢夺下一个流量入口
互联网很大程度上就是围绕用户流量而展开的商业模式,所以互联网大厂们始终需要流量的增长,以及对用户心智的争夺——让用户更高频地使用、更长久地停留在自家App上。
但随着淘宝、微信、抖音、美团等App如今基本占据了电商、社交、内容、本地生活等行业的主导地位,行业集中度达到前所未有的高度——根据QuestMobile的数据,截至 2025 年 2 月,中国移动互联网近一半行业的TOP3 应用已经通吃近八成的流量。
互联网大厂们陷入增长乏力的“流量焦虑”,直到今年DeepSeek的意外爆火为行业增长重新打开了一扇窗户。
阿里、腾讯、字节跳动等头部公司今年争先恐后地“抢滩”AI大模型,试图率先抢占AI时代的下一个流量入口——AI to C应用。
元宝是第一个宣布接入DeepSeekR1的AI助手,短短1个月,元宝日活上涨20倍,跃升为头部AI to C玩家。但4月后增长便开始失速:4月下载量环比降33.4%,5月月活跌至 2256 万,环比降低44.8%。
后来居上者是创下纪录的豆包。
春节期间,字节跳动召开内部会议,检讨对大模型机会的敏锐度不足,决定改变打法,将更多的精力放在基础模型的研究上。之后,4月推出豆包1.5版本,6月迭代至1.6版本,成为国内首款多模态SOTA模型,部分场景表现超越谷歌Veo3。自此开启了对AI to C应用市场的快速抢占。
10月,豆包的DAU(日活跃用户量)达到5410万,而同期腾讯元宝的DAU仅为560万,两者相差近乎10倍。

数据来源:QuestMobile 《2025年三季度AI应用行业报告》
阿里在这场C端入口的“抢滩登陆”中,却显得摇摆不定、姗姗来迟。3月阿里将夸克定为C端旗舰产品,但夸克存在“非AI原生”,功能复杂且无技术优势的问题。11月紧急转向,重启通义,改名为“千问”。次日蚂蚁又上线AI原生App“灵光”。
今年11月,阿里CEO吴泳铭喊出“阿里巴巴必须要有一个AI原生的C端超级入口”这句掷地有声的话。而阿里相关业务组的人员也透露,做Chatbot的目标“直指豆包[3]”。
虽然在今年AI to C的应用上,各互联网大厂呈现一片“勃勃生机、万物竞发地境界”,但是在“下一代流量入口”这个问题上,他们其实有一个共同的对手:
手机厂商们的手中握着一把针对互联网行业的“达摩克利斯之剑”——GUI Agent。
02 | 手机Agent碰撞大厂APP
目前手机Agent有两种主流路线:API和GUI。
简单理解,API(应用程序接口)类似手机厂商向各家互联网大厂商议,让其开发一个接入手机智能助手的API接口,在这个接口下对AI开放部分限定功能,实现AI对应用的操作。这一模式下主动权自然在互联网大厂一方,是否开放API接口、对谁开放、开放多少功能,都是未来提供议价权的筹码。
GUI Agent对App的使用则显得更直接,也更“野蛮”,就像豆包手机那样。
“GUI Agent在遵循以自然语言提出的指令下,能够理解屏幕内容、进行自主推理,并在 UI 上执行与人类操作类似的交互[4]。”
说人话就是:GUI Agent可以通过“看屏幕、点按钮”的方式来操作App。应用开放给人类使用的功能,AI都可以模拟用户来进行,绕过了应用对AI许可授权的过程。
可能在网上冲浪比较久的网友听到这儿已经有些耳熟了。没错,这玩意儿在十年前叫“外挂”。
而众所周知,互联网行业最讨厌外挂。
“淘宝、美团靠用户停留和广告赚钱,现在AI帮用户直接完成任务,不用看广告,不用刷首页,App核心KPI彻底作废,传统流量逻辑面临崩塌。” 老互联网人周鸿祎表示。
广告收入是互联网行业的重要收入来源,而广告投放的逻辑是:流量✖转化率=广告投放收益。
2025年前三季度,阿里巴巴的客户管理收入(包含纯广告收入和佣金收入)约占总营收的31%,是核心收入来源;腾讯的广告收入则是其旗下增长最快的业务之一,三季度营收达362.4亿元,连续十二个季度保持双位数增长;美团的“在线营销服务收入”是其核心本地商业板块的重要收入来源,2025年三季度占该板块收入的21%。
豆包手机的母公司字节跳动,2025年上半年广告收入占其总收入的近60%。
GUI Agent则将用户操作截留在了手机系统上,令用户不需打开App,便能使用其功能,那么在应用上的广告投放自然也失去了意义。
更进一步来说,如果这样的“手机助手”彻底普及,那么“下一代的流量入口”便成为了手机Agent。 移动互联网的价值链,将从占据优势的互联网大厂向终端硬件厂商转移。
据Quest Mobile数据测算,2025年9月,六大手机厂商AI助手的用户规模在一年内合计增长了6500万,手机厂商AI助手用户规模整体达到了5.35亿,接近互联网/AI科技企业原生App整体用户规模2.87亿的2倍。

注:激活设备数即在统计周期内首次使用新机型的设备数;复合增长率,统计2025年7月至9月AI应用月活跃用户规模增长表现;AI助手渗透率=AI助手活跃用户规模/所属手机厂商活跃用户规模.资料来源:QuestMobile、《财新周刊》
未来使用手机AI助手的用户越多,那AI to C应用的市场规模或将相应变小。这对于互联网行业来说是难以接受的,也是需要严格限制的。
03 | 互联网想做硬件,硬件想做爆款App
在对待外部自动化工具上,微信是最保守、最顽固地坚持生态入口逻辑的应用。
2024 年 4 月起,华为小艺、小米小爱等主流手机厂商的 AI 助手就已无法直接调用微信功能。
到了 8 月,微信进一步封禁相关权限,明确禁止通过非授权第三方工具进行自动化操作。《腾讯微信软件许可及服务协议》第 7.3 条明确规定:禁止 "通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用本软件及服务,或者进行自动化操作。"
一位手机厂商的AI负责人对微信的风控做出了形象的总结:“模拟点击的(如豆包手机助手)都封了,调用接口的可以[5]。”
支付宝的风控逻辑与微信相似,将 AI 助手的行为特征判定为 "外挂脚本",以 "设备安全校验失败" 为由拒绝登录。但阿里显然也有自己打造端侧AI的野心:11月27日,阿里巴巴发布首款自研AI眼镜,不仅由其“千问大模型”驱动,还接入了支付宝、高德地图、淘宝、飞猪、阿里商旅等阿里系生态应用。
阿里始终苦于没有一个统一的C端入口链接整个阿里系生态应用,因此也是最高调地进军硬件领域,做端侧AI产品。
而各大手机厂商则开始加速自己的“超级Agent”的研发和生态布局。目前,华为、苹果、谷歌因为已经拥有自己的应用生态,所以Agent以API布局为主,荣耀则以GUI为主,OPPO、Vivo等则使用API和GUI的混合路线。
荣耀首席影像工程师罗巍对行业现状总结道:“入口是关键护城河,也是收费站,是兵家必争之地。谁掌握了分发权,谁的话语权就大,所以互联网公司想做硬件,硬件公司想做爆款App。”
但是在阿里的AI眼镜发布四天后,豆包手机就给这个暗流涌动的市场投下了一枚重磅炸弹。
字节跳动作为头部互联网大厂,自然不可能不知道如今的手机Agent生态,更不可能不知道各大互联网厂商的逆鳞,但依然选择在万众瞩目下拿出一款使用类似GUI Agent技术的手机助手。
据财新报道,豆包AI手机基本由豆包硬件团队内部孵化而来,于2024年立项,初衷是希望拓展消费级产品的日均字符串(Tokens)调用量,做大份额,其中就包括了手机[6]。
字节跳动对于硬件侧的布局和野心也是由来已久:2018年收编罗永浩创办的“锤子科技”旗下坚果手机的所有软硬件人员;2021年“元宇宙”概念蹿红,收购VR硬件厂商PICO;2024年,收购国产耳机硬件厂商Oladance,并在当年10月发布接入豆包大模型的首款AI智能体耳机“Ola Friend”……
但无论如何,从豆包手机发布引发极大关注,再到被“互联网生态”联合围堵后,软硬件之争的暗流便被彻底端上台面,并由此催生出了更多的连锁反应。
04 | 尾声
12月9日,国内大模型厂商智谱宣布开源其核心AI Agent模型“AutoGLM”,任何厂商、任何设备、任何开发者,都可以基于它复现一个能看懂屏幕、能点能滑、能输入的AI Agent。
智谱公司表明:“这件事只在一家公司做,是不够的。AutoGLM 开源的第一层初衷,是把这一层能力变成整个行业可以共同拥有、共同打磨的公共底座。”
市场分析人士指出,这一举措的杀伤力在于,它将一项原本被视为“大厂核武器”的技术,变成了所有开发者唾手可得的工具。当技术门槛被夷平,巨头们或许可以围剿一款“豆包手机”,却难以围剿千千万万个基于开源框架自建的个性化Agent[7]。
或许连字节跳动自己都没有想到,豆包手机引发的大量关注带动了市场对于GUI Agent的热情,一场对于手机交互的创新革命正在加速发生。
而留给市场巨头们一边加紧自身进度,一边防范别人取得成功的窗口期大概已经不多了。
参考资料:
[1]. 豆包手机助手无法“登录”微信的背后:端侧AI火热,如何保护用户数据隐私-澎湃新闻
[2]. AI手机挑战大厂生态,谁会打赢这场“护城河”攻防战?-澎湃新闻
[3]. 深度复盘2025年C端卡位战:阿里猛攻,字节守擂,最焦虑的或是腾讯-36Kr
[4].「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说-36Kr
[5]. 微信卧榻之侧,不容豆包酣睡-搜狐科技
[6]. 最新财新周刊|豆包“AI手机”碰壁-财新周刊
[7]. 掀桌!豆包被“围攻”后,智谱把手机Agent开源,让人人皆可打造AI手机-华尔街见闻
说明:头图AI生成。
说明:数据源于公开披露,不构成任何投资建议,市场有风险,投资需谨慎。
上一篇:“国电南瑞”将爆发式增长