
2025年,当罗永浩的数字形象在百度优选直播间与助理朱萧木的数字人“眉来眼去”,用9.7万字的AI生成剧本讲解产品时,直播电商的底层逻辑正在被重写。这场数字人直播的销售额,甚至超过了他5月底真人场次的三分之一。可以说,罗永浩这场高调的数字人直播正式让全网看到了数字人带货带来的实打实的业绩增长。

据三方机构统计,2024年中国数字人核心市场规模为339.2亿元,预计2030年将达到935.6亿元,带动市场规模突破万亿元。尤其是以AI数字人视频为核心的AIGC内容创作场景,正迎来发展黄金期。
在刚刚结束的2026百度create大会上,百度宣布爆款罗永浩数字人“慧播星”品牌升级为“百度一镜”。从主要应用于直播带货场景的数字人,升级为一个以数字人为特色,包含直播、视频、实时互动等多形态的全场景数字人平台;同时百度推出“一镜海外版”,旨在帮助中国企业更便捷地走出去;让全球创作者高效产出有质量、有商业价值的内容。

正如百度CEO李彦宏在现场所说:“一个人+百度⼀镜,即可完成直播、短视频、品牌大片、实时互动等全流程内容创作。”
真的有这么神奇吗?百度用两个案例说服了大家,一个是可口可乐大片,主打品牌大片,另外一个是知名网红帕梅拉带货,主打人物代言叙事。
我们先来看百度为可口可乐制作的品牌大片。
很多人或许都知道,品牌营销历来是谨慎和追求品牌调性的,既要保持品牌故事的统一性和情感深度,又要推陈出新,利用数据洞察挖掘深层人性需求,去输出品牌级的情感叙事。
在百度一镜与可口可乐合作的世界杯限定版TVC案例中,我们看到了AI对品牌调性的精准理解。百度一镜通过对可口可乐历史TVC和目标人群的深度分析,精准提炼出一罐限定版可乐=社交重启按钮的核心创意概念。
这让人感受到AI对品牌的学习与文化洞察能力,而非简单的素材拼凑。它强大的叙事能力在成片中展现得淋漓尽致:成片实现了跨越5个城市、涉及5位角色的风格一致性。无论是推拉摇移的镜头语言,还是机位调度与构图层次,均达到了专业制片水准。即便是在多场景切换中,可口可乐标志性的红色元素、瓶身的纹理质感也保持了极高的一致性。
这种高度统一的视觉呈现,不仅规避了传统AI生成视频中常见的“五官崩坏”与“物理逻辑混乱”,更将品牌资产进行了数字化资产的沉淀与复用。
在听觉层面,百度一镜同样展现了其对品牌声音的敏锐捕捉。背景音乐的节奏起伏与人声旁白的情感浓度,完美契合了世界杯期间“欢聚、激情与分享”的氛围,使得这支AI生成的短片在情绪渲染上丝毫不输顶级4A公司耗时数月打磨的精品。

百度数字人创新业务部与电商商业业务部负责人吴晨霞在采访中表示,品牌营销是一个非标场景,每个客户它的需求不一样。可口可乐甚至要求片中的部分声音与品牌一贯的视听元素保持一致,譬如我们打开可口可乐易拉罐的那个声音,都得保持标准的可口可乐风格。
这一案例的成功,标志着AI视频创作正式迈入了“工业化精修”时代。它不再是简单的文生视频Demo,而是具备了从策略洞察、脚本撰写到分镜执行的全链路营销思维。对于品牌方而言,这意味着能够以更敏捷的速度响应热点(如世界杯),在保证品牌VI严丝合缝的前提下,实现大规模、高质量的个性化内容量产,重新定义了数字营销时代的“品效合一”。
不只是可口可乐世界杯广告视频合作,百度一镜海外版成功助力零跑汽车打造A10新车宣传片。依托顶尖的商品一致性能力,视频中的车辆细节得以高质量呈现;同时,通过生成零跑COO徐军的拟真数字人形象,无缝嵌入叙事链条,开创了企业高管“数字化代言”的新范式。
接下来来说说名人代言带货环节。
在Create2026大会上,百度还展示了帕梅拉数字人带货视频的案例,可以说有不少的惊喜之处。蛋白棒表面的反光、谷物颗粒堆叠的纹理,掰开后蛋白棒的断裂、碎屑的掉落,跟实际物理状态完全吻合,丝毫没有过去那种诡异感。帕梅拉本人也极度逼近真人,皮肤的质感、头发的蓬松走向,甚至眼睛里的反光,都做得极细。更难得的是,镜头切了好几个场景,换个背景换套衣服,人物形象从头到尾没崩过,你会下意识相信这就是同一个“人”。
在一镜的规划下,这个创意被拆成产品特写、试吃、健身后补能等几组镜头。等成片合成出来,蛋白棒的谷物纹理、咬开后的形态,以及人物的发丝都被完整被保留下来。如果不是现场介绍,压根看不出画面中的帕梅拉,居然是数字人。
李彦宏对一镜的概括非常直接:“数字人就是‘看得见’的智能体。”这句话背后,重点并不只是更逼真的呈现,而是数字人正在从一次性内容工具,升级为能够持续工作、反复调用、不断优化的Agent。

当AI不仅能精准还原蛋白棒的碎屑掉落,还能自主理解“为什么健身人群需要这根蛋白棒”时,内容电商的供给端革命才算真正落地。未来或许我们刷到的每一条打动人心的种草视频,背后站着的不再是疲惫的真人博主,而是一个深谙心理学与物理法则的AI Agent。
有媒体在年初发文指出,当前数字人交互体验仍处初级阶段,数字人在表情管理、感知互动、情感表达等方面难以达到真人水平,缺乏足够的亲和力。多轮对话时容易答非所问或陷入死循环,在强噪声环境下的语音识别也远未达到实用化要求。
尤其是,绝大多数数字人缺乏长期记忆能力,每次对话都是冷启动;在业务上,数字人"能说不能做",可以介绍业务但无法直接执行操作(如银行数字客服能解释理财产品但无法代客购买),沦为"高级UI"而非智能代理;3D数字人无法理解物理环境,不知道身后的椅子可以坐、桌上的水杯可以拿起。
因此,之前数字人处于“技术不够成熟与商业化初期”的阶段,或许还需要在技术上沉淀几年才会有足够便宜、好用的数字人。
但百度作为数字人行业的先行者和老大哥,率先在数字人行业实现技术与商业模式的双突破,这是怎么做到的?
百度Create2026大会前夕,百度集团副总裁、百度电商、百度数字人业务总经理平晓黎向媒体介绍,近两年数字人直播技术飞速发展,已经形成了多智能体形态,所以必须进行全面升级。

“我们认为数字人不仅是一种技术,更是完整的智能体系统。”百度的战略野望不止于此。“当AI技术进一步跃迁,势必要关注人与AI的关系,数字人便是最佳载体之一,”平晓黎介绍,“随着技术的逐渐进步,整个数字生命将越来越成熟,数字人在ToC场景上也将拥有巨大的想象空间。”

平晓黎还指出,百度一镜依托文心大模型、数字人专精模型、多智能体协同系统,构建三大核心能力矩阵,全面覆盖电商带货、品牌营销、内容创作、政务媒体、教育培训、医疗文旅等场景。
为什么说百度这次升级不同寻常呢?因为本次升级强调的是一镜到底、一镜生成的端到端交付能力。以前你做个短视频,得先写脚本,再找拍摄,最后剪辑。现在呢?它里面住着三个打工人:剧本Agent、视频Agent和智能剪辑Agent。
上文所说的数字人交互体验较初级,缺乏长期记忆等难以介入实际工作流的问题,在百度这里找到解法,百度一镜是“看得见用着好”的智能体。
百度数字人创新业务部负责人&百度电商商业业务部负责人吴晨霞表示,高说服力数字人如今已实现规模化应用,支持真人克隆、生成式开播、多品自由切换,动作自然、交互流畅、转化能力突出。数据显示,平台平均直播间转化率提升29%、交付效率提升150%、制作成本下降63.3%。国民护肤品牌倾颜上线全媒体首个数字人牙膏专项直播间,该直播间使用高说服力数字人后转化率提升32%,GMV增长31%,日订单增长25%。
在实时互动领域,百度一镜已实现关键技术突破。据沙利文报告,实时互动能力是区分传统数字人与AI数字人的核心标志。百度一镜的数字人响应时间已小于2秒,支持多模态实时生成与各模态高度对齐,动作更丰富、表情更生动,同时具备真实世界感知能力,能够理解现实环境与人物状态,实现24小时长时记忆与情绪识别。可广泛应用于AI讲师、导购客服、政务讲解员、医疗导诊等场景,持续拓宽AI交互边界。
数字人已从“风口”走向“必备生产力工具”。那些能解决实际业务痛点、提供完整解决方案的企业,将在百亿蓝海中占据先机。
百度的数字人“狂飙”,既是对自身技术实力的验证,也是对商业化深度的考验。百度一镜走向千行百业,将会有更多像帕梅拉和可口可乐这样的标杆案例,数字人技术也会逐步渗透到产业毛细血管中。