京东AI,直取“水源” 京东AI,直取“水源” 京东ai采集闪红灯
创始人
2026-05-14 20:39:57



在京东设想的具身智能数据采集体系里,一名门店咖啡师完成手冲咖啡的过程,不再只是一次线下服务。研磨、注水、萃取等动作,会通过头戴设备被第一视角记录,转化为可供模型训练的视频数据。

这类数据的价值,不只在于记录某个标准动作,更在于沉淀人类在真实服务场景中的操作顺序、力度控制和环境应对方式。对机器人而言,这些细节决定了它能否从“完成演示”走向“进入现场”。

不久前,京东开启了一项数据采集计划,并将其称为“人类历史上规模最大的数据采集行动”:发动最多60万人,在两年内累计超过1000万小时人类真实场景视频数据,目标是成为全球最大的具身智能数据公司。

在AI行业普遍追逐基础大模型和Chatbot应用的背景下,京东选择切入具身智能数据,表面上看不算性感,却指向了另一个更底层的问题:当AI从屏幕走向仓库、门店、家庭和工厂,谁能提供足够多、足够复杂、足够贴近现场的数据?

这也是理解京东AI战略的一个关键入口。高质量真实场景数据,正在成为物理AI落地前必须补上的一块基础设施。没有它,具身智能很容易停留在大模型里,难以进入真实产业流程。

京东并不是唯一看到这个机会的公司,但它的特殊性在于,过去多年积累的供应链、履约网络和线下业务场景,可以被重新解释为一种数据矿藏。

一方面,京东覆盖全国的供应链与线下场景,能持续产出高真实度、高多样性的物理场景数据。从仓库分拣到家庭保洁,从餐饮制作到商品导购,这些数据不仅实验室难以模拟,也是纯AI公司很难长期稳定获取的资源。

另一方面,快递、外卖、家政等业务让京东拥有密集的线下人力网络。数据采集、标注本身也是一项劳动密集型工作,京东的人力池与采集需求存在一定匹配度,这让它更容易把采集任务嵌入日常业务。

因此,京东能否在物理AI时代占住位置,关键不只是它是否投入算力、芯片的堆叠和大模型的迭代,而是它能否把原有的零售、物流和服务体系,转化成持续生产高质量数据的机制。

过去,京东是国内电子产品消费的重要渠道之一,但也长期面临一个问题:电子消费品的购买频次偏低,很多用户一年才来京东消费一两次。过去两年,京东通过丰富品类、优化价格,推动日百品类连续8个季度保持高增长。进入2025年后,京东又进一步切入外卖、家政等服务业务。

这些动作当然首先服务于增长本身,但放在AI视角下,它们还有另一层含义:京东正在把自己的业务半径,从相对标准化的商品交易,延伸到更高频、更动态的线下服务。

场景多了,数据的可能性也随之增加。但可能性不等于能力。京东2026年一季度财报显示,京东体系内研发投入同比增长59%。这笔投入的一部分,流向了具身智能数据平台这类基础设施。它不像前端应用那样容易被用户感知,也很难立刻对应到收入增量,但如果京东要把线下场景变成AI训练资源,这一步绕不开。

换句话说,京东这轮AI布局的重点,不是先推出一个更热闹的C端入口,而是尝试把场景、人力和模型训练接起来,把为用户提供的生活服务业提升到为产业提供的生产服务业。它能不能形成商业回报,取决于这些分散在业务里的真实操作,最终能否被整理成可训练、可复用、可交易的数据资产。

A

过去一年,机器人和具身智能频繁出现在发布会和展厅里。许多演示看上去已经很流畅了,但这些演示几乎只在特定的环境中才能展示。

物品摆放固定,动作路径明确,外部干扰也被降到最低。的确“物理”,但是并不“AI”。

真实商业场景很少如此配合。

还是以京东MALL里的咖啡师为例。机械臂在固定台面上完成一杯咖啡,和它在商场里服务顾客,是两件难度完全不同的事。



后者要面对的是不断变化的现场。有人靠近柜台,有人临时伸手取餐,地面可能刚被拖过,杯子、器具和人员动线也随时可能发生变化。

在这样的环境里,机器人要解决的已经不再是“能不能冲咖啡”了,是它能不能在不确定的现场里判断什么时候继续、什么时候减速、什么时候暂停等这一系列组合问题。

其中只要有一个判断出错,就有可能带来碰撞、烫伤或设备损坏,一招误判满盘皆属。

这也是物理AI比屏幕里的AI更难落地的原因。大模型说错一句话,可以重新生成。

机器人在现实世界里如果做错动作,那是要付出代价的。

要让机器人离开样板间,问题就不能只停留在动作本身。它需要看懂环境,理解现场约束,预判动作后果,还要把每一次执行后的反馈沉淀下来,反过来修正模型。

这解释了为什么具身智能看上去热闹,但很多进展仍停留在单一场景、单一动作上。演示可以被设计,真实世界却不会配合脚本。

京东选择进入这件事,押注的正是这一点:AI如果只停在屏幕里,价值天花板终究有限;只有进入仓库、门店、家庭和工厂,才可能真正变成一种新的生产力。而支撑这一切的,不是更漂亮的发布会演示,而是足够多、足够复杂、足够贴近现场的真实数据。

从这个角度看,京东与物理AI之间确实存在某种业务耦合。

一方面,早年布局无人机、无人配送、无人仓,让京东积累了一定的物理AI执行层经验;另一方面,京东围绕产业需求,战略投资多家具身智能企业,补强感知与约束决策层能力。与此同时,京东拥有全国仓储、路网、订单流转、履约服务所产生的线下实时数据,既能作为感知底座,也有机会依托业务运行数据形成反馈闭环。

这些数据能否成为京东的AI资产,取决于它能否完成从业务数据到训练数据的转化。为此,京东已经做了一系列布局。

在感知层,京东把遍布全国的线下场景变成AI的“眼睛”。

京东拥有覆盖零售、物流、工业、健康、家政、外卖等上百个线下场景。在这些环境中,京东通过采集人机操作、空间轨迹、设备状态与作业流程数据,为物理AI提供多模态感知信号。

在约束决策层,京东通过战略投资具身智能企业,自研JoyAI大模型、工业大模型JoyIndustrial、JoyInside附身智能等模型体系,搭建物理AI的决策能力。

在执行层,京东将布局多年的物流机器人、无人仓、无人机、配送设备、智能家电、服务机器人等硬件终端,作为物理AI完成现实动作的载体。

在自我进化层,京东开展大规模具身智能数据采集,将真实场景产生的数据回流至模型训练环节,尝试形成数据、模型、终端、反馈之间的持续迭代。

相比行业里比拼模型参数、堆砌算力的显性叙事,京东的路径更偏基础设施。它的难点也在这里:数据采集只是第一步,真正的考验在于数据质量、训练效率、场景迁移能力和商业化速度。

B

为什么偏偏是京东来讲这个故事?

与其说这是一次突然的跨界押注,不如说是京东在重新利用上一轮互联网竞争留下的资产。

上一轮互联网战争中,留给京东的重要资产之一,是那支深入城市毛细血管的庞大履约队伍,以及由此锤炼出的组织能力。

这让京东有了从电商业务向即时零售、外卖业务横向扩张的基础。无论做电商、外卖还是即时零售,体验、成本、效率都是核心能力。

但这项能力本身也有代价。庞大人力队伍意味着成本压力,只有让人力不断被复用,才能摊薄成本,让组织能力释放出新的价值。

如今,当竞争从互联网切换到AI,这支曾经被视为“成本中心”的人力队伍,有机会被重新定价。物理AI的训练离不开高质量数据采集、标注和真实世界反馈,而这些工作同样需要大量人力。

京东发动近60万人参与的数据采集行动,表面上是试图把一线履约队伍,转化为数据采集员、标注员和动作捕捉员,而更深层则是让这些一线员工成为数据资产的生产者,从物理产业链的尾端转入数字产业链的前端。

不同于其他企业需要额外招募、培训专业团队,京东的配送员、仓库分拣员、门店店员及外卖骑手,日常就穿梭于各类真实场景。只要佩戴自研的JoyEgoCam采集终端,就能在本职工作中同步完成数据采集与标注。



这给京东带来了一个相对特殊的起点:它不是从零搭建数据采集团队,而是把已有组织网络改造成数据网络。

有了采集数据的人,还需要使用数据的场景。

近两年,京东“四处出击”,做外卖、开七鲜小厨、布局酒旅、切入汽车后市场。

一方面,这是为了寻找新的增长曲线;另一方面,当一家企业的核心能力积累到一定程度,也会向外溢出,催生新的业务形态和商业场景。

这些新业务为京东带来增量收入、扩大用户规模,同时也为AI训练提供了土壤。AI要落地物理世界,必须依附于具体、复杂、不断变化的现实场景。在AI视角下,每一个新场景都是一个新的“感知触角”。

每一家新开的线下门店,每一位上门服务的家政人员,每一辆穿梭在城市中的物流车,都可以成为感知物理世界的传感器,源源不断地产生多模态真实数据。

支撑这一切的底座,是京东的超级供应链体系。

过去20余年,京东构建的超级供应链,已形成覆盖全球的近2000个仓库里的1亿SKU商品。

仅昆山亚一智能物流园,就具备日均分拣超450万件包裹的能力。其中,“狼族”机器人业务单量占比近半,日均出库单量稳居百万级,日常运营中持续产出海量人机交互和设备运行数据。

这套供应链打通了从生产、流通到消费的全链路。上游连接厂商,中端依托冷链与物流网络,末端完成履约。对零售业务来说,这是效率系统;放到物理AI里,它又可以被理解为一套持续产生现实世界数据的系统。

根据京东披露,通过全链路数据基础设施,原始数据可被精炼为用于AI训练的素材,数据有效率高达95%,成本降低60%。

这些数字说明,京东已经开始把供应链数据工程化,但它们距离真正转化为物理AI竞争力,还隔着模型训练、产品落地和客户付费几道关。

C

数据采集听起来不如大模型和C端应用有想象空间,却正在成为AI产业里被重新定价的环节。

一个直接的参照是Scale AI。

它并不直接训练基础模型,也不面向普通用户做应用,却凭借数据服务进入OpenAI等大模型公司的供应链,估值一度升至290亿美元。

Figure AI、1X Technologies、Covariant等具身智能公司能够获得高额融资,也与它们掌握的机器人训练数据和真实场景经验有关。

国内市场也出现了类似趋势。

随着具身智能的发展,光轮智能、灵初智能等布局数据业务的企业开始受到关注。资本看重的不是“标注”这个动作本身,而是这些公司能否持续拿到高质量、可训练、能反映真实世界复杂性的样本。

从这个角度看,京东切入“水源地”,本质上是在争夺物理AI落地前最基础、也最稀缺的数据供给位置。

谁能稳定提供场景化、专业化数据,谁就可能在物理AI落地过程中获得新的议价位置。

话又说回来,问题也要辨证地去看。

目前,行业内主流盈利方式大致可以分为硬件销售、平台订阅和数据分析服务三种。这与传统“卖水人”面临的天花板有关:它们的数据多来自众包或客户提供,来源偏二手,场景也相对碎片化,缺乏对数据生产源头的控制力。

当AI竞赛进入“物理智能”深水区,实验室合成数据或简单标注图片已经远远不够。行业真正需要的,是能反映真实世界复杂性与不确定性的“活数据”。

京东的机会正在这里。它拥有真实场景、全链路数据基础设施和供应链资源,理论上既能低成本规模化采集高质量数据,也能在真实业务中完成闭环迭代。



不过,机会和结果之间还有距离。数据能不能标准化、能不能对外交易、能不能跨行业复用,都会决定这门生意的天花板。

也正因如此,京东的商业前景不能只理解为“卖数据”。随着JoyInside附身智能进入更多智能家电,工业大模型JoyIndustrial服务超万家大型企业,京东有可能持续从家庭和工业两类物理场景中沉淀原生数据。

这意味着,京东未来可能不仅向外输出标准化数据集,也可能提供一整套基于真实物理场景的AI解决方案:从仓储机器人的路径规划,到家庭服务机器人的交互,再到工业采购的智能决策。

更大的变量在于,京东能否围绕具身智能超级供应链,建立数据交易、机器人售后、零售场景落地等生态业务。如果这些能力跑通,京东才有可能从数据采集方,进一步变成物理AI基础设施提供方,真正成为全球最大的物理世界运营公司。

未来,京东甚至可能把数据采集、标注、存储、交易等能力单独拆分出来,成为AI时代的“矿业公司”。但在此之前,它仍需要证明:这套来自零售和供应链的现实世界数据,究竟能在多大程度上转化为可复制的AI生产力。

淘金热里,卖铲子的人往往不直接参与淘金,却可能掌握更稳定的现金流。放到物理AI这轮竞争中,京东正在尝试扮演的,正是这样一个更靠近基础设施的位置。

相关内容

热门资讯

壹快评丨腾讯收购喜马拉雅附条件... 5月12日,市场监管总局发布《附加限制性条件批准腾讯控股有限公司收购喜马拉雅公司股权案反垄断审查决定...
A股新晋“股王”源杰科技副总经... A股新晋“股王”源杰科技副总经理陈文君被刑拘。5月14日,源杰科技发布《关于副总经理无法正常履职暨离...
IPO新观察|长鹰硬科过会,硬... 5月14日,昆山长鹰硬质材料科技股份有限公司(简称“长鹰硬科”)IPO申请在北京证券交易所(简称“北...
复星医药再加码阿尔茨海默病口服... “昨天我们刚刚达成协议,今天早上双方团队开始融合了,会以更大的投入来加速整体的完成速度。全球加起来有...
业绩骤变!大股东减持!科兴制药... 科兴制药依托四款成熟生物药稳住基本盘,但长期依赖老产品,毛利率持续走低。2026年一季度业绩转亏,股...