机器人为什么还不够聪明?具身智能不缺融资、缺数据 为啥机器人始终没有那么灵活 机器人不容易解决的问题
创始人
2026-06-25 10:43:53

具身智能无疑是科技行业最火热的赛道之一,资本持续涌入,创业公司不断刷新估值,机器人也在从演示视频走向真实场景。但热闹之下,一个核心问题始终没有被真正解决:机器人为什么还是不够“通用”?

许多机器人在特定任务上表现出色,“但换个物体操作就失效,换个场景可能就得重新训练。”RoboScience机器科学联合创始人汪涛认为,这背后最大的瓶颈是数据。

大语言模型的发展几乎验证了一条共识:更大的模型、更大的算力以及更大的数据规模,会持续带来能力提升。但这套Scaling Law(缩放定律)到了机器人领域,却遇到了现实阻碍。

互联网积累了海量文本数据,而机器人需要学习的是人与物体、环境之间的真实互动,这样的物理交互数据天然稀缺。

在汪涛看来,一个真正具备通用操作能力的具身智能大模型,所需的数据规模甚至可能超过今天的大语言模型,“千万小时、亿万小时都未必够。”而目前全球头部企业掌握的高质量真机数据,大多仍停留在数十万小时量级,最高约30万小时左右。

按照RoboScience机器科学的测算,相比大语言模型所拥有的数据规模,具身智能领域的数据缺口大约在10⁶至10⁸倍之间。这意味着,机器人行业距离自己的“ChatGPT时刻”,可能还有高达1亿倍的数据鸿沟。

面对数据短缺,传统的破局思路是真机采集。这一方式确实有效,业内预计,今年真机数据总量有望达到百万小时量级。但短期来看,成本与产能的问题同样明显。

如果算一笔账:靠人采集数据,每个人每天只有几百条,月产也只是万条级别,远不能满足大模型对数据规模的指数级需求;后训练阶段,为了让机器人学会一个复杂操作,动辄需要上万条人工标注,成本随任务数量线性累加。

行业正在重新思考具身智能的技术路线。过去几年,VLA(视觉语言行动模型)和模仿学习曾被视为主流方案。但随着实践深入,越来越多团队开始遇到架构和数据的瓶颈。

一个思路是用“算力换时间”:利用海量互联网视频以及自研仿真器生成的数据,替代大量人工采集过程,力求立刻开始基座模型的预训练。

RoboScience机器科学将“物体在三维空间中的运动轨迹(Object Trajectory)”作为数据格式,搭建了一条全自动数据管线,数据成本被压缩至“几分钱一条”,仅为真机采集的几十分之一,而产能则完全取决于算力,“理论没有上限”。

据介绍,今年年初,RoboScience的视频数据量超过百万小时,仿真数据达到了十亿、百亿量级。按照规划,今年他们的视频数据体量要超过千万小时,仿真数据要做到TB级别,基本上接近ChatGPT数据量的十分之一。


尽管属于机器人的“ChatGPT时刻”还未到来,但资本市场的热情持续至今。

IT桔子的数据显示,2026年上半年国内具身智能及机器人领域共发生288起融资事件,涉及226家企业,披露融资额超460亿元,有49家公司在半年内完成了两轮及以上融资。

但资本会更加谨慎和聚焦,汪涛提到,机构投资者会青睐解决核心问题的团队,同时相比概念和故事,今年投资者会更关注真实的落地以及客户复购率,这些指标真正能够验证团队能力。

相关内容

热门资讯

美股狂飙,美元为何没跟上? 美... AI浪潮推动美国股市强势领跑全球,但美元却未能同步走强,高盛最新研究揭示了这一背离背后的深层逻辑。据...
康宁推出玻璃光学互连技术,剑指... 6月24日,康宁在首尔POSCO Tower Yeoksam举办的AI数据中心光通信与互连技术大会上...
转转成被执行人:2.9万“案底... 文 |恒心来源|博望财经近日,一则看似不起眼的司法信息在投资圈和二手电商行业引发了不成比例的讨论。据...
机器人为什么还不够聪明?具身智... 具身智能无疑是科技行业最火热的赛道之一,资本持续涌入,创业公司不断刷新估值,机器人也在从演示视频走向...
臻宝科技首日大涨12倍市值90... 长江商报消息●长江商报记者 沈右荣A股市场又现10倍新股。6月24日,臻宝科技(688797.SH)...