出品 | 搜狐科技
作者 | 张莹
编辑 | 杨锦
用户规划前往餐厅的路线时,可以无缝地从街道空中视角“飞入”餐厅内部,连续查看沿途环境、停车位乃至具体包厢的陈设……
这就是高德扫街榜在上线100天之际推出的“飞行街景”能力。
其背后的技术底座是高德自研的世界模型“FantasyWorld”。
据了解,该世界模型融合多源感知数据,通过跨模态统一表征,联合建模并预测场景的视觉外观与三维几何结构,将物理世界映射为一个连续、可计算、高度一致的数字空间。
在发布会后的群访环节,高德飞行街景产品经理孙冲表示,目前市场上很多AI生成的过程在一定程度上是有幻觉的,而高德世界模型是一款事实AI,严格依据商家提供的真实影像资料进行还原。在飞行街景功能中,她把AI比作“空间的还原者”,而非“自由创作的画家”。
基于该世界模型,高德扫街榜将在今年一季度上线“AR实景”。
高德布局世界模型,并发布“飞行街景”
据高德CEO郭宁介绍,高德世界模型是一个面向物理AI 的世界模型,通过对输入的图像、点云等多模态资料进行统一的理解和压缩,能够对于未来世界的状态进行预测,并且最终解码出符合物理事实的视频和三维模型。
简言之,它试图将物理世界映射为一个连续、可计算、高度一致的数字空间。
目前,高德自研世界模型在国际权威评测基准WorldScore上综合得分位列第一,并在可控性、一致性等关键指标上保持领先。此外,该世界模型得到全球顶级AI学术界认可,相关论文被ICLR 2025、NeurIPS 2025等人工智能顶会收录。
基于高德自研的世界模型,高德发布全球首个“飞行街景”,同时宣布将投入价值数亿元的算力资源,为100万个商家全部免费接入飞行街景。
商家根据指引拍摄并上传几段简短的店内视频和门头照片,即可生成飞行街景。
“过去一个商家要花非常大的人工成本,包括拍照、修图、写文案,才能在线上有好的展示。”高德飞行街景产品经理孙冲在会后的群访环节中表示,她将其视为一种技术平权。
孙冲指出,通过应用世界模型AI技术,竞争焦点从“谁更会包装”转向“谁的店更好”的本质。
此外,高德扫街榜即将上线“AR实景”的功能,则允许用户扫描街道,直接在实景画面上叠加餐厅评分、推荐菜;扫描门店,招牌菜信息便浮现在门头上。
这一功能同样是基于世界模型实现的。该功能预计在今年一季度发布上线。
飞行街景下,AI是“空间的还原者”
孙冲解释,与传统高成本、难规模化的3D建模方式不同,高德飞行街景的方案是AI驱动的工业化生产流程,极大降低了采集门槛并提升了自动化生成能力。
“比如过去建一家店可能需要专业的设备、人员,工作几天后产出作品,现在商家只要用手机拍摄一段短视频和几张照片,最快几个小时内就能自动生成实景店铺。”
同时她强调,目前市场上很多AI生成的过程在一定程度上是有幻觉的,而高德世界模型是一款事实AI,严格依据商家提供的真实影像资料进行还原。
飞行街景功能中,她形容AI是“空间的还原者”,而非“自由创作的画家”。
然而,构建动态数字世界同样面临挑战。城市在变化,店铺在装修,如何保持数字世界与现实世界的更新同频共振?
孙冲坦言,这确实是“极具挑战的问题”。高德的解法是建立一个 “动静结合”的感知系统。
其中,城市骨架、道路等相对静态的信息依托高德自身的街景采集能力;动态变化部分则通过用户导航行为数据、UGC内容(如评价、动态)等信号驱动感知,一旦系统检测到变化,便会自动触发更新机制,目标是建立一个能与现实世界变化频率匹配、高速迭代的系统。
孙冲总结,其目标不是零延迟,而是建立一个能与现实世界变化频率匹配的系统。
目前,“飞行街景”这一功能还衍生到了餐饮之外的领域。在文旅场景,故宫博物院的飞行街景已上线,用户可以远程沉浸式游览建筑和历史细节,获得近似“云游览”的体验。
除了依托世界模型发布全球首个“飞行街景”外,高德扫街榜当天还宣布,推出全球首个应季、应时、应地的生活服务动态榜单;引入好友关系,新增好友动态和个人榜单功能。
数据显示,当前高德扫街榜用户规模已经突破6.6亿。高德扫街榜上线100天来,累计吸引86万新商家入驻高德,商家营业额环比增长超270%。