2026-07-03 16:05:16 中华网
当机器人走进酒店房间、物业走廊或康养病房,第一个要解决的问题不是“怎么走”,而是“这里到底长什么样”,具身智能的空间感知能力,正成为决定机器人能否从实验室走向真实场景的关键分水岭。
近日,云蝶科技科学家、南洋理工大学MMLab博士后王广聪的核心研究成果StructSplat正式在ECCV 2026(计算机视觉三大顶会之一)上发表。StructSplat的核心突破在于,无需提前设置相机标定参数,仅凭几张多角度的普通照片就能生成高保真三维场景,该技术在多个权威数据集上大幅刷新最优成绩。
空间感知的难题:没有标定,如何看懂世界?
想要机器人在现实环境自主作业,精准的三维空间认知是基础,但真实的场景天然存在诸多限制,比如楼道光照持续变化,房间家具、医疗设备摆放随时调整。传统三维重建方法需要提前用专业设备做相机标定,部署成本高、适配灵活性差,很难大规模应用于酒店、物业这类轻量化服务场景。
StructSplat正好可以解决这一行业痛点。与现有方法不同,StructSplat提出了一种结构化表征思路:运用几何、语义与纹理信息,进行可泛化的3D重建。这一设计能确保在“不知道相机在哪里、不知道焦距是多少”的条件下,仅凭几张随手拍摄的照片,就能重建出高保真的三维场景。
StructSplat在多个权威数据集上表现优异,如在DL3DV数据集上,StructSplat以28.045 PSNR的成绩大幅领先此前最优方法AnySplat(22.377),领先幅度高达5.67dB,SSIM从0.716提升至0.888,LPIPS从0.150降至0.091。同时,StructSplat还有出色的泛化能力,在跨数据集泛化测试中,StructSplat在ACID上领先AnySplat 1.94dB,在RealEstate10K上领先1.72dB。
空间智能的下一站:让机器人真正“活在物理世界“
当前,具身智能行业正处在一个关键转折点。当资本市场对“机器人能做什么”的追问从炫技Demo转向规模化落地,空间感知能力的真实水平将成为硬性约束。
StructSplat的核心意义在于:它证明了即使在最“不配合”的真实场景条件下——没有标定、没有专业设备、没有受控光照——高质量的空间理解依然是可实现的。这与云蝶科技一贯的技术路径高度吻合:不是等待模型完美了再进场,而是在真实场景中让模型持续进化。
论文作者王广聪博士,来自新加坡南洋理工大学MMLab,长期从事人工智能、计算机视觉与空间智能研究,已在TPAMI、TOG、TNNLS、TIP、NeurIPS、CVPR、ICCV、ECCV等国际顶级期刊和会议发表论文近30篇。同时,作为云蝶科技的科学家,王广聪深度参与云蝶科技在世界模型、空间智能建模等核心能力建设,将前沿学术成果直接转化为可落地的技术方案。这种“学术前沿—技术转化—场景验证”的闭环,正是云蝶科学家团队的差异化价值所在。
当行业从“让机器人动起来”进入“让机器人真正理解所处的世界”的新阶段,空间智能将成为具身智能的下一个核心战场。云蝶科技正在以“环境增强的世界模型”为顶层框架,以StructSplat等前沿空间智能研究为底层支撑,通过打造1:1真实业务场景训练,系统性构建机器人“看懂世界、理解世界、与世界协作”的全栈能力。