具身智能空间视觉技术新突破！云蝶科学家最新科研成果StructSplat亮相国际顶会ECCV 2026

2026-07-03 16:05:16 中华网

　　当机器人走进酒店房间、物业走廊或康养病房，第一个要解决的问题不是“怎么走”，而是“这里到底长什么样”，具身智能的空间感知能力，正成为决定机器人能否从实验室走向真实场景的关键分水岭。

　　近日，云蝶科技科学家、南洋理工大学MMLab博士后王广聪的核心研究成果StructSplat正式在ECCV 2026(计算机视觉三大顶会之一)上发表。StructSplat的核心突破在于，无需提前设置相机标定参数，仅凭几张多角度的普通照片就能生成高保真三维场景，该技术在多个权威数据集上大幅刷新最优成绩。

　　空间感知的难题：没有标定，如何看懂世界?

　　想要机器人在现实环境自主作业，精准的三维空间认知是基础，但真实的场景天然存在诸多限制，比如楼道光照持续变化，房间家具、医疗设备摆放随时调整。传统三维重建方法需要提前用专业设备做相机标定，部署成本高、适配灵活性差，很难大规模应用于酒店、物业这类轻量化服务场景。

　　StructSplat正好可以解决这一行业痛点。与现有方法不同，StructSplat提出了一种结构化表征思路：运用几何、语义与纹理信息，进行可泛化的3D重建。这一设计能确保在“不知道相机在哪里、不知道焦距是多少”的条件下，仅凭几张随手拍摄的照片，就能重建出高保真的三维场景。

　　StructSplat在多个权威数据集上表现优异，如在DL3DV数据集上，StructSplat以28.045 PSNR的成绩大幅领先此前最优方法AnySplat(22.377)，领先幅度高达5.67dB，SSIM从0.716提升至0.888，LPIPS从0.150降至0.091。同时，StructSplat还有出色的泛化能力，在跨数据集泛化测试中，StructSplat在ACID上领先AnySplat 1.94dB，在RealEstate10K上领先1.72dB。

　　空间智能的下一站：让机器人真正“活在物理世界“

　　当前，具身智能行业正处在一个关键转折点。当资本市场对“机器人能做什么”的追问从炫技Demo转向规模化落地，空间感知能力的真实水平将成为硬性约束。

　　StructSplat的核心意义在于：它证明了即使在最“不配合”的真实场景条件下——没有标定、没有专业设备、没有受控光照——高质量的空间理解依然是可实现的。这与云蝶科技一贯的技术路径高度吻合：不是等待模型完美了再进场，而是在真实场景中让模型持续进化。

　　论文作者王广聪博士，来自新加坡南洋理工大学MMLab，长期从事人工智能、计算机视觉与空间智能研究，已在TPAMI、TOG、TNNLS、TIP、NeurIPS、CVPR、ICCV、ECCV等国际顶级期刊和会议发表论文近30篇。同时，作为云蝶科技的科学家，王广聪深度参与云蝶科技在世界模型、空间智能建模等核心能力建设，将前沿学术成果直接转化为可落地的技术方案。这种“学术前沿—技术转化—场景验证”的闭环，正是云蝶科学家团队的差异化价值所在。

　　当行业从“让机器人动起来”进入“让机器人真正理解所处的世界”的新阶段，空间智能将成为具身智能的下一个核心战场。云蝶科技正在以“环境增强的世界模型”为顶层框架，以StructSplat等前沿空间智能研究为底层支撑，通过打造1:1真实业务场景训练，系统性构建机器人“看懂世界、理解世界、与世界协作”的全栈能力。

分享到微博分享到微信

具身智能空间视觉技术新突破！云蝶科学家最新科研成果StructSplat亮相国际顶会ECCV 2026

相关阅读

新动态

关注度

最话题