2026-05-25 19:11:45 资讯
当前,人工智能正从数字世界加速走向物理世界。如果说大语言模型让 AI 学会了理解语言、生成内容、辅助决策,那么“物理 AI”则进一步要求 AI 理解空间、物体、动作和任务,并通过机器人、智能终端、自动化设备等载体在真实世界中完成工作。
全球范围内,英伟达、Google DeepMind、Figure、Physical Intelligence 等科技企业都在推动 AI 从“语言模型”向“视觉—语言—动作模型”演进。国内政策层面,“人工智能+”行动、“人工智能+制造”专项行动、人形机器人与具身智能标准体系等密集出台,也标志着 AI 正从模型竞赛进入产业落地、场景应用和物理执行的新阶段。
围绕物理 AI 的发展趋势、中国机遇以及天娱数科(002354)在这一领域的布局,天娱数科首席数据官吴邦毅博士分享了观点。
“物理 AI”让 AI 从“认知智能”走向“行动智能”
理解物理 AI,不是一个简单的新概念,而是人工智能能力边界的一次外扩。过去几年,大模型主要解决的是信息世界的问题,比如写文章、生成图片、理解语义、辅助办公。它让 AI 变得“会说、会写、会画”。但物理 AI 要解决的是另一个问题:AI 如何理解真实世界,并在真实世界中完成任务。吴邦毅举例说,机器人听到“把桌上的杯子放进柜子”,它不只是要理解这句话,还要识别杯子在哪里、柜子在哪里,判断抓取方式,规划运动路径,再控制机械臂完成动作。这背后涉及视觉感知、空间理解、任务规划、动作生成和反馈调整。所以,物理 AI 的核心,是让 AI 从“认知智能”走向“行动智能”。过去 AI 更多是在屏幕里工作,未来 AI 要走进工厂、仓库、商场、家庭、能源站和城市基础设施。
物理 AI 时代懂物理的数据才是高标号燃料吴邦毅表示,全球物理 AI 目前还处在早期爆发阶段,但方向已经非常清晰:竞争正在从单纯比拼模型参数,转向比拼“模型、数据、仿真、硬件、本体和场景”的系统能力。
第一是视觉—语言—动作模型,也就是 VLA 模型。它让机器人不只是“看懂”和“听懂”,还要能够把自然语言指令转化为动作。
第二是仿真训练和世界模型。真实世界训练成本高、风险高,所以行业正在通过数字孪生、仿真环境和合成数据,让机器人先在虚拟环境中学习,再迁移到现实场景。
第三是高质量数据资产。大语言模型需要语料,物理 AI 更需要三维数据、动作数据、轨迹数据、物体交互数据和任务反馈数据。未来谁掌握更多懂空间、懂动作、懂场景的数据,谁就更有可能建立优势。
“大模型时代,数据是燃料;物理 AI 时代,懂物理的数据才是高标号燃料。”吴邦毅如是说。
物理 AI正在走出实验室和展厅里针对中国发展物理 AI的未来发展, 吴邦毅认为有非常大的空间,主要体现在三个方面。
第一,中国有全球最完整的制造业体系。物理 AI 最终要落到真实产业场景里,中国庞大的制造业、供应链和工业应用场景,为机器人和具身智能提供了最好的试验场。
第二,中国有巨大的场景红利。制造业质检、仓储物流、工业巡检、商业服务、能源运维、文旅消费等领域,都存在降本增效、安全生产和柔性化升级的需求。这些不是概念,而是真实的产业痛点。
第三,政策正在从支持 AI 技术研发,进一步转向支持 AI 规模化应用。从“人工智能+”到“人工智能+制造”,再到智能体和具身智能相关政策,方向都非常明确,就是推动 AI 进入产业现场,成为发展新质生产力的重要工具。
吴邦毅认为,未来,物理 AI 不会只停留在实验室和展厅里。谁能把技术变成可交付的产品、可复制的方案、可规模化的平台,谁才能真正抓住这一轮产业机会。
天娱数科布局具身智能和物理AI的空间智能基座
问及天娱数科在物理AI领域的布局,吴邦毅表示,目前,公司在这一方向上的核心布局,是 BehavisionPro 空间智能 MaaS 平台。我们把它理解为面向具身智能和物理 AI 的空间智能基座。
这个平台可以概括为 ABC 架构。
A 是 Assets,数据资产。物理 AI的第一步,是让机器理解物理世界。我们围绕三维物体、空间场景、人体动作、机器人轨迹、多模态行为等方向,构建高质量数据体系。公司已经沉淀了大量3D数据和多模态数据,并推动相关具身智能数据集进行数据资产登记和标准化建设。这类数据不是简单图片或视频,而是带有空间关系、结构层级、动作逻辑和任务反馈的数据。比如一个抽屉,机器不能只知道它叫抽屉,还要理解它能拉开、怎么拉开、运动轨迹是什么、机器人应该如何操作。
B 是 Behavior,行为决策。物理 AI 不能停留在识别层面,关键是要能完成任务。公司开发的Behavision 空间智能大模型已完成国家网信办生成式人工智能服务备案。我们通过大模型和行为引擎,强化系统对复杂任务的拆解、推理和规划能力。比如从“整理桌面”这样一个指令出发,系统要能够识别物体、判断位置、规划顺序、生成动作,并根据执行结果进行调整。
C 是 Client,端侧和本体适配。物理 AI 最后一定要落到机器人和智能设备上。现实产业中,机器人形态很多,有人形机器人、机械臂、轮式机器人、四足机器人、双臂机器人,不同厂商接口和控制方式也不一样。我们希望通过统一接口和工具化适配,降低模型与本体之间的连接成本,让更多开发者和机器人企业能够复用平台能力。
如果说智能手机时代需要操作系统和应用生态,那么物理AI时代也需要连接数据、模型、行为和本体的平台型基础设施。
然而,当前物理 AI 产业依然存在发展瓶颈。吴邦毅表示目前行业存在问题主要有三个:
第一是高质量数据不足。机器人不能只靠互联网文本训练,它需要真实场景里的动作数据、交互数据、失败数据和反馈数据。但目前这些数据分散、标准不一、标注成本高,制约了模型训练。
第二是泛化能力不足。很多机器人在演示环境里表现很好,但换一个物体、换一个光照、换一个场景,效果就会下降。真正的物理 AI,必须从“单场景可用”走向“多场景泛化”。
第三是软硬件接口碎片化。不同机器人本体、不同传感器、不同控制系统之间缺乏统一接口,导致算法和硬件反复适配,产业效率不高。
天娱数科切入这个领域,正是希望围绕这些痛点做基础设施:用数据资产解决训练燃料问题,用行为模型解决任务规划问题,用统一接口解决跨本体适配问题。
让机器真正懂世界,让 AI 真正能行动
天娱数科在物理AI领域的目标是:让机器真正懂世界,让 AI 真正能行动。“这句话背后是长期工程”,吴邦毅分析说,机器要懂世界,需要高质量数据;机器要会行动,需要行为模型;机器要进入产业,需要统一接口和场景验证;机器要规模化应用,需要安全、标准和生态。
物理 AI 不是短跑,而是一场长跑。它不会只属于某一家机器人企业,也不会只靠某一个大模型完成。它需要数据公司、模型公司、机器人公司、制造企业和场景方共同协同。
天娱数科希望成为其中的基础设施建设者。公司“高质量纹理3D铰接数据”“多模态 VLA 具身机器人抓取数据”等已经入选《北京市行业高质量数据集典型案例》《北京市高质量数据集服务商》,并参与中国信通院 MaaS 标准、中国人工智能产业发展联盟多模态 MaaS 标准制定。
AI 的上半场,是让机器理解人类语言;AI 的下半场,是让机器理解物理世界。谁能把这两件事连接起来,谁就有机会站在下一轮智能经济的入口。