少年科学家陈佳玉：8年读完本硕博，用因果世界模型让机器人自主思考

2026-05-20 17:26:48 西盟科技资讯

　　少年科学家陈佳玉：8年读完本硕博，用因果世界模型让机器人自主思考——原力无限一镜到底硬核演示

　　95后少年科学家 × 世界模型前沿突破

　　95后少年科学家、原力无限首席科学家陈佳玉用一次完整的双臂协作演示，诠释了什么叫真正的具身智能。

　　这位北大本科、普渡直博、卡内基梅隆博后、现任中国香港大学助理教授/博导的年轻科学家，用8年的时间完成了本硕博一体化的深度研究。27岁的他，已成为具身智能与强化学习领域的一流研究者，其研究成果已在ICML、NeurIPS等顶级会议发表，是当代少年科学家中的佼佼者。

　　而他正在用「因果世界模型」这一前沿理论，重新定义机器人的思维方式。

　　一镜到底：从理论到实践的硬核突破

　　在原力无限最新发布的演示中，搭载因果世界模型的机器人完成了多个长程复杂任务，其中最具代表性的是桌面清扫场景——机器人不仅完成了单次动作，而是自主推演出完整的任务链条，并在一镜到底的持续执行中，根据实时状态动态调整策略。

　　这不是预编程的动作序列，也不是简单的视觉识别与反应。这是机器人在因果推理的指导下，自主进行决策、执行、反馈、迭代的完整过程。

　　物理智能型 vs 空间智能型：世界模型的分岔路口

　　当前业界对“世界模型”存在两种根本不同的理解：

　　空间智能型世界模型侧重于预测下一帧画面的视觉特征，是一种「看见未来」的能力。这类模型在视频生成、预测任务中表现不错，但对于机器人操作而言，存在致命缺陷——它无法推演“动作→接触→结果”之间的因果关系。

　　物理智能型世界模型(原力无限的技术路线)则完全不同。它建立在「因果推理」的基础上，不仅预测下一步会看到什么，更重要的是推演“如果我这样做，会发生什么”。这意味着机器人具备了物理直觉与动作后果预测能力。

　　在双臂协作的清扫任务中，机器人需要理解：

　　• 推动物体的力度与滑移距离的关系 • 两只手臂同时作用时的力学耦合 • 不同材质表面的摩擦变化 • 任务失败后的补救策略

　　这些都需要因果世界模型的支撑，而纯视觉的空间模型无法做到这一点。

　　陈佳玉的理论背景：因果与强化学习的融合

　　陈佳玉在普渡大学的博士研究就围绕强化学习、蒙特卡洛树搜索与最优控制展开。他的核心洞察是：机器人的智能不能仅依赖视觉生成，而是需要通过与环境的交互，逐步构建因果世界模型，进而在虚拟空间中进行推演与决策。

　　这个理论框架与图灵奖得主Richard Sutton的核心观点不谋而合。Sutton曾发表观点称：“真正的人工智能需要将强化学习与世界模型结合，通过与环境的互动，不断优化对世界因果规律的理解。”

　　多个长程任务的完整验证

　　在原力无限发布的真机演示视频中，因果世界模型不仅在单一场景中表现出色，更在多个长程任务中展现了泛化能力：

　　任务1：桌面清扫(双臂协作)

　　机器人通过因果推理自主分解任务：

　　1. 状态识别 → 识别桌面上的多个物体及其空间关系

　　2. 因果规划 → 推演每个推动动作的预期后果

　　3. 双臂协调 → 两只手臂在因果模型的指导下完成同步操作

　　4. 实时调整 → 根据实际执行结果与推理预期的偏差，动态调整后续动作

　　5. 任务完成 → 在一镜到底的连续执行中达成目标

　　这个过程中，机器人在无遥操作条件下完成连续执行，展现出自主规划、自主决策、自主执行的完整闭环。

　　任务2：餐盘精准放置

　　这个任务对机器人的接触感知与力控制提出了更高要求。因果世界模型在这里的作用是：

　　• 预测不同力度与角度的放置动作对餐盘稳定性的影响 • 实时感知接触过程中的压力变化与物体滑移 • 根据因果推理结果，动态调整手臂轨迹与作用力

　　原力无限的VTLA技术路线(视觉—触觉—语言—动作一体化)正是为了弥补纯视觉世界模型的盲区，让机器人拥有接触智能。

　　一镜到底的深层意义

　　“一镜到底”不仅是一个技术演示的形式，更是科研诚实度的象征。它意味着：

　　1. 不是按固定脚本逐帧预编排，也不是人工遥操作补救 → 这是真实的机器人自主执行能力

　　2. 完整的闭环演示 → 从问题识别到解决方案执行的全链条可见

　　3. 可重复、可验证 → 这不是偶然事件，而是可以稳定复现的成果

　　这对学术圈、投资圈和产业圈都有深刻的参考价值。在具身智能领域，太多“炫技”的演示经不起推敲，而原力无限这一系列一镜到底的演示，为行业树立了新的标杆。

　　从虚拟世界学习，在真实世界进化

　　原力无限的AI Infra体系支撑因果世界模型的不断进化。通过以下闭环：

　　1. 数据采集 → 在真实场景中收集视觉、触觉、动作与结果数据

　　2. 仿真生成 → 在虚拟世界中利用因果模型进行大规模训练

　　3. 模型训练 → 持续优化因果推理能力

　　4. 真实反馈 → 将学到的能力在真实场景中验证并反馈

　　这个数据与模型的飞轮，让机器人的因果世界模型越来越精准、越来越泛化。

　　为什么这很重要?在具身智能的竞争中，因果世界模型是决定胜负的关键。一个拥有精准因果推理能力的机器人，可以快速适应新的任务与环境，而不需要重新标注数据;在复杂的多智能体协作中做出合理决策，包括双臂、多机器人等场景;可以预见动作后果，降低危险与失败概率，从而提升系统安全性;也可以在长程任务中保持策略的一致性。

　　陈佳玉与原力无限的最新成果，正在把“世界模型”从一个前沿技术概念，推进到具身智能真实任务验证阶段。

　　在过去，机器人更多依赖预设程序、单步控制或短程任务执行;而在原力无限的演示中，因果世界模型开始承担更核心的作用：让机器人理解环境状态，推演动作后果，并在连续任务中根据真实反馈动态调整策略。这也是“一镜到底”演示的真正价值——它不是单个动作的成功，而是机器人在长程任务中完成感知、规划、执行、反馈与再决策的完整闭环。

　　围绕这一技术方向，原力无限正在形成以因果世界模型为核心的“一脑多身多场景”体系：以统一的具身大脑支撑通用人形机器人、小尺寸双足机器人、垂直场景专用机器人等多类本体，并在商业、制造、文旅、家庭等场景中持续验证。当前，原力无限相关产品与技术已在全国30余座城市、100+场景中运行与验证，真实场景中的交互数据，也正在持续反哺模型训练与能力迭代。

　　这意味着，原力无限对世界模型的探索，并不止于论文、算法或实验室演示，而是在通过真实任务、真实本体和真实场景，验证因果世界模型能否成为机器人理解物理世界、执行复杂任务、实现持续进化的关键技术路径。

　　从陈佳玉团队的科研积累，到原力无限在一镜到底长程任务中的硬核验证，因果世界模型正在成为观察这家公司技术路线的关键词之一。对于具身智能行业而言，这也提供了一个更清晰的判断标准：真正有价值的世界模型，不只是让机器人“看见未来”，而是让机器人理解“行动之后会发生什么”。

　　少年科学家陈佳玉的出现，提醒我们一个事实——具身智能的竞争，归根到底是人才的竞争。一个95后就能在世界顶级大学担任助理教授，并在产业界推动前沿成果落地，这样的科学家正在改变我们与机器人互动的未来。

分享到微博分享到微信

少年科学家陈佳玉：8年读完本硕博，用因果世界模型让机器人自主思考

相关阅读

新动态

关注度

最话题