
全球具身世界模型权威评测榜单WorldArena更新最新排名,中国科学院工业人工智能研究所徐凯研究员牵头的物理智能团队(The PAI Lab)自研世界模型PAIWorld斩获榜单总分第一,实现我国在高端具身世界模型赛道的国际领跑。
WorldAren是当前世界模型领域公认权威性、严谨度双高的专业评测体系,围绕具身模型设立六大核心评测维度,覆盖视觉生成质量、运动流畅度、内容一致性、物理规则遵循、三维空间精度、场景可控性,直击时序运动逻辑、物理动力学模拟、三维空间感知等行业核心技术难点。该榜单汇聚全球顶尖科研机构与科技企业同台竞技,参赛阵容包含斯坦福大学李飞飞WorldLab实验室、谷歌、英伟达、智元机器人、北京人形机器人创新中心、高德、小米等全球头部技术团队,行业竞争激烈。
本次榜单评测中,PAIWorld以72.31的综合总分拔得头筹,充分证明其在高清视频生成、时序运动建模、物理规律推演、三维空间认知、机器人动作控制等底层核心技术实现全面突破,综合实力跻身全球顶尖梯队。
细分单项数据显示,PAIWorld在运动平滑性(Motion Smoothness)维度拿下95.41高分,在时空一致性建模上具备显著优势,可高度还原现实世界连续自然的物体运动规律;在轨迹准确性(Trajectory Accuracy)单项中,模型得分大幅领先第二名7.4分,长时序预测过程中能够稳定锁定物体、相机运动轨迹,有效规避轨迹漂移、空间错位等行业普遍痛点,实现“时空统一、精准预测、贴合物理”一体化建模。
PAIWorld核心研发思路为几何先验驱动+多视角时空联合建模,搭建完整的具身世界模型技术方案,可适配复杂多物体交互、铰链机械运动等复杂场景,精准还原物体动力学特征,三大创新技术构成核心竞争力:
三维几何先验注入:将深度结构、物体表面几何、遮挡关系等真实空间信息作为硬性约束嵌入模型生成流程,保障长时序复杂交互场景下物体结构稳定不畸变;
Geo-RoPE几何旋转位置编码:创新性拆分注意力头为射线、位姿两大子空间,分别编码像素三维射线方向与相机视角位姿,原生赋予模型跨视角三维几何感知能力;
多视角注意力机制:视频生成主干网络搭载专属多视角注意力模块,逐帧完成跨场景几何、外观信息对齐,高度复刻真实世界物理运行逻辑。
在多物体交互、机械铰链联动等实测场景中,PAIWorld均可精准预判物体运动趋势,重建画面时空一致性表现远超同类模型,物理场景理解能力得到榜单全方位验证。






