四大权威榜单登顶 大晓开悟世界模型领跑全球 技术路线实现对VLA范式超越

🤖 由 文心大模型 生成的文章摘要

大晓机器人正式公布,旗下开悟世界模型(Kairos)在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、DreamGen四大全球权威具身智能评测中全部斩获第一名,全面超越 Cosmos3、Wan2.2、Lingbot等多款国际主流世界模型,多项测试数据刷新全球纪录,标志着国产世界模型在技术路线与综合性能上实现对传统VLA(视觉语言动作)路线的超越,该模型现已面向全行业开源。

当前不少世界模型依托视频生成模型二次开发,普遍存在物理逻辑缺失、因果推理薄弱、响应延迟等问题。为此,大晓机器人打造多模态理解—生成—预测一体化原生统一架构,坚持自主设计网络架构与预训练范式,摒弃外挂式优化思路,从底层重构模型运行逻辑。结合自研混合线性注意力算子与全局状态共享机制,模型实现三大能力高效协同。值得一提的是,英伟达最新发布的Cosmos 3.0也采用同源架构,印证了这一技术路线的行业引领价值。

数据层面,Kairos整合十余万小时以人为核心的实景数据与数百万小时互联网视频,覆盖数百类职业场景,搭配显式模仿学习与隐空间强化学习,构建起完整的数据感知与理解闭环,夯实了具身智能落地根基。

在各项硬核评测中,Kairos展现出全方位优势。在难度极高的双臂机器人操作基准RoboTwin 2.0中,该模型平均成功率达96.1%,以微小优势领先MotuBrain,大幅甩开各类VLA模型,证明其在复杂双臂协作、精细操作和多任务泛化场景中的顶尖实力。在侧重真实环境适配能力的LIBERO-Plus评测里,Kairos拿下89.0分总分,超越所有参评世界模型与VLA模型,在光照、背景噪声、相机视角等七大干扰变量下依旧表现稳定,意味着机器人可快速部署至家庭、工厂、商场等多元场景,扫除商业化落地的核心障碍。

由伯克利分校、英伟达等机构联合推出的WorldModelBench Robot,是检验物理建模能力的行业标杆。仅4B参数的Kairos-4B斩获9.30分总分,超越16B参数的Cosmos3、28B参数的 Lingbot等大参数模型,创下参数效率新纪录。它在牛顿力学、重力等核心物理维度满分达标,指令遵循能力与头部模型持平,时序稳定性表现优异。而在DreamGen评测中,Kairos同时拿下平均物理遵循、综合得分两项第一,新行为、新环境适配能力突出,其生成的数据可有效用于机器人训练,进一步降低落地成本。

依托领先架构,Kairos-4B成为全球首款可端侧直驱机器人本体的具身世界模型,打通世界理解与状态预测端到端闭环,消除转译延迟,让机器人做到“想到即做到”,显著提升响应速度与作业精度。