银河通用联合清华大学发布开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

🤖 由 文心大模型 生成的文章摘要

银河通用机器人携手清华大学发布了全开源、多机型、跨虚实的人形机器人全身遥操作系统——OpenWBT。即便是新手,也能在小时内从零完成部署,并以接近日常人类工作空间的方式,高效采集人形机器人全空间操作数据,为打造具备操作智能的人形机器人提供坚实的数据支撑。

传统遥操作往往仅依赖上半身控制,而OpenWBT通过全身运动控制,让机器人实现移动、碰高、摸低等多种能力。只需要一款VR头显,就可以遥控多种机器人,使其像人类一样弯腰拾起地上的物品,或伸手擦拭高处的窗台。只需要一副VR头显、一台笔记本电脑,新手也可以在小时内从零完成系统的快速部署。不受场地限制、无需复杂的设备校准与穿戴,躺在家里床上,也可以遥控千里之外的机器人。

OpenWBT不仅兼容29自由度的Unitree G1,还支持拥有成人身高的Unitree H1,可轻松覆盖成年人完整的工作空间,成为对人类劳动力的有力补充。OpenWBT同时支持在真实世界和仿真环境中进行遥操作。在真实世界中遥操作,可避免感知与控制的域偏差,直接获得高质量机器人数据;在仿真环境中遥操作,无需搭建物理场景,便于快速采集和大规模数据增强,提高样本效率,并为后续模型的泛化能力奠定基础。

让机器人如此稳定在超大工作空间运动的秘诀来自于最近银河通用机器人和清华大学研究团队联合推出的一项工作:Unleashing Humanoid Reaching Potential via Real-world-Ready Skill Space。其旨在解决基于仿真强化学习的人形机器人全身控制中仿真到真实(sim2real)迁移这一难题。将仿真中的人形机器人技能迁移到真实世界极具挑战性,尤其是当机器人需要完成走路、下蹲、弯腰、手臂自由挥动等多种动作时,传统方法往往难以应对这一多样性,而提出了一种分层式的新颖框架来解决这一问题。

首先将运动分为若干原子技能(如走、蹲、前倾等),针对每种原子技能设计专门的奖励函数与训练策略,使其可以稳定迁移到真实世界中。因此,进一步通过强化学习对原子技能的组合与衔接进行优化,并利并用条件变分自编码器对包括原子技能及其组合衔接在内的各种底层控制进行统一生成式建模,我们将该生成空间命名为Real-world-Ready Skill Space。依据高层级任务需求,我们可以从该空间中选取特定的技能与组合,进而实现稳定的全身控制。把复杂的多技能sim2real问题拆分成可解决的单技能sim2real问题,再利用层次结构与生成式建模把技能整合起来,仿真到真实(sim2real)迁移难题就不再可怕。

具体来讲,该工作的技术核心包括以下三点:让机器人学会一种skill很难,让机器人学会多种skills更难,让机器人能够将学会的多种skills进行稳定的sim2real transfer更是难上加难。一般的端到端强化学习受限于优化难度和sim2real transfer稳定性,很难同时学会多种可在真实世界稳定运行的技能。

因此,本文提出首先通过基于启发式奖励函数的强化学习构建一个“真实世界稳定”的原子技能库。从功能性上设计出不同的原子技能,每个技能由专属的奖励函数训练,并通过sim2realtransfer验证其在真实世界中的稳定性。该工作将机器人的全身控制拆分为了三种不同的原子技能:locomotion,body-pose-adjustment和hand reaching。Locomotion负责让机器人健步如飞,body-pose-adjustment支持机器人像人一样弯腰下蹲,hand-reaching使得机器人双手可以精确触达目标点。

针对body-pose-adjustment,该工作鼓励在运动学和动力学上的对称性来实现稳定的机器人动作控制:分开训练虽然大大保证了原子技能在真实世界的表现,但是却不足以支撑真正的机器人全身控制,因为这需要机器人能够在不同技能之间协同、切换。使得机器人能够同时掌握多种技能,并将其编码到一个技能隐空间当中,并通过KL散度和约束函数使得其空间更具结构性:执行时,policy只需要从隐空间解码,便可得到真实的关节力矩,在保留原子技能的真实世界稳定性的基础之上,实现原子技能之间的稳定组合与衔接,大幅扩展机器人的运动空间。

「93913原创内容,转载请注明出处」