
北京智源大会正式在北京开幕。会上,北京智源研究院重磅推出悟界Physis-v0.1,这是全球首个通用世界基座模型,标志着人工智能技术从传统 “预测文字词元” 正式迈向 “预测物理状态” 的全新发展阶段,在AI探索真实物理世界领域实现关键性突破。
传统大语言模型的核心任务是预测下一个文字词元,而悟界Physis-v0.1的核心能力截然不同,它以预测下一个物理状态为目标,不仅能够理解世间通用的物理规则,还具备长程记忆能力,可适配真实物理世界中的各类场景。北京智源研究院行为世界模型中心负责人陈博远表示,这款通用世界基座模型本质上是在学习物理本身。依托对通用物理规律的掌握,该模型可广泛应用于环境交互、具身设备控制、充当具身智能 “大脑”、科学预测等诸多领域,为所有涉及物理规则的下游应用提供底层支撑。
为厘清当前纷繁的世界模型技术路线,智源研究院同步发布了一套全新的世界模型分类体系。该体系参考自动驾驶分级逻辑,依据模型对物理世界的理解能力进行层级划分,从视觉与空间生成、动作条件响应、物理世界理解,逐步进阶至通用物理推演、自主世界发现等不同阶段,清晰界定了不同类型世界模型的能力边界、应用场景与技术短板。其中低阶模型多侧重生成逼真影像、3D资产,画面视觉效果逼真,但并不遵循真实物理规则,也无法实现交互;高阶模型则能够完成跨尺度物理推演、自主发现未知物理规律并设计实验验证,可替代部分真实测试,在基础物理研究、新材料研发、工业仿真等领域具备极高价值。
北京智源研究院院长王仲远解读了模型命名背后的考量。他指出,真正成熟的世界模型需要具备全模态能力,可感知时空信息、物理规律与常识,同时拥有主动执行任务的能力,目前行业尚未达到这一理想状态。因此团队将此次发布的模型命名为悟界Physis-v0.1,后缀“0.1” 代表这只是探索通用世界基座模型迈出的第一步,后续还有大量技术难题等待攻克。






