SpAItial发布Echo-2 文本/图像一键生成实时可导航3D场景

🤖 由文心大模型生成的文章摘要

物理世界模型开发商SpAItial正式推出新一代3D场景生成模型Echo-2，可基于文本或单张图像输入，直接生成支持实时漫游、空间一致的沉浸式3D环境，适配多终端浏览器交互查看。

不同于逐帧生成的传统视频模型易出现算力消耗大、几何漂移、视角不一致等问题，Echo-2直接输出统一空间结构的3D场景，而非视频序列，用户可自由切换视角、自由导航。该模型网页演示采用3D高斯泼溅（3DGS）渲染，对GPU友好，普通配置硬件即可在浏览器中实现流畅实时交互。

Echo-2可通过单张照片快速生成家居、厂房等真实空间的数字克隆，无需昂贵3D扫描设备，大幅降低数字孪生、三维重建成本。同时具备场景理解与编辑能力，生成语义分割掩码识别桌椅、墙面等物体，支持文本指令增删改对象、整体风格重设计，保持空间整体一致性。

在行业应用上，Echo-2覆盖机器人、建筑、游戏开发等领域：

机器人领域：支持Sim2Real知识迁移，助力机器人在高保真仿真环境训练后部署，提升安全性与效率；

建筑与地产：可将2D平面图、蓝图转为可漫游3D场景，快速生成虚拟样板间与看房体验；

游戏开发：文本/图像快速生成可导航3D世界，支持快速原型开发与玩法验证。

官方数据显示，在世界生成基准测试WorldScore中，Echo-2在内容对齐度、主观画质、综合评分三项指标超越WorldLabsMarble-1.1模型。

SpAItial表示，后续版本将加入动力学与物理推理能力，进一步强化交互仿真与高级机器人训练场景的支持。

「93913原创内容，转载请注明出处」

相关文章