SpAItial发布Echo-2 文本/图像一键生成实时可导航3D场景

🤖 由 文心大模型 生成的文章摘要

物理世界模型开发商SpAItial正式推出新一代3D场景生成模型Echo-2,可基于文本或单张图像输入,直接生成支持实时漫游、空间一致的沉浸式3D环境,适配多终端浏览器交互查看。

不同于逐帧生成的传统视频模型易出现算力消耗大、几何漂移、视角不一致等问题,Echo-2直接输出统一空间结构的3D场景,而非视频序列,用户可自由切换视角、自由导航。该模型网页演示采用3D高斯泼溅(3DGS)渲染,对GPU友好,普通配置硬件即可在浏览器中实现流畅实时交互。

Echo-2可通过单张照片快速生成家居、厂房等真实空间的数字克隆,无需昂贵3D扫描设备,大幅降低数字孪生、三维重建成本。同时具备场景理解与编辑能力,生成语义分割掩码识别桌椅、墙面等物体,支持文本指令增删改对象、整体风格重设计,保持空间整体一致性。

在行业应用上,Echo-2覆盖机器人、建筑、游戏开发等领域:

机器人领域:支持Sim2Real知识迁移,助力机器人在高保真仿真环境训练后部署,提升安全性与效率;

建筑与地产:可将2D平面图、蓝图转为可漫游3D场景,快速生成虚拟样板间与看房体验;

游戏开发:文本/图像快速生成可导航3D世界,支持快速原型开发与玩法验证。

官方数据显示,在世界生成基准测试WorldScore中,Echo-2在内容对齐度、主观画质、综合评分三项指标超越WorldLabsMarble-1.1模型。

SpAItial表示,后续版本将加入动力学与物理推理能力,进一步强化交互仿真与高级机器人训练场景的支持。

「93913原创内容,转载请注明出处」