
7月18日,以色列AI创企Decart在AI领域扔下了一颗重磅炸弹,推出了全球首个直播扩散AI视频模型——MirageLSD。这一突破性的模型,可对无限长的视频流进行实时转换,并且响应时间小于40毫秒,这一速度几乎达到了人眼难以察觉延迟的程度。
前特斯拉AI总监、OpenAI创始团队成员安德烈・卡帕西(AndrejKarpathy)在社交平台X上毫不吝啬自己的赞美之词。他提到:“Veo等视频扩散模型固然神奇,但其生成视频往往需要花费数秒甚至数分钟的时间。而MirageLSD带来的则是实时的魔法。”在他眼中,这项技术具有强大的通用性,有望成为改变众多领域游戏规则的关键力量,像游戏、直播、视频通话、影视制作、会议,甚至AR/VR等领域,都可能因之发生翻天覆地的变化。
安德烈・卡帕西在社交平台上难掩激动之情,兴奋地表示:“扩散视频模型现在支持实时生成了!”他还指出,以往简单的视频滤镜虽然能够实现实时生成,但功能仅仅局限于基本的重新着色和样式设置,无法对视频内容进行深度的智能处理。反观MirageLSD,它就像是一位真正理解视频内容的艺术家,能够智能地对视频源的所有部分进行风格化处理。例如,精准地将一顶帽子戴在人物的头上,或者为角色的手上添上一把光剑,让视频内容按照用户的想象进行生动改变。
不仅如此,该模型还具备极高的操控性,用户可以通过文本提示的方式,轻松实现对视频的各种操控。这种可定制的智能视频滤镜,随着时间的推移,有望解锁出许多令人惊叹的创意应用:
虚拟实景转换:用户能够将摄像头捕捉到的现实画面,瞬间转化为充满奇幻色彩的虚拟实景,仿佛置身于另一个奇妙的世界。
实时电影创作:创作者可以亲自执导并拍摄自己的电影。在拍摄过程中,只需拿起简单的道具演绎场景,模型便能实时对场景进行布景和风格化处理,并且用户能够即时回看拍摄效果,实现边演边剪,大大提高创作效率,降低创作门槛。
游戏快速开发:游戏开发者可以先围绕简单的球体或方块搭建起游戏的基础机制,随后借助实时扩散模型,快速为游戏添加精美的纹理,将原本简陋的游戏雏形迅速打造成画面精美的游戏作品。
视频流风格化定制:无论是正在进行的游戏画面,还是普通的视频,都能按照用户的需求进行风格化处理和自定义。例如,玩家希望《上古卷轴5:天际》的画面更具“史诗感爆棚”的氛围,或者想让《毁灭战士2》仅通过一个提示词,就拥有现代虚幻引擎般的顶级画质;又或者将一部恐怖片实时转换为充满可爱元素、粉色调与小兔子的温馨风格,这些想法在MirageLSD的助力下都能轻松实现。








