中国自研HiDream模型开源后登顶国际AI测评榜单

🤖 由 文心大模型 生成的文章摘要

7月2日,据中国青年报报道,智象未来(合肥)信息技术有限公司在人工智能领域取得重大突破。其自主研发的HiDream-I1图像生成大模型与HiDream-E1交互编辑模型于今年4月份全面开源,这一举措在全球AI领域引起了广泛关注。开源后不到24小时,HiDream-I1便在国际权威的AI测评榜单Artificial Analysis中登顶,成为首个获此殊荣的中国自研生成式AI模型。​

HiDream-I1是一个拥有170亿参数的图像生成基础模型,采用了先进的扩散模型技术和混合专家架构(MoE)。这种创新性的架构使得模型在图像生成质量、提示词遵循能力等方面表现出色,能够支持逼真、卡通、艺术等多种风格的图像生成。例如,当用户输入“在宁静的森林中,阳光透过树叶洒在地面上,一只小鹿在溪边饮水”这样的描述时,HiDream-I1能够迅速生成细节丰富、色彩协调且符合描述场景的高质量图像,无论是树叶的光影效果,还是小鹿的神态动作,都栩栩如生。​

同时,为了满足不同用户的需求和硬件条件,HiDream-I1提供了完整版(HiDream-I1-Full)、蒸馏版(HiDream-I1-Dev)和极速版(HiDream-I1-Fast)三个版本。完整版适合追求极致图像质量的专业用户,其推断步骤为50步;蒸馏版在效率和效果之间取得了良好平衡,推断步骤减少到28步;极速版则适合对生成速度要求较高的实时应用场景,推断步骤仅为16步。​

而HiDream-E1交互编辑模型同样亮点十足,它基于HiDream-I1核心架构开发,专注于通过自然语言指令实现高质量的图像编辑。用户可以通过自然语言指令,轻松实现对图像的裁剪、滤镜应用、风格迁移和对象移除等操作。比如,用户只需说出“将这张图片中的天空换成蓝色,添加复古滤镜效果”,HiDream-E1就能快速准确地完成相应编辑,大大降低了图像编辑的门槛,为从专业设计到个人创作的各类用户提供了极大的便利。​

这两款模型的全面开源具有深远意义。一方面,开源能够促进全球AI开发者共同参与模型的优化和创新,加速技术的迭代升级。通过开源,开发者可以基于HiDream-I1和HiDream-E1进行二次开发,探索更多的应用场景和创新功能。另一方面,开源也推动了AI技术的普惠化,让更多的企业和个人能够使用先进的图像生成和编辑技术,为创意产业、教育、科研等领域带来新的发展机遇。​

在登顶Artificial Analysis榜单后,HiDream-I1获得了全球AI行业的高度认可。Artificial Analysis榜单通过人类用户对匿名生成的图像进行盲测投票,直接反映真实场景下的用户体验。HiDream-I1能够在开源后短时间内超越众多国际知名模型,如Flux1.1、RecraftV3等,登顶该榜单,充分证明了其在图像生成技术方面的领先地位。这不仅是智象未来公司的重大成就,也是中国在全球AI领域技术实力的有力彰显,标志着中国自研生成式AI模型在国际舞台上迈出了重要一步。

「93913原创内容,转载请注明出处」