
OpenAI于4月21日通过官方博文宣布,正式推出新一代AI生图工具ChatGPT Images 2.0。该工具基于全新的GPT Image 2模型打造,核心升级在于引入“思考能力”,彻底打破传统生图工具的功能局限,同时在多图生成、图像质量、多语言支持等关键维度实现全面突破,将图像生成从单纯的视觉渲染升级为兼具策略性与实用性的视觉设计系统。
作为OpenAI首款具备思考能力的图像生成模型,ChatGPT Images 2.0的核心亮点的在于其新增的“思考能力”。据OpenAI官方介绍,用户启用该功能后,工具将具备三大核心能力:一是联网检索实时信息,可根据最新数据生成符合当下场景的图像,解决了传统生图工具内容滞后的痛点;二是能够依据用户上传的文件创建视觉解析内容,深度理解用户的创作需求与核心意图;三是在生成图像前,会对图像的结构、元素布局进行提前推理规划,确保生成的图像构图合理、逻辑连贯。目前,这一核心功能已向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放,旨在帮助专业用户高效完成复杂视觉任务。
在多图生成能力上,ChatGPT Images 2.0实现了重大突破。该工具支持单次提示生成最多8张图像,更关键的是,系统能够在不同场景中始终保持角色、物体及风格的高度一致性。这一特性将大幅降低特定场景的创作门槛,尤其适用于漫画页面制作、社交媒体系列配图、室内设计方案展示等需要统一视觉风格的批量创作需求,让用户无需反复调整参数,就能快速生成一套连贯、统一的视觉作品。
图像质量的优化也是本次更新的重点内容。新版本工具支持最高2K分辨率输出,图像细节更清晰、质感更细腻,同时将宽高比范围扩展至3:1与1:3,可适配海报、长图、短视频封面等多种使用场景。此外,工具还针对像素艺术、漫画、电影剧照等多种热门风格进行了专项优化,在纹理、光照、构图及细节呈现上更具一致性,能够精准捕捉不同视觉风格的核心特征,满足游戏原型设计、故事板绘制、营销创意制作等专业领域的需求。








