🔥 近7天热词
特朗普 同比增长 伊朗 外交部 伊朗外交部 幽灵外卖
首页 > 正文

又要颠覆设计行业?OpenAI炸场发布Images_2.0,中文不再乱码、超越谷歌登顶

2026-04-22 17:39
ChatGPT Images 2.0生成的360°图片
当地时间4月22日,人工智能巨头OpenAI正式发布最新图像生成模型ChatGPT Images 2.0。
据官方介绍,这是一款能够承担复杂的视觉任务,并生成精准、立即可用视觉效果的最先进模型。模型在详细指令遵循、物体的精准放置与关联以及密集文本渲染方面有了巨大进步,并支持多种宽高比生成。其构图感和视觉审美意味着生成的结果感觉不那么像“AI生成”,而更像是经过精心设计。
值得一提的是,ChatGPT Images 2.0在多种语言中(特别是日语、韩语、中文、印地语和孟加拉语)都能保持精准,并利用其扩展的视觉和世界知识填补空白,用户只需更少的提示词就能获得更智能的图像。
ChatGPT Images 2.0生成的山姆·奥特曼直播带货图(部分内容为记者打码模糊处理)
据介绍,为了扩展模型处理最复杂任务的能力,Images 2.0还具备思维链(Thinking)能力。当选择思维模式或Pro模型时,Images 2.0可以搜索网络获取实时信息、根据一个提示词创建多个不同的图像,并自我复核其输出。
同时,该模型的知识截止日期为2025年12月,也意味着可以生成更相关且符合语境的准确输出。
ChatGPT Images 2.0生成的“照片”
OpenAI表示,该模型将图像生成从单纯的渲染提升到了战略设计的高度,从一种工具转变为一个视觉系统,帮助人们将想法转化为可以理解、分享、用于教学并在此基础上构建的成果。这也让不少网友惊呼设计行业又一次要被颠覆。
ChatGPT Images 2.0生成的产品广告图
ChatGPT Images 2.0生成的电影制作流程图
同时,由于生成的图片真假难辨,OpenAI强调公司致力于构建有用、具有创造力且安全的图像生成技术,并对此采取了端到端的安全方法:努力防止有害输出,实施强有力的保障措施,并会随着能力和风险的发展不断加强保护。
一经发布,GPT-Image-2便迅速登上模型竞技场Image Arena所有排行榜榜首。在“文本转图像”类别中位列第一名 (1512 分),领先第二名242分(Nano-banana-2 with web-search,又名 gemini-3.1-flash-image),Image Arena表示“这是我们迄今为止见过的最大差距”,“单图编辑”类别第一名 (1513 分),领先第二名125 分(Nano-banana-pro,又名 gemini-3-pro-image),“多图编辑”类别第一名 (1464 分),领先第二名90分(Nano-banana-2)。
官方发布的ChatGPT Images 2.0生成的多语言图片
目前,ChatGPT Images 2.0已向所有ChatGPT和Codex用户开放,带有思维链功能的高级输出可供 ChatGPT Plus、Pro和Business用户使用。gpt-image-2模型已在API中提供;定价根据所选图像的质量和分辨率而有所不同。
Images 2.0的发布无疑展现了OpenAI在视觉生成领域的统治力,然而技术的每一次狂飙突进,都伴随着未知的暗流。不久前,因公众对AI取代人类的深度焦虑,OpenAI CEO山姆·奥特曼(Sam Altman)的住宅曾遭遇袭击。如今,这种焦虑是否会进一步加剧?奥特曼想用技术征服世界,但如何化解大众的焦虑和信任危机,或许是他和OpenAI面临的更难关卡。
网友用ChatGPT Images 2.0生成的OpenAI和Anthropic两位CEO“牵手照”,真实情况是当时拒绝了牵手