K線
數據鏈上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
語言
  • 简体中文
  • 繁体中文
  • English
全球行情資料應用程式領跑者,致力於更有效率地提供有價值的資訊。

功能

  • 即時行情
  • 特色功能
  • AI網格

服務

  • 資訊內容
  • 開放數據(API)
  • 機構服務

軟體下載

  • PC版
  • Android版
  • iOS版

聯絡我們

  • 聊天室
  • 商務信箱
  • 官方信箱
  • 官方驗證通道

加入社區

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|舊版

白话解读 OpenAI Images 2.0: 他们发的不是图, 是 Token

CN
Techub News
關注
3 小時前
AI 總結,5秒速覽全文

撰文:硅谷 Alan Walker

下午茶时间, 从 Palo Alto 看这一场发布会

2026 年 4 月 21 日中午十二点整, OpenAI 在自家官网开了一场 livestream, Sam Altman 亲自上台, 发布了一款叫 ChatGPT Images 2.0 的新产品, 底层模型叫 gpt-image-2。

几个关键事实:

所有 ChatGPT 用户(包括免费的)都能用

付费用户(Plus、Pro、Business)额外解锁一个叫 Thinking 的模式——模型会先「想」再画,可以联网搜索、分析上传资料、一次出最多八张角色和风格保持一致的图

API 同步开放, 模型 ID 就是 gpt-image-2,支持 3:1 到 1:3 的任意比例, 最高 2K 分辨率

原生集成进了 Codex 代码环境,不需要单独的 API Key

Altman 在台上说的原话是「这一次升级就像从 GPT-3 一次跨到 GPT-5」。官方博客开篇用的那句话,值得先写在这里:

"Images are a language, not decoration."

然后推特上 @OpenAI 在 4 月 21 日那条发布贴里用了一段自己生成的视频做示范, 配文就一句「state-of-the-art image model that can take on complex visual tasks」。

下面 Alan 想和你掰开揉碎讲八件事, 都是下午茶这段时间反复来回推敲、大部分媒体和推特 KOL 还没说到点上的东西。

茶凉之前:今天发布的不是一个图像模型

Zombie Café 的下午四点,加州大道还是老样子。刚泡上第二杯, 推送就炸了。TechCrunch、VentureBeat、The Decoder、Tom's Guide、Engadget、Axios——全部在同一个小时里发稿。

标题九成九是三句话里选一句:「文字渲染变准了」、「能画漫画了」、「中文不再像乱码」。

这些都对, 但全是皮。

Alan 盯着 OpenAI 官方博客那句开场白看了很久——"Images are a language, not decoration"。这不是文艺句, 这是战略声明。

过去三年, 图像生成在 OpenAI 的产品线里是个「附加功能」——DALL-E 1 是玩具, DALL-E 3 是嵌件, GPT-Image-1.5 是能用但不够硬的工具。今天 gpt-image-2 的定位变了, 从「画图的模型」变成了「视觉这个模态的底座」。

Altman 在直播里那句「从 GPT-3 到 GPT-5」,翻译成大白话就是:

图像这条腿, OpenAI 不再把它当支线,从今天起它是主干的一部分。

你要理解后面我讲的每一件事,都得先扣住这个基本判断——今天发布的不是产品更新,是产品定位重塑。

先看价格,别看图:30 美金一百万 token,图像被塞进了文字的经济体

大多数人看发布会看产品特性, Alan 看发布会先看 Pricing 页面。这次 Images 2.0 的 API 定价结构, 是他从业二十年看过最有信号量的一次:

类型
价格(每百万 token)
Image input
$8.00
Image input(cached)
$2.00
Image output
$30.00
Text input
$5.00
Text input(cached)
$1.25
Text output
$10.00

看懂了没。图像和文字用的是同一个计价单位——token。

过去图像生成怎么收费,「一张图 2 美分、一张图 7 美分、一张高清图 19 美分」, 这是卖「图片」。今天 OpenAI 改规则了,图像按 token 计费,和文字并排摆在一张价目表上。

这意味着什么?意味着从今天开始,图像不再是消费品, 而是 agent 经济里的最小原语——和文字一样可以被 AI 自动调用、按字节计量、流式组合、编程式拼装。

一个跑推理的 agent, 写一段代码、生成一段文字、画一张图、再写一段文字, 全都是一条账单, 按同一种单位结算。这就是为什么 OpenAI 敢说 "Images are a language"——因为从计费那一刻起, 它真的就是一种 language 了。

顺便补一刀: fal.ai 在同一天上线了企业级 API, 定价是 $0.01/张(低质量)到 $0.41/张(4K)。OpenAI 官方在 $30/M output 这个价位守着高端, 让 fal、Replicate、Fireworks 这些基础设施商去卷低端——自己不跟低端打, 这是典型的 Altman 打法。

八张一致的图一键出: 广告代理公司的改稿账单被递到了甲方手里

Thinking 模式最被津津乐道的能力是「一次性输出最多 8 张角色、风格、场景连贯的图」。所有媒体都在讲漫画、讲故事板、讲角色一致性。

这些全对, 但没一个讲到要害。

要害是这样的。过去二十年, 全球广告代理行业商业模式的命门是「变体费」。

每一次变体都在计费, 每一次改稿都在消耗工时, 这就是创意总监、Art Director、Post-Production 团队整条食物链的肉。

今天 Images 2.0 做的事情: 一个 prompt,直接给你 8 张保持角色一致的 variation。

从客户的角度, 这不是「AI 能做漫画」的技术新闻。这是——

「我原来为什么要付代理公司变体费」这个老问题, 被 Altman 用一句 prompt 回答了。

WPP 今年财报里反复喊「AI-native agency」转型, Publicis 收购了 Sapient Razorfish 想做自动化工作流,Omnicom 和 IPG 合并后喊「规模化创意」。这些叙事从今天起要重写——甲方手里多了一把刀, 代理公司再也不能用「人力密集型」做借口收变体费了。

这一条等着看本季度的财报, 大概率会听到哀鸿遍野。

Codex 里画图不用 API Key:最被忽略那一刀,砍在工程师端工具身上

这一条是所有报道里最被低估的一行字。Decoder 的文章里只有一句带过:

"In Codex, image generation will be available directly in the workspace without a separate API key."

推特上几乎没人讨论。

但这句话的意义比前面两条加起来都大。

你是一个工程师,过去——

画一个 UI mockup 要切到 Figma

画一个架构图要切到 Excalidraw

画一个 Mermaid 流程图要嵌在 Markdown 里

给 README 做个 banner 要开 Canva

每一次「我要画个图」都是工作流之外的事,要打开另一个 tab、另一套账号、另一个心智模型。

从今天起,你的 coding agent——Codex、Cursor、Windsurf、Continue、Cline, 任何接了 OpenAI API 的工具——在同一个 context 窗口里就能画出 production 级别的视觉资产, 不需要切工具, 不需要另外的 Key, 不需要复制粘贴, 不需要排版对齐。

这杀掉的不是一个工具, 是「工程师端视觉工具」这个品类的存在理由。

Mermaid 靠开发者情怀撑着的 Markdown 图表、Excalidraw 靠极简美学撑着的草图、Draw.io 的企业市场、Figma Dev Mode 朝工程师那边的渗透——全都要重新问自己:我到底为什么还存在。

这一刀是 Altman 典型的「顺手带走一个品类」。他甚至没在 keynote 里重点讲。

中文、日文、韩文、印地文、孟加拉文都修好了:中国设计 SaaS 今夜集体失眠

OpenAI 官方原文在这条下面列了五种语言——Japanese、Korean、Chinese、Hindi、Bengali。

国内媒体基本都翻译成「中文字渲染变好了」。坐在 Palo Alto 看,准确读法是:

今天起, OpenAI 是中文世界最强的设计工具——不是之一。

过去两年, 海外模型——Midjourney、DALL-E、Stable Diffusion——中文字永远像乱码。这是事实,不争论。这件事正是中国设计 SaaS 行业过去两年的护城河:

稿定设计:号称 4 亿用户,主打中文海报一键生成

创客贴:字节系,专做中文社交图

图怪兽:站酷孵化,电商视觉模板

美图设计室:美图秀秀母公司 B 端产品

MasterGo:蓝湖的设计工具,对标 Figma

这五家, 加起来年营收接近 80 亿人民币。它们的核心价值主张——我把它翻译成一句话——就是「AI 能画对中文字、能排对中文版式」。

今天这道护城河被一家美国公司用一个 API 填平了。

而且不是用蛮力——官方博客特别强调了「rendered correctly but with language that flows coherently」, 意思是不只是把字摆对,是让字和版式在语言层面自然融合。这是 thinking mode 加 CJK 训练数据一起做的效果。

我们在湾区的几个中国创始人朋友今晚大概都在开紧急会议。要么接入 OpenAI API 做分发渠道, 要么向上找一个垂直场景躲起来,没有中间路线。电商视觉、社交图、品牌宣传图——这三个最大的品类,今天集体失血。

QR 码 demo:整场发布会最被低估的王炸

Livestream 里有一个 demo, 几乎所有媒体都一笔带过, 只有 Substack 上一个叫 Leonardo Gonzalez 的家伙在他那篇《ChatGPT Images 2.0 Explained》里点破了。

demo 是这样的: OpenAI 让 Images 2.0 做了一件事——抓取 LMArena 上用户对内部代号 "duct tape" 的反馈, 综合成一张带排版的海报, 然后在海报里嵌入一个可扫描的、能跳回 ChatGPT 的真实二维码。

停一下, 想一想。

这不是图像生成。这是三件事装进一个产物:

信息采集(web search 抓社交反馈)

版式构建(把抓来的信息排成海报)

机器可读编码(嵌入能扫的二维码,跳转真实 URL)

用 Alan Walker 的话讲,「一张图」从此不再是视觉终点,而是信息容器。

这是一个范式转移。

意味着什么。意味着从今天起:

海报不再只是海报, 可以是带实时数据的仪表盘

infographic 不再只是设计品, 可以是带跳转入口的交互资产

包装设计不再只是包装,可以是带溯源链路、带品牌故事、带社交触点的身份标识

名片不再只是名片, 可以是带履历、带作品、带联系方式的活体资料

顺便一提 OpenAI 给 Instant 模式起的内部代号——"duct tape"(强力胶布)。这个代号本身就是产品思想的泄露。他们把自己做的东西定义成「把 AI 生态里所有视觉需求粘起来的那层胶布」。这是基础设施的自我认知, 不是工具的自我认知。

infographic SaaS、数据可视化工具、二维码生成器、名片设计 app——这些过去各自是独立品类, 从今天起都只是 Images 2.0 一个子集的替代品。Visme、Piktochart、Infogram、Lucidpress, 全都要连夜开董事会。

股票怎么看: Adobe 再挨一刀,Canva 的 IPO 故事今晚要重写

按量级拆开说。

Adobe (ADBE):2026 年初到现在股价已经跌了 22%, 今年摩根士丹利从 Overweight 降到 Equal-Weight。Firefly 的企业叙事还剩一张牌——「Creative Cloud 最后一公里的专业工作流」。这张牌今天被 Images 2.0 的「strategic design system」定位直接捅了一刀。三个月内分析师大概率会再下调目标价。

Figma (FIG):2025 年 7 月 IPO 高光开盘, 半年跌了 66%。今天 Codex 原生画图这一条, 补的就是它「design tool + dev handoff」那条业务线的脆弱点。Dev Mode 本来是它朝工程师渗透的抓手, 今天工程师不需要抓手了。

Shutterstock (SSTK) 和 Getty (GETY):库存图业务本来死了一半, 靠「AI 训练数据授权」这条叙事续命。Shutterstock 三周前刚在 ChatGPT 里上线了官方 app——但那是分发,不是生产。OpenAI 今天给出了生产端的自研方案, Shutterstock 在议价桌上的位置被动下降一个档位。Getty 的集体诉讼还在打, 官司本身的战略价值今天贬值。

Microsoft (MSFT) 和 Nvidia (NVDA):赢家, 不多说。MSFT 持 OpenAI 股权, NVDA 卖推理芯片。但这两只已经 price in 过太多次, 没新鲜感。

Canva:这家还没上市, 据称正在筹备 2026 年 Q3 或 Q4 IPO。它的叙事一直是「AI-powered design platform for the rest of us」。今天这套叙事要重写——因为「rest of us」现在直接在 ChatGPT 里就画了, 不需要 Canva 再做中间层。今晚 Canva 的 IPO 团队大概率在重新看路演 deck。

Wix (WIX) 和 Squarespace (SQSP):被大多数人忽略的受害者。建站生意过去靠的是「设计门槛」——模板好看、排版合理、字体对齐。今天这三个门槛被 Images 2.0 抹平了, 建站的下一步是「一个 prompt 一个网站」, Wix 和 Squarespace 的 Elementor 编辑器都会变成历史名词。

Pinterest (PINS):最隐蔽的输家。视觉灵感分发的市场结构在变——人们过去上 Pinterest 找灵感, 以后直接让 ChatGPT 生成。长尾 DAU 会被慢慢抽走。

创业公司生死状: Midjourney 走风格引擎,Ideogram 和 Recraft 只有 72 小时

按公司一个一个说, 每家给一条生路或一个死讯。

Midjourney:直接正面对撞,但艺术家用户的护城河还在。短期不死。我的建议是立刻放弃「我们是创意平台」这个自我定位,转向「我们是风格引擎」——专攻 Images 2.0 做不好的那种带有明确 aesthetic DNA 的生成。OpenAI 擅长通用、多用途、工作流友好,Midjourney 要去做它擅长不了的「只有 Midjourney 才做得出来的那种味道」。

Ideogram 和 Recraft:过去一年核心卖点就是「文字渲染准」。这张牌今天被 OpenAI 从桌上拿走了。72 小时内必须找到新叙事,否则下一轮融资节奏断。可能的方向:Recraft 往矢量和品牌系统那边跑,Ideogram 往设计师工具链那边跑。两家都得转。

Leonardo AI、Krea、Playground:通用 image gen 品牌,全部变 commodity。只能在价格战里往下卷。Playground 这两年已经在挣扎,今天是加速信号。

fal.ai、Replicate、Fireworks AI、WaveSpeed:infrastructure 层反而更舒服。谁是前端不重要,反正推理都在我这跑。fal.ai 今天已经上线了 gpt-image-2 的企业 API,定价从 $0.01 到 $0.41——这就是标准的「在 OpenAI 之下再搭一层」的策略。这一层短期不受伤,中期看 OpenAI 是不是真的把 infra 抽回自己做。

Runway、Pika、Luma:短期安全,但要清楚一件事——图像是视频的原子。OpenAI 把图像 token 化之后,视频只是时间维度上的延展。Sora 2 或 3 下一次发布会重演今天这一幕。在那之前,这三家要做的就是积累 workflow 深度和品牌心智。

中文 SaaS——稿定、创客贴、图怪兽、MasterGo、美图设计室:最长的受害者名单。上面第五节讲过, 不重复。要么向下卷成分发渠道, 要么向上找到一个 OpenAI 够不到的垂直场景。

最后说一家我反而看好的: 任何一家把 gpt-image-2 API 嵌进自己领域工作流, 并且能守住「专业知识 + 合规审计 + 企业信任」这三角的公司——医疗影像、法律文件、金融合规、建筑设计、品牌管理。

这些领域有 OpenAI 跨不过去的东西: 行业专属知识、数据合规、客户信任。底层被 OpenAI 填平, 反而让上层的价值变得更清晰——你不再需要自己训模型, 你只需要专注于你的行业怎么用好这个 token。

茶已经第三杯, 窗外 California Avenue 的光在往西移。今天的 OpenAI 发布会从头到尾总结,判断只有一句话:

今天 OpenAI 发的不是一个图像模型, 是一套新的视觉 token 交易所。

gpt-image-2 这个 API, 它的 generate 调用只有两行:

或者更朴素的 cURL:

两行代码, $30 一百万 token, 八张图一次出, 中文字渲染准, Codex 里原生调用。

它看起来朴素, 其实它是一个把过去二十年视觉创作产业链的中间层全部绕过去的通道。

剩下的事, 就看下一个季度, 谁带着哪张牌来对局。

Alan Walker, Zombie Café · 2026 年 4 月 21 日

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

Techub News的精選文章

20 分鐘前
上海数字经济试验区方案发布:三十条已落地,试验刚开始
1 小時前
$STAY 登陆 KuCoin 和 LBANK,Staynex 将具备营收支撑的 AI 旅游生态引入链上
1 小時前
OpenAI 发布 Workspace Agents,接替 GPTs
查看更多

目錄

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

相關文章

avatar
avatarTechub News
20 分鐘前
上海数字经济试验区方案发布:三十条已落地,试验刚开始
avatar
avatarOdaily星球日报
47 分鐘前
BitMart上线TradFi聚合页,支持多类传统资产一站式交易
avatar
avatarTechub News
1 小時前
$STAY 登陆 KuCoin 和 LBANK,Staynex 将具备营收支撑的 AI 旅游生态引入链上
avatar
avatarTechub News
1 小時前
OpenAI 发布 Workspace Agents,接替 GPTs
avatar
avatarTechub News
1 小時前
80 万枚 BTC 背后的机构暗战:贝莱德与 Strategy 谁在主导市场?
APP下載
Windows
Mac

X

Telegram

Facebook

Reddit

複製鏈接