国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-Image-2 :隨意做出可作為“證據(jù)”的圖片,強到讓人恐慌

0
分享至


作者 | 貓貓頭
郵箱 | cathy@pingwest.com

+242。

這是4月21日GPT-Image-2在Image Arena Text-to-Image排行榜上領(lǐng)先第二名的Elo分差。Arena官方用了一個詞:clean sweep——全榜第一,沒有例外。


OpenAI在這天正式發(fā)布了GPT-Image-2。面向所有ChatGPT用戶,API預(yù)計5月初跟進。核心參數(shù):最高4096×4096分辨率,生成速度比前代快一倍,文字渲染準(zhǔn)確率從前代的90-95%跳到約99%。定價每百萬token $8-$30,折合單張圖片$0.006-$0.211。

模型分兩種模式。Instant是快出圖,所有人可用;Thinking模式集成推理和網(wǎng)頁搜索,單次最多生成8張風(fēng)格一致的圖片——但鎖在Plus及以上付費層級。

只看參數(shù),這像一次常規(guī)迭代。但Arena創(chuàng)始人@ml_angelopoulos 看完Arena榜單后說了一句話:"literally broke the chart——有史以來最大的差距。"


差距背后是一個積攢了三年的問題終于被正面回應(yīng)了。AI圖像生成最大的笑話,一直是文字。

DALL-E 3拼不對復(fù)雜單詞,Midjourney把招牌寫成亂碼,Stable Diffusion在海報上輸出鬼畫符。文字渲染是生圖模型的"手指問題"——不是不重要,而是一做就露餡。99%的準(zhǔn)確率如果成立,AI生成的海報、菜單、UI截圖、品牌物料第一次可以跳過人工修正,直接交付。

生圖模型的能力邊界,正在從"視覺"擴展到"信息"。

1

案例:它到底能做什么

發(fā)布當(dāng)天,社區(qū)反應(yīng)幾乎是即時的。

文字渲染是發(fā)布當(dāng)天被驗證最多的能力。VentureBeat的Carl Franzen讓模型生成阿茲特克、瑪雅和印加三大帝國版圖的歷史地圖,附完整圖例。地圖準(zhǔn)確、圖例完全可讀,他用的詞是"seemingly flawlessly"。


TechCrunch的Amanda Silberling讓模型生成一份墨西哥餐廳菜單——兩年前DALL-E 3拼不對"enchilada",這次的輸出"可以直接放進餐廳使用,客人不會察覺任何異樣"。


Thumio創(chuàng)始人@corbin_braun 連發(fā)幾串thread,做了更直覺的對比:把Google Pro 3和GPT Image 2的縮略圖生成結(jié)果并排放出來。他的結(jié)論一個詞:"insane。"同一天他還連發(fā)數(shù)條帖,稱這是"YouTube thumbnail endgame"。



文字之外,角色一致性是另一個被反復(fù)提到的點。OpenAI演示了從一張自拍生成三頁漫畫的工作流,角色在多頁間保持一致。美妝博主@jameygannon 把這個能力拉進了商業(yè)場景:一條prompt生成一整套品牌kit——logo、配色、排版、多頁應(yīng)用。



值得注意的是,這些測試全部發(fā)生在發(fā)布后幾小時內(nèi),來自不同人、不同場景、不同訴求。沒有人在精心挑選最佳輸出。

2

技術(shù)拆解:為什么這次不一樣

架構(gòu)重寫。GPT-Image-2不再基于GPT-4o的圖像pipeline。研究負(fù)責(zé)人Boyuan Chen將其定義為"GPT for images"——一個從頭設(shè)計的獨立系統(tǒng)。社區(qū)測試者在4月初Arena泄露階段(模型以maskingtape-alpha、gaffertape-alpha、packingtape-alpha三個代號出現(xiàn))就注意到變化:從兩階段生成轉(zhuǎn)向單次推理。

用一個類比:過去的模型是"先聽懂你說什么,再動手畫",中間有一次信息壓縮;GPT-Image-2是"邊理解邊畫",語言理解和圖像生成在同一過程中完成。所以文字渲染終于準(zhǔn)了——生成每個像素時,模型仍然"知道"自己在寫什么字。

Thinking模式。開啟后,模型在落筆前先規(guī)劃構(gòu)圖,生成后檢查輸出,發(fā)現(xiàn)錯誤還會迭代修正。anti gamble創(chuàng)始人@damianplayer 的拆解:"reasoning mid-generation——plans the composition, checks its own output。"推理集成還讓模型可以在生成過程中調(diào)用網(wǎng)頁搜索、將文檔轉(zhuǎn)化為視覺圖表、在8張圖片間維持角色一致性。


世界知識的飛躍。訓(xùn)練數(shù)據(jù)明顯偏向真實世界的視覺素材:UI截圖、店面招牌、界面布局。當(dāng)你要求生成"普通工程師的屏幕",它輸出的是可信的顯示器畫面,不是關(guān)鍵詞拼貼。@Yuchenj_UW 試用后的判斷很直接:"It is really good. OpenAI is finally leading the image gen again。"


架構(gòu)決定了它能"讀懂"文字,Thinking讓它能"檢查"文字,世界知識讓它知道文字應(yīng)該"長什么樣"。三層能力疊在一起,文字渲染從短板變成了長板。

3

人類必須嚴(yán)肅對待這樣的以假亂真能力

StartupFortune在發(fā)布日給了一個定位:從"creative novelty"到"production infrastructure"。品牌mockup、廣告設(shè)計、信息圖表,過去因為文字不可靠而必須人工介入的場景,開始變成一條prompt可以交付的工作流。

不過StartupFortune自己也加了一句謹(jǐn)慎的提醒:"benchmark performance and production performance often diverge。"99%是實驗室數(shù)字,真實世界的多語言、多字體、多排版場景能不能hold住,5月API開放后才會有答案。

我們更關(guān)心的是另一個問題。


Jake Handy在發(fā)布日的Substack技術(shù)拆解中寫了當(dāng)天最尖銳的一段:讓GPT-Image-2成為最好生產(chǎn)力工具的那組能力——精確的文字渲染、可信的UI布局、真實世界的視覺詞匯——恰好也是制造虛假信息的完美工具集。

假UI截圖、假Bloomberg終端、假法庭文件、假Slack對話,"every one of those is dense text laid over a known visual vocabulary, which is the exact workload OpenAI optimized for。"("這些中的每一個都是在已知視覺詞匯之上疊加的密集文本,而這正是 OpenAI 所優(yōu)化的工作負(fù)載。)

這個觀察之所以刺眼,是因為它不是在說模型有什么"副作用",它在說模型最被贊美的那個能力——把文字精確地嵌入可信的視覺場景——本身就是雙刃的。

過去的生圖模型因為文字太爛,反而天然帶有一層"防偽標(biāo)記":一眼就能看出是AI做的。GPT-Image-2把這層天然屏障拆掉了。

OpenAI的應(yīng)對是C2PA元數(shù)據(jù)水印和溯源分類器。image-2 lauch的直播中,產(chǎn)品負(fù)責(zé)人Adele Li在發(fā)布會上自己承認(rèn),元數(shù)據(jù)"is not a silver bullet"——截圖、裁剪、平臺壓縮,任何一步都讓水印失效。


Jake Handy給出的定性我們認(rèn)為是準(zhǔn)確的:"The model is an excellent problem。"

AI圖像生成確實進入了"文字時代"。但文字可信這件事,在人類的媒介史上,從來就不只是一個技術(shù)問題。

這也許才是那個“強到不應(yīng)該公開發(fā)布”的模型,今天之后,每個人都有了隨意生成曾經(jīng)都會被認(rèn)作事實證據(jù)的圖片,信息的判斷變得前所未有的難,這個強到離譜的模型會在未來很長一段時間給人們帶來恐慌,我們會看到因此而產(chǎn)生的各種沖突和討論,人類必須一起嚴(yán)肅應(yīng)對這種以假亂真的能力了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

鶴羽說個事
2026-04-16 22:07:31
EA888發(fā)動機!奧迪新車:降價首發(fā)

EA888發(fā)動機!奧迪新車:降價首發(fā)

手機評測室
2026-04-22 11:49:39
日本向中國提了一個請求!高市早苗知道:再猶豫,中國就要收網(wǎng)了

日本向中國提了一個請求!高市早苗知道:再猶豫,中國就要收網(wǎng)了

起喜電影
2026-04-22 00:41:35
斯諾克賽程:誕生3席16強,斯佳輝首秀2虎上陣,賀國強慘敗火箭?

斯諾克賽程:誕生3席16強,斯佳輝首秀2虎上陣,賀國強慘敗火箭?

劉姚堯的文字城堡
2026-04-22 08:20:20
特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統(tǒng)

特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統(tǒng)

混沌錄
2026-04-21 21:10:15
美國防部:415名美軍人員在對伊朗軍事行動中受傷,目前死亡人數(shù)仍為13人

美國防部:415名美軍人員在對伊朗軍事行動中受傷,目前死亡人數(shù)仍為13人

每日經(jīng)濟新聞
2026-04-21 14:32:25
這是底氣!申花主帥賽前直接明牌 | 臨時換裁判 能擋住追趕步伐嗎

這是底氣!申花主帥賽前直接明牌 | 臨時換裁判 能擋住追趕步伐嗎

80后體育大蜀黍
2026-04-22 10:26:15
竄訪宣布取消后,國民黨表態(tài),民眾黨向大陸攤牌,賴清德親自回應(yīng)

竄訪宣布取消后,國民黨表態(tài),民眾黨向大陸攤牌,賴清德親自回應(yīng)

聞識
2026-04-22 11:19:56
28+25+23!湖人2比0!KD沒頂住,老詹太猛了...

28+25+23!湖人2比0!KD沒頂住,老詹太猛了...

左右為籃
2026-04-22 13:33:24
別的不說,殷桃不愧是內(nèi)娛最性感的女明星之一,豐乳肥臀的太絕了

別的不說,殷桃不愧是內(nèi)娛最性感的女明星之一,豐乳肥臀的太絕了

動物奇奇怪怪
2026-04-22 09:04:37
經(jīng)濟熱點快評丨重磅意見印發(fā),服務(wù)業(yè)擴能提質(zhì)有了“路線圖”

經(jīng)濟熱點快評丨重磅意見印發(fā),服務(wù)業(yè)擴能提質(zhì)有了“路線圖”

人民網(wǎng)
2026-04-21 19:59:12
上海房東正在快速出貨

上海房東正在快速出貨

魔都財觀
2026-04-22 07:40:13
寧德時代這一夜,不只是發(fā)電池,而是在重寫中國電車規(guī)則

寧德時代這一夜,不只是發(fā)電池,而是在重寫中國電車規(guī)則

自主汽車
2026-04-21 23:53:57
白鹿這套“白里透黑”,誰看了不心癢?

白鹿這套“白里透黑”,誰看了不心癢?

飛娛日記
2026-04-22 08:06:06
今天,茶顏悅色深圳兩店齊開,上百名“黃?!毙顒荽l(fā),不論品種每杯88元,品牌回應(yīng)

今天,茶顏悅色深圳兩店齊開,上百名“黃?!毙顒荽l(fā),不論品種每杯88元,品牌回應(yīng)

深圳晚報
2026-04-22 08:10:41
時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

新車知多少
2026-04-21 18:28:58
爆冷!馬克西29+9探花爆發(fā)立功,布朗36+7首發(fā)最低,塔圖姆里程碑

爆冷!馬克西29+9探花爆發(fā)立功,布朗36+7首發(fā)最低,塔圖姆里程碑

魚崖大話籃球
2026-04-22 09:37:51
趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

風(fēng)過鄉(xiāng)
2026-04-22 13:16:46
伊朗代表:美國解除對伊海上封鎖或可成為談判基礎(chǔ)

伊朗代表:美國解除對伊海上封鎖或可成為談判基礎(chǔ)

新京報
2026-04-22 07:35:07
初代宅男女神宣布離婚:多謝大家關(guān)心...

初代宅男女神宣布離婚:多謝大家關(guān)心...

小椰的奶奶
2026-04-04 22:16:21
2026-04-22 14:07:00
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進入GenAl。
272文章數(shù) 36關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

頭條要聞

KTV服務(wù)員被指強奸14歲女生 官方通報

頭條要聞

KTV服務(wù)員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

健康
教育
時尚
藝術(shù)
本地

干細胞抗衰4大誤區(qū),90%的人都中招

教育要聞

2026 成都新初高中大爆發(fā)!七中 、 樹德、 西川、北二外領(lǐng)銜,9 月集體亮相!

頂流復(fù)工,已判若兩人

藝術(shù)要聞

無花不風(fēng)景

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

無障礙瀏覽 進入關(guān)懷版