国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

奧特曼「紅色警戒」5個月后,GPT Image 2屠榜,斷層領(lǐng)先反殺谷歌

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】被Google按了半年頭,OpenAI終于祭出一記反殺。GPT Image 2上線12小時,就登頂Arena文生圖榜,領(lǐng)先Nano Banana 2達(dá)241分。Arena官方稱,這是Image Arena文生圖排行榜迄今最大的分差。

發(fā)布當(dāng)天,三榜通殺。

GPT Image 2上線12小時,Text-to-Image(文生圖)、Single-Image Edit(單圖編輯)、Multi-Image Edit(多圖編輯)三個分榜全部登頂。

Arena官方原話:「a clean sweep」(全勝)。


文生圖主榜,GPT Image 2 1512分,Nano Banana 2 1271分。241分差距,Arena史上最大。

「沒有任何模型曾以這種差距統(tǒng)治過Image Arena」,Arena官方表示。

在Image Arena所有盲測對決中,GPT Image 2的勝率是93%:100張圖配對盲選,93張人們選了OpenAI那張。

「如果把DALL-E看作洞穴壁畫,把Images 1.0視為古代藝術(shù),那么Images 2.0就是文藝復(fù)興」。

OpenAI在發(fā)布會開場中這樣介紹Images 2.0,奧特曼更是將它稱作跨代升級:

這好像一下子從GPT-3躍升到了GPT-5。


https://www.youtube.com/watch?v=sWkGomJ3TLI

OpenAI官方API文檔對Images 2.0給出了一個最高級的評價。


https://developers.openai.com/api/docs/models/gpt-image-2

但真正的故事,并不在數(shù)據(jù)里。

Google了半年

OpenAI總算扳回一局

時間倒回2025年8月。

Google放出了Nano Banana。這個在Gemini里嵌入的圖像生成模型,在C端瞬間引爆。

三個月后的Q3財報會上,Google CEO Sundar Pichai親口披露了一組數(shù)字:Gemini月活,從7月的4.5億漲到10月的6.5億。

Google Labs負(fù)責(zé)人Josh Woodward稱,這一增長很大程度上來自Nano Banana帶動的圖像生成熱潮。

11月,Google再發(fā)Nano Banana Pro。文本渲染能力驚艷,AI圖像第一次能把字寫對,OpenAI在C端被反超。

11月18日,Google再補(bǔ)一刀。Gemini 3發(fā)布即登頂LM Arena,1501分,首個突破1500的前沿模型。

這一月底,奧特曼對全公司發(fā)了一份「紅色警戒」(code red)的內(nèi)部備忘錄。

據(jù)The Information報道,奧特曼私下告訴員工,Gemini 3可能給OpenAI帶來經(jīng)濟(jì)逆風(fēng)。Yahoo Finance后續(xù)披露:code red之下,OpenAI暫停了AI Agent等其他產(chǎn)品的研發(fā),資源全部傾斜到ChatGPT。

12月,OpenAI倉促拿出GPT Image 1.5。Arena第一,但C端沒能引爆。

2026年2月,Google再補(bǔ)一刀,Nano Banana 2登場,Arena再度領(lǐng)先。

OpenAI又輸了一次。

一直到4月21日,GPT Image 2上線,OpenAI這才實現(xiàn)反超,重新扳回一局。

畫圖AI將被重新定義

GPT Image 2憑什么能領(lǐng)先241分?

核心答案藏在架構(gòu)層面。

GPT Image 2不是Stable Diffusion那一代的擴(kuò)散模型。

OpenAI研究負(fù)責(zé)人Boyuan Chen稱這是「revamped from scratch」(從零重構(gòu))的「generalist model」(通用模型),OpenAI的內(nèi)部叫法是「圖像版的GPT」。

但Chen在press briefing時拒絕公開承認(rèn)它具體是擴(kuò)散還是自回歸架構(gòu)。

外界普遍把它理解為「帶推理規(guī)劃的圖像生成系統(tǒng)」:畫之前先規(guī)劃,再下筆。這正是GPT Image 2和上一代圖像模型最大的不同。

OpenAI在官方說明里給了它一個新標(biāo)簽:首個具備原生思考能力的圖像模型(image model with native thinking capabilities)。

畫之前先想、畫完自己檢查、需要時聯(lián)網(wǎng)搜索資料、一次能產(chǎn)出8張前后連貫的圖。

這不是畫筆,是會思考的視覺助理。

Arena榜單分項數(shù)據(jù)顯示:

文字渲染(Text Rendering)單項,GPT Image 2比前代漲了316分;卡通動漫和人像各漲296分;3個產(chǎn)品/3D/寫實分類,整體在+247到+277分區(qū)間。

文字渲染是2025年11月Nano Banana Pro首次解決的問題,但當(dāng)時準(zhǔn)確率94%。GPT Image 2把它推到了99%。


OpenAI發(fā)布會現(xiàn)場演示:讓GPT Image 2畫一碗米飯,其中只有一粒米上寫有模型名字。

具體到能力展示,OpenAI總裁Greg Brockman在自己的X賬號上做了示范。

第一個案例,老照片修復(fù)。


褪色發(fā)黃的家庭老照片,一個提示詞,立刻變身高清彩色版。

OpenAI官方API文檔里那句「high-fidelity image inputs」(高保真圖像輸入),說的就是模型對原圖細(xì)節(jié)的保留能力:輸入端能精確讀取褪色的、破損的、模糊的老照片細(xì)節(jié),輸出端才能重新渲染出清晰版。

第二個案例中,Brockman轉(zhuǎn)發(fā)了用戶@doodlestein的一組測試圖:用同一個復(fù)雜提示詞讓GPT Image 2畫一張數(shù)學(xué)解釋圖。

他評價說,即便是復(fù)雜提示詞,GPT Image 2也能生成風(fēng)格各異的圖。



@doodlestein 測試GPT Image 2用同一個提示詞畫一張線性代數(shù)解釋圖。模型一口氣畫出4個完全不同的版本:同樣是Mona Lisa+特征向量教學(xué),每個版本的構(gòu)圖、配色、信息密度完全不同。

這個案例真正價值不在「能畫數(shù)學(xué)圖」,而是解決了過去兩年中AI生圖的一個重要的痛點:輸出單一、變體可控性差。

GPT Image 2第一次讓「一個prompt給我4個完全不同的方向」變成了產(chǎn)品級能力。

業(yè)內(nèi)一位LM Arena資深測試者點評道:

GPT Image 2和Nano Banana Pro之間的差距,跟Nano Banana Pro和DALL-E之間的差距一樣大。

跨了整整一代。


GPT Image 2 Thinking模式生成的manga風(fēng)格漫畫頁:從一個簡單提示詞出發(fā),模型保持角色一致性、鋪出多格劇情。

DALL-E退役

Adobe Canva被逼到墻角

發(fā)布當(dāng)天,下游工具集成的速度比技術(shù)圈預(yù)期的還快。

Figma、Canva、Adobe Firefly、fal、Hermes Agent,全部在4月21日當(dāng)天完成集成。

API定價更是暗藏殺機(jī):

高質(zhì)量出圖$0.21一張;ChatGPT Plus $20一個月,圖像生成已經(jīng)包含在套餐里。

這個差價背后,可能帶來2026年圖像生成行業(yè)最大的產(chǎn)業(yè)重構(gòu)。


GPT Image 2生成的photorealistic candid(寫實抓拍)。海岸、陰天、復(fù)古車、膠片質(zhì)感——這種過去要專業(yè)攝影師外拍+后期才能達(dá)到的視覺效果,現(xiàn)在API $0.21一張。OpenAI研究員Gabriel Goh說,photorealism是他對這個模型最興奮的能力。

5月12日,DALL-E 2和DALL-E 3正式退役。

它們是2022年開啟了整個AIGC視覺革命的開山祖師。三年后,被OpenAI自家的繼承者,親手送入歷史。

OpenAI在官方發(fā)布說明里提到:

圖像不是裝飾,是語言。一張好圖做的事和一個好句子一樣:選擇、排列、揭示。

這代表了一種產(chǎn)品哲學(xué)的轉(zhuǎn)向。

當(dāng)然,也不是沒有反方聲音。ZDNet在實測中發(fā)現(xiàn),GPT Image 2無法準(zhǔn)確復(fù)刻品牌logo,連ZDNet自己的logo都被畫歪了。

Nano Banana 2在portrait realism和multi-reference一致性上仍有優(yōu)勢。

GPT Image 2雖然還不夠完美,但賽道格局已經(jīng)出現(xiàn)了變化。

渲染時代結(jié)束了

推理時代剛開始

Google把推理塞進(jìn)圖像模型里。OpenAI把圖像工具塞進(jìn)推理模型里。242分Elo差距測的就是二者架構(gòu)上的差異。

implicator.ai的這句評價,劃分了圖像生成的兩個時代。

2022到2025年,是渲染時代。

DALL-E、Midjourney、Stable Diffusion,目標(biāo)都是「畫得像」。模型是畫筆,用戶是畫師,prompt是畫稿。

GPT Image 2代表的是一個推理時代。

模型先思考再下筆,能搜索、能自檢、能完成任務(wù)。它不是畫筆,是會畫畫的助手。

GPT Image 2發(fā)布真正值得重視的,是圖像生成走向「會思考」這件事本身。

短期看,Black Forest Labs(Flux 2)麻煩可能最大。

Kingy AI直言:作為diffusion-first(擴(kuò)散為先)的廠商,F(xiàn)lux 2的整條技術(shù)流水線在架構(gòu)上和「token-by-token」的推理路線是沖突的。

要么融合,要么重寫,沒有第三條路。

中期看,Google可能會在下個季度反擊。Nano Banana 3,或者Imagen-Reason,時間不會太久。

長期看,這件事的影響遠(yuǎn)不止圖像生成。

當(dāng)AI開始用「思考」來產(chǎn)出圖像、視頻、音頻、代碼,整個生成式AI的范式都會跟著發(fā)生變化。

去年12月,奧特曼在備忘錄里敲下「code red」的時候,應(yīng)該沒想到五個月后會以這種方式回到Arena榜首。

但這次反殺的真正意義,可能不是OpenAI贏了Google,而是OpenAI改寫了圖像生成賽道的規(guī)則。


Arena.AI單圖編輯榜(Image Edit Arena):GPT Image 2 (medium) 仍以1510+分繼續(xù)登頂,第二、三、四、五名全部被OpenAI自家模型和Google Gemini系列占據(jù)。https://arena.ai/leaderboard/image-edit

Google下一拳什么時候出?這個問題決定了2026下半年AI格局的走向。

而在那一拳揮出來之前,GPT Image 2會在Arena榜首坐多久,沒人知道。

參考資料:

https://x.com/gdb/status/2048449695622586576

https://arena.ai/leaderboard/image-edit

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
雷克薩斯全新一代ES:依然ES,超「躍」ES

雷克薩斯全新一代ES:依然ES,超「躍」ES

汽車公社
2026-04-27 08:33:46
男子打麻將身體不適倒地昏迷后死亡,家屬起訴棋牌室及經(jīng)營者索賠28萬余元被駁回

男子打麻將身體不適倒地昏迷后死亡,家屬起訴棋牌室及經(jīng)營者索賠28萬余元被駁回

紅星新聞
2026-04-27 19:30:42
5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

老特有話說
2026-04-27 17:43:49
普京將會見伊朗外長

普京將會見伊朗外長

界面新聞
2026-04-27 19:27:26
蔡一杰腦癌已擴(kuò)散,仍堅持草蜢40周年演唱會,眾多大牌明星來捧場

蔡一杰腦癌已擴(kuò)散,仍堅持草蜢40周年演唱會,眾多大牌明星來捧場

攬星河的筆記
2026-04-27 15:12:26
這位派出所長,你瘋了嗎?

這位派出所長,你瘋了嗎?

新海言
2026-04-27 11:01:05
山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

極目新聞
2026-04-27 17:56:03
男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

爆角追蹤
2026-04-27 14:54:06
疑似國產(chǎn)垂直起降戰(zhàn)機(jī)被曝光,或是基于殲20衍生而來

疑似國產(chǎn)垂直起降戰(zhàn)機(jī)被曝光,或是基于殲20衍生而來

烽火觀天下
2026-04-27 11:06:43
從ID. AURA T6開始,拉開一汽-大眾智電2.0新篇章

從ID. AURA T6開始,拉開一汽-大眾智電2.0新篇章

新出行
2026-04-09 17:59:47
天地會逃到海外,成立了一個國家,面積比兩個日本大,至今說漢語

天地會逃到海外,成立了一個國家,面積比兩個日本大,至今說漢語

史之銘
2026-04-27 16:15:05
80歲不管存款多少,記得提前給自己準(zhǔn)備4樣?xùn)|西,建議了解

80歲不管存款多少,記得提前給自己準(zhǔn)備4樣?xùn)|西,建議了解

小談食刻美食
2026-04-27 07:57:04
67歲遲志強(qiáng)現(xiàn)狀:出獄37年后,定居黑龍江,兒子工作令人淚目

67歲遲志強(qiáng)現(xiàn)狀:出獄37年后,定居黑龍江,兒子工作令人淚目

蹲坑看世界
2026-04-25 19:10:38
央視曝光兒童彩妝玩具問題,汕頭澄海區(qū)開展專項整治行動

央視曝光兒童彩妝玩具問題,汕頭澄海區(qū)開展專項整治行動

環(huán)球網(wǎng)資訊
2026-04-27 17:21:34
5月1日全國統(tǒng)一施行:飯局、人情往來、私下轉(zhuǎn)賬,均納入嚴(yán)格監(jiān)管

5月1日全國統(tǒng)一施行:飯局、人情往來、私下轉(zhuǎn)賬,均納入嚴(yán)格監(jiān)管

一口娛樂
2026-04-27 01:04:39
臺灣最新民調(diào)出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態(tài)

臺灣最新民調(diào)出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態(tài)

老頭的傳奇色彩
2026-04-27 12:52:27
血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強(qiáng)拆

血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強(qiáng)拆

奇怪的鯊魚們
2026-04-26 16:32:25
偉偉道來 | 伊朗為什么越來越強(qiáng)硬

偉偉道來 | 伊朗為什么越來越強(qiáng)硬

經(jīng)濟(jì)觀察報
2026-04-27 12:08:53
伊朗稱發(fā)現(xiàn)15枚美軍未爆重型導(dǎo)彈,已送技術(shù)部門逆向研發(fā)仿制

伊朗稱發(fā)現(xiàn)15枚美軍未爆重型導(dǎo)彈,已送技術(shù)部門逆向研發(fā)仿制

紅星新聞
2026-04-27 16:51:19
從內(nèi)地偷運(yùn)51公斤盒飯回澳門?網(wǎng)友:啥盒飯?這么香嗎?

從內(nèi)地偷運(yùn)51公斤盒飯回澳門?網(wǎng)友:啥盒飯?這么香嗎?

寒士之言本尊
2026-04-27 15:10:08
2026-04-27 20:31:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15079文章數(shù) 66814關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

受賄數(shù)額特別巨大、搞權(quán)色交易 副部級王中和被判17年

頭條要聞

受賄數(shù)額特別巨大、搞權(quán)色交易 副部級王中和被判17年

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

教育
本地
藝術(shù)
旅游
公開課

教育要聞

定了!北京又一所學(xué)校官宣放春假!部分學(xué)校今日開始連休9天

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

藝術(shù)要聞

你絕對想不到,攝影能讓她成為女神!

旅游要聞

上海迪士尼游客勸阻男子吸煙反被毆打,沖突可以和解,是非不能模糊!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版