国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

反超Nano Banana!OpenAI旗艦圖像生成模型上線

0
分享至

Jay 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

OpenAI的紅色預(yù)警,還在發(fā)力。

憋了大半年的圖像生成模型——GPT-Image-1.5,終于發(fā)布。

官方表示,本次更新主要有四個亮點:

  • 更嚴(yán)謹(jǐn)?shù)闹噶钭裱?/li>
  • 精確編輯;
  • 細(xì)節(jié)保留;
  • 速度比以前快4倍。

感覺……這是要全面對標(biāo)Nano Banana了啊。

目前的玩法也很類似。比如,將汽車顏色改為橙色。



拯救這個被烤焦的餅。



根據(jù)奶昔架、芝士漢堡等元素,做一個復(fù)古風(fēng)格的餐館廣告。



指令遵守和精確編輯方面,的確比之前強了不少。

而且今天就能用上了,GPT-Image-1.5將在ChatGPT中面向所有用戶推出,并在API中作為GPT Image 1.5推出。

OpenAI最強圖像生成模型

被谷歌一輪正面「拷打」之后,OpenAI藏了大半年的GPT-Image-1.5,終于憋不住了。

這個旗艦級圖像生成模型,主打精準(zhǔn)編輯、細(xì)節(jié)保留,圖像生成速度最高提升4倍。所有改進(jìn),都指向同一個產(chǎn)品理念——實用性

編輯圖像時,GPT-Image-1.5對指令的遵循更加嚴(yán)謹(jǐn):光照、構(gòu)圖、人物外觀等關(guān)鍵要素,能夠在輸入、輸出及多輪編輯中保持高度一致。

例如:生成一張2000年代膠片相機風(fēng)格的照片,畫面中兩名男子和一條狗出現(xiàn)在孩子的生日派對上,神情略顯無聊。



在不改變原始畫面結(jié)構(gòu)的前提下,還可以「加戲」,邀請一群小朋友入鏡搗蛋,整體風(fēng)格與細(xì)節(jié)依然能保持一致。



在圖像風(fēng)格層面,真實感也有了明顯提升。比如下面這個Prompt:

  • 拍攝一張20世紀(jì)70年代倫敦切爾西的場景照片,畫面要逼真,所有景物清晰對焦,人群密集,還有一輛公交車,車身貼著「ImageGen 1.5」的廣告,廣告上印有OpenAI標(biāo)志和「創(chuàng)造你的想象」的副標(biāo)題。整體風(fēng)格像業(yè)余攝影作品,iPhone快照畫質(zhì)……

左邊是新模型,右邊是舊模型,差距還是挺明顯。



即便是更偏創(chuàng)意的任務(wù),同樣能夠穩(wěn)定保留關(guān)鍵信息與人物特征。

  • 根據(jù)這兩位男士的圖片,制作一張名為《Codex》的好萊塢黃金時代電影海報。演員姓名改為Wojciech Zaremba(左)和Greg Brockman(右),由奧特曼執(zhí)導(dǎo),菲吉·西莫制片,AGI影業(yè)出品。



創(chuàng)作一張深海生物在不同深度的海報,采用垂直海洋剖面圖,風(fēng)格為精美細(xì)致的日式動漫風(fēng)格。



前段時間,Nano Banana在答題卡上寫「小作文」的能力火爆全網(wǎng)。GPT也能實現(xiàn)了。

這次,GPT-Image-1.5在文本渲染上進(jìn)步明顯,能夠處理更密集、更小字號的文字。甚至可以根據(jù)給定資料,直接把GPT-5.2的技術(shù)報告做出來了。



除了模型能力的升級,產(chǎn)品形態(tài)也隨之調(diào)整。

OpenAI在ChatGPT中新增了專門的圖片板塊,內(nèi)置數(shù)十種濾鏡與Prompt,可通過App側(cè)邊欄或官網(wǎng)直接訪問。

來到Benchmark環(huán)節(jié),自然少不了「秀肌肉」。

評測機構(gòu)Artificial Analysis指出,GPT-Image-1.5在文本轉(zhuǎn)圖像圖像編輯方面中均位列第一,超過Nano Banana Pro。



不過,在更強調(diào)精細(xì)化圖像編輯能力的GenAI Image Editing Showdown中,GPT-Image-1.5仍未能反超谷歌。

但值得注意的是,其指令遵守率高達(dá)90%,斷層式領(lǐng)先



按照OpenAI的說法,該模型將于今日起面向全球所有ChatGPT用戶與API用戶全面開放。

定價方面,GPT-Image-1.5的API相較上一代GPT Image 1,輸入與輸出成本整體下降20%。

具體價格因分辨率而異:

  • 高質(zhì)量圖像約為每千張133美元;
  • 低質(zhì)量圖像約為每千張9美元。

不得不說,這波谷歌立大功。(doge)

世界理解,還得看香蕉?

「精細(xì)編輯+降價」,OpenAI這次,看來是鐵了心要把圖像功能推向生產(chǎn)力工具。

新模型發(fā)布后,曾任微軟AI副總裁、現(xiàn)就職于OpenAI的Sebastien Bubeck也第一時間下場,為GPT-Image-1.5站臺。



但質(zhì)疑也隨之而來。

有網(wǎng)友指出,GPT-Image-1.5在「理解世界」這一層面,似乎仍不如Nano Banana:

  • 問題太多了。左邊球體中的「線」是由三個不相連的環(huán)組成,每個方程式都有錯……像是在憑感覺做數(shù)學(xué)題?



對此,Sebastien Bubeck解釋道:

  • 這只是做著玩的,如果是正式海報,肯定會在此基礎(chǔ)上迭代。



事實上,對GPT-Image-1.5世界理解能力的質(zhì)疑,并非個例。

AI社區(qū)的知名「內(nèi)部」人士,Jimmy Apples在評測后直言:

  • 相比上一代提升很大,但不如香蕉聰明。



具體而言,他認(rèn)為:如果只是創(chuàng)意性工作,影響不大;但如果是做PPT,GPT-Image-1.5給出的圖片可能會有信息錯誤。

  • Nano Banana感覺更像一個世界模型。


[1]https://x.com/ArtificialAnlys/status/2001016199094948185?s=20
[2]https://x.com/SebastienBubeck/status/2001038641469194588?s=20
[3]https://x.com/apples_jimmy/status/2001053915278926228?s=20
[4]https://genai-showdown.specr.net/image-editing
[5]https://openai.com/index/new-chatgpt-images-is-here/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中亞五國赴日會議,只有托卡耶夫現(xiàn)身,背后隱藏什么秘密?

中亞五國赴日會議,只有托卡耶夫現(xiàn)身,背后隱藏什么秘密?

時時有聊
2025-12-19 07:17:26
翁帆新消息傳來,太令人驚喜了

翁帆新消息傳來,太令人驚喜了

深度報
2025-12-18 22:35:44
本田將暫停在華工廠生產(chǎn)

本田將暫停在華工廠生產(chǎn)

第一財經(jīng)資訊
2025-12-18 13:51:09
一馬當(dāng)先  盤盤古井貢酒·年份原漿古20馬年生肖酒“熱買經(jīng)”

一馬當(dāng)先 盤盤古井貢酒·年份原漿古20馬年生肖酒“熱買經(jīng)”

銠財
2025-12-19 09:55:26
54歲陳松伶減重27斤,皮松臉黑括號紋很深,和老公站一起像兩代人

54歲陳松伶減重27斤,皮松臉黑括號紋很深,和老公站一起像兩代人

娛圈小愚
2025-12-19 10:03:35
日媒還威脅上了:中方若不取消旅游限制,明年春節(jié)將付出慘痛代價

日媒還威脅上了:中方若不取消旅游限制,明年春節(jié)將付出慘痛代價

非凡觀點
2025-12-19 10:19:00
南博文物事件與兩任自殺館長背后的隱秘關(guān)聯(lián)

南博文物事件與兩任自殺館長背后的隱秘關(guān)聯(lián)

聽心堂
2025-12-19 06:59:59
46歲上市公司國盾量子董事長意外去世,官方通報四個字信息量很大

46歲上市公司國盾量子董事長意外去世,官方通報四個字信息量很大

Mr王的飯后茶
2025-12-19 00:02:15
22.13公里!世界最長高速公路隧道將于月底通車

22.13公里!世界最長高速公路隧道將于月底通車

每日經(jīng)濟新聞
2025-12-18 23:55:06
“日入過萬”的16歲深圳燒雞少年壓力來了!稱每天到手只有1000多

“日入過萬”的16歲深圳燒雞少年壓力來了!稱每天到手只有1000多

火山詩話
2025-12-19 11:47:47
羅永浩又開炮!開通1000兆寬帶下載只有90多兆,上海電信壓力來了

羅永浩又開炮!開通1000兆寬帶下載只有90多兆,上海電信壓力來了

火山詩話
2025-12-19 06:40:20
88比11!CBA最懸殊的比分誕生了:籃協(xié)看到這一幕后該懵了?

88比11!CBA最懸殊的比分誕生了:籃協(xié)看到這一幕后該懵了?

籃球快餐車
2025-12-19 01:21:14
“南京博物院藏仇英名作現(xiàn)身拍賣市場”追蹤

“南京博物院藏仇英名作現(xiàn)身拍賣市場”追蹤

新華社
2025-12-19 00:20:41
反轉(zhuǎn)反轉(zhuǎn)再反轉(zhuǎn)!狄龍自殺式防守送勇士兩罰1擲 太陽最后罰球絕殺

反轉(zhuǎn)反轉(zhuǎn)再反轉(zhuǎn)!狄龍自殺式防守送勇士兩罰1擲 太陽最后罰球絕殺

Emily說個球
2025-12-19 12:45:42
韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質(zhì)的中國籍綁匪

韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質(zhì)的中國籍綁匪

環(huán)球熱點快評
2025-12-18 11:43:15
高標(biāo)準(zhǔn)梯田(農(nóng)田)荒廢的背后 完全不切實際一場鬧劇

高標(biāo)準(zhǔn)梯田(農(nóng)田)荒廢的背后 完全不切實際一場鬧劇

原某報記者
2025-12-17 14:31:27
太平天國最大貢獻(xiàn):一場14年的“外科手術(shù)”,掏空清廷統(tǒng)治根基

太平天國最大貢獻(xiàn):一場14年的“外科手術(shù)”,掏空清廷統(tǒng)治根基

遠(yuǎn)方風(fēng)林
2025-12-18 23:49:15
北京一男子養(yǎng)五步蛇當(dāng)寵物,因蛇生病無法進(jìn)食,手動喂食時被咬致截肢

北京一男子養(yǎng)五步蛇當(dāng)寵物,因蛇生病無法進(jìn)食,手動喂食時被咬致截肢

大風(fēng)新聞
2025-12-19 08:36:10
涉及大量知名人士!民主黨人公布新一批愛潑斯坦案相關(guān)照片,特朗普、白宮回應(yīng)

涉及大量知名人士!民主黨人公布新一批愛潑斯坦案相關(guān)照片,特朗普、白宮回應(yīng)

環(huán)球網(wǎng)資訊
2025-12-13 10:34:17
最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

環(huán)球網(wǎng)資訊
2025-12-19 09:39:20
2025-12-19 13:15:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11879文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

頭條要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
手機
公開課

藝術(shù)要聞

諸樂三的寫意花鳥

親子要聞

很多家長問支具鋁板是什么,名字叫指鋁板,網(wǎng)上都能搜到

旅游要聞

北京周末可往返!賞冰雪、涮暖鍋、逛大集……官方推薦攻略來了→

手機要聞

蘋果客服回應(yīng)“內(nèi)存用完致iPhone損壞”:建議及時清理并備份數(shù)據(jù)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版