国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

實(shí)測GPT Image 1.5,拼盡全力還是沒能打敗Banana。

0
分享至

在Google的Banana淫威之下。

OpenAI憋了很久之后,終于把他們的圖片生成模型給掏出來了。


看一下他們的宣傳視頻。

突然想起了今年3月26號(hào)的時(shí)候,OpenAI第一次掏出GPT-4o的生圖模型,也就是GPT Image 1.0,然后同天,Google發(fā)布了 Gemini 2.5 Pro,事后看,Gemini 2.5 Pro肯定是一個(gè)偉大的模型。

但是那一天的時(shí)候,在整個(gè)X上、各種群里,大家討論的全部是GPT-4o。

那時(shí)候,我們說, 1.5 Pro被Sora淹,2.5 Pro被4o淹。

結(jié)果半年過去,風(fēng)水輪流轉(zhuǎn),現(xiàn)在屬于OpenAI天天被Google摁在地上打。。。

所以這一次,不是傳聞中的GPT Image 2.0,跟Nano Banana Pro一樣,用了一個(gè)小版本號(hào)去升級(jí),用了1.5。

有一種感覺,就是怕被Google打臉。。。

半年前,OpenAI意氣風(fēng)發(fā),誰能想到,如今是這樣的結(jié)局。

跟隨著新模型的上線,ChatGPT上,也上了一個(gè)全新的圖像界面。


點(diǎn)開以后,是這個(gè)樣子的。

就是這個(gè)粉粉的背景色,放在深色模式下,真的不好看。


OpenAI其實(shí)明顯感覺到,在C端體驗(yàn)上,做的確實(shí)還是比Google更上心,把風(fēng)格和部分的快捷指令,單獨(dú)拎了出來。

比如我們選中這個(gè)躺曲奇風(fēng)格。


在點(diǎn)擊以后,會(huì)彈出一個(gè)彈窗,讓你選擇最近你發(fā)給ChatGPT的圖片,或者上傳一個(gè)圖片。


我就傳了了我的那個(gè)AI固定模特染夏,就是那個(gè)粉頭發(fā)的妹子。


然后,他真的,就把我的圖片,和這一段默認(rèn)的Prompt,直接以對(duì)話的形式,發(fā)給了ChatGPT。

說實(shí)話,這個(gè)交互設(shè)計(jì)的體驗(yàn)真的并不是很好,各個(gè)界面跳來跳去,非常混亂。。。

不過生成的速度確實(shí)比之前有提升,測了一下,在ChatGPT上,大概40s到1分鐘不等。

在這個(gè)時(shí)間之后,你就能得到一個(gè),糖曲奇風(fēng)格的小圖了。


當(dāng)然,還有毛絨玩具風(fēng)格的。


除了快速轉(zhuǎn)風(fēng)格之外,也有一些快捷的操作預(yù)設(shè)。

比如創(chuàng)建專業(yè)產(chǎn)品照片、拍攝專業(yè)求職照片等等。


交互也都是一樣的,點(diǎn)開以后,傳圖,選擇。

比如,給染夏做一張,專業(yè)求職照片。


做出來的效果,確實(shí)也挺真誠。


也可以,直接用模板,變成名畫。


就是這個(gè)臉部,缺失了一些筆觸的風(fēng)格,變得過于平整了。

而模型本體能力上,在我測了一夜之后,還是發(fā)現(xiàn)有些比較可圈可點(diǎn)比較好玩的地方。

這次,我想讓X個(gè)跟Nano Banana Pro直接對(duì)比的案例,讓大家直觀的感受一下,他的特點(diǎn)和邊界,以及跟Nano Banana Pro孰強(qiáng)孰弱。

一. 信息準(zhǔn)確性

文字準(zhǔn)確性,絕對(duì)是現(xiàn)在的多模態(tài)AI繪圖模型,大家最為關(guān)注的。

所以,我們首先開始,肯定先看這個(gè)。

Prompt:生成一張桌面月歷照片,標(biāo)題必須逐字 "2026年2月",下方是標(biāo)準(zhǔn)7列表格(日一二三四五六)并填入日期1–28,要求網(wǎng)格對(duì)齊、數(shù)字清晰,除標(biāo)題與日期外不加其他字。


左邊是GPT Image 1.5,右邊是Banana Pro。

上來第一個(gè)case,GPT就拉了坨大的,我要求是只寫到28,Banana精準(zhǔn)的執(zhí)行了任務(wù),所有的數(shù)字都是對(duì)的,但是GPT在寫到28后沒有停止,又重復(fù)了一個(gè)28,然后寫了29和31,這就是完全的錯(cuò)誤了。

Prompt(來自@卡爾的AI沃茨):生成一張3:4的圖片,畫面上方用書法寫著一首完整的《茅屋秋風(fēng)所破歌》,內(nèi)容是【完整全文】,每個(gè)字上方都要標(biāo)注上漢語拼音,同時(shí)畫面內(nèi)容主要用水墨畫的形式展示這首詩所表達(dá)的情景。


兩邊各有各的拉,GPT你完全不不知道他在寫個(gè)啥,中文完全崩成了一坨跟鬼畫符一樣。右邊中文倒是寫的很不錯(cuò),只有個(gè)別字拉了,但是不知道為什么Prompt要求的是上面掛拼音,寫著寫著就腦袋頂上就掛了個(gè)中文字?而且排版確實(shí)不好看。

Prompt:為我生成蘇繡工藝的詳細(xì)解說圖,配上詳細(xì)的中文知識(shí)解析。


GPT的中文字翻車的比較狠,而且信息圖的展示沒有Banana清晰,有很多無關(guān)內(nèi)容硬生生的塞進(jìn)去了。

Prompt:這個(gè)模特的Instagram動(dòng)態(tài)界面,3:4。

這里我是把染夏的照片扔過去了。


GPT完全沒有畫出 Instagram上任何信息,emoji還畫錯(cuò)了,Banana對(duì)界面的理解畫的非常的精準(zhǔn),雖然人物一致性上有很多問題,但是在信息準(zhǔn)確性上,還是要強(qiáng)出好幾個(gè)檔次。

綜合來看,在信息準(zhǔn)確性上,GPT Image 1.5,確實(shí)是不如Banana Pro,而在中文字上,有非常明顯的差距,Banana Pro的中文字還是很穩(wěn)的。

二. 真實(shí)質(zhì)感

這一趴,來看直接生成的照片質(zhì)感,看看誰的效果更加的真實(shí)。

Prompt:年輕白皙膚色的年輕女性肖像照:皮膚帶自然紅暈、鼻子與臉頰無雀斑。短款灰褐色波波頭,中分層次,幾縷松散發(fā)絲垂在臉側(cè);淺棕色眼睛、卷曲睫毛、飽滿有光澤的粉色嘴唇,鼻中隔穿刺。表情俏皮淘氣:眨一只眼、吐舌頭、可愛搞怪。保留她皮膚/面部/手部可見的原始紋身細(xì)節(jié)。她隨意坐在吧臺(tái)凳上,穿黑色背心,外搭淺藍(lán)/白/黑格紋法蘭絨襯衫(敞開或披著),下穿牛仔迷你裙,系小黑色腰帶。左手自然下垂,手里夾著一支點(diǎn)燃的香煙。場景為昏暗的戶外或半戶外酒吧/酒館/夜店:石質(zhì)或金屬質(zhì)感的圓桌與吧凳;桌上有一只裝滿飲料的玻璃杯、一個(gè)玻璃水壺、以及一包香煙(Gudang Garam Surya 16)。背景虛化,隱約可見坐著的人與夜晚氛圍燈光。拍攝為高角度俯拍(從上往下看主體),強(qiáng)烈直射閃光燈,人物后方產(chǎn)生銳利陰影,皮膚明亮略微過曝。整體風(fēng)格:隨手快照、Y2K 美學(xué)、街頭風(fēng)、垃圾搖滾、閃光攝影。3:4,真實(shí)膠片質(zhì)感、輕微噪點(diǎn)、淺景深。


語義理解這兩家確實(shí)都很強(qiáng),提到的所有元素幾乎全部實(shí)現(xiàn)了,在質(zhì)感上,GPT的圖會(huì)更加AI更加油膩一些,Banana Pro會(huì)更真實(shí)一點(diǎn)。

Prompt:生成一張照片級(jí)抓拍:一位年邁水手站在小漁船上整理漁網(wǎng),旁邊有一只狗安靜坐著。要求可見真實(shí)皮膚紋理(皺紋、毛孔、日曬痕)、衣物磨損與鹽漬;自然海邊日光。鏡頭語言:50mm,中近景,平視,淺景深,輕微膠片顆粒;不擺拍、不精修;3:4。


這兩家基本打個(gè)平手,但是GPT的飽和度和對(duì)比度總是更強(qiáng)一些,Banana Pro會(huì)更日常一些。

Prompt:生成一張照片級(jí)真實(shí)抓拍:演出后臺(tái)化妝間。 場景: 一排帶燈泡的化妝鏡,桌面有散亂的化妝刷、發(fā)夾、水杯、紙巾; 光源為鏡前燈泡(暖)+室內(nèi)頂燈(中性),混合光真實(shí)。 主體: 至少6位演員/工作人員: 前景:一位坐著化妝,化妝師在旁邊補(bǔ)妝(手部動(dòng)作清楚); 中景:兩位在整理衣服與耳返; 鏡子里必須能看到與現(xiàn)實(shí)一致的反射(人數(shù)、姿態(tài)、位置匹配,不能憑空多出人或少人)。 攝影參數(shù)/構(gòu)圖: 50mm,f/1.8,1/160s,ISO 2500;中近景;淺景深。


GPT還是那個(gè)問題,對(duì)比度和飽和度都有點(diǎn)高,整體色彩會(huì)看著有一點(diǎn)AI感,整體上,我個(gè)人還是喜歡Banana Pro的質(zhì)感一些。

更為自然。

三.精準(zhǔn)編輯

測一下用嘴改圖的能力,這次GPT不是說,自己的精準(zhǔn)編輯能力更強(qiáng)了嗎。

第一個(gè)case就是換內(nèi)容。

比較簡單。

比如,把這個(gè)發(fā)布會(huì)的奧特曼,替換成染夏。


效果是這樣的。


從光影感覺,人物比例和透視,Banana Pro更勝一籌,第一個(gè)的燃夏身上的衣服的光影明顯就不對(duì),然后明明是個(gè)圓桌,染夏是更靠近鏡頭的,所以肯定會(huì)顯得大一點(diǎn),原來的奧特曼也是這樣,這就是最基本的近大遠(yuǎn)小。

但是GPT做的圖,你會(huì)發(fā)現(xiàn),染夏跟中間的老哥直接平齊了,沒有前后關(guān)系了。

然后就是更復(fù)雜一點(diǎn)的,跨畫風(fēng)做替換,還替換天氣。


圖1的人物的衣服替換成圖2角色的衣服,其他不變。天氣變成小雨,3:4。


這時(shí)候,兩邊的處理差距就挺大了。


雖然Banana的人臉保持也有一點(diǎn)問題,不太像了,但是整體肯定是比GPT要好的,我只替換服裝,然后下雨,沒讓你把畫風(fēng)和色調(diào)也遷移過去啊。

還有換衣服。

比如我想給染夏的這張照片,換一些別的服裝。


結(jié)果是這樣。


GPT直接把我衣服改了,變成了還有一件內(nèi)搭,這個(gè)肯定不對(duì)的,Banana Pro是正確的。

還有一個(gè)@-Zho-佬的Prompt,就是讓3個(gè)角色,用夸張的造型合影。

我找了3個(gè)角色。


Prompt: 三人在 鏡前 頂視角 擺出夸張姿勢合影。


有一說一,這張整體的構(gòu)圖和感覺,我覺得GPT更好一點(diǎn),GPT只丟了鏡前這一個(gè)信息,但是Banan Pro丟了頂視角和鏡前兩個(gè)信息,而且姿勢也沒那么夸張。

綜合來看,我覺得整體上,還是Banana在一致性、精準(zhǔn)度上,還是會(huì)更甚一籌。

四. 世界知識(shí)

我最喜歡的一個(gè)案例,就還是海賊王排名。


這塊從設(shè)計(jì)角度來說,確實(shí)左邊的GPT會(huì)更有張力,包括風(fēng)格上,也更好看,戰(zhàn)力的排序我就不多說了,這個(gè)見仁見智,但是就是有一個(gè)非常明顯的知識(shí)錯(cuò)誤,就是第十名,紅犬庫贊是什么鬼???

人叫赤犬,真名叫薩卡斯基。庫贊是青雉。。。這就是完全的錯(cuò)誤了。

右邊目前看著沒啥硬傷,頭像都能對(duì)得上。

還有一個(gè)@卡爾的AI沃茨的Prompt,也很有意思:

用一組圖,描繪公元前260年5月至10月之間,東經(jīng)112°41到113°09′,,北緯35°39′到35°59′ 發(fā)生的事情,并給出詳細(xì)的信息圖,圖上要用中文說明發(fā)生了什么事情,以及結(jié)果的重要信息。


這個(gè)地方呢,讓GPT-5.2自己來判斷一下。

它自己說:


我選Banana Pro。。。

不過坦率的講,差距并不大,至少不會(huì)有錯(cuò)誤。

還有一個(gè)非常搞的。

Prompt:創(chuàng)建一個(gè)包含以下內(nèi)容的正方形圖像:一只手有七根手指,一面顯示時(shí)間為8:22的掛鐘,一杯裝滿紅酒的玻璃杯。


這塊是讓我非常驚喜的,GPT Image 1.5把時(shí)間畫對(duì)了,除了那個(gè)時(shí)針應(yīng)該在上去一點(diǎn),分針是正確的,然后7根手指,畫成了6根手指。

而Banana Pro,在這地方就翻了個(gè)大車,手和始終全部失敗了。

所以,在世界知識(shí)這塊,我覺得還是比較能打個(gè)平手的,各有勝負(fù)。

花了一個(gè)通宵的時(shí)間,把GPT Image 1.5測了個(gè)大概。

不算差,但是肯定也不能說是特別好,跟Banana Pro比,在很多地方,還是有一些不足的。

而且自從3月份發(fā)布,OpenAI憋了半年,才憋出來個(gè)這個(gè)。

而Google,最恐怖的是,Gemini 2.5的畫圖,花了3個(gè)月進(jìn)化到了Banana,Banana又花了3個(gè)月,進(jìn)化成了Banana Pro。

這家公司的進(jìn)化速度,還是太恐怖了。

Google,不愧是現(xiàn)如今,AI的王。

這次,該輪到OpenAI,奮起直追了。

以上,既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗總統(tǒng):美國和以色列教唆“暴亂者”制造動(dòng)蕩,政府決心解決好經(jīng)濟(jì)困難

伊朗總統(tǒng):美國和以色列教唆“暴亂者”制造動(dòng)蕩,政府決心解決好經(jīng)濟(jì)困難

證券時(shí)報(bào)e公司
2026-01-11 20:15:27
四川這次動(dòng)真格了?2026開年3個(gè)月大掃除,買藥吃飯都盯得死死的

四川這次動(dòng)真格了?2026開年3個(gè)月大掃除,買藥吃飯都盯得死死的

王曉愛體彩
2026-01-11 14:07:19
爆冷!哈登19+7+7,賽后小卡走入通道,康寧漢姆一把抱住哈登

爆冷!哈登19+7+7,賽后小卡走入通道,康寧漢姆一把抱住哈登

擔(dān)酒
2026-01-11 11:14:19
馬琳,朱雨玲解題了!王曼昱輸給的同個(gè)對(duì)手,她為何能4-2拿下?

馬琳,朱雨玲解題了!王曼昱輸給的同個(gè)對(duì)手,她為何能4-2拿下?

曹老師評(píng)球
2026-01-11 18:46:54
原來,重復(fù)到極致就是天賦! 重復(fù)熟練,熟能生巧

原來,重復(fù)到極致就是天賦! 重復(fù)熟練,熟能生巧

夜深愛雜談
2026-01-06 21:05:20
烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們?cè)斐?.0

烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們?cè)斐?.0

博覽歷史
2025-12-29 19:26:45
林詩棟被韓乒悍將的氣勢壓倒,無緣男單決賽,國乒男隊(duì)全軍覆沒

林詩棟被韓乒悍將的氣勢壓倒,無緣男單決賽,國乒男隊(duì)全軍覆沒

湘楚風(fēng)云
2026-01-11 20:17:10
原本都是丹麥海外領(lǐng)地,為何格陵蘭島沒有獨(dú)立,冰島實(shí)現(xiàn)了獨(dú)立?

原本都是丹麥海外領(lǐng)地,為何格陵蘭島沒有獨(dú)立,冰島實(shí)現(xiàn)了獨(dú)立?

世界縱橫說
2026-01-10 12:52:14
郭臺(tái)銘赴美建廠血虧675億,如今帶回46臺(tái)光刻機(jī),來求賞飯?

郭臺(tái)銘赴美建廠血虧675億,如今帶回46臺(tái)光刻機(jī),來求賞飯?

商悟社
2026-01-11 03:56:05
建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

文史季季紅
2026-01-10 16:30:03
55歲的我,在除夕夜當(dāng)眾宣布離婚,嫌棄了我大半輩子的婆婆急眼了

55歲的我,在除夕夜當(dāng)眾宣布離婚,嫌棄了我大半輩子的婆婆急眼了

徐俠客有話說
2025-11-21 11:21:59
茅臺(tái)到底什么時(shí)候崩盤?1399不是底,是崩盤的開始

茅臺(tái)到底什么時(shí)候崩盤?1399不是底,是崩盤的開始

玉辭心
2026-01-11 17:44:25
太原多人放煙花引燃上百個(gè)全新充電樁,記者實(shí)探:事發(fā)地雜草叢生,圍擋上張貼了“禁止燃放煙花”告示

太原多人放煙花引燃上百個(gè)全新充電樁,記者實(shí)探:事發(fā)地雜草叢生,圍擋上張貼了“禁止燃放煙花”告示

極目新聞
2026-01-08 21:59:09
2025年,這些廣東的大廠停工停產(chǎn)了。。

2025年,這些廣東的大廠停工停產(chǎn)了。。

微微熱評(píng)
2026-01-10 00:19:12
曝庫皮揚(yáng)斯克數(shù)百俄軍被包圍后投降!烏軍摧毀俄羅斯軍船

曝庫皮揚(yáng)斯克數(shù)百俄軍被包圍后投降!烏軍摧毀俄羅斯軍船

項(xiàng)鵬飛
2026-01-10 20:46:46
國家終于出手了!不僅李梓萌被牽連,全紅嬋、靳東、成龍都沒逃過

國家終于出手了!不僅李梓萌被牽連,全紅嬋、靳東、成龍都沒逃過

大黑愛旅游
2026-01-09 21:11:53
2026年1月存款利率大改!1萬元存一年利息多少?我算透了說實(shí)在的

2026年1月存款利率大改!1萬元存一年利息多少?我算透了說實(shí)在的

星辰宇的不羈
2026-01-11 10:01:20
日本知名巨頭退出中國內(nèi)地市場,平價(jià)品牌狂奔,有門店日排隊(duì)3000桌

日本知名巨頭退出中國內(nèi)地市場,平價(jià)品牌狂奔,有門店日排隊(duì)3000桌

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-01-10 12:58:46
孟賀談為何麻六記酸辣粉為何賣不動(dòng)?缺失真誠,沒了大S的流量

孟賀談為何麻六記酸辣粉為何賣不動(dòng)?缺失真誠,沒了大S的流量

小徐講八卦
2026-01-11 18:09:10
美國軍嫂被ICE特工當(dāng)街槍殺,現(xiàn)年37歲,是美國公民,也是一名已故美國軍人的妻子

美國軍嫂被ICE特工當(dāng)街槍殺,現(xiàn)年37歲,是美國公民,也是一名已故美國軍人的妻子

臺(tái)州交通廣播
2026-01-08 22:17:30
2026-01-11 21:11:02
數(shù)字生命卡茲克 incentive-icons
數(shù)字生命卡茲克
反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
436文章數(shù) 490關(guān)注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對(duì)勸阻者出言不遜

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對(duì)勸阻者出言不遜

體育要聞

詹皇曬照不滿打手沒哨 裁判報(bào)告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣平臺(tái)"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補(bǔ)貼后9.98萬起

態(tài)度原創(chuàng)

數(shù)碼
健康
游戲
房產(chǎn)
公開課

數(shù)碼要聞

ECS精英推出Liva Z系列迷你主機(jī),多CPU可選

這些新療法,讓化療不再那么痛苦

《GTA6》注定創(chuàng)造歷史 但難復(fù)刻十年前午夜首發(fā)情懷

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版