国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nano Banana不會應(yīng)試!指標(biāo)拉垮,視覺效果驚艷,實(shí)測14個(gè)任務(wù)

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】最新報(bào)告探討了生成式模型Nano Banana Pro在低層視覺任務(wù)中的表現(xiàn),如去霧、超分等,傳統(tǒng)上依賴PSNR/SSIM等像素級指標(biāo)。研究發(fā)現(xiàn),Nano Banana Pro在視覺效果上更佳,但傳統(tǒng)指標(biāo)表現(xiàn)欠佳,因生成式模型更追求語義合理而非像素對齊。報(bào)告還提出改進(jìn)方向和新評測范式的思考,強(qiáng)調(diào)生成式模型雖有潛力,但與專用模型仍有差距。

過去幾年,文本生成圖像(T2I)與多模態(tài)生成式模型的能力突飛猛進(jìn),已經(jīng)能穩(wěn)定地產(chǎn)生高質(zhì)量、具備細(xì)節(jié)與語義一致性的圖像內(nèi)容。

報(bào)告關(guān)注的核心矛盾在于:這些「擅長生成」的模型,是否也能在傳統(tǒng)低層視覺任務(wù)中充當(dāng)通用求解器(generalist)?

低層視覺(low-level vision)通常強(qiáng)調(diào)對圖像退化的「精確逆過程」:例如去霧、超分、去噪、去雨、去模糊、去反射、去光暈等。

這類任務(wù)的經(jīng)典評價(jià)方式往往依賴 PSNR/SSIM 等參考指標(biāo),強(qiáng)調(diào)像素級一致性。但生成式模型天生帶有「補(bǔ)全/重建」的傾向:它們可能會依據(jù)先驗(yàn)去「合理地編造」高頻細(xì)節(jié),從人眼觀感看更清晰、更「像真的」,卻在像素對齊意義上偏離GT。

華中科技大學(xué)的研究人員最近發(fā)布了一篇報(bào)告,把這種沖突概括為「人類感知偏好 vs. 傳統(tǒng)指標(biāo)導(dǎo)向」的張力。


項(xiàng)目主頁:https://lowlevelbanana.github.io

論文鏈接:https://arxiv.org/abs/2512.15110

開源倉庫:https://huggingface.co/datasets/jlongzuo/LowLevelEval

報(bào)告中提出一個(gè)非常直接的問題:Nano Banana Pro能否成為低層視覺全能選手?

報(bào)告采用了一個(gè)刻意「極簡」的使用范式:不訓(xùn)練、不微調(diào),只用「輸入圖 + 簡單文本 prompt」直接讓Nano Banana Pro輸出結(jié)果,對其進(jìn)行zero-shot基準(zhǔn)評測。

零樣本+文本提示

14個(gè)低層任務(wù)的系統(tǒng)基準(zhǔn)

研究人員把評測擴(kuò)展到14個(gè)低層視覺任務(wù)、40個(gè)數(shù)據(jù)集,覆蓋三大類能力:圖像恢復(fù)(restoration)、圖像增強(qiáng)(enhancement)、圖像融合(fusion)。


任務(wù)清單包括:Dehazing、Super-Resolution、Deraining、Deshadowing、Motion Deblur、Defocus Deblur、Denoising、Reflection Removal、Flare Removal、Low-Light Enhancement、Underwater Enhancement、HDR Imaging、Multi-focus Fusion、Infrared-Visible Fusion;

圖中用顏色區(qū)分了restoration / enhancement / fusion三類任務(wù)。

保守估測性能

報(bào)告特別強(qiáng)調(diào):當(dāng)前結(jié)論是對模型能力的保守估計(jì),即研究人員沒有做精細(xì) prompt tuning,也沒有用多輪推理去「挑選最好看的輸出」,而是用固定、簡單的提示詞來模擬一種更接近「普通用戶上手」的用法。

閉源模型的評測約束

在一些任務(wù)章節(jié)里,研究人員也說明了評測工程細(xì)節(jié):由于模型以API方式調(diào)用且閉源,無法做任務(wù)定制訓(xùn)練;并且生成輸出分辨率可能固定在約1024尺度,因此需要將輸出resize回與GT一致的分辨率再計(jì)算指標(biāo),以保證定量比較盡量公平。

視覺「更好看」

但指標(biāo)「更差」

報(bào)告最重要的結(jié)論可以概括為一句話:

Nano Banana Pro在主觀視覺質(zhì)量上往往更討好,但在PSNR/SSIM等傳統(tǒng)參考指標(biāo)上整體落后于專用模型。

研究人員將其歸因于生成式模型的內(nèi)在屬性:生成式模型更傾向于追求「語義可信/感知合理」,而非嚴(yán)格的像素級對齊;同時(shí)模型輸出帶有隨機(jī)性(stochasticity),使得穩(wěn)定性與可復(fù)現(xiàn)性也成為部署障礙。

系統(tǒng)性現(xiàn)象:感知質(zhì)量與指標(biāo)不一致

以Flare Removal為例,研究人員觀察到一種非常典型的現(xiàn)象:有些樣本視覺上已經(jīng)「挺干凈、挺舒服」,但因?yàn)榱炼?顏色等與GT存在偏差,量化分?jǐn)?shù)依然不高,這反映了像素級指標(biāo)對生成式增強(qiáng)的懲罰機(jī)制。


同時(shí),研究人員也指出生成模型存在「高上限、低下限」的特征:在合適輸入上,它可能在細(xì)節(jié)恢復(fù)上超過 SOTA,但這種優(yōu)勢會被擴(kuò)散/生成模型的隨機(jī)性與語義漂移所抵消,出現(xiàn)明顯方差與語義幻覺,prompt 工程也只能部分緩解,難以保證工業(yè)級確定性。

穩(wěn)健但不極致:生成式模型有時(shí)會選擇更保守的輸出

在低光增強(qiáng)(Low-Light Enhancement)的分析中,研究人員給出另一個(gè)視角:

Nano Banana Pro可能不太會引入顯著的光暈、結(jié)構(gòu)破壞、嚴(yán)重色偏等「災(zāi)難性偽影」,這使得它在某些實(shí)際應(yīng)用中具備吸引力;

但它也會出現(xiàn)亮度控制不一致、對prompt敏感、以及與benchmark的GT定義不完全匹配等問題,因此整體仍難以與專用方法競爭。


更進(jìn)一步,報(bào)告還給出可能的改進(jìn)方向:更具體的prompt設(shè)計(jì)、few-shot示例對齊、輕量適配/微調(diào)、以及把統(tǒng)一多模態(tài)模型與任務(wù)模塊結(jié)合的混合范式。

報(bào)告貢獻(xiàn)與意義:它不只是在「打分」,而是在推動(dòng)重新定義評測與目標(biāo)

這份報(bào)告的價(jià)值不止在于給Nano Banana Pro下結(jié)論,更在于它把一個(gè)長期存在但常被忽略的問題擺到臺面上:

  • 當(dāng)生成式模型進(jìn)入低層視覺后,「像素一致性」是否仍是唯一目標(biāo)?

  • 傳統(tǒng)指標(biāo)是否在系統(tǒng)性地誤導(dǎo)我們對生成式恢復(fù)/增強(qiáng)的判斷?

  • 是否需要能同時(shí)刻畫「感知質(zhì)量 + 結(jié)構(gòu)/語義穩(wěn)定性 + 像素保真」的新評測范式?

報(bào)告明確指出:Nano Banana Pro作為零樣本低層視覺求解器,已經(jīng)是一個(gè)很強(qiáng)的 baseline,并展示出跨任務(wù)的「泛化潛力」;但要達(dá)到專用模型那種高保真、可控、穩(wěn)定的水準(zhǔn)仍有明顯鴻溝。

參考資料:

https://arxiv.org/abs/2512.15110

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
做最壞打算!中國055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

做最壞打算!中國055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

時(shí)時(shí)有聊
2026-01-08 07:28:37
終于輪到日本“強(qiáng)烈抗議”:130年了,日本從未像今天這樣憋屈

終于輪到日本“強(qiáng)烈抗議”:130年了,日本從未像今天這樣憋屈

小陳講史
2026-01-08 11:57:03
新年第一瓜,老王的小嬌妻留不住了!

新年第一瓜,老王的小嬌妻留不住了!

仕道
2026-01-07 10:29:10
江蘇調(diào)查組在徐湖平別墅搜出啥?太離譜!

江蘇調(diào)查組在徐湖平別墅搜出啥?太離譜!

鶴羽說個(gè)事
2026-01-07 11:06:57
雷軍的道歉,打了多少友軍的臉

雷軍的道歉,打了多少友軍的臉

此地?zé)o言
2026-01-06 23:39:23
朱芳雨上訴成功!籃協(xié)官宣認(rèn)錯(cuò),漏判山西兩違體,迪亞洛逃過一劫

朱芳雨上訴成功!籃協(xié)官宣認(rèn)錯(cuò),漏判山西兩違體,迪亞洛逃過一劫

多特體育說
2026-01-08 21:17:30
iPhone 官方半價(jià)換電池,釘子戶終于等到了!

iPhone 官方半價(jià)換電池,釘子戶終于等到了!

黑貓科技迷
2026-01-07 23:57:35
1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個(gè)不留!

1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個(gè)不留!

寄史言志
2026-01-07 20:37:09
刺激!蘋果突然官宣:1月8日,新品正式發(fā)售!

刺激!蘋果突然官宣:1月8日,新品正式發(fā)售!

科技堡壘
2026-01-06 11:41:33
遲到的父愛也是愛!成龍向女兒拋橄欖枝,吳卓林回應(yīng)已回香港創(chuàng)業(yè)

遲到的父愛也是愛!成龍向女兒拋橄欖枝,吳卓林回應(yīng)已回香港創(chuàng)業(yè)

代軍哥哥談娛樂
2026-01-07 11:55:28
強(qiáng)大德軍成片凍死在莫斯科時(shí),為何不燒樹木取暖?蘇聯(lián)人做法很絕

強(qiáng)大德軍成片凍死在莫斯科時(shí),為何不燒樹木取暖?蘇聯(lián)人做法很絕

云霄紀(jì)史觀
2026-01-06 01:56:08
美國扣押一艘與委內(nèi)瑞拉有關(guān)、懸掛俄羅斯旗幟的石油運(yùn)輸船,外交部回應(yīng)

美國扣押一艘與委內(nèi)瑞拉有關(guān)、懸掛俄羅斯旗幟的石油運(yùn)輸船,外交部回應(yīng)

環(huán)球網(wǎng)資訊
2026-01-08 15:38:17
4萬元/根,一盒內(nèi)存條堪比上海一套房

4萬元/根,一盒內(nèi)存條堪比上海一套房

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-01-07 14:58:12
外交部:美方在公海海域隨意扣押他國船只嚴(yán)重違反國際法

外交部:美方在公海海域隨意扣押他國船只嚴(yán)重違反國際法

澎湃新聞
2026-01-08 15:36:26
從警30多年的“老公安”秦書偉,任上被查

從警30多年的“老公安”秦書偉,任上被查

中國青年報(bào)
2026-01-08 20:13:07
57歲伊能靜曬泳裝蜂腰翹臀,胸部打碼引秦昊生理性心動(dòng)

57歲伊能靜曬泳裝蜂腰翹臀,胸部打碼引秦昊生理性心動(dòng)

王投吃吃喝喝
2026-01-08 00:15:39
成都女子賣“許愿蠟燭”被跨省抓捕,控訴遼源警方“遠(yuǎn)洋捕撈”

成都女子賣“許愿蠟燭”被跨省抓捕,控訴遼源警方“遠(yuǎn)洋捕撈”

浪花說法
2026-01-08 09:06:25
鄭爽近照越來越像媽媽!首曝居住環(huán)境消費(fèi)嚴(yán)重降級,衣服只要200

鄭爽近照越來越像媽媽!首曝居住環(huán)境消費(fèi)嚴(yán)重降級,衣服只要200

娛圈小愚
2026-01-08 10:29:36
古天樂被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

古天樂被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

封面新聞
2026-01-08 09:37:07
林建岳母親余寶珠101歲了,只認(rèn)前兒媳謝玲玲,四代同堂為她慶生

林建岳母親余寶珠101歲了,只認(rèn)前兒媳謝玲玲,四代同堂為她慶生

照見古今
2026-01-07 19:42:45
2026-01-08 22:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14288文章數(shù) 66451關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

10歲抗癌"王子"病情惡化 家人"放棄治療"孩子憧憬出院

頭條要聞

10歲抗癌"王子"病情惡化 家人"放棄治療"孩子憧憬出院

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

教育
手機(jī)
藝術(shù)
公開課
軍事航空

教育要聞

浙江首考地理:牛拉屎放屁,我該怎么辦(減排)?!

手機(jī)要聞

一加手機(jī)2025年銷量增速位居行業(yè)第一:一加15/Ace 6銷量創(chuàng)新高

藝術(shù)要聞

頤和園金光穿洞

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普提出將美國軍費(fèi)提升至1.5萬億美元

無障礙瀏覽 進(jìn)入關(guān)懷版