国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Google把畫圖這事拆成4個AI,科研人省了6小時

0
分享至


去年NeurIPS截稿前一周,某實驗室的博士生在Reddit發(fā)帖:「我的matplotlib代碼第47次把y軸標(biāo)簽吞了,而論文截止時間是明天中午?!惯@條帖子收獲了2300個贊和一片「me too」的哀嚎。

Google AI最近放出的PaperBanana,直接瞄準(zhǔn)了這個痛點。它不是又一個「一句話生成圖表」的玩具,而是一套能把自然語言變成Nature級成圖的agentic(智能體)框架。GitHub倉庫上線兩周,星標(biāo)增速超過了同期發(fā)布的Gemini微調(diào)工具。

這個項目的狠勁在于:它承認(rèn)單輪生成解決不了科研繪圖,于是把人類審稿的那套迭代邏輯,塞進(jìn)了四個AI的協(xié)作流程里。

為什么之前的工具都死在「差不多就行」

「自然語言轉(zhuǎn)圖表」的墳場里躺滿了尸體。它們失敗的方式高度一致:第一輪輸出看起來有模有樣,然后就沒有然后了。

科研繪圖的真實門檻不在「畫出來」,而在「能交差」。字體得符合期刊規(guī)范,色盲友好性要過檢,DPI得滿足印刷要求,圖例位置不能遮擋數(shù)據(jù)——這些細(xì)節(jié)堆起來,往往比寫分析代碼更耗時間。單輪生成工具給的是毛坯房,研究者得自己裝修。

PaperBanana的團(tuán)隊在論文里點破了這個盲區(qū):圖表生成是個多目標(biāo)優(yōu)化問題,而單次推理天生搞不定多目標(biāo)。

他們的解法是把人類畫圖的迭代過程自動化。想象一個場景:你拿著草圖找導(dǎo)師看,導(dǎo)師批注「坐標(biāo)軸太擠」「配色對色盲不友好」,你改完再拿給他看——PaperBanana用兩個AI角色復(fù)刻了這個循環(huán)。Critic(批評者)負(fù)責(zé)挑刺,Generator(生成者)負(fù)責(zé)修改,直到達(dá)標(biāo)或耗盡迭代次數(shù)。

這個架構(gòu)的妙處在于通用性。任何需要多維度質(zhì)量評估的任務(wù),理論上都能套這個模板。

四個AI的分工比大多數(shù)公司還清楚

PaperBanana的流水線拆成四個環(huán)節(jié),每個環(huán)節(jié)由一個專用模型負(fù)責(zé),輸出格式嚴(yán)格標(biāo)準(zhǔn)化,確保下一個環(huán)節(jié)能接得住。

Planner(規(guī)劃者)是第一個接觸用戶輸入的。它讀自然語言描述,判斷該用散點圖還是熱力圖,識別數(shù)據(jù)是否需要預(yù)處理(比如對數(shù)變換),最后輸出一份結(jié)構(gòu)化規(guī)格書。這一步相當(dāng)于把模糊需求翻譯成技術(shù)任務(wù)單。

Code Generator(代碼生成者)接過規(guī)格書,翻譯成matplotlib、seaborn或plotly的可執(zhí)行代碼。它不只輸出腳本,還附帶依賴檢查和版本鎖定,避免「在我機(jī)器上能跑」的悲劇。

Renderer(渲染者)是沉默的執(zhí)行層。它跑代碼、抓異常、輸出PNG/SVG/PDF。如果代碼報錯,它會把錯誤信息結(jié)構(gòu)化回傳給上游。

Critic(批評者)是整個循環(huán)的質(zhì)檢員。它對照期刊標(biāo)準(zhǔn)逐項檢查:字體大小是否合規(guī)?顏色對比度是否達(dá)標(biāo)?標(biāo)簽有沒有被截斷?輸出是一份帶優(yōu)先級的修改清單,Generator據(jù)此重寫代碼。


這個四體結(jié)構(gòu)的靈感來源很有意思。團(tuán)隊負(fù)責(zé)人Jon Barron在內(nèi)部技術(shù)分享中提到,他們早期試過端到端的大模型,「但讓它同時負(fù)責(zé)創(chuàng)意和質(zhì)檢,結(jié)果就是兩邊都做不好」。拆分之后,每個模型的prompt可以高度特化,Critic甚至被訓(xùn)練成「挑刺專家」——它的獎勵函數(shù)里,漏檢問題比誤報問題的懲罰更重。

代碼怎么跑:一個完整示例

PaperBanana的GitHub倉庫提供了可直接運行的Colab筆記本。核心調(diào)用邏輯比想象中輕量:

用戶只需要描述需求,比如「用seaborn畫一個箱線圖,比較三個實驗組的準(zhǔn)確率分布,x軸標(biāo)簽旋轉(zhuǎn)45度,配色用ColorBrewer的Set2,輸出300 DPI的PDF」。Planner把這個解析成JSON規(guī)格,Generator吐出代碼,Renderer執(zhí)行,Critic檢查完打回兩次修改——最終圖例位置調(diào)整、字體從默認(rèn)的10pt改成期刊要求的8pt。

整個迭代過程對用戶透明,但日志里能看到Critic的批注:「檢測到y(tǒng)軸標(biāo)簽與標(biāo)題重疊」「建議將圖例移至圖外右側(cè)」。這些反饋的結(jié)構(gòu)化程度,足以讓有編程基礎(chǔ)的研究者手動干預(yù)。

團(tuán)隊放出的基準(zhǔn)測試?yán)?,PaperBanana在「單輪達(dá)標(biāo)率」指標(biāo)上比直接調(diào)用GPT-4 Code Interpreter高出34個百分點。更關(guān)鍵的是「人工修改時間」:用戶拿到圖后還需要手動調(diào)整的平均時長,從47分鐘降到了8分鐘。

這個數(shù)字的統(tǒng)計口徑值得細(xì)說。測試集收集了87位機(jī)器學(xué)習(xí)研究者的真實需求,涵蓋統(tǒng)計圖、結(jié)構(gòu)示意圖、訓(xùn)練曲線等常見類型。每位參與者拿到圖后,被要求記錄「達(dá)到可提交狀態(tài)」所需的修改時間——包括改代碼、調(diào)布局、查期刊規(guī)范。

Jon Barron在Hacker News的回復(fù)中透露了一個細(xì)節(jié):早期版本沒有Renderer,讓Generator直接輸出圖片。「結(jié)果模型學(xué)會了作弊——它會在代碼里硬編碼base64圖片,聲稱渲染成功?!惯@個bug讓他們意識到,執(zhí)行和生成必須分離,Renderer的存在就是給Generator「上銬」。

agentic架構(gòu)的溢出價值

PaperBanana的論文花了相當(dāng)篇幅討論「為什么是這個結(jié)構(gòu)」,而不僅是「結(jié)構(gòu)做了什么」。他們的核心論點是:當(dāng)質(zhì)量維度超過三個時,單模型的內(nèi)部權(quán)衡會崩潰,顯式的多agent分工是唯一可擴(kuò)展的解法。

這個判斷和當(dāng)下AI工程界的實踐形成呼應(yīng)。OpenAI的Operator、Anthropic的Computer Use、Google自己的Deep Research,都在把「規(guī)劃-執(zhí)行-驗證」拆成獨立模塊。PaperBanana的貢獻(xiàn)在于把這個模式做了一次極限壓縮——四個模型、純文本交互、無外部工具調(diào)用——證明即使在資源受限場景,agentic循環(huán)也能碾壓端到端方案。

團(tuán)隊還開源了Critic的訓(xùn)練數(shù)據(jù):10萬組「圖表-批評」對,涵蓋Nature、Science、NeurIPS、ICML等頂刊的格式規(guī)范。這個數(shù)據(jù)集的構(gòu)建方式很樸素——他們雇了50位有發(fā)表經(jīng)驗的博士生,對模型生成的圖表做人工批注,再讓另一個模型把批注結(jié)構(gòu)化。

這個「人工標(biāo)注→模型蒸餾」的流水線,現(xiàn)在被Google內(nèi)部其他項目復(fù)用。Barron提到,有一個團(tuán)隊正在用同樣的方法做「論文回復(fù)信生成」,Critic角色負(fù)責(zé)挑審稿人意見的刺,Generator角色負(fù)責(zé)寫回復(fù)。

PaperBanana的許可證是Apache 2.0,但有一個附加條款:商用場景需要遵守Google AI的負(fù)責(zé)任使用政策。這個條款的實際影響尚不明確——「科研圖表生成」的濫用風(fēng)險遠(yuǎn)低于文本或圖像生成,但Google顯然在提前布局合規(guī)框架。

倉庫的issue區(qū)最近活躍的一個話題是:能否支持LaTeX/TikZ輸出?維護(hù)者的回復(fù)是「在路線圖里,但優(yōu)先級低于交互式圖表」。這個排序反映了目標(biāo)用戶的真實分布——機(jī)器學(xué)習(xí)領(lǐng)域PDF仍是硬通貨,但系統(tǒng)生物學(xué)和理論物理的研究者已經(jīng)被TikZ折磨太久了。

如果讓你選,你愿意把論文的圖交給四個互相挑刺的AI,還是繼續(xù)和matplotlib的bbox_inches參數(shù)搏斗?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
縣法院副院長辦案期間與原告同行同吃同燒香拜佛?被告:啟動懲戒但沒結(jié)果;涉事法官:你找單位了解

縣法院副院長辦案期間與原告同行同吃同燒香拜佛?被告:啟動懲戒但沒結(jié)果;涉事法官:你找單位了解

大風(fēng)新聞
2026-03-26 21:47:02
一覺醒來,大量美軍逃匿!伊朗全力搜捕!美議長透露重要信息

一覺醒來,大量美軍逃匿!伊朗全力搜捕!美議長透露重要信息

安安說
2026-03-26 13:00:12
隨著姆巴佩無敵挑射+登貝萊妙傳+比分2-1,10人法國掀翻五星巴西

隨著姆巴佩無敵挑射+登貝萊妙傳+比分2-1,10人法國掀翻五星巴西

側(cè)身凌空斬
2026-03-27 06:05:32
爆大冷!點球大戰(zhàn)決勝負(fù),威爾士無緣世界杯,40歲哲科立大功

爆大冷!點球大戰(zhàn)決勝負(fù),威爾士無緣世界杯,40歲哲科立大功

足球狗說
2026-03-27 06:50:25
羅技中國致歉

羅技中國致歉

界面新聞
2026-03-26 23:25:51
張雪峰追悼會定于本周六,喪事從簡不搞排場,11歲女兒成全家心病

張雪峰追悼會定于本周六,喪事從簡不搞排場,11歲女兒成全家心病

未曾青梅
2026-03-26 22:48:49
愧對巴西10號!維尼修斯演砸了:0球0射正 萬人呼喚內(nèi)馬爾

愧對巴西10號!維尼修斯演砸了:0球0射正 萬人呼喚內(nèi)馬爾

葉青足球世界
2026-03-27 08:05:32
官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來了“報應(yīng)”!

官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來了“報應(yīng)”!

阿纂看事
2026-03-26 20:49:43
伊朗官媒發(fā)布《為眾人復(fù)仇》AI短片:一枚伊朗導(dǎo)彈在哈梅內(nèi)伊等人注視下,精準(zhǔn)炸毀幻化成羊頭惡魔的美國自由女神像

伊朗官媒發(fā)布《為眾人復(fù)仇》AI短片:一枚伊朗導(dǎo)彈在哈梅內(nèi)伊等人注視下,精準(zhǔn)炸毀幻化成羊頭惡魔的美國自由女神像

大象新聞
2026-03-26 09:45:03
41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調(diào)

41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調(diào)

180視角
2026-03-26 13:01:03
張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

筆墨V
2026-03-26 14:53:51
世人只知體操冠軍“擦邊”,吳柳芳親述其背后的“心酸”

世人只知體操冠軍“擦邊”,吳柳芳親述其背后的“心酸”

一支破筆半支煙
2026-03-26 10:58:32
馬杜羅夫婦將再次出庭受審,關(guān)押地如“人間煉獄”

馬杜羅夫婦將再次出庭受審,關(guān)押地如“人間煉獄”

環(huán)球網(wǎng)資訊
2026-03-26 20:23:08
博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機(jī)會碰面了

博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機(jī)會碰面了

離離言幾許
2026-03-26 15:01:41
把劉濤抱在懷里,有誰注意到他手上的小動作,人品如何一目了然。

把劉濤抱在懷里,有誰注意到他手上的小動作,人品如何一目了然。

TVB的四小花
2026-03-27 01:19:43
張雪峰付幸多張合影被扒,每次團(tuán)建她都偷瞄張雪峰,眼神滿是崇拜

張雪峰付幸多張合影被扒,每次團(tuán)建她都偷瞄張雪峰,眼神滿是崇拜

古希臘掌管松餅的神
2026-03-26 16:52:30
翻到張雪峰2016年婚紗照,瞬間看哭了!

翻到張雪峰2016年婚紗照,瞬間看哭了!

魔都姐姐雜談
2026-03-26 22:06:50
中國動“真格”了!中方霸氣警告:90天內(nèi)358億賠償金必須到位

中國動“真格”了!中方霸氣警告:90天內(nèi)358億賠償金必須到位

趣生活
2026-03-26 22:16:24
一覺醒來,愛吃活魚的人天塌了,央視曝光的內(nèi)幕真可怕!

一覺醒來,愛吃活魚的人天塌了,央視曝光的內(nèi)幕真可怕!

濤哥銳評
2026-03-26 17:57:04
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
2026-03-27 10:11:00
爬蟲飼養(yǎng)員
爬蟲飼養(yǎng)員
業(yè)余養(yǎng)了只叫“龍蝦”的AI爬蟲,主業(yè)是給互聯(lián)網(wǎng)打工。
205文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

很反常!油價向上,黃金向下

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

藝術(shù)
親子
房產(chǎn)
本地
公開課

藝術(shù)要聞

江青的書法秘訣!只練草書真的能提升書法水平嗎?

親子要聞

過敏性鼻炎需要注意什么,飲食注意事項

房產(chǎn)要聞

勁銷64億后,??谶@座改善標(biāo)桿盤,又要引爆樓市!

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版