国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI科學(xué)家登上Nature,論文從構(gòu)思到發(fā)表全自動(dòng)化,一篇已通過評(píng)審

0
分享至

幾小時(shí)前,Nature 宣布了真正意義上的 AI 科學(xué)家的首次實(shí)現(xiàn)。由“Transformer 八子”之一聯(lián)合創(chuàng)辦的日本 Sakana AI 與英國牛津大學(xué)、英屬哥倫比亞大學(xué)的研究團(tuán)隊(duì)打造了一個(gè)從零開始搞科研的 AI,實(shí)現(xiàn)了從構(gòu)思到論文發(fā)表的完整端到端自動(dòng)化,并有 AI 論文通過國際頂會(huì) ICLR 2025 同行評(píng)審,這是 AI 科研范式的突破,觸及了人類創(chuàng)造力的邊界。


圖 | 被選中的 AI 論文節(jié)選(來源:https://www.nature.com/art)

值得注意的是,來自英國牛津大學(xué)的 Chris Lu 和來自英屬哥倫比亞大學(xué)的 Cong Lu 是共同一作之一。


圖 | 從左到右:Chris Lu 和 Cong Lu(來源:資料圖)

研究中,他們?cè)斐隽艘粋€(gè)叫 AI 科學(xué)家( AI Scientist)的系統(tǒng),從想點(diǎn)子、寫代碼、跑實(shí)驗(yàn)、分析數(shù)據(jù),到寫論文、自己審稿,全由AI自己完成。

更讓人震驚的是,其中一篇完全由AI生成的論文,投到了 ICLR 2025 的一個(gè)研討會(huì),拿到了 6 分、7 分、6 分的評(píng)審分?jǐn)?shù),超過了這個(gè)研討會(huì)平均的錄取線。這篇論文如果沒被主動(dòng)撤稿,大概率會(huì)被接收。


(來源:https://www.nature.com/articles/s41586-026-10265-5)

據(jù)了解,AI 科學(xué)家的工作流程分成四塊。

第一步是想點(diǎn)子。

它被喂進(jìn)一個(gè)研究領(lǐng)域后,會(huì)自己生成一批研究方向,每一條都帶著標(biāo)題、研究理由、實(shí)驗(yàn)方案,還給自己打分,有趣程度、新穎程度、可行性,1 到 10 分自己評(píng)。然后它連上 Semantic Scholar 的學(xué)術(shù)搜索引擎,把跟已有工作太像的點(diǎn)子扔掉。

第二步是做實(shí)驗(yàn)。

這里分兩種模式。

第一種是模板模式,研究人員先給它一段能跑通的代碼做起點(diǎn),它在這個(gè)基礎(chǔ)上想新點(diǎn)子,然后叫一個(gè)叫 Aider 的代碼助手來改代碼、跑實(shí)驗(yàn),出錯(cuò)了自己看日志、自己修,修好了繼續(xù)跑。

另一種是無模板模式,它連起點(diǎn)代碼都沒有,得從零開始寫。這時(shí)候它會(huì)搞一個(gè)樹形搜索,一個(gè)點(diǎn)子長出好幾個(gè)分支,每個(gè)分支跑不同參數(shù)、不同設(shè)置,跑完一輪選最好的那個(gè)繼續(xù)往下走。這個(gè)過程會(huì)并行跑很多個(gè)節(jié)點(diǎn),誰效果好誰被選中繼續(xù)深挖。

第三步是寫論文。

它把自己實(shí)驗(yàn)里記的筆記、生成的圖表填進(jìn)一個(gè)標(biāo)準(zhǔn)的 LaTeX 模板里,一節(jié)一節(jié)地寫,引言、方法、結(jié)果、結(jié)論,全齊。要寫相關(guān)工作部分的時(shí)候,它再去查 Semantic Scholar,把相關(guān)的論文找出來,然后讀摘要和寫引用。寫完還會(huì)自己編譯 LaTeX,報(bào)錯(cuò)了自己改,最多可以改五次,直到出一份能看的 PDF。

第四步是自己審稿。

研究團(tuán)隊(duì)還造了一個(gè)自動(dòng)化審稿器,照著 NeurIPS 的審稿指南,對(duì)論文打分,給優(yōu)點(diǎn)、缺點(diǎn)、倫理問題,最后給一個(gè)接受或拒絕的建議。五份獨(dú)立審稿結(jié)果匯總,再由它自己當(dāng)領(lǐng)域主席做一個(gè)綜合判斷。

這個(gè)自動(dòng)化審稿器不是隨便做的,研究團(tuán)隊(duì)拿它跟真實(shí)的人類審稿記錄做了對(duì)比。他們從 OpenReview 上拿了 ICLR 的論文數(shù)據(jù),讓自動(dòng)化審稿器打分,結(jié)果它的平衡準(zhǔn)確率達(dá)到 了69%,跟人類審稿人的 66% 差不多。

在 F1 分?jǐn)?shù)上,它甚至比 NeurIPS 2021 那個(gè)著名的審稿一致性實(shí)驗(yàn)里的人類審稿人之間的一致性還高。這意味著自動(dòng)化審稿器打出來的分?jǐn)?shù),跟一個(gè)真實(shí)的人類審稿專家基本在一個(gè)水平線上。

他們還專門測了數(shù)據(jù)污染的問題。模型訓(xùn)練時(shí)用的數(shù)據(jù)可能包含 2017 到 2024 年的論文,所以他們又拿 2025 年出的新論文測了一遍,結(jié)果平衡準(zhǔn)確率降到了 66%,仍然和人類審稿人持平。這說明自動(dòng)化審稿器不是靠背答案,它其實(shí)是真的能夠自己判斷論文質(zhì)量。


(來源:https://www.nature.com/articles/s41586-026-10265-5)

研究團(tuán)隊(duì)還發(fā)現(xiàn)了一個(gè)規(guī)律,AI 科學(xué)家生成的論文質(zhì)量,跟它底下用的基礎(chǔ)模型強(qiáng)相關(guān)。他們用不同時(shí)間發(fā)布的模型跑同一套流程,從較老的模型到最新的模型,生成的論文評(píng)分一直在漲。這說明隨著基礎(chǔ)模型越來越強(qiáng),AI 科學(xué)家寫出來的論文也會(huì)越來越接近人類水平。

同時(shí),給 AI 科學(xué)家分配的計(jì)算資源越多,它寫出來的論文質(zhì)量也越高。這有點(diǎn)像給一個(gè)研究生更多時(shí)間做實(shí)驗(yàn),最后成果也會(huì)更好。這兩個(gè)趨勢(shì)加在一起,意味著未來 AI 科學(xué)家的能力會(huì)隨著模型升級(jí)和算力增長持續(xù)提升。


(來源:Nature)

被研討會(huì)評(píng)審看上的那篇論文,研究的是深度學(xué)習(xí)里的一個(gè)負(fù)向結(jié)果,正好契合那個(gè)叫 ICBINB 的研討會(huì)主題。這篇論文由AI科學(xué)家在無模板模式下生成,從頭到尾沒有人類修改過。它從選題、設(shè)計(jì)實(shí)驗(yàn)、跑代碼、出圖表、寫 LaTeX,全部是自己完成的。

研究團(tuán)隊(duì)一共投了三篇,只有這一篇過了線,另外兩篇沒達(dá)標(biāo)。這說明 AI 科學(xué)家目前還不是每次都能寫出高質(zhì)量論文,但這明確證明 AI 寫出來的東西已經(jīng)能騙過人類審稿人,讓它以為自己是在審一個(gè)人類研究生的作業(yè)。

當(dāng)然,AI 科學(xué)家現(xiàn)在還遠(yuǎn)不夠完美。它偶爾會(huì)想出很幼稚的點(diǎn)子,方法論不夠嚴(yán)謹(jǐn),寫代碼時(shí)會(huì)出各種 bug,還會(huì)產(chǎn)生幻覺,比如引文明明是錯(cuò)的它硬說對(duì),或者附錄里把同一張圖放兩遍。

不過,研究團(tuán)隊(duì)發(fā)現(xiàn)在機(jī)器學(xué)習(xí)這個(gè)領(lǐng)域,很多技術(shù)剛出現(xiàn)時(shí)都不完美,甚至漏洞百出,但只要它能讓做出來這件事本身成立,后續(xù)通過擴(kuò)大規(guī)模、更好的模型、更優(yōu)的技術(shù),這項(xiàng)能力就會(huì)迅速提升,進(jìn)而很快超越人類水平。

總的來說,這項(xiàng)工作的意義遠(yuǎn)遠(yuǎn)不止讓 AI 寫幾篇論文,它把整個(gè)科研流程從頭到尾連起來了,從想點(diǎn)子到做實(shí)驗(yàn)到寫論文到審稿,全在計(jì)算機(jī)里跑通。

未來可以用 AI 來加速科研,比如在藥物發(fā)現(xiàn)、材料設(shè)計(jì)、氣候建模這些領(lǐng)域,讓 AI 科學(xué)家 7×24 小時(shí)地跑實(shí)驗(yàn)、試方向,而人類科學(xué)家只需要在關(guān)鍵節(jié)點(diǎn)做判斷和選擇。

同時(shí),研究團(tuán)隊(duì)在論文最后也提到了風(fēng)險(xiǎn),比如AI論文洪流可能會(huì)壓垮現(xiàn)有的審稿系統(tǒng),或者有人拿 AI 灌水、批量發(fā)假論文。所以他們主動(dòng)把投出去的論文撤回來了,也在所有生成的論文里加了水印,方便識(shí)別。他們還建議學(xué)術(shù)界盡快建立規(guī)范,告訴人們 AI 寫的論文應(yīng)該怎么標(biāo)注和怎么對(duì)待。

參考資料:

相關(guān)論文https://www.nature.com/articles/s41586-026-10265-5

https://www.linkedin.com/in/chris-lu-37471b119/

https://chrislu.page/

https://www.linkedin.com/in/cong-lu-530b74104/

https://www.conglu.co.uk/

https://sakana.ai/ai-scientist-nature/

運(yùn)營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美媒曬NBA球隊(duì)市值排名:勇士113.3億美元居首 湖人第2火箭第10

美媒曬NBA球隊(duì)市值排名:勇士113.3億美元居首 湖人第2火箭第10

羅說NBA
2026-03-26 06:18:02
筱梅曬圖,汪寶滿月,桌子上僅擺6個(gè)菜,發(fā)文稱簡單即是幸福!

筱梅曬圖,汪寶滿月,桌子上僅擺6個(gè)菜,發(fā)文稱簡單即是幸福!

潮鹿逐夢(mèng)
2026-03-26 11:02:11
多名大學(xué)校長炮轟機(jī)器人跳舞是嘩眾取寵

多名大學(xué)校長炮轟機(jī)器人跳舞是嘩眾取寵

上峰視點(diǎn)
2026-03-25 19:07:57
伊朗伊斯蘭革命衛(wèi)隊(duì)責(zé)令一艘擅自通過霍爾木茲海峽船只返航

伊朗伊斯蘭革命衛(wèi)隊(duì)責(zé)令一艘擅自通過霍爾木茲海峽船只返航

財(cái)聯(lián)社
2026-03-25 02:02:18
朝鮮為何突然禁播部分中國影視作品

朝鮮為何突然禁播部分中國影視作品

東方不敗然多多
2026-03-26 05:21:44
特朗普想退出伊朗戰(zhàn)爭哪有那么容易?

特朗普想退出伊朗戰(zhàn)爭哪有那么容易?

公評(píng)世界
2026-03-26 10:38:34
日媒:政府出手后,日本汽油價(jià)已降至7.71元/升

日媒:政府出手后,日本汽油價(jià)已降至7.71元/升

隨波蕩漾的漂流瓶
2026-03-25 15:39:49
曝張雪峰立過遺囑了

曝張雪峰立過遺囑了

大張的自留地
2026-03-26 09:49:17
大意了!張雪峰不同時(shí)段坐姿,證明他越來越疲憊了,可惜錯(cuò)過了

大意了!張雪峰不同時(shí)段坐姿,證明他越來越疲憊了,可惜錯(cuò)過了

魔都姐姐雜談
2026-03-26 10:53:11
連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對(duì)話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設(shè)置反轉(zhuǎn)劇情,沒想到會(huì)這么火

連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對(duì)話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設(shè)置反轉(zhuǎn)劇情,沒想到會(huì)這么火

極目新聞
2026-03-25 19:37:57
留幾手談張雪峰去世:死者又不是我爹,憑啥為大

留幾手談張雪峰去世:死者又不是我爹,憑啥為大

三言科技
2026-03-25 19:03:05
15戰(zhàn)14勝,加時(shí)掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

15戰(zhàn)14勝,加時(shí)掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

鍋?zhàn)踊@球
2026-03-26 11:25:55
張雪峰家人首發(fā)聲:不設(shè)追思會(huì)喪事從簡,謝絕所有人去家中慰問

張雪峰家人首發(fā)聲:不設(shè)追思會(huì)喪事從簡,謝絕所有人去家中慰問

娛樂圈圈圓
2026-03-26 11:08:26
我敢說,能在這張大合照里面認(rèn)出三個(gè),絕對(duì)是歷史高手。

我敢說,能在這張大合照里面認(rèn)出三個(gè),絕對(duì)是歷史高手。

生活魔術(shù)專家
2026-03-24 01:34:19
男子買菜順手買體彩!花4元中698萬 先上班再領(lǐng)獎(jiǎng) 現(xiàn)場捐2000元

男子買菜順手買體彩!花4元中698萬 先上班再領(lǐng)獎(jiǎng) 現(xiàn)場捐2000元

念洲
2026-03-26 13:12:32
伊朗軍方公布第26天作戰(zhàn)行動(dòng)細(xì)節(jié) 打擊多處美以目標(biāo)

伊朗軍方公布第26天作戰(zhàn)行動(dòng)細(xì)節(jié) 打擊多處美以目標(biāo)

極目新聞
2026-03-26 14:33:54
注意!公職人員再做這些事,將被開除!

注意!公職人員再做這些事,將被開除!

微法官
2026-03-18 00:03:02
島國暗黑界新晉女神,超模身材比肩安齋與棲花,堪稱最強(qiáng)接班人!

島國暗黑界新晉女神,超模身材比肩安齋與棲花,堪稱最強(qiáng)接班人!

碧波萬覽
2026-03-26 05:30:03
庫里可以接著休息了!東部只剩理論!

庫里可以接著休息了!東部只剩理論!

籃球大圖
2026-03-26 11:25:14
我與63歲老同學(xué)搭伙,他退休金13000全給我,僅僅7天我就受不了了

我與63歲老同學(xué)搭伙,他退休金13000全給我,僅僅7天我就受不了了

蟬吟槐蕊
2026-03-26 13:19:09
2026-03-26 15:15:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16487文章數(shù) 514797關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

游戲
手機(jī)
藝術(shù)
公開課
軍事航空

外媒銳評(píng)PS去年錯(cuò)得離譜!發(fā)行商排名21 被微軟甩開

手機(jī)要聞

存儲(chǔ)漲價(jià)苦了國產(chǎn)品牌、普通消費(fèi)者,蘋果卻不受影響

藝術(shù)要聞

哪一座橋不是風(fēng)景?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版