国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

港大團(tuán)隊(duì)開源7x24小時(shí)AI科學(xué)家,把人類時(shí)間還給創(chuàng)造力!

0
分享至

假如你是一名科研工作者,面對浩瀚的文獻(xiàn)和復(fù)雜的實(shí)驗(yàn),你是否渴望擁有一個(gè)不知疲倦、知識(shí)淵博并且能夠全程協(xié)作的超級(jí)助手?這個(gè)愿景正由香港大學(xué)教授黃超團(tuán)隊(duì)開發(fā)的 AI-Researcher 變?yōu)楝F(xiàn)實(shí)。

實(shí)驗(yàn)中,該團(tuán)隊(duì)揭示了以下實(shí)驗(yàn)效果:在技術(shù)實(shí)現(xiàn)上,以 Claude 為后端的 AI-Researcher 在 93.8%的情況下能夠成功產(chǎn)出可運(yùn)行的代碼;在科學(xué)質(zhì)量上,盡管 AI 論文平均分?jǐn)?shù)略低,但是相當(dāng)一部分已經(jīng)可以和人類工作比肩。例如,根據(jù) GPT-4o 評審,超過 78%的 AI 生成論文達(dá)到了可比水平。

它既是一個(gè)工具,也是一個(gè)能夠自主完成從文獻(xiàn)調(diào)研、假設(shè)生成、算法實(shí)現(xiàn)到論文撰寫全流程的 AI 科學(xué)家。實(shí)驗(yàn)表明,其所完成的學(xué)術(shù)成果在多個(gè)領(lǐng)域已經(jīng)慢慢接近人類高質(zhì)量研究水平。

黃超告訴 DeepTech:“我們的愿景就是希望通過 AI-Researcher 大幅提升科研效率。比如以前我們一個(gè)月可能只能驗(yàn)證一種算法思路,但有了 AI-Researcher 的輔助,我們一個(gè)月可以探索上百種不同的算法路徑,這種指數(shù)級(jí)的試錯(cuò)速度將帶來科研突破的質(zhì)的飛躍!


(來源:https://arxiv.org/abs/2505.18705)

多智能體系統(tǒng)的科研助手

AI-Researcher 的強(qiáng)大源于其多智能體協(xié)作框架。這套系統(tǒng)模擬了人類科研團(tuán)隊(duì)的完整分工,將復(fù)雜任務(wù)進(jìn)行了分解執(zhí)行。

系統(tǒng)首先會(huì)由知識(shí)獲取智能體啟動(dòng),它僅需用戶提供少量種子論文,便能自主檢索并篩選出最相關(guān)的高質(zhì)量學(xué)術(shù)論文和代碼庫。

隨后,資源分析智能體將扮演關(guān)鍵角色:其論文分析模塊通過 RAG 技術(shù)從論文中提取核心數(shù)學(xué)公式,代碼分析模塊則在倉庫中定位具體實(shí)現(xiàn),借此建立理論與實(shí)踐的雙向映射,將抽象概念原子化。最終,規(guī)劃智能體整合分析結(jié)果,形成涵蓋數(shù)據(jù)、訓(xùn)練、測試的詳細(xì)開發(fā)計(jì)劃。

在扎實(shí)的知識(shí)地基上,創(chuàng)意生成器開始工作。它采用發(fā)散-收斂的模式,首先生成多個(gè)方向迥異的研究設(shè)想,然后基于科學(xué)性、新穎性和可行性篩選,形成結(jié)構(gòu)完整的研究提案。

核心突破體現(xiàn)在算法實(shí)現(xiàn)環(huán)節(jié)。AI-Researcher 摒棄了傳統(tǒng)AI變成一次性生成的脆弱模式,引入了類人迭代精煉范式。

代碼智能體負(fù)責(zé)根據(jù)計(jì)劃進(jìn)行初始實(shí)現(xiàn),顧問智能體則像導(dǎo)師一樣審核代碼的正確性,并通過分析初步實(shí)驗(yàn)結(jié)果提供修改建議。兩者形成多輪的實(shí)現(xiàn)-反饋-優(yōu)化循環(huán),顯著提高了復(fù)雜算法的實(shí)現(xiàn)成功率。

接著,自動(dòng)化文檔智能體采用三階段分層生成框架應(yīng)對長文本一致性的挑戰(zhàn):先根據(jù)模板生成論文大綱,再逐步填充內(nèi)容并維護(hù)邏輯一致性,最后依據(jù)專業(yè)清單核查修訂報(bào)告中的內(nèi)容及參考文獻(xiàn),確保學(xué)術(shù)上的嚴(yán)謹(jǐn)性。


(來源:https://arxiv.org/abs/2505.18705)

科學(xué)評估與嚴(yán)格評測,能力邊界與意外發(fā)現(xiàn)

為了客觀評價(jià)AI的科研能力,該團(tuán)隊(duì)創(chuàng)建了 Scientist-Bench 基準(zhǔn),精選了涵蓋計(jì)算機(jī)視覺、圖機(jī)器學(xué)習(xí)等領(lǐng)域的22篇頂會(huì)論文作為評估標(biāo)準(zhǔn)。

評估設(shè)置了兩層難度:Level-1 提供明確指令,測試 AI-Researcher 實(shí)現(xiàn)并執(zhí)行既定科研想法的能力;Level-2 只給參考文獻(xiàn),要求 AI-Researcher 自主發(fā)現(xiàn)新穎研究方向,挑戰(zhàn)性更高。

評估框架極為嚴(yán)格:先由代碼評審智能體驗(yàn)證技術(shù)實(shí)現(xiàn),再進(jìn)行科學(xué)貢獻(xiàn)評估,使用校準(zhǔn)后的論文評審智能體,以雙盲方式比較AI論文與人類原稿。

評審標(biāo)準(zhǔn)對標(biāo) ICLR 等頂會(huì),從創(chuàng)新性、方法嚴(yán)謹(jǐn)性、實(shí)驗(yàn)驗(yàn)證三個(gè)維度打分。為了消除偏差,他們針對論文順序進(jìn)行隨機(jī)交換,并匯集了多個(gè)頂尖大模型的獨(dú)立評審意見,形成了類似于評審委員會(huì)的集體決策。

期間還有一個(gè)反直覺的發(fā)現(xiàn)是:在開放探索任務(wù)中,AI-Researcher 的表現(xiàn)普遍優(yōu)于有明確指令的任務(wù),其平均評分和可比比例均有著顯著提升。

這表明,當(dāng)前AI科研智能體在整合內(nèi)部知識(shí)、自主發(fā)現(xiàn)方向等方面展現(xiàn)出獨(dú)特的優(yōu)勢,過細(xì)的指令反而會(huì)限制它的創(chuàng)造性。這挑戰(zhàn)了 AI 僅擅長執(zhí)行而非創(chuàng)造的舊有認(rèn)知。

實(shí)驗(yàn)也指出了一定局限:在需要深厚專業(yè)背景的理論分析和前沿優(yōu)化技術(shù)實(shí),AI 依然顯得稚嫩;在需要多步驟的嚴(yán)密數(shù)學(xué)推導(dǎo)時(shí),現(xiàn)有架構(gòu)依然容易出錯(cuò);跨越多天的科研長流程也對記憶系統(tǒng)提出了挑戰(zhàn)。


(來源:https://arxiv.org/abs/2505.18705)

盡管如此,AI-Researcher 展示了一條通往增強(qiáng)科學(xué)發(fā)現(xiàn)的切實(shí)路徑。目前,該框架已在物理、化學(xué)、生物等領(lǐng)域得到廣泛應(yīng)用。黃超表示,用戶普遍反饋 AI-Researcher 具備助力領(lǐng)域?qū)<覍?shí)現(xiàn)AI賦能的潛力。這一過程顯著降低了 AI 應(yīng)用門檻,讓研究者無需具備深厚的計(jì)算機(jī)或編程背景,也能利用 AI 技術(shù)推動(dòng)本學(xué)科的研究,實(shí)現(xiàn)跨領(lǐng)域的智能增強(qiáng)。

參考資料:

相關(guān)論文https://arxiv.org/abs/2505.18705

開源系統(tǒng)https://github.com/HKUDS/AI-Researcher

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
別墅是中產(chǎn)返貧的最大陷阱!過來人血淚總結(jié):別墅的四大硬傷

別墅是中產(chǎn)返貧的最大陷阱!過來人血淚總結(jié):別墅的四大硬傷

流蘇晚晴
2026-01-02 17:56:17
馬斯克全力資助共和黨:若激進(jìn)左翼贏,國將不國

馬斯克全力資助共和黨:若激進(jìn)左翼贏,國將不國

觀察者網(wǎng)
2026-01-02 15:38:04
2026年開始否極泰來,運(yùn)勢持續(xù)走高,越來越順的三個(gè)星座

2026年開始否極泰來,運(yùn)勢持續(xù)走高,越來越順的三個(gè)星座

小晴星座說
2026-01-02 18:10:36
鄭麗文亮劍!藍(lán)營內(nèi)鬼現(xiàn)形,盧秀燕急踩剎車,此人恐遭重罰

鄭麗文亮劍!藍(lán)營內(nèi)鬼現(xiàn)形,盧秀燕急踩剎車,此人恐遭重罰

喜愛籃球的歷史謎
2026-01-02 13:36:45
明年1月5日起,這項(xiàng)費(fèi)用下調(diào)!

明年1月5日起,這項(xiàng)費(fèi)用下調(diào)!

掌心定西
2026-01-02 19:03:05
伊朗一警察局遭襲,已致3死17傷

伊朗一警察局遭襲,已致3死17傷

界面新聞
2026-01-02 07:25:32
雷軍被耍了,暴露車圈混亂一幕!

雷軍被耍了,暴露車圈混亂一幕!

鳴金網(wǎng)
2025-12-31 11:06:04
特朗普稱將就伊朗騷亂事件進(jìn)行干涉

特朗普稱將就伊朗騷亂事件進(jìn)行干涉

界面新聞
2026-01-02 17:30:07
不顧家人反對,執(zhí)意要嫁撒貝寧的富二代李白,如今才知道她有多賺

不顧家人反對,執(zhí)意要嫁撒貝寧的富二代李白,如今才知道她有多賺

素衣讀史
2025-12-30 15:45:13
“刺殺普京”真相揭開了?不是烏克蘭,也不是歐盟,而是它

“刺殺普京”真相揭開了?不是烏克蘭,也不是歐盟,而是它

趣生活
2026-01-02 12:55:53
78歲林子祥上海城隍廟祈福,皮松肉垮滿臉老年斑,和葉倩文像父女

78歲林子祥上海城隍廟祈福,皮松肉垮滿臉老年斑,和葉倩文像父女

韓馳
2026-01-01 22:55:31
杜蘭特工資3158萬美元NBA第一,庫里縮水最嚴(yán)重跌第5

杜蘭特工資3158萬美元NBA第一,庫里縮水最嚴(yán)重跌第5

大眼瞄世界
2026-01-02 14:02:32
切爾西官宣!馬雷斯卡下課,91場奪2冠,18天前開炮,或執(zhí)教曼城

切爾西官宣!馬雷斯卡下課,91場奪2冠,18天前開炮,或執(zhí)教曼城

奧拜爾
2026-01-01 20:20:51
黃繼光堵槍眼是虛構(gòu)的?八旬老人:荒唐!遺體是我親自背回來的

黃繼光堵槍眼是虛構(gòu)的?八旬老人:荒唐!遺體是我親自背回來的

浩渺青史
2025-12-28 21:03:08
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽
2025-12-23 18:33:38
女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

醫(yī)者榮耀
2025-12-25 12:05:06
著名空氣動(dòng)力學(xué)和船舶流體力學(xué)專家、哈工程原校長吳德銘逝世

著名空氣動(dòng)力學(xué)和船舶流體力學(xué)專家、哈工程原校長吳德銘逝世

澎湃新聞
2026-01-02 19:02:26
六大衛(wèi)視臉都腫了:30億砸出的舞臺(tái),竟輸給董宇輝的“賣菜攤”?

六大衛(wèi)視臉都腫了:30億砸出的舞臺(tái),竟輸給董宇輝的“賣菜攤”?

動(dòng)物奇奇怪怪
2026-01-02 03:12:23
特朗普白忙活一年,中國在年底打響聲勢,王毅一番話直戳美國心窩

特朗普白忙活一年,中國在年底打響聲勢,王毅一番話直戳美國心窩

胡麒牧博士
2026-01-02 19:26:46
天然氣比京津還貴!河北農(nóng)村供暖成難題,有氣不敢開,百姓意見大

天然氣比京津還貴!河北農(nóng)村供暖成難題,有氣不敢開,百姓意見大

眼光很亮
2026-01-02 14:37:34
2026-01-02 20:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16069文章數(shù) 514447關(guān)注度
往期回顧 全部

科技要聞

新勢力年榜:零跑險(xiǎn)勝華為,蔚來小鵬新高

頭條要聞

媒體:賴清德叫囂"中共不敢越雷池" 轉(zhuǎn)頭就被狠抽耳光

頭條要聞

媒體:賴清德叫囂"中共不敢越雷池" 轉(zhuǎn)頭就被狠抽耳光

體育要聞

英超離譜夜?4戰(zhàn)全平3場0-0 曼城紅軍翻車

娛樂要聞

田亮一家新年全家福!森碟變清純少女

財(cái)經(jīng)要聞

8200億擴(kuò)產(chǎn)潮下的鋰電供應(yīng)鏈之戰(zhàn)

汽車要聞

奇瑞汽車12月銷量超23萬輛 全年超263萬輛

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
游戲
手機(jī)
旅游

藝術(shù)要聞

神似章子怡?這個(gè)越南模特火了,天生長了一張電影臉啊~

2026新年禮:歡迎來到「靈感劇場」

性能媲美PS5!數(shù)毛社測試GPD Win 5掌機(jī)游戲表現(xiàn)

手機(jī)要聞

鴻蒙6.0.0.120 SP6突然推送:僅修復(fù)一個(gè)Bug,你遇到了嗎?

旅游要聞

旋轉(zhuǎn)木馬、城市冰場同步開放,冰雪與童話交織在陸家嘴商圈

無障礙瀏覽 進(jìn)入關(guān)懷版