国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

港大團隊開源7x24小時AI科學家,把人類時間還給創(chuàng)造力!

0
分享至

假如你是一名科研工作者,面對浩瀚的文獻和復雜的實驗,你是否渴望擁有一個不知疲倦、知識淵博并且能夠全程協(xié)作的超級助手?這個愿景正由香港大學教授黃超團隊開發(fā)的 AI-Researcher 變?yōu)楝F(xiàn)實。

實驗中,該團隊揭示了以下實驗效果:在技術實現(xiàn)上,以 Claude 為后端的 AI-Researcher 在 93.8%的情況下能夠成功產(chǎn)出可運行的代碼;在科學質量上,盡管 AI 論文平均分數(shù)略低,但是相當一部分已經(jīng)可以和人類工作比肩。例如,根據(jù) GPT-4o 評審,超過 78%的 AI 生成論文達到了可比水平。

它既是一個工具,也是一個能夠自主完成從文獻調研、假設生成、算法實現(xiàn)到論文撰寫全流程的 AI 科學家。實驗表明,其所完成的學術成果在多個領域已經(jīng)慢慢接近人類高質量研究水平。

黃超告訴 DeepTech:“我們的愿景就是希望通過 AI-Researcher 大幅提升科研效率。比如以前我們一個月可能只能驗證一種算法思路,但有了 AI-Researcher 的輔助,我們一個月可以探索上百種不同的算法路徑,這種指數(shù)級的試錯速度將帶來科研突破的質的飛躍?!?/p>


(來源:https://arxiv.org/abs/2505.18705)

多智能體系統(tǒng)的科研助手

AI-Researcher 的強大源于其多智能體協(xié)作框架。這套系統(tǒng)模擬了人類科研團隊的完整分工,將復雜任務進行了分解執(zhí)行。

系統(tǒng)首先會由知識獲取智能體啟動,它僅需用戶提供少量種子論文,便能自主檢索并篩選出最相關的高質量學術論文和代碼庫。

隨后,資源分析智能體將扮演關鍵角色:其論文分析模塊通過 RAG 技術從論文中提取核心數(shù)學公式,代碼分析模塊則在倉庫中定位具體實現(xiàn),借此建立理論與實踐的雙向映射,將抽象概念原子化。最終,規(guī)劃智能體整合分析結果,形成涵蓋數(shù)據(jù)、訓練、測試的詳細開發(fā)計劃。

在扎實的知識地基上,創(chuàng)意生成器開始工作。它采用發(fā)散-收斂的模式,首先生成多個方向迥異的研究設想,然后基于科學性、新穎性和可行性篩選,形成結構完整的研究提案。

核心突破體現(xiàn)在算法實現(xiàn)環(huán)節(jié)。AI-Researcher 摒棄了傳統(tǒng)AI變成一次性生成的脆弱模式,引入了類人迭代精煉范式。

代碼智能體負責根據(jù)計劃進行初始實現(xiàn),顧問智能體則像導師一樣審核代碼的正確性,并通過分析初步實驗結果提供修改建議。兩者形成多輪的實現(xiàn)-反饋-優(yōu)化循環(huán),顯著提高了復雜算法的實現(xiàn)成功率。

接著,自動化文檔智能體采用三階段分層生成框架應對長文本一致性的挑戰(zhàn):先根據(jù)模板生成論文大綱,再逐步填充內容并維護邏輯一致性,最后依據(jù)專業(yè)清單核查修訂報告中的內容及參考文獻,確保學術上的嚴謹性。


(來源:https://arxiv.org/abs/2505.18705)

科學評估與嚴格評測,能力邊界與意外發(fā)現(xiàn)

為了客觀評價AI的科研能力,該團隊創(chuàng)建了 Scientist-Bench 基準,精選了涵蓋計算機視覺、圖機器學習等領域的22篇頂會論文作為評估標準。

評估設置了兩層難度:Level-1 提供明確指令,測試 AI-Researcher 實現(xiàn)并執(zhí)行既定科研想法的能力;Level-2 只給參考文獻,要求 AI-Researcher 自主發(fā)現(xiàn)新穎研究方向,挑戰(zhàn)性更高。

評估框架極為嚴格:先由代碼評審智能體驗證技術實現(xiàn),再進行科學貢獻評估,使用校準后的論文評審智能體,以雙盲方式比較AI論文與人類原稿。

評審標準對標 ICLR 等頂會,從創(chuàng)新性、方法嚴謹性、實驗驗證三個維度打分。為了消除偏差,他們針對論文順序進行隨機交換,并匯集了多個頂尖大模型的獨立評審意見,形成了類似于評審委員會的集體決策。

期間還有一個反直覺的發(fā)現(xiàn)是:在開放探索任務中,AI-Researcher 的表現(xiàn)普遍優(yōu)于有明確指令的任務,其平均評分和可比比例均有著顯著提升。

這表明,當前AI科研智能體在整合內部知識、自主發(fā)現(xiàn)方向等方面展現(xiàn)出獨特的優(yōu)勢,過細的指令反而會限制它的創(chuàng)造性。這挑戰(zhàn)了 AI 僅擅長執(zhí)行而非創(chuàng)造的舊有認知。

實驗也指出了一定局限:在需要深厚專業(yè)背景的理論分析和前沿優(yōu)化技術實,AI 依然顯得稚嫩;在需要多步驟的嚴密數(shù)學推導時,現(xiàn)有架構依然容易出錯;跨越多天的科研長流程也對記憶系統(tǒng)提出了挑戰(zhàn)。


(來源:https://arxiv.org/abs/2505.18705)

盡管如此,AI-Researcher 展示了一條通往增強科學發(fā)現(xiàn)的切實路徑。目前,該框架已在物理、化學、生物等領域得到廣泛應用。黃超表示,用戶普遍反饋 AI-Researcher 具備助力領域專家實現(xiàn)AI賦能的潛力。這一過程顯著降低了 AI 應用門檻,讓研究者無需具備深厚的計算機或編程背景,也能利用 AI 技術推動本學科的研究,實現(xiàn)跨領域的智能增強。

參考資料:

相關論文https://arxiv.org/abs/2505.18705

開源系統(tǒng)https://github.com/HKUDS/AI-Researcher

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
那個曾揚言讓中國給全世界道歉,慘遭央視開除的阿丘,如今怎樣了

那個曾揚言讓中國給全世界道歉,慘遭央視開除的阿丘,如今怎樣了

楓塵余往逝
2026-01-06 01:21:58
一千多種兩用物質對日禁止出口! 美國砍向中國的刀:落到了日本身上

一千多種兩用物質對日禁止出口! 美國砍向中國的刀:落到了日本身上

奇葩游戲醬
2026-01-07 02:28:53
9分!楊瀚森生涯新高!中國其他球員在NBA單場最高得分是多少?

9分!楊瀚森生涯新高!中國其他球員在NBA單場最高得分是多少?

籃球圈里的那些事
2025-11-19 14:38:31
A股太霸氣!章盟主重返航空,傳陳小群日賺1.5億,鑫多多大牛股停牌核查

A股太霸氣!章盟主重返航空,傳陳小群日賺1.5億,鑫多多大牛股停牌核查

金石隨筆
2026-01-07 00:10:12
和胡明軒不和?輸球后,徐杰黑臉,原因曝光,誰注意胡明軒反應

和胡明軒不和?輸球后,徐杰黑臉,原因曝光,誰注意胡明軒反應

樂聊球
2026-01-06 09:37:18
中國海警發(fā)布海報,登船扣押海馬斯?賴清德緊急發(fā)聲,直呼不搞事

中國海警發(fā)布海報,登船扣押海馬斯?賴清德緊急發(fā)聲,直呼不搞事

文史旺旺旺
2026-01-05 22:04:07
房子里有“不干凈”的東西,會有以下3種特征,占一樣也不得了

房子里有“不干凈”的東西,會有以下3種特征,占一樣也不得了

神奇故事
2026-01-05 23:24:05
美日印澳開小會,緊急在北京碰頭,當面反華,想在眼皮底下搞事?

美日印澳開小會,緊急在北京碰頭,當面反華,想在眼皮底下搞事?

東方點兵
2026-01-06 15:38:47
進步飛速!火箭小將近25場罰球命中率超85% 投籃真有望練出來

進步飛速!火箭小將近25場罰球命中率超85% 投籃真有望練出來

驚奇侃球
2026-01-06 23:54:42
瀚森真實命中率聯(lián)盟墊底!斷層落后倒數(shù)第二 投籃能力需大幅提升

瀚森真實命中率聯(lián)盟墊底!斷層落后倒數(shù)第二 投籃能力需大幅提升

羅說NBA
2026-01-06 10:56:40
丑到讓人哭泣的搭配,夏天千萬不要這么穿,真的是又土又尷尬

丑到讓人哭泣的搭配,夏天千萬不要這么穿,真的是又土又尷尬

灼灼小齊
2026-01-05 09:42:22
最近,美國連續(xù)扣押多艘中國商船,中國是如何反擊的?

最近,美國連續(xù)扣押多艘中國商船,中國是如何反擊的?

阿胡
2025-12-23 17:56:32
坦克300極地版上市,極地裝備全標配,起售價22.68萬元

坦克300極地版上市,極地裝備全標配,起售價22.68萬元

紅星新聞
2026-01-06 20:18:25
公開道歉,官宣二胎,驟然離世,1月剛開始,娛樂圈又有新“瓜”

公開道歉,官宣二胎,驟然離世,1月剛開始,娛樂圈又有新“瓜”

杰絲聊古今
2026-01-05 03:04:38
李圣龍:離開一線隊不是終點,我會用自己的方式繼續(xù)幫助球隊

李圣龍:離開一線隊不是終點,我會用自己的方式繼續(xù)幫助球隊

懂球帝
2026-01-06 16:50:08
冉瑩穎直播懺悔:我敗光億萬資產(chǎn),丈夫鄒市明被迫復出拳壇

冉瑩穎直播懺悔:我敗光億萬資產(chǎn),丈夫鄒市明被迫復出拳壇

趕鴨子上架
2026-01-05 21:49:38
羽球冷門不斷!3大種子1輪游,國羽10人晉級,石宇奇奪冠后首勝!

羽球冷門不斷!3大種子1輪游,國羽10人晉級,石宇奇奪冠后首勝!

劉姚堯的文字城堡
2026-01-06 19:28:29
上海啟動“穩(wěn)崗留工”工作

上海啟動“穩(wěn)崗留工”工作

中國青年報
2026-01-06 14:14:20
丹麥首相警告特朗普:如果美國對丹麥動武,則“一切都將終結”

丹麥首相警告特朗普:如果美國對丹麥動武,則“一切都將終結”

現(xiàn)代小青青慕慕
2026-01-06 22:12:44
馬年起運!這3個生肖翻身逆襲,財神上門,大財小財全收

馬年起運!這3個生肖翻身逆襲,財神上門,大財小財全收

毅談生肖
2026-01-06 10:05:47
2026-01-07 05:47:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16087文章數(shù) 514456關注度
往期回顧 全部

科技要聞

速看!黃仁勛萬字實錄:甩出"物理AI"王牌

頭條要聞

特朗普:若輸中期選舉 我可能被彈劾

頭條要聞

特朗普:若輸中期選舉 我可能被彈劾

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財經(jīng)要聞

50萬億存款"洪流"將至 四大去向引關注

汽車要聞

摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

本地
教育
家居
公開課
軍事航空

本地新聞

云游內蒙|初見呼和浩特,古今交融的北疆都會

教育要聞

家長:我都能接受孩子的平庸,為什么老師就不能接受呢?

家居要聞

引光之宅 地下室也有生機

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美稱對“占領”委內瑞拉保留選擇權

無障礙瀏覽 進入關懷版