国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從“造工具”到“用倉庫”:RepoMaster,駕馭GitHub解決復(fù)雜任務(wù)的智能體大師!

0
分享至


RepoMaster旨在讓AI智能體像人類專家一樣,解決真實世界中的復(fù)雜開發(fā)任務(wù)。

作者丨QuantaAlpha

GitHub 上托管著超過5.2億個代碼倉庫,形成了一個龐大且持續(xù)增長的開源生態(tài)系統(tǒng)。然而,對于開發(fā)者而言,這片富饒的“代碼海洋”也常常意味著巨大的挑戰(zhàn):我們都曾有過這樣的經(jīng)歷——在GitHub上找到一個看似完美的項目,滿懷希望地 git clone,卻旋即陷入環(huán)境配置、依賴沖突和代碼理解的泥潭。過時的文檔、復(fù)雜的內(nèi)部邏輯和隱藏的入口點,常常讓“復(fù)用”的初衷演變成一場耗時費力的“考古”。

與主流社區(qū)致力于“為AI智能體開發(fā)更多專用工具”的思路不同,我們認(rèn)為,真正能被轉(zhuǎn)化的工具并不匱乏,解決智能體落地應(yīng)用的挑戰(zhàn)并非需要耗費大量人力、時間來專門設(shè)計和制造工具,而是如何讓智能體學(xué)會駕馭這個已經(jīng)存在的、海量的代碼世界。

因此,中科院、清華大學(xué)、北京大學(xué)、新加坡國立大學(xué)等機構(gòu)的研究者,與前沿開源學(xué)術(shù)組織 QuantaAlpha 及階躍星辰姜大昕團(tuán)隊聯(lián)合,共同推出了RepoMaster,其核心理念并非“造輪子”,而是“找到并用好輪子”——它能夠根據(jù)任務(wù)需求,首先利用深度搜索技術(shù)在海量開源項目中定位并篩選出最相關(guān)的代碼倉庫,然后將這個倉庫視為一個潛在的、可以直接調(diào)用的強大工具。RepoMaster 旨在讓AI智能體像人類專家一樣,能夠自主探索和理解陌生的代碼庫,從中快速提煉核心功能并加以利用;然后,它基于這份理解,自主地規(guī)劃任務(wù)、編寫和執(zhí)行代碼,并根據(jù)環(huán)境反饋進(jìn)行動態(tài)調(diào)整,從而以最小的適配成本,解決真實世界中的復(fù)雜開發(fā)任務(wù)。


  • 論文標(biāo)題:RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving

  • 論文鏈接:https://arxiv.org/pdf/2505.21577

  • GitHub: https://github.com/QuantaAlpha/RepoMaster

01

RepoMaster核心框架:從深度理解到自主執(zhí)行的三步閉環(huán)

RepoMaster的工作流程始于動態(tài)搜索與選擇:它首先根據(jù)任務(wù)需求,利用深度搜索技術(shù)在GitHub上篩選并鎖定最合適的代碼倉庫。在此之后,RepoMaster的核心優(yōu)勢便體現(xiàn)于其三階段閉環(huán)框架,該框架系統(tǒng)性地解決了AI智能體在面對陌生代碼庫時“看不懂、用不來”的根本難題,從而實現(xiàn)高效、自主的任務(wù)執(zhí)行。


第一階段:層級化倉庫分析—— 從全局到核心

面對陌生的代碼庫,RepoMaster首先進(jìn)行靜態(tài)的、結(jié)構(gòu)感知的分析,為后續(xù)探索建立一幅“導(dǎo)航地圖”。

  • 混合結(jié)構(gòu)化倉庫映射:通過AST解析,RepoMaster構(gòu)建出三種互補視圖來描繪代碼庫全貌:

    ?層次化代碼樹 (HCT):揭示代碼的包、模塊、類、函數(shù)間的層級關(guān)系。

    ?函數(shù)調(diào)用圖 (FCG):描繪函數(shù)間的調(diào)用關(guān)系,追蹤程序脈絡(luò)。

    ?模塊依賴圖 (MDG):理清模塊間的導(dǎo)入依賴,洞察項目架構(gòu)。

  • 核心組件識別:RepoMaster獨創(chuàng)了一套多維度評分機制(綜合依賴度、復(fù)雜度、Git更新頻率等),從全局視圖中精準(zhǔn)定位出倉庫最關(guān)鍵的核心模塊與類,為后續(xù)探索提供焦點。


第二階段:自主探索與執(zhí)行 (Autonomous Exploration & Execution) —— 從靜態(tài)地圖到動態(tài)導(dǎo)航

有了結(jié)構(gòu)化的“地圖”和初始上下文,RepoMaster便開始了任務(wù)驅(qū)動的動態(tài)探索與執(zhí)行循環(huán)。

  • 上下文感知的代碼探索 (Context-aware Code Exploration):RepoMaster配備了一套強大的探索工具集,允許智能體:

    ?精細(xì)化代碼查看:按需查看任意文件、類或函數(shù)的具體實現(xiàn)。

    ?依賴分析:沿著函數(shù)調(diào)用圖(FCG)和模塊依賴圖(MDG)追溯調(diào)用鏈和依賴路徑。

    ?代碼搜索:通過關(guān)鍵詞快速定位相關(guān)代碼片段。

  • 基于反饋的交互式執(zhí)行 (Interactive Feedback-based Execution):探索與執(zhí)行并非線性序列,而是一個緊密交織的閉環(huán)。智能體可以靈活地在編寫代碼、查看文件、分析日志和追蹤依賴之間切換,并根據(jù)執(zhí)行結(jié)果(成功或失?。┑姆答?,實時調(diào)整下一步的行動策略,實現(xiàn)“邊做邊學(xué)、邊學(xué)邊做”。

第三階段:高效信息篩選—— 為LLM上下文“減負(fù)”

為在有限的token窗口內(nèi)進(jìn)行高效的多輪交互,RepoMaster采用了一套多層次信息篩選策略,確保每一輪交互都聚焦于高價值信息:

  • 代碼減負(fù):對源代碼,僅提取與任務(wù)相關(guān)的AST子樹。

  • 文檔減負(fù):對大型文檔,將其分塊并根據(jù)任務(wù)相關(guān)性檢索最關(guān)鍵的片段。

  • 日志減負(fù):對執(zhí)行日志,模仿人類調(diào)試習(xí)慣,只保留包含關(guān)鍵錯誤信息的首尾部分,過濾掉冗長的中間輸出。

02

實驗評估:效果與效率的雙重飛躍

為了驗證RepoMaster的實力,我們選用了兩大極具挑戰(zhàn)性的評測基準(zhǔn),二者均摒棄了傳統(tǒng)的“從零生成代碼”模式,轉(zhuǎn)而考察智能體直接在現(xiàn)有代碼庫上解決復(fù)雜任務(wù)的能力。第一個是MLE-R,它改編自 OpenAI 的 MLE-Bench,將評測范式從“從零寫代碼”轉(zhuǎn)變?yōu)椤皬?fù)用GitHub項目解決機器學(xué)習(xí)任務(wù)”。第二個是我們?nèi)聵?gòu)建的GitTaskBench,它將這一理念擴(kuò)展到更廣泛的真實世界任務(wù)(如老照片修復(fù)、語音降噪等),并開創(chuàng)性地引入了交付質(zhì)量(Task Pass Rate)作為核心指標(biāo),旨在評測AI智能體端到端“交付成果”而非僅僅“跑通代碼”的能力。



  • 性能全面超越:無論是在MLE-R還是GitTaskBench上,RepoMaster的表現(xiàn)都遠(yuǎn)超OpenHands和SWE-Agent等主流框架。以GitTaskBench為例,在Claude 3.5模型的驅(qū)動下,RepoMaster將最高任務(wù)成功率從40.74%提升至62.96%,實現(xiàn)了跨越式增長。

  • 效率大幅領(lǐng)先:更令人印象深刻的是,RepoMaster在取得優(yōu)異性能的同時,展現(xiàn)了極高的效率。在GitTaskBench上,RepoMaster的token消耗量僅為SWE-Agent的約57%,極大地降低了使用成本。

  • 消融實驗驗證核心組件有效性:通過逐一移除核心組件,實驗證明了層級化分析、代碼探索和信息篩選三大模塊對于性能的決定性作用。移除任何一個組件都會導(dǎo)致性能顯著下降,驗證了RepoMaster設(shè)計的科學(xué)性與完整性。


03

案例分析:直觀對比

在一個復(fù)雜的3D姿態(tài)估計任務(wù)中,基線智能體或因無效的試錯而失敗,或因缺乏對倉庫的整體理解而偏離核心算法。相比之下,RepoMaster憑借其結(jié)構(gòu)化分析能力,迅速鎖定了關(guān)鍵組件,高效地完成了任務(wù),直觀地展示了其在解決真實世界復(fù)雜問題上的優(yōu)勢。


04

結(jié)論與展望

RepoMaster的提出,不僅是性能指標(biāo)上的突破,更重要的是,它為AI智能體如何有效利用龐大的人類代碼遺產(chǎn)庫指明了一條清晰可行的道路。它證明了將開源倉庫被有效利用后能被視為可組合、可復(fù)用的“工具”,而非從零開始的“負(fù)擔(dān)”,是解決復(fù)雜現(xiàn)實世界任務(wù)的強大范式。

未來,RepoMaster的設(shè)計理念有望推動一個更具可持續(xù)性和協(xié)作性的AI-for-code生態(tài)系統(tǒng),為實現(xiàn)多項目的大規(guī)模協(xié)同、軟件缺陷的自動化修復(fù),乃至向硬件描述語言、機器人中間件等領(lǐng)域的遷移奠定基礎(chǔ)。通過讓AI智能體真正學(xué)會“站在巨人的肩膀上”,RepoMaster正在加速人機協(xié)作的良性循環(huán),推動整個開源世界的持續(xù)創(chuàng)新與進(jìn)步。


關(guān)于 QuantaAlpha
?QuantaAlpha 成立于 2025 年 4 月,由來自清華、北大、中科院、CMU、港科大、中科大等學(xué)校的教授、博士后、博士與碩士組成。我們的使命是探索智能的“量子”世界,引領(lǐng)智能體研究的“阿爾法”前沿 —— 從CodeAgent到自進(jìn)化智能,再到金融、醫(yī)療等跨領(lǐng)域?qū)S弥悄荏w,致力于重塑人工智能的邊界。

? 2025 年,我們將在CodeAgent(真實世界任務(wù)的端到端自主執(zhí)行)、DeepResearch、Agentic Reasoning/Agentic RL、自進(jìn)化與協(xié)同學(xué)習(xí)等方向持續(xù)產(chǎn)出高質(zhì)量研究成果,歡迎對我們方向感興趣的同學(xué)加入我們!

團(tuán)隊主頁:https://quantaalpha.github.io/

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
亞歷山大32+7+6雷霆送快船5連敗,哈登缺席萊納德22+8+6

亞歷山大32+7+6雷霆送快船5連敗,哈登缺席萊納德22+8+6

湖人崛起
2025-12-19 11:25:36
海南封關(guān)首日太瘋狂!1.5噸馬來西亞榴蓮1小時搶空,價格直降一半

海南封關(guān)首日太瘋狂!1.5噸馬來西亞榴蓮1小時搶空,價格直降一半

娛樂的硬糖吖
2025-12-19 04:21:18
不干涉他國內(nèi)政

不干涉他國內(nèi)政

周邊問題研究所
2025-12-18 21:22:36
剛剛,哈佛長新冠研究突破!發(fā)現(xiàn)背后黑手

剛剛,哈佛長新冠研究突破!發(fā)現(xiàn)背后黑手

徐德文科學(xué)頻道
2025-12-18 21:44:08
日本迫使蘋果調(diào)整iOS規(guī)則大幅降低蘋果稅,中國繼續(xù)人傻錢多?

日本迫使蘋果調(diào)整iOS規(guī)則大幅降低蘋果稅,中國繼續(xù)人傻錢多?

風(fēng)向觀察
2025-12-18 16:40:37
內(nèi)存價格暴漲,小米、榮耀等平板宣布即將漲價

內(nèi)存價格暴漲,小米、榮耀等平板宣布即將漲價

三言科技
2025-12-17 08:56:42
鴻蒙系統(tǒng)居然不讓買甲流用藥!用戶憤怒吐槽后,華為客服光速道歉

鴻蒙系統(tǒng)居然不讓買甲流用藥!用戶憤怒吐槽后,華為客服光速道歉

回旋鏢
2025-12-18 19:18:42
“9歲女孩術(shù)后成植物人”案一審宣判:醫(yī)院全責(zé),賠201萬元;母親:沒看到相關(guān)人員被追責(zé),醫(yī)院沒道歉

“9歲女孩術(shù)后成植物人”案一審宣判:醫(yī)院全責(zé),賠201萬元;母親:沒看到相關(guān)人員被追責(zé),醫(yī)院沒道歉

大風(fēng)新聞
2025-12-19 12:46:06
省會城市公安局局長,獲任新職!長期在公安系統(tǒng)工作

省會城市公安局局長,獲任新職!長期在公安系統(tǒng)工作

上觀新聞
2025-12-19 14:37:04
被撞員工已確認(rèn)死亡,撞人的小米新車司機恐承擔(dān)刑責(zé)

被撞員工已確認(rèn)死亡,撞人的小米新車司機恐承擔(dān)刑責(zé)

映射生活的身影
2025-12-18 22:56:32
海南封關(guān)背后,真正的意圖!

海南封關(guān)背后,真正的意圖!

子木聊房
2025-12-18 16:23:54
中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

大風(fēng)新聞
2025-12-19 11:54:20
起底南博6位鑒定專家,個個來頭不小,龐家5幅畫真的是“偽作”?

起底南博6位鑒定專家,個個來頭不小,龐家5幅畫真的是“偽作”?

數(shù)字財經(jīng)智庫
2025-12-19 10:32:32
最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

環(huán)球網(wǎng)資訊
2025-12-19 09:39:20
南博文物事件與兩任自殺館長背后的隱秘關(guān)聯(lián)

南博文物事件與兩任自殺館長背后的隱秘關(guān)聯(lián)

聽心堂
2025-12-19 06:59:59
張雨綺換臉成功!說不出來哪里變了,好像又都變了

張雨綺換臉成功!說不出來哪里變了,好像又都變了

爆角追蹤
2025-12-18 16:05:56
小鵬汽車法務(wù)部:已報案

小鵬汽車法務(wù)部:已報案

每日經(jīng)濟(jì)新聞
2025-12-18 14:52:26
細(xì)思極恐!南京全城導(dǎo)航集體失靈,揭開高德、百度地圖背后的真相

細(xì)思極恐!南京全城導(dǎo)航集體失靈,揭開高德、百度地圖背后的真相

火山詩話
2025-12-19 06:18:20
關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

關(guān)于楊蘭蘭,終于破解出幾條她的關(guān)鍵信息

詩意世界
2025-12-19 12:00:03
88比11!CBA最懸殊的比分誕生了:籃協(xié)看到這一幕后該懵了?

88比11!CBA最懸殊的比分誕生了:籃協(xié)看到這一幕后該懵了?

籃球快餐車
2025-12-19 01:21:14
2025-12-19 14:56:49
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
7012文章數(shù) 20715關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

教育
藝術(shù)
家居
手機
公開課

教育要聞

忘記密碼看這里!2025冬季學(xué)考(合格考)準(zhǔn)考證今起打?。〈蛴≈边_(dá)入口→

藝術(shù)要聞

諸樂三的寫意花鳥

家居要聞

高端私宅 理想隱居圣地

手機要聞

顏值實力雙在線 vivo S50 Pro mini小屏實力派

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版