国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

兩款A(yù)I學(xué)術(shù)智能體:自動(dòng)生成論文圖表與同行評(píng)審

0
分享至


學(xué)術(shù)研究工作流正在經(jīng)歷前所未有的變革,AI的快速發(fā)展是這一變革的核心驅(qū)動(dòng)力。學(xué)術(shù)研究流程歷來嚴(yán)謹(jǐn)繁瑣,遠(yuǎn)不止構(gòu)思想法和撰寫論文那么簡(jiǎn)單。許多研究人員面臨的一大難題,是如何有效地將研究成果可視化。盡管AI能夠輔助文字撰寫,但要生成頂級(jí)會(huì)議和期刊所要求的復(fù)雜方法論示意圖和精確的統(tǒng)計(jì)圖表,難度要大得多。與此同時(shí),科學(xué)界依賴同行評(píng)審來維護(hù)已發(fā)表研究的學(xué)術(shù)嚴(yán)謹(jǐn)性,然而論文投稿數(shù)量的爆炸式增長(zhǎng)使這一體系承受巨大壓力,導(dǎo)致評(píng)審人疲憊不堪、評(píng)審質(zhì)量參差不齊。隨著大語言模型和多智能體系統(tǒng)日趨成熟,我們看到它們不僅僅是研究對(duì)象,更有潛力成為科學(xué)研究過程的主動(dòng)參與者。

為此,我們推出兩個(gè)全新的智能體框架:(一)PaperVizAgent(原名PaperBanana),一款用于繪制學(xué)術(shù)圖表的可視化智能體;(二)ScholarPeer,一款能夠自動(dòng)且嚴(yán)格評(píng)估學(xué)術(shù)論文(包括論文中嵌入的圖表)的評(píng)審智能體。這兩款智能體專為輔助學(xué)術(shù)研究全生命周期而設(shè)計(jì),旨在幫助科研人員將精力集中于創(chuàng)新本身,而非繁瑣的輔助性工作。評(píng)估結(jié)果顯示,PaperVizAgent能夠穩(wěn)定生成達(dá)到專家水準(zhǔn)的圖表,表現(xiàn)大幅優(yōu)于主流基準(zhǔn)模型(GPT-Image-1.5、Nano-Banana-Pro、Paper2Any);而ScholarPeer則能輸出具有高度批判性、有文獻(xiàn)依據(jù)支撐的評(píng)審意見,超越當(dāng)前最先進(jìn)的自動(dòng)化評(píng)審工具。

PaperVizAgent介紹

PaperVizAgent是一個(gè)自主框架,旨在根據(jù)學(xué)術(shù)文本自動(dòng)生成適合發(fā)表的學(xué)術(shù)插圖。通過彌合技術(shù)描述與視覺傳達(dá)之間的鴻溝,PaperVizAgent讓研究人員能夠直接從論文手稿中生成專業(yè)級(jí)圖表。啟動(dòng)流程時(shí),研究人員需提供兩項(xiàng)輸入內(nèi)容。

PaperVizAgent框架協(xié)同調(diào)度五個(gè)專業(yè)化AI智能體,分別是:(1)檢索智能體、(2)規(guī)劃智能體、(3)風(fēng)格智能體、(4)可視化智能體,以及(5)評(píng)審智能體。首先,檢索智能體和規(guī)劃智能體負(fù)責(zé)收集參考資料(例如,參照已有文獻(xiàn)中的相關(guān)學(xué)術(shù)圖表)并對(duì)內(nèi)容進(jìn)行組織整理。隨后,風(fēng)格智能體綜合歸納美學(xué)規(guī)范,確保輸出結(jié)果符合學(xué)術(shù)標(biāo)準(zhǔn)??梢暬悄荏w負(fù)責(zé)渲染圖像或生成可執(zhí)行的Python代碼用于統(tǒng)計(jì)圖表繪制。最后,評(píng)審智能體將輸出結(jié)果與原始文本進(jìn)行對(duì)照評(píng)估。若發(fā)現(xiàn)不一致之處,評(píng)審智能體將向可視化智能體提供針對(duì)性反饋,觸發(fā)迭代優(yōu)化循環(huán)。通過這一多智能體系統(tǒng)的反復(fù)迭代,最終生成的插圖既美觀大方,又在技術(shù)層面準(zhǔn)確無誤。

在給定來源內(nèi)容與傳達(dá)意圖后,PaperVizAgent會(huì)檢索相關(guān)參考示例,并綜合生成經(jīng)過風(fēng)格優(yōu)化的描述,再通過迭代優(yōu)化循環(huán)將該描述轉(zhuǎn)化為最終插圖。

在全面的實(shí)驗(yàn)評(píng)測(cè)中,PaperVizAgent持續(xù)優(yōu)于各主流基準(zhǔn)模型,包括直接提示法、少樣本提示法以及當(dāng)前最先進(jìn)的可視化方法Paper2Any。系統(tǒng)采用比較評(píng)分指標(biāo)(0至100分制,分值越高越好)進(jìn)行嚴(yán)格評(píng)估,涵蓋忠實(shí)度、簡(jiǎn)潔性、可讀性和美觀性四個(gè)關(guān)鍵維度。評(píng)測(cè)中使用的大語言模型評(píng)判器以人工繪制的圖表作為輸入進(jìn)行校準(zhǔn),并將人類表現(xiàn)基準(zhǔn)設(shè)定為50.0分。

PaperVizAgent取得了60.2分的優(yōu)異總分,顯著超越GPT-Image-1.5、Nano-Banana-Pro和Paper2Any等所有參評(píng)基準(zhǔn)模型,也是唯一在綜合評(píng)分上突破人類基準(zhǔn)線50.0分的框架。從各細(xì)分維度來看,該系統(tǒng)在簡(jiǎn)潔性和美觀性方面尤為突出,兩項(xiàng)得分均遠(yuǎn)高于人類基準(zhǔn)值;在統(tǒng)計(jì)圖表生成方面,其表現(xiàn)同樣達(dá)到了與人類相當(dāng)?shù)乃?,充分體現(xiàn)了系統(tǒng)的多功能性。上述成果代表著自動(dòng)化學(xué)術(shù)插圖領(lǐng)域的重大突破。

ScholarPeer介紹

ScholarPeer是一個(gè)具有情境感知能力、支持搜索的多智能體框架,旨在模擬資深研究人員的工作流程,實(shí)現(xiàn)同行評(píng)審過程的自動(dòng)化與質(zhì)量提升。

與將評(píng)審視為簡(jiǎn)單文本生成任務(wù)的標(biāo)準(zhǔn)大語言模型不同,ScholarPeer依賴于情境獲取與主動(dòng)核驗(yàn)的雙流程機(jī)制。它通過一個(gè)子領(lǐng)域歷史智能體動(dòng)態(tài)構(gòu)建領(lǐng)域敘事,將評(píng)審內(nèi)容錨定于實(shí)時(shí)的網(wǎng)絡(luò)規(guī)模文獻(xiàn)之中?;€偵察智能體則充當(dāng)對(duì)抗性審計(jì)員,專門排查作者可能遺漏的數(shù)據(jù)集或?qū)Ρ然鶞?zhǔn)。最后,多維度問答引擎對(duì)論文的技術(shù)主張進(jìn)行嚴(yán)格核實(shí),確保評(píng)審內(nèi)容深入且基于事實(shí)。最終生成的評(píng)審報(bào)告涵蓋詳細(xì)摘要、優(yōu)點(diǎn)、不足以及對(duì)作者的提問,形式與標(biāo)準(zhǔn)專家評(píng)審高度一致。

針對(duì)輸入論文,ScholarPeer采用雙流信息檢索流程。情境與知識(shí)模塊通過摘要生成器和具備搜索功能的文獻(xiàn)綜述工具,對(duì)內(nèi)外部信息進(jìn)行壓縮整合。這些輸入隨后進(jìn)入多維度問答引擎,該引擎圍繞論文的創(chuàng)新性和技術(shù)可靠性生成并回答深度追問。最后,評(píng)審生成器綜合以上輸入及特定會(huì)議的評(píng)審規(guī)范,生成最終評(píng)審意見。

ScholarPeer的表現(xiàn)充分證明了將主動(dòng)網(wǎng)絡(luò)搜索與多智能體協(xié)同編排相結(jié)合在學(xué)術(shù)評(píng)審領(lǐng)域的巨大潛力。在大型公開數(shù)據(jù)集上的測(cè)試中,ScholarPeer在與當(dāng)前最先進(jìn)的自動(dòng)化評(píng)審方法的對(duì)比評(píng)測(cè)中取得了顯著的勝率優(yōu)勢(shì)。更重要的是,該系統(tǒng)的主動(dòng)核驗(yàn)工作流大幅縮小了AI生成反饋與人類評(píng)審多樣性之間的差距,所產(chǎn)出的評(píng)審意見批判性強(qiáng)、貼近實(shí)際,并深度植根于現(xiàn)有文獻(xiàn)之中。

總結(jié)與展望

PaperVizAgent與ScholarPeer是我們探索AI輔助科研這一宏觀方向的重要組成部分。通過分別應(yīng)對(duì)論文發(fā)表生命周期中兩個(gè)截然不同卻同樣繁重的階段,這兩款工具以協(xié)作者的角色提升了科學(xué)交流的質(zhì)量,并能與其他工具協(xié)同,加速知識(shí)的傳播與擴(kuò)散。

盡管這兩個(gè)框架已能為學(xué)術(shù)界帶來即時(shí)且切實(shí)的價(jià)值,但這僅僅是我們探索旅程的起點(diǎn)。我們期望未來的研究人員能夠擁有一套豐富且互聯(lián)互通的AI助手生態(tài)系統(tǒng),無縫融入科學(xué)研究工作流的每一個(gè)環(huán)節(jié),我們也將在這一方向上持續(xù)深耕。

致謝

感謝Palash Goyal、Dawei Zhu、Mihir Parmar、Rui Meng、Yiwen Song、Yale Song、Hamid Palangi、Xiyu Wei、Sujian Li和Burak Gokturk對(duì)本項(xiàng)工作的寶貴貢獻(xiàn)。

免責(zé)聲明

PaperVizAgent與ScholarPeer均為實(shí)驗(yàn)性研究原型,并非面向生產(chǎn)環(huán)境的成熟工具。其自動(dòng)生成的反饋、圖表及評(píng)審意見僅供研究探索使用,不應(yīng)作為編輯或出版決策的唯一依據(jù)。

Q&A

Q1:PaperVizAgent是什么?它能生成哪些類型的學(xué)術(shù)圖表?

A:PaperVizAgent是一個(gè)自主智能體框架,能夠根據(jù)學(xué)術(shù)文本自動(dòng)生成適合發(fā)表的學(xué)術(shù)插圖,包括方法論示意圖和統(tǒng)計(jì)圖表。它由五個(gè)專業(yè)化智能體協(xié)同工作,通過迭代優(yōu)化確保圖表在視覺上美觀、技術(shù)上準(zhǔn)確。在評(píng)測(cè)中,其綜合得分為60.2分,是唯一超越人類基準(zhǔn)線(50.0分)的框架,在簡(jiǎn)潔性和美觀性維度上表現(xiàn)尤為突出。

Q2:ScholarPeer和普通大語言模型做論文評(píng)審有什么區(qū)別?

A:ScholarPeer與普通大語言模型的核心區(qū)別在于其雙流程機(jī)制:它不僅做文本生成,還通過子領(lǐng)域歷史智能體實(shí)時(shí)檢索網(wǎng)絡(luò)文獻(xiàn)構(gòu)建領(lǐng)域背景,并用基線偵察智能體專門查找作者遺漏的對(duì)比基準(zhǔn)。多維度問答引擎則對(duì)論文技術(shù)主張進(jìn)行嚴(yán)格核實(shí)。最終生成的評(píng)審報(bào)告包含摘要、優(yōu)點(diǎn)、不足及對(duì)作者的追問,接近真實(shí)專家評(píng)審水準(zhǔn),并在公開數(shù)據(jù)集測(cè)試中顯著優(yōu)于現(xiàn)有自動(dòng)化評(píng)審工具。

Q3:PaperVizAgent和ScholarPeer現(xiàn)在可以直接使用嗎?

A:目前這兩款工具均為實(shí)驗(yàn)性研究原型,尚未達(dá)到生產(chǎn)環(huán)境部署標(biāo)準(zhǔn)。官方明確說明,其自動(dòng)生成的圖表、反饋和評(píng)審意見僅供研究探索使用,不應(yīng)作為編輯或出版決策的唯一依據(jù)。如需使用,需了解其局限性,并結(jié)合人工判斷進(jìn)行綜合評(píng)估。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2010年李敖之子入讀北大,對(duì)記者說韓寒算老幾啊,韓寒:我無所謂

2010年李敖之子入讀北大,對(duì)記者說韓寒算老幾啊,韓寒:我無所謂

涼州辭
2026-04-09 09:45:03
在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個(gè)比一個(gè)炸裂啊

在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個(gè)比一個(gè)炸裂啊

解讀熱點(diǎn)事件
2026-02-04 00:05:07
江蘇省掛號(hào)費(fèi)最貴的十位醫(yī)生

江蘇省掛號(hào)費(fèi)最貴的十位醫(yī)生

華庭講美食
2026-04-10 12:09:24
浙江大學(xué)周一超被執(zhí)行死刑,死前大喊:我的靠山你們?nèi)遣黄?>
    </a>
        <h3>
      <a href=紀(jì)實(shí)錄
2024-10-08 17:20:44
88家機(jī)構(gòu),“盯”上這家公司

88家機(jī)構(gòu),“盯”上這家公司

新浪財(cái)經(jīng)
2026-04-11 23:19:03
再提打擊“村霸”,有何深意?

再提打擊“村霸”,有何深意?

中國(guó)新聞周刊
2026-04-11 19:20:04
為黃國(guó)昌輔選,柯文哲喊:藍(lán)綠一樣缺德!鄭麗文的2028大局破了?

為黃國(guó)昌輔選,柯文哲喊:藍(lán)綠一樣缺德!鄭麗文的2028大局破了?

愛意隨風(fēng)起呀
2026-04-12 00:03:30
新加坡急了,外長(zhǎng)幾乎是拍著桌子,讓中國(guó)“尊重”馬六甲的地位。

新加坡急了,外長(zhǎng)幾乎是拍著桌子,讓中國(guó)“尊重”馬六甲的地位。

南權(quán)先生
2026-01-26 15:41:26
政變只是一個(gè)開始,伊朗要變天了,中國(guó)最擔(dān)心的事情,恐將發(fā)生

政變只是一個(gè)開始,伊朗要變天了,中國(guó)最擔(dān)心的事情,恐將發(fā)生

阿坹武器裝備科普
2026-04-11 18:32:07
每吃一次,猝死就快一步?醫(yī)生:這4物是心源性猝死的“催化劑”

每吃一次,猝死就快一步?醫(yī)生:這4物是心源性猝死的“催化劑”

健康科普365
2026-04-03 22:00:07
風(fēng)向驟變!以德為首的西方國(guó)家齊發(fā)聲:中國(guó)已在換電關(guān)鍵領(lǐng)域崛起

風(fēng)向驟變!以德為首的西方國(guó)家齊發(fā)聲:中國(guó)已在換電關(guān)鍵領(lǐng)域崛起

夢(mèng)史
2026-04-12 00:25:48
中超本賽季下課第一人預(yù)測(cè)!坐擁豪華陣容卻連戰(zhàn)連敗,急需爆發(fā)

中超本賽季下課第一人預(yù)測(cè)!坐擁豪華陣容卻連戰(zhàn)連敗,急需爆發(fā)

劉哥談體育
2026-04-11 16:01:43
維爾茨創(chuàng)造50次運(yùn)動(dòng)戰(zhàn)機(jī)會(huì),成為本賽季英超繼B費(fèi)之后第二人

維爾茨創(chuàng)造50次運(yùn)動(dòng)戰(zhàn)機(jī)會(huì),成為本賽季英超繼B費(fèi)之后第二人

懂球帝
2026-04-12 03:10:14
金正恩自己都沒想到,下令出兵俄羅斯后,會(huì)給朝鮮帶來這么多驚喜

金正恩自己都沒想到,下令出兵俄羅斯后,會(huì)給朝鮮帶來這么多驚喜

混沌錄
2026-04-11 20:56:12
1997年,離休后的張宗遜,穿著病號(hào)服,坐在輪椅上,一張罕見留影

1997年,離休后的張宗遜,穿著病號(hào)服,坐在輪椅上,一張罕見留影

探源歷史
2026-04-04 12:17:02
五十七位開國(guó)上將,軍隊(duì)級(jí)別最低的是誰?他此前擔(dān)任過什么職務(wù)?

五十七位開國(guó)上將,軍隊(duì)級(jí)別最低的是誰?他此前擔(dān)任過什么職務(wù)?

芳芳?xì)v史燴
2026-04-05 08:42:08
全紅嬋后續(xù):網(wǎng)友喊話接著抓,有人開始慌亂,利益鏈條被曝光!

全紅嬋后續(xù):網(wǎng)友喊話接著抓,有人開始慌亂,利益鏈條被曝光!

眼光很亮
2026-04-11 18:25:25
家里有廢舊手機(jī)的要留意,手機(jī)店員工說漏嘴,記得提醒家人朋友

家里有廢舊手機(jī)的要留意,手機(jī)店員工說漏嘴,記得提醒家人朋友

小談食刻美食
2026-04-02 08:57:37
當(dāng)年害得游戲廳倒閉的罪魁禍?zhǔn)?,麻將BUG的使用者早已不在人世

當(dāng)年害得游戲廳倒閉的罪魁禍?zhǔn)?,麻將BUG的使用者早已不在人世

小怪吃美食
2026-04-11 00:12:11
角力伊斯蘭堡,美伊都到了!宮殿風(fēng)格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經(jīng)驗(yàn);預(yù)計(jì)雙方各占酒店一邊,避免走廊偶遇

角力伊斯蘭堡,美伊都到了!宮殿風(fēng)格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經(jīng)驗(yàn);預(yù)計(jì)雙方各占酒店一邊,避免走廊偶遇

每日經(jīng)濟(jì)新聞
2026-04-11 16:34:11
2026-04-12 04:08:49
至頂頭條 incentive-icons
至頂頭條
記錄和推動(dòng)數(shù)字化創(chuàng)新
17586文章數(shù) 49697關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂要聞

鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

財(cái)經(jīng)要聞

從日本翻身看:這次誰能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

健康
教育
手機(jī)
房產(chǎn)
時(shí)尚

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

阿圖什西部計(jì)劃志愿者訪顧炎武家鄉(xiāng)

手機(jī)要聞

全球首款闊折疊賣爆!華為Pura X一年出貨量超150萬臺(tái)

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026??跇鞘?,格局大變!

普通人穿衣其實(shí)很簡(jiǎn)單!構(gòu)造腰線、一衣多穿,大方舒適又自然

無障礙瀏覽 進(jìn)入關(guān)懷版