国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nature認(rèn)定的論文綜述神器來了

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

AI寫論文這事兒確實(shí)不新鮮了,但天下苦假引用久矣。

以往咱用大模型寫個(gè)綜述,看著像模像樣的,結(jié)果一查參考文獻(xiàn)——

好家伙,論文不存在、期刊不存在、作者也不存在(扶額)。

現(xiàn)在不用愁了,Nature新發(fā)表了一篇研究,艾倫人工智能研究所(Ai2)和華盛頓大學(xué)開源了一個(gè)叫OpenScholar的AI系統(tǒng),寫文獻(xiàn)綜述絕不瞎編。



背靠整整4500萬篇科學(xué)論文庫,直接把GPT-4o那種78%-90%的虛假引用率給干翻了。

那么問題來了,大家都在編,OpenScholar為啥不編?

自我反饋推理

其實(shí)主要還是因?yàn)長LM的底層邏輯就是預(yù)測下一個(gè)詞出現(xiàn)的概率。

當(dāng)你問它一個(gè)非常生僻的學(xué)術(shù)問題時(shí),它為了維持語言的連貫性以及“我無所不知”的人設(shè)——

會強(qiáng)行根據(jù)語料庫里的作者名、期刊名、標(biāo)題關(guān)鍵詞,拼湊出一個(gè)看起來最像真論文的…幻覺產(chǎn)物。

還有,通用AI缺乏事實(shí)錨點(diǎn),讀過萬卷書結(jié)果全記串了。

張教授寫過超導(dǎo),李教授寫過材料,當(dāng)你問它超導(dǎo)材料時(shí),它能面不改色地給你編出一篇《張教授與李教授關(guān)于超導(dǎo)材料的巔峰對話》……

這種由于訓(xùn)練數(shù)據(jù)截?cái)嘁约?strong>缺乏真實(shí)文獻(xiàn)驗(yàn)證機(jī)制導(dǎo)致的假引用,真的太太太離譜了!



OpenScholar就不一樣了,不再拍腦門預(yù)測下一個(gè)詞,直接接入了一個(gè)名為ScholarStore的龐大數(shù)據(jù)庫。

這是目前公開的最大科學(xué)領(lǐng)域段落索引,全開源可下載,任何人都能本地部署或者擴(kuò)展。

里面實(shí)打?qū)嵉卮媪?500萬篇論文的全文和摘要,再通過RAG技術(shù),讓每個(gè)知識點(diǎn)都背靠一篇真實(shí)存在的論文。

當(dāng)你拋出一個(gè)科研難題,它會先在那個(gè)擁有2.37億個(gè)向量嵌入的超大數(shù)據(jù)庫里瘋狂檢索,把相關(guān)的論文片段全翻出來。

給出初稿之后,帶著生成的“這里缺少討論”“這里引文不準(zhǔn)”“需要補(bǔ)搜最新進(jìn)展”等反饋再檢索、再改稿,通過搜索、生成、自我審查、再搜索、再修正這套閉環(huán),反復(fù)確認(rèn)輸出的內(nèi)容是不是真有論文支撐。

這樣一來顯著降低了幻覺,提高了輸出內(nèi)容的覆蓋度和引文精度,整個(gè)管道還會被用來生成高質(zhì)量合成數(shù)據(jù),反哺訓(xùn)練。



有多強(qiáng)?

但是!如果只是搜得準(zhǔn),那它充其量是個(gè)高級搜索引擎,OpenScholar不止如此。

它在知識合成的深度上,已經(jīng)開始正面硬剛?cè)祟悓<伊恕?/p>

研發(fā)團(tuán)隊(duì)整了個(gè)叫Scholar QABench的測試集,涵蓋了計(jì)算機(jī)科學(xué)、物理、生物醫(yī)藥等最吃邏輯的領(lǐng)域,由3000個(gè)問題和250個(gè)長篇專家答案構(gòu)成。

在自動測評上,OpenScholar-8B這個(gè)體量不算大的模型,在正確性上GPT-4o高出5%,比專業(yè)的PaperQA2也高出7%,引文準(zhǔn)確度和人類專家持平。



團(tuán)隊(duì)還搞了個(gè)“人機(jī)大戰(zhàn)”雙盲實(shí)驗(yàn),把AI寫的答案和實(shí)打?qū)嵉牟┦俊⒀芯繂T寫的答案放一起,然后讓另一群頂級科學(xué)家來盲評打分。

16位專家兩兩對比了108份學(xué)術(shù)答案。結(jié)果顯示,OpenScholar-8B的回答有51%比人類研究者親手寫的更好,升級組合版的OpenScholar-GPT4o勝率更是沖到70%,而普通GPT-4o只有32%。

評審專家們普遍反饋,OpenScholar的優(yōu)勢集中在信息覆蓋更全面、結(jié)構(gòu)更清晰、邏輯連貫性更強(qiáng),實(shí)用價(jià)值也更高。

作者團(tuán)隊(duì)

這篇研究的一作Akari Asai是艾倫人工智能研究所研究科學(xué)家,2026年秋起將任卡內(nèi)基梅隆大學(xué)助理教授。

在此之前她獲得了東京大學(xué)電氣工程與計(jì)算機(jī)科學(xué)專業(yè)的學(xué)士學(xué)位,后在華盛頓大學(xué)完成博士學(xué)業(yè),研究聚焦于自然語言處理和機(jī)器學(xué)習(xí),尤其側(cè)重于大型語言模型。



Jacqueline He目前在華盛頓大學(xué)讀自然語言處理專業(yè)博士,本科畢業(yè)于普林斯頓大學(xué),曾是普林斯頓自然語言處理小組成員,主要導(dǎo)師是陳丹琦。

讀研之前,她還擔(dān)任過Meta的軟件工程師。

Rulin Shao本科畢業(yè)于西安交通大學(xué),取得了數(shù)學(xué)的學(xué)士學(xué)位,后在卡內(nèi)基梅隆大學(xué)完成了機(jī)器學(xué)習(xí)碩士學(xué)位,現(xiàn)為華盛頓大學(xué)博士生,同時(shí)也是Meta的訪問研究員。



團(tuán)隊(duì)的其他作者均來自伊利諾伊大學(xué)厄巴納 - 香檳分校、卡內(nèi)基梅隆大學(xué)、Meta、北卡羅來納大學(xué)教堂山分校、斯坦福大學(xué)等高校和機(jī)構(gòu)。

論文地址:https://arxiv.org/abs/2411.14199

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
兒子長相神似妻子領(lǐng)導(dǎo),丈夫決定做親子鑒定,結(jié)果出來后愣住了

兒子長相神似妻子領(lǐng)導(dǎo),丈夫決定做親子鑒定,結(jié)果出來后愣住了

紅豆講堂
2024-08-29 11:07:25
謝賢前女友再曝猛料!相識第一天拒絕了兩次謝賢,當(dāng)時(shí)行情非常好

謝賢前女友再曝猛料!相識第一天拒絕了兩次謝賢,當(dāng)時(shí)行情非常好

念得小柔
2026-02-13 02:19:33
28日-3月5日,陜西連續(xù)多日有雨雪!小雪、中到大雪、局地暴雪

28日-3月5日,陜西連續(xù)多日有雨雪!小雪、中到大雪、局地暴雪

榆林傳媒中心
2026-02-24 20:44:53
荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應(yīng)商,不再合作!

荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應(yīng)商,不再合作!

通鑒史智
2026-02-24 14:19:15
謝霆鋒香港中環(huán)被偶遇,一身紅衣十分搶鏡,人群中最帥的仔啊!

謝霆鋒香港中環(huán)被偶遇,一身紅衣十分搶鏡,人群中最帥的仔??!

情感大頭說說
2026-02-24 16:15:12
斯坦福大學(xué)竟然開了個(gè) AI 編程課?!我已經(jīng)學(xué)上了

斯坦福大學(xué)竟然開了個(gè) AI 編程課?!我已經(jīng)學(xué)上了

程序員魚皮
2026-02-23 16:25:03
美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

悅心知足
2026-02-21 23:03:46
讓人心寒!給弟弟三孩子每人500,自己一孩子回500,姐姐決定斷親

讓人心寒!給弟弟三孩子每人500,自己一孩子回500,姐姐決定斷親

火山詩話
2026-02-20 15:43:13
風(fēng)水有言:水即是財(cái),欲求富貴,屋中這3處放水,財(cái)如泉涌,福運(yùn)自聚

風(fēng)水有言:水即是財(cái),欲求富貴,屋中這3處放水,財(cái)如泉涌,福運(yùn)自聚

煙火人間故事匯
2025-09-16 13:00:15
3-1到8-1!女足狂飆背后,從0-8慘敗到亞洲杯衛(wèi)冕有戲?

3-1到8-1!女足狂飆背后,從0-8慘敗到亞洲杯衛(wèi)冕有戲?

老汆古裝影視解說
2026-02-25 02:48:50
他進(jìn)政治局沒多久靠邊站,找李富春:我不輕生,出意外你給我作證

他進(jìn)政治局沒多久靠邊站,找李富春:我不輕生,出意外你給我作證

談古論今歷史有道
2026-02-24 11:35:03
當(dāng)?shù)厝艘脖辉祝钊R酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

當(dāng)?shù)厝艘脖辉祝钊R酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

社會日日鮮
2026-02-24 09:27:23
終于出手了!桂林城管對象山區(qū)這個(gè)讓市民心煩的情況開始整治了

終于出手了!桂林城管對象山區(qū)這個(gè)讓市民心煩的情況開始整治了

每日桂林
2026-02-24 21:09:01
湖北“臭名遠(yuǎn)播”的五所大學(xué)!已遭人民日報(bào)點(diǎn)名批評,考生請留意

湖北“臭名遠(yuǎn)播”的五所大學(xué)!已遭人民日報(bào)點(diǎn)名批評,考生請留意

戶外阿毽
2026-02-24 01:32:21
航發(fā)這塊也開始飚速!光是WS-10的產(chǎn)量就已接近1000臺/年

航發(fā)這塊也開始飚速!光是WS-10的產(chǎn)量就已接近1000臺/年

Thurman在昆明
2026-02-23 12:44:40
恭喜!香港名模突然宣布懷上雙胞胎,結(jié)婚七年終于造人成功

恭喜!香港名模突然宣布懷上雙胞胎,結(jié)婚七年終于造人成功

鄉(xiāng)野小珥
2026-02-24 04:17:52
17歲媽祖女孩口碑反轉(zhuǎn)!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

17歲媽祖女孩口碑反轉(zhuǎn)!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

古希臘掌管松餅的神
2026-02-24 16:40:56
中國游客遺體被打撈出,俄外長致哀

中國游客遺體被打撈出,俄外長致哀

觀察者網(wǎng)
2026-02-22 15:35:13
計(jì)劃投資1.5億!這個(gè)重要項(xiàng)目在桂林開工建設(shè)

計(jì)劃投資1.5億!這個(gè)重要項(xiàng)目在桂林開工建設(shè)

每日桂林
2026-02-24 21:09:01
一個(gè)人扛起了馬刺的后場大旗,后場新星的進(jìn)步確實(shí)非常明顯?

一個(gè)人扛起了馬刺的后場大旗,后場新星的進(jìn)步確實(shí)非常明顯?

稻谷與小麥
2026-02-24 23:47:30
2026-02-25 03:51:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12196文章數(shù) 176392關(guān)注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機(jī)器人Unitree As2

頭條要聞

男子摟住繼女強(qiáng)吻動作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強(qiáng)吻動作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個(gè)熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個(gè)孩子

財(cái)經(jīng)要聞

縣城消費(fèi)「限時(shí)繁榮」了十天

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
手機(jī)
教育
公開課

藝術(shù)要聞

投資95億,高428米!海南第一高樓最新進(jìn)展

房產(chǎn)要聞

330萬人涌入!春節(jié)全國樓市,第一個(gè)賣爆的區(qū)域出現(xiàn)了!

手機(jī)要聞

蘋果發(fā)布iOS 26.4 Beta 2系統(tǒng)更新,液態(tài)玻璃設(shè)計(jì)有新變化!

教育要聞

馬馬馬上上岸!!!TTS《大吉大利復(fù)試手冊》+復(fù)試班:紙質(zhì)筆記與1v1模擬面試堂堂上線!!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版