国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

RAG神話破滅?斯坦福頂尖團(tuán)隊(duì)新研究:合成數(shù)據(jù)訓(xùn)練效果反超,成本大降

0
分享至


在大模型商業(yè)化落地的進(jìn)程中,醫(yī)療、金融等高精尖垂直領(lǐng)域,始終面臨著一個(gè)核心難題:既要嚴(yán)控回答準(zhǔn)確率、杜絕AI幻覺(jué),又要控制部署成本,適配更多實(shí)際應(yīng)用場(chǎng)景。長(zhǎng)期以來(lái),業(yè)內(nèi)早已形成定論,檢索增強(qiáng)生成(RAG)是破解這一難題的最優(yōu)方案,甚至成為行業(yè)默認(rèn)的標(biāo)準(zhǔn)答案。

直到2026年3月,一支集結(jié)了全球頂尖院校力量的科研團(tuán)隊(duì),用一項(xiàng)重磅研究成果,徹底打破了這一固化格局。

斯坦福大學(xué)教授、NLP領(lǐng)域頂級(jí)學(xué)者、麥克阿瑟天才獎(jiǎng)得主、大模型常識(shí)推理與對(duì)齊領(lǐng)域領(lǐng)軍人物Yejin Choi,聯(lián)合斯坦福大學(xué)副教授James Zou,帶領(lǐng)來(lái)自斯坦福大學(xué)的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學(xué)院(MIT)的Chanwoo Park、華盛頓大學(xué)的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺(tái)發(fā)布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴(yán)謹(jǐn)詳實(shí)的實(shí)驗(yàn)數(shù)據(jù),完成了一次對(duì)傳統(tǒng)技術(shù)路線的顛覆。

這支科研夢(mèng)之隊(duì),在大量對(duì)照實(shí)驗(yàn)中,揭開(kāi)了一個(gè)被行業(yè)長(zhǎng)期忽視的真相:

傳統(tǒng)合成數(shù)據(jù)效果不及RAG,從來(lái)不是數(shù)據(jù)本身存在缺陷,而是使用方式存在誤區(qū)。

該研究通過(guò)改良訓(xùn)練模式、優(yōu)化數(shù)據(jù)配比,團(tuán)隊(duì)成功盤(pán)活合成數(shù)據(jù)潛力,實(shí)現(xiàn)了對(duì)主流RAG方案的反超,為大模型垂直領(lǐng)域適配,開(kāi)辟了一條低成本、高效率的全新路徑。


被低估的合成數(shù)據(jù):常年淪為配角,并非能力不足

談及大模型落地垂直領(lǐng)域,RAG技術(shù)早已占據(jù)不可撼動(dòng)的地位。通俗來(lái)講,RAG就像是為大模型配備了一座隨身外部知識(shí)庫(kù),遇到模糊不清的問(wèn)題、專(zhuān)業(yè)性極強(qiáng)的知識(shí)點(diǎn),模型無(wú)需依賴自身有限的預(yù)訓(xùn)練記憶,而是實(shí)時(shí)檢索外部資料,邊查證邊作答,最大限度降低幻覺(jué)出錯(cuò)率,這也是它能牢牢占據(jù)金融、醫(yī)療等高精準(zhǔn)度賽道的核心原因。

與之相對(duì),合成數(shù)據(jù)訓(xùn)練,一直被視作RAG的輔助手段。業(yè)內(nèi)普遍認(rèn)為,依靠合成數(shù)據(jù)微調(diào)的模型,知識(shí)儲(chǔ)備有限、性能提升存在天花板,即便大量堆砌數(shù)據(jù)、更換更強(qiáng)的生成模型,效果也始終無(wú)法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

這支頂尖團(tuán)隊(duì)最初也遭遇了同樣的瓶頸。在多輪測(cè)試中,單純使用合成問(wèn)答對(duì)、或是僅用合成文檔訓(xùn)練模型,性能提升都極為緩慢,即便加大數(shù)據(jù)投放量,效果也會(huì)快速觸頂,甚至比成熟RAG方案低4.6%。

經(jīng)過(guò)反復(fù)復(fù)盤(pán)實(shí)驗(yàn),團(tuán)隊(duì)終于找準(zhǔn)了問(wèn)題癥結(jié):

單一類(lèi)型的合成數(shù)據(jù)訓(xùn)練,只能讓模型習(xí)得片面能力,無(wú)法實(shí)現(xiàn)知識(shí)與能力的融合。 合成問(wèn)答對(duì)擅長(zhǎng)訓(xùn)練模型的推理邏輯、知識(shí)調(diào)用技巧,卻無(wú)法讓模型牢牢掌握專(zhuān)業(yè)細(xì)節(jié); 合成文檔能填充垂直領(lǐng)域干貨,卻難以教會(huì)模型靈活運(yùn)用知識(shí)。二者單打獨(dú)斗,自然無(wú)法突破性能上限。

針對(duì)這一核心短板,團(tuán)隊(duì)徹底摒棄傳統(tǒng)單一訓(xùn)練模式,提出兩大關(guān)鍵改良策略——合成混合訓(xùn)練(SMT,Synthetic Mixed Training)聚焦重寫(xiě)(Focal Rewriting),徹底釋放了合成數(shù)據(jù)的潛力。

SMT實(shí)現(xiàn)破局:讓AI從“開(kāi)卷查資料”轉(zhuǎn)向“閉卷記知識(shí)”

如果把RAG比作開(kāi)卷考試,允許隨時(shí)翻閱資料作答,那么SMT合成混合訓(xùn)練,就是讓AI在訓(xùn)練階段完成系統(tǒng)學(xué)習(xí),把知識(shí)點(diǎn)內(nèi)化成本身記憶,依靠自身實(shí)力應(yīng)對(duì)各類(lèi)問(wèn)題。

SMT的核心邏輯簡(jiǎn)潔卻直擊要害:將合成問(wèn)答對(duì)與合成文檔按1:1比例混合,共同用于模型微調(diào)訓(xùn)練。

兩類(lèi)數(shù)據(jù)形成完美互補(bǔ),問(wèn)答對(duì)負(fù)責(zé)錘煉模型的推理能力、解題思路,文檔負(fù)責(zé)灌輸專(zhuān)業(yè)領(lǐng)域知識(shí),讓AI既懂邏輯方法,又有扎實(shí)儲(chǔ)備,擺脫片面學(xué)習(xí)的局限。

為了進(jìn)一步提升訓(xùn)練效率,避免模型耗費(fèi)精力在冗余、重復(fù)的無(wú)效信息上,團(tuán)隊(duì)還配套推出聚焦重寫(xiě)技術(shù)。這項(xiàng)技術(shù)相當(dāng)于為AI劃定核心考點(diǎn),引導(dǎo)生成的文檔緊扣關(guān)鍵問(wèn)題展開(kāi),剔除無(wú)關(guān)內(nèi)容,讓模型集中吸收高價(jià)值知識(shí)點(diǎn),大幅提升學(xué)習(xí)效率。


這套組合策略,交出了亮眼的成績(jī)單。論文實(shí)驗(yàn)數(shù)據(jù)顯示,在長(zhǎng)文本理解(QuALITY)、醫(yī)療專(zhuān)業(yè)問(wèn)答(LongHealth)、金融分析研判(FinanceBench)三大權(quán)威測(cè)試場(chǎng)景中,通過(guò)SMT與Focal Rewriting組合策略微調(diào)的模型,實(shí)現(xiàn)了對(duì)傳統(tǒng)RAG的超越,在QuaLITY數(shù)據(jù)集上領(lǐng)先幅度高達(dá)4.4%。更具實(shí)用價(jià)值的是,將SMT訓(xùn)練后的模型與RAG結(jié)合使用,性能可在原有基礎(chǔ)上再提升9.1%,實(shí)現(xiàn)雙重增效。



該技術(shù)對(duì)中小參數(shù)模型格外友好,8B及以下的輕量模型,僅需少量高質(zhì)量合成數(shù)據(jù),就能達(dá)到甚至超越傳統(tǒng)RAG的效果,無(wú)需堆砌海量算力,不用搭建復(fù)雜的檢索系統(tǒng),大幅降低了企業(yè)落地門(mén)檻,讓中小廠商也能輕松布局垂直領(lǐng)域AI。

不止技術(shù)逆襲:改寫(xiě)大模型行業(yè)競(jìng)爭(zhēng)邏輯

SMT的價(jià)值,遠(yuǎn)不止實(shí)驗(yàn)室里的性能突破,更攪動(dòng)了整個(gè)大模型行業(yè)的發(fā)展格局,打破了行業(yè)多年來(lái)“唯參數(shù)論、唯算力論”的慣性思維。

過(guò)去幾年,大模型行業(yè)陷入粗放式內(nèi)卷,各大機(jī)構(gòu)盲目比拼模型參數(shù)規(guī)模、投入算力大小,誤以為硬件越強(qiáng),模型性能就越優(yōu)??呻S著算力投入不斷加大,邊際效益持續(xù)遞減,這種野蠻生長(zhǎng)的模式早已走到瓶頸。

SMT用實(shí)踐證明,精細(xì)化的數(shù)據(jù)處理與科學(xué)訓(xùn)練,遠(yuǎn)比盲目擴(kuò)張硬件更具價(jià)值。不必執(zhí)著于超大參數(shù)模型,不必耗費(fèi)巨額算力成本,只要用對(duì)合成數(shù)據(jù)、優(yōu)化訓(xùn)練方式,就能實(shí)現(xiàn)質(zhì)的性能飛躍,為行業(yè)開(kāi)辟了輕量化發(fā)展的新路線。


與此同時(shí),SMT進(jìn)一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補(bǔ)。RAG更適合知識(shí)需要實(shí)時(shí)更新的場(chǎng)景,SMT則適配離線環(huán)境、邊緣設(shè)備等無(wú)法聯(lián)網(wǎng)檢索的場(chǎng)景,二者靈活搭配,能覆蓋更多應(yīng)用需求,適配更廣泛的行業(yè)場(chǎng)景。

當(dāng)然,這項(xiàng)新技術(shù)仍有完善空間。


目前SMT在70B以上超大模型上的適配效果,還需更多實(shí)驗(yàn)驗(yàn)證,合成數(shù)據(jù)的質(zhì)量管控、多樣性把控也有待進(jìn)一步優(yōu)化。但實(shí)驗(yàn)中呈現(xiàn)的穩(wěn)定增長(zhǎng)趨勢(shì),已經(jīng)充分證明,合成數(shù)據(jù)訓(xùn)練擁有巨大的挖掘空間與落地潛力。

結(jié)語(yǔ):大模型行業(yè),邁入精細(xì)化發(fā)展新階段

從RAG一家獨(dú)大,到合成數(shù)據(jù)成功逆襲,這場(chǎng)技術(shù)路線的革新,本質(zhì)上是大模型行業(yè)從野蠻擴(kuò)張走向深耕細(xì)作的重要標(biāo)志。

Yejin Choi團(tuán)隊(duì)的這項(xiàng)研究,不僅推翻了“合成數(shù)據(jù)弱于RAG”的行業(yè)共識(shí),更為行業(yè)指明了新方向:比起堆砌參數(shù)、比拼算力,打磨數(shù)據(jù)質(zhì)量、優(yōu)化訓(xùn)練模式,才是未來(lái)競(jìng)爭(zhēng)的核心著力點(diǎn)。

對(duì)于企業(yè)而言,深耕高質(zhì)量合成數(shù)據(jù)、布局高效訓(xùn)練方法,將成為下一階段搶占市場(chǎng)的核心競(jìng)爭(zhēng)力。對(duì)于整個(gè)行業(yè)來(lái)說(shuō),多元技術(shù)路線并行融合,將推動(dòng)大模型落地更靈活、成本更親民、應(yīng)用更廣泛,徹底告別粗放內(nèi)卷,邁向效率與質(zhì)量并重的高質(zhì)量發(fā)展時(shí)代。

(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“出去!”店老板當(dāng)頭棒喝治愈女子“桃花癲”

“出去!”店老板當(dāng)頭棒喝治愈女子“桃花癲”

賓語(yǔ)觀世
2026-03-29 11:12:28
江蘇小伙一棵“月季”養(yǎng)9年,引上萬(wàn)人圍觀,網(wǎng)友:牛掰了,絕美

江蘇小伙一棵“月季”養(yǎng)9年,引上萬(wàn)人圍觀,網(wǎng)友:牛掰了,絕美

童童聊娛樂(lè)啊
2026-03-29 12:02:55
無(wú)所不能,這三個(gè)星座天賦極強(qiáng),不管處于什么群體,都能脫穎而出

無(wú)所不能,這三個(gè)星座天賦極強(qiáng),不管處于什么群體,都能脫穎而出

朗威談星座
2026-03-28 07:45:18
94歲王心剛現(xiàn)狀:跟兒子赴美,晚年回北京養(yǎng)老,證明王鐵成沒(méi)說(shuō)錯(cuò)

94歲王心剛現(xiàn)狀:跟兒子赴美,晚年回北京養(yǎng)老,證明王鐵成沒(méi)說(shuō)錯(cuò)

查爾菲的筆記
2026-03-23 18:04:49
吳千語(yǔ)真的嫁對(duì)了人,至少老公不用人到中年還在舞臺(tái)擦邊丟人現(xiàn)眼

吳千語(yǔ)真的嫁對(duì)了人,至少老公不用人到中年還在舞臺(tái)擦邊丟人現(xiàn)眼

可樂(lè)談情感
2026-03-28 16:53:28
國(guó)家出手逮捕的3名華人首富,瘋狂斂財(cái)坑害百姓,每個(gè)都罪有應(yīng)得

國(guó)家出手逮捕的3名華人首富,瘋狂斂財(cái)坑害百姓,每個(gè)都罪有應(yīng)得

林輕吟
2026-03-25 07:15:32
114-118影響三隊(duì)格局,東部現(xiàn)最大攪局者,哈登首輪生變數(shù)

114-118影響三隊(duì)格局,東部現(xiàn)最大攪局者,哈登首輪生變數(shù)

阿錯(cuò)田間生活
2026-03-29 12:06:17
傅作義起義兩年后仍藏武器電臺(tái),想東山再起,毛主席:你留著用吧

傅作義起義兩年后仍藏武器電臺(tái),想東山再起,毛主席:你留著用吧

鶴羽說(shuō)個(gè)事
2026-03-28 22:12:36
官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來(lái)了“報(bào)應(yīng)”!

官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來(lái)了“報(bào)應(yīng)”!

阿纂看事
2026-03-26 20:49:43
伊朗還能扛多久?法國(guó)專(zhuān)家算了筆賬:再打兩到四個(gè)月,問(wèn)題不大

伊朗還能扛多久?法國(guó)專(zhuān)家算了筆賬:再打兩到四個(gè)月,問(wèn)題不大

透視到底
2026-03-27 08:50:37
餐廳老板稱遇小學(xué)生“討錢(qián)”感覺(jué)不適;回應(yīng):“一元城市生存挑戰(zhàn)”活動(dòng)引發(fā)誤會(huì),本意讓學(xué)生用勞動(dòng)換報(bào)酬

餐廳老板稱遇小學(xué)生“討錢(qián)”感覺(jué)不適;回應(yīng):“一元城市生存挑戰(zhàn)”活動(dòng)引發(fā)誤會(huì),本意讓學(xué)生用勞動(dòng)換報(bào)酬

大風(fēng)新聞
2026-03-27 15:46:05
色情網(wǎng)站“丁香”覆滅記:7.3億瀏覽量的背后,是誰(shuí)在操控盈利?

色情網(wǎng)站“丁香”覆滅記:7.3億瀏覽量的背后,是誰(shuí)在操控盈利?

談史論天地
2026-02-08 20:30:04
張雪峰曾拜托汪涵照顧女兒,短短三個(gè)字全是父愛(ài),汪涵:千斤重?fù)?dān)

張雪峰曾拜托汪涵照顧女兒,短短三個(gè)字全是父愛(ài),汪涵:千斤重?fù)?dān)

滄海一粟1155
2026-03-26 19:28:57
“老虎”伍茲被捕,違法總是要付出代價(jià)的,不分國(guó)別!

“老虎”伍茲被捕,違法總是要付出代價(jià)的,不分國(guó)別!

阿廢冷眼觀察所
2026-03-29 03:51:22
馬航370憑空消失,一位美國(guó)中情局退休特工說(shuō)出真相,后來(lái)被滅口

馬航370憑空消失,一位美國(guó)中情局退休特工說(shuō)出真相,后來(lái)被滅口

文史達(dá)觀
2024-08-10 13:53:48
郴州煙花店燃爆:店主欠債300萬(wàn)自殺,多名公職人員吃拿卡要丟官

郴州煙花店燃爆:店主欠債300萬(wàn)自殺,多名公職人員吃拿卡要丟官

未曾青梅
2026-03-29 09:33:41
伊朗稱摧毀迪拜烏克蘭反無(wú)人機(jī)系統(tǒng)武器庫(kù),里面有21名烏士兵!伊總統(tǒng)強(qiáng)硬警告地區(qū)國(guó)家:勿讓敵人從你們的土地上發(fā)動(dòng)戰(zhàn)爭(zhēng),否則將遭到報(bào)復(fù)

伊朗稱摧毀迪拜烏克蘭反無(wú)人機(jī)系統(tǒng)武器庫(kù),里面有21名烏士兵!伊總統(tǒng)強(qiáng)硬警告地區(qū)國(guó)家:勿讓敵人從你們的土地上發(fā)動(dòng)戰(zhàn)爭(zhēng),否則將遭到報(bào)復(fù)

每日經(jīng)濟(jì)新聞
2026-03-28 20:04:15
小姐姐要出差便把貓咪寄養(yǎng)在寵物店,結(jié)果回來(lái)接它時(shí),一見(jiàn)面它秒撲到懷里含淚控訴:你怎么才來(lái)接我!

小姐姐要出差便把貓咪寄養(yǎng)在寵物店,結(jié)果回來(lái)接它時(shí),一見(jiàn)面它秒撲到懷里含淚控訴:你怎么才來(lái)接我!

拜見(jiàn)喵主子
2026-03-28 12:24:02
美國(guó)打伊朗到底圖什么?八成中國(guó)人以為是搶石油……

美國(guó)打伊朗到底圖什么?八成中國(guó)人以為是搶石油……

基本常識(shí)
2026-03-02 23:53:16
拖垮一個(gè)普通家庭,只需要一臺(tái)20萬(wàn)的車(chē)。

拖垮一個(gè)普通家庭,只需要一臺(tái)20萬(wàn)的車(chē)。

老陸不老
2026-03-24 20:20:23
2026-03-29 16:07:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
131491文章數(shù) 862026關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂(lè)要聞

張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車(chē)要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

家居
藝術(shù)
健康
本地
公開(kāi)課

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

藝術(shù)要聞

2025江南如畫(huà)——中國(guó)油畫(huà)作品展 | 入選作品選刊(二)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

本地新聞

在濰坊待了三天,沒(méi)遇到一個(gè)“濰坊人”

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版