国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

RAG神話破滅?斯坦福頂尖團隊新研究:合成數(shù)據(jù)訓練效果反超,成本大降

0
分享至


在大模型商業(yè)化落地的進程中,醫(yī)療、金融等高精尖垂直領(lǐng)域,始終面臨著一個核心難題:既要嚴控回答準確率、杜絕AI幻覺,又要控制部署成本,適配更多實際應用場景。長期以來,業(yè)內(nèi)早已形成定論,檢索增強生成(RAG)是破解這一難題的最優(yōu)方案,甚至成為行業(yè)默認的標準答案。

直到2026年3月,一支集結(jié)了全球頂尖院校力量的科研團隊,用一項重磅研究成果,徹底打破了這一固化格局。

斯坦福大學教授、NLP領(lǐng)域頂級學者、麥克阿瑟天才獎得主、大模型常識推理與對齊領(lǐng)域領(lǐng)軍人物Yejin Choi,聯(lián)合斯坦福大學副教授James Zou,帶領(lǐng)來自斯坦福大學的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學院(MIT)的Chanwoo Park、華盛頓大學的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺發(fā)布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴謹詳實的實驗數(shù)據(jù),完成了一次對傳統(tǒng)技術(shù)路線的顛覆。

這支科研夢之隊,在大量對照實驗中,揭開了一個被行業(yè)長期忽視的真相:

傳統(tǒng)合成數(shù)據(jù)效果不及RAG,從來不是數(shù)據(jù)本身存在缺陷,而是使用方式存在誤區(qū)。

該研究通過改良訓練模式、優(yōu)化數(shù)據(jù)配比,團隊成功盤活合成數(shù)據(jù)潛力,實現(xiàn)了對主流RAG方案的反超,為大模型垂直領(lǐng)域適配,開辟了一條低成本、高效率的全新路徑。


被低估的合成數(shù)據(jù):常年淪為配角,并非能力不足

談及大模型落地垂直領(lǐng)域,RAG技術(shù)早已占據(jù)不可撼動的地位。通俗來講,RAG就像是為大模型配備了一座隨身外部知識庫,遇到模糊不清的問題、專業(yè)性極強的知識點,模型無需依賴自身有限的預訓練記憶,而是實時檢索外部資料,邊查證邊作答,最大限度降低幻覺出錯率,這也是它能牢牢占據(jù)金融、醫(yī)療等高精準度賽道的核心原因。

與之相對,合成數(shù)據(jù)訓練,一直被視作RAG的輔助手段。業(yè)內(nèi)普遍認為,依靠合成數(shù)據(jù)微調(diào)的模型,知識儲備有限、性能提升存在天花板,即便大量堆砌數(shù)據(jù)、更換更強的生成模型,效果也始終無法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

這支頂尖團隊最初也遭遇了同樣的瓶頸。在多輪測試中,單純使用合成問答對、或是僅用合成文檔訓練模型,性能提升都極為緩慢,即便加大數(shù)據(jù)投放量,效果也會快速觸頂,甚至比成熟RAG方案低4.6%。

經(jīng)過反復復盤實驗,團隊終于找準了問題癥結(jié):

單一類型的合成數(shù)據(jù)訓練,只能讓模型習得片面能力,無法實現(xiàn)知識與能力的融合。 合成問答對擅長訓練模型的推理邏輯、知識調(diào)用技巧,卻無法讓模型牢牢掌握專業(yè)細節(jié); 合成文檔能填充垂直領(lǐng)域干貨,卻難以教會模型靈活運用知識。二者單打獨斗,自然無法突破性能上限。

針對這一核心短板,團隊徹底摒棄傳統(tǒng)單一訓練模式,提出兩大關(guān)鍵改良策略——合成混合訓練(SMT,Synthetic Mixed Training)聚焦重寫(Focal Rewriting),徹底釋放了合成數(shù)據(jù)的潛力。

SMT實現(xiàn)破局:讓AI從“開卷查資料”轉(zhuǎn)向“閉卷記知識”

如果把RAG比作開卷考試,允許隨時翻閱資料作答,那么SMT合成混合訓練,就是讓AI在訓練階段完成系統(tǒng)學習,把知識點內(nèi)化成本身記憶,依靠自身實力應對各類問題。

SMT的核心邏輯簡潔卻直擊要害:將合成問答對與合成文檔按1:1比例混合,共同用于模型微調(diào)訓練。

兩類數(shù)據(jù)形成完美互補,問答對負責錘煉模型的推理能力、解題思路,文檔負責灌輸專業(yè)領(lǐng)域知識,讓AI既懂邏輯方法,又有扎實儲備,擺脫片面學習的局限。

為了進一步提升訓練效率,避免模型耗費精力在冗余、重復的無效信息上,團隊還配套推出聚焦重寫技術(shù)。這項技術(shù)相當于為AI劃定核心考點,引導生成的文檔緊扣關(guān)鍵問題展開,剔除無關(guān)內(nèi)容,讓模型集中吸收高價值知識點,大幅提升學習效率。


這套組合策略,交出了亮眼的成績單。論文實驗數(shù)據(jù)顯示,在長文本理解(QuALITY)、醫(yī)療專業(yè)問答(LongHealth)、金融分析研判(FinanceBench)三大權(quán)威測試場景中,通過SMT與Focal Rewriting組合策略微調(diào)的模型,實現(xiàn)了對傳統(tǒng)RAG的超越,在QuaLITY數(shù)據(jù)集上領(lǐng)先幅度高達4.4%。更具實用價值的是,將SMT訓練后的模型與RAG結(jié)合使用,性能可在原有基礎(chǔ)上再提升9.1%,實現(xiàn)雙重增效。



該技術(shù)對中小參數(shù)模型格外友好,8B及以下的輕量模型,僅需少量高質(zhì)量合成數(shù)據(jù),就能達到甚至超越傳統(tǒng)RAG的效果,無需堆砌海量算力,不用搭建復雜的檢索系統(tǒng),大幅降低了企業(yè)落地門檻,讓中小廠商也能輕松布局垂直領(lǐng)域AI。

不止技術(shù)逆襲:改寫大模型行業(yè)競爭邏輯

SMT的價值,遠不止實驗室里的性能突破,更攪動了整個大模型行業(yè)的發(fā)展格局,打破了行業(yè)多年來“唯參數(shù)論、唯算力論”的慣性思維。

過去幾年,大模型行業(yè)陷入粗放式內(nèi)卷,各大機構(gòu)盲目比拼模型參數(shù)規(guī)模、投入算力大小,誤以為硬件越強,模型性能就越優(yōu)??呻S著算力投入不斷加大,邊際效益持續(xù)遞減,這種野蠻生長的模式早已走到瓶頸。

SMT用實踐證明,精細化的數(shù)據(jù)處理與科學訓練,遠比盲目擴張硬件更具價值。不必執(zhí)著于超大參數(shù)模型,不必耗費巨額算力成本,只要用對合成數(shù)據(jù)、優(yōu)化訓練方式,就能實現(xiàn)質(zhì)的性能飛躍,為行業(yè)開辟了輕量化發(fā)展的新路線。


與此同時,SMT進一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補。RAG更適合知識需要實時更新的場景,SMT則適配離線環(huán)境、邊緣設(shè)備等無法聯(lián)網(wǎng)檢索的場景,二者靈活搭配,能覆蓋更多應用需求,適配更廣泛的行業(yè)場景。

當然,這項新技術(shù)仍有完善空間。


目前SMT在70B以上超大模型上的適配效果,還需更多實驗驗證,合成數(shù)據(jù)的質(zhì)量管控、多樣性把控也有待進一步優(yōu)化。但實驗中呈現(xiàn)的穩(wěn)定增長趨勢,已經(jīng)充分證明,合成數(shù)據(jù)訓練擁有巨大的挖掘空間與落地潛力。

結(jié)語:大模型行業(yè),邁入精細化發(fā)展新階段

從RAG一家獨大,到合成數(shù)據(jù)成功逆襲,這場技術(shù)路線的革新,本質(zhì)上是大模型行業(yè)從野蠻擴張走向深耕細作的重要標志。

Yejin Choi團隊的這項研究,不僅推翻了“合成數(shù)據(jù)弱于RAG”的行業(yè)共識,更為行業(yè)指明了新方向:比起堆砌參數(shù)、比拼算力,打磨數(shù)據(jù)質(zhì)量、優(yōu)化訓練模式,才是未來競爭的核心著力點。

對于企業(yè)而言,深耕高質(zhì)量合成數(shù)據(jù)、布局高效訓練方法,將成為下一階段搶占市場的核心競爭力。對于整個行業(yè)來說,多元技術(shù)路線并行融合,將推動大模型落地更靈活、成本更親民、應用更廣泛,徹底告別粗放內(nèi)卷,邁向效率與質(zhì)量并重的高質(zhì)量發(fā)展時代。

(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
重慶大學采礦工程系原系主任黃滾逝世,終年54歲

重慶大學采礦工程系原系主任黃滾逝世,終年54歲

澎湃新聞
2026-04-02 11:12:31
何為籍,何為貫?“籍貫”到底是什么地方?下次可別再填錯了!

何為籍,何為貫?“籍貫”到底是什么地方?下次可別再填錯了!

長風文史
2026-04-01 17:03:21
鄭麗文首站來南京,上航班前,大陸官宣統(tǒng)一后規(guī)劃,兩岸共修高鐵

鄭麗文首站來南京,上航班前,大陸官宣統(tǒng)一后規(guī)劃,兩岸共修高鐵

混沌錄
2026-04-02 20:22:18
上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

靜若梨花
2026-03-01 16:25:46
美200名軍官行蹤敗露,被導彈一鍋端?伊朗公開下一步打擊計劃

美200名軍官行蹤敗露,被導彈一鍋端?伊朗公開下一步打擊計劃

華史談
2026-04-01 22:26:34
王藝迪4-1打瘋了,張本美和輸球呆若木雞!伊藤美誠被打哭

王藝迪4-1打瘋了,張本美和輸球呆若木雞!伊藤美誠被打哭

乒乓助手
2026-04-03 00:02:25
從高點暴跌20%!華爾街預言:金價將復制2008年,3年暴漲178%

從高點暴跌20%!華爾街預言:金價將復制2008年,3年暴漲178%

阿鳧愛吐槽
2026-04-02 09:01:25
特朗普聲稱摧毀伊朗導彈系統(tǒng)幾分鐘后 伊朗向以色列北部發(fā)射導彈

特朗普聲稱摧毀伊朗導彈系統(tǒng)幾分鐘后 伊朗向以色列北部發(fā)射導彈

財聯(lián)社
2026-04-02 10:04:15
西部排名又變了:馬刺10連勝,掘金7連勝,4隊排名互換

西部排名又變了:馬刺10連勝,掘金7連勝,4隊排名互換

籃球大視野
2026-04-02 16:24:29
重慶市政協(xié)經(jīng)濟委員會副主任阮路被查

重慶市政協(xié)經(jīng)濟委員會副主任阮路被查

新京報
2026-04-02 19:16:07
靜默旁聽 暗中施壓?特朗普成首位出席美最高法聽證會在任總統(tǒng)

靜默旁聽 暗中施壓?特朗普成首位出席美最高法聽證會在任總統(tǒng)

極目新聞
2026-04-02 15:14:50
內(nèi)娛女神劉詩詩驚艷蛻變?飽滿身姿暗藏極致女人味,這身材太絕?

內(nèi)娛女神劉詩詩驚艷蛻變?飽滿身姿暗藏極致女人味,這身材太絕?

娛樂領(lǐng)航家
2026-03-10 22:00:04
馬上消費金融搞“鬧鐘式卡點催收”,晚上10點準時來電 業(yè)內(nèi):擦邊式合規(guī)激化矛盾

馬上消費金融搞“鬧鐘式卡點催收”,晚上10點準時來電 業(yè)內(nèi):擦邊式合規(guī)激化矛盾

信網(wǎng)
2026-04-02 15:01:19
日本和廣東同為1.2億人口,日本創(chuàng)造4.2萬億GDP,廣東是多少?

日本和廣東同為1.2億人口,日本創(chuàng)造4.2萬億GDP,廣東是多少?

丁丁鯉史紀
2026-04-02 16:50:55
女孩一只腳已跨過欄桿,老兵司機10秒鐘搶回年輕生命,在長江二橋上救下輕生女子

女孩一只腳已跨過欄桿,老兵司機10秒鐘搶回年輕生命,在長江二橋上救下輕生女子

極目新聞
2026-04-02 20:39:32
人到晚年,最舒服的日子,就這10個,你占幾個?

人到晚年,最舒服的日子,就這10個,你占幾個?

風起見你
2026-04-02 12:32:15
烏克蘭:我們從未襲擊過伊朗,伊朗的無人機卻每天都在轟炸我們

烏克蘭:我們從未襲擊過伊朗,伊朗的無人機卻每天都在轟炸我們

鷹眼Defence
2026-04-01 16:55:25
山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

罪案洞察者
2025-03-31 09:35:41
湖人隊2喜訊1不利!悍將缺戰(zhàn)雷霆,老詹再獲力挺,名宿點成功關(guān)鍵

湖人隊2喜訊1不利!悍將缺戰(zhàn)雷霆,老詹再獲力挺,名宿點成功關(guān)鍵

籃球看比賽
2026-04-02 15:20:51
一聲干媽十年情!秦海璐把郭麒麟寵成親兒子打臉多少功利關(guān)系!

一聲干媽十年情!秦海璐把郭麒麟寵成親兒子打臉多少功利關(guān)系!

楓塵余往逝
2026-04-02 19:30:26
2026-04-03 06:03:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
131747文章數(shù) 862051關(guān)注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

伊朗稱擊中敵軍先進戰(zhàn)機 已墜入波斯灣

頭條要聞

伊朗稱擊中敵軍先進戰(zhàn)機 已墜入波斯灣

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經(jīng)要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅(qū)小車QQ3 EV

態(tài)度原創(chuàng)

健康
教育
時尚
藝術(shù)
軍事航空

干細胞抗衰4大誤區(qū),90%的人都中招

教育要聞

重磅官宣2026年QS世界大學學科排名!清華多個專業(yè)進入全球前10

成熟女性衣服別越買越多,準備好襯衫和西裝,得體大方又高級

藝術(shù)要聞

吳昌碩『扇畫』老辣古拙

軍事要聞

伊朗自殺無人機突進 逼退林肯號航母

無障礙瀏覽 進入關(guān)懷版