国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從“道生萬物”到“語言成圖”:一篇受道家啟發(fā)的 LGM 論文

0
分享至

——讀《LGM: Enhancing Large Language Models with Conceptual Meta-Relations and Iterative Retrieval》

推薦論文:LGM: Enhancing Large Language Models with Conceptual Meta-Relations and Iterative Retrieval
論文在arxiv中的文章編號為2511.03214
代碼已經(jīng)在Github上開源,可以在上面搜索language-graph-model
團(tuán)隊:Philisense(作者:雷文昌、鄒萍、王玥、孫峰、趙磊)

在這篇蘭州理工大學(xué)碩士雷文昌主導(dǎo)的LGM論文把“大模型怎么讀懂世界”這件事,拉回到一個非常東方的出發(fā)點——道家哲學(xué)中那句耳熟能詳?shù)脑挘?/p>

“道生一,一生二,二生三,三生萬物?!?/strong>

在他的設(shè)計下,復(fù)雜的文本世界被抽象成“概念 + 元關(guān)系”的網(wǎng)絡(luò):
從“道生萬物”的哲學(xué)觀,走向“關(guān)系生知識”的工程方案,讓大模型不再只是在長文里“背”,而是沿著概念結(jié)構(gòu)去“懂”。

一、為什么傳統(tǒng) RAG 碰到多跳推理就“失靈”?

RAG(檢索增強生成)已經(jīng)成了大模型落地的標(biāo)配:
切文檔、做向量、相似度檢索,再把一堆文本塞給大模型,讓它在“增強上下文”里作答。

但當(dāng)場景變復(fù)雜時,幾個典型問題會集中爆發(fā):

?多跳推理難
問題往往跨越多個段落、多個文檔,僅靠“相似度”很難一次撞中所有關(guān)鍵證據(jù);

?概念層級復(fù)雜
同一個概念有上位詞、別名、組成結(jié)構(gòu),傳統(tǒng) RAG 并不真正理解它們,只是在做“詞面匹配”;

?超長文本昂貴
企業(yè)知識庫動輒幾十萬字,單次上下文窗口無論多長都不夠“粗暴塞”。

結(jié)果是:

?要么漏證據(jù):回答看似正確,實則缺關(guān)鍵鏈條;

?要么費算力:無限拉長上下文,成本與時延都難以接受。

LGM 的切入點很直接:
與其繼續(xù)堆上下文,不如先承認(rèn)“知識本身是結(jié)構(gòu)化的”,把結(jié)構(gòu)提取出來再讓大模型用。

二、從道家哲學(xué)到“三類元關(guān)系”:道生萬物,關(guān)系生知識

道家講“道生一,一生二,二生三,三生萬物”,
LGM 則用三類元關(guān)系,構(gòu)造出萬千知識之間的“骨架”。

1. 繼承:從“一生二”到“種屬關(guān)系”

繼承關(guān)系(Inheritance)描述的是“誰是誰的一種”:

?“蘋果是水果的一種”;

?“Llama 是大語言模型的一種”;

?“SUV 是汽車的一種”。

在概念層級上,可以把“水果”的屬性(比如“富含維生素”)往下繼承到“蘋果”,
讓模型明白:即便某個文本沒寫“蘋果富含維生素”,只要提到了“蘋果是水果”,也有足夠的間接證據(jù)。

2. 組成:從“二生三”到“部分–整體”

組成關(guān)系(Composition)描述的是“誰由誰組成”:

?“計算機由 CPU、內(nèi)存、硬盤組成”;

?“企業(yè)組織由不同部門構(gòu)成”;

?“產(chǎn)品由多個功能模塊組成”。

復(fù)雜對象的能力與約束,可以拆解到組成部分上,再合并回來。
這讓系統(tǒng)在追溯問題根因時,可以從整體一路追到局部。

3. 別名:從“三生萬物”到“名稱的多樣性”

別名關(guān)系(Alias)處理“同物異名”:

?“DNA / 脫氧核糖核酸”;

?“kg / 千克”;

?產(chǎn)品內(nèi)部代號 vs 市場名稱。

別名系統(tǒng)解決的是一個很現(xiàn)實的問題:
用戶和文檔很少用同一種叫法。
如果不能把這些名字統(tǒng)一成一個“概念節(jié)點”,檢索就永遠(yuǎn)在“詞語表面”打轉(zhuǎn)。

三、兩張圖:SRG + CRG,把自然語言“翻譯”成語言圖

LGM 把文本世界翻譯成一張“語言圖”(Language Graph),由兩部分構(gòu)成:語法關(guān)系圖 SRG概念關(guān)系圖 CRG。


圖1:從人類認(rèn)知到語言圖的整體視角

1. SRG:語法關(guān)系圖,保證“原句可追溯”

SRG(Syntactic Relation Graph)負(fù)責(zé)保留文本的“語言形態(tài)”:

?節(jié)點:章節(jié)、段落、句子、詞元;

?邊:依存關(guān)系、段落隸屬、指代關(guān)系等;

?特點:

–對代詞做了指代消解(把“它/他/他們”換回具體實體);

–對句子做了詞形還原(便于不同形態(tài)統(tǒng)一檢索)。

SRG 的作用,是讓系統(tǒng)在任何推理路徑最后,都能回到一條人類可讀的原句證據(jù),支撐可解釋性。

2. CRG:概念關(guān)系圖,承載“元關(guān)系結(jié)構(gòu)”

CRG(Concept Relation Graph)則是 LGM 的“概念骨架”:

?節(jié)點:詞形還原后的概念,如 apples → apple;

?邊:繼承 / 組成 / 別名三類元關(guān)系;

?所有概念最終匯聚到一個抽象的根節(jié)點 “Thing”。


圖2:語法關(guān)系圖(SRG)與概念關(guān)系圖(CRG)

SRG 管“說了什么”,CRG 管“誰跟誰是什么關(guān)系”。
兩張圖疊加,既能在概念層面擴展,又能在句子層面取證。

四、兩大階段:從“學(xué)習(xí)語言圖”到“概念迭代檢索”

LGM 的運行可以拆成兩大階段:

1.Learning 階段:從文檔中自動構(gòu)建 SRG 和 CRG;

2.概念迭代檢索階段:圍繞用戶問題,在圖上展開檢索與推理。


圖3:LGM 的整體工作流

4.1 Learning:把長文檔“轉(zhuǎn)譯”為語言圖

在 Learning 階段,系統(tǒng)會對文檔做一條完整的處理流水線:

1.NLP 預(yù)處理

–分句、分詞、依存句法分析、指代消解、詞形還原;

–結(jié)果寫入 SRG,既保存原始語義,又方便后續(xù)檢索。

2.元關(guān)系抽取

–利用大模型和 Prompt 模板,從句子中抽取三類元關(guān)系:

?“A 是 B 的一種” → 繼承;

?“A 由 B 和 C 組成” → 組成;

?“A 又稱為 B” → 別名。

3.Reflection 反思機制(過濾錯誤關(guān)系)

–首先移除直接陳述該關(guān)系的句子;

–僅憑“間接證據(jù)”,讓大模型判斷關(guān)系是否成立;

–無效的關(guān)系被丟棄,“不確定”的暫時保留,等待更多證據(jù)。

這一套設(shè)計,讓語言圖既能充分吸收知識,又不過度依賴單次抽取的“第一印象”。

4.2 概念迭代檢索:從問題出發(fā),在圖上“走幾步”

真正回答問題時,LGM 采用的是概念迭代檢索(Concept Iterative Retrieval)


圖4:概念迭代檢索流程

整體思路可以簡化為幾步:

1.從問題中抽取概念

–抓出問題里的關(guān)鍵名詞、實體,作為起始概念。

2.沿 CRG 擴展概念閉包

–通過繼承、組成、別名關(guān)系找到相關(guān)的父類、子類、組成部分和別名;

–得到一個圍繞問題的“概念閉包”。

3.在 SRG 中檢索證據(jù)句

–查找所有包含這些概念的句子,并記錄所在文檔和上下文位置。

4.分塊并行抽取支持句

–把證據(jù)句切成若干塊,每塊和問題一起交給大模型;

–標(biāo)記出“支持該問題答案”的關(guān)鍵句子。

5.合并與壓縮

–將支持句合并,如果過長則用大模型壓縮、摘要、去冗余。

6.ROUGE 截斷(當(dāng)長度仍超限)

–用 ROUGE 相似度選出與問題最相關(guān)的證據(jù)子集,控制在上下文預(yù)算內(nèi)。

7.生成答案,如有缺口再“補一輪概念”

–讓大模型在當(dāng)前證據(jù)上生成答案;

–如仍缺關(guān)鍵概念,就把這些概念送回 CRG 繼續(xù)擴展,再來一輪迭代檢索。

這樣一來,無論知識庫有多大,真正進(jìn)入上下文的永遠(yuǎn)是一小撮“高度相關(guān)的概念 + 原句證據(jù)”。

五、實驗結(jié)果:在多跳問答上全面壓過多種 RAG 方案

論文選取了兩個經(jīng)典多跳問答數(shù)據(jù)集進(jìn)行評測:

?HotpotQA:英文維基多跳問答;

?Musique:由多個單跳問題組合而成的復(fù)雜多跳數(shù)據(jù)集。

并在兩種基礎(chǔ)大模型上,對比了多種主流 RAG 方案(GraphRAG、LightRAG、FastRAG、Dify 等)。

5.1 F1 分?jǐn)?shù)對比:LGM 穩(wěn)居第一梯隊

核心結(jié)果如下表(Table 3):



可以看到:

?在 HotpotQAMusique上,LGM 的平均 F1 都排在首位;

?相比 GraphRAG 這類圖 + RAG 方案,LGM 通過更精細(xì)的元關(guān)系建模 + 概念迭代檢索取得了更穩(wěn)的表現(xiàn)。

5.2 對上下文窗口“不敏感”:真正走出了“長上下文依賴”

論文還分析了當(dāng)最大輸入上限從 120k 逐漸壓到 30k 時,LGM 性能的變化:
F1 和 Recall 曲線整體非常平滑,沒有出現(xiàn)傳統(tǒng) RAG 那種“窗口一縮,性能猛跌”的情況。


圖5:不同上下文窗口大小對 LGM 性能的影響

這說明:

LGM 的效果主要來自語言圖結(jié)構(gòu)和概念級檢索,而不是依賴超長上下文的“粗暴兜底”。

六、典型應(yīng)用場景:從企業(yè)檢索到合規(guī)審計

從工程與產(chǎn)品視角看,LGM 天然適合這些場景:

1. 企業(yè)知識問答與內(nèi)部檢索

?別名、縮寫、歷史名字統(tǒng)一收斂到概念節(jié)點;

?組織架構(gòu)、系統(tǒng)模塊以組成關(guān)系串聯(lián);

?回答可以附上原句證據(jù),便于內(nèi)部核查與對外回復(fù)。

2. 客服與工單定位

?用戶問題往往要跨文檔、多版本追溯;

?概念級檢索可以串聯(lián)起“問題 → 模塊 → 配置 → 變更記錄”;

?多跳追根溯源遠(yuǎn)比關(guān)鍵詞檢索穩(wěn)定可靠。

3. 合規(guī)與審計

?涉及角色、權(quán)限、流程、條款等高度結(jié)構(gòu)化概念;

?可以用概念圖梳理條款之間的關(guān)系與約束;

?自動回答時附上條款原句,為審計與追責(zé)提供依據(jù)。

七、結(jié)語:從“道生萬物”到“關(guān)系生推理”

如果只看工程實現(xiàn),LGM 是一套“語言圖 + 概念檢索 + 迭代推理”的系統(tǒng);
但如果把視野拉高,會發(fā)現(xiàn)這篇工作背后有一條很清晰的思想線索:

?世界是結(jié)構(gòu)化的
不只是文本集合,更是概念與關(guān)系構(gòu)成的網(wǎng)絡(luò);

?語言可以成圖
通過元關(guān)系,我們可以把“萬物”拉回到“道”式的抽象結(jié)構(gòu)上;

?檢索也可以成“悟”
不再只比相似度,而是沿著概念關(guān)系“走幾步”,找到真正的證據(jù)。

在這條路上,LGM 給當(dāng)下的大模型應(yīng)用提供了一個頗具東方氣質(zhì)的答案:
用關(guān)系重構(gòu)知識,用概念組織檢索,讓模型從“會背文檔”走向“會懂世界”。

而這背后,既有大模型時代的工程思維,也有道家“以一貫萬”的哲學(xué)影子。
從“道生一,一生二,二生三,三生萬物”,到“語言成圖,圖生推理”,
這是一次從古老哲思通向前沿 AI 的有趣回響。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
袁世凱坐龍椅的真實老照片,接受群臣朝拜,“妃子們”也非常漂亮

袁世凱坐龍椅的真實老照片,接受群臣朝拜,“妃子們”也非常漂亮

文史微鑒
2025-12-13 22:13:15
52歲給女兒帶娃月薪5千,無意聽到小兩口對話,我連夜逃回老家

52歲給女兒帶娃月薪5千,無意聽到小兩口對話,我連夜逃回老家

木子言故事
2025-12-20 09:27:51
“雙一流”高校中南大學(xué)副校長郭學(xué)益被查 曾發(fā)表學(xué)術(shù)論文200余篇

“雙一流”高校中南大學(xué)副校長郭學(xué)益被查 曾發(fā)表學(xué)術(shù)論文200余篇

紅星新聞
2025-12-27 11:52:39
【E汽車】全新寶馬X7設(shè)計圖曝光

【E汽車】全新寶馬X7設(shè)計圖曝光

e汽車
2025-12-24 20:18:56
86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

蕭竹輕語
2025-12-05 17:38:25
上海入冬了

上海入冬了

脊梁in上海
2025-12-27 08:19:09
謝爾蓋·布林反思谷歌眼鏡失敗原因:承認(rèn)“過早商業(yè)化”與“喬布斯情結(jié)”

謝爾蓋·布林反思谷歌眼鏡失敗原因:承認(rèn)“過早商業(yè)化”與“喬布斯情結(jié)”

環(huán)球網(wǎng)資訊
2025-12-27 13:06:09
近日,曼城例行的體重檢測活動意外成為媒體和球迷關(guān)注的焦點。

近日,曼城例行的體重檢測活動意外成為媒體和球迷關(guān)注的焦點。

星耀國際足壇
2025-12-26 23:13:27
包養(yǎng)情人無數(shù),娶初中同學(xué)女兒為妻,玩老婆閨蜜,孫道存有多放蕩

包養(yǎng)情人無數(shù),娶初中同學(xué)女兒為妻,玩老婆閨蜜,孫道存有多放蕩

趣文說娛
2025-11-26 18:15:38
突發(fā)!林詩棟缺席!向鵬重任!林高遠(yuǎn)變陣!汕頭明潤暗藏玄機!

突發(fā)!林詩棟缺席!向鵬重任!林高遠(yuǎn)變陣!汕頭明潤暗藏玄機!

好乒乓
2025-12-27 10:57:06
馬斯克再放神預(yù)言,中日關(guān)系緊張之際,直接為日本未來定調(diào)

馬斯克再放神預(yù)言,中日關(guān)系緊張之際,直接為日本未來定調(diào)

趣味萌寵的日常
2025-12-26 07:57:26
為什么人類吃食草動物的肉,基本上不吃食肉動物的肉?

為什么人類吃食草動物的肉,基本上不吃食肉動物的肉?

宇宙時空
2025-12-26 11:49:12
阿姨這身打扮就是高級感穿搭的完美師范

阿姨這身打扮就是高級感穿搭的完美師范

美女穿搭分享
2025-12-25 21:07:18
中國衛(wèi)通、烽火通信、金風(fēng)科技、北斗星通,誰是商業(yè)航天后起老大

中國衛(wèi)通、烽火通信、金風(fēng)科技、北斗星通,誰是商業(yè)航天后起老大

林子說事
2025-12-26 15:49:00
放假通知!大學(xué)、中小學(xué)2026寒假時間確定了,家長卻表示難以接受

放假通知!大學(xué)、中小學(xué)2026寒假時間確定了,家長卻表示難以接受

復(fù)轉(zhuǎn)這些年
2025-12-27 00:36:21
不再沉默了,馬杜羅告知190國,中方原油遭搶掠,美國捅了馬蜂窩

不再沉默了,馬杜羅告知190國,中方原油遭搶掠,美國捅了馬蜂窩

梁訊
2025-12-25 16:50:27
患癌妻子賣房治病,丈夫卻要分走12萬?法院判決后,他這樣說

患癌妻子賣房治病,丈夫卻要分走12萬?法院判決后,他這樣說

福建第一幫幫團(tuán)
2025-12-26 19:00:29
媒體人:岳鑫、楊希、李揚大概率加盟后,海港深入接觸周定洋

媒體人:岳鑫、楊希、李揚大概率加盟后,海港深入接觸周定洋

懂球帝
2025-12-27 11:20:07
南博事件新證據(jù)曝光!徐湖平夫妻被帶走,40億金獸疑被偷梁換柱

南博事件新證據(jù)曝光!徐湖平夫妻被帶走,40億金獸疑被偷梁換柱

鋭娛之樂
2025-12-27 13:19:24
魯比奧再次回應(yīng)高市涉臺言論,不怕中國打日本,就怕中國不打日本

魯比奧再次回應(yīng)高市涉臺言論,不怕中國打日本,就怕中國不打日本

科普100克克
2025-12-26 16:03:23
2025-12-27 13:47:00
歐聚聚科技互聯(lián)
歐聚聚科技互聯(lián)
一重山,兩重山。山遠(yuǎn)天高煙水寒,相思楓葉丹。
413文章數(shù) 175關(guān)注度
往期回顧 全部

教育要聞

美國境內(nèi)旅游簽轉(zhuǎn)學(xué)簽到底需要花多少錢?

頭條要聞

美國聯(lián)邦政府終止撥款加州高鐵 美國加州撤銷相關(guān)訴訟

頭條要聞

美國聯(lián)邦政府終止撥款加州高鐵 美國加州撤銷相關(guān)訴訟

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

劉宇寧:我的價值不需要靠番位來證明

財經(jīng)要聞

注意,開始拉物價了!

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

房產(chǎn)
健康
數(shù)碼
教育
軍事航空

房產(chǎn)要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

HKC惠科全球首創(chuàng)1080Hz HD極致高刷電競顯示器

教育要聞

“上職高都能被退學(xué),你父母是真可憐”,職高女生被退學(xué)視頻火了

軍事要聞

英法德三國領(lǐng)導(dǎo)人通話 重申對烏支持

無障礙瀏覽 進(jìn)入關(guān)懷版