国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)模型紫東太初:多模態(tài)RAG全新發(fā)布,準確率提升33%(端到端

0
分享至

在產(chǎn)業(yè)智能化進程中,如何高效融合企業(yè)專有知識資產(chǎn),構建領域專屬認知引擎,是企業(yè)邁向智能決策與高效運營的關鍵。然而,傳統(tǒng)檢索增強生成(RAG)技術受限于語言單模態(tài)處理能力,僅能實現(xiàn)文本知識庫與文本查詢之間的淺層理解,難以滿足復雜業(yè)務場景的需求,在實際應用中暴露出兩大缺陷:

信息表征缺失:忽略知識庫中多模態(tài)富文檔的視覺語義信息,如版面結構、圖表關系、公式特征等;

模態(tài)交互受限:無法支持圖文混合查詢、跨模態(tài)關聯(lián)檢索等多樣化需求。

針對以上痛點,我們發(fā)布了紫東太初多模態(tài)檢索增強生成框架—Taichu-mRAG。該框架基于統(tǒng)一多模態(tài)細粒度檢索引擎和紫東太初多模態(tài)大模型,旨在提升內(nèi)容理解與生成質量,實現(xiàn)對多模態(tài)信息的協(xié)同感知、精準檢索與深度推理問答。

Taichu-mRAG 在多模態(tài)富文檔理解、多模態(tài)細粒度實體屬性問答兩大權威基準上取得突破性進展:

  • 在 M3DocVQA 數(shù)據(jù)集上端到端問答準確率比開源SOTA M3DocRAG相對提升33%,多模態(tài)檢索召回率相對提升12%;
  • 在 E-VQA 數(shù)據(jù)集上端到端問答準確率比開源SOTA EchoSight相對提升9%,多模態(tài)檢索召回率相對提升9%。

3.1 Taichu-mRAG整體架構

面向新一代智能問答場景,Taichu-mRAG 整體架構包含四大核心模塊:Query理解模塊、多模態(tài)混合索引召回模塊、多模態(tài)精排模塊、多模態(tài)增強答案生成模塊。

Query理解模塊

該模塊根據(jù)用戶Query 及對話上下文深度挖掘用戶需求,判斷是否需要觸發(fā)全文理解,并結合對話歷史對用戶 Query 進行智能擴展、改寫,使得改寫后的 Query 可以更精準地檢索到相關知識。

多模態(tài)混合索引與召回模塊

該模塊包含特征抽取、索引建庫及多路召回。在知識庫構建過程中,我們先對富文檔進行多維度理解、分塊,抽取出子級檢索單元塊;包括基于版面識別的區(qū)域級分塊、基于純視覺信息的頁面級分塊、基于文本語義的滑窗分塊;之后,通過多模態(tài)Embedding模型抽取這些檢索分塊的語義特征,在統(tǒng)一語義空間內(nèi)進行 ANN 索引建庫。當收到改寫的 Query 后,我們采用多路召回,并行執(zhí)行四路檢索:跨模態(tài)索引、關鍵Term倒排索引、基礎語義索引、知識擴展語義索引,高效召回和用戶需求最相關的 TopN 知識片段。

多模態(tài)精排模塊

多模態(tài)精排模塊負責對召回的 TopN 知識片段進行精細化排序,更加關注細粒度語義信息,有利于處理高難度場景,從而進一步提升多模態(tài)大模型的問答精準度。該模塊采用單塔結構,深度融合Query、文本、圖像、布局特征等信息,確保排序結果更加精準穩(wěn)定。

多模態(tài)答案生成模塊

答案生成模塊根據(jù)前序模塊給出的相關參考知識和用戶原始Query,聯(lián)合生成最終的答案,并給出答案的參考片段,便于用戶進行答案溯源。當候選片段無法覆蓋答案時,多模態(tài)大模型會根據(jù)用戶自定義配置選擇拒答或者依賴多模態(tài)大模型自身知識進行開放式回答。這一模塊不僅生成準確的答案,還提供了答案的來源和依據(jù),增強了答案的可信度和可解釋性。

3.2 Taichu-mRAG多模態(tài)檢索

Taichu-mRAG 的多模態(tài)檢索引擎采用了雙層級父子關聯(lián)索引機制和多路異構特征聯(lián)合檢索技術:

雙層級父子關聯(lián)索引機制

基于多模態(tài)結構感知的層級式分塊技術可有效解決多模態(tài)數(shù)據(jù)檢索中的粒度適配與上下文整合難題。雙層級父子索引技術核心是父級語義單元、子級檢索單元的智能分塊和關聯(lián)策略。

子級檢索單元為基礎單元,核心價值在于根據(jù)用戶 Query精準召回語義最相關的細粒度語義片段,確保召回的精準性;子級檢索單元可包含多種單元形式,如基于滑動窗口的文本片段單元、 圖像單元、表格單元、圖文混合單元等。父級語義單元為跨模態(tài)知識容器,核心價值是為關聯(lián)的子級檢索單元提供完整的上下文信息輸入給大模型,提升大模型的回答精度和完整度。

父、子語義單元的切分及關聯(lián)映射核心在于對以下多種策略的靈活組合: (1)語義理解分塊:基于句子、段落、圖像、圖表多模態(tài) Embedding 計算相似度,當連續(xù)內(nèi)容相似度低于特定閾值時則進行切割。(2)結構化分塊:基于布局分析技術,對PDF、PPT、Markdown 等文檔按章節(jié)、標題或頁面、語義塊邊界進行切割。(3)滑動窗口分塊 :設置字符重疊范圍及滑動窗口大小,通過滑動窗口對文檔內(nèi)容進行切割。

多路異構特征聯(lián)合檢索

Taichu-mRAG 檢索引擎采用多路異構特征聯(lián)合索引的召回機制,在多模態(tài)、復雜富文檔理解場景下形成互補增強的檢索矩陣,保證了檢索系統(tǒng)的精準性和產(chǎn)業(yè)落地可行性,多路異構特征索引概況如下:

其中,多模態(tài)Embedding模型充分利用多模態(tài)大模型的語義理解能力,經(jīng)過多粒度多階段學習,實現(xiàn)多種模態(tài)在統(tǒng)一空間的語義表征,支持文本、圖像、圖表、公式等多種混合形式。模型有效緩解了模態(tài)偏差問題,同時也具備出色的單模態(tài)語義表征能力。

3.3 紫東太初多模態(tài)大模型

紫東太初多模態(tài)大模型(Taichu-MLLM)具備強大的視覺理解能力和若干特性,支持動態(tài)分辨率、圖文及多語言輸入、圖文混排模式等。同時為了更好促進Taichu-mRAG的產(chǎn)業(yè)落地應用,針對落地應用過程中的重點需求,我們對Taichu-MLLM 特定能力進行了重點優(yōu)化:

  • 擴展上下文長度到128k,支持超長文本和多張高清圖片輸入;
  • 優(yōu)化拒答指令遵循能力,提升拒答精度,具備準確、穩(wěn)定的拒答能力;
  • 優(yōu)化溯源能力,模型同時生成答案和引用來源,便于用戶溯源查證,提高答案可解釋性。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅技再惹眾怒!囂張只因不愁賣,這69元國產(chǎn)平替不香嗎?

羅技再惹眾怒!囂張只因不愁賣,這69元國產(chǎn)平替不香嗎?

雷科技
2026-04-03 11:58:42
江蘇一學院更名為大學

江蘇一學院更名為大學

最江陰
2026-04-04 10:53:58
一人干翻2000人大廠!41歲程序員靠AI年入4億美元,奧特曼:我想見他

一人干翻2000人大廠!41歲程序員靠AI年入4億美元,奧特曼:我想見他

新智元
2026-04-03 19:51:46
欠中國的錢,委內(nèi)瑞拉不還了?美財長:中國已無法繼續(xù)獲得委石油

欠中國的錢,委內(nèi)瑞拉不還了?美財長:中國已無法繼續(xù)獲得委石油

萌城少年強
2026-01-22 12:47:40
特步二公主丁佳敏官宣生娃,曬出和老公周力源一路攜手走過的照片

特步二公主丁佳敏官宣生娃,曬出和老公周力源一路攜手走過的照片

觀魚聽雨
2026-04-03 18:13:09
足總杯預測:曼城12/31利物浦,南安1-2阿森納,切爾西30/41維爾

足總杯預測:曼城12/31利物浦,南安1-2阿森納,切爾西30/41維爾

光輝記
2026-04-04 11:40:38
沃飛長空的合作公司梳理,千億鋰礦龍頭入局

沃飛長空的合作公司梳理,千億鋰礦龍頭入局

證券時報
2026-04-04 08:34:11
想撤都晚了!伊朗亮萬枚家底,美軍嚇得光身逃跑,三面死圍以色列

想撤都晚了!伊朗亮萬枚家底,美軍嚇得光身逃跑,三面死圍以色列

青煙小先生
2026-04-04 12:02:06
又一個汽車品牌宣布退出! 曾年銷34萬,被追著買,卻走到了今天

又一個汽車品牌宣布退出! 曾年銷34萬,被追著買,卻走到了今天

沙雕小琳琳
2026-04-04 01:01:25
為啥中南海至今不掛“中央人民政府”牌子?取而代之的是一句口號

為啥中南海至今不掛“中央人民政府”牌子?取而代之的是一句口號

史之銘
2026-04-01 16:50:21
反轉?被騙至柬埔寨的19歲少女發(fā)視頻稱是自愿,被威脅強奸是演戲

反轉?被騙至柬埔寨的19歲少女發(fā)視頻稱是自愿,被威脅強奸是演戲

一支破筆半支煙
2026-04-04 12:16:17
張雪峰女兒再發(fā)聲,去世前一家三口曾一起用餐,女兒留言惹人哭

張雪峰女兒再發(fā)聲,去世前一家三口曾一起用餐,女兒留言惹人哭

潮鹿逐夢
2026-04-03 17:06:47
金昊已被執(zhí)行死刑!河北孟村家暴致妻死亡案塵埃落定,正義終抵人間

金昊已被執(zhí)行死刑!河北孟村家暴致妻死亡案塵埃落定,正義終抵人間

滄州吧
2026-04-04 00:12:38
月交付不足800臺!尊界S800要從“遙遙領先”變成“遙遙無期”?

月交付不足800臺!尊界S800要從“遙遙領先”變成“遙遙無期”?

三農(nóng)老歷
2026-04-03 14:48:32
外媒:“絕對不可能”!中國已經(jīng)能制造出足以進行核聚變的超級鋼

外媒:“絕對不可能”!中國已經(jīng)能制造出足以進行核聚變的超級鋼

阿纂看事
2026-04-03 21:10:57
46號令落地!國企嚴查啟動,誰會被重點查?

46號令落地!國企嚴查啟動,誰會被重點查?

別人都叫我阿腈
2026-04-03 20:05:12
庫里哈登米切爾密謀大事,波姐偷聽!

庫里哈登米切爾密謀大事,波姐偷聽!

貴圈真亂
2026-04-04 12:17:37
簽完反華聲明,馬克龍離開日本,臨走前一錘定音,中國產(chǎn)品不能過半

簽完反華聲明,馬克龍離開日本,臨走前一錘定音,中國產(chǎn)品不能過半

南宗歷史
2026-04-04 09:05:03
山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

罪案洞察者
2025-03-31 09:35:41
中國最有名的9條家訓,讀懂一條旺家三代,建議收藏反復背誦

中國最有名的9條家訓,讀懂一條旺家三代,建議收藏反復背誦

長風文史
2026-03-25 17:58:23
2026-04-04 13:28:49
親愛的數(shù)據(jù) incentive-icons
親愛的數(shù)據(jù)
《我看見了風暴:人工智能基建革命》一書作者
693文章數(shù) 219913關注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國產(chǎn)手機廠商集體漲價

頭條要聞

媒體:伊朗擊落的美軍機或從駐英基地起飛 英國尷尬了

頭條要聞

媒體:伊朗擊落的美軍機或從駐英基地起飛 英國尷尬了

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

闞清子口碑贏了!全開麥跑調拒絕重唱

財經(jīng)要聞

劉紀鵬:只盼長慢牛,鞏固4000點是關鍵

汽車要聞

17萬級海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

房產(chǎn)
藝術
本地
公開課
軍事航空

房產(chǎn)要聞

小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

藝術要聞

王羲之《孝經(jīng)》真跡現(xiàn)身日本!美得難以言表

本地新聞

跟著歌聲游安徽,聽古村回響

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄國防部:一架蘇-30戰(zhàn)機在克里米亞墜毀

無障礙瀏覽 進入關懷版