国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AdaMCoT:讓大模型學(xué)會「看題下菜碟」,動態(tài)選擇最佳思考語言

0
分享至



多語言大模型(MLLM)在面對多語言任務(wù)時,往往面臨一個選擇難題:是用原來的語言直接回答,還是翻譯成高資源語言去推理?

實際上,不同的語言在模型內(nèi)部承載著不同的「特長」。比如英語可能邏輯性強,適合科學(xué)推理;而中文或印尼語在處理特定文化背景或押韻任務(wù)時,可能比英語更具優(yōu)勢。

如何讓模型在面對不同任務(wù)時,自動選擇一條「最順手」的推理路徑?來自新加坡科技研究局(A*STAR)Nancy F. Chen 和 Ai Ti Aw 帶領(lǐng)的研究團隊,攜手新加坡科技設(shè)計大學(xué)(SUTD)Roy Ka-Wei Lee 教授團隊共同推出了AdaMCoT(Adaptive Multilingual Chain-of-Thought)框架。AdaMCoT 的核心在于把 「用哪種語言思考」本身當成一個可優(yōu)化的決策變量:通過自適應(yīng)地在多種語言間路由并組合鏈式思考,再將推理結(jié)果映射回目標語言,從而顯著提升跨語言的事實推理準確性與一致性。該工作已被 AAAI 2026 主軌道接收為 Oral 論文。



  • 論文標題: AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
  • 論文鏈接: https://arxiv.org/abs/2501.16154
  • 作者單位: 新加坡 A*STAR Institute for Infocomm Research(I2R)、新加坡科技設(shè)計大學(xué)(SUTD)

研究背景與痛點

現(xiàn)有的跨語言推理方法通常存在「路徑依賴」:要么不做處理直接推理,容易導(dǎo)致低資源語言的幻覺;要么強制全部轉(zhuǎn)換成英語推理,這在處理需要保留原語言文化韻味或特定語義的任務(wù)(如寫詩、雙關(guān)語)時,往往會弄巧成拙。

核心問題在于:沒有一種單一的語言適合所有的任務(wù)。

為了解決這一問題,研究團隊提出了AdaMCoT框架。與其強制模型「說英語」,不如賦予模型一種自適應(yīng)的元認知能力。AdaMCoT 能夠根據(jù)輸入問題的特性(是邏輯題、文化題還是常識題),動態(tài)地從候選語言池(Thinking Languages)中「路由」出一條最佳的思維路徑。



方法與創(chuàng)新:讓模型「換種語言思考」


AdaMCoT 并不是「先翻譯再回答」,而是引入了一個自適應(yīng)路由機制(Adaptive Routing):模型會根據(jù)問題特性,選擇是直接用目標語言推理,還是先在英語、中文等「思考語言」中展開鏈式思考,再回到目標語言給出答案。



1. 雙路徑推理機制

AdaMCoT 設(shè)計了兩條主要的推理路徑:

  • 跨語言思維鏈(Cross-Lingual CoT):對于與提示語言不適配的任務(wù),模型將綜合考慮主題一致性、語言知識豐富程度等因素,選取一個合適的 “思考語言”。例如面對使用馬來文提問的數(shù)學(xué)題,模型可以選擇英文或者中文作為思考語言,利用這些語言豐富的邏輯和知識儲備完成推理步驟,最后將結(jié)果整合回目標語言。
  • 直接生成(Direct Generation):對于模型本身擅長的語言或特定任務(wù)(如寫詩、押韻),直接在源語言上進行分析且生成答案,避免跨語言帶來的語義損耗。

2. 基于獎勵的自適應(yīng)路由

為了讓模型「知道」何時該用哪種語言思考,研究團隊引入了一個基于獎勵的微調(diào)機制。利用 GPT-4o 作為獎勵模型(Reward Model),從事實正確性、連貫性和指令遵循度等維度對不同推理路徑生成的答案進行打分。

在訓(xùn)練階段,模型只學(xué)習那些得高分(分數(shù) ≥ 9)的推理路徑。這種「優(yōu)勝劣汰」的機制使得 AdaMCoT 能夠根據(jù)問題類型自動切換策略。例如,處理科學(xué)問題時可能傾向于用英語思考,而處理具有文化特色的問題時則可能保留原語言。

實驗結(jié)果:全面超越傳統(tǒng)方法


研究團隊在mTruthfulQA、CrossAlpaca-Eval 2.0、Cross-MMLU 和 Cross-LogiQA等多個多語言基準上評估了 AdaMCoT,涵蓋了 LLaMA 3.1 和 Qwen 2.5 等主流開源模型。



1. 事實推理能力顯著提升

在 mTruthfulQA 數(shù)據(jù)集上,LLaMA3.1-8B-AdaMCoT 在 32 種語言中的 31 種上都取得了性能提升。

  • 對于中文,準確率相對原模型提升9.0%;
  • 對于低資源語言如印度尼西亞語,相對提升高達12.7%;
  • 在匈牙利語、葡萄牙語和孟加拉語等語言上,更是實現(xiàn)了超過10%的絕對提升。

相比之下,傳統(tǒng)的 Prompt 工程方法(如 AutoCAP)和翻譯對齊方法在低資源語言上往往表現(xiàn)不佳,甚至出現(xiàn)倒退。

2. 跨語言一致性增強

實驗表明,AdaMCoT 不僅提高了回答的準確率,還顯著增強了跨語言的一致性。這意味著無論用戶用哪種語言提問,模型都能調(diào)用其內(nèi)部最一致的知識庫來回答,減少了「見人說人話,見鬼說鬼話」的幻覺現(xiàn)象 。



在 mTruthfulQA 數(shù)據(jù)集上的推理路徑選擇分布。大部分情況下,模型優(yōu)先選擇高資源語言(尤其是英語和中文)作為中間推理語種,從而顯著降低錯誤率;其他語種約占 10%,主要用于提升特殊類別問題的回答準確性。

深度解讀:為什么「換語言思考」有效?


為了揭示 AdaMCoT 的生效機理,研究團隊利用Logit Lens和UMAP技術(shù)對模型的內(nèi)部狀態(tài)進行了可視化分析。



1. Logit Lens:透視模型的思考過程

通過 Logit Lens 分析發(fā)現(xiàn),當模型直接用低資源語言回答復(fù)雜問題時,中間層的預(yù)測往往充滿噪聲和幻覺。而當 AdaMCoT 引導(dǎo)模型先用英語「思考」時,模型在早期層級就能鎖定正確的事實路徑,最終生成的答案更加自信且準確。



2. UMAP:語義空間的對齊

UMAP 可視化顯示,AdaMCoT 成功拉近了不同語言在語義空間中的距離。經(jīng)過微調(diào)后,非英語語言的嵌入向量(Embeddings)顯著向英語中心靠攏。同時并沒有破壞原有的語義結(jié)構(gòu),而是在保持整體分布的前提下,讓多語言在同一空間中更加對齊。 這表明 AdaMCoT 促進了多語言知識在語義層面的深層融合,而非簡單的表面翻譯。

總結(jié)


AdaMCoT 提出了一種全新的多語言推理范式:不改變模型參數(shù)規(guī)模,不依賴海量多語言預(yù)訓(xùn)練數(shù)據(jù),僅通過「學(xué)會如何選擇思考語言」,就能顯著釋放大模型的跨語言潛能。

這項工作不僅為提升低資源語言的 AI 性能提供了低成本的高效方案,也為理解大模型的跨語言對齊機制提供了新的視角。隨著 AI 全球化的推進,AdaMCoT 有望成為打破語言隔閡、實現(xiàn)「AI 普惠」的關(guān)鍵技術(shù)之一。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
35歲少婦賣淫:現(xiàn)場89個道具畫面流出,正面照曝光,骯臟細節(jié)披露

35歲少婦賣淫:現(xiàn)場89個道具畫面流出,正面照曝光,骯臟細節(jié)披露

博士觀察
2025-12-20 16:36:18
再無中俄印三角,中國新“大三角戰(zhàn)略”已成,未來世界格局很清晰

再無中俄印三角,中國新“大三角戰(zhàn)略”已成,未來世界格局很清晰

老黯談娛
2025-12-21 07:03:56
惠州索尼工廠正式關(guān)閉,這是一個月內(nèi)日本在中國關(guān)閉的第二家大廠

惠州索尼工廠正式關(guān)閉,這是一個月內(nèi)日本在中國關(guān)閉的第二家大廠

荊楚寰宇文樞
2025-12-20 22:13:00
中戲院長郝戎風波升級,被扒兩屆藝考成績雷同,易烊千璽牽連其中

中戲院長郝戎風波升級,被扒兩屆藝考成績雷同,易烊千璽牽連其中

萌神木木
2025-12-20 13:14:47
翁帆新消息傳來,太令人驚喜了

翁帆新消息傳來,太令人驚喜了

深度報
2025-12-18 22:35:44
德約科維奇談生涯最黑暗一戰(zhàn):覺得世界已經(jīng)崩塌...

德約科維奇談生涯最黑暗一戰(zhàn):覺得世界已經(jīng)崩塌...

體育妞世界
2025-12-20 15:35:19
南京導(dǎo)航系統(tǒng)失靈,并非受到美國攻擊,而是我們?yōu)閼?zhàn)爭做萬全準備

南京導(dǎo)航系統(tǒng)失靈,并非受到美國攻擊,而是我們?yōu)閼?zhàn)爭做萬全準備

Thurman在昆明
2025-12-21 05:40:18
誰會是下一個國乒總教練?已有3人報名,馬琳王皓之爭成關(guān)注焦點

誰會是下一個國乒總教練?已有3人報名,馬琳王皓之爭成關(guān)注焦點

十點街球體育
2025-12-20 23:19:21
“寧愿她沒考上大學(xué)”,父親控訴211女兒的墮落歷程,看清了現(xiàn)實

“寧愿她沒考上大學(xué)”,父親控訴211女兒的墮落歷程,看清了現(xiàn)實

妍妍教育日記
2025-12-15 18:02:43
蘇格蘭決賽席位出爐!常冰玉將與韋克林爭冠,中國小將或成第11人

蘇格蘭決賽席位出爐!常冰玉將與韋克林爭冠,中國小將或成第11人

世界體壇觀察家
2025-12-21 07:01:05
研究所沒錢了?河南一研究所發(fā)全體員工告知函:8月起獎金全部取消

研究所沒錢了?河南一研究所發(fā)全體員工告知函:8月起獎金全部取消

趣筆談
2025-12-20 10:10:01
清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細胞,顯著抑制腫瘤生長

清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細胞,顯著抑制腫瘤生長

醫(yī)諾維
2025-12-20 12:47:12
封關(guān)首日,爆了!三亞免稅狂賣1.18億元!有蘋果手機便宜2140元,元旦海南機票訂量大增!

封關(guān)首日,爆了!三亞免稅狂賣1.18億元!有蘋果手機便宜2140元,元旦海南機票訂量大增!

每日經(jīng)濟新聞
2025-12-20 15:42:08
??谶@一天:梅婷面相兇,海陸性感,毛曉彤好美,陳都靈真敢穿

??谶@一天:梅婷面相兇,海陸性感,毛曉彤好美,陳都靈真敢穿

娛樂圈筆娛君
2025-12-20 18:07:34
離婚5年,她真的面相大變

離婚5年,她真的面相大變

伊姐看電影
2025-12-19 09:31:29
水滸傳中,太師蔡京、太尉高俅、樞密使童貫,誰的官職更大?

水滸傳中,太師蔡京、太尉高俅、樞密使童貫,誰的官職更大?

長風文史
2025-12-20 13:54:24
退休后,不要在熟人面前有8種行為, 誰看誰受益,建議收藏

退休后,不要在熟人面前有8種行為, 誰看誰受益,建議收藏

情感大使館
2025-12-16 14:07:41
絕了!臺灣頂級辣媽!果然是深藏不露

絕了!臺灣頂級辣媽!果然是深藏不露

吃瓜黨二號頭目
2025-12-08 10:12:52
池莉:半輩子過去了,自己盡是不體面和不高貴,遍體鱗傷

池莉:半輩子過去了,自己盡是不體面和不高貴,遍體鱗傷

尚曦讀史
2025-12-18 09:46:21
普京拒付金正恩派兵報酬,因朝鮮軍隊戰(zhàn)績不佳,僅支付20%報酬

普京拒付金正恩派兵報酬,因朝鮮軍隊戰(zhàn)績不佳,僅支付20%報酬

環(huán)球熱點快評
2025-12-17 09:19:03
2025-12-21 09:03:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142515關(guān)注度
往期回顧 全部

教育要聞

“好崩潰,女兒買這種低俗餅干”,家長曬出實物圖,堪比夜店游戲

頭條要聞

臺北襲擊案行兇者被造謠是"大陸籍" 蔣萬安駁斥

頭條要聞

臺北襲擊案行兇者被造謠是"大陸籍" 蔣萬安駁斥

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

手機
房產(chǎn)
親子
教育
軍事航空

手機要聞

iOS 26.1驗證已關(guān)閉!蘋果將暫時停更iOS 26.3測試版

房產(chǎn)要聞

廣州有態(tài)度,一座國際化社區(qū)給出的城市答案

親子要聞

兒科醫(yī)生短缺,家長投訴變惡性循環(huán),孩子健康誰之責?

教育要聞

于潔:學(xué)生課堂睡覺、作業(yè)擺爛、屢教不改……教師該如何應(yīng)對?

軍事要聞

澤連斯基:前線局勢愈發(fā)艱難

無障礙瀏覽 進入關(guān)懷版