国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

C2-Cite技術(shù)破解AI幻覺難題,讓回答有憑據(jù)

0
分享至

你讓AI寫篇論文,它可能引用一篇根本不存在的文獻(xiàn),讓它解釋個科學(xué)概念,里面摻著半真半假的信息,這種大語言模型的“幻覺”毛病,最近成了科技圈頭疼的事。

北郵和小米的團(tuán)隊聯(lián)手搞出了個新東西C2-Cite溯源大模型,剛被國際頂級會議WSDM2026收錄,據(jù)說能給AI的話加上“源頭水印”,讓每句話都能查到出處。

為啥AI會“說瞎話”?說白了,現(xiàn)在的大模型生成內(nèi)容時,經(jīng)常“憑記憶瞎編”,不記得信息哪來的,或者干脆編造來源。

為了讓AI說話靠譜,研究人員早就想了個招歸因技術(shù),就是讓AI在生成內(nèi)容時,給引用的信息加上來源鏈接,像咱們寫論文加參考文獻(xiàn)似的。



但之前的歸因技術(shù)有點“不靠譜”,有的模型加的引用標(biāo)記就是個擺設(shè),跟內(nèi)容對不上,有的為了引用準(zhǔn)確,寫出來的話前言不搭后語,還有的得先生成內(nèi)容再回頭加引用,根本做不到一句話一個出處,這些毛病導(dǎo)致AI內(nèi)容的可信度還是上不去。

就拿“事后歸因”來說,相當(dāng)于AI先寫完一篇文章,再讓人手動或者機器回頭找參考文獻(xiàn)貼上去。

這就像寫作文時先瞎寫一通,寫完了再硬湊幾個名言警句,經(jīng)常出現(xiàn)引用和內(nèi)容脫節(jié)的情況。

我之前見過一個AI生成的報告,引用的某篇論文標(biāo)題都寫錯了,一看就是湊數(shù)的,指令微調(diào)歸因也有毛病。



這種方法太依賴高質(zhì)量的訓(xùn)練數(shù)據(jù),要是數(shù)據(jù)里引用和內(nèi)容沒對齊,模型學(xué)完也跟著錯。

更麻煩的是,它不會主動把引用和上下文聯(lián)系起來,生成內(nèi)容時引用就像硬插進(jìn)去的廣告,讀著特別別扭。

這些老問題讓研究人員頭疼了好久,直到C2-Cite的出現(xiàn),才算找到了新路子。

這個模型最核心的想法,就是讓引用標(biāo)記不再是“死標(biāo)簽”,而是變成“活指針”,知道自己指向哪段信息,還能帶著上下文的意思。

C2-Cite第一個聰明的地方,是給引用標(biāo)記“辦了身份證”,以前的引用標(biāo)記可能是一串亂碼或者數(shù)字,模型根本不知道它指啥。



現(xiàn)在C2-Cite把這些標(biāo)記統(tǒng)一成一個符號,然后計算這個符號對應(yīng)的文獻(xiàn)的“語義指紋”,讓引用標(biāo)記本身就帶著文獻(xiàn)的意思。

打個比方,以前引用像貼個沒寫地址的快遞單,現(xiàn)在直接寫上“XX街XX號”,清清楚楚。

光有地址還不夠,還得確保引用和內(nèi)容對得上,這就需要第二個機制上下文引用對齊,C2-Cite里有個“引用路由器”,專門負(fù)責(zé)區(qū)分普通內(nèi)容和引用標(biāo)記。

普通內(nèi)容按正常邏輯生成,引用標(biāo)記則單獨優(yōu)化,確保它指向的文獻(xiàn)真能支撐前面說的話。



就像導(dǎo)航軟件,普通路段走常規(guī)路線,到了岔路口專門校準(zhǔn)方向,免得跑偏,方向?qū)α?,還得讓AI記得前面引用了啥,不然說著說著就忘了,這就靠上下文注意力增強機制。

這個機制簡單說,就是讓AI在生成后面內(nèi)容時,多“回頭看看”前面的引用標(biāo)記,比如寫到第二點時,特意關(guān)注第一點引用的文獻(xiàn),確保前后意思連貫。

有點像咱們聊天時,提到“剛才說的那個事”,得記得“剛才說的”具體是啥,不然對方聽不懂,為了讓這三個機制配合好,C2-Cite設(shè)計了一套“組合獎懲制度”多損失函數(shù)。

把普通內(nèi)容的生成質(zhì)量、引用的準(zhǔn)確性、路由器的判斷對錯、注意力的集中程度都算進(jìn)去,加權(quán)打分。



這樣一來,模型訓(xùn)練時就知道既要引用準(zhǔn),又要內(nèi)容順,不會顧此失彼,光說不練假把式,C2-Cite在三個權(quán)威數(shù)據(jù)集上做了測試,結(jié)果還真不錯。

在ALCE基準(zhǔn)測試的ASQA、ELI5、QAMPARI數(shù)據(jù)集上,不管是引用的準(zhǔn)確率還是內(nèi)容的通順度,都比之前的歸因模型好不少,尤其讓人驚喜的是速度,比那些需要來回迭代修改的模型快多了,處理效率明顯提升。

研究人員還發(fā)現(xiàn)個有意思的現(xiàn)象,用了C2-Cite后,AI生成內(nèi)容時,后面的句子會更關(guān)注前面的引用標(biāo)記。

通過注意力熱力圖能看到,引用標(biāo)記周圍的“關(guān)注度”明顯更高,就像說話時老提著前面的論據(jù),邏輯鏈條擰得更緊了,這種“跨引用的語義橋梁”,讓內(nèi)容讀著更可信。



當(dāng)然啦,這技術(shù)現(xiàn)在還在實驗室階段,離咱們?nèi)粘S肁I寫報告、查資料還有段距離,但它指明了一個方向,要讓AI說話靠譜,就得從根子上解決引用的問題,讓每個觀點都能找到“娘家”。

說不定過兩年,咱們用AI生成內(nèi)容時,看到帶引用標(biāo)記的地方,一點就能跳轉(zhuǎn)到原始文獻(xiàn)。

到那時候,再也不用對著AI寫的東西犯嘀咕,“這到底是真的還是編的?”這一天早點來才好呢,總的來說,C2-Cite算是給解決大模型“幻覺”問題開了個好頭。

從讓引用標(biāo)記“有意義”到“對齊準(zhǔn)”再到“記得牢”,每一步都踩在了之前的痛點上,雖然現(xiàn)在還不是完美方案,但至少讓我們看到,AI變得更靠譜,不是遙不可及的事。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
《尋秦記》重聚尬到腳趾摳地!郭羨妮發(fā)腮,宣萱油膩,滕麗名土氣

《尋秦記》重聚尬到腳趾摳地!郭羨妮發(fā)腮,宣萱油膩,滕麗名土氣

八斗小先生
2025-12-23 23:43:56
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

燦若銀爛
2025-12-25 13:06:29
韓寒賽車喜劇電影《飛馳人生3》定檔2026年春節(jié)

韓寒賽車喜劇電影《飛馳人生3》定檔2026年春節(jié)

IT之家
2025-12-26 11:14:50
前央視主持人劉芳菲直播訪談龐萊臣后人,結(jié)果龐叔令聲明其為假冒

前央視主持人劉芳菲直播訪談龐萊臣后人,結(jié)果龐叔令聲明其為假冒

總在茶余后
2025-12-25 22:39:22
中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個

中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個

博覽歷史
2025-12-26 06:40:03
90年我當(dāng)獸醫(yī),我趕公豬給寡婦家的母豬配種沒配上,被她強留一周

90年我當(dāng)獸醫(yī),我趕公豬給寡婦家的母豬配種沒配上,被她強留一周

燕無衣
2024-09-06 08:10:05
帕金斯:雷迪克公開抨擊球員可愛又好笑,他總歸咎于別人

帕金斯:雷迪克公開抨擊球員可愛又好笑,他總歸咎于別人

懂球帝
2025-12-26 15:49:07
從今天起,中國不再需要日本道歉!這覺醒,來自3500萬亡魂的重量

從今天起,中國不再需要日本道歉!這覺醒,來自3500萬亡魂的重量

科普100克克
2025-11-30 21:24:29
余華:我為什么討厭魯迅 (深度好文)

余華:我為什么討厭魯迅 (深度好文)

尚曦讀史
2025-11-28 09:51:13
烤雞少年"底褲被扒光",肉寶王只是冰山一角,李維剛也坐不住了

烤雞少年"底褲被扒光",肉寶王只是冰山一角,李維剛也坐不住了

鋭娛之樂
2025-12-25 08:33:43
冬至過后,遇到此菜別錯過,失眠怕它,常吃一覺睡到天亮

冬至過后,遇到此菜別錯過,失眠怕它,常吃一覺睡到天亮

江江食研社
2025-12-25 14:30:03
就差點名了!雷迪克賽后點出輸球原因:籃板很軟,讓裁判左右情緒

就差點名了!雷迪克賽后點出輸球原因:籃板很軟,讓裁判左右情緒

你的籃球頻道
2025-12-26 12:45:44
茅臺1月1日,起發(fā)動閃電五連鞭:讓每個人喝得起普通茅臺酒

茅臺1月1日,起發(fā)動閃電五連鞭:讓每個人喝得起普通茅臺酒

時尚的弄潮
2025-12-26 12:58:27
女子遭閨蜜和丈夫雙重背叛:求閨蜜放過被拉黑,一夜白頭要追責(zé)

女子遭閨蜜和丈夫雙重背叛:求閨蜜放過被拉黑,一夜白頭要追責(zé)

江山揮筆
2025-12-26 08:17:32
中國各省地圖像什么?來看看你的家鄉(xiāng)

中國各省地圖像什么?來看看你的家鄉(xiāng)

譚老師地理大課堂
2025-12-25 18:12:15
滬指,還是8連陽了!11:13,全市場為何同步跳水?

滬指,還是8連陽了!11:13,全市場為何同步跳水?

每經(jīng)牛眼
2025-12-26 15:26:22
美國提醒日本,小心被中國揍,日本天皇急召高市早苗,有要事交代

美國提醒日本,小心被中國揍,日本天皇急召高市早苗,有要事交代

墨印齋
2025-12-25 15:04:35
2026年,幼兒園關(guān)停潮已經(jīng)來了

2026年,幼兒園關(guān)停潮已經(jīng)來了

沒有偏旁的常慶
2025-12-26 08:14:36
1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

抽象派大師
2025-12-22 01:46:01
中緬泰聯(lián)合清剿KK園區(qū),汪文斌發(fā)文呼吁,應(yīng)倍加珍惜中柬鐵桿友誼

中緬泰聯(lián)合清剿KK園區(qū),汪文斌發(fā)文呼吁,應(yīng)倍加珍惜中柬鐵桿友誼

南宮一二
2025-12-26 11:32:07
2025-12-26 16:20:49
余們搞笑段子
余們搞笑段子
專注搞笑視頻,喜歡殿下關(guān)注,感謝支持!
1024文章數(shù) 53關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

日本領(lǐng)導(dǎo)人被指或參拜靖國神社 外交部回應(yīng)

頭條要聞

日本領(lǐng)導(dǎo)人被指或參拜靖國神社 外交部回應(yīng)

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天深夜道歉,只字未提五月天阿信

財經(jīng)要聞

資管江湖的人事“寒冬”

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

數(shù)碼
家居
健康
親子
公開課

數(shù)碼要聞

2026年TV市場趨勢預(yù)測:華為Mate TV將顛覆行業(yè)

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

這些新療法,讓化療不再那么痛苦

親子要聞

12歲男孩天天要抱抱,這正常嗎?為什么摟摟抱抱對孩子那么重要?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版