国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ICLR 2026 Oral|多模態(tài)知識(shí)圖譜對(duì)齊難:破解噪聲關(guān)聯(lián)至為關(guān)鍵

0
分享至



在數(shù)據(jù)類(lèi)型日益多元化的時(shí)代背景下,現(xiàn)實(shí)世界中的人、事、物皆可通過(guò)多種模態(tài)進(jìn)行記錄與呈現(xiàn)。在此趨勢(shì)推動(dòng)下,多模態(tài)知識(shí)圖譜(MMKG)[1,2] 作為一種集成文本、圖像、結(jié)構(gòu)化關(guān)系等多模態(tài)數(shù)據(jù)的信息載體,能夠高效、全面地為各類(lèi)多模態(tài)下游應(yīng)用提供數(shù)據(jù)支撐。作為構(gòu)建知識(shí)圖譜的核心技術(shù),實(shí)體對(duì)齊致力于從不同來(lái)源的圖譜中識(shí)別同一實(shí)體,從而建立跨圖譜關(guān)聯(lián)并促進(jìn)圖譜融合。

然而,現(xiàn)實(shí)生活中,大規(guī)模知識(shí)圖譜的關(guān)聯(lián)與融合非一蹴而就,往往面臨著噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)的雙重挑戰(zhàn)。如圖一 (a) 和 (c) 所示,試想以下場(chǎng)景:

  • 噪聲關(guān)聯(lián):當(dāng)你試圖為「海王」杰森?莫瑪關(guān)聯(lián)圖像,卻因?yàn)闃O高的視覺(jué)相似度,將一張中國(guó)演員徐錦江的照片進(jìn)行了上傳;當(dāng)你認(rèn)為名字高度相似的 Mr. & Mrs. Smith 和 Will Smith and Mrs. Smith 是同一個(gè)實(shí)體時(shí),其實(shí)是電影《史密斯夫婦》與美國(guó)明星「威爾?史密斯夫婦」。
  • 潛隱關(guān)聯(lián):當(dāng)模型想找到著名足球運(yùn)動(dòng)員 C 羅,卻發(fā)現(xiàn)搜索到實(shí)體的圖像竟然是「葡萄牙國(guó)旗」,于是認(rèn)為并不是想查詢(xún)的「人」。殊不知,這正是 C 羅的國(guó)籍。

近日,來(lái)自四川大學(xué)的研究團(tuán)隊(duì)揭示了上述現(xiàn)象在大規(guī)模知識(shí)圖譜中廣泛存在,并有效緩解了噪聲關(guān)聯(lián)潛隱關(guān)聯(lián)對(duì)實(shí)體對(duì)齊的負(fù)面影響,有望推動(dòng)大規(guī)模知識(shí)圖譜的關(guān)聯(lián)與融合。目前,該論文被機(jī)器學(xué)習(xí)頂會(huì) ICLR 2026 接收為了 Oral。



  • 論文標(biāo)題:Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment
  • 論文鏈接:https://openreview.net/forum?id=mytIKuRsSE
  • 代碼鏈接:https://github.com/XLearning-SCU/2026-ICLR-RULE
  • 噪聲關(guān)聯(lián)學(xué)習(xí)倉(cāng)庫(kù):https://github.com/XLearning-SCU/Awesome-Noisy-Correspondence

背景與挑戰(zhàn)

多模態(tài)實(shí)體對(duì)齊(MMEA)[3,4] 旨在識(shí)別異構(gòu)知識(shí)圖譜中的同一實(shí)體,而圖譜中的每個(gè)實(shí)體都與各種屬性(如結(jié)構(gòu)化信息、圖像和文本描述)相關(guān)聯(lián)。為建立異構(gòu)知識(shí)圖譜的關(guān)聯(lián),現(xiàn)有方法首先會(huì)根據(jù)實(shí)體內(nèi)關(guān)聯(lián)(實(shí)體 - 屬性關(guān)聯(lián))來(lái)融合多模態(tài)屬性,以獲取實(shí)體表征,然后根據(jù)跨圖譜關(guān)聯(lián)(實(shí)體 - 實(shí)體關(guān)聯(lián),屬性 - 屬性關(guān)聯(lián)),進(jìn)行實(shí)體層面和屬性層面的跨圖譜對(duì)齊來(lái)消除差異。

然而,現(xiàn)有方法通常假設(shè)實(shí)體內(nèi)和跨圖譜的關(guān)聯(lián)都是正確的,忽略了知識(shí)圖譜中廣泛存在的噪聲關(guān)聯(lián)問(wèn)題。據(jù)統(tǒng)計(jì),部分基準(zhǔn)測(cè)試中有超過(guò) 50% 的實(shí)體受噪聲關(guān)聯(lián)問(wèn)題影響。如圖 1 (b) 所示,噪聲關(guān)聯(lián)不僅會(huì)破壞實(shí)體內(nèi)的屬性融合,還會(huì)誤導(dǎo)跨圖譜對(duì)齊過(guò)程,這兩方面因素都將導(dǎo)致模型性能顯著下降。

除了噪聲關(guān)聯(lián)現(xiàn)象外,現(xiàn)有的多模態(tài)實(shí)體對(duì)齊模型通常僅依賴(lài)淺層相似度來(lái)判斷關(guān)聯(lián)程度,忽略了模型推理時(shí)往往存在看似不同但本質(zhì)相同的屬性,如圖 1 (c) 所示,這些潛隱關(guān)聯(lián)往往會(huì)影響實(shí)體對(duì)齊的準(zhǔn)確性。



圖 1:噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)示意圖,以及二者相關(guān)的觀察實(shí)驗(yàn)。

針對(duì)噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)挑戰(zhàn),本文提出了 RULE,主要貢獻(xiàn)如下:

  • 揭示了多模態(tài)知識(shí)圖譜中的噪聲關(guān)聯(lián)問(wèn)題,從多屬性融合和跨圖譜對(duì)齊兩個(gè)層面探索了噪聲關(guān)聯(lián)的負(fù)面影響。
  • 在測(cè)試時(shí)引入關(guān)聯(lián)推理模塊,來(lái)確保更準(zhǔn)確的實(shí)體識(shí)別,率先在實(shí)體對(duì)齊領(lǐng)域探索增強(qiáng)測(cè)試時(shí)魯棒性。
  • 為檢驗(yàn)現(xiàn)有方法的魯棒性建立了統(tǒng)一的基準(zhǔn)測(cè)試,涵蓋 5 個(gè)廣泛應(yīng)用的數(shù)據(jù)集。

方法

本文設(shè)計(jì)了一系列方法來(lái)緩解噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)對(duì)多模態(tài)實(shí)體對(duì)齊模型的負(fù)面影響。具體而言,團(tuán)隊(duì)首先提出了統(tǒng)一的準(zhǔn)則來(lái)量化實(shí)體內(nèi)和跨圖譜關(guān)聯(lián)的可靠度,在訓(xùn)練時(shí)采用魯棒的多屬性融合和跨圖譜對(duì)齊策略來(lái)緩解噪聲關(guān)聯(lián)的負(fù)面影響,在測(cè)試時(shí)使用了關(guān)聯(lián)推理模塊來(lái)挖掘潛隱關(guān)聯(lián),最終實(shí)現(xiàn)更準(zhǔn)確的實(shí)體對(duì)齊。



圖 2:RULE 的框架圖

1) 可靠度建模











2) 魯棒的跨圖譜對(duì)齊和多屬性融合

基于建模的關(guān)聯(lián)可靠度,團(tuán)隊(duì)提出了魯棒的跨圖譜對(duì)齊和多屬性融合,用于緩解噪聲關(guān)聯(lián)在這兩方面的負(fù)面影響。

魯棒的跨圖譜對(duì)齊:如圖 2 所示,RULE 采用基于 Dirichlet 分布的證據(jù)學(xué)習(xí) [5] 來(lái)優(yōu)化跨圖譜關(guān)聯(lián),





魯棒的多屬性融合:在可靠度建模部分,團(tuán)隊(duì)量化了實(shí)體 / 屬性對(duì)的可靠度,接下來(lái)需要估計(jì)實(shí)體內(nèi)關(guān)聯(lián)的可靠度。團(tuán)隊(duì)觀察到,對(duì)于正確的實(shí)體 - 實(shí)體關(guān)聯(lián)而言,錯(cuò)誤的實(shí)體 - 屬性關(guān)聯(lián)一定會(huì)導(dǎo)致錯(cuò)誤的屬性 - 屬性關(guān)聯(lián)。因此,跨圖譜屬性 - 屬性關(guān)聯(lián)的可靠度能夠用于識(shí)別錯(cuò)誤的實(shí)體 - 屬性關(guān)聯(lián)。對(duì)于正確的實(shí)體 - 實(shí)體關(guān)聯(lián)而言,團(tuán)隊(duì)采用如下的魯棒多屬性融合方式來(lái)獲取實(shí)體表征,





3) 測(cè)試時(shí)關(guān)聯(lián)推理

為了挖掘看似不同但本質(zhì)相同的屬性,團(tuán)隊(duì)提出了測(cè)試時(shí)關(guān)聯(lián)推理模塊,利用多模態(tài)大模型(MLLM)的內(nèi)蘊(yùn)知識(shí)來(lái)矯正屬性 - 屬性關(guān)聯(lián),進(jìn)而提升跨圖譜實(shí)體對(duì)齊的準(zhǔn)確率。具體而言,MLLM 推理得到的對(duì)齊結(jié)果如下:





實(shí)驗(yàn)結(jié)果

本文提出的 RULE 旨在克服多模態(tài)實(shí)體對(duì)齊中的噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)挑戰(zhàn)。為了更好地研究 RULE 的魯棒性,團(tuán)隊(duì)參考噪聲關(guān)聯(lián) [6,7]/ 標(biāo)簽 [8] 學(xué)習(xí)領(lǐng)域廣泛采用的策略,通過(guò)人工注入噪聲的方式構(gòu)建了更加嚴(yán)苛的評(píng)估環(huán)境。

具體而言,團(tuán)隊(duì)在以下三個(gè)維度注入人工噪聲:

  • 實(shí)體 - 實(shí)體噪聲關(guān)聯(lián):在已對(duì)齊的實(shí)體對(duì)中,隨機(jī)選擇一個(gè)實(shí)體替換為不同實(shí)體,破壞原始對(duì)齊關(guān)系;
  • 實(shí)體 - 屬性噪聲關(guān)聯(lián):將當(dāng)前實(shí)體的視覺(jué)和文本屬性隨機(jī)重新分配給不同實(shí)體,模擬屬性標(biāo)注錯(cuò)誤;
  • 屬性 - 屬性噪聲關(guān)聯(lián):對(duì)視覺(jué)和文本屬性注入噪聲,模擬屬性層面的噪聲干擾。



表 1:不使用名字屬性時(shí)的性能比較



表 2:所有屬性時(shí)的性能比較

部分實(shí)驗(yàn)結(jié)果如下:

根據(jù)表 1-2,本文提出的 RULE 在不同噪聲水平下均表現(xiàn)出卓越的魯棒性,全面領(lǐng)先于現(xiàn)有 SOTA 方法,這說(shuō)明 RULE 能夠有效地緩解噪聲和潛隱關(guān)聯(lián)問(wèn)題。即使在不額外注入噪聲的情況下,RULE 依然實(shí)現(xiàn)了大幅性能提升,這驗(yàn)證了現(xiàn)實(shí)世界數(shù)據(jù)集中普遍存在噪聲和潛隱關(guān)聯(lián)問(wèn)題。



圖 3 跨圖譜關(guān)聯(lián)的可靠度分布



圖 4 實(shí)體內(nèi)關(guān)聯(lián)的可靠度可視化



圖 5 測(cè)試時(shí)關(guān)聯(lián)推理模塊的可視化

根據(jù)圖 3-4,提出的可靠度量化策略不僅能夠有效區(qū)分跨圖譜的正確關(guān)聯(lián)和噪聲關(guān)聯(lián),而且能夠識(shí)別出不可靠的屬性,從而促進(jìn)魯棒跨圖譜對(duì)齊和多屬性融合。此外,根據(jù)圖 5,測(cè)試時(shí)關(guān)聯(lián)推理模塊能夠有效挖掘出圖像屬性之間的潛在關(guān)聯(lián),從而提升實(shí)體對(duì)齊的準(zhǔn)確率。

總結(jié)與展望

本文提出的 RULE 探索了多模態(tài)實(shí)體對(duì)齊任務(wù)中的噪聲關(guān)聯(lián)和潛隱關(guān)聯(lián)問(wèn)題,從多屬性融合、跨圖譜對(duì)齊和測(cè)試時(shí)推理三個(gè)層面揭示了兩者的負(fù)面影響,并進(jìn)一步構(gòu)建了評(píng)估方法魯棒性的基準(zhǔn)測(cè)試,為后續(xù)研究提供了實(shí)驗(yàn)觀察和評(píng)估體系。

值得注意的是,本工作是將噪聲關(guān)聯(lián)學(xué)習(xí)范式引入多模態(tài)實(shí)體對(duì)齊任務(wù)上的一次成功嘗試,拓展了噪聲關(guān)聯(lián)定義的外延,即實(shí)體內(nèi)和跨圖譜兩個(gè)層面的噪聲關(guān)聯(lián)。

此外,本工作揭示了現(xiàn)有檢索 / 對(duì)齊方法的固有缺陷,即依賴(lài)特征相似性進(jìn)行匹配,未能深入挖掘?qū)嶓w間的潛在關(guān)系,特別是潛隱關(guān)聯(lián)幾乎存在于所有的多模態(tài)任務(wù)中,而團(tuán)隊(duì)提出的關(guān)聯(lián)推理機(jī)制有望為相關(guān)研究帶來(lái)啟發(fā)。

參考文獻(xiàn)

[1] Ye Liu, Hui Li, Alberto Garcia-Duran, Mathias Niepert, Daniel Onoro-Rubio, and David S Rosenblum. Mmkg: Multi-modal knowledge graphs. In ESWC, 2019.

[2] Shichao Pei, Lu Yu, Guoxian Yu, and Xiangliang Zhang. Rea: Robust cross-lingual entity alignment between knowledge graphs. In KDD, 2020.

[3] Liyi Chen, Ying Sun, Shengzhe Zhang, Yuyang Ye, Wei Wu, and Hui Xiong. Tackling uncertain correspondences for multi-modal entity alignment. NeurIS, 2024.

[4] Zhuo Chen, Jiaoyan Chen, Wen Zhang, Lingbing Guo, Yin Fang, Yufeng Huang, Yichi Zhang, Yuxia Geng, Jeff Z Pan, Wenting Song, et al. Meaformer: Multi-modal entity alignment transformer for meta modality hybrid. In ACM Multimedia, 2023a.

[5] Murat Sensoy, Lance Kaplan, and Melih Kandemir. Evidential deep learning to quantify classification uncertainty. In NeurIPS, 2018.

[6] Mouxing Yang, Zhenyu Huang, Peng Hu, Taihao Li, Jiancheng Lv, and Xi Peng. Learning with twin noisy labels for visible-infrared person re-identification. In CVPR, 2022.

[7] Zhenyu Huang, Mouxing Yang, Xinyan Xiao, Peng Hu, and Xi Peng. Noise-robust vision-language pre-training with positive-negative learning. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024b.

[8] Nagarajan Natarajan, Inderjit S Dhillon, Pradeep K Ravikumar, and Ambuj Tewari. Learning with noisy labels. In NeurIPS, 2013.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一架專(zhuān)機(jī)將到中東,伊朗允許中國(guó)船只通過(guò),還親自感謝中國(guó)

一架專(zhuān)機(jī)將到中東,伊朗允許中國(guó)船只通過(guò),還親自感謝中國(guó)

公子故事會(huì)
2026-03-06 18:11:14
打破十年僵局:中國(guó)或?qū)⒔o波音重大訂單

打破十年僵局:中國(guó)或?qū)⒔o波音重大訂單

環(huán)球旅訊
2026-03-07 13:02:32
25分算個(gè)p!文班都被打哭了.....

25分算個(gè)p!文班都被打哭了.....

柚子說(shuō)球
2026-03-07 17:11:34
終于打穿了!美國(guó)航母神話,徹底崩了!

終于打穿了!美國(guó)航母神話,徹底崩了!

阿芒娛樂(lè)說(shuō)
2026-03-07 09:40:44
學(xué)術(shù)造假!大學(xué)教授,被開(kāi)除

學(xué)術(shù)造假!大學(xué)教授,被開(kāi)除

TOP大學(xué)來(lái)了
2026-03-06 17:48:24
1960年,烈士趙一曼兒子寫(xiě)信諷刺毛主席,主席看后只回復(fù)了6個(gè)字

1960年,烈士趙一曼兒子寫(xiě)信諷刺毛主席,主席看后只回復(fù)了6個(gè)字

小莜讀史
2026-03-04 15:56:32
好難,公司宣布從2026.3.1起停業(yè)解散,全員失業(yè)!

好難,公司宣布從2026.3.1起停業(yè)解散,全員失業(yè)!

黯泉
2026-03-06 20:46:33
西貝毛利70%,比海底撈都高:計(jì)劃2026年上市,現(xiàn)在威逼員工辭職

西貝毛利70%,比海底撈都高:計(jì)劃2026年上市,現(xiàn)在威逼員工辭職

江山揮筆
2026-03-07 11:07:14
山姆1.38公斤冰塊賣(mài)37.9元,消費(fèi)者稱(chēng)比冰塊融化速度慢,而且顏值高,門(mén)店工作人員:銷(xiāo)量不錯(cuò),現(xiàn)貨極少

山姆1.38公斤冰塊賣(mài)37.9元,消費(fèi)者稱(chēng)比冰塊融化速度慢,而且顏值高,門(mén)店工作人員:銷(xiāo)量不錯(cuò),現(xiàn)貨極少

觀威海
2026-03-04 10:39:05
兩會(huì)新華鮮報(bào)|“好房子”“好天氣”“好身體”!托舉民生之大

兩會(huì)新華鮮報(bào)|“好房子”“好天氣”“好身體”!托舉民生之大

新華社
2026-03-06 22:48:10
芬蘭總理:來(lái)故宮才明白,中國(guó)不是大國(guó)崛起,只是在重回歷史巔峰

芬蘭總理:來(lái)故宮才明白,中國(guó)不是大國(guó)崛起,只是在重回歷史巔峰

近史談
2026-03-06 13:57:51
8年謎團(tuán)終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

8年謎團(tuán)終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

秋姐居
2026-03-03 17:48:27
世上沒(méi)有后悔藥!下半身"貪婪"的任素汐,現(xiàn)狀印證王菲評(píng)價(jià)

世上沒(méi)有后悔藥!下半身"貪婪"的任素汐,現(xiàn)狀印證王菲評(píng)價(jià)

秋姐居
2026-02-27 17:16:02
方言的消失是中華文明的悲哀

方言的消失是中華文明的悲哀

虔青
2026-03-02 07:24:07
豪門(mén)悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級(jí)八強(qiáng)

豪門(mén)悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級(jí)八強(qiáng)

側(cè)身凌空斬
2026-03-07 06:10:33
翁帆近況:以訪問(wèn)學(xué)者身份去英國(guó),專(zhuān)注學(xué)術(shù)研究,50歲內(nèi)心很寧?kù)o

翁帆近況:以訪問(wèn)學(xué)者身份去英國(guó),專(zhuān)注學(xué)術(shù)研究,50歲內(nèi)心很寧?kù)o

查爾菲的筆記
2026-03-07 13:38:17
抱緊美日大腿,停飛中國(guó)航班、拒絕中國(guó)游客的小國(guó),如今怎樣了?

抱緊美日大腿,停飛中國(guó)航班、拒絕中國(guó)游客的小國(guó),如今怎樣了?

墨蘭史書(shū)
2026-03-07 03:50:03
錢(qián)再多有什么用?51歲百億影帝黃渤近況曝光,給年輕人們提了個(gè)醒

錢(qián)再多有什么用?51歲百億影帝黃渤近況曝光,給年輕人們提了個(gè)醒

基斯默默
2026-01-26 13:08:55
老賴(lài)黃淑芬把人撞成植物人, 寧可坐牢也不賠償, 后續(xù)結(jié)局大快人心

老賴(lài)黃淑芬把人撞成植物人, 寧可坐牢也不賠償, 后續(xù)結(jié)局大快人心

觀察鑒娛
2026-03-07 10:26:48
中國(guó)女籃戰(zhàn)捷克,直播頻道有變,張子宇對(duì)比劉禹彤,差距顯而易見(jiàn)

中國(guó)女籃戰(zhàn)捷克,直播頻道有變,張子宇對(duì)比劉禹彤,差距顯而易見(jiàn)

體育大學(xué)僧
2026-03-07 11:40:15
2026-03-07 19:15:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12430文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

中國(guó)貨船"鐵娘子"號(hào)通過(guò)霍爾木茲海峽 大量船舶仍滯留

頭條要聞

中國(guó)貨船"鐵娘子"號(hào)通過(guò)霍爾木茲海峽 大量船舶仍滯留

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂(lè)要聞

周杰倫田馥甄的“JH戀” 被扒得底朝天

財(cái)經(jīng)要聞

針對(duì)"不敢休、不讓休"怪圈 國(guó)家出手了

汽車(chē)要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

手機(jī)
本地
家居
數(shù)碼
教育

手機(jī)要聞

vivo X300 Max手機(jī)原型曝光:預(yù)估6.78英寸屏幕、7000mAh電池

本地新聞

食味印象|一口入魂!康樂(lè)烤肉串起千年絲路香

家居要聞

暖棕撞色 輕法奶油風(fēng)

數(shù)碼要聞

三星Galaxy Watch Ultra 2確認(rèn)將搭載全新芯片組

教育要聞

現(xiàn)在學(xué)校已經(jīng)不發(fā)教輔了,讓家長(zhǎng)自愿去書(shū)店購(gòu)買(mǎi)!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版