国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

NHB | 多模態(tài)大模型做“仇恨言論”判定:更懂語(yǔ)境,也更難擺脫偏見(jiàn)

0
分享至

PsyBrain 腦心前沿 | 公眾號(hào) PSY-Brain_Frontier

一鍵關(guān)注,點(diǎn)亮星標(biāo) ??

不錯(cuò)過(guò)每日前沿資訊

認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息:

Title:Multimodal large language models can make context-sensitive hate speech evaluations aligned with human judgement

發(fā)表時(shí)間:2025.12.15

Journal:Nature Human Behaviour

影響因子:15.9

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



引言

社交平臺(tái)的內(nèi)容審核(content moderation)長(zhǎng)期卡在一個(gè)矛盾點(diǎn):規(guī)則需要“統(tǒng)一”,但仇恨言論(hate speech)的含義往往高度依賴語(yǔ)境,即同一個(gè)詞,在攻擊與自嘲、外群體辱罵與群體內(nèi)部“重新占有”(reclaimed slur)之間,處理邏輯可能完全不同。

傳統(tǒng)自動(dòng)化模型多以“文本片段”做判斷,容易把討論歧視經(jīng)歷、引用他人辱罵、或群體內(nèi)部用語(yǔ)都誤判為違規(guī),反而加重對(duì)被針對(duì)群體的傷害。

本文把多模態(tài)大語(yǔ)言模型(multimodal large language models, MLLMs)拉進(jìn)更貼近真實(shí)審核的場(chǎng)景:給模型一段仇恨言論政策(policy),再讓它閱讀“截圖式”社交媒體帖(包含文字、頭像/姓名等身份線索、互動(dòng)回復(fù)、點(diǎn)贊量),用強(qiáng)制二選一的聯(lián)合實(shí)驗(yàn)(conjoint experiment)做“優(yōu)先送審”選擇,并與1,854名人類受試者的判斷對(duì)齊比較。


核心結(jié)果

更大、更強(qiáng)的多模態(tài)大模型(MLLMs)能更“看懂語(yǔ)境”:在給定仇恨言論政策(policy)并結(jié)合帖文上下文信息時(shí),模型對(duì)“是否應(yīng)優(yōu)先送審/處理”的判斷與人類更一致。

偏見(jiàn)并未消失:對(duì)詞匯(lexical)觸發(fā)與用戶人口學(xué)線索(demographic cues)的系統(tǒng)性偏差仍普遍存在,且在較小模型上更明顯。

視覺(jué)身份線索會(huì)放大差異:頭像/面孔等視覺(jué)信息會(huì)顯著影響部分模型的決策,使不同群體相關(guān)內(nèi)容的處理更不均衡。

提示詞能“增強(qiáng)語(yǔ)境敏感”,但無(wú)法根治偏差:通過(guò)prompting可提升對(duì)語(yǔ)境的利用程度,但偏見(jiàn)無(wú)法被完全消除。

方法論貢獻(xiàn):聯(lián)合實(shí)驗(yàn)(conjoint experiments)適合用來(lái)審計(jì)(audit)這類“高度依賴語(yǔ)境”的內(nèi)容審核AI,能更清晰拆解模型受哪些線索驅(qū)動(dòng)。


Fig. 1 | Simulated social media posts.



Fig. 2 | Effects of post attributes on the moderation decisions.


Fig. 3 | Differences in the effects of slurs by identity.


Fig. 4 | Differences in the effects of slurs by identity across prompts.


Fig. 5 | Effects of identity on moderation decisions by identity cue modality. AMCE

前沿交流|歡迎加入認(rèn)知神經(jīng)科學(xué)前沿交流群!


核心圖表、方法細(xì)節(jié)、統(tǒng)計(jì)結(jié)果與討論見(jiàn)原文及其拓展數(shù)據(jù)。

分享人:BQ

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
宋徽宗用瘦金體寫的圣旨,幾經(jīng)戰(zhàn)亂而流傳至今,乃真正的國(guó)寶

宋徽宗用瘦金體寫的圣旨,幾經(jīng)戰(zhàn)亂而流傳至今,乃真正的國(guó)寶

幸福娃3790
2025-12-11 11:34:53
特朗普已做好開(kāi)戰(zhàn)準(zhǔn)備?王毅警告:中美一旦沖突,結(jié)局只有一個(gè)

特朗普已做好開(kāi)戰(zhàn)準(zhǔn)備?王毅警告:中美一旦沖突,結(jié)局只有一個(gè)

近史談
2025-12-25 20:44:50
特朗普想通了,公開(kāi)一文件:不能跟中國(guó)真打,但一定要嚇唬住中國(guó)

特朗普想通了,公開(kāi)一文件:不能跟中國(guó)真打,但一定要嚇唬住中國(guó)

博覽歷史
2025-12-25 18:00:00
上海46歲獨(dú)居女子過(guò)世,遺產(chǎn)不能買墓地?最新消息:法院指定虹口區(qū)民政局任遺產(chǎn)管理人

上海46歲獨(dú)居女子過(guò)世,遺產(chǎn)不能買墓地?最新消息:法院指定虹口區(qū)民政局任遺產(chǎn)管理人

每日經(jīng)濟(jì)新聞
2025-12-25 00:48:23
男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

眼淚博物
2025-08-07 16:47:38
梁興初離開(kāi)“萬(wàn)歲軍”后,并沒(méi)有從朝鮮回國(guó),統(tǒng)一指揮近20萬(wàn)大軍

梁興初離開(kāi)“萬(wàn)歲軍”后,并沒(méi)有從朝鮮回國(guó),統(tǒng)一指揮近20萬(wàn)大軍

云霄紀(jì)史觀
2025-12-26 20:14:26
林丹談石宇奇2-0桃田賢斗:感謝兩位貢獻(xiàn)了精彩比賽,我很感動(dòng)

林丹談石宇奇2-0桃田賢斗:感謝兩位貢獻(xiàn)了精彩比賽,我很感動(dòng)

蘭亭墨未干
2025-12-27 02:39:03
官方:步行者裁掉懷斯曼、馬修斯,簽下邁卡-波特

官方:步行者裁掉懷斯曼、馬修斯,簽下邁卡-波特

懂球帝
2025-12-27 08:41:08
喪心病狂!河南某大院年終獎(jiǎng)出爐:?jiǎn)T工倒欠3萬(wàn)!

喪心病狂!河南某大院年終獎(jiǎng)出爐:?jiǎn)T工倒欠3萬(wàn)!

黯泉
2025-12-26 22:07:40
2:0領(lǐng)先遭連扳4局!王曼昱爆冷出局,女乒主力穩(wěn)定性遭拷問(wèn)

2:0領(lǐng)先遭連扳4局!王曼昱爆冷出局,女乒主力穩(wěn)定性遭拷問(wèn)

阿晞體育
2025-12-27 09:44:07
臺(tái)灣“最強(qiáng)斗士”邱毅,因愛(ài)國(guó)言論被迫離婚,妻子每天活在恐嚇中

臺(tái)灣“最強(qiáng)斗士”邱毅,因愛(ài)國(guó)言論被迫離婚,妻子每天活在恐嚇中

議紀(jì)史
2025-12-25 20:05:03
宣布交易!楊瀚森,狂喜!

宣布交易!楊瀚森,狂喜!

李帕在北漂
2025-12-26 14:32:35
中央新規(guī):70后可選三種退休方案,靈活選擇,各有福利

中央新規(guī):70后可選三種退休方案,靈活選擇,各有福利

慧眼看世界哈哈
2025-12-27 07:30:32
歐盟很惱火:我只是給中國(guó)電車加了點(diǎn)稅,中國(guó)干嘛對(duì)我發(fā)起反制?

歐盟很惱火:我只是給中國(guó)電車加了點(diǎn)稅,中國(guó)干嘛對(duì)我發(fā)起反制?

回京歷史夢(mèng)
2025-12-26 11:24:08
1.65萬(wàn)戶股東沸騰,300472,獲贈(zèng)巨額現(xiàn)金!下周存儲(chǔ)龍頭解禁市值超百億元

1.65萬(wàn)戶股東沸騰,300472,獲贈(zèng)巨額現(xiàn)金!下周存儲(chǔ)龍頭解禁市值超百億元

數(shù)據(jù)寶
2025-12-27 07:36:24
三殺雷霆,拯救不良少年,主教練米奇正帶領(lǐng)馬刺重返冠軍行列!

三殺雷霆,拯救不良少年,主教練米奇正帶領(lǐng)馬刺重返冠軍行列!

我球被偷了
2025-12-26 20:35:45
越扒瓜越大!徐鶯身份成謎,徐湖平被曝私生活混亂,還讓人碰見(jiàn)過(guò)

越扒瓜越大!徐鶯身份成謎,徐湖平被曝私生活混亂,還讓人碰見(jiàn)過(guò)

深析古今
2025-12-27 09:54:34
沉寂10天后,中國(guó)對(duì)美強(qiáng)硬出手,力度之大、范圍之廣前所未有

沉寂10天后,中國(guó)對(duì)美強(qiáng)硬出手,力度之大、范圍之廣前所未有

李健政觀察
2025-12-27 09:58:19
京東宣布年終獎(jiǎng)25薪!刺痛全行業(yè)的劉強(qiáng)東為什么要這么做?

京東宣布年終獎(jiǎng)25薪!刺痛全行業(yè)的劉強(qiáng)東為什么要這么做?

傳心財(cái)經(jīng)
2025-12-26 13:54:19
中醫(yī)曾兩次大規(guī)!膀(yàn)藥”,結(jié)果很尷尬

中醫(yī)曾兩次大規(guī)!膀(yàn)藥”,結(jié)果很尷尬

科海識(shí)貝sci
2025-12-26 15:27:23
2025-12-27 10:43:00
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動(dòng)態(tài),聚焦認(rèn)知與神經(jīng)新研究
79文章數(shù) 6關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開(kāi)發(fā)商:已超質(zhì)保期

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開(kāi)發(fā)商:已超質(zhì)保期

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂(lè)要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

保時(shí)捷經(jīng)銷商連夜閉店,維權(quán)車主寒風(fēng)中瑟瑟發(fā)抖

態(tài)度原創(chuàng)

教育
旅游
游戲
公開(kāi)課
軍事航空

教育要聞

全球留學(xué)質(zhì)量指數(shù)發(fā)布,中國(guó)競(jìng)爭(zhēng)力顯現(xiàn)

旅游要聞

旅日大熊貓回國(guó)后,日本動(dòng)物園“神操作”:由人扮演大熊貓供游客體驗(yàn)互動(dòng)

PS前CEO:平臺(tái)獨(dú)占仍在發(fā)力 專注能將性能推向極致

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

英法德三國(guó)領(lǐng)導(dǎo)人通話 重申對(duì)烏支持

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版