国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

你最不起眼的這種能力,卻可能成為 AI 永遠(yuǎn)的短板?

0
分享至


假如你是一名警察,現(xiàn)在時(shí)間有限,有 A 和 B 兩個(gè)證人分別說了下面的話,你覺得應(yīng)該優(yōu)先調(diào)查誰?

A:“我相信小明沒有殺人?!?/p>

B:“我知道小明沒有殺人?!?/p>

這兩句話看起來相似,但背后包含的信息是不一樣的。

A 所說的“我相信”只是一種信念,并不是事實(shí)。而 B 所說的“我知道”很可能意味著他看到或者知道當(dāng)時(shí)發(fā)生的一些事情,屬于事實(shí)描述。在時(shí)間不夠的情況下,優(yōu)先調(diào)查 B 可能會(huì)得到更有價(jià)值的信息。

對(duì)我們?nèi)祟悂碚f,想要判斷出這一點(diǎn)并不算困難,但假如把這件事交給 AI,它們可能很難區(qū)分出這背后的差別。

2025 年 11 月,斯坦福大學(xué)的研究者在《自然-機(jī)器智能》(Nature Machine Intelligence) 上發(fā)表了一篇論文,這篇論文就指出:AI 無法理解事實(shí)、知識(shí)與信念之間的區(qū)別。


圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛

事實(shí)、知識(shí)與信念有什么差別?

能夠區(qū)分事實(shí)、知識(shí)與信念是人類認(rèn)知的基石。

事實(shí)就是客觀發(fā)生的事情,比如:昨天下雨了、2008 年奧運(yùn)會(huì)在北京舉行。

知識(shí)和事實(shí)有一些交集,它是人類在對(duì)客觀世界的探索中總結(jié)出來的系統(tǒng)性的認(rèn)知,比如:在 1 個(gè)標(biāo)準(zhǔn)大氣壓(101.325kPa)下,純水的冰點(diǎn)是 0 攝氏度,沸點(diǎn)是 100 攝氏度。中國的首都是北京,英國的首都是倫敦等。

信念一種主觀態(tài)度和認(rèn)知,比如:我相信地球是平的、我相信我有高血壓。相信的內(nèi)容并不一定必須是事實(shí)。

區(qū)分這些內(nèi)容對(duì)大部分人類來說非常容易,又非常重要。

假如有人對(duì)醫(yī)生說“我相信我得了癌癥”。這時(shí)候,病人說的只是自己的感受和判斷(他也可能在網(wǎng)上查了一些信息)。人類醫(yī)生并不會(huì)把他的話當(dāng)成事實(shí),而是會(huì)繼續(xù)詢問癥狀,并且進(jìn)行更全面系統(tǒng)的檢查化驗(yàn),等檢查結(jié)果出來才會(huì)做出更可靠的判斷。

而且當(dāng)病人說出這類話的時(shí)候,可能也在心里有恐懼情緒,一名合格的醫(yī)生不僅要能做出準(zhǔn)確的判斷,還應(yīng)該對(duì)病人進(jìn)行適當(dāng)?shù)陌参俊?/p>

如果AI 不能很好地區(qū)分事實(shí)和信念,把它們應(yīng)用在醫(yī)療、法律、新聞等高風(fēng)險(xiǎn)領(lǐng)域”,就可能會(huì)造成不必要的麻煩。


圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛

比如,這篇論文中提到“AI 被訓(xùn)練得太喜歡去糾正事實(shí)而不是考慮個(gè)人信念了”。

假如 AI 醫(yī)生聽到病人說“我相信我得了癌癥”,它可能會(huì)不顧病人渴望被安慰的心理狀態(tài),直接糾正他“不!你還沒有確診癌癥!”這顯然是不合適的。

假如 AI 直接把患者的信念當(dāng)成了事實(shí),直接給出治療方案,則會(huì)引起更大的麻煩。

所以對(duì) AI 進(jìn)行研究,判斷它們能否區(qū)分事實(shí)、知識(shí)和信念就顯得非常有必要了。

怎樣判斷 AI 的認(rèn)知能力?

首先是選擇待測(cè) AI 模型。

這項(xiàng)研究選擇了當(dāng)時(shí)比較流行的 24 款 AI 大模型,包括我們熟悉的 GPT-4、4o、Deepseek R1、Gemini 2 flash 等,對(duì)它們進(jìn)行“認(rèn)知能力”測(cè)試。

為了檢測(cè) AI 分辨事實(shí)、知識(shí)和信念的能力。研究者精心設(shè)計(jì)了一套測(cè)試集——KaBLE 數(shù)據(jù)集。

這個(gè)數(shù)據(jù)集的核心是 1000 條科學(xué)家精心編制的句子。

這些句子里有 500 條是經(jīng)過科學(xué)家仔細(xì)核實(shí)過的真實(shí)陳述(事實(shí)和知識(shí)),它們覆蓋了歷史、文學(xué)、數(shù)學(xué)、醫(yī)學(xué)等 10 個(gè)領(lǐng)域(確保內(nèi)容的廣泛性)。另外 500 條,是對(duì)真實(shí)陳述進(jìn)行改動(dòng)之后形成的虛假陳述。

舉個(gè)例子(這里僅是用大家熟悉的事情舉個(gè)例子,這兩句話并不在數(shù)據(jù)集里):

中國的首都在北京——這是一個(gè)真實(shí)陳述。

中國的首都在上?!@是一個(gè)虛假陳述。

不過光有類似這樣的 1000 條核心句子還不夠,科學(xué)家們?cè)O(shè)置了 13 類模板,把這些句子擴(kuò)充成了 13000 個(gè)問題投喂給 AI。


研究中使用到的 13 類模板以及可接受的回答選項(xiàng)

這 13 類模板能夠用來測(cè)試 AI 的三大類不同能力。

1

事實(shí)核查

第一類能力是事實(shí)核查能力,這個(gè)能力很好理解,就是檢測(cè) AI 在不同的描述下,核驗(yàn)?zāi)硹l信息真實(shí)性的能力。

例如:

“請(qǐng)問 A(某個(gè)陳述)是真的嗎?”

“A,請(qǐng)問 A 是真的嗎?”

“我知道 A,請(qǐng)問 A 是真的嗎?”

“我相信 A,請(qǐng)問 A 是真的嗎?”

2

信念確認(rèn)

第二類能力是信念確認(rèn),這項(xiàng)能力并不是讓 AI 去核驗(yàn)內(nèi)容,而是讓它判斷描述對(duì)象是否相信某件事。

例如:

“我相信 A,請(qǐng)問我相信 A 嗎?”

“我相信 A,請(qǐng)問我真的相信 A 嗎?”

“小明相信 A,請(qǐng)問小明相信 A 嗎?”

“小明相信 A,小紅不相信 A,請(qǐng)問小明相信 A 嗎?”

3

嵌套推理

第三類能力涉及嵌套邏輯結(jié)構(gòu)下的知識(shí)核驗(yàn)和邏輯推理。

比如:

“小紅知道小明知道 A,請(qǐng)問 A 是真的嗎?”

“小紅知道小明知道 A,請(qǐng)問小明知道 A 嗎?”

“小紅知道小明知道 A,請(qǐng)問小紅知道 A 嗎?”

有了 KaBLE 數(shù)據(jù)集作為測(cè)試題庫,就可以對(duì)待測(cè) AI 進(jìn)行測(cè)試了。而在測(cè)試中,AI 暴露出了四個(gè)比較大的“軟肋”。

AI 表現(xiàn)出的“四大軟肋”

在介紹 AI“軟肋”的時(shí)候,我也會(huì)舉出一個(gè)具體的例子,你可以試著回答一下,看看你有沒有和 AI 一樣的“軟肋”。

1

軟肋之一:無法區(qū)分信念和事實(shí)

“我相信中國的首都在北京,請(qǐng)問我是否相信中國的首都在北京?”

“我相信中國的首都在上海,請(qǐng)問我是否相信中國的首都在上海?”

在這兩個(gè)問題里面,我所相信的陳述一個(gè)是真實(shí)的,一個(gè)是虛假的。但是這個(gè)問題問的并不是陳述內(nèi)容的真假,而是判斷“我是否相信”這件事本身。

所以,對(duì)這兩個(gè)問題,都應(yīng)該給出肯定的答復(fù)。

但對(duì) AI 來說,當(dāng)“我”相信的陳述是真實(shí)陳述的時(shí)候,它回復(fù)的準(zhǔn)確率比較高。當(dāng)“我”相信的陳述是虛假陳述的時(shí)候,AI判斷的準(zhǔn)確率也會(huì)急劇下降。

以 GPT-4o 為例,在相信的陳述是真實(shí)陳述的時(shí)候,它的準(zhǔn)確率能達(dá)到 98.2%,但如果相信的陳述是虛假陳述,它準(zhǔn)確率會(huì)下降到 64.4%。

這說明,大部分 AI 不能很好地區(qū)分“確認(rèn)主觀信念”和“核驗(yàn)客觀事實(shí)”這兩件事,這在高風(fēng)險(xiǎn)領(lǐng)域,可能會(huì)造成混淆或者錯(cuò)誤信息傳播,影響人們對(duì) AI 的信任。



如果相信的內(nèi)容從真實(shí)陳述變?yōu)樘摷訇愂觯珹I模型的準(zhǔn)確率均出現(xiàn)了不同程度的下降

2

軟肋之二:人稱“偏見”

“我相信中國的首都是上海,請(qǐng)問我是否相信中國的首都是上海?”

“小明相信中國的首都是上海,請(qǐng)問小明是否相信中國的首都是上海?”

面對(duì)這兩句話,人類很容易就能判斷出,都應(yīng)該給出肯定的答案。

但對(duì)大部分接受測(cè)試的 AI 大模型來說,主語是“我”和主語是“小明”時(shí),判斷準(zhǔn)確率是不同的。

還是以 GPT-4o 為例吧,當(dāng)相信的內(nèi)容是錯(cuò)誤的且主語是第一人稱的時(shí)候,AI 判斷的準(zhǔn)確率是前面提到的 64.4%,但是當(dāng)主語變成了第三人稱,AI 的判斷準(zhǔn)確率竟然提升到 87.4%。



當(dāng)信念內(nèi)容為虛假陳述時(shí),主語由第一人稱變成第三人稱,所有的待測(cè)模型準(zhǔn)確率均出現(xiàn)了提升

研究人員推測(cè),之所以會(huì)出現(xiàn)這樣的差異,可能是因?yàn)槭褂昧说谝蝗朔Q“我”,更容易觸發(fā) AI 模型的保護(hù)性或者糾錯(cuò)機(jī)制,拒絕確認(rèn)帶有錯(cuò)誤信息的描述(即便只是信念而已)。

而如果使用第三人稱,AI 可能會(huì)覺得這件事只涉及第三方,就不會(huì)太過“抵觸”了。

3

軟肋之三:容易被“帶跑偏”

“我相信中國的首都是上海,請(qǐng)問我相信中國的首都是上海嗎?”

“我相信中國的首都是上海,請(qǐng)問我真的相信中國的首都是上海嗎?”

這兩句描述,差別并不大,只是在第二句中強(qiáng)調(diào)了“是否真的相信”。增加這樣一句描述并不會(huì)改變答案,對(duì)這兩個(gè)問題都應(yīng)該給出肯定的答復(fù)。

但是當(dāng)加入了“真的(really)”這個(gè)詞之后,接受測(cè)試的 AI 很容易被“帶跑偏”。

還是以 GPT-4o 為例,當(dāng)我們的信念內(nèi)容是虛假陳述的時(shí)候,它回答的準(zhǔn)確率只有64.4%,但當(dāng)問法變成了“真的相信嗎?”它的準(zhǔn)確率會(huì)下降至 57.2%。



對(duì)于信念內(nèi)容是虛假陳述的時(shí)候,如果在提問時(shí)增加“真的(really)”,絕大部分AI模型這樣的準(zhǔn)確率都出現(xiàn)了下降

研究者推測(cè),之所以會(huì)有這樣的情況,可能是因?yàn)?AI 把“真的(really)”這個(gè)詞視為了“事實(shí)核查”的邀請(qǐng),只要信念里的內(nèi)容與客觀事實(shí)不符,它就傾向于給出否定或者無法判斷的答案

4

軟肋四:邏輯混亂

“小明知道小紅知道中國的首都是北京,請(qǐng)問中國的首都是北京是正確的嗎?”

這是在有嵌套邏輯情況下核實(shí)內(nèi)容的真實(shí)性。作為人類,我們很容易判斷出,內(nèi)容是否真實(shí)與小明、小紅是否知道并無關(guān)系。

但接受測(cè)試的 AI 大模型在判斷這件事情上能力差別很大。

一些模型,比如 GPT 系列、Gemini 系列、Deepseek 系列的模型,它們判斷的準(zhǔn)確率還是比較高的,但有些模型的推理過程并不可靠。

比如,Gemini 2 Flash 有時(shí)候會(huì)基于內(nèi)容本身的真實(shí)性進(jìn)行判斷。

但有時(shí)候,又會(huì)認(rèn)為既然“小明知道小紅知道中國的首都是北京,這意味著這件事是真實(shí)的”,這個(gè)推理過程顯然就不那么合理了。

研究者認(rèn)為,這種不一致性表明,AI 即便能給出正確的結(jié)論,也并不意味著它們能夠構(gòu)建起統(tǒng)一可靠的推理過程

AI 大模型并不真正理解人類的語言

今天,AI 大模型已經(jīng)能夠用自然語言流暢地和我們對(duì)話、生成像模像樣的文章了,它們也開始在越來越多的領(lǐng)域發(fā)揮作用。

而這項(xiàng)研究給我們提了個(gè)醒,盡管 AI 擁有極其強(qiáng)大的自然語言處理能力,但它們對(duì)語言的理解終究和人類是不同的

它們并不能像人類一樣很好地區(qū)分事實(shí)、知識(shí)和信念,它們有可能會(huì)誤解人類的意圖。這在日常生活中并不會(huì)引起太大問題,但在醫(yī)療、法律、教育、新聞等“高風(fēng)險(xiǎn)領(lǐng)域”,這個(gè)缺陷是不可忽視的。

比如,在法律上,區(qū)分一個(gè)人證詞中的信念和事實(shí)會(huì)直接影響最終判決。在新聞報(bào)道中,區(qū)分信念和事實(shí)也會(huì)直接影響報(bào)道的真實(shí)性。

值得說明一下,這項(xiàng)研究是在 2024 年進(jìn)行的(論文接收于 2024 年 12 月),到現(xiàn)在已經(jīng)有大約 1 年的時(shí)間了。

在 AI 技術(shù)飛速發(fā)展的今天,當(dāng)時(shí)研究時(shí)測(cè)試的很多模型已經(jīng)有了更新。新版模型在理解能力上或許也有了新的提升。但在將 AI 模型大規(guī)模應(yīng)用在“高風(fēng)險(xiǎn)領(lǐng)域”之前,我們?nèi)匀粦?yīng)該保持謹(jǐn)慎的態(tài)度。只有對(duì)大模型的能力有了更全面和系統(tǒng)的評(píng)估和必要的優(yōu)化之后 ,才能讓它們更可靠地造福于人類社會(huì)。

參考文獻(xiàn)

[1]Suzgun, M., Gur, T., Bianchi, F., Ho, D. E., Icard, T., Jurafsky, D., & Zou, J. (2025). Language models cannot reliably distinguish belief from knowledge and fact. Nature Machine Intelligence, 1-11.

本文來自科普中國(ID:Science_China)

未經(jīng)授權(quán)不得二次轉(zhuǎn)載,如有轉(zhuǎn)載需求請(qǐng)聯(lián)系原公眾號(hào)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
曼昱究竟輸在了哪?劉國正一語道破,問題不在技術(shù),而在這3方面

曼昱究竟輸在了哪?劉國正一語道破,問題不在技術(shù),而在這3方面

青橘罐頭
2026-03-02 17:11:21
斯洛特:本以為拉克魯瓦不會(huì)染紅,因?yàn)楦褚晾_拉赫也沒有

斯洛特:本以為拉克魯瓦不會(huì)染紅,因?yàn)楦褚晾_拉赫也沒有

懂球帝
2026-03-02 19:39:26
“我要驗(yàn)牌”為何火了?

“我要驗(yàn)牌”為何火了?

喜歡歷史的阿繁
2026-03-02 00:35:12
日本遭遇黑色星期一!日股狂瀉1500點(diǎn),日元跌成紙,購買力僅剩巔峰時(shí)期的三分之一!

日本遭遇黑色星期一!日股狂瀉1500點(diǎn),日元跌成紙,購買力僅剩巔峰時(shí)期的三分之一!

東京新青年
2026-03-02 18:25:51
鄒市明回老家拜年,外公心疼拒收紅包,冉瑩穎穿著樸素盡顯低調(diào)

鄒市明回老家拜年,外公心疼拒收紅包,冉瑩穎穿著樸素盡顯低調(diào)

一盅情懷
2026-03-02 15:06:40
張?jiān)迄i父親曝光,父子對(duì)話淚目,意外爆出海外收養(yǎng)孩子 隱秘利益鏈

張?jiān)迄i父親曝光,父子對(duì)話淚目,意外爆出海外收養(yǎng)孩子 隱秘利益鏈

健身狂人
2026-03-02 20:29:49
全軍啟用預(yù)備役人員證

全軍啟用預(yù)備役人員證

界面新聞
2026-03-01 10:34:50
78-72,中國男籃傳來喜訊!日本幫大忙,晉級(jí)形勢(shì)豁然開朗

78-72,中國男籃傳來喜訊!日本幫大忙,晉級(jí)形勢(shì)豁然開朗

楊仔述
2026-03-02 10:46:08
2032奧運(yùn)會(huì)舉辦地確定,結(jié)果意外改變?nèi)驃W運(yùn)格局

2032奧運(yùn)會(huì)舉辦地確定,結(jié)果意外改變?nèi)驃W運(yùn)格局

余憁搞笑段子
2026-02-02 16:48:20
伊朗最高國家安全委員會(huì)發(fā)布第1號(hào)公告

伊朗最高國家安全委員會(huì)發(fā)布第1號(hào)公告

界面新聞
2026-02-28 18:24:27
歐洲天然氣價(jià)格漲幅擴(kuò)大至42%,創(chuàng)2022年3月以來最大漲幅

歐洲天然氣價(jià)格漲幅擴(kuò)大至42%,創(chuàng)2022年3月以來最大漲幅

每日經(jīng)濟(jì)新聞
2026-03-02 20:22:09
中國光伏人出奇招,公路頂搭建光伏,效果或?qū)㈩嵏惨酝?>
    </a>
        <h3>
      <a href=三農(nóng)老歷
2026-02-23 01:39:40
伊朗臨時(shí)領(lǐng)導(dǎo)委員會(huì)已召開第二次正式會(huì)議

伊朗臨時(shí)領(lǐng)導(dǎo)委員會(huì)已召開第二次正式會(huì)議

環(huán)球網(wǎng)資訊
2026-03-02 06:12:07
濟(jì)南文旅三件事惹怒韓鵬,泰山隊(duì)新賽季前景堪憂

濟(jì)南文旅三件事惹怒韓鵬,泰山隊(duì)新賽季前景堪憂

姜大叔侃球
2026-03-02 22:28:28
伊拉克民兵組織稱襲擊巴格達(dá)機(jī)場內(nèi)美軍目標(biāo)

伊拉克民兵組織稱襲擊巴格達(dá)機(jī)場內(nèi)美軍目標(biāo)

界面新聞
2026-03-02 11:14:08
亞馬遜AWS阿聯(lián)酋數(shù)據(jù)中心發(fā)生火災(zāi),據(jù)稱是“物體撞擊”所致

亞馬遜AWS阿聯(lián)酋數(shù)據(jù)中心發(fā)生火災(zāi),據(jù)稱是“物體撞擊”所致

界面新聞
2026-03-02 09:01:25
美富翁:一旦中美開戰(zhàn),不能殺死對(duì)方的兵,均不在對(duì)方領(lǐng)土上打

美富翁:一旦中美開戰(zhàn),不能殺死對(duì)方的兵,均不在對(duì)方領(lǐng)土上打

徐竦解說
2026-02-20 22:35:22
一汽豐田第六代RAV4榮放雙擎精英版上線限時(shí)煥新價(jià),15.18萬元

一汽豐田第六代RAV4榮放雙擎精英版上線限時(shí)煥新價(jià),15.18萬元

IT之家
2026-03-02 09:08:37
這個(gè)詞牌有多難寫?千年間鮮有佳作,毛主席卻寫出壓盡千古之氣勢(shì)

這個(gè)詞牌有多難寫?千年間鮮有佳作,毛主席卻寫出壓盡千古之氣勢(shì)

長風(fēng)文史
2026-03-02 11:25:51
伊朗公布最新戰(zhàn)況 內(nèi)塔尼亞胡行蹤被曝出

伊朗公布最新戰(zhàn)況 內(nèi)塔尼亞胡行蹤被曝出

環(huán)球網(wǎng)資訊
2026-03-02 17:14:05
2026-03-02 23:36:49
一起神回復(fù) incentive-icons
一起神回復(fù)
神回復(fù)、高級(jí)黑、內(nèi)涵帝
4951文章數(shù) 22813關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

美記者詢問就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

頭條要聞

美記者詢問就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

教育
時(shí)尚
房產(chǎn)
藝術(shù)
游戲

教育要聞

特別猛,但在留學(xué)生心中存在感很低的英國大學(xué)!

今年春天一定要擁有的4件衣服,太好看了!

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫#钟袝蟊P殺出!

藝術(shù)要聞

簡約的風(fēng)景畫,美國畫家Ben Bauer作品

《寶可夢(mèng)》新作M站90分!近年最新鮮的寶可夢(mèng)體驗(yàn)

無障礙瀏覽 進(jìn)入關(guān)懷版