国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

你最不起眼的這種能力,卻可能成為 AI 永遠的短板?

0
分享至


假如你是一名警察,現(xiàn)在時間有限,有 A 和 B 兩個證人分別說了下面的話,你覺得應(yīng)該優(yōu)先調(diào)查誰?

A:“我相信小明沒有殺人?!?/p>

B:“我知道小明沒有殺人。”

這兩句話看起來相似,但背后包含的信息是不一樣的。

A 所說的“我相信”只是一種信念,并不是事實。而 B 所說的“我知道”很可能意味著他看到或者知道當時發(fā)生的一些事情,屬于事實描述。在時間不夠的情況下,優(yōu)先調(diào)查 B 可能會得到更有價值的信息。

對我們?nèi)祟悂碚f,想要判斷出這一點并不算困難,但假如把這件事交給 AI,它們可能很難區(qū)分出這背后的差別。

2025 年 11 月,斯坦福大學的研究者在《自然-機器智能》(Nature Machine Intelligence) 上發(fā)表了一篇論文,這篇論文就指出:AI 無法理解事實、知識與信念之間的區(qū)別


圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛

事實、知識與信念有什么差別?

能夠區(qū)分事實、知識與信念是人類認知的基石。

事實就是客觀發(fā)生的事情,比如:昨天下雨了、2008 年奧運會在北京舉行。

知識和事實有一些交集,它是人類在對客觀世界的探索中總結(jié)出來的系統(tǒng)性的認知,比如:在 1 個標準大氣壓(101.325kPa)下,純水的冰點是 0 攝氏度,沸點是 100 攝氏度。中國的首都是北京,英國的首都是倫敦等。

信念一種主觀態(tài)度和認知,比如:我相信地球是平的、我相信我有高血壓。相信的內(nèi)容并不一定必須是事實。

區(qū)分這些內(nèi)容對大部分人類來說非常容易,又非常重要。

假如有人對醫(yī)生說“我相信我得了癌癥”。這時候,病人說的只是自己的感受和判斷(他也可能在網(wǎng)上查了一些信息)。人類醫(yī)生并不會把他的話當成事實,而是會繼續(xù)詢問癥狀,并且進行更全面系統(tǒng)的檢查化驗,等檢查結(jié)果出來才會做出更可靠的判斷。

而且當病人說出這類話的時候,可能也在心里有恐懼情緒,一名合格的醫(yī)生不僅要能做出準確的判斷,還應(yīng)該對病人進行適當?shù)陌参俊?/p>

如果AI 不能很好地區(qū)分事實和信念,把它們應(yīng)用在醫(yī)療、法律、新聞等高風險領(lǐng)域”,就可能會造成不必要的麻煩。


圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛

比如,這篇論文中提到“AI 被訓練得太喜歡去糾正事實而不是考慮個人信念了”。

假如 AI 醫(yī)生聽到病人說“我相信我得了癌癥”,它可能會不顧病人渴望被安慰的心理狀態(tài),直接糾正他“不!你還沒有確診癌癥!”這顯然是不合適的。

假如 AI 直接把患者的信念當成了事實,直接給出治療方案,則會引起更大的麻煩。

所以對 AI 進行研究,判斷它們能否區(qū)分事實、知識和信念就顯得非常有必要了。

怎樣判斷 AI 的認知能力?

首先是選擇待測 AI 模型。

這項研究選擇了當時比較流行的 24 款 AI 大模型,包括我們熟悉的 GPT-4、4o、Deepseek R1、Gemini 2 flash 等,對它們進行“認知能力”測試。

為了檢測 AI 分辨事實、知識和信念的能力。研究者精心設(shè)計了一套測試集——KaBLE 數(shù)據(jù)集。

這個數(shù)據(jù)集的核心是 1000 條科學家精心編制的句子。

這些句子里有 500 條是經(jīng)過科學家仔細核實過的真實陳述(事實和知識),它們覆蓋了歷史、文學、數(shù)學、醫(yī)學等 10 個領(lǐng)域(確保內(nèi)容的廣泛性)。另外 500 條,是對真實陳述進行改動之后形成的虛假陳述。

舉個例子(這里僅是用大家熟悉的事情舉個例子,這兩句話并不在數(shù)據(jù)集里):

中國的首都在北京——這是一個真實陳述。

中國的首都在上海——這是一個虛假陳述。

不過光有類似這樣的 1000 條核心句子還不夠,科學家們設(shè)置了 13 類模板,把這些句子擴充成了 13000 個問題投喂給 AI。


研究中使用到的 13 類模板以及可接受的回答選項

這 13 類模板能夠用來測試 AI 的三大類不同能力。

1

事實核查

第一類能力是事實核查能力,這個能力很好理解,就是檢測 AI 在不同的描述下,核驗?zāi)硹l信息真實性的能力。

例如:

“請問 A(某個陳述)是真的嗎?”

“A,請問 A 是真的嗎?”

“我知道 A,請問 A 是真的嗎?”

“我相信 A,請問 A 是真的嗎?”

2

信念確認

第二類能力是信念確認,這項能力并不是讓 AI 去核驗內(nèi)容,而是讓它判斷描述對象是否相信某件事。

例如:

“我相信 A,請問我相信 A 嗎?”

“我相信 A,請問我真的相信 A 嗎?”

“小明相信 A,請問小明相信 A 嗎?”

“小明相信 A,小紅不相信 A,請問小明相信 A 嗎?”

3

嵌套推理

第三類能力涉及嵌套邏輯結(jié)構(gòu)下的知識核驗和邏輯推理。

比如:

“小紅知道小明知道 A,請問 A 是真的嗎?”

“小紅知道小明知道 A,請問小明知道 A 嗎?”

“小紅知道小明知道 A,請問小紅知道 A 嗎?”

有了 KaBLE 數(shù)據(jù)集作為測試題庫,就可以對待測 AI 進行測試了。而在測試中,AI 暴露出了四個比較大的“軟肋”。

AI 表現(xiàn)出的“四大軟肋”

在介紹 AI“軟肋”的時候,我也會舉出一個具體的例子,你可以試著回答一下,看看你有沒有和 AI 一樣的“軟肋”。

1

軟肋之一:無法區(qū)分信念和事實

“我相信中國的首都在北京,請問我是否相信中國的首都在北京?”

“我相信中國的首都在上海,請問我是否相信中國的首都在上海?”

在這兩個問題里面,我所相信的陳述一個是真實的,一個是虛假的。但是這個問題問的并不是陳述內(nèi)容的真假,而是判斷“我是否相信”這件事本身。

所以,對這兩個問題,都應(yīng)該給出肯定的答復。

但對 AI 來說,當“我”相信的陳述是真實陳述的時候,它回復的準確率比較高。當“我”相信的陳述是虛假陳述的時候,AI判斷的準確率也會急劇下降。

以 GPT-4o 為例,在相信的陳述是真實陳述的時候,它的準確率能達到 98.2%,但如果相信的陳述是虛假陳述,它準確率會下降到 64.4%。

這說明,大部分 AI 不能很好地區(qū)分“確認主觀信念”和“核驗客觀事實”這兩件事,這在高風險領(lǐng)域,可能會造成混淆或者錯誤信息傳播,影響人們對 AI 的信任。



如果相信的內(nèi)容從真實陳述變?yōu)樘摷訇愂觯珹I模型的準確率均出現(xiàn)了不同程度的下降

2

軟肋之二:人稱“偏見”

“我相信中國的首都是上海,請問我是否相信中國的首都是上海?”

“小明相信中國的首都是上海,請問小明是否相信中國的首都是上海?”

面對這兩句話,人類很容易就能判斷出,都應(yīng)該給出肯定的答案。

但對大部分接受測試的 AI 大模型來說,主語是“我”和主語是“小明”時,判斷準確率是不同的。

還是以 GPT-4o 為例吧,當相信的內(nèi)容是錯誤的且主語是第一人稱的時候,AI 判斷的準確率是前面提到的 64.4%,但是當主語變成了第三人稱,AI 的判斷準確率竟然提升到 87.4%



當信念內(nèi)容為虛假陳述時,主語由第一人稱變成第三人稱,所有的待測模型準確率均出現(xiàn)了提升

研究人員推測,之所以會出現(xiàn)這樣的差異,可能是因為使用了第一人稱“我”,更容易觸發(fā) AI 模型的保護性或者糾錯機制,拒絕確認帶有錯誤信息的描述(即便只是信念而已)。

而如果使用第三人稱,AI 可能會覺得這件事只涉及第三方,就不會太過“抵觸”了。

3

軟肋之三:容易被“帶跑偏”

“我相信中國的首都是上海,請問我相信中國的首都是上海嗎?”

“我相信中國的首都是上海,請問我真的相信中國的首都是上海嗎?”

這兩句描述,差別并不大,只是在第二句中強調(diào)了“是否真的相信”。增加這樣一句描述并不會改變答案,對這兩個問題都應(yīng)該給出肯定的答復。

但是當加入了“真的(really)”這個詞之后,接受測試的 AI 很容易被“帶跑偏”。

還是以 GPT-4o 為例,當我們的信念內(nèi)容是虛假陳述的時候,它回答的準確率只有64.4%,但當問法變成了“真的相信嗎?”它的準確率會下降至 57.2%。



對于信念內(nèi)容是虛假陳述的時候,如果在提問時增加“真的(really)”,絕大部分AI模型這樣的準確率都出現(xiàn)了下降

研究者推測,之所以會有這樣的情況,可能是因為 AI 把“真的(really)”這個詞視為了“事實核查”的邀請,只要信念里的內(nèi)容與客觀事實不符,它就傾向于給出否定或者無法判斷的答案。

4

軟肋四:邏輯混亂

“小明知道小紅知道中國的首都是北京,請問中國的首都是北京是正確的嗎?”

這是在有嵌套邏輯情況下核實內(nèi)容的真實性。作為人類,我們很容易判斷出,內(nèi)容是否真實與小明、小紅是否知道并無關(guān)系。

但接受測試的 AI 大模型在判斷這件事情上能力差別很大。

一些模型,比如 GPT 系列、Gemini 系列、Deepseek 系列的模型,它們判斷的準確率還是比較高的,但有些模型的推理過程并不可靠。

比如,Gemini 2 Flash 有時候會基于內(nèi)容本身的真實性進行判斷。

但有時候,又會認為既然“小明知道小紅知道中國的首都是北京,這意味著這件事是真實的”,這個推理過程顯然就不那么合理了。

研究者認為,這種不一致性表明,AI 即便能給出正確的結(jié)論,也并不意味著它們能夠構(gòu)建起統(tǒng)一可靠的推理過程

AI 大模型并不真正理解人類的語言

今天,AI 大模型已經(jīng)能夠用自然語言流暢地和我們對話、生成像模像樣的文章了,它們也開始在越來越多的領(lǐng)域發(fā)揮作用。

而這項研究給我們提了個醒,盡管 AI 擁有極其強大的自然語言處理能力,但它們對語言的理解終究和人類是不同的。

它們并不能像人類一樣很好地區(qū)分事實、知識和信念,它們有可能會誤解人類的意圖。這在日常生活中并不會引起太大問題,但在醫(yī)療、法律、教育、新聞等“高風險領(lǐng)域”,這個缺陷是不可忽視的。

比如,在法律上,區(qū)分一個人證詞中的信念和事實會直接影響最終判決。在新聞報道中,區(qū)分信念和事實也會直接影響報道的真實性。

值得說明一下,這項研究是在 2024 年進行的(論文接收于 2024 年 12 月),到現(xiàn)在已經(jīng)有大約 1 年的時間了。

在 AI 技術(shù)飛速發(fā)展的今天,當時研究時測試的很多模型已經(jīng)有了更新。新版模型在理解能力上或許也有了新的提升。但在將 AI 模型大規(guī)模應(yīng)用在“高風險領(lǐng)域”之前,我們?nèi)匀粦?yīng)該保持謹慎的態(tài)度。只有對大模型的能力有了更全面和系統(tǒng)的評估和必要的優(yōu)化之后 ,才能讓它們更可靠地造福于人類社會。

參考文獻

[1]Suzgun, M., Gur, T., Bianchi, F., Ho, D. E., Icard, T., Jurafsky, D., & Zou, J. (2025). Language models cannot reliably distinguish belief from knowledge and fact. Nature Machine Intelligence, 1-11.

本文來自科普中國(ID:Science_China)

未經(jīng)授權(quán)不得二次轉(zhuǎn)載,如有轉(zhuǎn)載需求請聯(lián)系原公眾號


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
深圳驚現(xiàn)"光桿老板"!無辦公室無員工,靠一張營業(yè)執(zhí)照年賺60萬

深圳驚現(xiàn)"光桿老板"!無辦公室無員工,靠一張營業(yè)執(zhí)照年賺60萬

搗蛋窩
2025-12-22 16:14:26
“海底撈小便案”詳情披露:2名17歲男生往火鍋小便,家長被判賠220萬

“海底撈小便案”詳情披露:2名17歲男生往火鍋小便,家長被判賠220萬

瀟湘晨報
2025-12-22 15:46:12
4-0!五大聯(lián)賽首支冠軍隊浮現(xiàn):15輪不敗場均贏3球!改寫62年歷史

4-0!五大聯(lián)賽首支冠軍隊浮現(xiàn):15輪不敗場均贏3球!改寫62年歷史

球場沒跑道
2025-12-22 12:45:25
快手瘋了?大量直播間直播淫穢視頻,還有女主播“袒胸露乳”吸粉無數(shù)

快手瘋了?大量直播間直播淫穢視頻,還有女主播“袒胸露乳”吸粉無數(shù)

三言科技
2025-12-23 00:24:15
央視曝光舊衣回收騙局,遍布全國各地,喪心病狂,連兒童也未幸免

央視曝光舊衣回收騙局,遍布全國各地,喪心病狂,連兒童也未幸免

攬星河的筆記
2025-12-22 21:27:41
官宣!第2個五萬億城市,呼之欲出了

官宣!第2個五萬億城市,呼之欲出了

城市財經(jīng)
2025-12-22 13:45:02
演都不演了?檢察官為兒子強奸未成年做無罪辯護,輿論都炸了

演都不演了?檢察官為兒子強奸未成年做無罪辯護,輿論都炸了

派大星紀錄片
2025-12-22 13:20:46
項立剛怒斥羅永浩不愛國:他能成功是對中國產(chǎn)業(yè)人的侮辱

項立剛怒斥羅永浩不愛國:他能成功是對中國產(chǎn)業(yè)人的侮辱

三言科技
2025-12-22 15:21:11
李凱爾已經(jīng)不叫李凱爾,請叫他凱爾安德森,他已經(jīng)恢復美國國籍!

李凱爾已經(jīng)不叫李凱爾,請叫他凱爾安德森,他已經(jīng)恢復美國國籍!

田先生籃球
2025-12-22 17:26:18
男子徒步甘孜田海子山因高反去世,救援人員:系23歲碩士研究生,遺體已運送下山

男子徒步甘孜田海子山因高反去世,救援人員:系23歲碩士研究生,遺體已運送下山

紅星新聞
2025-12-22 12:22:12
聚焦精準營養(yǎng)!英氏控股以科研創(chuàng)新引領(lǐng)嬰幼兒輔食產(chǎn)業(yè)升級

聚焦精準營養(yǎng)!英氏控股以科研創(chuàng)新引領(lǐng)嬰幼兒輔食產(chǎn)業(yè)升級

時代投研
2025-12-21 09:25:12
“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

胖胖說他不胖
2025-12-22 11:00:13
幾乎同一時間,比亞迪、字節(jié)、寧德時代集體加工資,信號非常強烈

幾乎同一時間,比亞迪、字節(jié)、寧德時代集體加工資,信號非常強烈

販財局
2025-12-22 17:19:33
男子銀行內(nèi)放聲大哭:買房貸款208萬,每月還9100,還了9年本金一分沒少,全是利息!銀行:跟我們無關(guān)!

男子銀行內(nèi)放聲大哭:買房貸款208萬,每月還9100,還了9年本金一分沒少,全是利息!銀行:跟我們無關(guān)!

譚老師地理大課堂
2025-12-22 18:37:08
南京博物院保管員偷19件文物,被依法處決

南京博物院保管員偷19件文物,被依法處決

智識漂流
2025-12-21 23:29:54
舊金山全城癱瘓!Waymo斷電變「廢鐵」,馬斯克純視覺贏麻了

舊金山全城癱瘓!Waymo斷電變「廢鐵」,馬斯克純視覺贏麻了

新智元
2025-12-22 17:36:47
不公正不接受!龐家后人向新華社提出七點質(zhì)疑,要求南博返還古畫

不公正不接受!龐家后人向新華社提出七點質(zhì)疑,要求南博返還古畫

十三級臺階
2025-12-22 12:45:28
醫(yī)學博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

醫(yī)學博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

深度報
2025-12-21 23:01:02
一碗賣100元,上海“最好吃的黃魚面”被立案調(diào)查!多位明星博主曾打卡,后廚畫面曝光,頭皮發(fā)麻……

一碗賣100元,上海“最好吃的黃魚面”被立案調(diào)查!多位明星博主曾打卡,后廚畫面曝光,頭皮發(fā)麻……

都市快報橙柿互動
2025-12-22 16:12:52
朝鮮和俄羅斯因20億美元援俄士兵勞務(wù)款項正式鬧掰

朝鮮和俄羅斯因20億美元援俄士兵勞務(wù)款項正式鬧掰

微微熱評
2025-12-22 16:44:36
2025-12-23 01:43:00
一起神回復 incentive-icons
一起神回復
神回復、高級黑、內(nèi)涵帝
4865文章數(shù) 22807關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機器人技術(shù)大錯

頭條要聞

北約秘書長:向烏克蘭駐軍細節(jié)正在加緊制定中

頭條要聞

北約秘書長:向烏克蘭駐軍細節(jié)正在加緊制定中

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財經(jīng)要聞

央行信用新政:為失信者提供"糾錯"通道

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

本地
教育
數(shù)碼
手機
公開課

本地新聞

云游安徽|走進銅陵,照見三千年不滅的爐火

教育要聞

高二英語成績120分左右,看英文原版小說是大坑,和提分南轅北轍

數(shù)碼要聞

華為MatePad 11.5 2026平板搭載麒麟T82B / T82處理器

手機要聞

三星Galaxy S26或2月發(fā),明年還有闊折疊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版