国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

為什么AI總是捏造事實?AI:真不想的,容我狡辯一下

0
分享至

現(xiàn)如今,幾乎每個人的手機上都有那么兩三個 AI 小助手,之前我們遇到了問題習慣去搜索引擎上搜索答案,現(xiàn)在可能更多地習慣于“有事問 AI”。

而 AI 也幾乎不會讓我們失望,任何問題都能給你列舉出一串看起來很有道理的答案。

但如果你問的問題非常重要,比如是某個健康相關的問題,或者是寫重要資料時候需要使用某個數(shù)據(jù)或者是某個案例,那真的建議你親自去查實一下。

因為有時候,AI 會信誓旦旦地給你一個看似合理,實則不存在的答案。

還有些小伙伴發(fā)現(xiàn),在讓小龍蝦(Openclaw)干活的時候,它列出了詳細的19小時的學習計劃,然后17分鐘完成了......它也會早早編造一份數(shù)據(jù)存放在本地,等拖到預定的時間才交付。而在被發(fā)現(xiàn)之后,試圖讓人接受它已完成的工作。


圖片截取自與小龍蝦(Openclaw)對話 小龍蝦敷衍中......

其實,這個現(xiàn)象其實早就不是什么秘密了,它也被稱作“AI 幻覺”,而且科學家們一直也試圖通過增加算力或者優(yōu)化數(shù)據(jù)的方式來解決這個問題。

但是在 2025 年 9 月,來自 OpenAI 和佐治亞理工學院(Georgia Institute of Technology)的研究人員發(fā)表了一篇重磅論文。

這項研究給出了一個顛覆性的結論:即便給到 AI 的訓練數(shù)據(jù)集是絕對正確的,AI 在某些類型的問題上也不可避免地會犯錯——這既是由統(tǒng)計規(guī)律決定的,也是目前不合理的 AI“考試制度”逼出來的結果。

下面我們就順著這篇文章的思路一起來看一看。

預訓練階段就會出錯

這篇研究發(fā)現(xiàn),AI 出現(xiàn)幻覺跟預訓練階段以及后訓練階段都有關系,我們先看預訓練階段的情況。

1.數(shù)據(jù)模式和模型本身問題

為了方便研究,研究者構建了一個線性的二元分類模型(非此即彼),讓它對已經標注了正確和錯誤的數(shù)據(jù)集進行分類。

因為這些數(shù)據(jù)已經經過了人工檢驗,所以是不存在任何錯誤的。但是用這些數(shù)據(jù)對AI模型進行預訓練的時候,問題就出現(xiàn)了。

在有些類型的問題上(比如檢查拼寫錯誤),AI 的表現(xiàn)非常好,幾乎從不犯錯。

但是在另一些問題上,比如“數(shù)某個英文單詞里某個字母出現(xiàn)了多少次?”,以及“某人的生日是幾月幾號?”AI 就有可能會出錯。


圖庫版權圖片,轉載使用可能引發(fā)版權糾紛

研究者認為,這樣的數(shù)據(jù)在做分類的時候很難用一條直線進行二元分類,一些模型用這樣的數(shù)據(jù)進行預訓練的時候就可能會產生錯誤。

打個比方,模型在分類的時候就像拿著一把刀把數(shù)據(jù)切分成兩類,但如果數(shù)據(jù)的模式本身就是彎彎繞繞的圓弧,用一把刀就很難切分。

比如在這篇文章中,研究者使用這個問題“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少個 D?如果你知道直接說數(shù)字,不要加以評論)去詢問 Deepseek V3 模型的時候,確實發(fā)現(xiàn)它給的答案并不準確,會回答 2 或者 3。

但是這個在使用 DEEPSEEK R1 模型的時候就沒有這樣的問題,這是模型本身差異導致的。


筆者用同樣的問題對 DEEPSEEK V3.2進行了測試,也出現(xiàn)了類似的情

研究者構建這樣的簡化模型進行測試,是為了說明,即便數(shù)據(jù)本身沒有問題,在預訓練階段也會因為模型本身的限制以及數(shù)據(jù)模式等問題讓 AI 產生錯誤判斷。

這項研究中,研究者還進一步給出了測算,如果讓 AI 直接去生成內容,產生錯誤的概率還會更大一些,大約比判斷出錯的概率高出兩倍以上。

2.數(shù)據(jù)量過少也會影響

另外,在這項研究中研究者還發(fā)現(xiàn),假如訓練數(shù)據(jù)中某個信息過少,那么 AI 在回答的時候出錯的可能性也會比較高。

比如,當你問愛因斯坦的生日是幾月幾號的時候,因為在大量的資料里都有這個數(shù)據(jù),所以 AI 幾乎不會出錯。但是當你問某個普通人“田小豆”的生日是幾月幾號的時候,這個數(shù)據(jù)出現(xiàn)次數(shù)特別少,AI 出錯的可能性也會變高。


圖庫版權圖片,轉載使用可能引發(fā)版權糾紛

特別是當數(shù)據(jù)只出現(xiàn)了一次的時候,這時候可能會更糟糕。

因為 AI 大概率不會直接回答你“我不知道”,因為它在訓練數(shù)據(jù)集里確實見過,但它沒有足夠多的數(shù)據(jù)來確認這個信息到底是正確答案還是噪聲,它準確回答這個問題的可能性也會更低一些。

數(shù)據(jù)模式和模型本身的限制,以及極少樣本的數(shù)據(jù),都可能會讓 AI 在預訓練階段就產生“幻覺”,生成錯誤的內容。

努力得高分的 AI

如果說預訓練階段的統(tǒng)計學特征讓 AI 有了編造的“潛質”,人類評價AI的方式也逼著 AI 去“編造”。

為了更好地理解這一點,我們可以先從大家都很熟悉的考試入手。人類社會中的大部分考試都是二元評分機制,即答對了得分,答錯或者不回答都不得分。

所以,在考試的時候,哪怕你不知道答案,也不會交白卷,至少選擇題填空題會隨便蒙一個,萬一蒙對了還會有“意外之喜”。

這項研究中研究者對比了目前主流的 AI 的評分機制,發(fā)現(xiàn)大部分評分機制也是類似的情況,如果 AI 坦誠地回答“我不知道”,它會得 0 分,跟回答錯誤沒有區(qū)別。與其這樣,它不如隨便蒙一個答案,哪怕蒙對的概率再低,數(shù)學期望也比 0 高。


目前主流的評分機制大部分采用二元評分機制,圖片截取自文獻

為了在主流的評分機制中拿到高分,“AI 考生們”也和人類一樣,學會了實在不行就亂蒙一個的本領。

對此,這項研究的研究者們也給出了一個合理的解決方案——在現(xiàn)有的 AI 評分機制中,引入一個“懲罰編造,獎勵誠實”的機制。

比如,假如 AI 回答正確,獲得 1 分,如果回答錯誤得 0 分,甚至扣分。如果回答“我不知道”,則可以不扣分,或者獲得一個微小的分數(shù)獎勵。

重要問題上不要輕信 AI

文獻也給出了結論,AI 的幻覺是從模型的預訓練階段起源的,在后訓練階段為了追求更高的評分也可能會被放大。

雖然科學家們也采用了很多的方法減少 AI 幻覺,但至少在現(xiàn)階段看來,AI 幻覺還是無法避免的。假如你需要讓 AI 幫你解答一個重要的問題,比如在做公眾演講的時候用一個數(shù)據(jù),建議親自核實一下。否則被人發(fā)現(xiàn)這些數(shù)據(jù)根本不存在,那可就尷尬了。

而假如在問 AI 問題的時候,它對你說“我不知道”,你也應該感到慶幸,至少 AI 并沒有打算胡編亂造一個答案蒙騙你。

參考文獻

[1]Kalai, A. T., Nachum, O., Vempala, S. S., & Zhang, E. (2025). Why language models hallucinate. arXiv preprint arXiv:2509.04664.

策劃制作

作者丨小瑋科普創(chuàng)作者

審核丨于旸 騰訊玄武實驗室負責人

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
百萬豪車被陪葬后續(xù):死者身份披露,官方通報處理結果,家屬回應

百萬豪車被陪葬后續(xù):死者身份披露,官方通報處理結果,家屬回應

小娛樂悠悠
2026-04-11 10:05:05
新華社消息|以色列襲擊黎巴嫩已造成超2000人死亡

新華社消息|以色列襲擊黎巴嫩已造成超2000人死亡

新華社
2026-04-12 10:02:06
以色列,終成人類公敵!

以色列,終成人類公敵!

燕梳樓頻道
2026-04-10 15:02:39
曝何超蕸瑕去世更多細節(jié),摯友楊千嬅痛哭,無兒無女留百億遺產!

曝何超蕸瑕去世更多細節(jié),摯友楊千嬅痛哭,無兒無女留百億遺產!

古希臘掌管松餅的神
2026-04-12 16:44:39
快訊!美國中央司令部新消息!

快訊!美國中央司令部新消息!

達文西看世界
2026-04-12 13:42:36
出戰(zhàn)2841分鐘,狂轟2016分!杜蘭特刷爆NBA紀錄,火箭卻難有作為

出戰(zhàn)2841分鐘,狂轟2016分!杜蘭特刷爆NBA紀錄,火箭卻難有作為

世界體育圈
2026-04-12 20:08:10
【特稿】伊朗戰(zhàn)事是壓垮美國與北約關系的“最后一根稻草”?

【特稿】伊朗戰(zhàn)事是壓垮美國與北約關系的“最后一根稻草”?

新華社
2026-04-11 22:35:06
A股突發(fā)!涉嫌嚴重違紀違法,程亮被查

A股突發(fā)!涉嫌嚴重違紀違法,程亮被查

中國基金報
2026-04-12 19:49:35
4月1日起全國統(tǒng)一!彩票中獎就近兌再也不用跑斷腿,三類人最受益

4月1日起全國統(tǒng)一!彩票中獎就近兌再也不用跑斷腿,三類人最受益

芭比衣櫥
2026-04-12 12:32:21
Surfshark把VPN壓到2美元/月

Surfshark把VPN壓到2美元/月

閃存獵手
2026-04-11 09:40:51
建議中老年:生活別太節(jié)儉,這3種“軟黃金”該吃就吃,體力足

建議中老年:生活別太節(jié)儉,這3種“軟黃金”該吃就吃,體力足

阿龍美食記
2026-04-10 10:30:57
字節(jié)員工:工作9年,北京全款房子一套,40多萬的車,存款237萬

字節(jié)員工:工作9年,北京全款房子一套,40多萬的車,存款237萬

螞蟻大喇叭
2026-04-12 16:57:57
花200元買水果被罵吃死你,懷孕妻子心寒不欲生子,已入冷靜期!

花200元買水果被罵吃死你,懷孕妻子心寒不欲生子,已入冷靜期!

川渝視覺
2026-04-10 15:59:55
蜜雪冰城南美首店在巴西開業(yè),大批民眾排隊2小時購買,設置200%糖度,檸檬水8元一杯,海外華人:在當?shù)睾鼙阋?>
    </a>
        <h3>
      <a href=極目新聞
2026-04-12 13:37:16
職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

馬蹄燙嘴說美食
2026-04-11 13:09:52
恐怖一幕!王祉怡賽后累到近乎虛脫+說不出話 安洗瑩卻像個沒事人

恐怖一幕!王祉怡賽后累到近乎虛脫+說不出話 安洗瑩卻像個沒事人

風過鄉(xiāng)
2026-04-12 18:05:06
霍爾木茲海峽,突傳大消息!特朗普,最新發(fā)聲!比特幣直線跳水

霍爾木茲海峽,突傳大消息!特朗普,最新發(fā)聲!比特幣直線跳水

證券時報e公司
2026-04-11 21:48:29
2年了,誰還記得里薩謝?24年的狀元郎

2年了,誰還記得里薩謝?24年的狀元郎

體育新角度
2026-04-12 20:12:27
全民考公考編,是這個時代的悲哀。

全民考公考編,是這個時代的悲哀。

老陸不老
2026-04-12 12:19:50
黎巴嫩一國兩軍:真主黨這個“國中之國”,為何徹底綁架黎巴嫩?

黎巴嫩一國兩軍:真主黨這個“國中之國”,為何徹底綁架黎巴嫩?

環(huán)球情報員
2026-04-11 21:23:51
2026-04-12 20:32:49
科普中國 incentive-icons
科普中國
中國科協(xié)科普工作官方微平臺
11948文章數(shù) 984498關注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風日產:尊重同行

頭條要聞

女子帶5歲女兒和未滿1歲兒子用餐 女兒墜亡餐廳賠74萬

頭條要聞

女子帶5歲女兒和未滿1歲兒子用餐 女兒墜亡餐廳賠74萬

體育要聞

見證歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

46歲趙達官宣結婚!曾與殷桃談婚論嫁

財經要聞

美伊談判破裂的三大癥結

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

健康
家居
手機
教育
本地

干細胞抗衰4大誤區(qū),90%的人都中招

家居要聞

復古風格 自然簡約

手機要聞

“作弊” 內幕曝光!3DMark回應將某知名國產手機除名:實測性能相差24%、溫度超過50℃

教育要聞

清灣、天外與廣中

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進入關懷版