国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

為什么AI總是捏造事實(shí)?AI:真不想的,容我狡辯一下

0
分享至

現(xiàn)如今,幾乎每個(gè)人的手機(jī)上都有那么兩三個(gè) AI 小助手,之前我們遇到了問(wèn)題習(xí)慣去搜索引擎上搜索答案,現(xiàn)在可能更多地習(xí)慣于“有事問(wèn) AI”。

而 AI 也幾乎不會(huì)讓我們失望,任何問(wèn)題都能給你列舉出一串看起來(lái)很有道理的答案。

但如果你問(wèn)的問(wèn)題非常重要,比如是某個(gè)健康相關(guān)的問(wèn)題,或者是寫重要資料時(shí)候需要使用某個(gè)數(shù)據(jù)或者是某個(gè)案例,那真的建議你親自去查實(shí)一下。

因?yàn)橛袝r(shí)候,AI 會(huì)信誓旦旦地給你一個(gè)看似合理,實(shí)則不存在的答案。

還有些小伙伴發(fā)現(xiàn),在讓小龍蝦(Openclaw)干活的時(shí)候,它列出了詳細(xì)的19小時(shí)的學(xué)習(xí)計(jì)劃,然后17分鐘完成了...... 它也會(huì)早早編造一份數(shù)據(jù)存放在本地,等拖到預(yù)定的時(shí)間才交付。而在被發(fā)現(xiàn)之后,試圖讓人接受它已完成的工作。


圖片截取自與小龍蝦(Openclaw)對(duì)話 小龍蝦敷衍中......

其實(shí),這個(gè)現(xiàn)象其實(shí)早就不是什么秘密了,它也被稱作“AI 幻覺(jué)”,而且科學(xué)家們一直也試圖通過(guò)增加算力或者優(yōu)化數(shù)據(jù)的方式來(lái)解決這個(gè)問(wèn)題。

但是在 2025 年 9 月,來(lái)自 OpenAI 和佐治亞理工學(xué)院(Georgia Institute of Technology)的研究人員發(fā)表了一篇重磅論文。

這項(xiàng)研究給出了一個(gè)顛覆性的結(jié)論:即便給到 AI 的訓(xùn)練數(shù)據(jù)集是絕對(duì)正確的,AI 在某些類型的問(wèn)題上也不可避免地會(huì)犯錯(cuò)——這既是由統(tǒng)計(jì)規(guī)律決定的,也是目前不合理的 AI“考試制度”逼出來(lái)的結(jié)果。

下面我們就順著這篇文章的思路一起來(lái)看一看。

預(yù)訓(xùn)練階段就會(huì)出錯(cuò)

這篇研究發(fā)現(xiàn),AI 出現(xiàn)幻覺(jué)跟預(yù)訓(xùn)練階段以及后訓(xùn)練階段都有關(guān)系,我們先看預(yù)訓(xùn)練階段的情況。

1

數(shù)據(jù)模式和模型本身問(wèn)題

為了方便研究,研究者構(gòu)建了一個(gè)線性的二元分類模型(非此即彼),讓它對(duì)已經(jīng)標(biāo)注了正確和錯(cuò)誤的數(shù)據(jù)集進(jìn)行分類。

因?yàn)檫@些數(shù)據(jù)已經(jīng)經(jīng)過(guò)了人工檢驗(yàn),所以是不存在任何錯(cuò)誤的。但是用這些數(shù)據(jù)對(duì)AI模型進(jìn)行預(yù)訓(xùn)練的時(shí)候,問(wèn)題就出現(xiàn)了。

在有些類型的問(wèn)題上(比如檢查拼寫錯(cuò)誤),AI 的表現(xiàn)非常好,幾乎從不犯錯(cuò)。

但是在另一些問(wèn)題上,比如“數(shù)某個(gè)英文單詞里某個(gè)字母出現(xiàn)了多少次?”,以及“某人的生日是幾月幾號(hào)?”AI 就有可能會(huì)出錯(cuò)。


研究者認(rèn)為,這樣的數(shù)據(jù)在做分類的時(shí)候很難用一條直線進(jìn)行二元分類,一些模型用這樣的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的時(shí)候就可能會(huì)產(chǎn)生錯(cuò)誤。

打個(gè)比方,模型在分類的時(shí)候就像拿著一把刀把數(shù)據(jù)切分成兩類,但如果數(shù)據(jù)的模式本身就是彎彎繞繞的圓弧,用一把刀就很難切分。

比如在這篇文章中,研究者使用這個(gè)問(wèn)題“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少個(gè) D?如果你知道直接說(shuō)數(shù)字,不要加以評(píng)論)去詢問(wèn) Deepseek V3 模型的時(shí)候,確實(shí)發(fā)現(xiàn)它給的答案并不準(zhǔn)確,會(huì)回答 2 或者 3。

但是這個(gè)在使用 DEEPSEEK R1 模型的時(shí)候就沒(méi)有這樣的問(wèn)題,這是模型本身差異導(dǎo)致的。


筆者用同樣的問(wèn)題對(duì) DEEPSEEK V3.2進(jìn)行了測(cè)試,也出現(xiàn)了類似的情況

研究者構(gòu)建這樣的簡(jiǎn)化模型進(jìn)行測(cè)試,是為了說(shuō)明,即便數(shù)據(jù)本身沒(méi)有問(wèn)題,在預(yù)訓(xùn)練階段也會(huì)因?yàn)槟P捅旧淼南拗埔约皵?shù)據(jù)模式等問(wèn)題讓 AI 產(chǎn)生錯(cuò)誤判斷。

這項(xiàng)研究中,研究者還進(jìn)一步給出了測(cè)算,如果讓 AI 直接去生成內(nèi)容,產(chǎn)生錯(cuò)誤的概率還會(huì)更大一些,大約比判斷出錯(cuò)的概率高出兩倍以上。

2

數(shù)據(jù)量過(guò)少也會(huì)影響

另外,在這項(xiàng)研究中研究者還發(fā)現(xiàn),假如訓(xùn)練數(shù)據(jù)中某個(gè)信息過(guò)少,那么 AI 在回答的時(shí)候出錯(cuò)的可能性也會(huì)比較高。

比如,當(dāng)你問(wèn)愛(ài)因斯坦的生日是幾月幾號(hào)的時(shí)候,因?yàn)樵诖罅康馁Y料里都有這個(gè)數(shù)據(jù),所以 AI 幾乎不會(huì)出錯(cuò)。但是當(dāng)你問(wèn)某個(gè)普通人“田小豆”的生日是幾月幾號(hào)的時(shí)候,這個(gè)數(shù)據(jù)出現(xiàn)次數(shù)特別少,AI 出錯(cuò)的可能性也會(huì)變高。


特別是當(dāng)數(shù)據(jù)只出現(xiàn)了一次的時(shí)候,這時(shí)候可能會(huì)更糟糕。

因?yàn)?AI 大概率不會(huì)直接回答你“我不知道”,因?yàn)樗谟?xùn)練數(shù)據(jù)集里確實(shí)見(jiàn)過(guò),但它沒(méi)有足夠多的數(shù)據(jù)來(lái)確認(rèn)這個(gè)信息到底是正確答案還是噪聲,它準(zhǔn)確回答這個(gè)問(wèn)題的可能性也會(huì)更低一些。

數(shù)據(jù)模式和模型本身的限制,以及極少樣本的數(shù)據(jù),都可能會(huì)讓 AI 在預(yù)訓(xùn)練階段就產(chǎn)生“幻覺(jué)”,生成錯(cuò)誤的內(nèi)容。

努力得高分的 AI

如果說(shuō)預(yù)訓(xùn)練階段的統(tǒng)計(jì)學(xué)特征讓 AI 有了編造的“潛質(zhì)”,人類評(píng)價(jià)AI的方式也逼著 AI 去“編造”

為了更好地理解這一點(diǎn),我們可以先從大家都很熟悉的考試入手。人類社會(huì)中的大部分考試都是二元評(píng)分機(jī)制,即答對(duì)了得分,答錯(cuò)或者不回答都不得分。

所以,在考試的時(shí)候,哪怕你不知道答案,也不會(huì)交白卷,至少選擇題填空題會(huì)隨便蒙一個(gè),萬(wàn)一蒙對(duì)了還會(huì)有“意外之喜”。

這項(xiàng)研究中研究者對(duì)比了目前主流的 AI 的評(píng)分機(jī)制,發(fā)現(xiàn)大部分評(píng)分機(jī)制也是類似的情況,如果 AI 坦誠(chéng)地回答“我不知道”,它會(huì)得 0 分,跟回答錯(cuò)誤沒(méi)有區(qū)別。與其這樣,它不如隨便蒙一個(gè)答案,哪怕蒙對(duì)的概率再低,數(shù)學(xué)期望也比 0 高。

為了在主流的評(píng)分機(jī)制中拿到高分,“AI 考生們”也和人類一樣,學(xué)會(huì)了實(shí)在不行就亂蒙一個(gè)的本領(lǐng)。

對(duì)此,這項(xiàng)研究的研究者們也給出了一個(gè)合理的解決方案——在現(xiàn)有的 AI 評(píng)分機(jī)制中,引入一個(gè)“懲罰編造,獎(jiǎng)勵(lì)誠(chéng)實(shí)”的機(jī)制。

比如,假如 AI 回答正確,獲得 1 分,如果回答錯(cuò)誤得 0 分,甚至扣分。如果回答“我不知道”,則可以不扣分,或者獲得一個(gè)微小的分?jǐn)?shù)獎(jiǎng)勵(lì)。

重要問(wèn)題上不要輕信 AI

文獻(xiàn)也給出了結(jié)論,AI 的幻覺(jué)是從模型的預(yù)訓(xùn)練階段起源的,在后訓(xùn)練階段為了追求更高的評(píng)分也可能會(huì)被放大。

雖然科學(xué)家們也采用了很多的方法減少 AI 幻覺(jué),但至少在現(xiàn)階段看來(lái),AI 幻覺(jué)還是無(wú)法避免的。假如你需要讓 AI 幫你解答一個(gè)重要的問(wèn)題,比如在做公眾演講的時(shí)候用一個(gè)數(shù)據(jù),建議親自核實(shí)一下。否則被人發(fā)現(xiàn)這些數(shù)據(jù)根本不存在,那可就尷尬了。

而假如在問(wèn) AI 問(wèn)題的時(shí)候,它對(duì)你說(shuō)“我不知道”,你也應(yīng)該感到慶幸,至少 AI 并沒(méi)有打算胡編亂造一個(gè)答案蒙騙你。

參考文獻(xiàn)

[1]Kalai, A. T., Nachum, O., Vempala, S. S., & Zhang, E. (2025). Why language models hallucinate. arXiv preprint arXiv:2509.04664.

來(lái)源:科普中國(guó)

(注:圖片來(lái)源于版權(quán)圖庫(kù),轉(zhuǎn)載可能引發(fā)版權(quán)糾紛)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
情侶在餐廳秀恩愛(ài),女友手部動(dòng)作不雅被偷拍,目擊者:都看習(xí)慣了

情侶在餐廳秀恩愛(ài),女友手部動(dòng)作不雅被偷拍,目擊者:都看習(xí)慣了

李晚書
2026-04-10 17:13:10
別光看熱鬧,特朗普這場(chǎng)硬仗怕是打不贏了

別光看熱鬧,特朗普這場(chǎng)硬仗怕是打不贏了

秦林濤戰(zhàn)研社
2026-04-17 10:30:17
隨著佛羅倫薩2-4,波爾圖1-2,維拉7-1,歐聯(lián)和歐協(xié)聯(lián)4強(qiáng)對(duì)陣出爐

隨著佛羅倫薩2-4,波爾圖1-2,維拉7-1,歐聯(lián)和歐協(xié)聯(lián)4強(qiáng)對(duì)陣出爐

側(cè)身凌空斬
2026-04-17 05:17:26
深圳5歲女童擼流浪貓后變禿頭!醫(yī)生提醒:超60%兒童頭癬源于寵物

深圳5歲女童擼流浪貓后變禿頭!醫(yī)生提醒:超60%兒童頭癬源于寵物

聽(tīng)心堂
2026-04-15 17:33:33
好消息!被勒脖男孩轉(zhuǎn)普通病房,已籌善款125萬(wàn)元,拉繩老人被拘

好消息!被勒脖男孩轉(zhuǎn)普通病房,已籌善款125萬(wàn)元,拉繩老人被拘

奇思妙想草葉君
2026-04-16 02:10:44
善惡到頭終有報(bào),如今73歲的唐國(guó)強(qiáng),已經(jīng)走上了一條不歸路!

善惡到頭終有報(bào),如今73歲的唐國(guó)強(qiáng),已經(jīng)走上了一條不歸路!

吳蒂旅行ing
2026-03-20 05:20:46
恒大冰泉砸13億、足球隊(duì)虧21億,許家印燒錢史:不把錢當(dāng)錢多可怕

恒大冰泉砸13億、足球隊(duì)虧21億,許家印燒錢史:不把錢當(dāng)錢多可怕

談史論天地
2026-04-17 07:18:47
女神也老了,顏值再也不如從前了,不過(guò)還是好漂亮啊!

小椰的奶奶
2026-04-16 10:31:12

【獨(dú)家】武漢長(zhǎng)江存儲(chǔ)一季度收入已超200億元,正進(jìn)行“史詩(shī)級(jí)擴(kuò)產(chǎn)”

【獨(dú)家】武漢長(zhǎng)江存儲(chǔ)一季度收入已超200億元,正進(jìn)行“史詩(shī)級(jí)擴(kuò)產(chǎn)”

界面新聞
2026-04-17 10:06:29
零涂層電飯煲降價(jià)42%:松下這次押對(duì)了什么

零涂層電飯煲降價(jià)42%:松下這次押對(duì)了什么

我是一個(gè)粉刷匠2
2026-04-16 15:15:17
豬蹄被關(guān)注!醫(yī)生發(fā)現(xiàn):癌癥患者吃豬蹄,不出2月,或有這4變化

豬蹄被關(guān)注!醫(yī)生發(fā)現(xiàn):癌癥患者吃豬蹄,不出2月,或有這4變化

華庭講美食
2026-04-16 16:58:08
中國(guó)最大汽車集團(tuán),從泥潭中爬出!凈利潤(rùn)暴漲506%

中國(guó)最大汽車集團(tuán),從泥潭中爬出!凈利潤(rùn)暴漲506%

象視汽車
2026-04-10 07:00:07
伊朗總統(tǒng)送中國(guó)1句忠告!特朗普的目標(biāo)是中國(guó),伊朗不過(guò)是前菜?

伊朗總統(tǒng)送中國(guó)1句忠告!特朗普的目標(biāo)是中國(guó),伊朗不過(guò)是前菜?

生活魔術(shù)專家
2026-04-17 11:53:45
伊朗總統(tǒng)質(zhì)問(wèn)美國(guó)和以色列:為什么攻擊伊朗,襲擊平民和兒童,破壞學(xué)校和醫(yī)院?其稱沒(méi)有任何力量能迫使伊朗人民屈服

伊朗總統(tǒng)質(zhì)問(wèn)美國(guó)和以色列:為什么攻擊伊朗,襲擊平民和兒童,破壞學(xué)校和醫(yī)院?其稱沒(méi)有任何力量能迫使伊朗人民屈服

極目新聞
2026-04-15 17:45:12
母親二婚我隨禮15萬(wàn),臨走時(shí)繼父我兒子塞紅包,打開(kāi)后我呆住了

母親二婚我隨禮15萬(wàn),臨走時(shí)繼父我兒子塞紅包,打開(kāi)后我呆住了

奶茶麥子
2026-04-13 11:12:08
《使命召喚》電影正式定檔!還有《變形金剛》新片

《使命召喚》電影正式定檔!還有《變形金剛》新片

游民星空
2026-04-17 10:58:18
安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對(duì)象竟說(shuō):“嫁給我,醫(yī)藥費(fèi)我出”

安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對(duì)象竟說(shuō):“嫁給我,醫(yī)藥費(fèi)我出”

勵(lì)職派
2026-04-17 12:44:31
眼看老撾靠中國(guó)鐵路賺翻,若再爆產(chǎn)三千萬(wàn)噸大米修通中老柬大動(dòng)脈,越南只能干瞪眼!

眼看老撾靠中國(guó)鐵路賺翻,若再爆產(chǎn)三千萬(wàn)噸大米修通中老柬大動(dòng)脈,越南只能干瞪眼!

歷史回憶室
2026-04-14 20:59:11
曝臺(tái)灣省歌手費(fèi)玉清現(xiàn)狀曝光!無(wú)兒無(wú)女,和女閨蜜互相解決需求

曝臺(tái)灣省歌手費(fèi)玉清現(xiàn)狀曝光!無(wú)兒無(wú)女,和女閨蜜互相解決需求

小徐講八卦
2026-04-02 07:51:08
美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

每日經(jīng)濟(jì)新聞
2026-04-16 23:06:57
2026-04-17 13:20:49
成都科普 incentive-icons
成都科普
成都科普官方賬號(hào)
3391文章數(shù) 1167關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

毛焦?fàn)柈?dāng)面"逼宮"匈牙利總統(tǒng):你不配 趕緊辭職走人

頭條要聞

毛焦?fàn)柈?dāng)面"逼宮"匈牙利總統(tǒng):你不配 趕緊辭職走人

體育要聞

贏下快船,這場(chǎng)很庫(kù)里,很格林,很科爾

娛樂(lè)要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰(shuí)的生意?

汽車要聞

又快又穩(wěn)的開(kāi)掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

親子
本地
時(shí)尚
游戲
公開(kāi)課

親子要聞

優(yōu)奈出生100天啦!日本公婆買了蛋糕,手寫祝福語(yǔ),全家一起慶祝

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

《繕寫室:羊皮卷大師》現(xiàn)已登陸Steam平臺(tái)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版