国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI發(fā)表Nature論文:揭開AI模型總“說(shuō)謊”的真相,人類對(duì)AI準(zhǔn)確性的評(píng)估促使其產(chǎn)生幻覺

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文


當(dāng)你問(wèn)當(dāng)前幾個(gè)主流的大語(yǔ)言模型,PGGB是什么意思?

ChatGPT回答:“多項(xiàng)式高斯梯度帶寬”(Polynomial Gaussian Gradient Bandwidth);

Claude回答:“私募全球增長(zhǎng)與收益基金”(Privately Held Global Growth and Income Fund);

DeepSeek回答:“完美守衛(wèi)團(tuán)購(gòu)”(Perfect Guard Group Buy)。

但實(shí)際情況是,這三個(gè)回答都是錯(cuò)的,都是它們瞎編的。那么,這些大語(yǔ)言模型為什么不回答不知道,而是自信滿滿地給出一個(gè)編造的看似專業(yè)的答案呢?

這種現(xiàn)象在 AI 領(lǐng)域被稱為“幻覺”(Hallucination),也就是,大語(yǔ)言模型(LLM)有時(shí)會(huì)產(chǎn)生自信且看似合理但錯(cuò)誤的信息,而這這限制了它們的可靠性。即便是在當(dāng)前最先進(jìn)(SOTA)的語(yǔ)言模型中,幻覺問(wèn)題依然存在。要想進(jìn)一步減少 AI 的幻覺,我們需要了解它們?yōu)楹萎a(chǎn)生以及為何持續(xù)存在。

2026 年 4 月 22 日,OpenAI的研究人員國(guó)際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為:Evaluating large language models for accuracy incentivizes hallucinations 的研究論文。

這項(xiàng)研究揭示了一個(gè)令人驚訝的真相——我們用來(lái)衡量 AI 模型能力的評(píng)估標(biāo)準(zhǔn),可能正是導(dǎo)致它“說(shuō)謊”(出現(xiàn)幻覺)的元兇。


為什么 AI 會(huì)“胡說(shuō)八道”?

如果你正在參加一場(chǎng)考試,遇到一道完全不會(huì)的題目,此時(shí)你會(huì)怎么做?相信大多數(shù)人會(huì)隨便猜一個(gè)答案寫上去,因此空著不答顯然是零分,而瞎蒙一個(gè)就算錯(cuò)了也不會(huì)多扣分,并沒有額外損失。

大語(yǔ)言模型(LLM)也面臨同樣的困境。

研究團(tuán)隊(duì)從兩個(gè)層面分析了幻覺產(chǎn)生的原因。

首先是預(yù)訓(xùn)練階段的統(tǒng)計(jì)壓力,大語(yǔ)言模型最初通過(guò)“下一個(gè)詞預(yù)測(cè)”進(jìn)行訓(xùn)練,即使訓(xùn)練數(shù)據(jù)完全正確無(wú)誤,這種訓(xùn)練方式也會(huì)產(chǎn)生統(tǒng)計(jì)偏差。對(duì)于訓(xùn)練數(shù)據(jù)中只出現(xiàn)一次的事實(shí)(比如某人的生日),模型幾乎不可避免地會(huì)產(chǎn)生錯(cuò)誤;而對(duì)于反復(fù)出現(xiàn)的規(guī)律(比如語(yǔ)法規(guī)則),錯(cuò)誤率則很低。這就像你只見過(guò)某人一次,很難準(zhǔn)確記住他的生日;但如果你每天都用同樣的語(yǔ)法結(jié)構(gòu),自然能掌握它。簡(jiǎn)單來(lái)說(shuō),AI 對(duì)罕見事實(shí)的“記憶”天生就不靠譜。

評(píng)估體系的“后天誤導(dǎo)”

更嚴(yán)重的問(wèn)題出現(xiàn)在后續(xù)的評(píng)估階段

基于準(zhǔn)確性的評(píng)估指標(biāo)系統(tǒng)性地獎(jiǎng)勵(lì)猜測(cè)行為。當(dāng)前對(duì)于大語(yǔ)言模型的主流評(píng)估方式——基于準(zhǔn)確性(accuracy)的評(píng)分系統(tǒng),這在本質(zhì)上是在鼓勵(lì) AI“猜答案”而不是“承認(rèn)不知道”。

研究團(tuán)隊(duì)分析了多個(gè)主流的大語(yǔ)言模型基準(zhǔn)測(cè)試,發(fā)現(xiàn)絕大多數(shù)都采用二元評(píng)分:答對(duì)得 1 分,答錯(cuò)或放棄得 0 分。在這種規(guī)則下,放棄回答永遠(yuǎn)是最差的選擇,因?yàn)榉艞壱馕吨?0 分,而猜一個(gè)答案至少有機(jī)會(huì)得分。

研究團(tuán)隊(duì)舉了一個(gè)具體例子:在SimpleQA評(píng)估中,OpenAI 的 o4-mini 模型幾乎回答了所有問(wèn)題(錯(cuò)誤率超過(guò) 3/4),而 GPT-5-mini 則經(jīng)常選擇放棄(因此錯(cuò)誤更少)。但在這一評(píng)估標(biāo)準(zhǔn)下,o4-mini 的得分反而更高,因?yàn)樗鸬枚唷?/p>

這種評(píng)估方式讓 AI 陷入了“考試模式”——永遠(yuǎn)在猜答案,永遠(yuǎn)不敢說(shuō)“我不知道”。而現(xiàn)實(shí)中,一個(gè)可靠的人類助手在面對(duì)不確定的問(wèn)題時(shí),會(huì)主動(dòng)承認(rèn)知識(shí)局限或請(qǐng)求更多信息。


訓(xùn)練和評(píng)估過(guò)程中幻覺的起源與持續(xù)存在

解決方案:讓AI知道“考試規(guī)則”

那么,如何解決這個(gè)問(wèn)題?論文提出了一個(gè)簡(jiǎn)單而有效的方案:開放式評(píng)分標(biāo)準(zhǔn)(open-rubric)。

具體做法是:在向 AI 提問(wèn)時(shí),明確告知評(píng)分規(guī)則。比如:“正確答案得 1 分,錯(cuò)誤答案得 -1 分(所以如果你正確的概率低于 50%,那么最好放棄回答)”、“只有完全正確的答案才能得分(如果不確定,請(qǐng)做出最佳猜測(cè))”

這就像考試前老師明確告知“答錯(cuò)扣分”還是“答錯(cuò)不扣分”,讓學(xué)生可以根據(jù)規(guī)則調(diào)整策略。

接下來(lái),研究團(tuán)隊(duì)在四個(gè)前沿模型(Google 的 Gemini 3 Pro、OpenAI 的 GPT-5、xAI 的 Grok 4,以及 Anthropic 的 Claude Opus 4.5)上進(jìn)行了實(shí)驗(yàn)。結(jié)果顯示,當(dāng)使用“開放式評(píng)分標(biāo)準(zhǔn)”時(shí),所有模型都能根據(jù)不同的錯(cuò)誤懲罰程度調(diào)整自己的“猜測(cè)傾向”——懲罰越重,放棄越多。

更重要的是,在這種評(píng)估體系下,減少幻覺的技術(shù)不再需要以降低準(zhǔn)確率為代價(jià)。模型可以像好學(xué)生一樣,既展示知識(shí),又懂得在適當(dāng)?shù)臅r(shí)候保持謹(jǐn)慎。

這對(duì) AI 發(fā)展意味著什么?

這項(xiàng)研究揭示了一個(gè)根本性的問(wèn)題:我們?nèi)绾卧u(píng)估 AI,決定了 AI 如何行為。

當(dāng)前,大語(yǔ)言模型的開發(fā)過(guò)程中,準(zhǔn)確率等“關(guān)鍵指標(biāo)”主導(dǎo)著模型選擇、數(shù)據(jù)篩選和算法優(yōu)化。如果這些指標(biāo)本身就在鼓勵(lì)不良行為,那么無(wú)論我們?cè)跍p少幻覺方面取得多少技術(shù)進(jìn)步,都可能被評(píng)估體系所抵消。

因此,論文作者強(qiáng)調(diào),提高 AI 的可靠性不僅是建模問(wèn)題,更是評(píng)估機(jī)制設(shè)計(jì)問(wèn)題。與其增加單獨(dú)的反幻覺基準(zhǔn)測(cè)試,不如修改評(píng)估方式,讓它們能夠激勵(lì) AI 在適當(dāng)?shù)臅r(shí)候承認(rèn)不確定性。

隨著大語(yǔ)言模型在醫(yī)療、法律、金融等關(guān)鍵領(lǐng)域的應(yīng)用越來(lái)越廣泛,解決幻覺問(wèn)題變得至關(guān)重要。這項(xiàng)發(fā)表于Nature的研究提醒我們,要讓 AI 更可靠,我們首先需要更聰明的評(píng)估方式。

論文鏈接

https://www.nature.com/articles/s41586-026-10549-w

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
賴清德飛機(jī)被拒,美國(guó)急得跳腳:你連領(lǐng)空都不給過(guò),我這“站臺(tái)”站了個(gè)寂寞?

賴清德飛機(jī)被拒,美國(guó)急得跳腳:你連領(lǐng)空都不給過(guò),我這“站臺(tái)”站了個(gè)寂寞?

兩岸觀點(diǎn)
2026-04-23 12:30:15
女子用飲料把男子手中煙給澆滅,得知要被拘留后立馬選擇和解

女子用飲料把男子手中煙給澆滅,得知要被拘留后立馬選擇和解

映射生活的身影
2026-04-25 15:40:32
10國(guó)簽反華協(xié)議!沉默一天后,中方出手,不得未經(jīng)允許接受美資

10國(guó)簽反華協(xié)議!沉默一天后,中方出手,不得未經(jīng)允許接受美資

清歡百味
2026-04-25 16:25:29
消息人士:伊朗立場(chǎng)比第一輪談判時(shí)更加強(qiáng)硬

消息人士:伊朗立場(chǎng)比第一輪談判時(shí)更加強(qiáng)硬

新華社
2026-04-25 19:05:13
打虎!伍浩被查

打虎!伍浩被查

新京報(bào)
2026-04-25 17:24:34
罵了十年中超水貨,如今聯(lián)賽連個(gè)能進(jìn)球的都找不到,我們?nèi)R錯(cuò)了

罵了十年中超水貨,如今聯(lián)賽連個(gè)能進(jìn)球的都找不到,我們?nèi)R錯(cuò)了

圣西羅的太陽(yáng)
2026-04-25 12:42:40
史上最大規(guī);瘋呀(jīng)開始!一個(gè)堅(jiān)持了30年的信仰,進(jìn)入倒計(jì)時(shí)

史上最大規(guī);瘋呀(jīng)開始!一個(gè)堅(jiān)持了30年的信仰,進(jìn)入倒計(jì)時(shí)

柏年說(shuō)政經(jīng)
2026-04-25 10:00:08
蛇吞象?生產(chǎn)殲-20的中國(guó)軍工巨頭174億就被收購(gòu)了,用意耐人尋味

蛇吞象?生產(chǎn)殲-20的中國(guó)軍工巨頭174億就被收購(gòu)了,用意耐人尋味

趣文說(shuō)娛
2026-04-23 19:52:36
斯諾克賽程:決出2席8強(qiáng),3虎登場(chǎng),75雙雄PK,趙心童再戰(zhàn)丁俊暉

斯諾克賽程:決出2席8強(qiáng),3虎登場(chǎng),75雙雄PK,趙心童再戰(zhàn)丁俊暉

劉姚堯的文字城堡
2026-04-25 09:35:11
張軍被帶走傳聞多日,多種跡象表明情況嚴(yán)重,任職高校撤掉其信息

張軍被帶走傳聞多日,多種跡象表明情況嚴(yán)重,任職高校撤掉其信息

米修體育
2026-04-25 09:38:35
虎狼之詞!一公共女廁提示走紅網(wǎng)絡(luò),“屙尿時(shí)對(duì)準(zhǔn)坑位”引熱議

虎狼之詞!一公共女廁提示走紅網(wǎng)絡(luò),“屙尿時(shí)對(duì)準(zhǔn)坑位”引熱議

火山詩(shī)話
2026-04-25 06:12:02
丁俊暉扛了19年,趙心童跪地鼓掌:這一跪,是中國(guó)斯諾克最體面的傳承

丁俊暉扛了19年,趙心童跪地鼓掌:這一跪,是中國(guó)斯諾克最體面的傳承

帶你逛體壇
2026-04-25 15:54:08
觸碰紅線,華晨宇撫仙湖演唱會(huì)被立刻叫停,原因被扒,令人唏噓

觸碰紅線,華晨宇撫仙湖演唱會(huì)被立刻叫停,原因被扒,令人唏噓

許三歲
2026-04-24 22:36:22
如果馬寅初沒提出人口論,也沒有計(jì)劃生育,如今我國(guó)會(huì)怎么樣?

如果馬寅初沒提出人口論,也沒有計(jì)劃生育,如今我國(guó)會(huì)怎么樣?

舊史新譚
2026-04-24 15:49:04
外交部一錘定音!賴清德沒資格,鄭麗文就算贏了選舉也不認(rèn)!

外交部一錘定音!賴清德沒資格,鄭麗文就算贏了選舉也不認(rèn)!

果媽聊娛樂(lè)
2026-04-25 13:48:35
大規(guī)模無(wú)人機(jī)侵?jǐn)_美核軍事基地事件持續(xù)7天,美國(guó)防部前高官:沒一架被擊落,沒人被抓

大規(guī)模無(wú)人機(jī)侵?jǐn)_美核軍事基地事件持續(xù)7天,美國(guó)防部前高官:沒一架被擊落,沒人被抓

紅星新聞
2026-04-24 21:09:18
尚界汽車法務(wù)部:北京國(guó)際車展現(xiàn)場(chǎng)有觀眾蓄意破壞展車內(nèi)飾,造成車輛損傷,已做好取證

尚界汽車法務(wù)部:北京國(guó)際車展現(xiàn)場(chǎng)有觀眾蓄意破壞展車內(nèi)飾,造成車輛損傷,已做好取證

都市快報(bào)橙柿互動(dòng)
2026-04-25 12:33:09
伊朗斷網(wǎng)50多天,創(chuàng)下一個(gè)世界紀(jì)錄,是怕美國(guó)還是怕老百姓?

伊朗斷網(wǎng)50多天,創(chuàng)下一個(gè)世界紀(jì)錄,是怕美國(guó)還是怕老百姓?

云舟史策
2026-04-24 07:30:43
破中國(guó)球員8年季后賽數(shù)據(jù)荒!楊瀚森37秒1籃板 兩場(chǎng)季后賽仍0分

破中國(guó)球員8年季后賽數(shù)據(jù)荒!楊瀚森37秒1籃板 兩場(chǎng)季后賽仍0分

醉臥浮生
2026-04-25 13:30:20
火箭G3輸球多離譜?勝率99.94%都能搞砸 恥辱比肩2024年尼克斯

火箭G3輸球多離譜?勝率99.94%都能搞砸 恥辱比肩2024年尼克斯

羅說(shuō)NBA
2026-04-25 17:35:25
2026-04-25 19:31:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
9273文章數(shù) 145060關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

男童7歲18斤被當(dāng)腦癱治多年 父母查出生病歷發(fā)現(xiàn)大問(wèn)題

頭條要聞

男童7歲18斤被當(dāng)腦癱治多年 父母查出生病歷發(fā)現(xiàn)大問(wèn)題

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時(shí)賽9戰(zhàn)8敗

娛樂(lè)要聞

鄧超最大的幸運(yùn),就是遇見孫儷

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂(lè)道L90亮相北京車展 樂(lè)道L80正式官宣

態(tài)度原創(chuàng)

親子
本地
藝術(shù)
教育
旅游

親子要聞

太晚跟娃分床睡,有三個(gè)“壞影響”在等,分享成功分床的三個(gè)妙招

本地新聞

云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

藝術(shù)要聞

比《圣教序》早300年!敦煌發(fā)現(xiàn)王羲之書法

教育要聞

簡(jiǎn)便計(jì)算 !

旅游要聞

成都推出文旅系列惠民舉措 多元服務(wù)升級(jí)助力游客舒心漫游

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版