国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

為什么大模型要騙你?

0
分享至

本文開始前,「象先志」先問大家三個問題,大家可以一起思考下

1. 1. AI為什么要騙你?

2. 2. 幻覺是大語言模型的bug還是feature?

3. 3. 為什么AI總是一本正經(jīng)地胡說八道?

OpenAI前段時間發(fā)了篇論文,題目叫 《Why language models hallucinate》,解釋為什么大語言模型會產(chǎn)生幻覺。「象先志」會先介紹下論文內(nèi)容,然后「象先志」再聊聊對這個問題一些不一樣的看法。



稍微有點硬核,希望大家耐心看到最后。這篇論文的基本結(jié)論,是大模型產(chǎn)生幻覺,原因是開發(fā)人員在訓(xùn)練它的時候鼓勵它這么做。就是說大模型天性是好的,是跟錯了人,后面路才走歪的。

為什么這么說呢?在訓(xùn)練大模型的時候,廠商內(nèi)部會跑很多的測試,來評價和校準(zhǔn)大模型的好壞。這些測試只看準(zhǔn)確率,不看錯誤率,所以哪怕模型不知道答案是什么,它還是會傾向猜一個答案。就跟我們考試的時候,哪怕不會做,答題卡上也要涂滿是一個道理。

要解決這個問題,那就對癥下藥嘛,論文作者呼吁大家要改變評測基準(zhǔn),不要再搞那套基于準(zhǔn)確率的評估方法了,要鼓勵大模型承認(rèn)自己的無知,而不是一本正經(jīng)的瞎咧咧。

論文主要說的就是這事,「象先志」想邏輯大家應(yīng)該很容易理解。坦白講,雖然說論文是OpenAI發(fā)的,但「象先志」覺得沒有什么新東西。當(dāng)然OpenAI出來發(fā)有個好處,人家行業(yè)地位擺著這,出來吼兩嗓子,有助于從業(yè)者更快地認(rèn)識到問題,然后去針對性地解決。

聊完論文,「象先志」再聊下對模型幻覺問題的理解。「象先志」認(rèn)為語言模型本質(zhì)上沒有幻覺不幻覺的概念,它們只是基于已有的信息,去預(yù)測下一個token。你訓(xùn)練數(shù)據(jù)里是什么樣的概率分布,它就會盡量去擬合這個分布,僅此而已。不管你怎樣去調(diào)整模型評估的方式方法,它其實仍然是在迎合新的評價指標(biāo)。

比如說,原來答錯不扣分,現(xiàn)在答錯要扣分,那模型肯定更謹(jǐn)慎,不確定的事實,不知道的答案,它就更多承認(rèn)自己不確定或者不知道。

但這樣還是存在兩個問題。

第一,模型仍然是沒有事實和非事實的概念區(qū)分,它不是因為這個東西是幻覺,它才不輸出;它是因為這個輸出會扣分,它才不輸出。

這就引出了第二個問題。按照這個理解角度,要減少模型的幻覺,就是要合理設(shè)置模型的評估模式,去盡可能引導(dǎo)模型的輸出跟人類認(rèn)知上的事實陳述重合。

這顯然是一種治標(biāo)不治本的方式,因為模型的輸出結(jié)果跟人類認(rèn)為的事實是兩個語言集合,我們現(xiàn)在等于沒辦法,直接瞄準(zhǔn)后面這個集合做優(yōu)化,所以只能退而求其次,對前一個集合做間接的限制。

但這樣搞有多大效果?上限在哪里?都是不知道的。

打個比方吧。人發(fā)燒是因為身體內(nèi)的免疫系統(tǒng)在劇烈反應(yīng),這個反應(yīng)是有一個根本的誘發(fā)因素的,比如說病毒感染。那現(xiàn)在要解決發(fā)燒的問題,一種辦法是直接對病毒做處理,上一些抗病毒的藥物,病毒解決了,身體自然就不發(fā)燒了。

還有一種辦法是什么呢?就是把體溫當(dāng)做優(yōu)化指標(biāo),用藥物把免疫反應(yīng)按下去,或者在頭上敷冰塊,反正要達(dá)到降體溫的目的。

現(xiàn)在OpenAI提的解決方案就類似于后者。這個方法有沒有用?當(dāng)然有用,就像人如果一直發(fā)燒發(fā)高燒,腦子就燒壞掉了,先把體溫降下來、緩解癥狀,是治療步驟中必要的環(huán)節(jié)。

OpenAI新的GPT-5的確也比之前模型要好很多,幻覺癥狀有明顯的緩解。但這能不能解決根本問題呢?我覺得很難,你最后還是需要找到發(fā)燒的原因才行。

只不過跟生病不一樣,人發(fā)燒是有客觀原因的,可能受限于醫(yī)學(xué)發(fā)展程度醫(yī)生找不到,但我們知道這個原因是客觀存在的。而語言模型的幻覺問題有可能是與生俱來的,發(fā)燒就是它身體正常新陳代謝的一部分,你解決不了。沒那個能力,知道吧?

順便說一句 ,剛才「象先志」又被AI給騙了?!赶笙戎尽乖儐柨聺崼@得過幾個世界冠軍時,ChatGPT非常篤定地回答,“截止2025年9月,柯潔共獲得9個世界冠軍,還列出了是哪幾次以及哪一年。”



本來以為是GPT語料被污染了,因為年初LG杯決賽時柯潔因不服裁判棄賽,隨后把微博簽名改為“九冠王”。但「象先志」定睛一看,發(fā)現(xiàn)情況并沒有那么復(fù)雜,因為ChatGPT回答里并沒有列出2025年的LG杯。

九冠的柯潔,只是它單純的幻覺。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
揮拳相向,馬克和老六場上激烈沖突,NBA原始味道讓聯(lián)盟更加成功

揮拳相向,馬克和老六場上激烈沖突,NBA原始味道讓聯(lián)盟更加成功

拾叁懂球
2025-12-28 21:58:49
36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預(yù)訂豪車,身后留下兩個幼女丨紅星調(diào)查

36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預(yù)訂豪車,身后留下兩個幼女丨紅星調(diào)查

紅星新聞
2025-12-27 10:37:08
原子彈炸后百年內(nèi)寸草不生!今廣島卻住滿了人,看看專家怎么說?

原子彈炸后百年內(nèi)寸草不生!今廣島卻住滿了人,看看專家怎么說?

興趣知識
2025-12-12 19:33:40
蒙古國提議400平方公里土地?fù)Q通道運稀土赴美

蒙古國提議400平方公里土地?fù)Q通道運稀土赴美

他是她的島熊
2025-12-27 12:22:46
馬面女孩吳小燕:毛巾蒙面13年,手術(shù)取出2公斤異物后過得怎樣了

馬面女孩吳小燕:毛巾蒙面13年,手術(shù)取出2公斤異物后過得怎樣了

小熊侃史
2025-12-25 11:27:42
肺癌患者有救了!伏美替尼實現(xiàn)100%控病,12.5%患者終于有了新藥

肺癌患者有救了!伏美替尼實現(xiàn)100%控病,12.5%患者終于有了新藥

普陀動物世界
2025-12-28 16:55:22
山西前首富攜妻潛逃英國!曾騙貸2600多億,超3萬老百姓被他坑慘

山西前首富攜妻潛逃英國!曾騙貸2600多億,超3萬老百姓被他坑慘

蜉蝣說
2025-12-18 16:06:23
605199,被證監(jiān)會立案!

605199,被證監(jiān)會立案!

證券時報e公司
2025-12-28 17:52:50
湖人再次開會!雷迪克決定變陣:詹姆斯回歸后我們進攻端缺乏章法

湖人再次開會!雷迪克決定變陣:詹姆斯回歸后我們進攻端缺乏章法

羅說NBA
2025-12-28 06:56:59
他們?yōu)楹渭庇谧N攜程?

他們?yōu)楹渭庇谧N攜程?

智識漂流
2025-12-25 20:09:36
“裝B”到無懈可擊是什么體驗?這哥們,裝得老天爺都看不下去了

“裝B”到無懈可擊是什么體驗?這哥們,裝得老天爺都看不下去了

滑稽斑馬呀
2025-12-28 18:04:18
很多房子已經(jīng)租不出去了。

很多房子已經(jīng)租不出去了。

愛吃糖的貓cat
2025-12-27 18:17:44
5艘航母逼近中國近海,特朗普直接打明牌,逼著中國接招!

5艘航母逼近中國近海,特朗普直接打明牌,逼著中國接招!

奉壹數(shù)碼
2025-12-26 22:02:25
路人偶遇徐藝洋,真的白到發(fā)光啊,又高又美,黃子韜撿到寶了

路人偶遇徐藝洋,真的白到發(fā)光啊,又高又美,黃子韜撿到寶了

阿廢冷眼觀察所
2025-12-28 16:36:56
必須有人離開:詹姆斯堅持做詹姆斯 湖人連敗逼老板清算三選二

必須有人離開:詹姆斯堅持做詹姆斯 湖人連敗逼老板清算三選二

籃球話題團
2025-12-28 00:20:03
人不會無故患上帶狀皰疹?調(diào)查發(fā)現(xiàn):患帶狀皰疹,背后有4個原因

人不會無故患上帶狀皰疹?調(diào)查發(fā)現(xiàn):患帶狀皰疹,背后有4個原因

涵豆說娛
2025-10-23 09:31:22
姚啟圣平定臺灣后,發(fā)現(xiàn)康熙對自己有殺意,留下了三個錦囊來應(yīng)對

姚啟圣平定臺灣后,發(fā)現(xiàn)康熙對自己有殺意,留下了三個錦囊來應(yīng)對

飯小妹說歷史
2025-12-24 09:14:17
首鋼受損!陳盈駿鼻骨骨折,北京大將下狠手,下輪南北面具俠對戰(zhàn)

首鋼受損!陳盈駿鼻骨骨折,北京大將下狠手,下輪南北面具俠對戰(zhàn)

體壇鑒春秋
2025-12-28 15:38:03
羽球天王杯:銅牌誕生!世界第8復(fù)仇喬納坦,石宇奇首局7-11落后

羽球天王杯:銅牌誕生!世界第8復(fù)仇喬納坦,石宇奇首局7-11落后

劉姚堯的文字城堡
2025-12-28 20:01:00
中方反制不到24小時,美悍然宣布中國已違法,挑明九屆政府都護臺

中方反制不到24小時,美悍然宣布中國已違法,挑明九屆政府都護臺

歷史有些冷
2025-12-27 19:25:03
2025-12-28 22:19:00
象先志 incentive-icons
象先志
專注互聯(lián)網(wǎng)、電商,聚焦產(chǎn)業(yè)、核心,洞察前沿、趨勢
81文章數(shù) 5關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

游戲
家居
健康
旅游
教育

醉酒兔女郎護送回家!重磅更新可偷看裙底?

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

這些新療法,讓化療不再那么痛苦

旅游要聞

各地持續(xù)推動冰雪旅游釋放新活力

教育要聞

從2026年北京選調(diào)擬錄用名單看升學(xué):這些大學(xué)最受青睞

無障礙瀏覽 進入關(guān)懷版