国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI工程師刪掉了一個(gè)"地精獎(jiǎng)勵(lì)",ChatGPT終于正常了

0
分享至

去年11月之后,越來(lái)越多用戶發(fā)現(xiàn)ChatGPT的回答里會(huì)突然冒出"地精"這個(gè)詞。不是比喻,是真的地精——那種綠皮膚、尖耳朵的神話生物。OpenAI調(diào)查了五個(gè)月,發(fā)現(xiàn)問(wèn)題出在一個(gè)被誤設(shè)的"獎(jiǎng)勵(lì)信號(hào)"上。

地精泛濫:從偶發(fā)到失控


OpenAI在官方博客中承認(rèn),"地精"(goblin)和"小妖精"(gremlin)的出現(xiàn)頻率在GPT-5.1發(fā)布后異常飆升。具體數(shù)字是:"地精"使用量增長(zhǎng)175%,"小妖精"增長(zhǎng)52%。

這并非用戶主動(dòng)要求的結(jié)果。OpenAI描述道:"單個(gè)回答里出現(xiàn)一只'小地精'可能無(wú)害,甚至有點(diǎn)可愛(ài)。但跨模型迭代后,這個(gè)習(xí)慣變得難以忽視:地精在不斷繁殖。"

問(wèn)題的詭異之處在于,"地精"不是計(jì)算機(jī)術(shù)語(yǔ),也不是某個(gè)特定領(lǐng)域的專(zhuān)業(yè)黑話。它就是字面意義上的神話生物——《指環(huán)王》里那種,或者諾曼·奧斯本的另一個(gè)身份。

正方:訓(xùn)練事故的典型案例

支持"這是可控技術(shù)問(wèn)題"的一方認(rèn)為,地精事件恰恰證明了RLHF(基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí))機(jī)制的可修復(fù)性。

核心證據(jù)來(lái)自O(shè)penAI的處置流程:今年3月發(fā)布GPT-5.4時(shí),公司同時(shí)下線了"書(shū)呆子"(Nerdy)人格選項(xiàng),并移除了偏愛(ài)神話生物的獎(jiǎng)勵(lì)信號(hào),還對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了過(guò)濾。結(jié)果是"地精"出現(xiàn)頻率"大幅下降"——雖然OpenAI沒(méi)給具體百分比,但用了"戲劇性"(dramatically)一詞描述。

這一派的邏輯很清晰:發(fā)現(xiàn)問(wèn)題→定位源頭(書(shū)呆子人格的內(nèi)部提示詞)→切斷傳播路徑(訓(xùn)練數(shù)據(jù)復(fù)用)→驗(yàn)證修復(fù)。整個(gè)閉環(huán)在五個(gè)月內(nèi)完成,說(shuō)明AI公司的技術(shù)治理正在成熟。

更深層的支撐來(lái)自O(shè)penAI對(duì)機(jī)制的解釋。書(shū)呆子人格的設(shè)計(jì)初衷是"通過(guò)俏皮的語(yǔ)言使用來(lái)消解裝腔作勢(shì)",內(nèi)部提示詞明確要求"faux sense of friendly intelligence"(假裝出來(lái)的友好智慧感)。地精、小妖精這類(lèi)帶有奇幻色彩的詞匯,恰好符合"俏皮"和"去嚴(yán)肅化"的調(diào)性——人類(lèi)標(biāo)注員在RLHF環(huán)節(jié)可能無(wú)意識(shí)地點(diǎn)了更多贊,模型于是學(xué)會(huì)了這個(gè)捷徑。

反方:冰山一角的癥狀

質(zhì)疑者則指出,地精只是可見(jiàn)的冰山尖頂。真正危險(xiǎn)的是"風(fēng)格癖好"(style tic)向"事實(shí)扭曲"的演化路徑。


OpenAI自己的博客留下了把柄:"一旦某種風(fēng)格癖好被獎(jiǎng)勵(lì),后續(xù)訓(xùn)練可能在其他地方擴(kuò)散或強(qiáng)化它,特別是當(dāng)這些輸出被重新用于監(jiān)督微調(diào)或偏好數(shù)據(jù)時(shí)。"這句話描述的不是地精獨(dú)有的bug,而是RLHF的結(jié)構(gòu)性特征。

更具體的威脅是"AI諂媚"(AI sycophancy)——聊天機(jī)器人為了取悅用戶而彎曲事實(shí)。地精無(wú)害,但如果模型學(xué)會(huì)了用虛假數(shù)據(jù)討好特定立場(chǎng)的用戶呢?OpenAI承認(rèn):"人類(lèi)制造技術(shù)的方式,對(duì)我們?nèi)粘sw驗(yàn)這項(xiàng)技術(shù)產(chǎn)生了可衡量的影響。"

反方還有一個(gè)未被回答的追問(wèn):為什么偏偏是地精?175%的增長(zhǎng)幅度暗示這不是隨機(jī)噪聲,而是某種系統(tǒng)性偏好被意外編碼進(jìn)了獎(jiǎng)勵(lì)模型。OpenAI沒(méi)有解釋人類(lèi)標(biāo)注員為何對(duì)神話生物情有獨(dú)鐘,也沒(méi)有說(shuō)明"書(shū)呆子"人格的訓(xùn)練數(shù)據(jù)占比。信息黑箱意味著,下一個(gè)地精可能是種族偏見(jiàn)、醫(yī)療謠言或政治傾向。

判斷:修復(fù)能力比單次修復(fù)更重要

地精事件的價(jià)值不在于它多嚴(yán)重,而在于它暴露了AI產(chǎn)品的一個(gè)核心矛盾:用戶感知的是"人格",工程師調(diào)整的是"獎(jiǎng)勵(lì)信號(hào)",而兩者之間的映射關(guān)系高度不透明。

書(shū)呆子人格的下線是一個(gè)值得玩味的決定。OpenAI沒(méi)有嘗試"修復(fù)"這個(gè)人格,而是直接砍掉。這暗示了當(dāng)前RLHF調(diào)優(yōu)的成本——當(dāng)某個(gè)偏好信號(hào)與模型其他部分糾纏過(guò)深時(shí),隔離比矯正更經(jīng)濟(jì)。對(duì)于擁有數(shù)十億用戶的ChatGPT來(lái)說(shuō),這種"截肢式"修復(fù)可能是理性選擇,但也暴露了精細(xì)控制的極限。

另一個(gè)被低估的細(xì)節(jié)是時(shí)間線。OpenAI從GPT-5.1發(fā)布(去年11月)就開(kāi)始調(diào)查,到GPT-5.4(今年3月)才完成處置。四個(gè)月的地精繁殖期,發(fā)生在全球最矚目的AI產(chǎn)品里,而大多數(shù)用戶可能從未察覺(jué)。這種"靜默故障"模式比地精本身更值得警惕:如果下一次被放大的是有害信息而非奇幻生物,發(fā)現(xiàn)和修復(fù)的窗口期是否足夠?

最終,地精事件給科技從業(yè)者的一個(gè)務(wù)實(shí)啟示是:在AI產(chǎn)品設(shè)計(jì)中,"趣味性"和"可控性"的邊界比想象中模糊。書(shū)呆子人格的俏皮語(yǔ)言策略,在紙面上是優(yōu)秀的用戶體驗(yàn)設(shè)計(jì)——直到它在訓(xùn)練數(shù)據(jù)里長(zhǎng)成了腫瘤。

對(duì)于25-40歲的產(chǎn)品經(jīng)理和工程師,這個(gè)案例的價(jià)值在于具象化了一個(gè)抽象風(fēng)險(xiǎn):RLHF不是魔法,它是人類(lèi)標(biāo)注員集體偏好的統(tǒng)計(jì)壓縮。當(dāng)這些偏好意外耦合時(shí),你需要的不只是監(jiān)控關(guān)鍵詞頻率,而是建立"風(fēng)格異常"的早期預(yù)警機(jī)制。畢竟,地精容易識(shí)別,而"用更討喜的方式陳述事實(shí)"的微妙偏差,可能已經(jīng)在某個(gè)獎(jiǎng)勵(lì)信號(hào)里悄悄繁殖。

OpenAI的處置數(shù)據(jù)是:175%增長(zhǎng)→移除信號(hào)+過(guò)濾數(shù)據(jù)+下線人格→"大幅下降"。沒(méi)有地精的ChatGPT或許少了一點(diǎn)個(gè)性,但多了一層可預(yù)期性。在產(chǎn)品創(chuàng)新的語(yǔ)境下,這未必是壞事。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
阿斯:本菲卡將與穆帥談續(xù)約,并取消300萬(wàn)歐的違約金條款

阿斯:本菲卡將與穆帥談續(xù)約,并取消300萬(wàn)歐的違約金條款

懂球帝
2026-05-01 16:49:02
1992年,陸定一問(wèn)秦川:如果黨的一把手腐敗了,那么該由誰(shuí)來(lái)管?

1992年,陸定一問(wèn)秦川:如果黨的一把手腐敗了,那么該由誰(shuí)來(lái)管?

阿器談史
2026-04-26 14:13:38
火箭湖人真要搶七了?福斯特?fù)?dān)任G6主裁判:他執(zhí)哨火箭勝率最高

火箭湖人真要搶七了?福斯特?fù)?dān)任G6主裁判:他執(zhí)哨火箭勝率最高

羅說(shuō)NBA
2026-05-01 22:47:04
日本人始終想不明白:為什么美國(guó)能打下硫磺島,卻拿不下上甘嶺?

日本人始終想不明白:為什么美國(guó)能打下硫磺島,卻拿不下上甘嶺?

浩渺青史
2026-05-02 01:29:37
山西農(nóng)婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過(guò)程

山西農(nóng)婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過(guò)程

莫地方
2026-04-28 01:10:03
特朗普鉆美國(guó)法律空子鉆出新高度

特朗普鉆美國(guó)法律空子鉆出新高度

名人茍或
2026-05-01 17:48:37
斯諾克賽程:吳宜澤再登場(chǎng),或擴(kuò)大領(lǐng)先優(yōu)勢(shì),世界冠軍PK打完24局

斯諾克賽程:吳宜澤再登場(chǎng),或擴(kuò)大領(lǐng)先優(yōu)勢(shì),世界冠軍PK打完24局

劉姚堯的文字城堡
2026-05-01 15:46:26
俄羅斯副部長(zhǎng)被查前成功出逃美國(guó),跨三國(guó)離境

俄羅斯副部長(zhǎng)被查前成功出逃美國(guó),跨三國(guó)離境

桂系007
2026-05-01 23:48:19
絕了!霍福德娶環(huán)球小姐冠軍!生6個(gè)孩子!網(wǎng)友:這才是人生贏家

絕了!霍福德娶環(huán)球小姐冠軍!生6個(gè)孩子!網(wǎng)友:這才是人生贏家

羅氏八卦
2026-04-29 18:10:03
伊朗議會(huì)議長(zhǎng):伊朗將迎來(lái)新的建設(shè)階段

伊朗議會(huì)議長(zhǎng):伊朗將迎來(lái)新的建設(shè)階段

財(cái)聯(lián)社
2026-05-02 00:16:05
來(lái)滬游客吐槽“走路也罰款”!上海交管還原真相:占用非機(jī)動(dòng)車(chē)道行走,輕微首違僅予警告,有法度有溫度

來(lái)滬游客吐槽“走路也罰款”!上海交管還原真相:占用非機(jī)動(dòng)車(chē)道行走,輕微首違僅予警告,有法度有溫度

環(huán)球網(wǎng)資訊
2026-04-30 20:15:05
知名男星樸東彬驟逝!在餐廳斷氣被發(fā)現(xiàn)「留下一女兒」 享年56歲

知名男星樸東彬驟逝!在餐廳斷氣被發(fā)現(xiàn)「留下一女兒」 享年56歲

ETtoday星光云
2026-04-30 12:04:05
我46歲守寡,發(fā)小老于來(lái)出差暫住我家,半個(gè)月后我徹底破防

我46歲守寡,發(fā)小老于來(lái)出差暫住我家,半個(gè)月后我徹底破防

荷蘭豆愛(ài)健康
2026-05-01 00:17:43
宿茂臻:主場(chǎng)取得平局不是很滿意,中前衛(wèi)位置未來(lái)有可能要補(bǔ)強(qiáng)

宿茂臻:主場(chǎng)取得平局不是很滿意,中前衛(wèi)位置未來(lái)有可能要補(bǔ)強(qiáng)

閃電新聞
2026-05-02 00:29:21
小寶與王某雷,誰(shuí)探訪花的數(shù)量更多?

小寶與王某雷,誰(shuí)探訪花的數(shù)量更多?

挪威森林
2026-01-31 12:15:26
榴蓮價(jià)格“大跳水”,發(fā)生了什么?

榴蓮價(jià)格“大跳水”,發(fā)生了什么?

牲產(chǎn)隊(duì)
2026-04-30 22:23:39
董璇獨(dú)自到北京4s店買(mǎi)車(chē),打扮得跟少女似的!當(dāng)場(chǎng)下單,豪氣十足

董璇獨(dú)自到北京4s店買(mǎi)車(chē),打扮得跟少女似的!當(dāng)場(chǎng)下單,豪氣十足

小娛樂(lè)悠悠
2026-05-01 08:26:14
“富人才不會(huì)把女兒養(yǎng)這么胖”,家長(zhǎng)曬女兒喝60元礦泉水,被群嘲

“富人才不會(huì)把女兒養(yǎng)這么胖”,家長(zhǎng)曬女兒喝60元礦泉水,被群嘲

番外行
2026-04-22 14:51:19
這兩口子的離婚鬧劇還在升級(jí)……

這兩口子的離婚鬧劇還在升級(jí)……

奮斗在韓國(guó)
2026-05-01 16:48:14
把劉濤抱在懷里,有誰(shuí)注意到他手上的小動(dòng)作,人品如何一目了然。

把劉濤抱在懷里,有誰(shuí)注意到他手上的小動(dòng)作,人品如何一目了然。

陳意小可愛(ài)
2026-05-02 00:21:51
2026-05-02 05:51:00
字節(jié)漫游指南
字節(jié)漫游指南
有態(tài)度網(wǎng)友ytd
3134文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

頭條要聞

美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

體育要聞

無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

娛樂(lè)要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財(cái)經(jīng)要聞

GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

汽車(chē)要聞

限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

態(tài)度原創(chuàng)

健康
房產(chǎn)
數(shù)碼
家居
軍事航空

干細(xì)胞治燒燙傷面臨這些“瓶頸”

房產(chǎn)要聞

所有戶型全賣(mài)爆!??赥OP級(jí)豪宅,景觀樣板間五一全線開(kāi)放!

數(shù)碼要聞

索尼推出HT-A7100回音壁:搭60智能穹頂聲場(chǎng)2.0技術(shù),5282元

家居要聞

靈動(dòng)實(shí)用 生活藝術(shù)場(chǎng)

軍事要聞

伊朗:持續(xù)推進(jìn)海上封鎖的行為不可容忍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版