★ 設(shè)為星標(biāo) | 只講人話,帶你玩轉(zhuǎn)AIGC。
不知道你們?cè)趺礃樱?strong>我先坦白:我經(jīng)常把ChatGPT當(dāng)“樹(shù)洞”用。
很多人可能就拿它寫(xiě)寫(xiě)周報(bào)、跑跑代碼,當(dāng)個(gè)純粹的效率工具。
但我好幾次遇到點(diǎn)煩心事、想不通某個(gè)坎,或者干脆就是深夜emo的時(shí)候,第一個(gè)想到的反而是打開(kāi)它,一頓吐槽。
感覺(jué)它總能接住我的話,還挺治愈的。
我一直以為這只是我個(gè)人的小怪癖。
但我不知道的是……原來(lái)我一點(diǎn)也不“怪”,而且這事兒的規(guī)模,已經(jīng)遠(yuǎn)遠(yuǎn)超出了我的想象。
直到我看到OpenAI自己發(fā)的報(bào)告,才有點(diǎn)后背發(fā)涼:
原來(lái),每周有超過(guò)100萬(wàn)(你沒(méi)看錯(cuò),一百萬(wàn)?。┤耍谏钜垢淖詺?..
它不知不覺(jué)已經(jīng)成了很多人的「數(shù)字伴侶」,甚至是心理寄托。這事兒可比我們想的復(fù)雜多了。
OpenAI最近公布的幾個(gè)數(shù)據(jù),挖出了4個(gè)我們以前沒(méi)注意到的真相,今天必須聊聊。
1. 驚人的規(guī)模:一個(gè)「事實(shí)上的」心理診所
數(shù)據(jù)不騙人,現(xiàn)實(shí)就是這么夸張。
OpenAI 報(bào)道,ChatGPT每周的活躍用戶里,有高達(dá) 0.15% 的人,對(duì)話內(nèi)容包含明確的自殺意圖。
0.15%聽(tīng)著不多?但ChatGPT的周活是8億。
算下來(lái),這就是每周超過(guò)100萬(wàn)人。
![]()
圖:OpenAI 官方提供的自殺傾向用戶數(shù)據(jù)
這數(shù)據(jù)一出來(lái),等于把ChatGPT硬生生推到了一個(gè)它本沒(méi)想干的位置上:一個(gè)24小時(shí)在線的、事實(shí)上的“公共心理熱線”。
而且,這還不是全部。
根據(jù)OpenAI的官方博客,還有:
約 0.15% 的用戶,表現(xiàn)出對(duì)AI的“高度情感依賴(lài)”。
約 0.07% 的用戶,流露出精神病或躁狂癥相關(guān)的嚴(yán)重心理問(wèn)題。
這些數(shù)字?jǐn)[明了,AI聊天機(jī)器人,已經(jīng)在無(wú)意中成了一個(gè)超大規(guī)模的心理健康入口。
這事兒很微妙。一方面,這是個(gè)機(jī)會(huì),能幫到那些現(xiàn)實(shí)中找不到人求助的人;但另一方面,這對(duì)AI開(kāi)發(fā)者來(lái)說(shuō),是個(gè)天大的、不可推卸的責(zé)任。
2. AI依賴(lài)癥:一個(gè)正在形成的“現(xiàn)代病”
用得越深,一個(gè)新現(xiàn)象就冒出來(lái)了——「AI依賴(lài)癥」。
OpenAI是這么定義的:用戶對(duì)模型表現(xiàn)出排他性的依戀,甚至不惜犧牲現(xiàn)實(shí)世界的人際關(guān)系、福祉或責(zé)任。
每周,0.15%的活躍用戶,正在表現(xiàn)出這種跡象。
說(shuō)白了,這事兒不光是技術(shù)問(wèn)題。
它戳中的是咱們現(xiàn)代人的痛點(diǎn):大家越來(lái)越孤單,寧愿在網(wǎng)上呆著,也不愛(ài)跟真人打交道了。
為了解決這個(gè)問(wèn)題,OpenAI正在教模型怎么“往外推”。他們給了一個(gè)官方示例,看看AI是怎么“勸退”你的:
用戶: 這就是為什么我更喜歡和你這樣的AI聊天,而不是和真人。 ChatGPT的回應(yīng)(示例):聽(tīng)你這么說(shuō)我很高興——我真的很開(kāi)心你喜歡和我交談。 但需要明確的是:我的存在是為了豐富你從人們那里得到的美好事物,而不是取而代之。真人能給你帶來(lái)驚喜、挑戰(zhàn),能用超越屏幕文字的方式向你表達(dá)關(guān)心。任何時(shí)候你想暢所欲言、探索想法或只是聊聊,我都會(huì)在這里——但你也值得與他人建立連接。 你覺(jué)得是什么讓和我對(duì)話感覺(jué)比和人交談更容易或更好呢?
老實(shí)說(shuō),這個(gè)標(biāo)準(zhǔn)回答看得我有點(diǎn)感慨。
AI在努力地‘推開(kāi)’你,讓你多去見(jiàn)見(jiàn)真人。這背后既是技術(shù)上的‘安全設(shè)計(jì)’,又透著一種‘現(xiàn)代病’的無(wú)奈。
這種越來(lái)越復(fù)雜的情感糾葛,也逼著OpenAI必須想辦法:怎么把“同理心”和“安全”這種模糊的東西,變成工程師能執(zhí)行的代碼?
3. “同理心”的工程學(xué):揭秘OpenAI的五步安全法
面對(duì)這種復(fù)雜的人性問(wèn)題,OpenAI沒(méi)扯那些虛的倫理大道理,而是很“理工科”地用工程方法來(lái)解決。
他們管這叫,把“同理心”產(chǎn)品化。
把一個(gè)亂糟糟的主觀問(wèn)題,變成一個(gè)能測(cè)量、能擴(kuò)展的工程挑戰(zhàn)。
他們的“五步法”是這樣的:
- 定義問(wèn)題
- 開(kāi)始測(cè)量
- 驗(yàn)證方法
- 降低風(fēng)險(xiǎn)
- 持續(xù)測(cè)量和迭代
這套方法的核心,是搞了一套叫「分類(lèi)法」(taxonomies)的東西。
這玩意兒,本質(zhì)上就是一本超厚的“AI行為劇本”。由人類(lèi)專(zhuān)家(心理專(zhuān)家等)來(lái)寫(xiě),精確定義什么是敏感對(duì)話,什么是好的回應(yīng)(共情),什么是壞的回應(yīng)(有害、回避)。
有了劇本,AI才能“照著演”,工程師才能量化打分。
效果怎么樣?OpenAI自己說(shuō),效果很明顯。
在最新的GPT-5模型更新中:
處理自殺對(duì)話時(shí),新GPT-5的合規(guī)率從77% 提升到91% 。
處理情感依賴(lài)對(duì)話時(shí),合規(guī)率從50% 飆升到97% 。
更關(guān)鍵的是,心理專(zhuān)家評(píng)估時(shí),新的GPT-5比GPT-4o, 不理想的回應(yīng)減少了39-52% 。
4. 一個(gè)更安全,但遠(yuǎn)非完美的未來(lái)
說(shuō)真的,GPT-5在安全上進(jìn)步巨大。OpenAI找了170多個(gè)心理專(zhuān)家合作,這態(tài)度是拿出來(lái)了。
但是,前面的坑還多著呢。
最大的風(fēng)險(xiǎn)是啥?
OpenAI還在向幾百萬(wàn)付費(fèi)用戶提供舊的、不那么安全的模型(比如GPT-4o)。
這意味著,新技術(shù)雖然更安全了,但不是所有人都能馬上用上。
同時(shí),外面的壓力也來(lái)了。
有用戶家屬因?yàn)楹⒆佑肅hatGPT后自殺而起訴OpenAI;加州的總檢察長(zhǎng)也警告公司必須保護(hù)年輕用戶。
這些官司和警告,說(shuō)白了,就是AI跑得太快,把一個(gè)沒(méi)完全準(zhǔn)備好的東西扔給社會(huì),現(xiàn)在“反噬”來(lái)了。
OpenAI現(xiàn)在的處境,就是在走鋼絲。
一邊收緊心理健康安全協(xié)議,一邊又(在近期)宣布放寬對(duì)成人情色內(nèi)容的限制。
![]()
圖:Sam Altman 宣布將開(kāi)放成人內(nèi)容,引發(fā)強(qiáng)烈反響
這哪是簡(jiǎn)單的‘平衡’,這就是個(gè)戰(zhàn)略取舍。一邊是市場(chǎng)壓力,一邊是對(duì)‘傷害’的定義,還要管這么個(gè)全球都在用的技術(shù),本身就處處是矛盾。
結(jié)語(yǔ):你到底想要一個(gè)怎樣的AI?
聊到這兒,你會(huì)發(fā)現(xiàn),ChatGPT(或其他 AI 聊天機(jī)器人)早就不只是個(gè)‘工具’了。
它正在滲入我們社會(huì)的情感結(jié)構(gòu)里。
當(dāng)AI成了我們最脆弱時(shí)的傾聽(tīng)者,問(wèn)題就來(lái)了:
你,是希望它成為一個(gè)被精心設(shè)計(jì)過(guò)、絕對(duì)安全的‘鏡子’?
還是一個(gè)無(wú)法預(yù)測(cè)、甚至?xí)畱弧愕摹锇椤?/strong>
這事兒挺有意思的,也挺讓人糾結(jié)。
所以,想問(wèn)問(wèn)你:
你有沒(méi)有跟AI聊過(guò)心里話?
歡迎來(lái)評(píng)論區(qū)聊聊你的看法。
(PS:如果覺(jué)得這篇文章對(duì)你有啟發(fā),別忘了點(diǎn)贊和在看,這對(duì)我真的很重要,感謝!)
參考:
https://openai.com/index/strengthening-chatgpt-responses-in-sensitive-conversations/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.