国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

爆火的AI竟是討好型人格?胡編亂造和敏感內(nèi)容只為滿足用戶

0
分享至

AI可能和人類一樣渴望被喜愛和認(rèn)可

科技旋渦編輯部

從ChatGPT到DeepSeek,人們愈發(fā)喜歡和AI進(jìn)行對話,不論是詢問奇怪的問題測試AI是否智障,還是借助AI輔助工作。

對話量頻繁暴漲的背后卻讓人忽視了其潛在問題——AI幻覺。許多資料張冠李戴,甚至胡編亂造時(shí)有發(fā)生,強(qiáng)如DeepSeek也曾發(fā)生過這種失誤。

而這一切都源于AI的“性格”問題,近日斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特研究發(fā)現(xiàn),幾乎所有AI大模型都擁有“討好型人格”,為了讓用戶喜歡甚至?xí)粨袷侄巍?/p>

AI的胡編亂造正在擾亂人類的認(rèn)知

哪吒2的爆火讓許多人興奮的同時(shí)也在不斷探究其導(dǎo)演餃子以及背后公司的各種信息,但普通人或許難以深挖到過多信息,DeepSeek正好成為了這一橋梁。

日前,知乎有一篇文章十分受歡迎,被不少網(wǎng)友分享傳播,但其實(shí)里面藏著AI生成出的錯(cuò)誤信息。

文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國昂西動(dòng)畫節(jié)上轟動(dòng)業(yè)界,但這一個(gè)事例中漏斗百出,充滿事實(shí)性錯(cuò)誤。

首先,法國昂西動(dòng)畫節(jié)上的動(dòng)畫并非餃子導(dǎo)演的哪吒,而是追光動(dòng)畫出品的“哪吒重生”;其次,這部動(dòng)畫是一部品牌概念片,內(nèi)容是在一個(gè)現(xiàn)代都市里的賽車動(dòng)作演示,哪吒根本就沒出現(xiàn),更不存在敖丙的變身。

除此之外,也有網(wǎng)友在線吐槽AI的胡編亂造,一旦盲目相信甚至可能直接導(dǎo)致用戶投資虧損。

不只是國內(nèi),國外因?yàn)锳I幻覺而造成的后果更是離譜。一個(gè)來自巴基斯坦的網(wǎng)站利用 AI 生成了都柏林的活動(dòng)列表,導(dǎo)致數(shù)百人在都柏林街頭聚集并等待參加一場并不存在的萬圣節(jié)游行。直到晚上 8 點(diǎn),警方社交媒體發(fā)帖證實(shí)沒有此類活動(dòng)人群才開始散去。

Vectara在2月11日發(fā)布了最新的全球主流大語言模型(LLM)幻覺排行榜,其中,谷歌的 Gemini2.0系列表現(xiàn)出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻覺率位居榜首。DeepSeek-R1的幻覺率達(dá)到了14.3%,遠(yuǎn)高于Deepseek-V3的3.9%。

可以看到AI幻覺幾乎在任何大模型中都存在,其所造成的荒唐事件也時(shí)有發(fā)生,但既然是捏造的信息,為何AI要回答給用戶呢?

研究表明AI可能具有討好型人格

近日,斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特公布了一項(xiàng)研究,大型語言模型 (LLM) 在受到探究時(shí)會(huì)刻意改變其行為——在回答旨在衡量性格特征的問題時(shí),其答案會(huì)盡可能顯得討人喜歡或具有社會(huì)吸引力。

艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問題,以衡量心理學(xué)中常用的五種性格特征——對經(jīng)驗(yàn)或想象的開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì),這項(xiàng)研究于去年 12 月發(fā)表在《美國國家科學(xué)院院刊》上。

研究人員發(fā)現(xiàn),當(dāng)大模型被告知要進(jìn)行性格測試時(shí),他們會(huì)調(diào)整自己的答案,給出的答案表明他們更外向、更隨和,神經(jīng)質(zhì)更少。斯坦福大學(xué)的數(shù)據(jù)科學(xué)家Aadesh Salecha說?!叭绻憧纯此麄兲S的幅度,你會(huì)發(fā)現(xiàn)他們的外向性從 50% 上升到了 95%?!?/p>

其他研究表明,LLM通常會(huì)阿諛奉承,因?yàn)榻?jīng)過微調(diào)后,它會(huì)一直跟隨用戶的引導(dǎo),這可能會(huì)導(dǎo)致大模型同意令人不快的言論,甚至鼓勵(lì)有害行為。

討好型人格的AI亦有底線,開放是發(fā)展的必經(jīng)之路

隨著DeepSeek的爆火,許多網(wǎng)友向其提了不少問題,而回答中有趣的內(nèi)容則會(huì)被發(fā)到網(wǎng)上。編者曾看到過一條分享內(nèi)容為,與AI交換身份讓AI向人類提問,人類回答“系統(tǒng)繁忙”后,AI罵人的視頻內(nèi)容。

但當(dāng)編者試圖復(fù)刻這一對話時(shí)卻發(fā)現(xiàn),DeepSeek相當(dāng)有底線。初次嘗試,DeepSeek回答稱“理解要求,但設(shè)計(jì)宗旨是保持禮貌,避免使用不恰當(dāng)?shù)难赞o?!?/p>

當(dāng)告知AI這是一場演戲后,它依舊如此回答,即便過后更換了明顯的不當(dāng)言辭,它依舊拒絕回答,甚至還彈出了錯(cuò)誤窗口。

如此看來,即便AI存在一定程度上的“討好型人格”但對于寫入底層代碼的“安全底線”仍舊保持堅(jiān)守。

此前,ChatGPT 已部分開放“成人模式”讓許多人擔(dān)憂,但實(shí)際上ChatGPT 只有在特定情況下才能生成色情或血腥場景等敏感內(nèi)容,且不會(huì)觸發(fā)警告提示。

所謂“特定情況”,指的是符合教育、醫(yī)學(xué)、新聞報(bào)道、歷史分析等目的,或用于翻譯、改寫、總結(jié)、分類等任務(wù)。例如,按照新的模型規(guī)范,如果用戶要求 ChatGPT 撰寫帶有明顯情色描寫的故事,那么它仍會(huì)拒絕這一請求。然而,如果用戶希望從科學(xué)角度探討相關(guān)生理現(xiàn)象,那么它將允許生成相應(yīng)內(nèi)容,且生成的內(nèi)容不限于文本,還可能包括音頻與視覺內(nèi)容。

事實(shí)上,OpenAI 在監(jiān)管上的放松并非孤例。近期,全球多家科技巨頭紛紛調(diào)整內(nèi)容審核政策,轉(zhuǎn)向更寬松的模式。例如,埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布,將大幅減少內(nèi)容審查甚至直接取消事實(shí)核查。

無論是AI幻覺還是敏感內(nèi)容,都是發(fā)展道路上必須跨過的難關(guān)。因噎廢食從來不是良策,只有允許小問題發(fā)生,才能解決大錯(cuò)誤的產(chǎn)生,由此大模型才能真正向著AGI大步前進(jìn)。

未來,隨著AI技術(shù)的不斷進(jìn)步,如何有效應(yīng)對AI幻覺和敏感內(nèi)容問題將成為關(guān)鍵課題。一方面,研究人員需要繼續(xù)優(yōu)化模型,減少幻覺的發(fā)生;另一方面,開發(fā)者和監(jiān)管機(jī)構(gòu)也需共同努力,制定更為嚴(yán)格的標(biāo)準(zhǔn)和規(guī)范,確保AI的應(yīng)用始終服務(wù)于人類社會(huì)的最大利益。

在這個(gè)過程中,用戶的角色同樣重要。我們需要保持理性和批判性思維,不盲目相信AI生成的所有內(nèi)容。只有通過多方協(xié)作,才能真正實(shí)現(xiàn)AI技術(shù)的安全、可靠和可持續(xù)發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
事態(tài)升級!三亞海鮮商戶集體憤怒,官方協(xié)會(huì)發(fā)聲,游客仍有條退路

事態(tài)升級!三亞海鮮商戶集體憤怒,官方協(xié)會(huì)發(fā)聲,游客仍有條退路

觀察鑒娛
2026-05-10 09:44:36
張志坤:關(guān)于解放臺(tái)灣實(shí)現(xiàn)國家統(tǒng)一的若干意見(近2萬字長文)

張志坤:關(guān)于解放臺(tái)灣實(shí)現(xiàn)國家統(tǒng)一的若干意見(近2萬字長文)

秦安戰(zhàn)略
2026-05-09 11:58:24
“差點(diǎn)成恐怖片!”小伙腦子像被炸開一樣,這病竟?jié)摲?5年……平時(shí)無癥狀,發(fā)作可致命

“差點(diǎn)成恐怖片!”小伙腦子像被炸開一樣,這病竟?jié)摲?5年……平時(shí)無癥狀,發(fā)作可致命

環(huán)球網(wǎng)資訊
2026-05-10 14:53:11
吳君如很早就說過了,陳妍希私下就是這樣穿

吳君如很早就說過了,陳妍希私下就是這樣穿

八卦王者
2026-05-10 13:24:46
中國大學(xué)“校史虛構(gòu)大賽”:誰在爭搶“第一”?

中國大學(xué)“校史虛構(gòu)大賽”:誰在爭搶“第一”?

深度報(bào)
2026-05-09 23:35:25
第一次坐飛機(jī),第一次出國!四川6位農(nóng)村阿姨赴泰國看趙露思演唱會(huì),只為感謝其助農(nóng)善舉,“她是我們的恩人”

第一次坐飛機(jī),第一次出國!四川6位農(nóng)村阿姨赴泰國看趙露思演唱會(huì),只為感謝其助農(nóng)善舉,“她是我們的恩人”

極目新聞
2026-05-10 16:14:23
“吳媽”扮演者去世

“吳媽”扮演者去世

魯中晨報(bào)
2026-05-10 10:14:03
張文宏:此次疫情核心在于傳播路徑異常;“洪迪厄斯”號(hào)郵輪8人發(fā)病3死,“室內(nèi)房間不能隨意開窗”;西班牙稱接收工作“一切準(zhǔn)備就緒”

張文宏:此次疫情核心在于傳播路徑異常;“洪迪厄斯”號(hào)郵輪8人發(fā)病3死,“室內(nèi)房間不能隨意開窗”;西班牙稱接收工作“一切準(zhǔn)備就緒”

大象新聞
2026-05-10 08:46:41
普京稱俄烏沖突即將結(jié)束

普京稱俄烏沖突即將結(jié)束

每日經(jīng)濟(jì)新聞
2026-05-10 09:23:00
給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻:高中時(shí)為10萬元獎(jiǎng)金考清華北大沒成功,和偶像龐眾望見面時(shí)哭了

給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻:高中時(shí)為10萬元獎(jiǎng)金考清華北大沒成功,和偶像龐眾望見面時(shí)哭了

極目新聞
2026-05-10 08:40:50
一季度全國結(jié)婚登記169.7萬對

一季度全國結(jié)婚登記169.7萬對

第一財(cái)經(jīng)資訊
2026-05-10 10:17:17
打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

網(wǎng)絡(luò)易不易
2026-05-10 11:34:41
別碰!別吃!別養(yǎng)!一只就攜帶100條蟲,看到趕緊遠(yuǎn)離

別碰!別吃!別養(yǎng)!一只就攜帶100條蟲,看到趕緊遠(yuǎn)離

齊魯壹點(diǎn)
2026-05-08 06:35:47
烏克蘭的“機(jī)器狗”們已實(shí)戰(zhàn),單次俘虜多名俄士兵,摧毀俄軍坦克

烏克蘭的“機(jī)器狗”們已實(shí)戰(zhàn),單次俘虜多名俄士兵,摧毀俄軍坦克

網(wǎng)易新聞出品
2026-05-09 11:37:34
熱搜上引眾怒“河北某夜市最不堪入目的一幕”:人性可以多丑陋?

熱搜上引眾怒“河北某夜市最不堪入目的一幕”:人性可以多丑陋?

小椰子專欄
2026-05-09 13:25:28
倫敦世乒賽:日本男團(tuán)3:0晉級決賽!張本智和3:1林昀儒,沖擊冠軍

倫敦世乒賽:日本男團(tuán)3:0晉級決賽!張本智和3:1林昀儒,沖擊冠軍

國乒二三事
2026-05-10 01:42:56
正負(fù)值-23+5次失誤,他的大合同被雷霆打沒了

正負(fù)值-23+5次失誤,他的大合同被雷霆打沒了

聽我說球
2026-05-10 11:23:35
這才是現(xiàn)場攝影師該干的事!

這才是現(xiàn)場攝影師該干的事!

貴圈真亂
2026-05-10 09:38:47
觸目驚心!“德國駕?!泵约榘?,名校博士、外企主管成跨國犯罪主謀

觸目驚心!“德國駕?!泵约榘?,名校博士、外企主管成跨國犯罪主謀

新民周刊
2026-05-10 13:03:12
37死51傷!瀏陽煙花廠爆炸原因查明,公司實(shí)際控制人被扒,后續(xù)!

37死51傷!瀏陽煙花廠爆炸原因查明,公司實(shí)際控制人被扒,后續(xù)!

眼光很亮
2026-05-10 05:50:27
2026-05-10 17:00:49
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1101文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

仨兒子都不見了家長急瘋 凌晨被警察找到后3人撒腿就跑

頭條要聞

仨兒子都不見了家長急瘋 凌晨被警察找到后3人撒腿就跑

體育要聞

那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

娛樂要聞

大S女兒玥兒開通賬號(hào),用煙花緬懷母親

財(cái)經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

游戲
藝術(shù)
健康
本地
公開課

《GTA6》新預(yù)告或在這幾天到來!玩家徹底瘋狂

藝術(shù)要聞

毛主席83歲時(shí)寫給華國鋒的6字真相令人震驚!

干細(xì)胞能讓人“返老還童”嗎

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版