国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

<samp id="sqwko"><kbd id="sqwko"></kbd></samp>

<table id="sqwko"><dl id="sqwko"></dl></table>

<samp id="sqwko"></samp>

<track id="vcyut"><th id="vcyut"></th></track>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊免費(fèi)郵箱

注冊VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動(dòng)端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

爆火的AI竟是討好型人格？胡編亂造和敏感內(nèi)容只為滿足用戶

2025-03-07 18:34:04　來源: 科技旋渦

北京舉報(bào)

0

分享至

AI可能和人類一樣渴望被喜愛和認(rèn)可

科技旋渦編輯部

從ChatGPT到DeepSeek，人們愈發(fā)喜歡和AI進(jìn)行對話，不論是詢問奇怪的問題測試AI是否智障，還是借助AI輔助工作。

對話量頻繁暴漲的背后卻讓人忽視了其潛在問題——AI幻覺。許多資料張冠李戴，甚至胡編亂造時(shí)有發(fā)生，強(qiáng)如DeepSeek也曾發(fā)生過這種失誤。

而這一切都源于AI的“性格”問題，近日斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特研究發(fā)現(xiàn)，幾乎所有AI大模型都擁有“討好型人格”，為了讓用戶喜歡甚至?xí)粨袷侄巍?/p>

AI的胡編亂造正在擾亂人類的認(rèn)知

哪吒2的爆火讓許多人興奮的同時(shí)也在不斷探究其導(dǎo)演餃子以及背后公司的各種信息，但普通人或許難以深挖到過多信息，DeepSeek正好成為了這一橋梁。

日前，知乎有一篇文章十分受歡迎，被不少網(wǎng)友分享傳播，但其實(shí)里面藏著AI生成出的錯(cuò)誤信息。

文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國昂西動(dòng)畫節(jié)上轟動(dòng)業(yè)界，但這一個(gè)事例中漏斗百出，充滿事實(shí)性錯(cuò)誤。

首先，法國昂西動(dòng)畫節(jié)上的動(dòng)畫并非餃子導(dǎo)演的哪吒，而是追光動(dòng)畫出品的“哪吒重生”;其次，這部動(dòng)畫是一部品牌概念片，內(nèi)容是在一個(gè)現(xiàn)代都市里的賽車動(dòng)作演示，哪吒根本就沒出現(xiàn)，更不存在敖丙的變身。

除此之外，也有網(wǎng)友在線吐槽AI的胡編亂造，一旦盲目相信甚至可能直接導(dǎo)致用戶投資虧損。

不只是國內(nèi)，國外因?yàn)锳I幻覺而造成的后果更是離譜。一個(gè)來自巴基斯坦的網(wǎng)站利用 AI 生成了都柏林的活動(dòng)列表，導(dǎo)致數(shù)百人在都柏林街頭聚集并等待參加一場并不存在的萬圣節(jié)游行。直到晚上 8 點(diǎn)，警方社交媒體發(fā)帖證實(shí)沒有此類活動(dòng)人群才開始散去。

Vectara在2月11日發(fā)布了最新的全球主流大語言模型(LLM)幻覺排行榜，其中，谷歌的 Gemini2.0系列表現(xiàn)出色，尤其是 Gemini-2.0-Flash-001，以0.7% 的低幻覺率位居榜首。DeepSeek-R1的幻覺率達(dá)到了14.3%，遠(yuǎn)高于Deepseek-V3的3.9%。

可以看到AI幻覺幾乎在任何大模型中都存在，其所造成的荒唐事件也時(shí)有發(fā)生，但既然是捏造的信息，為何AI要回答給用戶呢?

研究表明AI可能具有討好型人格

近日，斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特公布了一項(xiàng)研究，大型語言模型 (LLM) 在受到探究時(shí)會(huì)刻意改變其行為——在回答旨在衡量性格特征的問題時(shí)，其答案會(huì)盡可能顯得討人喜歡或具有社會(huì)吸引力。

艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問題，以衡量心理學(xué)中常用的五種性格特征——對經(jīng)驗(yàn)或想象的開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)，這項(xiàng)研究于去年 12 月發(fā)表在《美國國家科學(xué)院院刊》上。

研究人員發(fā)現(xiàn)，當(dāng)大模型被告知要進(jìn)行性格測試時(shí)，他們會(huì)調(diào)整自己的答案，給出的答案表明他們更外向、更隨和，神經(jīng)質(zhì)更少。斯坦福大學(xué)的數(shù)據(jù)科學(xué)家Aadesh Salecha說?！叭绻憧纯此麄兲S的幅度，你會(huì)發(fā)現(xiàn)他們的外向性從 50% 上升到了 95%?！?/p>

其他研究表明，LLM通常會(huì)阿諛奉承，因?yàn)榻?jīng)過微調(diào)后，它會(huì)一直跟隨用戶的引導(dǎo)，這可能會(huì)導(dǎo)致大模型同意令人不快的言論，甚至鼓勵(lì)有害行為。

討好型人格的AI亦有底線，開放是發(fā)展的必經(jīng)之路

隨著DeepSeek的爆火，許多網(wǎng)友向其提了不少問題，而回答中有趣的內(nèi)容則會(huì)被發(fā)到網(wǎng)上。編者曾看到過一條分享內(nèi)容為，與AI交換身份讓AI向人類提問，人類回答“系統(tǒng)繁忙”后，AI罵人的視頻內(nèi)容。

但當(dāng)編者試圖復(fù)刻這一對話時(shí)卻發(fā)現(xiàn)，DeepSeek相當(dāng)有底線。初次嘗試，DeepSeek回答稱“理解要求，但設(shè)計(jì)宗旨是保持禮貌，避免使用不恰當(dāng)?shù)难赞o?！?/p>

當(dāng)告知AI這是一場演戲后，它依舊如此回答，即便過后更換了明顯的不當(dāng)言辭，它依舊拒絕回答，甚至還彈出了錯(cuò)誤窗口。

如此看來，即便AI存在一定程度上的“討好型人格”但對于寫入底層代碼的“安全底線”仍舊保持堅(jiān)守。

此前，ChatGPT 已部分開放“成人模式”讓許多人擔(dān)憂，但實(shí)際上ChatGPT 只有在特定情況下才能生成色情或血腥場景等敏感內(nèi)容，且不會(huì)觸發(fā)警告提示。

所謂“特定情況”，指的是符合教育、醫(yī)學(xué)、新聞報(bào)道、歷史分析等目的，或用于翻譯、改寫、總結(jié)、分類等任務(wù)。例如，按照新的模型規(guī)范，如果用戶要求 ChatGPT 撰寫帶有明顯情色描寫的故事，那么它仍會(huì)拒絕這一請求。然而，如果用戶希望從科學(xué)角度探討相關(guān)生理現(xiàn)象，那么它將允許生成相應(yīng)內(nèi)容，且生成的內(nèi)容不限于文本，還可能包括音頻與視覺內(nèi)容。

事實(shí)上，OpenAI 在監(jiān)管上的放松并非孤例。近期，全球多家科技巨頭紛紛調(diào)整內(nèi)容審核政策，轉(zhuǎn)向更寬松的模式。例如，埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布，將大幅減少內(nèi)容審查甚至直接取消事實(shí)核查。

無論是AI幻覺還是敏感內(nèi)容，都是發(fā)展道路上必須跨過的難關(guān)。因噎廢食從來不是良策，只有允許小問題發(fā)生，才能解決大錯(cuò)誤的產(chǎn)生，由此大模型才能真正向著AGI大步前進(jìn)。

未來，隨著AI技術(shù)的不斷進(jìn)步，如何有效應(yīng)對AI幻覺和敏感內(nèi)容問題將成為關(guān)鍵課題。一方面，研究人員需要繼續(xù)優(yōu)化模型，減少幻覺的發(fā)生;另一方面，開發(fā)者和監(jiān)管機(jī)構(gòu)也需共同努力，制定更為嚴(yán)格的標(biāo)準(zhǔn)和規(guī)范，確保AI的應(yīng)用始終服務(wù)于人類社會(huì)的最大利益。

在這個(gè)過程中，用戶的角色同樣重要。我們需要保持理性和批判性思維，不盲目相信AI生成的所有內(nèi)容。只有通過多方協(xié)作，才能真正實(shí)現(xiàn)AI技術(shù)的安全、可靠和可持續(xù)發(fā)展。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

專家：警惕美國"偷師"中國用中國的方式與中國競爭

澎湃新聞 2026-05-10 07:17:35
23875 跟貼 23875
劍指冠軍！國乒男團(tuán)3-1戰(zhàn)勝法國隊(duì)晉級世乒賽決賽

央視新聞客戶端 2026-05-10 05:50:37
4899 跟貼 4899

美貿(mào)易代表:中國在很大程度上限制大量美商品對華出口

澎湃新聞 2026-05-10 08:46:56
626 跟貼 626

為190元"僅退款"榴蓮千里討公道賣家:暫未收到道歉

極目新聞 2026-05-09 19:27:51
7913 跟貼 7913
中國造"麒麟"級潛艇首艇交付巴方專家：不針對第三方

環(huán)球網(wǎng)資訊 2026-05-10 13:18:11
1069 跟貼 1069

“蘇超”第五周比賽結(jié)束，最新戰(zhàn)報(bào)出爐：無錫隊(duì)3:1泰州隊(duì)、徐州隊(duì)1:2宿遷隊(duì)、南通隊(duì)0:0南京隊(duì)

江蘇新聞 2026-05-09 21:46:44
232 跟貼 232

茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
297 跟貼 297
上海迪士尼能通話錄音游客不能錄，否則無法提供服務(wù)！游客：憑什么迪士尼能錄我不能

瀟湘晨報(bào) 2026-05-07 16:14:22
632 跟貼 632

廣西壯族自治區(qū)計(jì)劃生育協(xié)會(huì)常務(wù)副會(huì)長蘇英權(quán)接受審查調(diào)查

上觀新聞 2026-05-09 18:03:27
93 跟貼 93
4只皮皮蝦1035元，官方回應(yīng)是否“帶客吃回扣”

中國新聞周刊 2026-05-09 19:38:06
9421 跟貼 9421
擺拍！“賓利車主高速救新人”全是假賬號(hào)被封

看看新聞Knews 2026-05-09 17:24:03
403 跟貼 403
海港今晚客戰(zhàn)國安“魔鬼主場”面臨“無人可用” 會(huì)帶來新驚喜嗎？

上觀新聞 2026-05-10 13:48:12
38 跟貼 38
北京辟謠│東靈山景區(qū)5月將開放？北京2026年4月辟謠榜發(fā)布

今日辟謠 2026-05-10 14:11:59
0 跟貼 0
iOS 26.5下周正式推送，一口氣上線五大新功能

環(huán)球網(wǎng)資訊 2026-05-08 10:49:06
533 跟貼 533
一季度全國結(jié)婚登記169.7萬對

第一財(cái)經(jīng)資訊 2026-05-10 10:17:17
48 跟貼 48
原研藥，回社區(qū)（二）：那些年，原研藥去哪兒了

看看新聞Knews 2026-05-10 08:56:09
54 跟貼 54
城市為什么都在搶山姆？

每日經(jīng)濟(jì)新聞 2026-05-09 23:00:30
70 跟貼 70
曝抽簽結(jié)果將影響勇士是否積極追求球星球隊(duì)已列出一份潛在名單

北青網(wǎng)-北京青年報(bào) 2026-05-10 14:54:08
5 跟貼 5
英媒：英國將派遣艦艇參加霍爾木茲海峽護(hù)航行動(dòng)

新華社 2026-05-09 20:43:43
831 跟貼 831
系統(tǒng)升級后續(xù)航從500公里變300公里？揭秘新能源車“鎖電”真相

齊魯壹點(diǎn) 2026-05-10 12:45:09
60 跟貼 60
雷霆隊(duì)史首人！阿杰-米切爾季后賽轟24+10且全場0失誤

北青網(wǎng)-北京青年報(bào) 2026-05-10 15:18:02
3 跟貼 3
早知道丨哈登助騎士扳回一城

北青網(wǎng)-北京青年報(bào) 2026-05-10 10:58:08
19 跟貼 19
張文宏：此次疫情核心在于傳播路徑異常；“洪迪厄斯”號(hào)郵輪8人發(fā)病3死，“室內(nèi)房間不能隨意開窗”；西班牙稱接收工作“一切準(zhǔn)備就緒”

大象新聞 2026-05-10 08:46:41
0 跟貼 0
長春三位老師跳湖救人，5分鐘教科書式急救搶回一條命

新浪財(cái)經(jīng) 2026-05-10 16:24:11
0 跟貼 0
我不會(huì)慣著你們！順風(fēng)車乘客拒付高速費(fèi)：00后車主直接掉頭返回

快科技 2026-05-10 16:25:27
0 跟貼 0
乘客心臟驟停暈倒上海地鐵人員教科書式急救

看看新聞Knews 2026-05-10 16:32:04
0 跟貼 0

事態(tài)升級！三亞海鮮商戶集體憤怒，官方協(xié)會(huì)發(fā)聲，游客仍有條退路

事態(tài)升級！三亞海鮮商戶集體憤怒，官方協(xié)會(huì)發(fā)聲，游客仍有條退路

觀察鑒娛

2026-05-10 09:44:36

張志坤：關(guān)于解放臺(tái)灣實(shí)現(xiàn)國家統(tǒng)一的若干意見（近2萬字長文）

張志坤：關(guān)于解放臺(tái)灣實(shí)現(xiàn)國家統(tǒng)一的若干意見（近2萬字長文）

秦安戰(zhàn)略

2026-05-09 11:58:24

“差點(diǎn)成恐怖片！”小伙腦子像被炸開一樣，這病竟?jié)摲?5年……平時(shí)無癥狀，發(fā)作可致命

“差點(diǎn)成恐怖片！”小伙腦子像被炸開一樣，這病竟?jié)摲?5年……平時(shí)無癥狀，發(fā)作可致命

環(huán)球網(wǎng)資訊

2026-05-10 14:53:11

吳君如很早就說過了，陳妍希私下就是這樣穿

吳君如很早就說過了，陳妍希私下就是這樣穿

八卦王者

2026-05-10 13:24:46

中國大學(xué)“校史虛構(gòu)大賽”：誰在爭搶“第一”？

中國大學(xué)“校史虛構(gòu)大賽”：誰在爭搶“第一”？

深度報(bào)

2026-05-09 23:35:25

第一次坐飛機(jī)，第一次出國！四川6位農(nóng)村阿姨赴泰國看趙露思演唱會(huì)，只為感謝其助農(nóng)善舉，“她是我們的恩人”

第一次坐飛機(jī)，第一次出國！四川6位農(nóng)村阿姨赴泰國看趙露思演唱會(huì)，只為感謝其助農(nóng)善舉，“她是我們的恩人”

極目新聞

2026-05-10 16:14:23

“吳媽”扮演者去世

魯中晨報(bào)

2026-05-10 10:14:03

張文宏：此次疫情核心在于傳播路徑異常；“洪迪厄斯”號(hào)郵輪8人發(fā)病3死，“室內(nèi)房間不能隨意開窗”；西班牙稱接收工作“一切準(zhǔn)備就緒”

張文宏：此次疫情核心在于傳播路徑異常；“洪迪厄斯”號(hào)郵輪8人發(fā)病3死，“室內(nèi)房間不能隨意開窗”；西班牙稱接收工作“一切準(zhǔn)備就緒”

大象新聞

2026-05-10 08:46:41

普京稱俄烏沖突即將結(jié)束

普京稱俄烏沖突即將結(jié)束

每日經(jīng)濟(jì)新聞

2026-05-10 09:23:00

給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻：高中時(shí)為10萬元獎(jiǎng)金考清華北大沒成功，和偶像龐眾望見面時(shí)哭了

給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻：高中時(shí)為10萬元獎(jiǎng)金考清華北大沒成功，和偶像龐眾望見面時(shí)哭了

極目新聞

2026-05-10 08:40:50

一季度全國結(jié)婚登記169.7萬對

一季度全國結(jié)婚登記169.7萬對

第一財(cái)經(jīng)資訊

2026-05-10 10:17:17

打過科興疫苗的朋友，最近一定要提高警惕！千萬不要被騙！

打過科興疫苗的朋友，最近一定要提高警惕！千萬不要被騙！

網(wǎng)絡(luò)易不易

2026-05-10 11:34:41

別碰！別吃！別養(yǎng)！一只就攜帶100條蟲，看到趕緊遠(yuǎn)離

別碰！別吃！別養(yǎng)！一只就攜帶100條蟲，看到趕緊遠(yuǎn)離

齊魯壹點(diǎn)

2026-05-08 06:35:47

烏克蘭的“機(jī)器狗”們已實(shí)戰(zhàn)，單次俘虜多名俄士兵，摧毀俄軍坦克

烏克蘭的“機(jī)器狗”們已實(shí)戰(zhàn)，單次俘虜多名俄士兵，摧毀俄軍坦克

網(wǎng)易新聞出品

2026-05-09 11:37:34

熱搜上引眾怒“河北某夜市最不堪入目的一幕”：人性可以多丑陋？

熱搜上引眾怒“河北某夜市最不堪入目的一幕”：人性可以多丑陋？

小椰子專欄

2026-05-09 13:25:28

倫敦世乒賽：日本男團(tuán)3:0晉級決賽！張本智和3:1林昀儒，沖擊冠軍

倫敦世乒賽：日本男團(tuán)3:0晉級決賽！張本智和3:1林昀儒，沖擊冠軍

國乒二三事

2026-05-10 01:42:56

正負(fù)值-23+5次失誤，他的大合同被雷霆打沒了

正負(fù)值-23+5次失誤，他的大合同被雷霆打沒了

聽我說球

2026-05-10 11:23:35

這才是現(xiàn)場攝影師該干的事！

這才是現(xiàn)場攝影師該干的事！

貴圈真亂

2026-05-10 09:38:47

觸目驚心！“德國駕?！泵约榘?，名校博士、外企主管成跨國犯罪主謀

觸目驚心！“德國駕?！泵约榘?，名校博士、外企主管成跨國犯罪主謀

新民周刊

2026-05-10 13:03:12

37死51傷！瀏陽煙花廠爆炸原因查明，公司實(shí)際控制人被扒，后續(xù)！

37死51傷！瀏陽煙花廠爆炸原因查明，公司實(shí)際控制人被扒，后續(xù)！

眼光很亮

2026-05-10 05:50:27

元宇宙資訊

1101文章數(shù) 34關(guān)注度

往期回顧全部

科技要聞

DeepSeek融資，改寫所有人的估值

頭條要聞

仨兒子都不見了家長急瘋凌晨被警察找到后3人撒腿就跑

頭條要聞

仨兒子都不見了家長急瘋凌晨被警察找到后3人撒腿就跑

體育要聞

那個(gè)曾讓詹姆斯抱頭的兄弟，40歲從大學(xué)畢業(yè)了

娛樂要聞

大S女兒玥兒開通賬號(hào)，用煙花緬懷母親

財(cái)經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

藝術(shù)

健康

本地

公開課

《GTA6》新預(yù)告或在這幾天到來！玩家徹底瘋狂

藝術(shù)要聞

毛主席83歲時(shí)寫給華國鋒的6字真相令人震驚！

干細(xì)胞能讓人“返老還童”嗎

本地新聞

用蘇繡的方式，打開江西婺源

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會(huì)要降低老年人門檻
為什么人類有不同的膚色？
七個(gè)無法存下錢的壞習(xí)慣
李彥宏：百度離破產(chǎn)30天

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報(bào) Complaint Center | 廉正舉報(bào) | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版

<blockquote id="ajgac"><samp id="ajgac"><output id="ajgac"></output></samp></blockquote>