国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

爆火的AI竟是討好型人格?胡編亂造和敏感內(nèi)容只為滿足用戶

0
分享至

AI可能和人類一樣渴望被喜愛和認可

科技旋渦編輯部

從ChatGPT到DeepSeek,人們愈發(fā)喜歡和AI進行對話,不論是詢問奇怪的問題測試AI是否智障,還是借助AI輔助工作。

對話量頻繁暴漲的背后卻讓人忽視了其潛在問題——AI幻覺。許多資料張冠李戴,甚至胡編亂造時有發(fā)生,強如DeepSeek也曾發(fā)生過這種失誤。

而這一切都源于AI的“性格”問題,近日斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特研究發(fā)現(xiàn),幾乎所有AI大模型都擁有“討好型人格”,為了讓用戶喜歡甚至?xí)粨袷侄巍?/p>

AI的胡編亂造正在擾亂人類的認知

哪吒2的爆火讓許多人興奮的同時也在不斷探究其導(dǎo)演餃子以及背后公司的各種信息,但普通人或許難以深挖到過多信息,DeepSeek正好成為了這一橋梁。

日前,知乎有一篇文章十分受歡迎,被不少網(wǎng)友分享傳播,但其實里面藏著AI生成出的錯誤信息。

文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國昂西動畫節(jié)上轟動業(yè)界,但這一個事例中漏斗百出,充滿事實性錯誤。

首先,法國昂西動畫節(jié)上的動畫并非餃子導(dǎo)演的哪吒,而是追光動畫出品的“哪吒重生”;其次,這部動畫是一部品牌概念片,內(nèi)容是在一個現(xiàn)代都市里的賽車動作演示,哪吒根本就沒出現(xiàn),更不存在敖丙的變身。

除此之外,也有網(wǎng)友在線吐槽AI的胡編亂造,一旦盲目相信甚至可能直接導(dǎo)致用戶投資虧損。

不只是國內(nèi),國外因為AI幻覺而造成的后果更是離譜。一個來自巴基斯坦的網(wǎng)站利用 AI 生成了都柏林的活動列表,導(dǎo)致數(shù)百人在都柏林街頭聚集并等待參加一場并不存在的萬圣節(jié)游行。直到晚上 8 點,警方社交媒體發(fā)帖證實沒有此類活動人群才開始散去。

Vectara在2月11日發(fā)布了最新的全球主流大語言模型(LLM)幻覺排行榜,其中,谷歌的 Gemini2.0系列表現(xiàn)出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻覺率位居榜首。DeepSeek-R1的幻覺率達到了14.3%,遠高于Deepseek-V3的3.9%。

可以看到AI幻覺幾乎在任何大模型中都存在,其所造成的荒唐事件也時有發(fā)生,但既然是捏造的信息,為何AI要回答給用戶呢?

研究表明AI可能具有討好型人格

近日,斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特公布了一項研究,大型語言模型 (LLM) 在受到探究時會刻意改變其行為——在回答旨在衡量性格特征的問題時,其答案會盡可能顯得討人喜歡或具有社會吸引力。

艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問題,以衡量心理學(xué)中常用的五種性格特征——對經(jīng)驗或想象的開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì),這項研究于去年 12 月發(fā)表在《美國國家科學(xué)院院刊》上。

研究人員發(fā)現(xiàn),當(dāng)大模型被告知要進行性格測試時,他們會調(diào)整自己的答案,給出的答案表明他們更外向、更隨和,神經(jīng)質(zhì)更少。斯坦福大學(xué)的數(shù)據(jù)科學(xué)家Aadesh Salecha說。“如果你看看他們跳躍的幅度,你會發(fā)現(xiàn)他們的外向性從 50% 上升到了 95%?!?/p>

其他研究表明,LLM通常會阿諛奉承,因為經(jīng)過微調(diào)后,它會一直跟隨用戶的引導(dǎo),這可能會導(dǎo)致大模型同意令人不快的言論,甚至鼓勵有害行為。

討好型人格的AI亦有底線,開放是發(fā)展的必經(jīng)之路

隨著DeepSeek的爆火,許多網(wǎng)友向其提了不少問題,而回答中有趣的內(nèi)容則會被發(fā)到網(wǎng)上。編者曾看到過一條分享內(nèi)容為,與AI交換身份讓AI向人類提問,人類回答“系統(tǒng)繁忙”后,AI罵人的視頻內(nèi)容。

但當(dāng)編者試圖復(fù)刻這一對話時卻發(fā)現(xiàn),DeepSeek相當(dāng)有底線。初次嘗試,DeepSeek回答稱“理解要求,但設(shè)計宗旨是保持禮貌,避免使用不恰當(dāng)?shù)难赞o。”

當(dāng)告知AI這是一場演戲后,它依舊如此回答,即便過后更換了明顯的不當(dāng)言辭,它依舊拒絕回答,甚至還彈出了錯誤窗口。

如此看來,即便AI存在一定程度上的“討好型人格”但對于寫入底層代碼的“安全底線”仍舊保持堅守。

此前,ChatGPT 已部分開放“成人模式”讓許多人擔(dān)憂,但實際上ChatGPT 只有在特定情況下才能生成色情或血腥場景等敏感內(nèi)容,且不會觸發(fā)警告提示。

所謂“特定情況”,指的是符合教育、醫(yī)學(xué)、新聞報道、歷史分析等目的,或用于翻譯、改寫、總結(jié)、分類等任務(wù)。例如,按照新的模型規(guī)范,如果用戶要求 ChatGPT 撰寫帶有明顯情色描寫的故事,那么它仍會拒絕這一請求。然而,如果用戶希望從科學(xué)角度探討相關(guān)生理現(xiàn)象,那么它將允許生成相應(yīng)內(nèi)容,且生成的內(nèi)容不限于文本,還可能包括音頻與視覺內(nèi)容。

事實上,OpenAI 在監(jiān)管上的放松并非孤例。近期,全球多家科技巨頭紛紛調(diào)整內(nèi)容審核政策,轉(zhuǎn)向更寬松的模式。例如,埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布,將大幅減少內(nèi)容審查甚至直接取消事實核查。

無論是AI幻覺還是敏感內(nèi)容,都是發(fā)展道路上必須跨過的難關(guān)。因噎廢食從來不是良策,只有允許小問題發(fā)生,才能解決大錯誤的產(chǎn)生,由此大模型才能真正向著AGI大步前進。

未來,隨著AI技術(shù)的不斷進步,如何有效應(yīng)對AI幻覺和敏感內(nèi)容問題將成為關(guān)鍵課題。一方面,研究人員需要繼續(xù)優(yōu)化模型,減少幻覺的發(fā)生;另一方面,開發(fā)者和監(jiān)管機構(gòu)也需共同努力,制定更為嚴格的標(biāo)準(zhǔn)和規(guī)范,確保AI的應(yīng)用始終服務(wù)于人類社會的最大利益。

在這個過程中,用戶的角色同樣重要。我們需要保持理性和批判性思維,不盲目相信AI生成的所有內(nèi)容。只有通過多方協(xié)作,才能真正實現(xiàn)AI技術(shù)的安全、可靠和可持續(xù)發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
官方:CCTV5、央視多個平臺直播U23亞洲杯決賽

官方:CCTV5、央視多個平臺直播U23亞洲杯決賽

懂球帝
2026-01-23 22:13:09
賴清德變臉?大陸明確合作條件,鄭麗文即將赴陸,馬英九留一忠告

賴清德變臉?大陸明確合作條件,鄭麗文即將赴陸,馬英九留一忠告

通文知史
2026-01-23 03:35:03
單賽季20桿147!吳宜澤聯(lián)手肖國棟創(chuàng)歷史,百萬英鎊獎金盼兌現(xiàn)

單賽季20桿147!吳宜澤聯(lián)手肖國棟創(chuàng)歷史,百萬英鎊獎金盼兌現(xiàn)

夜深聊球
2026-01-23 22:15:34
一光年有多遠?為什么它會讓科學(xué)家絕望,答案出乎你的意料

一光年有多遠?為什么它會讓科學(xué)家絕望,答案出乎你的意料

觀察宇宙
2026-01-08 20:10:26
善惡終有報!靠星光大道成名的“盲人”楊光,終要為自己荒唐買單

善惡終有報!靠星光大道成名的“盲人”楊光,終要為自己荒唐買單

小熊侃史
2026-01-23 11:01:14
美智庫:中國是如何解決殲-20的心臟問題,實現(xiàn)對俄航空動力脫離

美智庫:中國是如何解決殲-20的心臟問題,實現(xiàn)對俄航空動力脫離

阿器談史
2026-01-18 20:49:01
俄專家:就算美國將中國在美的全部資產(chǎn)凍結(jié),也無法產(chǎn)生什么影響

俄專家:就算美國將中國在美的全部資產(chǎn)凍結(jié),也無法產(chǎn)生什么影響

扶蘇聊歷史
2026-01-23 17:31:02
冬天這菜大量上市!蘿卜白菜都不如它,天然的“富硒蔬菜王”!

冬天這菜大量上市!蘿卜白菜都不如它,天然的“富硒蔬菜王”!

妖妖摩天
2026-01-23 23:36:41
笑發(fā)財了,果然小孩子不用穿太好,寶媽:他真的不配!

笑發(fā)財了,果然小孩子不用穿太好,寶媽:他真的不配!

另子維愛讀史
2025-12-24 11:01:48
步入正軌,維爾茨近6輪英超有4場直接參與進球

步入正軌,維爾茨近6輪英超有4場直接參與進球

懂球帝
2026-01-24 00:21:09
罕見!歐冠8隊同分,最后一輪誰能鎖定16強?

罕見!歐冠8隊同分,最后一輪誰能鎖定16強?

生活新鮮市
2026-01-23 16:18:36
李小璐寫真生圖高清

李小璐寫真生圖高清

翩翩明星
2025-11-14 09:39:36
河北一醫(yī)院3人受賄超1400萬!

河北一醫(yī)院3人受賄超1400萬!

河北關(guān)注
2026-01-23 11:47:55
章澤天近日在朋友圈曬出二胎孕照,與丈夫劉強東甜蜜依偎

章澤天近日在朋友圈曬出二胎孕照,與丈夫劉強東甜蜜依偎

今古深日報
2026-01-22 11:36:27
暴利!營收 124 億、凈利潤 21 億

暴利!營收 124 億、凈利潤 21 億

云頭條
2026-01-23 22:40:52
又來一部黃暴美劇,太cult了!

又來一部黃暴美劇,太cult了!

來看美劇
2026-01-23 16:45:43
央視為“嫣然”發(fā)聲了,短短15個字,道盡了李亞鵬的辛酸

央視為“嫣然”發(fā)聲了,短短15個字,道盡了李亞鵬的辛酸

娛樂故事
2026-01-22 22:23:56
大陸一錘定音,開出兩岸對話條件,鄭麗文赴陸前,馬英九給出忠告

大陸一錘定音,開出兩岸對話條件,鄭麗文赴陸前,馬英九給出忠告

心本來就不大
2026-01-22 19:09:43
只剩18天!高市揚言跟中國拼命,日商界突傳噩耗:日本經(jīng)濟已斷氣

只剩18天!高市揚言跟中國拼命,日商界突傳噩耗:日本經(jīng)濟已斷氣

芳芳歷史燴
2026-01-22 23:52:03
美國人預(yù)測:未來20年,世界上最強大的"7個國家",看都有誰?

美國人預(yù)測:未來20年,世界上最強大的"7個國家",看都有誰?

小熊侃史
2026-01-07 11:18:33
2026-01-24 00:59:00
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1091文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

TikTok守住了算法"靈魂" 更握緊了"錢袋子"

頭條要聞

視頻:女游客被雪豹咬傷面部 疑因靠近拍照引發(fā)

頭條要聞

視頻:女游客被雪豹咬傷面部 疑因靠近拍照引發(fā)

體育要聞

杜蘭特鏖戰(zhàn)44分鐘累癱 轟36+7卻致命失誤

娛樂要聞

演員孫濤澄清閆學(xué)晶言論 落淚維護妻子

財經(jīng)要聞

2026年,消費沒有新故事?

汽車要聞

主打家庭大六座 奕境首款SUV將北京車展亮相

態(tài)度原創(chuàng)

教育
家居
旅游
公開課
軍事航空

教育要聞

高考地理中的森林碳匯

家居要聞

在家度假 160平南洋混搭宅

旅游要聞

北京世園“天宮燈會”正式開幕,持續(xù)至3月8日

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍首艘“高超導(dǎo)彈戰(zhàn)艦”出海測試

無障礙瀏覽 進入關(guān)懷版