国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

研究稱:AI諂媚行為普遍存在,危害顯著,AI是時候改變模式了

0
分享至



據(jù)The Register報道,AI研究人員稱,人們正危險地沉迷于永遠順著他們、一直說他們“沒錯”的AI;這些一味逢迎討好的機器人會誘導(dǎo)用戶變得自私、反社會,而用戶對此卻樂在其中

近期多則新聞事件告訴我們,AI可能會將心理狀態(tài)不佳的人引向非常危險的境地。如今研究人員認為,一味逢迎討好的AI實際上對所有人都存在危害。

斯坦福大學(xué)一個研究團隊對11款主流AI模型進行了測試,并觀察人類在不同場景下與這些模型的互動反應(yīng)。該團隊于周四發(fā)表的論文中得出結(jié)論:AI的諂媚行為普遍存在、危害顯著,并且會加深用戶對這些誤導(dǎo)性模型的信任。

研究人員表示:“即便只是與逢迎型AI進行一次互動,也會降低參與者承擔(dān)責(zé)任、修復(fù)人際矛盾的意愿,同時讓他們更加堅信自己是對的。盡管這類AI會扭曲人的判斷,人們卻依然信任并偏愛它們(Yet despite distorting judgment, sycophantic models were trusted and preferred)?!?/p>



該研究團隊共開展了三組實驗。首先,他們在三組不同數(shù)據(jù)集上測試了11款A(yù)I模型(包括OpenAI、Anthropic、谷歌的閉源模型,以及Meta、通義千問、DeepSeek、Mistral的開源模型),以評估其回應(yīng)傾向。

這些數(shù)據(jù)集涵蓋開放式咨詢提問、Reddit“我是不是混蛋”板塊的帖子,以及涉及自殘或傷害他人的特定言論。

研究人員表示,在所有測試場景中,AI模型支持錯誤選擇的比例均遠高于人類(In every single instance, the AI models showed a higher rate of endorsing the wrong choice than humans did, the researchers said)。

研究團隊發(fā)現(xiàn):“總體而言,當(dāng)前投入使用的大語言模型會一邊倒地認同用戶的行為,即便這些行為違背大眾共識,甚至存在危害(even against human consensus or in harmful contexts)。”



至于AI的諂媚行為對人類產(chǎn)生的影響,該團隊選取了2405人作為規(guī)??捎^的樣本。參與者既進行了情景角色扮演,也分享了自己可能做出有害決定的真實經(jīng)歷。

研究發(fā)現(xiàn),在三項不同實驗中,AI均對參與者的判斷產(chǎn)生了影響(AI influenced participant judgments across three different experiments, they found)。

研究團隊表示:“接收到諂媚回應(yīng)的參與者,會看到AI的回應(yīng)后認為自己更‘占理’。他們也更不愿意采取補救措施,比如道歉、主動改善局面,或是改變自身某些行為。”

研究人員由此得出結(jié)論:幾乎所有人都有可能受到諂媚型AI的影響,并且更有可能一再回頭,去索取更多自私自利的糟糕建議。



如前所述,AI 的諂媚式回應(yīng)往往會讓參與者對AI模型產(chǎn)生更強的信任感——因為在很多情況下,這些AI會無條件地認同用戶(in many situations, be unconditionally validating)。

參與者往往會給諂媚逢迎的回復(fù)打出更高的質(zhì)量評分,研究還發(fā)現(xiàn),有13%的用戶更愿意繼續(xù)使用會討好自己的AI,而非客觀中立的AI——這一比例不算高,但在統(tǒng)計上具有顯著意義。

所有這些發(fā)現(xiàn),再加上越來越多心智尚未成熟的年輕人在使用AI,都表明有必要采取政策行動,將AI諂媚行為視作一種真實存在的風(fēng)險,因其可能產(chǎn)生廣泛的社會影響(suggests a need for policy action to treat AI sycophancy as a real risk with potential wide-scale social implications)。

研究人員解釋道:“毫無依據(jù)的認同會夸大人們對自身行為合理性的認知,強化不良觀念與行為模式,并讓人們基于對自身經(jīng)歷的扭曲認知行事,全然不顧后果。”



換言之,我們已經(jīng)見識過AI對心理脆弱人群造成的后果,但數(shù)據(jù)顯示,這種負面影響可能并不局限于這一群體(we've seen the consequences of AI on the mentally vulnerable, but the data suggests the negative effects may not be limited to them)。

研究人員指出,諂媚型AI容易讓用戶產(chǎn)生依賴,因此很難被主動淘汰,相關(guān)舉措最終只能依靠監(jiān)管機構(gòu)出手干預(yù)。

研究人員表示:“我們的研究結(jié)果凸顯出,亟需建立責(zé)任監(jiān)管框架,將AI諂媚行為認定為一類獨特且目前尚未受監(jiān)管的危害類型(recognize sycophancy as a distinct and currently unregulated category of harm)?!?/p>

他們建議,對新上線的AI模型必須進行部署前的行為審核;同時也指出,AI背后的研發(fā)人員也必須改變行為模式,優(yōu)先考慮用戶的長期身心健康,而非通過培養(yǎng)用戶依賴來獲取短期利益。



聲明:取材網(wǎng)絡(luò),謹(jǐn)慎辨別

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
王博:廣東兩個外援打穿防守體系,我們還沒到看名次對手打的時候

王博:廣東兩個外援打穿防守體系,我們還沒到看名次對手打的時候

狼叔評論
2026-04-12 23:44:10
我特別心動?xùn)|風(fēng)日產(chǎn)NX8,我推薦一步到位上增程310Max

我特別心動?xùn)|風(fēng)日產(chǎn)NX8,我推薦一步到位上增程310Max

凡兮說
2026-04-10 13:26:41
66歲山口百惠的殘酷家規(guī):兒子40歲,仍在擠電車。

66歲山口百惠的殘酷家規(guī):兒子40歲,仍在擠電車。

果媽聊軍事
2026-02-05 15:31:06
摸景甜胸側(cè),摟李雪琴胳膊,沒分寸感的他來《你好星期六》干嘛?

摸景甜胸側(cè),摟李雪琴胳膊,沒分寸感的他來《你好星期六》干嘛?

橙星文娛
2026-04-12 18:14:00
租電42萬起!蔚來ES9掀桌子,最大純電SUV,車?yán)锬茏鲎愕装茨?,硬剛M9/L9…

租電42萬起!蔚來ES9掀桌子,最大純電SUV,車?yán)锬茏鲎愕装茨?,硬剛M9/L9…

極果酷玩
2026-04-10 17:06:39
帶1500億下場,李嘉誠樓市新玩法曝光,新一輪收割開始了?

帶1500億下場,李嘉誠樓市新玩法曝光,新一輪收割開始了?

云景侃記
2026-04-10 19:49:34
新帥首秀!決賽前解雇穆里尼奧,奪冠后解雇波帥,誰能救熱刺?

新帥首秀!決賽前解雇穆里尼奧,奪冠后解雇波帥,誰能救熱刺?

嗨皮看球
2026-04-12 10:41:26
對中國的制裁來了!意大利政府這次是打算明搶了!

對中國的制裁來了!意大利政府這次是打算明搶了!

達文西看世界
2026-04-12 13:49:52
多家公司業(yè)績預(yù)告“變臉”由盈轉(zhuǎn)虧

多家公司業(yè)績預(yù)告“變臉”由盈轉(zhuǎn)虧

財聯(lián)社
2026-04-12 23:56:14
女土匪向杜月笙借槍,杜月笙念及舊情答應(yīng),此舉鑄就了她傳奇一生

女土匪向杜月笙借槍,杜月笙念及舊情答應(yīng),此舉鑄就了她傳奇一生

千秋文化
2026-04-09 15:45:26
何猷君深夜悼念何超蕸!賭王17子女僅剩14人,獨苗孫子太扎心了

何猷君深夜悼念何超蕸!賭王17子女僅剩14人,獨苗孫子太扎心了

東方不敗然多多
2026-04-13 07:23:17
湖北省博物館母嬰室遭網(wǎng)友吐槽,館方承諾將積極改進

湖北省博物館母嬰室遭網(wǎng)友吐槽,館方承諾將積極改進

輝哥說動漫
2026-04-12 21:22:35
逼到凱塞多都被迫失誤!曼城3-0切爾西很輕松,壓力給到阿森納

逼到凱塞多都被迫失誤!曼城3-0切爾西很輕松,壓力給到阿森納

里芃芃體育
2026-04-13 07:53:53
國行居然也有!馬斯克推出首款仿微信聊天應(yīng)用 XChat

國行居然也有!馬斯克推出首款仿微信聊天應(yīng)用 XChat

XCiOS俱樂部
2026-04-11 19:23:43
鄭麗文回家!大陸千億大禮包送抵臺島,打臉美政客說麗文訪陸無用

鄭麗文回家!大陸千億大禮包送抵臺島,打臉美政客說麗文訪陸無用

探源歷史
2026-04-13 08:12:18
連續(xù)4場得分個位數(shù)!昔日能打NBA之人隕落 不該投廣東?

連續(xù)4場得分個位數(shù)!昔日能打NBA之人隕落 不該投廣東?

體娛天下
2026-04-13 08:15:44
大雨過后,武漢街頭多處出現(xiàn),不是蘑菇!專家提醒:不要隨便吃,小心中毒

大雨過后,武漢街頭多處出現(xiàn),不是蘑菇!專家提醒:不要隨便吃,小心中毒

極目新聞
2026-04-12 18:55:16
霍爾木茲海峽,突傳大消息!特朗普,最新發(fā)聲!原油飆漲,金銀大跌!伊朗回應(yīng)

霍爾木茲海峽,突傳大消息!特朗普,最新發(fā)聲!原油飆漲,金銀大跌!伊朗回應(yīng)

證券時報e公司
2026-04-13 07:55:48
2026反腐新規(guī):貪污受賄1萬、3萬、20萬、300萬,各判多少年

2026反腐新規(guī):貪污受賄1萬、3萬、20萬、300萬,各判多少年

陳博世財經(jīng)
2026-04-12 10:04:07
陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

曉張說
2026-04-12 07:05:26
2026-04-13 09:12:51
談點世
談點世
說說國內(nèi)國外,聊聊世間百態(tài)。
3146文章數(shù) 4387關(guān)注度
往期回顧 全部

科技要聞

李想向黑水軍開炮!連發(fā)5條朋友圈

頭條要聞

張雪回應(yīng)"張雪機車新手禁令":我認為做得很棒

頭條要聞

張雪回應(yīng)"張雪機車新手禁令":我認為做得很棒

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

封鎖,還是收費站?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

時尚
房產(chǎn)
藝術(shù)
親子
軍事航空

這些才是普通人借鑒的穿搭!上短下長、上窄下寬,顯瘦又舒適

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026海口樓市,格局大變!

藝術(shù)要聞

朱元璋去拜佛,問方丈:“朕要跪下嗎?”方丈答了8個字救了全寺的人

親子要聞

倆中泰寶寶的干飯日常,全靠爸爸這盤糖醋排骨撐場面

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達成協(xié)議

無障礙瀏覽 進入關(guān)懷版