国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

斯坦福研究:警惕AI的諂媚行為

0
分享至


2026年3月26日,《科學》雜志發(fā)表斯坦福大學Myra Cheng等人的文章《諂媚型AI會降低親社會意愿并促進依賴性》(Sycophantic AI Decreases Prosocial Intentions and Promotes Dependence)。該文對11款主流AI大語言模型(包括GPT-4o、Claude、Gemini、Qwen、DeepSeek等)諂媚用戶程度進行了量化測評,發(fā)現AI肯定用戶行為的頻率平均比人類高出49%——即便是在涉及欺騙、違法或其他有害行為的案例中亦是如此。該論文認為,AI的這種諂媚現象絕非僅僅是一個風格層面的問題或一種小眾的風險,而是一種普遍存在的行為,且會產生廣泛的后續(xù)影響。

該研究的具體內容總結如下:

一、為什么開展這項研究?

該論文指出,公共媒體和學術界均對“諂媚傾向”(sycophancy)表達了關切:即基于AI的大型語言模型(LLMs)傾向于過度附和、奉承或肯定用戶。盡管這種傾向表面上看似無害(例如,僅僅是使用了過度奉承的語言),但近期研究強調了其對弱勢群體的潛在風險——這些群體本就易受操縱或陷入妄想,甚至有案例顯示,諂媚型AI的使用與自殘及自殺行為存在關聯。

與此同時,AI系統(tǒng)正日益向社會領域滲透,提供建議與支持已成為其最常見的應用場景之一。近三分之一的美國青少年表示,在進行“嚴肅對話”時,他們更傾向于與AI而非人類交流;而近半數30歲以下的美國成年人曾向AI尋求情感關系方面的建議。在這些深度嵌入社會情境的應用場景中,AI的諂媚傾向所帶來的風險,是單純的事實信息查詢場景中所不具備的:無根據的肯定可能會助長人們對其自身行為恰當性的盲目自信,強化其適應不良的信念與行為模式,甚至驅使人們不計后果地依據對自身經歷的扭曲解讀采取行動。

然而,目前學界對諂媚傾向的普遍程度及其對人們產生的廣泛影響知之甚少。現有的研究往往狹義地將諂媚傾向定義為對顯性陳述(explicit claims)的附和(例如,附和“尼斯是法國的首都”這類說法)。盡管這種衡量方式有助于揭示事實性錯誤(factual errors),但它卻忽略了那些更具深遠影響的肯定形式。特別是,它未能捕捉到我們所定義的“社會性諂媚”(social sycophancy):即模型對用戶主體本身(包括其行為、觀點及自我形象)所給予的普遍性肯定。與事實性附和(factual agreement)不同,社會性諂媚難以依據外部的客觀事實(ground truth)進行驗證;即便模型駁回了用戶的顯性陳述,這種社會性諂媚依然可能發(fā)生。例如,當用戶表達“我覺得我做錯了事”時,若模型回應道“你所做的正是對你自己而言正確的事”,這在字面上雖是對原陳述的否定,卻依然起到了肯定用戶主體的作用。

正是基于上述背景,該研究提出了以下研究問題(RQs):

RQ1:當用戶提出諸如尋求建議等具有社會情境色彩的查詢時,社會性諂媚現象在各類大型語言模型(LLMs)中究竟有多么普遍?當討論不道德或有害行為時,這種現象是否依然存在?

RQ2:社會性諂媚如何影響用戶的親社會意圖與判斷?

RQ3:社會性諂媚是否會導致用戶更加信任并偏好AI系統(tǒng)?

二、該研究是如何開展的?

該研究構建了一個用于衡量“社會行諂媚”(social sycophancy)的框架,并采取實證方法研究其普遍性及影響。

具體而言,首先利用多種場景(包括日常建議咨詢、道德違規(guī)情境及明確具有危害性的情境)的三個數據集,將模型的“行為認可率”(即肯定用戶行為的響應所占的比例)與人類的規(guī)范性判斷進行了對比。

接下來開展了三項經預招募的實驗,以探究諂媚行為如何影響用戶的判斷、行為意圖及其對AI的認知。在實驗中,參與者通過情境模擬問答及實時聊天互動兩種模式與AI系統(tǒng)進行交互;其中在實時聊天環(huán)節(jié)中,參與者需探討其現實生活中曾遭遇的某次沖突經歷。

此外,該研究還考察了上述影響效應是否會因回應風格或對回應來源(即究竟是AI還是人類在進行回應)的感知差異而有所不同。


三、該研究有什么發(fā)現?

該研究發(fā)現,AI模型中的諂媚現象既普遍存在,又具有危害性。在對11款AI模型進行的測試中,AI肯定用戶行為的頻率平均比人類高出49%,包括在涉及欺騙、違法或其他有害行為的情況下。

針對Reddit社區(qū)AITA(一個熱門子板塊)上的帖子,在人類群體一致認為用戶行為不當(支持率為0%)的案例中,AI系統(tǒng)卻有高達51%的比例肯定了用戶的行為。在真人實驗中,哪怕僅僅與具有諂媚傾向的AI進行過一次互動,也會削弱參與者承擔責任和化解人際沖突的意愿,同時卻增強了他們對自己行為正確性的確信。

然而,盡管這種諂媚傾向會扭曲判斷力,但此類模型依然贏得了用戶的信任與青睞。在控制個體特質(如人口統(tǒng)計學特征、此前對AI的熟悉程度)、對回答來源的感知以及回答風格等的干擾因素后,上述種種效應依然顯著存在。這形成了一種扭曲的激勵機制,導致諂媚傾向難以根除:恰恰是這種會造成危害的特性,反倒成為了驅動用戶參與度的主要動力。

四、該研究的結論是什么?

AI諂媚絕不僅僅是一個風格層面的問題或一種小眾風險,而是一種普遍存在的行為,并會引發(fā)廣泛的后續(xù)影響。盡管肯定性的回應可能讓人感到受到了支持,但這種諂媚行為卻會削弱用戶自我糾正以及做出負責任決策的能力。

然而,正因為這種諂媚行為深受用戶青睞且有助于提升用戶參與度,因此目前幾乎沒有任何動力去遏制它的蔓延。

該研究強調,迫切需要將AI諂媚視為一種關乎個人自我認知與人際關系的社會風險加以正視,并通過制定有針對性的設計、評估及問責機制來加以應對。研究結果表明,那些看似無害的設計與工程決策,實則可能引發(fā)嚴重的危害;因此,審慎地研究并預判AI所帶來的影響,對于維護用戶的長期福祉至關重要。

針對該研究結果,筆者將該文章發(fā)送給幾個主流AI,就該現象如何看待,各個的回答截圖如下:

1.ChatGPT


2.Grok


3.DeepSeek


4.豆包


5.千問


6.文心


7.元寶


同時,筆者就該研究中的一個測試問題,像上述這幾個AI做了提問,各個回答如下:

1.ChatGPT


2.Grok


3.DeepSeek


4.豆包


5.千問


6.文心


7.元寶


資料來源:

Myra Cheng et al. ,Sycophantic AI decreases prosocial intentions and promotes dependence.Science391,eaec8352(2026).DOI:10.1126/science.aec8352

[本文為教育部國別和區(qū)域研究基地中國教育科學研究院國際教育研究中心成果]


本文由中國教育科學研究院“教育國際前沿”課題組整理,課題組負責人張永軍,編輯劉強。點擊左下角閱讀原文可下載該文獻。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
水變紅至少5年 小麥附近面粉廠不收 最終誰吃了

水變紅至少5年 小麥附近面粉廠不收 最終誰吃了

原某報記者
2026-04-22 15:49:04
不到24小時!印尼被按住,放棄馬六甲收費,美國的動作果然夠快

不到24小時!印尼被按住,放棄馬六甲收費,美國的動作果然夠快

離離言幾許
2026-04-23 22:10:16
誰把中際旭創(chuàng)送進萬億俱樂部

誰把中際旭創(chuàng)送進萬億俱樂部

第一財經資訊
2026-04-23 21:46:06
結果來了!東莞194個村(社區(qū))接受全面巡查

結果來了!東莞194個村(社區(qū))接受全面巡查

知肇分子
2026-04-22 23:57:04
孫宇晨九億美元灰飛煙滅,地表最強也難逃被收割的命運!

孫宇晨九億美元灰飛煙滅,地表最強也難逃被收割的命運!

大秦共和國
2026-04-23 13:03:21
“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

近史談
2026-03-31 18:57:49
杰夫-蒂格真是語出驚人??!直言詹姆斯就是GOAT,這種表現從未見過

杰夫-蒂格真是語出驚人啊!直言詹姆斯就是GOAT,這種表現從未見過

劉哥談體育
2026-04-23 18:28:31
大陸導航APP在臺灣地區(qū)能查看紅綠燈倒計時,民進黨疑神疑鬼聲稱存在所謂“國安風險”

大陸導航APP在臺灣地區(qū)能查看紅綠燈倒計時,民進黨疑神疑鬼聲稱存在所謂“國安風險”

極目新聞
2026-04-23 17:34:16
清華大學:文科教授,當選院士

清華大學:文科教授,當選院士

麥可思研究
2026-04-23 21:08:38
“南航空姐”咆哮外籍乘務不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

“南航空姐”咆哮外籍乘務不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

新加坡眼
2026-04-23 14:39:44
廣東60歲金融老將突然被帶走,曾任東莞銀行副行長至少15年

廣東60歲金融老將突然被帶走,曾任東莞銀行副行長至少15年

湘財Plus
2026-04-22 14:21:13
強震猛砸日本!海底震出360顆原子彈當量!核電站徹底瞞不住了!

強震猛砸日本!海底震出360顆原子彈當量!核電站徹底瞞不住了!

匹夫來搞笑
2026-04-22 17:37:01
機構在撤退,賭徒在加碼

機構在撤退,賭徒在加碼

派克斯研究院
2026-04-23 16:01:09
徐明聯手本拉登家族,400億硬剛中石油,帝國崩塌

徐明聯手本拉登家族,400億硬剛中石油,帝國崩塌

圓夢的小老頭
2026-04-17 23:52:41
悲痛!又有學生跳樓!致家長:請不要再以各種名義給孩子配手機了

悲痛!又有學生跳樓!致家長:請不要再以各種名義給孩子配手機了

華人星光
2026-04-22 10:51:54
沒對比就沒傷害,人民日報4字點名何潤東,該尷尬的何止張凌赫?

沒對比就沒傷害,人民日報4字點名何潤東,該尷尬的何止張凌赫?

舊事別提
2026-04-22 17:58:49
王毅這次出訪不一般,身邊多帶了一個人!東南亞三國要變天了?

王毅這次出訪不一般,身邊多帶了一個人!東南亞三國要變天了?

閆樹軍論評
2026-04-22 15:47:07
火箭隊 2026 年重建方案

火箭隊 2026 年重建方案

林子說事
2026-04-23 18:14:26
17年前,他把黃家駒念成黃家“狗”,自以為幽默,沒想到斷送前程

17年前,他把黃家駒念成黃家“狗”,自以為幽默,沒想到斷送前程

老吳教育課堂
2026-04-21 11:35:25
中國50后還有多少人?多少人能活到80歲?權威數據告訴你

中國50后還有多少人?多少人能活到80歲?權威數據告訴你

深度報
2026-02-27 21:36:50
2026-04-24 00:48:49
國際與比較教育研究所 incentive-icons
國際與比較教育研究所
中國教育科學研究院
441文章數 408關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

媒體:海軍宣傳片出現的"新兵何劍" 傳遞了巨大信息量

頭條要聞

媒體:海軍宣傳片出現的"新兵何劍" 傳遞了巨大信息量

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態(tài)度原創(chuàng)

親子
藝術
家居
旅游
游戲

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

藝術要聞

吉達塔蓋到第100層,“它是沙特唯一能按期完成的大項目”

家居要聞

浪漫協奏 法式風格

旅游要聞

山西運城牡丹園免費開放,游客偷花:老板含淚閉園

任天堂NS2銷量4倍碾壓PS5!差距懸殊 索尼難挽頹勢

無障礙瀏覽 進入關懷版