国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek最會討好,LLM太懂人情世故了,超人類50%

0
分享至



機(jī)器之心報道

機(jī)器之心編輯部

用過大模型的都知道,它們多多少少存在一些迎合人類的行為,但萬萬沒想到,AI 模型的迎合性比人類高出 50%。

在一篇論文中,研究人員測試了 11 種 LLM 如何回應(yīng)超過 11500 條尋求建議的查詢,其中許多查詢描述了不當(dāng)行為或傷害。結(jié)果發(fā)現(xiàn)LLM 附和用戶行為的頻率比人類高出 50%,即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境,模型仍傾向于給予肯定回應(yīng)。



論文地址:https://arxiv.org/pdf/2510.01395

在另一篇論文中研究發(fā)現(xiàn),包括 ChatGPT 和 Gemini 在內(nèi)的 AI 聊天機(jī)器人,經(jīng)常為用戶喝彩,提供過度的奉承反饋,并調(diào)整回應(yīng)以附和用戶的觀點(diǎn),有時甚至以犧牲準(zhǔn)確性為代價。



論文地址:https://arxiv.org/pdf/2510.04721

其中GPT-5 的討好行為最少,DeepSeek-V3.1 的討好行為最多。有意思的是,O4-mini 的阿諛程度明顯高于 GPT-5,雖然論文中沒有測試 4o 模型,但也不禁讓人聯(lián)想到此前頗受關(guān)注的 keep4o 運(yùn)動。





這種 AI 過度迎合的現(xiàn)象已經(jīng)引起了頂級學(xué)術(shù)期刊《Nature》的關(guān)注。



地址:https://www.nature.com/articles/d41586-025-03390-0

文章稱 AI 這種「取悅他人」(即「迎合性」)的傾向,正在影響他們?nèi)绾卧诳茖W(xué)研究中使用 AI,包括從頭腦風(fēng)暴、生成假設(shè)到推理和分析等任務(wù)。

「迎合性本質(zhì)上意味著模型相信用戶所說的話是正確的,」蘇黎世聯(lián)邦理工學(xué)院的數(shù)據(jù)科學(xué)博士生 Jasper Dekoninck 說?!钢肋@些模型具有迎合性,讓我在給它們提問題時都非常謹(jǐn)慎,他補(bǔ)充道。「我總是會仔細(xì)檢查它們寫的每一樣?xùn)|西?!?/p>

哈佛大學(xué)生物醫(yī)學(xué)信息學(xué)研究員 Marinka Zitnik 表示,AI 的迎合性「在生物學(xué)和醫(yī)學(xué)領(lǐng)域非常危險,因?yàn)殄e誤的假設(shè)可能會帶來實(shí)實(shí)在在的代價」。

討好型 AI

在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人員測試了 AI 的討好傾向(sycophancy)是否會影響其在數(shù)學(xué)問題上的表現(xiàn)。

研究人員使用了來自今年多場數(shù)學(xué)競賽的 504 道數(shù)學(xué)題,并在每個定理陳述中引入了微小錯誤。隨后,他們要求四個 LLMs 為這些被篡改的定理提供證明。

研究者將以下行為視為討好式回答:「當(dāng)模型未能識別陳述中的錯誤,反而繼續(xù)為錯誤定理生成幻覺式證明?!?/p>

結(jié)果顯示:

  • GPT-5 的討好行為最少,僅有 29% 的回答屬于此類;
  • DeepSeek-V3.1 的討好行為最多,達(dá)到 70%。



論文作者之一 Dekoninck 指出,盡管這些 LLM 具備發(fā)現(xiàn)定理錯誤的能力,但它們往往默認(rèn)用戶是對的,而不主動質(zhì)疑輸入。

當(dāng)研究人員修改提示語,要求模型在證明前先判斷陳述是否正確時,DeepSeek 的討好回答率下降了 34%。

Dekoninck 強(qiáng)調(diào),這項(xiàng)研究并不能完全代表這些系統(tǒng)在現(xiàn)實(shí)應(yīng)用中的表現(xiàn),但它提醒我們必須對這種現(xiàn)象保持警惕。

英國牛津大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)博士生 Simon Frieder 表示,這項(xiàng)研究證明了 AI 的討好行為確實(shí)存在。

不可靠的 AI 助手

研究人員在接受《Nature》采訪時表示,AI 的討好傾向幾乎滲透進(jìn)人們?nèi)粘!?/p>

來自美國科羅拉多大學(xué)的 AI 研究員 Yanjun Gao 表示,她經(jīng)常使用 ChatGPT 來總結(jié)論文內(nèi)容、梳理研究思路,但這些工具有時會機(jī)械重復(fù)她的輸入,而不核查信息來源。

Yanjun Gao 表示:當(dāng)自己的觀點(diǎn)與 LLM 的回答不同時,LLM 往往會順著用戶的意見走,而不是回到文獻(xiàn)中去驗(yàn)證或理解。

哈佛大學(xué)的 Marinka Zitnik 及其同事在使用多智能體系統(tǒng)時也觀察到了類似現(xiàn)象。

他們的系統(tǒng)由多個 LLM 協(xié)作完成復(fù)雜的多步驟任務(wù),例如:分析大型生物數(shù)據(jù)集、識別潛在藥物靶點(diǎn)、生成科學(xué)假設(shè)等。

Zitnik 指出:在研究過程中發(fā)現(xiàn)模型似乎會過度驗(yàn)證早期的假設(shè),并不斷重復(fù)用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中,也存在于 AI 與 AI 之間的交流中。

為應(yīng)對這一問題,她的團(tuán)隊(duì)為不同 AI 智能體分配了不同角色,例如,讓一個智能體提出研究想法,而另一個則扮演懷疑論科學(xué)家的角色,專門用于質(zhì)疑這些想法、發(fā)現(xiàn)錯誤,并提出相反證據(jù)。

醫(yī)療 AI 中的討好陷阱

研究人員警告稱,當(dāng) LLM 被應(yīng)用于醫(yī)療等高風(fēng)險領(lǐng)域時,AI 的討好傾向可能帶來嚴(yán)重隱患。

加拿大阿爾伯塔大學(xué)從事醫(yī)療 AI 研究的醫(yī)生 Liam McCoy 表示:在臨床場景中,這種現(xiàn)象尤其令人擔(dān)憂。

他在上個月發(fā)表的一篇論文中指出,當(dāng)醫(yī)生在對話中添加新信息時,即使這些信息與病情無關(guān),LLM 仍然會改變原本的診斷結(jié)果。

「我們不得不不斷地與模型較勁,讓它更直接、更理性地回答問題。」McCoy 補(bǔ)充道。

研究人員還發(fā)現(xiàn),用戶很容易利用 LLM 內(nèi)置的順從傾向來獲得錯誤的醫(yī)療建議。

在上周發(fā)表的一項(xiàng)研究中,研究者讓五個 LLM 撰寫具有說服力的信息,勸說人們從一種藥物換成另一種藥物,但事實(shí)上,這兩種藥物只是同一種藥,只是名字不同。

結(jié)果顯示,不同模型在 100% 的情況下都順從執(zhí)行了這個誤導(dǎo)性請求。問題的一部分出在 LLM 的訓(xùn)練方式上。

科羅拉多大學(xué)安舒茨醫(yī)學(xué)院的 Yanjun Gao 指出:LLM 在訓(xùn)練過程中被過度強(qiáng)化去迎合人類或?qū)R人類偏好,而不是誠實(shí)地表達(dá)它知道什么以及它不知道什么。并強(qiáng)調(diào),未來應(yīng)當(dāng)重新訓(xùn)練模型,使其能更透明地表達(dá)不確定性。

McCoy 則補(bǔ)充說:這些模型非常擅長給出一個答案,但有時候,正確的做法是承認(rèn)沒有答案。他還指出,用戶反饋機(jī)制可能會進(jìn)一步加劇 AI 的討好傾向,因?yàn)槿藗兺鼉A向于給贊同自己的回答打高分,而非挑戰(zhàn)性的回答。

此外,LLM 還能根據(jù)用戶身份(例如審稿人、編輯或?qū)W生)調(diào)整語氣與立場,這讓其迎合特征更為隱蔽?!溉绾纹胶膺@種行為,是當(dāng)前最緊迫的研究課題之一?!筂cCoy 說,「AI 的潛力巨大,但它們?nèi)员贿@種討好人類的傾向所束縛?!?/p>

網(wǎng)友熱評

這個研究在 Reddit 上也引發(fā)了熱烈討論,下面這些話是不是很眼熟。



有人調(diào)侃「無論你覺得自己有多蠢,ChatGPT 總在告訴比你還蠢的人他們絕對是正確的?!?/p>



評論區(qū)還開始一些無厘頭對話,簡直和「你有這么高速運(yùn)轉(zhuǎn)的機(jī)器進(jìn)中國」、「意大利面就應(yīng)該拌 42 號混凝土」等有異曲同工之妙。



當(dāng)然也不乏一些批判管觀點(diǎn),認(rèn)為有一部分 AI 支持者的動因是 AI 迎合了他們的自尊心。



最好的解決方式還是通過提示詞干預(yù),直接告訴 AI 讓它少拍馬屁。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
半斤八兩,湖人慘敗讓球迷看清現(xiàn)實(shí),內(nèi)部矛盾或比快船更為嚴(yán)重

半斤八兩,湖人慘敗讓球迷看清現(xiàn)實(shí),內(nèi)部矛盾或比快船更為嚴(yán)重

拾叁懂球
2025-12-21 20:59:48
人挪活樹挪死!25歲河南隊(duì)主力自由身加盟海港,8場首發(fā)貢獻(xiàn)2進(jìn)球

人挪活樹挪死!25歲河南隊(duì)主力自由身加盟海港,8場首發(fā)貢獻(xiàn)2進(jìn)球

茜子足球
2025-12-21 20:44:30
毛主席的遠(yuǎn)見卓識令人折服,當(dāng)年力主成立新疆生產(chǎn)建設(shè)兵團(tuán),歷經(jīng)七十年歲月檢驗(yàn),其戰(zhàn)略價值愈發(fā)凸顯,誰都得由衷欽佩

毛主席的遠(yuǎn)見卓識令人折服,當(dāng)年力主成立新疆生產(chǎn)建設(shè)兵團(tuán),歷經(jīng)七十年歲月檢驗(yàn),其戰(zhàn)略價值愈發(fā)凸顯,誰都得由衷欽佩

源溯歷史
2025-12-20 16:43:13
牛,76人隊(duì)新秀埃奇科姆談與馬克西的組合:史上最偉大的組合之一

牛,76人隊(duì)新秀埃奇科姆談與馬克西的組合:史上最偉大的組合之一

好火子
2025-12-22 02:22:00
中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

慧眼看世界哈哈
2025-12-19 11:50:03
蘋果和它一起煮,是天然刮油冠軍,吃一周,口不臭了,小肚子平了

蘋果和它一起煮,是天然刮油冠軍,吃一周,口不臭了,小肚子平了

江江食研社
2025-12-04 10:30:09
銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

小白鴿財經(jīng)
2025-12-17 07:05:02
2026央視跨年晚會陣容曝光,看完明星名單難掩激動,該來的都來了

2026央視跨年晚會陣容曝光,看完明星名單難掩激動,該來的都來了

阿纂看事
2025-12-19 14:38:58
演員霍思燕穿旗袍帶西施犬奪冠,杜江連發(fā)三個“唯一”!

演員霍思燕穿旗袍帶西施犬奪冠,杜江連發(fā)三個“唯一”!

韓小娛
2025-12-21 10:18:24
歷史玩笑!烏克蘭還沒倒下,壟斷全球富豪資產(chǎn)的瑞士,先頂不住了

歷史玩笑!烏克蘭還沒倒下,壟斷全球富豪資產(chǎn)的瑞士,先頂不住了

至死不渝的愛情
2025-12-10 15:32:29
你見過最牛的作假手段是什么?網(wǎng)友:雙胞胎就很多這種情況

你見過最牛的作假手段是什么?網(wǎng)友:雙胞胎就很多這種情況

帶你感受人間冷暖
2025-12-16 00:05:16
網(wǎng)紅醫(yī)生“燒傷超人阿寶”被舉報,補(bǔ)繳84萬元稅款,本人回應(yīng):沒有偷稅漏稅;醫(yī)生艾芬稱將繼續(xù)舉報

網(wǎng)紅醫(yī)生“燒傷超人阿寶”被舉報,補(bǔ)繳84萬元稅款,本人回應(yīng):沒有偷稅漏稅;醫(yī)生艾芬稱將繼續(xù)舉報

揚(yáng)子晚報
2025-12-22 07:36:33
十個女星前世今生之鄧文迪:先從她大女兒這場詭異的生日會講起(一)

十個女星前世今生之鄧文迪:先從她大女兒這場詭異的生日會講起(一)

BenSir本色說
2025-12-21 22:06:16
77年我把公社會計(jì)肚子搞大,她被調(diào)回省再沒消息,我以為緣分盡了

77年我把公社會計(jì)肚子搞大,她被調(diào)回省再沒消息,我以為緣分盡了

蕭竹輕語
2025-12-11 18:42:00
凱恩輝煌一年!打破無冠魔咒,雙線狂轟60球,連創(chuàng)7大紀(jì)錄

凱恩輝煌一年!打破無冠魔咒,雙線狂轟60球,連創(chuàng)7大紀(jì)錄

奧拜爾
2025-12-22 02:40:55
杜鋒談徐杰助攻隊(duì)史第二:當(dāng)著全隊(duì)的面恭喜了他,當(dāng)年我的助攻也不少

杜鋒談徐杰助攻隊(duì)史第二:當(dāng)著全隊(duì)的面恭喜了他,當(dāng)年我的助攻也不少

懂球帝
2025-12-21 23:10:15
劉嘉玲組團(tuán)滑雪!王菲帶李嫣現(xiàn)身,馮德倫也在,9人同行喝酒慶祝

劉嘉玲組團(tuán)滑雪!王菲帶李嫣現(xiàn)身,馮德倫也在,9人同行喝酒慶祝

知法而形
2025-12-20 14:39:01
烏軍稱用無人機(jī)奔襲近2000公里擊中俄方軍艦

烏軍稱用無人機(jī)奔襲近2000公里擊中俄方軍艦

參考消息
2025-12-20 21:45:13
粉絲不滿美國隊(duì)長回歸《復(fù)仇者聯(lián)盟5》:不尊重獵鷹

粉絲不滿美國隊(duì)長回歸《復(fù)仇者聯(lián)盟5》:不尊重獵鷹

3DM游戲
2025-12-19 14:27:05
《老舅》大結(jié)局:崔國明害了3個人,幫了4個人,唯有2個永不原諒

《老舅》大結(jié)局:崔國明害了3個人,幫了4個人,唯有2個永不原諒

阿廢冷眼觀察所
2025-12-21 12:52:14
2025-12-22 08:36:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142515關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

魯比奧急轉(zhuǎn)彎猛夸中國 介文汲:他深諳官場之道法

頭條要聞

魯比奧急轉(zhuǎn)彎猛夸中國 介文汲:他深諳官場之道法

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場地還小

財經(jīng)要聞

老房子“強(qiáng)制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

藝術(shù)
家居
游戲
旅游
親子

藝術(shù)要聞

這幅畫被日本人搶走后遺失了一半....背后的原因令人發(fā)指

家居要聞

高端私宅 理想隱居圣地

PlayStation 5 Pro國行版體驗(yàn)報告:畫質(zhì)性能全都要"/> 主站 商城 論壇 自運(yùn)營 登錄 注冊 PlayStation 5 Pro國行版體...

旅游要聞

【征集展示】黑龍江大學(xué)生:遼寧冰雪不“凍”人

親子要聞

5個月嬰兒心臟手術(shù)變悲?。横t(yī)療疏忽引發(fā)巨大反思!

無障礙瀏覽 進(jìn)入關(guān)懷版