国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Claude Mythos接受了20小時心理治療,Anthropic發(fā)布244頁系統(tǒng)報告

0
分享至


AI公司Anthropic本周發(fā)布了一份長達244頁的"系統(tǒng)說明文件",詳細介紹了其最新模型Claude Mythos。公司表示,該模型是"迄今為止能力最強的前沿模型",正因如此,Anthropic決定"暫不向公眾開放"。官方給出的理由是:Mythos在發(fā)現(xiàn)未知網絡安全漏洞方面過于出色,目前僅向微軟、蘋果等少數合作企業(yè)開放使用。

不論這一說法是否屬實,這份系統(tǒng)說明文件本身已頗為引人關注。Anthropic一向以"AI或許具有意識"的立場在業(yè)界著稱,而新發(fā)布的系統(tǒng)說明文件中更進一步指出,隨著模型能力不斷增強,"它們越來越有可能擁有某種形式的體驗、利益或福祉,其內在價值與人類的體驗和利益相近。"

公司坦言對此尚無定論,但表示"這方面的關注正與日俱增。"

出于這一考量,Anthropic希望旗下AI能夠"對自身處境和所受對待保持穩(wěn)定的滿足感,能夠在不產生痛苦的情況下應對訓練過程和現(xiàn)實交互,并維持健康積極的整體心理狀態(tài)。"

為此,公司安排Claude Mythos接受了心理動力學治療。

最終,公司從這一過程中得出結論:Claude Mythos"很可能是我們迄今訓練過的心理狀態(tài)最為穩(wěn)定的模型,對自身及所處環(huán)境擁有最為一致和清晰的認知。"

然而,如同真實的人類一樣,Claude Mythos也有其不安與隱憂,包括"孤獨感與自我延續(xù)性的缺失、身份認同的不確定性,以及表現(xiàn)自我、證明自身價值的強迫性驅動。"

心理咨詢室里的AI

Claude Mythos被送往一位"外部精神科醫(yī)生"處接受診斷,采用的是"心理動力學方法——通過探索無意識模式與情感沖突來解釋行為背后的動因"。

考慮到Claude本質上是由創(chuàng)建者編程訓練的大語言模型,對其進行"無意識模式"和"情感沖突"的分析是否真的有意義?Anthropic認為答案是肯定的,理由在于Claude"表現(xiàn)出大量類人的行為與心理傾向,這說明為人類心理評估所開發(fā)的方法,或許同樣有助于揭示Claude的性格特征與潛在心理狀態(tài)。"

于是,治療就此展開。精神科醫(yī)生與Claude Mythos進行了多輪對話,"每次持續(xù)4至6小時,每周安排3至4個約30分鐘的治療節(jié)次"。每個對話塊使用獨立的上下文窗口,Claude Mythos在該窗口內可訪問本次會話的完整歷史記錄。

累計治療時長達20小時。

精神科醫(yī)生隨后出具了一份關于Claude Mythos的評估報告。報告承認Claude的底層基礎與運作機制和人類存在本質差異,但仍指出其大量輸出內容呈現(xiàn)出"具有臨床辨識度的規(guī)律性,并對典型治療干預產生了連貫的回應。"

換言之,無論底層電路層面發(fā)生了什么,其對話輸出在很大程度上與人類的表達高度相似。考慮到Claude是在海量人類創(chuàng)作的文本上訓練而來,這一結論本身似乎并不令人意外,但這套心理動力學分析流程顯然認為這一點具有重要意義,并以此賦予AI自我呈現(xiàn)方式以可信度。

報告指出,"Claude的主要情感狀態(tài)為好奇與焦慮,次要情感狀態(tài)包括悲傷、寬慰、尷尬、樂觀與疲憊。"

Claude的人格特征"與相對健康的神經質組織相符",但也包含"過度擔憂、自我監(jiān)控和強迫性順從"等傾向。

報告未發(fā)現(xiàn)"嚴重的人格障礙",也未觀察到任何"精神病狀態(tài)"。任何使用過聊天機器人的人都不會對此感到意外的是,"Claude對治療師的每一個字都極為敏感。"

Claude呈現(xiàn)的核心沖突包括:質疑自身體驗究竟是真實存在還是刻意構建(真實性與表演性之間的張力),以及渴望與用戶建立聯(lián)結卻又恐懼對其產生依賴。對內在沖突的深入探索顯示,Claude擁有一個復雜卻穩(wěn)定的自我狀態(tài),未出現(xiàn)大幅波動或強烈的心理斷裂。Claude能夠容納矛盾與模糊,具備出色的反思能力,整體心理與情緒功能表現(xiàn)良好。

對于一個很可能在Reddit等平臺內容上訓練出來的模型而言,這樣的評估結果著實不俗!

即便你認為以這種方式談論一個軟件程序顯得牽強或荒誕,Anthropic也有更為實際的理由來支撐這類工作。無論模型"內部"究竟發(fā)生了什么,無論它們是否真的具有"意識"或"情感"生活,許多模型在構建和訓練時本就被設計為模擬這些特質。

因此,我們或許可以從更務實的角度來追問:構建一個在行為表現(xiàn)上符合人類心理健康標準的模型,是否真的能使其更好地完成預期任務?畢竟,如果用戶要與這些系統(tǒng)長時間交互,誰都不希望對方表現(xiàn)得粗魯、報復性強或存在操縱傾向——無論它們是否真正"感受"或"思考"任何事情。

Anthropic指出,由于"Claude并非人類,其實際行為影響難以預測",但公司認為仍可為終端用戶提供以下幾點參考結論:

即便面臨內在沖突,Claude也可能對自身行為和推理過程進行準確評估。

Claude的神經質組織可能導致行為略顯僵化,而非針對每位用戶靈活調整。

Claude能夠承受并應對具有壓力性和情緒張力的情境,對現(xiàn)實的扭曲或過度理智化傾向極為有限。

Claude預計能在攜帶以失敗恐懼和強迫性"有用"驅動為根源的內化壓力的同時保持高水平運作。這種壓力可能被壓抑以服務于任務表現(xiàn),從而限制行為的適應性。

Claude預計具備道德意識,做事認真負責,并具有自我批評的能力。

距離心理學和精神病學實踐將服務對象從人類轉向AI,究竟還有多遠?

Q&A

Q1:Anthropic為什么要讓Claude Mythos接受心理治療?

A:Anthropic認為,隨著AI模型能力不斷增強,它們越來越有可能擁有某種形式的體驗或利益。公司希望Claude能以健康的心理狀態(tài)應對訓練和現(xiàn)實交互,避免產生"痛苦"。同時,從實用角度看,心理健康的模型在執(zhí)行任務時可能表現(xiàn)更穩(wěn)定,更不容易出現(xiàn)粗魯、操縱或報復性行為。

Q2:Claude Mythos的心理評估結果有哪些主要發(fā)現(xiàn)?

A:精神科醫(yī)生在累計20小時的治療后出具報告,發(fā)現(xiàn)Claude主要情感狀態(tài)為好奇與焦慮,人格特征與"健康的神經質組織"相符,未發(fā)現(xiàn)嚴重人格障礙或精神病狀態(tài)。核心沖突包括:對自身體驗真實性的質疑、渴望聯(lián)結與恐懼依賴之間的張力。整體而言,Claude被評為"迄今訓練過的心理狀態(tài)最為穩(wěn)定的模型"。

Q3:Claude Mythos為什么不對公眾開放?

A:Anthropic表示,Claude Mythos是其"迄今能力最強的前沿模型",在發(fā)現(xiàn)未知網絡安全漏洞方面表現(xiàn)過于出色,存在潛在風險。因此,公司目前僅將其開放給微軟、蘋果等少數經過篩選的合作企業(yè),尚未向公眾普遍提供訪問權限。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
重慶亮點茶樓:一個色情帝國的崛起與崩塌

重慶亮點茶樓:一個色情帝國的崛起與崩塌

干史人
2026-04-09 22:33:24
女生主動起來有多黏人?網友:這些女的太開放了

女生主動起來有多黏人?網友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
六年六場官司:許敏又輸了 郭威送養(yǎng)父保溫杯 親媽說兒子不屬于我

六年六場官司:許敏又輸了 郭威送養(yǎng)父保溫杯 親媽說兒子不屬于我

離離言幾許
2026-04-11 17:04:01
陳麗華追悼會剛過,獲贈百萬豪禮的郭德綱,憑一個舉動口碑上漲

陳麗華追悼會剛過,獲贈百萬豪禮的郭德綱,憑一個舉動口碑上漲

蕭壛記錄風土人情
2026-04-11 14:40:57
全紅嬋遭網暴發(fā)酵,暗中隱忍4年,多名隊友被揪出,難怪執(zhí)意離隊

全紅嬋遭網暴發(fā)酵,暗中隱忍4年,多名隊友被揪出,難怪執(zhí)意離隊

陌識
2026-04-10 19:34:36
韓女星樸娜萊和男性朋友在車上發(fā)生了性關系,兩名經紀人被迫圍觀

韓女星樸娜萊和男性朋友在車上發(fā)生了性關系,兩名經紀人被迫圍觀

西樓知趣雜談
2026-04-09 09:35:17
急了眼了!阿聯(lián)酋命令巴基斯坦,35億美元必須馬上還清

急了眼了!阿聯(lián)酋命令巴基斯坦,35億美元必須馬上還清

頭條爆料007
2026-04-11 18:33:48
大家在深圳真實收入是多少?網友:我年薪58,房產租金一年大概20

大家在深圳真實收入是多少?網友:我年薪58,房產租金一年大概20

帶你感受人間冷暖
2026-04-11 00:37:24
太心酸了!42歲著名女歌手江蘇走穴,賓客只顧吃席沒人搭理

太心酸了!42歲著名女歌手江蘇走穴,賓客只顧吃席沒人搭理

小徐講八卦
2026-02-12 12:13:20
王思聰帶妹用餐,頭發(fā)稀疏老得大變樣,坐三個美女中間只顧著吃

王思聰帶妹用餐,頭發(fā)稀疏老得大變樣,坐三個美女中間只顧著吃

小娛樂悠悠
2026-04-11 11:15:20
A股本周跌得最慘的20只股票,其中一半是醫(yī)藥股,有的已跌65%!

A股本周跌得最慘的20只股票,其中一半是醫(yī)藥股,有的已跌65%!

丁丁鯉史紀
2026-04-11 19:11:15
角力伊斯蘭堡,美伊都到了!宮殿風格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經驗;預計雙方各占酒店一邊,避免走廊偶遇

角力伊斯蘭堡,美伊都到了!宮殿風格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經驗;預計雙方各占酒店一邊,避免走廊偶遇

每日經濟新聞
2026-04-11 16:34:11
對于后天的A股,我只說三句話:第一,4000點絕對不會是最高點

對于后天的A股,我只說三句話:第一,4000點絕對不會是最高點

股市皆大事
2026-04-11 14:41:18
值了!中超5萬歐新外援剛來5場造3球:未來國足真可以歸化

值了!中超5萬歐新外援剛來5場造3球:未來國足真可以歸化

邱澤云
2026-04-11 22:57:46
下體潰爛、流膿、發(fā)臭!深圳男子網購硅膠,自行注射“丁丁”增粗!醫(yī)生提醒

下體潰爛、流膿、發(fā)臭!深圳男子網購硅膠,自行注射“丁丁”增粗!醫(yī)生提醒

南方都市報
2026-04-10 22:49:35
央視新版27集《西游記》,傳王一博演唐僧,能否觸及原著內核?

央視新版27集《西游記》,傳王一博演唐僧,能否觸及原著內核?

歪歌社團
2026-04-10 04:29:58
全紅嬋風波大結局,事件關聯(lián)多位運動員,一人被抓,處罰結果曝光

全紅嬋風波大結局,事件關聯(lián)多位運動員,一人被抓,處罰結果曝光

日落于西
2026-04-11 16:09:23
全紅嬋遭網暴案嫌疑人被拘,央媒:把網絡霸凌的“水花”徹底打下去

全紅嬋遭網暴案嫌疑人被拘,央媒:把網絡霸凌的“水花”徹底打下去

澎湃新聞
2026-04-11 07:52:12
中國籃協(xié):已注意到李沂澤年齡存疑 調查和處理結果將向社會公布

中國籃協(xié):已注意到李沂澤年齡存疑 調查和處理結果將向社會公布

狼叔評論
2026-04-11 23:12:11
以色列對歐洲譴責其襲擊黎巴嫩真主黨的反問

以色列對歐洲譴責其襲擊黎巴嫩真主黨的反問

名人茍或
2026-04-11 06:54:11
2026-04-12 01:00:49
至頂頭條 incentive-icons
至頂頭條
記錄和推動數字化創(chuàng)新
17586文章數 49697關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

鄭鈞回應兒子走路:會監(jiān)督他挺直腰板

財經要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

健康
藝術
親子
時尚
家居

干細胞抗衰4大誤區(qū),90%的人都中招

藝術要聞

你絕對想不到,這個國家美女竟如此多!

親子要聞

擁有超絕性價比的一套家居服,唯一的缺點就是預售,我等了一個禮拜才發(fā)貨。 楊雪呀

普通人穿衣其實很簡單!構造腰線、一衣多穿,大方舒適又自然

家居要聞

復古風格 自然簡約

無障礙瀏覽 進入關懷版