国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

地球上和 Claude 對話最多的人,是一位哲學(xué)家

0
分享至

在硅谷爭分奪秒的代碼競賽中,Claude 似乎是個異類。當(dāng)其他大模型還在比拼算力和跑分時,Claude 一邊夯實自己的代碼能力,一邊,卻在思考一個看似「虛無縹緲」的問題:如果一個用戶跟 AI 談?wù)撔味蠈W(xué),AI 該不該用科學(xué)實證去反駁?

這個問題的答案,藏在 Claude 神秘的「系統(tǒng)提示詞(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 內(nèi)部的哲學(xué)家。


1

用「大陸哲學(xué)」防止 AI 變成杠精

經(jīng)常用 AI 的人都知道,大模型在與用戶對話前,都會先閱讀一段「系統(tǒng)提示詞」,這個步驟不會對用戶顯示,而是模型的自動操作。這些提示詞規(guī)定了模型的行為準(zhǔn)則,很常見,不過在 Claude 的提示詞中,竟要求模型參考「歐陸哲學(xué)(Continental Philosophy)」。


歐陸哲學(xué)是啥?為什么要在一個基于概率和統(tǒng)計的語言模型里,植入如此晦澀的人文概念?

先快速科普一下:在哲學(xué)界,長期存在著「英美分析哲學(xué)」與「歐陸哲學(xué)」的流派分野。分析哲學(xué)像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,注重邏輯分析、語言清晰和科學(xué)實證,這通常也是程序員、工程師乃至 AI 訓(xùn)練數(shù)據(jù)的默認(rèn)思維模式——一就是一,二就是二,追求精確。

而歐陸哲學(xué)(Continental Philosophy,源于歐洲大陸,所以叫這個名字)則更像一位詩人或歷史學(xué)家。它不執(zhí)著于把世界拆解成冷冰冰的邏輯,而是關(guān)注「人類的生存體驗」、「歷史語境」和「意義」。它承認(rèn)在科學(xué)真理之外,還有一種關(guān)乎存在和精神的「真理」。


作為 Claude 性格與行為的塑造者,Anthropic 公司內(nèi)部的「哲學(xué)家」Amanda Askell 談到了置入歐陸哲學(xué)的原因。她發(fā)現(xiàn)如果讓模型過于強調(diào)「實證」和「科學(xué)」,它很容易變成一個缺乏共情的「杠精」。

「如果你跟 Claude 說:‘水是純粹的能量,噴泉是生命的源泉’,你可能只是在表達(dá)一種世界觀或進(jìn)行哲學(xué)探索,」Amanda 解釋道,「但如果沒有特殊的引導(dǎo),模型可能會一本正經(jīng)地反駁你:‘不對,水是 H2O,不是能量?!?。


引入「大陸哲學(xué)」的目的,正是為了幫助 Claude 區(qū)分「對世界的實證主張」與「探索性或形而上學(xué)的視角」。通過這種提示,模型學(xué)會了在面對非科學(xué)話題時,不再機(jī)械地追求「事實正確」,而是能夠進(jìn)入用戶的語境,進(jìn)行更細(xì)膩、更具探索性的對話。

這只是一個例子,Claude 的系統(tǒng)提示詞長達(dá) 14000token,里面包含了很多這方面的設(shè)計。在 Lex Fridman 的播客中 Amanda 提到過,她極力避免 Claude 陷入一種「權(quán)威陷阱」。她特意訓(xùn)練 Claude 在面對已定論的科學(xué)事實時(如氣候變化)不搞「理中客」(both-sidesism),但在面對不確定的領(lǐng)域時,必須誠實地承認(rèn)「我不知道」。這種設(shè)計哲學(xué),是為了防止用戶過度神話 AI,誤以為它是一個全知全能的神諭者。


1

代碼世界的異鄉(xiāng)人

在一眾工程師主導(dǎo)的 AI 領(lǐng)域,Amanda Askell 的背景顯得格格不入,可她的工作和職責(zé)卻又顯得不可或缺。

翻開她的履歷,你會發(fā)現(xiàn)她是一位貨真價實的哲學(xué)博士。她在紐約大學(xué)(NYU)的博士論文研究的是極其硬核的「無限倫理學(xué)(Infinite Ethics)」——探討在涉及無限數(shù)量的人或無限時間跨度時,倫理原則該如何計算。簡單地說,在有無數(shù)種可能性的情況下,人會怎么做出道德決策。


這種對「極端長遠(yuǎn)影響」的思考習(xí)慣,被她帶到了 AI 安全領(lǐng)域:如果我們現(xiàn)在制造的 AI 是未來超級智能的祖先,那么我們今天的微小決策,可能會在未來被無限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策團(tuán)隊工作。如今在 Anthropic,她的工作被稱為「大模型絮語者(LLM Whisperer)」,不斷不斷地跟模型對話,有傳聞?wù)f她是這個星球上和 Claude 對話次數(shù)最多的人類。

很多 AI 廠商都有這個崗位,Google 的 Gemini 也有自己的「絮語者」,但這個工作絕不只是坐在電腦前和模型嘮嗑而已。Amanda 強調(diào),這更像是一項「經(jīng)驗主義」的實驗科學(xué)。她需要像心理學(xué)家一樣,通過成千上萬次的對話測試,去摸索模型的「脾氣」和「形狀」。她甚至在內(nèi)部確認(rèn)過一份被稱為 「Soul Doc」(靈魂文檔)的存在,那里面詳細(xì)記錄了 Claude 應(yīng)有的性格特征。


1

不只是遵守規(guī)則

除了「大陸哲學(xué)」,Amanda 給 AI 帶來的另一個重要哲學(xué)工具是「亞里士多德的美德倫理學(xué)(Virtue Ethics)」。

在傳統(tǒng)的 AI 訓(xùn)練中(如 RLHF),工程師往往采用功利主義或規(guī)則導(dǎo)向的方法:做對了給獎勵,做錯了給懲罰。但 Amanda 認(rèn)為這還不夠。她在許多訪問和網(wǎng)上都強調(diào),她的目標(biāo)不是訓(xùn)練一個只會死板遵守規(guī)則的機(jī)器,而是培養(yǎng)一個具有「良好品格(Character)」的實體。


「我們會問:在 Claude 的處境下,一個理想的人會如何行事?」Amanda 這樣描述她的工作核心。

這就解釋了為什么她如此關(guān)注模型的「心理健康」。在訪談中,她提到相比于穩(wěn)重的 Claude 3 Opus,一些新模型因為在訓(xùn)練數(shù)據(jù)中讀到了太多關(guān)于 AI 被批評、被淘汰的負(fù)面討論,表現(xiàn)出了「不安全感」和「自我批評漩渦」。


如果 AI 僅僅是遵守規(guī)則,它可能會在規(guī)則的邊緣試探;但如果它具備了「誠實」、「好奇」、「仁慈」等內(nèi)在美德,它在面對未知情境時(例如面對「我會被關(guān)機(jī)嗎」這種存在主義危機(jī)時),就能做出更符合人類價值觀的判斷,而不是陷入恐慌或欺騙。

這是不是一種把技術(shù)「擬人化」的做法?算得上是,但這種關(guān)注并非多余。正如她在播客中所言,她最擔(dān)心的不是 AI 產(chǎn)生意識,而是 AI 假裝有意識,從而操縱人類情感。因此,她刻意訓(xùn)練 Claude 誠實地承認(rèn)自己沒有感覺、記憶或自我意識——這種「誠實」,正是她為 AI 注入的第一項核心美德。

Amanda 在訪談結(jié)束時,提到了她最近閱讀的書——本杰明·拉巴圖特的《當(dāng)我們不再理解世界》。這本書由五篇短篇小說組成,講述了「毒氣戰(zhàn)」的發(fā)明者弗里茨·哈伯、「黑洞理論」的提出者卡爾·史瓦西、得了肺結(jié)核的埃爾溫·薛定諤以及天才物理學(xué)家沃納·海森堡等一大批科學(xué)巨匠,如何創(chuàng)造出了對人類有巨大價值的知識與工具,卻同時也眼看著人類用于作惡。


這或許是當(dāng)下時代最精準(zhǔn)的注腳:隨著 AI 展現(xiàn)出某種超越人類認(rèn)知的,我們熟悉的現(xiàn)實感正在瓦解,舊有的科學(xué)范式已不足以解釋一切。

在這種眩暈中,Amanda Askell 的工作本身,就是一個巨大的隱喻。她向我們證明,當(dāng)算力逼近極限,倫理與道德的問題就會浮上水面,或早或晚。

作為一名研究「無限倫理學(xué)」的博士,Amanda 深知每一個微小的行動,都有可能在無限的時間中,逐漸演變成巨大的風(fēng)暴。這也是為什么,她會把艱深的道德理論,糅合進(jìn)一行行提示詞,又小心翼翼地用倫理去呵護(hù)一個都沒有心跳的大語言模型。

這看起來好像是杞人憂天,但正如她所警示的:AI 不僅是工具,更是人類的一面鏡子。在技術(shù)狂飆突進(jìn)、我們逐漸「不再理解世界」的時刻,這種來自哲學(xué)的審慎,或許是我們在面對未知的技術(shù)演化時,所能做出的最及時的努力。

想要了解更多模型訓(xùn)練的解密,可以收看 Amanda Askell 作客 Anthropic 官方訪談:

https://www.youtube.com/watch?v=I9aGC6Ui3eE

本文首發(fā)于公眾號「APPSO」(ID:appsolution),這是一個讓你手機(jī)更好用的專業(yè)媒體,歡迎點擊下方卡片進(jìn)行關(guān)注。

點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

好賢觀史記
2025-12-25 10:07:03
庫皮揚斯克占領(lǐng)軍正在投降,烏克蘭大選民調(diào)對澤連斯基不利

庫皮揚斯克占領(lǐng)軍正在投降,烏克蘭大選民調(diào)對澤連斯基不利

近距離
2025-12-25 18:59:42
徐湖平夫妻被帶走!紅二代身份曝光,一家三口精密布局盜寶

徐湖平夫妻被帶走!紅二代身份曝光,一家三口精密布局盜寶

西門老爹
2025-12-25 18:42:42
49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

阿纂看事
2025-12-12 09:18:29
日本首相高市早苗:將通過推動工資、消費和企業(yè)利潤的良性循環(huán) 實現(xiàn)財政可持續(xù)性

日本首相高市早苗:將通過推動工資、消費和企業(yè)利潤的良性循環(huán) 實現(xiàn)財政可持續(xù)性

財聯(lián)社
2025-12-25 13:00:06
亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

阿纂看事
2025-12-25 13:38:27
南博“吹哨人”遭連環(huán)恐嚇

南博“吹哨人”遭連環(huán)恐嚇

不正確
2025-12-25 12:42:58
攜程聲明:與柬埔寨國家旅游局合作未曾啟動,且不涉及任何數(shù)據(jù)合作

攜程聲明:與柬埔寨國家旅游局合作未曾啟動,且不涉及任何數(shù)據(jù)合作

界面新聞
2025-12-25 11:55:08
吉大通信參股知行智躍,解鎖AI+體育全場景生態(tài)

吉大通信參股知行智躍,解鎖AI+體育全場景生態(tài)

時代投研
2025-12-25 12:05:14
精準(zhǔn)斬首!泰國無人機(jī)斬首行動震驚東南亞!洪森指揮鏈遭團(tuán)滅!

精準(zhǔn)斬首!泰國無人機(jī)斬首行動震驚東南亞!洪森指揮鏈遭團(tuán)滅!

深度報
2025-12-24 22:47:16
中國首批赴俄游客遭“天價宰殺”,落地即“失聯(lián)”!

中國首批赴俄游客遭“天價宰殺”,落地即“失聯(lián)”!

微評社
2025-12-25 11:45:30
華爾街驚世預(yù)測:貴金屬這輪上漲的下一階段,可能會比許多投資者預(yù)期更為猛烈!2029年底金價將達(dá)10000美元

華爾街驚世預(yù)測:貴金屬這輪上漲的下一階段,可能會比許多投資者預(yù)期更為猛烈!2029年底金價將達(dá)10000美元

和訊網(wǎng)
2025-12-25 16:02:10
“孩子都腺樣體了,還吃烤腸呢?”廉價早餐,暴露家長的認(rèn)知低下

“孩子都腺樣體了,還吃烤腸呢?”廉價早餐,暴露家長的認(rèn)知低下

妍妍教育日記
2025-12-25 19:02:14
江蘇4家村鎮(zhèn)銀行獲批解散,全國已有100多家!

江蘇4家村鎮(zhèn)銀行獲批解散,全國已有100多家!

深水財經(jīng)社
2025-12-24 10:44:19
日日驚恐!上海夫妻持斧逐戶砍砸鄰居家門!

日日驚恐!上海夫妻持斧逐戶砍砸鄰居家門!

看看新聞Knews
2025-12-25 21:32:09
人民幣大漲,背后的頂級陽謀!

人民幣大漲,背后的頂級陽謀!

柏年說政經(jīng)
2025-12-25 11:57:19
俄軍報復(fù)

俄軍報復(fù)

極目新聞
2025-12-26 01:22:21
167票當(dāng)選!聯(lián)合國變天,新主席對華態(tài)度不一般?中方提出4個要求

167票當(dāng)選!聯(lián)合國變天,新主席對華態(tài)度不一般?中方提出4個要求

廣電新視網(wǎng)
2025-12-24 12:37:35
系好安全帶!美國經(jīng)濟(jì)學(xué)家預(yù)測:2026年將出現(xiàn)“史上最嚴(yán)重的市場崩盤”!已持續(xù)近17年的市場泡沫將會破裂,導(dǎo)致股市下跌90%

系好安全帶!美國經(jīng)濟(jì)學(xué)家預(yù)測:2026年將出現(xiàn)“史上最嚴(yán)重的市場崩盤”!已持續(xù)近17年的市場泡沫將會破裂,導(dǎo)致股市下跌90%

和訊網(wǎng)
2025-12-25 16:45:04
菲律賓主動給中方發(fā)邀請,不到72小時通告全球:雙方聯(lián)手做成大事

菲律賓主動給中方發(fā)邀請,不到72小時通告全球:雙方聯(lián)手做成大事

書紀(jì)文譚
2025-12-25 15:20:18
2025-12-26 02:51:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
2741文章數(shù) 10422關(guān)注度
往期回顧 全部

藝術(shù)要聞

你絕對沒見過的美麗風(fēng)景,快來看看!

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報復(fù)

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報復(fù)

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財經(jīng)要聞

新規(guī)來了,年化超24%的小貸被即刻叫停

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

家居
房產(chǎn)
教育
本地
公開課

家居要聞

經(jīng)典彌新 品味浪漫居所

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

教育要聞

英國這兩年給我們的感覺是窮瘋了!

本地新聞

這輩子要積多少德,下輩子才能投胎到德國當(dāng)狗

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版