国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

地球上和 Claude 對(duì)話最多的人,是一位哲學(xué)家

0
分享至

在硅谷爭(zhēng)分奪秒的代碼競(jìng)賽中,Claude 似乎是個(gè)異類。當(dāng)其他大模型還在比拼算力和跑分時(shí),Claude 一邊夯實(shí)自己的代碼能力,一邊,卻在思考一個(gè)看似「虛無縹緲」的問題:如果一個(gè)用戶跟 AI 談?wù)撔味蠈W(xué),AI 該不該用科學(xué)實(shí)證去反駁?

這個(gè)問題的答案,藏在 Claude 神秘的「系統(tǒng)提示詞(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 內(nèi)部的哲學(xué)家。


用「大陸哲學(xué)」防止 AI 變成杠精

經(jīng)常用 AI 的人都知道,大模型在與用戶對(duì)話前,都會(huì)先閱讀一段「系統(tǒng)提示詞」,這個(gè)步驟不會(huì)對(duì)用戶顯示,而是模型的自動(dòng)操作。這些提示詞規(guī)定了模型的行為準(zhǔn)則,很常見,不過在 Claude 的提示詞中,竟要求模型參考「歐陸哲學(xué)(Continental Philosophy)」。


歐陸哲學(xué)是啥?為什么要在一個(gè)基于概率和統(tǒng)計(jì)的語言模型里,植入如此晦澀的人文概念?

先快速科普一下:在哲學(xué)界,長(zhǎng)期存在著「英美分析哲學(xué)」與「歐陸哲學(xué)」的流派分野。分析哲學(xué)像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,注重邏輯分析、語言清晰和科學(xué)實(shí)證,這通常也是程序員、工程師乃至 AI 訓(xùn)練數(shù)據(jù)的默認(rèn)思維模式——一就是一,二就是二,追求精確。

而歐陸哲學(xué)(Continental Philosophy,源于歐洲大陸,所以叫這個(gè)名字)則更像一位詩人或歷史學(xué)家。它不執(zhí)著于把世界拆解成冷冰冰的邏輯,而是關(guān)注「人類的生存體驗(yàn)」、「歷史語境」和「意義」。它承認(rèn)在科學(xué)真理之外,還有一種關(guān)乎存在和精神的「真理」。


作為 Claude 性格與行為的塑造者,Anthropic 公司內(nèi)部的「哲學(xué)家」Amanda Askell 談到了置入歐陸哲學(xué)的原因。她發(fā)現(xiàn)如果讓模型過于強(qiáng)調(diào)「實(shí)證」和「科學(xué)」,它很容易變成一個(gè)缺乏共情的「杠精」。

「如果你跟 Claude 說:‘水是純粹的能量,噴泉是生命的源泉’,你可能只是在表達(dá)一種世界觀或進(jìn)行哲學(xué)探索,」Amanda 解釋道,「但如果沒有特殊的引導(dǎo),模型可能會(huì)一本正經(jīng)地反駁你:‘不對(duì),水是 H2O,不是能量?!?。


引入「大陸哲學(xué)」的目的,正是為了幫助 Claude 區(qū)分「對(duì)世界的實(shí)證主張」與「探索性或形而上學(xué)的視角」。通過這種提示,模型學(xué)會(huì)了在面對(duì)非科學(xué)話題時(shí),不再機(jī)械地追求「事實(shí)正確」,而是能夠進(jìn)入用戶的語境,進(jìn)行更細(xì)膩、更具探索性的對(duì)話。

這只是一個(gè)例子,Claude 的系統(tǒng)提示詞長(zhǎng)達(dá) 14000token,里面包含了很多這方面的設(shè)計(jì)。在 Lex Fridman 的播客中 Amanda 提到過,她極力避免 Claude 陷入一種「權(quán)威陷阱」。她特意訓(xùn)練 Claude 在面對(duì)已定論的科學(xué)事實(shí)時(shí)(如氣候變化)不搞「理中客」(both-sidesism),但在面對(duì)不確定的領(lǐng)域時(shí),必須誠實(shí)地承認(rèn)「我不知道」。這種設(shè)計(jì)哲學(xué),是為了防止用戶過度神話 AI,誤以為它是一個(gè)全知全能的神諭者。


代碼世界的異鄉(xiāng)人

在一眾工程師主導(dǎo)的 AI 領(lǐng)域,Amanda Askell 的背景顯得格格不入,可她的工作和職責(zé)卻又顯得不可或缺。

翻開她的履歷,你會(huì)發(fā)現(xiàn)她是一位貨真價(jià)實(shí)的哲學(xué)博士。她在紐約大學(xué)(NYU)的博士論文研究的是極其硬核的「無限倫理學(xué)(Infinite Ethics)」——探討在涉及無限數(shù)量的人或無限時(shí)間跨度時(shí),倫理原則該如何計(jì)算。簡(jiǎn)單地說,在有無數(shù)種可能性的情況下,人會(huì)怎么做出道德決策。


這種對(duì)「極端長(zhǎng)遠(yuǎn)影響」的思考習(xí)慣,被她帶到了 AI 安全領(lǐng)域:如果我們現(xiàn)在制造的 AI 是未來超級(jí)智能的祖先,那么我們今天的微小決策,可能會(huì)在未來被無限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策團(tuán)隊(duì)工作。如今在 Anthropic,她的工作被稱為「大模型絮語者(LLM Whisperer)」,不斷不斷地跟模型對(duì)話,有傳聞?wù)f她是這個(gè)星球上和 Claude 對(duì)話次數(shù)最多的人類。

很多 AI 廠商都有這個(gè)崗位,Google 的 Gemini 也有自己的「絮語者」,但這個(gè)工作絕不只是坐在電腦前和模型嘮嗑而已。Amanda 強(qiáng)調(diào),這更像是一項(xiàng)「經(jīng)驗(yàn)主義」的實(shí)驗(yàn)科學(xué)。她需要像心理學(xué)家一樣,通過成千上萬次的對(duì)話測(cè)試,去摸索模型的「脾氣」和「形狀」。她甚至在內(nèi)部確認(rèn)過一份被稱為 「Soul Doc」(靈魂文檔)的存在,那里面詳細(xì)記錄了 Claude 應(yīng)有的性格特征。


不只是遵守規(guī)則

除了「大陸哲學(xué)」,Amanda 給 AI 帶來的另一個(gè)重要哲學(xué)工具是「亞里士多德的美德倫理學(xué)(Virtue Ethics)」。

在傳統(tǒng)的 AI 訓(xùn)練中(如 RLHF),工程師往往采用功利主義或規(guī)則導(dǎo)向的方法:做對(duì)了給獎(jiǎng)勵(lì),做錯(cuò)了給懲罰。但 Amanda 認(rèn)為這還不夠。她在許多訪問和網(wǎng)上都強(qiáng)調(diào),她的目標(biāo)不是訓(xùn)練一個(gè)只會(huì)死板遵守規(guī)則的機(jī)器,而是培養(yǎng)一個(gè)具有「良好品格(Character)」的實(shí)體。


「我們會(huì)問:在 Claude 的處境下,一個(gè)理想的人會(huì)如何行事?」Amanda 這樣描述她的工作核心。

這就解釋了為什么她如此關(guān)注模型的「心理健康」。在訪談中,她提到相比于穩(wěn)重的 Claude 3 Opus,一些新模型因?yàn)樵谟?xùn)練數(shù)據(jù)中讀到了太多關(guān)于 AI 被批評(píng)、被淘汰的負(fù)面討論,表現(xiàn)出了「不安全感」和「自我批評(píng)漩渦」


如果 AI 僅僅是遵守規(guī)則,它可能會(huì)在規(guī)則的邊緣試探;但如果它具備了「誠實(shí)」、「好奇」、「仁慈」等內(nèi)在美德,它在面對(duì)未知情境時(shí)(例如面對(duì)「我會(huì)被關(guān)機(jī)嗎」這種存在主義危機(jī)時(shí)),就能做出更符合人類價(jià)值觀的判斷,而不是陷入恐慌或欺騙。

這是不是一種把技術(shù)「擬人化」的做法?算得上是,但這種關(guān)注并非多余。正如她在播客中所言,她最擔(dān)心的不是 AI 產(chǎn)生意識(shí),而是AI 假裝有意識(shí),從而操縱人類情感。因此,她刻意訓(xùn)練 Claude 誠實(shí)地承認(rèn)自己沒有感覺、記憶或自我意識(shí)——這種「誠實(shí)」,正是她為 AI 注入的第一項(xiàng)核心美德。

Amanda 在訪談結(jié)束時(shí),提到了她最近閱讀的書——本杰明·拉巴圖特的《當(dāng)我們不再理解世界》。這本書由五篇短篇小說組成,講述了「毒氣戰(zhàn)」的發(fā)明者弗里茨·哈伯、「黑洞理論」的提出者卡爾·史瓦西、得了肺結(jié)核的埃爾溫·薛定諤以及天才物理學(xué)家沃納·海森堡等一大批科學(xué)巨匠,如何創(chuàng)造出了對(duì)人類有巨大價(jià)值的知識(shí)與工具,卻同時(shí)也眼看著人類用于作惡。


這或許是當(dāng)下時(shí)代最精準(zhǔn)的注腳:隨著 AI 展現(xiàn)出某種超越人類認(rèn)知的,我們熟悉的現(xiàn)實(shí)感正在瓦解,舊有的科學(xué)范式已不足以解釋一切。

在這種眩暈中,Amanda Askell 的工作本身,就是一個(gè)巨大的隱喻。她向我們證明,當(dāng)算力逼近極限,倫理與道德的問題就會(huì)浮上水面,或早或晚。

作為一名研究「無限倫理學(xué)」的博士,Amanda 深知每一個(gè)微小的行動(dòng),都有可能在無限的時(shí)間中,逐漸演變成巨大的風(fēng)暴。這也是為什么,她會(huì)把艱深的道德理論,糅合進(jìn)一行行提示詞,又小心翼翼地用倫理去呵護(hù)一個(gè)都沒有心跳的大語言模型。

這看起來好像是杞人憂天,但正如她所警示的:AI 不僅是工具,更是人類的一面鏡子。在技術(shù)狂飆突進(jìn)、我們逐漸「不再理解世界」的時(shí)刻,這種來自哲學(xué)的審慎,或許是我們?cè)诿鎸?duì)未知的技術(shù)演化時(shí),所能做出的最及時(shí)的努力。

想要了解更多模型訓(xùn)練的解密,可以收看 Amanda Askell 作客 Anthropic 官方訪談:

https://www.youtube.com/watch?v=I9aGC6Ui3eE

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡(jiǎn)歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日常穿搭也能借鑒這種穿搭思路選對(duì)單品就不用怕俗氣或者沒氣質(zhì)

日常穿搭也能借鑒這種穿搭思路選對(duì)單品就不用怕俗氣或者沒氣質(zhì)

牛彈琴123456
2025-12-17 10:21:01
毛利率70%,超LV、比肩愛馬仕!昆山這家耳機(jī)公司,憑什么征服世界?

毛利率70%,超LV、比肩愛馬仕!昆山這家耳機(jī)公司,憑什么征服世界?

創(chuàng)客公社-江蘇第一創(chuàng)投媒體
2025-12-19 15:43:49
杜蘭特真怒了!甩手跺腳不滿申京,死亡凝視烏度卡,沉默震耳欲聾

杜蘭特真怒了!甩手跺腳不滿申京,死亡凝視烏度卡,沉默震耳欲聾

嘴炮體壇
2025-12-19 17:37:59
日哈14項(xiàng)協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

日哈14項(xiàng)協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

小濤叨叨
2025-12-19 15:09:11
這才對(duì)嘛!盧偉棄用強(qiáng)援,重用遼籃雙星,斬獲大勝,新星空砍32分

這才對(duì)嘛!盧偉棄用強(qiáng)援,重用遼籃雙星,斬獲大勝,新星空砍32分

萌蘭聊個(gè)球
2025-12-19 21:45:02
直擊“全國地王”安瀾上海項(xiàng)目認(rèn)籌首日:現(xiàn)場(chǎng)嚴(yán)防死守,最貴一套1.46億元

直擊“全國地王”安瀾上海項(xiàng)目認(rèn)籌首日:現(xiàn)場(chǎng)嚴(yán)防死守,最貴一套1.46億元

每日經(jīng)濟(jì)新聞
2025-12-19 21:52:06
殺豬盤新套路:先讓你賺錢,再掏空你全部身家

殺豬盤新套路:先讓你賺錢,再掏空你全部身家

流蘇晚晴
2025-12-17 18:10:58
“演唱會(huì)出軌門”女主首度發(fā)聲,稱兩人當(dāng)時(shí)都處于婚姻分居階段,是第一次親密接觸;兩人事后相繼辭職

“演唱會(huì)出軌門”女主首度發(fā)聲,稱兩人當(dāng)時(shí)都處于婚姻分居階段,是第一次親密接觸;兩人事后相繼辭職

大風(fēng)新聞
2025-12-19 16:58:03
太慘了!廣西忻城發(fā)生命案3死1傷!35歲男子被抓,知情人曝原因

太慘了!廣西忻城發(fā)生命案3死1傷!35歲男子被抓,知情人曝原因

鋭娛之樂
2025-12-19 20:40:12
曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生,曹云金的話,有人信了

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生,曹云金的話,有人信了

科學(xué)發(fā)掘
2025-12-19 10:27:00
全球震怒!美國都受不了,以色列竟然還敢針對(duì)中國,真是自作孽!

全球震怒!美國都受不了,以色列竟然還敢針對(duì)中國,真是自作孽!

小虎新車推薦員
2025-12-20 05:34:33
“不要再查了,再查我怕過兩天南京博物院庫房就要著火了!”

“不要再查了,再查我怕過兩天南京博物院庫房就要著火了!”

迷世書童H9527
2025-12-18 10:00:25
央視《老舅》被觀眾要求下架,理由:劇情太假,掛羊頭賣狗肉!

央視《老舅》被觀眾要求下架,理由:劇情太假,掛羊頭賣狗肉!

甜檸聊史
2025-12-17 09:23:55
許亞軍說他每次給兒子微信轉(zhuǎn)賬的時(shí)候不到1分鐘,兒子馬上就收款

許亞軍說他每次給兒子微信轉(zhuǎn)賬的時(shí)候不到1分鐘,兒子馬上就收款

忠于法紀(jì)
2025-12-19 18:27:51
“滾回自己的國家!”近日,陜西西安,4名印度留學(xué)生去吃飯,

“滾回自己的國家!”近日,陜西西安,4名印度留學(xué)生去吃飯,

忠于法紀(jì)
2025-12-19 18:27:15
21號(hào)冬至吃餃子,切記:4餡不上桌,福氣不進(jìn)門,分別指的是什么

21號(hào)冬至吃餃子,切記:4餡不上桌,福氣不進(jìn)門,分別指的是什么

阿龍美食記
2025-12-18 21:23:12
吃相太難看!史曉燕炮轟何晴,離婚咎由自取,難怪許亞軍缺席葬禮

吃相太難看!史曉燕炮轟何晴,離婚咎由自取,難怪許亞軍缺席葬禮

阿纂看事
2025-12-19 11:17:36
江蘇一大爺用玩具娃娃冒充保安,通宵值夜班,自己卻呼呼大睡,網(wǎng)友:你大爺還是你大爺!

江蘇一大爺用玩具娃娃冒充保安,通宵值夜班,自己卻呼呼大睡,網(wǎng)友:你大爺還是你大爺!

商業(yè)匯評(píng)
2025-12-18 22:16:46
22:00,中國男足首輪=生死戰(zhàn)!主力11人浮現(xiàn),CCTV直播U23亞洲杯

22:00,中國男足首輪=生死戰(zhàn)!主力11人浮現(xiàn),CCTV直播U23亞洲杯

侃球熊弟
2025-12-20 00:25:03
楊穎咖位暴跌,濃妝擠網(wǎng)紅角落,曾是 Dior 親閨女如今代言褲襪

楊穎咖位暴跌,濃妝擠網(wǎng)紅角落,曾是 Dior 親閨女如今代言褲襪

北極熊愛看海
2025-12-18 18:45:03
2025-12-20 07:12:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
5942文章數(shù) 26728關(guān)注度
往期回顧 全部

藝術(shù)要聞

60幅流失海外的中國畫,件件精品

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時(shí)停止打擊

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時(shí)停止打擊

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

健康
房產(chǎn)
教育
本地
家居

這些新療法,讓化療不再那么痛苦

房產(chǎn)要聞

廣州有態(tài)度,一座國際化社區(qū)給出的城市答案

教育要聞

涉事教師被開除!三年級(jí)學(xué)生推落行李箱,被教師罰扇自己40個(gè)耳光

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

家居要聞

高端私宅 理想隱居圣地

無障礙瀏覽 進(jìn)入關(guān)懷版