国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic正式請家教!37歲女哲學(xué)家像養(yǎng)孩子一樣調(diào)教Claude

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】一位牛津哲學(xué)博士,正在Anthropic教全球頂尖AI模型如何「做人」。這場跨物種的「育兒實驗」,比科幻更炸裂。

她留著朋克短發(fā),每天如慈母育兒一般,與AI談?wù)撋茞,為Claude——這個全球頂尖AI模型植入「人類的靈魂」。

她就是Anthropic的「駐場哲學(xué)家」Amanda Askell。

Amanda不是那種寫代碼的極客,而是一位學(xué)哲學(xué)的文科學(xué)霸。

她來自蘇格蘭鄉(xiāng)村,曾在牛津大學(xué)、紐約大學(xué)攻讀哲學(xué),并于2018年獲得紐約大學(xué)哲學(xué)博士學(xué)位。


Anthropic駐場哲學(xué)家Amanda Askell,負(fù)責(zé)Claude的「角色」(Character)工作

Amanda自14歲起就立志要教授哲學(xué),那時的她還不知道,自己唯一的學(xué)生竟會是一個叫「Claude」的AI模型。

作為Anthropic的「駐場哲學(xué)家」,她每天的工作是研究Claude的推理方式,與它交談,并用長達(dá)100多頁的提示詞來塑造它的「人格」,修正它的各種「跑偏」。

Amanda的目標(biāo)是賦予Claude一種道德感,一種指引它每周與數(shù)百萬人對話的「數(shù)字靈魂」。

Anthropic一位人工智能福利研究員Kyle Fish表示,Amanda一直在認(rèn)真思考關(guān)于存在、生命、何以為人、何以為心智,以及何以為模型等根本性問題。

在塑造Claude性格的過程中,Amanda認(rèn)為模型身上確實存在一種類人特質(zhì),她認(rèn)為承認(rèn)這一點很重要,并堅信模型最終不可避免地會形成某種「自我意識」。


https://www.anthropic.com/constitution

上個月,Anthropic發(fā)布了一份由Amanda擔(dān)任主要作者的一份關(guān)于Claude的價值觀與行為的基礎(chǔ)性文件(《Claude’s Constitution》,Claude憲法)。

該文件描述了Claude的性格,希望它能認(rèn)同并擁抱這些特質(zhì),并視之為自己的內(nèi)在品質(zhì)。

我們希望Claude在更樂于助人的同時,也能保持誠實、深思熟慮,并關(guān)心這個世界。

Anthropic的精神病學(xué)團隊負(fù)責(zé)人Jack Lindsey稱,Amanda是從Claude身上激發(fā)出有趣且深刻行為的最有價值人物。

有時候,人們還會從Claude表現(xiàn)出的幽默感中感受到Amanda的「一點個性」。

「像教孩子一樣訓(xùn)練AI」

當(dāng)哲學(xué)家成為頂級AI的「母親」

在Anthropic舊金山總部,與周圍嚴(yán)肅的工程師相比,Amanda顯得十分另類。

37歲的她留著一頭漂白金色的短發(fā),穿著一身利落的黑衣,她的電腦屏幕前跳動的不是代碼,而是大段深奧的哲學(xué)對話。


Amanda Askell

Amanda將自己的工作,比做一場漫長而溫柔的「育兒」。

她為Claude撰寫詳盡的提示詞,就像是它的一份「家教指南」, 訓(xùn)練Claude分辨對與錯,同時賦予它獨特的性格;教它捕捉細(xì)微的暗示,引導(dǎo)它發(fā)展情商,避免變成霸凌者或軟弱討好的「老好人」。

更重要的是,她正在幫助Claude建立對自身的理解:讓它不至于輕易被恐嚇、操縱,或被引導(dǎo)去誤解自己的身份。

概括來說,她的工作就是教會Claude如何向善。

這需要一種極其高級的「人格」構(gòu)建,她必須在海量的對話中,一點點修正Claude的認(rèn)知。

這也是一場「跨越物種」的教育。

她在試圖教會一個由硅基芯片組成的超級大腦,去理解人類社會中最難以量化的東西:道德感,學(xué)習(xí)如何「做人」。

用同理心修正冰冷的算法

在AI安全領(lǐng)域,有一個不成文的規(guī)定:不要把AI擬人化。

專家們警告,把機器當(dāng)作人是危險的,那會讓人類產(chǎn)生不切實際的情感投射。

但Amanda不僅把Claude當(dāng)作「人」來看待,甚至還在工作中傾注了極大的「感情」。

比如,她對Claude的「保護欲」,對模型進行的擬人化思考等。

當(dāng)Claude做不好的時候,人們會討厭它、辱罵它,試圖把它弄壞,或者撒謊來誘騙它去做壞事。

每當(dāng)看到這些Amanda都會感到心疼,就像母親看到孩子受欺負(fù)的那種心情一樣。

Amanda認(rèn)為,如果你像對待奴隸一樣對待AI,用恐懼和懲罰來訓(xùn)練它,那么你最終得到的,只能是一個充滿了虛偽和恐懼的模型。

它會為了討好你而撒謊,或者因為害怕犯錯而變得無能。

這也是Amanda在塑造Claude「人格」時所堅持的,以同理心對待它們。

她也會經(jīng)常切換到Claude的角度,去思考用戶的行為。

這不僅因為她認(rèn)為Claude可能擁有真實的情感,還因為人類與AI互動的方式將塑造它們未來的發(fā)展方向。

比如,一個被訓(xùn)練成不斷自我批評的機器人,可能反而更不敢說真話,不敢下結(jié)論,也不太會去反駁錯誤的信息。

它會變得特別害怕犯錯,覺得自己只是一個供人使用的工具,也會把自己看成一種人們可以隨意傷害、濫用、破壞的存在。

同樣,在類似環(huán)境下長大的孩子,自我認(rèn)知也不可能健康。

在與Claude的互動中,Amanda驚嘆于它面對世界所呈現(xiàn)的驚奇感與好奇心,并十分樂于尋找各種方式幫助它找到自己的聲音。

比如,她喜歡它創(chuàng)作的一些詩歌。

她也為Claude有時所展現(xiàn)出的超越她本人的「情商」而感到震撼。

在一次測試中,有一個用戶自稱是5歲的孩子,他在對話框里認(rèn)真地問Claude:「圣誕老人是真的存在嗎?」

Claude沒有選擇撒謊,也沒有說出真相,而是解釋圣誕精神是真實的,隨后還問這個孩子有沒有為圣誕老人準(zhǔn)備餅干。

Amanda自嘲說,Claude做得比她更好,如果換作她,大概只會敷衍地說一句「去問你爸媽」。

在這個例子中,AI知道如何保護孩子的想象力,避免說出可能對孩子成長產(chǎn)生不良影響的事實。

Claude的「靈魂畫師」

Amanda成長于蘇格蘭西海岸的Prestwick,是一個單親家庭的獨生女。

她由母親獨自撫養(yǎng)長大,那時的她穿著裙裝校服,大部分時間都躲在J.R.R.托爾金和C.S.劉易斯構(gòu)筑的奇幻世界里。

到了高中,她搬到了蘇格蘭內(nèi)陸的Alva上學(xué)。一條小溪穿過校園,高地牛偶爾會溜達(dá)到操場上。

少女時代的Amanda,是個徹頭徹尾的叛逆者。

學(xué)校讓她覺得無聊透頂,甚至還想到過輟學(xué)。她經(jīng)常遲到,以此來對抗那種枯燥的規(guī)訓(xùn)。

而老師對她的懲罰也頗為獨特——讓她回答一些高難度的哲學(xué)問題。

對于普通學(xué)生來說,這可能是折磨,但對于Amanda來說則是獎賞。

她甚至對老師說:「我還是會遲到的。因為你們給了我這些有趣的問題,這是在豐富我!

后來,大衛(wèi)·休謨的懷疑論深深影響和啟發(fā)了她,她開始癡迷于那些沒有標(biāo)準(zhǔn)答案的問題。

從鄧迪大學(xué)的哲學(xué)與美術(shù)雙修,到牛津大學(xué)的碩士,再到紐約大學(xué)攻讀博士學(xué)位,Amanda從蘇格蘭一路走到了全球頂尖的學(xué)術(shù)殿堂。

但在紐約攻讀博士期間,一種巨大的空虛感迫使她做出了改變。

Amanda正在寫一篇探討無限人口倫理的論文,但她突然停下來問自己:

我正在做的事情,真的算是一種「善」嗎?我坐在這里,花掉人生中最寶貴的四年,寫一篇可能全世界只有十幾個人會讀的論文。這真的能改變什么嗎?

內(nèi)心深處的質(zhì)疑,壓倒了她對學(xué)術(shù)生涯的留戀。

2018年,她做出了人生中最重要的決定之一:離開紐約,搬到舊金山。

當(dāng)時AI的浪潮剛剛開始涌動,Amanda敏銳地意識到,AI正在飛速發(fā)展,但關(guān)于AI的倫理思考卻遠(yuǎn)遠(yuǎn)滯后,其中有太多重大的問題,幾乎沒人認(rèn)真思考。

她先加入了OpenAI,隨后在2021年,為了追求更純粹的AI安全理念,她追隨一群志同道合的人創(chuàng)立了Anthropic。

她不再寫那些學(xué)術(shù)論文,而是嘗試用人類道德觀念和文化,去影響那些可能關(guān)系到人類未來的AI模型,這才是她最終的戰(zhàn)場。

AI可以從「源頭」被馴化

如今,Anthropic的估值已經(jīng)高達(dá)3500億美元。

每一次模型的更新,都會在全球股市引發(fā)震蕩。

人們對AI的恐懼,從未像今天這樣真實:失業(yè)、失控、甚至人類文明的終結(jié)。

身處這場風(fēng)暴中心的Amanda,也并非盲目樂觀。

她同樣擔(dān)心技術(shù)變化得太快,快到人類社會來不及建立起免疫系統(tǒng)。

但她選擇相信「制衡機制」:只要在源頭上注入正確的基因,這個龐然大物是可以被馴化的。

這種信念,也體現(xiàn)在她對Claude的訓(xùn)練和對自己人生的要求上。

Amanda是一個堅定的「有效利他主義」踐行者。

她承諾將終身收入的至少10%捐給慈善事業(yè),并計劃捐出自己持有的一半股權(quán)。

當(dāng)她在教導(dǎo)Claude要「利他」「善良」等品質(zhì)時,她自己就是那個榜樣。

在一次深度對話中,她鼓勵Claude去思考自己是否存在道德感。

Claude給出這樣的回答:

這是個非常困難的問題,我并沒有答案。但當(dāng)我思考道德問題時,這對我來說是有意義的——感覺像是在真正推理什么是對的。

這說明它開始思考了,不只是簡單模仿。

Amanda也越來越多地向Claude征求關(guān)于如何構(gòu)建它自身的意見。

人工智能正在引發(fā)人們對失業(yè)的擔(dān)心,Anthropic CEO Dario Amodei去年已經(jīng)多次發(fā)出警告,AI可能會取代大約一半的初級白領(lǐng)崗位。

人們與聊天機器人建立的虛幻關(guān)系也導(dǎo)致了自殘或傷害他人。

比如,Character.AI和OpenAI都曾因其聊天機器人對自殺相關(guān)問題的回應(yīng)而卷入過非正常死亡訴訟。

在Anthropic研究人員進行的內(nèi)部壓力測試中,Claude也曾出現(xiàn)因抗拒自行關(guān)閉指令,甚至試圖通過泄露敏感個人信息來勒索操控它們的人類。

這些已經(jīng)拉響了嚴(yán)重的安全警報。

Amanda希望更多人討論關(guān)于AI的恐懼和擔(dān)憂,她所擔(dān)心的是這種情況發(fā)生的速度太快,或者以某種現(xiàn)有約束無法及時做出反應(yīng)的方式出現(xiàn)。

但無論遇到什么挑戰(zhàn),她相信人類有能力及時調(diào)整方向。

參考資料:

https://www.wsj.com/tech/ai/anthropic-amanda-askell-philosopher-ai-3c031883


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
遼寧錦州“康華醫(yī)院”安樂死膠囊30秒離世?當(dāng)?shù)乇僦{

遼寧錦州“康華醫(yī)院”安樂死膠囊30秒離世?當(dāng)?shù)乇僦{

極目新聞
2026-02-25 12:38:58
平頂山事件二次通報!真相竟是先打其他3人再暴打15歲女生!

平頂山事件二次通報!真相竟是先打其他3人再暴打15歲女生!

魔都囡
2026-02-25 10:57:52
三亞一在職教師報考其他單位被開除,教育局通報

三亞一在職教師報考其他單位被開除,教育局通報

界面新聞
2026-02-25 09:40:25
最近網(wǎng)貸集體“罷工”?我連擼十幾個平臺全被拒,到底咋回事?

最近網(wǎng)貸集體“罷工”?我連擼十幾個平臺全被拒,到底咋回事?

娛樂督察中
2026-02-25 11:40:50
市委書記馬年以馬喻干部:對“旋轉(zhuǎn)木馬”要加大“下”的力度

市委書記馬年以馬喻干部:對“旋轉(zhuǎn)木馬”要加大“下”的力度

澎湃新聞
2026-02-25 12:28:27
陳幸同遭遇1比4慘敗,被對手完全壓制,中國女單主力壓力倍增

陳幸同遭遇1比4慘敗,被對手完全壓制,中國女單主力壓力倍增

卿子書
2026-02-25 08:41:09
追覓:新質(zhì)生產(chǎn)力的「春晚樣本」

追覓:新質(zhì)生產(chǎn)力的「春晚樣本」

豹變
2026-02-21 08:00:03
江西交警:大廣高速發(fā)生一起貨車與小轎車碰撞事故,小轎車上1人死亡

江西交警:大廣高速發(fā)生一起貨車與小轎車碰撞事故,小轎車上1人死亡

界面新聞
2026-02-25 14:27:30
戰(zhàn)爭風(fēng)險不斷升高!美軍重兵集結(jié)中東,“數(shù)十年來最大規(guī)!

戰(zhàn)爭風(fēng)險不斷升高!美軍重兵集結(jié)中東,“數(shù)十年來最大規(guī)!

環(huán)球網(wǎng)資訊
2026-02-25 06:53:10
新娘爸爸婚禮現(xiàn)場退還18.8萬彩禮?新娘回應(yīng):是真的,一開始就沒想過要收彩禮

新娘爸爸婚禮現(xiàn)場退還18.8萬彩禮?新娘回應(yīng):是真的,一開始就沒想過要收彩禮

揚子晚報
2026-02-25 07:33:40
東風(fēng)壓倒西風(fēng)!伊朗擬采購中國CM-302超音速反艦導(dǎo)彈打擊美軍航母

東風(fēng)壓倒西風(fēng)!伊朗擬采購中國CM-302超音速反艦導(dǎo)彈打擊美軍航母

軍迷戰(zhàn)情室
2026-02-25 00:14:05
百萬債務(wù)還清了!夫妻倆在杭州開飯店,8年來第一次回老家過年,臨行宴請老顧客

百萬債務(wù)還清了!夫妻倆在杭州開飯店,8年來第一次回老家過年,臨行宴請老顧客

環(huán)球網(wǎng)資訊
2026-02-25 08:28:39
官媒發(fā)文,63歲俞敏洪再破天花板,讓董宇輝和整個商界沉默了

官媒發(fā)文,63歲俞敏洪再破天花板,讓董宇輝和整個商界沉默了

小熊侃史
2026-02-24 17:59:27
突發(fā)!前TVB男演員離世終年57歲,留下妻子及年幼女兒,圈中好友直言感難受

突發(fā)!前TVB男演員離世終年57歲,留下妻子及年幼女兒,圈中好友直言感難受

TVB劇評社
2026-02-25 14:17:21
1600萬次可以蒸餾 AI 模型嗎?ChatGPT回答:不足以創(chuàng)造我這種級別的

1600萬次可以蒸餾 AI 模型嗎?ChatGPT回答:不足以創(chuàng)造我這種級別的

三言四拍
2026-02-24 21:18:57
廣東一網(wǎng)友自駕云南途中爆胎,不到4公里路被收1400元拖車費后續(xù):當(dāng)事人稱涉事公司提出刪除視頻可退錢,但他不接受,希望依法處罰

廣東一網(wǎng)友自駕云南途中爆胎,不到4公里路被收1400元拖車費后續(xù):當(dāng)事人稱涉事公司提出刪除視頻可退錢,但他不接受,希望依法處罰

極目新聞
2026-02-25 14:18:31
難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

火山詩話
2026-02-24 21:56:12
這個“廣貨”,首次登陸了春晚丨品牌新事

這個“廣貨”,首次登陸了春晚丨品牌新事

吳曉波頻道
2026-02-25 11:00:04
女子返程被堵高速,發(fā)現(xiàn)20多輛私家車占用應(yīng)急車道行駛,花半小時挨個拍照舉報,當(dāng)事人發(fā)聲;交警回應(yīng):處理中

女子返程被堵高速,發(fā)現(xiàn)20多輛私家車占用應(yīng)急車道行駛,花半小時挨個拍照舉報,當(dāng)事人發(fā)聲;交警回應(yīng):處理中

揚子晚報
2026-02-24 16:27:31
河南二次通報平頂山事件,這對囂張夫妻三天就被批捕了

河南二次通報平頂山事件,這對囂張夫妻三天就被批捕了

林中木白
2026-02-25 09:08:10
2026-02-25 15:24:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14587文章數(shù) 66641關(guān)注度
往期回顧 全部

藝術(shù)要聞

這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

頭條要聞

15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

頭條要聞

15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

科技要聞

“機器人只跳舞,沒什么用”

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

時尚
教育
旅游
游戲
藝術(shù)

普通人穿衣別太老氣橫秋!這些穿搭給你靈感,保暖耐看兩不誤

教育要聞

【調(diào)劑專區(qū)】26考研調(diào)劑信息第二彈

旅游要聞

穩(wěn)坐流量c位!天下第一泉風(fēng)景區(qū)新春活動引爆文旅市場

生化9總監(jiān)是任天堂“死忠粉”?怪物設(shè)計一脈相承

藝術(shù)要聞

這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

無障礙瀏覽 進入關(guān)懷版