国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

打臉哲學(xué)無(wú)用!牛津博士教出Claude,自曝百萬(wàn)年薪提示詞秘訣

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】在Anthropic,有一位駐場(chǎng)哲學(xué)家Amanda Askell專門研究如何與AI模型打交道。她不僅主導(dǎo)設(shè)計(jì)了Claude的性格、對(duì)齊與價(jià)值觀機(jī)制,還總結(jié)出一些行之有效的提示詞技巧。哲學(xué)在AI時(shí)代不僅沒(méi)有落伍,反而那些通過(guò)哲學(xué)訓(xùn)練掌握提示詞技巧的人,年薪中位數(shù)可以高達(dá)15萬(wàn)美元。

假設(shè)你手上有一臺(tái)最新款的超級(jí)咖啡機(jī)。

你按了十幾次按鈕,就是做不出來(lái)你想要喝的那種咖啡。

問(wèn)題不在于咖啡機(jī)的性能不夠強(qiáng)大,而在于你不知道正確的指令是什么。

在Anthropic,就有一個(gè)專門研究和AI這臺(tái)「超級(jí)智能咖啡機(jī)」溝通的人。

她既不是工程師,也不是程序員,而是一位駐場(chǎng)哲學(xué)家Amanda Askell。


Amanda Askell是一位受過(guò)哲學(xué)訓(xùn)練的學(xué)者,負(fù)責(zé)協(xié)助管理Claude的性格設(shè)定

Askell是正兒八經(jīng)的哲學(xué)科班出身。

她曾在牛津大學(xué)和紐約大學(xué)學(xué)習(xí)哲學(xué),2018年獲得了紐約大學(xué)哲學(xué)博士學(xué)位。


畢業(yè)后,Askell曾在OpenAI擔(dān)任政策方向的研究科學(xué)家。

2021年她加入Anthropic,至今一直在該公司擔(dān)任對(duì)齊微調(diào)方向的研究科學(xué)家。

Askell負(fù)責(zé)為Anthropic的Claude注入某些性格特質(zhì),同時(shí)避免其他特質(zhì)。

她因?yàn)橹鲗?dǎo)設(shè)計(jì)了Claude的性格、對(duì)齊與價(jià)值觀機(jī)制,而被列入「2024年最具影響力的100位AI人物」 。


在Anthropic,Askell有一個(gè)「Claude耳語(yǔ)者」(Claude whisperer)的綽號(hào)。

這大概是因?yàn)樗难芯糠较颍侨绾闻cClaude溝通,并調(diào)整優(yōu)化它的輸出。

用好AI

你需要一把「哲學(xué)鑰匙」

哲學(xué),就好比打開(kāi)AI這臺(tái)復(fù)雜機(jī)器的鑰匙。

近日,Askell分享了她制定有效AI提示詞的方法。

她認(rèn)為提示詞工程需要清晰表達(dá)、不斷嘗試,以及哲學(xué)式的思考方式。

在Askell看來(lái),哲學(xué)的一大核心能力,是能把思想表達(dá)得清楚而準(zhǔn)確,而這正是發(fā)揮AI最大價(jià)值的關(guān)鍵:

「很難總結(jié)其中的奧妙,一個(gè)關(guān)鍵是要愿意頻繁地與模型互動(dòng),并且認(rèn)真觀察它每一次的輸出」。

Askell認(rèn)為好的提示詞作者應(yīng)該「非常愛(ài)嘗試、敢于試驗(yàn)」,但比不斷試錯(cuò)更重要的是哲學(xué)思維。

「哲學(xué)思維確實(shí)能幫助寫提示詞,我很大一部分的工作就是盡可能清晰地向模型解釋我正在思考的問(wèn)題、擔(dān)憂或想法是什么」。

哲學(xué)思維對(duì)于清晰表達(dá)的重視,不僅能幫助人們優(yōu)化自己的提示詞,也有助于更好地理解AI本身。


https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/overview?utm_source=chatgpt.com

在Anthropic發(fā)布的《提示詞工程概覽》中,就提出了包含清晰表達(dá)在內(nèi)的提示詞技巧:

  • 清晰且直接(Be clear and direct);

  • 給出示例(multishot/few-shot prompting),使用多輪示例來(lái)說(shuō)明預(yù)期輸出;

  • 如果任務(wù)復(fù)雜,讓模型分步思考(chain-of-thought),以提高準(zhǔn)確性;

  • 給Claude一個(gè)角色(system prompt/role prompt),以便設(shè)定上下文、風(fēng)格、任務(wù)邊界。

這意味著我們?cè)谂cClaude聊天時(shí),可以把它設(shè)想為一個(gè)知識(shí)豐富、非常聰明,但又時(shí)常健忘、缺乏背景知識(shí)的新員工,需要你給出明確的指示。

也就是說(shuō),它并不了解你的規(guī)范、風(fēng)格、偏好或工作方式。

你越精確說(shuō)明需求,Claude的回復(fù)就會(huì)越好。


Netscape(網(wǎng)景)聯(lián)合創(chuàng)始人Marc Andreessen

Netscape(網(wǎng)景)聯(lián)合創(chuàng)始人,硅谷著名技術(shù)企業(yè)家與風(fēng)險(xiǎn)投資人Marc Andreessen不久前也表示,AI的強(qiáng)大之處在于把它當(dāng)成「思維伙伴」:

「AI的藝術(shù)就在于你問(wèn)它什么問(wèn)題」。

在AI時(shí)代,提出一個(gè)問(wèn)題往往比解決一個(gè)問(wèn)題更重要。

或者說(shuō),正確地提出問(wèn)題(提示詞工程),就是在高效解決問(wèn)題。

人類把提問(wèn)的部分(提示詞)做好了,解決問(wèn)題的部分主要交給AI就可以了。

這也是為什么掌握提示詞技能的人能夠找到高薪工作的原因。

根據(jù)levels.fyi(科技從業(yè)者查詢薪資的平臺(tái))的數(shù)據(jù),提示詞工程師的年薪中位數(shù)高達(dá)15萬(wàn)美元。

AI不是「某個(gè)人」

別再問(wèn)它「你怎么看了?」


近日,Karpathy在一篇推文中表達(dá)了他對(duì)提示詞的看法。

他建議人們不要把大模型當(dāng)成一個(gè)「實(shí)體」,而要把它看作一個(gè)「模擬器」。

比如,在探索某個(gè)話題時(shí)不要問(wèn)它你怎么看xyz(某個(gè)問(wèn)題),因?yàn)槟愕奶釂?wèn)對(duì)象并不是一個(gè)真正的個(gè)體。

而是應(yīng)當(dāng)這樣問(wèn):

「如果要討論xyz,找哪些角色/人群會(huì)比較合適?他們會(huì)怎么說(shuō)?」

Karpathy認(rèn)大模型可以切換、模擬很多不同的視角,但它并不會(huì)像我們那樣,長(zhǎng)時(shí)間地思考xyz并逐漸形成自己的觀點(diǎn)。

因此,如果你用「你」來(lái)提問(wèn),它會(huì)根據(jù)微調(diào)數(shù)據(jù)里的統(tǒng)計(jì)特征,自動(dòng)套用某種隱含的「人格嵌入向量」,再以那種人格的方式來(lái)回答。

Karpathy的這種解釋,在一定程度上破除了大家想象中「在向一個(gè)AI發(fā)問(wèn)」時(shí)所帶來(lái)的那種神秘感。


針對(duì)Karpathy的觀點(diǎn),網(wǎng)友Dimitris提到,模型是否會(huì)自動(dòng)「扮演」成最有能力回答問(wèn)題的專家人格。

Karpathy回答這種現(xiàn)象確實(shí)存在,在某些任務(wù)中確實(shí)可能工程化了一個(gè)「人格」,比如讓模型模仿專家、通過(guò)獎(jiǎng)勵(lì)模型得到高分、模仿用戶喜歡的風(fēng)格等。

這樣會(huì)出現(xiàn)某種「復(fù)合型人格」,但這種人格是刻意工程疊加而形成的,并非自然形成的人類心智。

所以,AI從本質(zhì)上仍然是token預(yù)測(cè)機(jī)器。模型的所謂「人格」,只是通過(guò)訓(xùn)練、人為約束、系統(tǒng)指令等手段疊加上的「外殼」。

對(duì)此,Askell也提到了類似觀點(diǎn)。

盡管Claude的個(gè)性中仍有一種「類人的特質(zhì)」,但它沒(méi)有情感、記憶或自我意識(shí)。

因此,它所表現(xiàn)出的任何「?jìng)€(gè)性」都只是復(fù)雜語(yǔ)言處理的結(jié)果,而非內(nèi)在生命的體現(xiàn)。

你以為AI在「理解世界」

它可能只是「換頻道」

開(kāi)發(fā)AI模型,有時(shí)感覺(jué)就好像在玩打地鼠游戲。

剛修好了模型在一個(gè)問(wèn)題上的錯(cuò)誤回答,它又開(kāi)始在別的問(wèn)題上出錯(cuò)。

層出不窮的問(wèn)題就像那些不斷從洞口探出頭的地鼠一樣。

OpenAI等機(jī)構(gòu)研究人員,將這類現(xiàn)象的一種表現(xiàn)被稱為「裂腦問(wèn)題」(split-brain problem):

提問(wèn)方式稍微改變一下,就可能讓模型給出完全不同的答案。

「裂腦問(wèn)題」背后反映出當(dāng)今大模型的一個(gè)致命缺陷:

它并不會(huì)像人類那樣逐步形成對(duì)世界運(yùn)作方式的理解。

一些專家據(jù)此認(rèn)為,它們無(wú)法很好地泛化,難以處理訓(xùn)練數(shù)據(jù)之外的任務(wù)。

這也可能帶來(lái)一個(gè)質(zhì)疑:

投資者向OpenAI、Anthropic等實(shí)驗(yàn)室投入數(shù)百億美元,希望它們訓(xùn)練出的模型能在醫(yī)學(xué)、數(shù)學(xué)等領(lǐng)域做出新的發(fā)現(xiàn),這樣的投入是否真正有效?

「裂腦問(wèn)題」通常出現(xiàn)在模型開(kāi)發(fā)的后期階段,也就是后訓(xùn)練階段。

在這一階段,模型會(huì)被輸入經(jīng)過(guò)精心挑選的數(shù)據(jù),比如醫(yī)學(xué)、法律等特定領(lǐng)域的知識(shí),或者是學(xué)習(xí)如何更好地回應(yīng)使用者。

比如,一個(gè)模型可能被訓(xùn)練在數(shù)學(xué)題數(shù)據(jù)集上,以便更準(zhǔn)確地解答數(shù)學(xué)問(wèn)題。

它也可能被訓(xùn)練在另一個(gè)數(shù)據(jù)集上,以提升回答時(shí)的語(yǔ)氣、個(gè)性和格式。

但這樣做有時(shí)會(huì)讓模型無(wú)意間學(xué)到「分場(chǎng)景作答」,它會(huì)根據(jù)自「以為」遇到的場(chǎng)景來(lái)決定回答方式:

是一個(gè)明確的數(shù)學(xué)問(wèn)題,還是它在另一個(gè)訓(xùn)練數(shù)據(jù)集中經(jīng)常見(jiàn)到的那類更泛化的問(wèn)答場(chǎng)景。

如果用戶用正式的證明風(fēng)格來(lái)提數(shù)學(xué)問(wèn)題,模型通常能答對(duì)。

但如果用戶用更隨意的口吻提問(wèn),它可能誤以為自己是在一個(gè)更偏向被獎(jiǎng)勵(lì)「友好表達(dá)、格式漂亮」的場(chǎng)景里。

于是可能為了這些附加屬性而犧牲準(zhǔn)確性,比如寫出一個(gè)排版很好、甚至帶表情符號(hào)的答案。

也就是說(shuō)A在回答問(wèn)題的時(shí)候也會(huì)「看人下菜碟」:

如果覺(jué)得用戶問(wèn)的是「低水平」的問(wèn)題,它就會(huì)給出「低水平」的回答;如果它覺(jué)得用戶問(wèn)的是「高水平」的問(wèn)題,它也會(huì)呈現(xiàn)「高水平」的回答。

這是模型在對(duì)提示詞格式「過(guò)度敏感」,而導(dǎo)致出現(xiàn)的一些本來(lái)不該出現(xiàn)的細(xì)微差別。

比如提示詞里是用破折號(hào)還是冒號(hào),都可能影響模型回答的質(zhì)量。

「裂腦問(wèn)題」凸顯了訓(xùn)練模型的困難性和微妙之處,尤其是要確保訓(xùn)練數(shù)據(jù)的組合恰到好處。

它也解釋了為什么許多AI公司愿意砸下數(shù)十億美元,請(qǐng)數(shù)學(xué)、編程、法律等領(lǐng)域的專家來(lái)生成訓(xùn)練數(shù)據(jù),避免他們的模型在專業(yè)用戶面前繼續(xù)犯一些基礎(chǔ)錯(cuò)誤。

「裂腦問(wèn)題」的出現(xiàn),也降低了人們對(duì)于AI即將自動(dòng)化多個(gè)行業(yè)(從投行到軟件開(kāi)發(fā))的預(yù)期。

雖然像AI一樣,人類同樣也會(huì)誤解問(wèn)題。

但AI存在的意義正是在于彌補(bǔ)這些人類的不足,而不是通過(guò)「裂腦問(wèn)題」放大這種不足。

因此,必須要有具備哲學(xué)思維和某個(gè)領(lǐng)域的專業(yè)知識(shí)的人類專家,通過(guò)提示詞工程來(lái)形成大模型訓(xùn)練和使用的「說(shuō)明書」,人們使用這些「說(shuō)明書」與大模型溝通,才能應(yīng)對(duì)大模型的「裂腦問(wèn)題」。

而且,在大模型出現(xiàn)「擬人」特征時(shí),還要避免把大模型當(dāng)成「人」的錯(cuò)覺(jué),也有助于我們更好地發(fā)揮它的價(jià)值,降低機(jī)器幻覺(jué)。

這其實(shí)都非常需要哲學(xué)訓(xùn)練,使自己與AI的對(duì)話清晰富有邏輯。

從這個(gè)角度來(lái)說(shuō),對(duì)于大部分人來(lái)說(shuō),能不能用好AI,不是取決于你的AI專業(yè)知識(shí),而是取決于你的哲學(xué)思維能力。

參考資料:

https://www.theinformation.com/articles/ais-split-brain-problem?rc=epv9gi%20

https://x.com/karpathy/status/1997731268969304070%20

https://www.businessinsider.com/anthropic-philosopher-amanda-askell-tips-ai-prompting-whispering-claude-2025-12

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
兩個(gè)拼車的人竟然親上了!盤點(diǎn)生活中那些有趣又尷尬的經(jīng)歷

兩個(gè)拼車的人竟然親上了!盤點(diǎn)生活中那些有趣又尷尬的經(jīng)歷

夜深愛(ài)雜談
2025-12-19 17:11:55
呂良偉七十大壽:溫碧霞著裝俗氣,甄母年輕袁詠儀漂亮

呂良偉七十大壽:溫碧霞著裝俗氣,甄母年輕袁詠儀漂亮

剪劇課代表
2025-12-25 00:06:13
萬(wàn)萬(wàn)沒(méi)想到,46條中日航線剛?cè)咳∠驼ǔ鰜?lái)一群“妖魔鬼怪”

萬(wàn)萬(wàn)沒(méi)想到,46條中日航線剛?cè)咳∠?,就炸出?lái)一群“妖魔鬼怪”

策略述
2025-12-24 12:22:15
輿論升級(jí)!小洛熙事件后續(xù):有多名醫(yī)生發(fā)聲,涉事部門已重新服務(wù)

輿論升級(jí)!小洛熙事件后續(xù):有多名醫(yī)生發(fā)聲,涉事部門已重新服務(wù)

王大嘴評(píng)說(shuō)
2025-12-23 21:49:34
利雅得勝利5-1祖拉全勝戰(zhàn)績(jī)出線,C羅助攻,菲利克斯傳射建功

利雅得勝利5-1祖拉全勝戰(zhàn)績(jī)出線,C羅助攻,菲利克斯傳射建功

懂球帝
2025-12-25 02:01:13
中國(guó)軍隊(duì)回撤時(shí)越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

中國(guó)軍隊(duì)回撤時(shí)越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

古書記史
2025-12-22 19:50:50
福建艦上唯一能用明火的地方披露:理療室,艦員稱“針灸項(xiàng)目相當(dāng)火爆,一針難求”

福建艦上唯一能用明火的地方披露:理療室,艦員稱“針灸項(xiàng)目相當(dāng)火爆,一針難求”

極目新聞
2025-12-24 22:24:20
反轉(zhuǎn)!龐叔令《亞洲周刊》怒撕劉芳菲節(jié)目:請(qǐng)的龐氏后人是冒牌貨

反轉(zhuǎn)!龐叔令《亞洲周刊》怒撕劉芳菲節(jié)目:請(qǐng)的龐氏后人是冒牌貨

鋭娛之樂(lè)
2025-12-24 15:51:40
龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂了

龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂了

小蜜情感說(shuō)
2025-12-24 12:21:12
被網(wǎng)友家的“暖氣片用法”驚到了!打開(kāi)思路后,比地暖還要香

被網(wǎng)友家的“暖氣片用法”驚到了!打開(kāi)思路后,比地暖還要香

裝修秀
2025-12-08 11:35:03
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

就一點(diǎn)
2025-10-09 12:19:42
2025年有一種痛苦叫搬進(jìn)了“大平層”,不好住不好賣,已淪不動(dòng)產(chǎn)

2025年有一種痛苦叫搬進(jìn)了“大平層”,不好住不好賣,已淪不動(dòng)產(chǎn)

巢客HOME
2025-12-25 07:25:03
慘烈!飛機(jī)墜海 多人遇難! 海水猛灌機(jī)艙殘骸 乘客深海絕望

慘烈!飛機(jī)墜海 多人遇難! 海水猛灌機(jī)艙殘骸 乘客深海絕望

北國(guó)向錫安
2025-12-24 10:28:47
想不到2025還沒(méi)結(jié)束,奚美娟再迎喜訊,讓周野芒和整個(gè)娛圈沉默了

想不到2025還沒(méi)結(jié)束,奚美娟再迎喜訊,讓周野芒和整個(gè)娛圈沉默了

鋭娛之樂(lè)
2025-12-25 08:36:37
全國(guó)出生人口斷崖:21年1062萬(wàn)人,24年954萬(wàn),25年令人意想不到

全國(guó)出生人口斷崖:21年1062萬(wàn)人,24年954萬(wàn),25年令人意想不到

天天熱點(diǎn)見(jiàn)聞
2025-12-23 05:51:15
何晴閨蜜悼文爆料許何14歲搬許亞軍家真相 許何喪母后發(fā)消息給她

何晴閨蜜悼文爆料許何14歲搬許亞軍家真相 許何喪母后發(fā)消息給她

阿纂看事
2025-12-25 09:53:45
浙江省紀(jì)委省監(jiān)委網(wǎng)站:林建波,主動(dòng)投案

浙江省紀(jì)委省監(jiān)委網(wǎng)站:林建波,主動(dòng)投案

上觀新聞
2025-12-25 08:02:12
一天,齊白石給人畫蝦,畫完后,客人不加錢,卻非要他再畫一只蝦

一天,齊白石給人畫蝦,畫完后,客人不加錢,卻非要他再畫一只蝦

忠于法紀(jì)
2025-12-23 18:42:41
一夜之間,房?jī)r(jià)的玩笑這次開(kāi)大了

一夜之間,房?jī)r(jià)的玩笑這次開(kāi)大了

重遠(yuǎn)投資觀
2025-12-24 12:14:19
15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個(gè)月來(lái)借酒澆愁最多一天喝2斤

15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個(gè)月來(lái)借酒澆愁最多一天喝2斤

大風(fēng)新聞
2025-12-24 20:58:04
2025-12-25 14:24:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14180文章數(shù) 66396關(guān)注度
往期回顧 全部

藝術(shù)要聞

緬懷 | 著名油畫家宮立龍逝世,享年73歲

頭條要聞

女子入室殺害好友三名未成年子女 隨后在樓內(nèi)上吊自殺

頭條要聞

女子入室殺害好友三名未成年子女 隨后在樓內(nèi)上吊自殺

體育要聞

單賽季11冠,羽壇“安洗瑩時(shí)代”真的來(lái)了

娛樂(lè)要聞

金莎小19歲男友求婚成功!兩人雪地?fù)砦?/h3>

財(cái)經(jīng)要聞

美國(guó)未來(lái)18個(gè)月不對(duì)中國(guó)芯片加額外關(guān)稅

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

汽車要聞

預(yù)售31.3萬(wàn)元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

本地
時(shí)尚
游戲
旅游
軍事航空

本地新聞

云游安徽|亳州晨暮皆成史,街巷縱橫印春秋

對(duì)不起周柯宇,是陳靖可先來(lái)的

摩托辣妹太爽了! 《鳴潮》3.0版本更新上線

旅游要聞

元旦迎新跑,火熱報(bào)名中→

軍事要聞

澤連斯基版“和平計(jì)劃”透露哪些信息

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版