国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Karpathy:別再問AI「你怎么看了」,這是錯誤的提示詞策略!

0
分享至


↑閱讀之前記得關(guān)注+星標??,,每天才能第一時間接收到更新

Andrej Karpathy對于如何理解和與LLM交互最新觀點

他提出一個核心觀點:不要把大語言模型看作是實體,而應(yīng)視作模擬器

這一視角的轉(zhuǎn)變,直接影響著用戶與AI交互的方式和效果

Karpathy建議,當人們想要探索某個話題時,應(yīng)該避免使用這樣的提問方式:

“關(guān)于xyz,你怎么看?”

原因很簡單:根本就沒有“你”存在。

Karpathy認為,大模型并沒有像人類那樣,隨著時間的推移對某個話題進行思考并形成自己的觀點。

如果用戶強行使用“你”來提問,LLM會根據(jù)其微調(diào)數(shù)據(jù)的統(tǒng)計規(guī)律,采用一個隱含的 “個性嵌入向量”(personality embedding vector),并基于此進行模擬回復(fù)。雖然這樣做也沒問題,但Karpathy指出,這其中的神秘感遠沒有人們通常認為的詢問AI那么高

更有效的提問策略

基于模擬器的定位,Karpathy給出了一種更優(yōu)的Prompt策略:

“什么樣的一群人適合探索xyz話題?他們會怎么說?”

通過這種方式,用戶可以讓LLM引導或模擬多種視角,而非局限于單一的、被統(tǒng)計數(shù)據(jù)塑造的“AI人格”


關(guān)于AI人格的工程化本質(zhì)

針對卡帕西的觀點,有網(wǎng)友提出了一個反直覺的問題:模型難道不會采取回報率最高的個性嗎?這就意味著它會表現(xiàn)得像該領(lǐng)域最適合回答該問題的專家

對此,Karpathy承認,確實存在針對“你”這一模擬維度的工程化工作。

目前,通過SFT(監(jiān)督微調(diào))和RLHF(人類反饋強化學習),開發(fā)者正在努力構(gòu)建一個能夠獲得高獎勵、贏得用戶或裁判模型點贊、或者模仿特定響應(yīng)風格的“個性”。這確實產(chǎn)生了一種涌現(xiàn)出的復(fù)合人格

但Karpathy強調(diào),這種“你”是被刻意設(shè)計、工程化并硬加上去的

它本質(zhì)上仍然建立在一個Token模擬引擎之上,而不是一個隨著時間推移、以普通人可理解的方式構(gòu)建起來的、具有涌現(xiàn)性的“心智”

可驗證與不可驗證領(lǐng)域

Karpathy最后指出,在不同領(lǐng)域,這種區(qū)別的影響不同:

在可驗證領(lǐng)域(如數(shù)學、編程):情況相對簡單,專家視角的模擬通常是準確的。

在不可驗證領(lǐng)域(如詢問對某話題的觀點/意見):情況則變得更加有趣且復(fù)雜。

在后一種情況下,用戶很難搞清楚正在與之對話的這個“你”究竟是誰,它來自哪里,以及應(yīng)該給予它多大的信任度


驗證

直接上手驗證一下,用Karpathy建議的Prompt策略,來解析Karpathy以上觀點

提問:


LLM(Gemini 3 pro)的回答:

為了深入探討“LLM是模擬器而非實體”這一論題,最適合組成的虛擬圓桌會議應(yīng)該包含以下幾類人:深度學習理論家、認知科學家、RLHF(人類反饋強化學習)一線工程師以及高階提示詞專家

假如他們聚在一起,針對Karpathy的觀點,他們會分別這樣說:

1. 深度學習理論家(The Deep Learning Theorist)

視角核心:統(tǒng)計學與概率分布

Karpathy切中了要害。從數(shù)學本質(zhì)上看,模型只是在多維空間中學習數(shù)據(jù)分布。所謂的‘回答’,本質(zhì)上是從巨大的概率分布中進行的條件采樣(Conditional Sampling)

當你問‘你怎么看’時,模型并不是在調(diào)動一個內(nèi)在的自我意識中心,它只是在計算:在海量的互聯(lián)網(wǎng)文本中,當出現(xiàn)‘你怎么看’這種句式時,后面接什么Token的概率最高。它模擬的是‘互聯(lián)網(wǎng)上的平均回答者’或者‘微調(diào)數(shù)據(jù)中定義的理想助手’。確實不存在一個物理的或心理的‘實體’在思考

2. RLHF工程師(The Alignment Engineer)

視角核心:工程實現(xiàn)與獎勵機制

關(guān)于‘硬加’和‘工程化’這一點,我們最清楚。底座模型就像是一個瘋狂的夢境生成器,它能模擬莎士比亞,也能模擬代碼,或者模擬網(wǎng)絡(luò)噴子。

我們通過RLHF給它套上了一個面具。那個彬彬有禮、總是說作為一名人工智能語言模型……’的‘你’,確實是我們?yōu)榱税踩陀杏眯裕ㄟ^獎勵模型硬生生訓練出來的特定行為模式。Karpathy說得對,這只是一層薄薄的界面,底下仍然是那個通用的Token模擬引擎

3. 認知科學家/心靈哲學家(The Cognitive Scientist)

視角核心:主體性(Agency)與時間連續(xù)性

關(guān)鍵在于Karpathy提到的時間和形成觀點。人類的我建立在記憶的連續(xù)性和與世界持續(xù)交互的經(jīng)驗之上

LLM是無狀態(tài)的。每一次對話對它來說都是全新的開端,沒有過去,也沒有未來。它沒有隨著時間推移去在這個世界上生活,因此它不可能擁有像人類那樣基于生活經(jīng)驗累積而成的觀點。它是在模擬一個擁有觀點的人類會說出的話,這在本體論上與擁有觀點是兩回事

4. 高階提示詞專家(The Prompt Engineer)

視角核心:實用主義與上下文激活

從實操角度看,把LLM當作‘模擬器’能讓性能提升一個量級

如果我問‘你怎么看這行代碼’,它可能會給出一個平庸的、通過RLHF對齊的通用解釋。但如果我按照Karpathy的邏輯,把它設(shè)定為‘模擬一位資深的Linux內(nèi)核維護者’,它就會調(diào)用訓練數(shù)據(jù)中那部分特定的、高權(quán)重的專業(yè)知識分布

承認‘沒有你’,反而讓我們能更自由地定義‘你是誰’,從而榨出模型的最強性能?!?/p>

總結(jié)這群人的共識:

他們會一致認為,Karpathy不僅是在糾正稱呼,更是在揭示大模型“變色龍”的本質(zhì)。“你”是一個被訓練出來的用戶界面,而“模擬器”才是這臺機器真正的操作系統(tǒng)

非常有意思,建議大家也嘗試一下,小小的一個提示詞策略改變,可能會讓你獲得對某個topic更好的理解

--end--

最后記得??我,這對我非常重要,每天都在更新:

歡迎點贊轉(zhuǎn)發(fā)推薦評論,別忘了關(guān)注我

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
蒯曼4-1長崎美柚,連勝兩位日乒隊員,晉級女單四強,轟兩局11:3

蒯曼4-1長崎美柚,連勝兩位日乒隊員,晉級女單四強,轟兩局11:3

湘楚風云
2026-01-11 00:30:01
果然不出中國所料:日本喊話俄羅斯,72年基業(yè)絕不能毀在中國手上

果然不出中國所料:日本喊話俄羅斯,72年基業(yè)絕不能毀在中國手上

歷史有些冷
2026-01-09 18:50:02
施海榮有魄力,換大量替補出場!郭中楠魏伊衫范泊寧都有出色表現(xiàn)

施海榮有魄力,換大量替補出場!郭中楠魏伊衫范泊寧都有出色表現(xiàn)

金毛愛女排
2026-01-11 00:00:09
陪玩陪睡已過時!拳頭塞嘴、集體開嫖、戚薇遭殃,陰暗面徹底曝光

陪玩陪睡已過時!拳頭塞嘴、集體開嫖、戚薇遭殃,陰暗面徹底曝光

涵豆說娛
2025-11-20 16:35:46
雙豐收,雄鹿戰(zhàn)勝湖人后,字母哥收到了一份來自詹姆斯的特別禮物

雙豐收,雄鹿戰(zhàn)勝湖人后,字母哥收到了一份來自詹姆斯的特別禮物

好火子
2026-01-11 00:44:14
人有沒有錢,一看便知:沒錢的子女,大多有3大特質(zhì)、3大窮習慣

人有沒有錢,一看便知:沒錢的子女,大多有3大特質(zhì)、3大窮習慣

第一桶金學派
2025-06-30 10:18:46
牡丹花下死,做鬼也風流!37歲“縱欲過度”的王思聰,再陷大丑聞

牡丹花下死,做鬼也風流!37歲“縱欲過度”的王思聰,再陷大丑聞

瓜汁橘長Dr
2025-12-22 15:12:57
哈工大發(fā)現(xiàn):喜歡睡午覺的人,壽命比不睡午覺的人長幾年不止?

哈工大發(fā)現(xiàn):喜歡睡午覺的人,壽命比不睡午覺的人長幾年不止?

健康之光
2026-01-05 14:22:46
WTT冠軍賽四強對陣,三位國乒冠軍出局,蒯曼立功,陳幸同壓力大

WTT冠軍賽四強對陣,三位國乒冠軍出局,蒯曼立功,陳幸同壓力大

云隱南山
2026-01-11 02:36:52
一舉超越美日!中國砸下263億建全球最大海上機場,到底有多牛?

一舉超越美日!中國砸下263億建全球最大海上機場,到底有多牛?

科學知識點秀
2026-01-10 08:00:04
專家提醒:不要買!不要吃!里面含有硼砂,危害健康,別害了自己

專家提醒:不要買!不要吃!里面含有硼砂,危害健康,別害了自己

蜉蝣說
2025-10-31 10:56:39
四川省城市足球聯(lián)賽總決賽階段抽簽結(jié)果揭曉,首戰(zhàn)計劃在3月14日打響!

四川省城市足球聯(lián)賽總決賽階段抽簽結(jié)果揭曉,首戰(zhàn)計劃在3月14日打響!

紅星新聞
2026-01-11 00:23:08
1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個不留!

1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個不留!

寄史言志
2026-01-07 20:37:09
第一次去男友家,我吃了一桌剩菜,偷聽母子對話后,我連夜逃離

第一次去男友家,我吃了一桌剩菜,偷聽母子對話后,我連夜逃離

云端小院
2026-01-10 10:44:29
特朗普通告全球,不許3國買俄油,話音剛落,中方第一個宣布不服

特朗普通告全球,不許3國買俄油,話音剛落,中方第一個宣布不服

南宗歷史
2026-01-10 13:06:24
福建婚禮上新娘顏值爆表走紅,新郎長相惹爭議:懂事早和董事長?

福建婚禮上新娘顏值爆表走紅,新郎長相惹爭議:懂事早和董事長?

梅子的小情緒
2025-11-29 14:26:05
伊朗多個城市宣布脫離政府控制,革命衛(wèi)隊軍人被打死!

伊朗多個城市宣布脫離政府控制,革命衛(wèi)隊軍人被打死!

知兵
2026-01-11 00:07:45
爆笑經(jīng)典侄女糗事冷笑話,侄女三歲多初上幼兒園不知天高地厚,當老師教育她時她居然說!

爆笑經(jīng)典侄女糗事冷笑話,侄女三歲多初上幼兒園不知天高地厚,當老師教育她時她居然說!

天天明星
2026-01-10 12:08:36
婆婆把80萬全給小叔子,兩年后哭著敲門,入贅老公的做法讓我意外

婆婆把80萬全給小叔子,兩年后哭著敲門,入贅老公的做法讓我意外

木子言故事
2026-01-04 13:01:59
一生僅存六首詩,卻有兩首被寫進課本,成七絕五絕之最

一生僅存六首詩,卻有兩首被寫進課本,成七絕五絕之最

長風文史
2025-11-26 15:26:24
2026-01-11 03:24:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領(lǐng)域
1027文章數(shù) 393關(guān)注度
往期回顧 全部

科技要聞

必看 | 2026開年最頂格的AI對話

頭條要聞

特朗普簽署行政令 宣布進入國家緊急狀態(tài)

頭條要聞

特朗普簽署行政令 宣布進入國家緊急狀態(tài)

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂要聞

吳速玲曝兒子Joe是戀愛腦

財經(jīng)要聞

這不算詐騙嗎?水滴保誘導扣款惹眾怒

汽車要聞

寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
健康
教育
時尚

藝術(shù)要聞

601米,150億美元!沙特目前第一高樓是它!

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

這些新療法,讓化療不再那么痛苦

教育要聞

表現(xiàn)不好,還不接受批評的學生,怎么教育比較合適?

伊姐周六熱推:電視劇《小城大事》;電視劇《軋戲》......

無障礙瀏覽 進入關(guān)懷版