国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Karpathy:別再問AI「你怎么看了」,這是錯誤的提示詞策略!

0
分享至


↑閱讀之前記得關(guān)注+星標(biāo)??,,每天才能第一時間接收到更新

Andrej Karpathy對于如何理解和與LLM交互最新觀點

他提出一個核心觀點:不要把大語言模型看作是實體,而應(yīng)視作模擬器

這一視角的轉(zhuǎn)變,直接影響著用戶與AI交互的方式和效果

Karpathy建議,當(dāng)人們想要探索某個話題時,應(yīng)該避免使用這樣的提問方式:

“關(guān)于xyz,你怎么看?”

原因很簡單:根本就沒有“你”存在。

Karpathy認為,大模型并沒有像人類那樣,隨著時間的推移對某個話題進行思考并形成自己的觀點。

如果用戶強行使用“你”來提問,LLM會根據(jù)其微調(diào)數(shù)據(jù)的統(tǒng)計規(guī)律,采用一個隱含的 “個性嵌入向量”(personality embedding vector),并基于此進行模擬回復(fù)。雖然這樣做也沒問題,但Karpathy指出,這其中的神秘感遠沒有人們通常認為的詢問AI那么高

更有效的提問策略

基于模擬器的定位,Karpathy給出了一種更優(yōu)的Prompt策略:

“什么樣的一群人適合探索xyz話題?他們會怎么說?”

通過這種方式,用戶可以讓LLM引導(dǎo)或模擬多種視角,而非局限于單一的、被統(tǒng)計數(shù)據(jù)塑造的“AI人格”


關(guān)于AI人格的工程化本質(zhì)

針對卡帕西的觀點,有網(wǎng)友提出了一個反直覺的問題:模型難道不會采取回報率最高的個性嗎?這就意味著它會表現(xiàn)得像該領(lǐng)域最適合回答該問題的專家

對此,Karpathy承認,確實存在針對“你”這一模擬維度的工程化工作。

目前,通過SFT(監(jiān)督微調(diào))和RLHF(人類反饋強化學(xué)習(xí)),開發(fā)者正在努力構(gòu)建一個能夠獲得高獎勵、贏得用戶或裁判模型點贊、或者模仿特定響應(yīng)風(fēng)格的“個性”。這確實產(chǎn)生了一種涌現(xiàn)出的復(fù)合人格

但Karpathy強調(diào),這種“你”是被刻意設(shè)計、工程化并硬加上去的

它本質(zhì)上仍然建立在一個Token模擬引擎之上,而不是一個隨著時間推移、以普通人可理解的方式構(gòu)建起來的、具有涌現(xiàn)性的“心智”

可驗證與不可驗證領(lǐng)域

Karpathy最后指出,在不同領(lǐng)域,這種區(qū)別的影響不同:

在可驗證領(lǐng)域(如數(shù)學(xué)、編程):情況相對簡單,專家視角的模擬通常是準確的。

在不可驗證領(lǐng)域(如詢問對某話題的觀點/意見):情況則變得更加有趣且復(fù)雜。

在后一種情況下,用戶很難搞清楚正在與之對話的這個“你”究竟是誰,它來自哪里,以及應(yīng)該給予它多大的信任度


驗證

直接上手驗證一下,用Karpathy建議的Prompt策略,來解析Karpathy以上觀點

提問:


LLM(Gemini 3 pro)的回答:

為了深入探討“LLM是模擬器而非實體”這一論題,最適合組成的虛擬圓桌會議應(yīng)該包含以下幾類人:深度學(xué)習(xí)理論家、認知科學(xué)家、RLHF(人類反饋強化學(xué)習(xí))一線工程師以及高階提示詞專家

假如他們聚在一起,針對Karpathy的觀點,他們會分別這樣說:

1. 深度學(xué)習(xí)理論家(The Deep Learning Theorist)

視角核心:統(tǒng)計學(xué)與概率分布

Karpathy切中了要害。從數(shù)學(xué)本質(zhì)上看,模型只是在多維空間中學(xué)習(xí)數(shù)據(jù)分布。所謂的‘回答’,本質(zhì)上是從巨大的概率分布中進行的條件采樣(Conditional Sampling)

當(dāng)你問‘你怎么看’時,模型并不是在調(diào)動一個內(nèi)在的自我意識中心,它只是在計算:在海量的互聯(lián)網(wǎng)文本中,當(dāng)出現(xiàn)‘你怎么看’這種句式時,后面接什么Token的概率最高。它模擬的是‘互聯(lián)網(wǎng)上的平均回答者’或者‘微調(diào)數(shù)據(jù)中定義的理想助手’。確實不存在一個物理的或心理的‘實體’在思考

2. RLHF工程師(The Alignment Engineer)

視角核心:工程實現(xiàn)與獎勵機制

關(guān)于‘硬加’和‘工程化’這一點,我們最清楚。底座模型就像是一個瘋狂的夢境生成器,它能模擬莎士比亞,也能模擬代碼,或者模擬網(wǎng)絡(luò)噴子。

我們通過RLHF給它套上了一個面具。那個彬彬有禮、總是說作為一名人工智能語言模型……’的‘你’,確實是我們?yōu)榱税踩陀杏眯?,通過獎勵模型硬生生訓(xùn)練出來的特定行為模式。Karpathy說得對,這只是一層薄薄的界面,底下仍然是那個通用的Token模擬引擎

3. 認知科學(xué)家/心靈哲學(xué)家(The Cognitive Scientist)

視角核心:主體性(Agency)與時間連續(xù)性

關(guān)鍵在于Karpathy提到的時間和形成觀點。人類的我建立在記憶的連續(xù)性和與世界持續(xù)交互的經(jīng)驗之上

LLM是無狀態(tài)的。每一次對話對它來說都是全新的開端,沒有過去,也沒有未來。它沒有隨著時間推移去在這個世界上生活,因此它不可能擁有像人類那樣基于生活經(jīng)驗累積而成的觀點。它是在模擬一個擁有觀點的人類會說出的話,這在本體論上與擁有觀點是兩回事

4. 高階提示詞專家(The Prompt Engineer)

視角核心:實用主義與上下文激活

從實操角度看,把LLM當(dāng)作‘模擬器’能讓性能提升一個量級

如果我問‘你怎么看這行代碼’,它可能會給出一個平庸的、通過RLHF對齊的通用解釋。但如果我按照Karpathy的邏輯,把它設(shè)定為‘模擬一位資深的Linux內(nèi)核維護者’,它就會調(diào)用訓(xùn)練數(shù)據(jù)中那部分特定的、高權(quán)重的專業(yè)知識分布

承認‘沒有你’,反而讓我們能更自由地定義‘你是誰’,從而榨出模型的最強性能?!?/p>

總結(jié)這群人的共識:

他們會一致認為,Karpathy不僅是在糾正稱呼,更是在揭示大模型“變色龍”的本質(zhì)?!澳恪笔且粋€被訓(xùn)練出來的用戶界面,而“模擬器”才是這臺機器真正的操作系統(tǒng)

非常有意思,建議大家也嘗試一下,小小的一個提示詞策略改變,可能會讓你獲得對某個topic更好的理解

--end--

最后記得??我,這對我非常重要,每天都在更新:

歡迎點贊轉(zhuǎn)發(fā)推薦評論,別忘了關(guān)注我

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

古怪奇談錄
2025-06-28 13:49:02
2:4再輸!王曼昱呆坐,衣服開線遭單局大逆轉(zhuǎn),全場給孫穎莎加油

2:4再輸!王曼昱呆坐,衣服開線遭單局大逆轉(zhuǎn),全場給孫穎莎加油

銜春信
2026-03-02 01:11:07
中國核工業(yè)集團,總工程師羅琦,突然從一個極重要位置上被撤下來

中國核工業(yè)集團,總工程師羅琦,突然從一個極重要位置上被撤下來

百態(tài)人間
2026-02-25 15:36:52
下一周(3.2)持有這些個股的要小心了?。ǜ絺€股)

下一周(3.2)持有這些個股的要小心了?。ǜ絺€股)

股市皆大事
2026-03-01 15:11:43
官方出手!這一次,反詐老陳終為自己的“荒唐”行徑付出了代價

官方出手!這一次,反詐老陳終為自己的“荒唐”行徑付出了代價

娛樂圈的筆娛君
2026-03-02 00:57:55
戰(zhàn)勝中國臺北 前臺北球員狂夸朱俊龍胡金秋!網(wǎng)友:先給你發(fā)身份證

戰(zhàn)勝中國臺北 前臺北球員狂夸朱俊龍胡金秋!網(wǎng)友:先給你發(fā)身份證

冷桂零落
2026-03-02 01:35:21
整天開會有啥必要?。?>
    </a>
        <h3>
      <a href=整天開會有啥必要??? 北京老付
2026-01-20 10:59:33
若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

貓叔東山再起
2026-03-01 12:40:03
A股:剛剛,重磅消息傳來,不出意外的話,周一將迎來更大的變盤

A股:剛剛,重磅消息傳來,不出意外的話,周一將迎來更大的變盤

云鵬敘事
2026-03-02 00:00:04
造車新勢力2月交付承壓:零跑跌至3萬輛以下,多家車企加碼促銷

造車新勢力2月交付承壓:零跑跌至3萬輛以下,多家車企加碼促銷

澎湃新聞
2026-03-01 22:10:31
蘇翊鳴谷愛凌參加表彰大會彼此不熟,都挺疲憊,快睡著了眼皮耷拉

蘇翊鳴谷愛凌參加表彰大會彼此不熟,都挺疲憊,快睡著了眼皮耷拉

樂悠悠娛樂
2026-03-01 10:23:24
哈梅內(nèi)伊死了,裸官還能留嗎?

哈梅內(nèi)伊死了,裸官還能留嗎?

美第奇效應(yīng)
2026-03-02 02:33:27
梅德韋杰夫報平安:情況不同尋常,沒人知道我們何時能起飛

梅德韋杰夫報平安:情況不同尋常,沒人知道我們何時能起飛

懂球帝
2026-03-01 19:44:21
美以對伊朗斬首轟炸得逞 “反常規(guī)”白天空襲是成功關(guān)鍵

美以對伊朗斬首轟炸得逞 “反常規(guī)”白天空襲是成功關(guān)鍵

洪超飛軍事
2026-03-01 11:47:26
最懂 AI 的那撥人,都在讓自家孩子學(xué)什么?看完這篇刷屏文章,我終于不焦慮了

最懂 AI 的那撥人,都在讓自家孩子學(xué)什么?看完這篇刷屏文章,我終于不焦慮了

AI范兒
2026-02-28 13:06:42
一種戴久了可能致癌的首飾,很多人家里都有!

一種戴久了可能致癌的首飾,很多人家里都有!

距離距離
2026-02-26 13:18:17
加拿大皇家銀行:歐佩克+基本都已達到最大產(chǎn)能 油價突破每桶100美元是明顯威脅

加拿大皇家銀行:歐佩克+基本都已達到最大產(chǎn)能 油價突破每桶100美元是明顯威脅

財聯(lián)社
2026-03-01 11:14:09
43年了,為什么那么多人懷念1983年?

43年了,為什么那么多人懷念1983年?

深度報
2026-02-28 22:25:37
把天捅破!美國駐以色列大使:若以色列拿下整個中東,那也沒問題

把天捅破!美國駐以色列大使:若以色列拿下整個中東,那也沒問題

達文西看世界
2026-02-22 21:18:10
德國總理感慨:新時代已到來,中美俄達成脆弱平衡,瓜分勢力范圍

德國總理感慨:新時代已到來,中美俄達成脆弱平衡,瓜分勢力范圍

婲顏明蘊
2026-03-02 01:14:29
2026-03-02 03:39:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領(lǐng)域
1034文章數(shù) 396關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

特朗普警告伊朗“不要報復(fù)” 伊朗外長回應(yīng)

頭條要聞

特朗普警告伊朗“不要報復(fù)” 伊朗外長回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

游戲
家居
本地
親子
公開課

以《生化危機》命名?Capcom解答對RE引擎的誤讀

家居要聞

素色肌理 品意式格調(diào)

本地新聞

津南好·四時總相宜

親子要聞

帶娃看醫(yī)生,聽懂這幾句話少走90%彎路!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版