国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Karpathy2025年AI終極復盤:我們還沒發(fā)揮出LLM潛力的10%

0
分享至


新智元報道

編輯:定慧

【新智元導讀】就在剛剛, Andrej Karpathy 這位曾一手締造特斯拉Autopilot、定義了OpenAI早期靈魂、現(xiàn)在公認的全球「AI教導主任」,發(fā)布了他極具分量的2025年LLM年度回顧!

2025年,注定是人工智能歷史上被銘記的一年。

如果說2023年是「驚艷」(ChatGPT的橫空出世),2024年是「迷茫」(在大模型落地的憧憬中探索),那么在Andrej Karpathy的筆下,2025則是「覺醒」的一年。


Karpathy一直以來都是AI界的「頂流」布道者。

他的年終總結不僅僅是一篇技術回顧,更像是一部微縮的編年史,記錄了LLM如何從「模仿人類的鸚鵡」進化到了「召喚理性的幽靈」。

他以極其敏銳的視角,捕捉到了AI進化的核心:RLVR(基于可驗證獎勵的強化學習)的崛起、Vibe Coding(氛圍編碼)的流行、以及那個令人深思的哲學隱喻:

創(chuàng)造AI,我們到底是在制造一種新的物種,還是在召喚幽靈?

這一次讓我們剝繭抽絲,深度解析Karpathy提到的每一個范式轉移。

穿過技術術語的迷霧,直抵智能進化的本質,呈現(xiàn)一個真實、瘋狂且充滿「參差感」的AI-2025年。

第一章:RLVR革命

從「討好人類」到「追求真理」

在2025年之前,訓練一個大語言模型(LLM)的通常包含三道工序:


  1. 預訓練(Pre-training):

    讓模型閱讀整個互聯(lián)網,學會預測下一個token。這是「博學」的階段。

  2. 監(jiān)督微調(SFT):

    用高質量的問答數(shù)據教模型如何像個助手一樣說話。這是「懂事」的階段。

  3. 人類反饋強化學習(RLHF):

    讓模型根據人類的喜好調整回答的語氣和安全性。這是「討好」的階段。


這套流程在ChatGPT時代大放異彩,但也埋下了隱患。


Karpathy一針見血地指出,RLHF本質上是在訓練模型「看起來像是在推理」,而不是「真的在推理」。

因為人類評審員也是人,他們很難在幾秒鐘內判斷一段500行的Python代碼是否真的沒有Bug,或者一個復雜的數(shù)學證明是否嚴絲合縫。

于是,模型學會了走捷徑:寫出漂亮但錯誤的代碼,編造聽起來很有道理的廢話。

這就是所謂的「阿諛奉承」(Sycophancy)問題。

這也和后來GPT-5的諂媚如出一轍。

RLVR的崛起:當上帝變成編譯器

2025年,行業(yè)迎來了一個名為RLVR(Reinforcement Learning from Verifiable Rewards,基于可驗證獎勵的強化學習的第四階段。

RLVR的核心邏輯簡單而粗暴:別聽人的,聽結果的。


在數(shù)學、編程、邏輯謎題等領域,我們不需要人類來打分。

代碼能不能跑通?編譯器說了算。數(shù)學題對不對?答案說了算。

這種客觀、自動、不可欺騙的獎勵信號,為模型提供了一個無限的練兵場。

RLVR可以看作是AI LLM的AlphaZero時刻。

當年的AlphaZero通過自我博弈精通了圍棋,如今的LLM通過RLVR在「思維的棋盤」上自我博弈。

  • 探索(Exploration):模型面對一道難題,不再是基于概率吐出一個答案,而是嘗試生成成千上萬條不同的推理路徑(Reasoning Traces)。

  • 驗證(Verification):每一條路徑都被送入一個自動驗證器(Verifier),比如Python解釋器或數(shù)學證明器。

  • 強化(Reinforcement):只有那些通向正確結果的路徑會被獎勵,錯誤的路徑會被懲罰。

在這個過程中,奇跡發(fā)生了!

模型并沒有被顯式地教導「如何思考」,但在為了獲取獎勵的殘酷進化中,它涌現(xiàn)出了推理能力。

它學會了將大問題拆解為小步驟,學會了回頭檢查,學會了我們在教科書里從未見過的「外星人思維策略」。

RLVR不僅改變了訓練方式,還引入了一個全新的Scaling Law:測試時算力

以前,我們認為模型的能力在訓練結束那一刻就定格了。

但在RLVR范式下,我們可以在推理階段(InferenceTime)通過讓模型「多想一會兒」來提升智力。

這就像是一個學生,你給他1分鐘做題和給他1小時做題,其表現(xiàn)是完全不同的。

Karpathy特別提到了OpenAI o1(2024年底)和o3(2025年初)的發(fā)布,以及DeepSeek R1的開源,這些都是這一趨勢的里程碑。


DeepSeek R1甚至展示了即便沒有大規(guī)模的監(jiān)督微調(SFT),僅靠純粹的RLVR(即R1-Zero),模型也能從零開始衍生出強大的推理能力,甚至學會自我反思。

這意味著算力的價值從「訓練端」向「推理端」轉移。

未來的AI應用,可能會根據問題的難易程度,動態(tài)調整「思考時間」。

對于簡單的問題(如「你好」),它秒回;對于復雜的問題(如「設計一個高并發(fā)架構」),它可能會消耗巨大的推理算力,但給出一個超越人類專家的方案。

第二章:哲學分野

我們是在造動物,還是在招幽靈?

在深入技術細節(jié)之余,Karpathy通過引用AI先驅Rich Sutton的對話,拋出了一個極具哲學深度的議題:Animals vs. Ghosts(動物與幽靈)。


Rich Sutton的苦澀教訓與動物直覺

Rich Sutton是強化學習教父級人物,他提出了著名的「苦澀教訓」(The Bitter Lesson):

長期來看,只有那些能利用無限算力的通用方法(如搜索和學習)才能戰(zhàn)勝那些利用人類先驗知識的方法。

簡單點說,就是算力終結一切,人類的精巧構思在龐大的算力面前不值一提。


Sutton心目中的AGI是像動物一樣的:一個具身的(Embodied)、在物理世界中通過不斷試錯、由生存本能驅動的學習者。

如果能造出一只「數(shù)字松鼠」,我們離AGI就不遠了。

動物的智能是連貫的、持續(xù)的。一只松鼠不會因為你沒給它指令就停止思考,它的「自我」是連續(xù)不斷的流。

幽靈的誕生:統(tǒng)計學的降靈術

然而,Karpathy反駁道,我們現(xiàn)在造出來的LLM,根本不是動物。

它們是幽靈(Ghosts)。

無狀態(tài)的游魂:LLM沒有身體,沒有持續(xù)的意識流。當你按下回車鍵,它從虛無中醒來(Boot up),處理你的Token,吐出預測,然后瞬間「死亡」,回到虛無。它沒有昨天,也沒有明天,只有當下的Context Window(上下文窗口)。

人類的鏡像:它們的訓練數(shù)據不是物理世界的反饋,而是人類互聯(lián)網的文本殘留。它們是人類文明的「統(tǒng)計學蒸餾」。當我們與ChatGPT對話時,我們不是在與一個獨立的生物交流,而是在與全人類的語言碎片拼湊成的「英靈殿」對話。

BTW,我真的非常喜歡這個比喻,現(xiàn)在的AI可能還是先知,或者人造之神,但是一個由全人類的語言碎片拼湊成的英靈。

為什么這個比喻如此重要?

因為它解釋了為什么現(xiàn)在的AI充滿了「恐怖谷」效應。

當一個LLM說「我不想死」時,它不是真的在恐懼(像動物那樣腎上腺素飆升),它是在調用訓練數(shù)據中關于「科幻AI面臨毀滅時該說什么」的文本模式。

它在扮演恐懼。


Karpathy認為,我們目前的科研方向并不是在制造更完美的動物,而是在召喚更強大的幽靈。

這是一種全新的智能形態(tài),位于「心智空間」(Space of Minds)的一個完全不同的坐標系上。


這種智能是「參差」的(Jagged),它通曉天文地理(因為它讀過維基百科),卻可能在數(shù)「strawberry」里有幾個「r」這種連三歲小孩都會的問題上翻車。

第三章:Vibe Coding

當編程變成了玄學

如果說RLVR是后臺的革命,那么Vibe Coding(氛圍編碼)就是前端開發(fā)者的徹底解放。

Karpathy在這個概念上展現(xiàn)了他作為「造詞大師」的天賦。


在傳統(tǒng)的「軟件1.0」時代,程序員是工匠,每一個變量名、每一個內存指針都需要精心雕琢。

在「軟件2.0」時代(深度學習),程序員變成了煉丹師,調整權重和數(shù)據集。

而在2025年的Vibe Coding時代,程序員變成了產品經理。

語法已死,氛圍永生

什么是Vibe Coding?

就是你完全放棄對代碼細節(jié)的掌控,「把自己交給氛圍(Vibes),擁抱指數(shù)級增長,甚至忘掉代碼的存在」。

你不再逐行編寫代碼,而是用自然語言描述你的意圖(Intent),讓AI去生成實現(xiàn)。

如果跑不通?沒關系,把報錯信息甩回給AI,說一句「修好它」。

MenuGen實戰(zhàn):零行代碼的奇跡

Karpathy為了驗證這個理論,親自上手做了一個叫MenuGen的項目。

這是一個Web應用,用來生成餐廳菜單。


令人震驚的是,作為頂級程序員的Karpathy,在這個項目中沒有手寫一行代碼。

他對著Cursor或ClaudeCode說:「我要一個菜單生成器,要有藍色的按鈕。」

AI生成代碼,運行。

如果有Bug,他不說「第5行邏輯錯了」,而是說「感覺不太對,按鈕太丑了,換個樣式」。

這就是Vibe Coding的核心:人類負責審美和驗收,AI負責邏輯和實現(xiàn)。

代碼變成了一種「中間產物」,就像匯編語言一樣,除了極少數(shù)底層工程師,沒人再需要去讀它了。

工具之戰(zhàn):Cursor vs. ClaudeCode

2025年也是AI編程工具的「戰(zhàn)國時代」。

Karpathy重點對比了兩大流派:


  1. Cursor/Windsurf(IDE派):

    這些工具將AI無縫集成到了VSCode里。它們就像是鋼鐵俠的戰(zhàn)衣(IronManSuit),增強了人類的能力。你依然在寫代碼,但AI隨時在幫你補全、重構、解釋。這種體驗是「流暢」的。

  2. ClaudeCode(終端派):

    Anthropic推出的ClaudeCode則更加激進。它不是IDE插件,它是一個活在終端(Terminal)里的Agent。你給它一個任務:「把整個項目的測試覆蓋率提高到80%」。然后你就去喝咖啡了。它會自己跑測試、看報錯、修代碼、提交Git,甚至自己由于權限問題卡住時還會問你討要權限。


Karpathy坦言,雖然Claude Code展現(xiàn)了Agent的雛形,但在2025年,真正的「全自動工程師」還未到來。

目前的Agent更像是一個勤奮但記性不好的實習生,能干臟活累活,但在面對復雜的大型架構時,依然需要人類的「Vibe」來把控方向。

如果在云端的AI像是住在神殿里的先知,那么Anthropic推出的Claude Code(CC)就像是住在你硬盤里的管家。

Karpathy認為OpenAI走錯了路,他們太執(zhí)著于云端、容器化和ChatGPT的網頁入口。

而Claude Code抓住了開發(fā)者的痛點:本地化(Localhost)

第四章:范式轉移

GUI的終結與新生

谷歌Gemini Nano Banana是2025年最具顛覆性的范式轉移模型之一。

這原本是Gemini圖像生成模型的內部代號。

這本該是一個嚴肅的技術發(fā)布,但因為「Nano Banana」這個名字實在太滑稽、太無厘頭,它意外地引發(fā)了一場全球范圍的病毒式傳播。

在Karpathy看來,LLM是繼1970、80年代計算機之后的下一個重大計算范式。

人類將見證個人計算、微控制器(認知核心)、互聯(lián)網(智能體網絡)等概念的對應形態(tài)。

特別是在用戶界面體驗方面,與LLM「對話」有點像1980年代向計算機終端輸入指令。

文本是計算機(及LLM)偏好處理的原始數(shù)據形式,卻非人類喜愛的交互格式,尤其在輸入層面。人們其實厭惡閱讀文字——這過程緩慢且費力。


相反,人類更傾向于通過視覺和空間維度接收信息,這正是傳統(tǒng)計算領域發(fā)明圖形界面的根本原因。

同樣地,LLMs應當以我們偏好的格式與我們對話——通過圖像、信息圖、幻燈片、白板、動畫/視頻、網頁應用等形式。

這一理念的早期及當前版本自然包括表情符號和Markdown這類工具,它們通過標題、加粗、斜體、列表、表格等方式對文本進行視覺化裝扮與排版,以便更輕松地消化信息。但究竟由誰來構建LLM的圖形用戶界面呢?

在這種世界觀下,nano banana首次為我們提供了這種可能性的早期雛形。

值得注意的是,它的一個顯著特點在于:這不僅僅是圖像生成本身,更是文本生成、圖像生成與世界知識三者交織于模型權重之中所形成的綜合能力。

人們不再討論參數(shù)量、擴散算法,而是瘋狂地生成各種「香蕉化」的圖像,將萬物變成手辦風格。

谷歌也順水推舟,在官方宣傳中使用了香蕉Emoji。

由此,Karpathy提出了一個極其深刻的觀點:文本是計算機喜歡的格式,不是人類喜歡的。

人類討厭閱讀長篇大論,人類喜歡圖表、動畫、視頻和白板。

參差的智能

人類的智力通常是正相關的:一個能解微積分的人,通常也能算清楚買菜找零。

但AI不同。

它可以是一個數(shù)學天才(RLVR讓它精通奧數(shù)),同時又是一個常識白癡(無法理解簡單的物理空間關系,或者數(shù)不清單詞里的字母)。

這種「參差感」源于模型訓練數(shù)據的分布不均和Tokenization的先天缺陷。

模型在它「見過」或「被強化過」的領域(如代碼、數(shù)學)表現(xiàn)出神入化,而在那些因為太簡單而從未被當作訓練數(shù)據的領域(如日常生活中的隱性知識)則表現(xiàn)得像個智障。

系好安全帶,在參差中前行

簡而言之,2025年是LLMs令人興奮且略帶驚喜的一年,我們站在了一個奇異的十字路口。

Karpathy的年終總結,像是一份來自未來的生存指南。

LLMs正作為一種新型智能形態(tài)嶄露頭角,它們既比人類預期的聰明得多,又比人類預期的笨拙得多。

無論如何,它們都極其有用,Karpathy認為即使以當前能力,行業(yè)也遠未發(fā)掘出它們哪怕10%的潛力。

與此同時,有太多想法值得嘗試,從概念上看這個領域仍感覺廣闊無垠。

正如今年早些時候在Dwarkesh播客中提到的,Karpathy同時(表面上看似矛盾地)相信:

我們將見證持續(xù)快速的發(fā)展,同時仍有大量工作亟待完成。

正如Karpathy所言:「這僅僅是個開始,系好安全帶,準備啟程?!?/strong>

參考資料:

https://x.com/karpathy/status/2002118205729562949

秒追ASI

?點贊、轉發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
如何看待發(fā)送淫穢信息違法?再也看不到院長、主任們的桃色新聞了

如何看待發(fā)送淫穢信息違法?再也看不到院長、主任們的桃色新聞了

爆角追蹤
2025-12-24 12:37:06
全球最精確預言家:2026,歷史性的一年, 能說的都在這里

全球最精確預言家:2026,歷史性的一年, 能說的都在這里

神奇故事
2025-12-24 23:34:15
他姓胡,曾被視為中共“接班人”之一,58歲官至正國級,今年95歲

他姓胡,曾被視為中共“接班人”之一,58歲官至正國級,今年95歲

大運河時空
2025-12-24 11:50:03
消失的圣誕節(jié)與平安夜

消失的圣誕節(jié)與平安夜

十柱
2025-12-24 11:53:00
貴州省總工會原黨組成員、副主席梁偉等3人被提起公訴

貴州省總工會原黨組成員、副主席梁偉等3人被提起公訴

界面新聞
2025-12-24 16:07:17
曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

古希臘掌管松餅的神
2025-12-24 13:29:23
壞消息!國際乒聯(lián)官宣最新排名:國乒世界第1丟了!

壞消息!國際乒聯(lián)官宣最新排名:國乒世界第1丟了!

好乒乓
2025-12-24 19:49:49
天了!中國向全球正式宣布,禁止跟美合作,一記重拳轟向美軍七寸

天了!中國向全球正式宣布,禁止跟美合作,一記重拳轟向美軍七寸

瞳哥視界
2025-12-23 20:17:07
令人震驚!柬埔寨生命科學院,院里面全都是中文的服務(多圖)

令人震驚!柬埔寨生命科學院,院里面全都是中文的服務(多圖)

微微熱評
2025-12-24 12:22:04
三星堆的敘述手法與古國體制———三星堆的偶像、情節(jié)式敘述與背后的秩序系統(tǒng)

三星堆的敘述手法與古國體制———三星堆的偶像、情節(jié)式敘述與背后的秩序系統(tǒng)

經濟觀察報
2025-12-23 23:46:42
國家正式出手!2026年元旦起,存取現(xiàn)金一律按“新規(guī)”辦

國家正式出手!2026年元旦起,存取現(xiàn)金一律按“新規(guī)”辦

有范又有料
2025-12-24 09:44:50
恭喜國乒3人!入圍2025十大運動員,王楚欽孫穎莎落選,理由如下

恭喜國乒3人!入圍2025十大運動員,王楚欽孫穎莎落選,理由如下

侃球熊弟
2025-12-24 15:05:13
徐湖平家中字畫的高清版,被網友們找到了!

徐湖平家中字畫的高清版,被網友們找到了!

麥杰遜
2025-12-24 12:06:49
南博事件升級!高層震怒,南博曾多次向龐家討要藏品,被逐一披露

南博事件升級!高層震怒,南博曾多次向龐家討要藏品,被逐一披露

火山詩話
2025-12-23 18:07:03
攤牌了,日本反咬美國,用“自殺式豪賭”拉美國下水!

攤牌了,日本反咬美國,用“自殺式豪賭”拉美國下水!

局勢帝
2025-12-24 15:32:32
江西49歲女園長駕車墜泥塘致8死,小兒也在車上,丈夫是校車司機

江西49歲女園長駕車墜泥塘致8死,小兒也在車上,丈夫是校車司機

Mr王的飯后茶
2025-12-24 15:40:24
茅臺鎮(zhèn)過冬:酒價最高降6成!有酒廠暫停投產、免費租窖池,大家在等2027

茅臺鎮(zhèn)過冬:酒價最高降6成!有酒廠暫停投產、免費租窖池,大家在等2027

紅星新聞
2025-12-24 16:58:16
美國再施壓!安理會緊急會議 中方連說5個“反對”

美國再施壓!安理會緊急會議 中方連說5個“反對”

看看新聞Knews
2025-12-24 10:42:04
澤連斯基:中方助長俄羅斯“侵略”,將對中國公民實施新的制裁

澤連斯基:中方助長俄羅斯“侵略”,將對中國公民實施新的制裁

知法而形
2025-12-23 21:29:34
意外收獲!南博事件拔出蘿卜帶出泥!

意外收獲!南博事件拔出蘿卜帶出泥!

大道微言
2025-12-23 19:29:03
2025-12-25 04:43:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
14175文章數(shù) 66395關注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

體育要聞

26歲廣西球王,在質疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

家居
手機
健康
公開課
軍事航空

家居要聞

法式大平層 智能家居添彩

手機要聞

榮耀Magic8 Ultra:雙3D生物識別+LOFIC主攝,還有24GB大內存!

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

軍事專家:"特朗普級"戰(zhàn)艦設計疑大量借鑒中國055大驅

無障礙瀏覽 進入關懷版