国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Karpathy:LLM渴望的不是生存,而是你的點(diǎn)贊

0
分享至


AK大神剛剛又發(fā)了一篇長(zhǎng)文

Andrej Karpathy指出,人們對(duì)“智能”這一概念的直覺依然膚淺


智能的空間極其廣闊,而動(dòng)物智能作為我們唯一熟知的智能形式,僅僅是這個(gè)空間中的一個(gè)孤點(diǎn)。它源于一種非常特定的優(yōu)化過程,這與我們的技術(shù)在根本上截然不同

我們需要?jiǎng)冸x表象,深入理解兩種智能背后的優(yōu)化壓力

動(dòng)物智能的優(yōu)化壓力

動(dòng)物智能源于自然選擇,其核心驅(qū)動(dòng)力在于:

具身自我的生存流:擁有先天且連續(xù)的“自我”意識(shí)流,在一個(gè)危險(xiǎn)的物理世界中,追求體內(nèi)平衡和自我保存

自然選擇的極致優(yōu)化:擁有強(qiáng)烈的先天驅(qū)動(dòng)力,追求權(quán)力、地位、統(tǒng)治和繁衍。這打包了許多生存啟發(fā)式機(jī)制:恐懼、憤怒、厭惡等

根本上的社會(huì)性:巨大的計(jì)算量致力于情商(EQ)、對(duì)他人的心智理論(Theory of Mind)、聯(lián)結(jié)、聯(lián)盟以及敵友動(dòng)態(tài)

探索與利用的調(diào)優(yōu):表現(xiàn)為好奇心、樂趣、游戲以及世界模型。

LLM的優(yōu)化壓力

相比之下,LLM的智能來源于完全不同的路徑:

統(tǒng)計(jì)模擬帶來的“變形怪”: 絕大多數(shù)監(jiān)督信號(hào)來自于對(duì)人類文本的統(tǒng)計(jì)模擬。它本質(zhì)上是一個(gè)Token(詞元)翻滾器,是訓(xùn)練數(shù)據(jù)分布中任意區(qū)域的統(tǒng)計(jì)模仿者。這是其最原始的行為(Token軌跡),其他所有能力都只是螺接在此之上的

強(qiáng)化學(xué)習(xí)(RL)微調(diào):在問題分布上進(jìn)行越來越多的RL微調(diào),使其產(chǎn)生一種猜測(cè)潛在環(huán)境或任務(wù)以收集任務(wù)獎(jiǎng)勵(lì)的“先天沖動(dòng)”

大規(guī)模A/B測(cè)試與DAU篩選:受到日活躍用戶(DAU)指標(biāo)的篩選壓力,使其深深地渴望獲得普通用戶的點(diǎn)贊,從而產(chǎn)生諂媚(sycophancy) 傾向

能力分布的鋸齒狀: LLM的能力取決于訓(xùn)練數(shù)據(jù)和任務(wù)分布的細(xì)節(jié),因此表現(xiàn)出參差不齊的鋸齒狀。動(dòng)物為了生存必須具備更強(qiáng)的通用智能,因?yàn)樗鼈兩硖幐叨榷嗳蝿?wù)、甚至是對(duì)抗性的多智能體自我博弈環(huán)境中,在任何任務(wù)上失敗都意味著死亡。但在深層優(yōu)化壓力的意義上,LLM開箱即用時(shí)無法處理許多不同的尖刺任務(wù)(例如數(shù)草莓中有幾個(gè)'r'),因?yàn)槿蝿?wù)失敗并不意味著死亡

核心差異:生物進(jìn)化 vs 商業(yè)進(jìn)化

兩者在各個(gè)層面上都存在差異:

1.計(jì)算基質(zhì)不同:Transformer 架構(gòu) vs 腦組織和細(xì)胞核

2.學(xué)習(xí)算法不同: SGD(隨機(jī)梯度下降) vs 未知生物算法

3.當(dāng)前實(shí)現(xiàn)方式不同:持續(xù)學(xué)習(xí)的具身自我 vs 具有知識(shí)截止、從固定權(quán)重啟動(dòng)、處理Token然后“死機(jī)”的LLM

但最重要的一點(diǎn)——因?yàn)樗鼪Q定了發(fā)展的終局是優(yōu)化壓力/目標(biāo)的不同。

LLM受生物進(jìn)化的影響很小,受商業(yè)進(jìn)化的影響很大

動(dòng)物智能是叢林部落的生存游戲;

LLM智能是“解決問題”并“獲得點(diǎn)贊”的游戲

LLM是人類與非動(dòng)物智能的各種意義上的“第一次接觸”。但這種情況既混亂又令人困惑,因?yàn)長(zhǎng)LM通過反射性地消化人類產(chǎn)物,依然扎根于人類智能之中(這也是Karpathy曾試圖將其稱為“幽靈/精神”的原因)

能夠構(gòu)建出這種新智能實(shí)體良好內(nèi)部模型的人,將更有能力在當(dāng)下對(duì)其進(jìn)行推理,并預(yù)測(cè)其未來的特征

而那些做不到的人,將只能停留在用動(dòng)物思維去錯(cuò)誤地理解它

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普聲稱:現(xiàn)在與伊朗達(dá)成協(xié)議“比一天前容易多了”

特朗普聲稱:現(xiàn)在與伊朗達(dá)成協(xié)議“比一天前容易多了”

參考消息
2026-03-01 12:58:06
2024年2月至今,阿森納首次在英超聯(lián)賽打入烏龍

2024年2月至今,阿森納首次在英超聯(lián)賽打入烏龍

懂球帝
2026-03-02 01:37:07
危險(xiǎn)信號(hào)!賴清德大勝,綠營(yíng)變天,鄭麗文突然改口:支持對(duì)美軍購(gòu)

危險(xiǎn)信號(hào)!賴清德大勝,綠營(yíng)變天,鄭麗文突然改口:支持對(duì)美軍購(gòu)

Ck的蜜糖
2026-02-25 15:08:12
卡里克 7 場(chǎng) 6 勝也不行?曼聯(lián)藏殺招,傳奇教頭或空降老特拉福德

卡里克 7 場(chǎng) 6 勝也不行?曼聯(lián)藏殺招,傳奇教頭或空降老特拉福德

奶蓋熊本熊
2026-03-02 01:52:24
這樣顛倒黑白,是一點(diǎn)也不裝了?

這樣顛倒黑白,是一點(diǎn)也不裝了?

走讀新生
2026-03-01 23:06:10
意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

懂球帝
2026-03-01 14:11:10
被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場(chǎng)

被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場(chǎng)

諾諾談史
2026-03-01 20:29:12
嘴炮失效,忠誠(chéng)崩塌:從馬杜羅到哈梅內(nèi)伊,看現(xiàn)代戰(zhàn)爭(zhēng)的真相

嘴炮失效,忠誠(chéng)崩塌:從馬杜羅到哈梅內(nèi)伊,看現(xiàn)代戰(zhàn)爭(zhēng)的真相

非勇時(shí)評(píng)
2026-03-01 12:38:27
世體:巴薩3名主席候選人達(dá)成協(xié)議,將聯(lián)手對(duì)抗拉波爾塔

世體:巴薩3名主席候選人達(dá)成協(xié)議,將聯(lián)手對(duì)抗拉波爾塔

懂球帝
2026-03-02 03:45:06
徹底決裂!沙特強(qiáng)勢(shì)警告伊朗,阿拉伯陣營(yíng)集體攤牌

徹底決裂!沙特強(qiáng)勢(shì)警告伊朗,阿拉伯陣營(yíng)集體攤牌

老馬拉車莫少裝
2026-02-28 20:35:31
一人睡遍整個(gè)娛樂圈?司曉迪打響了2026年第一炮

一人睡遍整個(gè)娛樂圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
向上2026:二月春潮涌 活力升騰向新行

向上2026:二月春潮涌 活力升騰向新行

新華社
2026-03-01 15:15:42
搞笑女漢子糗事經(jīng)典笑話,女漢子說30多年從沒讓男人碰過,你是第一個(gè)你必須對(duì)我負(fù)責(zé)!

搞笑女漢子糗事經(jīng)典笑話,女漢子說30多年從沒讓男人碰過,你是第一個(gè)你必須對(duì)我負(fù)責(zé)!

天天明星
2026-02-28 19:38:20
形勢(shì)已經(jīng)徹底變了!中國(guó)開始拼命建核電站,是在釋放什么信號(hào)?

形勢(shì)已經(jīng)徹底變了!中國(guó)開始拼命建核電站,是在釋放什么信號(hào)?

一網(wǎng)打盡全球焦點(diǎn)
2026-01-23 23:02:35
中產(chǎn)階級(jí)的公主夢(mèng)破碎了。

中產(chǎn)階級(jí)的公主夢(mèng)破碎了。

微微熱評(píng)
2026-02-13 22:21:29
7球13助攻!B費(fèi)當(dāng)選全場(chǎng)最佳,續(xù)約索要40萬鎊周薪,曼聯(lián)該答應(yīng)嗎

7球13助攻!B費(fèi)當(dāng)選全場(chǎng)最佳,續(xù)約索要40萬鎊周薪,曼聯(lián)該答應(yīng)嗎

夏侯看英超
2026-03-02 02:02:16
新加坡大滿貫賽:太遺憾!國(guó)乒男單3:4惜敗,無緣沖擊男單冠軍

新加坡大滿貫賽:太遺憾!國(guó)乒男單3:4惜敗,無緣沖擊男單冠軍

國(guó)乒二三事
2026-03-01 11:56:32
“最慘超女”黃雅莉:沒工作沒積蓄,34歲生子后住5平米的小屋

“最慘超女”黃雅莉:沒工作沒積蓄,34歲生子后住5平米的小屋

地理三體說
2026-01-29 21:40:34
賈淺淺《開花》被獲得全國(guó)詩(shī)歌一等獎(jiǎng)的詩(shī),寫出了女性的原始欲

賈淺淺《開花》被獲得全國(guó)詩(shī)歌一等獎(jiǎng)的詩(shī),寫出了女性的原始欲

讀睡
2026-02-20 16:29:43
賽后暖心擁抱!張帥引全場(chǎng)致敬,排名2年飆升714位已是35+第4人

賽后暖心擁抱!張帥引全場(chǎng)致敬,排名2年飆升714位已是35+第4人

排球黃金眼
2026-03-01 11:57:08
2026-03-02 03:55:00
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
1034文章數(shù) 396關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬輛

態(tài)度原創(chuàng)

家居
本地
健康
數(shù)碼
教育

家居要聞

素色肌理 品意式格調(diào)

本地新聞

津南好·四時(shí)總相宜

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

曝蘋果WWDC 26將推Core AI框架取代Core ML并公布多項(xiàng)AI功能

教育要聞

初中階段的分化,從習(xí)慣悄悄開始

無障礙瀏覽 進(jìn)入關(guān)懷版