国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek OCR論文引爆網(wǎng)絡(luò)!Andrej Karpathy:,我很喜歡;馬斯克:未來99%都是光子

0
分享至


剛剛,AI大神Andrej Karpathy表示非常喜歡DeepSeek OCR 論文,原話:

我相當(dāng)喜歡新的DeepSeek-OCR論文。它是一個很好的OCR模型(可能比dots稍微差一點(diǎn)),是的,數(shù)據(jù)收集等等,但無論如何都不重要。對我來說更有趣的部分(尤其是作為一個以計(jì)算機(jī)視覺為核心,暫時(shí)偽裝成自然語言的人)是像素是否比文本更適合作為LLM的輸入。文本標(biāo)記是否浪費(fèi)且糟糕,作為輸入。

還不知什么情況的看我這篇文章

Karpathy認(rèn)為,拋開模型本身不談,deepseek這篇論文引出了一個更值得深思的問題:對于LLM來說,像素是否是比文本更優(yōu)越的輸入形式?文本Token是否既浪費(fèi)又糟糕?

他進(jìn)一步設(shè)想,或許所有LLM的輸入都只應(yīng)該是圖像。即便是純文本內(nèi)容,也應(yīng)該先渲染成圖片再輸入給模型

Karpathy給出了支持這一構(gòu)想的四大核心理由:

1. 更高的信息壓縮效率

將文本渲染成圖像,可以實(shí)現(xiàn)更高的信息壓縮,這意味著更短的上下文窗口和更高的運(yùn)行效率

2. 更通用的信息流

像素是一種遠(yuǎn)比文本更通用的信息流。它不僅能表示純文本,還能輕松捕捉粗體、彩色文本,甚至是任意的圖表和照片

3. 默認(rèn)實(shí)現(xiàn)強(qiáng)大的雙向注意力

像素化的輸入可以很自然、很輕松地默認(rèn)使用雙向注意力進(jìn)行處理,這種處理方式比自回歸注意力更為強(qiáng)大

4. 徹底淘汰Tokenizer

Karpathy毫不掩飾自己對Tokenizer的嫌棄。他認(rèn)為Tokenizer是一個丑陋、獨(dú)立、非端到端的階段。它引入了Unicode和字節(jié)編碼的所有丑陋之處,繼承了大量歷史包袱,并帶來了安全和越獄風(fēng)險(xiǎn)(例如連續(xù)字節(jié)問題)

他舉例說,Tokenizer會導(dǎo)致兩個在人眼看來完全相同的字符,在網(wǎng)絡(luò)內(nèi)部被表示為兩個完全不同的Token。一個笑臉emoji,在模型看來只是一個奇怪的Token,而不是一個由像素構(gòu)成的、真實(shí)的笑臉,這導(dǎo)致模型無法利用其視覺信息帶來的遷移學(xué)習(xí)優(yōu)勢。Tokenizer必須消失,他強(qiáng)調(diào)

Karpathy總結(jié)道,OCR只是眾多視覺到文本(vision -> text)任務(wù)中的一種。而傳統(tǒng)的文本到文本(text -> text)任務(wù),完全可以被重構(gòu)成視覺到文本任務(wù),反之則不行

他設(shè)想的未來交互模式可能是:用戶的輸入(Message)是圖像,而解碼器(Assistant的響應(yīng))的輸出仍然是文本。因?yàn)槿绾握鎸?shí)地輸出像素,或者是否有必要這樣做,目前還不明確

核心爭議:雙向注意力與圖像分塊

對于Karpathy的觀點(diǎn),AI學(xué)者Yoav Goldberg提出了兩個疑問:


1.為什么說圖像能輕松獲得雙向注意力,而文本不能?

2.雖然沒有了Tokenization,但將輸入圖像切分成圖塊(Patches),難道不是一種類似且可能更丑陋的處理方式嗎?

Karpathy對此進(jìn)行了解釋。

他回應(yīng)說,原則上沒有任何東西阻止文本使用雙向注意力。但為了效率,文本通常都是以自回歸的方式進(jìn)行訓(xùn)練的。他設(shè)想,可以在訓(xùn)練中期加入一個微調(diào)階段,用雙向注意力來處理作為條件的信息(比如用戶的輸入消息,因?yàn)檫@些Token不需要模型去生成)。但他不確定在實(shí)踐中是否有人這樣做。理論上,為了預(yù)測下一個Token,甚至可以對整個上下文窗口進(jìn)行雙向編碼,但這將導(dǎo)致訓(xùn)練無法并行化

最后他補(bǔ)充道,或許這個方面(雙向注意力)嚴(yán)格來說并非像素與Token的本質(zhì)區(qū)別,更多是像素通常被編碼(encoded),而Token通常被解碼(decoded)(借用原始Transformer論文的術(shù)語)

馬斯克:未來99%是光子

在這場討論的最后,Elon Musk也現(xiàn)身評論區(qū),并給出了一個更具未來感的判斷:


從長遠(yuǎn)來看,AI模型超過99%的輸入和輸出都將是光子。沒有其他任何東西可以規(guī)?;?/p>

馬斯克的這條評論并非隨口一說。他進(jìn)一步補(bǔ)充了一段堪稱硬核的宇宙學(xué)科普,來解釋為什么他認(rèn)為“光子”是終極的規(guī)?;桨?/p>

簡單來說,宇宙中絕大多數(shù)的粒子都是光子

而這些光子最主要的來源,是宇宙微波背景(CMB)。根據(jù)測算,CMB的光子密度約為每立方厘米410個。將這個密度乘以可觀測宇宙的巨大體積(半徑約465億光年),可以得出僅CMB貢獻(xiàn)的光子數(shù)量就達(dá)到了一個驚人的數(shù)字:約1.5 x 10??個

相比之下,所有恒星發(fā)出的光子(星光)以及其他來源(如中微子背景、黑洞輻射等)貢獻(xiàn)的數(shù)量,則完全可以忽略不計(jì)

這背后揭示的物理事實(shí)是:光子在數(shù)量級上擁有無與倫比的優(yōu)勢。這或許就是馬斯克認(rèn)為AI的未來輸入輸出將由光子主宰的底層邏輯

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
超20000名旅客滯留!“迪拜機(jī)場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費(fèi)用

超20000名旅客滯留!“迪拜機(jī)場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費(fèi)用

江西工人報(bào)
2026-03-01 22:27:25
快訊!伊朗大捷!

快訊!伊朗大捷!

達(dá)文西看世界
2026-03-01 16:46:09
美以空襲伊朗,阿拉伯國家聯(lián)盟發(fā)聲:“阿拉伯-以色列沖突升級為全面地區(qū)戰(zhàn)爭的時(shí)刻”

美以空襲伊朗,阿拉伯國家聯(lián)盟發(fā)聲:“阿拉伯-以色列沖突升級為全面地區(qū)戰(zhàn)爭的時(shí)刻”

環(huán)球網(wǎng)資訊
2026-03-01 11:00:18
哈梅內(nèi)伊死后,有伊朗人分析:現(xiàn)在還沒到慶祝的時(shí)候

哈梅內(nèi)伊死后,有伊朗人分析:現(xiàn)在還沒到慶祝的時(shí)候

小蘿卜絲
2026-03-01 09:56:11
3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

阿龍美食記
2026-03-01 16:17:49
“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

每日經(jīng)濟(jì)新聞
2026-02-28 14:37:58
美軍公布傷亡情況

美軍公布傷亡情況

環(huán)球時(shí)報(bào)國際
2026-03-02 00:10:13
伊朗稱襲擊致美軍傷亡560人

伊朗稱襲擊致美軍傷亡560人

財(cái)聯(lián)社
2026-03-02 00:54:12
今年,北京已無離職潮

今年,北京已無離職潮

微微熱評
2026-03-01 18:45:40
伊朗外長:新任最高領(lǐng)袖將在“一或兩天”內(nèi)被選出

伊朗外長:新任最高領(lǐng)袖將在“一或兩天”內(nèi)被選出

財(cái)聯(lián)社
2026-03-01 23:33:52
回顧:浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長后怕不已

回顧:浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長后怕不已

談史論天地
2026-03-01 09:49:38
重大進(jìn)展!伊朗作出“前所未有”承諾:同意永遠(yuǎn)不擁有可制造核武器的核材料,將實(shí)現(xiàn)“零積累、零庫存”,并接受全面核查!特朗普最新表態(tài)

重大進(jìn)展!伊朗作出“前所未有”承諾:同意永遠(yuǎn)不擁有可制造核武器的核材料,將實(shí)現(xiàn)“零積累、零庫存”,并接受全面核查!特朗普最新表態(tài)

每日經(jīng)濟(jì)新聞
2026-02-28 10:40:45
美以刺殺伊朗最高領(lǐng)袖和總統(tǒng)失敗

美以刺殺伊朗最高領(lǐng)袖和總統(tǒng)失敗

財(cái)聯(lián)社
2026-02-28 18:48:32
真的天塌!拔乳牙竟把孩子2顆恒牙拔掉,鹽城一口腔醫(yī)生整出事故

真的天塌!拔乳牙竟把孩子2顆恒牙拔掉,鹽城一口腔醫(yī)生整出事故

火山詩話
2026-03-01 18:08:52
又一個國家采取軍事行動! 瑞典在厄勒海峽上空攔截了俄羅斯無人機(jī)

又一個國家采取軍事行動! 瑞典在厄勒海峽上空攔截了俄羅斯無人機(jī)

一種觀點(diǎn)
2026-02-28 08:44:21
伊朗“斬首”疑云:美以為何總能做到“百萬軍中取上將首級”?

伊朗“斬首”疑云:美以為何總能做到“百萬軍中取上將首級”?

國是直通車
2026-03-01 17:53:07
特朗普稱美方“基本摧毀”伊朗海軍總部

特朗普稱美方“基本摧毀”伊朗海軍總部

財(cái)聯(lián)社
2026-03-02 01:29:13
云淡風(fēng)輕!網(wǎng)傳特朗普指揮襲擊伊朗前幾分鐘,還在家中參加派對

云淡風(fēng)輕!網(wǎng)傳特朗普指揮襲擊伊朗前幾分鐘,還在家中參加派對

小蘿卜絲
2026-03-01 13:10:35
網(wǎng)友預(yù)測明天早上10點(diǎn)半 deepseek 發(fā)布V4 模型,首次沒給英偉達(dá)權(quán)限,選擇與華為合作

網(wǎng)友預(yù)測明天早上10點(diǎn)半 deepseek 發(fā)布V4 模型,首次沒給英偉達(dá)權(quán)限,選擇與華為合作

風(fēng)向觀察
2026-03-01 17:11:32
兩個人的律所干翻千人大所!靠Claude在兩小時(shí)拆穿對方三處漏洞

兩個人的律所干翻千人大所!靠Claude在兩小時(shí)拆穿對方三處漏洞

三言四拍
2026-03-01 20:58:56
2026-03-02 03:40:49
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
1034文章數(shù) 396關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財(cái)經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬輛

態(tài)度原創(chuàng)

藝術(shù)
家居
時(shí)尚
教育
公開課

藝術(shù)要聞

看!這位伊朗超模如何顛覆你的美麗認(rèn)知!

家居要聞

素色肌理 品意式格調(diào)

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

教育要聞

初中階段的分化,從習(xí)慣悄悄開始

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版