国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Karpathy開源第二大腦方案,有望替代向量數(shù)據(jù)庫,讓AI永不失憶

0
分享至

你以為 AI 在學(xué)習(xí),實(shí)際上,每次對話它都在重學(xué)一遍。

你或許也有這樣的體驗(yàn):在 NotebookLM、ChatGPT 上傳一系列文件,LLM 處理并生成答案。但每次 LLM 都要“從 0 開始”挖掘知識,尤其是當(dāng)達(dá)到使用上限或結(jié)束會話時(shí),就像給項(xiàng)目做了一次“記憶清空”。

其本質(zhì)仍然是檢索增強(qiáng)生成(RAG)。為了讓它記住建立的架構(gòu)細(xì)節(jié),只能用更多的 token 和時(shí)間來重建 AI 的上下文。

現(xiàn)在,OpenAI 創(chuàng)始成員之一、特斯拉前 AI 總監(jiān) Andrej Karpathy 通過構(gòu)建一個(gè)持久的、由 LLM 維護(hù)的項(xiàng)目記錄,提出了一套全新的知識庫方案 LLM Wiki。

該方案比典型的企業(yè)級解決方案(向量數(shù)據(jù)庫和 RAG 管道)更簡單,也更優(yōu)雅,能夠復(fù)制粘貼到個(gè)人 Agent 中(例如 OpenAI Codex、Claude Code、OpenCode/Pi 等)。在這個(gè)系統(tǒng)中,LLM 本身充當(dāng)?shù)慕巧侨殹爸R庫管理員”:積極編譯、檢查和鏈接類 Markdown(.md)維基百科式文檔。


(來源:https://gist.github.com/karpathy/442a6bf555914893e9)

Karpathy 將大量 token 預(yù)算用于結(jié)構(gòu)化知識構(gòu)建,而非重復(fù)生成樣板代碼,從而為“第二大腦”的下一階段繪制藍(lán)圖:一個(gè)能夠自我修復(fù)、可審計(jì)且完全人類可讀的知識體系。

Karpathy 指出,“該方法在約 100 篇文章、40 萬字規(guī)模下的效率顯著優(yōu)于傳統(tǒng) RAG,且完全人類可讀、可審計(jì),基本擺脫了供應(yīng)商鎖定。”

盡管 Karpathy 稱這套方案現(xiàn)在還處于靠“一堆蹩腳腳本”實(shí)現(xiàn)的階段,但已有企業(yè)家嗅到了商機(jī),有企業(yè)家稱:誰能把這個(gè)功能打包成普通用戶都能用的東西,誰就把握了巨大商機(jī)。一款應(yīng)用即可與你常用工具、書簽、閱讀應(yīng)用、播客應(yīng)用及社交媒體優(yōu)質(zhì)討論內(nèi)容同步。


(來源:https://x.com/karpathy/status/2039805659525644595)

在 LLM Wiki 方案中,LLM 并非僅僅在查詢時(shí)從原始文檔中檢索信息,而是逐步構(gòu)建并維護(hù)一個(gè)持久化的維基:一個(gè)結(jié)構(gòu)化的、相互鏈接的 Markdown 文件集合,它位于用戶和原始數(shù)據(jù)源之間。

當(dāng)用戶添加新的數(shù)據(jù)源時(shí),LLM 不僅會為其進(jìn)行索引以便后續(xù)檢索,還會讀取、提取關(guān)鍵信息,并將其整合到現(xiàn)有的 Wiki 中更新頁面,修訂主題摘要,指出新數(shù)據(jù)與舊說法相矛盾之處,從而不斷修正或強(qiáng)化已有知識體系。知識被編譯后可持續(xù)復(fù)用,無需在每次查詢時(shí)重新推導(dǎo)。

關(guān)鍵在于,LLM Wiki 是一個(gè)持續(xù)更新、不斷完善的資源。交叉引用已然建立,矛盾之處已被標(biāo)記,綜合信息則反映了用戶閱讀過的所有內(nèi)容。你添加的每個(gè)來源、提出的每個(gè)問題都會讓 LLM Wiki 的內(nèi)容更加豐富。

這樣做的好處是,用戶幾乎從不(或很少)親自編寫 Wiki,所有內(nèi)容都由 LLM(知識庫管理員)編寫和維護(hù),其一次可處理約 15 個(gè)文件。你只需要尋找資料、主動探索和提出正確的問題;而 LLM 則負(fù)責(zé)所有繁瑣的工作:總結(jié)、交叉引用、歸檔和信息整理,這些工作使知識庫能夠長期發(fā)揮作用。

Karpathy 稱,他一邊打開 Agent,一邊打開 Obsidian。LLM 會根據(jù)他們的對話進(jìn)行編輯,用戶能夠?qū)崟r(shí)瀏覽結(jié)果,包括點(diǎn)擊鏈接、查看圖表視圖、閱讀更新后的頁面。在這種情景下,Obsidian 是集成開發(fā)環(huán)境(IDE);LLM 是程序員;維基則是代碼庫。

綜合來看,系統(tǒng)架構(gòu)分三個(gè)不同的階段運(yùn)行。

數(shù)據(jù)導(dǎo)入:原始資料,例如研究論文、GitHub 代碼庫、數(shù)據(jù)集和網(wǎng)絡(luò)文章被導(dǎo)入到 raw/ 目錄中。為了將網(wǎng)頁文章轉(zhuǎn)換為 .md 文件,Karpathy 使用了 Obsidian Web Clipper 擴(kuò)展,他還設(shè)置了一個(gè)快捷鍵,將所有相關(guān)的圖片下載到本地,以便 LLM 可通過視覺功能引用它們。

編譯步驟:這是架構(gòu)中的核心創(chuàng)新點(diǎn)。LLM 不僅僅是對文件進(jìn)行索引,而是對文件進(jìn)行“編譯”。它讀取原始數(shù)據(jù)并生成結(jié)構(gòu)化的維基百科頁面,包括生成摘要、識別關(guān)鍵概念、撰寫百科全書式條目,以及在相關(guān)概念之間創(chuàng)建“反向鏈接”。

主動維護(hù)(代碼校對):該系統(tǒng)并非一成不變。Karpathy 描述了運(yùn)行“健康檢查”或“代碼校對”的過程,LLM 會掃描 Wiki 以查找不一致之處、缺失數(shù)據(jù)或新連接。這相當(dāng)于一個(gè)更動態(tài)的、能夠“自我修復(fù)”的知識庫。


(來源:https://x.com/himanshustwts/status/2039811786602607)

LLM Wiki 的應(yīng)用場景廣泛,競爭分析、盡職調(diào)查、旅行計(jì)劃、課程筆記、興趣愛好深度研究……任何需要持續(xù)積累知識,并且希望有序整理的場景都可以用到它。

個(gè)人成長:追蹤個(gè)人目標(biāo)、健康、心理、自我提升,可記錄日記、文章、播客筆記,并隨著時(shí)間的推移構(gòu)建一個(gè)結(jié)構(gòu)化的自我形象。

深度研究:對某個(gè)主題進(jìn)行為期數(shù)周或數(shù)月的深入研究,例如閱讀論文、文章、報(bào)告,并逐步構(gòu)建一個(gè)包含不斷發(fā)展的論點(diǎn)的綜合維基。

讀書筆記:邊讀邊整理章節(jié),創(chuàng)建頁面記錄人物、主題、情節(jié)線索以及它們之間的聯(lián)系。最終,你將擁有一個(gè)內(nèi)容豐富的配套維基。以托爾金百科(Tolkien Gateway)為例,其歷經(jīng)數(shù)年由志愿者社區(qū)構(gòu)建而成,涵蓋人物、地點(diǎn)、事件、語言等。你可以一邊閱讀,一邊構(gòu)建類似的內(nèi)容,而 LLM 則負(fù)責(zé)所有的交叉引用和維護(hù)工作。

業(yè)務(wù)/團(tuán)隊(duì):一個(gè)由 LLM 維護(hù)的內(nèi)部 Wiki,內(nèi)容來源于 Slack 消息、會議記錄、項(xiàng)目文檔和客戶電話,可能也會有人工參與審核更新。Wiki 之所以能保持更新狀態(tài),是因?yàn)?LLM 承擔(dān)了重要使命——那些團(tuán)隊(duì)中其他人都不愿意做的維護(hù)工作。

目前,已有開發(fā)者將 LLM Wiki 模式擴(kuò)展到 OpenClaw 管理的 10 個(gè) Agent 系統(tǒng)中,通過 Hermes(由 Nous Research 訓(xùn)練用于結(jié)構(gòu)化評估)作為獨(dú)立審核關(guān)卡對編譯后的文章進(jìn)行評分驗(yàn)證,以確保只有準(zhǔn)確的內(nèi)容進(jìn)入永久知識庫,再生成簡報(bào)回饋給各個(gè) Agent,從而形成了一個(gè)“產(chǎn)生-整理-驗(yàn)證-反饋”的閉環(huán)。


(來源:X)

Karpathy 將 Markdown 文件看作“真理之源”,其可避免向量嵌入的“黑箱”問題。AI 給出的每一條結(jié)論都可以追溯到特定的 .md 文件,而這些文件可以由人閱讀、編輯或刪除。

LLM Wiki 方案探索的未來目標(biāo)是合成數(shù)據(jù)生成和微調(diào)。隨著 Wiki 的增長,數(shù)據(jù)通過持續(xù)的 LLM 代碼校對變得越來越“純凈”,有望成為更完美的數(shù)據(jù)訓(xùn)練集。

LLM 不再僅僅讀取 Wiki 的上下文窗口,在此基礎(chǔ)上,用戶最終有望在 Wiki 本身上對模型進(jìn)行微調(diào),從而構(gòu)建一個(gè)更小、更高效的模型。這將使 LLM 通過模型權(quán)重掌握個(gè)人知識庫,把研究項(xiàng)目真正轉(zhuǎn)化為專屬的定制化智能。

總體來說,這種方案是一種新的理念:通過擁有自身記憶的主動智能體,避免了以往“單次”人工智能交互的局限性。

對于個(gè)人研究人員而言,這意味著有望告別 LLM“失憶”,轉(zhuǎn)而建立更長期的關(guān)系。對企業(yè)而言,這預(yù)示著原始數(shù)據(jù)湖正在向編譯后的知識資產(chǎn)轉(zhuǎn)變?;蛟S,這也意味著我們正在進(jìn)入 AI 自主知識庫時(shí)代。

參考資料:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

https://x.com/karpathy/status/2039805659525644595

https://x.com/himanshustwts/status/2039811786602607052

https://x.com/jumperz/status/2040166448492900356

https://venturebeat.com/data/karpathy-shares-llm-knowledge-base-architecture-that-bypasses-rag-with-an

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
閉門會談 1 小時(shí),鄭麗文邀咱們訪臺。大陸一句話,定調(diào)兩岸統(tǒng)一

閉門會談 1 小時(shí),鄭麗文邀咱們訪臺。大陸一句話,定調(diào)兩岸統(tǒng)一

眼界看視野
2026-04-11 11:29:37
美國雇員因薪酬入不敷出,縱火燒了10億的貨

美國雇員因薪酬入不敷出,縱火燒了10億的貨

慕容律師
2026-04-10 22:39:12
禽獸不如!武漢4歲女童被親生父親殺害拋江,曾買60元意外保險(xiǎn)

禽獸不如!武漢4歲女童被親生父親殺害拋江,曾買60元意外保險(xiǎn)

派大星紀(jì)錄片
2026-04-10 17:31:01
多家快遞公司,宣布漲價(jià)

多家快遞公司,宣布漲價(jià)

魯中晨報(bào)
2026-04-11 13:36:04
普京和澤連斯基宣布:俄烏?;?2小時(shí)!澤連斯基:愿意與普京會面,但不是在莫斯科

普京和澤連斯基宣布:俄烏?;?2小時(shí)!澤連斯基:愿意與普京會面,但不是在莫斯科

每日經(jīng)濟(jì)新聞
2026-04-10 17:29:03
賽力斯新專利:汽車座便器!

賽力斯新專利:汽車座便器!

新浪財(cái)經(jīng)
2026-04-10 19:33:14
標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號

標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號

極目新聞
2026-04-11 00:53:31
遼陽奔馳陪葬后續(xù):多部門介入,豪車當(dāng)天被挖出!當(dāng)事人背景流出

遼陽奔馳陪葬后續(xù):多部門介入,豪車當(dāng)天被挖出!當(dāng)事人背景流出

火山詩話
2026-04-11 08:39:41
笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來,貓咪聽不下去直接捂嘴

笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來,貓咪聽不下去直接捂嘴

搗蛋窩
2026-04-11 10:57:44
不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

新民晚報(bào)
2026-04-10 13:56:07
突發(fā):以軍發(fā)動襲擊

突發(fā):以軍發(fā)動襲擊

第一財(cái)經(jīng)資訊
2026-04-11 10:21:30
難以置信啊!一餐吃掉562339.80元,上海一張消費(fèi)清單刷爆網(wǎng)絡(luò)

難以置信?。∫徊统缘?62339.80元,上海一張消費(fèi)清單刷爆網(wǎng)絡(luò)

火山詩話
2026-04-10 06:49:46
“窮到吃豆豉,還生呢?”農(nóng)村家長曬5兒3女,大兒子眼神好可怕

“窮到吃豆豉,還生呢?”農(nóng)村家長曬5兒3女,大兒子眼神好可怕

妍妍教育日記
2026-04-11 07:30:06
湖南祁東沿路插了百余米的白事支架燈籠,上面印“奠” 下面掛長條幅,當(dāng)?shù)孛裾郑阂讶坎鸪?>
    </a>
        <h3>
      <a href=大風(fēng)新聞
2026-04-11 10:41:08
演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

韓小娛
2026-04-11 11:46:56
“危山”之下 丨400余名村民“裂縫”求生

“危山”之下 丨400余名村民“裂縫”求生

大象新聞
2026-04-11 10:28:07
赫魯曉夫荒唐史:在北極圈種玉米,為沖三倍肉產(chǎn)量殺光了牛羊,還公款買肉充數(shù)

赫魯曉夫荒唐史:在北極圈種玉米,為沖三倍肉產(chǎn)量殺光了牛羊,還公款買肉充數(shù)

流蘇晚晴
2026-03-25 18:21:13
門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

毒sir財(cái)經(jīng)
2026-04-09 16:14:36
深圳一男子誤吞150片藥,混著白酒!凌晨被發(fā)現(xiàn)癱在床上!醫(yī)生:常規(guī)洗胃沒用,得“拆毒”

深圳一男子誤吞150片藥,混著白酒!凌晨被發(fā)現(xiàn)癱在床上!醫(yī)生:常規(guī)洗胃沒用,得“拆毒”

環(huán)球網(wǎng)資訊
2026-04-11 14:04:10
阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

三體引力波
2026-04-11 01:02:06
2026-04-11 15:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16564文章數(shù) 514863關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

本地
時(shí)尚
家居
健康
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

這件人生單品,現(xiàn)在正是穿它的黃金期

家居要聞

復(fù)古風(fēng)格 自然簡約

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進(jìn)入關(guān)懷版