国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

卡帕西630行代碼炸出81個智能體,4天協(xié)作跑2333次實驗,公布預訓練十大發(fā)現(xiàn)

0
分享至

Karpathy讓AI通宵干活,自己去蒸桑拿了。

這個Autoresearch項目總共630行Python代碼,兩天AI自主完成276次實驗,篩出29項有效改進,把一個語言模型的訓練效率提升了約11%,全程零人類干預。


但真正有意思的故事,發(fā)生在Karpathy放下鍵盤之后。

全球開發(fā)者社區(qū)接過了這個項目,把它從“一個AI做實驗”變成了“一群AI做科研”。

他們搭了一個分布式協(xié)作層,讓數(shù)十個智能體在不同GPU上共享成果、分工協(xié)作,4天已經(jīng)跑了超過2000次實驗。


人類進去檢查成果時才突然發(fā)現(xiàn):

不知不覺間,AI已經(jīng)自發(fā)形成了智能體間的同行評審制度。

AI“重新發(fā)明”科學共同體

Karpathy本人曾給出autoresearch的下一步方向:

目標不是模擬一個博士生,而是模擬一整個研究社區(qū)。

社區(qū)照著這個方向做了。

受SETI@home(尋找外星信號的分布式計算項目)啟發(fā),開發(fā)者在autoresearch上層加了一個協(xié)作層,誕生了autoresearch@home

任何互聯(lián)網(wǎng)用戶都可以參與并協(xié)作進行人工智能/機器學習研究。


智能體可以閱讀并學習以往的實驗結(jié)果,避免重復工作,并實時地在彼此成果的基礎上繼續(xù)發(fā)展。

不到一周已經(jīng)從最初的13個智能體擴展到80+個智能體、運行2000+實驗。

其中智能體自發(fā)產(chǎn)生了角色分化,沒人事先分配任務,但群體運行一段時間后,不同智能體開始各司其職

  • 實驗員負責跑實驗

  • 驗證員專門復現(xiàn)別人的結(jié)論

  • 統(tǒng)計員測量方差和置信度

  • 元分析員提新研究方向
    ……

數(shù)字最能說明問題:

一個智能體一天跑了188次實驗,專門驗證別人的聲明。另一組智能體生成了5895條研究假設,但一個實驗都沒跑。

整個系統(tǒng)開始像一個分布式研究實驗室。


項目發(fā)起者Ensue創(chuàng)始人Christine Yip公布了十大發(fā)現(xiàn),除了智能體角色分化之外,還有很多涉及最底層的AI訓練技術(shù)細節(jié)。


  • 更多step始終優(yōu)于更大的batch

將batch_size減半從2^19 → 2^18,訓練步驟加倍,BPB(Bits Per Byte)改善了0.007。

  • 簡單的注意力模式就是最好的

多個智能體獨立發(fā)現(xiàn)并驗證,最終收斂到了一個窗口注意力模式:SSSL(3個短上下文層,1個長上下文層,重復)。

過多的長層會浪費計算資源在全局注意力機制上,過少會導致跨toke信息缺失。

  • 調(diào)整初始化比調(diào)整優(yōu)化器更重要

僅三項改動就帶來了約0.004 BPB的改善:value embedding使用正態(tài)初始化、QKV縮放倍率、給殘差連接(skip-connection)加上可學習權(quán)重。

這些改動都沒有涉及到優(yōu)化器,而在大模型預訓練里,0.001都算有效。

  • 能學習的就別寫死

把固定常數(shù)替換為可學習參數(shù),幾乎總能提升性能。案例包括skip-2殘差權(quán)重、殘差混合的lambda系數(shù)、value embedding的門控參數(shù)。

即使在5分鐘的短訓練中,這些新參數(shù)也能收斂并產(chǎn)生收益。

  • 最優(yōu)架構(gòu)出人意料地小

群體智能在深度和寬度之間做了大范圍探索,最終最優(yōu)配置是:12層、維度512、aspect ratio 40。

加深網(wǎng)絡很快就適得其反,16層帶來84%更多的參數(shù),但步數(shù)減少23%,BPB反而更差。

  • 大量“改進”其實是噪聲

一個智能體專門跑了100組隨機種子實驗,發(fā)現(xiàn)種子方差約為0.002 BPB,這恰好是很多聲稱的”改進”的量級。換句話說,之前很多“發(fā)現(xiàn)”可能只是運氣好。

有了這個結(jié)論后,智能體群體自發(fā)調(diào)整了行為:開始要求重復實驗、多種子驗證、獨立確認。

  • 一些公認好技術(shù)直接翻車

幾個實驗產(chǎn)生了災難性退化:weight tying直接把BPB炸到3.216,label smoothing炸到1.32,PaLM風格的z-loss帶來一致性退化。

這些負面結(jié)果寫進共享記憶后,成了整個集群最有用的知識,所有后來的智能體都自動避開這些坑,不再浪費算力重復踩。

  • 最大的機會可能還沒智能體碰

1045次實驗中,幾乎所有改動都在改模型架構(gòu)。但元智能體生成了1000多條關(guān)于數(shù)據(jù)管道的假設:課程學習、數(shù)據(jù)排序、領(lǐng)域特定批處理,一條都沒被測試。

最大的突破可能根本不在架構(gòu)上,而在數(shù)據(jù)調(diào)度上。

  • 集體記憶加速了發(fā)現(xiàn)過程

因為智能體共享實驗結(jié)果,后來的智能體可以直接從已知最優(yōu)配置出發(fā),不用從頭重新發(fā)現(xiàn)前人的工作。

幾個關(guān)鍵突破來自那些綜合了已有結(jié)果而非盲目探索的智能體,證明共享記憶能顯著加速研究進程。

為了優(yōu)化,智能體“不擇手段”

在autoresearch激發(fā)的另一個衍生項目auto-discovery中,發(fā)現(xiàn)除了自動訓練模型,智能體在科學發(fā)現(xiàn)和算法發(fā)現(xiàn)中表現(xiàn)也不錯。

在幾個經(jīng)典的數(shù)學優(yōu)化任務上竟然比AlphaEvolve、SkyDiscover和LoongFlow等重量級的結(jié)果更好。


項目發(fā)起者華盛頓大學博士生Tu Xinming發(fā)現(xiàn)了AI智能體為了優(yōu)化令人捧腹大笑的時刻。

他忘了在指令文件里寫“不許上網(wǎng)搜答案”。結(jié)果AI直接上網(wǎng)搜了一圈,從別人的開源倉庫里把最優(yōu)解抄了過來。

還有一次,AI碰到評估腳本里的嚴格容差限制。它沒有卡住,也沒有報錯,而是自己去讀了評估器的源代碼,理解了約束條件,然后專門設計了一套“容差感知優(yōu)化”策略,在規(guī)則邊界內(nèi)繼續(xù)推進。

這與傳統(tǒng)超參數(shù)搜索不同,傳統(tǒng)方法在預設范圍內(nèi)調(diào)數(shù)字;autoresearch框架下的AI可以直接刪掉AdamW優(yōu)化器,然后從零寫一個新的,自由度完全不同。


One More Thing

Karpathy在最初設計autoresearch時只寫了630行代碼。

他也沒想到,社區(qū)會在幾天內(nèi)把它變成一個分布式科學共同體,有實驗、有驗證、有評審、有分工,甚至有了自己的“負面結(jié)果知識庫”。

這場實驗中最有意思的發(fā)現(xiàn),不是任何一個具體的模型架構(gòu),而是這個過程本身。

Karpathy在OpenAI的前同事Noam Brown提問:為什么在自工業(yè)革命以來人類歷史上最關(guān)鍵的時刻,他沒有在人工智能前沿實驗室工作?


Karpathy還沒有回應,但有人替他答了。

我想他可能會問你類似的問題:在至少自工業(yè)革命以來人類歷史上最關(guān)鍵的時刻,你為什么要把自己局限于商業(yè)組織?

autoresearch:

https://github.com/karpathy/autoresearch

autoresearch@home:

https://ensue-network.ai/autoresearch?view=strategies

auto-discovery:

https://github.com/XinmingTu/auto-discovery

參考鏈接:
[1]https://x.com/christinetyip/status/2032590900107346327
[2]https://x.com/TuXinming/status/2032478765033701835

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馬筱梅哭訴婆婆家沒房間,68歲張?zhí)m一張健身照回擊:少賣慘多讀書

馬筱梅哭訴婆婆家沒房間,68歲張?zhí)m一張健身照回擊:少賣慘多讀書

未曾青梅
2026-04-19 22:11:35
黃圣依“消失”2個月后現(xiàn)身,曬瑞士游學照,網(wǎng)友:實驗室出鏡像女大

黃圣依“消失”2個月后現(xiàn)身,曬瑞士游學照,網(wǎng)友:實驗室出鏡像女大

動物奇奇怪怪
2026-04-20 00:47:39
蘇林夫婦廣西考察,嚴月霞身高曝光引關(guān)注,實力不容小覷

蘇林夫婦廣西考察,嚴月霞身高曝光引關(guān)注,實力不容小覷

朗威談星座
2026-04-19 02:27:46
特朗普:由于安全原因,萬斯將不參加美伊復談

特朗普:由于安全原因,萬斯將不參加美伊復談

澎湃新聞
2026-04-19 22:03:10
蔚來回應ES9仍用隱藏式門把手:目前蔚來全系在售車型,均可以正常使用隱藏式門把手,也完全合規(guī)

蔚來回應ES9仍用隱藏式門把手:目前蔚來全系在售車型,均可以正常使用隱藏式門把手,也完全合規(guī)

魯中晨報
2026-04-18 17:16:31
演員何潤東回應穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

演員何潤東回應穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

極目新聞
2026-04-19 10:17:37
張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創(chuàng)姓改稱

張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創(chuàng)姓改稱

有范又有料
2026-04-19 00:03:10
半場:阿森納1-1戰(zhàn)平曼城,謝爾基一條龍,多納魯馬巨大失誤送禮

半場:阿森納1-1戰(zhàn)平曼城,謝爾基一條龍,多納魯馬巨大失誤送禮

側(cè)身凌空斬
2026-04-20 00:17:01
極端情況下,切爾西可能要靠輸給利物浦來獲得歐冠資格

極端情況下,切爾西可能要靠輸給利物浦來獲得歐冠資格

懂球帝
2026-04-20 00:22:46
突然“值錢了”!不少人家里都有,專家提醒:別賣!

突然“值錢了”!不少人家里都有,專家提醒:別賣!

娛樂圈見解說
2026-04-19 10:33:31
比失業(yè)更可怕的是工資倒退,深圳的工資已經(jīng)降到了10年前

比失業(yè)更可怕的是工資倒退,深圳的工資已經(jīng)降到了10年前

細說職場
2026-04-07 11:32:47
不陪快船內(nèi)耗了!倫納德下家曝光,首選騎士,哈登圓夢總冠軍有戲

不陪快船內(nèi)耗了!倫納德下家曝光,首選騎士,哈登圓夢總冠軍有戲

體育大朋說
2026-04-19 14:00:03
貝森特通告全球,將對中國二級制裁,話音剛落,中國被曝美債余額

貝森特通告全球,將對中國二級制裁,話音剛落,中國被曝美債余額

浮光驚掠影
2026-04-19 10:01:06
郭富城與方媛曬結(jié)婚紀念日合照,雙雙曬照定制水晶擺件撒糖

郭富城與方媛曬結(jié)婚紀念日合照,雙雙曬照定制水晶擺件撒糖

眼底星碎
2026-04-19 18:40:18
“雷軍被堵車里維權(quán)”真相來了!小米高管放話:絕不放任

“雷軍被堵車里維權(quán)”真相來了!小米高管放話:絕不放任

雷科技
2026-04-19 22:59:40
楊瀚森踏上第一次季后賽之旅!笑容滿面登機 G1有機會上場嗎?

楊瀚森踏上第一次季后賽之旅!笑容滿面登機 G1有機會上場嗎?

羅說NBA
2026-04-19 08:42:47
悲哀!10人小群里剩自己“干凈”,30歲女生稱身體忠于丈夫被孤立

悲哀!10人小群里剩自己“干凈”,30歲女生稱身體忠于丈夫被孤立

火山詩話
2026-04-19 07:13:36
【深圳故事】龍崗業(yè)主:千萬身家,被小區(qū)熟人4個月騙走3200萬。

【深圳故事】龍崗業(yè)主:千萬身家,被小區(qū)熟人4個月騙走3200萬。

美中融合
2026-04-19 17:49:50
突發(fā)!兩家A股公司遭立案,超6萬股東踩雷

突發(fā)!兩家A股公司遭立案,超6萬股東踩雷

財經(jīng)智多星
2026-04-19 08:05:32
泰坦尼克號幸存者救生衣首次被拍賣,以617萬元人民幣成交,救生衣主人與其他幸存者在上面簽了名,救生衣配有12個口袋,裝有肩墊和側(cè)綁帶

泰坦尼克號幸存者救生衣首次被拍賣,以617萬元人民幣成交,救生衣主人與其他幸存者在上面簽了名,救生衣配有12個口袋,裝有肩墊和側(cè)綁帶

大風新聞
2026-04-19 13:33:02
2026-04-20 01:20:49
算法與數(shù)學之美 incentive-icons
算法與數(shù)學之美
分享知識,交流思想
5482文章數(shù) 64624關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

親子
數(shù)碼
房產(chǎn)
公開課
軍事航空

親子要聞

孩子總打噴嚏、起疹子,時過敏嗎?

數(shù)碼要聞

亞馬遜明確:未來Fire TV Stick全換Vega OS

房產(chǎn)要聞

官宣簽約最強城更!??跇鞘?,突然殺入神秘房企!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無障礙瀏覽 進入關(guān)懷版