国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

神經(jīng)計算機橫空出世:AI不再調(diào)用軟件,而是直接長成一臺計算機

0
分享至



過去幾十年里,人類使用計算機的方式始終沒有發(fā)生根本變化:我們編寫程序,機器按照指令執(zhí)行。

但隨著大模型的發(fā)展,這種關(guān)系正在悄然改變,人類開始不再描述“如何做”,而是直接表達“想做什么”,而系統(tǒng)則負責推理并完成整個過程。在這一背景下,師從被譽為“現(xiàn)代人工智能之父”“LSTM 之父”的于爾根·施米德胡伯,來自 Meta 與 KAUST(阿卜杜拉國王科技大學(xué))的諸葛鳴晨與田淵棟等合作者,提出了一種名為“神經(jīng)計算機”的新設(shè)想:讓神經(jīng)網(wǎng)絡(luò)直接學(xué)習(xí)如何使用計算機本身,而不是依賴已有的軟件接口、工具鏈或程序結(jié)構(gòu)。換句話說,這種路徑并不是讓AI更好地使用現(xiàn)有軟件,而是嘗試讓“軟件本身”逐漸進入模型內(nèi)部。


論文公開后,他們很快發(fā)現(xiàn),這個看似抽象的設(shè)想引發(fā)了出乎意料的關(guān)注:在 X 上獲得了超過近九百條轉(zhuǎn)發(fā)和超過一百多萬瀏覽量。

對諸葛鳴晨來說,這不僅是一次傳播上的反饋,也讓他更加確信,這種方向確實擊中了當前 AI 發(fā)展的某個關(guān)鍵問題。


采訪中他講述了這篇論文的緣起。他剛來到 KAUST 時,跟自己的導(dǎo)師于爾根·施米德胡伯說,自己來這兒是因為兩個人是他的偶像,一個是 David Ha,另一個就是導(dǎo)師本人。這兩人有一個共同特點,擁有推廣全新研究范式的能力。比如他們在 2018 年合作的世界模型,是關(guān)于施米德胡伯教授在 1990 年的《Make the World Differentiable》里的用遞歸神經(jīng)網(wǎng)絡(luò)實現(xiàn)世界模型的工程實現(xiàn)。

除了為人熟知的 LSTM 等 AI 時代的巨作,施米德胡伯提出的在 2003 年提出的戈德爾機器,推動了遞歸自我進化這個方向。從 2024 年末開始,諸葛鳴晨多次與導(dǎo)師于爾根·施米德胡伯討論“神經(jīng)計算機”的設(shè)想。他們反復(fù)討論的一個問題是:AI 究竟只是更高效地使用計算機,還是會成為一種新的計算機形態(tài)?

逐漸地,一個更激進的判斷開始成形,這可能是 AI 邁向下一階段的重要方向。

與當前常見的“AI 代理”不同,這種系統(tǒng)并不依賴預(yù)先定義好的接口或工具調(diào)用。它直接從屏幕像素和用戶操作中學(xué)習(xí)整個計算機的運行方式,而不是通過預(yù)定義接口去調(diào)用已有軟件功能。

換句話說,它不是在“調(diào)用軟件”,而是在“直接生成一整臺計算機的運行過程”。也就是說,原本分散在操作系統(tǒng)、軟件和工具鏈中的功能,正在被壓縮進同一個學(xué)習(xí)系統(tǒng)之中。


傳統(tǒng)的計算機有明確的分工,處理器負責計算,內(nèi)存負責存儲,操作系統(tǒng)負責調(diào)度,你按下一個鍵,它執(zhí)行一段寫好的程序。神經(jīng)計算機則無需依靠任何人寫的代碼,只需通過觀看大量的屏幕錄像和操作記錄來學(xué)習(xí)。

為了實現(xiàn)原型,研究團隊一共探索了 6 種完全不一樣的數(shù)據(jù)收集方式,收集了超過 80 萬條命令行操作片段,總時長大約 1,100 小時,還收集了大約 1,500 小時的圖形桌面操作記錄。他們采用約 25 萬個 H100 GPU hours 訓(xùn)練了 8 個截然不同模型,這些模型看多了之后,自己學(xué)會了終端里的文本應(yīng)該是什么樣子的,光標應(yīng)該怎么移動,窗口應(yīng)該怎么彈出。它沒有學(xué)過一行操作系統(tǒng)的代碼,卻能通過觀察屏幕像素的變化來掌握系統(tǒng)行為。這也意味著,它不是在執(zhí)行明確規(guī)則,而是在大量非結(jié)構(gòu)化的觀察中歸納出“計算機如何運作”。換句話說,它不是在運行程序,而是在學(xué)會成為一臺計算機。

命令行(CLI)模型的學(xué)習(xí)過程是這樣的,一開始它生成的終端畫面完全不可讀,文字亂成一團。訓(xùn)練了 2.5 萬步之后,它開始能夠?qū)懗鰜砬逦淖址伾透袷揭捕紝Φ蒙?。越往后學(xué),它生成的內(nèi)容和真實操作的差距就越小。研究人員使用了一個名為 Tesseract 的文字識別工具來評估模型的生成質(zhì)量,發(fā)現(xiàn)字符準確率從最初幾乎不可讀(約 3%),提升到超過一半內(nèi)容可以被正確識別(54%)。

這意味著,模型已經(jīng)能夠生成一個在外觀和結(jié)構(gòu)上都接近真實的終端界面。不過當涉及到算術(shù)運算時,模型就會露怯。問它 28 減 23 等于多少,它經(jīng)常給出錯誤答案。但是,如果在指令中把答案也告訴它,它就能準確地把那個數(shù)字顯示在屏幕上。這說明目前的神經(jīng)計算機更像一個模仿者,它能夠?qū)W會“計算機看起來是如何工作的”,卻還沒有真正掌握“計算本身”。

換句話說,它擅長復(fù)現(xiàn)結(jié)果的表現(xiàn)形式,但還不具備生成結(jié)果的內(nèi)在能力。這種能力上的不均衡,也體現(xiàn)了當前這類系統(tǒng)的一個典型特征:它可以在某些模式明確的任務(wù)上表現(xiàn)出色,卻在看似簡單的問題上出現(xiàn)明顯失誤。


(來源: https://arxiv.org/pdf/2604.06425v1)

圖形桌面模型(GUI)面對的是短時控制的挑戰(zhàn),它需要理解鼠標移動、點擊、拖拽這些動作和屏幕變化之間的關(guān)系。研究人員嘗試了四種模型(擁有不同的動作注入方式)來輸入這些操作信息。

最簡單的方式是把操作信息疊加在輸入畫面上,稍復(fù)雜的方式是在模型內(nèi)部的注意力機制里單獨加一個處理操作的模塊。結(jié)果發(fā)現(xiàn),讓操作信息在模型內(nèi)部更深的地方參與計算,模型學(xué)到的控制效果更好。為了實現(xiàn)更加精確的光標控制,研究人員還給模型加了一個額外的監(jiān)督信號,單獨告訴它光標應(yīng)該在什么位置。加上這個信號之后,光標位置的準確率從不到 14% 飆升到了 98.7%。

然而一旦涉及多步驟的任務(wù),比如連續(xù)處理多個文件,模型還是容易出現(xiàn)狀態(tài)漂移,做著做著就和真實屏幕對不上了。這也說明模型在短時控制上已經(jīng)取得進展,但在長時狀態(tài)保持和連續(xù)推理上仍然存在明顯挑戰(zhàn)。


(來源:https://arxiv.org/pdf/2604.06425v1)

據(jù)了解,研究人員把此次神經(jīng)計算機看做一種全新的機器形態(tài)。他們設(shè)想的更遠目標,是一種“完全神經(jīng)計算機”:不僅能夠模仿屏幕,還可以穩(wěn)定執(zhí)行任務(wù)、持續(xù)學(xué)習(xí),并讓能力在系統(tǒng)內(nèi)部長期保留和復(fù)用。


(來源:https://arxiv.org/pdf/2604.06425v1)

諸葛鳴晨告訴 DeepTech:“如果沒有這份工作,我給自己博士生涯的打分大概是 70 到 80 分,但有了這份工作之后,我覺得自己完全滿足了,打出了 95 到 98 分的高分。因為這份工作補上了我職業(yè)生涯中非常重要的一塊,我一直想成為某種新范式的提出者,而不是僅僅引出某個新話題。”


從更長遠的角度看,這項工作的意義不在于它今天能做到什么,而在于它提出了一種新的可能性:如果計算機本身可以被學(xué)習(xí),而不是被設(shè)計,那么“軟件”這一概念本身也可能發(fā)生變化,甚至不再以我們熟悉的形式存在。

對諸葛鳴晨來說,這項工作不僅是一篇論文,更像是他一直想完成的一件事,提出一種新的研究范式,而不是只是在已有問題上不斷推進。

未來的系統(tǒng),很可能不再由固定程序構(gòu)成,而是在每一次任務(wù)中動態(tài)生成執(zhí)行過程。人類不再需要操作軟件,也不再需要描述步驟,而是直接給出目標,由系統(tǒng)在內(nèi)部完成推理、生成路徑并執(zhí)行。

一旦這種模式成立,計算機將不再只是執(zhí)行指令的工具,而是一種能夠自行運行、持續(xù)完成任務(wù)的機器形態(tài)。到那時,被改變的將不只是使用方式,而是“計算機”這個詞本身的含義。

參考資料:
相關(guān)論文https://arxiv.org/pdf/2604.06425v1

排版:胡莉花

注:封面/首圖由 AI 輔助生成

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
小伙找不到工作后坐大街上哭喊:一分錢都沒了,吃飯都沒錢了

小伙找不到工作后坐大街上哭喊:一分錢都沒了,吃飯都沒錢了

映射生活的身影
2026-05-03 19:47:41
卡里克致命換人!曼聯(lián)連丟2球,拉門斯超巨失誤,索博9分鐘傳射

卡里克致命換人!曼聯(lián)連丟2球,拉門斯超巨失誤,索博9分鐘傳射

奧拜爾
2026-05-04 00:00:46
跟隊:斯洛特對謝什科沒被判手球相當不滿,發(fā)布會上猛拍桌子

跟隊:斯洛特對謝什科沒被判手球相當不滿,發(fā)布會上猛拍桌子

懂球帝
2026-05-04 01:36:48
感謝特朗普!我國投入巨資建設(shè)的瓜達爾港,終于等來了大訂單

感謝特朗普!我國投入巨資建設(shè)的瓜達爾港,終于等來了大訂單

南生今世說
2026-05-02 17:56:11
忍不了了,約旦終于動手,深夜戰(zhàn)機越境空襲,現(xiàn)場火光沖天

忍不了了,約旦終于動手,深夜戰(zhàn)機越境空襲,現(xiàn)場火光沖天

游古史
2026-05-04 02:23:50
什么事讓你瞬間感到毛骨悚然?網(wǎng)友:從此再沒見過她老公發(fā)脾氣

什么事讓你瞬間感到毛骨悚然?網(wǎng)友:從此再沒見過她老公發(fā)脾氣

另子維愛讀史
2026-03-10 23:08:46
拜仁官媒調(diào)侃等歐冠半決賽次回合:天上一天,地上一年

拜仁官媒調(diào)侃等歐冠半決賽次回合:天上一天,地上一年

懂球帝
2026-05-04 00:11:17
人類尸臭為啥如此難聞?外國石棺咋阻止尸臭泄漏?教堂味道難聞嗎

人類尸臭為啥如此難聞?外國石棺咋阻止尸臭泄漏?教堂味道難聞嗎

向航說
2026-05-02 00:55:03
87年我跟爹燒窯半夜有人拍門,爹從灶膛抽出根燒火棍:你先別出聲

87年我跟爹燒窯半夜有人拍門,爹從灶膛抽出根燒火棍:你先別出聲

千秋文化
2026-04-19 20:07:16
剛從伊朗回來,現(xiàn)實情況可能和大家想得不太一樣,別再被蒙騙了!

剛從伊朗回來,現(xiàn)實情況可能和大家想得不太一樣,別再被蒙騙了!

無悔的燦爛人生
2026-05-03 07:57:13
蘇聯(lián)檔案解密,朝戰(zhàn)前毛主席曾推斷:志愿軍難勝美軍,會被迫退卻

蘇聯(lián)檔案解密,朝戰(zhàn)前毛主席曾推斷:志愿軍難勝美軍,會被迫退卻

章媸解說體育
2026-04-29 22:27:42
一場16-17 輸球不可怕,可怕的是艾倫的點評:這種失誤不配進決賽

一場16-17 輸球不可怕,可怕的是艾倫的點評:這種失誤不配進決賽

林子說事
2026-05-03 21:09:16
廈門建發(fā),虧麻了

廈門建發(fā),虧麻了

拾遺地
2026-05-03 12:38:10
馬未都:得了一場大病,你才明白——什么都不如活著重要

馬未都:得了一場大病,你才明白——什么都不如活著重要

杏花煙雨江南的碧園
2026-05-03 13:15:03
伊朗媒體說伊朗一超大型油輪突破了美國封鎖

伊朗媒體說伊朗一超大型油輪突破了美國封鎖

新華社
2026-05-03 17:50:04
人設(shè)崩塌!馬斯克庭審當眾失控,打臉來得太快!

人設(shè)崩塌!馬斯克庭審當眾失控,打臉來得太快!

達文西看世界
2026-05-03 10:58:54
波爾圖主席博阿斯奪冠致辭:第31座葡超冠軍屬于球隊所有人

波爾圖主席博阿斯奪冠致辭:第31座葡超冠軍屬于球隊所有人

懂球帝
2026-05-03 15:56:20
離了大譜!賴清德竄訪成行,鄭麗文罕見變臉站臺,黃國昌跟風(fēng)力挺

離了大譜!賴清德竄訪成行,鄭麗文罕見變臉站臺,黃國昌跟風(fēng)力挺

娛樂小可愛蛙
2026-05-03 16:38:59
你有多年后反應(yīng)過來的事嗎?網(wǎng)友:第一個就很炸裂啊,可以判刑了

你有多年后反應(yīng)過來的事嗎?網(wǎng)友:第一個就很炸裂啊,可以判刑了

解讀熱點事件
2026-03-17 00:05:06
我的個天啊!一個后衛(wèi),投射不行,突破不行,他能拿2.5億頂薪?

我的個天?。∫粋€后衛(wèi),投射不行,突破不行,他能拿2.5億頂薪?

球毛鬼胎
2026-05-03 09:54:23
2026-05-04 04:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16656文章數(shù) 514913關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

妻子給陌生人發(fā)兒子照片 丈夫親子鑒定三個娃兩個非親生

頭條要聞

妻子給陌生人發(fā)兒子照片 丈夫親子鑒定三個娃兩個非親生

體育要聞

曼聯(lián)3-2雙殺利物浦!提前三輪鎖定歐冠資格 梅努制勝

娛樂要聞

黃曉明五一帶娃去游樂場 父子幸福同框

財經(jīng)要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

親子
健康
本地
公開課
軍事航空

親子要聞

寶藍和叔叔在家挖了一個洞,來到了一個室內(nèi)彈床游樂場真有趣~

干細胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進入關(guān)懷版