国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

VLA與世界模型“血戰(zhàn)”前夜:吵的是路線,搶的是話語權(quán)

0
分享至

“很多VLA模型訓(xùn)練出來之后,泛化能力幾乎為零”。

這是至簡動(dòng)力CEO賈鵬在英偉達(dá)GTC 2026上闡述的一個(gè)重要觀點(diǎn),而賈鵬不是別人,就是前理想智駕研發(fā)負(fù)責(zé)人。

而為了解決模型泛化能力不足的短板,至簡動(dòng)力將世界模型和VLA融合在一起,研發(fā)出了“大一統(tǒng)基座模型”。

英偉達(dá)GTC大會(huì)作為每年一度的科技盛會(huì),理想今年也照例登臺(tái)演說。



眾所周知,理想是VLA的忠實(shí)擁護(hù)者和踐行者,其基座模型負(fù)責(zé)人詹錕在GTC大會(huì)上就發(fā)布了理想的下一代智能化架構(gòu)——MindVLA-o1。

詹錕還表示,同一套VLA模型不僅可以控制車輛,還能擴(kuò)展至機(jī)器人,這類基礎(chǔ)模型未來將驅(qū)動(dòng)新的具身智能范式。

賈鵬和詹錕的觀點(diǎn)對(duì)撞火花四濺,一場前員工與老東家的觀點(diǎn)交鋒,在英偉達(dá)GTC 2026的舞臺(tái)上也以這樣意外的方式拉開。

而在GTC舞臺(tái)之上以及周圍,一場爆發(fā)在VLA和世界模型之間,規(guī)模更廣、毫不留情的觀點(diǎn)對(duì)抗,也在轟然進(jìn)行。

世界模型聯(lián)軍的炮火

早在去年四季度的時(shí)候,VLA和世界模型就已經(jīng)明顯分化成了兩大陣營。

VLA的陣營里主要有理想和小鵬,世界模型的陣營里則主要有華為和蔚來。

有趣的是,理想和小鵬看起來都是VLA的擁躉,但小鵬卻又搞出了一套第二代VLA,與理想拉開了距離,甚至還要在氣勢上壓過理想一頭。

短短幾個(gè)月過去了,局勢又發(fā)生了巨大變化。

一方面,各家方案紛紛落地,顯得彼此之間根本沒有對(duì)錯(cuò),而是對(duì)與更對(duì)的近身肉搏。

另一方面,新的成員開始站隊(duì),讓局勢更加緊張和熱鬧了起來。



吉利汽車集團(tuán)CTO李傳海在GTC大會(huì)上就分享了吉利的WAM世界行為模型。

WAM概括地說主要是包括四大技術(shù)內(nèi)核:

多模態(tài)模型識(shí)別路況;動(dòng)作專家生成不同的動(dòng)作序列;世界模型推演分析;基于人類駕駛數(shù)據(jù)訓(xùn)練而來的價(jià)值函數(shù)來評(píng)估選擇。

用大家都能看得懂的話說,就是WAM世界行為模型追求像人一樣去理解、推理和執(zhí)行,再經(jīng)過大量的訓(xùn)練,最終使得駕駛精確性近乎直覺。

可,像人一樣去駕駛,VLA難道就不能做到嗎?



李傳海在介紹WAM的同時(shí),指出了VLA的三大問題。

第一,VLA只會(huì)背標(biāo)準(zhǔn)答案,卻不能掌握真正規(guī)律,泛化性不夠,這一點(diǎn)也與文章開頭提到的賈鵬的觀點(diǎn)不謀而合。

第二,VLA依賴具體的汽車駕駛操作數(shù)據(jù),不能像世界模型那樣處理來自互聯(lián)網(wǎng)的海量視頻,如此一來,數(shù)據(jù)的質(zhì)量和一致性則成了VLA的瓶頸。

第三,VLA建構(gòu)的是語言或符號(hào)與駕駛動(dòng)作之間的關(guān)系,不能像世界模型那樣對(duì)物理世界規(guī)律有深刻的認(rèn)知。

按照李傳海的以上觀點(diǎn),即使VLA能像人一樣去駕駛,那也很可能是一個(gè)反應(yīng)還不太靈活的新手司機(jī)。



不只是吉利這樣的整車廠,頭部智駕供應(yīng)商Momenta也對(duì)VLA持有類似的想法。

Momenta CEO曹旭東在最近的上汽大眾ID.ERA 9X技術(shù)發(fā)布會(huì)上就表示,VLA只能是錦上添花,對(duì)于智駕的提升不會(huì)那么大,而世界模型再加強(qiáng)化學(xué)習(xí)才能給智駕帶來十倍、百倍的提升。

在曹旭東看來,其背后的邏輯就在于VLA的訓(xùn)練方式是先訓(xùn)練大語言模型,而大語言模型的參數(shù)量一般在100B左右,接下來就是視覺和語言的對(duì)齊、行動(dòng)再跟視覺和語言對(duì)齊。

一套流程走下來,結(jié)果大量的參數(shù)并沒有完全用在開車本身。

世界模型則不然,它能建構(gòu)起對(duì)物理規(guī)律的認(rèn)知,然后再通過強(qiáng)化學(xué)習(xí)將認(rèn)知變成肌肉記憶,最終甚至能夠超越人類的駕駛水平。

華為車BU CEO靳玉志去年曾直言VLA取巧,并不是走向真正自動(dòng)駕駛的路徑,而李傳海與曹旭東的觀點(diǎn),又恰與靳玉志形成了一種遙相呼應(yīng)之勢。

不過,一大整車廠,兩大頭部智駕供應(yīng)商都不看好VLA,就真的說明VLA注定只是過渡階段的產(chǎn)物,而非指向終局的利刃嗎?

VLA的防御工事

李傳海在GTC上指出VLA三大病癥時(shí),曹旭東為上汽站臺(tái)直言VLA只是錦上添花時(shí),理想和小鵬也沒閑著。

前文提到,詹錕在GTC大會(huì)上發(fā)布了理想下一代智能化架構(gòu)——MindVLA-o1。

MindVLA-o1實(shí)現(xiàn)了一個(gè)底層技術(shù)的突破:原生3D ViT,也就是3D視覺模型編碼器,能夠以視覺為核心,再結(jié)合激光雷達(dá)點(diǎn)云,引導(dǎo)模型對(duì)物理空間結(jié)構(gòu)有進(jìn)一步的感知和理解。

理想汽車CEO李想把原生3D ViT評(píng)價(jià)為“真正的三維視覺編碼器”。



李想解釋道,今天所有的端到端系統(tǒng)本質(zhì)上都是“看2D視頻學(xué)開車”,更像是一個(gè)人坐在電腦前看了十萬小時(shí)行車記錄儀,然后直接上路。

其道理也很淺顯,如同刷視頻學(xué)做飯,一看就會(huì),一練就廢。

所以理想通過3D ViT彌補(bǔ)了“看”與“練”之間的實(shí)踐鴻溝,讓模型一開始就工作在真實(shí)的三維世界中,學(xué)習(xí)如何看懂“空間結(jié)構(gòu)、位置關(guān)系、語義信息”。

這也間接回答了李傳海指出的VLA對(duì)物理規(guī)律沒有深刻認(rèn)知的問題。

與此同時(shí),理想還引入了一個(gè)大家比較陌生的新概念——預(yù)測式隱世界模型,即能夠在一個(gè)“隱空間”中模擬未來。



更詳細(xì)地說,是先用視頻數(shù)據(jù)構(gòu)建未來表征,MindVLA-o1再進(jìn)行世界模型推演,最后世界模型、多模態(tài)推理以及駕駛行為進(jìn)行聯(lián)合訓(xùn)練和對(duì)齊,進(jìn)而能讓模型應(yīng)對(duì)當(dāng)下的同時(shí)還能預(yù)測未來幾秒的場景演化。

而將空間、時(shí)間統(tǒng)合起來預(yù)測未來時(shí)間的場景,也同樣是世界模型的關(guān)鍵亮點(diǎn)。

由此也不難看出,無論是世界模型,還是VLA,其實(shí)都已經(jīng)具備了L3/4的技術(shù)基礎(chǔ)。



李想說MindVLA-o1“正在逐漸演化成一個(gè)通用的物理世界智能體”。

賈鵬和李傳海所指出的VLA泛化能力不強(qiáng)的問題,在李想這里,也貌似不是問題。

事實(shí)上,從目前各家對(duì)世界模型和VLA的表述來看,兩條路貌似都能奔向通用物理世界智能體。

小鵬其實(shí)已經(jīng)在自己的第二代VLA路上狂奔起來了。

以第二代VLA為技術(shù)底座,小鵬在L2、L4、Robotaxi、人形機(jī)器人等方面做了廣泛布局。

另外第二代VLA具體的實(shí)力我們也有感受,面對(duì)擁擠的廣州早高峰,它非常像一位老練的出租車司機(jī)。大家可以參考下面這個(gè)視頻。

近幾天世界模型陣營指摘VLA,小鵬的輿論陣地也在為捍衛(wèi)VLA戰(zhàn)斗。

何小鵬就做了一場關(guān)于回答第二代VLA問題的直播。

其中,何小鵬提到第二代VLA其實(shí)就是小鵬面向L4的第一個(gè)版本,并且還將面向全球。

這也說明,所謂VLA泛化能力不足在小鵬這里,跟理想一樣看起來并不是問題。

值得一提的是,英偉達(dá)在這次GTC大會(huì)上也再次展示了自己的VLA模型——AIpamayo,并宣布將在奔馳CLA等車型上量產(chǎn)。

從芯片到智駕方案,英偉達(dá)的強(qiáng)勢入局,又會(huì)讓VLA和世界模型的天平往哪偏,是個(gè)懸念。

表面上看,VLA和世界模型在GTC臺(tái)上臺(tái)下爭得面紅耳赤,但仔細(xì)一看,這卻更像是一場心照不宣的“技術(shù)秀”。

大家吵的是路線,搶的卻是L3/4大門開啟前的話語權(quán)。

誰掌握了話語權(quán),誰便更有可能在激烈的競爭中掌握市場格局的主動(dòng)權(quán),贏得未來的門票。

而就技術(shù)本身而言,世界模型和VLA在一定程度上其實(shí)是你中有我、我中有你的關(guān)系。

并且就在今年,小鵬將試運(yùn)營基于第二代VLA的Robotaxi,華為會(huì)推進(jìn)高速L3,理想目標(biāo)將全新L9打造成具身智能機(jī)器人......

因此,世界模型和VLA誰能吵贏誰已經(jīng)是最不重要的事了,它們本質(zhì)上已經(jīng)來到了比拼工程落地的沖刺階段。

劍已出鞘,就看誰能見血了。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這四位是八十年代火遍大江南北的的女演員,猜猜看,她們是誰?

這四位是八十年代火遍大江南北的的女演員,猜猜看,她們是誰?

情感大頭說說
2026-04-11 01:14:12
警鐘敲響!2026公安部嚴(yán)打全面升級(jí),紅線千萬別碰,違者必重罰!

警鐘敲響!2026公安部嚴(yán)打全面升級(jí),紅線千萬別碰,違者必重罰!

據(jù)說說娛樂
2026-04-11 08:15:49
今晚直播決賽!溫瑞博逆襲篠塚大登,林詩棟阻擊日乒,國乒沖擊5冠!

今晚直播決賽!溫瑞博逆襲篠塚大登,林詩棟阻擊日乒,國乒沖擊5冠!

好乒乓
2026-04-11 13:12:23
打起來了!趙麗穎方發(fā)文宣誓楚喬主權(quán),《冰湖重生》暗諷后秒刪

打起來了!趙麗穎方發(fā)文宣誓楚喬主權(quán),《冰湖重生》暗諷后秒刪

影視地平線
2026-04-10 22:20:59
上海一男子凈身出戶,房產(chǎn)車輛全歸妻子!離婚3天后,女方再婚

上海一男子凈身出戶,房產(chǎn)車輛全歸妻子!離婚3天后,女方再婚

周哥一影視
2026-04-11 12:04:43
75年,張文問洪學(xué)智以什么身份去賀龍追悼會(huì),洪:他手下的一個(gè)兵

75年,張文問洪學(xué)智以什么身份去賀龍追悼會(huì),洪:他手下的一個(gè)兵

微野談寫作
2026-04-11 14:00:07
赫格塞思要倒霉?不到24小時(shí),美國被曝兩大丑聞,特朗普也受牽連

赫格塞思要倒霉?不到24小時(shí),美國被曝兩大丑聞,特朗普也受牽連

音樂時(shí)光的娛樂
2026-04-11 13:14:04
48架F-35壓境,美日撕破臉!王毅專機(jī)直插平壤,中朝抄了美軍后路

48架F-35壓境,美日撕破臉!王毅專機(jī)直插平壤,中朝抄了美軍后路

阿校談史
2026-04-11 09:09:07
我在非洲開餐館,年入百萬,娶了3個(gè)老婆,如今卻很焦慮

我在非洲開餐館,年入百萬,娶了3個(gè)老婆,如今卻很焦慮

千秋文化
2026-04-06 19:51:23
熱搜上1張瘋傳的“黃色生日蛋糕”照片,暴露多少中國家長的可怕

熱搜上1張瘋傳的“黃色生日蛋糕”照片,暴露多少中國家長的可怕

小椰子專欄
2026-04-10 13:03:00
海豚瘋狂的繁殖行為!它們和人類一樣,不以生育為目的進(jìn)行性行為

海豚瘋狂的繁殖行為!它們和人類一樣,不以生育為目的進(jìn)行性行為

怪羅
2026-04-05 22:14:48
美媒披露特朗普發(fā)動(dòng)伊朗戰(zhàn)爭內(nèi)幕:“全憑直覺”,除萬斯外無人反對(duì)

美媒披露特朗普發(fā)動(dòng)伊朗戰(zhàn)爭內(nèi)幕:“全憑直覺”,除萬斯外無人反對(duì)

澎湃新聞
2026-04-08 20:56:27
轟40分13板5助1斷2帽,文班破紀(jì)錄!鎖死DPOY一陣一防沖MVP+冠軍

轟40分13板5助1斷2帽,文班破紀(jì)錄!鎖死DPOY一陣一防沖MVP+冠軍

鍋?zhàn)踊@球
2026-04-11 12:56:53
65歲大媽直言:我選兒媳婦就一個(gè)要求,她的父母晚年必須有退休金

65歲大媽直言:我選兒媳婦就一個(gè)要求,她的父母晚年必須有退休金

清水家庭故事
2026-04-10 14:27:09
你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

掠影后有感
2026-04-01 20:26:07
泰國抽兵驚見590萬跨性別網(wǎng)紅!現(xiàn)場秒變女神集中營震撼 畫面曝光

泰國抽兵驚見590萬跨性別網(wǎng)紅!現(xiàn)場秒變女神集中營震撼 畫面曝光

環(huán)球趣聞分享
2026-04-11 13:57:49
徐某(男,31歲),建微信群多次侮辱全紅嬋

徐某(男,31歲),建微信群多次侮辱全紅嬋

中國網(wǎng)
2026-04-11 10:10:21
賈平凹再曝抄襲:尋根尋到英格蘭

賈平凹再曝抄襲:尋根尋到英格蘭

不正確
2026-03-09 12:11:05
菲律賓副總統(tǒng)扛起獨(dú)立大旗,痛批親美派,中國在等她趕走馬科斯

菲律賓副總統(tǒng)扛起獨(dú)立大旗,痛批親美派,中國在等她趕走馬科斯

一口娛樂
2026-04-11 13:35:40
中央明確:社保最低繳費(fèi)年限要提高,70、80后早做準(zhǔn)備

中央明確:社保最低繳費(fèi)年限要提高,70、80后早做準(zhǔn)備

混沌錄
2026-04-10 17:39:15
2026-04-11 14:48:49
Autolab incentive-icons
Autolab
專注汽車行業(yè)資訊的新媒體
9547文章數(shù) 47937關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

旅游
游戲
本地
教育
軍事航空

旅游要聞

藍(lán)色浪漫大片!上海這里已成夢幻花海,一秒走入偶像劇中!

打架還會(huì)爆衣!國產(chǎn)大尺度新游登陸Steam 首發(fā)打85折

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

中小學(xué)教師減負(fù)8條措施

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進(jìn)入關(guān)懷版