国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從“猴子開車”到“人類智能”:基礎(chǔ)模型定義智駕新賽點(diǎn)

0
分享至


文|三少爺

2026年3月17日,英偉達(dá)GTC大會的聚光燈下,理想汽車基座模型負(fù)責(zé)人詹錕向全球展示了下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1。

3月18日,“智己超級智能體IM Ultra Agent”發(fā)布會上,智己汽車與Momenta聯(lián)合宣布推出IM AD ZETA,稱其為“直接面向L4級自動(dòng)駕駛的基座模型”。無獨(dú)有偶,就在同一天,卓馭科技也發(fā)布了其面向移動(dòng)物理AI的原生多模態(tài)基礎(chǔ)模型。

一時(shí)間,基礎(chǔ)模型/基座模型這個(gè)在大語言模型、多模態(tài)生成等領(lǐng)域已被充分驗(yàn)證和廣泛宣傳的產(chǎn)業(yè)級范式,正式吹響了進(jìn)軍物理世界的號角,快步走向量產(chǎn)前線。一個(gè)清晰的信號正在釋放:打造一個(gè)強(qiáng)大的物理世界基礎(chǔ)模型,已成為躋身智能駕駛「真第一梯隊(duì)」的新門票,沒有基礎(chǔ)模型,就不要來湊第一梯隊(duì)的熱鬧了。

瞄準(zhǔn)物理AI的端側(cè)大腦

基礎(chǔ)模型的核心追求,在于鍛造一套面向物理世界的通用智能。這意味著,它不僅要能看懂紅綠燈和行人,更要能理解三維空間的幾何關(guān)系、物體運(yùn)動(dòng)的物理規(guī)律,并最終規(guī)劃出安全、舒適、高效的行動(dòng)軌跡。

簡而言之,它要讓機(jī)器獲得在復(fù)雜、動(dòng)態(tài)的物理世界中自主移動(dòng)和操作所必需的空間直覺、物理常識與任務(wù)規(guī)劃能力。正因如此,它不再僅僅是“自動(dòng)駕駛專屬大腦”,而更像一個(gè)可以安裝在不同機(jī)器人身體上的“通用智慧內(nèi)核”。

在今年的GTC大會上,理想汽車自動(dòng)駕駛負(fù)責(zé)人詹錕就展示了這樣的一幕:同一個(gè)MindVLA-o1模型,不僅能熟練地駕駛車輛,在切換接口后,也能流暢地驅(qū)動(dòng)機(jī)器人完成操作任務(wù)。這一演示清晰地表明,基礎(chǔ)模型在設(shè)計(jì)之初,其視野就已超越了單一車輛的框架,內(nèi)嵌了對不同本體結(jié)構(gòu)、不同應(yīng)用場景的深刻理解與適應(yīng)潛力。


圖片來源:理想汽車

那么,基礎(chǔ)模型的核心特點(diǎn)到底是什么呢?我們可以從去年行業(yè)內(nèi)那場沸沸揚(yáng)揚(yáng)的VLA與世界模型之爭談起。當(dāng)時(shí)吵得多難聽我們就不再復(fù)述了,不過,那場有傷和氣的爭論到底在爭什么呢?這里既有技術(shù)路線的分歧,也包括對智能本質(zhì)的不同理解。

書說簡短。傳統(tǒng)VLA如同一位“語言大師”,依托大語言模型,擅長將視覺信息轉(zhuǎn)化為文本進(jìn)行語義推理,能理解路牌、指令乃至手勢。但三維世界到一維語言的“翻譯”過程,難免丟失精確的空間細(xì)節(jié),它知道有行人,卻難以判斷那決定生死的幾十厘米。世界模型則更像一位“空間建筑師”,旨在內(nèi)部構(gòu)建動(dòng)態(tài)世界,直接理解物體的三維形狀、距離、速度與相互作用規(guī)律,能進(jìn)行更精細(xì)的環(huán)境感知與軌跡預(yù)測。但其表征往往是隱式的,在面對“潮汐車道”、“禮讓行人”等復(fù)雜社會規(guī)則時(shí),理解的靈活性不如VLA。


圖片來源:元戎啟行

基礎(chǔ)模型的核心特點(diǎn),正是彌合了VLA與世界模型之間的鴻溝,將語言智能的博聞強(qiáng)識與空間智能的精準(zhǔn)直覺,統(tǒng)一到了同一個(gè)“智慧內(nèi)核”之中。它意味著,基礎(chǔ)模型必須同時(shí)學(xué)會用語言理解“潮汐車道”的復(fù)雜規(guī)則,也用空間直覺判斷“右前方三輪車切入”的精確軌跡與風(fēng)險(xiǎn)。而這種融合后的統(tǒng)一智能,恰恰是任何想要在物理世界中安全、靈活移動(dòng)的智能體(無論是自動(dòng)駕駛汽車、人形機(jī)器人還是未來的飛行汽車)必須具備的基礎(chǔ)能力。它就像為機(jī)器安裝了一套通用的“感官與常識”系統(tǒng),使其能適應(yīng)不同本體,應(yīng)對萬千場景。

基礎(chǔ)模型兼具VLA和世界模型能力且適應(yīng)不同本體的特點(diǎn),在小鵬汽車VLA的研發(fā)脈絡(luò)與公開表述中,體現(xiàn)得尤為清晰。在2025年11月的發(fā)布會上,小鵬明確將其第二代VLA表述為“是VLA,也是世界模型”。這句看似矛盾的表述,恰恰表明,小鵬二代VLA已經(jīng)將語言智能的推理能力與空間智能的物理理解原生地糅合在了一起。


圖片來源:小鵬汽車

小鵬之所以沒有將其二代VLA高調(diào)地冠以“基礎(chǔ)模型/基座模型”這么吊炸天的名字,是因?yàn)樵谒脑捳Z體系里,真正的基座模型另有其人。那是一個(gè)位于云端的、更龐大的“母體”。

早在2025年4月,小鵬便推出了一個(gè)720億參數(shù)的“世界基座模型”,這個(gè)面向物理AI的通用“大腦”,作為一個(gè)知識淵博的“教師模型”,在云端消化海量的多模態(tài)數(shù)據(jù),理解通用的物理規(guī)律與社會規(guī)則。然后,通過針對性的微調(diào)與蒸餾,這個(gè)“教師模型”可以將自身的能力“灌注”到不同的端側(cè)模型之中。于是,車端那個(gè)能理解、能推演、能駕駛的VLA司機(jī)模型誕生了;未來,一個(gè)能操控機(jī)器人手臂完成精細(xì)作業(yè)的模型,同樣可以由此孕育而來。


圖片來源:小鵬汽車

作為自動(dòng)駕駛賽道的新晉玩家,小米同樣在基礎(chǔ)模型的星辰大海中展開了自己的探索。2025年11月,小米發(fā)布了“業(yè)界首個(gè)成功打通自動(dòng)駕駛與具身智能的跨域具身基座模型”MiMo-Embodied,在隨后推出的新一代SU 7上,首次搭載了“融入Xiaomi MiMo-Embodied具身智能基座模型”的XLA方案。

然而,仔細(xì)審視其技術(shù)報(bào)告會發(fā)現(xiàn),MiMo-Embodied采用的是“視覺編碼-投影對齊-語言推理”三段式架構(gòu),其核心架構(gòu)更加接近于傳統(tǒng)VLA,與前文所述的將語言智能與空間智能原生融合的統(tǒng)一表征思路仍存在清晰可辨的差異。這或許正揭示了當(dāng)前行業(yè)的一個(gè)現(xiàn)狀:“基礎(chǔ)模型”作為一個(gè)極具號召力的概念已被廣泛采納,但其具體的技術(shù)內(nèi)涵、架構(gòu)標(biāo)準(zhǔn)與能力邊界,仍在演進(jìn)之中。


圖片來源:小米

描繪一個(gè)統(tǒng)一的物理AI基礎(chǔ)模型的美好藍(lán)圖是一回事,真正將它鍛造出來并投入實(shí)戰(zhàn),則是另一回事。這道由基礎(chǔ)模型劃出的新戰(zhàn)線,其壁壘之高,遠(yuǎn)超單一算法的創(chuàng)新。它考驗(yàn)的是一家企業(yè)從模型、數(shù)據(jù)到軟硬協(xié)同部署的全棧體系化能力,將競爭直接拉入了深水區(qū)。

難以逾越的三重鴻溝

一個(gè)強(qiáng)大的、面向物理AI的基礎(chǔ)模型,正在成為一道高聳的門檻。這并非單一技術(shù)的領(lǐng)先,而是體系化能力的代差,具體體現(xiàn)在三個(gè)相互關(guān)聯(lián)、卻又各自獨(dú)立的關(guān)鍵維度上。

第一重鴻溝,是模型規(guī)模與工程錘煉的能力代差。能夠理解并駕馭物理世界的基礎(chǔ)模型,參數(shù)量動(dòng)輒百億,這已非傳統(tǒng)用于感知或預(yù)測的專用小模型可比。而這種駕馭超大模型的能力,不是一蹴而就的。正所謂不積跬步無以至千里,它必須在之前完成徹底的、一段式端到端的架構(gòu)改造,并在視覺語言模型、世界模型等前沿方向上積累足夠的探索與實(shí)踐之后,才能夠逐步打磨出來。

端到端本身就是一個(gè)將感知、預(yù)測、規(guī)劃等任務(wù)不斷神經(jīng)網(wǎng)絡(luò)化,從而將模型參數(shù)越做越大的過程。從分段式端到端到一段式端到端,車企的算法團(tuán)隊(duì)正是在這個(gè)過程中,積累了處理海量數(shù)據(jù)、調(diào)試復(fù)雜網(wǎng)絡(luò)架構(gòu)、進(jìn)行超大規(guī)模分布式訓(xùn)練的核心工程能力。這種能力的積累是循序漸進(jìn)的,而模型參數(shù)規(guī)模的提升,正是這種能力積累到一定階段后的自然結(jié)果。

例如,理想汽車在2025年量產(chǎn)的VLA司機(jī)大模型參數(shù)約為40億級別,而其在GTC 2026發(fā)布的下一代MindVLA-o1,則明確指向百億參數(shù)以上的規(guī)模。小鵬汽車在2026年的技術(shù)規(guī)劃中也立下目標(biāo),計(jì)劃將其第二代VLA模型的參數(shù)量推向兩百億級別。沒有經(jīng)歷過這個(gè)漫長“煉丹”過程的團(tuán)隊(duì),很難憑空掌握駕馭百億參數(shù)巨獸的秘訣,這構(gòu)成了第一道堅(jiān)實(shí)的壁壘。


圖片來源:小鵬汽車

第二重鴻溝,是數(shù)據(jù)閉環(huán)的深度與“煉金”效率。很多車企宣稱不缺數(shù)據(jù),但自動(dòng)駕駛模型迭代的精髓在于針對性補(bǔ)齊短板,關(guān)鍵在于能否建立一套高效的機(jī)制,從充滿了無聊語料的數(shù)據(jù)海洋中篩選出真正的“黃金”。

這就像人的學(xué)習(xí)區(qū)分為舒適區(qū)和拉伸區(qū)一樣,大量簡單、重復(fù)的行車數(shù)據(jù)是舒適區(qū),對能力提升貢獻(xiàn)有限,而那些復(fù)雜的交互、罕見的長尾場景,才是讓模型能力得到拉伸的關(guān)鍵。數(shù)據(jù)挖掘的核心意義,就在于高效、精準(zhǔn)地找到這些拉伸區(qū)數(shù)據(jù)。而這,特別考驗(yàn)車企的數(shù)據(jù)閉環(huán)體系。

第三重鴻溝,是軟硬件協(xié)同的終極考驗(yàn)。 一個(gè)百億參數(shù)的基座模型,最終要部署到車端芯片上,在幾十毫秒內(nèi)完成推理,同時(shí)滿足功能安全、實(shí)時(shí)性和功耗的嚴(yán)苛要求,這是一場極致的工程挑戰(zhàn)。


圖片來源:理想汽車

它要求從芯片架構(gòu)、編譯器、運(yùn)行時(shí)到算法模型進(jìn)行深度協(xié)同設(shè)計(jì)。理想汽車在發(fā)布MindVLA-o1時(shí)強(qiáng)調(diào)的軟硬件協(xié)同設(shè)計(jì)定律,小鵬汽車與北京大學(xué)前沿計(jì)算研究中心聯(lián)合研究如何對視覺Token進(jìn)行高效動(dòng)態(tài)剪枝,以極致優(yōu)化車端推理效率,都是這個(gè)層面的攻堅(jiān)。

這不僅僅是算法層面的優(yōu)化,更是對車載計(jì)算平臺從底層硬件到頂層應(yīng)用的全棧掌控能力。采用標(biāo)準(zhǔn)化、黑盒化供應(yīng)鏈方案的玩家,在這一環(huán)上幾乎失去了參與頂級競賽的資格,因?yàn)樾阅芘c效率的極限,往往就誕生在軟硬件縫隙被徹底抹平的地方。

李想曾將自動(dòng)駕駛的演進(jìn)生動(dòng)地比作生物智能的躍遷:依賴規(guī)則算法的昆蟲智能、基于端到端方案的哺乳動(dòng)物智能、基于VLA大模型的人類智能。如今,行業(yè)頭部玩家集體瞄準(zhǔn)的物理AI基礎(chǔ)模型,其野心正是實(shí)現(xiàn)哺乳動(dòng)物智能到人類智能的躍遷。

不過,這最后的躍遷遠(yuǎn)比想象中艱難,它并非單一算法的突破,而是由模型規(guī)模、數(shù)據(jù)閉環(huán)與軟硬協(xié)同的三重高墻,共同構(gòu)成的一項(xiàng)龐大的系統(tǒng)工程。這道全新的門檻,正將智能駕駛的競爭,從功能體驗(yàn)的比拼,拉入一場考驗(yàn)全棧能力的深度較量。

當(dāng)理想汽車用MindVLA-o1演示多模態(tài)思考,當(dāng)小鵬汽車宣布其第二代VLA在內(nèi)部測試中實(shí)現(xiàn)“領(lǐng)先行業(yè)一流選手5倍”的體驗(yàn)領(lǐng)先時(shí),他們展示的,正是基礎(chǔ)模型在系統(tǒng)體驗(yàn)上必然帶來的大踏步跨越。

這種跨越代表著競爭的邏輯已經(jīng)改變,那些仍在依賴舊范式、停留在“猴子開車”階段的玩家,面臨的不僅是體驗(yàn)的落差,更是技術(shù)代際的斷層。留給它們的時(shí)間真的不多了。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
深度 | 從“粉絲”變對手:毛焦?fàn)柸绾谓K結(jié)歐爾班時(shí)代重塑匈牙利?

深度 | 從“粉絲”變對手:毛焦?fàn)柸绾谓K結(jié)歐爾班時(shí)代重塑匈牙利?

上觀新聞
2026-04-13 20:53:11
演員袁成杰探店文章面館,當(dāng)被問為啥開店,文章:“純屬是為了自己有一口吃的”

演員袁成杰探店文章面館,當(dāng)被問為啥開店,文章:“純屬是為了自己有一口吃的”

新浪財(cái)經(jīng)
2026-04-14 13:33:43
深圳比亞迪坪山工廠出現(xiàn)火災(zāi),官方通報(bào):火勢已撲滅,沒有人員傷亡

深圳比亞迪坪山工廠出現(xiàn)火災(zāi),官方通報(bào):火勢已撲滅,沒有人員傷亡

極目新聞
2026-04-14 08:45:22
外交部宣布:查波將訪華

外交部宣布:查波將訪華

中國網(wǎng)
2026-04-14 10:53:35
后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠,坦言及時(shí)止損

后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠,坦言及時(shí)止損

青梅侃史啊
2026-04-14 07:17:00
柳海光連任上海足協(xié)掌門人,2025年上海職業(yè)足球入場觀眾破100萬人次

柳海光連任上海足協(xié)掌門人,2025年上海職業(yè)足球入場觀眾破100萬人次

上觀新聞
2026-04-13 21:24:22
《瘋狂動(dòng)物城2》付費(fèi)僅限48小時(shí)內(nèi)觀看,視頻平臺回應(yīng)

《瘋狂動(dòng)物城2》付費(fèi)僅限48小時(shí)內(nèi)觀看,視頻平臺回應(yīng)

大象新聞
2026-04-14 07:09:05
歐爾班:澤連斯基笑到了最后

歐爾班:澤連斯基笑到了最后

史政先鋒
2026-04-13 16:03:44
鄭麗文返臺后,島內(nèi)民調(diào)曝光,位列倒數(shù)第三,與沈伯洋幾乎持平?

鄭麗文返臺后,島內(nèi)民調(diào)曝光,位列倒數(shù)第三,與沈伯洋幾乎持平?

影孖看世界
2026-04-14 02:23:31
比亞迪緊急回應(yīng)工廠起火

比亞迪緊急回應(yīng)工廠起火

浙江之聲
2026-04-14 10:38:59
談判破裂,川普的“二道封鎖”,德黑蘭錯(cuò)過了最后的臺階

談判破裂,川普的“二道封鎖”,德黑蘭錯(cuò)過了最后的臺階

難得君
2026-04-13 17:20:42
請陳芋汐正面回應(yīng):在知情的情況下,為何不退出282群?

請陳芋汐正面回應(yīng):在知情的情況下,為何不退出282群?

開成運(yùn)動(dòng)會
2026-04-13 20:23:15
特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬人恐難撐過一個(gè)月

特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬人恐難撐過一個(gè)月

民間胡扯老哥
2026-04-14 06:00:51
Lululemon涉嫌使用永久化學(xué)物質(zhì)被調(diào)查,研究顯示或致癌

Lululemon涉嫌使用永久化學(xué)物質(zhì)被調(diào)查,研究顯示或致癌

魯中晨報(bào)
2026-04-14 07:16:33
太罕見了!浙江嘉興,有一男子在野外河里,釣到條金燦燦的翹嘴魚

太罕見了!浙江嘉興,有一男子在野外河里,釣到條金燦燦的翹嘴魚

觀察鑒娛
2026-04-14 10:44:11
人窮能卑微到什么地步?網(wǎng)友說:一個(gè)男人兩千塊買了我三個(gè)晚上!

人窮能卑微到什么地步?網(wǎng)友說:一個(gè)男人兩千塊買了我三個(gè)晚上!

黯泉
2026-04-14 12:13:04
劉雨鑫吃了6000家餐廳、走遍幾十個(gè)國家,他的錢其實(shí)就3個(gè)來源

劉雨鑫吃了6000家餐廳、走遍幾十個(gè)國家,他的錢其實(shí)就3個(gè)來源

老吳教育課堂
2026-04-14 07:44:56
國乒三條消息: 張繼科復(fù)出、馬龍坐鎮(zhèn)成都、王曼昱跨界新身份

國乒三條消息: 張繼科復(fù)出、馬龍坐鎮(zhèn)成都、王曼昱跨界新身份

羅納爾說個(gè)球
2026-04-13 22:28:20
美軍封鎖霍爾木茲海峽方案早已存在:攔截-登船-接管

美軍封鎖霍爾木茲海峽方案早已存在:攔截-登船-接管

紅星新聞
2026-04-14 13:35:16
許家印當(dāng)庭認(rèn)罪,家族還有多少資產(chǎn)沒追回?

許家印當(dāng)庭認(rèn)罪,家族還有多少資產(chǎn)沒追回?

鳳凰網(wǎng)財(cái)經(jīng)
2026-04-14 12:59:36
2026-04-14 14:36:49
autocarweekly incentive-icons
autocarweekly
負(fù)責(zé)不一樣的汽車觀點(diǎn)和福利
9740文章數(shù) 110028關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

體育要聞

他做對了所有事,卻被整個(gè)職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價(jià)13.38萬元

態(tài)度原創(chuàng)

時(shí)尚
健康
藝術(shù)
家居
軍事航空

今年科切拉的風(fēng)吹向了誰?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

這位美女畫家的夏天竟如此夢幻

家居要聞

復(fù)古風(fēng)格 自然簡約

軍事要聞

伊朗要求五個(gè)中東國家賠償戰(zhàn)爭損失

無障礙瀏覽 進(jìn)入關(guān)懷版