国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1 向具身智能通用模型進(jìn)化

0
分享至

3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開啟全能范式——下一代統(tǒng)一視覺-語言-動作自動駕駛大模型探索》,發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型,讓自動駕駛看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效。

詹錕表示:“當(dāng)我們把視覺、語言和行動統(tǒng)一到一個模型中時,它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體?;谕惶譜LA模型,不僅可以控制車輛,也能夠擴(kuò)展到機(jī)器人。因此,自動駕駛只是物理AI的起點,未來這類基礎(chǔ)模型將驅(qū)動新的具身智能范式。”

從規(guī)則時代到AI時代 理想輔助駕駛持續(xù)演進(jìn)

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術(shù)架構(gòu)經(jīng)歷了多輪關(guān)鍵迭代,持續(xù)的技術(shù)探索與工程實踐,為理想汽車在軟硬件一體化研發(fā)領(lǐng)域積累了深厚的基礎(chǔ)研究能力與研發(fā)實力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統(tǒng)架構(gòu)量產(chǎn)交付,輔助駕駛首次真正具備了跨場景、跨任務(wù)的統(tǒng)一理解能力。2025年,理想汽車進(jìn)一步將空間理解、語言理解與行動決策統(tǒng)一到同一模型框架,構(gòu)建了基于VLA、世界模型與強(qiáng)化學(xué)習(xí)三大技術(shù)棧的VLA司機(jī)大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機(jī)大模型月使用率達(dá)到80%,VLA指令累計使用1225.4萬次;春節(jié)期間理想輔助駕駛總里程達(dá)2.5億公里,VLA指令使用次數(shù)達(dá)130.3萬次。規(guī)?;挠脩趄炞C與持續(xù)積累的真實場景數(shù)據(jù),為理想汽車推進(jìn)下一代自動駕駛技術(shù)演進(jìn)提供了堅實基礎(chǔ)。

MindVLA-o1五大技術(shù)創(chuàng)新:看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效

理想汽車提出下一代統(tǒng)一架構(gòu)——MindVLA-o1。該架構(gòu)以原生多模態(tài)MoE Transformer為核心,通過五大技術(shù)創(chuàng)新——3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強(qiáng)化學(xué)習(xí)(Closed-loop RL)和軟硬件協(xié)同設(shè)計(Hardware–Software Co-Design),構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型。


在感知層面,理想汽車采用以視覺為核心的 3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達(dá)點云作為三維幾何提示,引導(dǎo)模型理解真實空間結(jié)構(gòu),使其在單一表示中同時具備語義理解與三維感知能力。同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預(yù)測(Next-state prediction)作為自監(jiān)督信號,使模型同時學(xué)習(xí)深度信息、語義結(jié)構(gòu)與物體運動,最終形成融合空間結(jié)構(gòu)與時間上下文的高質(zhì)量3D表示。具備3D空間理解能力,使模型看得更遠(yuǎn)。


在思考層面,自動駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測未來幾秒的場景演化。在語言模型承擔(dān)語義理解、常識知識和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測式隱世界模型,在隱空間中高效模擬未來。訓(xùn)練分三階段:第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來表征;第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態(tài)推理能力及駕駛行為進(jìn)行聯(lián)合訓(xùn)練與對齊。由此,模型不僅能理解當(dāng)前場景并進(jìn)行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態(tài)思考(Generative Multimodal Thinking)。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機(jī)制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert(動作專家),從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。其次,為滿足實時性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時生成所有軌跡點,大幅提升效率。最后,引入Discrete Diffusion(離散擴(kuò)散)進(jìn)行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時間穩(wěn)定,并符合車輛動力學(xué)約束。形成統(tǒng)一行為生成機(jī)制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓模型不僅能從真實數(shù)據(jù)學(xué)習(xí),還能在世界模擬器(World Simulator)中持續(xù)探索和優(yōu)化策略。為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓(xùn)練。同時,結(jié)合生成式模型(Generative Models),模擬環(huán)境可擴(kuò)展、編輯并生成全新場景。為支持大規(guī)模模擬與訓(xùn)練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實現(xiàn)低成本、高效率的強(qiáng)化學(xué)習(xí)閉環(huán)。在閉環(huán)強(qiáng)化學(xué)習(xí)框架下,模型實現(xiàn)更快進(jìn)化。


為解決傳統(tǒng)端側(cè)大模型部署耗時長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計定律,將模型結(jié)構(gòu)與驗證損失建模,并結(jié)合Roofline模型刻畫硬件計算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。理想汽車基座模型團(tuán)隊評估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺上完成驗證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計與部署效率。在軟硬件協(xié)同設(shè)計定律下,模型部署更高效。


自動駕駛只是起點,為具身智能構(gòu)建“數(shù)字大腦”

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統(tǒng)一的VLA數(shù)據(jù)引擎,負(fù)責(zé)大規(guī)模數(shù)據(jù)的采集、清洗和自動標(biāo)注;MindVLA-o1,統(tǒng)一的原生多模態(tài)VLA模型,可以理解環(huán)境、進(jìn)行推理,并生成駕駛行為;MindSim,可控的多模態(tài)世界模型,用于生成復(fù)雜駕駛場景并支持大規(guī)模閉環(huán)訓(xùn)練;RL Infra(強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),通過獎勵模型和策略學(xué)習(xí),使系統(tǒng)在仿真與真實環(huán)境中自我進(jìn)化。

四部分協(xié)同形成完整閉環(huán),使AI能夠感知、理解并在物理世界中自主行動,并持續(xù)學(xué)習(xí)。從結(jié)構(gòu)上看,這套系統(tǒng)如同一個“數(shù)字大腦”:感知層對應(yīng)視覺皮層,推理與規(guī)劃如前額葉,場景生成似運動皮層,強(qiáng)化學(xué)習(xí)則類似多巴胺反饋,實現(xiàn)了感知、理解、行動和持續(xù)優(yōu)化的完整閉環(huán)。

該框架不僅服務(wù)于汽車,也可擴(kuò)展至機(jī)器人及各種物理系統(tǒng)。對理想汽車而言,車是最大號的機(jī)器人,其本質(zhì)是在構(gòu)建硅基生命體的軀干與大腦。


理想汽車在持續(xù)推進(jìn)技術(shù)創(chuàng)新的同時,在人工智能領(lǐng)域頂級學(xué)術(shù)會議和期刊發(fā)表了大量研究成果,其中MindVLA-o1相關(guān)的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發(fā)表。未來,理想汽車將繼續(xù)以用戶價值為導(dǎo)向,投入前沿研究以及核心技術(shù)自研,持續(xù)構(gòu)建面向物理世界智能的完整AI系統(tǒng),堅定邁向全球領(lǐng)先的具身智能企業(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
江西各地2026年1-2月財政收入排行:吉安難破50億,景德鎮(zhèn)跌10.2%

江西各地2026年1-2月財政收入排行:吉安難破50億,景德鎮(zhèn)跌10.2%

水又木二
2026-04-12 11:38:55
涉嫌嚴(yán)重違紀(jì)違法,卯祥云被查

涉嫌嚴(yán)重違紀(jì)違法,卯祥云被查

吉刻新聞
2026-04-12 11:55:29
曝何超蕸去世更多細(xì)節(jié),閨蜜楊千嬅痛哭,最后露面狀態(tài)已水腫疲憊

曝何超蕸去世更多細(xì)節(jié),閨蜜楊千嬅痛哭,最后露面狀態(tài)已水腫疲憊

小彭美識
2026-04-12 18:24:32
油價驟降!4月11日92、95號汽油價格下調(diào),創(chuàng)下新低

油價驟降!4月11日92、95號汽油價格下調(diào),創(chuàng)下新低

芭比衣櫥
2026-04-11 11:10:17
切爾西0-3崩盤后主帥攤牌:爭四主動權(quán)已不在手里

切爾西0-3崩盤后主帥攤牌:爭四主動權(quán)已不在手里

籃壇第一線
2026-04-13 03:33:10
摸景甜胸側(cè),摟李雪琴胳膊,沒分寸感的他來《你好星期六》干嘛?

摸景甜胸側(cè),摟李雪琴胳膊,沒分寸感的他來《你好星期六》干嘛?

橙星文娛
2026-04-12 18:14:00
為這場和談,巴基斯坦押上國運!萬人封城不給以色列任何可乘之機(jī)

為這場和談,巴基斯坦押上國運!萬人封城不給以色列任何可乘之機(jī)

青青子衿
2026-04-11 02:19:32
迪麗熱巴胯真大,腳也大

迪麗熱巴胯真大,腳也大

可樂談情感
2026-04-13 01:47:12
37歲杜蘭特常規(guī)賽提前結(jié)束!本賽季場均26+5.5+4.8,他依舊是超巨

37歲杜蘭特常規(guī)賽提前結(jié)束!本賽季場均26+5.5+4.8,他依舊是超巨

愛體育
2026-04-12 21:06:19
4.13日早評|大消息!美伊談崩了!全球股市將巨震?

4.13日早評|大消息!美伊談崩了!全球股市將巨震?

龍行天下虎
2026-04-13 02:54:29
41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來一次

41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來一次

丫頭舫
2026-04-10 21:54:02
7隊將繳納奢侈稅罰金:騎士勇士均超6000萬美元 湖人火箭也在列

7隊將繳納奢侈稅罰金:騎士勇士均超6000萬美元 湖人火箭也在列

羅說NBA
2026-04-12 23:00:58
貴人橫財雙加持!4-6月三大生肖被命運選中,富地水到渠成

貴人橫財雙加持!4-6月三大生肖被命運選中,富地水到渠成

毅談生肖
2026-04-12 11:30:29
賽力斯總裁何利揚:今年以來,選擇純電車型的用戶比例大幅增加

賽力斯總裁何利揚:今年以來,選擇純電車型的用戶比例大幅增加

新浪財經(jīng)
2026-04-11 14:56:25
Surfshark把VPN壓到2美元/月

Surfshark把VPN壓到2美元/月

閃存獵手
2026-04-11 09:40:51
女子獨自帶5歲女兒和未滿1歲兒子到餐廳用餐,女兒不幸從包間窗戶墜亡……法院判了:餐廳賠近74萬元,母親擔(dān)責(zé)三成

女子獨自帶5歲女兒和未滿1歲兒子到餐廳用餐,女兒不幸從包間窗戶墜亡……法院判了:餐廳賠近74萬元,母親擔(dān)責(zé)三成

極目新聞
2026-04-12 18:00:56
國羽3連冠夢碎!王祉怡1-2無緣連斬世界第1,安洗瑩首奪亞錦賽

國羽3連冠夢碎!王祉怡1-2無緣連斬世界第1,安洗瑩首奪亞錦賽

釘釘陌上花開
2026-04-12 15:45:44
我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

岐黃傳人孫大夫
2026-04-12 06:30:03
特斯拉Model Y新款在歐洲續(xù)航突破400英里,續(xù)航能力驚艷!

特斯拉Model Y新款在歐洲續(xù)航突破400英里,續(xù)航能力驚艷!

奇思妙想生活家
2026-04-13 02:42:58
以色列對歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問

以色列對歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問

名人茍或
2026-04-11 06:54:11
2026-04-13 04:15:00
EV世紀(jì) incentive-icons
EV世紀(jì)
專業(yè)的新能源汽車垂直媒體
20691文章數(shù) 16994關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

伊媒:美驅(qū)逐艦遭革命衛(wèi)隊鎖定 距離被摧毀僅差幾分鐘

頭條要聞

伊媒:美驅(qū)逐艦遭革命衛(wèi)隊鎖定 距離被摧毀僅差幾分鐘

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

本地
藝術(shù)
手機(jī)
公開課
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

藝術(shù)要聞

揭開她筆下女人的神秘面紗,豪放灑脫的魅力令人驚嘆!

手機(jī)要聞

華為闊折疊設(shè)計圖曝光!這外觀你喜歡嗎?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版