国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

馬赫100芯片支撐、首搭全新L9

0
分享至

來源:市場資訊

(來源:Xauto報告)


架構(gòu)升級成為今年自動駕駛賽道的一個關(guān)鍵詞。

今年以來,蔚來推送世界模型2.0、小鵬推送第二代VLA、Momenta推出Momenta R7強化學(xué)習(xí)世界模型,在前幾天舉辦的NVIDIA GTC 2026大會上,理想發(fā)布了下一代自動駕駛基座模型MindVLA-o1。

理想汽車基座模型負(fù)責(zé)人詹錕在演講中詳細(xì)地介紹了新一代架構(gòu),隨后,理想汽車創(chuàng)始人李想又與詹錕進行了一場生動的對話。

讓我們得以對理想下一代自動駕駛架構(gòu)的搭建和思考有了更多了解。

01

自動駕駛架構(gòu)再升級,引入3D ViT

詹錕介紹,自動駕駛架構(gòu)進入端到端之后,才算是真正的AI系統(tǒng)。但早期的端到端屬于低階智能,類似于昆蟲具備的智能,本質(zhì)是通過學(xué)習(xí)模仿來做事情。

因此,想讓自動駕駛系統(tǒng)有好的表現(xiàn),就需要喂給它大量數(shù)據(jù)進行模仿學(xué)習(xí),然而現(xiàn)實世界之復(fù)雜,長尾場景難以窮盡,靠吃數(shù)量來學(xué)習(xí),顯然無法完全覆蓋。

這就是為什么,當(dāng)前第一梯隊輔助駕駛系統(tǒng)在常規(guī)城市路況下表現(xiàn)都比較不錯,但在長尾場景中,依然會暴露各種各樣的問題,遠(yuǎn)遠(yuǎn)不如人類司機。

那么如何讓自動駕駛系統(tǒng)從模仿學(xué)習(xí),進化到理解交通場景?

在端到端的基礎(chǔ)之上,各家技術(shù)架構(gòu)開始分化。詹錕介紹,端到端中間加了Language語義推理,就成了VLA,中間加了未來圖像想象,就成了世界模型。

去年的英偉達(dá)GTC大會上,理想推出VLA架構(gòu)。一年沉淀下來,理想智駕整體確實有很大進步,但很快又到了一個瓶頸期。在Xauto智駕榜30個考點中,理想在窄路通行、三點式掉頭等難度較高場景依然無法通過。


面對這樣的現(xiàn)狀,李想提出了一個思考。

人類開車看上去沒那么難,每個普通人都能把車開得又快又穩(wěn),但全世界最頂尖的企業(yè)砸了幾千億進去,自動駕駛?cè)匀贿M展緩慢。問題到底出在哪?

經(jīng)過總結(jié),理想認(rèn)為,過去一直在教AI做成年人的事,但從來沒讓它當(dāng)過小孩。

人類在0到6歲的階段學(xué)會了走路,學(xué)會了扔球、接球。這看起來只是簡單的動作,但實際上已經(jīng)幫助孩子建立了對三維物理空間的理解。

人類能精準(zhǔn)測距、穩(wěn)定駕駛,是因為“3D預(yù)訓(xùn)練”在人類6歲前就完成了。

今天所有的端到端系統(tǒng)本質(zhì)上都是“看2D視頻學(xué)開車”,更像是一個人坐在電腦前看了十萬小時行車記錄儀,然后直接上路。

此前被行業(yè)津津樂道的BEV、OCC都存在著短板,BEV把世界從俯視角拍扁,從而丟失了高度信息,OCC雖是3D,但是缺少語義信息。

理想認(rèn)為,物理AI缺的不是更大的模型、更多的數(shù)據(jù),而是一個能真正理解3D世界的視覺基礎(chǔ)。

為了解決這個問題,理想引入了原生3D ViT,也就是三維視覺編碼器。

ViT(Vision Transformer),是基于Transformer的主干網(wǎng)絡(luò),具備全局注意力的特性,能提取出更優(yōu)秀的全局上下文特征,是大模型時代的主流。

理想介紹,3D ViT是讓模型一開始就工作在真實的三維世界里,以高分辨率多視角視覺為核心,在編碼階段直接完成對3D空間幾何和語義的統(tǒng)一理解,包括空間結(jié)構(gòu)、位置關(guān)系、語義信息等一次完成。

那么,模型不只是看見畫面,而是理解世界。

在這個體系下,激光雷達(dá)的角色變了,它不再是感知的核心,而更像一把高精度的尺子,為視覺提供幾何標(biāo)定和近場空間約束。

李想表示,在統(tǒng)一建模下,3D ViT可以穩(wěn)定感知并推理到500米以上的空間范圍。

這里想提一個點,最近華為將旗下多款車型升級到了更高精度的896線激光雷達(dá),或許也是基于同樣的思考,為自動駕駛模型描繪更高精度的物理世界。

既然3D ViT有諸多優(yōu)勢,理想為何此時才開始引入其自動駕駛架構(gòu)?談及這個問題。

詹錕表示,因為3D ViT對車端推理算力提出了極高的要求,理想汽車自研的馬赫100芯片,單顆算力達(dá)到1280TOPS,自研芯片的落地為3D ViT部署提供基礎(chǔ)。

02

五大核心技術(shù)點,最新架構(gòu)解讀

了解了理想汽車新一代自動駕駛架構(gòu)的核心變化,我們再來全面了解一下其核心技術(shù)點。

理想汽車下一代自動駕駛架構(gòu)的名稱是MindVLA-o1。

這個架構(gòu)以原生多模態(tài)MoE Transformer為核心,有五方面核心技術(shù)點,包括3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強化學(xué)習(xí)和軟硬件協(xié)同設(shè)計。


在感知層面,理想汽車采用以視覺為核心的3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達(dá)點云作為三維幾何提示,引導(dǎo)模型理解真實空間結(jié)構(gòu),使其同時具備語義理解與三維感知能力。

同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預(yù)測作為自監(jiān)督信號,使模型同時學(xué)習(xí)深度信息、語義結(jié)構(gòu)與物體運動,最終形成融合空間結(jié)構(gòu)與時間上下文的高質(zhì)量3D表示。

具備3D空間理解能力,使模型看得更遠(yuǎn)。


在思考層面,自動駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測未來幾秒的場景演化。

在語言模型承擔(dān)語義理解、常識知識和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測式隱世界模型,在隱空間中高效模擬未來。

訓(xùn)練分三階段:

第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來表征;

第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;

第三,將世界模型、多模態(tài)推理能力及駕駛行為進行聯(lián)合訓(xùn)練與對齊。

由此,模型不僅能理解當(dāng)前場景并進行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。

理想汽車將這種能力定義為多模態(tài)思考。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機制。

首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert,從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。

其次,為滿足實時性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時生成所有軌跡點,大幅提升效率。

最后,引入Discrete Diffusion(離散擴散)進行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時間穩(wěn)定,并符合車輛動力學(xué)約束。

形成統(tǒng)一行為生成機制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強化學(xué)習(xí)框架,讓模型不僅能從真實數(shù)據(jù)學(xué)習(xí),還能在世界模擬器中持續(xù)探索和優(yōu)化策略。

為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓(xùn)練。

同時,結(jié)合生成式模型,模擬環(huán)境可擴展、編輯并生成全新場景。

為支持大規(guī)模模擬與訓(xùn)練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實現(xiàn)低成本、高效率的強化學(xué)習(xí)閉環(huán)。

在閉環(huán)強化學(xué)習(xí)框架下,模型實現(xiàn)更快進化。


為解決傳統(tǒng)端側(cè)大模型部署耗時長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計定律,將模型結(jié)構(gòu)與驗證損失建模,并結(jié)合Roofline模型刻畫硬件計算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。

理想汽車基座模型團隊評估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺上完成驗證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計與部署效率。

在軟硬件協(xié)同設(shè)計定律下,模型部署更高效。

03

根據(jù)理想透露的信息,新一代自動駕駛架構(gòu)量產(chǎn)時間或在今年二季度,首發(fā)落地車型是全新理想L9。

李想此前介紹稱,單顆馬赫100的有效算力就是英偉達(dá)Thor U的3倍。全新理想L9還準(zhǔn)備了一個頂配版L9 Livis,這個版本將搭載兩顆馬赫100芯片。

另一個值得關(guān)注的地方是,主流自動駕駛玩家都在向世界模型靠攏,通過理想對于3D ViT的介紹也可以看到,理想也在試圖讓模型真正理解3D世界。

此外,行業(yè)的共識是,自動駕駛只是物理AI落地的一個關(guān)鍵場景,對于自動駕駛的探索,不僅服務(wù)于汽車,也可擴展至機器人及各種物理系統(tǒng)。

因此,打造一個通用物理AI基座模型,也是當(dāng)前車企和智駕公司研發(fā)投入的重點。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
正式退出,林詩棟發(fā)聲,官宣決定,原因曝光,王勵勤難辭其咎

正式退出,林詩棟發(fā)聲,官宣決定,原因曝光,王勵勤難辭其咎

懂球社
2026-03-26 14:25:39
40分鐘連挨4輪導(dǎo)彈!以色列遭美國背叛?中方:支持巴勒斯坦建國

40分鐘連挨4輪導(dǎo)彈!以色列遭美國背叛?中方:支持巴勒斯坦建國

小濤叨叨
2026-03-26 14:11:51
孫子生日,我轉(zhuǎn)了8888元給兒媳,她回復(fù)2個字,我直接凍結(jié)銀行卡

孫子生日,我轉(zhuǎn)了8888元給兒媳,她回復(fù)2個字,我直接凍結(jié)銀行卡

清茶淺談
2025-09-07 23:32:29
東契奇NBA生涯第60次單場得分40+,位列現(xiàn)役所有球員第5

東契奇NBA生涯第60次單場得分40+,位列現(xiàn)役所有球員第5

懂球帝
2026-03-26 11:45:09
姆巴佩:無法想象沒有內(nèi)馬爾的世界杯,但我也不能去反對安帥

姆巴佩:無法想象沒有內(nèi)馬爾的世界杯,但我也不能去反對安帥

懂球帝
2026-03-26 07:00:47
2026年交警正式更名交管!不止換稱呼,罰單、停車、換駕照全變了

2026年交警正式更名交管!不止換稱呼,罰單、停車、換駕照全變了

混沌錄
2026-03-20 21:00:04
消息人士:若美國打通霍爾木茲海峽,伊朗或在曼德海峽開辟新戰(zhàn)線

消息人士:若美國打通霍爾木茲海峽,伊朗或在曼德海峽開辟新戰(zhàn)線

極目新聞
2026-03-26 10:13:04
山東男籃3連勝殺到第4!下輪贏球真能沖進前三?

山東男籃3連勝殺到第4!下輪贏球真能沖進前三?

有態(tài)度的體育小白
2026-03-26 15:11:15
美國隱瞞戰(zhàn)死人數(shù)!美軍炸了鍋:不想為以色列而死

美國隱瞞戰(zhàn)死人數(shù)!美軍炸了鍋:不想為以色列而死

涵豆說娛
2026-03-25 10:17:17
公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

另子維愛讀史
2026-03-25 22:28:47
家長違停孩子開門殺撞人后逃逸?交警回應(yīng)

家長違停孩子開門殺撞人后逃逸?交警回應(yīng)

中國新聞周刊
2026-03-26 14:46:51
親戚借車從不加油,這次他故意空著油箱給她,她老公卻急了:我上次不是剛加了600塊的油嗎!

親戚借車從不加油,這次他故意空著油箱給她,她老公卻急了:我上次不是剛加了600塊的油嗎!

品讀時刻
2026-03-25 09:04:33
吃相難看!張雪峰去世不到24小時,惡心的事情發(fā)生,官方出手整治

吃相難看!張雪峰去世不到24小時,惡心的事情發(fā)生,官方出手整治

阿鳧愛吐槽
2026-03-25 18:57:39
3 國遭殃?以軍炸伊朗化工廠,卻忘自家死海藏著致命毒庫!

3 國遭殃?以軍炸伊朗化工廠,卻忘自家死海藏著致命毒庫!

眼界看視野
2026-03-25 17:45:55
特朗普舊招重演,美國突然大規(guī)模增兵,第二個馬杜羅即將到來?

特朗普舊招重演,美國突然大規(guī)模增兵,第二個馬杜羅即將到來?

古史青云啊
2026-03-26 14:47:33
加拿大空軍試射AIM-120D3型中程空空導(dǎo)彈

加拿大空軍試射AIM-120D3型中程空空導(dǎo)彈

看航空
2026-03-26 15:37:02
太突然!董事長湯建,因心梗意外去世

太突然!董事長湯建,因心梗意外去世

每日經(jīng)濟新聞
2026-03-25 18:21:26
闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

侃神評故事
2026-03-21 19:15:03
53票反對47票贊成!美國投票結(jié)果出來了,特朗普接連宣布3件事

53票反對47票贊成!美國投票結(jié)果出來了,特朗普接連宣布3件事

瀲滟晴方DAY
2026-03-26 15:04:53
別想再回國!中國體壇 4 大叛徒,奪冠后否認(rèn)是國人,如今遭報應(yīng)

別想再回國!中國體壇 4 大叛徒,奪冠后否認(rèn)是國人,如今遭報應(yīng)

動物奇奇怪怪
2026-03-25 14:18:48
2026-03-26 16:12:49
新浪財經(jīng) incentive-icons
新浪財經(jīng)
新浪財經(jīng)是一家創(chuàng)建于1999年8月的財經(jīng)平臺
2640808文章數(shù) 6156關(guān)注度
往期回顧 全部

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個擁抱

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個擁抱

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結(jié)束了

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

態(tài)度原創(chuàng)

藝術(shù)
本地
親子
房產(chǎn)
數(shù)碼

藝術(shù)要聞

哪一座橋不是風(fēng)景?

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

親子要聞

售賣“增高神藥”讓孩子“猛長20厘米”?多家店鋪被查

房產(chǎn)要聞

質(zhì)價比標(biāo)桿!三亞首創(chuàng)浮島全景艙亮相,還得是萬科!

數(shù)碼要聞

三星更新870 EVO系列SATA SSD:最高8TB 定價超1萬元

無障礙瀏覽 進入關(guān)懷版