国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

汽車會思考了嗎?理想發(fā)布MindVLA-o1

0
分享至


經(jīng)觀感知

自動駕駛技術正在進入新的階段。

3月17日,在美國硅谷舉行的NVIDIA GTC 2026大會上,理想汽車發(fā)布下一代自動駕駛基礎模型 MindVLA-o1。

理想汽車基座模型負責人詹錕在演講中表示,這一模型通過統(tǒng)一視覺、語言和行動三類能力,使自動駕駛系統(tǒng)不僅能夠理解環(huán)境并生成駕駛行為,還能夠在模型內(nèi)部推演未來場景,從而形成類似“思考—決策—行動”的能力。

在理想汽車的描述中,這一模型不再只是傳統(tǒng)意義上的自動駕駛算法,而是面向物理世界的一種基礎智能模型架構。按照其規(guī)劃,同一套模型未來不僅可以用于車輛控制,也可以擴展至機器人等物理系統(tǒng)。

近年來,隨著大模型技術在自然語言和視覺領域的突破,自動駕駛行業(yè)也在嘗試將視覺理解、語言推理與行動決策統(tǒng)一到同一模型中。這類模型通常被稱為 VLA(Vision-Language-Action)模型。其核心目標是讓機器同時具備環(huán)境理解、邏輯推理以及行為生成能力,從而提升自動駕駛系統(tǒng)在復雜場景中的泛化能力。

在不少業(yè)內(nèi)人士看來,VLA模型正在成為自動駕駛技術新的研究方向。相比傳統(tǒng)模塊化系統(tǒng),統(tǒng)一模型架構有望減少系統(tǒng)之間的信息損失,并通過大規(guī)模數(shù)據(jù)訓練提升系統(tǒng)在未知場景中的適應能力。

理想汽車此次發(fā)布MindVLA-o1,被視為車企在這一技術路徑上的一次探索。

智駕路線紛爭

自動駕駛技術過去十余年的發(fā)展,大致經(jīng)歷了從規(guī)則系統(tǒng)到深度學習的轉變。

在最早階段,自動駕駛系統(tǒng)主要依賴工程規(guī)則。系統(tǒng)通常由感知、定位、預測、規(guī)劃和控制等多個模塊組成,每個模塊獨立設計,并通過大量規(guī)則邏輯進行連接。這種架構在高速公路等簡單場景中運行穩(wěn)定,但在復雜城市交通環(huán)境中容易遇到難以覆蓋的極端情況。

隨著深度學習技術的發(fā)展,自動駕駛企業(yè)開始嘗試端到端模型。該方法通過神經(jīng)網(wǎng)絡直接從傳感器數(shù)據(jù)生成駕駛軌跡,從而減少人工規(guī)則的依賴。特斯拉FSD、小鵬汽車以及多家自動駕駛公司均在探索這一技術路線。

不過,端到端模型也存在新的挑戰(zhàn)。雖然模型可以通過學習生成駕駛行為,但在復雜交通環(huán)境中仍然缺乏對場景的深層理解能力。

在這一背景下,融合多模態(tài)能力的VLA模型逐漸受到關注。VLA模型通過結合視覺感知、語言模型推理以及行動生成,使自動駕駛系統(tǒng)不僅能夠識別環(huán)境,還能夠通過推理生成決策。

MindVLA-o1正是在這一思路下設計。

自動駕駛系統(tǒng)的核心能力之一,是對真實世界環(huán)境的理解。車輛傳感器獲取的數(shù)據(jù)通常以二維圖像形式呈現(xiàn),但駕駛決策需要基于三維空間。例如車輛之間的距離、行人的運動軌跡以及道路結構等信息,都需要通過三維建模進行理解。

MindVLA-o1在感知層采用了以視覺為核心的三維編碼架構,并結合激光雷達點云信息作為幾何提示,使模型能夠同時學習語義信息與空間結構。



此外,系統(tǒng)還引入三維高斯?jié)姙R(3D Gaussian Splatting)等技術,對場景進行三維重建,并通過預測下一幀圖像作為自監(jiān)督信號訓練模型,使其在學習語義信息的同時理解深度與運動關系。

這種方法的目標,是讓自動駕駛模型不僅能夠識別物體,還能夠理解物體在空間中的位置以及運動關系。

“大模型時代”

在自動駕駛系統(tǒng)中,理解當前環(huán)境只是第一步,更重要的是預測未來場景變化。例如車輛接近路口時,需要判斷行人是否準備過馬路、前車是否會突然減速、周圍車輛是否可能并線等。

傳統(tǒng)自動駕駛系統(tǒng)通常依賴單獨的預測模塊進行場景預測。而MindVLA-o1通過引入世界模型,使系統(tǒng)能夠在隱空間中模擬未來場景。

在訓練過程中,模型首先通過大量視頻數(shù)據(jù)學習未來場景變化的規(guī)律,然后在隱空間中持續(xù)推演可能出現(xiàn)的情境,并將這些推理結果與駕駛行為進行聯(lián)合訓練。

理想汽車將這一能力稱為“多模態(tài)思考”。在這一機制下,自動駕駛系統(tǒng)可以在生成駕駛決策之前,對未來場景進行預測和推演。

在駕駛決策階段,MindVLA-o1采用混合專家模型架構,并設置專門的動作專家模塊生成駕駛軌跡。系統(tǒng)會綜合環(huán)境信息、導航目標以及駕駛指令,直接生成車輛行駛軌跡。

為了滿足實時性要求,系統(tǒng)通過并行解碼方式一次性生成全部軌跡點,同時利用擴散模型進行多輪優(yōu)化,使軌跡更加平滑并符合車輛動力學約束。

這種方式與傳統(tǒng)自動駕駛系統(tǒng)存在明顯差異。過去系統(tǒng)通常通過規(guī)則和優(yōu)化算法計算駕駛軌跡,而新的模型則通過生成式方法直接生成駕駛行為。

MindVLA-o1還引入強化學習框架,并通過世界模擬器進行大規(guī)模訓練。系統(tǒng)可以在虛擬環(huán)境中生成大量駕駛場景,使模型通過不斷試錯優(yōu)化駕駛策略。

為了支持這種訓練方式,理想汽車開發(fā)了新的三維渲染引擎和分布式訓練框架,以提升模擬環(huán)境生成效率并降低訓練成本。

近年來,自動駕駛競爭正逐漸從硬件能力轉向人工智能能力。一方面,自動駕駛系統(tǒng)需要大量數(shù)據(jù)和算力支持;另一方面,大模型技術正在改變自動駕駛系統(tǒng)的整體架構。

包括特斯拉、Wayve以及部分自動駕駛公司都在探索大模型路線。部分企業(yè)還通過構建超級計算平臺訓練自動駕駛模型。

在這一背景下,車企的角色也在發(fā)生變化。從傳統(tǒng)制造企業(yè)向技術公司轉型,或成為不少車企的重要戰(zhàn)略方向。

理想汽車表示,其AI體系由數(shù)據(jù)引擎MindData、VLA模型MindVLA-o1、世界模型MindSim以及強化學習基礎設施等模塊組成。這些模塊共同構成一個閉環(huán)系統(tǒng),使AI能夠在真實世界與模擬環(huán)境中持續(xù)學習和優(yōu)化。

按照理想汽車的設想,這套系統(tǒng)未來不僅可以服務于汽車,也可以擴展至機器人等物理系統(tǒng)。

不過,大模型路線仍面臨不少挑戰(zhàn)。首先,大模型訓練需要巨量數(shù)據(jù)與算力,成本極高;其次,自動駕駛系統(tǒng)的安全性仍需要長期驗證;此外,監(jiān)管政策與商業(yè)化進程也會影響技術落地速度。

自動駕駛技術的發(fā)展歷程表明,每一次技術突破都需要經(jīng)歷較長的驗證周期。

MindVLA-o1的發(fā)布意味著自動駕駛行業(yè)正在嘗試新的技術方向,但這一技術路徑是否會成為未來主流,還需要時間檢驗。

可以確定的是,隨著人工智能技術的發(fā)展,自動駕駛已經(jīng)不再只是車輛控制系統(tǒng)的問題,而正在逐漸演變?yōu)橐粋€復雜的人工智能問題。在這一變化中,車企與科技公司的邊界也在逐漸模糊。

免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日軍官闖中國使館后,天皇玄孫迅速澄清,高市失聲,特朗普沒說錯

日軍官闖中國使館后,天皇玄孫迅速澄清,高市失聲,特朗普沒說錯

滄海旅行家
2026-03-26 13:46:41
韓媒臆想:中國隊歡呼吧,國際足聯(lián)同意他們替補世界杯

韓媒臆想:中國隊歡呼吧,國際足聯(lián)同意他們替補世界杯

體壇風之子
2026-03-26 07:00:06
淚目!全紅嬋這張紅金海報藏深意:從湛江漁村到全球代言人

淚目!全紅嬋這張紅金海報藏深意:從湛江漁村到全球代言人

TVB的四小花
2026-03-26 12:18:20
日本自衛(wèi)官持刀闖入中國大使館,日本網(wǎng)絡輿論呼吁政府立即道歉

日本自衛(wèi)官持刀闖入中國大使館,日本網(wǎng)絡輿論呼吁政府立即道歉

徐靜波靜說日本
2026-03-25 08:10:07
成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實現(xiàn)以租養(yǎng)貸

成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實現(xiàn)以租養(yǎng)貸

封面新聞
2026-03-25 21:28:05
日本內(nèi)閣官房長官就“強闖使館”事件表態(tài)

日本內(nèi)閣官房長官就“強闖使館”事件表態(tài)

新浪財經(jīng)
2026-03-25 18:48:42
岳云鵬現(xiàn)身上海,氣場跟以前完全不一樣了,助理當街抽煙也不避諱

岳云鵬現(xiàn)身上海,氣場跟以前完全不一樣了,助理當街抽煙也不避諱

仙味少女心
2026-03-24 16:47:29
第六險來了!一文讀懂“長護險”

第六險來了!一文讀懂“長護險”

極目新聞
2026-03-26 07:21:00
連場三雙,約基奇成為NBA歷史首位背靠背場均15+15+15的球員

連場三雙,約基奇成為NBA歷史首位背靠背場均15+15+15的球員

懂球帝
2026-03-26 14:02:09
出了一身臭汗,洗澡睡覺……

出了一身臭汗,洗澡睡覺……

鄉(xiāng)野小珥
2026-03-26 12:26:29
科學家在月球背面,發(fā)現(xiàn)了2200萬億噸金屬,它們究竟從何而來?

科學家在月球背面,發(fā)現(xiàn)了2200萬億噸金屬,它們究竟從何而來?

觀察宇宙
2026-03-25 20:24:45
“寫作業(yè)就頭痛,睡一覺又好了”,江蘇一家長以為孩子裝病逃避學習,為探究竟帶往醫(yī)院,結果孩子突發(fā)腦出血,被送ICU,家屬:正在恢復中

“寫作業(yè)就頭痛,睡一覺又好了”,江蘇一家長以為孩子裝病逃避學習,為探究竟帶往醫(yī)院,結果孩子突發(fā)腦出血,被送ICU,家屬:正在恢復中

瀟湘晨報
2026-03-26 11:49:57
美國最大的失誤就是一上來就把宋江給干掉了

美國最大的失誤就是一上來就把宋江給干掉了

仰望星空的一粒沙子
2026-03-14 16:25:14
東契奇:六連客最滿意的是從不放棄,布朗尼相比去年進步很大

東契奇:六連客最滿意的是從不放棄,布朗尼相比去年進步很大

懂球帝
2026-03-26 11:13:10
白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
我愛上41歲女人,她開口:玩玩可以但不結婚,得知真相我癱坐在地

我愛上41歲女人,她開口:玩玩可以但不結婚,得知真相我癱坐在地

小月故事
2026-03-19 17:08:37
養(yǎng)肥了再宰?蒙古對西方巨頭下手了,這一刀也給中國提了個醒

養(yǎng)肥了再宰?蒙古對西方巨頭下手了,這一刀也給中國提了個醒

財經(jīng)保探長
2026-03-19 19:39:45
伊朗最新回應:已被特朗普欺騙了兩次,不想再被愚弄!3架F-15戰(zhàn)機墜毀,特朗普最新回應:小意外!伊朗致函聯(lián)合國,“176國傳閱”

伊朗最新回應:已被特朗普欺騙了兩次,不想再被愚弄!3架F-15戰(zhàn)機墜毀,特朗普最新回應:小意外!伊朗致函聯(lián)合國,“176國傳閱”

每日經(jīng)濟新聞
2026-03-25 16:15:05
CIA前局長稱相比特朗普更相信伊朗方面的表述

CIA前局長稱相比特朗普更相信伊朗方面的表述

極目新聞
2026-03-25 14:10:05
40分鐘連挨4輪導彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國

40分鐘連挨4輪導彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國

近史博覽
2026-03-26 09:52:59
2026-03-26 14:16:49
經(jīng)濟觀察報 incentive-icons
經(jīng)濟觀察報
經(jīng)濟觀察報是專注于財經(jīng)新聞與經(jīng)濟分析的全國性綜合財經(jīng)類媒體。聚焦商道、商技和商機。
113746文章數(shù) 1606619關注度
往期回顧 全部

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時限4到5天

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時限4到5天

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰家人首發(fā)聲 不設追思會喪事從簡

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結束了

科技要聞

Meta高管狂分百億期權,700名員工卻下崗

態(tài)度原創(chuàng)

藝術
手機
教育
健康
公開課

藝術要聞

哪一座橋不是風景?

手機要聞

三星One UI 9前瞻:小部件更方正、Now Bar動畫更絲滑

教育要聞

2027屆注意:暑期實習=秋招通行證,錯過等一年

轉頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版