国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

世界模型是讓自動(dòng)駕駛汽車?yán)斫馐澜邕€是預(yù)測(cè)未來(lái)?

0
分享至

[首發(fā)于智駕最前沿微信公眾號(hào)]世界模型在自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓自動(dòng)駕駛汽車得以理解世界,還是為其提供了預(yù)測(cè)未來(lái)的視角?

世界模型到底做了什么?

世界模型,其實(shí)是一個(gè)“內(nèi)部表征+動(dòng)態(tài)預(yù)測(cè)”的組合。簡(jiǎn)單理解,世界模型就是將感知到的東西(圖像、點(diǎn)云、雷達(dá)、文本、動(dòng)作歷史)壓縮成一套內(nèi)部狀態(tài),然后用這套內(nèi)部狀態(tài)去生成、預(yù)測(cè)接下來(lái)可能出現(xiàn)的場(chǎng)景或觀察。



圖片源自:網(wǎng)絡(luò)

想要實(shí)現(xiàn)“內(nèi)部表征+動(dòng)態(tài)預(yù)測(cè)”,有兩個(gè)關(guān)鍵的技術(shù)不得不去討論,一個(gè)是“表示”(representation),也就是把復(fù)雜的外界信息提煉成對(duì)后續(xù)推斷和決策有用的結(jié)構(gòu);還有一個(gè)是“生成/預(yù)測(cè)”(generative/predictive),即基于表示去推演、采樣、評(píng)估未來(lái)可能發(fā)生的序列。

早期很多研究發(fā)現(xiàn),如果智能體每一步都只根據(jù)當(dāng)前看到的畫(huà)面直接“做反應(yīng)”,其實(shí)跟條件反射差不多,缺少前瞻性。一旦場(chǎng)景稍微復(fù)雜,或者需要權(quán)衡幾步之后的結(jié)果,這種做法就很容易失誤。于是“世界模型”這個(gè)概念就被引入到強(qiáng)化學(xué)習(xí)中,也就是先讓系統(tǒng)學(xué)會(huì)一個(gè)簡(jiǎn)化但可信的“世界運(yùn)行方式”,也就是學(xué)清楚在某個(gè)狀態(tài)下采取什么動(dòng)作,環(huán)境大概率會(huì)往哪個(gè)方向發(fā)展。等這個(gè)模型學(xué)成了,策略就不再只盯著眼前這一刻,而是可以在這個(gè)“內(nèi)部世界”里提前試著走幾步,看看不同選擇大概會(huì)帶來(lái)什么后果,再?zèng)Q定現(xiàn)實(shí)中該怎么做。

這種做法的變化點(diǎn)在于,系統(tǒng)不再是“看見(jiàn)什么就立刻反應(yīng)什么”,而是先在內(nèi)部做一輪模擬和推演,再輸出動(dòng)作。也正因?yàn)槎嗔诉@一步“提前想一想”的動(dòng)作,智能體的行為便傾向于在做規(guī)劃,而不是條件反射式的響應(yīng)。

這也回答了為什么有人說(shuō)世界模型是在“理解世界”,如果“理解”被定義為能在內(nèi)部構(gòu)建一個(gè)能解釋因果、能預(yù)測(cè)后果、并能據(jù)此做出合理選擇的表征,那么世界模型確實(shí)是一種機(jī)器理解。相對(duì)地,如果你把“理解”定義為擁有像人類一樣的主觀體驗(yàn)、常識(shí)推理和高層抽象的概念,那世界模型還遠(yuǎn)未到那一步。

其實(shí)世界模型更準(zhǔn)確的定位應(yīng)該是一種能替代部分理解功能的機(jī)器表征與預(yù)測(cè)機(jī)制,它做的是有用的理解,而不是類似人類的全方位主觀理解。世界模型的更像是讓大模型在內(nèi)部試跑未來(lái),再用模擬得到的后果指導(dǎo)現(xiàn)實(shí)中的行動(dòng)。

世界模型的三要素

將世界模型拆開(kāi)剖析,其可以分為3部分,第1個(gè)是表征(representation),第2個(gè)是動(dòng)力學(xué)/生成模型(dynamics/generative),第3個(gè)是利用這些能力來(lái)支持決策(planning/control)。

這三者不是獨(dú)立模塊簡(jiǎn)單拼湊,而是互相輔助,好的表征可以讓預(yù)測(cè)更穩(wěn)健,可靠的預(yù)測(cè)能讓規(guī)劃更安全,而規(guī)劃過(guò)程也能反過(guò)來(lái)推動(dòng)表征和預(yù)測(cè)的改進(jìn)(例如通過(guò)閉環(huán)數(shù)據(jù)收集)。這種閉環(huán)被視為世界模型范式的核心,即大模型學(xué)習(xí)一個(gè)可用來(lái)想象未來(lái)的內(nèi)部世界,然后在想象中訓(xùn)練和評(píng)估動(dòng)作。



圖片源自:網(wǎng)絡(luò)

表征通常會(huì)把高維觀測(cè)映射到一個(gè)低維或離散的潛在空間,這個(gè)潛在空間既要壓縮信息,也要保留那些對(duì)未來(lái)預(yù)測(cè)和決策至關(guān)重要的結(jié)構(gòu)(比如物體的速度、相對(duì)位置、可碰撞性、路面屬性等)。

生成/動(dòng)力學(xué)模塊則在這個(gè)潛在空間上學(xué)習(xí)時(shí)間演化規(guī)則,給定當(dāng)前潛在狀態(tài)和動(dòng)作,預(yù)測(cè)下一步潛在狀態(tài)或直接生成下一幀觀測(cè)。一旦這套機(jī)制可用,就能在內(nèi)部做軌跡采樣、比較不同動(dòng)作序列的后果,進(jìn)而選擇一個(gè)看起來(lái)更安全、更高收益的動(dòng)作。這種“先想后做”的模式,正是世界模型在機(jī)器人和自動(dòng)控制里被看好的核心原因。

當(dāng)然,世界模型并不是生成像素級(jí)的逼真畫(huà)面,而是在某種抽象層面上保留因果和可操作的信息。換言之,對(duì)于世界模型來(lái)說(shuō),能不能預(yù)測(cè)未來(lái)的高層結(jié)構(gòu)(哪個(gè)物體會(huì)碰到哪個(gè)物體,速度會(huì)如何變化,行人的意圖是不是要橫穿馬路)比單純把畫(huà)面渲染得漂亮更重要。這也是為什么有些工作不做原始像素的逐幀生成,而是去預(yù)測(cè)四維占據(jù)(4Doccupancy)、幾何表示、BEV(bird-eyeview)軌跡或更緊湊的行為意圖。



世界模型到底是在“理解”還是“預(yù)測(cè)”?

如果非要在“理解世界”與“預(yù)測(cè)未來(lái)”之間選一項(xiàng)作為世界模型的本質(zhì),智駕最前沿以為,世界模型本質(zhì)上是為了預(yù)測(cè)而構(gòu)建的表征系統(tǒng),但這種預(yù)測(cè)是為決策服務(wù)的,因此它等同于一種可操作的理解。也就是說(shuō),世界模型通過(guò)預(yù)測(cè)未來(lái)(短期或中期)的能力來(lái)體現(xiàn)對(duì)世界的理解,但這種理解是功能性的、以行為為導(dǎo)向的,而不是哲學(xué)意義上的知道世界為什么存在的那種理解。



圖片源自:網(wǎng)絡(luò)

其實(shí)對(duì)于世界模型來(lái)說(shuō),預(yù)測(cè)是手段不是目的,世界模型的最終目的是改善決策效果,而預(yù)測(cè)未來(lái)只是實(shí)現(xiàn)該目的的方式?!袄斫狻睂?duì)于世界模型也只是一種可操作的形式,它不是詞典式的定義或人文式的領(lǐng)悟,而是把有用的因果、動(dòng)力學(xué)、約束編碼進(jìn)模型,使模型在遇到新情況時(shí)能推測(cè)后果并選擇更優(yōu)行動(dòng)。此外,世界模型的理解也只是一個(gè)工程目標(biāo),其能否把預(yù)測(cè)變成安全的、魯棒的決策依據(jù),比其能不能進(jìn)行人類化的理解更關(guān)鍵,也更實(shí)際。

對(duì)自動(dòng)駕駛的影響

在傳統(tǒng)自動(dòng)駕駛系統(tǒng)里,感知負(fù)責(zé)識(shí)別和定位,預(yù)測(cè)負(fù)責(zé)給出軌跡或意圖的分布,決策/規(guī)劃再根據(jù)這些輸入做路徑選擇。引入世界模型后,系統(tǒng)可以在內(nèi)部模擬各種動(dòng)作序列和外界響應(yīng),評(píng)估不同策略在模擬未來(lái)中的長(zhǎng)期效果,使自動(dòng)駕駛系統(tǒng)不再只依賴短期軌跡預(yù)測(cè)。這意味著系統(tǒng)能在更長(zhǎng)時(shí)間尺度上權(quán)衡風(fēng)險(xiǎn)和收益,而不是根據(jù)每一幀的數(shù)據(jù)做短期判斷。



圖片源自:網(wǎng)絡(luò)

世界模型也為自動(dòng)駕駛提供了一項(xiàng)關(guān)鍵技術(shù)方案,在模擬環(huán)境里,世界模型可批量生成極端情況,用于訓(xùn)練和驗(yàn)證,減少了現(xiàn)實(shí)路測(cè)需要費(fèi)時(shí)費(fèi)力且非常危險(xiǎn)的問(wèn)題。如自動(dòng)駕駛大模型GAIA-1就利用視頻、文本和動(dòng)作的聯(lián)合建模,合成了多樣的駕駛場(chǎng)景,用于訓(xùn)練更魯棒的策略。當(dāng)然,這一方案需要注意合成場(chǎng)景必須高質(zhì)量并且覆蓋真實(shí)分布的關(guān)鍵薄弱點(diǎn),否則訓(xùn)練出來(lái)的策略在真實(shí)世界中將無(wú)法使用。因此對(duì)于自動(dòng)駕駛來(lái)說(shuō),世界模型是一種強(qiáng)補(bǔ)充手段,而不是完全替代真實(shí)路測(cè)的工具。

世界模型可以給自動(dòng)駕駛帶來(lái)前瞻性的預(yù)測(cè),但這種前瞻性并非無(wú)誤。自動(dòng)駕駛系統(tǒng)在依賴世界模型做決策時(shí),必須有明確的不確定性度量與回退策略,在模型信心不足或預(yù)測(cè)分布過(guò)于分散時(shí),系統(tǒng)應(yīng)退回更保守的控制策略或請(qǐng)求人工干預(yù)。

世界模型如何處理長(zhǎng)尾問(wèn)題?

對(duì)于自動(dòng)駕駛來(lái)說(shuō),真實(shí)交通環(huán)境是非常復(fù)雜的,無(wú)論是對(duì)于哪種模型來(lái)說(shuō),想在學(xué)習(xí)階段就搜集所有的數(shù)據(jù)是完全不可能的。那世界模型是如何處理這一問(wèn)題的?

世界模型會(huì)先用真實(shí)數(shù)據(jù)學(xué)習(xí)表征和基本動(dòng)力學(xué),再用生成式或模擬方法擴(kuò)展到稀有場(chǎng)景。近年來(lái)就有一些生成式世界模型(例如把視頻、動(dòng)作、文本聯(lián)合建模的那類)用無(wú)監(jiān)督或自監(jiān)督手段來(lái)學(xué)習(xí)高層結(jié)構(gòu),然后用這些模型合成數(shù)據(jù)來(lái)訓(xùn)練策略或進(jìn)行安全測(cè)試。

這種方式的好處是能在模擬中“壓縮”長(zhǎng)尾風(fēng)險(xiǎn)的出現(xiàn)頻率,加速策略在極端情況的魯棒性提升;其壞處就是合成分布和現(xiàn)實(shí)分布的差異可能引入偏差或假象,導(dǎo)致訓(xùn)練結(jié)果與現(xiàn)實(shí)有偏差。



圖片源自:網(wǎng)絡(luò)

很多技術(shù)方案中會(huì)用不同模態(tài)(視覺(jué)、雷達(dá)、激光、地圖)融合進(jìn)表征,用基于潛在變量的生成模型或基于JEPA的預(yù)測(cè)架構(gòu)來(lái)學(xué)習(xí)時(shí)間一致性的表示,再用規(guī)劃器或強(qiáng)化學(xué)習(xí)算法在潛在空間里做閉環(huán)訓(xùn)練。

這樣做的目的是減小原始觀測(cè)維度的噪聲影響,把決策問(wèn)題放在更穩(wěn)定的抽象層上。最新的一些技術(shù)甚至把世界模型做成離散token序列的形式,把預(yù)測(cè)問(wèn)題變?yōu)樾蛄猩蓡?wèn)題,借助大規(guī)模序列模型的力量來(lái)提升長(zhǎng)時(shí)序的穩(wěn)定性。

無(wú)論是哪種技術(shù)路線,其核心都是用內(nèi)部模型來(lái)替代部分真實(shí)交互,以節(jié)省成本并提升安全性。

最后的話

回到最開(kāi)始的問(wèn)題,世界模型是理解世界還是預(yù)測(cè)未來(lái)?答案是二者兼有。世界模型通過(guò)學(xué)習(xí)內(nèi)部表征來(lái)提高對(duì)未來(lái)的預(yù)測(cè)能力,而這些預(yù)測(cè)主要是為決策和行動(dòng)服務(wù)的。

世界模型通過(guò)提供一個(gè)可理解、可推理的世界表征,賦予了自動(dòng)駕駛系統(tǒng)預(yù)測(cè)未來(lái)的能力。理解是預(yù)測(cè)的基礎(chǔ),預(yù)測(cè)是理解的延伸與應(yīng)用。二者緊密耦合,讓自動(dòng)駕駛從“感知-反應(yīng)”模式,進(jìn)化到“理解-推演-決策”的更高層次,這正是其技術(shù)變革性的關(guān)鍵所在。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
真沒(méi)想到!風(fēng)電龍頭竟然承包了半壁航天供應(yīng)鏈

真沒(méi)想到!風(fēng)電龍頭竟然承包了半壁航天供應(yīng)鏈

和訊網(wǎng)
2026-01-11 21:53:47
不出中國(guó)所料:日本的幫手已到,難怪特朗普按兵不動(dòng),他留了一手

不出中國(guó)所料:日本的幫手已到,難怪特朗普按兵不動(dòng),他留了一手

關(guān)權(quán)教授聊經(jīng)濟(jì)
2025-12-24 11:28:38
阿嬌香港機(jī)場(chǎng)被粉絲圍堵!暴瘦后小蠻腰性感,面對(duì)鏡頭一臉不自信

阿嬌香港機(jī)場(chǎng)被粉絲圍堵!暴瘦后小蠻腰性感,面對(duì)鏡頭一臉不自信

心靜物娛
2026-01-12 11:23:34
沙特采購(gòu)"梟龍"戰(zhàn)機(jī) 是怎樣從不可能變成現(xiàn)實(shí)的

沙特采購(gòu)"梟龍"戰(zhàn)機(jī) 是怎樣從不可能變成現(xiàn)實(shí)的

看看新聞Knews
2026-01-11 23:29:08
是閆學(xué)晶在說(shuō)謊,還是中央戲劇學(xué)院在甩鍋?

是閆學(xué)晶在說(shuō)謊,還是中央戲劇學(xué)院在甩鍋?

筆桿論道
2026-01-12 06:18:34
GEO概念延續(xù)強(qiáng)勢(shì) 利歐股份等多股漲停

GEO概念延續(xù)強(qiáng)勢(shì) 利歐股份等多股漲停

財(cái)聯(lián)社
2026-01-12 09:32:25
恩德里克:感謝球隊(duì)熱情接納我;接下來(lái)也必須做好準(zhǔn)備

恩德里克:感謝球隊(duì)熱情接納我;接下來(lái)也必須做好準(zhǔn)備

懂球帝
2026-01-12 09:05:21
著名音樂(lè)家、指揮家劉鍵逝世,曾因在街頭見(jiàn)義勇為為人所熟知

著名音樂(lè)家、指揮家劉鍵逝世,曾因在街頭見(jiàn)義勇為為人所熟知

澎湃新聞
2026-01-11 18:58:27
好消息!馬鈔預(yù)約難度降低了!即將預(yù)約,銀行入口更新!

好消息!馬鈔預(yù)約難度降低了!即將預(yù)約,銀行入口更新!

天天紀(jì)念幣
2026-01-12 10:07:33
美智庫(kù):美軍36小時(shí)內(nèi)精準(zhǔn)打擊中方5萬(wàn)目標(biāo)

美智庫(kù):美軍36小時(shí)內(nèi)精準(zhǔn)打擊中方5萬(wàn)目標(biāo)

你的雷達(dá)站
2026-01-09 03:32:07
謝賢前女友大曝戀愛(ài)私隱!三年不碰她,卻每天給她做“四哥菜芯”

謝賢前女友大曝戀愛(ài)私隱!三年不碰她,卻每天給她做“四哥菜芯”

阿纂看事
2026-01-09 10:19:00
“動(dòng)物園跑出去的吧?第一次看到!”杭州大伯爬山途中遇見(jiàn)黃麂,動(dòng)物園回應(yīng):沒(méi)跑掉,是本土常見(jiàn)的野生動(dòng)物

“動(dòng)物園跑出去的吧?第一次看到!”杭州大伯爬山途中遇見(jiàn)黃麂,動(dòng)物園回應(yīng):沒(méi)跑掉,是本土常見(jiàn)的野生動(dòng)物

都市快報(bào)橙柿互動(dòng)
2026-01-11 20:56:56
1950年湖北土改踢到鐵板,地主拍桌子吼道:去北京打聽(tīng)打聽(tīng)我是誰(shuí)!李先念無(wú)奈撥通一個(gè)電話,對(duì)面只回了一句話,徹底安靜了

1950年湖北土改踢到鐵板,地主拍桌子吼道:去北京打聽(tīng)打聽(tīng)我是誰(shuí)!李先念無(wú)奈撥通一個(gè)電話,對(duì)面只回了一句話,徹底安靜了

源溯歷史
2026-01-05 16:24:20
中國(guó)U23男足戰(zhàn)勝澳大利亞隊(duì) 距亞洲杯出線一步之遙

中國(guó)U23男足戰(zhàn)勝澳大利亞隊(duì) 距亞洲杯出線一步之遙

極目新聞
2026-01-11 21:38:26
廣東30分大勝遼籃!徐杰破紀(jì)錄,三外援合砍71分,胡明軒僅得3分

廣東30分大勝遼籃!徐杰破紀(jì)錄,三外援合砍71分,胡明軒僅得3分

多特體育說(shuō)
2026-01-11 21:32:39
中組部、人社部發(fā)布通知

中組部、人社部發(fā)布通知

政知新媒體
2026-01-11 14:24:03
美英發(fā)出緊急警告,烏克蘭面臨巨大戰(zhàn)爭(zhēng)災(zāi)難?普京已動(dòng)用最后底牌

美英發(fā)出緊急警告,烏克蘭面臨巨大戰(zhàn)爭(zhēng)災(zāi)難?普京已動(dòng)用最后底牌

軍機(jī)Talk
2026-01-12 10:44:09
擁有400億資產(chǎn)的“黑老大”劉漢死刑后,美貌前妻楊雪下場(chǎng)如何?

擁有400億資產(chǎn)的“黑老大”劉漢死刑后,美貌前妻楊雪下場(chǎng)如何?

豐譚筆錄
2026-01-12 07:55:06
維尼修斯找回狀態(tài)難救皇馬 阿隆索帥位還穩(wěn)嗎?

維尼修斯找回狀態(tài)難救皇馬 阿隆索帥位還穩(wěn)嗎?

體壇周報(bào)
2026-01-12 11:44:13
唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

章眽八卦
2026-01-05 12:27:07
2026-01-12 12:03:00
智駕最前沿
智駕最前沿
自動(dòng)駕駛領(lǐng)域?qū)I(yè)的技術(shù)、資訊分享平臺(tái)。我們的slogan是:聚焦智能駕駛 ,緊盯行業(yè)前沿。
323文章數(shù) 11關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

媒體:美國(guó)"不演了" 特朗普直白表態(tài)震驚世界

頭條要聞

媒體:美國(guó)"不演了" 特朗普直白表態(tài)震驚世界

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

"家轎之王"變帥了 東風(fēng)日產(chǎn)全新軒逸量產(chǎn)下線

態(tài)度原創(chuàng)

手機(jī)
時(shí)尚
游戲
本地
家居

手機(jī)要聞

2026年第一款真全面屏來(lái)了!紅魔11 Air官宣

普通人就該照搬這些穿搭!衣服不用買(mǎi)太貴,自然耐看又舒適

《黑神話》再登國(guó)區(qū)暢銷榜前十!佳作熱度不減

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

家居要聞

包絡(luò)石木為生 野性舒適

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版