国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達(dá)投下自動駕駛重磅炸彈!首次開源VLA模型Alpamayo-R1

0
分享至

車東西(公眾號:chedongxi)
作者 | Janson
編輯 | 志豪

英偉達(dá)要用“因果推理”重塑L4自動駕駛?!

車東西12月3日消息,日前,英偉達(dá)(NVIDIA)研究團(tuán)隊(duì)正式發(fā)布并開源全新的視覺-語言-動作(VLA)模型Alpamayo-R1,并明確宣布計(jì)劃在未來的更新中開源該模型及部分核心數(shù)據(jù)集。


▲Alpamayo-R1對應(yīng)的數(shù)據(jù)集已上傳至開源社區(qū)

目前,該模型對應(yīng)的數(shù)據(jù)集也已上傳至開源社區(qū),總大小約100TB,這也是英偉達(dá)首次將VLA模型進(jìn)行開源。


▲Alpamayo-R1模型架構(gòu)

這一舉措不僅打破了高端自動駕駛模型的封閉高墻,更標(biāo)志著端到端自動駕駛技術(shù)從單純的“模仿行為”邁向了具備深層“因果思考”的新階段。

對于自動駕駛行業(yè)而言,Alpamayo-R1的出現(xiàn)直擊了當(dāng)前最令人頭疼的痛點(diǎn)——長尾場景(Long-tail scenarios)下的安全性。

英偉達(dá)此次帶來的 Alpamayo-R1正是為了終結(jié)這一困境,而其交出的實(shí)測成績單也足夠令人信服。


▲Alpamayo-R1相對基線的提升明顯

在針對極高難度長尾場景的測試中,AR1的規(guī)劃準(zhǔn)確率相比僅有軌跡預(yù)測的基線模型提升了整整12%;

在閉環(huán)仿真測試?yán)?,AR1成功將車輛沖出道路的事故率降低了35%;

與其他車輛或行人的近距離危險(xiǎn)遭遇率也大幅減少了25%。

更值得一提的是,即便在集成復(fù)雜的推理大腦后,該模型在NVIDIA RTX 6000 Pro Blackwell車載硬件上依然保持了99毫秒的端到端超低延遲,完全滿足了實(shí)時自動駕駛的嚴(yán)苛需求。

一、解決自動駕駛端到端黑盒問題 引入因果鏈數(shù)據(jù)集

過去幾年,基于模仿學(xué)習(xí)的端到端大模型雖然通過堆砌數(shù)據(jù)量取得了顯著進(jìn)步,但它們本質(zhì)上更像是一個只會死記硬背的“黑盒”。

這些模型能夠精準(zhǔn)模仿人類駕駛員的操作,卻缺乏對場景的因果理解。它們知道“前面有車要剎車”,卻不知道“為什么要剎車”。

這種知其然不知其所以然的缺陷,導(dǎo)致車輛在面對從未見過的高風(fēng)險(xiǎn)復(fù)雜路況時,往往表現(xiàn)脆弱,決策邏輯甚至自相矛盾。

為了讓AI真正學(xué)會像人類老司機(jī)一樣思考,英偉達(dá)并沒有選擇在現(xiàn)有模型上修修補(bǔ)補(bǔ),而是從最底層的數(shù)據(jù)構(gòu)建開始了一場革命。


▲因果鏈推理演示

為了解決傳統(tǒng)數(shù)據(jù)集中描述模糊、缺乏邏輯關(guān)聯(lián)的問題,研究團(tuán)隊(duì)構(gòu)建了一套全新的“因果鏈”(Chain of Causation, CoC)數(shù)據(jù)集。

這套數(shù)據(jù)集的核心在于教會模型建立“觀察-原因-決策”的嚴(yán)密邏輯閉環(huán)。它不再讓AI生成諸如“天氣晴朗、路面寬闊”這類無關(guān)痛癢的旁白。

在這套模型下,提示詞可明確指出“因?yàn)樽髠?cè)有車輛正在強(qiáng)行并線,且前方有行人橫穿,所以我決定減速避讓”。

這種數(shù)據(jù)構(gòu)建方式不僅消除了因果混淆,更有效提升了模型的邏輯性。

二、引入新架構(gòu) 平衡模型性能

在強(qiáng)大的數(shù)據(jù)支撐下,Alpamayo-R1采用了一種模塊化且高效的架構(gòu)設(shè)計(jì),巧妙地平衡了“慢思考”與“快行動”。

其大腦由英偉達(dá)專為物理AI打造的Cosmos-Reason視覺語言模型驅(qū)動,負(fù)責(zé)處理復(fù)雜的環(huán)境理解和邏輯推理。

而行動則交由一個基于流匹配(Flow Matching)技術(shù)的動作專家解碼器來控制。

這種分工合作的機(jī)制,讓模型既能利用大語言模型的廣博知識進(jìn)行深思熟慮,又能通過擴(kuò)散模型生成絲般順滑且符合車輛動力學(xué)的行駛軌跡,完美解決了大模型通常反應(yīng)遲鈍的弊病。

不過,真正讓Alpamayo-R1與眾不同的,是其在訓(xùn)練階段引入的強(qiáng)化學(xué)習(xí)(RL)機(jī)制。


▲推理-動作高一致性將提升獎勵

在監(jiān)督學(xué)習(xí)教會模型基本的駕駛技能后,研究人員引入了一個更為嚴(yán)苛的“判卷老師”——利用更大規(guī)模的推理模型作為批評者(Critic),對AR1的表現(xiàn)進(jìn)行打分。

這個階段的訓(xùn)練目標(biāo)非常明確——要求模型言行一致。

對此,該模型中的獎勵函數(shù)不僅看重車輛是否開得安全,更看重模型嘴上說的推理邏輯與實(shí)際做出的駕駛動作是否吻合。

如果模型推理說“因?yàn)榧t燈要停車”,但實(shí)際動作卻在加速,它就會受到嚴(yán)厲懲罰。


▲采用強(qiáng)化學(xué)習(xí)新模式后質(zhì)量顯著提升

這種訓(xùn)練方式讓AI的解釋不再是一種事后的敷衍,而是真正成為了指導(dǎo)車輛行動的決策綱領(lǐng),推理質(zhì)量因此提升了45%,推理與行動的一致性也提高了37%。

在論文的最后還有一個小彩蛋,致謝中排在第一位的正是英偉達(dá)自動駕駛負(fù)責(zé)人吳新宙。


▲吳新宙在致謝第一位

結(jié)語:英偉達(dá)首次開源VLA模型

隨著 Alpamayo-R1 的發(fā)布及后續(xù)開源計(jì)劃的推進(jìn),英偉達(dá)不僅展示了一條通往 L4 級自動駕駛的務(wù)實(shí)技術(shù)路徑,更為整個開源社區(qū)注入了強(qiáng)勁動力。

當(dāng)自動駕駛汽車開始能夠清晰地解釋自己的每一個決策邏輯時,我們距離那個真正安全、可信的自動駕駛未來,或許只剩下最后的一公里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國家全面出擊!2026年元旦起,存取現(xiàn)金將統(tǒng)一按“新規(guī)”執(zhí)行!

國家全面出擊!2026年元旦起,存取現(xiàn)金將統(tǒng)一按“新規(guī)”執(zhí)行!

今朝牛馬
2025-12-22 22:24:33
江西:堅(jiān)決擁護(hù)黨中央決定

江西:堅(jiān)決擁護(hù)黨中央決定

新京報(bào)
2025-12-22 22:37:38
克宮的期待落空!阿塞拜疆總統(tǒng)以“日程繁忙”為由缺席俄羅斯峰會

克宮的期待落空!阿塞拜疆總統(tǒng)以“日程繁忙”為由缺席俄羅斯峰會

藍(lán)色海邊
2025-12-23 12:39:14
樊振東莫雷加德歐冠首次同隊(duì)出戰(zhàn),二人巴黎奧運(yùn)會交手后曾互換球衣

樊振東莫雷加德歐冠首次同隊(duì)出戰(zhàn),二人巴黎奧運(yùn)會交手后曾互換球衣

好乒乓
2025-12-23 12:28:57
“姐姐為亡弟追兇27年”案一審宣判:被告人被判處死刑,緩期二年執(zhí)行

“姐姐為亡弟追兇27年”案一審宣判:被告人被判處死刑,緩期二年執(zhí)行

澎湃新聞
2025-12-23 10:52:26
葉選寧為何是“紅二代”里的老大哥?鄧樸方的一句評價,十分經(jīng)典

葉選寧為何是“紅二代”里的老大哥?鄧樸方的一句評價,十分經(jīng)典

素年文史
2025-12-21 16:04:03
金飾克價首破1400元

金飾克價首破1400元

第一財(cái)經(jīng)資訊
2025-12-23 12:01:58
成都23歲大學(xué)生失聯(lián)9天后遺體被發(fā)現(xiàn),警方初步判斷排除刑事案件;家屬:還不清楚兒子為什么要輕生,目前正在處理后續(xù)事宜

成都23歲大學(xué)生失聯(lián)9天后遺體被發(fā)現(xiàn),警方初步判斷排除刑事案件;家屬:還不清楚兒子為什么要輕生,目前正在處理后續(xù)事宜

揚(yáng)子晚報(bào)
2025-12-23 12:28:57
中日各方已準(zhǔn)備就緒!就等12月26日,高市早苗敢不敢去參拜神廁

中日各方已準(zhǔn)備就緒!就等12月26日,高市早苗敢不敢去參拜神廁

扶蘇聊歷史
2025-12-22 14:10:47
打臉!曼聯(lián)棄將隨那不勒斯奪意超杯后曬照:多么偉大的決定

打臉!曼聯(lián)棄將隨那不勒斯奪意超杯后曬照:多么偉大的決定

雪狼侃體育
2025-12-23 13:56:03
畫風(fēng)突變,多哈冠軍賽已不再宣傳孫穎莎,王曼昱名字成亮點(diǎn)

畫風(fēng)突變,多哈冠軍賽已不再宣傳孫穎莎,王曼昱名字成亮點(diǎn)

削桐作琴
2025-12-23 12:56:56
洪馬奈:柬埔寨如調(diào)整對華合作節(jié)奏,并獲美日的支持,可快速發(fā)展

洪馬奈:柬埔寨如調(diào)整對華合作節(jié)奏,并獲美日的支持,可快速發(fā)展

詩意世界
2025-12-22 14:17:53
胰腺癌去世的人越來越多!專家:牢記飯后4不做,飯前3不吃

胰腺癌去世的人越來越多!專家:牢記飯后4不做,飯前3不吃

岐黃傳人孫大夫
2025-12-20 11:45:03
天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

美食店主
2025-12-22 00:27:55
鄉(xiāng)道爆胎被困,救援服務(wù)讓Model Y車主直接鎖定下一臺特斯拉

鄉(xiāng)道爆胎被困,救援服務(wù)讓Model Y車主直接鎖定下一臺特斯拉

特空間
2025-12-22 12:20:39
央企“最牛女副處長”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

央企“最牛女副處長”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

西門老爹
2025-12-16 15:35:31
利物浦官方:伊薩克腳踝受傷且腓骨骨折,已經(jīng)完成手術(shù)

利物浦官方:伊薩克腳踝受傷且腓骨骨折,已經(jīng)完成手術(shù)

懂球帝
2025-12-23 05:11:56
見證一個國家的衰?。盒录悠拢隈R來泯于印度

見證一個國家的衰?。盒录悠?,生于馬來泯于印度

百味朱砂
2025-12-23 13:21:19
求助中國?哈薩克斯坦和日本簽了稀土協(xié)議后,發(fā)現(xiàn)運(yùn)輸是個大難題

求助中國?哈薩克斯坦和日本簽了稀土協(xié)議后,發(fā)現(xiàn)運(yùn)輸是個大難題

科普100克克
2025-12-22 18:05:46
合租四年的女室友,突然要辭職回家相親,我打趣說:別走了嫁給我

合租四年的女室友,突然要辭職回家相親,我打趣說:別走了嫁給我

今天說故事
2025-12-20 10:04:23
2025-12-23 14:28:52
車東西
車東西
未來汽車看這里。
5765文章數(shù) 6383關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

江蘇省委省政府成立調(diào)查組 對南京博物院開展全面調(diào)查

頭條要聞

江蘇省委省政府成立調(diào)查組 對南京博物院開展全面調(diào)查

體育要聞

用冠軍致敬迭戈時代 ”超級“那不勒斯捧杯

娛樂要聞

阿信發(fā)聲報(bào)平安,曬演唱會向F3索吻畫面

財(cái)經(jīng)要聞

直播間涉黃?快手:遭到黑灰產(chǎn)攻擊已報(bào)警

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時代

態(tài)度原創(chuàng)

旅游
親子
教育
本地
健康

旅游要聞

船營區(qū)雪季攻略(二) 城市記憶之旅

親子要聞

當(dāng)你對孩子說:這個太貴了,我們?nèi)ゾW(wǎng)上買,會有意想不到的結(jié)果

教育要聞

女兒臥室里的東西,氣得我手抖,母親失控:她才上初中啊

本地新聞

云游安徽|宣城何以動人心,百年塔影一城徽韻

這些新療法,讓化療不再那么痛苦

無障礙瀏覽 進(jìn)入關(guān)懷版