国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

小鵬加速沖向L4終局:對VLA架構「動刀」成關鍵一環(huán)

0
分享至



編輯|澤南、杜偉

兩個月前的 CES 上,黃仁勛開源了英偉達的首個 VLA(視覺 - 語言 - 動作)模型,并高調宣稱物理 AI 的「ChatGPT 時刻」馬上就要到來。

如今,物理世界的 AI 正在成為一個重要趨勢:從機器人到輔助駕駛,越來越多的公司正在嘗試用 VLA 模型來重構機器與物理世界交互的方式。

在輔助駕駛領域,端到端的 VLA 方法已經經歷了大量驗證,實現(xiàn)了前所未有的效果。然而,這種架構面臨一個天然挑戰(zhàn):作為中間層的語言難以完整準確表達現(xiàn)實物理世界的全部細節(jié)。李飛飛曾在一次訪談中表示,「語言本身只是對物理世界的一種有損表達?!?/p>

在需要實時理解環(huán)境并生成駕駛決策的自動駕駛環(huán)境中,通過語言這一中間層來描述物理世界既有可能引入信息損失,還會增加額外推理路徑。隨著駕駛場景復雜度的增加,這種架構缺陷制約了系統(tǒng)準確率與效率的繼續(xù)提升。

針對這一痛點,小鵬汽車給出的創(chuàng)新性解法是:直接去掉「語言轉譯」環(huán)節(jié),在業(yè)界首次實現(xiàn)從視覺信號到動作指令的端到端直接生成。這正是其在去年 11 月亮相的第二代 VLA(XPENG VLA 2.0),并在此后數(shù)月完成了 468 個版本更新。

新技術很快產生了質變:在 3 月 2 日舉辦的「小鵬第二代 VLA 媒體體驗日」上,何小鵬宣布,第二代 VLA 將于本月開啟推送。



人們普遍預測,2026 年將成為「物理 AI 元年」。小鵬第二代 VLA 的落地,率先給出了通向完全自動駕駛的「中國答案」。

跨代級的駕駛體驗

在實際體驗上,第二代 VLA 的提升主要體現(xiàn)在三大維度:安心絲滑、全場景能力和高效率

由于端到端模型的泛化能力,小鵬第二代 VLA 已實現(xiàn)實現(xiàn)準確識別各種異形車輛的能力。



即使是對面來車的交通事故,VLA 也能正確識別障礙物和阻礙路線的車輛,并進行實時的路徑規(guī)劃。



在安全和流暢度提升的同時,小鵬的第二代 VLA 成為了真正的「全場景輔助駕駛」,支持從停車位、P 擋的原地激活,覆蓋園區(qū)小路、鄉(xiāng)村土路及無導航道路,能夠應對小路通行、鄉(xiāng)村小路避坑等復雜場景。

在擁擠且復雜的停車場,第二代 VLA 輔助駕駛可以自動漫游一直穿行到出門,給你充分的時間設置好導航,可以開始正式的行程。



這意味著從你上車按下啟動鍵開始,AI 系統(tǒng)就能接管駕駛,真正實現(xiàn)了從家里車位到公司車位的點到點無縫銜接。何小鵬表示,全場景的輔助駕駛能力將保證在今年年內推出,在所有場景下的輔助駕駛能力都會像主干道一樣達到「99 分水平」。

第二代 VLA 的通行效率也有大幅提升,在保障安全的前提下,小鵬實測其綜合行車效率提升了 23%。在城市晚高峰的復雜路況下,其通行效率超過了傳統(tǒng)的 L2 智駕和 Robotaxi。

基于這樣的能力,第二代 VLA 的使用門檻大幅降低。何小鵬表示,好的技術一定要讓每一個人都能用起來,國民的智駕就應該像坐電梯一樣簡單,做到簡單、安全且好用。

不過,體驗上是極度的簡單好用,并不意味著技術上是在原有智駕框架上的簡單修補。小鵬第二代 VLA 背后,是底層技術架構的一次完全「推倒重來」。

重構技術底座:原生多模態(tài)物理大模型

面向 L4 的終極目標,小鵬汽車自前年開始立項,對端到端的智能駕駛進行了完全的底層重構。

為了將自動駕駛推向物理 AI 的本質,小鵬構建了全流程能力,其中第二代 VLA 是真正做好高階自動駕駛的關鍵技術底座

第二代 VLA 代表了 AI 驅動駕駛技術的一次重要架構升級,其不再像傳統(tǒng) VLA 模型那樣先通過視覺感知獲取環(huán)境信息,再將這些信息轉化為基于語言的推理過程,最終生成車輛的行動指令。

通過引入一種端到端的「視覺 - 動作」(Vision-to-Action)架構,第二代 VLA 使系統(tǒng)能夠將環(huán)境感知直接轉化為駕駛決策,提升了整體效率,并顯著加快了系統(tǒng)響應速度。

用一句話總結第二代 VLA:其以統(tǒng)一模型貫通環(huán)境感知、場景推理與行動決策,實現(xiàn)「感知 — 推理 — 行動」一體化

在感知層面,通過原生多模態(tài) Tokenizer,打破不同模態(tài)之間的壁壘,實現(xiàn)了視覺、語音、文本等的統(tǒng)一編碼與融合,對物理世界形成了統(tǒng)一的理解。

在推理層面,引入超密集的視覺思維鏈(Visual CoT),能夠對復雜場景進行更高效視覺推理,相較于傳統(tǒng) CoT 推理效率提升約 32 倍。同時相較傳統(tǒng) CoT 預測誤差降低 33%,提升系統(tǒng)對復雜駕駛環(huán)境的理解與決策判斷。

在行動層面,直接生成多模態(tài)輸出,包括語音、視覺反饋以及具體動作和行為。



小鵬通用智能中心負責人劉先明

不僅如此,小鵬汽車還聯(lián)合北京大學提出了一種全新的視覺 token 剪枝框架FastDriveVLA,它能讓 AI 像人類司機一樣,在復雜路況下自動忽略路邊的廣告牌和無關風景,只盯著核心路況。

通過讓 AI 只專注有用的核心信息而忽略無用信息,該框架高效解決了自動駕駛模型 VLA 在處理高幀率圖像時帶來的超高計算量問題。相關論文已被 AI 頂會 AAAI 2026 接收。



論文地址:https://arxiv.org/pdf/2507.23318

當然,構建出強大的 AI 底座僅僅是第一步。在高度復雜的物理世界中,面向 L4 級的輔助駕駛,還必須依托于另外幾個核心要素。

能力公式重構:模型 × 算力 × 數(shù)據(jù) × 本體

小鵬提出:第二代 VLA 的突破并非單點能力升級,而是遵循 L4 能力等于「模型 × 算力 × 數(shù)據(jù) × 本體」的 Scaling Laws(規(guī)模法則)

正如前沿 AI 技術應用不斷驗證的那樣,單純堆疊通用芯片算力或一味追求龐大的模型參數(shù),往往會在實際部署時遭遇瓶頸。真正的能力護城河,必須是算法、底層硬件架構與海量數(shù)據(jù)的深度耦合。

在自動駕駛這個頂級 AI 工程問題上,要想實現(xiàn)真正的 L4 級自動駕駛,僅靠單一的算法模型突破是遠遠不夠的。系統(tǒng)必須依托車輛這個「物理本體」,在模型、算力和數(shù)據(jù)三個維度實現(xiàn)高度協(xié)同。

這是一條難而正確的路。

在這其中,既包含了理解真實世界的基礎:原生多模態(tài)大模型。正如上文所述,小鵬的基座模型實現(xiàn)「看、聽、讀」的感官合一,將感知理解、場景推理、行動執(zhí)行統(tǒng)一到同一模型框架中。



同時也包含了高度優(yōu)化的軟硬件協(xié)同,利用有效算力打開智能的上限

小鵬在底層算力架構上進行了深度定制。依靠自研的圖靈芯片,小鵬實現(xiàn)了「芯片 - 編譯器 - 模型」的聯(lián)合優(yōu)化研發(fā)。通過專門開發(fā)的自動化編譯器和基于芯片定制化的圖靈結構模型,小鵬最大化了算力的利用率,使得模型在車端的運行速度飆升了 12 倍。



這種深度的軟硬件一體化設計,正是第二代 VLA 能夠實時處理海量視覺信息的底氣。

在訓練 AI 的過程中,還必須構筑起數(shù)據(jù)飛輪,讓視覺數(shù)據(jù)的高信息密度價值得以充分釋放。

一個值得關注的對比是:當前國內所有數(shù)字 AI(主要是各類大語言模型)的日調用量大約為 0.737 萬億 Token,而小鵬僅僅 20 萬輛搭載第二代 VLA Ultra 的車輛,每天在車端模型上消耗的物理 AI Token 量就高達 58.8 萬億 —— 小鵬車端模型每天消耗的 Token,是全國數(shù)字 AI 日調用量的近 80 倍。

目前,小鵬已經積累了超過 50PB 的訓練數(shù)據(jù),小鵬車端的高清傳感器每秒要處理高達 53 億字節(jié)的視覺數(shù)據(jù)。

最后,這一切都需要依托強大的 AI Infra,再通過世界模型的仿真訓練實現(xiàn)閉環(huán)。

依托領先的 AI 基礎設施,自去年科技日以來,小鵬在半年內完成了 468 個模型的版本迭代。

此外為了應對現(xiàn)實世界中難以窮盡的 Corner Case,小鵬引入了世界模型進行閉環(huán)仿真。如今,其仿真場景庫已從一年前的 3 萬個激增至 50 多萬個,每天在虛擬世界中進行基于強化學習的「自我對弈」,日均仿真測試里程等效于 3000 萬公里的實車測試。



可以說,小鵬第二代 VLA 是一個基于端到端 AI 算法、定制芯片高度整合,由海量數(shù)據(jù)和世界模型知識共同構建的超級物理 AI 生命體。

結語

隨著新一代 VLA 智能駕駛的出現(xiàn),物理 AI 的實力正在逐漸展現(xiàn)。



何小鵬表示,基于端到端模型的輔助駕駛能力將會成為汽車行業(yè)未來三年的重要突破,它是面向完全自動駕駛的第一個版本。在小鵬內部,該技術正在以前所未有的速度迭代。

對于一家車企而言,第二代 VLA 是小鵬在自動駕駛技術路徑上的一次重要探索:不同于傳統(tǒng)駕駛系統(tǒng)各個模塊(如感知、規(guī)劃、控制)逐一優(yōu)化的工程化思路,其圍繞自研基座模型打造統(tǒng)一的物理世界智能系統(tǒng),從而具備理解真實世界并持續(xù)學習、演進的能力。

隨著自動駕駛技術加速邁向 AI 驅動的智能時代,這種技術體系勢必成為其在下一階段競爭中爭奪主動權的關鍵變量。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
名場面!烏克蘭大使公開拒吊唁伊朗高層,字字戳心撕破偽善面具

名場面!烏克蘭大使公開拒吊唁伊朗高層,字字戳心撕破偽善面具

老馬拉車莫少裝
2026-03-06 13:45:05
玩死10只馴出1只!2014年,四川男子兩天抓14只,被判14年

玩死10只馴出1只!2014年,四川男子兩天抓14只,被判14年

萬象硬核本尊
2026-03-06 18:04:27
哈佛大學:一個人的命運,決定于晚上8點到10點之間

哈佛大學:一個人的命運,決定于晚上8點到10點之間

洞見
2026-03-06 21:37:47
朝鮮公開軍隊冬訓畫面,網友:現(xiàn)代化軍事戰(zhàn)爭搞這有啥用?

朝鮮公開軍隊冬訓畫面,網友:現(xiàn)代化軍事戰(zhàn)爭搞這有啥用?

映射生活的身影
2026-03-07 02:12:00
4家企業(yè)同時被查,中標后故意放軍隊鴿子,背后有什么隱情?

4家企業(yè)同時被查,中標后故意放軍隊鴿子,背后有什么隱情?

古史青云啊
2026-03-06 10:05:40
陳永貴副手郭鳳蓮的現(xiàn)狀:兒子都是億萬富翁,大兒子掏3000萬修廟

陳永貴副手郭鳳蓮的現(xiàn)狀:兒子都是億萬富翁,大兒子掏3000萬修廟

兵鑒史
2026-03-07 02:19:39
獨家掃描141個OpenClaw 項目,賺最多錢的不是做AI的

獨家掃描141個OpenClaw 項目,賺最多錢的不是做AI的

王煜全
2026-03-07 06:31:17
“油耗子”越南付出代價,盜挖中國石油數(shù)十年,最終付出慘痛代價

“油耗子”越南付出代價,盜挖中國石油數(shù)十年,最終付出慘痛代價

早起的鳥兒有飯吃
2026-03-07 13:59:51
3月7日,人社部發(fā)布重要消息,是否有2026年養(yǎng)老金調整最新消息?

3月7日,人社部發(fā)布重要消息,是否有2026年養(yǎng)老金調整最新消息?

虎哥閑聊
2026-03-07 14:50:23
上海高工母親與未婚碩士女兒同患阿爾茨海默??!百萬房貸要還,唯一監(jiān)護人失聯(lián),保姆苦苦支撐

上海高工母親與未婚碩士女兒同患阿爾茨海默??!百萬房貸要還,唯一監(jiān)護人失聯(lián),保姆苦苦支撐

新民晚報
2026-03-07 09:38:02
霍爾木茲海峽關閉“打崩”日韓股市,韓國暴力救市 專家:社會信心恢復需要時間

霍爾木茲海峽關閉“打崩”日韓股市,韓國暴力救市 專家:社會信心恢復需要時間

紅星新聞
2026-03-07 16:54:16
下一周(3.9)持有這些個股的要小心了!(附個股)

下一周(3.9)持有這些個股的要小心了?。ǜ絺€股)

股市皆大事
2026-03-07 14:23:53
泰山3-0大勝鐵人!場上數(shù)據(jù)一目了然,不是謝文能,頭號功臣是他

泰山3-0大勝鐵人!場上數(shù)據(jù)一目了然,不是謝文能,頭號功臣是他

球場沒跑道
2026-03-07 17:33:05
李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

西樓知趣雜談
2026-02-28 21:36:48
伊朗多地爆發(fā)抗議活動 哈梅內伊告別儀式被推遲

伊朗多地爆發(fā)抗議活動 哈梅內伊告別儀式被推遲

看看新聞Knews
2026-03-04 20:42:20
調倉!牛市或重演歷史

調倉!牛市或重演歷史

郭小凡財經
2026-03-05 12:54:07
安徽女大學生睡夢中去世!死因曝光太離譜,男友自責長跪靈堂不起

安徽女大學生睡夢中去世!死因曝光太離譜,男友自責長跪靈堂不起

李橑在北漂
2026-03-06 16:44:26
文旅部部長:外國游客來華都說“你好”不再用“Hello”,喝開水吃火鍋成體驗中國生活標配

文旅部部長:外國游客來華都說“你好”不再用“Hello”,喝開水吃火鍋成體驗中國生活標配

極目新聞
2026-03-07 12:57:58
萬萬沒想到!兩會最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動

萬萬沒想到!兩會最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動

查爾菲的筆記
2026-03-05 20:24:50
西貝的情況已經挺危險了

西貝的情況已經挺危險了

蔚然未來消費
2026-03-07 08:32:52
2026-03-07 18:28:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12430文章數(shù) 142578關注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

頭條要聞

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

周杰倫田馥甄的“JH戀” 被扒得底朝天

財經要聞

針對"不敢休、不讓休"怪圈 國家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

藝術
數(shù)碼
健康
旅游
手機

藝術要聞

《圣教序》真跡終于找到!1903字清晰無損

數(shù)碼要聞

AI存儲需求進一步增長,三星NAND閃存被曝Q2將繼續(xù)漲價

轉頭就暈的耳石癥,能開車上班嗎?

旅游要聞

哈尼梯田水滿田疇 游客盡享“天空之鏡”

手機要聞

vivo X300 Max手機原型曝光:預估6.78英寸屏幕、7000mAh電池

無障礙瀏覽 進入關懷版