国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

警惕VLA“泡沫”,VLA只是錦上添花,并不是“萬能鑰匙”

0
分享至

就在VLA被推上“神壇”之際,博世智能駕控中國區(qū)總裁吳永橋給VLA潑了一盆涼水。剛剛結(jié)束的2025世界人工智能大會(WAIC)上,吳永橋提出了一個反共識的觀點:VLA短期內(nèi)難以落地,仍需攻克多維難題。

其實2024年就有企業(yè)提及VLA的概念,2025年以來,VLA開始被行業(yè)大肆鼓吹。語音、手勢、甚至表情控制智駕系統(tǒng),VLA被描繪得無所不能。這個原本在具身智能機器人領(lǐng)域廣泛討論的技術(shù)被移植到了自動駕駛。但在吳永橋看來,行業(yè)對VLA的癡迷太過急于求成。他提到VLA當下存在很多問題(引號內(nèi)為吳永橋原話):

“首先,多模態(tài)大模型的特征對齊很難實現(xiàn)(視覺、語言、動作)”;

這里的多模態(tài)特征對齊指的是將不同模態(tài)(如圖像、文本、音頻等)的特征映射到統(tǒng)一的語義空間,從而實現(xiàn)跨模態(tài)信息的有效融合與理解。這種技術(shù)在多模態(tài)學(xué)習(xí)中扮演著“橋梁”的角色,使得不同模態(tài)的數(shù)據(jù)能夠協(xié)同工作,提升模型的智能表現(xiàn)。

“其次,多模態(tài)的數(shù)據(jù)獲取和訓(xùn)練也十分困難。”

按照不少車企的宣傳話術(shù),VLA可以實現(xiàn)語音識別,手勢識別,甚至眼神識別等,但是這些數(shù)據(jù)從哪來,沒有足夠多的實際數(shù)據(jù)作為支撐如何保證絲滑體驗。

“最重要的一點,VLA模型要部署在智駕芯片上,才能實現(xiàn)行車安全以及駕駛高度擬人化,模型規(guī)模必須要做到7B-10B左右。但目前市面上幾乎所有的三方智駕芯片都不是專為大模型的計算而設(shè)計的,帶寬相對較小,僅3B的模型布置在Thor芯片,頻率很難做到10赫茲?!?/p>

這里其實提到了3個問題,首先是參數(shù)量的問題,目前行業(yè)主流的車端VLA模型參數(shù)差不多在2B左右,企業(yè)披露的最高是4B。跟吳永橋說的10B(100億)差距甚遠。

聚焦VLA的企業(yè)首先要解決的就是量的問題。目前看來沒有任何一家企業(yè)能夠達到這個數(shù)據(jù)量,而且短期內(nèi)很難速成,只能靠賣車一點點積累。

另外一個就是芯片問題。芯片硬件的設(shè)計要提前預(yù)判幾年后的軟件趨勢。VLA是最近1年才流行起來的說法,而目前主流的芯片都是至少3年前就開始立項開發(fā),并不是專門針對大模型參數(shù)設(shè)計,這就存在吳永橋提到的帶寬問題。就是芯片在一定時間內(nèi)能夠傳輸?shù)臄?shù)據(jù)量。是數(shù)據(jù)傳輸率的一個重要指標,表示在傳輸管道中可以傳遞數(shù)據(jù)的能力。大家可以換一個蓄水池的角度理解或許更形象,就是在一個足夠大的蓄水池里,但是出水口徑只有2cm,效率其實是非常低的。

有技術(shù)預(yù)判的企業(yè)肯定意識到了這個問題,為了支持大參數(shù)量,車企們的策略是自研芯片,小鵬和蔚來已經(jīng)上車,但效果怎么樣還是未知數(shù)。但其實還是繞不開那個問題,這幾家企業(yè)芯片立項的時間都比較早,能考慮到多大的硬件極限也不清楚。

再有就是刷新頻率。就是系統(tǒng)對外部輸入信息的實時更新,按照吳永橋的說法,現(xiàn)在的模型刷新頻率都很難達到VLA需要的10赫茲。也有企業(yè)說達到了這個數(shù)據(jù)。

最后,吳永橋給了一個結(jié)論,可能要在3-5年之后,有了真正能跑大模型的芯片,才能支持VLA落地。博世并不否認VLA的價值,但是當下,吳永橋認為一段式端到端更有意義。只有將一段式端到端打磨到極致的性能,才能帶來高度擬人化、絲滑的智駕產(chǎn)品。(當然他說的應(yīng)該是當下最好的產(chǎn)品)

無獨有偶,博世并不是唯一一個提醒大家保持冷靜的人。技術(shù)控曹旭東對VLA的態(tài)度更克制。上海車展期間,Momenta創(chuàng)始人曹旭東在接受騰訊汽車采訪時也提到了相同的觀點。(引號部分為曹旭東原話)

“VLM(Visual-Language Model,視覺語言模型)、VLA(Vision-Language-Action Model,視覺語言行動模型)是很好的方向,但在我看來是錦上添花的方向,在技術(shù)實現(xiàn)上其實沒那么難。它可能對自動駕駛系統(tǒng)上限,或者系統(tǒng)安全性來說,會有少則三五倍、多則五到十倍的提升,但這個提升對實現(xiàn)規(guī)模化L4是遠遠不夠的,規(guī)?;疞4至少是100倍到1000倍的提升才有可能實現(xiàn)。”

這里曹旭東表達了3個意思:1、VLA是一個不錯的方向;2、技術(shù)難度并不高;3、對系統(tǒng)安全的性能提升有限,最多5-10倍,這個提升對L4規(guī)模化遠遠不夠。

這個可以順著他的意思把其中的邏輯給拆解一下,第一點他說VLA是一個很好的方向,但并沒有強調(diào)VLA的唯一性,這和不少企業(yè)將VLA宣傳成自動駕駛的必須且唯一解有本質(zhì)區(qū)別。

后面2點,曹旭東解釋自動駕駛本身就是一個vision action(視覺-行動)的東西,把語言加進去,相當于加了一個信息輸入而已,技術(shù)難度并不高,而且加入一個信息元素系統(tǒng)安全也很難提升100到1000倍。

“我們認為提升要用強化學(xué)習(xí),把端到端大模型放到通過海量真實數(shù)據(jù)構(gòu)建起來的仿真環(huán)境去做探索,成功就給獎勵,失敗就給懲罰,這個模型就能夠?qū)W習(xí)到什么是安全駕駛、高效駕駛的概念。這種能力是能夠把模型的上限和安全的上限、下限提升100到1000倍,甚至1000到10000倍都是可以的。”

和吳永橋一樣,曹旭東也認為,要保證優(yōu)質(zhì)的自動駕駛體驗,將端到端與強化學(xué)習(xí)結(jié)合是更靠譜的方案。

相較于這些概念性的東西。曹旭東更強調(diào)自動駕駛本源的三要素:模型、數(shù)據(jù)、算法。他認為,模型設(shè)計的上限決定了系統(tǒng)學(xué)習(xí)能力的上限。如果模型設(shè)計的不好,給他再多的數(shù)據(jù)也學(xué)不會。就像老鼠的腦結(jié)構(gòu)不可能超越人類。

順著這個思路再往下走,VLA只是一種“視覺-語言-行為”模型,證明它可以在一個模型里處理這些信息,但處理的好不好是另一回事。如果按照老鼠,猴子,猩猩,人類腦結(jié)構(gòu)來劃分,不同物種有不同的VLA結(jié)構(gòu)。其實又回到了模型設(shè)計的問題,然后通過大數(shù)據(jù)喂養(yǎng)和強化學(xué)習(xí)訓(xùn)練在生成一個好的模型。而且還有一個核心的問題,目前最好的模型是什么人類無法提前預(yù)知,只能先搭建,然后用數(shù)據(jù)去試。

如果我們把視角再往前推會發(fā)現(xiàn)一個非常有意思的事情,大概1年前整個行業(yè)將端到端推上神壇,一體化架構(gòu)、自主學(xué)習(xí)……各種花里胡哨的名詞,仿佛有了端到端就無所不能。結(jié)果僅僅一年時間,端到端還沒成熟,新的VLA技術(shù)又粉墨登場,被大肆宣揚。

慶幸的是,在所有人都被流量裹挾時被總有人發(fā)出不一樣的聲音。就像當年端到端大火的時候,所有人提起端到端都兩眼放光,前圖森未來創(chuàng)始人侯曉迪給端到端破了一盆冷水,他認為端到端只是人工智能里很平常的一項技術(shù),提醒行業(yè)不要過分神化,有了端到端也未必能解決所有問題。站在今天的視角來看,端到端已經(jīng)從成了大家口中的牛夫人,VLA才是當下的小甜甜,但是這股風(fēng)到底會持續(xù)多久誰也不知道。明年會不會又有什么新的技術(shù)名詞出現(xiàn)呢?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

股經(jīng)縱橫談
2026-03-16 21:56:42
AI“搶飯碗”,硅谷大裁員!一線工程師戳破真相:AI效率被嚴重高估,人類被倒逼成審核員,工作量是過去10倍

AI“搶飯碗”,硅谷大裁員!一線工程師戳破真相:AI效率被嚴重高估,人類被倒逼成審核員,工作量是過去10倍

華爾街見聞官方
2026-03-25 23:20:49
考研導(dǎo)師張雪峰因跑步心臟聚停離世?網(wǎng)傳特殊治療知情同意書也被流傳出。

考研導(dǎo)師張雪峰因跑步心臟聚停離世?網(wǎng)傳特殊治療知情同意書也被流傳出。

貼小君
2026-03-24 20:41:23
中日破裂,這是53年來對日最強硬的外交表態(tài)!

中日破裂,這是53年來對日最強硬的外交表態(tài)!

見聞致
2025-11-15 21:21:56
震驚!河北35歲女子征婚,不上班不做飯,要求每個月給一萬生活費

震驚!河北35歲女子征婚,不上班不做飯,要求每個月給一萬生活費

火山詩話
2026-03-23 07:28:09
蘋果突然官宣:6月9日,大量新品發(fā)布

蘋果突然官宣:6月9日,大量新品發(fā)布

3C毒物
2026-03-25 00:07:57
出大事了,以高官公然宣告一件事,國際社會鬧翻天,歐盟連夜救場

出大事了,以高官公然宣告一件事,國際社會鬧翻天,歐盟連夜救場

溫讀史
2026-03-25 18:26:52
陳寶國近況令人揪心!發(fā)福顯老像80歲,獨子43歲不婚成心病

陳寶國近況令人揪心!發(fā)福顯老像80歲,獨子43歲不婚成心病

娛小余
2026-03-24 20:58:07
又一次被火箭二隊打爆了!昔日籃網(wǎng)首輪秀在雷霆二隊也要被淘汰了

又一次被火箭二隊打爆了!昔日籃網(wǎng)首輪秀在雷霆二隊也要被淘汰了

稻谷與小麥
2026-03-26 01:50:14
濰坊一商場外火壺表演者服飾被意外引燃,急忙脫衣滾地滅火,商場:表演已暫停

濰坊一商場外火壺表演者服飾被意外引燃,急忙脫衣滾地滅火,商場:表演已暫停

極目新聞
2026-03-25 18:22:53
大冰悼念張雪峰的方式很特別

大冰悼念張雪峰的方式很特別

皮蛋兒電影
2026-03-25 18:48:41
離譜!皇馬隊醫(yī)坑完姆巴佩坑卡馬文加,前員工曝其用ChatGPT開藥

離譜!皇馬隊醫(yī)坑完姆巴佩坑卡馬文加,前員工曝其用ChatGPT開藥

仰臥撐FTUer
2026-03-26 08:02:05
上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

李昕言溫度空間
2026-03-19 22:56:18
特朗普:赫格塞思對和解不感興趣,只想打仗

特朗普:赫格塞思對和解不感興趣,只想打仗

觀察者網(wǎng)
2026-03-25 09:19:14
英媒:沙特公投基金無意出售紐卡,賽季結(jié)束后再進行統(tǒng)一復(fù)盤

英媒:沙特公投基金無意出售紐卡,賽季結(jié)束后再進行統(tǒng)一復(fù)盤

懂球帝
2026-03-25 16:18:38
2026,離職潮徹底消失了。

2026,離職潮徹底消失了。

老陸不老
2026-03-18 12:53:10
笑著告別觀眾,轉(zhuǎn)身去蹲3年半!2.3億被沒收,蔡正元藏著太多故事

笑著告別觀眾,轉(zhuǎn)身去蹲3年半!2.3億被沒收,蔡正元藏著太多故事

行者聊官
2026-03-20 17:40:44
20分32分42分!上海全員殺瘋,一夜爆3門慘案,3-12名亂成一鍋粥

20分32分42分!上海全員殺瘋,一夜爆3門慘案,3-12名亂成一鍋粥

后仰大風(fēng)車
2026-03-26 06:05:05
據(jù)報:伊朗最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊同意與美國進行談判并達成協(xié)議

據(jù)報:伊朗最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊同意與美國進行談判并達成協(xié)議

紫京講談
2026-03-26 01:39:04
張雪峰去世,他留下的10條志愿鐵律,2026高考、考研依然封神

張雪峰去世,他留下的10條志愿鐵律,2026高考、考研依然封神

寒律
2026-03-25 09:53:30
2026-03-26 08:20:49
圓周智行
圓周智行
智能出行產(chǎn)業(yè)科技研究院
160文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關(guān)停

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現(xiàn)場畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現(xiàn)場畫面披露

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

教育
家居
健康
旅游
手機

教育要聞

中考數(shù)學(xué),幾何求面積,學(xué)霸的方法想不到

家居要聞

輕奢堇天府 小資情調(diào)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

旅游要聞

風(fēng)?吹?麥?浪?正出片!

手機要聞

realme真我GT8 Pro適配Android 17開發(fā)者預(yù)覽版教程說明發(fā)布

無障礙瀏覽 進入關(guān)懷版