国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智駕大模型的「隱形戰(zhàn)場」:當(dāng)GPU堆不動了,行業(yè)拼什么?

0
分享至

作者 | 本一

編輯 | 德新

過去兩年,隨著大模型的發(fā)展,智駕行業(yè)行業(yè)似乎進(jìn)入一場“軍備競賽”。從大規(guī)模裝車量產(chǎn),采集數(shù)據(jù)喂養(yǎng)模型迭代,“算力”成為一段時間內(nèi)主機(jī)廠們關(guān)注的焦點,行業(yè)甚至有「千卡是門檻,萬卡是入場券」的說法。

從 BEV+Transformer 到端到端,再到如今大熱的 VLA(視覺-語言-動作)模型,參數(shù)量指數(shù)級膨脹,讓整個行業(yè)陷入了一種“囤卡狂熱”。

仿佛只要堆砌了足夠的 H100 或 H800,L3 甚至 L4 級別的自動駕駛能力就會在 Scaling Law 的魔法下,自動涌現(xiàn)。

在前不久的 2025 龍蜥操作系統(tǒng)大會(OAC)自動駕駛分論壇上,我們聽到了一些冷靜得近乎“潑冷水”的聲音。

主持人在圓桌討論的時候提到一個很有意思的事情:

之前微軟 CEO 薩提亞·納德拉在接受采訪的時候就感慨過,即便擁有大量的 GPU,也面臨著缺乏足夠的物理基礎(chǔ)設(shè)施(如機(jī)柜與電力環(huán)境)來安置它們的尷尬境地。

這也折射出了智駕行業(yè)一個被長期掩蓋的痛點:單純依靠堆砌 GPU,想“大力出奇跡”的模式,正在撞上一堵「物理現(xiàn)實與經(jīng)濟(jì)成本」的墻。

當(dāng)行業(yè)的焦點都集中在英偉達(dá)、華為昇騰這些臺前的“算力卡”上時,一場關(guān)于操作系統(tǒng)、基礎(chǔ)軟件與異構(gòu)計算的“隱形戰(zhàn)爭”早已在水面下打響。

阿里云副總裁李俊平在開場致辭中提出了一個公式:AI 的效能 = 數(shù)據(jù)(燃料)× 模型(引擎)× 軟件(油門和方向盤)。

今天的智駕競爭,正在從單一的模型之爭,演變?yōu)檫@三者乘積效應(yīng)的系統(tǒng)工程對抗。


圖片來源:龍蜥社區(qū)(OpenAnolis)

一、這屆智駕,被“數(shù)據(jù)搬運”卡脖子

“談卡傷感情,沒卡沒感情?!边@是前兩年智駕圈的真實寫照。但到了 2025 年,很多車企發(fā)現(xiàn),即便斥巨資買來了卡,訓(xùn)練效率卻并沒有線性增長。

問題出在哪?GPU 在“偷懶”。

這其實不是什么硬件故障,而是數(shù)據(jù)“喂”得不夠快。

智駕研發(fā)并非只有模型訓(xùn)練這一個環(huán)節(jié),它是一個包含數(shù)據(jù)采集、清洗、標(biāo)注、挖掘、訓(xùn)練、仿真到端側(cè)部署的一條長長的數(shù)據(jù)閉環(huán)。


圖片來源:龍蜥社區(qū)(OpenAnolis)

阿里云智能集團(tuán)高級架構(gòu)師張先國分享了一組數(shù)據(jù):智駕研發(fā)團(tuán)隊,云端存儲的數(shù)據(jù)總量通常已達(dá)到 400PB 到 800PB,日增量在 1PB 以上。一個智駕企業(yè)同時進(jìn)行多個模型訓(xùn)練,消耗的算力經(jīng)常需要萬卡以上。

想象一下,GPU 就像是一臺擁有 F1 引擎的賽車,但如果給它輸油的管子(I/O帶寬)只有吸管那么細(xì),引擎空轉(zhuǎn)就在所難免。


圖片來源:龍蜥社區(qū)(OpenAnolis)

在龍蜥大會的現(xiàn)場,多位專家指出了“數(shù)據(jù)閉環(huán)”中存在的隱形關(guān)卡:

一個是數(shù)據(jù)加載的問題。訓(xùn)練開始前,海量的小文件(圖片、標(biāo)注信息)需要從存儲層搬運到計算層。另一個是預(yù)處理可能遭受的瓶頸:視頻需要抽幀、解碼、清洗,訓(xùn)練集群就在那里,但數(shù)據(jù)卡在緩存層過不來,GPU 只能閑置等待。


圖片來源:龍蜥社區(qū)(OpenAnolis)

阿里云產(chǎn)品專家錢君在演講中提到,為了解決這個問題,行業(yè)正在把目光投向存儲與操作系統(tǒng)的底層優(yōu)化。

例如,龍蜥操作系統(tǒng)(OpenAnolis)給出的方案是全鏈路的“疏通”:針對 CPFS(并行文件系統(tǒng)),龍蜥在 OS 層面進(jìn)行了深度適配。緩存寫場景下的性能可以直接提升 10 倍。這意味著模型訓(xùn)練中的 Checkpoint 保存時間大幅縮短:以前需要幾小時,現(xiàn)在幾十分鐘就能搞定。

這種“看不見”的基礎(chǔ)設(shè)施優(yōu)化,雖然沒有新開發(fā)一個大模型那么性感,但它決定了生產(chǎn)智能的效率和成本,是讓萬卡集群真正跑滿的關(guān)鍵。


圖片來源:龍蜥社區(qū)(OpenAnolis)

二、CPU :被忽視的“異構(gòu)協(xié)同”

在智駕的模型訓(xùn)練中,公眾通常認(rèn)為關(guān)鍵的算力在于 GPU;但在本屆大會上,“CPU的挖掘”成為當(dāng)下的新共識。

“不能只關(guān)注 GPU,CPU 在數(shù)據(jù)預(yù)處理、存儲 I/O 及邏輯控制中扮演著關(guān)鍵角色。” 中興通訊操作系統(tǒng)產(chǎn)品副總經(jīng)理胡沖在圓桌討論中直言。

事實上,在視頻轉(zhuǎn)圖片(抽幀)、數(shù)據(jù)清洗、以及 Spark 大數(shù)據(jù)分析環(huán)節(jié),CPU 才是主力軍。而且,隨著架構(gòu)的演進(jìn),Arm 架構(gòu)的服務(wù)器 CPU(例如如阿里云倚天 710 )正在展現(xiàn)出獨特的優(yōu)勢。

安謀科技(Arm China)云人工智能事業(yè)部總監(jiān)侯科鑫女士,在演講中向現(xiàn)場觀眾展示了數(shù)據(jù)中心架構(gòu)的演進(jìn)邏輯:隨著 NVIDIA Grace Hopper 異構(gòu)加速平臺的推出,CPU 與 GPU 的“緊密協(xié)同處理”已成為行業(yè)明確的發(fā)展方向。


圖片來源:龍蜥社區(qū)(OpenAnolis)

為什么要協(xié)同?是為了打破“內(nèi)存墻”。

“視頻處理并不是簡單的計算,它對高負(fù)載下算力要求極高。”張先國指出。

智駕訓(xùn)練需要把每秒視頻抽幀為 8-32 張圖片,在視頻解碼計算(如 H.264/H.265 格式)的高并發(fā)場景下,傳統(tǒng)的 x86 架構(gòu),由于睿頻(超線程)機(jī)制和功耗墻的存在,在高負(fù)載下往往會降頻。

而張先國分享的實測數(shù)據(jù)顯示,Arm 架構(gòu)處理器憑借更多的物理核和大緩存(L1/L2 Cache),在智駕數(shù)據(jù)處理場景下表現(xiàn)驚人:

首先是視頻抽幀,性能比傳統(tǒng) x86 提升約 20%,成本卻降低了 20%-30%;

大數(shù)據(jù)清洗方面,由于擁有更大的 Cache(緩存),數(shù)據(jù) Miss 率極低,這意味著 CPU 不需要頻繁地去內(nèi)存“搬磚”,從而使端到端性能提升了 30%,在部分場景下甚至實現(xiàn)了翻倍。


圖片來源:龍蜥社區(qū)(OpenAnolis)

一個高效的智駕云端底座,必須是 CPU 與 GPU “各司其職、緊密抱團(tuán)”的異構(gòu)系統(tǒng)。

侯科鑫還從更宏觀的維度講述了硬件底座的變遷。她指出,為了打破“內(nèi)存墻”和功耗瓶頸,數(shù)據(jù)中心正在從通用服務(wù)器向“定制化 SoC + Chiplet”演進(jìn)。

NVIDIA 的 Grace Hopper 平臺就是典型案例——通過將 Arm 架構(gòu) CPU 與 Hopper GPU 緊密互聯(lián),實現(xiàn)內(nèi)存共享,極大降低了數(shù)據(jù)搬運的延遲。這種 CPU 與 GPU 緊密協(xié)作的架構(gòu),正是為了解決單一算力無法應(yīng)對復(fù)雜數(shù)據(jù)流的困境。Arm 推出的 Total Design 生態(tài)和 Neoverse CSS,正是以推動異構(gòu)計算規(guī)模化落地為核心目標(biāo),讓芯片設(shè)計公司能節(jié)省大量工程投入,快速構(gòu)建這種異構(gòu)計算的「高速公路」。


圖片來源:NVIDIA

三、基礎(chǔ)軟件的魔法:不堆卡也能讓訓(xùn)練變得更快

摩爾定律在放緩,硬件的紅利正在吃緊。這時候,軟件工程的價值就被進(jìn)一步放大了。

阿里云智能集團(tuán)編譯器技術(shù)總監(jiān)李三紅在圓桌環(huán)節(jié)提到了一個非常典型的矛盾:模型開發(fā)者的“爽”和底層工程師的“痛”。


圖片來源:龍蜥社區(qū)(OpenAnolis)

算法工程師喜歡用 PyTorch 的 Eager 模式,因為這樣寫代碼像寫 Python 一樣靈活,所見即所得;但這種模式對底層硬件極其不友好,運行效率低。而底層工程師希望用 Compile 模式,把代碼編譯成極致優(yōu)化的機(jī)器碼,但這又要求上層改代碼,門檻極高。

“上層的模型開發(fā)者追求開發(fā)效率(Eager Mode),底層的 Infra 追求成本和性能,這中間的 Gap(鴻溝),就是基礎(chǔ)軟件的機(jī)會。” 阿里云智能集團(tuán)編譯器技術(shù)總監(jiān)李三紅在圓桌討論中一針見血地指出。

針對如何填補這一鴻溝的問題,阿里云智能集團(tuán)產(chǎn)品專家錢君與高級架構(gòu)師張先國在隨后的演講中展示了龍蜥操作系統(tǒng)(OpenAnolis)如何通過全鏈路優(yōu)化,在不改變硬件的情況下“白撿”性能

存儲加速(IO 吞吐): 針對 CPFS(并行文件系統(tǒng)),系統(tǒng)在 OS 層面進(jìn)行了深度適配。錢君披露的數(shù)據(jù)顯示,在緩存寫場景下,性能提升了驚人的 10 倍。這意味著模型訓(xùn)練中的 Checkpoint 保存時間大幅縮短,斷點續(xù)訓(xùn)不再是噩夢。

網(wǎng)絡(luò)加速(打破 TCP 限制): 張先國指出,通過部署自研的 eRDMA 協(xié)議,相比傳統(tǒng) TCP,延遲降低 3 倍,帶寬提升 4 倍(實測可達(dá) 18GB/s)。這讓數(shù)據(jù)在節(jié)點間的跳躍如同在本地總線般順滑。

編譯器優(yōu)化(榨干每一滴算力): 針對 PyTorch 等框架的運行效率痛點,利用 AI Compiler 進(jìn)行算子融合。據(jù)錢君介紹,這套方案在部分通用模型上帶來了接近 100% 的性能提升,有效地解決了開發(fā)靈活性與運行效率不可兼得的難題。


圖片來源:龍蜥社區(qū)(OpenAnolis)

效果有多明顯?

地平線和小鵬汽車的案例顯示,通過這一套“操作系統(tǒng)+編譯器+調(diào)度”的組合拳,部分場景下的性能提升可達(dá) 30% 甚至 100%,而成本卻能下降 20%-60%。

在「降本增效」成為汽車產(chǎn)業(yè)主旋律的 2025 年,這種來自基礎(chǔ)軟件的“軟實力”,比盲目堆更多的卡,更有性價比。

四、眺望未來:世界模型與“合成數(shù)據(jù)”

如果說當(dāng)下智駕行業(yè)發(fā)展的痛點是“效率”,那么未來的挑戰(zhàn)可能會是“認(rèn)知”。

清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東教授在圓桌論壇上拋出了一個前瞻性觀點:智駕模型正在從單純的感知,向世界模型(World Model)演進(jìn)。


圖片來源:CVPR 2024 Driving into the Future: Multiview Visual Forecasting and Planning with World Model for Autonomous Driving

目前的端到端大模型,雖然能處理很多場景,但面對極端的 Corner Case(長尾場景),靠實車采集的數(shù)據(jù)永遠(yuǎn)是不夠的。


圖片來源:NVIDIA

“路是跑不完的,但世界是可以被模擬的。”

但這種演進(jìn)這種演進(jìn)對基礎(chǔ)設(shè)施提出了更苛刻的要求:

算力需求的指數(shù)級爆炸: 世界模型極重,不僅需要理解物理世界,還要生成虛擬物理世界。這可能需要數(shù)百億甚至更高的算力支撐,甚至觸及到供電能力的邊界。

合成數(shù)據(jù)的崛起: 真實路采數(shù)據(jù)的效率太低且稀缺。未來,大量的訓(xùn)練數(shù)據(jù)將來自“虛擬物理世界”的高效生成。這對GPU 的渲染能力和 CPU 的邏輯模擬能力提出了雙重挑戰(zhàn)。

軟件定義的靈活性:正如中興操作系統(tǒng)產(chǎn)品線副總經(jīng)理胡沖在圓桌中所感慨的,算法迭代極快——“去年可能還是 BEV,今年就是 VLA 了”。而阿里云李三紅也證實,一線技術(shù)團(tuán)隊確實清晰感知到了模型向 VLA 及世界模型演進(jìn)的趨勢。這種軟件層面的極速狂奔,與硬件芯片較長的迭代周期形成了鮮明對比。這就要求編譯器和操作系統(tǒng)必須具備極強(qiáng)的適應(yīng)性,通過軟件定義來抹平硬件迭代的時間差。AI 不僅要“看懂”視頻,還要能“生成”視頻,甚至要理解牛頓定律。

鄧教授指出,這需要底層算力支持極其復(fù)雜的“虛實遷移”。這意味著,未來的操作系統(tǒng)不僅要調(diào)度計算,還要調(diào)度“物理世界的規(guī)則”

這也解釋了為什么像龍蜥(OpenAnolis)這樣的開源社區(qū),開始在這個階段強(qiáng)調(diào)“ AI 原生操作系統(tǒng)”的概念——因為舊的底座,真的撐不住新的世界了。


圖片來源:龍蜥社區(qū)(OpenAnolis)

五、開源底座的長期主義

從 2025 龍蜥操作系統(tǒng)大會的這場自動駕駛分論壇中,我們看到了汽車科技行業(yè)的一個明顯轉(zhuǎn)折:

大家不再盲目迷信硬件的堆砌,開始回歸計算機(jī)科學(xué)的常識——系統(tǒng)協(xié)同

面對 Arm、x86、RISC-V 等復(fù)雜的芯片架構(gòu),面對日新月異的模型算法,車企和智駕公司不可能每一家都去從零手搓一套底層軟件。

而龍蜥社區(qū)的存在,就是為了提供一個標(biāo)準(zhǔn)化的技術(shù)底座,屏蔽底層異構(gòu)硬件(不同架構(gòu)的 CPU、GPU、NPU)的差異,讓車企和智駕公司能夠?qū)W⒂谏蠈幽P秃退惴ǖ膭?chuàng)新。正如 Arm 通過 Arm Total Design 聯(lián)合產(chǎn)業(yè)鏈一樣,軟件層面也需要這樣一個“連接器”來降低全行業(yè)的試錯成本。

正如胡沖所言:“通過社區(qū)共建、共享,降低車企的研發(fā)門檻與成本,是解決算力荒的另一種路徑?!?/p>

在算力資源有限、成本高企、模型日趨復(fù)雜的背景下,誰能更高效地榨干每一 Tops 算力的價值,誰能以更低的成本完成數(shù)據(jù)的閉環(huán)流轉(zhuǎn),誰就能在 L3+ 的量產(chǎn)前夜活下來。

數(shù)據(jù)是資產(chǎn),模型是能力,而軟件與操作系統(tǒng),是這一切的根基。

自動駕駛的下半場,不再是單點技術(shù)的突破,而是“數(shù)據(jù)-模型-軟件”全鏈路的生態(tài)戰(zhàn)爭。在這個戰(zhàn)場上,那個由 CPU、操作系統(tǒng)、編譯器、文件系統(tǒng)構(gòu)成的龐大“新基座”,正在成為決定勝負(fù)的隱形力量。

對中國的自動駕駛產(chǎn)業(yè)而言,建立一個自主、可控、高效的基礎(chǔ)軟件生態(tài),其戰(zhàn)略意義或許絲毫不亞于擁有幾萬張顯卡。

因為只有根扎得夠深,智能的樹才能長得夠高夠穩(wěn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
昔日“鞋王”跌落神壇!開膠、斷底,一上腳就報廢,2年巨虧4.6億

昔日“鞋王”跌落神壇!開膠、斷底,一上腳就報廢,2年巨虧4.6億

歷史偉人錄
2025-12-22 14:08:05
“難怪口感怪怪的……”必勝客門店被查!羅永浩發(fā)聲

“難怪口感怪怪的……”必勝客門店被查!羅永浩發(fā)聲

都市快報橙柿互動
2025-12-20 11:32:06
25km/h算狂飆?新國標(biāo)電動車售賣按下暫停鍵,媒體又翻車為什么?

25km/h算狂飆?新國標(biāo)電動車售賣按下暫停鍵,媒體又翻車為什么?

你食不食油餅
2025-12-22 12:11:37
庾澄慶母親張正芬有多美?風(fēng)華絕代氣質(zhì)非凡,是國寶級國劇名伶

庾澄慶母親張正芬有多美?風(fēng)華絕代氣質(zhì)非凡,是國寶級國劇名伶

萬物知識圈
2025-12-17 09:17:12
成都市金牛區(qū)人民政府關(guān)于丁學(xué)林等3人職務(wù)任免的通知

成都市金牛區(qū)人民政府關(guān)于丁學(xué)林等3人職務(wù)任免的通知

愛看頭條
2025-12-22 19:47:07
50歲中年阿姨穿衣風(fēng)格,會不會太保守

50歲中年阿姨穿衣風(fēng)格,會不會太保守

深海的秘密
2025-12-17 07:41:34
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

小哥很OK
2025-12-12 14:33:01
臺灣換防失誤使中業(yè)島被菲侵占,中國三大行動讓菲機(jī)場美夢成空

臺灣換防失誤使中業(yè)島被菲侵占,中國三大行動讓菲機(jī)場美夢成空

壹知眠羊
2025-12-22 07:19:13
日媒還威脅上了:中方若不取消旅游限制,明年春節(jié)將付出慘痛代價

日媒還威脅上了:中方若不取消旅游限制,明年春節(jié)將付出慘痛代價

非凡觀點
2025-12-19 10:19:00
孟子義「摔出神圖」炸網(wǎng)!網(wǎng)贊:畫面美到能跟珍妮弗勞倫斯媲美

孟子義「摔出神圖」炸網(wǎng)!網(wǎng)贊:畫面美到能跟珍妮弗勞倫斯媲美

達(dá)達(dá)哥
2025-12-22 16:05:27
“伊斯坎德爾-M”原形畢露,“雌鹿”又遭損失!簡評俄烏空襲斗法

“伊斯坎德爾-M”原形畢露,“雌鹿”又遭損失!簡評俄烏空襲斗法

鷹眼Defence
2025-12-21 18:02:28
疑看到女兒!小洛熙爸爸發(fā)解剖臺畫面被禁止播放

疑看到女兒!小洛熙爸爸發(fā)解剖臺畫面被禁止播放

看看新聞Knews
2025-12-21 17:01:02
比糖和鹽還傷血管,已被世衛(wèi)組織拉入“黑名單”,勸你早日忌口

比糖和鹽還傷血管,已被世衛(wèi)組織拉入“黑名單”,勸你早日忌口

39健康網(wǎng)
2025-12-20 20:16:48
武統(tǒng)已完成最終準(zhǔn)備?臺媒:不光解放軍萬事俱備,還另有高人相助

武統(tǒng)已完成最終準(zhǔn)備?臺媒:不光解放軍萬事俱備,還另有高人相助

東方點兵
2025-12-22 17:11:09
伊森:比賽輸球完全是我的錯,我不該最后時刻去協(xié)防

伊森:比賽輸球完全是我的錯,我不該最后時刻去協(xié)防

懂球帝
2025-12-22 15:42:17
談妥了,中烏代表在京握手,澤連斯基對華示好,中方要拔1根毒針

談妥了,中烏代表在京握手,澤連斯基對華示好,中方要拔1根毒針

鐵錘簡科
2025-12-21 16:28:35
按薄一波的資歷,假如參加55年授銜,能不能被授予“開國大將”?

按薄一波的資歷,假如參加55年授銜,能不能被授予“開國大將”?

鶴羽說個事
2025-12-20 11:25:04
朱珠的冬至家宴照殺瘋了,喝到臉紅!小女兒穿著練功服滿屋子打鬧

朱珠的冬至家宴照殺瘋了,喝到臉紅!小女兒穿著練功服滿屋子打鬧

樂悠悠娛樂
2025-12-22 10:17:48
1903年,法國貴婦打臺球穿的是開襠褲,不是為了風(fēng)騷,是因為

1903年,法國貴婦打臺球穿的是開襠褲,不是為了風(fēng)騷,是因為

南權(quán)先生
2025-12-22 17:14:57
明明能出去買早餐,為什么還有家長每天早上六點就起來親自做?

明明能出去買早餐,為什么還有家長每天早上六點就起來親自做?

另子維愛讀史
2025-12-21 18:26:33
2025-12-22 22:43:00
HiEV incentive-icons
HiEV
新一代智能汽車創(chuàng)新研究平臺
1021文章數(shù) 79關(guān)注度
往期回顧 全部

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

頭條要聞

韓媒:韓國四大集團(tuán)掌門人擬明年1月隨團(tuán)訪華

頭條要聞

韓媒:韓國四大集團(tuán)掌門人擬明年1月隨團(tuán)訪華

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財經(jīng)要聞

央行信用新政:為失信者提供"糾錯"通道

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機(jī)器人技術(shù)大錯

態(tài)度原創(chuàng)

家居
本地
房產(chǎn)
藝術(shù)
公開課

家居要聞

現(xiàn)代手法 詮釋東方文化

本地新聞

云游安徽|走進(jìn)銅陵,照見三千年不滅的爐火

房產(chǎn)要聞

重磅!海南發(fā)布島內(nèi)居民免稅商品經(jīng)營主體及免稅店管理辦法征求意見稿!

藝術(shù)要聞

萬年松樹開花,震驚你的雙眼!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版