国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

無(wú)數(shù)據(jù)不智能,數(shù)據(jù)閉環(huán)重塑高階智駕未來(lái)

0
分享至

城市NOA,自動(dòng)駕駛進(jìn)化之路上的關(guān)鍵節(jié)點(diǎn),也被視為智能汽車(chē)下半場(chǎng)的開(kāi)端。

自2023年上海車(chē)展以來(lái),有關(guān)城市NOA的路線之爭(zhēng)逐漸明晰,“重感知+輕地圖”、借助純感知和融合感知路線、以及BEV+Transformer模型的智能駕駛解決方案,成為業(yè)界共識(shí)。

如今,城市NOA邁向商業(yè)化落地競(jìng)爭(zhēng),如何利用高效的算力支撐、完善的算法模型、大量有效的數(shù)據(jù)形成閉環(huán),是大規(guī)模量產(chǎn)的關(guān)鍵。

數(shù)據(jù)成為高階智駕“稀缺品”

在智能駕駛領(lǐng)域里,數(shù)據(jù)就是生命之源。沒(méi)有數(shù)據(jù),那些復(fù)雜的算法和模型就如同干涸的河流,無(wú)法滋養(yǎng)出智能的果實(shí)。

端到端時(shí)代讓數(shù)據(jù)的重要性空前提升。在傳統(tǒng)基于規(guī)則的算法時(shí)代,工程師將如何執(zhí)行駕駛行為凝練成為規(guī)則寫(xiě)入自動(dòng)駕駛算法,當(dāng)模型出現(xiàn)問(wèn)題時(shí),修改或添加新的規(guī)則即可完成對(duì)問(wèn)題的修復(fù)。

而對(duì)端到端自動(dòng)駕駛算法而言,模型只會(huì)通過(guò)駕駛的視頻片段學(xué)習(xí)駕駛行為和對(duì)環(huán)境的理解,因此如何將人類想要讓模型學(xué)習(xí)到的內(nèi)容賦予到數(shù)據(jù)中,并讓模型在訓(xùn)練中能夠?qū)W習(xí)這些先驗(yàn)知識(shí)難度較高。因?yàn)槊總€(gè)人類駕駛的視頻片段其實(shí)都包含豐富的駕駛行為,讓模型理解到這些視頻片段中的某一種抽象化的先驗(yàn)知識(shí)(如左轉(zhuǎn)讓直行)并不容易。

端到端技術(shù)的核心在于通過(guò)大量數(shù)據(jù)訓(xùn)練模型,使其能夠識(shí)別和預(yù)測(cè)各種駕駛場(chǎng)景。高質(zhì)量數(shù)據(jù)的輸入,直接決定了模型輸出的準(zhǔn)確性和可靠性。這些數(shù)據(jù)不僅需要涵蓋各種道路條件、天氣變化和交通情況,還要確保其標(biāo)注的準(zhǔn)確性和多樣性。

傳統(tǒng)模塊化算法需要改變控制策略時(shí),可以找到代碼中具體的幾行參數(shù)修改,之后測(cè)試1%的案例即可,而端到端的算法中,小的改動(dòng)需要重新對(duì)自動(dòng)駕駛算法進(jìn)行訓(xùn)練,難度可想而知。因此,海量的、多樣化的、優(yōu)質(zhì)的數(shù)據(jù)不可或缺,同時(shí)自動(dòng)化、高水平的數(shù)據(jù)處理體系亦至關(guān)重要。毫不夸張地說(shuō),數(shù)據(jù)會(huì)占據(jù)端到端自動(dòng)駕駛開(kāi)發(fā)中80%以上的研發(fā)成本。

從數(shù)據(jù)維度看,海量且優(yōu)質(zhì)的數(shù)據(jù)正成為自動(dòng)駕駛行業(yè)的“稀缺品”。通常,激光雷達(dá)的算法要滿足自動(dòng)駕駛的性能要求,需要至少幾十萬(wàn)幀的數(shù)據(jù)訓(xùn)練。單目攝像頭要求更高,需要百萬(wàn)幀的訓(xùn)練數(shù)據(jù)。不過(guò)這兩者和BEV方案比起來(lái),差距仍然十分巨大。

自動(dòng)駕駛采用的BEV感知方案,需要達(dá)到1億幀以上的訓(xùn)練數(shù)據(jù)才能滿足車(chē)規(guī)要求,否則泛化性、準(zhǔn)確率和召回率就難以保障。

對(duì)于端到端算法而言,數(shù)據(jù)的需求激增,并且伴隨模型體量的增加而擴(kuò)大;對(duì)質(zhì)量的要求也顯著提高,多樣性和豐富度不可或缺。

以特斯拉為例,馬斯克曾表示,特斯拉FSD測(cè)試?yán)锍绦枰_(dá)到60億英里,才能滿足全球監(jiān)管機(jī)構(gòu)的要求,這也是自動(dòng)駕駛系統(tǒng)實(shí)現(xiàn)質(zhì)變的一個(gè)重要節(jié)點(diǎn)。

據(jù)《馬斯克傳》中描述,神經(jīng)網(wǎng)絡(luò)至少得進(jìn)過(guò)100萬(wàn)個(gè)視頻片段的訓(xùn)練才能達(dá)到良好的工作狀態(tài),而特斯拉到2023年初已經(jīng)分析了從特斯拉客戶車(chē)輛上收集的1000萬(wàn)幀視頻畫(huà)面,這其中,特斯拉還會(huì)挑選出人類優(yōu)質(zhì)司機(jī)所采取的行為來(lái)給模型進(jìn)行訓(xùn)練。

2024年5月,在解決了算力瓶頸之后,馬斯克表示更大的難點(diǎn)在于對(duì)長(zhǎng)尾數(shù)據(jù)的收集。目前,特斯拉通過(guò)不斷擴(kuò)大FSD功能覆蓋更大規(guī)模的用戶數(shù)量。2024年第一季度,特斯拉FSD真實(shí)路況總里程已達(dá)12.5億英里(約20億公里),這一數(shù)字遠(yuǎn)超其他公司總和。特斯拉方面預(yù)計(jì),按照目前的速度,F(xiàn)SD累計(jì)行駛里程有望在一年之內(nèi)達(dá)到60億英里總量。

由此可以看出,要想達(dá)到特斯拉的自動(dòng)駕駛水準(zhǔn),海量、多樣化、高質(zhì)量的數(shù)據(jù)是首要前提。

“數(shù)據(jù)閉環(huán)”關(guān)鍵點(diǎn)

如何獲取大規(guī)模數(shù)據(jù),獲取之后如何有效回傳、標(biāo)注以及訓(xùn)練,并最終OTA反饋到車(chē)端,是數(shù)據(jù)閉環(huán)的核心任務(wù),也是大多數(shù)車(chē)企迫切想要擁有的能力。

數(shù)據(jù)閉環(huán)并非新概念,互聯(lián)網(wǎng)時(shí)代早期即有廣泛應(yīng)用。一個(gè)比較典型的例子即是各類軟件、App的“用戶體驗(yàn)改進(jìn)計(jì)劃”。

用戶在初次打開(kāi)一款軟件時(shí),往往會(huì)彈出選項(xiàng)“是否加入用戶體驗(yàn)改進(jìn)計(jì)劃”。點(diǎn)擊確定后,軟件就會(huì)收集用戶的使用信息。在出現(xiàn)崩潰、Bug等場(chǎng)景下,軟件還會(huì)彈出信息,詢問(wèn)“是否允許上傳本次崩潰信息以幫助改進(jìn)”,比如Windows出現(xiàn)的各種錯(cuò)誤報(bào)告。

點(diǎn)擊提交后,軟件開(kāi)發(fā)商的工程師們會(huì)分析錯(cuò)誤報(bào)告,以找出出現(xiàn)崩潰、Bug的原因,進(jìn)而修改代碼并在下次更新后予以解決。

用戶在使用過(guò)程中遇到的所有問(wèn)題均可以通過(guò)此種方式解決,周而復(fù)始,不斷優(yōu)化軟件性能與使用體驗(yàn),這就是一種傳統(tǒng)的數(shù)據(jù)閉環(huán)。

自動(dòng)駕駛系統(tǒng)的研發(fā)與優(yōu)化,與傳統(tǒng)軟件開(kāi)發(fā)存在很多不同。

傳統(tǒng)軟件更多是在代碼端解決各類問(wèn)題,但自動(dòng)駕駛系統(tǒng)除代碼以外,還有更為關(guān)鍵的AI模型。代碼端的問(wèn)題可以通過(guò)傳統(tǒng)的數(shù)據(jù)閉環(huán)方式予以解決,但模型端的調(diào)整則需要重新訓(xùn)練或優(yōu)化AI算法模型。

因此,自動(dòng)駕駛數(shù)據(jù)閉環(huán)需要在傳統(tǒng)數(shù)據(jù)閉環(huán)方式上,引入一些新東西,比如數(shù)據(jù)標(biāo)注、模型訓(xùn)練、算法調(diào)試等。

在數(shù)據(jù)采集環(huán)節(jié),收集足夠多的交通數(shù)據(jù)并非易事。采集數(shù)據(jù)分為兩種,一種是靠研發(fā)采集車(chē)。小鵬、華為在起步階段,均是靠這種方式獲取數(shù)據(jù)。另一種是通過(guò)量產(chǎn)車(chē)獲取數(shù)據(jù),這是在數(shù)據(jù)規(guī)模上來(lái)后的主流方式。

早年自動(dòng)駕駛企業(yè)大多依賴采集車(chē)采集數(shù)據(jù),這種數(shù)據(jù)是不真實(shí)的、分布有偏的、低質(zhì)量的,只能做個(gè)Demo,難以進(jìn)行大規(guī)模端到端訓(xùn)練。最近幾年,隨著量產(chǎn)車(chē)的規(guī)?;涞兀瑯I(yè)界很多公司都開(kāi)始轉(zhuǎn)向采用量產(chǎn)車(chē)通過(guò)影子模式采集數(shù)據(jù),但這種模式依然面臨艱巨的挑戰(zhàn)。

這里面包含采集策略的問(wèn)題,即如何平衡數(shù)據(jù)的長(zhǎng)尾問(wèn)題(有效性)和數(shù)據(jù)的規(guī)模問(wèn)題(成本)。如果采集策略比較寬松,往往采集的數(shù)據(jù)大部分是無(wú)價(jià)值數(shù)據(jù);如果采集策略過(guò)于嚴(yán)格,又會(huì)丟失大量有價(jià)值的數(shù)據(jù)。

其次是數(shù)據(jù)的質(zhì)量問(wèn)題,如何定義數(shù)據(jù)質(zhì)量是個(gè)艱巨的產(chǎn)品問(wèn)題,如何精準(zhǔn)地挑選出覆蓋足夠多極端情況的高質(zhì)量數(shù)據(jù)又是一個(gè)復(fù)雜的技術(shù)問(wèn)題。

之后是數(shù)據(jù)分布問(wèn)題,如何從海量的數(shù)據(jù)片段中提取有效的特征、如何統(tǒng)計(jì)數(shù)據(jù)的分布、應(yīng)該考慮哪些維度,都需要大量的工作。

在數(shù)據(jù)回傳環(huán)節(jié),在數(shù)據(jù)量特別大的時(shí)候,數(shù)據(jù)回傳的成本會(huì)非常高。

單車(chē)每日回傳的數(shù)據(jù)量大概為百兆級(jí)。在研發(fā)階段,車(chē)輛總數(shù)可能只有幾十輛或者幾百輛,但是到了量產(chǎn)階段,車(chē)輛數(shù)目的量級(jí)可以達(dá)到上萬(wàn)、幾十萬(wàn)甚至更多。那么,量產(chǎn)階段,整個(gè)車(chē)隊(duì)日產(chǎn)生的數(shù)據(jù)量就是很大的數(shù)字。某造車(chē)新勢(shì)力每個(gè)月僅用來(lái)做數(shù)據(jù)回傳的流量費(fèi)就高達(dá)“大幾千萬(wàn)”。

另一方面,急劇增加的數(shù)據(jù)量還給存儲(chǔ)空間以及數(shù)據(jù)處理的速度都帶來(lái)了挑戰(zhàn)。

量產(chǎn)之后,數(shù)據(jù)處理的延遲需要和研發(fā)階段保持在同一個(gè)量級(jí)。但如果底層的基礎(chǔ)設(shè)施跟不上,數(shù)據(jù)處理的延遲就會(huì)隨著數(shù)據(jù)量的增長(zhǎng)而相應(yīng)地增加,這樣會(huì)極大地拖慢研發(fā)流程的進(jìn)度。對(duì)于系統(tǒng)迭代來(lái)講,這種效率的降低是不可接受的。

在數(shù)據(jù)標(biāo)注環(huán)節(jié),雖然大模型的應(yīng)用可以讓高達(dá)80%的數(shù)據(jù)標(biāo)注可以通過(guò)自動(dòng)化的方式來(lái)完成,但還有至少20%涉及復(fù)雜場(chǎng)景、多目標(biāo)、語(yǔ)義復(fù)雜的數(shù)據(jù)需要由人工來(lái)完成“精標(biāo)”。

以往需要標(biāo)注的數(shù)據(jù)主要是前視攝像頭數(shù)據(jù),2D標(biāo)注框+3D位置就已經(jīng)是標(biāo)注的全部?jī)?nèi)容了;如今在BEV+Transformer方案下,所有相關(guān)的攝像頭看到的所有障礙物、車(chē)道線、車(chē)輛的運(yùn)動(dòng)狀態(tài)都需要對(duì)應(yīng)的標(biāo)注,并且還要統(tǒng)一在同一坐標(biāo)系下,還有大量的語(yǔ)義信息也需要標(biāo)注。

多數(shù)公司在數(shù)據(jù)標(biāo)注環(huán)節(jié)都會(huì)依靠“人海戰(zhàn)術(shù)”,依靠人工一個(gè)個(gè)地對(duì)采集回來(lái)的數(shù)據(jù)做場(chǎng)景分類,工作量遠(yuǎn)超想象。一般的檢測(cè)框,一分鐘的內(nèi)容,標(biāo)注需要一小時(shí)左右;點(diǎn)云分割,一分鐘的內(nèi)容,標(biāo)注需要幾個(gè)小時(shí);但對(duì)更復(fù)雜的任務(wù)做4D標(biāo)注,可能一分鐘的任務(wù)需要花超過(guò)一天時(shí)間才能完成。

后面如果要做端到端的算法訓(xùn)練,在給這一幀的內(nèi)容打標(biāo)簽時(shí),還得考慮該標(biāo)簽如何跟其他幀的內(nèi)容做關(guān)聯(lián)。

總體趨勢(shì)是,自動(dòng)駕駛行業(yè)對(duì)標(biāo)注的要求越來(lái)越高了,這意味著,投入到一分鐘視頻上的標(biāo)注成本也隨之水漲船高。如果標(biāo)注的結(jié)果不準(zhǔn)確、不完整,那基于這些數(shù)據(jù)訓(xùn)練出來(lái)的模型的性能就會(huì)受到影響。

此外,在數(shù)據(jù)收集和處理的過(guò)程中,隱私保護(hù)是一個(gè)不容忽視的問(wèn)題。自動(dòng)駕駛車(chē)輛在運(yùn)行過(guò)程中,可能會(huì)捕捉到行人的面貌、車(chē)牌號(hào)碼等敏感信息。如何保護(hù)這些個(gè)人隱私,避免數(shù)據(jù)泄露和濫用,是每個(gè)自動(dòng)駕駛企業(yè)都必須嚴(yán)肅對(duì)待的問(wèn)題。

對(duì)大部分自動(dòng)駕駛企業(yè),還會(huì)面臨嚴(yán)重的數(shù)據(jù)泛化問(wèn)題,因?yàn)椴煌能?chē)型傳感器配置差異巨大,采集的數(shù)據(jù)往往難以復(fù)用,而國(guó)內(nèi)車(chē)企普遍車(chē)型眾多,最后很可能是采了一堆數(shù)據(jù)放在那沒(méi)法使用,看起來(lái)是數(shù)據(jù)資產(chǎn),其實(shí)都是存儲(chǔ)成本。

“華山一條路”的技術(shù)新路徑

在數(shù)據(jù)閉環(huán)體系中,仿真技術(shù)無(wú)疑是非常關(guān)鍵的一環(huán)。仿真的起點(diǎn)是數(shù)據(jù),而數(shù)據(jù)又分為真實(shí)數(shù)據(jù)與合成數(shù)據(jù)。隨著真實(shí)數(shù)據(jù)“規(guī)模小、質(zhì)量低、使用難度大”等問(wèn)題日漸暴露,合成數(shù)據(jù)越來(lái)越受重視。

在國(guó)內(nèi),雖然各家主機(jī)廠已經(jīng)不缺真實(shí)數(shù)據(jù),但這些數(shù)據(jù)的利用率究竟有多高,仍然存在很大疑問(wèn)。同時(shí),如果用真實(shí)數(shù)據(jù)用來(lái)做仿真,有個(gè)很?chē)?yán)重的痛點(diǎn)——復(fù)用性差。

比如,在做路采的時(shí)候,車(chē)輛的芯片平臺(tái)、傳感器架構(gòu)及制動(dòng)系統(tǒng)是怎樣的,在仿真系統(tǒng)里做測(cè)試時(shí),車(chē)輛的這些硬件配置也必須跟路采時(shí)所用的車(chē)輛配置一致。一旦傳感器的位置或者型號(hào)有變更,這一組數(shù)據(jù)的價(jià)值就降低,甚至?xí)鲝U。

事實(shí)上,真實(shí)數(shù)據(jù)的最主要問(wèn)題并不是“太少”,而是質(zhì)量低,使用難度大、復(fù)用性差,而這恰合也就是合成數(shù)據(jù)的用武之地。

合成數(shù)據(jù)(Synthetic Data)就是通過(guò)計(jì)算機(jī)技術(shù)生成的數(shù)據(jù),而不是由真實(shí)事件產(chǎn)生的數(shù)據(jù)。但合成數(shù)據(jù)又具備“可用性”,能夠在數(shù)學(xué)上或統(tǒng)計(jì)學(xué)上反映原始數(shù)據(jù)的屬性,因此也可以用來(lái)訓(xùn)練、測(cè)試并驗(yàn)證模型。OpenAI的GPT-4,就采用了大量前一代模型GPT-3.5生產(chǎn)的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練。

Gartner 預(yù)測(cè),到2024年用于訓(xùn)練Al的數(shù)據(jù)中有60%將是合成數(shù)據(jù),到2030年AI模型使用的絕大部分?jǐn)?shù)據(jù)將由人工智能合成。

合成數(shù)據(jù)最早于1993年由統(tǒng)計(jì)學(xué)家唐納德·B·魯賓(Donald B. Rubin)提出,目前被廣泛引用,并在金融保險(xiǎn)、醫(yī)療制藥、汽車(chē)制造、零售、自動(dòng)駕駛等領(lǐng)域都有或深或淺的應(yīng)用。

合成數(shù)據(jù)的產(chǎn)生原理,很大程度上在于模擬真實(shí)數(shù)據(jù)的分布特征和統(tǒng)計(jì)特性,再通過(guò)生成模型創(chuàng)建新的數(shù)據(jù)集,用來(lái)輔助真實(shí)訓(xùn)練數(shù)據(jù)樣本不足或使用受限情況下(如數(shù)據(jù)敏感或隱私保護(hù))的模型訓(xùn)練、測(cè)試和開(kāi)發(fā)。

廣義上,因?yàn)楹铣蓴?shù)據(jù)保留了和真實(shí)世界數(shù)據(jù)相同的結(jié)構(gòu)或分布,卻不包含原始信息,所以主要被用來(lái)代替原始數(shù)據(jù)用于模型訓(xùn)練和下游任務(wù)。

不過(guò)在實(shí)際應(yīng)用中,出于數(shù)據(jù)可用性或真實(shí)場(chǎng)景數(shù)據(jù)對(duì)強(qiáng)化模型泛化能力的考慮,也有人基于原始數(shù)據(jù)樣本,通過(guò)部分合成的方式(比如利用?數(shù)據(jù)填補(bǔ)的方法替換原本的敏感和關(guān)鍵字段,進(jìn)行局部數(shù)據(jù)的合成),生成相應(yīng)的合成數(shù)據(jù)。所以,在有些分類中,合成數(shù)據(jù)又包含全部合成、部分合成、混用多種形態(tài)。

目前,合成數(shù)據(jù)在模型訓(xùn)練和數(shù)據(jù)集增強(qiáng)等場(chǎng)景,尤其在對(duì)齊階段深度的模型訓(xùn)練中發(fā)揮著重要作用。

隨著合成數(shù)據(jù)越發(fā)受到重視,技術(shù)人員也在持續(xù)創(chuàng)新數(shù)據(jù)合成的方法。從實(shí)際使用看,目前主要通過(guò)以下方式進(jìn)行合成數(shù)據(jù)。

隨機(jī)采樣生成。根據(jù)現(xiàn)實(shí)世界數(shù)據(jù)中觀察到的統(tǒng)計(jì)特性(如均值、方差、相關(guān)性等),隨機(jī)生成數(shù)據(jù)。這種合成方法比較基礎(chǔ)直接,適合簡(jiǎn)單的數(shù)據(jù)集生成,但面對(duì)高維復(fù)雜的數(shù)據(jù),則存在一定的局限性。

基于特定領(lǐng)域規(guī)則生成。基于數(shù)據(jù)集預(yù)定義的規(guī)則和約束,手動(dòng)或半自動(dòng)生成合成數(shù)據(jù)。這種方式生成的數(shù)據(jù),能保持與現(xiàn)實(shí)世界復(fù)雜場(chǎng)景的一致性,使得生成的合成數(shù)據(jù)具有一定可解釋性,但這種方法在具有明顯規(guī)律或規(guī)則時(shí)才較為有效。

利用深度學(xué)習(xí)方法生成。主要表現(xiàn)在利用生成對(duì)抗網(wǎng)絡(luò)(GAN)、變分自動(dòng)編碼器(VAE)等生成合成數(shù)據(jù)。比如視頻生成模型Sora就采用了生成對(duì)抗網(wǎng)絡(luò)(GAN)來(lái)生成合成數(shù)據(jù)。在這過(guò)程中,生成器負(fù)責(zé)基于原始數(shù)據(jù)合成圖像,鑒別器負(fù)責(zé)將原始圖像和合成圖像分離,當(dāng)對(duì)抗機(jī)制達(dá)到平衡,就能生成與真實(shí)世界圖像特征非常相似但又有所區(qū)別的合成圖像數(shù)據(jù)。

變分自動(dòng)編碼器(VAE)則是利用無(wú)監(jiān)督算法,通過(guò)編碼器(數(shù)據(jù)降維)和解碼器(數(shù)據(jù)重構(gòu))的協(xié)作,在原始數(shù)據(jù)基礎(chǔ)上生成新的數(shù)據(jù)。兩者都是合成多模態(tài)數(shù)據(jù)的有效方式。

利用合成數(shù)據(jù)工具生成。比如利用Python、Scikit-learn、Datagen、Mostly AI等數(shù)據(jù)合成工具軟件、機(jī)器學(xué)習(xí)庫(kù),針對(duì)性生成相應(yīng)的合成數(shù)據(jù)。目前也可以直接利用GPT等大語(yǔ)言模型,通過(guò)提示詞引導(dǎo),進(jìn)行數(shù)據(jù)增強(qiáng)和虛擬數(shù)據(jù)的合成。

除此之外,通過(guò)對(duì)現(xiàn)有數(shù)據(jù)樣本進(jìn)行變換、擴(kuò)充、匿名等生成更多的訓(xùn)練數(shù)據(jù)樣本,即采用增強(qiáng)數(shù)據(jù)、匿名數(shù)據(jù)等方式合成數(shù)據(jù)也比較常見(jiàn)。只是這種更多屬于部分合成數(shù)據(jù),真實(shí)數(shù)據(jù)特性保留度高,多樣性、豐富性方面也會(huì)有一定影響。

合成數(shù)據(jù)在自動(dòng)駕駛領(lǐng)域的一大應(yīng)用是對(duì)于極端情況的模擬。大量的極端情況在真正發(fā)生前沒(méi)有人能預(yù)知,屬于“預(yù)期功能安全”第三象限里面的“Unknown,Unsafe”一類,所以無(wú)法在真實(shí)道路上進(jìn)行模擬。這類情況,無(wú)法通過(guò)基于人工規(guī)則的合成數(shù)據(jù)(WorldSim)來(lái)生成,也沒(méi)法通過(guò)對(duì)真實(shí)世界做3D重建的技術(shù)(NeRF)來(lái)生成,但有望通過(guò)基于AIGC的合成數(shù)據(jù)來(lái)獲取。

有些極端情況盡管人們能想象得到“大概會(huì)怎樣”,但畢竟太危險(xiǎn),所以也不適合在真實(shí)道路上做模擬。這種極端情況無(wú)法通過(guò)NeRF技術(shù)來(lái)生成,但可以通過(guò)合成數(shù)據(jù)來(lái)生成。有些極端情況,算不上有多么不安全,但也會(huì)影響到交通安全,比如雨、霧、雪和極端光線等極端天氣跟某種極端交通流的組合,這些也需要通過(guò)合成數(shù)據(jù)技術(shù)來(lái)生成。還有許多極端情況,在真實(shí)數(shù)據(jù)中的密度太低,挖掘成本太高,這個(gè)時(shí)候選擇合成數(shù)據(jù)便是最佳策略。

有了合成數(shù)據(jù),主機(jī)廠或自動(dòng)駕駛公司便可在幾小時(shí)內(nèi)模擬數(shù)百萬(wàn)個(gè)極端情況,這些模擬可能涵蓋不同照明條件、目標(biāo)位置和惡劣環(huán)境下的示例,或者可以插入隨機(jī)噪聲來(lái)模擬臟污的攝像頭、霧水和其他視覺(jué)障礙物。

此外,真實(shí)數(shù)據(jù)由于高度受制于采集場(chǎng)景的限制,所以極端情況在樣本的分布上也很難有效滿足算法的需求。而合成數(shù)據(jù),可以有針對(duì)性地生成分布狀況更滿足訓(xùn)練需求的極端情況,這更有助于提升算法的性能。

如今,數(shù)據(jù)對(duì)自動(dòng)駕駛產(chǎn)業(yè)的驅(qū)動(dòng)力已經(jīng)成為每一位玩家繞不開(kāi)的關(guān)鍵。完備的閉環(huán)模型需要大規(guī)模、高質(zhì)量、多場(chǎng)景的數(shù)據(jù),高算力、高效率、相對(duì)低成本的算法模型,趨向自動(dòng)化的數(shù)據(jù)標(biāo)注與處理,高速率、低成本的傳輸速率與存儲(chǔ)模式,再加上安全合規(guī)的保駕護(hù)航,在數(shù)據(jù)的喂養(yǎng)下飛輪不斷循環(huán)向前,實(shí)現(xiàn)自動(dòng)駕駛的持續(xù)進(jìn)化。

數(shù)據(jù)閉環(huán)的每一步推進(jìn)都是成本和效率的博弈,每一次博弈都是科技理性與價(jià)值理性的融合,每一場(chǎng)融合也將必然需要上下游企業(yè)數(shù)據(jù)共享、技術(shù)開(kāi)源、生態(tài)共建。而數(shù)據(jù)閉環(huán)也是實(shí)現(xiàn)城市NOA和更高級(jí)別智駕的“華山一條路”,在這條路上,可以慢、可以錯(cuò),但唯獨(dú)不能不上山,否則就會(huì)被遺忘在山腳下。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
收評(píng):三大指數(shù)均漲超1% 兩市成交額3.6萬(wàn)億創(chuàng)歷史新高

收評(píng):三大指數(shù)均漲超1% 兩市成交額3.6萬(wàn)億創(chuàng)歷史新高

財(cái)聯(lián)社
2026-01-12 15:04:34
伊朗,大的還在后臺(tái)呢

伊朗,大的還在后臺(tái)呢

寰宇大觀察
2026-01-10 17:10:03
不做人形:他家的具身智能憑什么在100+城市賣(mài)出400萬(wàn)杯咖啡?

不做人形:他家的具身智能憑什么在100+城市賣(mài)出400萬(wàn)杯咖啡?

機(jī)器之心Pro
2026-01-12 10:20:48
特朗普對(duì)古巴人民和政府發(fā)出新威脅,外交部回應(yīng)

特朗普對(duì)古巴人民和政府發(fā)出新威脅,外交部回應(yīng)

環(huán)球網(wǎng)資訊
2026-01-12 15:49:09
馬斯克最新的預(yù)言:AI大失業(yè)時(shí)代,我們卻再也不用存錢(qián)養(yǎng)老了?

馬斯克最新的預(yù)言:AI大失業(yè)時(shí)代,我們卻再也不用存錢(qián)養(yǎng)老了?

牛頓頓頓
2026-01-10 17:57:41
瑞典軍工發(fā)布導(dǎo)彈視頻:1枚導(dǎo)彈命中摧毀中國(guó)052d型驅(qū)逐艦!

瑞典軍工發(fā)布導(dǎo)彈視頻:1枚導(dǎo)彈命中摧毀中國(guó)052d型驅(qū)逐艦!

達(dá)文西看世界
2026-01-11 19:10:20
柬埔寨鐵籠拉人當(dāng)?shù)乇僦{翻車(chē),騙不了尋子?jì)寢尩难蹨I和公眾的眼睛

柬埔寨鐵籠拉人當(dāng)?shù)乇僦{翻車(chē),騙不了尋子?jì)寢尩难蹨I和公眾的眼睛

你食不食油餅
2026-01-12 15:32:08
加拿大總理卡尼將訪華

加拿大總理卡尼將訪華

界面新聞
2026-01-12 15:13:30
上千網(wǎng)友到合川幫女孩殺豬,車(chē)子從村頭停到了村尾,主廚:這么多張嘴掛身上,壓力太大了

上千網(wǎng)友到合川幫女孩殺豬,車(chē)子從村頭停到了村尾,主廚:這么多張嘴掛身上,壓力太大了

極目新聞
2026-01-12 13:44:34
這下子,特朗普算是明白,為什么前任都不敢動(dòng)委內(nèi)瑞拉了

這下子,特朗普算是明白,為什么前任都不敢動(dòng)委內(nèi)瑞拉了

諦聽(tīng)骨語(yǔ)本尊
2026-01-12 13:59:10
新華社消息|古巴國(guó)家主席:把一切都當(dāng)作生意的人,沒(méi)資格對(duì)古巴指手畫(huà)腳

新華社消息|古巴國(guó)家主席:把一切都當(dāng)作生意的人,沒(méi)資格對(duì)古巴指手畫(huà)腳

新華社
2026-01-12 10:30:34
閆學(xué)晶兒子中戲合照流出,先讀的預(yù)科,再進(jìn)的本科班?

閆學(xué)晶兒子中戲合照流出,先讀的預(yù)科,再進(jìn)的本科班?

金牌娛樂(lè)
2026-01-12 11:50:11
內(nèi)蒙古自治區(qū)黨委組織部部長(zhǎng)調(diào)整

內(nèi)蒙古自治區(qū)黨委組織部部長(zhǎng)調(diào)整

上觀新聞
2026-01-12 17:34:12
我連夜啃完馬斯克這173分鐘視頻,很震撼

我連夜啃完馬斯克這173分鐘視頻,很震撼

販財(cái)局
2026-01-11 18:19:53
上海最新通報(bào):一金融租賃企業(yè)公職人員被查!

上海最新通報(bào):一金融租賃企業(yè)公職人員被查!

上觀新聞
2026-01-12 16:54:07
特朗普再稱要得到格陵蘭島 歐洲國(guó)家不滿并尋求應(yīng)對(duì)方法

特朗普再稱要得到格陵蘭島 歐洲國(guó)家不滿并尋求應(yīng)對(duì)方法

新華社
2026-01-12 16:03:10
開(kāi)盤(pán)20分鐘兩市成交額突破1萬(wàn)億 預(yù)計(jì)全天成交超3.8萬(wàn)億

開(kāi)盤(pán)20分鐘兩市成交額突破1萬(wàn)億 預(yù)計(jì)全天成交超3.8萬(wàn)億

財(cái)聯(lián)社
2026-01-12 09:52:29
齊河縣委原書(shū)記孫修煒,被開(kāi)除黨籍和公職

齊河縣委原書(shū)記孫修煒,被開(kāi)除黨籍和公職

魯中晨報(bào)
2026-01-12 17:29:24
上海寶山宜家等突然宣布閉店,現(xiàn)場(chǎng)排起長(zhǎng)隊(duì),網(wǎng)友:勸大家不要去了

上海寶山宜家等突然宣布閉店,現(xiàn)場(chǎng)排起長(zhǎng)隊(duì),網(wǎng)友:勸大家不要去了

河南交通廣播1041
2026-01-12 14:01:47
西安交大匿名校友伉儷向母校捐贈(zèng)1億元,該校此前有多對(duì)伉儷單次捐贈(zèng)1億元,復(fù)旦曾收到10億元捐贈(zèng)

西安交大匿名校友伉儷向母校捐贈(zèng)1億元,該校此前有多對(duì)伉儷單次捐贈(zèng)1億元,復(fù)旦曾收到10億元捐贈(zèng)

極目新聞
2026-01-12 17:26:12
2026-01-12 19:23:00
極智GeeTech incentive-icons
極智GeeTech
釋放科技想象,探索數(shù)字未來(lái)。
69文章數(shù) 11關(guān)注度
往期回顧 全部

汽車(chē)要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

頭條要聞

夫妻匿名向西安交大捐贈(zèng)1億元 此前有多對(duì)伉儷捐贈(zèng)1億

頭條要聞

夫妻匿名向西安交大捐贈(zèng)1億元 此前有多對(duì)伉儷捐贈(zèng)1億

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

態(tài)度原創(chuàng)

旅游
健康
游戲
公開(kāi)課
軍事航空

旅游要聞

1月14日9時(shí)起,洛陽(yáng)旅游年票暫停線上、線下銷售、查詢等

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

法系DH太帥了!魔獸12.0惡魔獵手重做曝光,噬滅成新版本必玩專精

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

官方確認(rèn):殲10CE在空戰(zhàn)中擊落多架戰(zhàn)機(jī)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版