国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

特斯拉新推出的FSD V14:自動駕駛訓(xùn)練從模仿學(xué)習(xí)走向強(qiáng)化學(xué)習(xí)

0
分享至


隨著端到端自動駕駛2.0方案的不斷涌現(xiàn),強(qiáng)化學(xué)習(xí)的概念再次站到了舞臺中間。

借著這個機(jī)會,今天跟大家談一談智能的三種范式,以及模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的不同點。

古代先賢將天、地、人視為三才,看似渺小的人類可以與廣袤的天地并立,是因為人類具有其它物種不曾擁有的智能,發(fā)展出了改天換地的能力。

到了人工智能時代,碳基人類孵化出已經(jīng)實現(xiàn)全知、正在邁向全能的硅基人類新物種,對這個新物種而言,其智能的獲得有規(guī)則編寫、模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三種方式。


從人工智能的三大流派來看,編寫規(guī)則屬于符號主義學(xué)派,模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)屬于連接主義學(xué)派。

符號主義的核心思想是人類專家將知識和決策過程編寫為明確的邏輯規(guī)則,用各種符號來表達(dá)知識和概念之間的關(guān)聯(lián)。

該學(xué)派的典型代表作是專家系統(tǒng),它將特定領(lǐng)域的知識編碼到知識庫中,推理引擎根據(jù)輸入的事實進(jìn)行匹配并執(zhí)行相應(yīng)的規(guī)則,得出具體的結(jié)論。


連接主義的核心思想是智能來自于神經(jīng)網(wǎng)絡(luò)及其連接機(jī)制,強(qiáng)調(diào)的是從數(shù)據(jù)中學(xué)習(xí),構(gòu)建由大量簡單的處理單元通過帶有權(quán)重的連接組成的人工神經(jīng)網(wǎng)絡(luò)。

根據(jù)輸入數(shù)據(jù)自動調(diào)整網(wǎng)絡(luò)中的連接權(quán)重,以最小化網(wǎng)絡(luò)輸出和真實輸出之間的誤差,使得網(wǎng)絡(luò)學(xué)習(xí)輸入和輸出之間的復(fù)雜映射關(guān)系并具備泛化能力。


具體到自動駕駛領(lǐng)域,23年之前,頭部智駕企業(yè)實現(xiàn)了基于深度神經(jīng)網(wǎng)絡(luò)的感知。

在駕駛策略決策上依賴天生牛馬的程序員編寫的程序,感知層踐行的是連接主義,決策層踐行的是符號主義,算是符號主義和連接主義的混合體。


24年之后,頭部智駕企業(yè)紛紛效法特斯拉轉(zhuǎn)型端到端方案,其核心轉(zhuǎn)變在于決策層由規(guī)則驅(qū)動的編碼轉(zhuǎn)向數(shù)據(jù)驅(qū)動的深度神經(jīng)網(wǎng)絡(luò),從學(xué)術(shù)流派上來看,則是全面轉(zhuǎn)向了連接主義。

成也蕭何,敗也蕭何。人是推動基于符號主義的人工智能系統(tǒng)智能水平提升的關(guān)鍵動力,也是拖累這類AI系統(tǒng)能力進(jìn)步的關(guān)鍵因素。

就自動駕駛系統(tǒng)而言,如果還困守在規(guī)則編碼范式上,隨著其設(shè)計運行條件越來越寬泛,這種將人類復(fù)雜思維和業(yè)務(wù)邏輯映射為代碼形式的規(guī)則編碼系統(tǒng)將在維護(hù)和擴(kuò)展上面臨越來越大的挑戰(zhàn)。


隨著自動駕駛從簡單的高速場景進(jìn)入交通流復(fù)雜的城區(qū)場景,幾萬條甚至幾十萬條規(guī)則極其復(fù)雜地交織在一起,能夠handle得住這些復(fù)雜規(guī)則的程序員越來越少了。

一方面,高昂的認(rèn)知復(fù)雜度和規(guī)則交互的不可預(yù)測性給系統(tǒng)的魯棒性、安全性帶來了很大的隱患。

另一方面,由于天才程序員極其稀少,規(guī)則系統(tǒng)的核心邏輯往往掌握在少數(shù)幾個極度資深的關(guān)鍵人物頭腦中,一旦他們離職或者調(diào)動,系統(tǒng)的維護(hù)就會面臨巨大的風(fēng)險。


比技術(shù)本身的復(fù)雜性更加棘手的是人因問題。

當(dāng)代碼的規(guī)模越來越大,原本依賴個人智慧的單兵突進(jìn)開發(fā)方式迅速失效,轉(zhuǎn)向兵團(tuán)作戰(zhàn)的開發(fā)方式時,為了克服開發(fā)和測試人員在理解、溝通、協(xié)作和維護(hù)規(guī)則代碼時存在的天然限制和水平差異,需要圍繞人因協(xié)作定義軟件活動、軟件開發(fā)流程和軟件體系,帶來了軟件工程難題。


自動駕駛算法轉(zhuǎn)型端到端范式之后,系統(tǒng)提升自身智能水平的途徑由符號主義的規(guī)則編碼轉(zhuǎn)向連接主義的數(shù)據(jù)驅(qū)動深度學(xué)習(xí),自然而然地解決了規(guī)則代碼復(fù)雜性和人因的問題。

更重要的,端到端還解決了把錢花在人力上還是花在物力(算力卡)上的問題,見異思遷的人員可以自由流動,買來的算力卡卻不長腿,對于萬惡的資本家來說,哪種方式更加誘人是不言而喻的。

有人的地方就有江湖,有江湖的地方就有紛爭。

自動駕駛算法范式由傳統(tǒng)的端到端1.0向端到端2.0方案切換以來,基于強(qiáng)化學(xué)習(xí)的一段式端到端、VLA和世界行為模型這三種技術(shù)路線之間展開了你來我往的輿論大混戰(zhàn),再次驗證了在競爭激烈的本土智能電動汽車江湖里,講的不是人情世故,而是打打殺殺。


說起來,這三種方案各有各的優(yōu)點,各有各的缺陷,求同存異的話,它們都在訓(xùn)練階段引入了強(qiáng)化學(xué)習(xí),也就是說,它們的學(xué)習(xí)方式都由原來的模仿學(xué)習(xí)走向了模仿學(xué)習(xí)+強(qiáng)化學(xué)習(xí)的混合學(xué)習(xí)。


在自動駕駛領(lǐng)域,模仿學(xué)習(xí)的核心是讓司機(jī)Agent通過觀察專家司機(jī)在特定狀態(tài)下的動作,學(xué)習(xí)從感知傳感器輸入到動作輸出之間的映射策略,使得在遇到相同或相似的狀態(tài)時,系統(tǒng)能夠采取與老司機(jī)相似的動作。

這種學(xué)習(xí)方式可以直接利用現(xiàn)成的駕駛數(shù)據(jù),無需與環(huán)境進(jìn)行耗時且可能危險的交互,能夠快速獲得一個表現(xiàn)不錯的策略。

而且,由于模仿人類,其駕駛風(fēng)格更加擬人,行為更加自然。

強(qiáng)化學(xué)習(xí)的核心是將駕駛問題建模為馬爾科夫決策過程,不斷進(jìn)行“感知狀態(tài)-選擇動作-執(zhí)行動作-獲得反饋-學(xué)習(xí)與更新”的重復(fù)循環(huán),通過與環(huán)境的反復(fù)試錯交互,根據(jù)獲得的獎勵信號自主學(xué)習(xí)最優(yōu)的策略。


模仿學(xué)習(xí)的缺點非常明顯,有樣學(xué)樣,模仿的人類專家水平就是這類模型的天花板,費心費力在這個賽道上投入了幾十萬億,人類對自動駕駛系統(tǒng)的期待肯定不能這么低。

強(qiáng)化學(xué)習(xí)解決了這個天花板問題,它通過自我的博弈和探索,可以發(fā)現(xiàn)人類未曾想到的更高效更安全的駕駛策略,做到了青出于藍(lán)而勝于藍(lán)!

目前,業(yè)界普遍采用融合模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的方案,先通過模仿學(xué)習(xí)將自動駕駛系統(tǒng)的水平高效率地提升到人類水平,再通過強(qiáng)化學(xué)習(xí)把人類老司機(jī)拍在沙灘上。 至于強(qiáng)化學(xué)習(xí)能將自動駕駛系統(tǒng)的智能水平提高到什么程度,特斯拉新推出的FSD V14給了非常驚艷的答案!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
出大事了!特朗普不顧丹麥反對,“強(qiáng)占”格陵蘭島,歐盟集體站隊

出大事了!特朗普不顧丹麥反對,“強(qiáng)占”格陵蘭島,歐盟集體站隊

云上烏托邦
2025-12-23 20:03:43
楊冪代言,商場“無頭大衣”嚇人,網(wǎng)友:冪級恐懼犯了!

楊冪代言,商場“無頭大衣”嚇人,網(wǎng)友:冪級恐懼犯了!

品牌頭版
2025-12-21 11:04:08
一個劍指中國的聯(lián)盟成立,幾大亞洲國家加入,中國把丑話說在前頭

一個劍指中國的聯(lián)盟成立,幾大亞洲國家加入,中國把丑話說在前頭

混沌錄
2025-12-23 20:34:58
歌手謝東帶兩個兒子游泳,竟然被調(diào)侃兒子長得像侯震

歌手謝東帶兩個兒子游泳,竟然被調(diào)侃兒子長得像侯震

西樓知趣雜談
2025-12-21 06:58:44
為弟追兇27年的女子稱兇手表情冷靜沒有道歉!擬申請抗訴

為弟追兇27年的女子稱兇手表情冷靜沒有道歉!擬申請抗訴

南方都市報
2025-12-23 15:54:31
CBA最新消息!北控男籃更換外援,鮑威爾確定離開山東

CBA最新消息!北控男籃更換外援,鮑威爾確定離開山東

體壇瞎白話
2025-12-23 08:31:00
中國股市賺錢的有且只有一種人:用80%時間等待,用20%時間去操作

中國股市賺錢的有且只有一種人:用80%時間等待,用20%時間去操作

一方聊市
2025-12-23 14:08:09
江暢同志突發(fā)心梗,不幸逝世

江暢同志突發(fā)心梗,不幸逝世

新京報政事兒
2025-12-20 22:27:40
新加坡前外長:若中美開戰(zhàn),美國取勝必用核武,但中國有反制絕招

新加坡前外長:若中美開戰(zhàn),美國取勝必用核武,但中國有反制絕招

樂天閑聊
2025-12-23 11:01:15
外交部亞洲事務(wù)特使再赴柬泰穿梭調(diào)停

外交部亞洲事務(wù)特使再赴柬泰穿梭調(diào)停

界面新聞
2025-12-23 14:54:04
北京這一晚,55歲劉奕君秒了41歲向佐,才懂男人剛陽硬朗的魅力

北京這一晚,55歲劉奕君秒了41歲向佐,才懂男人剛陽硬朗的魅力

大鐵貓娛樂
2025-12-22 16:14:20
2026年元旦后,運勢悄然翻盤,未來十年越走越順的三個星座請留意

2026年元旦后,運勢悄然翻盤,未來十年越走越順的三個星座請留意

小晴星座說
2025-12-23 20:33:05
閏土夫婦代Y兒子!紫菱給大佬當(dāng)P友!

閏土夫婦代Y兒子!紫菱給大佬當(dāng)P友!

八卦瘋叔
2025-12-23 12:00:15
吉林省委:領(lǐng)導(dǎo)干部要用90%以上的時間調(diào)查研究,了解真情況、找準(zhǔn)真問題、真解決問題

吉林省委:領(lǐng)導(dǎo)干部要用90%以上的時間調(diào)查研究,了解真情況、找準(zhǔn)真問題、真解決問題

新京報政事兒
2025-12-23 14:17:40
曾經(jīng)他們硬氣的拒絕了中國,如今好懷念他們當(dāng)初桀驁不馴的樣子!

曾經(jīng)他們硬氣的拒絕了中國,如今好懷念他們當(dāng)初桀驁不馴的樣子!

阿傖說事
2025-12-23 14:06:40
被判2年!秦升刑滿釋放8個月后開賬號 自稱叫獸+中場鐵閘語言大師

被判2年!秦升刑滿釋放8個月后開賬號 自稱叫獸+中場鐵閘語言大師

念洲
2025-12-23 17:44:08
南博前院長的家:滿屋的“胡平雅藏”,卻說自己不收藏?

南博前院長的家:滿屋的“胡平雅藏”,卻說自己不收藏?

迷世書童H9527
2025-12-23 10:40:20
勝率又回來了,勇士還有4收獲,擺正一人就是香,一人可以少用

勝率又回來了,勇士還有4收獲,擺正一人就是香,一人可以少用

體壇大辣椒
2025-12-23 14:33:18
當(dāng)劉濤和謝娜站一起,才明白儀態(tài)好和儀態(tài)不好的女人,差距有多大

當(dāng)劉濤和謝娜站一起,才明白儀態(tài)好和儀態(tài)不好的女人,差距有多大

湘村大余
2025-12-22 16:41:55
驚喜!哈里梅根全家福曝光:阿奇王子長相帥氣不輸喬治路易

驚喜!哈里梅根全家福曝光:阿奇王子長相帥氣不輸喬治路易

粵語經(jīng)典歌單
2025-12-21 14:08:09
2025-12-23 21:27:00
燃擎頻道 incentive-icons
燃擎頻道
中國汽車自媒體前30強(qiáng)!
8383文章數(shù) 231280關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

男生被對象媽媽嫌矮做斷骨增高術(shù) 十年后下樓雙腿無力

頭條要聞

男生被對象媽媽嫌矮做斷骨增高術(shù) 十年后下樓雙腿無力

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

朱孝天回應(yīng)阿信感謝,自曝沒再收到邀約

財經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時代

態(tài)度原創(chuàng)

游戲
本地
健康
教育
房產(chǎn)

《影之刃零》制作人梁其偉訪談:如何還原武俠的精髓"/> 主站 商城 論壇 自運營 登錄 注冊 《影之刃零》制作人梁其偉訪談:如何還原武俠的精髓 Marv...

本地新聞

云游安徽|宣城何以動人心,百年塔影一城徽韻

這些新療法,讓化療不再那么痛苦

教育要聞

“一手好牌打得稀爛”,985女兒留學(xué)花了50萬,畢業(yè)后卻求職無門

房產(chǎn)要聞

獨家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

無障礙瀏覽 進(jìn)入關(guān)懷版