国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話何小鵬:在物理AI時(shí)代,數(shù)據(jù)是新的石油

0
分享至


汽車(chē)、Robotaxi、機(jī)器人、飛行汽車(chē),將會(huì)為小鵬帶來(lái)更多“石油”。

作者 | 韋艷嬌

編輯 | 田 哲

那些天馬行空的科技暢想,都正在從夢(mèng)想變成現(xiàn)實(shí)。

11月5日,第七屆小鵬科技日如期進(jìn)行,活動(dòng)地在小鵬新搬遷的總部園區(qū)。從早期蝸居廣州城中村的創(chuàng)業(yè)團(tuán)隊(duì),到如今擁有自建科技園區(qū),辦公地點(diǎn)的變化背后,也藏著小鵬成立11周年后從站穩(wěn)到跑向世界的愿景。

小鵬汽車(chē)正變得更像一家AI公司。

它將業(yè)務(wù)聚焦在四個(gè)方向:智能汽車(chē)、機(jī)器人、Robotaxi與飛行汽車(chē)。這四個(gè)板塊并非簡(jiǎn)單并列,而是以智能駕駛為核心的不同演化路徑。汽車(chē)是商業(yè)化起點(diǎn),Robotaxi是算法的城市化延伸,機(jī)器人與飛行汽車(chē)則是具身智能和空間智能的外溢結(jié)果。

其中,小鵬汽車(chē)推出了首個(gè)量產(chǎn)物理世界大模型即第二代VLA,這也是小鵬在物理AI領(lǐng)域探索的關(guān)鍵技術(shù)突破。在何小鵬看來(lái),當(dāng)AI將進(jìn)一步進(jìn)化,AI將不再僅停留于應(yīng)答與生成,而是直接參與、引導(dǎo)甚至重塑物理世界的運(yùn)行,AI的能力要從數(shù)字世界延伸至物理世界。

相較于傳統(tǒng)的行業(yè)標(biāo)準(zhǔn)版的VLA,小鵬二代VLA去掉了語(yǔ)言這一中間轉(zhuǎn)譯環(huán)節(jié)。減少了語(yǔ)言轉(zhuǎn)譯的延遲后,視覺(jué)信號(hào)直達(dá)動(dòng)作指令,并且小鵬二代VLA使用大量的長(zhǎng)尾視頻數(shù)據(jù),大模型從學(xué)習(xí)模仿變成更聰明的理解。

二代VLA帶來(lái)的機(jī)器逐步理解、交互和改變世界的能力,也是小鵬串聯(lián)起汽車(chē)、機(jī)器人、飛行汽車(chē)等多元業(yè)務(wù)線的信心來(lái)源,因?yàn)樗鼈兯鎸?duì)的都是同一個(gè)物理世界,所需要解決也都是基于物理世界信息進(jìn)行決策。

據(jù)小鵬汽車(chē)聯(lián)合創(chuàng)始人、執(zhí)行董事、董事長(zhǎng)兼CEO何小鵬透露,第二代VLA是在瀕臨放棄研發(fā)的絕望中突然實(shí)現(xiàn)的。

2024年,小鵬內(nèi)部同時(shí)研發(fā)兩代VLA,卻一直沒(méi)有取得突破,研發(fā)團(tuán)隊(duì)也逐漸失去信心,甚至有些高管逃避參與報(bào)告會(huì)。但是在不久后的一天,二代VLA突然呈現(xiàn)出驚喜的理解能力。小鵬內(nèi)部認(rèn)為,這種變化源于技術(shù)積累觸及某個(gè)臨界點(diǎn)后的自然爆發(fā),沒(méi)有辦法確認(rèn)是什么量變觸發(fā)了這種質(zhì)變。

何小鵬表示,二代VLA所展現(xiàn)出的物理AI能力只是一個(gè)開(kāi)始。真正的難題不在于模型的涌現(xiàn),而在于能否更快實(shí)現(xiàn)穩(wěn)定量產(chǎn)。那意味著不僅要讓“長(zhǎng)板”更長(zhǎng),還要讓中板和短板被一并補(bǔ)齊。量產(chǎn),是小鵬接下來(lái)必須跨過(guò)的門(mén)檻。

在他看來(lái),物理AI將成為未來(lái)科技公司新的競(jìng)爭(zhēng)。在物理AI時(shí)代,數(shù)據(jù)是新的石油,誰(shuí)能先獲得大量高質(zhì)量數(shù)據(jù)并形成“數(shù)據(jù)-體驗(yàn)-更多數(shù)據(jù)”的閉環(huán),誰(shuí)就能取得優(yōu)勢(shì)。而這一循環(huán)的起點(diǎn)與關(guān)鍵環(huán)節(jié),都取決于企業(yè)在硬件和工程化能力上的深度投入,最終構(gòu)成軟硬件協(xié)同演進(jìn)的閉環(huán)。

在這種思考下,小鵬將硬件業(yè)務(wù)從汽車(chē)延伸至機(jī)器人、飛行汽車(chē)、Robotaxi等板塊,或許會(huì)帶來(lái)更多數(shù)據(jù),形成更大的軟硬件循環(huán)能力。

小鵬推出Robotaxi業(yè)務(wù),則更多基于對(duì)未來(lái)出行的思考。何小鵬堅(jiān)信,未來(lái)的4個(gè)輪子交通一定是“共享”和“私享”的組合。

與此同時(shí),第二代VLA大模型的成熟,也為小鵬切入這一市場(chǎng)提供了優(yōu)勢(shì)。二代VLA已具備擺脫高精地圖依賴的能力,可直接支持前裝量產(chǎn)方案,而非事后改造。同時(shí),通過(guò)與量產(chǎn)車(chē)型共享研發(fā)體系,小鵬得以在保證性能的前提下分?jǐn)偝杀緣毫?,將單?chē)成本控制在更具經(jīng)濟(jì)性的區(qū)間。

在趨勢(shì)和條件都有利的邏輯下,小鵬基于現(xiàn)有的汽車(chē)業(yè)務(wù)去布局Robotaxi也非常合理。

何小鵬也明確,小鵬汽車(chē)的定位將切換為“面向全球的具身智能企業(yè)”,而不再只是一家中國(guó)車(chē)企。

除了更多業(yè)務(wù)面向更大市場(chǎng)的動(dòng)作外,小鵬正將其部分核心技術(shù)以開(kāi)源形式開(kāi)放。其第二代VLA大模型面向全球商業(yè)伙伴開(kāi)源,大眾汽車(chē)成為該技術(shù)的首發(fā)客戶,后續(xù)將推動(dòng)第二代小鵬 VLA 和圖靈芯片,在大眾品牌車(chē)型上落地。

在商業(yè)化落地規(guī)劃中,何小鵬表示科技日上公布的多項(xiàng)技術(shù)將在2026年進(jìn)入爆發(fā)周期:第二代 VLA 端到端輔助駕駛、小路 NGP、無(wú)需導(dǎo)航漫游的 Super LCC、第二代人形機(jī)器人 IRON、前裝量產(chǎn) Robotaxi。

在科技日后,小鵬被稱為是最像特斯拉的企業(yè),小鵬汽車(chē)的市值回到220億美元,特斯拉的市值約為1.5萬(wàn)億美元。

二者之間仍然有著巨大的差距,但從另一個(gè)角度看,小鵬在機(jī)器人、自動(dòng)駕駛領(lǐng)域開(kāi)放SDK,挖掘物理AI的數(shù)據(jù)石油,也在助其搶占物理AI高地。

在物理AI這條路徑上,小鵬有了更廣闊的向上空間。

圍繞物理AI、機(jī)器人、業(yè)務(wù)發(fā)展等內(nèi)容,雷峰網(wǎng)《新智駕》等與小鵬汽車(chē)董事長(zhǎng)何小鵬、小鵬汽車(chē)副董事長(zhǎng)兼聯(lián)席總裁顧宏地、小鵬汽車(chē)自動(dòng)駕駛中心組織負(fù)責(zé)人劉先明、小鵬汽車(chē)機(jī)器人副總裁及AI技術(shù)委員會(huì)負(fù)責(zé)人米良川進(jìn)行了多場(chǎng)交流。

以下是編輯后的內(nèi)容節(jié)選:

Q:小鵬為什么堅(jiān)持機(jī)器人“高度擬人化”?如果做高度擬人化,對(duì)應(yīng)非常高的投入成本,怎么做權(quán)衡和取舍?

何小鵬未來(lái)高等級(jí)的機(jī)器人有各種各樣的形態(tài),有像人的,也有不像人的。

更擬人的機(jī)器人,有三大好處:第一,今天機(jī)器人想做到聰明,不能用規(guī)則,要用AI來(lái)驅(qū)動(dòng),只有從人類(lèi)世界才可以學(xué)到最多的數(shù)據(jù)。

第二,我們的家庭、工廠,實(shí)際上大部分都是為了方便人類(lèi)去使用而設(shè)計(jì)、建造、運(yùn)營(yíng)的,所以如果它越像人,越容易適應(yīng)這個(gè)世界。

第三,從商業(yè)角度看,像人更容易讓大家有親和感,更有購(gòu)買(mǎi)欲。賣(mài)得多帶來(lái)規(guī)模效應(yīng),成本更低,成本更低就可以賣(mài)得更多,會(huì)形成正向循環(huán)。

Q:為什么小鵬Robotaxi首個(gè)全球生態(tài)合作伙伴選擇了高德?第二個(gè)問(wèn)題,明年要發(fā)布三款無(wú)人駕駛出租車(chē),這三款車(chē)的差異在哪兒?

何小鵬:高德是中國(guó)非常大的出行生態(tài)平臺(tái),小鵬跟很多Robotaxi公司不一樣,無(wú)論是在中國(guó)還是全球,都不追求自己的全力運(yùn)營(yíng)。希望小鵬做Robotaxi就像一個(gè)“工具箱”一樣,有車(chē)、有軟件、有SDK接口,開(kāi)放出來(lái)給合作伙伴,他拿著“工具箱”就能做本地Robotaxi的運(yùn)營(yíng)。

高德是一個(gè)出行運(yùn)營(yíng)商,所以它來(lái)運(yùn)營(yíng),我們提供“工具箱”,這是符合兩家戰(zhàn)略定位的。三款Robotaxi是不同價(jià)位的,提供5、6、7座,滿足不同用戶的需求。

Q:許多中國(guó)大公司常被拿來(lái)和特斯拉比較,但估值卻遠(yuǎn)低于特斯拉。在未來(lái),我們應(yīng)當(dāng)如何讓資本市場(chǎng)更好地提升小鵬汽車(chē)的估值?

顧宏地:我們目前在追求的,其實(shí)更多的是科技和產(chǎn)品,確實(shí)其中有些和特斯拉比較類(lèi)似。都聚焦于物理AI,同時(shí)聚焦打造智能汽車(chē)、自動(dòng)駕駛、人形機(jī)器人等等。我們?cè)诓糠诸I(lǐng)域甚至比特斯拉開(kāi)始得更早,比如飛行汽車(chē),人形機(jī)器人。某種程度上,我們是聚焦于使用技術(shù)和AI去打造更多物理世界的場(chǎng)景。

關(guān)于資本市場(chǎng)的估值,小鵬和特斯拉的現(xiàn)狀是非常不一樣的,其中有很多變量。

首先,中國(guó)和美國(guó)不同,在市場(chǎng)、科技公司、資本市場(chǎng),有一些情況有所不同。第二,特斯拉是有一些優(yōu)勢(shì)的,尤其是他們?cè)陔妱?dòng)車(chē)領(lǐng)域開(kāi)啟得更早,并且媒體曝光度也非常高。

特斯拉有不同的產(chǎn)品,電車(chē)只是一部分,同時(shí)他們也有AI模型、FSD,以及很多生態(tài)企業(yè),種種加起來(lái)可以組成他們的估值,小鵬也在不斷推出各種產(chǎn)品及技術(shù),希望小鵬在未來(lái)可以獲得一樣的國(guó)際聲望。

Q:小鵬的新一代機(jī)器人與汽車(chē)在零部件上的復(fù)用比例達(dá)到多少?

何小鵬:我沒(méi)有精確的答案,但是很多工藝是一樣的,比如說(shuō)感知、域控制器,AI 軟件有70%是一樣的,但機(jī)器人的關(guān)節(jié)、皮膚在汽車(chē)零部件上是沒(méi)有的。

Q:小鵬希望在物理AI業(yè)務(wù)上,與汽車(chē)營(yíng)收的占比是如何的?

何小鵬:未來(lái),我對(duì)機(jī)器人的看法可能更樂(lè)觀。汽車(chē)在全球是10萬(wàn)億美金的市場(chǎng),一年生產(chǎn)9000萬(wàn)臺(tái)車(chē);而機(jī)器人是20萬(wàn)億美金的市場(chǎng)。當(dāng)然它不會(huì)這么快(實(shí)現(xiàn)),可能需要10~20年的時(shí)間,在這個(gè)時(shí)候可能會(huì)有2億或者更多的人形機(jī)器人。

我沒(méi)有想過(guò)10年以后,一年能賣(mài)多少機(jī)器人,但肯定會(huì)超過(guò)汽車(chē),超過(guò)100萬(wàn),這是從10年的角度來(lái)看。從短期的角度來(lái)看,機(jī)器人的量產(chǎn)還要過(guò)很多很多關(guān)。

Q:很多Robotaxi公司還沒(méi)有取得盈利,請(qǐng)問(wèn)你們?cè)谕七M(jìn)Robotaxi計(jì)劃時(shí)怎么確保有盈利?

何小鵬:小鵬可能是一個(gè)不一樣的Robotaxi公司,因?yàn)槲覀冏隽饲把b的車(chē),做了量產(chǎn)的車(chē)。小鵬Robotaxi、同時(shí)還有一個(gè)Robo(私人L4),可以To C銷(xiāo)售,可以大幅度分?jǐn)侭OM和研發(fā)費(fèi)用。

另外,基于二代VLA,小鵬Robotaxi不需要高精地圖,不需要掃街,不需要激光雷達(dá),更像一個(gè)物理世界的人去思考,所以更廣度、更泛化,不需要部署費(fèi)用。小鵬汽車(chē)在Robotaxi領(lǐng)域,研發(fā)費(fèi)和BOM比其他公司天然擁有百分之幾十,甚至幾倍的優(yōu)勢(shì)。

Q:小鵬把VLA的“L”去掉了,是真的消除了嗎?如果真的消除了,你們現(xiàn)在還叫VLA,不應(yīng)該是叫VA嗎?

何小鵬我們說(shuō)V+L,轉(zhuǎn)譯環(huán)節(jié)沒(méi)有變成人類(lèi)的語(yǔ)言跟格式,而是變成了一個(gè)物理世界的新語(yǔ)言,所以它不是人類(lèi)可見(jiàn)、可認(rèn)知的語(yǔ)言,效率很好,更豐富。

Q:發(fā)布會(huì)現(xiàn)場(chǎng)沒(méi)有提到L3,直接面向L4,L3產(chǎn)品的進(jìn)展是不是也卡在這個(gè)法律法規(guī)上?

何小鵬:我認(rèn)為,將來(lái)一個(gè)是L2,一個(gè)是L4,沒(méi)有L3,跳躍了L3。

Q:小鵬把固態(tài)電池裝在人形機(jī)器人,這款固態(tài)電池是來(lái)自外部供應(yīng)商嗎?

何小鵬:我們不研發(fā)電芯,都用合作伙伴的,我們固態(tài)電池的電芯來(lái)自于兩家,一家來(lái)自海外,一家來(lái)自中國(guó)。

Q:為什么小鵬在這個(gè)時(shí)候啟動(dòng)Robotaxi?目前有什么樣的策略?

何小鵬因?yàn)槲覀兒芏郃I技術(shù)的開(kāi)發(fā)、目前算力的提升,已經(jīng)能夠很好地去催生Robotaxi的機(jī)遇,和半年前、兩年前完全不一樣。

此外我們也看到,L4智駕越來(lái)越成熟。在過(guò)去6個(gè)月到一年當(dāng)中,很多公司以及行業(yè)合作都聚焦于L4級(jí)自動(dòng)駕駛。當(dāng)我們?nèi)マD(zhuǎn)向L4、轉(zhuǎn)向Robotaxi的時(shí)候,目前的情況和半年甚至一年前是完全不一樣的。

對(duì)于小鵬來(lái)說(shuō),也想要提供更加經(jīng)濟(jì)的解決方案,來(lái)更好地幫助客戶享受到L4的便利性。目前,在Robotaxi領(lǐng)域,我們和很多生態(tài)合作伙伴合作。

Q:小鵬就展出了一個(gè)女性的人形機(jī)器人,為什么會(huì)是女性?這方面是出于哪些考量?

何小鵬:人形機(jī)器人是男是女不重要,就像你可以買(mǎi)黑顏色的車(chē),也可以買(mǎi)白顏色的車(chē)。在第一代機(jī)器人里面,我希望完成一個(gè)男性、一個(gè)女性的機(jī)器人,我認(rèn)為都是需要的。

Q:特斯拉和小鵬是全球、全世界業(yè)務(wù)重合度最高的兩家公司,如果用一個(gè)詞概括,小鵬和特斯拉最不同的地方在哪里?

顧宏地:特斯拉和小鵬的對(duì)比中,有兩個(gè)特別的點(diǎn)。第一是我們相同的地方,我們都注重規(guī)模,做事時(shí)不希望只針對(duì)一個(gè)很小的細(xì)分市場(chǎng),而是希望達(dá)到量產(chǎn)和規(guī)模化,這是我們相同的地方。第二是我們不同的地方,小鵬是一個(gè)非常開(kāi)放的生態(tài)。

更加開(kāi)放的生態(tài)系統(tǒng)和更加封閉的系統(tǒng),都有自己的優(yōu)劣勢(shì),比如封閉的可能更容易去獲得經(jīng)濟(jì)效益,開(kāi)放的可能更容易和合作伙伴合作。

目前小鵬更加開(kāi)放,因?yàn)槲覀兪且粋€(gè)年輕的公司,我們有自己的局限性,沒(méi)有資源去做很多事情。我們?cè)跈C(jī)器人、在自動(dòng)駕駛車(chē)上開(kāi)放SDK,可以讓我們和更多人合作實(shí)現(xiàn)很多技術(shù),這樣也可以更好地去幫助我們的產(chǎn)品和技術(shù)成熟。

Q:發(fā)布會(huì)提到了機(jī)器人的一些場(chǎng)景,比如說(shuō)擰螺絲、做家務(wù),這些可能都不是立刻會(huì)實(shí)現(xiàn)的場(chǎng)景,在你們看來(lái),如果實(shí)現(xiàn)這些場(chǎng)景可能需要多少年?

何小鵬:在人形機(jī)器人上,不同的公司會(huì)選擇不同的商業(yè)化方案,在我們公司有一些規(guī)則,讓機(jī)器人不要有太多用手的操作,以及我們也想在機(jī)器人的智慧或者是智力方面,循序漸進(jìn)地發(fā)展。

目前我們還是在商業(yè)化早期階段,可能在3~5年之內(nèi)可以實(shí)現(xiàn)你剛剛提到的場(chǎng)景,可以做更多不同的事情。但如果我們想要機(jī)器人在家里去照顧老人、照顧小孩,那可能需要更久的時(shí)間,甚至可能需要5~10年。有些人說(shuō),5~10年之后,人類(lèi)可能在很多場(chǎng)景下會(huì)被機(jī)器人取代,但在我看來(lái),這是不可能實(shí)現(xiàn)的。

Q:業(yè)務(wù)線上,包括機(jī)器人、低空飛行器乃至Robotaxi,小鵬是如何看待它的國(guó)際化市場(chǎng)潛力?

何小鵬:小鵬的目標(biāo)是,接下來(lái)十年有一半產(chǎn)品在中國(guó)以外銷(xiāo)售。所有產(chǎn)品線和大部分的產(chǎn)品,我們都會(huì)考慮如何全球化。實(shí)際上,有部分的產(chǎn)品比如飛行汽車(chē)在全球的使用場(chǎng)景,可能比中國(guó)還多一點(diǎn)、還快一點(diǎn)。

Q:在智駕方面,小鵬在國(guó)外XNGP有沒(méi)有一些規(guī)劃?

何小鵬:在海外市場(chǎng)方面,小鵬也在積極推進(jìn)XNGP的落地進(jìn)程。目前,公司已對(duì)多個(gè)國(guó)家和地區(qū)進(jìn)行了前期考察,其中部分市場(chǎng)的法律法規(guī)已允許部署更高階的智能駕駛功能,例如高速NGP等。

預(yù)計(jì)明年將在歐洲率先實(shí)現(xiàn)相關(guān)功能的落地。同時(shí),公司也在持續(xù)跟進(jìn)香港及東南亞市場(chǎng)的政策進(jìn)展。需要強(qiáng)調(diào)的是,海外XNGP的落地不僅取決于技術(shù)成熟度,也與各地的法律法規(guī)密切相關(guān),小鵬正在與當(dāng)?shù)卣氨O(jiān)管機(jī)構(gòu)保持溝通,以推動(dòng)技術(shù)合規(guī)化應(yīng)用。

Q:奧地利麥格納工廠的生產(chǎn)情況,明年預(yù)期或者計(jì)劃的年產(chǎn)量?未來(lái),是否會(huì)去海外更多地方設(shè)廠?

顧宏地:今年8月份,奧地利工廠正式開(kāi)始投產(chǎn),今年的產(chǎn)能規(guī)模大概是幾千到大幾千輛,明年我覺(jué)得是幾萬(wàn)輛的規(guī)模。

在其他地方建設(shè)本地化工廠,我覺(jué)得是絕對(duì)需要的。一個(gè)希望達(dá)到全球領(lǐng)先的企業(yè),沒(méi)有一家是只靠出口能達(dá)到的,一定要有當(dāng)?shù)氐牟季帧a(chǎn)、研發(fā)、銷(xiāo)售服務(wù)、品牌建設(shè),這些都是我們必須要做的。所以我認(rèn)為將來(lái)在主要的銷(xiāo)售地區(qū),我們都會(huì)有本地化生產(chǎn)和本地化運(yùn)營(yíng)的能力。

Q: 物理AI有哪些難點(diǎn)?

劉先明: 難點(diǎn)在于模型的做法。模型是通過(guò)語(yǔ)言建模做離散化token(字符單位),然后經(jīng)過(guò)一個(gè)架構(gòu),最終輸出。

Q: 這套技術(shù)背后的核心原理是什么?

劉先明: 就是把大模型、大算力、大數(shù)據(jù)堆到一塊,模型邏輯非常簡(jiǎn)單,背后的原理也很簡(jiǎn)單,沒(méi)有什么復(fù)雜的故事。但想把它做好難度很大,非常大的數(shù)據(jù)要一口氣讀進(jìn)來(lái),還要在千卡、萬(wàn)卡級(jí)別訓(xùn)練得非常穩(wěn)定保證不崩掉。

Q:無(wú)數(shù)據(jù)標(biāo)注具體能帶來(lái)什么商業(yè)優(yōu)勢(shì)?

劉先明: 舉個(gè)例子,我要去歐洲等海外市場(chǎng)、去一個(gè)新的地方落地當(dāng)?shù)氐腞obotaxi,其實(shí)不需要數(shù)據(jù)標(biāo)注,只要這個(gè)地方有小鵬的車(chē)可以采集數(shù)據(jù),就可以把這件事搞定。不需要再定向采集很多數(shù)據(jù),不需要雇很多人去標(biāo)注數(shù)據(jù),成本會(huì)下降很多。

Q:小鵬的數(shù)據(jù)為什么可以做到無(wú)需標(biāo)注?你們是如何通過(guò)infra采集到大量長(zhǎng)尾數(shù)據(jù)的?

劉先明: 我們最大的優(yōu)勢(shì)就在數(shù)據(jù)。采集長(zhǎng)尾數(shù)據(jù)有兩個(gè)方面:一是車(chē)端的infra,我們做了很重要的工作——識(shí)別哪些數(shù)據(jù)是要的,哪些是不要的。一輛車(chē)平均每天開(kāi)1.7個(gè)小時(shí),能遇到很多好駕駛場(chǎng)景和極限場(chǎng)景,只要有辦法識(shí)別出來(lái)就可以。二是云端有比較大的數(shù)據(jù)閉環(huán),也在調(diào)優(yōu)數(shù)據(jù)質(zhì)量、分布,避免同一場(chǎng)景下太多重復(fù)數(shù)據(jù)。

Q: 你們?nèi)绾沃匦滤伎甲詣?dòng)駕駛的本質(zhì)?

劉先明: 我們退回去想,自動(dòng)駕駛本質(zhì)上它是一個(gè)物理AI的問(wèn)題,你要嘗試去理解這個(gè)世界,為它做三維建模,然后推演什么事情要發(fā)生、做預(yù)測(cè),再根據(jù)這些做出最安全、最符合人類(lèi)意識(shí)的一種選擇。這就是物理AI的本質(zhì)。

自動(dòng)駕駛本身就是物理AI或Robotaxi里面最簡(jiǎn)單的一種問(wèn)題,它只有兩個(gè)自由度:向前的加速度以及方向盤(pán)的轉(zhuǎn)角,相比于正常的機(jī)器人來(lái)說(shuō)自由度小很多,數(shù)據(jù)空間小,數(shù)據(jù)也更容易獲取。所以物理AI的第一件事就是去做自動(dòng)駕駛。

Q: 為什么扔掉語(yǔ)言?

劉先明: 這幾年AI發(fā)展最大的原動(dòng)力來(lái)自于scaling和data scaling,即不停地用更大規(guī)模的數(shù)據(jù)來(lái)訓(xùn)練,我們?cè)谡Z(yǔ)言模型看到了非常好的效果。

物理模型也有同樣的問(wèn)題:如果想要更大規(guī)模地使用數(shù)據(jù),一定要拆掉所有的separation(模塊界限),讓它變成一種自監(jiān)督的模式,不需要人工標(biāo)注。只要有語(yǔ)言存在,就一定涉及到人工的篩選或標(biāo)注,于是我把它拆掉,讓它變成一種非常極致的數(shù)據(jù)驅(qū)動(dòng)模式。

Q:現(xiàn)有的VLA架構(gòu)存在什么問(wèn)題?

劉先明: 很多VLA架構(gòu)基本都是圖像進(jìn)來(lái),通過(guò)一個(gè)大語(yǔ)言模型最終輸出一Meta action(高級(jí)抽象的動(dòng)作指令),Meta action一般是文字,然后再通過(guò)文字的方式處理后輸出。這種方式最大的好處是你有很多開(kāi)源模型可以用,可以直接拿開(kāi)源的NLP模型來(lái)做推理。

但它帶來(lái)的問(wèn)題是,你引入了中間一個(gè)離散化的語(yǔ)言輸出,成為了瓶頸,這樣會(huì)讓數(shù)據(jù)使用的規(guī)模受到限制。一個(gè)系統(tǒng)沒(méi)有任何中間瓶頸,才可能大規(guī)模地做起來(lái)。

Q: 物理世界交互的本質(zhì)是什么?

劉先明: 物理世界交互的本質(zhì)其實(shí)是直接輸出控制信號(hào)。為什么這種基于端到端的視頻輸入、動(dòng)作輸出的大模型能工作?因?yàn)楫?dāng)人類(lèi)做任何動(dòng)作時(shí),需要經(jīng)歷幾個(gè)過(guò)程:先要理解這個(gè)場(chǎng)景的3D是怎么構(gòu)建的,然后根據(jù)過(guò)去的歷史信息做出對(duì)未來(lái)的判斷,最后根據(jù)自己的指令做出最終行動(dòng)。

如果我最終的輸出信號(hào)直接是行為的話,那它其實(shí)包含了重建、理解、生成和最后推進(jìn)的所有過(guò)程。只要用更大規(guī)模的數(shù)據(jù)、更大的模型把這個(gè)事做下來(lái),理論上就可以解決這個(gè)問(wèn)題。

Q: 從模型到量產(chǎn),部署方面面臨什么挑戰(zhàn)?

劉先明:這只是一個(gè)demo、一個(gè)模型。從模型到最終量產(chǎn)涉及部署問(wèn)題。除了傳統(tǒng)剪枝量化方法外,更重要的是要把它放在端上、放在芯片上,所以需要低延時(shí)、高幀率、本地化的部署方案。我們做了從模型到軟件到編譯器到硬件的聯(lián)合優(yōu)化和協(xié)同設(shè)計(jì)。

Q: 你們選擇的是世界模型還是VLA路徑?

劉先明:一直有人拿這事問(wèn)我們選的是哪條路徑。其實(shí)本質(zhì)上這兩個(gè)沒(méi)什么太多區(qū)別,都是一種極致的端到端系統(tǒng)。我們更多還是要回歸基礎(chǔ)本質(zhì),去解決基礎(chǔ)本身的問(wèn)題。

Q:"涌現(xiàn)"這個(gè)概念在機(jī)器人領(lǐng)域怎么體現(xiàn)?

米良川:古語(yǔ)講"量變引起質(zhì)變"。我們?nèi)ツ臧l(fā)布之后,采用了最艱難的生成式方式去做控制器。從去年10月份一直到今年3月份都在迭代優(yōu)化。在這個(gè)過(guò)程中整個(gè)團(tuán)隊(duì)包括我自己都經(jīng)常,持續(xù)優(yōu)化數(shù)據(jù)、優(yōu)化各種東西,但總看不到質(zhì)變。3月26號(hào)那天晚上,團(tuán)隊(duì)測(cè)試倒著走的時(shí)候,在監(jiān)控器視頻里看發(fā)現(xiàn)倒著走好像有點(diǎn)意思,那一天就是我們控制器的拐點(diǎn)。

到底哪個(gè)優(yōu)化帶來(lái)這個(gè)變化,說(shuō)不清楚,堅(jiān)持以后突然的飛躍。

Q: 機(jī)器人展示的跳舞和貓步行走,背后是什么技術(shù)?

米良川: 大家看到的貓步行走,用的是我們第三代控制器;剛才大家看到的太極,實(shí)際上是第四代。

Q: 能介紹一下控制器的代際演進(jìn)嗎?

米良川: 最開(kāi)始是model base,大概在2023年左右使用,但實(shí)際上我們?cè)?024年就已經(jīng)把它拋棄了。我們也支持MPCC(模型預(yù)測(cè)控制),這是業(yè)界用得比較多的技術(shù)路線。我們第三代選擇了一個(gè)比較難的路,就是真人模擬——你們看到的貓步也好,自然行走也好,它的步態(tài)和風(fēng)格實(shí)際上是嵌在控制模型里面的。它邁步子本身不是軌跡跟隨或姿態(tài)跟隨,而是生成式的。比如說(shuō)貓步的那個(gè)姿態(tài),怎么走都是貓步,包括左拐右拐。

Q: 你們?yōu)楹芜x擇導(dǎo)覽、導(dǎo)購(gòu)、接待這類(lèi)場(chǎng)景作為切入點(diǎn)?

米良川: 我們判斷以機(jī)器人當(dāng)前的能力狀態(tài),在這些場(chǎng)景能夠產(chǎn)生有效的價(jià)值。同時(shí)在實(shí)際場(chǎng)景中一定會(huì)發(fā)現(xiàn)新問(wèn)題,只有在這種"知行合一"的實(shí)踐過(guò)程中,才可能真正促進(jìn)能力提升。當(dāng)能力提升到一定程度,自然就會(huì)發(fā)現(xiàn)新的應(yīng)用。

Q: 您提到現(xiàn)在的運(yùn)動(dòng)完全是生成式的,是否可以理解為機(jī)器人自主上下臺(tái),背后已經(jīng)沒(méi)有遙控器,已經(jīng)有一個(gè)激活的大模型在工作?

米良川: 機(jī)器人現(xiàn)在的控制原理,包括控制器,是整體支持的。人要操作它,基本上還是要告訴它方向和速度,它只需要這兩個(gè)東西。

方向和速度可以來(lái)自于上層的模型生成,比如我們的導(dǎo)航模型就是方向和它直接對(duì)接的。如果是遙控,實(shí)際上就是一個(gè)人在搖桿操作;如果是既定的編排軌跡,也是這樣的方式。

Q:機(jī)器人量產(chǎn)時(shí)不得不考慮成本問(wèn)題,這一代相比上一代成本有什么變化?

米良川:成本問(wèn)題分成兩部分,一部分是我們能做的,一部分是需要依托整個(gè)行業(yè)的。

我們機(jī)器人的所有螺絲基本都是自研。這給了我們迭代的效率,也給了我們技術(shù)降本的機(jī)會(huì)。但另外一部分,最有效的降本還是等到產(chǎn)業(yè)比較成熟,供應(yīng)鏈能夠共享沉淀下來(lái)。

Q:小鵬機(jī)器人與一些機(jī)器人公司有沒(méi)有合作關(guān)系?

米良川:我們也在努力希望跟更多同行合作,但當(dāng)前階段還是以自研為主。我們的戰(zhàn)略合作伙伴更多是在一些硬件上,包括一些局部技術(shù)上進(jìn)行合作。

本文作者長(zhǎng)期關(guān)注小鵬汽車(chē)動(dòng)態(tài),感興趣的行業(yè)人士歡迎添加作者微信(XY8899672)交流。



近期熱門(mén)文章





特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美民調(diào):特朗普支持率下降,多數(shù)受訪者認(rèn)為美國(guó)朝錯(cuò)誤方向發(fā)展

美民調(diào):特朗普支持率下降,多數(shù)受訪者認(rèn)為美國(guó)朝錯(cuò)誤方向發(fā)展

界面新聞
2026-04-22 12:29:39
牌局終了:王石,潘石屹和許加印

牌局終了:王石,潘石屹和許加印

藍(lán)鉆故事
2026-04-22 01:33:24
《寒戰(zhàn)1994》全陣容正式曝光,把港片半壁江山直接搬上銀幕!

《寒戰(zhàn)1994》全陣容正式曝光,把港片半壁江山直接搬上銀幕!

手工制作阿殲
2026-04-22 14:51:50
股市歌舞升平!有人卻在迎接饑荒

股市歌舞升平!有人卻在迎接饑荒

睿知睿見(jiàn)
2026-04-23 07:24:35
總決賽2-2戰(zhàn)平!核心重傷退場(chǎng),王思雨李緣難救場(chǎng),搶5誰(shuí)能贏?

總決賽2-2戰(zhàn)平!核心重傷退場(chǎng),王思雨李緣難救場(chǎng),搶5誰(shuí)能贏?

老吳說(shuō)體育
2026-04-22 21:28:21
華為把鍵盤(pán)改成了圓的,但這不是為了好看

華為把鍵盤(pán)改成了圓的,但這不是為了好看

全棧遛狗員
2026-04-20 17:46:00
藏在成都的5家“國(guó)寶級(jí)”中醫(yī)院!每一家都有看家本領(lǐng),快收藏

藏在成都的5家“國(guó)寶級(jí)”中醫(yī)院!每一家都有看家本領(lǐng),快收藏

荷蘭豆愛(ài)健康
2026-04-22 19:18:04
別克至境E7上市90分鐘大定突破一萬(wàn)臺(tái) 15.49萬(wàn)元起

別克至境E7上市90分鐘大定突破一萬(wàn)臺(tái) 15.49萬(wàn)元起

CNMO科技
2026-04-22 16:33:02
深圳市委書(shū)記會(huì)見(jiàn)國(guó)資委央企,萬(wàn)億級(jí)資產(chǎn)如何“點(diǎn)石成金”

深圳市委書(shū)記會(huì)見(jiàn)國(guó)資委央企,萬(wàn)億級(jí)資產(chǎn)如何“點(diǎn)石成金”

南方都市報(bào)
2026-04-23 00:26:04
DeepSeek突然更新!

DeepSeek突然更新!

智東西
2026-04-22 18:26:16
糾纏5年后去父留子 ,終于分了。

糾纏5年后去父留子 ,終于分了。

In風(fēng)尚
2026-03-31 17:33:34
偉偉道來(lái) | 備戰(zhàn)

偉偉道來(lái) | 備戰(zhàn)

經(jīng)濟(jì)觀察報(bào)
2026-04-22 14:26:02
全體起立!寧德時(shí)代發(fā)布全新電池:6分鐘充滿!1500km不用充電

全體起立!寧德時(shí)代發(fā)布全新電池:6分鐘充滿!1500km不用充電

DeepAuto車(chē)探
2026-04-22 14:28:32
五代十國(guó),深挖這段被教科書(shū)"刪除"的53年,血腥到不敢拍成電視劇

五代十國(guó),深挖這段被教科書(shū)"刪除"的53年,血腥到不敢拍成電視劇

輿圖司馬
2026-04-06 10:00:08
實(shí)在搞不懂,這么漂亮的女神,為啥也離婚了

實(shí)在搞不懂,這么漂亮的女神,為啥也離婚了

動(dòng)物奇奇怪怪
2026-04-21 17:03:30
張雪自曝供應(yīng)鏈出現(xiàn)危機(jī),正遭遇業(yè)內(nèi)圍剿

張雪自曝供應(yīng)鏈出現(xiàn)危機(jī),正遭遇業(yè)內(nèi)圍剿

童叔不飆車(chē)
2026-04-21 21:50:42
算力租賃:中國(guó)AI新核心資產(chǎn)

算力租賃:中國(guó)AI新核心資產(chǎn)

華爾街見(jiàn)聞官方
2026-04-22 11:44:32
隨著申花2-0海牛+負(fù)10分起步仍7輪不敗,賽后產(chǎn)生了5大難以置信

隨著申花2-0海牛+負(fù)10分起步仍7輪不敗,賽后產(chǎn)生了5大難以置信

夢(mèng)憶之淺
2026-04-23 07:01:28
專(zhuān)挑富人下手的“騙局”:造假18年,收割4萬(wàn)人,700億灰飛煙滅

專(zhuān)挑富人下手的“騙局”:造假18年,收割4萬(wàn)人,700億灰飛煙滅

混沌錄
2026-03-29 22:37:11
39萬(wàn)億債務(wù)中國(guó)拒付,巴西盧拉怒斥聯(lián)合國(guó)

39萬(wàn)億債務(wù)中國(guó)拒付,巴西盧拉怒斥聯(lián)合國(guó)

人生就是要簡(jiǎn)單
2026-04-22 11:19:44
2026-04-23 08:03:00
新智駕 incentive-icons
新智駕
新智駕,讀懂汽車(chē)的未來(lái)。
3767文章數(shù) 4397關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

媒體:聽(tīng)到美國(guó)要查中國(guó)成分 東南亞貿(mào)易代表倒吸冷氣

頭條要聞

媒體:聽(tīng)到美國(guó)要查中國(guó)成分 東南亞貿(mào)易代表倒吸冷氣

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

蜜雪冰城泰國(guó)代言人 被扒出辱華黑歷史

財(cái)經(jīng)要聞

醫(yī)院專(zhuān)家號(hào)"秒空"!警方牽出黑色產(chǎn)業(yè)鏈

汽車(chē)要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
房產(chǎn)
公開(kāi)課

藝術(shù)要聞

藍(lán)得這么美!

親子要聞

兼顧專(zhuān)業(yè)哺喂與綠色環(huán)保,貝親發(fā)布自然實(shí)感凈澈系列奶瓶

旅游要聞

“五一”高性價(jià)比“小城游”熱度攀升 你pick哪座城?

房產(chǎn)要聞

官宣!今年9月起,廣州中小學(xué)“重點(diǎn)班”將成歷史!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版