国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

宇樹科技王興興在浙江上了一堂什么課

0
分享至

從“絕不做人形機(jī)器人”到“All in”,王興興首次自曝“打臉”史。

作者丨YP

編輯丨沈三又

來(lái)源丨盒飯財(cái)經(jīng)(ID:daxiongfan)

封面來(lái)源丨浙江組工

王興興的身份和標(biāo)簽越來(lái)越多,是宇樹科技創(chuàng)始人,是90后企業(yè)家,是“杭州六小龍”之一的掌門人,近期他又成了一名“老師”。


據(jù)“浙江組工”消息,4月10日晚,人工智能通識(shí)及應(yīng)用網(wǎng)絡(luò)專題培訓(xùn)第四課邀請(qǐng)宇樹科技創(chuàng)始人、CEO、CTO王興興,以“機(jī)器人產(chǎn)業(yè)的現(xiàn)狀及發(fā)展趨勢(shì)”為主題,用親身經(jīng)歷分享機(jī)器人產(chǎn)業(yè)發(fā)展案例,從不同角度講述因地制宜發(fā)展新質(zhì)生產(chǎn)力的經(jīng)驗(yàn)。

王興興并不是一個(gè)吝于分享的人,他一直活躍在知乎上,分享他關(guān)注到 Tesla 機(jī)器人 Optimus 的設(shè)計(jì)細(xì)節(jié),講述自己大一寒假如何 200 元手搓了一個(gè)雙足人型機(jī)器人,回答 2021 年春晚上的機(jī)器牛和波士頓動(dòng)力機(jī)器牛的區(qū)別,關(guān)注模型訓(xùn)練的穩(wěn)定性。

但他鮮少出現(xiàn)在講臺(tái)上、直播間,這樣系統(tǒng)地和大家分享他理解的 AI 和機(jī)器人。2025 年春節(jié)聯(lián)歡晚會(huì)上,全國(guó)人民都看到了宇樹科技的人形機(jī)器人,但大眾并不知曉,在 2023 年之前,王興興的態(tài)度一直是“絕對(duì)不做人形機(jī)器人”。究竟是什么扭轉(zhuǎn)了他的理念?這次分享中他也首次正式闡述了背后的思考。

他對(duì) AI 和機(jī)器人的理解,有著濃重的“王興興”特點(diǎn)——搭建 AI 如同造房子,邏輯和 Transformer 架構(gòu)中的多頭注意力機(jī)制底層很相似。他的思維是跳躍的,直播中,嘴巴總是跟不上腦子;也因?yàn)樽约鹤哌^(guò)學(xué)習(xí)的彎路,他在這樣的講臺(tái)上一遍遍建議小孩子也可以“玩”AI。

在演講中,王興興還用“接地氣”的語(yǔ)言和概念向浙江干部們解釋了 AI 和機(jī)器人的一些技術(shù),并分享了自己對(duì)產(chǎn)業(yè)的判斷及思考。

本文根據(jù)王興興的直播整理,核心觀點(diǎn)如下。

1. 人形機(jī)器人發(fā)展還比較早期,馬上要在工廠或家里用起來(lái),在全球范圍內(nèi)還是一件不太現(xiàn)實(shí)的事。 2. 人能做到的事情,人形機(jī)器人理論上都能做。 3. 目前AI入門基本0門檻,不需要花錢,小學(xué)生也可以玩。如果從小開(kāi)始玩?zhèn)€十年,肯定是可以玩得很好,而且也不需要有心理負(fù)擔(dān)。 4. 通俗講,深度神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,和建造一個(gè)房子很像。我們?cè)旆孔訒r(shí),用現(xiàn)成的磚頭、水泥、鋼筋,只要把它搭起來(lái)就行了。你拿它里面的一些模塊,把它拼在一起,就可以構(gòu)造一個(gè)神經(jīng)網(wǎng)絡(luò)。 5. AI體系跟邏輯推理的本質(zhì)很接近。大語(yǔ)言模型目前都是建立在 Transformer 架構(gòu)中的多頭注意力機(jī)制的基礎(chǔ)上,和邏輯推理非常接近。

以下為王興興分享實(shí)錄(有刪改,未經(jīng)本人審核):

1. “我們絕對(duì)不做人形機(jī)器人”

我是宇樹科技的創(chuàng)始人兼CEO王興興,我們公司成立于2016年,到現(xiàn)在為止差不多快9年了。早些年,我們主要做高性能的機(jī)器狗,2023年開(kāi)始做人形機(jī)器人。

2013年到2016年,當(dāng)時(shí)在上海大學(xué)讀書期間做的XDog這款小型純電驅(qū)動(dòng)的四足機(jī)器人。這款機(jī)器人開(kāi)創(chuàng)了全球低成本高性能足式機(jī)器人技術(shù)方案的先河,比BD(Boston Dynamics,美國(guó)波士頓動(dòng)力公司)早一年公布。

來(lái)源:王興興賬號(hào)知乎截圖


為什么這么說(shuō)?

這款機(jī)器人本身成本是比較低的。大概是2013年大學(xué)期間,我想到了這個(gè)技術(shù)方案,又覺(jué)得它值得商業(yè)化,所以想著要不要要輟學(xué)創(chuàng)業(yè)。我們這一代人聽(tīng)著很多輟學(xué)創(chuàng)業(yè)的故事長(zhǎng)大,當(dāng)時(shí)我也萌生了這個(gè)念頭。不過(guò)當(dāng)時(shí)也只是想想,因?yàn)槟莻€(gè)時(shí)候產(chǎn)品沒(méi)做出來(lái),也沒(méi)有什么資源和資金。


2013年到2016年期間,我把這款機(jī)器人做出來(lái)了。2015年,我?guī)е@款機(jī)器人在上海參加了一個(gè)比賽,拿了二等獎(jiǎng),賺了8萬(wàn)塊獎(jiǎng)金。因?yàn)檠邪l(fā)投入大概是1~2萬(wàn)元,所以這也算是我賺的第一桶金。


剛參加比賽時(shí),這款機(jī)器人還只做了一半,比賽過(guò)程中慢慢繼續(xù)做。到了決賽,這款機(jī)器人基本上可以下地走路了。這款機(jī)器人涉及到的電控技術(shù)、電路板、控制算法、機(jī)械結(jié)構(gòu)等技術(shù)都是我一個(gè)人做的,所以哪怕我花的時(shí)間比較多,但也收到了不錯(cuò)的結(jié)果。


2016年左右,我們?cè)趪?guó)際上全球機(jī)器人圈火了一把,有人愿意買我的機(jī)器人、有人愿意投資,后來(lái)才有了辭職出來(lái)創(chuàng)業(yè)的事。


大家也知道,過(guò)去幾年,國(guó)內(nèi)外四足機(jī)器人、人形機(jī)器人都比較火。那陣子很多用的很多都是MIT Cheetah mini(麻省理工學(xué)院研發(fā)的四足機(jī)器人)的開(kāi)源方案。這個(gè)方案是在2018年左右開(kāi)源的,開(kāi)源以后很多國(guó)內(nèi)外公司用它的方案去做機(jī)器狗、人形機(jī)器人。

實(shí)際上,開(kāi)源方案里用的電機(jī)和我用的電機(jī)是一模一樣的。2015年左右,MIT的教授發(fā)現(xiàn)我這樣一個(gè)學(xué)生也可以用這種低成本的方案做出一個(gè)性能比較好的機(jī)器狗出來(lái),所以他就重新做了一個(gè)方案出來(lái),然后又把它開(kāi)源了。

這也是為什么我們公司在過(guò)去幾年,在全球范圍內(nèi)大家對(duì)我們的認(rèn)可度相對(duì)比較高。


這是非常難得的一件事情,也是時(shí)代給我們的機(jī)會(huì)。很多領(lǐng)域,要在全球獲得真正的有知名度或認(rèn)可度是非常難的。很多品類里有公司把這部分市場(chǎng)做了,哪怕后面產(chǎn)品價(jià)格很低且性能很好,很多情況大家都不認(rèn)可,覺(jué)得你不是開(kāi)創(chuàng)性的。但唯獨(dú)我們這個(gè)領(lǐng)域,因?yàn)槲覀児镜募夹g(shù)方案、產(chǎn)品等,在全球范圍內(nèi)做的都比較早,大眾對(duì)我們的認(rèn)可度一直比較高。

2023年初,宇樹開(kāi)始做人形機(jī)器人。


我個(gè)人一直比較喜歡機(jī)器人,大概在2009年大一的時(shí)候,我就做一個(gè)小的雙足機(jī)器人,制作那個(gè)機(jī)器人大概花了我200元。但是做好了以后,我發(fā)現(xiàn)當(dāng)時(shí)的技術(shù)和效果都不太理想,所以后面很多年我都沒(méi)有再做人形機(jī)器人。


2019年、2022年有人問(wèn)我,“你們公司要不要做人形機(jī)器人”。面對(duì)這些問(wèn)題,我都是直接給出了否定的答案,說(shuō)“我們絕對(duì)不做人形機(jī)器人”。從當(dāng)時(shí)AI技術(shù)和工程技術(shù)的發(fā)展程度來(lái)看,做(人形機(jī)器人)是比較吃力不討好的,效果不太好,又比較貴。


那為什么宇樹又在2023年大力做人形機(jī)器人呢?


原因比較簡(jiǎn)單,就是在2021~2022年,整個(gè)機(jī)器人和AI技術(shù)進(jìn)步比較快。尤其海外幾家大的巨頭公司,他們對(duì)人形機(jī)器人這塊更加專注和投入了。簡(jiǎn)單來(lái)說(shuō),就是需求建立起來(lái)了,大家更加關(guān)注人形機(jī)器人,更加喜歡人形機(jī)器人,并且整個(gè)AI的技術(shù)也差不多快要到一個(gè)臨界點(diǎn)了。


我們判斷這是非常好的一個(gè)時(shí)間節(jié)點(diǎn)。


大家可能想象不到,在宇樹做人形機(jī)器人之前,2022年底就有人找我們下訂單。我們還沒(méi)有做,就有人愿意買我們的人形機(jī)器人,所以覺(jué)得值得做。原因也比較簡(jiǎn)單,沒(méi)有大家想的那么復(fù)雜。


2023年8月,我們發(fā)布了第一款人形機(jī)器人。這款機(jī)器人當(dāng)時(shí)大概花了半年多時(shí)間,效率非???。2023年下半年,我們完成了小批量量產(chǎn)。我記得大概在2023年10月,我們就把機(jī)器人的貨發(fā)到美國(guó),效率還是非常高的。


為什么我們效率會(huì)比較快呢?


我們之前做機(jī)器狗的累積,涉及到的關(guān)鍵電機(jī)、電池、動(dòng)力系統(tǒng)、控制算法都是現(xiàn)成的。


可以看到,在國(guó)內(nèi)我們公司做人形機(jī)器人不是最早的,甚至相對(duì)晚一些,但是目前來(lái)看我們的出貨量、性能在全球范圍內(nèi)都有很強(qiáng)的競(jìng)爭(zhēng)性。因?yàn)樵谧鰴C(jī)器人這件事上,我們從硬件、軟件、生產(chǎn)等方面都有深厚的累積。


當(dāng)時(shí)發(fā)布的時(shí)候,這款H1機(jī)器人還刷新了幾個(gè)指標(biāo)。去年3月,H1就實(shí)現(xiàn)了原地的空翻,是世界首個(gè)可原地空翻全尺寸電驅(qū)人形機(jī)器人。去年5月我們發(fā)布了第二款人形機(jī)器人G1,它外觀好看很多,而且它的關(guān)節(jié)自由度、關(guān)節(jié)舒展、傳感器都是非常領(lǐng)先,同時(shí)相對(duì)價(jià)格也比較低。

2. 為什么要做人形機(jī)器人

目前,人形機(jī)器人發(fā)展還是比較早期,馬上要在工廠或者家里用起來(lái),在全球范圍內(nèi)都還是一件不太現(xiàn)實(shí)的事。但像這款機(jī)器人,我們目前有一部分市場(chǎng)已經(jīng)開(kāi)始做起來(lái)了,像一些科研教育、AI公司和一些娛樂(lè)活動(dòng)的展示。

到現(xiàn)在為止,大家在網(wǎng)上還是爭(zhēng)論為什么要做人形機(jī)器人,有的人贊同,有的人反對(duì),但從全球頭部公司創(chuàng)始人到政府都很關(guān)注這一塊。這個(gè)趨勢(shì)是不可阻擋的。

(1)結(jié)構(gòu)最簡(jiǎn)單的通用機(jī)器人

早些年大家做的AI,都是單功能的AI,比如識(shí)別一個(gè)數(shù)字,識(shí)別一個(gè)文字,識(shí)別一個(gè)音頻。但到現(xiàn)在為止,大家希望一個(gè)AI模型能把所有的功能都集合在一起,它可以自由的調(diào)度,能做任何事情,這是大家正在推進(jìn)的通用AI。

機(jī)器人也一樣,就是配合通用AI我們需要一個(gè)通用機(jī)器人。因?yàn)閷S眯偷臋C(jī)器我們已經(jīng)做了很多了,比如工廠里的、家庭洗衣做飯的,現(xiàn)在我們需要通用型的機(jī)器人配合通用AI。大家回頭發(fā)現(xiàn)人形機(jī)器人反而是最簡(jiǎn)單的通用機(jī)器人。

可能很多人覺(jué)得人形機(jī)器人很復(fù)雜。實(shí)際上,人形機(jī)器人一點(diǎn)都不復(fù)雜。為什么呢?

人形機(jī)器人,你可以認(rèn)為就是把幾個(gè)關(guān)節(jié)拿幾個(gè)連桿組合在一起,構(gòu)成一個(gè)人形機(jī)器人,沒(méi)有比人形機(jī)器人更經(jīng)典的通用機(jī)器人了。不然的話,如果你要做成一只蜘蛛、做成其他的形態(tài),難度其實(shí)要比做人形機(jī)器人還要大。甚至,如果未來(lái)通用AI很成熟的時(shí)候,沒(méi)準(zhǔn)哪一天,比如說(shuō)一個(gè)小朋友在垃圾堆里撿幾個(gè)電機(jī)、撿幾個(gè)連桿裝在一起,隨便下個(gè)程序就能跑了,一個(gè)機(jī)器人成型。


(2)人更喜歡長(zhǎng)得像人的機(jī)器人,更有情緒價(jià)值


因?yàn)樗L(zhǎng)得更像人,所以它還具備除了機(jī)器以外的附加價(jià)值。比如表演、服務(wù)、還有去到一些人能去的一些地方。如表演這樣的功能,其實(shí)就包含了情緒價(jià)值。

(3)方便數(shù)據(jù)采集

現(xiàn)在的AI都是靠數(shù)據(jù)采集來(lái)驅(qū)動(dòng)的,數(shù)據(jù)質(zhì)量好一點(diǎn),AI效果就好一點(diǎn)。目前數(shù)據(jù)采集只能靠人,這種時(shí)候肯定是長(zhǎng)得像人的東西去采集更好一點(diǎn)。如果你要映射到一只蜘蛛、一只豬或者別的形態(tài)的機(jī)器人上,其實(shí)就很難映射,把這個(gè)數(shù)據(jù)給這種機(jī)器用也很難用。如果這個(gè)機(jī)器人長(zhǎng)非常像人,那么最后采集數(shù)據(jù)和訓(xùn)練數(shù)據(jù)就會(huì)變得非常容易。

(4)可以處理需要人處理的各種事

目前自然環(huán)境中,人的越障能力都是非常好。比如說(shuō)人可以通過(guò)一些很狹窄的或很崎嶇的地方,別的一些形態(tài)就不一定。人作為靈長(zhǎng)類的動(dòng)物,它的通過(guò)能力、運(yùn)動(dòng)能力都算是卓越的。所以這也是為什么做成人形機(jī)器人相對(duì)比較好。舉個(gè)例子,如果你現(xiàn)在把一個(gè)機(jī)器人做成車或者做成別的樣子,你讓一輛車翻過(guò)一個(gè)墻,怎么翻呢,對(duì)吧。


人能做的事情,人形機(jī)器人理論上都能做。以上四點(diǎn)是我個(gè)人想到相對(duì)比較直接的原因。

3.國(guó)內(nèi)外人形機(jī)器人的產(chǎn)業(yè)現(xiàn)狀

過(guò)去一兩年,國(guó)家對(duì)機(jī)器人行業(yè)非常重視和支持。今年年初開(kāi)始,尤其是今年2月,國(guó)內(nèi)人形機(jī)器人包括整個(gè)機(jī)器人行業(yè),都是熱火朝天。

簡(jiǎn)單來(lái)說(shuō),不單單是我們公司,就是所有我知道的(公司),過(guò)去哪怕可能都已經(jīng)虧損很嚴(yán)重、快要撐不下去的機(jī)器人公司,今年訂單業(yè)務(wù)都非常不錯(cuò),相關(guān)行業(yè)的表現(xiàn)也很不錯(cuò)。很多傳統(tǒng)行業(yè)的老板或傳統(tǒng)行業(yè)的人都開(kāi)始想,我能不能在工廠里或商店里使用機(jī)器人?需求和消費(fèi)情緒都開(kāi)始被點(diǎn)燃了。

當(dāng)然可能里面也有一些盲目的成分。需求端被點(diǎn)燃肯定是一個(gè)好事,但大家也要保持一些克制,因?yàn)槟壳按蠹蚁胍男枨?,可能有些是機(jī)器人還辦不到的,可能還有點(diǎn)偏差。

過(guò)去幾年,海外也是一直非常熱,包括特斯拉、英偉達(dá)和其他頭部科技公司對(duì)人形機(jī)器人都很關(guān)注。

比如OpenAI,去年開(kāi)始他就是開(kāi)始想做機(jī)器人AI,今年年初,他們自己在招做機(jī)器人硬件的人。但是確實(shí)目前整個(gè)機(jī)器人AI還是沒(méi)有到達(dá)突破的臨界點(diǎn)。目前每個(gè)月機(jī)器人AI都在進(jìn)步,但在還沒(méi)有達(dá)到真正大規(guī)模在工業(yè)還是家庭應(yīng)用的臨界點(diǎn)。

現(xiàn)在類似什么情況呢?

有點(diǎn)像ChatGPT出來(lái)前一兩年,大家已經(jīng)發(fā)現(xiàn)了這種技術(shù)方向,正在做的過(guò)程中,但還沒(méi)有做出來(lái)。對(duì)于普通消費(fèi)者來(lái)說(shuō),可能如果你真的要家用,不是當(dāng)下一兩年就能用的。

目前機(jī)器人AI行業(yè)發(fā)展如何呢?

比如說(shuō)你想在工廠、在農(nóng)業(yè)場(chǎng)景,或者如礦業(yè)這樣這樣比較辛苦或危險(xiǎn)的場(chǎng)景使用機(jī)器人,現(xiàn)在最大的問(wèn)題就是機(jī)器人AI還沒(méi)有達(dá)到突破的臨界點(diǎn),反而硬件是個(gè)相對(duì)小的問(wèn)題。當(dāng)然,硬件目前做得肯定還不夠完善,但它不是一個(gè)限制性因素。某種程度上,硬件方面的本體已經(jīng)夠用了或者能用了,但未來(lái)幾年需要做得更好。

但這些不是本質(zhì)上的問(wèn)題,本質(zhì)的問(wèn)題還是機(jī)器人AI模型做得不太夠,而且機(jī)器人AI模型和目前的大語(yǔ)言模型還不是同一種東西。我們可以簡(jiǎn)單理解為,機(jī)器人的AI模型更多偏向干活。

4. AI模型的基本邏輯規(guī)則

下面我簡(jiǎn)單介紹一下AI,方便大家了解。另外,如果家里有小朋友,我非常鼓勵(lì)小學(xué)或者初中的學(xué)生都可以學(xué)一下AI相關(guān)的內(nèi)容。

首先提出一個(gè)點(diǎn),就是邏輯推理的本質(zhì)。

這也是我高中時(shí)思考的一個(gè)點(diǎn)。大家在討論邏輯的時(shí)候,比如說(shuō)這個(gè)人邏輯思維比較好,到底什么是邏輯?總結(jié)起來(lái)也是比較簡(jiǎn)單的,其實(shí)就是通過(guò)一些概念和規(guī)則連接在一起。比如有A、B、C、D這幾個(gè)概念和相應(yīng)的很多規(guī)則,那A跟B有什么關(guān)系???B跟C有什么關(guān)系?相互可以推導(dǎo)。

所以很多情況下,比如要學(xué)一個(gè)新的知識(shí)點(diǎn),其實(shí)也比較簡(jiǎn)單。比如說(shuō)我要學(xué)新的概念C這個(gè)知識(shí)點(diǎn),我只要用我自己比較熟悉的概念B和D的知識(shí)點(diǎn)把這個(gè)規(guī)則給推導(dǎo)出來(lái)就行了。

這樣你對(duì)整個(gè)新知識(shí)點(diǎn)的記憶和理解是比較深的,而且某種程度上你學(xué)東西可以越來(lái)越快。再舉個(gè)例子,如果你學(xué)了某個(gè)知識(shí)點(diǎn),但過(guò)了五年到十年后忘記了,你還可以把概念B和概念C重新推導(dǎo)出來(lái)。

我在介紹AI前,為什么要說(shuō)這個(gè)?原因比較簡(jiǎn)單,目前的整個(gè)AI體系跟這張圖很接近。大語(yǔ)言模型目前都是建立Transformer架構(gòu)中的多頭注意力機(jī)制的基礎(chǔ)上,和這張圖的非常接近。

來(lái)源:直播截圖


另外一點(diǎn),目前的AI都采用的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。就是有一層層的神經(jīng)網(wǎng)絡(luò),然后里面有一個(gè)個(gè)神經(jīng)元,就是一神經(jīng)元、二神經(jīng)元、三神經(jīng)元,這是作為一層。再有第二層又是一個(gè)神經(jīng)元,一個(gè)神經(jīng)元,然后有第三層。里面每一層之間有一根線連接在一起,這個(gè)線其實(shí)也比較簡(jiǎn)單,就是全連接。這個(gè)模型目前也是全世界用的最多的、最基礎(chǔ)的模型,叫全連接層。

什么叫全連接層?就是每一根線出來(lái)把所有的線都連一遍,就是一把一、二、三全連一遍,二把一、二、三全連一遍,這是目前最常用的模型。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(1),來(lái)源:直播截圖


簡(jiǎn)單理解,就是一個(gè)圓圈里面就是一個(gè)數(shù)學(xué)公式。最簡(jiǎn)單的一個(gè)神經(jīng)元的構(gòu)造就是,輸入和輸出。比如,輸入a、b、c,輸出有y,然后每次計(jì)算時(shí),就是a×Wa、b×Wb、c×Wc,乘一下,然后再加一個(gè)激活函數(shù)就輸出了。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(2),來(lái)源:直播截圖


打個(gè)比方,大家在玩AI的時(shí)候,輸入一段文字,比如今天星期幾?輸入A、B、C,然后他算一下就把星期幾給輸出了。然后里面就是每一個(gè)數(shù)學(xué)公式。

從某種程度上,你可以換成任何函數(shù),可以把這個(gè)函數(shù)換成復(fù)雜一點(diǎn)。所以你如果要發(fā)表一篇比較簡(jiǎn)單的AI論文,要怎么做呢?把這個(gè)函數(shù)換一下,然后做一些實(shí)驗(yàn),測(cè)試哪個(gè)函數(shù)效果比較好,接著你就可以發(fā)表論文了。

目前最常用的神經(jīng)網(wǎng)絡(luò)就是這種,沒(méi)有大家想的那么難,只不過(guò)實(shí)際應(yīng)用的時(shí)候還有點(diǎn)麻煩。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(3),來(lái)源:直播截圖


這里有兩個(gè)概念,前向傳播和反向傳播。剛才提到的,從輸入A、B、C算一遍到輸出,就是一個(gè)前向傳播的過(guò)程。簡(jiǎn)單來(lái)說(shuō),就是做了個(gè)數(shù)學(xué)函數(shù),就是y=f(x)。

前向傳播,就是訓(xùn)練好后,我在調(diào)用它,讓它干活的時(shí)候再這么做。那我訓(xùn)練的時(shí)候怎么訓(xùn)練呢?這里就是反向傳播。反向傳播其實(shí)就是求導(dǎo)數(shù),就是y'=f'(x),這個(gè)就是自動(dòng)微分的過(guò)程,就是做了個(gè)梯度下降。


怎么理解?比如我前面有座山,我要去爬山,那有什么比較好的路線可以上山,把它找來(lái)。比較簡(jiǎn)單的理解,就是把這個(gè)山的梯度(斜率)給求出來(lái)。因?yàn)槲乙吹竭@個(gè)山的哪個(gè)地方比較陡、哪個(gè)地方比較緩,比較陡和比較緩的地方先找出來(lái)以后,就可以發(fā)現(xiàn)這條路可以從什么地方上去和下來(lái)。


反向傳播的求導(dǎo)就做了這件事情,就是我們有好多山,通過(guò)反向傳播求導(dǎo)以后,我就可以把這些路徑給查出來(lái),就是怎么從y到x的路徑搜索出來(lái)。


大家可能覺(jué)得自動(dòng)微分比較復(fù)雜,實(shí)際上你不需要做,因?yàn)橛泄ぞ吣軒湍阕龊谩_@也是我剛才提到的,鼓勵(lì)小學(xué)生都去玩一下AI。很多情況下,你不需要裝軟件,打開(kāi)一個(gè)網(wǎng)頁(yè)就可以直接編程,很多的工具都比較現(xiàn)成。

5. 小學(xué)生也能建AI模型

目前比較常用的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心工具PyTorch。這個(gè)工具是目前全世界用的最多的AI工具,也是一個(gè)開(kāi)源工具。

PyTorch這個(gè)工具的功能有哪些?

第一,批量數(shù)據(jù)的處理和加載。目前的AI都需要用海量采集來(lái)的數(shù)據(jù)訓(xùn)練,這個(gè)時(shí)候數(shù)據(jù)的管理和整理都是非常麻煩的一件事情,而這個(gè)工具具有數(shù)據(jù)的管理和整理功能。

第二,深度神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建。上面我們也了解了一些神經(jīng)網(wǎng)絡(luò)最基本的原理,那我們要如何搭建經(jīng)網(wǎng)絡(luò)?其實(shí)就和我們搭積木一樣,而這個(gè)搭載過(guò)程中這個(gè)工具已經(jīng)構(gòu)造好了。

通俗易懂一點(diǎn),你要構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò),這和建造一個(gè)房子很像。目前我們?cè)旆孔訒r(shí),就有很多磚頭、水泥、鋼筋,這些已經(jīng)有現(xiàn)成的了,你只要把它搭起來(lái)就行了。你拿它里面的一些模塊,把它拼在一起,你就可以自己構(gòu)造一個(gè)神經(jīng)網(wǎng)絡(luò)了。

第三,自動(dòng)訓(xùn)練。神經(jīng)網(wǎng)絡(luò)構(gòu)造好了后,剩下的比如自動(dòng)微分、自動(dòng)訓(xùn)練,你只要“吊”一兩行程序,整個(gè)過(guò)程全自動(dòng)幫你做好了。構(gòu)建神經(jīng)網(wǎng)絡(luò)的時(shí)候你會(huì)發(fā)現(xiàn),這就像搭積木,搭著搭著,可能就倒了。所以在做一些實(shí)驗(yàn)時(shí),如果發(fā)現(xiàn)這個(gè)“積木”搭出來(lái)效果不錯(cuò),那你就可以保留下來(lái)。

來(lái)源:直播截圖


大家如果有興趣,或者家里的小朋友,我這里推薦幾個(gè)工具。這里提供幾個(gè)國(guó)內(nèi)外的平臺(tái),你只要打開(kāi)網(wǎng)站注冊(cè)好就能用了,而且它的GPU少量使用是免費(fèi)的。你只要打開(kāi)網(wǎng)站,輸入幾行代碼就可以做AI訓(xùn)練了,包括有些數(shù)據(jù)工具都是現(xiàn)成的,這也是我自己用的比較多的工具。

目前整個(gè)AI的入門門檻是比較低的,就是基本0門檻,不需要花錢,小學(xué)生也可以玩。如果從小開(kāi)始玩,玩?zhèn)€十年,那肯定是可以玩得很好了,而且也不需要有心理負(fù)擔(dān)。打個(gè)比方,如果現(xiàn)在市面上的一些AI模型是“摩天大樓”的話,那我可以先造個(gè)小房子出來(lái),這是完全沒(méi)問(wèn)題的。


那我現(xiàn)在如果真的要造一個(gè)“摩天大樓”出來(lái),要怎么做呢?我肯定要有圖紙,對(duì)吧?目前大家已驗(yàn)證用得比較多的“圖紙”,目前全球最前沿AI模型架構(gòu),大家比較公認(rèn)的模型的搭建方式,主要有以下三種。


第一,擴(kuò)散模型。這種目前主要用來(lái)干嘛呢?主要是用來(lái)畫畫的,生成一張比較漂亮的圖片,生成一個(gè)視頻,用得最多的是擴(kuò)散模型。


擴(kuò)散模型這個(gè)名字也比較簡(jiǎn)單、直觀。什么叫擴(kuò)散?如果我有一杯清水,我在這個(gè)水杯里點(diǎn)了一滴墨水進(jìn)去,這個(gè)墨水就會(huì)擴(kuò)散。兩個(gè)是同一個(gè)意思,就是我把一個(gè)規(guī)則的物體擴(kuò)散成一個(gè)有很多噪聲或者很多噪聲的東西,然后重新收斂到一個(gè)比較規(guī)則的東西里去,這就是一個(gè)擴(kuò)散的過(guò)程。再打個(gè)比方,比如一張照片本身是很清晰的,然后把它變得很模糊,接著把這個(gè)過(guò)程再映像一下,就變成AI的一個(gè)生成過(guò)程。


但目前來(lái)看,擴(kuò)散模型我個(gè)人感覺(jué)還是有一定的局限性,所以目前主要還是畫畫用的比較多。


第二,GPT等為代表的LLM大語(yǔ)言模型。這個(gè)模型更為主流一些,LLM大語(yǔ)言模型目前基本以Transformer架構(gòu)構(gòu)建的,就是多頭注意力機(jī)制。我后面會(huì)詳細(xì)介紹下。


第三,強(qiáng)化學(xué)習(xí),PPO、GRPO等。目前,強(qiáng)化學(xué)習(xí)也是最主流的方向之一,像我們機(jī)器人用的都是強(qiáng)化學(xué)習(xí)。比如DeepSeek,目前大語(yǔ)言模型也在做強(qiáng)化學(xué)習(xí)。


為什么大語(yǔ)言模型需要強(qiáng)化學(xué)習(xí)?原因也比較簡(jiǎn)單,因?yàn)閭鹘y(tǒng)的語(yǔ)言模型的架構(gòu)就是,有多好的訓(xùn)練數(shù)據(jù)集就有多好的結(jié)果。如果我的數(shù)據(jù)集不好,那結(jié)果也比較糟糕;我的訓(xùn)練數(shù)據(jù)集的質(zhì)量很好,那我的訓(xùn)練效果也很好。

但是,這是有極限的,輸出的結(jié)果不可能比你訓(xùn)練的數(shù)據(jù)質(zhì)量還好。那我怎么才能進(jìn)一步提升AI模型的輸出能力呢?就是必須得用強(qiáng)化學(xué)習(xí)。今年年初爆火的DeepSeek,最大的點(diǎn)就是很好得把強(qiáng)化學(xué)習(xí)用出來(lái)了。他們自己開(kāi)發(fā)了一個(gè)強(qiáng)化學(xué)習(xí)算法,可以把真正的,比如說(shuō)一些數(shù)學(xué)推理做得更好一點(diǎn)。


個(gè)人感覺(jué),未來(lái)的幾年強(qiáng)化學(xué)習(xí)會(huì)成為整個(gè)AI的最主流方向。

6. GPT LLM大語(yǔ)言模型、強(qiáng)化學(xué)習(xí)與VLA模型

(1)GPT LLM大語(yǔ)言模型


目前,語(yǔ)言模型的架構(gòu)相對(duì)比較直觀和精簡(jiǎn)。在做的各位,包括我本身也不是搞語(yǔ)言模型,有些太深的點(diǎn)我們也不用太多了解,大概了解一些基礎(chǔ)的點(diǎn)就行了。

來(lái)源:直播截圖

目前的語(yǔ)言模型,簡(jiǎn)單來(lái)說(shuō)就是用一個(gè)編碼層和解碼層(構(gòu)成的)。編碼層,比如我打開(kāi)加一個(gè)word文檔,里面每一個(gè)漢字或一個(gè)漢字拼音都是用大概兩個(gè)字節(jié)來(lái)編碼的,兩個(gè)字節(jié)我就可以編碼一個(gè)漢字。但是做AI的時(shí)候,肯定是行不通的。那目前大家做AI的時(shí)候怎么做呢?先要把一個(gè)編碼、一個(gè)漢字或一個(gè)字母變成一個(gè)向量,就是我要把它重新編碼一下。比如說(shuō)“今天晚上有點(diǎn)熱”這幾個(gè)漢字,每個(gè)漢字編碼成一個(gè)向量。后面我再做一下多頭注意力機(jī)制。


多頭注意力機(jī)制是干嘛的?就是算一下向量的相關(guān)性。


某種意義上,注意力機(jī)制就是求一下相關(guān)性。相關(guān)性求好了以后再把它輸出,然后再重新解碼一下,就變成輸出了整個(gè)過(guò)程也相對(duì)比較直觀。我每一個(gè)概念或規(guī)則其實(shí)有一個(gè)向量,每個(gè)概念再求一下每個(gè)向量的相關(guān)性,就可以推導(dǎo)出每個(gè)向量之間的邏輯推理。


但是真正要做一個(gè)比較復(fù)雜的模型出來(lái),肯定會(huì)涉及到很多公式上的問(wèn)題。因?yàn)橐煲粋€(gè)小的房子出來(lái)和建一個(gè)摩天大樓,本身還有很多技術(shù)上和工程上的問(wèn)題要解決,工作量也是非常大的。


(2)強(qiáng)化學(xué)習(xí)(用策略模型和獎(jiǎng)勵(lì)函數(shù)代替模型反向傳播誤差)


強(qiáng)化學(xué)習(xí)并不是一個(gè)單純的算法,某種程度上,強(qiáng)化學(xué)習(xí)是一個(gè)思維的、概念的問(wèn)題。


說(shuō)得簡(jiǎn)單一點(diǎn),強(qiáng)化學(xué)習(xí)就是試錯(cuò),比如我往前走一步可能摔倒了,我遇到了什么狀況,然后我把每次試錯(cuò)的最好結(jié)果給保留下來(lái),把不好的結(jié)果給丟了就行。比如在仿真環(huán)境里試錯(cuò)時(shí),試一百萬(wàn)次、一億次,我總是有一些好的結(jié)果的,對(duì)吧?那我就把這些好的結(jié)構(gòu)都給保留下來(lái)。


(3)當(dāng)下潛力最大的具身智能模型VLA模型?


目前整個(gè)的具身智能模型比較主流的模型:VLA模型。某種程度上,VLA模型就是在大語(yǔ)言模型的基礎(chǔ)上加了一些東西。比如說(shuō)?Llama的模型,傳統(tǒng)的語(yǔ)言模型都是用文字,輸入是文字,輸出也是文字,它的整個(gè)架構(gòu)通用性很不錯(cuò)。

來(lái)源:直播截圖


那它既然可以輸入文字,那我就可以把文字給編碼,把一個(gè)漢字編碼成一個(gè)向量,那我為什么不能把圖片和圖像也編碼一下呢?


這個(gè)思路也很簡(jiǎn)單,就是我在輸入端加一個(gè)圖片或一些視頻編碼器,我加在頭端,然后和文字的向量放在一起,做一下交叉注意力就可以了。


VLA,V就是視覺(jué)模型,L就是語(yǔ)言模型,A就是執(zhí)行器模型。什么是執(zhí)行器的模型?一般的語(yǔ)言模型輸出的是文字,在輸出的文字前,再加一個(gè)神經(jīng)網(wǎng)絡(luò),比如最簡(jiǎn)單的是說(shuō),我把全鏈接層加上去,加上去以后就可以輸出一些機(jī)器的控制指令,比如關(guān)節(jié)的運(yùn)動(dòng)指令、執(zhí)行指令。VLA的架構(gòu)也相對(duì)比較簡(jiǎn)單直觀。

7. 未來(lái),真正的AGI需要實(shí)物機(jī)器人

現(xiàn)在智能機(jī)器人技術(shù)最重要的是什么?


第一就是,統(tǒng)一,端到端智能機(jī)器人大模型。就是需要一個(gè)更好的機(jī)器人模型去做,可能就是剛才提到的VLA模型就可以了,但是VLA模型個(gè)人感覺(jué)還是有很多的局限性。


第二,更低成本、更高壽命的硬件,及超大批量的制造。簡(jiǎn)單來(lái)說(shuō),就是要生產(chǎn)很多人形機(jī)器人,或者很多別的各種各樣的機(jī)器人出來(lái),就要要成本低,且性能也要很好。

第三,低成本、大規(guī)模算力。如果機(jī)器人的數(shù)量達(dá)到一定規(guī)模,比如當(dāng)幾百萬(wàn)或者上億都需要配置算力時(shí),那對(duì)算力低成本要求是非常高的。

現(xiàn)在很多情況下,大家在強(qiáng)調(diào)AI的時(shí)候,脫離了物理機(jī)器人去強(qiáng)調(diào)AI。我在這里想提出的,也是我去年一直提出的一個(gè)點(diǎn),就是物理機(jī)器人對(duì)AI也是非常重要的。這是我個(gè)人的判斷,可能是錯(cuò)誤的,但這是我非常相信的一個(gè)點(diǎn)。對(duì)于真正的AGI(通用人工智能)、真正的通用機(jī)器人來(lái)說(shuō),物理機(jī)器人非常非常重要。

為什么“身體”非常重要?目前很多的AI模型,它沒(méi)有身體,它和真實(shí)世界是脫離交互的,它不能很好地去感知這個(gè)世界。它不能感知這個(gè)空間,感知桌子的碰撞等感受。

舉個(gè)例子,為什么夢(mèng)里跑不快?比如我小時(shí)候睡覺(jué)做噩夢(mèng)的時(shí)候,有怪物追我,我在前面跑,但是我一直感覺(jué)很吃力地在跑,但跑不快。我在大學(xué)的時(shí)候想過(guò),原因比較簡(jiǎn)單,就是人在睡覺(jué)的時(shí)候,你的大腦和身體斷開(kāi)了連接。

清醒狀況下,我們跑步時(shí),每次跑到地面都是有反饋,所以我知道我的腳踩到地面上了。但做夢(mèng)時(shí),因?yàn)樯眢w和大腦是斷開(kāi)連接的,我不知道自己踩到地面上去了,會(huì)覺(jué)得我的腳是踩到空氣里面,所以我跑不快。

為什么要說(shuō)這個(gè)事情?目前的語(yǔ)言模型是有幻覺(jué)的,它說(shuō)出的話有時(shí)候錯(cuò)了自己也不知道,或者編一些亂七八糟的內(nèi)容出來(lái)。這個(gè)情況很像做夢(mèng),說(shuō)夢(mèng)話。目前很多情況下,語(yǔ)言模型就有點(diǎn)像說(shuō)夢(mèng)話,像在做夢(mèng),迷失在虛擬環(huán)境里面,和真實(shí)世界是脫離交互的。

AGI需要參與到和整個(gè)世界的物理交互,需要參與到人類的大眾生活中,來(lái)體驗(yàn)和理解人類的情緒和性格等等。

目前AI的發(fā)展速度非???,但是發(fā)展速度還是階梯性的。最后希望大家相信、相信、盡可能相信AI。

歡迎在評(píng)論區(qū)留言~如需開(kāi)白請(qǐng)加微信:YPYP01234567

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
正臉曝光!強(qiáng)闖我使館的村田晃大3月15日剛晉升,所持刀具刃長(zhǎng)約18厘米

正臉曝光!強(qiáng)闖我使館的村田晃大3月15日剛晉升,所持刀具刃長(zhǎng)約18厘米

中國(guó)網(wǎng)
2026-03-26 14:01:45
柯文哲遭重判,民眾黨發(fā)全臺(tái)動(dòng)員令:3月29日上凱道討公道!

柯文哲遭重判,民眾黨發(fā)全臺(tái)動(dòng)員令:3月29日上凱道討公道!

海峽導(dǎo)報(bào)社
2026-03-27 09:53:13
東航訂購(gòu)101架空客飛機(jī)

東航訂購(gòu)101架空客飛機(jī)

參考消息
2026-03-26 20:46:37
FIFA系列賽新規(guī):比賽需決出勝負(fù) 打平將互射點(diǎn)球

FIFA系列賽新規(guī):比賽需決出勝負(fù) 打平將互射點(diǎn)球

體壇周報(bào)
2026-03-26 15:53:18
以毒攻毒!研究證實(shí):蜂毒100%殺死癌細(xì)胞,正常細(xì)胞影響小

以毒攻毒!研究證實(shí):蜂毒100%殺死癌細(xì)胞,正常細(xì)胞影響小

醫(yī)學(xué)科普匯
2026-03-26 23:55:03
湖人108-110送大禮,西部首輪對(duì)陣浮現(xiàn),詹皇將遇最愛(ài)對(duì)手

湖人108-110送大禮,西部首輪對(duì)陣浮現(xiàn),詹皇將遇最愛(ài)對(duì)手

鏗鏘格斗
2026-03-26 14:33:21
張雪峰二婚妻子履歷遭深扒,海量生活美照曝光,賬號(hào)緊急變私密

張雪峰二婚妻子履歷遭深扒,海量生活美照曝光,賬號(hào)緊急變私密

古希臘掌管松餅的神
2026-03-26 10:25:26
第86輪打擊來(lái)襲!打擊力度升級(jí),以色列海軍基地遭摧毀,川普讓步

第86輪打擊來(lái)襲!打擊力度升級(jí),以色列海軍基地遭摧毀,川普讓步

愛(ài)吃醋的貓咪
2026-03-26 22:25:02
中國(guó)最“尷尬”的5個(gè)地級(jí)市:它們根本不該在本省,應(yīng)該“改嫁”

中國(guó)最“尷尬”的5個(gè)地級(jí)市:它們根本不該在本省,應(yīng)該“改嫁”

好笑娛樂(lè)君每一天
2026-03-26 01:22:35
亞馬遜砸3.5億拍爛片,觀眾投票卻把這部送上第一

亞馬遜砸3.5億拍爛片,觀眾投票卻把這部送上第一

灰度測(cè)試中
2026-03-27 10:43:20
邵佳一首秀!國(guó)足VS庫(kù)拉索首發(fā)曝光:張玉寧韋世豪王鈺棟三箭齊發(fā)

邵佳一首秀!國(guó)足VS庫(kù)拉索首發(fā)曝光:張玉寧韋世豪王鈺棟三箭齊發(fā)

念洲
2026-03-27 08:50:15
不能讓美只手遮天,普京訪華日期或?qū)⒐?,中俄要?lián)手辦大事

不能讓美只手遮天,普京訪華日期或?qū)⒐迹卸硪?lián)手辦大事

忠于法紀(jì)
2026-03-27 10:57:33
賴昌星前妻近狀曝光:拒絕政府安置,獨(dú)居3000平老宅,只做一件事

賴昌星前妻近狀曝光:拒絕政府安置,獨(dú)居3000平老宅,只做一件事

芳芳?xì)v史燴
2026-03-23 03:53:23
100億美元成立一支NBA球隊(duì)很貴嗎?勇士早已印證這只是白菜價(jià)!

100億美元成立一支NBA球隊(duì)很貴嗎?勇士早已印證這只是白菜價(jià)!

田先生籃球
2026-03-26 11:11:45
離婚后,小姨子見(jiàn)我辛苦常來(lái)打理家務(wù),前妻:要不,你們?cè)谝黄鸢?>
    </a>
        <h3>
      <a href=秀秀情感課堂
2026-03-24 14:20:04
特寫|“反霸權(quán)、反帝國(guó)主義”——委內(nèi)瑞拉民眾要求美國(guó)釋放馬杜羅

特寫|“反霸權(quán)、反帝國(guó)主義”——委內(nèi)瑞拉民眾要求美國(guó)釋放馬杜羅

新華社
2026-03-26 17:09:03
姐姐尋找弟弟33年后續(xù)!直播時(shí)鬧矛盾,李鑫已告別離開(kāi),姐姐讓步

姐姐尋找弟弟33年后續(xù)!直播時(shí)鬧矛盾,李鑫已告別離開(kāi),姐姐讓步

潮鹿逐夢(mèng)
2026-03-26 17:43:25
家門口首秀還贏球!意大利21歲新星:這輩子值了,我們必進(jìn)世界杯

家門口首秀還贏球!意大利21歲新星:這輩子值了,我們必進(jìn)世界杯

仰臥撐FTUer
2026-03-27 11:09:03
蔣介石下令炸開(kāi)汪精衛(wèi)之墓,發(fā)現(xiàn)他身上放著一張紙條,寫了何內(nèi)容

蔣介石下令炸開(kāi)汪精衛(wèi)之墓,發(fā)現(xiàn)他身上放著一張紙條,寫了何內(nèi)容

北海史記
2026-03-26 15:06:32
如果美國(guó)解體,猶太財(cái)閥的巨資何處安放下一個(gè)宿主,答案超乎想象

如果美國(guó)解體,猶太財(cái)閥的巨資何處安放下一個(gè)宿主,答案超乎想象

芳芳?xì)v史燴
2026-03-25 22:24:25
2026-03-27 11:44:49
盒飯財(cái)經(jīng) incentive-icons
盒飯財(cái)經(jīng)
約會(huì)最好的商業(yè)思想
1307文章數(shù) 16871關(guān)注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

頭條要聞

男孩被搶走17年后找到生母 對(duì)"命好"的弟弟感情微妙

頭條要聞

男孩被搶走17年后找到生母 對(duì)"命好"的弟弟感情微妙

體育要聞

近29戰(zhàn)23勝!這支黃蜂有多強(qiáng)?

娛樂(lè)要聞

張雪峰靈堂內(nèi)景曝光,四周擺滿了鮮花

財(cái)經(jīng)要聞

很反常!油價(jià)向上,黃金向下

汽車要聞

與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
本地
時(shí)尚
公開(kāi)課

房產(chǎn)要聞

剛剛,海南樓市,官方數(shù)據(jù)發(fā)布!

數(shù)碼要聞

口袋里的135英寸HDR巨幕!雷鳥Air 4 Pro蝙蝠俠圖賞

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

張雪峰曾經(jīng)“5次談猝死”

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版