国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Yann LeCun AI思考的最新小結(jié):從機(jī)器學(xué)習(xí)到自主智能

0
分享至

文:城主

這是AI巨頭Yann LeCun9.29在德國(guó)的一個(gè)演講。題目“從機(jī)器學(xué)習(xí)到自主智能”。這個(gè)主題的演講Yann巨頭之前也曾講過(guò),這一次在德國(guó)所做的talk更加概括提煉。

LeCun之前PK參議院()很是加分,這個(gè)演講代表了他AI思考的最新小結(jié),講得還通俗易懂,推薦~

視頻完整版?zhèn)魉烷T【AI巨頭Yann LeCun最新德國(guó)演講:從機(jī)器學(xué)習(xí)到自主智能-嗶哩嗶哩】 https://b23.tv/b3eMUSW

=以下是本城根據(jù)講話整理成文=

我非常高興和榮幸地歡迎Yann LeCun教授。

感謝您接受我們的邀請(qǐng)并赴慕尼黑參與今日的講座。LeCun教授現(xiàn)任Meta的首席人工智能科學(xué)家,并擔(dān)任紐約大學(xué)計(jì)算機(jī)科學(xué)銀教授。他在巴黎取得計(jì)算機(jī)科學(xué)博士學(xué)位后移居到美國(guó),進(jìn)入知名的AT&T貝爾實(shí)驗(yàn)室并成為圖像處理研究部的負(fù)責(zé)人。之后,他于2003年加入紐約大學(xué),2012年又被任命為紐約大學(xué)數(shù)據(jù)科學(xué)中心的創(chuàng)始主任。

LeCun教授在卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展上有著杰出的貢獻(xiàn)。這種技術(shù)基本上解決了圖像科學(xué)和計(jì)算機(jī)視覺(jué)領(lǐng)域的許多難題。特別值得一提的是,一個(gè)特殊的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)名為L(zhǎng)eNet,這一名字在某種程度上也代表了我們今天所看到的深度學(xué)習(xí)和AI的顯著發(fā)展。他的這些突出貢獻(xiàn)使他榮獲眾多獎(jiǎng)項(xiàng)。其中,他是美國(guó)國(guó)家科學(xué)院和國(guó)家工程院的成員,并獲得了諸如來(lái)自EPFL的榮譽(yù)學(xué)位、IEEE神經(jīng)網(wǎng)絡(luò)先鋒獎(jiǎng)和2019年的圖靈獎(jiǎng)等眾多榮譽(yù),這個(gè)獎(jiǎng)項(xiàng)通常被譽(yù)為計(jì)算機(jī)界的諾貝爾獎(jiǎng)。僅僅幾周前,《時(shí)代》雜志將他評(píng)選為全球AI領(lǐng)域100名最具影響力的人物之一。

他還發(fā)表了許多引發(fā)公眾爭(zhēng)議的觀點(diǎn),并為公開(kāi)的AI討論做出了重要貢獻(xiàn),特別是關(guān)于現(xiàn)在盛行的大型語(yǔ)言模型。他深入探討了機(jī)器如何能夠像人類和動(dòng)物那樣有效地學(xué)習(xí),以及機(jī)器如何進(jìn)行推理和計(jì)劃。在此次演講中,Yann LeCun教授將探討基于新的模塊化認(rèn)知架構(gòu)的自主智能代理的發(fā)展路徑。

歡迎Yann教授上臺(tái)發(fā)言。

非常感謝您的熱情介紹和邀請(qǐng),同時(shí)感謝所有來(lái)到這里的人。但我需要糾正一個(gè)誤會(huì),我并沒(méi)有為L(zhǎng)eNet命名。這個(gè)名稱是我在貝爾實(shí)驗(yàn)室時(shí)的實(shí)驗(yàn)室主任所起的,但我認(rèn)為這確實(shí)是一個(gè)很好的名字。

接下來(lái),我要討論的是目標(biāo)驅(qū)動(dòng)人工智能。我曾用“自主機(jī)器智能”作為此次演講的標(biāo)題,但這似乎讓人們感到擔(dān)憂,他們擔(dān)心機(jī)器將會(huì)自主,超出我們的控制范圍。因此,我將其更名為“目標(biāo)驅(qū)動(dòng)AI”,這更加精確地描述了這一領(lǐng)域。這些系統(tǒng)不僅僅是我們已經(jīng)實(shí)現(xiàn)的,而是我們期望能夠?qū)崿F(xiàn)的:具有學(xué)習(xí)、記憶、推理、計(jì)劃和常識(shí)的系統(tǒng),具備我們?cè)趧?dòng)物和人類中觀察到的相同學(xué)習(xí)能力和智慧。

讓我先分享一些前沿技術(shù)。目前,關(guān)于AI的爭(zhēng)論很多,許多人擔(dān)心AI的影響。每當(dāng)有技術(shù)革命,人們總是對(duì)未知感到恐懼。AI有望引發(fā)一場(chǎng)大革命,這使得人們的恐懼有所增加。但在討論其潛在風(fēng)險(xiǎn)之前,我們應(yīng)該首先看到它的好處?,F(xiàn)在,AI已經(jīng)在醫(yī)學(xué)、診斷、醫(yī)療助理和治療計(jì)劃方面帶來(lái)了巨大的好處,如今,在歐盟銷售的每輛汽車都必須配備自動(dòng)緊急制動(dòng)系統(tǒng)。這種系統(tǒng)能夠自動(dòng)停車,從而避免正面碰撞,它已經(jīng)減少了40%的碰撞,這確實(shí)是一種可以拯救生命的技術(shù)。在所有我知道的系統(tǒng)中,大多數(shù)都使用了卷積網(wǎng)絡(luò)技術(shù)。德國(guó),尤其是巴伐利亞,是這方面的領(lǐng)導(dǎo)者,這種早期的系統(tǒng)是由Benz開(kāi)發(fā)的。

輔助駕駛、自動(dòng)駕駛、能源存儲(chǔ)與管理、環(huán)境監(jiān)測(cè)與保護(hù)等都是當(dāng)前的熱門領(lǐng)域。但其中,內(nèi)容信息與管理可能是人工智能最廣泛的應(yīng)用,尤其在工業(yè)、制造、信息系統(tǒng)以及質(zhì)量控制等方面。教育領(lǐng)域也開(kāi)始預(yù)測(cè)個(gè)性化教育的趨勢(shì)。隨著翻譯、遠(yuǎn)程展示、增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)的發(fā)展,這些技術(shù)也廣泛應(yīng)用于科學(xué)、生物學(xué)、基因組學(xué)、神經(jīng)科學(xué)以及特別是無(wú)序系統(tǒng)、復(fù)雜系統(tǒng)以及超大規(guī)模模擬的物理學(xué)領(lǐng)域,以及化學(xué)和材料科學(xué)等。我們經(jīng)常討論關(guān)于創(chuàng)新和藝術(shù)的話題,人工智能的核心就是提高創(chuàng)造力,使那些可能不具備技術(shù)基礎(chǔ)的人也能創(chuàng)造藝術(shù)。人工智能已經(jīng)深入到了各個(gè)領(lǐng)域。例如,幾年前Meta公司的計(jì)算機(jī)視覺(jué)系統(tǒng)就能展示物體檢測(cè)、人體跟蹤、語(yǔ)義分割等功能。但是,計(jì)算機(jī)視覺(jué)的研究還遠(yuǎn)未完成,這也是為什么下周巴黎會(huì)有ICCV會(huì)議。目前,該領(lǐng)域仍有很多工作要做,盡管人工智能已經(jīng)取得了很多進(jìn)展。

在醫(yī)學(xué)方面,醫(yī)學(xué)成像技術(shù)正在受到廣泛關(guān)注。我在紐約大學(xué)的同事們使用3D圖像識(shí)別技術(shù)來(lái)檢測(cè)例如乳腺X光中的腫瘤或MRI圖像中的特定區(qū)域。其中一個(gè)與Meta公司的FAIR實(shí)驗(yàn)室合作的項(xiàng)目成功將MRI數(shù)據(jù)采集速度提高了四倍,而不降低圖像質(zhì)量。這意味著原本需要40分鐘的MRI檢查現(xiàn)在只需要10分鐘就能完成,這得益于深度學(xué)習(xí)技術(shù)。

在科學(xué)研究上,現(xiàn)在神經(jīng)科學(xué)家用來(lái)描述大腦工作原理的模型是基于人工神經(jīng)網(wǎng)絡(luò)。使用功能性MRI數(shù)據(jù),我們觀察到的情況其實(shí)與卷積網(wǎng)絡(luò)模型非常相似。而卷積網(wǎng)絡(luò)的設(shè)計(jì)原則其實(shí)是受到了視覺(jué)皮層結(jié)構(gòu)的啟發(fā)。此外,還有研究試圖利用大型語(yǔ)言模型來(lái)解釋人腦在處理語(yǔ)言時(shí)的活動(dòng),但目前這種模型在語(yǔ)言處理方面的效果并不如卷積網(wǎng)絡(luò)模型在視覺(jué)處理方面的效果。這也意味著我們?cè)诶斫庹Z(yǔ)言處理的過(guò)程中還遺漏了一些關(guān)鍵要素。

在物理學(xué),尤其是高能物理學(xué)中,現(xiàn)在有很多模型是基于AI來(lái)描述粒子碰撞等現(xiàn)象。圖像處理技術(shù)也被用來(lái)探索外太空中的行星。據(jù)統(tǒng)計(jì),現(xiàn)在大約12%的物理學(xué)論文都提到了人工智能技術(shù),這在短時(shí)間內(nèi)的進(jìn)展確實(shí)令人驚訝。而在大規(guī)模宇宙模擬中,人工智能也被用來(lái)驗(yàn)證關(guān)于暗物質(zhì)等的理論。FAIR實(shí)驗(yàn)室的一個(gè)項(xiàng)目“開(kāi)放催化劑項(xiàng)目”也是一個(gè)很有意思的研究,大家都可以參與其中。

該網(wǎng)站名為open-catalyst.org。這個(gè)項(xiàng)目的核心理念是:若我們掌握了一種優(yōu)越、高效且可擴(kuò)展的能源儲(chǔ)存方法,那么我們就有機(jī)會(huì)應(yīng)對(duì)氣候變化問(wèn)題。理想情況下,如果我們有了合適的能源儲(chǔ)存方式,僅覆蓋小片的沙漠區(qū)域使用太陽(yáng)能電池板,便可生產(chǎn)足夠的能源供應(yīng)歐洲乃至全球。關(guān)鍵是我們需要一種有效的能源儲(chǔ)存方式。盡管德國(guó)政府已對(duì)可再生能源進(jìn)行了大力支持,但由于我們無(wú)法預(yù)測(cè)風(fēng)力和陽(yáng)光的存在,使得可再生能源仍未完全發(fā)揮其潛能。在無(wú)風(fēng)或無(wú)陽(yáng)光的時(shí)刻,我們需要另一種能源來(lái)源,或是能夠儲(chǔ)存并傳輸?shù)叫枰牡胤降哪茉础?/p>

理想的能源儲(chǔ)存方法是以氫氣或甲烷的形式。最直接的方式是從水中分離出氫氣和氧氣。這個(gè)過(guò)程包括將水放入并設(shè)置兩個(gè)電極,接著將氫氣和氧氣進(jìn)行分離。但難點(diǎn)在于,如果使用諸如鉑這樣的催化劑進(jìn)行該過(guò)程,盡管它可以實(shí)現(xiàn)大規(guī)模應(yīng)用,但其效率并不高。因此,主要的挑戰(zhàn)是是否能設(shè)計(jì)新的化合物或催化劑,來(lái)高效地促進(jìn)這一反應(yīng),且不需要使用像鉑這樣的高價(jià)材料,使其具有更好的可擴(kuò)展性。我們的策略是進(jìn)行大量的化學(xué)模擬,主要基于兩種不同化合物上的水的DFT模擬。結(jié)合模擬和實(shí)驗(yàn)獲取數(shù)據(jù)后,我們希望利用這些數(shù)據(jù)訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),從中找出規(guī)律,進(jìn)而設(shè)計(jì)出新的、效果相當(dāng)?shù)杀靖偷牟牧稀_@個(gè)項(xiàng)目的前景十分吸引人,雖然不確定是否一定會(huì)成功,但仍然值得嘗試。

重要的是,我們近年來(lái)在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域所取得的進(jìn)展,大部分都?xì)w功于一種我們稱為“自我監(jiān)督學(xué)習(xí)”的技術(shù)。許多人可能已經(jīng)在使用或至少聽(tīng)說(shuō)過(guò)這種技術(shù)。從本質(zhì)上看,自監(jiān)督學(xué)習(xí)是一套技術(shù),可以在不需要標(biāo)注數(shù)據(jù)或人工干預(yù)的情況下,訓(xùn)練系統(tǒng)來(lái)理解數(shù)據(jù)和世界。這種技術(shù)在自然語(yǔ)言處理領(lǐng)域尤為成功?,F(xiàn)今,大部分NLP系統(tǒng)的訓(xùn)練方式,無(wú)論是基于LLM或其他模型,都采用了這種方法。其核心思想是:取一段文字,刪除其中的某些單詞,然后訓(xùn)練一個(gè)大型神經(jīng)網(wǎng)絡(luò),如Transformer架構(gòu),來(lái)預(yù)測(cè)這些被刪除的單詞。為了使這些系統(tǒng)正常工作,還需要將單詞進(jìn)一步細(xì)分為子詞單元或標(biāo)記,因?yàn)榇蠖鄶?shù)語(yǔ)言的單詞都含有前綴、詞根和后綴。這種訓(xùn)練方式的代表性模型就是BERT,它完全基于自我監(jiān)督學(xué)習(xí),除了原始文本外,不需要任何其他數(shù)據(jù)。經(jīng)過(guò)預(yù)訓(xùn)練后,您可以使用系統(tǒng)生成的內(nèi)部表示為其他任務(wù),如翻譯、仇恨言論檢測(cè)或摘要等,提供輸入。

這里還有一個(gè)令人印象深刻的例子,是我在巴黎博覽會(huì)的同事所開(kāi)發(fā)的系統(tǒng),名為Dino V2。這可以被視為一個(gè)基礎(chǔ)的視覺(jué)模型,經(jīng)過(guò)訓(xùn)練后,能夠從圖像中提取特征,進(jìn)而這些特征可以被應(yīng)用于各種任務(wù),如分類、細(xì)粒度分類、深度估計(jì)、語(yǔ)義分割和實(shí)例檢索等。我在這里展示了一些視頻中的應(yīng)用案例。這種方法需要非常少的監(jiān)督,但由于其在大量數(shù)據(jù)上的預(yù)訓(xùn)練,因此僅需訓(xùn)練一個(gè)淺層網(wǎng)絡(luò),就可以在深度估計(jì)、分類等領(lǐng)域擊敗現(xiàn)有技術(shù)。這一技術(shù)已經(jīng)在線上開(kāi)放互動(dòng)使用,您可以通過(guò)提供的URL來(lái)體驗(yàn)。

這些展示的是特征提取的可視化例子。它們采用不同的顏色表示不同的特征向量,每種顏色代表一個(gè)主成分,如果你對(duì)此有所了解。這些都是典型的圖像示例?,F(xiàn)已有很多應(yīng)用,如生物圖像分析、天文學(xué)和環(huán)境保護(hù)。我要介紹的下一個(gè)例子與此相關(guān)。他們利用了Dino V2的功能,并在其上訓(xùn)練了一個(gè)相對(duì)較小的模型,從衛(wèi)星圖像中預(yù)測(cè)樹(shù)木的高度。我們手頭有大量的全球衛(wèi)星圖像,其分辨率為半米。這些圖像可以從衛(wèi)星成像公司獲取。在某些地區(qū),激光雷達(dá)數(shù)據(jù)能夠提供樹(shù)木的高度信息。你可以使用這些數(shù)據(jù)來(lái)訓(xùn)練模型,然后將其應(yīng)用到全球范圍。通過(guò)知道樹(shù)的高度,我們可以估算樹(shù)木鎖定了多少碳。這是非常重要的信息,因?yàn)樗婕暗轿覀兪欠駪?yīng)該保護(hù)森林,以及我們是否應(yīng)該種植更多的樹(shù)木和在何處種植。

關(guān)于這個(gè)主題,有許多詳盡的出版物。在我展示的自然語(yǔ)言處理中,自我監(jiān)督學(xué)習(xí)的另一個(gè)成功案例是在生物學(xué)中。在那里,一些詞被刪除,尤其是在蛋白質(zhì)組學(xué)中。蛋白質(zhì)是由氨基酸組成的序列,我們知道存在數(shù)億種氨基酸。你可以取得氨基酸序列,刪除一些氨基酸,然后訓(xùn)練一個(gè)大型神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)缺失的氨基酸。這個(gè)系統(tǒng)學(xué)習(xí)了代表氨基酸序列的表示形式,然后使用這種表示作為輸入來(lái)預(yù)測(cè)蛋白質(zhì)的構(gòu)象,其折疊方式,以及它是否可以與另一種蛋白質(zhì)的特定部位結(jié)合。我們的DeepMind同事做了一個(gè)稱為AlphaFold的著名項(xiàng)目,但這種利用預(yù)先訓(xùn)練的蛋白質(zhì)Transformer的概念最早是我在FAIR的同事提出的。他們已經(jīng)離開(kāi)FAIR,并圍繞這個(gè)概念創(chuàng)建了一個(gè)創(chuàng)業(yè)公司。這一方法取得了巨大成功,全球有數(shù)千研究團(tuán)隊(duì)正在使用這些數(shù)據(jù)。目前已有一個(gè)包含6億個(gè)蛋白質(zhì)的預(yù)測(cè)結(jié)構(gòu)的蛋白質(zhì)圖譜,名為ESM宏基因組圖譜,可在ESMatlas.com上查找。這對(duì)生物學(xué)家來(lái)說(shuō)是一個(gè)寶貴的工具,它可能會(huì)徹底改變我們的藥物設(shè)計(jì)和生命機(jī)制理解方式。

另一個(gè)印象深刻的項(xiàng)目是“No Language Left Behind”,由FAIR的全球團(tuán)隊(duì)完成。這是一個(gè)能夠翻譯200種語(yǔ)言的系統(tǒng),無(wú)論翻譯方向如何。當(dāng)你了解這些語(yǔ)言時(shí),你會(huì)發(fā)現(xiàn)其中有很多我們從未聽(tīng)說(shuō)過(guò)的語(yǔ)言。但對(duì)于這些說(shuō)這些語(yǔ)言的人們來(lái)說(shuō),保存他們的文化并能以自己的語(yǔ)言表達(dá)自己是非常重要的。有趣的是,盡管有40,000種可能的翻譯方向,但只有2,400對(duì)方向有數(shù)據(jù)覆蓋。但是,由于我們訓(xùn)練了一個(gè)巨大的Transformer來(lái)表示各種語(yǔ)言,系統(tǒng)可以利用語(yǔ)言家族之間的相似性來(lái)獲得與語(yǔ)言無(wú)關(guān)的表示,從而允許系統(tǒng)在任何方向上進(jìn)行翻譯,即使是那些從未被訓(xùn)練過(guò)的方向。按照當(dāng)前標(biāo)準(zhǔn),這是一個(gè)相當(dāng)大的模型,擁有540億個(gè)參數(shù)。同一團(tuán)隊(duì)近期也發(fā)布了一個(gè)名為Seamless的項(xiàng)目,該項(xiàng)目可以進(jìn)行語(yǔ)音到語(yǔ)音、語(yǔ)音到文本、文本到語(yǔ)音和文本到文本的翻譯,以及語(yǔ)音識(shí)別和語(yǔ)音合成。這種語(yǔ)音到語(yǔ)音的轉(zhuǎn)換尤其有趣,因?yàn)樗梢苑g那些并不直接用于語(yǔ)音書(shū)寫(xiě)的語(yǔ)言。該系統(tǒng)可以處理上千種語(yǔ)言,這真的是令人震驚的。深度學(xué)習(xí)的一些應(yīng)用可能不那么明顯,但它連接了人與知識(shí),也連接了人與人。目前,深度學(xué)習(xí)在社交網(wǎng)絡(luò)和搜索引擎等在線服務(wù)中的部署可能是最大的。如果從Google、Meta或Microsoft中移除深度學(xué)習(xí),這些公司可能會(huì)遭受重創(chuàng),因?yàn)樗鼈兊臉I(yè)務(wù)在很大程度上是基于這種技術(shù)的。

深度學(xué)習(xí)能夠助力我們處理信息洪流,如搜索、檢索、排名和問(wèn)答等任務(wù)。為了理解這些內(nèi)容,機(jī)器必須深入理解其背后的含義。這種技術(shù)對(duì)許多人來(lái)說(shuō)尤為有益,例如那些不識(shí)字、盲人或有視力障礙的人群。如今,有近30億的人群無(wú)法充分利用現(xiàn)代技術(shù),因?yàn)樗麄兓蚨嗷蛏俚卮嬖陂喿x障礙。人工智能的一個(gè)主要應(yīng)用是篩選并移除非法和危險(xiǎn)的內(nèi)容,但這絕非易事。盡管追求完美可能是一個(gè)遙不可及的目標(biāo),但值得注意的是,人工智能已經(jīng)取得了巨大的進(jìn)步。例如,五年前,F(xiàn)acebook使用當(dāng)時(shí)相對(duì)簡(jiǎn)單的機(jī)器學(xué)習(xí)技術(shù)方法,僅能自動(dòng)刪除約20%至25%的仇恨言論。但自從自我監(jiān)督的預(yù)訓(xùn)練Transformer技術(shù)出現(xiàn)后,這一比例在去年已經(jīng)增加到95%。

很多人對(duì)人工智能持有各種觀點(diǎn),其中一些人對(duì)其知之甚少。他們可能會(huì)告訴你關(guān)于人工智能的各種潛在危險(xiǎn),如如何破壞民主,或者因?yàn)榧傩畔⒃斐傻挠绊憽H欢?,他們可能沒(méi)有意識(shí)到的是,人工智能實(shí)際上是這些問(wèn)題的解決辦法。實(shí)際上,社交網(wǎng)絡(luò)的內(nèi)容審核已經(jīng)大量地依賴了人工智能的進(jìn)步,而那些試圖破壞這些系統(tǒng)的人在人工智能技術(shù)方面卻遠(yuǎn)遠(yuǎn)落后。

人們都很興奮地討論生成式人工智能,如自回歸的大型語(yǔ)言模型等。許多人都嘗試過(guò)利用先進(jìn)技術(shù)生成圖像,例如Meta的Make-a-Scene、OpenAI的Dall-E和Google的ImageGen。事實(shí)上,最新的進(jìn)展來(lái)自Meta,它最近發(fā)布了一篇論文,并隨后推出了名為EMU的產(chǎn)品,這是一個(gè)可以根據(jù)文本提示生成圖像的系統(tǒng)。這個(gè)產(chǎn)品在昨天已經(jīng)與新聞一同發(fā)布,并且它現(xiàn)在可以在Facebook Messenger上使用。通過(guò)與Meta.AI對(duì)話并輸入相應(yīng)的命令,用戶可以在幾秒鐘內(nèi)生成圖像,這在過(guò)去需要數(shù)分鐘來(lái)完成。目前,該團(tuán)隊(duì)正在研究視頻合成技術(shù),這是他們一年前的研究方向。

關(guān)于大型語(yǔ)言模型,它們都是基于自回歸技術(shù)。簡(jiǎn)單來(lái)說(shuō),這意味著從一段文本中刪除某些單詞,然后訓(xùn)練模型來(lái)預(yù)測(cè)這些單詞。這種方法被稱為自回歸預(yù)測(cè),其效果令人震驚。市場(chǎng)上有許多這樣的模型,例如Meta的Llama、Llama2等,其中一些模型如CodeLlama是專門用于代碼生成的。除了這些,還有ChatGPT、Alpaca、Lambda和Chinchilla等。最近,一個(gè)名為Mistral的產(chǎn)品由巴黎的一家初創(chuàng)公司發(fā)布,該公司的團(tuán)隊(duì)成員曾在FAIR工作,這也是一個(gè)值得關(guān)注的事實(shí)。

這些系統(tǒng)確實(shí)展現(xiàn)出了卓越的性能,讓我們都感到震驚。然而,它們也犯下了一些嚴(yán)重的錯(cuò)誤。這些系統(tǒng)并不真正理解這個(gè)世界,只是被訓(xùn)練成根據(jù)給定提示生成最有可能的單詞序列。盡管它們經(jīng)過(guò)微調(diào),能夠有效地解決特定的問(wèn)題,但依然存在事實(shí)錯(cuò)誤和邏輯錯(cuò)誤。它們的輸出不總是一致的,并且它們沒(méi)有真正的推理能力。由于這些系統(tǒng)只是從文本中學(xué)習(xí),所以它們對(duì)真實(shí)世界的理解是有限的。它們沒(méi)有常識(shí),無(wú)法像我們預(yù)期的那樣策劃答案。這意味著用戶可以與像Llama這樣的機(jī)器人進(jìn)行互動(dòng)。

我提到的聊天機(jī)器人MetaAI實(shí)際上是Llama2的產(chǎn)品版本。它具有不同的化身,可以被視為扮演不同的角色。總共有三種模型,每種模型有自己的生產(chǎn)模式。最好的是,它是開(kāi)源的,所以如果你有強(qiáng)大的GPU,你可以自己運(yùn)行它?,F(xiàn)在,有很多人正在努力使這些模型能夠在移動(dòng)設(shè)備和筆記本電腦上運(yùn)行,以生成文本。

有趣的是,當(dāng)Llama剛開(kāi)始時(shí),我的同事們有所質(zhì)疑。他們向我展示了Llama的輸出,詢問(wèn)是否可以發(fā)布在報(bào)紙上。當(dāng)然可以,但我更想知道它是否可以以爵士樂(lè)的方式輸出,因?yàn)槲腋矚g爵士樂(lè)。然而,由于缺乏爵士樂(lè)的訓(xùn)練數(shù)據(jù),該請(qǐng)求并未得到滿足,這讓我感到失望。

Meta最近發(fā)布了28種專門針對(duì)不同應(yīng)用的聊天機(jī)器人。例如,你可以選擇讓說(shuō)唱歌手Snoop Dogg扮演地下城主的角色,而其他機(jī)器人可能是旅行顧問(wèn)或廚師。每個(gè)機(jī)器人都有自己獨(dú)特的性格。但問(wèn)題在于,這些系統(tǒng)并不如我們預(yù)期的那樣出色。雖然它們能夠流暢地使用語(yǔ)言,給人一種它們很聰明的錯(cuò)覺(jué),但實(shí)際上,它們并沒(méi)有真正的人類智能。

在社交網(wǎng)絡(luò)上,如X和Twitter,人們經(jīng)常討論這些系統(tǒng)。當(dāng)他們談?wù)撃硞€(gè)公司的最新LLM時(shí),這確實(shí)很令人興奮。但事實(shí)上,我們距離實(shí)現(xiàn)人類水平的智能(我稱之為AGI)還有很長(zhǎng)的路要走。

這些系統(tǒng)之所以看起來(lái)那么聰明,是因?yàn)樗鼈兘邮芰舜罅康臄?shù)據(jù)訓(xùn)練,使它們積累了大量的背景知識(shí)。但大多數(shù)人類知識(shí)與語(yǔ)言無(wú)關(guān),而與我們的日常經(jīng)驗(yàn)有關(guān)。很多人認(rèn)為,這些機(jī)器不能制定計(jì)劃,并且它們的預(yù)測(cè)是基于自回歸的,這在本質(zhì)上是有缺陷的。

我預(yù)測(cè),幾年內(nèi),沒(méi)有人會(huì)使用自回歸LLM,因?yàn)樗忻黠@的缺陷。盡管有些人擔(dān)心未來(lái)的人工智能系統(tǒng)可能比人類更聰明,但基于當(dāng)前的LLM,這是一個(gè)誤解。未來(lái)的人工智能系統(tǒng)不會(huì)使用現(xiàn)有的架構(gòu)。他們不會(huì)是自回歸的LLM。

自回歸LLM的問(wèn)題在于,它們沒(méi)有真正的推理和計(jì)劃能力。盡管每個(gè)生成的Token的計(jì)算是恒定的,但這種機(jī)器不會(huì)學(xué)習(xí)到世界是如何運(yùn)作的,因此它們永遠(yuǎn)無(wú)法達(dá)到人類的智慧水平。

當(dāng)某家公司的首席執(zhí)行官聲稱他們擁有世界上最先進(jìn)的LLM,并預(yù)測(cè)AGI即將到來(lái)時(shí),我們應(yīng)持謹(jǐn)慎態(tài)度。我們目前仍未達(dá)到關(guān)于這方面的一些關(guān)鍵突破。然而,機(jī)器最終會(huì)在所有領(lǐng)域超越人類的智能,這是毫無(wú)疑問(wèn)的。預(yù)計(jì)這將在大多數(shù)人的有生之年發(fā)生,雖然我可能看不到那一天。這個(gè)過(guò)程可能需要數(shù)十年。

這些都與人工智能面臨的挑戰(zhàn)有關(guān),特別是在學(xué)習(xí)對(duì)世界的表征和預(yù)測(cè)模型方面。自我監(jiān)督學(xué)習(xí)正在努力解決這個(gè)問(wèn)題。目前,對(duì)于文本的處理我們已經(jīng)取得了不錯(cuò)的進(jìn)展,但視頻方面仍需努力。同時(shí),AI需要學(xué)會(huì)推理。比如丹尼爾·卡尼曼的系統(tǒng)一和系統(tǒng)二的概念:系統(tǒng)一是我們不假思索的潛意識(shí)行為,而系統(tǒng)二是需要我們集中注意力的有意識(shí)行為。當(dāng)前的LLM可以處理系統(tǒng)一的任務(wù),但對(duì)于系統(tǒng)二,我們?nèi)孕枰獦?gòu)建能夠推理的人工智能系統(tǒng)。

丹尼爾·卡尼曼,這位諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主實(shí)際上是一位心理學(xué)家。我曾提出一個(gè)解決方案,稱之為目標(biāo)驅(qū)動(dòng)人工智能,并公開(kāi)評(píng)審了相關(guān)論文。這篇論文不僅是一個(gè)工作文件,而且被廣泛評(píng)述。我還進(jìn)行了一系列技術(shù)講座,深入討論了基于模塊化認(rèn)知架構(gòu)的理念。

這個(gè)認(rèn)知架構(gòu)包括多個(gè)模塊,第一個(gè)是感知模塊,它負(fù)責(zé)感知世界并構(gòu)建對(duì)當(dāng)前世界狀態(tài)的估計(jì)。這個(gè)估計(jì)可能會(huì)結(jié)合存儲(chǔ)的內(nèi)存內(nèi)容,這是未被直接感知到的信息。接下來(lái)是世界模型,它的任務(wù)是預(yù)測(cè)一系列行動(dòng)的結(jié)果。演員模塊則想象這些動(dòng)作,并將其輸入世界模型。這個(gè)模型會(huì)預(yù)測(cè)一系列行動(dòng)的潛在結(jié)果。

系統(tǒng)的主要目標(biāo)是找到一個(gè)行動(dòng)序列,這些行動(dòng)預(yù)計(jì)會(huì)滿足成本模塊定義的約束條件。成本模塊基本上是系統(tǒng)的驅(qū)動(dòng)力,表示系統(tǒng)當(dāng)前的目標(biāo)和整體目的。系統(tǒng)從世界模型獲取預(yù)測(cè),然后計(jì)算其成本,基本上衡量系統(tǒng)的不舒適度。系統(tǒng)的任務(wù)就是找到一個(gè)最小化其成本的行動(dòng)序列。

此外,您可以想象一些安全措施,如家用機(jī)器人在切洋蔥時(shí)不會(huì)突然揮動(dòng)其手臂,這樣可以確保系統(tǒng)的安全性。這些措施在系統(tǒng)推理時(shí)已經(jīng)考慮進(jìn)去,并確保系統(tǒng)只產(chǎn)生安全的行為。

您知道,系統(tǒng)在某些情境下可能因?yàn)轭A(yù)期之外的提示而產(chǎn)生不安全的行為。但在這里,根據(jù)其世界模型,系統(tǒng)是設(shè)計(jì)成無(wú)法執(zhí)行違反設(shè)定護(hù)欄的操作的。所以,從這個(gè)角度看,只要滿足兩個(gè)基本條件,這些系統(tǒng)在本質(zhì)上是安全的。首先,需要確保護(hù)欄的目標(biāo)本身確實(shí)保障了安全性,這是一個(gè)頗為復(fù)雜的問(wèn)題。其次,我們需要假設(shè)世界模型是準(zhǔn)確的,這也同樣具有挑戰(zhàn)性??梢栽O(shè)想,隨著時(shí)間的流逝,這種安全性的實(shí)現(xiàn)逐漸展現(xiàn)出來(lái)。例如,考慮到一系列操作,如在此場(chǎng)景中的兩個(gè)操作。這種思考模式與控制理論中的模型預(yù)測(cè)控制非常相似,但不同之處在于我們?cè)谶@里是在學(xué)習(xí)世界模型,并可能同時(shí)學(xué)習(xí)相關(guān)的成本。

您可以將其視為一種分層規(guī)劃的系統(tǒng)。實(shí)際上,人類和動(dòng)物時(shí)刻都在進(jìn)行這種分層規(guī)劃,這是我們?nèi)粘;顒?dòng)的基本特征。然而,我們目前尚未完全掌握這一技能。盡管有一些初步的思路和嘗試,但真正的解決方案仍然遙遠(yuǎn)。對(duì)于有抱負(fù)的年輕科學(xué)家或研究者,這是一個(gè)巨大的機(jī)會(huì)。如果您能破解分層規(guī)劃的秘密,那么收益將是巨大的。

以我自己為例,假設(shè)我現(xiàn)在位于紐約大學(xué)的辦公室,我計(jì)劃前往巴黎。在宏觀層面上,我首先需要前往機(jī)場(chǎng)然后乘坐飛機(jī)。但在這之間,還有許多決策要做,比如根據(jù)交通情況選擇機(jī)場(chǎng),考慮哪家航空公司的班次。接下來(lái),我需要考慮如何到達(dá)機(jī)場(chǎng),可能是打車。為了實(shí)現(xiàn)這個(gè)目標(biāo),我需要走出辦公室,叫車。這就涉及到從座位上站起、打開(kāi)門、走向電梯等一系列更微觀的行動(dòng)。我們不可能為從辦公室到巴黎的每一步都制定詳細(xì)到毫秒的計(jì)劃,這就需要分層規(guī)劃。工程師在進(jìn)行控制操作時(shí)確實(shí)可以實(shí)現(xiàn)這種規(guī)劃,但其中的層次結(jié)構(gòu)往往是手動(dòng)設(shè)定的。真正的挑戰(zhàn)在于,我們?nèi)绾问箼C(jī)器能自動(dòng)學(xué)習(xí)并確定行動(dòng)計(jì)劃的合適層次。

這確實(shí)是一個(gè)待解決的重大問(wèn)題。如果您計(jì)劃進(jìn)一步深造或攻讀多個(gè)學(xué)位,這將是一個(gè)值得研究的領(lǐng)域。我們希望通過(guò)技術(shù)如LLM來(lái)實(shí)現(xiàn)這種功能。在這樣的系統(tǒng)中,Token的生成不再是逐一進(jìn)行,而是通過(guò)推斷一系列滿足多個(gè)目標(biāo)和條件的Token來(lái)完成。這會(huì)使得LLM更加可控,盡管現(xiàn)在的技術(shù)仍然存在局限性。

最終,我們希望機(jī)器能夠?qū)W習(xí)和理解世界,這正是建立世界模型的目的。當(dāng)我們考慮在時(shí)間t的世界狀態(tài)和可能的行動(dòng)時(shí),我們希望預(yù)測(cè)時(shí)間t+1或之后的世界狀態(tài)會(huì)是怎樣的。人類和動(dòng)物在此方面都表現(xiàn)得很出色。嬰兒在最初的幾個(gè)月里就能迅速學(xué)習(xí)世界的運(yùn)作方式,從基本的三維空間概念到物體的持續(xù)性和重力等基本物理原理。這些大都是通過(guò)觀察和實(shí)驗(yàn)學(xué)到的。而我們至今尚不清楚如何使機(jī)器實(shí)現(xiàn)這種學(xué)習(xí)。這也是為什么盡管我們已經(jīng)擁有了高度智能的系統(tǒng),如可以輕松通過(guò)律師考試的系統(tǒng),但我們還沒(méi)有可以自動(dòng)完成家務(wù)的機(jī)器人。

任何10歲的孩子都能在短短幾分鐘內(nèi)輕松掌握某些事物。目前,我們尚未真正擁有完全自主的5級(jí)自動(dòng)駕駛汽車,盡管任何17歲的青少年都可以在20小時(shí)內(nèi)掌握,并且可以在高速公路上以300公里的速度行駛。很顯然,我們?cè)谀承╆P(guān)鍵領(lǐng)域仍然缺乏進(jìn)展。人類和動(dòng)物所展現(xiàn)的學(xué)習(xí)效率,我們?nèi)匀徊恢廊绾卧跈C(jī)器上復(fù)制。

因此,我們需要培養(yǎng)機(jī)器的能力,使其能夠從視頻中學(xué)習(xí)世界模型,這實(shí)際上來(lái)源于自然信號(hào)。這引導(dǎo)我們轉(zhuǎn)向自我監(jiān)督學(xué)習(xí)的概念,但是現(xiàn)在它是應(yīng)用于視頻而不是文本。處理文本相對(duì)容易,因?yàn)槲谋臼请x散的,每種語(yǔ)言中的可能標(biāo)記數(shù)量大約為30,000個(gè)。這使得預(yù)測(cè)接下來(lái)的標(biāo)記的概率分布變得相對(duì)簡(jiǎn)單。但對(duì)于視頻,我們尚未找到一種有效的表示所有可能性的方法。

以高速公路為例,如果你嘗試用一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)視頻中的下一個(gè)場(chǎng)景,你可能只會(huì)得到一個(gè)非常模糊的預(yù)測(cè),因?yàn)樗鼉H僅是所有可能情境的平均值。這就導(dǎo)致我提出了所謂的聯(lián)合嵌入預(yù)測(cè)架構(gòu),簡(jiǎn)稱JEPA。它是一個(gè)非生成式的框架。

大家都在討論生成式人工智能,但我要告訴你的是,生成模型并不是王道。事實(shí)上,這些流行的方法,如LLM和其他機(jī)器學(xué)習(xí)方法,都存在局限性。在生成模型中,你需要從觀察到的數(shù)據(jù)x預(yù)測(cè)輸出y,這在文本中是可以的,但在視頻中,這幾乎是不可能的。而JEPA采用的聯(lián)合嵌入方式通過(guò)編碼器處理x和y,預(yù)測(cè)是在表示空間中進(jìn)行的。

這個(gè)JEPA有多個(gè)版本,我這里無(wú)法詳細(xì)介紹,但有興趣的可以查閱相關(guān)長(zhǎng)篇論文。核心思想是,存在多種方法來(lái)訓(xùn)練這些JEPA。其中一個(gè)特別有趣的技術(shù)是Image JPA或iJPA,它采用了一種“遮蔽”技巧。簡(jiǎn)而言之,你會(huì)遮蔽圖像的某部分,并用編碼器對(duì)其進(jìn)行處理,再用另一個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器嘗試預(yù)測(cè)完整圖像的表示。這種方法效果很好,并在多個(gè)任務(wù)上都表現(xiàn)出色。

我們還有類似的項(xiàng)目VJEPA,它旨在從視頻中進(jìn)行自我監(jiān)督學(xué)習(xí)。基本上,這種學(xué)習(xí)模型是為了模擬嬰兒觀察世界并學(xué)習(xí)的方式。此項(xiàng)目的相關(guān)論文已提交,有些人可能知道這個(gè)項(xiàng)目,因?yàn)樘峤坏慕刂谷掌谑墙裉臁?shí)際上,知道這個(gè)日期的人現(xiàn)在可能都在忙于撰寫(xiě)論文。

截止日期已經(jīng)過(guò)去兩個(gè)小時(shí)。這意味著您可以使用這些JPEG作為世界模型,因?yàn)槟靼?,?dāng)您有一個(gè)輸入時(shí),您可以為其提供一系列可能的代理操作,然后它將預(yù)測(cè)下一個(gè)時(shí)間步的世界狀態(tài)的抽象表示。這也可能作為我先前提到的大型架構(gòu)的一部分用于世界模型。

我們確實(shí)需要利用人工智能來(lái)回答許多問(wèn)題。這是我倒數(shù)第二張幻燈片。人類水平的人工智能距離我們還有多遠(yuǎn)?幾年或是幾十年?似乎還需幾十年的時(shí)間。這個(gè)挑戰(zhàn)可能比我們預(yù)期的要大,絕對(duì)比某些過(guò)于自信的人所想象的要困難。在達(dá)到人類級(jí)別的人工智能之前,我們可能先實(shí)現(xiàn)貓級(jí)別的人工智能。

有些人擔(dān)心,有一天有人會(huì)突然發(fā)現(xiàn)人類級(jí)人工智能的秘密,并啟動(dòng)一臺(tái)強(qiáng)大的計(jì)算機(jī),這臺(tái)計(jì)算機(jī)可能會(huì)接管整個(gè)世界并消滅所有人。但這種想法簡(jiǎn)直荒謬,完全不可能發(fā)生。我們會(huì)從小規(guī)模、低智能的模型開(kāi)始,例如像老鼠或貓那樣的模型,然后我們將逐漸提高它的智能,并確保其在各種受控環(huán)境中被安全地測(cè)試。所以,將機(jī)器人突然獲得高級(jí)智能并失去控制的概念局限于好萊塢電影是不切實(shí)際的。

實(shí)際上,并沒(méi)有所謂的通用人工智能,因?yàn)橹悄鼙旧砭褪嵌嗑S的。人類只在某些方面表現(xiàn)出色,但在其他許多方面表現(xiàn)平庸。計(jì)算機(jī)在很多任務(wù)上都比我們做得更好,例如國(guó)際象棋、圍棋、撲克和許多電子游戲。還有,僅憑聽(tīng)歌聲就能識(shí)別鳥(niǎo)類,或者通過(guò)尾巴的形狀來(lái)識(shí)別海洋哺乳動(dòng)物。這是人工智能系統(tǒng)可以做到的,但只有少數(shù)人能做到。因此,所謂的通用人工智能(AGI)實(shí)際上是一個(gè)誤導(dǎo)性的概念。

不可否認(rèn),機(jī)器將最終超過(guò)人類的智能。因此,人們對(duì)此感到害怕是可以理解的。但一個(gè)有趣的問(wèn)題是,想象20年或更長(zhǎng)時(shí)間后,我們每次與數(shù)字世界互動(dòng)都是通過(guò)人工智能系統(tǒng)進(jìn)行的。事實(shí)上,如果今天的初創(chuàng)公司和大公司的計(jì)劃得以實(shí)現(xiàn),這種情況可能會(huì)很快發(fā)生。因此,這些人工智能系統(tǒng)將成為所有人類知識(shí)的中心存儲(chǔ)庫(kù)。

開(kāi)源在此背景下顯得尤為重要,因?yàn)檎麄€(gè)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施都是開(kāi)源的,并在開(kāi)源軟件上運(yùn)行。這是因?yàn)樗匾耍荒鼙粏蝹€(gè)公司所控制。對(duì)于人工智能系統(tǒng)也是如此。它們必須是開(kāi)源的,因?yàn)槿绻泄竦男畔⒍家ㄟ^(guò)這些系統(tǒng)進(jìn)行處理,那么這些系統(tǒng)對(duì)于單個(gè)公司或少數(shù)公司來(lái)說(shuō)太重要了。這些系統(tǒng)的培訓(xùn)方式應(yīng)該是眾包的,像維基百科那樣,收集全球的文化、信息和知識(shí),而不僅僅是從某個(gè)特定的文化或地點(diǎn)。這也是我為什么強(qiáng)烈支持基于開(kāi)源的人工智能模型。我和我的同事在Meta公司都支持開(kāi)源這些基礎(chǔ)模型,因?yàn)檫@會(huì)使它們更安全、更強(qiáng)大,發(fā)展得更快,并從更多的人那里獲得多樣化的文化視角。這為初創(chuàng)公司和研究項(xiàng)目創(chuàng)建了一個(gè)完整的生態(tài)系統(tǒng),他們可以在此基礎(chǔ)上進(jìn)行構(gòu)建。這目前是一個(gè)非常重要的政策問(wèn)題,因?yàn)樵S多公司正在向全球各地的政府施壓,希望將人工智能封閉起來(lái),認(rèn)為它過(guò)于危險(xiǎn),需要更多的控制和許可。但我認(rèn)為真正的危險(xiǎn)在于,如果它僅僅掌握在少數(shù)人手中。

這些人已經(jīng)成功地說(shuō)服英國(guó)政府和首相,人工智能的應(yīng)用需要受到嚴(yán)格的監(jiān)管。顯著地,歐盟委員會(huì)似乎也同意這種觀點(diǎn)。然而,我個(gè)人相信,如果我們正確地發(fā)展和應(yīng)用人工智能,它有潛力使每個(gè)人都更為聰明。這種情境與我們目前擁有的智能助手相似,仿佛有一群聰明的人在為你工作。實(shí)際上,成功的領(lǐng)導(dǎo)者往往只與比自己更聰明的人合作。我自己也是如此,我只雇傭比我更有才智的人,因?yàn)檫@是成功的秘訣。因此,未來(lái)我們可能會(huì)有比自己還要聰明的人工智能助手。我們無(wú)需對(duì)它們感到威脅,因?yàn)檫@些助手會(huì)被設(shè)計(jì)得完全服從我們。這種變化可能會(huì)給社會(huì)帶來(lái)巨大的影響,這種影響與500年前印刷機(jī)的出現(xiàn)所帶來(lái)的影響相似,或許會(huì)引發(fā)一個(gè)新的復(fù)興,因?yàn)橹橇κ俏覀兡壳白罴毙璧馁Y源。這將讓人類變得更聰明。

觀眾問(wèn)答

非常感謝你,Yann,這是一次精彩的演講。我們還有大約10分鐘的提問(wèn)時(shí)間,我相信會(huì)有很多問(wèn)題。

感謝您的精彩演講。您提及了保持代碼的開(kāi)放性,這是一個(gè)很好的觀點(diǎn)。但正如您所說(shuō),最近很多技術(shù)進(jìn)步不僅依賴于軟件,還涉及到硬件。大部分的硬件技術(shù)都是由大公司進(jìn)行開(kāi)發(fā)的,他們擁有大量的GPU資源。這在德國(guó),乃至其他國(guó)家,都造成了某種限制。您如何看待這一問(wèn)題?同時(shí),在學(xué)術(shù)界和Meta公司之間,您是如何進(jìn)行權(quán)衡的?您在大學(xué)進(jìn)行某些研究,而在Meta進(jìn)行另一些研究嗎?關(guān)于未來(lái),您有何看法?

回應(yīng)這個(gè)問(wèn)題,我認(rèn)為應(yīng)該使用自動(dòng)語(yǔ)音識(shí)別器,但是由于存在回聲問(wèn)題,這有時(shí)會(huì)變得困難。確實(shí),硬件是一個(gè)巨大的瓶頸。目前,只有那些能夠進(jìn)行大規(guī)模計(jì)算的實(shí)體,例如Google、Meta和Microsoft,或是那些可以通過(guò)云服務(wù)訪問(wèn)這些資源的公司,如OpenAI和Anthropic,才能訓(xùn)練大型語(yǔ)言模型。為了訓(xùn)練一個(gè)頂尖的語(yǔ)言模型,所需的資金可能高達(dá)數(shù)千萬(wàn)歐元,這還取決于所用的方法和規(guī)模。如果你想購(gòu)買一個(gè)足夠強(qiáng)大的基礎(chǔ)設(shè)施,基本上你需要從NVIDIA那里購(gòu)買,而這可能會(huì)花費(fèi)上億。這真是太令人震驚了。因此,我們需要開(kāi)源這些基礎(chǔ)模型,因?yàn)樗鼈兪且环N共同的基礎(chǔ)設(shè)施,每個(gè)人都應(yīng)該能夠訪問(wèn)。

感謝您的精彩演講。我注意到您的演示文稿中涉及到人工智能和機(jī)器學(xué)習(xí)的挑戰(zhàn),其中包括道德、公平和負(fù)責(zé)任的人工智能。我想知道這些是否是您當(dāng)前所面臨的挑戰(zhàn)?如果是,您又是如何應(yīng)對(duì)的?

對(duì)此,我認(rèn)為這些挑戰(zhàn)確實(shí)是我們需要面對(duì)的,但它們被包含在我之前提到的其他點(diǎn)中。關(guān)于如何確保這些人工智能系統(tǒng)的安全性,這仍然是一個(gè)問(wèn)題,因?yàn)槲覀冞€沒(méi)有開(kāi)始構(gòu)建這種類型的系統(tǒng)。但這是一個(gè)可以解決的工程問(wèn)題。我們過(guò)去已經(jīng)為智能實(shí)體,如人類或公司,設(shè)計(jì)了行為目標(biāo),這就是法律的目的。這些法律旨在確保人類和公司的行為符合社會(huì)的共同利益。當(dāng)然,腐敗等問(wèn)題可能存在,但這是一個(gè)基本的理念,所以我們對(duì)此概念并不陌生。

謝謝你的精彩演講。我想進(jìn)一步詢問(wèn)我們之前提到的關(guān)于GPU資源的問(wèn)題。我觀察到在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,過(guò)去的幾年中很多重大突破都依賴于大量的GPU資源,而學(xué)術(shù)機(jī)構(gòu)往往沒(méi)有這樣的資源配置。在這樣的背景下,您認(rèn)為學(xué)術(shù)研究在人工智能領(lǐng)域的前景如何?

實(shí)際上,我本身就是學(xué)者,并且我身兼多重角色。事實(shí)上,很多杰出的創(chuàng)意都起源于學(xué)術(shù)界。例如,從文本生成圖像的技術(shù)實(shí)際上最早是在德國(guó)的一所大學(xué)中提出的。而使用注意力機(jī)制的想法,也是Transformer的核心,起源于蒙特利爾大學(xué)。這是由迪米特里·巴達(dá)諾、喬京勇和約書(shū)亞·本吉奧提出的。他們構(gòu)想了一個(gè)翻譯系統(tǒng),這個(gè)系統(tǒng)能夠決定在翻譯英語(yǔ)到德語(yǔ)時(shí)應(yīng)該關(guān)注哪些單詞,因?yàn)榈抡Z(yǔ)中動(dòng)詞的位置經(jīng)常導(dǎo)致翻譯錯(cuò)誤。他們因此引入了學(xué)習(xí)注意力機(jī)制的概念。隨后,斯坦福大學(xué)的Chris Manning采納了這種設(shè)計(jì)并成功地進(jìn)行了擴(kuò)展,贏得了WNT比賽。之后,這個(gè)思路被廣泛采納,例如谷歌的研究人員基于此構(gòu)建了完整的神經(jīng)網(wǎng)絡(luò),其中的一篇研究論文被命名為“注意力就是你所需要的”,也就是現(xiàn)在的Transformer。

學(xué)術(shù)界往往是許多出色創(chuàng)意的發(fā)源地。我提到的問(wèn)題,如分層規(guī)劃、從視頻中學(xué)習(xí)世界模型等,并不需要大量的計(jì)算資源來(lái)驗(yàn)證其有效性。如果一個(gè)理論被證明是可行的并且有說(shuō)服力,那么即使它在某些基準(zhǔn)測(cè)試中可能不是最佳的,也仍然有其他研究者或機(jī)構(gòu)愿意接受并進(jìn)一步發(fā)展它。這就是學(xué)術(shù)研究產(chǎn)生影響的方式。

如果你考慮一下你的職業(yè)生涯,是什么驅(qū)使你, 你會(huì)說(shuō)更多的是對(duì)可能發(fā)生事情的夢(mèng)想,或者是對(duì)這個(gè)主題的唯一興趣?隨著時(shí)間的推移,你貢獻(xiàn)的所有工作還可能如何改變?

這確實(shí)是一個(gè)引人入勝的問(wèn)題。從根本上說(shuō),這是一個(gè)科學(xué)問(wèn)題:什么是智力?大腦是如何工作的?這一大問(wèn)題,隨著時(shí)間的推移,仍然是中心焦點(diǎn)。實(shí)際上,存在三個(gè)主要的科學(xué)問(wèn)題:宇宙是由什么構(gòu)成的?生命是什么?以及大腦如何工作?這三個(gè)問(wèn)題都是至關(guān)重要的。

盡管我也是一名工程師,但對(duì)于像大腦這樣的復(fù)雜系統(tǒng),真正理解其工作原理的方式是構(gòu)建一個(gè)類似的系統(tǒng),然后驗(yàn)證您在該系統(tǒng)中的所有假設(shè)與實(shí)際情況是否相符。這就是多層學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò),以及背后的卷積網(wǎng)絡(luò)的思想來(lái)源。它們從大腦中獲得靈感,但我們不能簡(jiǎn)單地復(fù)制大腦。我們需要理解其背后的基本原理,這確實(shí)是驅(qū)使我前進(jìn)的力量。當(dāng)然,如果有其他引人入勝的應(yīng)用,不管是有用的還是僅僅有趣的,都是值得歡迎的。雖然我不總是親自這樣做,但我對(duì)那些這樣做的人感到非常高興。

您問(wèn)到我對(duì)實(shí)體人工智能和機(jī)器人學(xué)習(xí)的看法。我發(fā)現(xiàn)這非常有趣,因?yàn)樗褂萌斯ぶ悄芗夹g(shù)來(lái)影響現(xiàn)實(shí)世界。實(shí)際上,世界模型的概念在語(yǔ)言背景下容易實(shí)現(xiàn),這也是為什么我們有如此出色的語(yǔ)言模型。但現(xiàn)實(shí)世界的數(shù)據(jù),如視頻和機(jī)器人的本體感知數(shù)據(jù),與此大不相同。與機(jī)器人合作的實(shí)體AI的優(yōu)點(diǎn)是您不能夠作弊或采取捷徑。因此,我認(rèn)為,這類問(wèn)題會(huì)迫使人們更加真實(shí)和坦誠(chéng)。

我覺(jué)得過(guò)去幾年在人工智能領(lǐng)域的最有趣的進(jìn)展不僅僅是大型語(yǔ)言模型。而是那些專注于機(jī)器人技術(shù)的研究團(tuán)隊(duì),他們努力使機(jī)器人能夠高效學(xué)習(xí)而無(wú)需長(zhǎng)時(shí)間的模擬訓(xùn)練。例如,紐約大學(xué)的Leroy Pinto,卡內(nèi)基梅隆大學(xué)的Abhinav Gupta和他的團(tuán)隊(duì),以及伯克利分校的Peter Abbeel、Sergey Levine和Chelsea Finn(后者曾是他們?cè)谒固垢4髮W(xué)的學(xué)生)。這些方法都與規(guī)劃理念和目標(biāo)驅(qū)動(dòng)的規(guī)劃緊密相關(guān),這些都必須在機(jī)器人背景下實(shí)現(xiàn)。這確實(shí)是一個(gè)非常有趣的領(lǐng)域。因此,F(xiàn)AIR設(shè)有一個(gè)名為Embody.ai的專門部門。

非常感謝您,Yann,為我們帶來(lái)這次精彩的分享。我們都非常感謝您分享了您對(duì)未來(lái)人工智能的見(jiàn)解和觀點(diǎn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小波特關(guān)注庫(kù)里,預(yù)計(jì)交易即將完成,勇士迎來(lái)最大補(bǔ)強(qiáng)!

小波特關(guān)注庫(kù)里,預(yù)計(jì)交易即將完成,勇士迎來(lái)最大補(bǔ)強(qiáng)!

愛(ài)體育
2026-01-12 22:43:54
漲幅達(dá)300%!內(nèi)存條價(jià)格大漲,記者實(shí)地探訪

漲幅達(dá)300%!內(nèi)存條價(jià)格大漲,記者實(shí)地探訪

上觀新聞
2026-01-12 06:41:08
專題片揭露徐憲平隱蔽利益鏈:收受商人原始股,十多年后退居二線才變現(xiàn)

專題片揭露徐憲平隱蔽利益鏈:收受商人原始股,十多年后退居二線才變現(xiàn)

澎湃新聞
2026-01-12 21:38:27
要交易?首鋼連敗,2人被點(diǎn)名,名帥怒批,誰(shuí)注意周琦表態(tài)

要交易?首鋼連敗,2人被點(diǎn)名,名帥怒批,誰(shuí)注意周琦表態(tài)

樂(lè)聊球
2026-01-12 10:35:14
A股徹底癲了!17連陽(yáng)又見(jiàn)證歷史!

A股徹底癲了!17連陽(yáng)又見(jiàn)證歷史!

老A情報(bào)圈
2026-01-13 00:12:40
仁濟(jì)醫(yī)院:低調(diào)背后的頂級(jí)醫(yī)療硬實(shí)力

仁濟(jì)醫(yī)院:低調(diào)背后的頂級(jí)醫(yī)療硬實(shí)力

周哥一影視
2026-01-12 06:40:15
隨著火箭三連敗掉進(jìn)附加賽,太陽(yáng)上升到第6,西部排名又變了

隨著火箭三連敗掉進(jìn)附加賽,太陽(yáng)上升到第6,西部排名又變了

消費(fèi)俠
2026-01-13 04:55:10
韓國(guó)某中學(xué)把“中華人民共和國(guó)”當(dāng)作班級(jí)目標(biāo)引爭(zhēng)議

韓國(guó)某中學(xué)把“中華人民共和國(guó)”當(dāng)作班級(jí)目標(biāo)引爭(zhēng)議

隨波蕩漾的漂流瓶
2026-01-10 17:50:06
哭窮炫富,“知三當(dāng)三”,裝了10年的吉克雋逸,還是“自食惡果”

哭窮炫富,“知三當(dāng)三”,裝了10年的吉克雋逸,還是“自食惡果”

顧史
2025-12-12 14:59:24
沈騰帶妻子出席慈善晚會(huì),王琦瘦出瓜子臉,膚白顯嫩就是有點(diǎn)禿

沈騰帶妻子出席慈善晚會(huì),王琦瘦出瓜子臉,膚白顯嫩就是有點(diǎn)禿

小咪侃娛圈
2026-01-12 09:20:19
第15天:伊朗傷亡人數(shù)飆升,川普又開(kāi)空頭支票

第15天:伊朗傷亡人數(shù)飆升,川普又開(kāi)空頭支票

近距離
2026-01-12 10:59:39
老了才明白:盡量不要跟身邊任何人!包括你的親人,分享這5件事

老了才明白:盡量不要跟身邊任何人!包括你的親人,分享這5件事

小鬼頭體育
2026-01-13 05:42:26
專為U字號(hào)亞洲杯而生,門神李昊證明馬競(jìng)的球探很優(yōu)秀

專為U字號(hào)亞洲杯而生,門神李昊證明馬競(jìng)的球探很優(yōu)秀

米奇兔
2026-01-12 11:53:08
連爆大冷2-6!塞爾比+墨菲一輪游,五虎淘汰三虎,4強(qiáng)中國(guó)鎖定1席

連爆大冷2-6!塞爾比+墨菲一輪游,五虎淘汰三虎,4強(qiáng)中國(guó)鎖定1席

球場(chǎng)沒(méi)跑道
2026-01-12 06:51:15
阿里納斯:沒(méi)有三球誰(shuí)關(guān)注黃蜂?喬丹賣隊(duì)的時(shí)候NBA就該解散他們

阿里納斯:沒(méi)有三球誰(shuí)關(guān)注黃蜂?喬丹賣隊(duì)的時(shí)候NBA就該解散他們

懂球帝
2026-01-12 09:05:21
遺骸沖上海灘,澳大利亞警方初步確認(rèn):32歲華人男子浮潛抓龍蝦遇難

遺骸沖上海灘,澳大利亞警方初步確認(rèn):32歲華人男子浮潛抓龍蝦遇難

紅星新聞
2026-01-12 16:22:12
合川千人刨豬湯后續(xù):母親獨(dú)自打掃,本人哭求幫忙,粉絲擅自亂闖

合川千人刨豬湯后續(xù):母親獨(dú)自打掃,本人哭求幫忙,粉絲擅自亂闖

丁丁鯉史紀(jì)
2026-01-12 15:59:20
徐達(dá)常遇春他們都是農(nóng)民,為何起義后卻成了軍事天才?原因很現(xiàn)實(shí)

徐達(dá)常遇春他們都是農(nóng)民,為何起義后卻成了軍事天才?原因很現(xiàn)實(shí)

銘記歷史呀
2026-01-10 13:09:37
1月13日起,“i茅臺(tái)”開(kāi)搶陳年茅臺(tái)酒(15)

1月13日起,“i茅臺(tái)”開(kāi)搶陳年茅臺(tái)酒(15)

每日經(jīng)濟(jì)新聞
2026-01-12 20:17:05
亮燈之下:西安砂舞的虛名與現(xiàn)實(shí)。2026年1月8日晚上家中隨筆。

亮燈之下:西安砂舞的虛名與現(xiàn)實(shí)。2026年1月8日晚上家中隨筆。

成都人的故事
2026-01-12 11:40:07
2026-01-13 07:04:49
Web3天空之城 incentive-icons
Web3天空之城
美好,有趣的,值得銘記的
101文章數(shù) 86關(guān)注度
往期回顧 全部

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

頭條要聞

"搖人殺豬"女孩一天漲粉150萬(wàn):我捅了大婁子

頭條要聞

"搖人殺豬"女孩一天漲粉150萬(wàn):我捅了大婁子

體育要聞

一場(chǎng)安東尼奧式勝利,給中國(guó)足球帶來(lái)驚喜

娛樂(lè)要聞

蔡少芬結(jié)婚18周年,與張晉過(guò)二人世界

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

房產(chǎn)
時(shí)尚
旅游
本地
親子

房產(chǎn)要聞

重磅調(diào)規(guī)!417畝商改住+教育地塊!海口西海岸又要爆發(fā)!

看了日本主婦的搭配才明白,年紀(jì)大了這么穿,優(yōu)雅又不油膩

旅游要聞

走進(jìn)布哈拉古城

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

親子要聞

原來(lái)生氣可以這么可愛(ài)的?傲嬌寶寶:那可不咋滴!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版