国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

澳洲國立大學(xué)與穆罕默德·本·扎耶德人工智能大學(xué)突破

0
分享至


這項(xiàng)由澳洲國立大學(xué)(ANU)和穆罕默德·本·扎耶德人工智能大學(xué)(MBZUAI)聯(lián)合開展的研究發(fā)表于2026年的計(jì)算機(jī)視覺頂級會議,研究編號為arXiv:2602.23058v1。有興趣深入了解的讀者可以通過該編號查詢完整論文。

想象一下,你正在指導(dǎo)一個機(jī)器人完成復(fù)雜的任務(wù),比如更換手機(jī)的存儲芯片。這個任務(wù)需要按照特定的步驟:先取出外殼,然后移除舊的存儲芯片,安裝新的芯片,最后裝回外殼。對于人類來說,這種多步驟的規(guī)劃似乎很自然,但對AI系統(tǒng)來說卻是一個巨大的挑戰(zhàn)。

目前的AI系統(tǒng)在學(xué)習(xí)復(fù)雜任務(wù)時面臨著一個根本性問題:它們很難像人類一樣進(jìn)行長期規(guī)劃。就像一個只能看到眼前一步路的近視眼旅行者,現(xiàn)有的AI系統(tǒng)往往只關(guān)注當(dāng)下的動作,而無法制定涵蓋多個步驟的完整計(jì)劃。這種局限性嚴(yán)重影響了AI在實(shí)際應(yīng)用中的表現(xiàn),特別是在需要連續(xù)多步操作的復(fù)雜任務(wù)中。

研究團(tuán)隊(duì)意識到,傳統(tǒng)的AI學(xué)習(xí)方法存在兩個致命缺陷。首先,這些系統(tǒng)在學(xué)習(xí)過程中忽略了不同狀態(tài)之間的幾何關(guān)系和層次結(jié)構(gòu)。想象一下,如果你在學(xué)習(xí)圍棋時只記住每一步棋子的位置,而不理解整個棋局的戰(zhàn)略層次和各個區(qū)域之間的關(guān)系,你永遠(yuǎn)無法成為高手。其次,當(dāng)AI系統(tǒng)試圖進(jìn)行多步規(guī)劃時,誤差會像滾雪球一樣累積,導(dǎo)致越往后的預(yù)測越不準(zhǔn)確,最終整個計(jì)劃都會偏離正軌。

為了解決這些問題,研究團(tuán)隊(duì)開發(fā)了一個名為GeoWorld的創(chuàng)新系統(tǒng)。這個系統(tǒng)的核心思想是讓AI學(xué)會在一個特殊的幾何空間中進(jìn)行思考和規(guī)劃,這個空間被稱為雙曲空間。雙曲空間聽起來很抽象,但我們可以把它想象成一個特殊的地圖,在這張地圖上,不同的位置自然地形成了層次結(jié)構(gòu),就像一個倒置的碗,越往邊緣走,空間擴(kuò)展得越快。

一、雙曲幾何:AI規(guī)劃的新天地

要理解GeoWorld的創(chuàng)新之處,我們首先需要了解什么是雙曲幾何。在我們熟悉的平面幾何中,兩條平行線永遠(yuǎn)不會相交,三角形的內(nèi)角和總是180度。但在雙曲幾何中,這些規(guī)則都被打破了。想象一下一個馬鞍形的表面,在這個表面上,"直線"實(shí)際上是彎曲的,而且通過一個點(diǎn)可以畫出無數(shù)條與給定直線平行的線。

這種奇特的幾何特性為什么對AI規(guī)劃如此重要呢?關(guān)鍵在于雙曲空間天生具有層次結(jié)構(gòu)的特點(diǎn)。就像一棵樹的分支結(jié)構(gòu)一樣,從主干到分支再到枝葉,每一層都有明確的層級關(guān)系。當(dāng)AI系統(tǒng)在雙曲空間中表示不同的狀態(tài)時,那些在任務(wù)執(zhí)行中處于更高層次的狀態(tài)會自動被置于空間的更中心位置,而具體的執(zhí)行步驟則分布在邊緣區(qū)域。

研究團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)AI系統(tǒng)在雙曲空間中進(jìn)行規(guī)劃時,它能夠更好地理解任務(wù)的整體結(jié)構(gòu)?;氐礁鼡Q存儲芯片的例子,在雙曲空間中,"完成整個更換任務(wù)"這個高層目標(biāo)會位于中心位置,而"取出外殼"、"移除舊芯片"等具體步驟則圍繞在周圍,形成一個自然的層次結(jié)構(gòu)。

為了實(shí)現(xiàn)這種雙曲幾何的應(yīng)用,研究團(tuán)隊(duì)開發(fā)了一種叫做雙曲JEPA(H-JEPA)的技術(shù)。JEPA本身是一種讓AI系統(tǒng)學(xué)習(xí)預(yù)測未來狀態(tài)的方法,而H-JEPA則將這種預(yù)測能力擴(kuò)展到了雙曲空間中。就像給AI系統(tǒng)配備了一個特殊的"雙曲眼鏡",讓它能夠在這個彎曲的空間中看清事物之間的真實(shí)關(guān)系。

在雙曲空間中,距離的計(jì)算方式也完全不同。兩個狀態(tài)之間的"距離"不再是簡單的直線距離,而是沿著雙曲表面的測地線距離。這種距離測量方式天然地反映了狀態(tài)之間的層次關(guān)系:層次相近的狀態(tài)距離較近,而跨越多個層次的狀態(tài)則距離較遠(yuǎn)。

二、幾何強(qiáng)化學(xué)習(xí):讓AI在彎曲空間中學(xué)會規(guī)劃

有了雙曲空間的表示還不夠,AI系統(tǒng)還需要學(xué)會在這個空間中進(jìn)行有效的規(guī)劃。這就需要用到研究團(tuán)隊(duì)開發(fā)的另一項(xiàng)技術(shù):幾何強(qiáng)化學(xué)習(xí)(GRL)。

傳統(tǒng)的強(qiáng)化學(xué)習(xí)就像訓(xùn)練一只小狗學(xué)會做動作,通過獎勵和懲罰來引導(dǎo)行為。但在復(fù)雜的多步規(guī)劃任務(wù)中,這種方法往往效果不佳,因?yàn)橄到y(tǒng)很難理解每個步驟對整體目標(biāo)的貢獻(xiàn)。幾何強(qiáng)化學(xué)習(xí)則采用了一種完全不同的思路。

在GeoWorld系統(tǒng)中,AI的規(guī)劃過程被重新定義為在雙曲空間中尋找最短路徑的問題。就像在一個復(fù)雜的地形中尋找從起點(diǎn)到終點(diǎn)的最佳路線一樣,AI系統(tǒng)需要找到一條沿著雙曲表面的測地線,這條線代表了完成任務(wù)的最優(yōu)步驟序列。

這種方法的巧妙之處在于將規(guī)劃問題轉(zhuǎn)化為了幾何優(yōu)化問題。系統(tǒng)不再需要猜測每個動作的價值,而是通過最小化雙曲空間中的"能量"來找到最優(yōu)路徑。就像水總是沿著最省力的路徑流動一樣,AI系統(tǒng)會自動找到在雙曲空間中能量最低的路徑,這條路徑通常對應(yīng)著最有效的任務(wù)執(zhí)行方案。

幾何強(qiáng)化學(xué)習(xí)還引入了一個重要的約束機(jī)制:三角不等式正則化。在雙曲幾何中,三角不等式告訴我們,通過中間點(diǎn)的路徑長度不能小于直接路徑的長度。這個約束確保了AI系統(tǒng)的規(guī)劃保持幾何一致性,避免了不合理的"捷徑"。

三、能量景觀:AI規(guī)劃的新視角

GeoWorld系統(tǒng)的另一個創(chuàng)新之處在于它對規(guī)劃問題的全新理解方式。傳統(tǒng)的AI系統(tǒng)通常逐步生成下一個動作,就像一個人走路時只看腳下的下一步。而GeoWorld則采用了一種被稱為"能量景觀"的方法來理解整個任務(wù)空間。

想象一個起伏的山地地形圖,山峰代表困難或不可行的狀態(tài),而山谷則代表容易到達(dá)且有希望的狀態(tài)。在這個地形圖上,從當(dāng)前位置到目標(biāo)位置的最佳路徑就是沿著山谷前進(jìn)的路徑。GeoWorld系統(tǒng)正是通過構(gòu)建這樣一個能量景觀來進(jìn)行規(guī)劃的。

在雙曲空間中,這個能量景觀具有特殊的結(jié)構(gòu)。由于雙曲幾何的特性,整個景觀呈現(xiàn)出層次化的特征:高層的戰(zhàn)略決策對應(yīng)著景觀的主要結(jié)構(gòu),而具體的執(zhí)行步驟則對應(yīng)著局部的細(xì)節(jié)特征。這種結(jié)構(gòu)使得AI系統(tǒng)能夠同時考慮宏觀策略和微觀執(zhí)行,實(shí)現(xiàn)真正的層次化規(guī)劃。

研究團(tuán)隊(duì)通過大量的可視化實(shí)驗(yàn)展示了雙曲空間中的能量景觀與傳統(tǒng)歐幾里德空間中的景觀有著顯著差異。在傳統(tǒng)的平面空間中,能量景觀通常呈現(xiàn)出平滑的拋物面形狀,缺乏明確的方向性指導(dǎo)。而在雙曲空間中,景觀呈現(xiàn)出更加尖銳和結(jié)構(gòu)化的形狀,具有明顯的方向性特征,能夠?yàn)锳I系統(tǒng)提供更清晰的規(guī)劃指導(dǎo)。

四、交叉熵方法:在彎曲空間中尋找最優(yōu)路徑

有了雙曲空間的表示和能量景觀的概念,AI系統(tǒng)還需要一種有效的搜索方法來找到最優(yōu)的規(guī)劃方案。研究團(tuán)隊(duì)采用了一種叫做交叉熵方法(CEM)的優(yōu)化技術(shù)。

交叉熵方法的工作原理就像一個不斷學(xué)習(xí)的探險家。開始時,探險家對地形一無所知,只能隨機(jī)嘗試各種路徑。但隨著探索的深入,探險家逐漸學(xué)會識別哪些路徑更有希望,并將更多的努力集中在這些有前途的方向上。

在GeoWorld系統(tǒng)中,交叉熵方法被用來在雙曲空間的能量景觀中搜索最優(yōu)路徑。系統(tǒng)首先生成大量的候選動作序列,然后評估每個序列在雙曲空間中對應(yīng)的能量成本。那些能量成本較低的序列被認(rèn)為是更好的候選方案,系統(tǒng)會據(jù)此調(diào)整搜索策略,在下一輪搜索中生成更多類似的優(yōu)質(zhì)序列。

這個過程會反復(fù)迭代多次,每次迭代都會使搜索范圍向著最優(yōu)解的方向收縮。就像一個漏斗一樣,搜索范圍越來越小,但質(zhì)量越來越高,最終找到在雙曲空間中能量最低的路徑。

交叉熵方法在雙曲空間中的應(yīng)用特別有效,因?yàn)殡p曲幾何的層次結(jié)構(gòu)特性使得優(yōu)質(zhì)解往往聚集在特定的區(qū)域內(nèi)。這種聚集效應(yīng)大大提高了搜索效率,使得系統(tǒng)能夠快速找到高質(zhì)量的規(guī)劃方案。

五、實(shí)驗(yàn)驗(yàn)證:從理論到實(shí)踐的成功跨越

為了驗(yàn)證GeoWorld系統(tǒng)的有效性,研究團(tuán)隊(duì)在兩個大型數(shù)據(jù)集上進(jìn)行了廣泛的實(shí)驗(yàn):CrossTask和COIN。這兩個數(shù)據(jù)集包含了數(shù)千個真實(shí)世界的指導(dǎo)性視頻,涵蓋了從烹飪、手工制作到設(shè)備維修等各種復(fù)雜的多步驟任務(wù)。

CrossTask數(shù)據(jù)集包含4700個視頻,涵蓋83種不同類型的任務(wù)和105種不同的動作,總時長達(dá)375小時。COIN數(shù)據(jù)集則更加龐大,包含11287個視頻,涵蓋180種任務(wù)和778種動作,總時長476小時。這些數(shù)據(jù)集為AI系統(tǒng)提供了豐富的學(xué)習(xí)材料,讓它們能夠?qū)W習(xí)人類如何執(zhí)行各種復(fù)雜任務(wù)。

實(shí)驗(yàn)結(jié)果令人振奮。在3步規(guī)劃任務(wù)中,GeoWorld系統(tǒng)的成功率比之前最先進(jìn)的V-JEPA 2系統(tǒng)提高了約3%。在更具挑戰(zhàn)性的4步規(guī)劃任務(wù)中,成功率提升了約2%。雖然這些數(shù)字看起來不大,但在AI領(lǐng)域,這樣的提升是非常顯著的,往往代表著技術(shù)的重大突破。

更重要的是,隨著規(guī)劃步數(shù)的增加,GeoWorld系統(tǒng)的優(yōu)勢變得更加明顯。在6步規(guī)劃任務(wù)中,傳統(tǒng)系統(tǒng)的表現(xiàn)急劇下降,而GeoWorld系統(tǒng)仍能保持相對穩(wěn)定的性能。這說明雙曲幾何和幾何強(qiáng)化學(xué)習(xí)確實(shí)能夠有效緩解長期規(guī)劃中的誤差累積問題。

研究團(tuán)隊(duì)還進(jìn)行了深入的分析實(shí)驗(yàn),探究了系統(tǒng)的各個組成部分對整體性能的貢獻(xiàn)。他們發(fā)現(xiàn),雙曲幾何表示和幾何強(qiáng)化學(xué)習(xí)是互補(bǔ)的:雙曲幾何提供了更好的任務(wù)結(jié)構(gòu)表示,而幾何強(qiáng)化學(xué)習(xí)則優(yōu)化了在這種結(jié)構(gòu)中的規(guī)劃策略。兩者結(jié)合使用時,效果最為顯著。

六、技術(shù)細(xì)節(jié):深入理解GeoWorld的工作機(jī)制

GeoWorld系統(tǒng)的技術(shù)實(shí)現(xiàn)涉及多個精心設(shè)計(jì)的組件,每個組件都為整體性能做出了獨(dú)特貢獻(xiàn)。

首先是編碼器的設(shè)計(jì)。系統(tǒng)使用預(yù)訓(xùn)練的視覺編碼器將視頻幀轉(zhuǎn)換為高維特征向量。這些特征向量隨后通過一個特殊的指數(shù)映射函數(shù)被投影到雙曲空間中。這個投影過程就像給每個狀態(tài)分配一個在雙曲地圖上的位置,位置的選擇反映了狀態(tài)在任務(wù)層次中的重要性。

預(yù)測器網(wǎng)絡(luò)是系統(tǒng)的核心組件,它是一個包含約3億參數(shù)的大型Transformer網(wǎng)絡(luò)。這個網(wǎng)絡(luò)的任務(wù)是在雙曲空間中預(yù)測未來狀態(tài)的演變。與傳統(tǒng)的預(yù)測器不同,GeoWorld的預(yù)測器必須遵循雙曲幾何的規(guī)則,確保預(yù)測結(jié)果在幾何上是一致的。

訓(xùn)練過程采用了兩階段策略。第一階段是監(jiān)督學(xué)習(xí),系統(tǒng)通過觀察大量的示例視頻學(xué)習(xí)基本的狀態(tài)轉(zhuǎn)換規(guī)律。這個階段的目標(biāo)是讓系統(tǒng)掌握在雙曲空間中進(jìn)行準(zhǔn)確預(yù)測的能力。第二階段是幾何強(qiáng)化學(xué)習(xí),系統(tǒng)通過優(yōu)化能量函數(shù)來改進(jìn)其規(guī)劃能力。

幾何強(qiáng)化學(xué)習(xí)階段特別值得關(guān)注。系統(tǒng)不是簡單地最大化獎勵,而是最小化雙曲空間中的測地距離。這種方法將規(guī)劃問題轉(zhuǎn)化為幾何優(yōu)化問題,使得系統(tǒng)能夠找到真正意義上的最優(yōu)路徑。

研究團(tuán)隊(duì)還引入了一個重要的正則化機(jī)制:三角不等式約束。這個約束確保系統(tǒng)的預(yù)測遵循雙曲幾何的基本規(guī)律,防止出現(xiàn)幾何上不合理的預(yù)測結(jié)果。實(shí)驗(yàn)表明,這個約束對于維持長期規(guī)劃的穩(wěn)定性至關(guān)重要。

七、對比分析:GeoWorld與現(xiàn)有方法的差異

為了突出GeoWorld的創(chuàng)新性,研究團(tuán)隊(duì)將其與多種現(xiàn)有的AI規(guī)劃方法進(jìn)行了詳細(xì)對比。

傳統(tǒng)的生成式方法通過逐幀生成未來視頻來進(jìn)行規(guī)劃。這些方法的問題在于必須處理大量的像素級細(xì)節(jié),不僅計(jì)算成本高昂,而且容易被無關(guān)的視覺噪聲干擾。就像試圖通過繪制詳細(xì)地圖來規(guī)劃旅行路線一樣,這種方法往往過于關(guān)注無關(guān)緊要的細(xì)節(jié),而忽略了整體的戰(zhàn)略考慮。

預(yù)測式方法雖然避免了像素級生成的問題,但通常在歐幾里德空間中進(jìn)行,無法充分利用任務(wù)的層次結(jié)構(gòu)。這就像在平面地圖上規(guī)劃山地旅行,無法準(zhǔn)確反映地形的起伏變化和真實(shí)的路徑難度。

基于大語言模型的方法雖然在某些任務(wù)上表現(xiàn)不錯,但它們主要依賴文本信息,難以充分利用視覺信息中蘊(yùn)含的豐富細(xì)節(jié)。這些方法就像僅憑路標(biāo)指示進(jìn)行導(dǎo)航,而無法看到實(shí)際的道路狀況。

相比之下,GeoWorld結(jié)合了多種方法的優(yōu)點(diǎn):它像預(yù)測式方法一樣避免了像素級生成的復(fù)雜性,又像生成式方法一樣能夠進(jìn)行多步規(guī)劃,同時還通過雙曲幾何捕捉了任務(wù)的層次結(jié)構(gòu)信息。

八、應(yīng)用前景:從實(shí)驗(yàn)室到現(xiàn)實(shí)世界

GeoWorld技術(shù)的潛在應(yīng)用范圍極其廣泛,幾乎涵蓋了所有需要復(fù)雜規(guī)劃的領(lǐng)域。

在機(jī)器人技術(shù)方面,GeoWorld可以幫助機(jī)器人更好地理解和執(zhí)行復(fù)雜的操作任務(wù)。無論是家用服務(wù)機(jī)器人還是工業(yè)制造機(jī)器人,都需要能夠進(jìn)行多步驟的規(guī)劃和執(zhí)行。GeoWorld的層次化規(guī)劃能力使得機(jī)器人能夠更智能地分解復(fù)雜任務(wù),提高執(zhí)行效率和成功率。

在自動駕駛領(lǐng)域,車輛需要在復(fù)雜的交通環(huán)境中進(jìn)行實(shí)時規(guī)劃。GeoWorld的幾何規(guī)劃方法可以幫助自動駕駛系統(tǒng)更好地理解交通場景的層次結(jié)構(gòu),從戰(zhàn)略層面的路徑規(guī)劃到戰(zhàn)術(shù)層面的避障操作,實(shí)現(xiàn)更安全、更智能的駕駛行為。

在智能助手和虛擬代理方面,GeoWorld可以使這些系統(tǒng)能夠更好地理解和執(zhí)行用戶的復(fù)雜指令。比如"幫我準(zhǔn)備一個生日聚會"這樣的高層指令需要分解為購買材料、準(zhǔn)備食物、布置場地等多個子任務(wù),GeoWorld的層次化規(guī)劃能力正好適用于這類場景。

在教育領(lǐng)域,GeoWorld技術(shù)可以用于開發(fā)智能化的學(xué)習(xí)系統(tǒng),幫助學(xué)生掌握復(fù)雜的多步驟技能。系統(tǒng)可以根據(jù)學(xué)生的學(xué)習(xí)進(jìn)度和能力水平,動態(tài)調(diào)整教學(xué)策略和練習(xí)難度。

九、技術(shù)挑戰(zhàn)與未來發(fā)展

盡管GeoWorld展示了巨大的潛力,但研究團(tuán)隊(duì)也坦誠地指出了當(dāng)前技術(shù)面臨的挑戰(zhàn)和局限性。

首先是計(jì)算復(fù)雜性問題。雙曲幾何的計(jì)算比傳統(tǒng)的歐幾里德幾何更加復(fù)雜,特別是在大規(guī)模應(yīng)用中,這可能成為性能瓶頸。研究團(tuán)隊(duì)正在探索更高效的數(shù)值計(jì)算方法和硬件加速技術(shù)來解決這個問題。

其次是數(shù)據(jù)需求問題。雖然GeoWorld在現(xiàn)有數(shù)據(jù)集上表現(xiàn)優(yōu)異,但這些數(shù)據(jù)集主要包含相對簡單的日常任務(wù)。對于更復(fù)雜的專業(yè)任務(wù),可能需要更多的訓(xùn)練數(shù)據(jù)和更精細(xì)的標(biāo)注。

可解釋性也是一個重要挑戰(zhàn)。雖然雙曲空間的層次結(jié)構(gòu)在理論上很直觀,但在實(shí)際應(yīng)用中,系統(tǒng)的決策過程對用戶來說仍然是黑盒的。如何讓用戶理解和信任AI系統(tǒng)的規(guī)劃決策是一個需要進(jìn)一步研究的問題。

研究團(tuán)隊(duì)對未來的發(fā)展方向也有明確的規(guī)劃。他們希望將GeoWorld擴(kuò)展到更復(fù)雜的任務(wù)場景,包括需要多個代理協(xié)作的任務(wù)和動態(tài)變化的環(huán)境。同時,他們也在探索如何將GeoWorld與其他AI技術(shù)結(jié)合,比如大語言模型和強(qiáng)化學(xué)習(xí),創(chuàng)造出更強(qiáng)大的智能規(guī)劃系統(tǒng)。

另一個重要的發(fā)展方向是將技術(shù)應(yīng)用到具體的機(jī)器人系統(tǒng)中。目前的實(shí)驗(yàn)主要在視頻數(shù)據(jù)上進(jìn)行,真實(shí)的機(jī)器人應(yīng)用還需要考慮傳感器噪聲、執(zhí)行誤差、環(huán)境變化等實(shí)際因素。

十、理論意義與科學(xué)價值

GeoWorld的貢獻(xiàn)不僅在于技術(shù)上的突破,更在于為AI規(guī)劃研究提供了全新的理論視角。

傳統(tǒng)的AI規(guī)劃研究主要關(guān)注算法的效率和準(zhǔn)確性,而GeoWorld首次將幾何學(xué)的深刻洞察引入了AI規(guī)劃領(lǐng)域。這種跨學(xué)科的融合為解決長期困擾AI社區(qū)的規(guī)劃問題提供了新的思路。

雙曲幾何在AI中的應(yīng)用也為其他相關(guān)研究領(lǐng)域提供了啟發(fā)。比如在知識圖譜嵌入、層次化表示學(xué)習(xí)、多尺度特征學(xué)習(xí)等領(lǐng)域,雙曲幾何都顯示出了獨(dú)特的優(yōu)勢。GeoWorld的成功可能會推動這些領(lǐng)域的進(jìn)一步發(fā)展。

從認(rèn)知科學(xué)的角度來看,GeoWorld的層次化規(guī)劃方法與人類的認(rèn)知過程有很多相似之處。人類在進(jìn)行復(fù)雜規(guī)劃時,通常會采用分層的策略:先制定大致的計(jì)劃框架,再逐步細(xì)化具體的執(zhí)行步驟。GeoWorld的幾何方法為理解和模擬這種認(rèn)知過程提供了新的工具。

說到底,GeoWorld代表了AI規(guī)劃研究的一個重要里程碑。它不僅解決了現(xiàn)有技術(shù)的實(shí)際問題,更為整個領(lǐng)域的發(fā)展指明了新的方向。隨著技術(shù)的不斷完善和應(yīng)用場景的擴(kuò)展,我們有理由相信,基于幾何學(xué)的AI規(guī)劃方法將會在未來的智能系統(tǒng)中發(fā)揮越來越重要的作用。

這項(xiàng)研究讓我們看到了AI技術(shù)發(fā)展的另一種可能性:不是簡單地增加模型的規(guī)模和數(shù)據(jù)的數(shù)量,而是通過深入理解問題的本質(zhì)結(jié)構(gòu),借鑒數(shù)學(xué)和物理學(xué)的深刻洞察,創(chuàng)造出真正智能的解決方案。對于關(guān)心AI技術(shù)發(fā)展的普通讀者來說,GeoWorld告訴我們,AI的未來不僅在于更強(qiáng)大的計(jì)算能力,更在于更深刻的理論洞察和更巧妙的數(shù)學(xué)工具。有興趣深入了解這項(xiàng)研究的讀者可以通過論文編號arXiv:2602.23058v1查詢完整論文,探索這個令人著迷的幾何AI世界。

Q&A

Q1:GeoWorld與傳統(tǒng)AI規(guī)劃方法有什么本質(zhì)區(qū)別?

A:GeoWorld的核心創(chuàng)新是使用雙曲幾何而非傳統(tǒng)的歐幾里德空間進(jìn)行規(guī)劃。傳統(tǒng)方法像在平面地圖上規(guī)劃路線,而GeoWorld像在有層次結(jié)構(gòu)的立體地形圖上規(guī)劃,能夠自然地捕捉任務(wù)的層次關(guān)系,使AI系統(tǒng)能夠同時考慮宏觀策略和具體執(zhí)行步驟。

Q2:雙曲幾何為什么適合AI規(guī)劃任務(wù)?

A:雙曲幾何天生具有層次結(jié)構(gòu)特性,就像樹的分支結(jié)構(gòu)。在雙曲空間中,高層目標(biāo)自然位于中心位置,具體執(zhí)行步驟分布在邊緣,形成清晰的層次關(guān)系。這種結(jié)構(gòu)完美匹配了復(fù)雜規(guī)劃任務(wù)的本質(zhì)特征,使AI能夠更好地理解任務(wù)的整體結(jié)構(gòu)。

Q3:GeoWorld技術(shù)能應(yīng)用到哪些實(shí)際場景中?

A:GeoWorld技術(shù)應(yīng)用前景廣泛,包括機(jī)器人操作、自動駕駛、智能助手等領(lǐng)域。任何需要多步驟規(guī)劃的場景都能受益,比如家用機(jī)器人執(zhí)行復(fù)雜家務(wù)、自動駕駛車輛進(jìn)行路徑規(guī)劃、智能助手幫助用戶分解復(fù)雜任務(wù)等。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美以的戰(zhàn)爭行為,實(shí)質(zhì)是在絞殺中國!

美以的戰(zhàn)爭行為,實(shí)質(zhì)是在絞殺中國!

達(dá)文西看世界
2026-03-02 11:49:12
正月理發(fā)有什么講究和忌諱?理發(fā)最佳時間在正月多少號?

正月理發(fā)有什么講究和忌諱?理發(fā)最佳時間在正月多少號?

匹夫來搞笑
2026-03-02 19:54:51
共和報:國米和尤文都在物色新門將,兩隊(duì)同時關(guān)注阿利松

共和報:國米和尤文都在物色新門將,兩隊(duì)同時關(guān)注阿利松

懂球帝
2026-03-03 01:27:04
給《純真年代的愛情》演技最好演員排名:劉敏濤墊底,陳飛宇第5

給《純真年代的愛情》演技最好演員排名:劉敏濤墊底,陳飛宇第5

往史過眼云煙
2026-03-02 14:15:15
緊急提醒!明天柳州多條路段將交通管制,禁止一切車輛駛?cè)耄?>
    </a>
        <h3>
      <a href=柳州全攻略
2026-03-02 20:11:55
徹底決裂!沙特強(qiáng)勢警告伊朗,阿拉伯陣營集體攤牌

徹底決裂!沙特強(qiáng)勢警告伊朗,阿拉伯陣營集體攤牌

老馬拉車莫少裝
2026-02-28 20:35:31
上門安裝 OpenClaw,年入百萬?

上門安裝 OpenClaw,年入百萬?

愛范兒
2026-03-02 16:33:30
A股:大家坐穩(wěn)扶好了,周二不出意外,牛市或?qū)⒃俅沃匮輾v史了!

A股:大家坐穩(wěn)扶好了,周二不出意外,牛市或?qū)⒃俅沃匮輾v史了!

云鵬敘事
2026-03-03 00:00:10
貴州一村民殺年豬,柴火都備好了,此時豬竟“撲通”一聲雙膝跪地

貴州一村民殺年豬,柴火都備好了,此時豬竟“撲通”一聲雙膝跪地

有書
2026-01-11 17:29:43
雷霆100-87擊敗獨(dú)行俠!亞歷打破塵封63年NBA紀(jì)錄,登頂歷史第一

雷霆100-87擊敗獨(dú)行俠!亞歷打破塵封63年NBA紀(jì)錄,登頂歷史第一

籃球大視野
2026-03-02 19:47:56
兩款蘋果新品泄露,都支持高刷!

兩款蘋果新品泄露,都支持高刷!

花果科技
2026-03-01 17:59:27
原來他已去世9年,45歲離世留下年幼孩子,王寶強(qiáng)張譯葬禮上痛哭

原來他已去世9年,45歲離世留下年幼孩子,王寶強(qiáng)張譯葬禮上痛哭

白面書誏
2026-03-02 17:21:56
別想歪!這幅人體油畫靠“光”就能讓你呼吸放緩?答案藏在薄紗里

別想歪!這幅人體油畫靠“光”就能讓你呼吸放緩?答案藏在薄紗里

陳洪標(biāo)寫字說畫
2026-01-27 22:31:02
中國哪個城市的水質(zhì)最好?經(jīng)評比:這10個城市上榜,快來看看,有你的家鄉(xiāng)嗎?

中國哪個城市的水質(zhì)最好?經(jīng)評比:這10個城市上榜,快來看看,有你的家鄉(xiāng)嗎?

美食格物
2026-01-23 17:04:10
輸給中國男籃后,陳盈駿接受采訪,他獨(dú)夸一人,確實(shí)非常有格局!

輸給中國男籃后,陳盈駿接受采訪,他獨(dú)夸一人,確實(shí)非常有格局!

現(xiàn)代小青青慕慕
2026-03-02 11:36:31
“以為是六個博士,結(jié)果是六個送外賣的!”六個兒子征婚視頻火了

“以為是六個博士,結(jié)果是六個送外賣的!”六個兒子征婚視頻火了

阿凱銷售場
2026-03-01 01:46:42
迪拜機(jī)場將恢復(fù)運(yùn)營,建議乘客確認(rèn)后再前往

迪拜機(jī)場將恢復(fù)運(yùn)營,建議乘客確認(rèn)后再前往

每日經(jīng)濟(jì)新聞
2026-03-03 00:13:06
港口被搶,李嘉誠清倉英國電網(wǎng),他用百億學(xué)費(fèi),換回一個殘酷真相

港口被搶,李嘉誠清倉英國電網(wǎng),他用百億學(xué)費(fèi),換回一個殘酷真相

村里一枝花人
2026-03-02 15:04:49
陳浩民夫婦滯留;明星中東困境;美征谷愛凌稅;薛之謙被舉報 | 3月03日娛樂八卦日報

陳浩民夫婦滯留;明星中東困境;美征谷愛凌稅;薛之謙被舉報 | 3月03日娛樂八卦日報

娛樂圈那檔子事兒
2026-03-03 01:05:02
斯諾克紅包賽形勢:中國保2爭3,趙心童吳宜澤穩(wěn)進(jìn),肖國棟有機(jī)會

斯諾克紅包賽形勢:中國保2爭3,趙心童吳宜澤穩(wěn)進(jìn),肖國棟有機(jī)會

劉姚堯的文字城堡
2026-03-02 07:40:55
2026-03-03 02:12:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
7408文章數(shù) 553關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

本地
時尚
旅游
游戲
公開課

本地新聞

津南好·四時總相宜

今年春天一定要擁有的4件衣服,太好看了!

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

外媒給《寶可夢》新作60分:不夠有趣的縫合怪

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版