国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Scaling Law沒死!Gemini核心大佬爆料,谷歌已有顛覆性密鑰

0
分享至


新智元報(bào)道

編輯:Aeneas 傾傾

【新智元導(dǎo)讀】谷歌大模型將迎顛覆升級(jí)!Gemini負(fù)責(zé)人爆料:長(zhǎng)上下文效率與長(zhǎng)度雙重突破在即,注意力機(jī)制迎來驚人發(fā)現(xiàn)。Scaling Law未死,正加速演變!

谷歌又要有重大突破了?

最近,Google DeepMind的Gemini預(yù)訓(xùn)練負(fù)責(zé)人Sebastian Borgeaud在采訪中給出重磅爆料——

未來一年,大模型預(yù)訓(xùn)練領(lǐng)域?qū)⒃?strong>「長(zhǎng)上下文處理效率」和「上下文長(zhǎng)度擴(kuò)展」兩大方向迎來重大技術(shù)創(chuàng)新。

同時(shí),Google Gemini三巨頭——Jeff Dean、OriolVinyalsML和Noam Shazeer罕見同臺(tái)了,他們的對(duì)談中,跟Sebastian的內(nèi)容展現(xiàn)出了驚人的一致。

眾多高瞻遠(yuǎn)矚、閃爍著智慧光芒的思想讓人深思。

難怪,谷歌依然是那個(gè)巨人。

谷歌大佬激動(dòng)預(yù)言

已破解大模型核心秘密

Google DeepMind的Gemini預(yù)訓(xùn)練負(fù)責(zé)人Sebastian Borgeaud在最近的訪談中表示,預(yù)計(jì)在未來一年內(nèi),針對(duì)提升長(zhǎng)上下文處理效率以及進(jìn)一步擴(kuò)展模型上下文長(zhǎng)度的預(yù)訓(xùn)練技術(shù),將會(huì)有重大創(chuàng)新。


另外他還透露說,最近他們?cè)谧⒁饬C(jī)制方面取得了一些非常有趣的發(fā)現(xiàn),這可能在未來幾個(gè)月內(nèi)重塑他們的研究方向。

對(duì)此,他表示非常興奮。

而且他提出了振聾發(fā)聵的一句話:Scaling Law并未消亡,只是正在演變!

Sebastian Borgeaud是Gemini 3的預(yù)訓(xùn)練負(fù)責(zé)人。

這次,是他首次接受博客采訪,帶我們深入了解了Gemini 3背后的實(shí)驗(yàn)室思維——變化究竟發(fā)生在哪里,為什么現(xiàn)在的工作不再是「訓(xùn)練模型」,而是構(gòu)建一個(gè)完整的系統(tǒng)。

Gemini 3背后:AI的未來正在加速到來

一場(chǎng)意外的飛躍后,一個(gè)系統(tǒng)誕生了。

「如果對(duì)自己誠(chéng)實(shí)的話,我想……我們比我認(rèn)為我們能達(dá)到的地方,走得更遠(yuǎn)了?!?/p>

坐在麥克風(fēng)前的Sebastian Bourjou語氣平靜,但這句話卻像一顆投入湖面的石子,激起無限漣漪。

為何Gemini 3會(huì)實(shí)現(xiàn)如此巨大的性能飛躍?

Sebastian的回答看似很簡(jiǎn)單:「更好的預(yù)訓(xùn)練和更好的后期訓(xùn)練」。

然而,在這輕描淡寫的背后,是一個(gè)根本性的認(rèn)知轉(zhuǎn)變。


「我們不再僅僅是在構(gòu)建一個(gè)模型了,」他緩緩說道,「我認(rèn)為,在這一點(diǎn)上,我們真正在構(gòu)建的是一個(gè)系統(tǒng)?!?/p>

而這,就是Gemini 3顛覆性進(jìn)步的關(guān)鍵。

人們常常想象,從一個(gè)Gemini版本到下一個(gè)版本,總有一些石破天驚的「秘密武器」。但Sebastian揭示的真相是:進(jìn)步源于無數(shù)細(xì)微改進(jìn)的聚合。是來自龐大團(tuán)隊(duì)中,日復(fù)一日發(fā)現(xiàn)的那些「旋鈕」和優(yōu)化。

他還指出,AI發(fā)展范式正在經(jīng)歷的潛在轉(zhuǎn)移:過去,我們仿佛擁有無限數(shù)據(jù),可以隨意擴(kuò)大數(shù)據(jù)集;而現(xiàn)在,我們正轉(zhuǎn)向一個(gè)「數(shù)據(jù)有限」體制。


這意味著,未來的AI,必須要學(xué)會(huì)更高效地利用有限的數(shù)據(jù)資源,構(gòu)建更復(fù)雜的系統(tǒng)工程。

這也就是模型架構(gòu)研究的核心價(jià)值所在。

這一轉(zhuǎn)變,將迫使整個(gè)行業(yè)從「大力出奇跡」的粗放模式,轉(zhuǎn)向「精雕細(xì)琢」的精細(xì)模式。

未來的競(jìng)爭(zhēng)焦點(diǎn),將不再是「誰的數(shù)據(jù)中心更大」,而是「誰的學(xué)習(xí)算法更高效」、「誰的模型架構(gòu)更優(yōu)雅」、「誰能從有限數(shù)據(jù)中提取更多智慧」。

而Gemini 3的大腦架構(gòu)——混合專家模型MoE,就代表了LLM發(fā)展的一條清晰路徑:從追求單純的「大」,轉(zhuǎn)向追求「大而高效,大而智能」。


AI的下一站——長(zhǎng)上下文、高效檢索與「成本革命」

展望未來幾年的技術(shù)前沿,Sebastian指出了激動(dòng)人心的方向,它們將共同塑造下一代AI的能力與形態(tài)。


1. 長(zhǎng)上下文:從「短記憶」到「海量工作臺(tái)」

Gemini 1.5帶來的超長(zhǎng)上下文能力,已經(jīng)是一場(chǎng)變革。Sebastian預(yù)測(cè),這方面的創(chuàng)新將持續(xù)加速?!肝艺J(rèn)為未來一年左右,將在使長(zhǎng)上下文更高效、并進(jìn)一步擴(kuò)展上下文長(zhǎng)度方面看到更多創(chuàng)新?!?/p>

這不僅僅是「記住更多」這么簡(jiǎn)單。超長(zhǎng)上下文將把模型變成一個(gè)真正的數(shù)字工作臺(tái):它可以同時(shí)載入整個(gè)代碼庫、多篇科研論文、長(zhǎng)時(shí)間對(duì)話歷史,并在其中進(jìn)行連貫的分析、推理和創(chuàng)作。

這為復(fù)雜的多步任務(wù)、深度研究和創(chuàng)作提供了前所未有的可能,是邁向更強(qiáng)大「智能體」的關(guān)鍵基礎(chǔ)設(shè)施。


2. 注意力機(jī)制的進(jìn)化

Sebastian特別提到,在注意力機(jī)制上,「我們最近有了一些真正有趣的發(fā)現(xiàn),我認(rèn)為這將塑造未來幾個(gè)月的大量研究?!顾麑?duì)此「?jìng)€(gè)人非常興奮」。

這暗示著,被認(rèn)為是當(dāng)前大模型基石的注意力機(jī)制,仍有巨大的改進(jìn)空間。

更高效、更強(qiáng)大或具備新特性的注意力機(jī)制,可能從底層顯著提升模型的理解、推理和計(jì)算效率,是推動(dòng)性能邊界的重要杠桿。

3. 檢索的回歸:讓模型學(xué)會(huì)「查資料」

Sebastian早期曾主導(dǎo)「Retro」項(xiàng)目,研究讓模型在訓(xùn)練和推理時(shí)檢索外部知識(shí)庫,而非將所有知識(shí)死記硬背在參數(shù)中。他認(rèn)為,這一方向遠(yuǎn)未過時(shí)。

「我內(nèi)心深處相信,長(zhǎng)期的答案是以可微分的方式學(xué)習(xí)這種能力?!惯@意味著,未來模型可能將檢索與推理更原生地結(jié)合,動(dòng)態(tài)地從海量知識(shí)源中獲取信息進(jìn)行思考,而非依賴后期「嫁接」的搜索工具。

這能讓模型更精準(zhǔn)、更及時(shí),并可能突破參數(shù)規(guī)模的知識(shí)容量限制。


4. 效率與成本的「革命」

一個(gè)日益凸顯的挑戰(zhàn)是:隨著用戶激增,模型的部署和服務(wù)成本變得至關(guān)重要。未來的研究將不再只追求性能峰值,還必須關(guān)注如何讓強(qiáng)大模型變得「便宜又好用」。

我仍看不到盡頭

采訪臨近尾聲,當(dāng)我們把鏡頭拉回這位站在AI浪潮之巔的研究者本人時(shí),Sebastian的回答透露著一種沉靜的樂觀與純粹的熱情。

盡管探討了數(shù)據(jù)瓶頸、成本挑戰(zhàn)等現(xiàn)實(shí)問題,但Sebastian對(duì)AI進(jìn)步的總體判斷依然充滿信心。


「我已經(jīng)多次提到這一點(diǎn),但確實(shí)有如此多不同的事情會(huì)復(fù)合起來,還有許多有改進(jìn)空間的方向。我現(xiàn)在真的看不到這類工作停止給我們帶來進(jìn)步的任何盡頭?!?/p>

這種信心并非盲目。它源于他作為一線領(lǐng)航者所目睹的:大量細(xì)微但確定的改進(jìn)空間,以及整個(gè)領(lǐng)域尚未枯竭的創(chuàng)造活力。

在他看來,至少在未來幾年,這種進(jìn)步勢(shì)頭不會(huì)放緩。

規(guī)模不再是神話

Noam Shazeer回歸后的第一桶冷水

接下來,是Jeff Dean、Noam Shazeer、Oriol Vinyals三位大佬的對(duì)談。


在會(huì)議中,我們能明顯感受到,Noam不再是那個(gè)把油門踩到底的激進(jìn)派。

他幾乎不主動(dòng)談?wù)摗割嵏病?,也很少用那些讓人血脈噴張的宏大詞匯。甚至一反常態(tài),多次談到研發(fā)節(jié)奏、系統(tǒng)的穩(wěn)定性,以及如何長(zhǎng)期運(yùn)行。

作為Transformer的開創(chuàng)者,他曾經(jīng)引領(lǐng)著大模型從無到有;現(xiàn)在,大模型一路高歌猛進(jìn),他卻停下來警告:大模型給出的答案太快,自我檢查的次數(shù)太少。

他曾在公開場(chǎng)合反復(fù)強(qiáng)調(diào):

現(xiàn)在的模型并不缺「聰明」,缺的是持續(xù)思考,并在復(fù)雜任務(wù)中反復(fù)修正的能力。

也就是說,大模型的規(guī)模依然重要,但它不再是決定一切的唯一變量。

當(dāng)Noam討論推理時(shí),他明顯將重心從「能不能更強(qiáng)」移向了「能不能更穩(wěn)定」。

這是他回歸Google后,第一次在公開場(chǎng)合展現(xiàn)這種判斷。

聽起來并不像是否定過去,而更像是在承認(rèn)一個(gè)事實(shí):那條單純靠堆參數(shù)就能不斷前進(jìn)的路,已經(jīng)接近邊界了。

頂級(jí)科學(xué)家的共識(shí):一次高分,不能定義AI的未來

Noam提到一個(gè)詞:慢思考(Slow Thinking)。

不只是簡(jiǎn)單的放慢研發(fā)速度,而是反復(fù)追問值不值、貴不貴、能不能被規(guī)?;瘡?fù)制。

至此,智能不再是一項(xiàng)抽象的能力,而是一項(xiàng)需要長(zhǎng)期支付的工程開銷,需要和CPU、硬盤一起放進(jìn)賬本里討論。

這一步一旦邁出去,很多過去衡量AI的標(biāo)準(zhǔn),如Benchmark也在慢慢失效。

在整場(chǎng)會(huì)議中,三位頂級(jí)科學(xué)家沒有表現(xiàn)出對(duì)榜單的興奮,也沒用「誰贏了誰」來定義進(jìn)展。

榜單擅長(zhǎng)衡量瞬時(shí)表現(xiàn),卻很難回答「能不能一直運(yùn)行」這類長(zhǎng)期問題。

而Noam和Jeff反復(fù)強(qiáng)調(diào)的,恰恰是后者:模型是否可靠、是否具備遷移能力、是否能在復(fù)雜任務(wù)中持續(xù)自我修正。

這些能力,很難被壓縮成一個(gè)漂亮的數(shù)字。

Gemini被當(dāng)成System,而不是Model

在這場(chǎng)對(duì)談里,「System」出現(xiàn)的頻率極高,這顯然不是一種修辭。

Noam和Jeff在描述Gemini時(shí),刻意避開了「一個(gè)更強(qiáng)的模型」這種表述,而是反復(fù)強(qiáng)調(diào)它是一個(gè)可以長(zhǎng)期運(yùn)行、不斷迭代的「系統(tǒng)」。

「系統(tǒng)」和「模型」,聽起來差不多,但背后的邏輯天差地別。

「模型」更像是一次性的成果,是在實(shí)驗(yàn)室里的瞬間表現(xiàn);而「系統(tǒng)」更像基礎(chǔ)設(shè)施,它關(guān)心的是穩(wěn)定性、可擴(kuò)展性,以及在出現(xiàn)錯(cuò)誤后能不能快速修復(fù)并繼續(xù)工作。

對(duì)于Noam這類,極度強(qiáng)調(diào)架構(gòu)設(shè)計(jì)、研發(fā)節(jié)奏和工程約束的人,天然會(huì)更在意一個(gè)系統(tǒng)能不能穩(wěn)健地運(yùn)行十年、二十年,而不是某一次響應(yīng)速度有多快。

在他們眼中,Gemini不是勝利者的獎(jiǎng)品,而是一種「長(zhǎng)期可用」的智能形態(tài)。

正因如此,整場(chǎng)對(duì)談沒有急于求成的產(chǎn)品宣發(fā),沒有劍拔弩張的「對(duì)標(biāo)某模型」。

它更像是在對(duì)外強(qiáng)調(diào):Google追求的不是曇花一現(xiàn)的成品,而是一套能反復(fù)使用、不斷進(jìn)化的智能工業(yè)體系。

參考資料:

https://x.com/JeffDean/status/2001759657950667219

https://x.com/JeffDean/status/2001692889299206519

https://twitter.com/i/spaces/1eaJbjvBOooJX/peek

https://x.com/Hangsiin/status/2001780901982961944

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責(zé)!評(píng)論區(qū)一言難盡!

男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責(zé)!評(píng)論區(qū)一言難盡!

你食不食油餅
2025-12-25 20:35:40
Google 這對(duì)組合拳太狠了!3 句話讓我的 Idea 變成真 App,全程不寫代碼,爽翻!

Google 這對(duì)組合拳太狠了!3 句話讓我的 Idea 變成真 App,全程不寫代碼,爽翻!

AI范兒
2025-12-25 14:01:00
敖德薩遭襲,此前澤連斯基變卦、變卦、又變卦……

敖德薩遭襲,此前澤連斯基變卦、變卦、又變卦……

新民周刊
2025-12-26 09:07:59
烏軍確認(rèn)撤出西維爾斯克,庫皮揚(yáng)斯克取得進(jìn)展,克宮拒絕圣誕?;?>
    </a>
        <h3>
      <a href=烏軍確認(rèn)撤出西維爾斯克,庫皮揚(yáng)斯克取得進(jìn)展,克宮拒絕圣誕停火 鷹眼Defence
2025-12-24 16:19:36
圣誕節(jié),美國(guó)“家中”唱《我和我的祖國(guó)》——姜昆等寓意何為!

圣誕節(jié),美國(guó)“家中”唱《我和我的祖國(guó)》——姜昆等寓意何為!

TVB的四小花
2025-12-26 00:23:53
毛東東很調(diào)皮,爬到爺爺?shù)募绨蛏希棠躺廴A打心底高興

毛東東很調(diào)皮,爬到爺爺?shù)募绨蛏希棠躺廴A打心底高興

大江
2025-12-26 11:14:49
妻子與男閨蜜在歐洲玩15天,接到電話立馬回家,卻已于事無補(bǔ)

妻子與男閨蜜在歐洲玩15天,接到電話立馬回家,卻已于事無補(bǔ)

紙鳶奇譚
2025-12-23 10:37:30
內(nèi)行人預(yù)測(cè)2026年大勢(shì),4大現(xiàn)象席卷全國(guó)!

內(nèi)行人預(yù)測(cè)2026年大勢(shì),4大現(xiàn)象席卷全國(guó)!

老特有話說
2025-12-25 12:01:20
首屆中科大少年班成員今何在?三大神童命運(yùn)各異

首屆中科大少年班成員今何在?三大神童命運(yùn)各異

長(zhǎng)星寄明月
2025-12-23 23:26:48
最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

阿胡
2025-12-23 17:56:32
拋棄的糟糠妻,如今到了王傳君手里閃閃發(fā)光

拋棄的糟糠妻,如今到了王傳君手里閃閃發(fā)光

鋒哥與八卦哥
2025-12-25 14:08:39
最后一次!安東尼奧尼傳世佳作迎來告別放映

最后一次!安東尼奧尼傳世佳作迎來告別放映

幕味兒
2025-12-26 10:37:17
董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

八怪娛
2025-12-26 10:14:31
廣州一家5口墜江遇難!4大1小,原因令人憤怒,村民透露更多

廣州一家5口墜江遇難!4大1小,原因令人憤怒,村民透露更多

觀察鑒娛
2025-12-26 08:45:50
勝獨(dú)行俠勇士迎最佳局面!6配角被盤活,不和格林一起上陣舒服!

勝獨(dú)行俠勇士迎最佳局面!6配角被盤活,不和格林一起上陣舒服!

細(xì)話籃球
2025-12-26 11:13:29
4 屆世界杯冠軍連續(xù) 11 年缺席!意大利足球,為何徹底迷失了?

4 屆世界杯冠軍連續(xù) 11 年缺席!意大利足球,為何徹底迷失了?

瀾歸序
2025-12-25 14:03:34
臺(tái)灣民意機(jī)構(gòu)通過賴清德彈劾提案

臺(tái)灣民意機(jī)構(gòu)通過賴清德彈劾提案

第一財(cái)經(jīng)資訊
2025-12-26 13:44:59
96年我咒女同桌沒人娶,19年后她突然出現(xiàn):當(dāng)年的話,自己來兌現(xiàn)

96年我咒女同桌沒人娶,19年后她突然出現(xiàn):當(dāng)年的話,自己來兌現(xiàn)

卡西莫多的故事
2025-12-25 10:12:11
1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

春秋硯
2025-12-20 08:55:09
雞娃的盡頭是街道辦?!東西海朝等5區(qū)公示錄取名單及生源校!

雞娃的盡頭是街道辦?!東西海朝等5區(qū)公示錄取名單及生源校!

京城教育圈
2025-12-25 20:44:46
2025-12-26 14:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14186文章數(shù) 66397關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

澤連斯基圣誕致辭疑詛咒普京"他該去死" 克宮回應(yīng)

頭條要聞

澤連斯基圣誕致辭疑詛咒普京"他該去死" 克宮回應(yīng)

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天深夜道歉,只字未提五月天阿信

財(cái)經(jīng)要聞

資管江湖的人事“寒冬”

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

教育
房產(chǎn)
親子
家居
健康

教育要聞

陰影面積是12,求直角梯形的面積

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

親子要聞

2026年,幼兒園關(guān)停潮已經(jīng)來了

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

這些新療法,讓化療不再那么痛苦

無障礙瀏覽 進(jìn)入關(guān)懷版