国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

【關注】胡延平:Gemini 3釋放了12個信號——打臉懷疑論,漸進范式也可以逼近AGI?

0
分享至




在模型底層原理(Transformer-Difussion-Mamba等)、智能的數(shù)學世界觀等層面,以及進一步面向以融合感知、持續(xù)學習、內生自主為基礎的認知與行為智能等方面,存在著范式變革的需求。

本文作者系
盤古智庫學術委員、
上海財經大學特聘教授、智能科技產業(yè)與智能經濟研究學者
胡延平,
文章來源于“
胡延平研思小筆記

本文大約2100字,讀完約5分鐘。


在Yann LeCun、Richard Sutton等聲稱現(xiàn)有技術方向死路一條的時候,在多方認為范式效率陷入停滯的時候,Gemini 3以智能水準的顯著躍升打臉了懷疑論。

都知道Google動靜不會小,只是沒想到這次憋出來的有點大:ARC-AGI-2、Humanity’s Last Exam、ScreenSpot-Pro等新型基準測試成績數(shù)倍于GPT-5.1,提升幅度之大遠超擠牙膏的OpenAI,有Google提前發(fā)布了GPT-6的即視感。AIME 2025更是得到了100%的滿分。

試用和討論過程中,提煉出Gemini 3釋放的12個信號:

1.代碼、視覺理解、數(shù)學、智能體、工具利用等構成能力內核,智能水準走向可用的交付而不是尚未閉環(huán)的生成,尤其代碼通則智能通;

2.AIME 2025(美國數(shù)學邀請賽)是個有點普通的基準,但測試滿分可以理解為AGI的第一個預演。AGI有沒有到來,關鍵看如何定義AGI。一直認為AGI不是只有一個時點、一個刻度。AGI是從多方面分無數(shù)次到來的。從知識到推理,從問答到感知和行動,從AGI到ASI,測試機構和業(yè)界始終在前移路標,但是如果路標一直上調標準,意味著AGI始終難以到達。

3.數(shù)據-算法-算力-能源、Transformer-LLMs-MLLMs-Agent-Tools的范式即使不顛覆,漸進發(fā)展下去也可以逐步逼近AGI。

4.芯片-操作系統(tǒng)-瀏覽器-云平臺-大模型-智能體-軟件-Apps-開發(fā)生態(tài)-億萬用戶,全棧-全生態(tài)能力不僅有利于競爭,也有利于做出更高水準的智能。

5.Gemini 3在ARC-AGI-2、Humanity’s Last Exam等更具挑戰(zhàn)的創(chuàng)新基準測試中,一騎絕塵的表現(xiàn)尤其增強了業(yè)者的信心和希望,不僅Scaling Law繼續(xù)有效,網絡效應、規(guī)模奇點、整體最優(yōu)等生態(tài)法則也在起作用;Scaling Law不是成效顯著衰減了,而是潛力才剛開始釋放;缺乏足夠的低成本算力、缺少用之不盡的高質量訓練數(shù)據以及被電力問題搞得焦頭爛額,至少部分原因其實不是智能范式的鍋,是大模型的creator們資源實力有限的錯。

6.超級平臺和超級智能合體對打造強智能來說是好事,但是對防止生態(tài)極化和生態(tài)依附沒有好處,頭部人工智能企業(yè)的強者恒強、贏者通吃、虹吸效應、生態(tài)失衡等發(fā)展特征越來越明顯。打造了Transformer的Google王者歸來意味著OpenAI-Microfost聯(lián)盟(超級智能+超級平臺)多了一個競爭對手,但Google仍然是AI極化發(fā)展趨向的一部分,超級智能和超級平臺在Google這里天然是一體的。

7.如果說之前2和2.5版本的Gemini只是對GPT產生沖擊,Gemini 3意味著Google生態(tài)實力對OpenAI的地位構成動搖。OpenAI真正的勁敵不是Anthropic,接下來圍繞OpenAI融資、估值、上市的一系列過程,必然跌宕起伏變化多端。此前這個勢頭從原生多模態(tài)、Veo等多個技術和產品節(jié)點已經初現(xiàn)端倪。不過試用比較Gemini 3 Pro和GPT-5.1的Deep Research,GPT-5.1還是有肉眼可見的優(yōu)等生即視感。模型之間真正的比拼不在常規(guī)問答,在Deep Think、Deep Research等“深”水區(qū)域,真實水準往往在200美元左右而不是20美元左右的賬戶里使用才能夠比較出來。然而即使如此,Gemini 3還是會讓OpenAI的壓力山大,GPT-5.5、GPT-6只可能加快節(jié)奏。

8.奧特曼稱GPT-6會顯著優(yōu)于GPT-5,尤其記憶方面;不過Gemini 3力證了業(yè)界的一個基本共識,比較現(xiàn)實且高ROI的智能水準提升途徑,是智能體、工具、代碼等方面的生態(tài)協(xié)同,模型要么將Agent與工具等能力內化,要么對Agent與工具調用有更好的支持,而只有更好的內化才會有更好的支持。

9.Gemini 3主要是范式的漸進,不過也有能力的突變,否則不會多項基準表現(xiàn)大幅度躍升。更為復雜的深度推理成為亮點,是強化學習、思維鏈有新進展?還是有創(chuàng)新的方法?有待繼續(xù)觀察。

10.使用自家TPU而非GPU訓練和推理,Gemini可以稱之為非英偉達生態(tài)也能走出來的一個成功范例,其它非英偉達生態(tài)由此增添了一些想象力。

11.題外話,DeepSeek奇跡再次復現(xiàn)的概率不大,因為AI生態(tài)的競爭游戲不再是單點突破,而是整體的生態(tài)推進能力。

12.另一個題外話,去年烏鎮(zhèn)峰會期間主持AI OS討論時我曾經問過一個問題,安卓生態(tài)App向鴻蒙生態(tài)的遷移主要靠堆工程師且bug比較多,是不是可以用專門訓練的代碼能力較強的AI大模型來做編譯轉換。今年烏鎮(zhèn)峰會期間再次主持的時候,沒好意思再提這個問題。走到隨Gemini 3一起發(fā)布的Antigravity開發(fā)平臺這一步,至少大量相對簡單的長尾安卓App,未來通過“標準+模型+工具+人工”,一鍵遷移到鴻蒙生態(tài)其實越來越接近可行。簡而言之,鴻蒙生態(tài)化出現(xiàn)的卡頓,其實也顯示了AI能力的不足。

重復之前答媒體問時的觀點,LeCun等所謂死路,其實不是死路,而是要走的路,至少是其中一條路,而且是必經的路,并且是已經走通的路。懷疑論認為是未來之路的路,目前還沒有究竟,目前所謂世界模型其實主要是基于視覺的空間智能或時空智能,真正的世界模型還比較遙遠。倒是在模型底層原理(Transformer-Difussion-Mamba等)、智能的數(shù)學世界觀等層面,以及進一步面向以融合感知、持續(xù)學習、內生自主為基礎的認知與行為智能等方面,存在著范式變革的需求?!?/p>




文章來源于“胡延平研思小筆記”微信公眾號

圖文編輯:張洵

責任編輯:劉菁波

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
前國安主帥被評年度最佳!曾被批太保守,球隊年年換帥何時奪冠?

前國安主帥被評年度最佳!曾被批太保守,球隊年年換帥何時奪冠?

體壇鑒春秋
2026-01-11 22:37:15
德國雜志“惡意抓拍”?樊振東封面照被批“認不出”,球迷怒懟:辜負他的治愈微笑

德國雜志“惡意抓拍”?樊振東封面照被批“認不出”,球迷怒懟:辜負他的治愈微笑

最愛乒乓球
2026-01-11 08:21:43
魅族,整了個新玩意

魅族,整了個新玩意

放毒
2026-01-10 19:51:00
砸手里了!美媒曬本季8大交易價值暴跌球星:追夢入選+濃眉排第一

砸手里了!美媒曬本季8大交易價值暴跌球星:追夢入選+濃眉排第一

鍋子籃球
2026-01-11 21:44:56
中國的“性蕭條”時代,正式到來了

中國的“性蕭條”時代,正式到來了

律法刑道
2025-12-15 08:28:58
1980年,王光美拿過追悼會名單,狠狠劃掉幾人,卻添上個正在挨整的將軍:他對咱家有恩

1980年,王光美拿過追悼會名單,狠狠劃掉幾人,卻添上個正在挨整的將軍:他對咱家有恩

源溯歷史
2026-01-07 19:28:08
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽
2025-12-23 18:33:38
2個首輪+2個次輪,開拓者贏麻了?楊瀚森的機會才剛剛開始

2個首輪+2個次輪,開拓者贏麻了?楊瀚森的機會才剛剛開始

他想要很多很多的夢
2026-01-11 23:30:04
爽子小號曝光,爽言爽語再加上半張臉露出的嘴角疤痕讓人一眼認出

爽子小號曝光,爽言爽語再加上半張臉露出的嘴角疤痕讓人一眼認出

樂悠悠娛樂
2026-01-10 11:35:58
中俄相繼出手后,不到24小時,特朗普下令放人,取消第二波打擊

中俄相繼出手后,不到24小時,特朗普下令放人,取消第二波打擊

小鬼頭體育
2026-01-11 07:39:16
焦點 || 江蘇12歲小學生服藥自殺,遺書稱寫不會英語單詞,媽媽起訴……

焦點 || 江蘇12歲小學生服藥自殺,遺書稱寫不會英語單詞,媽媽起訴……

直播銀川
2026-01-11 16:59:20
36歲哺乳期媽媽在私人工作室打玻尿酸,喊了聲疼后單眼永久性失明

36歲哺乳期媽媽在私人工作室打玻尿酸,喊了聲疼后單眼永久性失明

半島晨報
2026-01-11 20:44:48
如果你想毀掉一個孩子的學習能力,請繼續(xù)這樣“愛”他

如果你想毀掉一個孩子的學習能力,請繼續(xù)這樣“愛”他

曾奇峰心理工作室
2026-01-11 12:01:13
你知道女性的陰道有多長嗎?或許與你所想,完全不同!

你知道女性的陰道有多長嗎?或許與你所想,完全不同!

戰(zhàn)爭茶館
2025-11-26 10:33:50
據說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關系

據說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關系

忠于法紀
2025-12-04 11:25:07
玄彬哭紅眼李政宰捧遺像,韓國半個影壇為噎死的老影帝長跪不起

玄彬哭紅眼李政宰捧遺像,韓國半個影壇為噎死的老影帝長跪不起

安寧007
2026-01-09 19:28:49
再摳門,也不要在網上買這6樣東西,會致癌,看完真會后怕的!

再摳門,也不要在網上買這6樣東西,會致癌,看完真會后怕的!

古事尋蹤記
2026-01-07 07:18:22
立刻戒掉這個“口頭禪”,它像一道符咒,死死封印著你的財運

立刻戒掉這個“口頭禪”,它像一道符咒,死死封印著你的財運

真實人物采訪
2026-01-10 16:00:05
為什么老一輩說財不外露?網友 :炫耀了一下,就帶著全家跪下借錢

為什么老一輩說財不外露?網友 :炫耀了一下,就帶著全家跪下借錢

夜深愛雜談
2026-01-10 23:00:25
U23國足末輪形勢:贏球頭名&打平出線,輸球則命懸一線!

U23國足末輪形勢:贏球頭名&打平出線,輸球則命懸一線!

懂球帝
2026-01-12 00:07:17
2026-01-12 00:44:49
盤古智庫 incentive-icons
盤古智庫
盤古智庫官方賬號
5650文章數(shù) 9853關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

特朗普就格陵蘭島下最后通牒 加拿大開始行動了

頭條要聞

特朗普就格陵蘭島下最后通牒 加拿大開始行動了

體育要聞

U23國足形勢:末輪不負泰國即確保晉級

娛樂要聞

留幾手為閆學晶叫屈?稱網友自卑敏感

財經要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

房產
家居
親子
數(shù)碼
時尚

房產要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

家居要聞

木色留白 演繹現(xiàn)代自由

親子要聞

晨時評 | 新生兒疑被助產士剪斷手指,別用孩子亂動推卸責任

數(shù)碼要聞

科技有AI,連接全球:海信家電參展CES 2026,定義智慧生活新圖景

當一個57歲的女人,決定從零開始

無障礙瀏覽 進入關懷版