国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華姚順宇跳槽谷歌后首秀:Gemini 3 Deep Think重大升級(jí)

0
分享至

2 月 12 日,谷歌上線 Gemini 3 Deep Think 的重大升級(jí)。這次升級(jí)的背后,也站著一位在 2025 年 9 月因?yàn)椴粷M前東家 Anthropic 言論而辭職加入谷歌的清華物理系傳奇校友姚順宇


圖 | 姚順宇(來源:資料圖)

作為一款推理模型,Gemini 3 Deep Think 在多項(xiàng)基準(zhǔn)測(cè)試中刷新紀(jì)錄:ARC-AGI-2 測(cè)試達(dá) 84.6%,Codeforces 編程平臺(tái)獲 3,455 分(世界排名第 8,僅 7 人能超越),并在數(shù)學(xué)、物理、化學(xué)奧賽中達(dá)金牌水平。然而,其每項(xiàng)任務(wù)成本僅為 13.62 美元,比 OpenAI o3 降低大約 280-420 倍。目前,新模型已被用于數(shù)學(xué)論文審閱、晶體生長(zhǎng)工藝優(yōu)化等科研場(chǎng)景,現(xiàn)已通過 Gemini 應(yīng)用和 API 向訂閱用戶及部分研究者開放。


(來源:Google)

如果你對(duì) 2025 年 Gemini Deep Think 在 IMO 摘金的印象還停留在這是一個(gè)很會(huì)解題的學(xué)霸,那么這次升級(jí)可能會(huì)讓你重新認(rèn)識(shí)它。學(xué)霸和科學(xué)家的區(qū)別在于:前者擅長(zhǎng)回答帶有標(biāo)準(zhǔn)答案的問題,但是后者敢于跳進(jìn)沒有邊界、數(shù)據(jù)殘缺、甚至沒有人知道終點(diǎn)在哪里的渾水。這正是此次 Deep Think 升級(jí)最本質(zhì)的跨越。


(來源:Google)

谷歌在官方博客中反復(fù)強(qiáng)調(diào)的關(guān)鍵詞是:“messy or incomplete。”現(xiàn)實(shí)世界的科研難題,從來不像奧數(shù)題那樣會(huì)給你完美的已知條件。一個(gè)凝聚態(tài)物理的實(shí)驗(yàn)數(shù)據(jù)可能包含無法復(fù)現(xiàn)的噪聲,一個(gè)化學(xué)生物學(xué)交叉課題的文獻(xiàn)綜述可能需要橫跨幾十年的幾十個(gè)互斥的假說。新版 Deep Think 的核心突破,則是學(xué)會(huì)了在這種混沌之中保持推理的優(yōu)雅。

有這樣一組數(shù)據(jù)也許足以讓同行沉默。在被稱為人類最后考試(Humanity‘s Last Exam)的極限基準(zhǔn)測(cè)試中,Deep Think 在不借助任何外部工具的情況下拿下 48.4% 的準(zhǔn)確率。這個(gè)數(shù)字的厲害之處在于,它不僅甩開了 GPT-5.2(34.5%)和 Claude Opus 4.6(40.0%),也意味著 AI 首次在橫跨數(shù)百個(gè)尖端學(xué)科的長(zhǎng)尾難題中,逼近了人類博士候選人的中位線。

而在 ARC-AGI-2 這個(gè)被公認(rèn)為是抽象推理試金石的測(cè)試中,84.6% 的得分是一個(gè)代際斷層的表現(xiàn)。ARC Prize Foundation 的獨(dú)立驗(yàn)證,更是讓這個(gè)數(shù)字褪去了營(yíng)銷成分。

可能會(huì)讓一部分人感到脊背發(fā)涼的是 Codeforces 那行小小的數(shù)字:3455Elo。關(guān)注競(jìng)技編程的讀者知道,2,700 分已經(jīng)是國(guó)際特級(jí)大師的表現(xiàn),3,000 分是人類窮盡職業(yè)生涯也難以觸摸的神域。更可怕的是,3,455 分這個(gè)分?jǐn)?shù)是不借助任何工具取得的,既不是純文本生成,也沒有代碼執(zhí)行輔助。這意味著 Deep Think 對(duì)于算法本質(zhì)的理解,已經(jīng)內(nèi)化成為某種超越代碼本身的直覺。


(來源:Google)

然而,如果把這次升級(jí)僅僅解讀為跑分更強(qiáng),就完全錯(cuò)過了谷歌布下的那盤大棋。這個(gè)棋局藏在兩個(gè)看似不抬起眼的場(chǎng)景描述里。

第一個(gè)場(chǎng)景是把手繪草圖直接生成 3D 打印文件。從模糊的線條到精密的物理模型,中間橫亙著幾何建模、結(jié)構(gòu)力學(xué)分析、打印路徑優(yōu)化等多道專業(yè)壁壘。Deep Think 做到了在理解繪圖這意圖的基礎(chǔ)之上,主動(dòng)補(bǔ)全了那些草圖上沒有畫出來的受力邏輯。

第二個(gè)場(chǎng)景是羅格斯大學(xué)的數(shù)學(xué)家 Lisa Carbone 用它審稿,Deep Think 發(fā)現(xiàn)了一處人類審稿人集體遺漏的微秒邏輯漏洞,這意味著 AI 能在前沿研究的模糊地帶捕捉到推理鏈的斷裂,也意味著 AI 告別了只是復(fù)述教科書式的錯(cuò)誤的階段。

這兩件事的共同點(diǎn)在于,AI 不再只是等待指令,開始主動(dòng)介入創(chuàng)造與驗(yàn)證的閉環(huán)。這也正是姚順宇在那篇廣為流傳的離職博文中反復(fù)提到的命題。這位當(dāng)年清華物理系的特獎(jiǎng)得主,大二開始選修研究生課程,先后成為美國(guó)斯坦福大學(xué)博士和美國(guó)加州大學(xué)伯克利分校博士后,卻在傳統(tǒng)理論物理最光鮮的學(xué)術(shù)坦途選擇了轉(zhuǎn)彎。他曾在博文里寫道,一個(gè)沒有實(shí)驗(yàn)指引的領(lǐng)域,很難客觀評(píng)判理論工作的價(jià)值。他看到的困局,其實(shí)也是 AI 行業(yè)自身的影像。

過去兩年,有時(shí)人們沉迷于在封閉基準(zhǔn)上比拼小數(shù)點(diǎn)后的精度,卻越來越遠(yuǎn)離使用智能解決真實(shí)問題的初心。姚順宇把當(dāng)下的 AI 研究比作 17 世紀(jì)的熱力學(xué)。那時(shí),人們甚至不知道熱是什么,燃素說依然是主流,但是這并不妨礙波義爾通過系統(tǒng)實(shí)驗(yàn)總結(jié)出定律,并最終催生了蒸汽機(jī)。Deep Think 此次升級(jí)的野望,或許正是要成為AI世界的波義爾。

因此,與其說 Gemini 3 Deep Think 是一個(gè)模型,不如說它是一個(gè)正在快速進(jìn)化的科研操作系統(tǒng)。3455 Elo 是它的左腦,84.6% 的抽象推理是它的右腦,而從草圖到實(shí)物的 3D 打印能力是它伸向物理世界的一只手臂。幾百年前,牛頓用自己在蘋果樹下的思考解釋宇宙,AI 時(shí)代的今天,無論如何都得換種方法了。

參考資料:

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

https://the-decoder.com/google-deepmind-upgrades-gemini-3-deep-think-for-complex-science-and-engineering-tasks/

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)女冰隊(duì)長(zhǎng)反擊特朗普,怒批不合時(shí)宜的笑話讓運(yùn)動(dòng)員成就遭掩蓋

美國(guó)女冰隊(duì)長(zhǎng)反擊特朗普,怒批不合時(shí)宜的笑話讓運(yùn)動(dòng)員成就遭掩蓋

體育妞世界
2026-02-26 15:28:54
韓國(guó)總統(tǒng):將持續(xù)努力與朝鮮對(duì)話

韓國(guó)總統(tǒng):將持續(xù)努力與朝鮮對(duì)話

財(cái)聯(lián)社
2026-02-26 15:52:05
太暖心!30萬現(xiàn)金燒成黑渣,基層銀行拒之門外?央行直接上門處理

太暖心!30萬現(xiàn)金燒成黑渣,基層銀行拒之門外?央行直接上門處理

川渝視覺
2026-02-26 16:21:37
楊毅:放眼國(guó)際籃聯(lián)歷史,這場(chǎng)比賽判罰也是無法無天的

楊毅:放眼國(guó)際籃聯(lián)歷史,這場(chǎng)比賽判罰也是無法無天的

懂球帝
2026-02-26 20:54:03
一場(chǎng)高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

一場(chǎng)高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

芭比衣櫥
2026-02-24 09:41:49
小叔子35歲仍然單身。有一天,我丈夫不在家,他突然前來找我談話

小叔子35歲仍然單身。有一天,我丈夫不在家,他突然前來找我談話

第7情感
2026-02-10 17:13:09
小獵豹老婆打緊縮針!金晨的鼻子“罷工”!

小獵豹老婆打緊縮針!金晨的鼻子“罷工”!

八卦瘋叔
2026-02-26 11:47:39
這么成熟的臉來演初中生?都可以演初中生他媽了,這部劇瘋了吧?

這么成熟的臉來演初中生?都可以演初中生他媽了,這部劇瘋了吧?

星宿影視鴨
2026-02-26 11:17:18
德國(guó)總理默茨在中國(guó)兩天一夜,完全沒了之前高高在上的樣子

德國(guó)總理默茨在中國(guó)兩天一夜,完全沒了之前高高在上的樣子

小陸搞笑日常
2026-02-27 02:35:02
超雄真的有那么可怕嗎?網(wǎng)友的分享,一看一個(gè)不吱聲

超雄真的有那么可怕嗎?網(wǎng)友的分享,一看一個(gè)不吱聲

另子維愛讀史
2026-02-01 20:30:29
開工沒幾天,有醫(yī)院病房已爆滿!該病正愈發(fā)年輕化,這些行為該改改了

開工沒幾天,有醫(yī)院病房已爆滿!該病正愈發(fā)年輕化,這些行為該改改了

齊魯壹點(diǎn)
2026-02-26 11:09:20
褚時(shí)健到2002年才明白,原來當(dāng)年是得罪了惹不起的那幾位

褚時(shí)健到2002年才明白,原來當(dāng)年是得罪了惹不起的那幾位

阿柒的訊
2026-02-24 15:07:34
廣東夫妻爆吵后“扔孩子”投江沖上熱搜,我看到了最無能父母的樣子……

廣東夫妻爆吵后“扔孩子”投江沖上熱搜,我看到了最無能父母的樣子……

桌子的生活觀
2026-02-26 12:17:54
發(fā)現(xiàn)一個(gè)悲哀現(xiàn)象:中國(guó)的長(zhǎng)壽老人,幾乎都是子女用生命在托舉

發(fā)現(xiàn)一個(gè)悲哀現(xiàn)象:中國(guó)的長(zhǎng)壽老人,幾乎都是子女用生命在托舉

談史論天地
2026-02-21 08:33:48
女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
普通人怎么快速賺到100萬?

普通人怎么快速賺到100萬?

流蘇晚晴
2026-02-15 18:05:40
TVB“御用爛仔”演員游飚去世,終年57歲,李力持發(fā)文悼念

TVB“御用爛仔”演員游飚去世,終年57歲,李力持發(fā)文悼念

紅星新聞
2026-02-25 11:05:07
湖南一縣委書記抖音賬號(hào)成民情留言板,一天漲粉約4萬,當(dāng)?shù)兀簳涀约菏褂迷撡~號(hào),本人回復(fù)網(wǎng)友

湖南一縣委書記抖音賬號(hào)成民情留言板,一天漲粉約4萬,當(dāng)?shù)兀簳涀约菏褂迷撡~號(hào),本人回復(fù)網(wǎng)友

揚(yáng)子晚報(bào)
2026-02-26 12:34:10
雨雨雨模式開啟,上海今日傍晚雨勢(shì)增強(qiáng),未來一周難覓陽光

雨雨雨模式開啟,上海今日傍晚雨勢(shì)增強(qiáng),未來一周難覓陽光

縱相新聞
2026-02-26 18:33:06
“中產(chǎn)階級(jí)”及格線誕生!全國(guó)只有3320萬戶,你達(dá)標(biāo)了嗎?

“中產(chǎn)階級(jí)”及格線誕生!全國(guó)只有3320萬戶,你達(dá)標(biāo)了嗎?

李云飛Afey
2026-01-01 12:52:31
2026-02-27 04:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16325文章數(shù) 514659關(guān)注度
往期回顧 全部

科技要聞

單季營(yíng)收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

美國(guó)政府對(duì)外交官下令:開始行動(dòng)

頭條要聞

美國(guó)政府對(duì)外交官下令:開始行動(dòng)

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強(qiáng)公開表態(tài) 財(cái)產(chǎn)留給兒媳婦郭碧婷

財(cái)經(jīng)要聞

中國(guó)AI調(diào)用量超美國(guó) 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

本地
時(shí)尚
教育
公開課
軍事航空

本地新聞

津南好·四時(shí)總相宜

今年春天最美搭配:西裝+半裙,怎么穿都好看!

教育要聞

小升初學(xué)霸題,能答對(duì)很厲害了,求面積

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美政府給新伊核協(xié)議設(shè)限內(nèi)容遭披露

無障礙瀏覽 進(jìn)入關(guān)懷版