国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

奧特曼都點贊,谷歌Gemini 3 Pro到底強在哪?

0
分享至


谷歌可算是發(fā)布Gemini 3 Pro了,很突然,而且很“低調(diào)”。

雖然谷歌在Gemini 3 Pro之前發(fā)布了圖片編輯模型Nano Banana,進而刷了一波存在感。但是在基座模型方面,谷歌已經(jīng)靜默太久。

過去這大半年,大家都在熱議OpenAI的新動作,或者感嘆Claude在代碼領(lǐng)域的統(tǒng)治力,唯獨沒有人提及8個月沒有版本號升級的Gemini。

縱使谷歌的云業(yè)務(wù)和財報再漂亮,可在AI開發(fā)者的核心圈子里,谷歌的存在感仍然被一點點的稀釋。

好在的是,小榜在第一時間體驗過后發(fā)現(xiàn),Gemini 3 Pro并沒有讓我們失望。

但現(xiàn)在還不能過早下結(jié)論。因為現(xiàn)在的AI賽道早就已經(jīng)過了靠參數(shù)量嚇人的階段,大家都在卷應(yīng)用、卷落地、卷成本。

谷歌能不能適應(yīng)新版本和新環(huán)境,還是個未知數(shù)。


01

我讓Gemini 3 Pro用一句話來形容自己,它是這么回答我的。

“不再急于向世界證明自己有多聰明,而是開始琢磨如何讓自己變得更有用!薄狦emini 3 Pro

在LMArena排行榜上,Gemini 3 Pro以1501的Elo分數(shù)登頂,這是AI模型在綜合能力評估中的新紀錄。這是一個相當優(yōu)秀的成績,就連奧特曼也發(fā)推表示祝賀。


數(shù)學(xué)能力測試中,該模型在AIME2025(美國數(shù)學(xué)邀請賽)的代碼執(zhí)行模式下達到了100%的準確率。在GPQADiamond科學(xué)知識測試中,Gemini 3 Pro的準確率為91.9%。

MathArenaApex數(shù)學(xué)競賽的測試結(jié)果顯示,Gemini 3 Pro獲得了23.4%的得分,而其他主流模型的得分普遍在2%以下。此外,在名為Humanity'sLastExam的測試中,該模型在不使用工具的情況下達到了37.5%的得分。

Google在此次更新中引入了名為“vibecoding”的代碼生成功能。這項功能允許用戶通過自然語言描述需求,系統(tǒng)隨后生成相應(yīng)的代碼和應(yīng)用程序。

在Canvas編程環(huán)境的測試中,用戶描述“制作一個可以調(diào)節(jié)轉(zhuǎn)速的電風(fēng)扇”后,系統(tǒng)在約30秒內(nèi)生成了包含旋轉(zhuǎn)動畫、速度控制滑塊和開關(guān)按鈕的完整代碼。


官方展示的案例還包括核聚變過程的可視化模擬。

在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能。與傳統(tǒng)AI助手只返回文本回答不同,該系統(tǒng)可以根據(jù)查詢內(nèi)容自動生成定制化的界面布局。

例如,當用戶詢問量子計算相關(guān)問題時,系統(tǒng)可能生成包含概念解釋、動態(tài)圖表和相關(guān)論文鏈接的交互式界面。

針對不同受眾的同一問題,系統(tǒng)會生成不同的界面設(shè)計,舉個簡單例子,向兒童和成人解釋同一概念時,會采用不同的呈現(xiàn)方式。兒童的就會偏可愛,成人則會偏簡潔明了。

Google Labs中提供的Visual Layout實驗功能展示了這種界面的應(yīng)用,用戶可以獲得雜志風(fēng)格的視圖布局,包含圖片、模塊和可調(diào)節(jié)的UI元素。

此次發(fā)布還包含了名為Gemini Agent的智能體系統(tǒng),目前處于實驗階段。該系統(tǒng)可以執(zhí)行多步驟任務(wù),并連接到Gmail、Google Calendar和Reminders等谷歌服務(wù)。

在收件箱管理場景中,系統(tǒng)可以自動篩選郵件、標記優(yōu)先級和起草回復(fù)。旅行規(guī)劃是另一個應(yīng)用場景,用戶只需提供目的地和大致時間,系統(tǒng)會查詢?nèi)諝v、搜索航班和酒店選項,并添加行程安排。而這項功能目前僅向美國地區(qū)的Google AI Ultra訂閱用戶開放。

在多模態(tài)處理方面,Gemini 3 Pro基于稀疏混合專家架構(gòu)構(gòu)建,支持文本、圖像、音頻和視頻輸入。模型的上下文窗口為100萬token,意味著可以處理較長的文檔或視頻內(nèi)容。

加拿大勞瑞爾大學(xué)歷史學(xué)教授Mark Humphries的測試顯示,該模型在識別18世紀手寫文稿時的字符錯誤率為0.56%,相比前代版本降低了50%到70%。

Google表示,訓(xùn)練數(shù)據(jù)包括公開網(wǎng)絡(luò)文檔、代碼、圖像、音頻和視頻內(nèi)容,后訓(xùn)練階段使用了強化學(xué)習(xí)技術(shù)。

Google還推出了名為Gemini 3 Deep Think的優(yōu)化版本,專門用于復(fù)雜推理任務(wù)。該模式目前正在進行安全評估,計劃在未來幾周向Google AI Ultra訂閱者開放。

在Google Search的AI模式中,用戶可以點擊“thinking”選項卡查看該模式的推理過程。與標準模式相比,Deep Think模式會在生成回答前進行更多步驟的分析。

除了官方提供的資料外,我還將Gemini 3 Pro和ChatGPT-5.1進行了對比。

第一個對比就是生成圖片。

提示詞:給我生成一張iPhone17

ChatGPT-5.1


Gemini 3 Pro


主觀上來講,ChatGPT-5.1更符合我的需求,因此這回合是ChatGPT-5.1勝出。

第二個對比的就是兩者的智能體水平。

提示詞:去給我研究研究字母榜這個微信公眾號,然后評論一下這個號的水平

GPT-5.1


Gemini 3 Pro


雖然從主觀上來講,我更喜歡Gemini 3 Pro的解讀,但是太過于鼓吹,ChatGPT-5.1能發(fā)現(xiàn)小榜還有所不足,更客觀真實。

最后是代碼能力,也是目前所有大模型最關(guān)注的一塊。

我選的項目是GitHub上最近星數(shù)非常高的項目,叫做LightRAG。這是通過整合圖結(jié)構(gòu)來增強上下文感知和高效信息檢索,從而改進檢索增強生成,實現(xiàn)了更高的準確性和更快的響應(yīng)時間。項目地址https://github.com/HKUDS/LightRAG

提示詞:跟我說說這個項目如何

GPT-5.1


Gemini 3 Pro


同時,Gemini 3 Pro也獲得了業(yè)內(nèi)人士的高度評價。




02

雖然Gemini 3 Pro發(fā)布的非常低調(diào),但實際上谷歌已經(jīng)為Gemini 3 Pro預(yù)熱了很久。

在谷歌第三季度財報電話會上,谷歌CEO皮查伊說了這么一句話:“Gemini 3 Pro將在2025年內(nèi)發(fā)布!睕]有具體日期,沒有更多細節(jié),卻拉開了科技行業(yè)一場營銷大戲的序幕。

谷歌不斷釋放信號,讓整個AI社區(qū)保持高度關(guān)注,卻始終拒絕給出任何確定的發(fā)布時間表。

從10月開始,各種“意外泄露”接踵而至。10月23日開始流傳一份日歷,在其11月12日“Gemini 3 Pro Release”的內(nèi)部日歷截圖瘋傳。


而且眼尖的開發(fā)者還在Vertex AI的API文檔中發(fā)現(xiàn)了“gemini-3-pro-preview-11-2025”的字樣。


緊接著,Reddit 和 X上開始出現(xiàn)各種截圖。有用戶聲稱在 Gemini Canvas 工具中看到了新模型的身影,有人在移動應(yīng)用的某些版本中發(fā)現(xiàn)了異常的模型標識。

然后就是,下面這張測試數(shù)據(jù)開始在社交媒體流傳。


這些“泄露”看似偶然,實則構(gòu)成了一場精心編排的預(yù)熱。

每一次泄露都恰到好處地展示了Gemini 3 Pro 的某項核心能力,每一次討論都將期待值推向新的高度。而 谷歌官方賬號的態(tài)度則耐人尋味,他們會轉(zhuǎn)發(fā)社區(qū)的討論,會用“即將到來”這樣的措辭吊胃口,甚至谷歌AI實驗室的高層,還在關(guān)于發(fā)布日期預(yù)測的推文下回復(fù)了兩個“思考”表情符號,但就是不肯說出一個準確日期。

預(yù)熱了將近1個月,谷歌終于將新鮮的Gemini 3 Pro端了上來。然而Gemini 3 Pro性能雖然強勁,但是谷歌的更新頻率多少讓人有點著急。

早在今年3月份的時候,谷歌就發(fā)布了Gemini 2.5 Pro的預(yù)覽版本,后續(xù)又陸續(xù)推出了Gemini 2.5 Flash預(yù)覽版等衍生預(yù)覽版本。直至Gemini 3 Pro問世,Gemini系列在此期間無任何版本號升級。

可谷歌的對手們并不會等待Gemini。

OpenAI在8月7日推出了GPT-5,并在11月12日進一步升級到 GPT-5.1。而且這段時間里,OpenAI還推出了自己的AI瀏覽器Atlas,直指谷歌腹地。

Anthropic 的迭代速度更為密集:2月24日發(fā)布 Claude 3.7 Sonnet(首個混合推理模型),5月22日推出 Claude Opus 4 和 Sonnet 4,8月5日發(fā)布 Claude Opus 4.1,9月29日推出 Claude Sonnet 4.5,10月15日又發(fā)布了 Claude Haiku 4.5。

這一系列攻勢打得谷歌有些措手不及,不過目前來看,谷歌頂住了。


03

谷歌之所以耗時8個月才更新Gemini 3 Pro,最大的原因可能來自于人員上的變更。

2025年7月至8月前后,微軟對谷歌發(fā)起了一波猛烈的人才攻勢,成功招募了超過20名DeepMind的核心專家和高管。

這其中就包括DeepMind高級產(chǎn)品總監(jiān)(Senior Director of Product)戴夫·希創(chuàng)(Dave Citron),負責(zé)其核心AI產(chǎn)品的落地。以及Gemini的工程副總裁 (VP of Engineering)阿瑪爾·蘇布拉馬尼亞(Amar Subramanya),他是 Google最重要模型Gemini的核心工程負責(zé)人之一。

另外一方面,谷歌Nano Banana團隊曾表示,谷歌在發(fā)布Gemini 2.5 Pro后很長一段時間里,都在糾結(jié)AI生圖領(lǐng)域,進而放緩了基座模型的更新。

谷歌認為,只有攻克了角色一致性 (Character Consistency)、語境編輯(In-context Editing)、文字亂碼(Text Rendering)這三個生成圖片領(lǐng)域的難關(guān)后,才能讓基座模型的表現(xiàn)更好。

Nano Banana團隊表示,模型不僅能“畫得好看”,更重要的是能“聽懂人話”并“受人控制”,從而讓 AI 生圖真正進入商業(yè)落地階段。

這時回頭來看Gemini 3 Pro,它是一份合格的答卷,但在這個只爭朝夕的 AI 戰(zhàn)場,及格早已不夠。

谷歌既然選擇了在此時此刻交卷,就必須準備好面對最苛刻的閱卷人,那些已經(jīng)被競品“喂刁”了口味的用戶和開發(fā)者。接下來的幾個月,將不是模型參數(shù)的比拼,而是生態(tài)整合能力的肉搏。谷歌這頭大象不僅要學(xué)會跳舞,還得跳得比所有人都快。


歡迎在評論區(qū)留言~
如需開白請加小編微信:dongfangmark



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
一個畫面記了兩年?東方甄選主播YOYO向董宇輝道歉……

一個畫面記了兩年?東方甄選主播YOYO向董宇輝道歉……

柴狗夫斯基
2026-01-08 08:29:49
情況已經(jīng)開始不對勁兒了,馬杜羅成燙手山芋,把人交給俄羅斯?

情況已經(jīng)開始不對勁兒了,馬杜羅成燙手山芋,把人交給俄羅斯?

小陸搞笑日常
2026-01-07 08:15:51
不到72小時,日本遭受6個噩耗,東京亂成一團,高市徹底沒戲了

不到72小時,日本遭受6個噩耗,東京亂成一團,高市徹底沒戲了

青途歷史
2026-01-07 19:28:11
美國學(xué)者杰弗里·薩克斯:美國試圖主宰美洲的做法將引發(fā)暴力事件

美國學(xué)者杰弗里·薩克斯:美國試圖主宰美洲的做法將引發(fā)暴力事件

環(huán)球網(wǎng)資訊
2026-01-06 17:42:10
調(diào)侃廣東球迷是猴,抖音體育官方:已終止該解說員工作安排

調(diào)侃廣東球迷是猴,抖音體育官方:已終止該解說員工作安排

懂球帝
2026-01-08 08:05:13
35歲鄭爽近照曝光!臉部又僵又腫,徹底淪為素人,孩子身影曝光

35歲鄭爽近照曝光!臉部又僵又腫,徹底淪為素人,孩子身影曝光

葉公子
2026-01-07 20:11:46
菊花褲設(shè)計大揭秘:誰創(chuàng)造了這款潮流單品?

菊花褲設(shè)計大揭秘:誰創(chuàng)造了這款潮流單品?

白宸侃片
2026-01-05 09:50:11
iPhone 官方半價換電池,釘子戶終于等到了!

iPhone 官方半價換電池,釘子戶終于等到了!

黑貓科技迷
2026-01-07 23:57:35
徐靜蕾美國超市現(xiàn)身,黃立行白發(fā)相伴,15年戀愛長跑不婚也幸福

徐靜蕾美國超市現(xiàn)身,黃立行白發(fā)相伴,15年戀愛長跑不婚也幸福

墨語家
2026-01-07 20:40:26
山東區(qū)劃調(diào)整:日照并入臨沂?官方回應(yīng)

山東區(qū)劃調(diào)整:日照并入臨沂?官方回應(yīng)

大象新聞
2026-01-07 11:57:03
我70歲才明白:孩子不尊重你,無需翻臉,用“烏鴉定律”就行

我70歲才明白:孩子不尊重你,無需翻臉,用“烏鴉定律”就行

蘭姐說故事
2026-01-03 17:40:03
股價跌去近70%!霸王茶姬,咋了?

股價跌去近70%!霸王茶姬,咋了?

包不同
2026-01-07 11:12:42
美方積極討論“購買”格陵蘭島 魯比奧下周或與丹麥官員會面

美方積極討論“購買”格陵蘭島 魯比奧下周或與丹麥官員會面

環(huán)球網(wǎng)資訊
2026-01-08 07:11:05
TVB頒獎晚宴星光黯淡,寒酸像農(nóng)村辦酒席,女明星一個比一個敢穿

TVB頒獎晚宴星光黯淡,寒酸像農(nóng)村辦酒席,女明星一個比一個敢穿

八卦南風(fēng)
2026-01-05 11:03:49
2-0!2-2!意甲最新積分榜:國米穩(wěn)居榜首,那不勒斯拉齊奧齊丟分

2-0!2-2!意甲最新積分榜:國米穩(wěn)居榜首,那不勒斯拉齊奧齊丟分

萬花筒體育球球
2026-01-08 08:51:01
歐盟發(fā)布研發(fā)榜單:華為以229.4億歐元成唯一進入前十的中國企業(yè)

歐盟發(fā)布研發(fā)榜單:華為以229.4億歐元成唯一進入前十的中國企業(yè)

黃海峰
2026-01-07 08:58:38
掀翻7個省會,中國第一個6000億超強縣,產(chǎn)自江蘇!

掀翻7個省會,中國第一個6000億超強縣,產(chǎn)自江蘇!

創(chuàng)客公社-江蘇第一創(chuàng)投媒體
2026-01-07 20:57:40
孫儷在上海襄陽北路拍戲,封路拍攝,引起路人不滿

孫儷在上海襄陽北路拍戲,封路拍攝,引起路人不滿

凌風(fēng)的世界觀
2026-01-06 15:40:17
秘魯總統(tǒng)赫里:完全贊同美國對委內(nèi)瑞拉的干預(yù)行動,已采取了必要的措施,并且現(xiàn)在必須逐步恢復(fù)民主秩序

秘魯總統(tǒng)赫里:完全贊同美國對委內(nèi)瑞拉的干預(yù)行動,已采取了必要的措施,并且現(xiàn)在必須逐步恢復(fù)民主秩序

和訊網(wǎng)
2026-01-07 12:16:18
錢再多有什么用?自曝曾生活不能自理的武大靖,給所有老將提了醒

錢再多有什么用?自曝曾生活不能自理的武大靖,給所有老將提了醒

以茶帶書
2026-01-07 17:04:33
2026-01-08 09:11:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽到營銷這兩個字都有點惡心

頭條要聞

牛彈琴:美國又干了件石破天驚的事 俄羅斯遭沉重打擊

頭條要聞

牛彈琴:美國又干了件石破天驚的事 俄羅斯遭沉重打擊

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

《馬背搖籃》首播,革命的樂觀主義故事

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

燃油駕趣+智能電感雙Buff 試駕全新奧迪Q5L

態(tài)度原創(chuàng)

數(shù)碼
時尚
旅游
公開課
軍事航空

數(shù)碼要聞

雷神MIX G2獨顯游戲迷你主機亮相:行業(yè)首款Ultra 9 275HX + RTX 5090

藍色+灰色、紅色+棕色,這4組配色怎么搭都好看!

旅游要聞

西安藏不住的秦嶺神仙秘境!自帶仙氣,韻味十足,冬天也很美

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普政府正在討論獲取格陵蘭島的方案 包括軍事選項

無障礙瀏覽 進入關(guān)懷版