国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini 3.1 Pro新王登場!一口氣手搓Win11操作系統(tǒng)

0
分享至



性能暴增價格不變。

作者 |程茜 江宇

編輯 |心緣

智東西2月20日消息,谷歌正式發(fā)布其新一代旗艦模型Gemini 3.1 Pro。根據(jù)谷歌放出的基準測試,谷歌最強復雜任務(wù)處理模型Gemini 3.1 Pro在12項測試中超過Gemini 3 Pro、Claude Opus 4.6、Claude Sonnet 4.6、GPT-5.2等模型,拿下第一。



谷歌DeepMind主要提升了Gemini 3.1 Pro的推理能力。面對業(yè)界公認高難度的ARC-AGI-2通用智能基準測試,Gemini 3.1 Pro斬獲77.1%的高分,超越Claude、GPT模型,且成績相較Gemini 3 Pro實現(xiàn)翻倍提升。

去年9月加入谷歌DeepMind的清華物理系傳奇人物姚順宇(Shunyu Yao)也發(fā)文官宣了新模型發(fā)布,并稱“更好的Gemini模型正以勢不可擋的速度涌現(xiàn)”



下面這一經(jīng)典的“鵜鶘騎自行車SVG動畫”對比,直觀體現(xiàn)了新模型的能力提升,右側(cè)Gemini 3.1 Pro生成的鵜鶘身體結(jié)構(gòu)、騎行姿態(tài)自然合理,且自行車的車架、鏈條、腳踏、座椅等細節(jié)完整,相比Gemini 3 Pro的生成結(jié)果符合物理常識,更像一個完整的動畫場景。



為Gemini 3.1開發(fā)SVG生成功能的清華校友Jiao Sun,在X上評論說“無比自豪”。

從今日起,Google AI Pro、Ultra訂閱用戶可以在Gemini應(yīng)用、AI助手NotebookLM中使用Gemini 3.1 Pro,免費用戶可向Gemini 3.1 Pro提問2次。開發(fā)者和企業(yè)用戶可以在AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI及Android Studio的Gemini API預覽版中使用Gemini 3.1 Pro。

Gemini 3.1 Pro預覽版的API價格采用分級計費模式,與上一代Gemini 3 Pro預覽版保持一致,提示詞在20萬token以內(nèi),每百萬token輸入價格2美元(約合人民幣14元),輸出價格12美元(約合人民幣83元),提示詞超過20萬token,每百萬token輸入價格4美元(約合人民幣28元),輸出價格18美元(約合人民幣124元)。



01.

能搭WebOS、能做《我的世界》

還能拆視覺錯覺

Gemini 3.1 Pro的核心升級集中在復雜任務(wù)處理能力上。其博客透露,新模型在高級推理、多模態(tài)理解和復雜項目生成方面進一步強化,能夠更好應(yīng)對高難度工作場景。模型發(fā)布后,社區(qū)實測迅速跟進。

知名AI博主Chetaslua展示了其用Gemini 3.1 Pro一次性安裝Windows 11 WebOS的結(jié)果。

Chetaslua在帖中直言:“上次我分享類似案例時還非常困難,現(xiàn)在已經(jīng)變成常態(tài)。有了智能體系統(tǒng),我們幾乎可以用這個模型做任何事?!?/p>



他之前也發(fā)過用Gemini 3.0 Pro生成Windows Web操作系統(tǒng)的視頻,兩個視頻放一起對比,提升效果非常明顯。

Gemini 3.1 Pro生成的系統(tǒng)界面有完整應(yīng)用圖標、開始菜單樣式布局以及基礎(chǔ)窗口交互邏輯,整體形態(tài)更接近一個可運行的輕量級操作系統(tǒng)。

相比之下,之前3.0 Pro生成的系統(tǒng)形態(tài)相對簡陋,一些基礎(chǔ)桌面交互和系統(tǒng)級應(yīng)用缺失。

另一組更偏工程化的案例顯示,有開發(fā)者用Gemini 3.1 Pro在瀏覽器中直接生成并運行了一個可交互的VoxelWeb項目,形態(tài)類似“我的世界”式3D沙盒。

界面已包含啟動按鈕、移動控制、方塊交互以及基礎(chǔ)合成邏輯,具備完整的輕量沙盒雛形。



在前端生成與動畫細節(jié)方面,也有開發(fā)者要求模型生成一段完整的交互式生長動畫,覆蓋種子發(fā)芽、根系形成、枝干生長到樹葉展開的全過程。



實測結(jié)果顯示,模型在生長階段銜接與葉片細節(jié)上表現(xiàn)較為完整。該開發(fā)者評價稱:“這是我在這個提示詞下見過最好的樹葉效果?!?/p>

視覺理解方向的測試則進一步拉高了難度。有網(wǎng)友專門驗證“AgenticVision”能力,輸入素材是一張看似普通的街頭垃圾桶照片。

模型不僅完成了基礎(chǔ)識別,還進一步指出:當瞇眼或拉遠觀看時,畫面中的垃圾、陰影與輪廓會在視覺上拼合成兩個并排而坐的卡通角色。模型還逐項拆解了這一視覺錯覺的形成機制,解釋不同布料、垃圾袋與陰影分別對應(yīng)角色的頭部、身體與外輪廓關(guān)系,體現(xiàn)出多步視覺推理能力。



整體來看,Gemini 3.1 Pro已經(jīng)開始觸及空間關(guān)系理解、形狀映射和視覺錯覺解釋等更高階視覺認知任務(wù)。開發(fā)者給出的綜合判斷是,其表現(xiàn)已進入當前第一梯隊水平。

我們還用“開車還是步行去距離100米的洗車店洗車”、“父母能否結(jié)婚”等陷阱題考了考Gemini 3.1 Pro,結(jié)果它都成功避坑答對。



02.

手搓《模擬城市》

創(chuàng)意編程、交互式設(shè)計分分鐘搞定

谷歌DeepMind的官方X賬號展示了谷歌UX工程師Michael Chang用Gemini 3.1 Pro開發(fā)了一個逼真的城市規(guī)劃應(yīng)用程序。Gemini 3.1 Pro能自己處理復雜地形、繪制基礎(chǔ)設(shè)施圖、模擬交通,最后生成高質(zhì)量的可視化效果。

除了上面提到的鵜鶘騎自行車,Gemini 3.1 Pro在生成青蛙騎老式高輪自行車、長頸鹿駕駛微型汽車、鴕鳥穿著旱冰鞋等各種抽象畫面的SVG動畫上,表現(xiàn)也毫不遜色。相比Gemini 3 Pro,Gemini 3.1 Pro的生成效果整體場景更生動、更有故事感,細節(jié)表現(xiàn)力大幅提升。

如Gemini 3.1 Pro可以直接根據(jù)文本提示生成可用于網(wǎng)站的動畫SVG,并且由于這些動畫是用純代碼而非像素構(gòu)建的,因此在任何尺寸下都能保持清晰,并且文件體積相比傳統(tǒng)視頻非常小。

Gemini 3.1 Pro的復雜推理能力,能幫助用戶使用復雜API完成設(shè)計。如下面案例,該模型構(gòu)建了一個實時航空航天儀表盤,成功配置了公共遙測數(shù)據(jù)流,以可視化國際空間站的軌道運行軌跡。

在交互式設(shè)計方面,Gemini 3.1 Pro可以編寫代碼,生成一個復雜的3D椋鳥群飛模擬。并且其還能構(gòu)建沉浸式體驗,用戶可以通過手勢追蹤操控鳥群,同時聆聽一段生成式配樂,音樂會隨著鳥群的動態(tài)變化而改變。

Gemini3.1 Pro還能進行創(chuàng)意編程, 將文學主題轉(zhuǎn)化為可運行的代碼。當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》構(gòu)建一個現(xiàn)代個人作品集網(wǎng)站時,該模型深入分析了小說的氛圍基調(diào),設(shè)計出一個簡潔現(xiàn)代的界面,打造出一個能捕捉主角精神內(nèi)核的網(wǎng)站。

03.

編程、推理、多模態(tài)樣樣行

數(shù)項測試超Claude、GPT模型

研究人員在一系列基準測試中對Gemini 3.1 Pro進行了評估,包括推理、多模態(tài)能力、智能體工具使用、多語言性能和長上下文。

相比Gemini 3 Pro、Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.2、GPT-5.3-Codex,Gemini 3.1 Pro在12項基準測試中拿下第一。

在需要更強推理能力的測試中,Gemini 3.1 Pro在人類最后的考試、ARC-AGI-2、GPQA Diamond 3項測試中,表現(xiàn)都優(yōu)于Claude、GPT模型。

編程能力測試中,Gemini 3.1 Pro在SWE-Bench Pro(公開版)和SWE-Bench Verified中得分相對較低,這兩大測試集考驗的是模型在真實項目中理解需求、定位問題、修改代碼、保證可用的端到端工程能力。

GDPval-AA Elo是當前衡量大模型在高價值知識工作中綜合能力的相對評分體系,Gemini 3.1 Pro的表現(xiàn)優(yōu)于GPT-5.2、GPT-5.3-Codex,僅次于Sonnet 4.6。

衡量大模型工具使用能力的τ2-bench、MCP Atlas、BrowseComp、多語言性能的MMLU、長上下能力的MRCR v2測試集中,新模型的表現(xiàn)同樣優(yōu)于其他模型。

在多模態(tài)大模型學術(shù)評測基準MMMU-Pro上,Gemini 3.1 Pro的表現(xiàn)比Claude、GPT模型更好,但略遜于Gemini 3 Pro。

04.

結(jié)語:大模型競賽焦點

轉(zhuǎn)向復雜任務(wù)落地能力

當前大模型行業(yè)正從通用能力比拼,轉(zhuǎn)向真實世界復雜任務(wù)的實戰(zhàn)能力競爭,海內(nèi)外各家模型在推理、工程化、多模態(tài)理解等核心能力上不斷發(fā)力突破,力求讓大模型真正落地應(yīng)用,與真實業(yè)務(wù)場景相結(jié)合。

谷歌近期的加速布局也是如此,其上周發(fā)布了Gemini 3 Deep Think模型升級、一周后又推出Gemini 3.1 Pro,都將模型的升級重點放在專業(yè)領(lǐng)域加速技術(shù)研發(fā)、解決實際工作中的復雜問題上??梢钥闯?,當下大模型已經(jīng)讓更智能的大模型真正具備解決真實世界復雜任務(wù)能力,AI成為專業(yè)領(lǐng)域核心生產(chǎn)力的潛力增加。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
趙光義為何容不下投降的錢弘俶?并非猜忌,而是他觸碰了一條紅線

趙光義為何容不下投降的錢弘俶?并非猜忌,而是他觸碰了一條紅線

孔孔說體育
2026-02-25 16:22:33
劉強東,又出手了

劉強東,又出手了

中國新聞周刊
2026-02-25 21:26:27
74歲陳凱歌在三亞豪宅過年,穿5萬元皮鞋戴大金表,臉上有老年斑

74歲陳凱歌在三亞豪宅過年,穿5萬元皮鞋戴大金表,臉上有老年斑

離離言幾許
2026-02-25 16:07:01
英媒曝卡塞米羅大幅降薪加盟AC米蘭,再度攜手魔笛,無緣沙特高薪

英媒曝卡塞米羅大幅降薪加盟AC米蘭,再度攜手魔笛,無緣沙特高薪

夏侯看英超
2026-02-26 01:33:34
官方:重慶銅梁龍從恒大足校簽下U19國腳劉佳樂

官方:重慶銅梁龍從恒大足校簽下U19國腳劉佳樂

懂球帝
2026-02-25 18:20:05
安徽一“80后”廳干履新!

安徽一“80后”廳干履新!

鳳凰網(wǎng)安徽
2026-02-25 20:15:52
市委書記馬年以馬喻干部:對“旋轉(zhuǎn)木馬”要加大“下”的力度

市委書記馬年以馬喻干部:對“旋轉(zhuǎn)木馬”要加大“下”的力度

澎湃新聞
2026-02-25 12:28:27
放棄爭奪260億遺產(chǎn),帶著女兒遠赴美國,如今才知她是人間清醒

放棄爭奪260億遺產(chǎn),帶著女兒遠赴美國,如今才知她是人間清醒

林輕吟
2026-01-31 11:44:55
當韓國人知道韓國很小中國很大后,是完全顛覆他們認知的!

當韓國人知道韓國很小中國很大后,是完全顛覆他們認知的!

夜深愛雜談
2026-02-25 21:23:43
生前無人問津,死了大封特賞

生前無人問津,死了大封特賞

我是歷史其實挺有趣
2026-02-25 14:00:27
勵志!陳彬彬時隔4年重返中超:上次中超出場還是1388天前

勵志!陳彬彬時隔4年重返中超:上次中超出場還是1388天前

邱澤云
2026-02-25 18:15:53
何超瓊春節(jié)到四太女兒家做客,跟何超盈女兒穿親子裝,姐妹倆很親

何超瓊春節(jié)到四太女兒家做客,跟何超盈女兒穿親子裝,姐妹倆很親

觀察者海風
2026-02-25 12:09:32
王中磊破產(chǎn),攜全家搬出莊園住進別墅,老婆愁眉苦臉被迫接受降級

王中磊破產(chǎn),攜全家搬出莊園住進別墅,老婆愁眉苦臉被迫接受降級

王瑄自駕
2025-11-13 20:32:34
32歲小伙瘦骨嶙峋,確診罕見癌癥:我連病友都找不到!杭州醫(yī)生:三分之一患者面臨無藥可用困境

32歲小伙瘦骨嶙峋,確診罕見癌癥:我連病友都找不到!杭州醫(yī)生:三分之一患者面臨無藥可用困境

極目新聞
2026-02-25 12:38:59
深入安卓最底層,國產(chǎn)千元機的一場“流暢革命”

深入安卓最底層,國產(chǎn)千元機的一場“流暢革命”

觀察者網(wǎng)
2026-02-25 18:43:12
廣州一人行道裝了27根隔離樁防違停,導致市民出行不便,街道辦:會優(yōu)化樁距間隔

廣州一人行道裝了27根隔離樁防違停,導致市民出行不便,街道辦:會優(yōu)化樁距間隔

環(huán)球網(wǎng)資訊
2026-02-25 14:38:20
2月26日精選熱點:日本PCB巨頭3月1日漲價  這些國產(chǎn)龍頭要飛了

2月26日精選熱點:日本PCB巨頭3月1日漲價 這些國產(chǎn)龍頭要飛了

元芳說投資
2026-02-25 20:17:35
14.98萬起!日產(chǎn)NX8掀桌,理想L6遭降維打擊?

14.98萬起!日產(chǎn)NX8掀桌,理想L6遭降維打擊?

犯困的蛋撻醬
2026-02-24 19:45:04
全球首款:三星Galaxy S26 Ultra手機支持APV編解碼器

全球首款:三星Galaxy S26 Ultra手機支持APV編解碼器

IT之家
2026-02-26 07:34:32
美國深夜收到消息:中發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

美國深夜收到消息:中發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

快看張同學
2026-02-25 14:20:29
2026-02-26 08:39:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11255文章數(shù) 116980關(guān)注度
往期回顧 全部

數(shù)碼要聞

2025中國學習平板銷量超600萬臺 作業(yè)幫占比達28.8%

頭條要聞

中方對日方出口管制措施落地后 高市早苗表態(tài)了

頭條要聞

中方對日方出口管制措施落地后 高市早苗表態(tài)了

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

短劇市場風云突變!有人投百萬賠得精光

科技要聞

“機器人只跳舞,沒什么用”

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

旅游
教育
本地
公開課
軍事航空

旅游要聞

市花開了!主題公園今年有望啟動

教育要聞

最后2天!2026山東單招綜招志愿填報操作手冊來了!最低錄取分僅15分!

本地新聞

津南好·四時總相宜

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美政府給新伊核協(xié)議設(shè)限內(nèi)容遭披露

無障礙瀏覽 進入關(guān)懷版