国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini 3.1 Pro新王登場!一口氣手搓Win11操作系統(tǒng)

0
分享至



性能暴增價格不變。

作者 |程茜 江宇

編輯 |心緣

智東西2月20日消息,谷歌正式發(fā)布其新一代旗艦?zāi)P?strong>Gemini 3.1 Pro。根據(jù)谷歌放出的基準(zhǔn)測試,谷歌最強(qiáng)復(fù)雜任務(wù)處理模型Gemini 3.1 Pro在12項測試中超過Gemini 3 Pro、Claude Opus 4.6、Claude Sonnet 4.6、GPT-5.2等模型,拿下第一。



谷歌DeepMind主要提升了Gemini 3.1 Pro的推理能力。面對業(yè)界公認(rèn)高難度的ARC-AGI-2通用智能基準(zhǔn)測試,Gemini 3.1 Pro斬獲77.1%的高分,超越Claude、GPT模型,且成績相較Gemini 3 Pro實現(xiàn)翻倍提升。

去年9月加入谷歌DeepMind的清華物理系傳奇人物姚順宇(Shunyu Yao)也發(fā)文官宣了新模型發(fā)布,并稱“更好的Gemini模型正以勢不可擋的速度涌現(xiàn)”



下面這一經(jīng)典的“鵜鶘騎自行車SVG動畫”對比,直觀體現(xiàn)了新模型的能力提升,右側(cè)Gemini 3.1 Pro生成的鵜鶘身體結(jié)構(gòu)、騎行姿態(tài)自然合理,且自行車的車架、鏈條、腳踏、座椅等細(xì)節(jié)完整,相比Gemini 3 Pro的生成結(jié)果符合物理常識,更像一個完整的動畫場景。



為Gemini 3.1開發(fā)SVG生成功能的清華校友Jiao Sun,在X上評論說“無比自豪”。

從今日起,Google AI Pro、Ultra訂閱用戶可以在Gemini應(yīng)用、AI助手NotebookLM中使用Gemini 3.1 Pro,免費用戶可向Gemini 3.1 Pro提問2次。開發(fā)者和企業(yè)用戶可以在AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI及Android Studio的Gemini API預(yù)覽版中使用Gemini 3.1 Pro。

Gemini 3.1 Pro預(yù)覽版的API價格采用分級計費模式,與上一代Gemini 3 Pro預(yù)覽版保持一致,提示詞在20萬token以內(nèi),每百萬token輸入價格2美元(約合人民幣14元),輸出價格12美元(約合人民幣83元),提示詞超過20萬token,每百萬token輸入價格4美元(約合人民幣28元),輸出價格18美元(約合人民幣124元)。



01.

能搭WebOS、能做《我的世界》

還能拆視覺錯覺

Gemini 3.1 Pro的核心升級集中在復(fù)雜任務(wù)處理能力上。其博客透露,新模型在高級推理、多模態(tài)理解和復(fù)雜項目生成方面進(jìn)一步強(qiáng)化,能夠更好應(yīng)對高難度工作場景。模型發(fā)布后,社區(qū)實測迅速跟進(jìn)。

知名AI博主Chetaslua展示了其用Gemini 3.1 Pro一次性安裝Windows 11 WebOS的結(jié)果。

Chetaslua在帖中直言:“上次我分享類似案例時還非常困難,現(xiàn)在已經(jīng)變成常態(tài)。有了智能體系統(tǒng),我們幾乎可以用這個模型做任何事?!?/p>



他之前也發(fā)過用Gemini 3.0 Pro生成Windows Web操作系統(tǒng)的視頻,兩個視頻放一起對比,提升效果非常明顯。

Gemini 3.1 Pro生成的系統(tǒng)界面有完整應(yīng)用圖標(biāo)、開始菜單樣式布局以及基礎(chǔ)窗口交互邏輯,整體形態(tài)更接近一個可運行的輕量級操作系統(tǒng)。

相比之下,之前3.0 Pro生成的系統(tǒng)形態(tài)相對簡陋,一些基礎(chǔ)桌面交互和系統(tǒng)級應(yīng)用缺失。

另一組更偏工程化的案例顯示,有開發(fā)者用Gemini 3.1 Pro在瀏覽器中直接生成并運行了一個可交互的VoxelWeb項目,形態(tài)類似“我的世界”式3D沙盒。

界面已包含啟動按鈕、移動控制、方塊交互以及基礎(chǔ)合成邏輯,具備完整的輕量沙盒雛形。



在前端生成與動畫細(xì)節(jié)方面,也有開發(fā)者要求模型生成一段完整的交互式生長動畫,覆蓋種子發(fā)芽、根系形成、枝干生長到樹葉展開的全過程。



實測結(jié)果顯示,模型在生長階段銜接與葉片細(xì)節(jié)上表現(xiàn)較為完整。該開發(fā)者評價稱:“這是我在這個提示詞下見過最好的樹葉效果?!?/p>

視覺理解方向的測試則進(jìn)一步拉高了難度。有網(wǎng)友專門驗證“AgenticVision”能力,輸入素材是一張看似普通的街頭垃圾桶照片。

模型不僅完成了基礎(chǔ)識別,還進(jìn)一步指出:當(dāng)瞇眼或拉遠(yuǎn)觀看時,畫面中的垃圾、陰影與輪廓會在視覺上拼合成兩個并排而坐的卡通角色。模型還逐項拆解了這一視覺錯覺的形成機(jī)制,解釋不同布料、垃圾袋與陰影分別對應(yīng)角色的頭部、身體與外輪廓關(guān)系,體現(xiàn)出多步視覺推理能力。



整體來看,Gemini 3.1 Pro已經(jīng)開始觸及空間關(guān)系理解、形狀映射和視覺錯覺解釋等更高階視覺認(rèn)知任務(wù)。開發(fā)者給出的綜合判斷是,其表現(xiàn)已進(jìn)入當(dāng)前第一梯隊水平。

我們還用“開車還是步行去距離100米的洗車店洗車”、“父母能否結(jié)婚”等陷阱題考了考Gemini 3.1 Pro,結(jié)果它都成功避坑答對。



02.

手搓《模擬城市》

創(chuàng)意編程、交互式設(shè)計分分鐘搞定

谷歌DeepMind的官方X賬號展示了谷歌UX工程師Michael Chang用Gemini 3.1 Pro開發(fā)了一個逼真的城市規(guī)劃應(yīng)用程序。Gemini 3.1 Pro能自己處理復(fù)雜地形、繪制基礎(chǔ)設(shè)施圖、模擬交通,最后生成高質(zhì)量的可視化效果。

除了上面提到的鵜鶘騎自行車,Gemini 3.1 Pro在生成青蛙騎老式高輪自行車、長頸鹿駕駛微型汽車、鴕鳥穿著旱冰鞋等各種抽象畫面的SVG動畫上,表現(xiàn)也毫不遜色。相比Gemini 3 Pro,Gemini 3.1 Pro的生成效果整體場景更生動、更有故事感,細(xì)節(jié)表現(xiàn)力大幅提升。

如Gemini 3.1 Pro可以直接根據(jù)文本提示生成可用于網(wǎng)站的動畫SVG,并且由于這些動畫是用純代碼而非像素構(gòu)建的,因此在任何尺寸下都能保持清晰,并且文件體積相比傳統(tǒng)視頻非常小。

Gemini 3.1 Pro的復(fù)雜推理能力,能幫助用戶使用復(fù)雜API完成設(shè)計。如下面案例,該模型構(gòu)建了一個實時航空航天儀表盤,成功配置了公共遙測數(shù)據(jù)流,以可視化國際空間站的軌道運行軌跡。

在交互式設(shè)計方面,Gemini 3.1 Pro可以編寫代碼,生成一個復(fù)雜的3D椋鳥群飛模擬。并且其還能構(gòu)建沉浸式體驗,用戶可以通過手勢追蹤操控鳥群,同時聆聽一段生成式配樂,音樂會隨著鳥群的動態(tài)變化而改變。

Gemini3.1 Pro還能進(jìn)行創(chuàng)意編程, 將文學(xué)主題轉(zhuǎn)化為可運行的代碼。當(dāng)被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》構(gòu)建一個現(xiàn)代個人作品集網(wǎng)站時,該模型深入分析了小說的氛圍基調(diào),設(shè)計出一個簡潔現(xiàn)代的界面,打造出一個能捕捉主角精神內(nèi)核的網(wǎng)站。

03.

編程、推理、多模態(tài)樣樣行

數(shù)項測試超Claude、GPT模型

研究人員在一系列基準(zhǔn)測試中對Gemini 3.1 Pro進(jìn)行了評估,包括推理、多模態(tài)能力、智能體工具使用、多語言性能和長上下文。

相比Gemini 3 Pro、Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.2、GPT-5.3-Codex,Gemini 3.1 Pro在12項基準(zhǔn)測試中拿下第一。

在需要更強(qiáng)推理能力的測試中,Gemini 3.1 Pro在人類最后的考試、ARC-AGI-2、GPQA Diamond 3項測試中,表現(xiàn)都優(yōu)于Claude、GPT模型。

編程能力測試中,Gemini 3.1 Pro在SWE-Bench Pro(公開版)和SWE-Bench Verified中得分相對較低,這兩大測試集考驗的是模型在真實項目中理解需求、定位問題、修改代碼、保證可用的端到端工程能力。

GDPval-AA Elo是當(dāng)前衡量大模型在高價值知識工作中綜合能力的相對評分體系,Gemini 3.1 Pro的表現(xiàn)優(yōu)于GPT-5.2、GPT-5.3-Codex,僅次于Sonnet 4.6。

衡量大模型工具使用能力的τ2-bench、MCP Atlas、BrowseComp、多語言性能的MMLU、長上下能力的MRCR v2測試集中,新模型的表現(xiàn)同樣優(yōu)于其他模型。

在多模態(tài)大模型學(xué)術(shù)評測基準(zhǔn)MMMU-Pro上,Gemini 3.1 Pro的表現(xiàn)比Claude、GPT模型更好,但略遜于Gemini 3 Pro。

04.

結(jié)語:大模型競賽焦點

轉(zhuǎn)向復(fù)雜任務(wù)落地能力

當(dāng)前大模型行業(yè)正從通用能力比拼,轉(zhuǎn)向真實世界復(fù)雜任務(wù)的實戰(zhàn)能力競爭,海內(nèi)外各家模型在推理、工程化、多模態(tài)理解等核心能力上不斷發(fā)力突破,力求讓大模型真正落地應(yīng)用,與真實業(yè)務(wù)場景相結(jié)合。

谷歌近期的加速布局也是如此,其上周發(fā)布了Gemini 3 Deep Think模型升級、一周后又推出Gemini 3.1 Pro,都將模型的升級重點放在專業(yè)領(lǐng)域加速技術(shù)研發(fā)、解決實際工作中的復(fù)雜問題上??梢钥闯觯?dāng)下大模型已經(jīng)讓更智能的大模型真正具備解決真實世界復(fù)雜任務(wù)能力,AI成為專業(yè)領(lǐng)域核心生產(chǎn)力的潛力增加。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

百態(tài)中的情感起伏
2026-02-23 12:25:50
紅樓夢:難怪寶玉第一次“干人事”要找襲人,看襲人做了什么動作

紅樓夢:難怪寶玉第一次“干人事”要找襲人,看襲人做了什么動作

談史論天地
2026-02-26 11:13:38
楊冪參加國外活動,窘迫陪笑試圖拒絕采訪,不停擦汗的肖戰(zhàn)很愜意

楊冪參加國外活動,窘迫陪笑試圖拒絕采訪,不停擦汗的肖戰(zhàn)很愜意

查爾菲的筆記
2026-03-02 14:04:58
核心臟被炸穿!伊朗阿拉克核設(shè)施群遭毀滅性空襲

核心臟被炸穿!伊朗阿拉克核設(shè)施群遭毀滅性空襲

老馬拉車莫少裝
2026-03-03 01:05:00
德天空:紅軍考慮回購夸安薩;轉(zhuǎn)會合同中有8000萬歐回購條款

德天空:紅軍考慮回購夸安薩;轉(zhuǎn)會合同中有8000萬歐回購條款

懂球帝
2026-03-03 04:39:05
出軌、凈身出戶?這次,74歲的梁錦松,終究在伏明霞身上栽了跟頭

出軌、凈身出戶?這次,74歲的梁錦松,終究在伏明霞身上栽了跟頭

秋姐居
2026-02-10 09:19:42
56歲大媽心梗離世,醫(yī)生:吃他汀時除了牛奶,這6種食物盡量少碰

56歲大媽心梗離世,醫(yī)生:吃他汀時除了牛奶,這6種食物盡量少碰

岐黃傳人孫大夫
2026-02-28 22:15:03
被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

皇朝冰酷
2026-03-01 23:27:08
一天報銷115輛坦克!塔利班舉白旗求饒,巴鐵:多虧了中國制造!

一天報銷115輛坦克!塔利班舉白旗求饒,巴鐵:多虧了中國制造!

來科點譜
2026-03-02 10:58:53
這是什么店?????要不要進(jìn)去?

這是什么店?????要不要進(jìn)去?

太急張三瘋
2026-02-06 16:51:47
年輕時的她是真正的古典美女,年輕貌美、雍容華貴,高挺的水滴鼻

年輕時的她是真正的古典美女,年輕貌美、雍容華貴,高挺的水滴鼻

草莓解說體育
2026-03-03 01:11:23
俄專家終于說出大實話,一旦爆發(fā)海戰(zhàn),全世界僅有一國能擊敗美軍

俄專家終于說出大實話,一旦爆發(fā)海戰(zhàn),全世界僅有一國能擊敗美軍

壹知眠羊
2026-01-08 11:34:42
伊朗的援軍到了!以色列再征兵10萬,關(guān)鍵時刻,普京對中國做承諾

伊朗的援軍到了!以色列再征兵10萬,關(guān)鍵時刻,普京對中國做承諾

軍機(jī)Talk
2026-03-02 09:50:33
一周最少5次,45歲女子肛裂住院,丈夫哭訴:怎么勸她就是不聽!

一周最少5次,45歲女子肛裂住院,丈夫哭訴:怎么勸她就是不聽!

健康科普365
2026-03-02 23:30:03
活得通透:能自理就好好活著,不能自理,便坦然落幕

活得通透:能自理就好好活著,不能自理,便坦然落幕

青蘋果sht
2026-02-23 05:26:25
痛別!喻岳青逝世

痛別!喻岳青逝世

環(huán)球網(wǎng)資訊
2026-03-02 20:46:29
為何抗戰(zhàn)劇里的日軍炮樓都有探照燈?舊中國那么落后,電從哪來?

為何抗戰(zhàn)劇里的日軍炮樓都有探照燈?舊中國那么落后,電從哪來?

芊芊子吟
2026-02-20 22:00:03
維穩(wěn)辦不能變成欺壓辦,孫玉良:真正的穩(wěn)定是讓弱勢群體揚眉吐氣

維穩(wěn)辦不能變成欺壓辦,孫玉良:真正的穩(wěn)定是讓弱勢群體揚眉吐氣

孫玉良
2026-02-23 08:18:07
巴拿馬終于動手,李嘉誠資產(chǎn)被強(qiáng)搶,毀掉港口也不應(yīng)留給巴拿馬

巴拿馬終于動手,李嘉誠資產(chǎn)被強(qiáng)搶,毀掉港口也不應(yīng)留給巴拿馬

王新喜
2026-03-02 10:24:59
蘇聯(lián)“人猿雜交”實驗:5名女孩與11只猩猩參與,結(jié)局如何?

蘇聯(lián)“人猿雜交”實驗:5名女孩與11只猩猩參與,結(jié)局如何?

談史論天地
2026-02-28 13:35:18
2026-03-03 07:48:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11280文章數(shù) 116984關(guān)注度
往期回顧 全部

數(shù)碼要聞

蘋果首款觸摸屏MacBook Pro或年內(nèi)發(fā)布 搭載M6芯片

頭條要聞

媒體:遭受慘烈襲擊后 伊朗做了件"史無前例"的事

頭條要聞

媒體:遭受慘烈襲擊后 伊朗做了件"史無前例"的事

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟(jì)

科技要聞

蘋果iPhone17e發(fā)布:4499元起 升級A19芯片

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

親子
家居
本地
公開課
軍事航空

親子要聞

開學(xué)了!珠海香洲:筑牢安全防線,保障托育機(jī)構(gòu)順利開園復(fù)托

家居要聞

萬物互聯(lián) 享科技福祉

本地新聞

津南好·四時總相宜

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版