国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Gemini 3.1 Pro低調(diào)上場:谷歌的“小版本更新”與AI競賽的“長跑邏輯”

0
分享至

  【CNMO】馬年春節(jié)的熱鬧勁兒還沒完全過去,國內(nèi)的大模型戰(zhàn)場正打得火熱,硅谷那邊也沒閑著。就在行業(yè)還在消化上周Gemini 3 Deep Think、Claude Sonnet 4.6等一系列密集更新時,北京時間2月19日深夜,谷歌又毫無預(yù)兆地擲出了一枚“核彈”——Gemini 3.1 Pro正式上線。



  對于關(guān)注AI動態(tài)的人來說,這個消息來得既突然,又在情理之中。畢竟,距離去年11月Gemini 3 Pro發(fā)布才剛過三個月。但真正耐人尋味的,不是發(fā)布節(jié)奏的加快,而是谷歌這次打出的牌:一個“.1”的小版本迭代,卻實現(xiàn)了讓競爭對手大版本更新都汗顏的性能躍升。

“.1”背后的野心:推理能力翻倍與“思考模式”的進化

  Gemini 3.1 Pro的官方敘事非常聚焦:專為復(fù)雜任務(wù)而生,將機器的核心推理能力推向新高度。

  數(shù)據(jù)是最直觀的佐證。在衡量AI應(yīng)對全新邏輯問題能力的 ARC-AGI-2 基準(zhǔn)測試中,Gemini 3.1 Pro拿下了77.1% 的實測得分。這是什么概念?上一代Gemini 3 Pro的得分是31.1%。雖然業(yè)內(nèi)對于ARC-AGI測試集是否可能出現(xiàn)在訓(xùn)練數(shù)據(jù)中仍存有謹慎的討論,但超過一倍的增長,即便剔除“刷題”水分,其底層邏輯能力的精進也是不容小覷的。

  另一個值得關(guān)注的維度是幻覺控制。在AA-Omniscience Index(衡量模型對自身知識邊界認知能力的指標(biāo))上,Gemini 3.1 Pro從前代的13分躍升至30分,在主流模型中排名第一。這或許比單純的跑分更具現(xiàn)實意義——在大模型從“玩具”走向“工具”的過程中,知道“我不知道”往往比強行生成一個似是而非的答案更重要。

  如果說跑分只是紙上談兵,那么“三層思考模式”(Low/Medium/High)的引入,則是谷歌在工程落地層面的一次精妙設(shè)計。這相當(dāng)于給模型裝了一個可調(diào)節(jié)的“算力旋鈕”。

  過去的模型是“一勺燴”,簡單問答和復(fù)雜推理消耗的資源一樣,成本和效率都不經(jīng)濟?,F(xiàn)在,用戶可以根據(jù)任務(wù)難度自主選擇:日常閑聊用Low模式追求極速響應(yīng);復(fù)雜的數(shù)據(jù)分析或代碼調(diào)試用High模式,讓模型進入類似Deep Think的狀態(tài),花幾分鐘時間進行深度推理。這種對“計算-質(zhì)量-成本”三角關(guān)系的顯式化管理,體現(xiàn)的正是AI進入生產(chǎn)環(huán)境后的成熟度思維。

不止于“手搓”Demo:從代碼生成到“氛圍編程”

  當(dāng)然,技術(shù)參數(shù)的進步最終要回歸到用戶體驗。這次谷歌及其合作方展示的一系列案例,比以往任何時候都更具“殺傷力”。

  最直觀的進化體現(xiàn)在視覺生成上。同樣是生成“鵜鶘騎自行車”的SVG動畫,Gemini 3 Pro生成的結(jié)果可能只是元素的堆砌,而Gemini 3.1 Pro生成的畫面中,鵜鶘的身體結(jié)構(gòu)、騎行姿態(tài)不僅更符合物理常識,甚至連自行車的鏈條、腳踏這些細節(jié)都清晰可見。

  但這不僅僅是畫質(zhì)的提升,更是對復(fù)雜指令理解能力的躍遷。開發(fā)者們用實測證明了這一點:

  有人讓Gemini 3.1 Pro生成一個Windows 11風(fēng)格的Web操作系統(tǒng),結(jié)果它直接返回了一個包含完整圖標(biāo)、開始菜單和基礎(chǔ)交互邏輯的可運行界面,與之前3.0 Pro生成的簡陋形態(tài)形成鮮明對比。

  還有人要求它為《呼嘯山莊》設(shè)計一個現(xiàn)代風(fēng)格的個人作品集網(wǎng)站。模型不僅完成了代碼編寫,更令人驚嘆的是,它似乎“讀懂了”小說中那種陰郁、狂野的文學(xué)氛圍,并將其轉(zhuǎn)化為了網(wǎng)站的色彩、排版和整體視覺語言。這被一些開發(fā)者稱為“氛圍編程”的開始——模型不再只是執(zhí)行指令的工具,而是能理解意圖的創(chuàng)意伙伴。

  在更硬核的工程領(lǐng)域,Gemini 3.1 Pro也展示了其接入現(xiàn)實世界的能力。無論是直接接入公開遙測數(shù)據(jù)流,實時追蹤國際空間站軌道的儀表盤,還是可交互的3D椋鳥群飛模擬,都證明了它在處理復(fù)雜API、構(gòu)建完整應(yīng)用方面的成熟度。

競賽進入下半場:谷歌開始“卷”了,但卷的是“長跑”

  面對Gemini 3.1 Pro的發(fā)布,技術(shù)社區(qū)的評價呈現(xiàn)出有趣的分化。樂觀派看到了它在硬核基準(zhǔn)上的全面領(lǐng)先:在Artificial Analysis的綜合智能維度以57分居首,超越Claude Opus 4.6的53分;在科學(xué)知識測試GPQA Diamond上更是拿下94.3%的高分。

  但質(zhì)疑聲同樣存在。Gartner分析師William McKeon-White的評價代表了一種審慎態(tài)度:“這是好的持續(xù)進步,但沒有什么根本性的游戲規(guī)則改變者。 ” 華盛頓大學(xué)教授Chirag Shah則進一步指出,更好的推理能力是處理復(fù)雜任務(wù)的必要條件,但并非充分條件,更何況“復(fù)雜”本身就是一個模糊的定義。

  然而,如果我們跳出單純的性能對比,從行業(yè)戰(zhàn)略層面審視這次發(fā)布,會發(fā)現(xiàn)一個更值得關(guān)注的信號:谷歌的迭代策略開始變得空前激進。

  這是谷歌首次在Gemini系列中使用“.1”作為版本增量。此前無論是從1.0到1.5,還是2.0到2.5,都是0.5的跨度?,F(xiàn)在改為0.1的細粒度更新,意味著谷歌放棄了過去追求“大版本震撼”的發(fā)布模式,轉(zhuǎn)向更貼近工程實際、更快速的持續(xù)迭代。

  這種轉(zhuǎn)變本身就說明了AI競賽的殘酷性:單次爆發(fā)的窗口期正在急劇收窄。 在Anthropic發(fā)布Sonnet 4.6僅兩天后,谷歌就攜3.1 Pro正面回擊。頭部廠商的技術(shù)差距正在肉眼可見地縮小,大家拼的不再是誰能憋出“王炸”,而是誰能以更快的速度、更穩(wěn)的步伐進行“長跑”。

  更耐人尋味的是定價。Gemini 3.1 Pro預(yù)覽版的API價格與上一代完全持平:輸入每百萬tokens 2美元起,輸出12美元起。這在一眾漲價的競品中顯得尤為突出。Artificial Analysis算了一筆賬:跑完其智能指數(shù)測試集,Gemini 3.1 Pro的花費還不到Claude Opus 4.6的一半。

當(dāng)最強的模型不再伴隨最高的溢價,這意味著大模型行業(yè)的競爭已經(jīng)從“性能溢價”階段,進入了“性能普惠”的新階段。

結(jié)語:重新定義“王座”

  有人說Gemini 3.1 Pro是來“搶王座”的。但在我看來,在這樣一個每周都有新王登基的時代,“王座”本身的概念正在被消解。

  過去,我們習(xí)慣于用一兩個基準(zhǔn)測試的榜首來定義王者。但今天,當(dāng)谷歌用一個“.1”版本就實現(xiàn)了推理能力翻倍、幻覺率大幅下降,并將最強能力以最低價格推向市場時,它傳遞的信息其實是:AI競賽的下一程,比的不是誰在領(lǐng)獎臺上站得更高,而是誰能構(gòu)建一個讓開發(fā)者和企業(yè)真正愿意扎根的生態(tài)。

  Gemini 3.1 Pro或許不是一個顛覆性的“游戲規(guī)則改變者”,但它清晰地劃出了谷歌的賽道:憑借Google Cloud和Workspace構(gòu)成的企業(yè)基礎(chǔ)設(shè)施,以及對核心推理能力的持續(xù)打磨,谷歌正在向外界證明,它要做的是那個能滿足企業(yè)所有模型需求的“一站式商店”。

  AI的2026年,就這樣在硅谷的你追我趕中拉開了序幕。DeepSeek們何時會再次出場“殺死比賽”仍是未知數(shù),但可以確定的是,這場游戲的節(jié)奏,已經(jīng)快到讓所有人都必須屏住呼吸。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
新加坡大滿貫賽:女單大爆冷!世界第4被淘汰,陳幸同3:0日本名將

新加坡大滿貫賽:女單大爆冷!世界第4被淘汰,陳幸同3:0日本名將

國乒二三事
2026-02-27 10:14:54
2月27日俄烏最新:俄羅斯又反手給了某人一記耳光

2月27日俄烏最新:俄羅斯又反手給了某人一記耳光

西樓飲月
2026-02-27 17:30:19
冤家!曼城皇馬連續(xù)五年歐冠淘汰賽相遇,將迎第16、17次交鋒

冤家!曼城皇馬連續(xù)五年歐冠淘汰賽相遇,將迎第16、17次交鋒

懂球帝
2026-02-27 19:20:47
澳門的賭臺,大面積關(guān)停!不是沒人去,而是被“算法”割廢的?

澳門的賭臺,大面積關(guān)停!不是沒人去,而是被“算法”割廢的?

水泥土的搞笑
2026-02-27 17:09:36
“手機將全面漲價”,沖上熱搜

“手機將全面漲價”,沖上熱搜

南方都市報
2026-02-27 14:31:12
好消息!嫣然醫(yī)院暫不搬遷,已張貼最新宣傳海報,欠款公告被撤下

好消息!嫣然醫(yī)院暫不搬遷,已張貼最新宣傳海報,欠款公告被撤下

達文西看世界
2026-02-27 20:35:55
四川自貢市榮縣發(fā)生3.0級地震,震源深度6千米

四川自貢市榮縣發(fā)生3.0級地震,震源深度6千米

北青網(wǎng)-北京青年報
2026-02-27 19:53:05
“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識了

“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識了

阿龍美食記
2026-02-26 14:30:14
紐卡兩眼一黑?3月迎地獄賽程!14天5戰(zhàn)連踢曼聯(lián)曼城+巴薩切爾西

紐卡兩眼一黑?3月迎地獄賽程!14天5戰(zhàn)連踢曼聯(lián)曼城+巴薩切爾西

我愛英超
2026-02-27 20:16:49
歐冠又現(xiàn)“死亡”半?yún)^(qū)!6大豪門齊聚 阿森納獲絕世好簽 或直通4強

歐冠又現(xiàn)“死亡”半?yún)^(qū)!6大豪門齊聚 阿森納獲絕世好簽 或直通4強

我愛英超
2026-02-27 19:38:34
俄羅斯“居住服役”法令頒布華人蜂擁回國,機票暴漲200%

俄羅斯“居住服役”法令頒布華人蜂擁回國,機票暴漲200%

史政先鋒
2026-02-27 14:48:38
情侶虎跳峽游玩時男子墜江失蹤!女友崩潰:我們馬上要結(jié)婚…已是五天內(nèi)第二起事故

情侶虎跳峽游玩時男子墜江失蹤!女友崩潰:我們馬上要結(jié)婚…已是五天內(nèi)第二起事故

新民晚報
2026-02-27 19:50:14
貴州8人赴廣西砍甘蔗,3個月掙回18萬!汗水真的能變現(xiàn)

貴州8人赴廣西砍甘蔗,3個月掙回18萬!汗水真的能變現(xiàn)

小影的娛樂
2026-02-27 00:01:35
幾塊錢的維生素B2,竟是高血壓克星?提醒:還有助改善性生活

幾塊錢的維生素B2,竟是高血壓克星?提醒:還有助改善性生活

橘子約定
2026-02-27 09:33:19
教育部:學(xué)生每天體育2小時、課間15分鐘已在全國所有省份部署推開

教育部:學(xué)生每天體育2小時、課間15分鐘已在全國所有省份部署推開

財聯(lián)社
2026-02-25 18:55:14
就是一整塊屏!廣東新聞聯(lián)播提前展示OPPO Find N6:微距展示肉眼幾乎看不到折痕

就是一整塊屏!廣東新聞聯(lián)播提前展示OPPO Find N6:微距展示肉眼幾乎看不到折痕

快科技
2026-02-27 10:42:00
男子向7歲兒子撒謊去走親戚,回京上班后內(nèi)心不舍,折返老家700公里接孩子:不該欺騙孩子,也不想讓他留下童年創(chuàng)傷

男子向7歲兒子撒謊去走親戚,回京上班后內(nèi)心不舍,折返老家700公里接孩子:不該欺騙孩子,也不想讓他留下童年創(chuàng)傷

觀威海
2026-02-27 18:27:11
男籃逆轉(zhuǎn)日本后遭當(dāng)頭一棒?韓國隊爆冷輸球:中國隊別以為穩(wěn)了?

男籃逆轉(zhuǎn)日本后遭當(dāng)頭一棒?韓國隊爆冷輸球:中國隊別以為穩(wěn)了?

籃球快餐車
2026-02-27 00:22:31
兩位英雄駕機撞向俄軍!不是所有烏克蘭人都是扎波羅熱哥薩克的種

兩位英雄駕機撞向俄軍!不是所有烏克蘭人都是扎波羅熱哥薩克的種

鷹眼Defence
2026-02-27 12:55:26
南京市檔案館查到谷愛凌外婆馮國珍的珍貴歷史檔案,確定其為南京戶籍

南京市檔案館查到谷愛凌外婆馮國珍的珍貴歷史檔案,確定其為南京戶籍

極目新聞
2026-02-27 10:42:46
2026-02-27 22:55:00
CNMO科技 incentive-icons
CNMO科技
專業(yè)、有態(tài)度的手機門戶
112224文章數(shù) 316226關(guān)注度
往期回顧 全部

數(shù)碼要聞

Omdia:時隔5年,小米去年再度回歸可穿戴設(shè)備出貨榜首

頭條要聞

23歲博士研究生確診胃癌晚期 坦言經(jīng)常錯過食堂飯點

頭條要聞

23歲博士研究生確診胃癌晚期 坦言經(jīng)常錯過食堂飯點

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

科技要聞

單張不到五毛!谷歌深夜發(fā)布Nano Banana 2

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

本地
房產(chǎn)
旅游
教育
家居

本地新聞

津南好·四時總相宜

房產(chǎn)要聞

重磅!海南“十五五”規(guī)劃出爐!未來五年,方向定了!

旅游要聞

輕奢三日游!包往返+包住宿+包景點,全部都包!

教育要聞

2月25日直播剪影,龍凱鋒軍事評論

家居要聞

素色肌理 品意式格調(diào)

無障礙瀏覽 進入關(guān)懷版