国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Gemini 3 Flash 倒反天罡了:關(guān)鍵性能居然超過了 Pro!

0
分享至


作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com

12 月 17 日,Google 正式發(fā)布 Gemini 3 Flash。一個定價只有 Claude 1/5、GPT 1/4 的“輕量模型”,在編碼上超過 Claude Sonnet 4.5,在推理和多模態(tài)上全面碾壓,和 GPT-5.2 也互有勝負。


MMMU-Pro,多模態(tài)的評估效果:


更夸張的是,它甚至超過了自家旗艦:在 SWE-bench 上,Gemini 3 Flash 78%,Gemini 3 Pro 76.2%,這也是 Flash 系列誕生以來超過同代 Pro 模型的第一次。


數(shù)據(jù)可能還是有點抽象,直接看它能干什么:

Gemini 3 Flash 單次生成完整動畫 3D 程序化房間


用Gemini 3 Flash 一句話生成可玩游戲


Resemble AI 用Gemini 3 Flash 實時分析 deepfake 視頻:他們的產(chǎn)品需要把復(fù)雜的音視頻取證數(shù)據(jù)即時轉(zhuǎn)化為普通人能理解的分析結(jié)果。在測試中,他們發(fā)現(xiàn) 3 Flash 的多模態(tài)分析速度比 2.5 Pro 快了 4 倍,能夠在不拖慢關(guān)鍵工作流的情況下處理原始的技術(shù)輸出數(shù)據(jù)

一個月前,Gemini 3 Pro 和 Deep Think 的發(fā)布讓 Google 重新站回 AI 第一梯隊,Gemini 3 Pro 登頂 LMArena,Deep Think 在 ARC-AGI 上打出其他模型三倍的成績。發(fā)布以來,Gemini API 日均處理量突破 1 萬億 tokens?,F(xiàn)在,F(xiàn)lash 的到來補齊了 Gemini 3 家族的最后一塊拼圖。

但這次的 Gemini 3 Flash 和以往不一樣。過去我們對 Flash 的認知很清晰,快、便宜、但能力打折。想要速度,就得接受智能上的妥協(xié)。然而Gemini 3 Flash 打破了這個慣例,它用輕量模型的價格,打出了旗艦級的能力。

1

1/5 的價格,憑什么打旗艦?

先說和其他家的對比。

在博士級科學推理基準 GPQA Diamond 上,Gemini 3 Flash 拿到 90.4%,大幅領(lǐng)先 Claude Sonnet 4.5 的 83.4%,接近 GPT-5.2 的 92.4%。在多模態(tài)理解基準 MMMU-Pro 上,F(xiàn)lash 81.2%,超過 GPT-5.2 的 79.5%,更是甩開 Claude Sonnet 4.5 十幾個百分點。

在人類最后考試 Humanity's Last Exam 上(無工具),Gemini 3 Flash 33.7%,Claude Sonnet 4.5 只有 13.7%——差距接近 20 個百分點。


編碼能力同樣亮眼。在 SWE-bench Verified 上,Gemini 3 Flash 78%,超過了 Claude Sonnet 4.5 的 77.2%,頭一次超過了自家 3 Pro 的 76.2%。

把價格因素放進來看就更夸張了,F(xiàn)lash 的價格大約是 Claude 的 1/5、GPT 的 1/4,但在多項指標上打平甚至領(lǐng)先。 如果說以前選 Flash 是快、省錢但有所妥協(xié),現(xiàn)在選 Flash 是省錢還省心。

么一個問題自然出現(xiàn),Gemini 3 Pro 還有什么用?

極限推理場景。GPQA Diamond 上 Pro 91.9% vs Flash 90.4%,Humanity's Last Exam 上 Pro 37.5% vs Flash 33.7%,加上只有Gemini 3 Pro才有的 Deep Think 模式。Pro 適合極限推理,F(xiàn)lash 適合高頻 agent 任務(wù),這是 Google 給出的新分工。

但對大多數(shù)場景來說,F(xiàn)lash 不僅夠用,而且性價比炸裂。

效率層面同樣顯著。根據(jù) Artificial Analysis 測試,Gemini 3 Flash 比 2.5 Pro 快 3 倍,處理日常任務(wù)平均節(jié)省 30% token 消耗。定價方面,輸入 $0.50/百萬 tokens,輸出 $3/百萬 tokens,只有 3 Pro 的四分之一。


Gemini 3 Flash 在性能、成本與速度的權(quán)衡關(guān)系上推進了最優(yōu)邊界

Google 的官方說法是:“速度和規(guī)模,不必以犧牲智能為代價?!?/strong> 放在以前的 Flash 上可能是句口號,但這次數(shù)據(jù)確實撐得起來。

1

免費用戶,旗艦體驗

Gemini 3 Flash 的發(fā)布不只是 API 層面的事,它會直接改變普通用戶的日常體驗。

在 Gemini App 里,Gemini 3 Flash 會替代原來的 2.5 Flash,成為新的默認模型。這意味全球所有的 Gemini 用戶,包括免費用戶,都將自動升級到 Gemini 3 級別的體驗,不需要付費,不需要做任何設(shè)置。

升級后的 App 會提供三種模式供用戶選擇:

  • Fast(極速):默認由Gemini 3 Flash 驅(qū)動,秒回日常問題。

  • Thinking(思考):同樣由 Flash 3 驅(qū)動,但激活了它的“深度思考”能力,專門處理復(fù)雜邏輯。

  • Pro(專業(yè)):繼續(xù)保留 Gemini 3 Pro,作為處理高難度數(shù)學和代碼問題的首選。

在 Google Search 里,AI Mode 的默認模型也會在全球范圍內(nèi)升級到 3 Flash。Google 表示,得益于 3 Flash 強大的推理和多模態(tài)能力,AI Mode 現(xiàn)在能更精準地理解用戶意圖,處理更復(fù)雜、更有多重約束條件的問題,同時生成結(jié)構(gòu)清晰、易于消化的回答。

對于美國用戶,Google 還開放了更多選項,可以在 AI Mode 里選擇"Thinking with 3 Pro"來獲得更深度的幫助,圖像生成模型 Nano Banana Pro 也向更多美國用戶開放了。

對于普通用戶來說,這可能是感知最明顯的一次升級。你打開 Gemini,它已經(jīng)是前沿級別的模型了;你在 Google 搜索里問復(fù)雜問題,背后跑的是一個融入了頂級大模型能力的引擎。換句話說,免費用戶現(xiàn)在用的默認模型,能力已經(jīng)不輸其他家的付費旗艦。

1

開發(fā)者:省錢還賺到

以前做 agentic 應(yīng)用,想用旗艦級模型就得付旗艦級價格。Gemini 3 Flash 改變了這個局面。

過去開發(fā)者面臨一個兩難選擇,要么用快但笨的小模型,犧牲任務(wù)完成質(zhì)量;要么用聰明但慢且貴的大模型,面對延遲和成本的雙重壓力。尤其是在需要多輪調(diào)用、高頻迭代的 agent 場景里,這個取舍幾乎是綁死的。Gemini 3 Flash 提供了一個新選項,足夠快、足夠聰明、成本可控。在 SWE-bench 上 78% 的成績說明它完全有能力處理復(fù)雜的編碼任務(wù),同時 3 倍于 2.5 Pro 的速度讓它能勝任對延遲敏感的實時場景,而 1/5 于競品的價格讓大規(guī)模部署成為可能。

目前,Gemini 3 Flash 已經(jīng)在以下平臺上線(preview):

  • Google AI Studio 和 Gemini API

  • Gemini CLI

  • Android Studio

  • Vertex AI(面向企業(yè))

  • Google Antigravity:這是 Google 新推出的 agentic 開發(fā)平臺,專門為 AI 主導的軟件開發(fā)流程設(shè)計,讓 AI Agent 可以直接操作編輯器、終端和瀏覽器

在高頻調(diào)用場景,Google 還提供了配套的成本優(yōu)化方案。Context Caching 功能可以在重復(fù) token 使用達到一定閾值時降低 90% 的成本;Batch API 支持異步批量處理,成本可以再降 50%,同時提供更高的調(diào)用配額。對那些需要在生產(chǎn)環(huán)境里大規(guī)模跑 agent 任務(wù)的團隊,這套組合拳相當有吸引力。

1

Flash 的含義變了

Gemini 3 Flash 的發(fā)布,某種程度上重新定義了“Flash”這個品類的含義。

Flash,終于不只是快速和效率了。

過去,F(xiàn)lash 或者說輕量級模型的定位非常明確:用能力換取速度和成本優(yōu)勢。你選擇 Flash,就意味著接受它在智能上的折扣。但 Gemini 3 Flash 證明了另一種可能,當?shù)讓拥幕A(chǔ)模型足夠強大時,輕量版本不一定要做太多能力閹割,它可以只是“更高效的滿配版”。

Google 在博客里提到,Gemini 3 Flash 的核心模型能力已經(jīng)強到一個程度:在很多任務(wù)上,關(guān)掉思考模式的 3 Flash,比開著思考模式的 2.5 版本表現(xiàn)還好。 以前你需要犧牲速度來換準確,現(xiàn)在不用了。

這次發(fā)布也讓 Gemini 3 家族陣容正式成型:Gemini 3 Pro、Gemini 3 Deep Think、Gemini 3 Flash 三個版本,覆蓋了從輕度用戶到硬核開發(fā)者的完整需求譜系。想要極致推理深度,用 Deep Think;想要最強綜合能力,用 Pro;想要又快又好還便宜,用 Flash。各取所需,不再是單選題。

從數(shù)據(jù)來看,Google 在 AI 產(chǎn)品化這條路上跑得相當穩(wěn)。Gemini App 的月活已經(jīng)突破 6.5 億,開發(fā)者數(shù)量達到 1300 萬,API 調(diào)用量同比增長 3 倍。上季度到這季度,用戶數(shù)從 4.5 億猛增到 6.5 億。

目前,普通用戶可以直接在 Gemini App 和 Google Search 的 AI Mode 中體驗新模型;開發(fā)者可以通過 Google AI Studio 和 Gemini API 開始構(gòu)建應(yīng)用。

當 Google 用 Flash 模型 1/5 的價格打出旗艦級能力,F(xiàn)lash 這個品類的想象空間被徹底打開了。


點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
當你隔壁是個超級大國:東南亞人眼中的中國,到底是什么樣的?

當你隔壁是個超級大國:東南亞人眼中的中國,到底是什么樣的?

斜煙風起雨未
2025-12-24 13:32:53
海南封關(guān)運作后,就相當于中國版的新加坡正式上線了。

海南封關(guān)運作后,就相當于中國版的新加坡正式上線了。

流蘇晚晴
2025-12-21 16:05:12
倪妮太豪!在北京家里過圣誕,意外曝光內(nèi)景,難怪她看不上馮紹峰

倪妮太豪!在北京家里過圣誕,意外曝光內(nèi)景,難怪她看不上馮紹峰

心靜物娛
2025-12-24 11:19:19
美高官:先打中國再打朝鮮,打不過就核戰(zhàn),因為中國火箭軍太強大

美高官:先打中國再打朝鮮,打不過就核戰(zhàn),因為中國火箭軍太強大

古史青云啊
2025-12-24 16:32:15
新加坡總統(tǒng):中國不要自給自足,海南封關(guān)將會砸了新加坡的鐵飯碗

新加坡總統(tǒng):中國不要自給自足,海南封關(guān)將會砸了新加坡的鐵飯碗

無法克制的煩惱
2025-12-25 02:28:28
董卿父親董善祥:我這輩子最后悔的事,就是讓寶貝女兒嫁給密春雷

董卿父親董善祥:我這輩子最后悔的事,就是讓寶貝女兒嫁給密春雷

豐譚筆錄
2025-12-25 11:35:55
日本人妻,全員不倫?

日本人妻,全員不倫?

記錄生活日常阿蜴
2025-12-25 00:51:21
12月31日,新能源充電服務(wù)補貼停止,網(wǎng)約車司機:天塌了

12月31日,新能源充電服務(wù)補貼停止,網(wǎng)約車司機:天塌了

用車指南
2025-12-25 10:00:59
經(jīng)濟學家姚洋:制約中國生育率低的不是房價,而是教育

經(jīng)濟學家姚洋:制約中國生育率低的不是房價,而是教育

觀察者網(wǎng)
2025-12-23 13:42:06
這事是真的嗎?

這事是真的嗎?

西樓飲月
2025-12-24 23:30:03
險歸化國足!26歲華裔求婚成功,相戀6年白人女友驚艷:明眸皓齒

險歸化國足!26歲華裔求婚成功,相戀6年白人女友驚艷:明眸皓齒

我愛英超
2025-12-24 22:35:21
風水輪流轉(zhuǎn)! 掃地出門、人財兩空 張嘉倪官宣喜訊,打臉買超

風水輪流轉(zhuǎn)! 掃地出門、人財兩空 張嘉倪官宣喜訊,打臉買超

銀河史記
2025-12-24 12:15:44
回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

就一點
2025-10-09 12:19:42
63歲大爺和37歲寡婦搭伙,女方什么也不要,新婚當夜提了1個要求

63歲大爺和37歲寡婦搭伙,女方什么也不要,新婚當夜提了1個要求

詭譎怪談
2025-03-25 22:46:25
蘿莉島案件大反轉(zhuǎn)

蘿莉島案件大反轉(zhuǎn)

藍鉆故事
2025-12-25 00:00:59
2003 年宋美齡生命垂危之際,她在宋子文墓前潸然淚下,哭訴道:宋家人怎么都葬在了這里?

2003 年宋美齡生命垂危之際,她在宋子文墓前潸然淚下,哭訴道:宋家人怎么都葬在了這里?

桃煙讀史
2025-12-19 17:24:18
1952 年鄭洞國進京任職,妻嫌薪低改嫁,20 年后哭著找上門

1952 年鄭洞國進京任職,妻嫌薪低改嫁,20 年后哭著找上門

嘮叨說歷史
2025-12-24 14:47:32
臉都打腫了!新華社這回算是直接把那個遮羞布給掀開了。

臉都打腫了!新華社這回算是直接把那個遮羞布給掀開了。

忠于法紀
2025-12-24 21:27:55
渤海完全屬于中國!因當年毛主席的一句話,如今沒有一艘外船敢進

渤海完全屬于中國!因當年毛主席的一句話,如今沒有一艘外船敢進

抽象派大師
2025-12-11 17:05:41
當黑人選民看到,奧巴馬越老越白的時候,產(chǎn)生了強烈的被背叛感!

當黑人選民看到,奧巴馬越老越白的時候,產(chǎn)生了強烈的被背叛感!

看盡人間百態(tài)
2025-12-24 01:28:42
2025-12-25 12:19:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
2739文章數(shù) 10422關(guān)注度
往期回顧 全部

數(shù)碼要聞

年末裝機主板選購指南,不選貴的只選對的

頭條要聞

讓美國人跌入深淵的"斬殺線":四口之家一年要賺98萬元

頭條要聞

讓美國人跌入深淵的"斬殺線":四口之家一年要賺98萬元

體育要聞

單賽季11冠,羽壇“安洗瑩時代”真的來了

娛樂要聞

金莎小19歲男友求婚成功!兩人雪地擁吻

財經(jīng)要聞

美國未來18個月不對中國芯片加額外關(guān)稅

科技要聞

屠龍少年被"招安"!英偉達平安夜豪擲200億

汽車要聞

預(yù)售31.3萬元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

藝術(shù)
本地
旅游
家居
公開課

藝術(shù)要聞

緬懷 | 著名油畫家宮立龍逝世,享年73歲

本地新聞

云游安徽|亳州晨暮皆成史,街巷縱橫印春秋

旅游要聞

美麗中國丨云南南澗:無量山冬櫻花綻放

家居要聞

經(jīng)典彌新 品味浪漫居所

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版