国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Google Gemma 4 開源|全面解讀

0
分享至

Model

今天凌晨,Google DeepMind 發(fā)布了新一代開源模型 Gemma 4


Gemma 是 Google 的開源模型系列,和閉源旗艦 Gemini 共享底層技術(shù),權(quán)重完全公開,任何人可以下載、修改、部署。上一代 Gemma 3 是 2025 年 3 月發(fā)的,到這次更新整整一年。在這一年里國(guó)內(nèi)幾家開源模型已經(jīng)迭代了好幾輪,Google 在開源賽道的存在感越來(lái)越弱

這次一口氣放出四款模型,從手機(jī)到工作站全覆蓋。許可證從 Google 自有協(xié)議換成了 Apache 2.0


Gemma 4 在 Arena AI 開源排行榜的 Elo 評(píng)分 vs 參數(shù)量,31B 排第三,26B MoE 排第六

四款模型

Gemma 4 發(fā)布了四個(gè)版本,分大模型組和小模型組

31B Dense:310 億參數(shù)全激活,60 層,256K 上下文。追求質(zhì)量上限,Arena AI 開源排行榜第三。未量化 bfloat16 權(quán)重一張 80GB H100 就能裝下,量化后消費(fèi)級(jí)顯卡也能跑

26B A4B MoE:252 億總參數(shù)、38 億激活參數(shù),MoE 架構(gòu)(128 個(gè)專家,每次激活 8 個(gè)加 1 個(gè)共享),30 層,256K 上下文。推理速度接近 4B 模型,質(zhì)量遠(yuǎn)超 4B 水平。排行榜第六


四款模型架構(gòu)參數(shù)對(duì)比

E4B:80 億總參數(shù)、45 億有效參數(shù),42 層,128K 上下文。名字里的 E 是 Effective 的縮寫,小模型用了 Per-Layer Embeddings 技術(shù),有效參數(shù)遠(yuǎn)小于總參數(shù)

E2B:51 億總參數(shù)、23 億有效參數(shù),35 層,128K 上下文。據(jù)官方說(shuō)法,在部分設(shè)備上內(nèi)存占用可以壓到 1.5GB 以下


官方的四款模型能力對(duì)比

所有模型都支持圖像和視頻輸入,支持 140 多種語(yǔ)言

各模型均為多模態(tài),小模型支持語(yǔ)音輸入,大模型反而不支持

E2B 和 E4B 各自帶了一個(gè)約 3 億參數(shù)的音頻編碼器,可以做語(yǔ)音識(shí)別和語(yǔ)音翻譯(最長(zhǎng) 30 秒)。大模型沒(méi)有音頻能力。從產(chǎn)品邏輯看,手機(jī)端語(yǔ)音是剛需,工作站場(chǎng)景下不是

Google 和 Pixel 團(tuán)隊(duì)、高通、聯(lián)發(fā)科合作優(yōu)化了端側(cè)部署。E2B 和 E4B 可以在手機(jī)、樹莓派、NVIDIA Jetson Orin Nano 上完全離線運(yùn)行

成績(jī)

先說(shuō)結(jié)論:相比上一代 Gemma 3 27B,多個(gè)核心指標(biāo)的提升是代際級(jí)別的


Gemma 4 完整 Benchmark 數(shù)據(jù),最后一列為 Gemma 3 27B 基線

數(shù)學(xué):AIME 2026 競(jìng)賽測(cè)試,31B 拿到 89.2%,Gemma 3 27B 是 20.8%

代碼:Codeforces ELO 從 110 拉到 2150。LiveCodeBench v6 從 29.1% 到 80.0%。代碼是這次進(jìn)步最大的方向

綜合推理:GPQA Diamond(研究生級(jí)科學(xué)問(wèn)答)從 42.4% 到 84.3%。MMLU Pro 從 67.6% 到 85.2%

視覺(jué):MMMU Pro 從 49.7% 到 76.9%。文檔 OCR(OmniDocBench)從 0.365 到 0.131

長(zhǎng)上下文:MRCR v2 128K 從 13.5% 到 66.4%。長(zhǎng)上下文此前是 Gemma 的短板,這次補(bǔ)回來(lái)了

多語(yǔ)言:MMMLU 從 70.7% 到 88.4%。原生訓(xùn)練了 140 多種語(yǔ)言

26B MoE 和 31B 在大部分指標(biāo)上只差 2 到 5 個(gè)百分點(diǎn),但推理速度快得多。延遲敏感的場(chǎng)景下 26B MoE 性價(jià)比更高

E4B 的 MMLU Pro 69.4%%,有效參數(shù)只有 45 億,接近上一代 27B 的水平

核心能力

推理和思考。四款模型都內(nèi)置了可開關(guān)的思考模式,開啟后模型先輸出內(nèi)部推理再給答案。數(shù)學(xué)、邏輯、多步驟規(guī)劃類任務(wù)效果好很多,和 Gemini 的 thinking 能力同源

Agent 工作流。原生支持函數(shù)調(diào)用和結(jié)構(gòu)化 JSON 輸出,可以讓模型調(diào)用外部工具和 API。Google 同步發(fā)布了 Agent Development Kit(ADK),一個(gè)開源的 Agent 框架。端側(cè) E2B/E4B 也能跑 Agent,Google AI Edge Gallery 里已有示范應(yīng)用

代碼生成。支持離線寫代碼。Codeforces ELO 2150、LiveCodeBench 80.0%,在代碼補(bǔ)全和生成場(chǎng)景里是可用的

多模態(tài)理解。所有模型都能處理圖片和視頻(視頻按幀處理,最長(zhǎng) 60 秒)。圖片支持可變分辨率和寬高比,視覺(jué) token 預(yù)算可手動(dòng)配置(70 到 1120 五檔),低預(yù)算換速度,高預(yù)算換精度。OCR、文檔解析、圖表理解是重點(diǎn)場(chǎng)景

長(zhǎng)文檔。大模型 256K 上下文,小模型 128K。架構(gòu)上用混合注意力機(jī)制(局部滑動(dòng)窗口 + 全局注意力交替),全局層用統(tǒng)一 KV 和 Proportional RoPE 優(yōu)化長(zhǎng)上下文的內(nèi)存占用

多語(yǔ)言。原生訓(xùn)練 140 多種語(yǔ)言,MMMLU 88.4%

Apache 2.0

之前 Gemma 1/2/3 用的都是 Google 自己的許可協(xié)議,雖然允許商用但有附加條款。這次直接換成了 Apache 2.0,開源社區(qū)最認(rèn)可的商業(yè)友好型許可證之一。開發(fā)者可以自由修改、分發(fā)、商用,沒(méi)有用戶量門檻

Hugging Face 聯(lián)合創(chuàng)始人 Clément Delangue 評(píng)價(jià)這是一個(gè)重大里程碑。從 Gemma 系列自身看(三代自定義協(xié)議 → Apache 2.0),這是一個(gè)明確的轉(zhuǎn)向

Google 用許可證的選擇回答了一個(gè)討論了兩年的問(wèn)題:大廠做開源到底有多大誠(chéng)意

開源賽道的競(jìng)爭(zhēng)者

Arena AI 開源排行榜上,Gemma 4 31B 排第三、26B MoE 排第六。排在前面的主要是國(guó)內(nèi)的開源模型

目前開源賽道的主要競(jìng)爭(zhēng)者是 DeepSeek(V3.2 在用,V4 即將發(fā)布)、通義千問(wèn) Qwen3.5、智譜 GLM-5.1、MiniMax M2.5、月之暗面 Kimi K2.5。這幾家在今年春節(jié)前后密集發(fā)布了新版本,參數(shù)量從幾百億到上千億不等,在推理、代碼、Agent 等方向各有側(cè)重

Gemma 4 最大只有 31B,參數(shù)量的天花板是一個(gè)限制。但 Gemma 4 在端側(cè)部署的工程完整度上做得最深:和高通、聯(lián)發(fā)科的芯片級(jí)合作,和 Android 生態(tài)的原生打通,加上 Apache 2.0 的合規(guī)便利,這些是它的差異化

訓(xùn)練數(shù)據(jù)截止到 2025 年 1 月,且沒(méi)有公開訓(xùn)練數(shù)據(jù)的具體組成


去哪里用

在線體驗(yàn):Google AI Studio(31B、26B),Google AI Edge Gallery App(E4B、E2B)

模型下載:Hugging Face、Kaggle、Ollama

云端部署:Vertex AI、Cloud Run、GKE

Android 開發(fā):AICore Developer Preview(和 Gemini Nano 4 前向兼容)

推理框架:Hugging Face Transformers、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth、SGLang 等

Gemma 系列到目前累計(jì)超過(guò) 4 億 次下載,社區(qū)產(chǎn)出超過(guò) 10 萬(wàn) 個(gè)變體

Kaggle 上同步啟動(dòng)了 Gemma 4 Good Challenge,鼓勵(lì)用 Gemma 4 做有社會(huì)價(jià)值的項(xiàng)目

參考材料

→ Google 官方博客
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

→ Google DeepMind 產(chǎn)品頁(yè)
https://deepmind.google/models/gemma/gemma-4/

→ Gemma 4 Model Card(含完整 Benchmark)
https://ai.google.dev/gemma/docs/core/model_card_4

→ Hugging Face 模型集合
https://huggingface.co/collections/google/gemma-4

→ Hugging Face 技術(shù)博客
https://huggingface.co/blog/gemma4

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
希金斯:5-8落后讓我想起了去年的決賽,和趙心童比賽將非常困難

希金斯:5-8落后讓我想起了去年的決賽,和趙心童比賽將非常困難

世界體壇觀察家
2026-04-03 07:28:31
伊朗甩出八座橋的報(bào)復(fù)清單:這不是炸橋預(yù)告,是一封精心計(jì)算戰(zhàn)書

伊朗甩出八座橋的報(bào)復(fù)清單:這不是炸橋預(yù)告,是一封精心計(jì)算戰(zhàn)書

Ck的蜜糖
2026-04-04 01:24:00
西方戰(zhàn)略專家:中國(guó)是全世界,唯一強(qiáng)得悄無(wú)聲息的超級(jí)大國(guó)

西方戰(zhàn)略專家:中國(guó)是全世界,唯一強(qiáng)得悄無(wú)聲息的超級(jí)大國(guó)

阿豐聊娛
2026-04-02 23:02:04
優(yōu)思益造假:成本20元賣434元,董宇輝幫假保健品賣千萬(wàn)

優(yōu)思益造假:成本20元賣434元,董宇輝幫假保健品賣千萬(wàn)

網(wǎng)易新聞出品
2026-04-03 16:16:43
日本警察廳最新發(fā)布的統(tǒng)計(jì)數(shù)據(jù):在日外國(guó)人犯罪越南人居首,中國(guó)人其次

日本警察廳最新發(fā)布的統(tǒng)計(jì)數(shù)據(jù):在日外國(guó)人犯罪越南人居首,中國(guó)人其次

東京在線
2026-04-03 21:24:18
鄭麗文詳細(xì)行程公布!首日夜宿南京,又解決藍(lán)營(yíng)隱患 徐巧芯高興了

鄭麗文詳細(xì)行程公布!首日夜宿南京,又解決藍(lán)營(yíng)隱患 徐巧芯高興了

混沌錄
2026-04-02 20:21:18
徹底變天!中東四巨頭聯(lián)手掀翻牌桌!失控的以色列終于踢到鐵板!

徹底變天!中東四巨頭聯(lián)手掀翻牌桌!失控的以色列終于踢到鐵板!

阿纂看事
2026-04-03 23:22:54
35歲TT近況:征服卡戴珊,和3女友生4娃,都處成朋友,轉(zhuǎn)型成功

35歲TT近況:征服卡戴珊,和3女友生4娃,都處成朋友,轉(zhuǎn)型成功

科學(xué)發(fā)掘
2026-04-03 12:41:57
恭喜早已密婚?!房祖名低調(diào)領(lǐng)證手戴鉆戒,住500萬(wàn)婚房娶前天王嫂?

恭喜早已密婚?!房祖名低調(diào)領(lǐng)證手戴鉆戒,住500萬(wàn)婚房娶前天王嫂?

In風(fēng)尚
2026-04-03 12:07:40
馮提莫戶外直播被嚴(yán)重曬傷!大方展示胸前大片紅腫

馮提莫戶外直播被嚴(yán)重曬傷!大方展示胸前大片紅腫

游民星空
2026-04-03 18:09:22
網(wǎng)友爆料:提前申報(bào)帶$40萬(wàn)入境新加坡,被海關(guān)當(dāng)場(chǎng)扣下還判監(jiān)…

網(wǎng)友爆料:提前申報(bào)帶$40萬(wàn)入境新加坡,被海關(guān)當(dāng)場(chǎng)扣下還判監(jiān)…

新加坡萬(wàn)事通
2026-04-03 20:35:03
老虎伍茲被捕畫面曝光!神志不清+直接打電話給特朗普 否認(rèn)毒駕

老虎伍茲被捕畫面曝光!神志不清+直接打電話給特朗普 否認(rèn)毒駕

風(fēng)過(guò)鄉(xiāng)
2026-04-03 07:23:26
“唯一一條窮路被你找到了”,33歲農(nóng)村女生考編,網(wǎng)友恨鐵不成鋼

“唯一一條窮路被你找到了”,33歲農(nóng)村女生考編,網(wǎng)友恨鐵不成鋼

妍妍教育日記
2026-04-01 09:00:08
法日聯(lián)手提臺(tái)海,馬克龍變了調(diào),中國(guó)反制早有章法。

法日聯(lián)手提臺(tái)海,馬克龍變了調(diào),中國(guó)反制早有章法。

墜入二次元的海洋
2026-04-04 00:31:19
白拿35%股份贏麻了?趕走張雪后,凱越才懂什么叫自斷雙臂

白拿35%股份贏麻了?趕走張雪后,凱越才懂什么叫自斷雙臂

王二哥老搞笑
2026-04-03 19:50:57
局勢(shì)再度升級(jí)!首艘開往中國(guó)的油輪遭到襲擊,是誤傷還是警告

局勢(shì)再度升級(jí)!首艘開往中國(guó)的油輪遭到襲擊,是誤傷還是警告

鐵錘簡(jiǎn)科
2026-04-03 15:20:07
白酒再次被關(guān)注!醫(yī)生研究發(fā)現(xiàn):喝得越多,壽命或越短告訴你真相

白酒再次被關(guān)注!醫(yī)生研究發(fā)現(xiàn):喝得越多,壽命或越短告訴你真相

健康科普365
2026-03-29 18:30:09
房?jī)r(jià)要變了?如果不出意外,2026年二手房?jī)r(jià)格將出現(xiàn)4大轉(zhuǎn)變

房?jī)r(jià)要變了?如果不出意外,2026年二手房?jī)r(jià)格將出現(xiàn)4大轉(zhuǎn)變

靚仔情感
2026-04-03 14:38:01
警惕!仙人跳3.0殺瘋了,??永蠈?shí)人,一次私了就可能毀終身

警惕!仙人跳3.0殺瘋了,??永蠈?shí)人,一次私了就可能毀終身

老特有話說(shuō)
2026-01-29 23:44:15
鄭麗文高鐵往返南京,清晨拜謁中山陵,392級(jí)臺(tái)階藏滿深意

鄭麗文高鐵往返南京,清晨拜謁中山陵,392級(jí)臺(tái)階藏滿深意

哄動(dòng)一時(shí)啊
2026-04-03 17:10:19
2026-04-04 02:40:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
358文章數(shù) 50關(guān)注度
往期回顧 全部

科技要聞

5萬(wàn)輛庫(kù)存車,給了特斯拉一記重拳

頭條要聞

特朗普非常生氣要大清洗 陸軍部長(zhǎng)、FBI局長(zhǎng)等或被調(diào)整

頭條要聞

特朗普非常生氣要大清洗 陸軍部長(zhǎng)、FBI局長(zhǎng)等或被調(diào)整

體育要聞

被NBA選中20年后,他重新回到籃球場(chǎng)

娛樂(lè)要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

專家稱長(zhǎng)期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長(zhǎng)得很像嗎?

態(tài)度原創(chuàng)

教育
親子
房產(chǎn)
家居
公開課

教育要聞

3000師生徒步108里祭英烈,網(wǎng)友吵翻“沒(méi)苦硬吃”?老校長(zhǎng)回應(yīng)

親子要聞

兩個(gè)孩子棒 父母也棒

房產(chǎn)要聞

小陽(yáng)春全面啟動(dòng)!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

家居要聞

溫馨多元 愛(ài)的具象化

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版