国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

以小小小小勝大!Google 最強小模型剛剛發(fā)布,手機也能跑

0
分享至


「開放」和「開源」,并非一字之差。

Google 的 Gemma 系列發(fā)布已有兩年,開發(fā)者能下載、能本地運行,但用途受限,再分發(fā)受限,改了也不能隨便傳播。充其量說,這只能算「開放」,還達不到 AI 圈「開源」的標準。


▲Google DeepMind CEO Demis Hassabis

就在剛剛,Google 發(fā)布四款 Gemma 4 系列模型,支持 Apache 2.0 全面開源,其中最小的版本可以在樹莓派上完全離線運行。Gemma 小模型,第一次真正意義上地落到了每個人手里。

以小小小小勝大

Gemma 4 共發(fā)布四個尺寸,底層技術(shù)與 Gemini 3 同源,覆蓋從邊緣設備到高性能工作站的硬件:

E2B / E4B:專為手機和 IoT 設備設計,與 Google Pixel 團隊及高通、聯(lián)發(fā)科深度合作優(yōu)化。推理時分別僅激活 2B 和 4B 參數(shù),以盡量節(jié)省內(nèi)存和電量。

支持 128K 上下文窗口,具備圖片、視頻和原生音頻輸入能力,可在 Pixel 手機、樹莓派、Jetson Orin Nano 上完全離線運行,延遲接近于零。Android 開發(fā)者現(xiàn)在可通過 AICore 開發(fā)者預覽版提前體驗 Agent Mode。


26B MoE:混合專家架構(gòu),推理時僅激活全部參數(shù)中的 3.8B,在保證極快推理速度的同時維持較高質(zhì)量,Arena AI 文本評分達到 1441,位列開源模型第六。

31B Dense:追求極致原始性能,Arena AI 文本評分達到 1452,位列開源模型第三。未量化的 bfloat16 權(quán)重可在單張 80GB NVIDIA H100 上運行,量化版本支持消費級 GPU,為本地微調(diào)提供強力基礎。

在能力層面,四款模型高度一致:均支持多步推理和復雜邏輯;原生支持函數(shù)調(diào)用、JSON 結(jié)構(gòu)化輸出和系統(tǒng)指令,可構(gòu)建能與外部工具和 API 交互的自主 Agent;支持圖片和視頻輸入,擅長 OCR 和圖表理解等視覺任務;預訓練語言超過 140 種。

26B 和 31B 的上下文窗口進一步擴展至 256K,可在單次提示中傳入完整代碼庫或長文檔。


基準測試的數(shù)字,能更直觀地說明這一代的升級幅度。

與上一代 Gemma 3 27B 相比,Gemma 4 31B 在數(shù)學推理基準 AIME 2026 上從 20.8% 跳升至 89.2%,代碼能力基準 LiveCodeBench v6 從 29.1% 升至 80.0%,衡量 Agent 工具調(diào)用能力的 τ2-bench 則從 6.6% 大幅提升至 86.4%。

這三項數(shù)據(jù)尤為關(guān)鍵,因為它們直接對應推理、編程和 Agent 三個當下最核心的應用場景。

參數(shù)效率是另一個值得關(guān)注的維度。從「模型性能對比參數(shù)量」的散點圖來看,Gemma 4 用 26B 和 31B 的體量,拿到了通常需要數(shù)百億乃至千億參數(shù)才能達到的 Elo 分數(shù)。

26B MoE 的 Arena AI 評分接近參數(shù)量約 15 倍的 Qwen3.5-397B-A17B,31B Dense 的評分則與體量在 600B 以上的 GLM-5 處于同一梯隊。Google 將其概括為「單位參數(shù)智能密度前所未有」,至少數(shù)字顯得有理有據(jù)。


邊緣端模型同樣值得關(guān)注。

E2B 在多語言問答基準 MMMLU 上達到 60.0%,在科學知識基準 GPQA Diamond 上達到 43.4%,要知道,這僅僅是一個只激活 2B 參數(shù)、可以跑在手機上的模型。相比之下,Gemma 3 27B 在 GPQA Diamond 上的得分是 42.4%,兩者幾乎持平。

換句話說,手機上的 2B 模型,已經(jīng)追上了上一代 270 億參數(shù)的桌面模型。

在硬件生態(tài)層面,NVIDIA 與 Google 已就 Gemma 4 在 RTX GPU、DGX Spark 個人 AI 超級計算機及 Jetson Orin Nano 上的推理優(yōu)化展開合作。

NVIDIA Tensor Core 和 CUDA 軟件棧為 Gemma 4 提供了開箱即用的高吞吐、低延遲支持。本地 Agent 應用 OpenClaw 也已適配最新模型,可調(diào)用用戶本地文件和應用上下文自動化執(zhí)行任務。


從「開放」到「開源」,打開另一種可能性

理解這次發(fā)布,需要先搞清楚 Gemma 和 Gemini 的關(guān)系。兩者基于同一套研究和技術(shù)體系構(gòu)建,區(qū)別在于 Gemini 是訂閱制的閉源產(chǎn)品,Gemma 則是可以免費下載、本地運行的開放模型。

Gemma 系列歷代產(chǎn)品一直使用 Google 自有條款授權(quán)。

開發(fā)者雖然可以下載和本地運行,但用途和再分發(fā)受到限制,嚴格來說只能算「開放」,算不上「開源」。Google 依然握著這根韁繩。

Gemma 4 正式切換至 Apache 2.0 協(xié)議。在這套許可證下,開發(fā)者可以將模型用于任何目的,包括個人、商業(yè)和企業(yè)用途,無需支付版稅,也無任何用途限制,修改和再分發(fā)同樣自由。

Apache 2.0 還內(nèi)置了專利保護機制:貢獻者的專利自動授權(quán)給用戶,若用戶反過來以專利侵權(quán)起訴他人,則自動喪失使用授權(quán)。這套雙向條款為企業(yè)級用戶提供了額外的法律保障。

這次開源的實質(zhì)意義在于,Gemma 4 現(xiàn)在可以合法打包進產(chǎn)品、服務和硬件設備中一并交付。對于醫(yī)療、金融等有數(shù)據(jù)主權(quán)或合規(guī)要求的行業(yè)用戶,完全本地運行意味著數(shù)據(jù)不必上傳云端,同時又能獲得前沿的 AI 能力。

Hugging Face 聯(lián)合創(chuàng)始人兼 CEO Clément Delangue 將此次授權(quán)切換稱為「一個重要的里程碑」。自 2024 年 2 月首代發(fā)布至今,Gemma 系列總下載量已超 4 億次,社區(qū)衍生變體超過 10 萬個。

現(xiàn)在,模型權(quán)重已經(jīng)上架 Hugging Face、Kaggle 和 Ollama,Transformers、TRL、vLLM、llama.cpp、MLX、Unsloth、SGLang、Keras 等主流框架均已于發(fā)布當天提供支持。


本地部署可通過 Ollama 或 llama.cpp 配合 GGUF 格式權(quán)重快速上手,Unsloth Studio 同步提供量化模型的微調(diào)和部署支持。如需云端擴展,Google Vertex AI、Cloud Run 和 GKE 同步可用。

以 Gemma 4 為代表的小模型有著更深遠的意義,因為它重新回答了一個基礎問題:AI 應該在哪里運行。

過去兩年,這個問題的答案幾乎是默認的:

數(shù)據(jù)中心。用戶通過網(wǎng)絡接口調(diào)用云端模型,數(shù)據(jù)必須上傳,使用依賴連接,成本由服務商定價。這套模式在消費場景里運轉(zhuǎn)尚可,但對數(shù)據(jù)主權(quán)有要求的行業(yè),比如醫(yī)療、金融、工業(yè),始終是一道難以逾越的門檻。

Gemma 4 提供了另一種可能。

手機、樹莓派、沒有外網(wǎng)的工廠終端,都可以在本地完成完整的模型推理。數(shù)據(jù)不離開設備,決策不經(jīng)過云端。Apache 2.0 的授權(quán)則進一步打開了落地空間:模型可以合法打包進硬件產(chǎn)品,預裝進行業(yè)設備,不再受限于調(diào)用協(xié)議和數(shù)據(jù)出境的合規(guī)約束。


能力層面的數(shù)字也印證了這條路的可行性。E2B 在科學知識基準 GPQA Diamond 上的得分,已經(jīng)與上一代 270 億參數(shù)的桌面模型基本持平,而它推理時只激活 20 億參數(shù),可以完全離線跑在手機上。

「更便宜」或「更方便」已經(jīng)不足以描述這個變化,它更接近于一次覆蓋范圍的擴張,AI 能力開始有條件真正進入那些長期被排除在外的場景。

操作系統(tǒng)的普及經(jīng)歷過類似的過程:從專業(yè)機構(gòu)的專用工具,逐漸嵌進每一臺個人設備,直到人們不再意識到它的存在。AI 離那個階段還很遠,工程、交互、可靠性上的問題都還沒有完整的答案,但可以跑在任意設備上,一定是這條路上最基礎也是最重要的一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
前阿里財務總監(jiān)爆火言論:普通家庭買車是最蠢的動作!評論炸鍋

前阿里財務總監(jiān)爆火言論:普通家庭買車是最蠢的動作!評論炸鍋

許三歲
2026-04-10 09:31:44
官宣!馬刺傷情報告出爐,掘金有意挑火箭,湖人干就完了

官宣!馬刺傷情報告出爐,掘金有意挑火箭,湖人干就完了

世界體育圈
2026-04-12 11:59:28
1954年,甘祖昌得知被評為準軍級:我有意見,要向中央討要個說法

1954年,甘祖昌得知被評為準軍級:我有意見,要向中央討要個說法

史之銘
2026-04-12 17:55:26
狂轟11:2,溫瑞博3:1淘汰日乒世界冠軍,球迷怒噴王皓撞南墻不拐

狂轟11:2,溫瑞博3:1淘汰日乒世界冠軍,球迷怒噴王皓撞南墻不拐

觀察鑒娛
2026-04-12 10:28:21
中年男人最大的悲哀是什么?網(wǎng)友:我,中年女人,也對啥都沒興趣

中年男人最大的悲哀是什么?網(wǎng)友:我,中年女人,也對啥都沒興趣

帶你感受人間冷暖
2026-04-10 01:21:44
美伊談判破裂的三大癥結(jié):霍爾木茲、濃縮鈾和百億凍結(jié)資金

美伊談判破裂的三大癥結(jié):霍爾木茲、濃縮鈾和百億凍結(jié)資金

華爾街見聞官方
2026-04-12 16:55:53
“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

皓皓情感說
2026-04-10 22:54:59
廣東戰(zhàn)廣廈12人名單,黃明依入圍,杜鋒變陣,徐杰替補三將關(guān)鍵

廣東戰(zhàn)廣廈12人名單,黃明依入圍,杜鋒變陣,徐杰替補三將關(guān)鍵

佳佳說奇事故事
2026-04-12 16:58:26
教育部通知!9月入學迎來顛覆性改革,孩子上學不用再拼家底了

教育部通知!9月入學迎來顛覆性改革,孩子上學不用再拼家底了

今朝牛馬
2026-04-10 22:35:42
熱議!雖然把醫(yī)生投訴了,但醫(yī)生醫(yī)術(shù)好,還想找你看??!醫(yī)生能拒診嗎?

熱議!雖然把醫(yī)生投訴了,但醫(yī)生醫(yī)術(shù)好,還想找你看病!醫(yī)生能拒診嗎?

華醫(yī)網(wǎng)
2026-04-12 05:41:34
廣東莫氏雞煲老板誠實經(jīng)營:雞源已斷卻贏得食客信賴

廣東莫氏雞煲老板誠實經(jīng)營:雞源已斷卻贏得食客信賴

馬蹄燙嘴說美食
2026-04-12 12:04:59
中美印負債金額差距斷崖:美36萬億,印160萬億,中國有多少?

中美印負債金額差距斷崖:美36萬億,印160萬億,中國有多少?

夢史
2026-04-12 04:48:05
政變只是一個開始,伊朗要變天了,中國最擔心的事情,恐將發(fā)生

政變只是一個開始,伊朗要變天了,中國最擔心的事情,恐將發(fā)生

舊鐵皮往南開
2026-04-12 12:31:02
亞錦賽戰(zhàn)報:韓國3金1銀收官!國羽鎖定1金2銀只待石宇奇

亞錦賽戰(zhàn)報:韓國3金1銀收官!國羽鎖定1金2銀只待石宇奇

老汆古裝影視解說
2026-04-12 17:11:36
機關(guān)事業(yè)單位職工未來要調(diào)整為“一周4天工作制”,你贊同嗎?

機關(guān)事業(yè)單位職工未來要調(diào)整為“一周4天工作制”,你贊同嗎?

細說職場
2026-04-12 09:39:35
農(nóng)村酒席嚴查!2026新規(guī)落地,這3種酒堅決不能辦,違者直接處罰

農(nóng)村酒席嚴查!2026新規(guī)落地,這3種酒堅決不能辦,違者直接處罰

復轉(zhuǎn)這些年
2026-04-08 13:04:32
2換1神級交易!狂攬31助攻5失誤!詹姆斯等來頂級控衛(wèi)

2換1神級交易!狂攬31助攻5失誤!詹姆斯等來頂級控衛(wèi)

籃球教學論壇
2026-04-12 13:27:10
蘭州擒獲殺人惡魔:八名特警破門而入,搏斗十分鐘,情節(jié)堪比武俠劇

蘭州擒獲殺人惡魔:八名特警破門而入,搏斗十分鐘,情節(jié)堪比武俠劇

隴史薈王文元
2026-04-11 07:34:39
全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

陳述影視
2026-04-04 17:53:34
一場3-1,讓國乒收獲第2冠!太原賽12日賽程出爐:溫瑞博沖雙冠王

一場3-1,讓國乒收獲第2冠!太原賽12日賽程出爐:溫瑞博沖雙冠王

侃球熊弟
2026-04-11 20:26:26
2026-04-12 18:35:00
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
38688文章數(shù) 2601461關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風日產(chǎn):尊重同行

頭條要聞

伊朗不接受美"紅線" 消息人士:美在談判決策上犯了錯

頭條要聞

伊朗不接受美"紅線" 消息人士:美在談判決策上犯了錯

體育要聞

五大聯(lián)賽首冠出爐?拜仁或提前4輪衛(wèi)冕德甲

娛樂要聞

46歲趙達官宣結(jié)婚!曾與殷桃談婚論嫁

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

家居
數(shù)碼
游戲
本地
軍事航空

家居要聞

復古風格 自然簡約

數(shù)碼要聞

破壁機哪個牌子好?安全無毒材質(zhì)是重點,揭秘TOP10家用哪種好

《塞爾達時之笛RE》可能是假的!任天堂在搞釣魚執(zhí)法

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達成協(xié)議

無障礙瀏覽 進入關(guān)懷版