国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

比國產(chǎn)AI還卷:谷歌Gemma 4以小博大,端側(cè)模型迎來分水嶺

0
分享至

發(fā)布才幾個小時,Gemma 4 就已經(jīng)把開發(fā)者社區(qū)的情緒拉滿了。

北京時間 4 月 3 日凌晨,Google 推出了新一代開源模型 Gemma 4,包括 E2B、E4B、26B(MoE)、31B 「一門四杰」,其中 E2B、E4B 兩個較小模型直接可以在手機、樹莓派等設(shè)備上部署運行,26B、31B 兩個較大模型也只需要一張消費級顯卡就能跑起來。

不同于閉源的 Gemini 大模型走的是「力大磚飛」,Google 在 Gemma 開源模型的思路上一直是「小而精」。

但 Gemma 4 給人的第一印象還是有點不按劇本來。參數(shù)規(guī)模沒有膨脹,結(jié)構(gòu)也談不上顛覆,可是在一系列 benchmark 里,Gemma 4 卻能逼近甚至超越更大一檔規(guī)模的模型。26B、31B 版本在 AI 競技場(人工對話打分)已經(jīng)比肩一眾國產(chǎn)開源模型,甚至超越了 685B 的 DeepSeek V3.2 以及 397B 的 Qwen 3.5。



比國產(chǎn)模型還卷了。

過去在這個戰(zhàn)場上,Qwen 幾乎就是「小而精」模型的代名詞,但 Gemma 4 這次的進(jìn)步確實太大了。 不只是在 AI 競技場這種偏「AI 聊天」的真實場景測試中有驚艷的表現(xiàn),Gemma 4 還是少有從一開始就面向本地 Agent 工作流設(shè)計的模型,也支持多模態(tài)。

這么小規(guī)模的模型下,Gemma 4 卻做到了超預(yù)期的性能和能力,也難怪 AI 研究工程師 Sebastian Raschka 在 X 上說,「Gemma 4 是一個巨大的跨越!

但很多人忽略的一個關(guān)鍵,還在于開源協(xié)議的切換。這次 Google 終于想通了,放棄了自家糟糕透頂?shù)?Gemma 開源協(xié)議,Gemma 4 全系換上了主流的 Apache 2.0 協(xié)議,從個人到企業(yè)都可以放心商用、再分發(fā)。



開源 AI 模型的格局,又要再變一次?

免費、無 API,大模型不大但好用

先從 26B 和 31B 這兩個模型說起。

按照過去兩年的直覺,這個參數(shù)規(guī)模幾乎不在第一梯隊。開源世界里,動輒就是百億、千億,甚至像 DeepSeek V3.2 這種 600B+ 級別的模型,才有資格談「對標(biāo)閉源」。但 Gemma 4 的這兩個模型,上來就把這套邏輯打亂了。

26B 和 31B 的表現(xiàn),不只是「能打」,而是已經(jīng)開始穩(wěn)定貼近甚至超過更大體量的模型。Google DeepMind 創(chuàng)始人兼 CEO Demis Hassabis就說得很直白,Gemma 4 就是「同級別(參數(shù)規(guī)模)最好的開源模型」。

需要一提的是,Gemma 4(26B)采用的是 MoE 架構(gòu),總參數(shù) 26B,但實際激活規(guī)模要小得多。這種設(shè)計帶來的直接結(jié)果不是紙面參數(shù)的好看,而是一個更現(xiàn)實的變化:在很多任務(wù)里,它用小模型的成本,打出了接近更大模型的效果。



圖片來源:英偉達(dá)

事實上,Gemma 4 的優(yōu)勢,不在絕對能力,而在「智能密度」,或者說是每個參數(shù)的效率最大化。

26B 和 31B 就是最直觀的例子,在實際測試?yán)锞湍芨惺艿竭@種密度和效率。在一些開發(fā)者的早期測試中,它反而比更大的模型更「好用」,因為它不只是能做,還能穩(wěn)定、快速地做。

簡言之,能夠承擔(dān)更復(fù)雜的任務(wù)和更好的表現(xiàn)。

Gemma 4 推出后,X 上就有獨立開發(fā)者就在 RTX 5090 上本地部署了 31B,不僅能快速完成代碼生成、多模態(tài)理解任務(wù),整體表現(xiàn)已經(jīng)相當(dāng)可用。至于 Gemma 4(26B),在 Mac mini(M4 16GB)上就能很好地部署運行 。



更重要的是,Hacker New 社區(qū)還有人指出,測試將 Gemma 4 接進(jìn) code-agent harness(30K+ 上下文)的表現(xiàn)很好,明顯快于 Qwen 同級模型。

免費、無需 API。Gemma 4 的 26B 和 31B,并不是最強的開源模型,但已經(jīng)足夠強,同時又足夠「輕」,甚至可以真正在本地做事,用極低的使用成本在本地處理一系列低復(fù)雜度的 Agent 任務(wù)。

這也是為什么很多開發(fā)者在討論 Gemma 4 時,很少再糾結(jié)它和 GPT、Claude 的差距,而是開始討論另一件事,這樣體量的模型,能不能成為本地 Agent 的核心。因為一旦這個問題的答案變成「可以」,那整個開源模型的價值,就不再只是替代 API,而是開始接管一部分真實的工作流。

接下來一段時間,相信這也是 Gemma 4 的重點。

聯(lián)手高通、聯(lián)發(fā)科,小模型引發(fā)本地 Agent 浪潮?

但這一代 Gemma 4,不只看 26B、31B,把視角往下拉到 E2B、E4B,會發(fā)現(xiàn) Google 還想更進(jìn)一步把端側(cè) AI 塞進(jìn)手機等邊緣設(shè)備。

先說一點。這兩個模型不是可以在端側(cè)跑,而是從一開始就是為端側(cè)設(shè)計的。Google 在官方描述里就強調(diào),E2B 和 E4B 的目標(biāo)是「重新定義端側(cè)實用性」,優(yōu)先考慮的是低延遲、多模態(tài)和系統(tǒng)級集成,而不是參數(shù)規(guī)模。這句話背后其實很明確,它們不是縮小版的大模型,而是另一類產(chǎn)品。

這類產(chǎn)品最關(guān)鍵的一點,是把「本地 AI」從概念變成了一個可以落地的工程路徑。E2B 在量化之后可以壓到 1.5GB 以內(nèi),在樹莓派 5 上也能跑出可用的推理速度,prefill 可以到 100 tokens/s 以上 。意味著一個不依賴云、不走 API 的 AI 系統(tǒng),開始可以在極其有限的硬件上運行。



手機上就能本地部署,圖片來源:Google

更重要的是,這件事并不是 Google 一家在做。為了讓這兩個模型真的跑起來,Google 這次是把整條硬件鏈路一起拉進(jìn)來了,從 Pixel 團(tuán)隊,到高通、聯(lián)發(fā)科,再到 ARM、NVIDIA,都參與了優(yōu)化 。換句話說,這還是一次面向手機和邊緣設(shè)備的系統(tǒng)級協(xié)同。

這也解釋了為什么 E2B 和 E4B 的意義,和過去的小模型完全不一樣。以前的小模型,本質(zhì)是「能力不夠,只能在端側(cè)跑」。現(xiàn)在這兩個模型更像是「能力剛好夠,而且專門為端側(cè)優(yōu)化」。它們不僅支持文本,還原生支持圖像、音頻輸入,甚至可以直接參與多步 Agent 工作流 ,支持 Skiill。



可以安裝 App 使用,圖片來源:Google

真正的變化在這里開始顯現(xiàn)。過去討論手機上的 AI,大多還停留在「調(diào)用云端模型」,本地只負(fù)責(zé)做一些簡單推理。但 Gemma 4 這一步,相當(dāng)于是把更完整的 AI 能力,直接搬進(jìn)手機等設(shè)備里,甚至是脫離網(wǎng)絡(luò)在本地運行 Agent 。

尤其是在豆包手機助手引發(fā)云端 AI Agent 的隱私安全顧慮之后,這對手機意味著什么,其實不難想象。

而當(dāng)模型可以直接運行在 SoC 的 NPU 上,當(dāng)系統(tǒng)級組件可以調(diào)用本地模型完成推理、生成、甚至多步任務(wù)執(zhí)行,AI 也會更進(jìn)一步變成操作系統(tǒng)的一部分。

所以 E2B 和 E4B 真正讓人興奮的地方,但不是它們的性能,而是讓人看到端側(cè) AI 的潛力還有巨大的挖掘空間。而這條路徑,一旦跑通,影響的就不只是模型本身,而是整個終端生態(tài)。

開源 AI 模型,在 Agent 時代重新洗牌

最早,Meta 用 Llama 奠定了開源模型生態(tài)的方式,但很快,從 Qwen、DeepSeek 到去年 Kimi、MiniMax 的相繼開源,中國公司已經(jīng)主導(dǎo)了全球開源 AI 的大模型格局,也在在性能、成本和落地能力上同時逼近甚至反超閉源模型。

也正是在這個背景下,再看 Google 的動作,就不只是一次模型更新了。

Gemma 過去一直處在一個略顯尷尬的位置,名義上開源,但協(xié)議并不徹底,企業(yè)用起來有顧慮,開發(fā)者也很難放心做二次分發(fā)和深度定制。這一次,Gemma 4 直接換成 Apache 2.0,本質(zhì)上是把最后一道門檻拆掉了,從「可以用」變成「可以放心用」。



圖片來源:安卓

這一步的意義,比模型本身更大。因為它等于明確了一件事,Google 不只是要做模型,還要重新進(jìn)入開源生態(tài)。

這也讓它的整體策略變得更清晰了。一邊是 Gemini,繼續(xù)對標(biāo) GPT 和 Claude,守住能力上限和商業(yè)化;另一邊是 Gemma,面向開發(fā)者、面向本地部署、面向生態(tài)擴(kuò)展。閉源和開源,不再是取舍,而是分工。

過去幾個月,真正把行業(yè)注意力拉走的,是 Agent。無論是 Anthropic 推出的 Claude Code,還是開源社區(qū)圍繞 OpenClaw 搭起來的一整套工具鏈,大家討論的焦點已經(jīng)不再是對話、多模態(tài),而是「干活」。



圖片來源:OpenClaw

在這波變化里,Gemini 的存在感其實不算強。能力依然在第一梯隊,但在開發(fā)者心智里,它并沒有成為 Agent 的首選底座。這也是為什么你會看到越來越多開發(fā)者開始轉(zhuǎn)向開源模型,哪怕能力略遜一籌,也更愿意換取可控性和可部署性。

Gemma 4 出現(xiàn)在這個時間點,就顯得很微妙了。

一方面,它補上了 Google 在開源上的短板,尤其是協(xié)議問題解決之后,開發(fā)者終于可以真正把它當(dāng)作基礎(chǔ)設(shè)施來用。另一方面,它又剛好踩在「本地 Agent」這個新需求上,無論是 26B、31B,還是 E2B、E4B,都在試圖回答同一個問題:能不能把一部分 AI 能力,直接搬到設(shè)備上運行。

這未必是最激進(jìn)的一步,但很可能是最現(xiàn)實的一步。

開源模型的競爭,正在從「誰更強」,變成「誰更能被用起來」。而在這個新的牌桌上,Google 終于重新坐了下來,只是這一次,它不再是發(fā)牌的人,而是必須重新爭奪籌碼的玩家。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
無錫出逃卡皮巴拉現(xiàn)蹤跡,蘇錫常救援隊馳援搜尋

無錫出逃卡皮巴拉現(xiàn)蹤跡,蘇錫常救援隊馳援搜尋

現(xiàn)代快報
2026-04-03 12:03:15
關(guān)于內(nèi)蒙古自治區(qū)優(yōu)秀共產(chǎn)黨員、優(yōu)秀黨務(wù)工作者、 先進(jìn)基層黨組織擬推薦對象的公示

關(guān)于內(nèi)蒙古自治區(qū)優(yōu)秀共產(chǎn)黨員、優(yōu)秀黨務(wù)工作者、 先進(jìn)基層黨組織擬推薦對象的公示

豐川大地
2026-04-03 23:08:56
比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺灣領(lǐng)導(dǎo)人,解放軍必定收臺

比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺灣領(lǐng)導(dǎo)人,解放軍必定收臺

共工之錨
2026-03-29 18:26:19
“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

樂趣紀(jì)史
2026-02-04 13:45:32
故事:白宮幕僚位置到手,特朗普御用風(fēng)水師,卻在關(guān)鍵時刻放棄了

故事:白宮幕僚位置到手,特朗普御用風(fēng)水師,卻在關(guān)鍵時刻放棄了

宅家伍菇?jīng)?/span>
2024-11-07 17:35:34
拒絕伊朗地面戰(zhàn)?陸軍參謀長被解職,特朗普需要軍方的“自己人”

拒絕伊朗地面戰(zhàn)?陸軍參謀長被解職,特朗普需要軍方的“自己人”

上觀新聞
2026-04-04 05:10:15
這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

潮鹿逐夢
2026-03-02 17:19:02
他是央視名嘴,北大外交系出身,隱婚女演員,妻子是我們熟悉的她

他是央視名嘴,北大外交系出身,隱婚女演員,妻子是我們熟悉的她

以茶帶書
2026-04-03 14:17:57
剛剛,中紀(jì)委通報!大學(xué)原黨委書記,接受審查調(diào)查

剛剛,中紀(jì)委通報!大學(xué)原黨委書記,接受審查調(diào)查

TOP大學(xué)來了
2026-04-03 22:09:25
粉紅外套下的乳白誘惑,這丈母娘美得讓人心慌?

粉紅外套下的乳白誘惑,這丈母娘美得讓人心慌?

娛樂領(lǐng)航家
2026-03-17 20:30:03
快評丨比贏球更讓人興奮的,是成都蓉城的進(jìn)步

快評丨比贏球更讓人興奮的,是成都蓉城的進(jìn)步

紅星新聞
2026-04-03 23:19:23
鄭麗文要簽署兩岸和平協(xié)議,蔣經(jīng)國后終于出現(xiàn)第二個推動統(tǒng)一的人

鄭麗文要簽署兩岸和平協(xié)議,蔣經(jīng)國后終于出現(xiàn)第二個推動統(tǒng)一的人

暮雪無痕
2026-02-03 08:52:46
瓜迪奧拉下家大爆冷!曼城離任后有望接手意大利國家隊?

瓜迪奧拉下家大爆冷!曼城離任后有望接手意大利國家隊?

夜白侃球
2026-04-03 09:04:39
突然發(fā)現(xiàn)一件事:凡是有公務(wù)員的家庭,父母都有這個軟實力

突然發(fā)現(xiàn)一件事:凡是有公務(wù)員的家庭,父母都有這個軟實力

風(fēng)流女漢
2026-03-04 02:10:00
喝了30天,眼睛亮得能看清遠(yuǎn)處站牌!這杯茶真管用

喝了30天,眼睛亮得能看清遠(yuǎn)處站牌!這杯茶真管用

笑飲孤鴻非
2026-04-02 07:18:00
91 輪轟炸過后:以色列陷入三重死局,伊朗求助中國

91 輪轟炸過后:以色列陷入三重死局,伊朗求助中國

起喜電影
2026-04-04 00:21:00
獨家評論:直接點名硬剛賴清德,鄭麗文四句話拆穿“臺獨”話術(shù)

獨家評論:直接點名硬剛賴清德,鄭麗文四句話拆穿“臺獨”話術(shù)

海峽導(dǎo)報社
2026-04-02 23:17:16
謝娜凌晨發(fā)文,拒絕承認(rèn)她主持水平差,流程問題是節(jié)目組調(diào)度安排

謝娜凌晨發(fā)文,拒絕承認(rèn)她主持水平差,流程問題是節(jié)目組調(diào)度安排

四斤
2026-04-03 12:11:35
董璇陪張維伊回鄉(xiāng)給公婆掃墓,本人又白又美又年輕,47看著像37

董璇陪張維伊回鄉(xiāng)給公婆掃墓,本人又白又美又年輕,47看著像37

觀察鑒娛
2026-04-03 14:12:16
虎跳峽“發(fā)瘋石”男子遺體打撈細(xì)節(jié):遺體離水面僅40厘米,卡在狹小石縫里,救援人員已摸到手腕并拴上繩,但怕遺體肢解不得不放手

虎跳峽“發(fā)瘋石”男子遺體打撈細(xì)節(jié):遺體離水面僅40厘米,卡在狹小石縫里,救援人員已摸到手腕并拴上繩,但怕遺體肢解不得不放手

大象新聞
2026-04-02 23:45:21
2026-04-04 05:48:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36723文章數(shù) 811983關(guān)注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

美國提議停火48小時 伊朗以持續(xù)重火力打擊回應(yīng)

頭條要聞

美國提議;48小時 伊朗以持續(xù)重火力打擊回應(yīng)

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長得很像嗎?

態(tài)度原創(chuàng)

本地
親子
教育
時尚
軍事航空

本地新聞

跟著歌聲游安徽,聽古村回響

親子要聞

5種高添加劑食品別給娃吃

教育要聞

教育部部署專項行動:義務(wù)教育嚴(yán)禁設(shè)立重點班

冬奧雙金夫妻:愛與榮耀,頂峰相見

軍事要聞

俄國防部:一架蘇-30戰(zhàn)機在克里米亞墜毀

無障礙瀏覽 進(jìn)入關(guān)懷版