国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Byte for Byte,谷歌開源最強模型Gemma 4 殺入手機端

0
分享至


北京時間2026年4月3日凌晨,Google DeepMind正式發(fā)布新一代開放模型系列——Gemma 4。官方博客標題寫:“Byte for byte, the most capable open models”——逐字節(jié)衡量,這是迄今為止最強悍的開源模型。

據(jù)官方發(fā)布的博客,在Arena AI文本排行榜上,Gemma 4的31B Dense模型以307億參數(shù)規(guī)模登上開源模型全球第三,26B A4B MoE模型位居第六,后者推理時僅激活38億參數(shù),卻擊敗了參數(shù)量數(shù)百億乃至數(shù)千億級別的競品。

當整個行業(yè)還在為大模型“越大越好”的軍備競賽焦慮時,谷歌選擇用工程效率與推理密度的極致優(yōu)化,給出了一條截然不同的技術(shù)路徑。

四款模型,四個戰(zhàn)場

Gemma 4此次一口氣釋放了四個規(guī)格,覆蓋了從端側(cè)嵌入式設(shè)備到本地開發(fā)工作站的完整算力梯度:


從關(guān)鍵技術(shù)數(shù)據(jù)看,26B A4B MoE模型推理時僅激活38億參數(shù)(總參252億),卻在Arena AI排行榜擊敗了多款參數(shù)量達數(shù)百億甚至數(shù)千億級別的競品,包括通義千問Qwen3-235B(2350億)和Meta Llama-3.1-405B(4050億)等。31B Dense未量化版本可在單張80GB NVIDIA H100上運行,量化后可部署于消費級GPU。

邊緣模型E2B/E4B支持原生音頻輸入,可進行語音識別與理解。全系列模型均原生支持視頻與圖像處理,支持可變分辨率輸入。

這一產(chǎn)品矩陣的邏輯在于:小模型打“無處不在”,大模型打“無處不在的前沿智能”。

E2B和E4B被谷歌定義為核心戰(zhàn)略——“移動優(yōu)先AI”(mobile-first AI),專為數(shù)十億Android設(shè)備及物聯(lián)網(wǎng)終端設(shè)計;26B和31B則瞄準本地開發(fā)、IDE輔助和Agent工作流。

與Gemini 3同源的技術(shù)底座

一個容易被忽略但至關(guān)重要的信息是:Gemma 4基于與閉源旗艦?zāi)P虶emini 3相同的研究成果與技術(shù)架構(gòu)構(gòu)建。這意味著,開源社區(qū)獲得了與谷歌內(nèi)部頂級閉源模型處于同一技術(shù)世代的推理能力。

這種“開源共享底層技術(shù)”的做法,在Gemma系列中一直延續(xù),但在第四代上更進一步。Gemma 4在以下能力維度上實現(xiàn)提升:

? 高級推理(Advanced Reasoning):支持多步規(guī)劃與深度邏輯鏈,在數(shù)學(xué)和指令遵循基準測試上表現(xiàn)顯著提升,不再止步于簡單對話,而是能夠處理復(fù)雜邏輯與Agent工作流。

? Agentic工作流原生支持:內(nèi)置函數(shù)調(diào)用(function-calling)、結(jié)構(gòu)化JSON輸出、原生系統(tǒng)指令,使開發(fā)者能夠直接構(gòu)建自主智能體,與外部工具和API可靠交互并執(zhí)行完整工作流。

? 高質(zhì)量離線代碼生成:將本地工作站轉(zhuǎn)變?yōu)楸镜貎?yōu)先的AI編程助手。

? 多模態(tài)原生:全部模型原生處理視頻和圖像,支持可變分辨率輸入,在OCR和圖表理解等視覺任務(wù)上表現(xiàn)突出。E2B和E4B還支持原生音頻輸入。

? 超長上下文:邊緣模型支持128K上下文窗口,大模型最高支持256K,可在單次提示中處理代碼倉庫或長篇文檔。

? 140+語言原生訓(xùn)練:原生支持超過140種語言,覆蓋全球用戶群體。

Gemma 4的另一層重大信號,在于其許可證選擇——Apache 2.0。

此前Gemma系列采用的條件性許可協(xié)議曾引發(fā)社區(qū)持續(xù)爭論。此次轉(zhuǎn)向Apache 2.0——業(yè)界最寬松、對商業(yè)用途最友好的開源許可證之一——意味著開發(fā)者獲得了完全的數(shù)據(jù)主權(quán)、基礎(chǔ)設(shè)施控制權(quán)和模型控制權(quán),可在本地或云端自由構(gòu)建和部署。

“Gemma 4以Apache 2.0許可證發(fā)布是一個巨大的里程碑。我們非常激動能在發(fā)布首日就在Hugging Face上支持Gemma 4家族?!?strong>Clément Delangue,Hugging Face聯(lián)合創(chuàng)始人兼CEO表示。

谷歌官方在博文中明確表示,這一變化直接回應(yīng)了開發(fā)者社區(qū)的反饋:“構(gòu)建AI的未來需要協(xié)作方式,我們相信在不設(shè)限制性障礙的情況下賦能開發(fā)者生態(tài)系統(tǒng)。”

或許,對谷歌來說,許可證變更意味著一次戰(zhàn)略定位的調(diào)整。當Meta的Llama系列已經(jīng)以寬松許可占據(jù)開源生態(tài)心智時,谷歌如果繼續(xù)在許可條款上設(shè)限,只會加速開發(fā)者向競品生態(tài)遷移。Apache 2.0是參與開源競爭的“入場券”,而非“加分項”。

從邊緣到云端:端側(cè)AI的“填滿”攻勢

Gemma 4最值得產(chǎn)業(yè)界關(guān)注的戰(zhàn)略動作,可能是其邊緣側(cè)布局。

E2B和E4B從底層為計算與內(nèi)存效率而設(shè)計,推理時僅分別激活20億和40億參數(shù),以保護設(shè)備的RAM和電池壽命。谷歌Pixel團隊與高通(Qualcomm)、聯(lián)發(fā)科(MediaTek)深度合作,使這些多模態(tài)模型能在手機、樹莓派、NVIDIA Jetson Orin Nano等設(shè)備上完全離線運行,且延遲接近于零。

端側(cè)生態(tài)整合要點:

? Android開發(fā)者可通過AICore Developer Preview進行Agent流程原型設(shè)計,與未來的Gemini Nano 4保持向前兼容。 ? Android Studio中可驅(qū)動Agent Mode進行應(yīng)用開發(fā)。 ? ML Kit GenAI Prompt API支持生產(chǎn)級Android應(yīng)用構(gòu)建。 ? Google AI Edge Gallery提供E4B和E2B的即時體驗入口。

這釋放了一個明確的信號:谷歌正在將端側(cè)AI從“實驗品”推向“基礎(chǔ)設(shè)施”。當4B參數(shù)級別模型能夠在手機端實現(xiàn)多模態(tài)推理、OCR、語音識別,且完全離線運行,“云端依賴”便不再是AI能力的必要前提。結(jié)合256K上下文窗口的處理能力,“長文檔本地分析”“離線代碼審查”等場景將從概念走向日常。

在發(fā)布首日,Gemma 4就獲得了主流AI工具鏈的全面支持,這在開源模型發(fā)布史上并不多見:


從Hugging Face到NVIDIA NIM,從Apple MLX到AMD ROCm,從Docker到Google Cloud——Gemma 4的部署路徑覆蓋了消費級硬件、企業(yè)級基礎(chǔ)設(shè)施和三大云平臺。值得注意的是,谷歌還提供了Kaggle上的“Gemma 4 Good Challenge”競賽,鼓勵開發(fā)者利用該模型構(gòu)建有社會影響力的應(yīng)用,延續(xù)Gemma系列的社區(qū)運營傳統(tǒng)。

自第一代發(fā)布以來,Gemma系列累計下載量已超過4億次,衍生變體超過10萬個。Apache 2.0許可之下,這一生態(tài)有望在第四代上實現(xiàn)更大幅度的擴張。

開源模型進入“效率競賽”階段

Gemma 4的發(fā)布,使開源大模型競爭進入了一個新階段——“效率競賽”取代“規(guī)模競賽”成為核心敘事。

當26B A4B MoE模型能以38億激活參數(shù)擊敗參數(shù)量數(shù)百倍的競品,“參數(shù)效率”(intelligence-per-parameter)成為衡量開源模型價值的新標尺。這不僅是工程能力的體現(xiàn),更是商業(yè)策略的選擇:在消費級硬件上實現(xiàn)前沿推理能力,意味著更低的部署成本、更快的推理速度、更廣泛的適用場景。

與閉源模型不同,開源模型的競爭邏輯天然是多維的——許可證寬松度、硬件適配廣度、社區(qū)生態(tài)活躍度、微調(diào)友好度,每一項都可能成為決定勝負的關(guān)鍵變量。Gemma 4在Apache 2.0許可、四規(guī)格矩陣、140+語言覆蓋、首日工具鏈全支持上的組合拳,顯然是經(jīng)過精密計算的戰(zhàn)略布局。

對于中國開發(fā)者而言,Gemma 4的256K上下文窗口和原生中文支持(140+語言包含中文),配合Apache 2.0的完全自由部署權(quán),意味著在國內(nèi)合規(guī)框架下也有本地化落地的技術(shù)空間。

Gemma 4的發(fā)布不是一次簡單的模型更新,而是開源AI領(lǐng)域的一次結(jié)構(gòu)性位移。當端側(cè)4B參數(shù)模型能夠處理多模態(tài)、語音、長上下文任務(wù),當307億參數(shù)模型可以在單張H100上運行且躋身開源排行榜前三,“本地AI”與“云端AI”的能力邊界正在被重新定義。

谷歌選擇了同時開放所有模型權(quán)重、擁抱Apache 2.0、覆蓋從手機到云端的全硬件?!@種“全棧開源”策略,既是對Meta Llama系列和Mistral等開源競品的正面回應(yīng),也是對“閉源才能維持技術(shù)壁壘”這一傳統(tǒng)認知的直接挑戰(zhàn)。

開源模型的下一個臨界點,或許不再是“誰參數(shù)更大”,而是“誰在更小的體積內(nèi)裝進了更多的智能”。Gemma 4給出的答案,至少在今天是:byte for byte,它是目前最強的。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
香港知名女星暴瘦成紙片人!被傳因拜狐仙,成為一代性感女神

香港知名女星暴瘦成紙片人!被傳因拜狐仙,成為一代性感女神

仙味少女心
2026-03-11 18:58:41
蘋果被點名!醫(yī)生提醒:高血壓患者常吃蘋果,很快或迎來這5后果

蘋果被點名!醫(yī)生提醒:高血壓患者常吃蘋果,很快或迎來這5后果

白宸侃片
2026-04-03 18:43:18
今天又跌麻了?別慌,你丟掉的籌碼,未來都會變成錯過的遺憾

今天又跌麻了?別慌,你丟掉的籌碼,未來都會變成錯過的遺憾

徐sir財經(jīng)
2026-04-03 15:33:25
事態(tài)嚴重了!中方接到日媒消息,日本遠導(dǎo)鎖定東海,俄已選邊站

事態(tài)嚴重了!中方接到日媒消息,日本遠導(dǎo)鎖定東海,俄已選邊站

策略述
2026-04-02 18:20:07
不打伊朗了?特朗普通告全世界,戰(zhàn)爭費由22國承擔,朝鮮發(fā)出警告

不打伊朗了?特朗普通告全世界,戰(zhàn)爭費由22國承擔,朝鮮發(fā)出警告

聊歷史的阿稼
2026-04-01 09:54:30
專家警告:每天吃一個西紅柿,就等于給血管“上鎖”?真相來了

專家警告:每天吃一個西紅柿,就等于給血管“上鎖”?真相來了

荊醫(yī)生科普
2026-04-03 13:33:34
央視點名!成本僅20元售價899元,暴利近40倍,網(wǎng)友:就是智商稅

央視點名!成本僅20元售價899元,暴利近40倍,網(wǎng)友:就是智商稅

北緯的咖啡豆
2026-04-02 17:16:49
伊朗外長:霍爾木茲海峽“完全開放” 僅對參與對伊朗戰(zhàn)爭的各方關(guān)閉

伊朗外長:霍爾木茲海峽“完全開放” 僅對參與對伊朗戰(zhàn)爭的各方關(guān)閉

財聯(lián)社
2026-04-01 02:16:06
你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
醫(yī)生:這6種癌癥幾乎不影響壽命,確診后別慌,合理治療即可!

醫(yī)生:這6種癌癥幾乎不影響壽命,確診后別慌,合理治療即可!

健康之光
2026-04-03 16:15:03
一嫁前國足謝輝,二嫁普信男,44歲2次離婚的佟晨潔才是人間清醒

一嫁前國足謝輝,二嫁普信男,44歲2次離婚的佟晨潔才是人間清醒

白面書誏
2026-04-02 19:20:05
張雪820RR供應(yīng)鏈國產(chǎn)化清單曝光:華為助力車機互聯(lián)

張雪820RR供應(yīng)鏈國產(chǎn)化清單曝光:華為助力車機互聯(lián)

CNMO科技
2026-04-03 16:26:05
小姑子給我女兒大紅包,我轉(zhuǎn)她兩萬,紅包打開一看:全是優(yōu)惠券!

小姑子給我女兒大紅包,我轉(zhuǎn)她兩萬,紅包打開一看:全是優(yōu)惠券!

壞故事集
2026-03-31 10:48:50
優(yōu)思益暴雷后董宇輝惹上麻煩,網(wǎng)友曬訂單要求假一賠十

優(yōu)思益暴雷后董宇輝惹上麻煩,網(wǎng)友曬訂單要求假一賠十

映射生活的身影
2026-04-01 23:26:28
俄議員警告:如果以色列對伊朗使用核武器,擁核國家不再只有9個

俄議員警告:如果以色列對伊朗使用核武器,擁核國家不再只有9個

小蘭聊歷史
2026-04-03 19:13:07
歷史老師跌入“無人區(qū)”:某高中20人教研組,近一半無學(xué)生可教

歷史老師跌入“無人區(qū)”:某高中20人教研組,近一半無學(xué)生可教

聽心堂
2026-03-31 15:52:04
這是迄今為止,我見過最美的女人,不接受反駁

這是迄今為止,我見過最美的女人,不接受反駁

草莓解說體育
2026-04-03 15:08:02
再炸伊朗核心高官,以色列已斬60人,伊朗為何連個尉官都殺不掉?

再炸伊朗核心高官,以色列已斬60人,伊朗為何連個尉官都殺不掉?

阿芒娛樂說
2026-04-03 19:40:48
皇馬贏麻了?歐超大結(jié)局:皇馬單挑全歐洲800隊

皇馬贏麻了?歐超大結(jié)局:皇馬單挑全歐洲800隊

仰臥撐FTUer
2026-04-03 05:40:03
脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

丹妮觀
2026-04-02 14:43:02
2026-04-03 21:11:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
131782文章數(shù) 862052關(guān)注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

石破茂公開評價特朗普:他好面子 喜歡被奉承

頭條要聞

石破茂公開評價特朗普:他好面子 喜歡被奉承

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當爸?否認婚內(nèi)出軌

財經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎?

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
健康
游戲
軍事航空

藝術(shù)要聞

吳昌碩『扇畫』老辣古拙

房產(chǎn)要聞

小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

干細胞抗衰4大誤區(qū),90%的人都中招

國產(chǎn)大作《湮滅之潮》外媒專訪 虛幻5重塑亞瑟王傳奇

軍事要聞

俄國防部:一架蘇-30戰(zhàn)機在克里米亞墜毀

無障礙瀏覽 進入關(guān)懷版