国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)大模型霸榜前10,誰是最強開源王者?

0
分享至

見證歷史性的一刻,中國模型包攬全球知名AI開源社區(qū)Hugging Face大模型趨勢榜前十

該榜單排名綜合了近期訪問、下載、點贊、API(應(yīng)用程序接口)調(diào)用等數(shù)據(jù)。

近段時間以來,國產(chǎn)開源模型的發(fā)展態(tài)勢迎來了一波集中且迅猛的爆發(fā)期。騰訊混元、阿里Qwen、智譜GLM-4.5、月之暗面kimi-k2 一批國產(chǎn)開源大模型,如繁星般密集亮相。

在Hugging Face前10名的開源模型榜單中,全部都是中國的模型。智譜GLM-4.5登頂?shù)谝?/strong>,阿里Qwen一家獨霸5個席位,呈現(xiàn)霸榜形式。現(xiàn)在應(yīng)該是扎克伯格最傷心的時刻,Meta開源的大旗被我們搶走了。

放在全球大模型領(lǐng)域看,現(xiàn)在已經(jīng)形成中國開源領(lǐng)先,美國閉源大模型領(lǐng)先的分水嶺局面。盡管在最強大模型的排名中,GLM-4.5最高排名到第三,前二還是美國閉源模型保持,但我們已經(jīng)形成包圍之勢。

而且國產(chǎn)大模型,也呈現(xiàn)了一些核心優(yōu)勢:

1、模型采用統(tǒng)一MoE / 多任務(wù)稠密雙軌模式,不像國外稠密模型為主,混合專家模式往往能帶來靈活調(diào)用的優(yōu)勢。

類似 GLM-4.5總參數(shù) 3550 億,激活參數(shù)僅為320 億,把“大而不貴”寫進代碼里——同規(guī)模 Claude-4-Sonnet 的激活量估算接近 600-800 億,GLM-4.5 直接砍到一半以下。

2、國產(chǎn)大模型還呈現(xiàn)多尺寸全覆蓋的特點,1B → 480B 全精度/量化雙軌布局,端-邊-云全適用。以Qwen3 系列為例,已經(jīng)覆蓋30B-A3B, 110B, 235B-A22B, 480B-A35B等眾多尺寸,其中Qwen3-30B-A3B-int4 能在 RTX 4090 24G 單卡運行。

國外『不大不小』的模型基本是空白,大都是大力出奇跡的大模型,典型的就是Claude和Grok系列。

3、在DeepSeek率先打破的大模型價格市場中,國產(chǎn)大模型的API 與自建推理成本均低 50-90 %。智譜這次API 調(diào)用價格更低,輸入 0.8 元 / 百萬 tokens、輸出 2 元 / 百萬 tokens,直接把 Claude-4-Sonnet 的 21.5 元輸入、107.4 元輸出打到骨折——成本驟降 90% 以上。

換句話說,同樣 1000 萬字的長文本任務(wù),用 GLM-4.5 只需要 160 元,Claude-4-Sonnet 得掏 12890 元,省下的預(yù)算足夠再跑 80 次同樣規(guī)模的活兒。

盡管霸榜,但市場反饋才是最終標準。我們挑選了近期開源的代表—— 階躍星辰 Step 3、智譜 GLM-4.5、阿里 Qwen3-235B-A22B-2507以及騰訊Hunyuan等,從交互設(shè)計、內(nèi)容創(chuàng)作、邏輯推理、全棧開發(fā)、多模態(tài)生成五個維度進行測試。看看誰是真正的開源霸主。


1.交互設(shè)計:交互式日歷組件構(gòu)建

首先測試大模型在前端技術(shù)實現(xiàn)、系統(tǒng)架構(gòu)設(shè)計方面的深度。要求三種大模型生成一款功能全面的交互式日歷組件。

請設(shè)計并開發(fā)一個功能全面的交互式日歷組件,支持年月周日四種基礎(chǔ)視圖無縫切換;支持顯示 / 添加 / 編輯日程事件,不同類型事件可通過顏色區(qū)分。

階躍星辰 step 3

階躍星辰 step 3在交互設(shè)計上稍顯吃力,生成的功能完整性不足,距離實用有很大的進步空間。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507其次,完成基礎(chǔ)交互功能,但細節(jié)打磨有點粗糙。

智譜GLM-4.5

而最強的還是智譜GLM-4.5 ,不僅實現(xiàn)了全功能需求,更在色彩搭配的專業(yè)性、操作流暢度上都非常的好,而且還支持“實時預(yù)覽” ,為新手解決了 “寫了看不到效果” 的痛點。

三者對比之下,智譜 GLM-4.5 在交互設(shè)計的完整性、專業(yè)性與人性化細節(jié)上形成了明顯優(yōu)勢,Qwen3 系列基本滿足基礎(chǔ)需求,而階躍星辰 Step 3 則需在核心能力上實現(xiàn)更大突破。


2.內(nèi)容創(chuàng)作:專業(yè)求職簡歷生成

畢業(yè)季的大學(xué)生都需要投遞簡歷吧,簡歷的精美度和專業(yè)角度都非常能決定是否被錄用,鯨哥就讓三個大模型生成簡歷,看有沒有遵守STAR法則,以及評估模型對專業(yè)文檔內(nèi)容組織與視覺設(shè)計的理解能力。

請制作一份專業(yè)規(guī)范、亮點突出的求職簡歷,需兼顧內(nèi)容完整性與視覺專業(yè)性

階躍星辰 step 3

階躍星辰 Step 3 的輸出偏向基礎(chǔ)簡化,內(nèi)容框架較為單薄,在專業(yè)深度與細節(jié)上不足。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507生成內(nèi)容邏輯縝密、表述嚴謹,專業(yè)度足以支撐核心需求;不過預(yù)覽功能存在一處明顯短板 —— 雖然兼容 HTML、CSS、JavaScript 等格式,卻時常生成無法直接預(yù)覽的 JSX 文件,一定程度上影響了使用體驗的流暢性。

智譜GLM-4.5

而智譜GLM-4.5 設(shè)計上采用藍紫色漸變,信息層次清晰,不僅嚴格遵循 STAR 法則,還兼顧專業(yè)性與個性化。

綜合來看,智譜 GLM-4.5 和Qwen3-235B-A22B-2507 在內(nèi)容專業(yè)性與呈現(xiàn)精致度上都非常的完美,階躍星辰 Step 3 還需在內(nèi)容深度上實現(xiàn)突破。

3.邏輯推理:國際奧數(shù)難題求解

我們再拿出國際奧數(shù)題,考驗?zāi)P蛯Τ橄髷?shù)學(xué)概念的理解與創(chuàng)新性應(yīng)用能力,需大模型突破常規(guī)思維定式構(gòu)造性證明、反證法。

一位魔術(shù)師有一百張卡片,分別寫有數(shù)字 1到 100 。他把這一百張卡片放入三個盒子里,一個盒子是紅色的,一個是白色的,一個是藍色的。 每個盒子里至少都放入了一張卡片。 一位觀眾從三個盒子中挑出兩個,再從這兩個盒子里各選取一張卡片, 然后宣布這兩張卡片上的數(shù)字之和。知道這個和之后,魔術(shù)師便能夠指出哪一個是沒有從中選取卡片的盒子。 問共有多少種放卡片的方法,使得魔術(shù)總能夠成功?(兩種方法被認為是不同的,如果至少有一張卡片被放入不同顏色的盒子)

階躍星辰 step 3

階躍星辰 step 3回答:6種。家人們可以拿起筆和紙算一下,這個答案對嗎

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507回答:12種。

智譜GLM-4.5

智譜GLM-4.5回答:6種

階躍星辰 step 3和智譜GLM-4.5 都回答的是6種方法,但是正確答案是12種方法,只有Qwen3-235B-A22B-2507模型回答正確了。Qwen3-235B-A22B-2507模型在邏輯推理、數(shù)學(xué)、科學(xué)和編碼等任務(wù)上性能提升是非常顯著的。


4.全棧開發(fā):“賽博訂單可視化”應(yīng)用構(gòu)建

全棧開發(fā)的復(fù)雜度,主要在一次性需要完成多項要求,實現(xiàn)復(fù)雜的 前后端交互、CRUD操作、對應(yīng)用狀態(tài)、以及 UI 樣式的精確控制。

幫我開發(fā)一個賽博朋克風(fēng)格的訂單可視化網(wǎng)頁應(yīng)用,需包含「可視化大屏」和「后臺管理系統(tǒng)」兩個模塊,支持界面切換與數(shù)據(jù)實時聯(lián)動,要有交互設(shè)計感。

階躍星辰 step 3

階躍星辰 Step 3 有鮮明的視覺風(fēng)格,動感特效強烈,賽博氣息也很濃郁。不過,其特效數(shù)據(jù)目前尚無法實時動態(tài)修改。

Qwen3-235B-A22B-2507

相比之下,Qwen3-235B-A22B-2507 在呈現(xiàn)實時數(shù)據(jù)跳動方面表現(xiàn)卓越,效果極佳,科技感十足,并且支持一鍵部署,操作便捷。部署成功網(wǎng)站:https://chat.qwen.ai/s/deploy/ea703c46-1e76-422e-b2d9-08fdca9fc2b2

智譜GLM-4.5

而智譜 GLM-4.5 的設(shè)計初看簡潔干凈,似乎偏離了賽博主題。但鯨哥深入體驗后發(fā)現(xiàn),它設(shè)計了三種可切換模式。當切換到“賽博模式”時,其呈現(xiàn)的視覺沖擊力堪比《生化危機》的氛圍。

其交互設(shè)計和核心功能完備,更關(guān)鍵的是,它構(gòu)建了API接口,能夠高效完成訂單數(shù)據(jù)的增刪改查(CRUD)操作,同樣支持一鍵部署,真正實現(xiàn)了全棧式開發(fā)的便捷體驗。部署成功網(wǎng)站:https://c08fu6euyrd1-deploy.space.z.ai

5.多模態(tài)內(nèi)容生成:“兔子打卡北京”視頻生成

多模態(tài)內(nèi)容生成能力運用了自然語言理解、圖像生成、動畫渲染、音頻合成等技術(shù),同時需要大模型具有深度理解文本指令的能力。多模態(tài)的內(nèi)容生成,能降低創(chuàng)作者的視頻創(chuàng)作門檻。

生成兔子在北京各地打卡的vlog視頻,每個景點兔子會拍照打卡。需要打卡的景點北京天壇,故宮,長城,水立方,鳥巢,國家博物館,環(huán)球影城。每個景點的先生成打卡照片。視頻需有比較歡快中國化的配樂。

階躍星辰 step 3

階躍星辰 Step 3 生成的動畫里,一只呆呆的兔子靜立于故宮的雕花花壇之上,隨后是幾幀古建筑的動態(tài)剪影。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507生成的兔子手忙腳亂的拿著手機在打卡拍照,背景是一點都沒變,不過可以看出來背景上有故宮建筑和水立方等景點樣式。

騰訊Hunyuan

騰訊Hunyuan生成的視頻兔子在故宮里面,像擺件一樣在院子中間,不過這阿姨的回頭殺,嚇死鯨哥了。

這三款模型生成的短視頻均僅有 5 秒時長,動作設(shè)計也偏向簡單重復(fù),鯨哥認為若用于日常娛樂尚可,但若論專業(yè)創(chuàng)作則仍顯力不從心。

如果非要給這次測試體感排序的話GLM-4.5 當之無愧是第一,其次就是Qwen3-235B-A22B-2507,最后就是階躍星辰 step 3。

本次測評不僅是一場技術(shù)能力的橫向?qū)Ρ?,更是中國大模型生態(tài)蓬勃發(fā)展的縮影。

從智譜 GLM-4.5 的強勢登頂,到阿里 Qwen 等模型的多點開花,我們清晰地看到國產(chǎn)開源模型的強勁勢頭。

如果你也感興趣這些模型進化的實力,期待你的實測反應(yīng)與反饋。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
陳麗華百億遺產(chǎn)分配引熱議,曾透露會給孩子留,未提及遲重瑞

陳麗華百億遺產(chǎn)分配引熱議,曾透露會給孩子留,未提及遲重瑞

扒蝦侃娛
2026-04-07 16:10:24
時隔十年國民黨主席再訪大陸 鄭麗文今赴上海

時隔十年國民黨主席再訪大陸 鄭麗文今赴上海

參考消息
2026-04-07 09:56:06
豐田新款GR YARIS正式上市,40.28萬元起售

豐田新款GR YARIS正式上市,40.28萬元起售

界面新聞
2026-04-07 20:38:38
市委書記暗訪撞見民工被派出所長毆打,走近一看,被打者是他二叔

市委書記暗訪撞見民工被派出所長毆打,走近一看,被打者是他二叔

歷史八卦社
2024-08-21 18:13:16
趙麗穎久違“營業(yè)”!工作室曬高月香練舞舊照,粉絲:終于等到你

趙麗穎久違“營業(yè)”!工作室曬高月香練舞舊照,粉絲:終于等到你

草莓解說體育
2026-04-07 02:42:27
日媒:日本一老人在景點與女子發(fā)生爭執(zhí)啃咬對方手臂,被捕后短時間內(nèi)死亡,警方正調(diào)查死因

日媒:日本一老人在景點與女子發(fā)生爭執(zhí)啃咬對方手臂,被捕后短時間內(nèi)死亡,警方正調(diào)查死因

環(huán)球網(wǎng)資訊
2026-04-07 11:12:37
嗜血豬周期,前所未有

嗜血豬周期,前所未有

巨潮WAVE
2026-04-07 15:01:33
一隊一冠?英超七隊,可能瓜分七個冠軍

一隊一冠?英超七隊,可能瓜分七個冠軍

嗨皮看球
2026-04-07 17:45:44
陳某某(女,45歲)駕車意外墜河,5人死亡,警方通報

陳某某(女,45歲)駕車意外墜河,5人死亡,警方通報

南方都市報
2026-04-07 19:26:07
Shams:庫里傷病多次反復(fù)醫(yī)生建議賽季報銷 但他堅持復(fù)出

Shams:庫里傷病多次反復(fù)醫(yī)生建議賽季報銷 但他堅持復(fù)出

北青網(wǎng)-北京青年報
2026-04-07 19:34:04
油價再上漲 92號汽油逼近9元/升 調(diào)控措施少漲0.31元/升

油價再上漲 92號汽油逼近9元/升 調(diào)控措施少漲0.31元/升

太平洋汽車
2026-04-07 17:39:36
中東突發(fā)!剛剛,大逆轉(zhuǎn)!

中東突發(fā)!剛剛,大逆轉(zhuǎn)!

中國基金報
2026-04-07 19:04:25
張雪母親改嫁后成為作家!回應(yīng):張雪騎車撞人我賠3萬 借給他55萬

張雪母親改嫁后成為作家!回應(yīng):張雪騎車撞人我賠3萬 借給他55萬

念洲
2026-04-07 09:37:27
北京明天最高氣溫21℃,傍晚至后天有降水,請注意防范

北京明天最高氣溫21℃,傍晚至后天有降水,請注意防范

北青網(wǎng)-北京青年報
2026-04-07 20:42:06
35億美金的“分手費”!巴基斯坦硬剛阿聯(lián)酋,寧可國庫清空還債

35億美金的“分手費”!巴基斯坦硬剛阿聯(lián)酋,寧可國庫清空還債

孤芳自賞的小李
2026-04-07 04:15:26
伊朗背后三個神秘力量開始浮出水面,美國一個也對付不了

伊朗背后三個神秘力量開始浮出水面,美國一個也對付不了

揭秘歷史的真相
2026-04-05 20:57:15
四川一戶人家火了,僅樓道一鞋柜就被無數(shù)人效仿,那叫一個高級

四川一戶人家火了,僅樓道一鞋柜就被無數(shù)人效仿,那叫一個高級

科學(xué)發(fā)掘
2026-04-07 20:12:56
大陸給高規(guī)格禮遇,鄭麗文接下鮮花,坐高鐵到南京前,她喊出12字

大陸給高規(guī)格禮遇,鄭麗文接下鮮花,坐高鐵到南京前,她喊出12字

林子說事
2026-04-07 19:10:21
鄭麗文來南京,老板:鴨四件別錯過!馬英九王力宏都吃這口金陵味

鄭麗文來南京,老板:鴨四件別錯過!馬英九王力宏都吃這口金陵味

馬蹄燙嘴說美食
2026-04-07 20:23:30
張本智和死死盯著世界杯!告誡松島輝空:多打王楚欽 就知道怕了

張本智和死死盯著世界杯!告誡松島輝空:多打王楚欽 就知道怕了

念洲
2026-04-07 09:38:23
2026-04-07 23:08:49
鯨選AI incentive-icons
鯨選AI
最新AI產(chǎn)品化與商業(yè)化案例速遞
146文章數(shù) 36關(guān)注度
往期回顧 全部

科技要聞

滿嘴謊言!OpenAI奧特曼黑料大起底

頭條要聞

特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

頭條要聞

特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

體育要聞

官宣簽約“AI球員”,這支球隊被罵慘了...

娛樂要聞

女首富陳麗華離世 被曝生前已分好遺產(chǎn)

財經(jīng)要聞

10萬億財政轉(zhuǎn)移支付,被誰拿走了?

汽車要聞

不止是大 極狐首款MPV問道V9靜態(tài)體驗

態(tài)度原創(chuàng)

藝術(shù)
時尚
游戲
教育
家居

藝術(shù)要聞

美麗風(fēng)光看不盡

還是這些穿搭適合初春季節(jié)!外套不多買、常穿裙子,優(yōu)雅舒適

重磅!寶可夢系列最新作本周登陸Switch平臺 正式開玩

教育要聞

第一個「寫進政府工作報告」的春假,研學(xué)賽道加速分化

家居要聞

雅致愜意 感知生活之美

無障礙瀏覽 進入關(guān)懷版