国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中國AI模型是否已超越全球同行?斯坦福報告繪制中國開源AI全景圖

0
分享至

2025 年末,一份來自斯坦福大學人本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,簡稱 HAI)與 DigiChina 項目聯(lián)合發(fā)布了一項政策簡報,對中國開放權重 AI 模型的全球崛起這一在硅谷引發(fā)熱議卻鮮少被系統(tǒng)分析的話題進行了深入解讀。

這份題為《超越 DeepSeek:中國多元化的開放權重 AI 生態(tài)系統(tǒng)及其政策影響》的報告,發(fā)布于 12 月初,由 Caroline Meinhardt、Sabina Nong、Graham Webster 等五位研究者聯(lián)合撰寫。


圖丨相關報告(來源:HAI)

報告試圖厘清一個現(xiàn)實:當 DeepSeek 在今年 1 月以一款推理模型震驚全球投資者、讓英偉達市值單日蒸發(fā)近千億美元時,這家杭州初創(chuàng)公司并非中國 AI 領域的唯一選手。它只是一個更龐大、更多元生態(tài)系統(tǒng)的冰山一角。

從追趕到領跑

報告援引的多項數(shù)據(jù)指向一個明確結論:在開源大模型領域,中國已從追趕者變?yōu)轭I跑者。所謂開放權重,指的是模型的參數(shù)權重可供下載、使用和修改,開發(fā)者能夠在官方應用或 API 之外獨立運行這些模型,并根據(jù)自身需求進行調(diào)整。

根據(jù) Hugging Face 平臺的下載統(tǒng)計,阿里巴巴旗下的 Qwen(通義千問)模型系列在 2025 年 9 月正式超越 Meta 的 Llama,成為該平臺下載量最高的大語言模型家族。截至 12 月中旬,Qwen 累計下載量已達約 3.85 億次,而 Llama 約為 3.46 億次。另一組數(shù)據(jù)同樣值得關注:2024 年 8 月至 2025 年 8 月間,中國開發(fā)者的模型下載量占 Hugging Face 總下載量的 17.1%,首次超過美國的 15.8%。這組數(shù)據(jù)由麻省理工學院與 Hugging Face 聯(lián)合追蹤,經(jīng) ATOM 項目分析后公布。


圖丨開源模型的累積下載量(來源:HAI)

衍生模型的增長曲線更能說明問題。自 2025 年 1 月起,基于 Qwen 和 DeepSeek 的衍生模型上傳數(shù)量持續(xù)攀升,到 9 月份時,中國模型的衍生版本已占 Hugging Face 當月新增衍生模型的 63%。這意味著全球開發(fā)者社區(qū)正在以前所未有的速度圍繞中國模型構建應用生態(tài)。

報告重點剖析了四個具有代表性的中國模型家族。

Qwen 由阿里云開發(fā),定位于多語言和多模態(tài)能力最強的通用模型,支持 119 種語言,采用 Apache 2.0 許可證開源;DeepSeek-R1 以推理能力見長,在數(shù)學和復雜問題求解方面表現(xiàn)突出,同時也提供了多個蒸餾版本供資源受限的開發(fā)者使用;月之暗面(Moonshot AI)的 Kimi K2 聚焦于代碼生成和智能體任務,強調(diào)快速推理;智譜 AI(現(xiàn)更名為 Z.ai)的 GLM-4.5 則走均衡路線,通過多專家訓練整合推理、編程和視覺能力。


(來源:HAI)

芯片受限下的效率優(yōu)先策略

從技術架構看,這些模型普遍采用了混合專家(Mixture of Experts,MoE)架構。MoE 的核心優(yōu)勢在于效率,它能讓模型在有限的計算資源下獲得更好的性能,訓練和推理速度都更快。這并非巧合。

由于美國自 2022 年起對先進 AI 芯片實施出口管制,中國開發(fā)者被迫在算力受限的條件下尋找替代方案。DeepSeek 在 2024 年底和 2025 年初發(fā)布的模型,正是 MoE 架構的標桿應用。以 DeepSeek-V3 為例,雖然總參數(shù)量高達 6,710 億,但單次推理僅激活 370 億參數(shù),既保證了性能,又大幅降低了運行成本。

另一個值得關注的轉變是許可證條款的自由化。

2024 年發(fā)布的 Qwen 2.5 曾對最小和最大規(guī)格的模型施加了研究用途限制,同期的 DeepSeek V3 也限制了商業(yè)使用和再分發(fā)。但到了 2025 年,Qwen3 和 DeepSeek R1 全部采用了最寬松的開源許可證,前者是 Apache 2.0,后者是 MIT License。這種轉變的背后,既有吸引全球開發(fā)者社區(qū)的商業(yè)考量,也有中國開發(fā)者希望借開放姿態(tài)在國際 AI 圈建立學術信譽的訴求。

有意思的是,這場開放潮流甚至影響了此前堅持閉源路線的玩家。百度 CEO 李彥宏曾是中國科技圈里最堅定的閉源擁躉,他多次公開強調(diào)私有模型的商業(yè)優(yōu)勢。然而到了 2025 年 6 月,百度還是向市場妥協(xié),將旗艦產(chǎn)品文心一言(ERNIE)4.5 以開放權重形式發(fā)布。用李彥宏自己的話說:“當模型開源時,人們出于好奇自然想嘗試一下?!?/p>

政策支持與商業(yè)模式

報告作者們特別指出,中國官方在開放權重 AI 發(fā)展中扮演的角色復雜而微妙。頂層設計的支持確實存在:早在 2017 年的《新一代人工智能發(fā)展規(guī)劃》中,“開源”和“開放”就被明確列為推動國家創(chuàng)新戰(zhàn)略的關鍵詞匯。

2023 年 10 月發(fā)布的《全球人工智能治理倡議》和 2025 年 7 月發(fā)布的《全球人工智能治理行動計劃》,則將開源 AI 提升至國際話語權爭奪的高度,強調(diào)“平等的 AI 發(fā)展和使用權”,與美國的出口管制形成對比。

但報告同時也提醒讀者警惕過度簡化。DeepSeek 的成功似乎與政府扶持關系不大,這家公司脫胎于私募量化基金幻方,直到 V3 發(fā)布引發(fā)廣泛關注后,其創(chuàng)始人梁文鋒才進入更廣泛的公眾視野。

換句話說,中國開放權重 AI 的繁榮更多是市場競爭、人才積累和工程文化共同作用的結果,而非自上而下的規(guī)劃產(chǎn)物。

當然,政府的角色也并非完全缺席。地方政府正在為參與開源社區(qū)的 AI 組織和項目提供定向財政支持;學術機構被鼓勵將開源貢獻納入科研績效考核;算力基礎設施的建設也得到了國家層面的資源傾斜。據(jù)不完全統(tǒng)計,已有不少地方公共服務部門將 DeepSeek 模型的本地化版本集成到相關系統(tǒng)中,這些系統(tǒng)通常由數(shù)據(jù)管理部門與技術伙伴負責部署和微調(diào)。

從商業(yè)模式角度看,中國開放權重模型開發(fā)者正在探索多元化的變現(xiàn)路徑,但長期的規(guī)?;瘍冬F(xiàn)與可持續(xù)性仍有待市場檢驗。

阿里巴巴作為云服務提供商,將 Qwen 定位為“AI 操作系統(tǒng)”,試圖通過企業(yè)和政府客戶對模型的采用帶動云計算業(yè)務增長,HP、阿斯利康據(jù)稱已成為其客戶。新加坡國家 AI 計劃選擇基于 Qwen3 構建旗艦模型,可能為阿里云帶來東南亞市場的商業(yè)流量。

DeepSeek 和智譜則走輕資產(chǎn)路線,沒有自建大規(guī)模云基礎設施,而是采取協(xié)作部署策略,為不同云和算力提供商的客戶提供本地化服務。總體而言,與西方同行類似,中國開發(fā)者目前仍依賴間接變現(xiàn):通過廣泛采用的開放模型培育用戶基礎,再將其引導至付費產(chǎn)品和服務。

老調(diào)子還沒唱完

報告最后用相當篇幅討論了政策影響,歸納為四個維度:全球獲取與依賴性、AI 治理、AI 安全、地緣政治競爭,毫無疑問的又是美國智庫討論中國技術議題時的標準模板。

關于技術獲取,報告指出高性能中國模型的廣泛可用,為資源有限的低收入和中等收入國家提供了獲取先進 AI 能力的新路徑。當模型性能趨同于前沿水平時,這些國家的采用者可能更看重負擔得起、穩(wěn)定可靠的服務,而非追逐最高基準分數(shù)。

中國模型“夠好用”、許可證寬松、使用成本低,恰好契合這一需求。這一邏輯在發(fā)達國家同樣適用:Airbnb CEO Brian Chesky 在 11 月透露,公司傾向于使用 Qwen 而非 ChatGPT 為客服聊天機器人供電,原因很簡單:“又快又便宜”。

治理和安全維度則再次搬出了那些熟悉的論調(diào)。報告聲稱使用中國模型可能“繼承內(nèi)置的內(nèi)容審查邏輯”,數(shù)據(jù)“可能物理傳輸至中國”,面臨“被政府或商業(yè)競爭對手獲取的風險”。在安全層面,報告引用美國政府 AI 測試中心 CAISI 的評估稱 DeepSeek 模型被越獄攻擊突破的概率是美國同類模型的 12 倍。

最后一個維度依舊是地緣政治競爭。DeepSeek R1 的發(fā)布直接改變了美國對開放權重 AI 的政策態(tài)度。特朗普總統(tǒng)稱其為“警醒時刻”,白宮 AI 事務負責人 David Sacks 則將其作為推行聯(lián)邦層面 AI 去監(jiān)管政策的依據(jù)。

2025 年 7 月,白宮發(fā)布《美國 AI 行動計劃》,將開放權重模型提升為戰(zhàn)略資產(chǎn),同時強調(diào)加強對中國等對手的出口管制。一個月后,OpenAI 時隔近六年首次發(fā)布開放權重模型,采用 Apache 2.0 許可證——Sam Altman 在與記者的晚餐中坦承,中國開源模型的競爭是促使他們做出這一決定的重要因素:“如果我們不這么做,世界將主要建立在中國開源模型之上。這確實是我們決策中的一個重要考量?!?/p>

當然,盡管這份報告離不開這些模板化的框架,但其價值仍在于它提供了一個相對完整的圖景:中國開放權重 AI 生態(tài)系統(tǒng)的參與者多元,包括 DeepSeek、阿里巴巴這樣的明星,也包括智譜、月之暗面、百川、零一萬物等一眾“小巨頭”,以及北京智源人工智能研究院這樣的非營利機構;它們的技術路線各有側重,許可證策略趨向寬松,商業(yè)模式仍在摸索;政府支持確實存在,但并非唯一驅動力;全球擴散已成事實,政策影響正在顯現(xiàn)。

對于那些仍將 DeepSeek 視為“中國 AI 的全部故事”的觀察者而言,這份報告是一次必要的校準。而對于那些試圖以簡單的“趕超”或“落后”敘事框定中美 AI 競爭的人來說,它提供了更多需要消化的復雜性:當模型能力差距縮小,真正的競爭會越來越像生態(tài)競爭、工程競爭、成本競爭與合規(guī)競爭疊加的系統(tǒng)戰(zhàn)。把這些變量看清楚,才更接近“中文模型是否超越全球同行”這個問題在產(chǎn)業(yè)層面的真實答案。

參考資料:

1.https://hai.stanford.edu/policy/beyond-deepseek-chinas-diverse-open-weight-ai-ecosystem-and-its-policy-implications

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全網(wǎng)嘲諷“丈夫因一臺電腦想離婚”事件:這種父母禍害了多少孩子

全網(wǎng)嘲諷“丈夫因一臺電腦想離婚”事件:這種父母禍害了多少孩子

凡知
2026-01-02 09:10:36
“最快女護士”張水華宣布辭職,此前因虛假調(diào)休等受處分 丈夫:我們很累也很忙

“最快女護士”張水華宣布辭職,此前因虛假調(diào)休等受處分 丈夫:我們很累也很忙

紅星新聞
2026-01-02 22:56:20
美軍悍然侵入,馬杜羅已被抓!多國發(fā)聲,中國對委投資打水漂?

美軍悍然侵入,馬杜羅已被抓!多國發(fā)聲,中國對委投資打水漂?

博覽歷史
2026-01-03 19:14:52
陳紅與何晴30年前合影曝光:一顰一笑透著絕代風華,瓊瑤眼光絕了

陳紅與何晴30年前合影曝光:一顰一笑透著絕代風華,瓊瑤眼光絕了

小徐講八卦
2026-01-04 08:15:26
女王:一種關于清醒的隱喻

女王:一種關于清醒的隱喻

疾跑的小蝸牛
2026-01-03 15:15:36
一把輸光3億元!躲過兩次調(diào)查的山西前首富,這次終于逃不掉了

一把輸光3億元!躲過兩次調(diào)查的山西前首富,這次終于逃不掉了

夢史
2026-01-03 14:20:10
5名美國人被抓

5名美國人被抓

陸棄
2026-01-03 11:09:20
字節(jié)跳動2025年營收預計1860億美元,逼近Meta成互聯(lián)網(wǎng)新巨頭

字節(jié)跳動2025年營收預計1860億美元,逼近Meta成互聯(lián)網(wǎng)新巨頭

呼呼歷史論
2026-01-03 08:26:44
特朗普讓委內(nèi)瑞拉一夜變天,中國接下來的態(tài)度至關重要

特朗普讓委內(nèi)瑞拉一夜變天,中國接下來的態(tài)度至關重要

觸摸史跡
2026-01-03 21:20:44
陳超臨死前喊“上面是誰“被打斷,31年后徐湖平父子局浮出水面

陳超臨死前喊“上面是誰“被打斷,31年后徐湖平父子局浮出水面

娛樂洞察點點
2026-01-04 03:26:48
A股:周末突發(fā)3大核彈級利好利空!下周一很可能迎更大級別大行情?

A股:周末突發(fā)3大核彈級利好利空!下周一很可能迎更大級別大行情?

股市皆大事
2026-01-04 09:23:34
馬德興:王鈺棟在U23國足與吉爾吉斯的比賽中打進65米外吊射

馬德興:王鈺棟在U23國足與吉爾吉斯的比賽中打進65米外吊射

懂球帝
2026-01-04 11:53:14
特朗普下令抓走馬杜羅,梅德韋杰夫表態(tài):只有核武庫才能保證安全

特朗普下令抓走馬杜羅,梅德韋杰夫表態(tài):只有核武庫才能保證安全

戰(zhàn)域筆墨
2026-01-04 11:23:20
美國后花園是南美,俄羅斯的后花園是中亞,中國的后花園是哪里?

美國后花園是南美,俄羅斯的后花園是中亞,中國的后花園是哪里?

策前論
2025-11-07 16:21:32
俄外交部:委內(nèi)瑞拉副總統(tǒng)在俄境內(nèi)是假新聞

俄外交部:委內(nèi)瑞拉副總統(tǒng)在俄境內(nèi)是假新聞

新華社
2026-01-04 10:44:25
委內(nèi)瑞拉馬杜羅事件,對中國軍售的挑戰(zhàn)!

委內(nèi)瑞拉馬杜羅事件,對中國軍售的挑戰(zhàn)!

文雅筆墨
2026-01-04 11:14:05
特朗普登機訪華前,美方先通告全球,中國已經(jīng)買了800萬噸大豆

特朗普登機訪華前,美方先通告全球,中國已經(jīng)買了800萬噸大豆

花花娛界
2026-01-03 20:17:18
美媒總算看明白:中國這哪是買石油,分明是在給俄進行“大換血”

美媒總算看明白:中國這哪是買石油,分明是在給俄進行“大換血”

墨印齋
2026-01-02 20:47:40
特朗普發(fā)布觀看美對委行動照片

特朗普發(fā)布觀看美對委行動照片

財聯(lián)社
2026-01-04 05:14:16
“抓走”馬杜羅后,特朗普又威脅上這位總統(tǒng)了

“抓走”馬杜羅后,特朗普又威脅上這位總統(tǒng)了

環(huán)球時報國際
2026-01-04 11:59:28
2026-01-04 12:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16072文章數(shù) 514446關注度
往期回顧 全部

科技要聞

雷軍:罵小米汽車有流量,但別故意抹黑

頭條要聞

男子在村口畫"天安門"墻繪爆火:因英語5考央美均落榜

頭條要聞

男子在村口畫"天安門"墻繪爆火:因英語5考央美均落榜

體育要聞

離開中超后,他成了足壇“倒鉤之王”

娛樂要聞

謝玲玲為101歲林老太慶生,四代同堂

財經(jīng)要聞

委內(nèi)瑞拉華商親歷:顧客排隊買生活物資

汽車要聞

最高續(xù)航310km 嵐圖泰山8或將上半年發(fā)布

態(tài)度原創(chuàng)

本地
手機
房產(chǎn)
數(shù)碼
公開課

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

手機要聞

小迭代旗艦工程機影像配置曝光:3X±光學變焦、200Mp主攝

房產(chǎn)要聞

單盤最高狂賣64億!海南樓市2025年最全榜單發(fā)布!

數(shù)碼要聞

華擎帶來SL-P白金ATX電源:全日系電容,Cybenetics A靜音

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版