国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“集市”的終結(jié)?當(dāng)開源AI只剩下載:一項(xiàng)280萬個倉庫的實(shí)證研究揭示了什么

0
分享至

當(dāng) Meta 發(fā)布 Llama、DeepSeek 開放 R1 權(quán)重時,整個技術(shù)社區(qū)都在歡呼AI 開源時代來了。但一個關(guān)鍵問題被忽略了:把模型權(quán)重掛到網(wǎng)上供人下載,就等于"開源"了嗎?如果沒有人能真正參與到模型的共同開發(fā)中,那這種"開源"與免費(fèi)發(fā)放產(chǎn)品試用裝之間,究竟有什么區(qū)別?

在傳統(tǒng)開源軟件(OSS)的黃金年代,Eric Raymond 提出的"集市"模式(Bazaar)被奉為開源協(xié)作開發(fā)的典范:開發(fā)者分布式參與,流程開放透明,用戶可以自下而上驅(qū)動創(chuàng)新。從 Linux 內(nèi)核到 Apache,再到 PyTorch,無數(shù)成功案例證明了這一范式的強(qiáng)大生命力。然而,在人工智能時代,所謂的開源 AI 模型(以下簡稱 OSM)正在悄然背離這一經(jīng)典范式。

北京大學(xué)開源軟件分析實(shí)驗(yàn)室團(tuán)隊(duì)完成了一項(xiàng)大規(guī)?;旌戏椒▽?shí)證研究,結(jié)合大規(guī)模數(shù)據(jù)挖掘(GitHub 上 1,428,792 個 OSS 倉庫 vs. Hugging Face 上 1,440,527 個 OSM 倉庫)、社會網(wǎng)絡(luò)分析、主題建模分析以及對數(shù)十名核心開發(fā)者與社區(qū)參與者的深度訪談,系統(tǒng)性地對比了傳統(tǒng)開源軟件與開源 AI 模型在協(xié)作模式上的差異,是目前該領(lǐng)域規(guī)模最大的跨平臺實(shí)證對比研究。


核心發(fā)現(xiàn)可以概括為一句話:當(dāng)前的開源 AI,在很大程度上是一種"只讀式開源"模型可以下載和使用,但協(xié)作開發(fā)的大門幾乎是關(guān)閉的。 但故事并沒有止步于此,在舊范式失靈的裂隙中,新的協(xié)作形態(tài)正在萌芽。

一、消失的互動:協(xié)作數(shù)據(jù)的全景掃描

把近 288 萬個倉庫的數(shù)據(jù)攤開對比,可以發(fā)現(xiàn)開源 AI 社區(qū)的協(xié)作強(qiáng)度相比傳統(tǒng)開源軟件,不是略有下降,而是斷崖式塌陷:

- 近 140 倍的活躍度鴻溝:在核心開發(fā)指標(biāo)上,傳統(tǒng) OSS 倉庫的平均提交數(shù)(Commits)達(dá)到 1,464 次,而 OSM 僅為 10.65 次。一個典型的開源 AI 倉庫的全部開發(fā)活躍度,可能還不如一個活躍的傳統(tǒng)開源項(xiàng)目一個月的貢獻(xiàn)頻次。

- 近乎沉寂的社區(qū)討論:傳統(tǒng) OSS 平均每個倉庫的 Issue 數(shù)量為 35.94 條,而 OSM 倉庫的社區(qū)討論平均僅有 0.20 條(約 180 倍的差距)。絕大多數(shù)開源 AI 模型的倉庫頁面更像一個靜默的文件下載站,而非一個活躍的協(xié)作社區(qū)。

- 高度中心化的協(xié)作網(wǎng)絡(luò):社會網(wǎng)絡(luò)分析進(jìn)一步揭示,傳統(tǒng) OSS 的開發(fā)者協(xié)作網(wǎng)絡(luò)在深度和廣度上都遠(yuǎn)超 OSM。在 OSM 的提交網(wǎng)絡(luò)中,頭部項(xiàng)目的核心開發(fā)往往被同一小批內(nèi)部成員包攬,外部節(jié)點(diǎn)極度稀疏。

- 極低的外部貢獻(xiàn)率:開源的精髓不只是"結(jié)果可獲取",更在于"過程可參與",但在當(dāng)前的開源 AI 領(lǐng)域,這種參與的開放性幾乎名存實(shí)亡。OSM 的直接貢獻(xiàn)(代碼/權(quán)重提交)極度封閉,98.91% 的貢獻(xiàn)者來自發(fā)布機(jī)構(gòu)內(nèi)部或在線托管平臺員工,外部開發(fā)者的直接貢獻(xiàn)僅占 1.09%。換句話說,絕大多數(shù)開源 AI 模型的開發(fā)過程,外界幾乎無從介入。而即便是傳統(tǒng)商業(yè)公司主導(dǎo)的 OSS 項(xiàng)目,其外部開發(fā)者的貢獻(xiàn)比例通常也能達(dá)到 56.7%。


指標(biāo) 傳統(tǒng)開源軟件 (OSS) 開源 AI 模型 (OSM) 差異倍數(shù)

平均 Commits

1,464 10.65 ~140x 平均 Issues / Discussions 35.94 0.20 ~180x

外部貢獻(xiàn)者比例

超過 56.7% 1.09% ~50x

二、共同開發(fā)者適配使用者:用戶角色的遷移

數(shù)字背后是更根本的分歧:傳統(tǒng)開源社區(qū)的對話圍繞"如何一起把它改好",而AI開源社區(qū)的對話圍繞"我該怎么把它跑通"?;跀?shù)萬條在線托管平臺交流記錄的主題分析印證了這一判斷。

- 傳統(tǒng) OSS:圍繞改進(jìn)展開。溝通內(nèi)容高度集中于"Bug 報告"(42.7%)和"功能改進(jìn)建議"(28.2%),用戶以"共同開發(fā)者"的身份深度參與產(chǎn)品打磨。一條典型的 Issue 可能是:"我發(fā)現(xiàn)某某函數(shù)在并發(fā)場景下存在競態(tài)條件,附上復(fù)現(xiàn)代碼和修復(fù) PR。"

- OSM:圍繞使用展開。社區(qū)討論的主流變成了"使用問題"(40.0%)和"性能評估"(22.3%)。一條典型的 Discussion 更像是:"我在 4-bit 量化后推理結(jié)果出現(xiàn)亂碼,有人遇到過同樣問題嗎?"

用戶不再致力于改進(jìn)模型本身,而是專注于在下游應(yīng)用中進(jìn)行環(huán)境適配和微調(diào)。他們正從"開發(fā)者"(Developer)演變?yōu)?適配者"(Adaptor)。這意味著所謂的開源 AI 社區(qū)在協(xié)作性質(zhì)上更接近一個用戶論壇,而非一個共建社區(qū)。

三、為什么集市模型開發(fā)的語境下失靈了?

協(xié)作的塌陷不是偶然的,對數(shù)?名領(lǐng)域?qū)<业纳疃仍L談反復(fù)傳遞著同一個信號:不是人們不愿意協(xié)作,而是AI模型開發(fā)的技術(shù)現(xiàn)實(shí)和產(chǎn)業(yè)邏輯,從根本上堵死了傳統(tǒng)協(xié)作的入口。

- 略性開放的出發(fā)點(diǎn)定位在 AI 領(lǐng)域,開源往往是企業(yè)競爭的戰(zhàn)略棋子:構(gòu)建生態(tài)鎖定、爭奪開發(fā)者、對抗競爭對手的封閉策略,而并非完全為了社區(qū)共建。正如一位受訪者所言:"雖然大家都在說開源,但大公司之間其實(shí)幾乎不存在真正的協(xié)作,說到底還是商業(yè)競爭和壟斷",另一位受訪者補(bǔ)充道:"小公司也不太可能真正開源自己的模型,因?yàn)橘u API 就是它們的主營業(yè)務(wù)。大公司可以靠其他增值服務(wù)賺錢,但對小公司來說,模型本身就是全部家當(dāng)“。這種策略性開放從動機(jī)層面就決定了社區(qū)參與的天花板。

- 技術(shù)架構(gòu)的黑盒壁壘。傳統(tǒng)軟件的源代碼是人類可讀的文本,開發(fā)者可以逐行審查、定位問題、提交修改。但模型權(quán)重是高維的二進(jìn)制數(shù)值文件,無法像讀代碼一樣讀懂一個 70B 參數(shù)模型的某一層為什么會產(chǎn)生某種輸出。更關(guān)鍵的是,當(dāng)前模型主流架構(gòu)具有高度的全局耦合性,難以像傳統(tǒng)軟件那樣實(shí)現(xiàn)清晰的模塊化分工。代碼是可以被理解的協(xié)作對象,而模型權(quán)重不是。

- 算力構(gòu)筑的參與門檻。訓(xùn)練一個前沿大模型所需的算力投入,已經(jīng)從"昂貴"升級為"天文數(shù)字"。一位受訪者直接提及:“我們公司去年投入超過 5 億美元,其中 70% 花在了算力上,個人開發(fā)者根本承擔(dān)不起這種級別的參與。” 當(dāng)核心開發(fā)的入場券標(biāo)價數(shù)億美元,獨(dú)立開發(fā)者和小型團(tuán)隊(duì)就被徹底排除在了核心協(xié)作圈之外。

- 基礎(chǔ)設(shè)施的結(jié)構(gòu)性錯位。以Git為代表的、驅(qū)動了傳統(tǒng)開源繁榮的版本控制基礎(chǔ)設(shè)施,擅長追蹤代碼的逐行變更,卻無法有效管理動輒數(shù)十 GB 的模型權(quán)重文件。當(dāng)每次提交的具體修改內(nèi)容都無法明確追蹤的時候,模型審查和協(xié)作迭代就失去了基礎(chǔ)。

四、舊范式失靈,但新芽已現(xiàn):OSM中的全新協(xié)作形態(tài)

如果故事止步于“集市”模式的失靈,那未免過于悲觀。事實(shí)上,在傳統(tǒng)協(xié)作范式瓦解的裂隙中,幾種全新的協(xié)作形態(tài)正在自發(fā)生長。

- 外圍知識生產(chǎn)。被算力和技術(shù)壁壘擋在核心開發(fā)之外的貢獻(xiàn)者,并沒有徹底沉默。他們正在開辟另一條路徑:不觸碰模型權(quán)重本身,而是圍繞模型構(gòu)建獨(dú)立于模型結(jié)構(gòu)之外的知識公共財產(chǎn),例如提示詞庫(Prompt Libraries)的集體編寫、評測基準(zhǔn)(Benchmarks)的共同開發(fā)、使用文檔和最佳實(shí)踐的社區(qū)積累。這些貢獻(xiàn)并未改動模型的參數(shù),卻推進(jìn)了模型被理解、被評估、被使用的方式?!?strong>改不了黑盒本身,就去改黑盒周圍的一切”,這正是外圍貢獻(xiàn)者找到的協(xié)作突破口。

- 集體邊界探測另一種引人注目的協(xié)作形態(tài)是,大量用戶通過分布式的實(shí)驗(yàn)測試,協(xié)同探索模型的行為邊界和能力極限。紅隊(duì)測試、對抗性提示、邊界案例收集……這些看似零散的用戶行為,匯聚起來構(gòu)成了一種大規(guī)模的協(xié)同評估機(jī)制。即便核心訓(xùn)練過程仍然封閉,這些來自外圍的信號也能反向引導(dǎo)上游開發(fā)者優(yōu)化模型對齊,形成一種間接但真實(shí)的協(xié)作閉環(huán)。

- 基于資源互補(bǔ)的聯(lián)盟式協(xié)作。傳統(tǒng)軟件可以通過功能模塊的分解實(shí)現(xiàn)分工協(xié)作,但 AI 模型的不可分解性使得一種新的協(xié)作模式萌生:不再拆分任務(wù),而是交換資源,大型機(jī)構(gòu)貢獻(xiàn)算力,合作方和社區(qū)貢獻(xiàn)領(lǐng)域知識與專有數(shù)據(jù)。這種資源互補(bǔ)式的聯(lián)盟,讓大模型開發(fā)變成了參與方各出所長的聯(lián)合行動,它不是集市,更像是一種以資源為紐帶的協(xié)作聯(lián)邦。

五、通往 AI 協(xié)作新范式的四條路徑

識別了問題的根源和新生的協(xié)作萌芽之后,一個自然的追問是:能否主動設(shè)計方案和工具,促使OSM中協(xié)作的發(fā)生?破局的關(guān)鍵不在于空泛地呼吁更多人來貢獻(xiàn),而在于重新定義什么叫貢獻(xiàn)、重新設(shè)計協(xié)作的基礎(chǔ)設(shè)施,上述實(shí)證發(fā)現(xiàn)和訪談洞察共同指向了四條通往AI協(xié)作新范式的路徑。

- 標(biāo)準(zhǔn)化訓(xùn)練配方(Recipes)。完整復(fù)現(xiàn)一個大模型的算力門檻極高,但透明性可以通過另一條路徑實(shí)現(xiàn):將數(shù)據(jù)處理邏輯、超參數(shù)配置、環(huán)境規(guī)格等打包為標(biāo)準(zhǔn)化的訓(xùn)練配方,讓社區(qū)無需重跑訓(xùn)練,也能評估和驗(yàn)證模型的構(gòu)建過程。配方將開發(fā)邏輯與硬件需求解耦,社區(qū)參與者跑不起同樣的訓(xùn)練不要緊,但至少能看懂它是怎么做出來的,這是彌合模型生產(chǎn)者與社區(qū)之間資源鴻溝的重要一步。

- 構(gòu)建偽模塊化的協(xié)作接口。AI模型整體難以模塊化切分,而包括但不限于PEFT(參數(shù)高效微調(diào))技術(shù)和模型融合在內(nèi)的新技術(shù)卻正在模擬模塊化,為更加解耦的開發(fā)流程鋪路。將模型變體的生產(chǎn)從端到端的完整訓(xùn)練流程中剝離出來,獨(dú)立貢獻(xiàn)者無需重跑預(yù)訓(xùn)練,就可以開發(fā)面向特定任務(wù)的模型變體。這種"偽模塊化"讓協(xié)作可以異步發(fā)生,從而繞開了預(yù)訓(xùn)練階段的巨額算力門檻,讓更多人有機(jī)會真正參與到模型開發(fā)中來。

- 開發(fā)適配 AI 特性的協(xié)作基礎(chǔ)設(shè)施。一套為 AI 協(xié)作設(shè)計的新工具鏈正亟待設(shè)計和實(shí)現(xiàn),以面向大規(guī)模二進(jìn)制文件的語義化差分存儲與版本控制、標(biāo)準(zhǔn)化的插件式推理接口、低門檻的在線實(shí)驗(yàn)環(huán)境等。正如 Git 和 GitHub 催生了傳統(tǒng)開源的黃金時代,AI 開源的繁榮同樣需要屬于自己的基礎(chǔ)設(shè)施革命。

- 重構(gòu)貢獻(xiàn)度評價體系當(dāng)前的開源貢獻(xiàn)評估高度依賴代碼提交(Commit)和合并請求(Pull Request),但在OSM開發(fā)語境下,許多關(guān)鍵貢獻(xiàn)形式被系統(tǒng)性地低估了。正如第四部分所揭示的那樣,外圍知識生產(chǎn)、集體邊界探測、資源互補(bǔ)協(xié)同,這些不寫代碼的協(xié)作形式對模型質(zhì)量和安全同樣至關(guān)重要,卻長期游離在正式的貢獻(xiàn)激勵體系之外。承認(rèn)并量化這些貢獻(xiàn),才能讓更多樣化的參與者找到協(xié)作的入口。

一方面,傳統(tǒng)開源的"集市"模式在 AI 模型開發(fā)的場域下正經(jīng)歷嚴(yán)重的失靈:協(xié)作強(qiáng)度斷崖式下跌,外部參與近乎封閉,用戶從共同開發(fā)者退化為被動使用者;而另一方面,在舊范式瓦解的縫隙中,新的協(xié)作形態(tài)正在萌生:外圍知識生產(chǎn)、集體邊界探測、資源互補(bǔ)協(xié)同等,共同指向了一種與AI模型技術(shù)特性相適應(yīng)的全新協(xié)作邏輯。

開源 AI 的未來不應(yīng)止步于開放權(quán)重,真正需要的不僅是理念上的重申,更是技術(shù)基礎(chǔ)設(shè)施、協(xié)作工具鏈和貢獻(xiàn)評價體系的系統(tǒng)性重建。"集市"或許不會終結(jié),但它需要一場深刻的自我革新:在算力障礙與黑盒架構(gòu)的重壓之下,重新找到人人可參與的協(xié)作之路,而那些正在萌芽的新協(xié)作形態(tài),或許正是這場革新最有希望的起點(diǎn)。

-- 論文信息:

> 論文標(biāo)題:From OSS to Open Source AI: an Exploratory Study of Collaborative Development Paradigm Divergence

> 發(fā)表于:The 29th ACM Conference on Computer-Supported Cooperative Work & Social Computing (CSCW’26)

> 作者:Hengzhi Ye, Minghui Zhou

> 全文鏈接:http://arxiv.org/abs/2604.08888

> 歡迎引用、討論與批評。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女子坐網(wǎng)約車開門時,磕到馬路牙子,愿賠50或100,司機(jī)不同意!

女子坐網(wǎng)約車開門時,磕到馬路牙子,愿賠50或100,司機(jī)不同意!

川渝視覺
2026-04-20 16:28:00
劉曉慶只比鄧婕大5歲,二人狀態(tài)大不同,科技臉和原裝臉一眼就懂

劉曉慶只比鄧婕大5歲,二人狀態(tài)大不同,科技臉和原裝臉一眼就懂

蓓小西
2026-03-28 09:17:09
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
造成毛岸英犧牲的罪魁禍?zhǔn)祝屆飨春薜米锶?,他們下場如何?>
    </a>
        <h3>
      <a href=風(fēng)笛悠揚(yáng)聲
2025-12-04 10:08:06
魔都打工人怒了!龍陽路站換乘暴走10分鐘,跪求炸掉重建!

魔都打工人怒了!龍陽路站換乘暴走10分鐘,跪求炸掉重建!

墜入二次元的海洋
2026-04-20 10:14:14
浙江女子稱花近24萬買理想i6后

浙江女子稱花近24萬買理想i6后

新浪財經(jīng)
2026-04-19 11:05:34
37歲福原愛官宣生下三胎,現(xiàn)任丈夫居然是此前出軌門男主,母子平安

37歲福原愛官宣生下三胎,現(xiàn)任丈夫居然是此前出軌門男主,母子平安

好乒乓
2026-04-20 11:14:45
比石油斷供還危險!美國農(nóng)業(yè)爆發(fā)生存危機(jī),春耕急盼中國救命

比石油斷供還危險!美國農(nóng)業(yè)爆發(fā)生存危機(jī),春耕急盼中國救命

老謝談史
2026-04-17 09:35:26
DeepSeek將于4月下旬正式發(fā)布,高“DeepSeek”含量的大數(shù)據(jù)ETF華夏(516000)漲近2%

DeepSeek將于4月下旬正式發(fā)布,高“DeepSeek”含量的大數(shù)據(jù)ETF華夏(516000)漲近2%

每日經(jīng)濟(jì)新聞
2026-04-20 10:48:20
g2騎士大戰(zhàn)猛龍,看似強(qiáng)強(qiáng)對決,實(shí)則勝負(fù)沒有懸念

g2騎士大戰(zhàn)猛龍,看似強(qiáng)強(qiáng)對決,實(shí)則勝負(fù)沒有懸念

郝小小看體育
2026-04-20 17:55:33
新華社權(quán)威快報|首個全國“全民閱讀活動周”啟幕

新華社權(quán)威快報|首個全國“全民閱讀活動周”啟幕

新華社
2026-04-20 11:31:09
從8分到28分:一個二輪秀的季后賽生存法則

從8分到28分:一個二輪秀的季后賽生存法則

綠茵狂熱者
2026-04-20 19:03:32
比導(dǎo)彈便宜萬倍!中國 LW30 一出場,無人機(jī)當(dāng)場變廢鐵

比導(dǎo)彈便宜萬倍!中國 LW30 一出場,無人機(jī)當(dāng)場變廢鐵

小蘭聊歷史
2026-04-18 14:25:14
定了!4月17日發(fā)改委官宣:工資假期收入全上調(diào)

定了!4月17日發(fā)改委官宣:工資假期收入全上調(diào)

夜深愛雜談
2026-04-19 10:01:09
這6種食物不能“二次加熱”,吃不完就倒掉,別為節(jié)省,害了自己

這6種食物不能“二次加熱”,吃不完就倒掉,別為節(jié)省,害了自己

所食所想
2026-04-01 10:30:32
華為Pura 90 Pro Max亮相:業(yè)界首發(fā)雙色漸變金屬中框

華為Pura 90 Pro Max亮相:業(yè)界首發(fā)雙色漸變金屬中框

快科技
2026-04-20 14:44:08
全紅嬋亞運(yùn)會資格有戲!選拔規(guī)則相當(dāng)友好,重拾訓(xùn)練迫在眉睫

全紅嬋亞運(yùn)會資格有戲!選拔規(guī)則相當(dāng)友好,重拾訓(xùn)練迫在眉睫

一枚野球君
2026-04-20 19:09:07
“你女兒比松子還可悲”,女孩吃三文魚表情走紅,讓評論區(qū)吵翻了

“你女兒比松子還可悲”,女孩吃三文魚表情走紅,讓評論區(qū)吵翻了

妍妍教育日記
2026-04-15 11:40:07
經(jīng)紀(jì)人霍汶希評論區(qū)翻車了!因張敬軒風(fēng)波,網(wǎng)友毫不留情面的怒批

經(jīng)紀(jì)人霍汶希評論區(qū)翻車了!因張敬軒風(fēng)波,網(wǎng)友毫不留情面的怒批

小徐講八卦
2026-04-19 11:17:33
中青視線丨騎手每日交3元保費(fèi),猝死遭拒賠?法院“穿透式審判”鎖定“真正投保人”

中青視線丨騎手每日交3元保費(fèi),猝死遭拒賠?法院“穿透式審判”鎖定“真正投保人”

中國青年報
2026-04-19 19:03:07
2026-04-20 19:43:00
開源中國 incentive-icons
開源中國
每天為開發(fā)者推送最新技術(shù)資訊
7702文章數(shù) 34535關(guān)注度
往期回顧 全部

科技要聞

華為Pura90逆周期定價,4699元起,未漲價

頭條要聞

小學(xué)生遭多名中小學(xué)生施暴搜家 家長以"入室搶劫"報案

頭條要聞

小學(xué)生遭多名中小學(xué)生施暴搜家 家長以"入室搶劫"報案

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
家居
教育
公開課

數(shù)碼要聞

華為新內(nèi)存技術(shù)來了,Mate X7用戶6月有福

藝術(shù)要聞

王羲之《換鵝帖》尚在人間,驚艷無比!

家居要聞

自然慢調(diào) 慢享時光

教育要聞

同一個詞,AI怎么知道它是什么意思?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版