国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi超過DeepSeek的新模型被指“套殼”Qwen?到底怎么回事兒

0
分享至

作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com

昨天深夜,月之暗面發(fā)布了開源代碼模型Kimi-Dev-72B。這個模型在軟件工程任務(wù)基準測試SWE-bench Verified上取得了60.4%的成績,創(chuàng)下開源模型新紀錄,超越了包括DeepSeek在內(nèi)的多個競爭對手。

然而,當開發(fā)者們深入了解這個模型時,發(fā)現(xiàn)它明確標注了:Base model: Qwen/Qwen2.5-72B。這引發(fā)了一些人的疑問,Kimi-Dev的優(yōu)異表現(xiàn),究竟是創(chuàng)新還是“套殼”?

Kimi-Dev-72B并非從零開始訓(xùn)練的模型。根據(jù)月之暗面在Hugging Face上的說明,這個模型明確標注了Base model: Qwen/Qwen2.5-72B。在官方博客中也寫到:以 Qwen 2.5-72B 基礎(chǔ)模型為起點,我們收集了數(shù)百萬個 GitHub 問題單和 PR 提交作為中期訓(xùn)練數(shù)據(jù)集。這意味著Kimi-Dev是基于阿里巴巴Qwen團隊的72B參數(shù)模型進行二次開發(fā)的。

從技術(shù)角度看,Kimi-Dev的創(chuàng)新主要體現(xiàn)在訓(xùn)練方法上。月之暗面采用了大規(guī)模強化學(xué)習(xí)技術(shù),讓模型在Docker環(huán)境中自主修復(fù)真實代碼倉庫的問題,只有當完整測試套件通過時才能獲得獎勵。這種訓(xùn)練方式確保了模型生成的代碼不僅正確,而且符合實際開發(fā)標準。

在軟件工程任務(wù)基準測試上,Kimi-Dev-72B展現(xiàn)了出色的性能。它在SWE-bench Verified上取得了60.4%的成績,這是一個專門評估模型解決真實GitHub issues能力的基準測試。相比之下,前一名開源模型的成績僅為約50%左右,Kimi-Dev實現(xiàn)了顯著的提升。

在許可證方面,Kimi-Dev-72B的LICENSE.md文件顯示其采用MIT協(xié)議發(fā)布。

但同時,月之暗面也在文檔中明確說明:“Kimi-Dev-72B is built with Qwen-2.5-72B. Qwen-2.5-72B is licensed under the Qwen LICENSE AGREEMENT, Copyright (c) Alibaba Cloud. All Rights Reserved.Subject to the Qwen LICENSE AGREEMENT, Kimi-Dev-72B is under MIT license”。

也就是說Kimi-Dev-72B需要遵守Qwen-2.5-72B的原始許可限制,同時將自己的創(chuàng)新工作(即通過強化學(xué)習(xí)獲得的微調(diào)權(quán)重)以MIT協(xié)議開源。這種做法在開源社區(qū)中被稱為“delta權(quán)重”發(fā)布,即只發(fā)布相對于基礎(chǔ)模型的增量部分。

一個“歷史遺留”問題

爭議的起源是社區(qū)對“月之暗面是否獲得了使用Qwen-2.5-72B的特殊許可”的質(zhì)疑。根據(jù)Qwen的許可協(xié)議體系,雖然較小的模型采用Apache 2.0協(xié)議,但72B這個旗艦?zāi)P筒捎玫氖恰锻x千問許可協(xié)議》(Qwen LICENSE AGREEMENT)。

這份協(xié)議規(guī)定,當產(chǎn)品的月活躍用戶(MAU)超過1億時,需要向阿里申請商業(yè)授權(quán)??紤]到Kimi作為熱門AI助手的用戶規(guī)模,可能將Kimi-Dev-72B引入其產(chǎn)品,這個限制條款引起了關(guān)注。

面對社區(qū)詢問,Qwen團隊負責(zé)人林俊旸(Junyang Lin)在X平臺上的第一個回復(fù)簡短而直接:"no we did not give them the permission"(不,我們沒有給他們授權(quán))。

這個回復(fù)立即引發(fā)討論,然而,僅僅一個多小時后,林俊旸發(fā)布了第二條推文,改變了事件走向:“nvm this is our legacy issue. for qwen3, all are under apache 2.0 now.”(沒事了,這是我們的歷史遺留問題。對于qwen3,現(xiàn)在所有模型都采用apache 2.0協(xié)議了。)

林俊旸的第二條推文揭示了問題的本質(zhì),這不是月之暗面的違規(guī)使用,而是Qwen團隊自身許可策略演進中的“歷史遺留問題”。

具體來說,Qwen2.5系列采用了復(fù)雜的分級許可體系:大部分模型(包括 0.5?B、1.5?B、7?B、14?B、32?B、VL、Omni 等)采用Apache 2.0協(xié)議,屬于完全開源許可,而3B和72B模型采用的是《通義千問許可協(xié)議》,包含商業(yè)限制條款。

這種分級許可策略在開源社區(qū)中并不罕見,目的是在推動技術(shù)普及的同時保護核心商業(yè)利益。但隨著時間推移,Qwen團隊可能意識到這種策略可能會阻礙生態(tài)發(fā)展。

在2025年4月底發(fā)布的Qwen3系列中,所有模型都已經(jīng)采用了更加開放的Apache 2.0協(xié)議。Apache 2.0是一種廣受歡迎的開源協(xié)議,它具有以下特點:

商業(yè)友好:全球開發(fā)者、研究機構(gòu)和企業(yè)均可免費下載并商用,無需額外申請授權(quán)。

無限制使用:允許商業(yè)使用與二次開發(fā),用戶可以修改代碼并以其他協(xié)議重新發(fā)布。

社區(qū)驅(qū)動:通過降低使用門檻,促進更多開發(fā)者參與,推動技術(shù)的快速迭代和創(chuàng)新。

通過全面轉(zhuǎn)向Apache 2.0,Qwen試圖正在構(gòu)建一個更加開放和活躍的AI生態(tài)系統(tǒng)。

在這種背景下,將Kimi-Dev基于“舊協(xié)議”模型的使用定性為“歷史遺留問題”,實際上是一種著眼未來,支持生態(tài)伙伴的創(chuàng)新的選擇。

開源協(xié)作的新范式

從技術(shù)角度看,這個案例反映了當前AI創(chuàng)業(yè)的現(xiàn)實。根據(jù)MosaicML的數(shù)據(jù),訓(xùn)練一個達到GPT-3質(zhì)量的30B參數(shù)模型需要約45萬美元,而更大規(guī)模的模型如70B參數(shù)級別,成本會達到數(shù)百萬美元。對于希望從零開始訓(xùn)練一個70B模型的機構(gòu)來說,需要準備好數(shù)百萬美元的基礎(chǔ)預(yù)算,還需要配備頂尖的AI研究和工程團隊,并且要考慮到隨著技術(shù)發(fā)展,未來模型的訓(xùn)練成本可能會進一步攀升。

而月之暗面選擇Qwen-2.5-72B作為基座并非偶然。根據(jù)多項評測,Qwen2.5系列在代碼、數(shù)學(xué)、多語言等方面都達到了業(yè)界領(lǐng)先水平。站在這樣的基座模型上,月之暗面可以在類似這樣的研究項目中,將資源集中在自己的核心優(yōu)勢——強化學(xué)習(xí)訓(xùn)練方法上。

NebulaGraph GenAI負責(zé)人Wey Gu對硅星人表示:“我認為他們(Kimi)的開放權(quán)重、透明地分享paper的工作對社區(qū)是非常有益處的”,他還指出,Kimi-Dev分發(fā)MIT協(xié)議的delta權(quán)重文件沒有問題,“不過模型的消費者是繞不過base model的Qwen license的”。

值得注意的是,盡管Kimi-Dev在SWE-bench上取得了優(yōu)異成績,但實際應(yīng)用中仍有改進空間。有開發(fā)者測試發(fā)現(xiàn),模型生成的代碼有時需要調(diào)試才能運行,對復(fù)雜需求的理解也不夠完整。這說明即使基于強大的基礎(chǔ)模型,要做出真正優(yōu)秀的垂直應(yīng)用仍需要大量創(chuàng)新。

這場“套殼”爭議最終成為了一個行業(yè)發(fā)展的縮影。開源策略正在從限制性許可向完全開放轉(zhuǎn)變,這是贏得開發(fā)者生態(tài)的必然選擇。同時,基于優(yōu)秀基礎(chǔ)模型的“二次創(chuàng)新”正在興起,關(guān)鍵是找到自己的差異化價值。大廠與創(chuàng)業(yè)公司不再是簡單的競爭關(guān)系,而是在開源生態(tài)中形成新的協(xié)作模式。

隨著更多的開源模型采用Apache 2.0協(xié)議,類似的許可爭議將越來越少。而像Kimi-Dev這樣基于開源模型的專項優(yōu)化案例,或許會越來越多,這正是開源AI生態(tài)繁榮發(fā)展的標志。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
神宮寺奈緒的哭戲:一滴眼淚,如何將作品抬升到不屬于它的高度

神宮寺奈緒的哭戲:一滴眼淚,如何將作品抬升到不屬于它的高度

春天不是讀書天
2026-03-01 22:22:17
首發(fā)0分他打球拖累全隊!球迷炮轟郭士強選他是錯誤,該選得分王

首發(fā)0分他打球拖累全隊!球迷炮轟郭士強選他是錯誤,該選得分王

老吳說體育
2026-03-01 19:21:06
連續(xù)2場逆轉(zhuǎn),中國男籃兩連勝,李弘權(quán)9+11成奇兵 高詩巖防守拉滿

連續(xù)2場逆轉(zhuǎn),中國男籃兩連勝,李弘權(quán)9+11成奇兵 高詩巖防守拉滿

替補席看球
2026-03-01 17:55:20
超20000名旅客滯留!“迪拜機場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費用

超20000名旅客滯留!“迪拜機場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費用

江西工人報
2026-03-01 22:27:25
搶完中企資產(chǎn),再搜查辦公室,巴當局闖下大禍,中國準備甩出王牌

搶完中企資產(chǎn),再搜查辦公室,巴當局闖下大禍,中國準備甩出王牌

嘆知
2026-02-28 21:25:23
1-0!女足亞洲杯揭幕戰(zhàn),東道主拿下首勝,中國隊3日下午衛(wèi)冕首秀

1-0!女足亞洲杯揭幕戰(zhàn),東道主拿下首勝,中國隊3日下午衛(wèi)冕首秀

侃球熊弟
2026-03-01 19:01:07
整天開會有啥必要啊?

整天開會有啥必要???

北京老付
2026-01-20 10:59:33
哈梅內(nèi)伊的死,將了特朗普的軍!哈梅內(nèi)伊最后“陽謀”,有多毒?

哈梅內(nèi)伊的死,將了特朗普的軍!哈梅內(nèi)伊最后“陽謀”,有多毒?

今夜繁星墜落
2026-03-02 00:21:33
伊朗發(fā)動大規(guī)模襲擊:已襲擊27個美軍基地和以軍總司令部等地;伊方公布導(dǎo)彈擊中以軍總參謀部圖

伊朗發(fā)動大規(guī)模襲擊:已襲擊27個美軍基地和以軍總司令部等地;伊方公布導(dǎo)彈擊中以軍總參謀部圖

極目新聞
2026-03-01 13:09:32
俄媒警告中國:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰(zhàn)

俄媒警告中國:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰(zhàn)

阿嘵田侃故事
2026-02-28 20:21:18
伊朗伊斯蘭革命衛(wèi)隊指揮官:伊朗目前使用的只是“廢舊導(dǎo)彈”

伊朗伊斯蘭革命衛(wèi)隊指揮官:伊朗目前使用的只是“廢舊導(dǎo)彈”

參考消息
2026-03-01 01:29:04
樓市走到現(xiàn)在,有一種“預(yù)感”越來越強烈了!或超出很多人的想象

樓市走到現(xiàn)在,有一種“預(yù)感”越來越強烈了!或超出很多人的想象

阿離家居
2026-03-01 16:25:00
500萬英鎊輸光,住出租屋的破產(chǎn)冠軍,對陣開勞斯萊斯的豪門公子

500萬英鎊輸光,住出租屋的破產(chǎn)冠軍,對陣開勞斯萊斯的豪門公子

情感大頭說說
2026-03-01 13:41:53
哈梅內(nèi)伊身亡,伊朗對多國不宣而戰(zhàn),中俄態(tài)度完全一致,中東變天

哈梅內(nèi)伊身亡,伊朗對多國不宣而戰(zhàn),中俄態(tài)度完全一致,中東變天

混沌錄
2026-03-02 00:18:14
劉強東砸50億,在廣東造游艇!這門新生意,還沒開張就先賺了3億

劉強東砸50億,在廣東造游艇!這門新生意,還沒開張就先賺了3億

財經(jīng)保探長
2026-03-01 18:12:05
伊朗伊斯蘭革命衛(wèi)隊發(fā)布6號公告

伊朗伊斯蘭革命衛(wèi)隊發(fā)布6號公告

界面新聞
2026-03-01 12:51:42
如今黃金價格變成了一個天大的笑話,買黃金可笑到什么程度

如今黃金價格變成了一個天大的笑話,買黃金可笑到什么程度

花小貓的美食日常
2026-03-01 11:57:50
特朗普通報全球,他帶領(lǐng)美國贏了中國!話音剛落,中方對美征稅

特朗普通報全球,他帶領(lǐng)美國贏了中國!話音剛落,中方對美征稅

別讓往昔的悲傷和對未來的恐懼
2026-03-02 00:11:50
難怪伊朗進行如此瘋狂反擊,事實證明:哈梅內(nèi)伊一開始就被炸死了

難怪伊朗進行如此瘋狂反擊,事實證明:哈梅內(nèi)伊一開始就被炸死了

墨蘭史書
2026-03-01 23:43:19
營銷造假?有網(wǎng)友發(fā)現(xiàn)鴻蒙智行多個營銷視頻使用加速、倒放素材

營銷造假?有網(wǎng)友發(fā)現(xiàn)鴻蒙智行多個營銷視頻使用加速、倒放素材

新浪財經(jīng)
2026-02-28 22:28:30
2026-03-02 01:03:00
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進入GenAl。
243文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

媒體:美以能精準"斬首"背后 摩薩德的"手筆"令人咋舌

頭條要聞

媒體:美以能精準"斬首"背后 摩薩德的"手筆"令人咋舌

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

手機
房產(chǎn)
親子
本地
軍事航空

手機要聞

小米11全系正式退役!安全更新停更,這些機型該換了

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

親子要聞

金龜子女兒流產(chǎn)后,為兒子舉辦2歲生日宴,三個卡通可愛的蛋糕

本地新聞

津南好·四時總相宜

軍事要聞

伊朗前總統(tǒng)內(nèi)賈德遇襲身亡

無障礙瀏覽 進入關(guān)懷版