国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

代碼+視覺不再“偏科”,國產(chǎn)模型真正平替Claude還有多遠(yuǎn)?

0
分享至



出品 | 創(chuàng)業(yè)最前線

作者 | 白華

編輯 | 閃電

美編 | 邢靜

審核 | 頌文

過去一年,AI編程工具邁入“軍備競賽”階段。以Anthropic的Claude系列為代表的閉源模型,憑借領(lǐng)先的代碼生成和Agent能力,成為全球主流開發(fā)平臺(tái)的首選。然而,其對(duì)中國市場的服務(wù)限制、高昂的API成本,以及缺乏本地化支持,正倒逼國內(nèi)開發(fā)者尋找高性能、高性價(jià)比的替代方案。

與此同時(shí),國產(chǎn)大模型在純文本任務(wù)上已取得顯著進(jìn)展,但在視覺理解、復(fù)雜Agent工具調(diào)用等真實(shí)工程場景中仍存在明顯短板——多數(shù)編程模型要么不支持圖像輸入,要么支持圖像的模型編程能力不足。因?yàn)閳D文能力割裂,難以支撐現(xiàn)代軟件開發(fā)中日益增長的代碼+多模態(tài)基礎(chǔ)需求。

近期,Kimi新發(fā)布的K2.5模型在開發(fā)者群體中引發(fā)廣泛關(guān)注,因?yàn)榫幊绦阅艿奶嵘c視覺能力的補(bǔ)齊,讓開發(fā)者終于等到了完整Claude平替的希望。

在全球最大的大模型API聚合平臺(tái)OpenRouter上,Kimi K2.5模型發(fā)布次日就沖上了全球前三。



這份亮眼表現(xiàn)也迅速獲得了頭部編程工具平臺(tái)的認(rèn)可與青睞。Cursor的核心競品,由GitLab創(chuàng)始人打造的知名編程工具Kilo Code宣布推出Kimi K2.5的首周免費(fèi)活動(dòng)后,K2.5也成為該平臺(tái)上最受歡迎的模型,單日消耗超過380億Token。



最近很火的Claude Code開源版OpenCode,也宣布限時(shí)免費(fèi)來吸引開發(fā)者用戶。



國內(nèi)大廠旗下的編程工具同樣第一時(shí)間接入了K2.5模型。騰訊CodeBuddy將其設(shè)定為首選模型;字節(jié)Trae宣布提供免費(fèi)額度,阿里Qoder、美團(tuán)CatPaw等據(jù)傳也在接入中。



1、K2.5代碼能力究竟如何?

從知名匿名評(píng)測機(jī)構(gòu)大模型競技場LMarena公布的數(shù)據(jù)來看,K2.5在Thinking模式下,代碼能力以1509分與Claude Sonnet 4.5持平。排在它前面的,只有Claude和Gemini最新的旗艦?zāi)P汀_@應(yīng)該是開源模型代碼能力的新高。



不止代碼能力表現(xiàn)亮眼,K2.5在視覺能力上的評(píng)測成績同樣令人驚喜。從大模型競技場的視覺能力匿名評(píng)測來看,K2.5模型的視覺能力比Claude更能打。



我們也從開發(fā)者社區(qū)看到一些真實(shí)反饋,K2.5的實(shí)際表現(xiàn)和體感,與榜單呈現(xiàn)的結(jié)果比較接近,代碼能力確實(shí)有了提升。





一位Sezxy的網(wǎng)友表示Kimi K2.5+OpenCode感覺很不錯(cuò),幾個(gè)需求都用它倆解決。



不過,似乎編程能力的提升,也有一定的“副作用”,部分網(wǎng)友表示,之前K2模型的創(chuàng)意寫作能力好像在K2.5模型上減弱了。



2、代碼模型為什么需要視覺?

在知乎問題《Kimi發(fā)布并開源K2.5模型,哪些信息值得關(guān)注?》下,有Kimi的工程師分享了Kimi做多模態(tài)的背后思路,其中一段提到了視覺能力對(duì)代碼模型的價(jià)值,其中一個(gè)關(guān)鍵場景是模型可以自己發(fā)現(xiàn)前端頁面的視覺bug,然后有機(jī)會(huì)在后續(xù)的流程中自己進(jìn)行修正:

其實(shí)對(duì)于很多任務(wù)而言,Agent模型也能去自己debug,去根據(jù)Console Log的文本內(nèi)容去解決問題,但是我們還是會(huì)遇到一些沒有任何Error或者Warnning,但又不得不再次提出Feedback的時(shí)刻,比如:“網(wǎng)站兩個(gè)組件產(chǎn)生了堆疊遮擋,你修改下”“放在首頁的圖裂開了,應(yīng)該是Link失效了,麻煩你check下”“這是一個(gè)介紹中學(xué)生的網(wǎng)頁,配圖不應(yīng)該是工作人員”。

這些問題總是在不斷提出,我們總是希望模型能不犯這些錯(cuò)誤。是的,模型是有可能one-shot出來沒有任何問題的代碼,但是,只要我們給模型一雙眼睛,這些吐槽的問題或者就有可能會(huì)讓模型自己形成一個(gè)Action-Critic的Refine閉環(huán),而沒有Human的工作流水線是有更高效率的理想上限。



這可能是K2.5模型上線后,立即受到開發(fā)者群體歡迎的關(guān)鍵原因之一。此前的中國編程模型,普遍沒有視覺能力,遇到圖片和視頻都無法處理,只能報(bào)錯(cuò)。或者需要非常復(fù)雜的流程,自行接入另一個(gè)模型來處理,對(duì)編程的效率影響很大。另一個(gè)關(guān)鍵原因則是Claude模型太貴了,燒錢太快。Kimi新模型的API價(jià)格只有Claude中號(hào)模型Sonnet 4.5的1/5,用起來錢包不會(huì)太疼。

3、更多K2.5的幕后

除了市場端的亮眼表現(xiàn),K2.5的技術(shù)研發(fā)背后還有不少值得深挖的細(xì)節(jié)。

因此在1月29日凌晨,Kimi核心團(tuán)隊(duì)在Reddit平臺(tái)舉行了一場長達(dá)3小時(shí)的AMA(有問必答)活動(dòng),CEO楊植麟、算法團(tuán)隊(duì)負(fù)責(zé)人周昕宇、吳育昕三位聯(lián)合創(chuàng)始人,與全球網(wǎng)友交流了K2.5的技術(shù)細(xì)節(jié)、產(chǎn)品規(guī)劃與行業(yè)看法。這場對(duì)話中,許多關(guān)鍵問題的回應(yīng),讓外界了解了更多K2.5的幕后。



有網(wǎng)友拋出尖銳問題:Kimi K2.5非常棒,但我看到有人說模型會(huì)自稱為Claude,并把這當(dāng)作你們大量蒸餾(distill)自Claude模型的證據(jù)。這是怎么回事?

楊植麟回應(yīng)稱:“我們的觀察是,在正確的系統(tǒng)提示詞下,它有很高的概率回答‘Kimi’,尤其是在思考模式下。但當(dāng)系統(tǒng)提示為空時(shí),它就進(jìn)入了一個(gè)未定義區(qū)域,這更多地反映了預(yù)訓(xùn)練數(shù)據(jù)的分布情況。其中一項(xiàng)改進(jìn)是,我們?cè)陬A(yù)訓(xùn)練階段對(duì)來自互聯(lián)網(wǎng)的最新編程數(shù)據(jù)進(jìn)行了上采樣,而這些數(shù)據(jù)似乎與詞元‘Claude’的關(guān)聯(lián)性更強(qiáng)。事實(shí)上,K2.5在許多基準(zhǔn)測試中似乎都優(yōu)于Claude,例如HLE、BrowseComp、MMMU Pro和MathVision等等?!?/p>



對(duì)于“Kimi Code和Claude Code有什么區(qū)別?為什么Kimi要開發(fā)自己的編程工具?”的問題,楊植麟表示:“我們認(rèn)為我們需要一個(gè)與模型最匹配的框架。但使用Claude Code時(shí),框架會(huì)不斷變化,兼容性有時(shí)會(huì)成為問題。此外,Kimi Code還擁有一些獨(dú)有的功能。我們認(rèn)為video2code(視頻生代碼)非常重要,代表著前端開發(fā)的未來?!?/p>



而被問及“訓(xùn)練VLM的主要挑戰(zhàn)是什么?為什么Kimi如此堅(jiān)定地投入視覺模型的訓(xùn)練?”時(shí),楊植麟給出了深入的技術(shù)解讀:“主要挑戰(zhàn)在于同步提升文本與視覺能力。我們發(fā)現(xiàn),只要配方得當(dāng),兩者可以相互增強(qiáng):在視覺任務(wù)上做RL訓(xùn)練,反而提高了文本知識(shí)基準(zhǔn);反過來,像K2這樣扎實(shí)的文本基礎(chǔ),也是視覺性能的關(guān)鍵?!?/p>

從技術(shù)突破到市場認(rèn)可,再到研發(fā)底層的邏輯拆解,K2.5的出現(xiàn)為國產(chǎn)大模型的發(fā)展提供了全新的思路和樣本。

4、結(jié)束語

中國企業(yè)和開發(fā)者都亟需一個(gè)真正的Clauce平替,“代碼和視覺功能完備+性能全面對(duì)標(biāo)+性價(jià)比優(yōu)勢”。現(xiàn)在看起來,kimi2.5暫時(shí)彌補(bǔ)了這一空缺。但我們還是希望看到更多中國模型可以站起來,讓企業(yè)和開發(fā)者有更多選擇。

*注:文中題圖來自界面圖庫。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這次荷蘭沒話說了!中方正式宣布:更換國內(nèi)供應(yīng)商,從此不再合作

這次荷蘭沒話說了!中方正式宣布:更換國內(nèi)供應(yīng)商,從此不再合作

肖茲探秘說
2026-02-26 17:28:23
不是賈巴里帕克!廣東隊(duì)新大外援曝光,2米18內(nèi)線大殺器成首選?

不是賈巴里帕克!廣東隊(duì)新大外援曝光,2米18內(nèi)線大殺器成首選?

緋雨兒
2026-02-26 14:31:35
王守仁,在深圳病逝

王守仁,在深圳病逝

南方都市報(bào)
2026-02-26 14:59:16
今日激戰(zhàn)!2月26日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

今日激戰(zhàn)!2月26日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀天下
2026-02-26 15:12:33
中戲的招生丑聞,徹底震驚了整個(gè)藝術(shù)圈!

中戲的招生丑聞,徹底震驚了整個(gè)藝術(shù)圈!

南權(quán)先生
2026-02-24 15:52:36
盈利暴跌95%卻豪擲236億搶地王!越秀地產(chǎn)這是賭命還是瘋了?

盈利暴跌95%卻豪擲236億搶地王!越秀地產(chǎn)這是賭命還是瘋了?

達(dá)文西看世界
2026-02-26 17:49:48
獄友問我怎么進(jìn)來的,我:貪10個(gè)億。獄警上來就是一腳:裝什么

獄友問我怎么進(jìn)來的,我:貪10個(gè)億。獄警上來就是一腳:裝什么

懸案解密檔案
2026-02-26 15:34:48
美國駐華大使抵京上任,落地后第一句話讓中國不再對(duì)他抱有幻想

美國駐華大使抵京上任,落地后第一句話讓中國不再對(duì)他抱有幻想

娛樂小可愛蛙
2026-02-26 17:42:31
男子春節(jié)聚餐喝一兩白酒后,不幸去世,家屬把一桌人都給告了!

男子春節(jié)聚餐喝一兩白酒后,不幸去世,家屬把一桌人都給告了!

張曉磊
2026-02-25 11:27:56
徹底決裂了!

徹底決裂了!

安安說
2026-02-26 11:00:55
中產(chǎn)階級(jí)的公主夢(mèng)破碎了。

中產(chǎn)階級(jí)的公主夢(mèng)破碎了。

微微熱評(píng)
2026-02-13 22:21:29
多接觸女性的隱秘好處:第2個(gè),90%的男人一輩子都沒意識(shí)到

多接觸女性的隱秘好處:第2個(gè),90%的男人一輩子都沒意識(shí)到

風(fēng)起見你
2026-02-26 10:55:00
都說不去日本,春節(jié)赴日的卻是這群人!日媒暗訪揭開真相

都說不去日本,春節(jié)赴日的卻是這群人!日媒暗訪揭開真相

壹知眠羊
2026-02-25 22:18:18
“書記,你一件沖鋒衣頂農(nóng)民一年收成!”女選調(diào)生下鄉(xiāng),卻被威脅

“書記,你一件沖鋒衣頂農(nóng)民一年收成!”女選調(diào)生下鄉(xiāng),卻被威脅

妍妍教育日記
2026-02-04 18:29:23
明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

最美的開始
2026-02-24 19:00:14
東北男子養(yǎng)鹿破產(chǎn),賭氣放生了30頭鹿,8年后上山,眼前一幕卻讓他淚崩了...

東北男子養(yǎng)鹿破產(chǎn),賭氣放生了30頭鹿,8年后上山,眼前一幕卻讓他淚崩了...

品讀時(shí)刻
2026-02-14 09:03:05
氣質(zhì)軟綿綿別演大俠,《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾!

氣質(zhì)軟綿綿別演大俠,《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾!

娛樂圈筆娛君
2026-02-24 18:16:13
如果你要更換戶口本,更換時(shí),記得多問一句話,不然怕你會(huì)后悔

如果你要更換戶口本,更換時(shí),記得多問一句話,不然怕你會(huì)后悔

天氣觀察站
2026-02-25 04:52:25
香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠花費(fèi)千萬為他續(xù)命

香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠花費(fèi)千萬為他續(xù)命

郁郁乎文
2024-07-07 22:25:36
一個(gè)非常不好的消息:中國超2億獨(dú)生子女面臨的非常嚴(yán)峻問題。

一個(gè)非常不好的消息:中國超2億獨(dú)生子女面臨的非常嚴(yán)峻問題。

百態(tài)人間
2026-02-05 15:39:14
2026-02-26 19:04:49
創(chuàng)業(yè)最前線 incentive-icons
創(chuàng)業(yè)最前線
創(chuàng)業(yè)有道·創(chuàng)新中國|長期關(guān)注中國科技創(chuàng)新經(jīng)濟(jì)市場,提供更有價(jià)值的創(chuàng)投科技報(bào)道。
3559文章數(shù) 53578關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補(bǔ)委員的第一位

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補(bǔ)委員的第一位

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財(cái)經(jīng)要聞

人民幣離岸價(jià)升破6.83 什么原因?

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

家居
藝術(shù)
親子
游戲
時(shí)尚

家居要聞

歸隱于都市 慢享自由

藝術(shù)要聞

趙孟頫珍藏的一部《金剛經(jīng)》,曾是南宋皇家至寶,這才叫“最美中國字”!

親子要聞

寶藍(lán)幫助鄰居阿姨照顧寶寶,阿姨送寶藍(lán)玩具感謝寶藍(lán)的照顧~

Xbox用戶遭短信轟炸 官方道歉稱Xbox APP過于熱情

無論幾歲,好心態(tài)萬歲!

無障礙瀏覽 進(jìn)入關(guān)懷版