国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,楊植麟親自發(fā)布Kimi K2.5開(kāi)源新王:指揮“智能體大軍”,效率暴漲450%

0
分享至


智東西
作者 王涵
編輯 云鵬

智東西1月27日?qǐng)?bào)道,今天,月之暗面Kimi開(kāi)源了新模型——K2.5,楊植麟還特別發(fā)視頻親自介紹。

楊植麟分享稱(chēng),K2.5是Kimi迄今為止最強(qiáng)大的模型。面對(duì)復(fù)雜任務(wù)時(shí),Kimi K2.5可自主調(diào)度包含多達(dá)100個(gè)子智能體的集群,并行執(zhí)行最高1500次工具調(diào)用。

相較于單智能體模式,其任務(wù)執(zhí)行效率提升最高達(dá)4.5倍。整個(gè)Agent集群由K2.5模型全自動(dòng)創(chuàng)建與協(xié)調(diào),無(wú)需任何預(yù)定義子智能體或工作流。該模型以Kimi K2為基礎(chǔ)技術(shù)架構(gòu),在原有架構(gòu)之上進(jìn)行了持續(xù)的預(yù)訓(xùn)練優(yōu)化,且訓(xùn)練過(guò)程中學(xué)習(xí)、融合了約15萬(wàn)億個(gè)“視覺(jué)+文本”混合形式的訓(xùn)練數(shù)據(jù)單元。

▲K2.5模型開(kāi)源頁(yè)面(來(lái)源:Hugging Face)

基準(zhǔn)測(cè)試上,在Agents方面,HLE-Full(綜合推理)、BrowseComp(瀏覽交互)、DeepSearchQA(深度搜索問(wèn)答)三個(gè)基準(zhǔn)測(cè)試中K2.5得分均位列第一;在編碼方面,K2.5在SWE-Bench Verified、SWE-Bench Multilingual兩項(xiàng)中均排名第一;在圖像多模態(tài)方面,K2.5在文檔理解測(cè)試mniDocBench 1.5中得分88.8,為第一名。


▲K2.5模型基準(zhǔn)測(cè)試

在Agent基準(zhǔn)測(cè)試HLE、BrowseComp和SWE-Veried中,K2.5與GPT-5.2(xhigh)相比,在性能逼近的同時(shí)成本更低。


▲K2.5模型性?xún)r(jià)比對(duì)比

外網(wǎng)網(wǎng)友對(duì)Kimi K2.5模型的評(píng)價(jià)可以說(shuō)是好評(píng)如潮。FireworksAI聯(lián)合創(chuàng)始人兼首席技術(shù)官Dmytro Dzhulgakov評(píng)論稱(chēng)“Kimi K2.5=開(kāi)源SOTA推理+視覺(jué)+256K 上下文+智能體編碼”。


▲外網(wǎng)網(wǎng)友評(píng)價(jià)(來(lái)源:X)

Thrive Protocol AI與數(shù)據(jù)工程師、Ethers Club播客主持人0xSero說(shuō)(他用)Kimi創(chuàng)建了新的網(wǎng)站頁(yè)面。


▲外網(wǎng)網(wǎng)友評(píng)價(jià)(來(lái)源:X)

KEA Research協(xié)作平臺(tái)創(chuàng)立者Stanislaw則評(píng)價(jià)Kimi看起來(lái)十分有潛力。


▲外網(wǎng)網(wǎng)友評(píng)價(jià)(來(lái)源:X)

除了K2.5模型外,針對(duì)軟件工程場(chǎng)景,Kimi團(tuán)隊(duì)還推出了編程產(chǎn)品Kimi Code。Kimi Code可直接在終端運(yùn)行,并支持與VSCode、Cursor、Zed等主流IDE集成。該產(chǎn)品已開(kāi)源,支持圖像與視頻輸入,還能自動(dòng)發(fā)現(xiàn)現(xiàn)有技能及MCP協(xié)議并遷移至Kimi Code工作環(huán)境。

價(jià)格上,K2.5模型API輸入(每百萬(wàn)Token)4元,緩存輸入0.7元;輸出(每百萬(wàn)Token)21元。


▲K2.5模型API價(jià)格

K2.5模型提供了四種模式:

1、快速模式:提供最快的響應(yīng)體驗(yàn);

2、思考模式:可以用來(lái)解答復(fù)雜問(wèn)題;

3、Agent模式:擅長(zhǎng)深度研究、PPT、Excel、Word、PDF和網(wǎng)頁(yè)生成等任務(wù);

4、Agent集群模式:適合需要并行處理的復(fù)雜任務(wù)。


▲K2.5模型主頁(yè)

開(kāi)源地址:

Hugging Face:

https://huggingface.co/moonshotai/Kimi-K2.5

魔搭社區(qū):

https://modelscope.cn/models/moonshotai/Kimi-K2.5

一、幾句話生成能交互的動(dòng)態(tài)網(wǎng)頁(yè)界面,K2.5降低視覺(jué)表達(dá)門(mén)檻

在Kimi團(tuán)隊(duì)內(nèi)部編程基準(zhǔn)測(cè)試集Kimi Code Bench中,K2.5在多語(yǔ)言環(huán)境下從構(gòu)建、調(diào)試、重構(gòu)、測(cè)試到腳本編寫(xiě)的端到端任務(wù)上均較K2有所增強(qiáng)。


▲內(nèi)部編程基準(zhǔn)測(cè)試集Kimi Code Bench

楊植麟稱(chēng),Kimi團(tuán)隊(duì)不只是想讓K2.5學(xué)會(huì)寫(xiě)代碼,更希望它具備設(shè)計(jì)審美。在前端開(kāi)發(fā)領(lǐng)域,K2.5能將簡(jiǎn)單對(duì)話轉(zhuǎn)化為完整的前端界面,可以做出像專(zhuān)業(yè)設(shè)計(jì)師出品一樣,有高級(jí)審美和動(dòng)效的網(wǎng)頁(yè),就像這樣:

在視覺(jué)編程方面,通過(guò)對(duì)圖像與視頻的推理,K2.5的圖像/視頻轉(zhuǎn)代碼生成與視覺(jué)調(diào)試能力增強(qiáng),降低了用戶通過(guò)視覺(jué)表達(dá)創(chuàng)意的門(mén)檻,直接上傳一個(gè)錄屏,就可以重建網(wǎng)頁(yè)。

此能力源于K2.5的大規(guī)模視覺(jué)-文本聯(lián)合預(yù)訓(xùn)練。當(dāng)數(shù)據(jù)規(guī)模足夠龐大時(shí),視覺(jué)與文本能力實(shí)現(xiàn)同步提升。

K2.5還可以通過(guò)代碼推理謎題并標(biāo)記最短路徑:


二、自主調(diào)動(dòng)1500個(gè)協(xié)調(diào)步驟,K2.5端到端運(yùn)行時(shí)間縮短80%

半年前,Kimi發(fā)布了首個(gè)萬(wàn)億參數(shù)開(kāi)源Agent模型Kimi K2。隨后推出的Kimi K2 Thinking,通過(guò)增加思考時(shí)間,具備了獨(dú)立完成長(zhǎng)達(dá)300步操作的長(zhǎng)程任務(wù)能力,但這還不夠。

通過(guò)并行智能體強(qiáng)化學(xué)習(xí)(PARL)訓(xùn)練,K2.5模型學(xué)會(huì)了自主調(diào)度最多100個(gè)子智能體組成的集群,并行執(zhí)行最多1500個(gè)協(xié)調(diào)步驟的工作流,整個(gè)過(guò)程無(wú)需預(yù)定義角色或人工設(shè)計(jì)工作流。

可以說(shuō),K2.5是從“單個(gè)專(zhuān)家”升級(jí)為了一個(gè)“專(zhuān)業(yè)團(tuán)隊(duì)”。


▲K2.5 Agent集群結(jié)構(gòu)

K2.5 Agent集群通過(guò)并行、專(zhuān)門(mén)化的執(zhí)行方式能夠提升復(fù)雜任務(wù)的性能。在Kimi團(tuán)隊(duì)內(nèi)部評(píng)估中,其能夠?qū)⒍说蕉诉\(yùn)行時(shí)間縮短80%,同時(shí)支持更復(fù)雜、更長(zhǎng)期的工作負(fù)載。


▲Kimi團(tuán)隊(duì)內(nèi)部評(píng)估

在廣泛搜索場(chǎng)景中,與單智能體執(zhí)行相比,Agent集群可以將達(dá)到目標(biāo)性能所需的最小關(guān)鍵步驟減少至原先的1/4到1/5.5。通過(guò)并行化,Agent集群實(shí)際運(yùn)行時(shí)間最多可減少至原先的1/5.5。


▲運(yùn)行時(shí)間對(duì)比

在實(shí)際任務(wù)中,例如在大規(guī)模并行處理方面,面對(duì)在100個(gè)細(xì)分領(lǐng)域中找出排名前三的YouTube創(chuàng)作者的任務(wù),K2.5 Agent集群首先研究并定義每個(gè)領(lǐng)域,然后自主創(chuàng)建100個(gè)子智能體進(jìn)行并行搜索。

每個(gè)子智能體在其分配的細(xì)分領(lǐng)域內(nèi)識(shí)別出領(lǐng)先的創(chuàng)作者,并將結(jié)果匯總到一個(gè)結(jié)構(gòu)化的電子表格中。

在大規(guī)模使用工具方面,K2.5 Agent集群僅憑一張結(jié)婚照,就能啟動(dòng)20個(gè)并行子智能體,生成符合當(dāng)?shù)匚幕尘暗娜蚧槎Y旅行場(chǎng)景,并將它們整合到一個(gè)具有統(tǒng)一身份和服飾的互動(dòng)網(wǎng)頁(yè)中。

此外,在規(guī);a(chǎn)出方面,K2.5 Agent集群可以將一項(xiàng)涵蓋40篇社會(huì)心理學(xué)論文的文獻(xiàn)綜述任務(wù)分解為多個(gè)專(zhuān)注于寫(xiě)作的子智能體。

每個(gè)子智能體負(fù)責(zé)綜述的特定部分,它們的輸出最終被綜合成一份100頁(yè)的雙欄學(xué)術(shù)文檔,其中包含格式完整的引文和參考文獻(xiàn)。

最后,在大規(guī)模下載方面,K2.5 Agent集群能夠調(diào)度多個(gè)具有專(zhuān)業(yè)分工的子智能體,共同協(xié)作處理保羅·格雷厄姆(Paul Graham)的文章。這些子智能體分別負(fù)責(zé)搜索、下載、分類(lèi)、總結(jié)與匯編任務(wù)。

在協(xié)同工作下,系統(tǒng)將超過(guò)200篇原始文章按主題整理至6個(gè)分類(lèi)文件夾,并生成了一份結(jié)構(gòu)清晰的綜合摘要報(bào)告。報(bào)告中所有引用均明確標(biāo)注了對(duì)應(yīng)的原始文章來(lái)源。


三、AI辦公質(zhì)量提升近60%,K2.5能處理大規(guī)模辦公任務(wù)

不僅如此,K2.5已經(jīng)開(kāi)始熟練掌握Office套件的核心技能。

其能夠端到端處理高密度、大規(guī)模的辦公任務(wù),該模型能解析大規(guī)模高密度輸入,協(xié)調(diào)多步驟工具使用,并通過(guò)直接對(duì)話生成專(zhuān)業(yè)級(jí)輸出成果,包括Word、Excel、PPT和PDF。

KImi團(tuán)隊(duì)針對(duì)真實(shí)職場(chǎng)場(chǎng)景,設(shè)計(jì)了兩套內(nèi)部專(zhuān)家生產(chǎn)力基準(zhǔn)測(cè)試。AI辦公基準(zhǔn)測(cè)試評(píng)估端到端的辦公輸出質(zhì)量,而通用智能體基準(zhǔn)測(cè)試則以人類(lèi)專(zhuān)家表現(xiàn)為標(biāo)準(zhǔn),衡量多步驟生產(chǎn)級(jí)工作流的表現(xiàn)。

在這兩項(xiàng)測(cè)試中,在兩項(xiàng)基準(zhǔn)測(cè)試中,K2.5的性能分別比K2 Thinking提升了59.3%24.3%。


▲kimi內(nèi)部專(zhuān)家生產(chǎn)力基準(zhǔn)測(cè)試

K2.5智能體支持高級(jí)辦公任務(wù),例如在Word中添加批注、使用數(shù)據(jù)透視表構(gòu)建財(cái)務(wù)模型、在PDF中編寫(xiě)LaTeX公式,并能處理長(zhǎng)達(dá)萬(wàn)字的論文或百頁(yè)文檔等長(zhǎng)篇輸出。

例如生成包含圖片的100個(gè)鏡頭的分鏡腳本表格:

給技術(shù)報(bào)告增添行內(nèi)注釋?zhuān)?/p>

從數(shù)據(jù)中提取30個(gè)帶密碼的工資單PDF文件:


結(jié)語(yǔ):月之暗面或?qū)⒅囟嗄B(tài)及智能體集群能力

一周前,市場(chǎng)還在為月之暗面在20天內(nèi)估值暴漲約34億人民幣的消息而驚嘆。一周后,這家北京AI獨(dú)角獸就開(kāi)源了新模型。

此次開(kāi)源的K2.5模型,最亮眼的就是其“智能體集群”能力,將AI從執(zhí)行單一指令的工具,升級(jí)為能自主調(diào)度、并行處理上千步驟的“團(tuán)隊(duì)”,而這正直指企業(yè)級(jí)應(yīng)用的核心痛點(diǎn):復(fù)雜、高成本、長(zhǎng)周期的知識(shí)工作流程自動(dòng)化。

整體來(lái)看,這是一次聚焦于提升模型實(shí)際效能、擴(kuò)展多模態(tài)能力的技術(shù)迭代。此次發(fā)布展示了月之暗面近期的研發(fā)重心與成果,此前曝光的新融資或?yàn)檫@類(lèi)深度研發(fā)提供更多支持。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“矮大緊”事后補(bǔ)料,“牢A”理論更扎實(shí)!

“矮大緊”事后補(bǔ)料,“牢A”理論更扎實(shí)!

達(dá)文西看世界
2026-01-22 10:52:23
省會(huì)議通過(guò)!湛江今年大項(xiàng)目工程有以下100個(gè)!

省會(huì)議通過(guò)!湛江今年大項(xiàng)目工程有以下100個(gè)!

湛江朋友
2026-01-27 19:13:24
登陸英超!U23國(guó)足隊(duì)長(zhǎng)攜女友已抵英國(guó) 6隊(duì)友祝福:加油狼隊(duì)球員

登陸英超!U23國(guó)足隊(duì)長(zhǎng)攜女友已抵英國(guó) 6隊(duì)友祝福:加油狼隊(duì)球員

我愛(ài)英超
2026-01-26 10:02:13
國(guó)防部新聞發(fā)言人蔣斌就近期涉軍問(wèn)題發(fā)布消息

國(guó)防部新聞發(fā)言人蔣斌就近期涉軍問(wèn)題發(fā)布消息

中國(guó)軍視網(wǎng)
2026-01-24 15:55:20
西甲瘋狂夜!巴薩反超皇馬登頂,馬競(jìng)連勝?zèng)_刺榜首!

西甲瘋狂夜!巴薩反超皇馬登頂,馬競(jìng)連勝?zèng)_刺榜首!

籃球看比賽
2026-01-27 12:50:14
九一三事件后,許世友之女因被林立果拒,執(zhí)意終生不嫁令人淚目

九一三事件后,許世友之女因被林立果拒,執(zhí)意終生不嫁令人淚目

嘮叨說(shuō)歷史
2026-01-21 15:04:49
局勢(shì)驟緊!美軍航母就位,伊朗立巨幅畫(huà)暗指航母被炸,特朗普:若遭暗殺,將把伊朗“從地球上抹去”

局勢(shì)驟緊!美軍航母就位,伊朗立巨幅畫(huà)暗指航母被炸,特朗普:若遭暗殺,將把伊朗“從地球上抹去”

每日經(jīng)濟(jì)新聞
2026-01-27 21:56:52
在美國(guó)買(mǎi)了房,房子是你的不假一旦你無(wú)力負(fù)擔(dān)房產(chǎn)稅照樣無(wú)家可歸

在美國(guó)買(mǎi)了房,房子是你的不假一旦你無(wú)力負(fù)擔(dān)房產(chǎn)稅照樣無(wú)家可歸

忠于法紀(jì)
2025-12-23 21:02:38
3500萬(wàn)賣(mài)出22歲希望之星:瓜帥前鋒人手太多,只好放棄培養(yǎng)他

3500萬(wàn)賣(mài)出22歲希望之星:瓜帥前鋒人手太多,只好放棄培養(yǎng)他

里芃芃體育
2026-01-27 05:00:03
關(guān)鍵時(shí)刻還得依靠杜蘭特!火箭對(duì)他的依賴(lài)程度似乎越來(lái)越高了?

關(guān)鍵時(shí)刻還得依靠杜蘭特!火箭對(duì)他的依賴(lài)程度似乎越來(lái)越高了?

稻谷與小麥
2026-01-27 23:20:30
瓜帥:我一直尊重裁判從未批評(píng)他們,但我必須捍衛(wèi)我的俱樂(lè)部

瓜帥:我一直尊重裁判從未批評(píng)他們,但我必須捍衛(wèi)我的俱樂(lè)部

懂球帝
2026-01-27 22:34:52
勁爆利好炸場(chǎng)!半導(dǎo)體全線暴漲

勁爆利好炸場(chǎng)!半導(dǎo)體全線暴漲

君臨財(cái)富
2026-01-27 22:29:15
不是,廣州舊改,開(kāi)年就玩這么大啊

不是,廣州舊改,開(kāi)年就玩這么大啊

廣州PLUS
2026-01-27 17:55:21
身高1米8的小孩哥!網(wǎng)友調(diào)侃:再大也是個(gè)寶寶

身高1米8的小孩哥!網(wǎng)友調(diào)侃:再大也是個(gè)寶寶

另子維愛(ài)讀史
2026-01-26 22:45:09
黃金與白銀在刷新歷史高點(diǎn)后大幅回調(diào)

黃金與白銀在刷新歷史高點(diǎn)后大幅回調(diào)

每日經(jīng)濟(jì)新聞
2026-01-27 05:38:36
中南大學(xué)湘雅醫(yī)院打造“白天治療 晚上回家”的診療模式

中南大學(xué)湘雅醫(yī)院打造“白天治療 晚上回家”的診療模式

中國(guó)青年報(bào)
2026-01-26 21:02:09
臨近年關(guān),輕松“拿捏”霍啟剛的郭晶晶,竟意外走上了倪萍的老路

臨近年關(guān),輕松“拿捏”霍啟剛的郭晶晶,竟意外走上了倪萍的老路

三石記
2026-01-26 18:59:23
美國(guó)中產(chǎn)斬殺線,到底誰(shuí)在幸災(zāi)樂(lè)禍

美國(guó)中產(chǎn)斬殺線,到底誰(shuí)在幸災(zāi)樂(lè)禍

冰川思想庫(kù)
2025-12-29 10:56:56
地下戀真相大白10個(gè)月,劉亦菲官宣喜訊,網(wǎng)友:恭喜終于等到這天

地下戀真相大白10個(gè)月,劉亦菲官宣喜訊,網(wǎng)友:恭喜終于等到這天

離離言幾許
2026-01-27 21:26:37
汽車(chē)圈“大地震”!比亞迪大將投奔行業(yè)巨頭,叫囂:三年內(nèi)沒(méi)對(duì)手

汽車(chē)圈“大地震”!比亞迪大將投奔行業(yè)巨頭,叫囂:三年內(nèi)沒(méi)對(duì)手

長(zhǎng)星寄明月
2026-01-20 21:00:46
2026-01-28 00:20:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11133文章數(shù) 116945關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會(huì)講話透露了哪些關(guān)鍵信息

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對(duì)手現(xiàn)學(xué)?

娛樂(lè)要聞

張雨綺風(fēng)波持續(xù)發(fā)酵,曝多個(gè)商務(wù)被取消

財(cái)經(jīng)要聞

多地對(duì)壟斷行業(yè)"近親繁殖"出手了

汽車(chē)要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗(yàn)車(chē)下線

態(tài)度原創(chuàng)

房產(chǎn)
親子
游戲
公開(kāi)課
軍事航空

房產(chǎn)要聞

實(shí)景兌現(xiàn)在即!綠城,在海棠灣重新定義終極旅居想象!

親子要聞

雙職工家庭,孩子上幼兒園后,無(wú)老人幫忙,夫妻倆能獨(dú)立帶娃嗎?

《生化危機(jī)9》注定能成功!避開(kāi)了開(kāi)放世界的坑

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美海軍"林肯"號(hào)航母打擊群抵達(dá)中東地區(qū)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版