国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Kimi K2.5來了:楊植麟親自站臺(tái),還能分身出100個(gè)Agent!

0
分享至


作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com

沒坐在實(shí)木茶幾前,沒坐在沙發(fā)里,背景也沒有高雅的綠植映襯,月之暗面的CEO楊植麟在視頻里站著就發(fā)布了Kimi最新的模型K2.5。

而且還是中英文雙語(yǔ)的。

“Hi 大家好,我是植麟?!睏钪谗胝f?!癒2.5是我們目前最強(qiáng)大的模型,它是一個(gè)全能模型,不管是視覺還是文本,對(duì)話還是agent,思考還是非思考——所有這些能力,都集中在這一個(gè)模型里。重要的是,K2.5是一個(gè)開源模型?!?/p>

顯然,一個(gè)瘋狂的模型集體更新季到來了。

而即便如此,在諸多新發(fā)布的模型之間,月之暗面剛剛最新發(fā)布的Kimi K2.5依然區(qū)分度明顯。

根據(jù)Kimi的數(shù)據(jù),K2.5在包括HLE、BrowseComp 和 DeepSearchQA等極具挑戰(zhàn)性的 agent 評(píng)測(cè)中取得了當(dāng)前最佳表現(xiàn)。在編程能力測(cè)試上,它在 SWE-bench Verified 上拿到了 76.8 分,縮小了與頂尖閉源模型之間的差距。多項(xiàng)視覺理解評(píng)測(cè)上也實(shí)現(xiàn)了當(dāng)前最佳效果。


在這些能力指標(biāo)之外,更重要的是,K2.5是至今為止最能充分展現(xiàn)月之暗面特質(zhì)的一代模型:

這家公司一直被寄予厚望的是它的算法研究和產(chǎn)品創(chuàng)新能力,而這代更全面的模型充分展示了這家公司在研究和產(chǎn)品設(shè)計(jì)上很強(qiáng)的少年氣。

1

先看看K2.5的幾個(gè)核心特點(diǎn):

在模型具體單點(diǎn)的能力上,它終于有了視覺能力,可以基于視覺,包括圖片和視頻,進(jìn)行理解和推理。同時(shí)它是一個(gè)all in one架構(gòu)的模型,多模態(tài)和文本、思考和快速回答、代碼和agent能力都統(tǒng)一于一個(gè)模型一身。

在月之暗面一直堅(jiān)信的“模型即產(chǎn)品”思路之下,K2.5這次做了多個(gè)很有新意的功能封裝。

它把視覺和編碼能力結(jié)合,把模型追求的few shots甚至zero shot能力直接體現(xiàn)在Kimi的產(chǎn)品上,你可以用更簡(jiǎn)單的自然語(yǔ)言和更直觀的視覺編輯的方式,比如直接給他一個(gè)你要的產(chǎn)品的視頻,讓它拆解后還原復(fù)刻,比如直接在生成的UI上圈圈改改,就能完成創(chuàng)作和開發(fā)以及修改。

官方給出的一個(gè)用視覺能力復(fù)刻項(xiàng)目的例子

除了前端設(shè)計(jì),伴隨K2.5,Kimi還推出了Kimi Code,可以在終端里直接運(yùn)行,也能集成到 VSCode、Cursor 等主流編輯器中。你可以直接輸入圖片和視頻進(jìn)行編程輔助,而且它還可以自動(dòng)發(fā)現(xiàn)并將你現(xiàn)有的Skills遷移到新的工作流中。

更亮眼的則是此次發(fā)布的但依然在beta階段的多agent能力。Kimi直接通過產(chǎn)品把模型訓(xùn)練出來的“多agent平行與串行調(diào)度能力”封裝提供了出來:

當(dāng)你選擇Agent集群模式,模型開始給你打造一個(gè)專業(yè)團(tuán)隊(duì),100個(gè)agent集群可以同時(shí)并發(fā),串行+并行來完成復(fù)雜任務(wù)。根據(jù)Kimi介紹,這些專項(xiàng) agents 本質(zhì)上都是 K2.5 的“分身”但各自承擔(dān)不同的角色和子任務(wù)。

“沒有任何預(yù)設(shè)的規(guī)則,所有的角色分配和任務(wù)拆解,都由 K2.5 現(xiàn)場(chǎng)即時(shí)決定?!币廊皇悄P屯ㄓ媚芰ψ罱K大過垂直打造工作流的產(chǎn)品思路。

目前Agent 集群功能正在進(jìn)行 Beta 測(cè)試,部分 Kimi 會(huì)員可提前試用,接下來會(huì)逐漸推廣。

而在這一切的底座上,在模型訓(xùn)練方法以及AI技術(shù)演進(jìn)的方向上楊植麟繼續(xù)完善著他scale to AGI的路線。

在訓(xùn)練上,Agent集群對(duì)模型提出新的要求,Kimi為此重構(gòu)了強(qiáng)化學(xué)習(xí)的基建,專門優(yōu)化了訓(xùn)練算法,以確保它能達(dá)到極致的效率和性能。

而從K1.5開始,每一代的模型其實(shí)都在Scale一個(gè)不同的方向,K1.5 是在 token上繼續(xù)Scale,到了agent能力增強(qiáng)的K2,重點(diǎn)scale 思考的步驟,而K2.5 則是對(duì)agent的規(guī)模,也就是多agent的共同協(xié)作能力做Scale,進(jìn)而保持scale的可延續(xù)。

“Scaling Out, Not Just Up.”

2

這次K2.5讓Kimi變成一個(gè)全面的模型,更難得的,是這些背后都有它自己思路清晰的創(chuàng)新思考。

都說scaling law不持續(xù),我就要給你延續(xù)下去,而且是一個(gè)又一個(gè)“新花樣”的延續(xù)。

而且這些Scale的方向后來也都成為了模型研究界在那一階段的主流。此次的多agent其實(shí)再次把a(bǔ)gent swarm擺到了大家面前,這個(gè)“agent蜂巢”的概念提了很久,這次Kimi用一個(gè)模型來把它展示出來,接下來如何提高高并發(fā)、大批量、多樣性以及智能“分身”的能力,會(huì)成為又一個(gè)各大廠商比拼的重點(diǎn)。

在此次的技術(shù)報(bào)告里,Kimi也著重分享了Agent swarm背后的創(chuàng)新。

K2.5使用了一種并行智能體強(qiáng)化學(xué)習(xí)(PARL)的方法進(jìn)行訓(xùn)練,讓模型學(xué)會(huì)自我指導(dǎo)一個(gè)多達(dá)100個(gè)子智能體的蜂群,在最多1500個(gè)協(xié)調(diào)步驟內(nèi)執(zhí)行并行工作流。而這個(gè)過程里無需預(yù)定義角色或手工設(shè)計(jì)的工作流。

PARL其實(shí)包括三個(gè)部分,一個(gè)可訓(xùn)練的編排智能體,負(fù)責(zé)拆解任務(wù),“分身”出可并行化的子任務(wù),這些子任務(wù)由動(dòng)態(tài)實(shí)例化的凍結(jié)子智能體執(zhí)行。

這個(gè)訓(xùn)練過程困難重重,比如當(dāng)你讓它們并行后再串聯(lián)起來時(shí),很可能會(huì)發(fā)現(xiàn)編排器默認(rèn)退化為了單智能體執(zhí)行,于是一切都崩了。Kimi為解決此問題,給PARL采用了分階段獎(jiǎng)勵(lì)塑形,在訓(xùn)練早期鼓勵(lì)并行,并逐步將重心轉(zhuǎn)向任務(wù)成功。


這一套創(chuàng)新帶來很好的效果。在Kimi的內(nèi)部評(píng)估中,Agent Swarm使端到端運(yùn)行時(shí)間縮短80%,并支持更復(fù)雜的長(zhǎng)周期任務(wù)負(fù)載。


在廣泛搜索場(chǎng)景下,相比單智能體執(zhí)行,它將達(dá)成目標(biāo)性能所需的最小關(guān)鍵步驟減少3至4.5倍,且節(jié)省效果隨目標(biāo)提升而擴(kuò)展——通過并行化實(shí)現(xiàn)高達(dá)4.5倍的實(shí)際耗時(shí)縮減。

同時(shí),在多模態(tài)上,它不只是給一個(gè)文本模型補(bǔ)上這個(gè)能力就完事了,它同樣展現(xiàn)了自己對(duì)這個(gè)能力究竟能給人們帶來什么價(jià)值的思考。

眼看人們的創(chuàng)造都已離不開AI卻又逐漸淪陷在AI味兒的模版化里無暇逃離,它就花大力氣去訓(xùn)模型的“美學(xué)品味”。

眼看提示詞工程正變得越來越懸乎,本該簡(jiǎn)潔的AI交互里,它(很多時(shí)候瞎熱鬧)的復(fù)雜性正被反過來用作一種新的FOMO來源,于是Kimi強(qiáng)化了K2.5的意圖理解能力,并且在交互上做文章——

都知道多模態(tài)是必備能力,但Kimi覺得它不該是“目的”本身,而應(yīng)該是一把利刃,加持到Coding的能力上去,這樣能讓更多人平等的享受AI帶來的編程“普惠”紅利,不用陷入提示詞陷阱里去。

有用戶使用K2.5生成的網(wǎng)頁(yè) Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.

Kimi從成立到今天,有一個(gè)地方一直沒變,就是它是一個(gè)最有自己想法的,甚至有時(shí)候讓人感到充滿一股中二氣質(zhì)和熱血感的模型公司。

一個(gè)很有意思的地方是,當(dāng)這個(gè)多agent調(diào)用時(shí),它會(huì)給不同agent起名字,在一個(gè)案例里,這些agent的名字中二氣十足:


比起在榜單上對(duì)閉源模型的逼近,其實(shí)今天我們更需要的沒有被困在某個(gè)階段或是困在原地的模型和公司們,它們能讓人看到繼續(xù)打破一些桎梏往前走的希望,讓人看到一些少年氣,這真的很重要。


點(diǎn)個(gè)愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中已經(jīng)提前收到了消息,伊朗這次基本上難逃此劫了?風(fēng)暴正在逼近

中已經(jīng)提前收到了消息,伊朗這次基本上難逃此劫了?風(fēng)暴正在逼近

小莜讀史
2026-03-01 02:15:50
男子走失25年后漂洋過?;貒?guó)認(rèn)親:第一次用微信支付買了兒時(shí)吃過的冰糖葫蘆,賬號(hào)注冊(cè)1小時(shí)粉絲已破7000

男子走失25年后漂洋過海回國(guó)認(rèn)親:第一次用微信支付買了兒時(shí)吃過的冰糖葫蘆,賬號(hào)注冊(cè)1小時(shí)粉絲已破7000

極目新聞
2026-02-28 17:53:15
永遠(yuǎn)不要向任何人,包括你的親戚和好友,透露你真實(shí)的財(cái)務(wù)狀況

永遠(yuǎn)不要向任何人,包括你的親戚和好友,透露你真實(shí)的財(cái)務(wù)狀況

流蘇晚晴
2026-02-27 18:09:29
俄軍已經(jīng)動(dòng)了,中國(guó)幫不幫伊朗?中方三句話,沒一句是美國(guó)想聽的

俄軍已經(jīng)動(dòng)了,中國(guó)幫不幫伊朗?中方三句話,沒一句是美國(guó)想聽的

墨蘭史書
2026-02-27 18:42:48
以方消息稱伊朗政府所有高級(jí)官員都是襲擊目標(biāo)

以方消息稱伊朗政府所有高級(jí)官員都是襲擊目標(biāo)

財(cái)聯(lián)社
2026-02-28 15:29:11
中國(guó)男籃vs中國(guó)臺(tái)北時(shí)間已定!CCTV5直播,省隊(duì)球員賽前放出狠話

中國(guó)男籃vs中國(guó)臺(tái)北時(shí)間已定!CCTV5直播,省隊(duì)球員賽前放出狠話

籃球?qū)^(qū)
2026-02-28 20:36:42
浙江一男子口頭勸醉酒朋友別開車后離開,朋友幾分鐘后駕車身亡;法院:死者屬嚴(yán)重醉酒狀態(tài),不應(yīng)僅限于口頭提醒,男子被判賠9.5萬余元

浙江一男子口頭勸醉酒朋友別開車后離開,朋友幾分鐘后駕車身亡;法院:死者屬嚴(yán)重醉酒狀態(tài),不應(yīng)僅限于口頭提醒,男子被判賠9.5萬余元

揚(yáng)子晚報(bào)
2026-02-28 11:21:00
巴基斯坦宣戰(zhàn)!塔利班瘋狂報(bào)復(fù)?中國(guó)看在眼中,緊急下場(chǎng)表態(tài)!

巴基斯坦宣戰(zhàn)!塔利班瘋狂報(bào)復(fù)?中國(guó)看在眼中,緊急下場(chǎng)表態(tài)!

Ck的蜜糖
2026-03-01 02:00:54
“??颇猩跑?小時(shí)”事件,被全網(wǎng)嘲笑:無知的人連裝都不會(huì)裝

“??颇猩跑?小時(shí)”事件,被全網(wǎng)嘲笑:無知的人連裝都不會(huì)裝

妍妍教育日記
2026-02-26 20:37:12
1.2億農(nóng)村老人,每月只領(lǐng)200元養(yǎng)老金,買兩袋米就沒了。

1.2億農(nóng)村老人,每月只領(lǐng)200元養(yǎng)老金,買兩袋米就沒了。

流蘇晚晴
2026-02-26 18:18:15
真干仗了!對(duì)大A、大宗商品有什么影響?2月A股哪些股票持續(xù)創(chuàng)歷史新高?

真干仗了!對(duì)大A、大宗商品有什么影響?2月A股哪些股票持續(xù)創(chuàng)歷史新高?

價(jià)值線傳媒
2026-02-28 17:12:25
價(jià)格戰(zhàn)再次打響!問界“降”7萬,零跑4.6萬!

價(jià)格戰(zhàn)再次打響!問界“降”7萬,零跑4.6萬!

電動(dòng)知家
2026-02-28 19:59:59
獨(dú)來獨(dú)往的人,都是強(qiáng)者嗎?

獨(dú)來獨(dú)往的人,都是強(qiáng)者嗎?

加油丁小文
2026-02-28 16:30:06
伊朗高豐度濃縮鈾儲(chǔ)藏處首次曝光!多處核設(shè)施在蓋新屋頂、用土埋隧道口

伊朗高豐度濃縮鈾儲(chǔ)藏處首次曝光!多處核設(shè)施在蓋新屋頂、用土埋隧道口

紅星新聞
2026-02-28 13:23:18
開火了!承諾放棄核材料不到一天,美國(guó)翻臉,聯(lián)手以色列轟炸伊朗

開火了!承諾放棄核材料不到一天,美國(guó)翻臉,聯(lián)手以色列轟炸伊朗

派大星紀(jì)錄片
2026-02-28 16:53:27
洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

阿龍美食記
2026-02-28 10:49:43
美方要求中方參加中美俄三邊核裁軍談判,外交部:不公平、不合理也不可行!“中國(guó)的核力量同美俄完全不在一個(gè)量級(jí)”

美方要求中方參加中美俄三邊核裁軍談判,外交部:不公平、不合理也不可行!“中國(guó)的核力量同美俄完全不在一個(gè)量級(jí)”

每日經(jīng)濟(jì)新聞
2026-02-27 17:25:20
可打美航母!英媒:中國(guó)或違反聯(lián)合國(guó)規(guī)定,運(yùn)超高音速導(dǎo)彈去伊朗

可打美航母!英媒:中國(guó)或違反聯(lián)合國(guó)規(guī)定,運(yùn)超高音速導(dǎo)彈去伊朗

通鑒史智
2026-02-26 09:20:17
特朗普完全失算,開戰(zhàn)后兩大目標(biāo)一個(gè)都沒實(shí)現(xiàn),伊朗已經(jīng)等來援軍

特朗普完全失算,開戰(zhàn)后兩大目標(biāo)一個(gè)都沒實(shí)現(xiàn),伊朗已經(jīng)等來援軍

蔡蔡說史
2026-03-01 00:32:55
北京賣豆汁大爺爆火,小伙質(zhì)疑里面摻糞,現(xiàn)場(chǎng)直接舉報(bào),當(dāng)場(chǎng)帶走

北京賣豆汁大爺爆火,小伙質(zhì)疑里面摻糞,現(xiàn)場(chǎng)直接舉報(bào),當(dāng)場(chǎng)帶走

離離言幾許
2026-02-26 16:20:55
2026-03-01 03:12:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
2894文章數(shù) 10458關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

伊朗媒體公布反擊美軍軍事行動(dòng)結(jié)果

頭條要聞

伊朗媒體公布反擊美軍軍事行動(dòng)結(jié)果

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財(cái)經(jīng)要聞

沖突爆發(fā) 市場(chǎng)變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
親子
游戲
家居
房產(chǎn)

藝術(shù)要聞

驚艷!這位天使般的女子與油畫讓人心動(dòng)不已!

親子要聞

嬰兒吃的“洋”輔食,九成靠代工貼牌?涉及上市公司

所有人保持嘴角不變!生化危機(jī):安魂曲里昂騷話大盤點(diǎn)

家居要聞

素色肌理 品意式格調(diào)

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

無障礙瀏覽 進(jìn)入關(guān)懷版