国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測Kimi K2.5:召喚 100 個 AI 同時干活,這就是 Agent的「蜂群時刻」

0
分享至

  Kimi K2.5 帶來了一個「蜂群時刻」。

  這兩天 K2.5 的更新在海內(nèi)外都賺足了討論,一個原生多模態(tài)模型,提供了最先進的編碼和視覺功能,以及自主智能體集群范式——召喚一群 agent 過來完成任務(wù),聽上去也太酷了。

  如果你還沒體驗過,快來參與本期的福利放送:Kimi 和 APPSO 給大家準備了一批 Kimi Agent 日卡福利,包括24 小時會員+ 3 次集群功能使用,專屬鏈接稍后會掉落在留言區(qū),先到先得,期待大家體驗后回來與我們分享使用感受。

  

  技能多 Agent,好酷炫好好玩

  K2.5 目前已經(jīng)全量推出,客戶端即可使用。K2.5 Agent 有免費體驗次數(shù),而 K2.5 集群則是付費功能,目前只對 Allegretto 計劃。訂閱了也有點數(shù)限額:每個月起步 47 點,每次任務(wù)消耗 3 點。

  總體上是夠用的,作為 Kimi 老用戶,當然是買,買它。正好手邊有一堆文件需要合并,懶得手動復制粘貼了,就發(fā)給 Kimi 打開集群模式讓它統(tǒng)一處理。

  

  集群模型下,Kimi 還給這個地方加了個設(shè)計:會有一個工牌掉落下來,你可以看到是哪位「負責人」在執(zhí)行任務(wù)。

  

  合并文檔最終的效果不錯,而且我還進一步提出讓它整理和調(diào)整各個層級的小標題,它可以實現(xiàn)先分析、提方案、再執(zhí)行的鏈路。不過最好是下載到本地檢查格式,Kimi 自帶的預覽功能,有時候不能準確反映當輪次的修改效果。

  為了進一步看它的多并發(fā)操作,我參考官方 demo,測試了一個任務(wù):檢索近三個月內(nèi)所有關(guān)于集群式 agent 的文獻,然后整理到一個 excel 表格里,提煉核心發(fā)現(xiàn)和研究創(chuàng)新點。

  

  這次安排的「人員」就比較多了,各個 agent 紛紛趕來支援,每個人都有自己分配到的任務(wù)。

  

  這個的耗時明顯比之前要長了很多,但沒關(guān)系,可以先掛機讓它自己跑。同時,我又安排了一個考察多模態(tài)能力的任務(wù)。

  

  這是上傳給 Kimi 的原始素材圖,視頻版中有更多動效。Kimi 要做的是把這個設(shè)計,轉(zhuǎn)換為網(wǎng)頁,而且保留所有的設(shè)計元素、風格。

  

  Prompt 寫得簡單,但實際工作是復雜的:既要識別、理解,又要生圖,還要寫前端。

  這個任務(wù)也花了比較長的時間,但最終效果很好。有一些小細節(jié)上的問題,比如圖片排版、懸停和跳轉(zhuǎn)等 bug。不過核心的設(shè)計元素都保留了,并且網(wǎng)頁功能也完備。

  

  再回頭來看,文獻檢索的任務(wù)也好了,整整齊齊列了一個 excel 出來:

  

  最后一個測試任務(wù)是:上小紅書找達人,要求是數(shù)碼博主,粉絲量大于 5000,累計筆記多于 100 條。這兩個條件其實很寬松,真的找起來范圍很大。

  

  Kimi 碰到的第一個問題是:進不去小紅書。其實這里可以主動詢問用戶,類似 GPT agent 會用的辦法。

  但并沒有,Kimi 轉(zhuǎn)而去了新榜抓數(shù)據(jù),這樣既繞開了網(wǎng)頁權(quán)限,又能直接讀取數(shù)字。這不算是個很好的策略,最后只能抓出來數(shù)量很少的博主,顯然小紅書上不可能只有這些。另外,被擋在平臺外,也無法體現(xiàn) Kimi 的視覺能力,畢竟抓取的都是現(xiàn)成的數(shù)字。

  

  不過總體上,Swarm Agent 給人一種踏實感。這些工作單體 agent 能不能做?自然是可以,只是要花時間、錯漏多。而一群人來做,更加的令人安心。

  創(chuàng)「新」在哪里?

  說到這里,你可能會問:這不就是 Multi-Agent(多智能體)嗎?很多公司都在做啊。

  關(guān)鍵區(qū)別在于「誰來當老板」。

  在傳統(tǒng)的 Multi-Agent 系統(tǒng)中,人類需要預先設(shè)計好整個工作流程:誰負責什么、誰先誰后、結(jié)果怎么匯總。就像搭積木一樣,你得先把圖紙畫好。而 Agent Swarm 的核心創(chuàng)新在于——AI 自己就是設(shè)計師。

  Kimi 團隊用了一種叫 PARL(Parallel-Agent Reinforcement Learning,并行代理強化學習)的訓練方法,讓模型學會了「分解任務(wù)」和「調(diào)度資源」的能力。你不需要告訴它「先派 3 個人去搜資料、再派 2 個人去寫總結(jié)」,它自己就能判斷:這個任務(wù)適合拆成幾份?每份派誰去做?什么時候該并行、什么時候該串行?

  換句話說,Multi-Agent 是「人類編排的交響樂團」,Agent Swarm 是 AI 自己組隊的爵士樂。

  

  還有一個容易混淆的概念是 MoE:Mixture of Experts,混合專家模型。主流大模型內(nèi)部都用了 MoE 架構(gòu),但它們和 Agent Swarm 完全是兩回事。

  MoE 發(fā)生在模型內(nèi)部。你可以把它理解為:模型里住著一群「專家」,每次處理任務(wù)時,模型會動態(tài)決定激活哪幾個專家來參與。但這些專家沒有獨立的身份,也不會互相協(xié)作,它們只是模型內(nèi)部的不同計算路徑。

  Agent Swarm 發(fā)生在模型外部。每個子 Agent 都是一個相對獨立的執(zhí)行單元,有自己的任務(wù)目標,可以并行運行,甚至可以調(diào)用工具(比如搜索網(wǎng)頁、寫代碼)。它們之間是真正的「協(xié)作關(guān)系」,而不是簡單的「激活關(guān)系」。

  用個不太嚴謹?shù)谋扔鳎篗oE 像是一個人的大腦里分區(qū)工作,Agent Swarm 像是一個公司里的團隊協(xié)作。

  從實測和官方演示來看,Agent Swarm 至少在以下幾類任務(wù)上表現(xiàn)出色:

  第一類是大規(guī)模信息收集。 比如官方案例中 100 個領(lǐng)域創(chuàng)作者調(diào)研,以及我們這次實測的小紅書博主檢索。處理這類任務(wù)的共同特點是「可并行」——每個子任務(wù)相對獨立,不需要太多中間協(xié)調(diào)。

  

  第二類是視覺+代碼的復雜任務(wù)。 Kimi K2.5 強調(diào)自己是「原生多模態(tài)」模型,能看懂圖片和視頻。結(jié)合 Agent Swarm 后,它可以一邊分析 UI 截圖,一邊派不同 Agent 分別處理布局、樣式、交互邏輯,最后生成完整的前端代碼。

  

  第三類是長文檔處理。 官方提到,Kimi Agent 可以處理「1 萬字的論文或 100 頁的文檔」,支持 Word 批注、Excel 透視表、LaTeX 公式等高級功能。Agent Swarm 可以把長文檔拆成多個章節(jié),讓不同 Agent 并行處理,再匯總成統(tǒng)一格式——正如最開始的實測案例一樣。

  不過,別急著興奮,Agent Swarm 并非「開了掛」。在實際使用中,你會發(fā)現(xiàn)幾個明顯的邊界:

  第一,任務(wù)本身得「可拆」。 如果任務(wù)步驟之間有強依賴關(guān)系——比如「先想清楚論點,再去找證據(jù),最后才能寫結(jié)論」——強行并行反而會幫倒忙。

  第二,成本會顯著上升。 100 個 Agent 同時工作,意味著 100 倍的 API 調(diào)用。雖然總時間縮短了,但 Token 消耗是實打?qū)嵉摹?/p>

  第三,質(zhì)量不一定比單 Agent 好。 在某些需要深度推理的任務(wù)上,比如數(shù)學證明、復雜編程題,單 Agent 的「深度思考模式」反而更可靠。Agent Swarm 的優(yōu)勢在于「廣度」和「速度」,而不是「深度」。實測下來,部分任務(wù) Kimi 會自動調(diào)劑成單 Agent 模型,這點 Kimi 團隊成員也在 reddit 的線上問答里得到了證實。

  

  Kimi 團隊眼中的未來

  從目前的使用體驗來看,集群還可以繼續(xù)提升,包括但不限于:

  更智能的調(diào)度:目前的 Agent Swarm 已經(jīng)能自動分解任務(wù)和創(chuàng)建 Agent,但調(diào)度策略還比較「粗粒度」。未來有希望能建立更精細的資源分配——比如根據(jù)任務(wù)的緊急程度、復雜度、依賴關(guān)系,動態(tài)決定「派多少人、干多久」。

  更深度的協(xié)作:現(xiàn)在的子Agent之間交流有限,主要是「各自干完活,把結(jié)果交給老大匯總」。未來可能會支持子Agent之間的直接協(xié)作,比如「AAgent發(fā)現(xiàn)一個問題,可以主動呼叫 BAgent來幫忙」。

  更廣泛的工具集成:擴展 Agent 可以調(diào)用的工具庫,包括但不限于更多的辦公軟件、開發(fā)環(huán)境、數(shù)據(jù)分析工具。目標是讓 Agent Swarm 能真正「端到端」地完成復雜工作流。

  在 Reddit 的 AMA(Ask Me Anything)活動中,Kimi 團隊也回答了大量關(guān)于技術(shù)、產(chǎn)品和愿景的問題。透過這些回答,我們可以拼湊出他們對 Agent Swarm 乃至整個 AI 未來的思考。

  AMA 中還有一個問題很有意思:許多說法稱,scaling law 已經(jīng)碰到了上限,團隊如何看待這個問題呢?

  楊植麟的回答是:Agent 集群就是他們走出的嘗試。展望未來,或許會出現(xiàn)一種幾乎不、甚至完全不需要人類先驗信息的模型。

  

  這個愿景聽起來有些理想化,但細想之下頗有深意。過去兩年,AI 領(lǐng)域一直在「卷參數(shù)」——模型越來越大、算力越來越貴。而 Agent Swarm 代表了一種不同的思路:與其讓一個超級大腦做所有事,不如讓一群大腦分工協(xié)作。

  這可能才是通向 AGI 的更務(wù)實路徑:單獨一只蜜蜂并不起眼,但當成千上萬只蜜蜂協(xié)同工作時,它們能建造出精妙的蜂巢。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
周總理為什么不愿在人民大會堂國畫《江山如此多嬌》上題詞?

周總理為什么不愿在人民大會堂國畫《江山如此多嬌》上題詞?

老杉說歷史
2026-02-16 18:05:07
3.3億游艇到30億涂鴉,扎克伯格壕得如此高調(diào),挑戰(zhàn)了我的想象力

3.3億游艇到30億涂鴉,扎克伯格壕得如此高調(diào),挑戰(zhàn)了我的想象力

電影爛番茄
2026-02-17 22:26:59
富士康“賭輸”了!郭臺銘做夢也沒有想到,“制裁”會來的這么快

富士康“賭輸”了!郭臺銘做夢也沒有想到,“制裁”會來的這么快

混沌錄
2025-08-22 18:23:58
別看景區(qū)人山人海,仔細一算全是窮游,人均消費露餡,消費降級了

別看景區(qū)人山人海,仔細一算全是窮游,人均消費露餡,消費降級了

眼光很亮
2026-02-22 10:37:00
61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

蜉蝣說
2026-02-03 15:04:01
善惡到頭終有報?57歲央視女主持王小丫,已走上另一條大路

善惡到頭終有報?57歲央視女主持王小丫,已走上另一條大路

妙知
2026-01-13 11:55:41
2026年放假安排火了!清明端午中秋全不調(diào)休,打工人直接笑出聲

2026年放假安排火了!清明端午中秋全不調(diào)休,打工人直接笑出聲

老特有話說
2026-02-24 22:50:35
還在看智能手表的睡眠監(jiān)測?這準確率還不如丟硬幣。。。

還在看智能手表的睡眠監(jiān)測?這準確率還不如丟硬幣。。。

差評XPIN
2026-02-25 00:09:24
去了趟拉斯維加斯,這輩子再不想去二回,到處是陷阱防不勝防!

去了趟拉斯維加斯,這輩子再不想去二回,到處是陷阱防不勝防!

天下霸奇
2026-01-29 09:07:49
不怕神一樣的對手,就怕豬一樣的隊友,本賽季76人的馬克西有多苦

不怕神一樣的對手,就怕豬一樣的隊友,本賽季76人的馬克西有多苦

大眼瞄世界
2026-02-24 10:39:03
沒有退路了!2連敗韓國隊后,中國男籃VS日本,賽程時間如下

沒有退路了!2連敗韓國隊后,中國男籃VS日本,賽程時間如下

李覴在北漂
2026-02-25 02:08:53
農(nóng)民把10頭豬趕到無人島,12年后再次登島,眼前畫面讓他不敢信

農(nóng)民把10頭豬趕到無人島,12年后再次登島,眼前畫面讓他不敢信

白云故事
2026-01-22 17:30:05
被困印度54年的中國老兵,因在森林中迷路誤入印度境內(nèi),最終只能在當?shù)厝⑵奚?>
    </a>
        <h3>
      <a href=史海孤雁
2026-02-14 18:06:18
金銀價再度大漲,國內(nèi)金飾價格逼近1600元/克,專家提醒:勿盲目追高,不加杠桿

金銀價再度大漲,國內(nèi)金飾價格逼近1600元/克,專家提醒:勿盲目追高,不加杠桿

極目新聞
2026-02-21 15:57:38
TVB知名演員游飚去世,會客時突感不適,送院前已呈半昏迷狀態(tài)

TVB知名演員游飚去世,會客時突感不適,送院前已呈半昏迷狀態(tài)

韓小娛
2026-02-25 08:56:10
四川省人事任免!免去李天滿的四川省自然資源廳副廳長職務(wù)

四川省人事任免!免去李天滿的四川省自然資源廳副廳長職務(wù)

明月照鳳凰
2026-02-24 19:58:49
夢鴿心中永遠的痛:如今58歲的她,已經(jīng)為兒子鋪好下一條路了嗎?

夢鴿心中永遠的痛:如今58歲的她,已經(jīng)為兒子鋪好下一條路了嗎?

小熊侃史
2026-02-24 18:06:25
長江電力“逆向”下行,是布局機遇,還是價值陷阱?

長江電力“逆向”下行,是布局機遇,還是價值陷阱?

錦緞研究院
2026-02-25 07:51:44
古董相機價格暴漲翻10倍 根本搶不到 業(yè)內(nèi)人士:芯片短缺和物流費用暴漲成主因

古董相機價格暴漲翻10倍 根本搶不到 業(yè)內(nèi)人士:芯片短缺和物流費用暴漲成主因

快科技
2026-02-24 11:31:04
春節(jié)高速免費最后1分鐘:有人壓哨通過省下1000多元,也有車主從蕭山上高速后“卡點”失敗交了幾百元通行費

春節(jié)高速免費最后1分鐘:有人壓哨通過省下1000多元,也有車主從蕭山上高速后“卡點”失敗交了幾百元通行費

都市快報橙柿互動
2026-02-24 09:16:26
2026-02-25 09:31:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6126文章數(shù) 26782關(guān)注度
往期回顧 全部

科技要聞

蘋果MacBook Pro要加觸摸屏了,還帶靈動島

頭條要聞

87歲上海老人和59歲保姆結(jié)婚 稱房子被賣遭多次打砸

頭條要聞

87歲上海老人和59歲保姆結(jié)婚 稱房子被賣遭多次打砸

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

汽車要聞

入門即滿配 威蘭達AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

手機
旅游
藝術(shù)
房產(chǎn)
公開課

手機要聞

歐洲十大暢銷手機出爐,真是顛覆大家固有印象

旅游要聞

新春走基層|暖陽照春城 煙火聚年味

藝術(shù)要聞

如果吳清源重生,他會如何與柯潔較量?

房產(chǎn)要聞

330萬人涌入!春節(jié)全國樓市,第一個賣爆的區(qū)域出現(xiàn)了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版