国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實(shí)測Kimi首個Agent:智能體與模型之間的區(qū)隔消失了?

0
分享至

這兩天,月之暗面上線了名為 Kimi-Researcher 的產(chǎn)品,以“模型即Agent”的思路切入,標(biāo)志著其在 Agent 路線上的一次明顯發(fā)力。

如果大家還記得的話,就在 Kimi 發(fā)布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調(diào)的公司幾乎在同一時段重新進(jìn)入公眾視野,也讓原本趨于平靜的 AI 四小強(qiáng)格局再次活躍起來。

Kimi、MiniMax、智譜、階躍星辰,這幾位曾經(jīng)在大模型初期階段高頻出現(xiàn)的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術(shù)報(bào)告的更新、產(chǎn)品形態(tài)的演進(jìn),還是實(shí)際功能的迭代,幾家廠商都在以各自的節(jié)奏向外界釋放信號。

這一輪產(chǎn)品集中露面的時間節(jié)點(diǎn)并非巧合。從時機(jī)上看,這一波集中亮相并非偶然。當(dāng)前,大模型正從純粹的問答工具演進(jìn)為具備自主規(guī)劃、任務(wù)執(zhí)行與上下文記憶能力的智能體系統(tǒng)。Agent 正在從“增強(qiáng)生產(chǎn)力”轉(zhuǎn)向“替代部分人類任務(wù)角色”。對于具備模型研發(fā)和產(chǎn)品整合能力的廠商來說,這是一次相對公平的新起點(diǎn)。

01

報(bào)告,不只是寫完,還得像

在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口:深度研究。

這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答,而是瞄準(zhǔn)了原本需要專業(yè)助理團(tuán)隊(duì)完成的任務(wù),例如梳理產(chǎn)業(yè)政策、比對跨國法規(guī)、生成調(diào)研報(bào)告等。

這類任務(wù)對模型的檢索、思考、組織、判斷能力要求極高,幾乎是對 Agent 體系的全方位考驗(yàn)。

話不多說,我們直接開測。

比如說我想讓它分析下2025年上半年黃金價(jià)格波動與美聯(lián)儲政策走向的關(guān)聯(lián)性。

它沒有立刻開始寫,而是反問了我一些問題,從研究邏輯本身出發(fā),主動確認(rèn)這個任務(wù)到底該怎么做才不空轉(zhuǎn)。

這種主動澄清機(jī)制,是過去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結(jié)果的虛擬機(jī)結(jié)構(gòu),更接近一個“你提一個話題,它開始一步步推”的助研模型。

Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開信息源,而是直接把它切換到一種更傾向生成完整結(jié)構(gòu)報(bào)告的工作狀態(tài)。

經(jīng)過大概十幾分鐘的等待,它一共生成了兩種版本。

一種是我們熟悉的文字版研究報(bào)告,段落結(jié)構(gòu)清晰,語氣沉穩(wěn),整體邏輯偏向內(nèi)容層次 + 政策推導(dǎo);另一種則是自動渲染的 HTML 格式報(bào)告,已經(jīng)配好封面、標(biāo)題、摘要、分節(jié)說明,標(biāo)注出“核心發(fā)現(xiàn)”“關(guān)鍵風(fēng)險(xiǎn)”“歷史規(guī)律”這些結(jié)構(gòu)化小標(biāo)簽。

網(wǎng)頁稿鏈接在這,有興趣的朋友們可以打開看一看:

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

內(nèi)容還是很豐富的。

對經(jīng)常要做對內(nèi)材料和對外匯報(bào)的人來說,這種“寫+排+渲”一體的體驗(yàn),確實(shí)提高了交付效率。

你可以把它當(dāng)成是Word+Notion+研究助理的混合體,不僅能輸出內(nèi)容,還知道怎么讓內(nèi)容看起來像一份真的報(bào)告。

然后我們也測了測生成PPT的能力。給它的任務(wù)是這樣的:

梳理一下 Stable Diffusion 從最初發(fā)布到最新版本的演進(jìn)路線,列出各階段關(guān)鍵改進(jìn)與社區(qū)貢獻(xiàn)節(jié)點(diǎn),并作出PPT

看起來是一個非常結(jié)構(gòu)化的問題,理論上應(yīng)該正對 Researcher 的下懷。但實(shí)際操作過程中,我們也發(fā)現(xiàn)了一些限制。

1. 當(dāng)前版本仍未支持多任務(wù)并行(當(dāng)然,這可能只是內(nèi)測階段的限制,正式版是否優(yōu)化還有待觀察。)

2. 并不能生成傳統(tǒng)PPT,只能是 HTML 格式報(bào)告。

我們還是把report鏈接放在這里:

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

不過也不能說它表現(xiàn)不好。作為一個學(xué)術(shù)型Agent,它在報(bào)告里自動加上了參考文獻(xiàn)鏈接,并用下劃線標(biāo)注出處??梢酝瓿梢徽卓山桓秲?nèi)容。

而這,恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。

但當(dāng)我們把這個任務(wù)交給 MiniMax Agent 時,體驗(yàn)就完全不同了:

它不僅生成了 PPT,還一并打包了 PDF 報(bào)告、Markdown 研究文檔、圖表文件、項(xiàng)目任務(wù)表(todo.md)和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件,二次修改內(nèi)容和格式。也能查看 .md 的版本記錄、調(diào)圖的 .py 腳本,每一階段的中間產(chǎn)物全都可查。

從產(chǎn)出形式來看,它給你的是一整個PPT 制作系統(tǒng),而不是一份靜態(tài)報(bào)告。

02

Kimi-Researcher和

MiniMax Agent,哪個更適合你

從執(zhí)行力上來說,兩者都已經(jīng)遠(yuǎn)超傳統(tǒng)意義上的聊天機(jī)器人——你不用再一句一句提示,它們可以自己補(bǔ)全問題、拆解任務(wù),甚至按你沒說出口的邏輯推下去。但使用下來,兩者的Agent 感其實(shí)來自不同的方向。

Kimi-Researcher 是任務(wù)導(dǎo)向的,它的邏輯很清楚:你給我一個研究型問題,我就像一個訓(xùn)練過的助理那樣,問你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個運(yùn)行在虛擬機(jī)里的多工系統(tǒng)——你可以把它理解成你裝了一個干活的人,但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運(yùn)營”,而是你怎么設(shè)計(jì),他就按你的指令一步步走。有時候你會覺得,它像是個開著調(diào)試模式的智能體,你能看到它每一步調(diào)用了什么插件、在哪個頁面抓了數(shù)據(jù)、用了哪個文檔里的知識。這種透明度很高的體驗(yàn),本質(zhì)上更像是你操控一個流程機(jī)器人,而不是和一個人打交道。

如果說 Kimi 是把一個智能體藏在了模型背后,讓你感受到結(jié)果;那 MiniMax 更像是把智能體攤開在你眼前,讓你參與構(gòu)建過程。兩者誰更強(qiáng),不一定,但它們帶來的使用心智是完全不一樣的。

還有一個重要差別,是默認(rèn)角色設(shè)定。

Kimi 很明顯是自帶性格的——不夸張地說,它的Researcher標(biāo)簽決定了它的行為方式,比如它更關(guān)注嚴(yán)謹(jǐn)表達(dá)、更傾向于做出規(guī)范排版、更容易使用資料比對視角進(jìn)行總結(jié)。

而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt,自己搭建鏈路,它才啟動真正的 Agent 能力。

我不是說哪個更好,我只是說它們在實(shí)現(xiàn)Agent這件事上,走的是完全不同的路徑。

在我們深度體驗(yàn)兩者后,給出用戶一句話結(jié)論:如果你更在意“我提個需求就能直接拿到結(jié)果”,Kimi 會是更順手的選擇;但如果你希望掌控整個任務(wù)的執(zhí)行流程、甚至自己定義智能體的邏輯結(jié)構(gòu),那 MiniMax 可能更適合你。

03

Kimi 做結(jié)果,MiniMax 做過程

說到底,Kimi 和 MiniMax 的這次同步出招,看起來像是在做 Agent,其實(shí)是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設(shè)計(jì)這些 Developer 套路,它不是在鼓勵你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應(yīng)你。它把智能體的控制權(quán)從用戶界面撤回到了模型內(nèi)部,交給了系統(tǒng)自動調(diào)度。

這一點(diǎn)是很多人沒意識到的。

過去我們理解的智能體,是我來設(shè)計(jì)、我來組合,但 Kimi 的思路是,你不需要設(shè)計(jì),你只要告訴我你要什么結(jié)果,我來決定應(yīng)該找誰干活、用什么方法、怎么安排流程。

它把整個 Agent 系統(tǒng)做成了一個黑箱,你丟任務(wù)進(jìn)去,它自己完成任務(wù)拆解、插件調(diào)用、資料組織和內(nèi)容生成。就像你發(fā)了封工作郵件,過一陣就能收到一份干凈利落的文檔回復(fù)。

很多人還在找插件入口,Kimi 已經(jīng)在去插件化。

這兩種產(chǎn)品方向的不同,其實(shí)也能看出背后公司在策略上的側(cè)重點(diǎn)。Kimi 一直強(qiáng)調(diào)“長文本”能力和“系統(tǒng)性表達(dá)”,在 Researcher 這個產(chǎn)品上被推到極致,它更注重交付內(nèi)容的完整性和邏輯性。

Kimi不是做開發(fā)者平臺,它要做的是“懂結(jié)構(gòu)、能調(diào)度”的模型本體。這也解釋了為什么它一上來就定位在最復(fù)雜的研究類任務(wù),因?yàn)檫@種任務(wù)能最大程度激活它預(yù)設(shè)的 Agent 內(nèi)部機(jī)制:澄清問題、檢索并行、結(jié)構(gòu)統(tǒng)籌、表達(dá)生成。這不是讓你看到它能干什么,而是逼你意識到,你其實(shí)可以不再親自干。

這點(diǎn)對用戶心智的沖擊,其實(shí)比 MiniMax 更強(qiáng)。

MiniMax 反而是最像 Agent的那一個。你真的可以看到它調(diào)用了哪些函數(shù),爬了哪些網(wǎng)頁,引用了哪段語料,它給你一個完整的操作軌道,你像是在 Debug 一個機(jī)器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當(dāng)成 Agent 的 IDE ——你是工程師,它是執(zhí)行層。

但這個過程中,大多數(shù)用戶其實(shí)是有門檻的。

你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結(jié)果?!?/p>

這個差別說到底,是兩家公司對智能體未來形態(tài)的不同下注。

MiniMax 賭的是:AI 應(yīng)該成為一個流程平臺,你來決定它長成什么樣。

Kimi 賭的是:AI 應(yīng)該直接成為一個能干事的角色,讓你不再需要流程本身。

這兩條路背后的預(yù)設(shè)完全不同。一個相信每個用戶都該擁有自己的Agent,一個相信模型應(yīng)該成為能自動執(zhí)行復(fù)雜任務(wù)的交付體。

Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。

這場Agent戰(zhàn)役其實(shí)不是從用戶開始的,而是從怎么分配任務(wù)這件事開始的。而這,恰恰是大模型能力真正能走入現(xiàn)實(shí)的起點(diǎn)。

你以為你在選一個Agent工具,其實(shí)你在決定的是:你愿不愿意把解決問題的方式,也一并交給它。

歡迎在評論區(qū)留言~
如需開白請加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
三亞4菜1868元后續(xù)!涉事司機(jī)被罰1.5萬,涉事海鮮店被立案調(diào)查

三亞4菜1868元后續(xù)!涉事司機(jī)被罰1.5萬,涉事海鮮店被立案調(diào)查

奇思妙想草葉君
2026-01-10 15:02:59
瑞典軍工發(fā)布導(dǎo)彈視頻:1枚導(dǎo)彈命中摧毀中國052d型驅(qū)逐艦!

瑞典軍工發(fā)布導(dǎo)彈視頻:1枚導(dǎo)彈命中摧毀中國052d型驅(qū)逐艦!

達(dá)文西看世界
2026-01-11 19:10:20
2026年養(yǎng)老金好消息!1956年到1961年出生的人,可能調(diào)整更多嗎?

2026年養(yǎng)老金好消息!1956年到1961年出生的人,可能調(diào)整更多嗎?

社會日日鮮
2026-01-11 11:09:44
麥當(dāng)勞縮水實(shí)錘?網(wǎng)友爆料供應(yīng)商早換了,評論區(qū)一言難盡,為啥

麥當(dāng)勞縮水實(shí)錘?網(wǎng)友爆料供應(yīng)商早換了,評論區(qū)一言難盡,為啥

你食不食油餅
2026-01-11 08:41:12
太解氣了,2026殯葬新規(guī)要來了,以后辦白事再也不用當(dāng)"冤大頭"了

太解氣了,2026殯葬新規(guī)要來了,以后辦白事再也不用當(dāng)"冤大頭"了

知鑒明史
2026-01-11 10:35:03
死了么APP發(fā)文回應(yīng):將把主要精力投入到產(chǎn)品打磨中,對新名稱的積極建議,會認(rèn)真研究和考慮

死了么APP發(fā)文回應(yīng):將把主要精力投入到產(chǎn)品打磨中,對新名稱的積極建議,會認(rèn)真研究和考慮

大風(fēng)新聞
2026-01-11 15:26:05
WTT冠軍賽:林詩棟連救4局點(diǎn)逆轉(zhuǎn)失敗!張禹珍3分險(xiǎn)勝,追到1-1!

WTT冠軍賽:林詩棟連救4局點(diǎn)逆轉(zhuǎn)失??!張禹珍3分險(xiǎn)勝,追到1-1!

劉姚堯的文字城堡
2026-01-11 19:16:16
中方對高市早苗不再手下留情,李在明主動跟進(jìn),反手捅了日本一刀

中方對高市早苗不再手下留情,李在明主動跟進(jìn),反手捅了日本一刀

空天力量
2026-01-11 17:23:50
個人所得稅減半征收政策!延續(xù)至2027年12月31日!

個人所得稅減半征收政策!延續(xù)至2027年12月31日!

審計(jì)之家
2026-01-11 09:03:14
拜合拉木遭針對!與曼聯(lián)新星沖突,連遭中衛(wèi)推搡,前國腳支招

拜合拉木遭針對!與曼聯(lián)新星沖突,連遭中衛(wèi)推搡,前國腳支招

奧拜爾
2026-01-11 19:58:15
明搶5000萬桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國連一桶都不肯買了

明搶5000萬桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國連一桶都不肯買了

奇思妙想生活家
2026-01-11 15:03:30
報(bào)告稱中國人均存款11萬,但有8.37億人負(fù)債,占比達(dá)73%

報(bào)告稱中國人均存款11萬,但有8.37億人負(fù)債,占比達(dá)73%

爆角追蹤
2026-01-10 21:36:39
新疆男籃正式官宣!國家隊(duì)教練走馬上任,成為主帥,全力沖擊前八

新疆男籃正式官宣!國家隊(duì)教練走馬上任,成為主帥,全力沖擊前八

體壇瞎白話
2026-01-11 18:13:52
宋彬彬晚年回國道歉仍不被原諒,其父宋任窮也不愿提起她,為何

宋彬彬晚年回國道歉仍不被原諒,其父宋任窮也不愿提起她,為何

雍親王府
2026-01-09 15:20:02
上海今晨多個郊區(qū)氣溫跌破冰點(diǎn),下周將有嚴(yán)重冰凍周末或迎“小陽春”氣溫直沖 17℃

上海今晨多個郊區(qū)氣溫跌破冰點(diǎn),下周將有嚴(yán)重冰凍周末或迎“小陽春”氣溫直沖 17℃

縱相新聞
2026-01-11 15:57:08
伊朗IRPG進(jìn)入最高警戒狀態(tài),死傷大幅增加,美以將隨時支援伊朗人民

伊朗IRPG進(jìn)入最高警戒狀態(tài),死傷大幅增加,美以將隨時支援伊朗人民

以色列計(jì)劃Pro
2026-01-11 12:24:32
32歲貨車司機(jī)中毒去世留下兩娃,眾卡友已為其募捐18萬,還有人愿承擔(dān)其小女兒15年上學(xué)費(fèi)用

32歲貨車司機(jī)中毒去世留下兩娃,眾卡友已為其募捐18萬,還有人愿承擔(dān)其小女兒15年上學(xué)費(fèi)用

極目新聞
2026-01-11 19:42:23
徹底清零!緬甸KK園區(qū)635棟涉賭詐建筑全數(shù)炸毀

徹底清零!緬甸KK園區(qū)635棟涉賭詐建筑全數(shù)炸毀

看看新聞Knews
2026-01-11 12:45:02
這條荒唐新聞,引起公憤了!

這條荒唐新聞,引起公憤了!

胖胖說他不胖
2026-01-11 10:00:11
東莞市衛(wèi)健局回應(yīng)“網(wǎng)傳疑患梅毒網(wǎng)紅住院記錄”:診療記錄涉隱私需保護(hù),將調(diào)查核實(shí) 本人發(fā)檢測報(bào)告否認(rèn)

東莞市衛(wèi)健局回應(yīng)“網(wǎng)傳疑患梅毒網(wǎng)紅住院記錄”:診療記錄涉隱私需保護(hù),將調(diào)查核實(shí) 本人發(fā)檢測報(bào)告否認(rèn)

紅星新聞
2026-01-11 17:02:17
2026-01-11 21:03:00
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

體育要聞

詹皇曬照不滿打手沒哨 裁判報(bào)告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補(bǔ)貼后9.98萬起

態(tài)度原創(chuàng)

時尚
本地
房產(chǎn)
健康
公開課

當(dāng)一個57歲的女人,決定從零開始

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版