国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話階躍AI:做桌面 Agent,要比 Claude Cowork 往前一步

0
分享至

Claude Cowork 火了,基于本地的 AI Agent 產(chǎn)品突然成為大家關(guān)注的重點(diǎn)。

但這么嘗試的不止 Anthropic,25 年 9 月底階躍發(fā)布的「階躍 AI 桌面伙伴」也在做同樣的事情。

基于桌面端而不是云端的形式,主打本地的任務(wù)執(zhí)行和文件處理,嘗試更主動為用戶提供服務(wù)。可以幫你處理 Excel 數(shù)據(jù)、社媒信息獲取,甚至主動完成一些定時(shí)任務(wù)。

為什么大家都選擇了桌面端 Agent?模型公司做 Agent,又有什么不一樣的策略?

在產(chǎn)品發(fā)布 3 個(gè)月后,我們采訪了階躍 AI 桌面伙伴的產(chǎn)品負(fù)責(zé)人鐘經(jīng)緯,聊了聊一款來自基模公司的 Agent 產(chǎn)品,背后的思考和嘗試。

*注:采訪時(shí)間為 2025 年 11 月,2026 年 1 月補(bǔ)采部分問題。

階躍 AI 桌面伙伴目前 Mac、Windows 版均已發(fā)布,免費(fèi)體驗(yàn)中。

官網(wǎng)下載:https://www.stepfun.com/download

2025 年,我們在 AI 產(chǎn)品市集推薦了 170 款產(chǎn)品,我們挑選了一些亮眼的產(chǎn)品,采訪產(chǎn)品主創(chuàng)團(tuán)隊(duì),想聽聽他們在產(chǎn)品上的探索和思考。本篇是第一篇,后續(xù)訪談陸續(xù)發(fā)布中。

歡迎加入我們的飛書「AI 產(chǎn)品市集」社群提交你的產(chǎn)品。

進(jìn)群后,你有機(jī)會得到:

  • 最新、最值得關(guān)注的 AI 新品資訊;

  • 不定期贈送熱門新品的邀請碼、會員碼;

  • 最精準(zhǔn)的AI產(chǎn)品曝光渠道

01對比 Claude Cowork,

方向一致、打法各異

Founder Park:怎么看待 Claude 最近發(fā)布的 Cowork,你們之間的區(qū)別是?算是殊途同歸嗎?

鐘經(jīng)緯:主要的區(qū)別是,我們在終端 Agent 的探索會更往前走了一點(diǎn)。例如,我們推出了「全局記憶」功能,嘗試在上下文的可能性上進(jìn)行更激進(jìn)的探索,以及通過「懸浮窗」這種交互方式,提升用戶體驗(yàn)。

他們在 Agent 本身會打磨的更精細(xì),我們也在努力優(yōu)化中。

總體上是有點(diǎn)殊途同歸的,后面可能都是往著端云協(xié)同去,同時(shí)有本地和云端的能力,但考慮到成本,當(dāng)前大家還是會先選一邊,每邊都有其優(yōu)劣。從這個(gè)角度看,我們想到一塊去了,都選擇了本地端。

選擇本地客戶端的優(yōu)勢在于更大的場景拓展空間,和上下文探索的可能性。缺點(diǎn)是關(guān)機(jī)時(shí)無法執(zhí)行,而且下載安裝本地應(yīng)用的滲透率低于網(wǎng)頁應(yīng)用。

我們當(dāng)前關(guān)注的是多元的用戶場景探索。目前,Agent 協(xié)作的方式仍處于早期階段,我們希望與用戶一起挖掘更多創(chuàng)新的用法。而本地客戶端能夠更好地激發(fā)這種想象空間,因此我們優(yōu)先選擇了本地方案。

在此之外,大家面臨的關(guān)鍵問題都很類似。

第一個(gè)問題是 Agent 能力提升。核心是讓 Agent 做得更多、更穩(wěn)、更快、成本更低。

Skill 是其中一個(gè)重要探索——它是給模型用的 workflow,包含驗(yàn)證過的路徑、標(biāo)準(zhǔn)和腳本,能顯著提升穩(wěn)定性和效果,相當(dāng)于開卷考了。相比 MCP 剛推出時(shí),現(xiàn)在參與 Skill 產(chǎn)出的人更多,實(shí)用價(jià)值也有提高。

我們在 Claude 25 年 10 月推出 Skill 之前,也上線了類似的「妙計(jì)」功能,支持加入本地文檔和腳本,出發(fā)點(diǎn)是一致的。不過他們在上下文設(shè)計(jì)上比我們當(dāng)時(shí)極致,最近我們也在優(yōu)化這樣的設(shè)計(jì)。

接下來,我們還會探索更多基于上下文的自主學(xué)習(xí)能力,比如把一次滿意的執(zhí)行一鍵沉淀為妙計(jì),將文件路徑、代碼腳本等關(guān)鍵信息保存下來,下次直接復(fù)用,就不用再讓 Agentic 重新整了。

另一個(gè)問題是 Agent 的滲透。基于我們這段時(shí)間對用戶的觀察看,無論海外還是國內(nèi),都處于很早期的階段。海外滲透更高一點(diǎn),并且有更大規(guī)模爆發(fā)的趨勢。

非技術(shù)人員的工作場景中,意識到「有 Agent 可用」的人就很少,能明確知道「自己工作中哪些環(huán)節(jié)能用 Agent」的更是鳳毛麟角。

我印象很深的是,當(dāng)時(shí)我們調(diào)研了三位教師用戶,他們的使用場景完全不同:有人用來整理教案,有人做學(xué)生成績統(tǒng)計(jì)分析,有人處理其他教學(xué)事務(wù)。當(dāng)我們分享彼此的用法后,他們都大受啟發(fā),發(fā)現(xiàn)很多場景自己也能用。

從這點(diǎn)也能看出,如何讓大家知道能用,知道哪里能用,是很重要的事。

Founder Park:你們內(nèi)部最初構(gòu)思這個(gè)產(chǎn)品時(shí),是如何定義它的?

鐘經(jīng)緯:我們認(rèn)為它是一個(gè)「探索型」產(chǎn)品具備幾個(gè)特點(diǎn)。

第一,它是我們在 AI+終端戰(zhàn)略下的一次創(chuàng)新嘗試;

第二,用于驗(yàn)證我們關(guān)于用戶場景、技術(shù)實(shí)現(xiàn)等方面的假設(shè);

第三,它會為我們的長期目標(biāo)積累底層能力。

我們在探索,通過端云協(xié)同,讓 agent 在不同終端上為大家服務(wù)是什么樣的。

我個(gè)人的一種理解是:在現(xiàn)有的Web、App 和數(shù)據(jù)庫之上,疊加一層「Agent 加工層」。這一層由以用戶為中心的 Agent 們組成,它們的目標(biāo)不是復(fù)刻服務(wù)商既有的流程,而是圍繞用戶需求,構(gòu)建「新結(jié)果」和「新狀態(tài)」。

所謂「新結(jié)果」,包括三類:

  • 新信息:比如 Deep Research,是對互聯(lián)網(wǎng)信息的再加工;

  • 新媒介:比如 NotebookLM 實(shí)現(xiàn)的視頻自動生成 PPT;

  • 新操作界面:比如有人將愛潑斯坦泄露的 PDF 郵件整理成仿 Gmail 界面,大幅提升「吃瓜」的體驗(yàn);B 站的個(gè)性裝扮也是一種個(gè)性化界面。這方面新的 AI 形態(tài)供給還比較少,但潛力比較大;

而「新狀態(tài)」,則是指那些改變用戶與世界關(guān)系的行為,比如自動填表、給人發(fā)消息、預(yù)約他人會議等。

在上述框架下,體驗(yàn)可以拆解為兩種基本形態(tài):

  • 任務(wù)執(zhí)行:像賈維斯一樣,用戶下達(dá)指令或 agent 主動識別需求后完成任務(wù);

  • 瀏覽操作:類似鋼鐵俠的智能工作臺,界面隨需求動態(tài)調(diào)整,提供沉浸式交互。

從目標(biāo)來看,這兩種體驗(yàn)我們都希望實(shí)現(xiàn)。但在當(dāng)下,階躍桌面伙伴做了一定取舍,更聚焦在任務(wù)執(zhí)行上,因?yàn)槲覀冇X得當(dāng)前 AI 對瀏覽體驗(yàn)的提升雖然有,但還不夠痛。

Founder Park:你們打算怎么切入「任務(wù)執(zhí)行」這個(gè)場景?

鐘經(jīng)緯:首先是倒推的視角。要實(shí)現(xiàn)上面說的那些,agent 不僅需要更多的三方執(zhí)行和數(shù)據(jù)權(quán)限,還需要更多的個(gè)人上下文信息。

第一,終端選擇。

考慮到是先做獨(dú)立 APP 的話,當(dāng)前選擇電腦端會更容易滿足這些條件——既能深度集成瀏覽器和本地工具,又能安全獲取用戶資產(chǎn)。直接做硬件也是一種方式,不過需要更長時(shí)間一點(diǎn)。車機(jī)相關(guān)的也會更快一點(diǎn),階躍也已經(jīng)在布局車機(jī)方向了。

一方面,車機(jī)系統(tǒng)的數(shù)據(jù)開放度相對較高,操作系統(tǒng)能獲取的信息更豐富,而且與現(xiàn)有 APP 生態(tài)的競爭關(guān)系沒那么激烈。另一方面,車機(jī)交互對用戶手動操作不友好——比如出行途中想點(diǎn)杯飲品,用語音讓 agent 代勞遠(yuǎn)比手動點(diǎn)擊更自然高效。

第二是應(yīng)用場景的選擇。

當(dāng)前 AI agent 的任務(wù)完成率還不夠理想,失敗率高、耗時(shí)長、成本也不低。在生活場景中,這種不穩(wěn)定性容易勸退用戶——比如點(diǎn)外賣十次失敗兩次,大家寧愿自己動手。但辦公場景不一樣,任務(wù)往往復(fù)雜、鏈路長、手動成本高,即便成功率只有六七成,用戶也愿意反復(fù)嘗試。而且辦公也能更好的體現(xiàn) Agent 的智能。所以我們優(yōu)先從辦公場景切入。

這樣一交叉,先在電腦端做辦公場景的探索,就比較順理成章了。不過這是一個(gè)中間路徑,最終我們也希望取代電腦。之前在大廠的時(shí)候印象很深,很多職級很高的同學(xué)都不帶電腦,有手機(jī)就夠了,因?yàn)樗麄冇泻芏喑墒斓?Agent 幫他們交付結(jié)果,他們只需要做決策就好了,未來可能人人都能實(shí)現(xiàn)這種狀態(tài)。

在「倒推邏輯」外,還有「正推邏輯」:我們最初的產(chǎn)品形態(tài),也源于真實(shí)痛點(diǎn)。

我從 24 年底開始用 Cursor 做數(shù)據(jù)分析,來幫助我做模型優(yōu)化的策略。我經(jīng)常要處理各種數(shù)據(jù),它能幫我快速寫腳本,非常方便。但很快就發(fā)現(xiàn),大量非技術(shù)人員,比如數(shù)據(jù)分析師、產(chǎn)品經(jīng)理、運(yùn)營,甚至傳統(tǒng)行業(yè)的合同風(fēng)控人員同樣面臨大量類似的文件處理需求:數(shù)據(jù)分析、格式轉(zhuǎn)換、批量整合等。

雖然像 Cursor 或 Claude 具備部分能力,但它們藏在 IDE 或命令行里,學(xué)習(xí)門檻非常高。很多人光是下載安裝就很折騰,更別說使用了。

所以,我判斷這里存在一個(gè)機(jī)會:用更產(chǎn)品化、低門檻的方式去滿足這個(gè)場景的需求。

第二個(gè)機(jī)會是信息獲取。我們在做 Deep Research 項(xiàng)目時(shí)觀察到,它能滿足用戶很多跨領(lǐng)域?qū)W習(xí)的需求,但在垂直領(lǐng)域內(nèi)如何更好地獲取信息和數(shù)據(jù),滿足得還不夠好——大家要的不是報(bào)告,是批量的數(shù)據(jù)。

一個(gè)很典型的 case 是,我們之前做娛樂產(chǎn)品時(shí),運(yùn)營同學(xué)每天都要聯(lián)系大量創(chuàng)作者,并且在創(chuàng)作者發(fā)完筆記后,要人工一個(gè)個(gè)去看,把筆記數(shù)據(jù)更新到表格里,非常痛苦。如果有一個(gè)能自動使用瀏覽器工具的 agent,就能幫她完成這件事。

所以,我們產(chǎn)品一上來主要就打這兩個(gè)場景:一是文件處理,二是批量信息獲取。

02「妙計(jì)」是對提升滲透的一種嘗試

Founder Park:現(xiàn)階段你們的典型案例演示,主要是為了幫助用戶建立認(rèn)知——「原來這類場景 AI 能快速完成」或「原來這樣寫指令效果更好」。這是否和「妙計(jì)」功能是相配合的?

鐘經(jīng)緯:是的?!该钣?jì)」是一個(gè)非常關(guān)鍵的探索方向。它具備多個(gè)價(jià)值:

簡化操作:把常用指令或流程保存下來,避免每次從零輸入,使用成本更低、效率更高。

降低門檻:一方面解決「不會寫復(fù)雜指令」的問題,另一方面把行業(yè)經(jīng)驗(yàn)直接封裝進(jìn)去。比如麥肯錫報(bào)告格式、公司內(nèi)部常用模板等,都可以被直接復(fù)用。

沉淀腳本資產(chǎn):比如在處理 Excel 時(shí)寫過一段腳本,可以把它保存為「妙計(jì)」,下次直接調(diào)用——相當(dāng)于把一次性的操作,變成可復(fù)用的小工具或小程序。

自主學(xué)習(xí)的可能性:如果 Agent 能夠自己意識到,什么時(shí)候應(yīng)該自動創(chuàng)建「妙計(jì)」,并在執(zhí)行類似任務(wù)時(shí)參考,某種程度上也就具備了自主學(xué)習(xí)的能力。

Founder Park:現(xiàn)階段,用戶在使用「妙計(jì)」這塊,無論是自己寫還是用官方推薦的,符合你們最初設(shè)計(jì)這個(gè)功能的預(yù)期嗎?

鐘經(jīng)緯:一部分符合,一部分不太符合。

符合預(yù)期的是,「妙計(jì)」本身也扮演著一種playbook(操作指南)的角色。現(xiàn)階段我們并沒有真正意義上實(shí)現(xiàn)一個(gè)通用 agent,但用戶面對一個(gè)「桌面伙伴」時(shí),很容易產(chǎn)生過高期待,覺得它什么都能解決。

因此,我們需要通過「妙計(jì)」來告訴用戶:哪些事情現(xiàn)在能做好,哪些場景值得用。這既能幫助用戶建立合理預(yù)期,也讓我們在對外溝通時(shí)有更具體、可感知的價(jià)值錨點(diǎn)。有了「妙計(jì)」,用戶會更清楚「我可以用它來干什么」。


另外,也有不少用戶分享了非常高質(zhì)量的「妙計(jì)」,給了我們很多啟發(fā)。

不符合預(yù)期的地方主要在于:當(dāng)前的創(chuàng)建和使用引導(dǎo)還不夠強(qiáng)。

比如,當(dāng)前懸浮窗形態(tài)對「妙計(jì)」的展示不夠友好。用戶可能根本注意不到輸入框上方那句「輸入 / 即可使用妙計(jì)」,甚至不知道「妙計(jì)」是什么。

后面我們也會做更多優(yōu)化,比如加強(qiáng)露出(最新的更新中已經(jīng)做了加強(qiáng)),增加預(yù)設(shè)推薦、優(yōu)化引導(dǎo)路徑,并通過運(yùn)營手段鼓勵(lì)用戶創(chuàng)作和分享,形成正向循環(huán)。

03「主動服務(wù)」應(yīng)該是所有 Agent 的能力

Founder Park:你們看具體用戶行為時(shí),有什么跟之前想的不一樣的事?

鐘經(jīng)緯:比較好的地方在于,有些功能意外地受到了很多人的喜歡。比如「喝水提醒」「久坐提醒」這類功能,發(fā)現(xiàn)用戶的接受度和使用意愿都很高。

同時(shí),我們也看到了很多意料之外的長尾需求,比如有人會每天定時(shí)檢測并自動關(guān)閉 VPN。

不太符合預(yù)期的地方在于,Agent 的整體滲透率并不高。很多用戶并不會主動去聯(lián)想到更多使用場景,往往只解決了一兩個(gè)明確的問題,就停下來了,并沒有意識到它還能做更多事。

在用戶訪談中,這一點(diǎn)表現(xiàn)得尤為明顯。很多時(shí)候我們只要稍微提示一下,用戶就會恍然大悟:「原來還能這樣用?」而這種「被點(diǎn)醒」的情況,這種情況的比例比我想象中高很多。

也正因?yàn)槿绱耍以絹碓接X得,「主動」的能力,以及通過「妙計(jì)」這種方式去更清晰地傳達(dá)能力,變得格外重要。如果未來能進(jìn)一步培養(yǎng)出一種心智——「這個(gè)事情,是不是也可以讓階躍試試?」——那我覺得就更好了。

Founder Park:這感覺像是當(dāng)前模型和 agent 產(chǎn)品普遍面臨的共性問題——能力其實(shí)已經(jīng)到了,但用戶不知道能這么用,或者有需求卻不會表達(dá)。就像最近 Nano Banana 的出圈,也是靠一個(gè)具體、有趣、可傳播的案例才被大眾感知到。

鐘經(jīng)緯:對。而且對更廣泛的用戶來說,大家大多是「懶」的,也討厭學(xué)習(xí)。這種「懶」并不是不想解決問題,而是很多時(shí)候,寧愿用自己熟悉的方式花 30 分鐘,也不愿意花 5 分鐘去學(xué)一個(gè)新方法。

所以我們特別重視對話的自然性,以及「妙計(jì)」的易用性,目的就是讓用戶以最低成本上手。而「主動服務(wù)」的探索,也是為了解決用戶的認(rèn)知和使用門檻的問題。

Founder Park:「主動」在你們產(chǎn)品里定義的是什么樣的場景?是真正的 AI 主動,還是說你們設(shè)定了某個(gè)場景,類似 if/else,監(jiān)測到用戶可能有什么行為,就通過預(yù)設(shè)讓 AI 出來跟用戶對話?

鐘經(jīng)緯:最終的想象比較科幻:它檢測到你有什么事就自動幫你做了。比如,我們倆今天要聊 agent,它可能在昨天就自動幫你把這個(gè)產(chǎn)品下載了,說「你今天要聊這個(gè),要不要體驗(yàn)一下?」; 或者你還想看同類產(chǎn)品的數(shù)據(jù),它就自動幫你做了一份 Manus、Genspark 這類產(chǎn)品的研究報(bào)告給你參考。

但要實(shí)現(xiàn)這個(gè)狀態(tài),還需要一段時(shí)間。所以在當(dāng)前階段,我們選擇分兩方面探索。

一方面是先從一些我們拿得準(zhǔn)的場景切入,并且這些場景能和我們 agent 當(dāng)前的核心能力掛鉤。比如識別屏幕內(nèi)容,自動生成待辦事項(xiàng)、每日復(fù)盤,或推薦任務(wù)給「小躍」。

另一方面是,把探索權(quán)交給用戶,給用戶設(shè)定「當(dāng)模型發(fā)現(xiàn) X 時(shí),執(zhí)行 Y」的開放性功能。例如當(dāng)前就有人設(shè)置「每天晚上 9 點(diǎn)總結(jié) Obsidian 日記」,未來還可能變成「當(dāng)發(fā)現(xiàn)我不專注的時(shí)候提醒我」。這些長尾場景空間很大,我們覺得可以更多把能力交給用戶,看他們想做什么,我們也能從中發(fā)現(xiàn)用戶的需求。

同時(shí),「主動」這件事,隱私安全特別重要。當(dāng)前的本地模型還沒有那么成熟,在這個(gè)過程中也要把本地模型打磨得更好。

Founder Park:「主動」是不是可以更好地解決所謂的用戶教育問題?在用戶沒有意識到 agent 能解決他任務(wù)的時(shí)候,主動出來,讓他意識到。

鐘經(jīng)緯:是的。它有點(diǎn)像是在「跨越鴻溝」——把早期用戶探索出來的好用法,用一種幾乎無感的方式,傳遞給更廣泛的用戶群體,從而進(jìn)一步提升 AI 的整體滲透率。

我有個(gè)印象很深的事。我經(jīng)常會去看 Excel 求助帖,底下會有人說「你可以用 AI 啊」,然后就會有人回「居然可以用 AI 么」。說明能力有了,但觸達(dá)和引導(dǎo)沒跟上?!钢鲃印故墙鉀Q這個(gè)問題的方法之一。

Founder Park:現(xiàn)在一個(gè)本地安裝的 agent 能不能做到主動,一方面是模型能力,另一方面是很多產(chǎn)品還無法獲取用戶更長的上下文,因?yàn)樗淮_定什么時(shí)候介入是合適的。所以要做得更主動,還是要在獲取用戶屏幕信息或者更多介入用戶流程上下功夫。

鐘經(jīng)緯:現(xiàn)在可能是兩條線:一條線是怎么讓 agent 變得更智能,或者說能完成更復(fù)雜、更難的任務(wù);另一條線是怎么讓 AI 更懂你。這個(gè)「更懂你」不只是對話上更懂你,而是真的知道你什么時(shí)候可能需要什么。

這靠 chatbot 很難解決,它一定得跟你當(dāng)前的現(xiàn)實(shí)生活、手機(jī)或電腦的系統(tǒng)環(huán)境有比較強(qiáng)的結(jié)合。

Founder Park:這就需要更多地在終端層面去介入用戶的實(shí)際工作和生活流程中?

鐘經(jīng)緯:終端肯定是重要的,這也是我們后面一直跟很多終端廠商合作的原因。但也不是只有終端能做。比如,瀏覽器其實(shí)也是一種小 OS,使用頻率比較高,我記得海外數(shù)據(jù)是人均使用時(shí)長 5.5 小時(shí)。很多人辦公全在瀏覽器里完成。微信、抖音、甚至游戲也都有上下文,同樣可以嘗試「主動」服務(wù),所以應(yīng)用層面也有空間。

還有些別的方法,比如豆包最近營銷的另一個(gè) case 也很好:開著視頻通話,讓豆包「看著」孩子學(xué)習(xí),一旦注意力不集中就提醒一下,坐姿不對也會提示。這也是一個(gè)主動場景。

04用戶的主要場景是「文件處理」

Founder Park:最初上線的功能是一開始就計(jì)劃好的嗎?

鐘經(jīng)緯:不完全是。整體要打的核心場景和用戶價(jià)值,其實(shí)從一開始就很清楚,主要集中在文件處理信息獲取這兩個(gè)點(diǎn)上。

但初期設(shè)想的功能規(guī)模,比現(xiàn)在實(shí)際做出來的要多出三到四倍。隨著推進(jìn),我們不斷砍需求、調(diào)優(yōu)先級,同時(shí)也根據(jù)真實(shí)用戶反饋,補(bǔ)充了一些更關(guān)鍵的能力。

從開發(fā)到正式上線,整個(gè)周期不到一個(gè)半月。這期間,視覺和交互也在持續(xù)迭代——懸浮窗的樣式中途改過一次;后來被大家夸「好看」的 IP 形象、登錄頁和新手引導(dǎo) UI,甚至是在上線前兩周才最終敲定的。

某種程度上,時(shí)間壓力倒逼了團(tuán)隊(duì)聚焦,也激發(fā)了不少創(chuàng)造力。

Founder Park:從目前用戶反饋來看,日常最高頻的任務(wù)是哪些?反饋?zhàn)詈玫娜蝿?wù)又是什么?

鐘經(jīng)緯:最主要的場景有三塊,基本是 4:3:3 的比例。文件處理占 40% 左右,信息獲取大概 30%,剩下 30% 是一些更長尾的,比如快問快答和一些零散需求。

文件處理這一塊,其實(shí)出現(xiàn)了很多很有意思的用法。比如在數(shù)據(jù)處理上,有 HR 用戶用它自動匯總多張出勤 Excel 表,基本省掉了原來大量的手動統(tǒng)計(jì)工作。

文件管理上,我們有不少算法同學(xué)每天要看大量論文,就讓 agent 自動下載論文,并根據(jù)文件內(nèi)容自動重命名。因?yàn)楹芏嗾撐膹?arXiv 下下來,文件名通常只是一串編號,根本看不出來內(nèi)容是什么。現(xiàn)在 agent 可以直接讀取文件內(nèi)容,理解主題后自動改名,發(fā)票整理之類的場景也是類似的邏輯。

還有一個(gè)和文件相關(guān)、我覺得特別有意思的案例,是一位家長分享的,他在給孩子用這個(gè)產(chǎn)品。

他給孩子整理了一個(gè)錯(cuò)題本,里面是各種單詞,然后設(shè)置了一個(gè)定時(shí)任務(wù):每天早上 9 點(diǎn),讓 AI 從文件里隨機(jī)抽幾個(gè)單詞提問。當(dāng)孩子連續(xù)回答正確幾次后,系統(tǒng)就會自動把這些單詞從錯(cuò)題本里刪掉,相當(dāng)于一個(gè)「會自己更新的學(xué)習(xí)文件」。

05模型現(xiàn)階段依然非常重要

Founder Park:你怎么看「模型即產(chǎn)品」的說法?

鐘經(jīng)緯:我覺得可以從兩個(gè)層面來看。

首先,模型本身依然非常重要。目前國內(nèi) agentic 模型整體上仍然弱于海外,并且模型能力的突破還在持續(xù)發(fā)生。比如像 Gemini 3 仍在不斷解鎖新的應(yīng)用場景。同時(shí),強(qiáng)模型天然自帶「流量」。在 AI 圈子里,一旦出現(xiàn)一個(gè)更聰明的模型,大家會主動去測試、討論和傳播,很快就會形成「這是一個(gè)很強(qiáng)模型」的心智,這本身就是一種勢能。

但從真正落地的角度看,模型之外的因素也在變得越來越重要。比如個(gè)人數(shù)據(jù)接入、場景教育。還有經(jīng)驗(yàn)沉淀:像 Agent 執(zhí)行過一次文件檢索了,是不是可以有個(gè)地方把目錄記錄下來,下次就可以直接找到了。此外,工具的細(xì)節(jié)設(shè)計(jì)和反饋也越來越重要,它決定了模型在這些場景上能不能發(fā)揮得更好。

所以我的總體看法是:模型依然重要,但模型之外的東西的重要性也在提升,兩者需要一起進(jìn)化。

Founder Park:也就是說,模型本身的 agent 能力是一個(gè)長線持續(xù)提升的東西。但現(xiàn)階段把 agent 產(chǎn)品的上下游補(bǔ)足,也能做出表現(xiàn)不錯(cuò)的產(chǎn)品?

鐘經(jīng)緯:對。2023–2025 年,大家其實(shí)都在做「功能點(diǎn)」——模型本身也像是一種「功能」。但隨著基礎(chǔ)能力趨同,整合能力會越來越重要:哪些功能保留、如何串聯(lián)、怎樣嵌入用戶工作流,這些很關(guān)鍵。

Founder Park:這兩個(gè)月(202511-202601),產(chǎn)品主要更新了哪些新功能?

鐘經(jīng)緯:這兩個(gè)月,我們的重點(diǎn)仍然放在 Agent 核心能力的持續(xù)優(yōu)化上,同時(shí)也相對激進(jìn)地探索了一些新的方向,比如全局記憶?;谌钟洃洠覀冊趦?nèi)部還嘗試構(gòu)建了主動推薦小躍 Query 等功能 Demo,可以看作是在「主動」方向上的一次探索。

我們最近還打算將我們與用戶以及公司內(nèi),共同打磨的 Agent 使用方式和具體案例,分享給大家,幫助大家理解,如何真正將 Agent 融入到自己的工作流里。用了后,真的會很爽。

Founder Park:這款產(chǎn)品會反哺階躍本身的模型研發(fā)嗎?

鐘經(jīng)緯:會有的,這是主要目的之一。產(chǎn)品還是在幫助牽引方向。比如「妙計(jì)」就是一個(gè)很好的 benchmark。一個(gè)很火的「妙計(jì)」,有一千多人點(diǎn)贊,一萬多人因?yàn)檫@個(gè)「妙計(jì)」下載了產(chǎn)品,那就說明這個(gè)任務(wù)是大家需要的,就值得我們?nèi)タ己四P湍懿荒茉谶@道題上做得越來越好。所以它是一個(gè)很好牽引模型方向的事。

此外,也能幫模型積累數(shù)據(jù)?,F(xiàn)在 agent 任務(wù)的數(shù)據(jù)不那么好造,因?yàn)樗虚g有很多步驟,純?nèi)藢懙?pattern 有時(shí)跟模型本身的 pattern 還有差異,反而可能干擾數(shù)據(jù)。通過產(chǎn)品,我們能沉淀出不錯(cuò)的合成數(shù)據(jù),也是一種比較好的方式。以及 agent 依賴于環(huán)境的反饋信號,能讓用戶參與進(jìn)來反饋很重要。

06用對話的形式解決任務(wù),

對用戶來說成本最低

Founder Park:從 Manus 到現(xiàn)在,你印象里有哪些覺得有意思的通用或垂直 agent?

鐘經(jīng)緯:最近有好幾個(gè)(25 年 11 月底)。

第一個(gè)是 Hero AI(Hero Assistant)。他們最近發(fā)布了一個(gè) SDK,我已經(jīng)申請了,但還沒拿到邀請碼。這個(gè)產(chǎn)品在輸入框?qū)用娴慕换ド献隽艘粋€(gè)很有意思的創(chuàng)新。

Hero AI 的創(chuàng)新點(diǎn)在于:不先問問題,而是在你輸入的過程中自動判斷維度。比如你在描述生圖需求時(shí),輸入到一半,輸入框就會主動浮出「人物」「環(huán)境」「動作」等可選塊;再比如你輸入「買一杯咖啡」,系統(tǒng)會自動識別出「品牌」這個(gè)維度,并給出「星巴克」「瑞幸」等候選。

它還有一個(gè)挺有意思的商業(yè)化想象:當(dāng)系統(tǒng)判斷你「并不知道該買什么咖啡」時(shí),會在浮層里給你一些輕量的推薦,甚至是廣告。

還有一個(gè)是 OpenAI 收購的Sky.app*,我很喜歡他們在懸浮窗形態(tài)上的探索。

注:一款專為 Mac 打造的 AI 助手,Workflow 和 Shortcuts 的原開發(fā)者 Ari Weinstein 和 Conrad Kramer 領(lǐng)銜開發(fā)。

再比如 MineContext(字節(jié)出品的上下文感知工具)我也很喜歡,他們的很多理念跟我們很像,也在全局記憶、圍繞特定人群(比如 ADHD 用戶)做場景探索。整體來看,他們同樣是在圍繞上下文理解人–AI 交互體驗(yàn)做持續(xù)優(yōu)化,這個(gè)方向本身還有非常大的探索空間。

Founder Park:像今年出現(xiàn)的 Macaron、MuleRun 這種偏向 agent 工具或商店的產(chǎn)品,你怎么看?

鐘經(jīng)緯:關(guān)鍵還是要回到幫用戶解決的問題是什么。工具的價(jià)值在于能被沉淀下來、反復(fù)調(diào)用,幫助提升效率和可靠性,以及有些場景下 GUI 更直觀和便捷。但這和面向大眾做 coding 產(chǎn)品,有些區(qū)別。難點(diǎn)是,有很多用戶連需求是什么都不知道,更別說描述工具是什么了。

我們的體感是:在自然對話中調(diào)用,成本最低。你只需說出任務(wù)目標(biāo),agent 自動生成或匹配「妙計(jì)」,這比去應(yīng)用商店找工具、下載、再學(xué)習(xí)使用要順暢得多。

我之前看過一些 Vibe Coding 的例子,發(fā)現(xiàn)確實(shí)有很多長尾需求。比如有老師用它做課表簽到,幫助很大。但在手機(jī)上,這些場景有沒有已經(jīng)被小程序滿足得比較好?以及為了一堆很低頻的工具需求,用戶愿不愿意下載一個(gè) APP,并且之后還能想起來用它?如果有高頻的,是不是已經(jīng)有別人做了?小程序在微信里能成立,一個(gè)很重要原因是微信本身是大流量入口。

所以,我覺得從用戶價(jià)值上是有的,但從實(shí)際落地形態(tài)上要再看看。在電腦端,我們后面圍繞「妙計(jì)」也會有類似的設(shè)計(jì)。不過更符合我想象的是,從 Agent 這樣的形態(tài)切入,傳達(dá)用戶的是完成某個(gè)任務(wù)的心智,Coding 在里面更多是手段。

Founder Park:確實(shí),如果某個(gè)痛點(diǎn)是真的痛,可能已經(jīng)有其他產(chǎn)品在解決了。

鐘經(jīng)緯:對。它很像瀏覽器插件,到底是個(gè)供給問題還是個(gè)分發(fā)問題,大家可能要想一想。

Founder Park:但可能還有另一個(gè)邏輯,如果用戶想要的功能能即時(shí)生成,可能比他花時(shí)間尋找現(xiàn)有方案成本更低,畢竟現(xiàn)在「發(fā)現(xiàn)成本」本身就很高的。

鐘經(jīng)緯:對,對于用戶來說,只需要說任務(wù)是什么,是最簡單的。

轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
王毅判斷沒錯(cuò),短短三天中方見識了:比利時(shí)的虛偽、西班牙的真誠

王毅判斷沒錯(cuò),短短三天中方見識了:比利時(shí)的虛偽、西班牙的真誠

快看張同學(xué)
2026-03-26 10:19:39
張雪峰走后才懂:北京戶口,真的值得拿命換嗎?

張雪峰走后才懂:北京戶口,真的值得拿命換嗎?

硯底沉香
2026-03-26 12:09:51
中國股市炒股其實(shí)很簡單:"20以下滿倉進(jìn),80以上滿倉出"穩(wěn)賺不虧

中國股市炒股其實(shí)很簡單:"20以下滿倉進(jìn),80以上滿倉出"穩(wěn)賺不虧

股經(jīng)縱橫談
2026-03-26 17:11:55
9.9元戰(zhàn)火未熄,庫迪用“不限量”掀了桌子!給瑞幸整不會了

9.9元戰(zhàn)火未熄,庫迪用“不限量”掀了桌子!給瑞幸整不會了

品牌觀察官
2026-03-26 17:17:59
浙江省高校排名更新!寧波大學(xué)第4,浙工大第7,溫州醫(yī)科大僅排14

浙江省高校排名更新!寧波大學(xué)第4,浙工大第7,溫州醫(yī)科大僅排14

朗威談星座
2026-03-26 18:09:46
1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

阿校談史
2026-03-20 11:03:27
德邦將于3月31日退市并摘牌,并入京東物流后品牌獨(dú)立運(yùn)營

德邦將于3月31日退市并摘牌,并入京東物流后品牌獨(dú)立運(yùn)營

南方都市報(bào)
2026-03-26 11:30:07
已被禁賽4年 俄羅斯不后悔未加入亞足聯(lián) 主帥:就5隊(duì)能打難獲進(jìn)步

已被禁賽4年 俄羅斯不后悔未加入亞足聯(lián) 主帥:就5隊(duì)能打難獲進(jìn)步

我愛英超
2026-03-26 18:25:55
快手股價(jià)暴跌逾14%,總市值已不足2000億港元

快手股價(jià)暴跌逾14%,總市值已不足2000億港元

澎湃新聞
2026-03-26 16:36:26
我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

番外行
2026-03-24 13:04:28
孫子生日,我轉(zhuǎn)了8888元給兒媳,她回復(fù)2個(gè)字,我直接凍結(jié)銀行卡

孫子生日,我轉(zhuǎn)了8888元給兒媳,她回復(fù)2個(gè)字,我直接凍結(jié)銀行卡

清茶淺談
2025-09-07 23:32:29
一口氣刷完全集,Netflix新劇又殺瘋了

一口氣刷完全集,Netflix新劇又殺瘋了

來看美劇
2026-03-26 19:45:54
WTO25年來首改臺灣稱呼,美國調(diào)整涉臺立場,賴清德破防

WTO25年來首改臺灣稱呼,美國調(diào)整涉臺立場,賴清德破防

有牙的兔紙
2026-03-26 20:06:31
一個(gè)很悲催現(xiàn)象:百萬存款,子女盼你走;一萬退休金,子女怕你走

一個(gè)很悲催現(xiàn)象:百萬存款,子女盼你走;一萬退休金,子女怕你走

華人星光
2026-03-26 13:21:26
伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

每日經(jīng)濟(jì)新聞
2026-03-26 12:20:14
中方堅(jiān)決扣留船只,美方及時(shí)干預(yù) 取消中企投標(biāo)資格,巴拿馬難挽

中方堅(jiān)決扣留船只,美方及時(shí)干預(yù) 取消中企投標(biāo)資格,巴拿馬難挽

南宗歷史
2026-03-25 16:04:15
中共中央批準(zhǔn),開除劉慧黨籍

中共中央批準(zhǔn),開除劉慧黨籍

新京報(bào)政事兒
2026-03-26 17:13:05
一覺醒來天塌了!美國突然發(fā)現(xiàn),命脈被中國控制,這仗還怎么打?

一覺醒來天塌了!美國突然發(fā)現(xiàn),命脈被中國控制,這仗還怎么打?

谷盟a
2026-03-24 13:43:01
曼城115項(xiàng)指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

曼城115項(xiàng)指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

樂道足球
2026-03-26 19:55:49
伊朗導(dǎo)彈砸向美國航母:伊朗打出了開戰(zhàn)以來最強(qiáng)一拳

伊朗導(dǎo)彈砸向美國航母:伊朗打出了開戰(zhàn)以來最強(qiáng)一拳

起喜電影
2026-03-26 14:20:32
2026-03-26 20:44:49
FounderPark incentive-icons
FounderPark
關(guān)注AI創(chuàng)業(yè),專注和創(chuàng)業(yè)者聊真問題
1183文章數(shù) 160關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

健康
數(shù)碼
游戲
公開課
軍事航空

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

小米Book Pro 14超薄設(shè)計(jì)引爆市場!這家國產(chǎn)廠商立功了

10萬獎(jiǎng)池!2026 KKCS1.6 巔峰之路傳奇聯(lián)賽(春季賽)正式開賽!——KK官方對戰(zhàn)平臺

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版