国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

聽(tīng)完P(guān)romptPilot的發(fā)布會(huì),發(fā)現(xiàn)他們想Pilot的竟然不止是Prompts

0
分享至

作者 | 郭海惟
郵箱 | guohaiwei@pingwest.com

9月13日,火山云的PromptPilot終于“正式”發(fā)布了。

這款產(chǎn)品最早在6月12日的火山引擎 FORCE 原動(dòng)力大會(huì)上亮相,當(dāng)時(shí)火山引擎智能算法負(fù)責(zé)人吳迪花了十分鐘介紹了PromptPilot的特點(diǎn)和工作流程。

吳迪當(dāng)時(shí)對(duì)PromptPilot推出的戰(zhàn)略背景有三點(diǎn)總結(jié):

  • 模型越強(qiáng),提出好問(wèn)題的正向價(jià)值越大;

  • 有很多高價(jià)值問(wèn)題,沒(méi)有標(biāo)準(zhǔn)答案;

  • 提示詞工程本質(zhì)是一個(gè)搜索問(wèn)題,一切搜索問(wèn)題都長(zhǎng)期都將由算法來(lái)解決。

這三個(gè)論斷,或許可以被理解為當(dāng)時(shí)火山引擎對(duì)PromptPilot業(yè)務(wù)戰(zhàn)略邏輯的核心論述:

提示詞是值錢的,而PromptPilot的價(jià)值,某種程度來(lái)自于個(gè)性化的場(chǎng)景需求與對(duì)prompt需求的個(gè)性化理解。正是因?yàn)閳?chǎng)景是個(gè)性化的,所以prompt有被調(diào)整的需要;正是因?yàn)閜rompt本質(zhì)是搜索,所以需要構(gòu)建對(duì)用戶的理解。

其實(shí)很多巨頭都在做類似的事情。

比如,最近阿里巴巴財(cái)報(bào)會(huì)上,吳永銘將記憶能力稱為整個(gè)agent應(yīng)用突破的重要節(jié)點(diǎn);Notion、飛書、IMA等應(yīng)用,都在致力于構(gòu)建一個(gè)服務(wù)于用戶的知識(shí)庫(kù)生態(tài)。

Prompt天然有以上的屬性。

借用最近挺火的“十字路口”的比喻,Prompt既是人與智能的十字路口,也是當(dāng)下以大模型為主的智能基礎(chǔ)與未來(lái)以agent為主的智能生態(tài)的十字路口。

而在9月14日PromptPilot正式發(fā)布的溝通會(huì)上,面對(duì)臺(tái)下的開(kāi)發(fā)者和媒體,技術(shù)負(fù)責(zé)人許偉則對(duì)PrompPilot的戰(zhàn)略價(jià)值給出了更多的論述角度,他在會(huì)議上給了幾個(gè)很有意思的斷,也是我印象比較深幾點(diǎn)。

第一,他說(shuō),在垂直場(chǎng)景的打造過(guò)程中,場(chǎng)景定制化與基礎(chǔ)模型能力的GAP會(huì)“永遠(yuǎn)存在”。

如果要解決好垂直場(chǎng)景的落地問(wèn)題,最好的方式就是“將一些關(guān)鍵能力交到廣大客戶和行業(yè)專家手中”,從而“共同推動(dòng)智能的進(jìn)一步廣泛和深度提升,實(shí)現(xiàn)大規(guī)模的落地應(yīng)用”。

第二,其實(shí)也與第一中的解決方案相呼應(yīng)。許偉稱,如果AI上半場(chǎng)是互聯(lián)網(wǎng)數(shù)據(jù)引領(lǐng)智能增長(zhǎng),那么“下半場(chǎng)的數(shù)據(jù)則源自行業(yè)和專家的腦袋”,而這會(huì)是“重要的區(qū)別”。

第三,與大模型訓(xùn)練類似,大量開(kāi)發(fā)者在開(kāi)發(fā)agent的時(shí)候,依然像是在煉金,將數(shù)據(jù)扔進(jìn)黑箱里祈求獲得黃金。這已經(jīng)成為了agent開(kāi)發(fā)中的痛點(diǎn),同時(shí)也造成了一定的算力浪費(fèi)。許偉認(rèn)為,工程化的prompt能力,將不同的模塊聯(lián)動(dòng)訓(xùn)練,可以一定程度上讓agent的訓(xùn)練“可執(zhí)行、可驗(yàn)證”。

從這個(gè)角度來(lái)說(shuō),PromptPilot對(duì)自己角色的定位算是很明確的。它應(yīng)該就是一個(gè)輔助行業(yè)從AI上半場(chǎng)走向下半場(chǎng)的工具。

而作為工具,它自己要迭代、要scaling、要積累數(shù)據(jù),同時(shí)要考慮一些“代碼素人”的行業(yè)專家也可以使用。

而如果落腳到現(xiàn)實(shí)問(wèn)題上,PromptPilot其實(shí)要解決許偉提出的三個(gè)“悖論”。

一個(gè)是用戶“如何清楚表達(dá)需求”:

許偉認(rèn)為,用戶的意圖從人腦,再到具象化的目標(biāo)、結(jié)構(gòu)化的表達(dá),中間是存在鴻溝的。尤其是當(dāng)場(chǎng)景越垂直、越專業(yè),那就越難以用自然語(yǔ)言一次性說(shuō)清楚,也越需要更精細(xì)、更結(jié)構(gòu)化的prompt。

其次是如何摸清楚“模型的能力邊界”:

而對(duì)于agent開(kāi)發(fā)者來(lái)說(shuō),大模型能力的邊界也是模糊的。(許偉沒(méi)有展開(kāi)講,但我想這個(gè)觀點(diǎn)其實(shí)也無(wú)需多言,因?yàn)榇竽P推鋵?shí)是一個(gè)黑箱,所以才會(huì)有各種各樣對(duì)大模型的能力測(cè)評(píng)榜單,對(duì)榜單的評(píng)測(cè)結(jié)果才會(huì)有各種各樣的爭(zhēng)議)。

許偉說(shuō),“大模型應(yīng)用本質(zhì)是尋找定制場(chǎng)景的模型能力邊界”。他指出,作為大模型開(kāi)發(fā)者的工作,其實(shí)是在表達(dá)不清的需求和能力莫測(cè)的模型之間,試圖搭建人與模型之間的橋梁。

第一和第二個(gè)“悖論”,其實(shí)呼應(yīng)了之前的觀點(diǎn),即場(chǎng)景定制化與基礎(chǔ)模型能力的GAP會(huì)“永遠(yuǎn)存在”。

而第三個(gè)悖論則是長(zhǎng)上下文的動(dòng)態(tài)適應(yīng)過(guò)程。

許偉認(rèn)為這是目前最難的挑戰(zhàn)。一方面大模型本身是人類高級(jí)思考的替代品,本身是很開(kāi)放式的(硅星人注:注意力不集中且容易有幻覺(jué));另一方面,上下文越來(lái)越長(zhǎng),越來(lái)越多樣。這導(dǎo)致在開(kāi)發(fā)過(guò)程中,很多問(wèn)題是開(kāi)發(fā)者想象之外的。

你很難想象PromptPilot能解決以上所有的問(wèn)題,但他們給出了一個(gè)自己的工作流程,我也拍了一張照可以給大家參考——PromptPilot建立了一個(gè)與用戶行為流程相匹配的SDK數(shù)據(jù)閉環(huán)回流,來(lái)試圖形成一個(gè)不斷改進(jìn)系統(tǒng)能力的飛輪。

而在整個(gè)發(fā)布會(huì)中,最高頻出現(xiàn)的詞語(yǔ)大概是圖中所示的評(píng)估標(biāo)準(zhǔn)和badcase。

在模型深入場(chǎng)景的過(guò)程中,可能最珍貴的就是如何評(píng)價(jià)的標(biāo)準(zhǔn)。與prompt一樣,標(biāo)準(zhǔn)其實(shí)藏在專家的腦子里,它甚至不是一條條理論性的可以清楚描述的語(yǔ)言,而是存在相當(dāng)程度“灰度”的。而后者則是很難用語(yǔ)言直接描述的。

許偉舉例說(shuō),比如圖片審核中,一些元素以不同的方式不同的程度出現(xiàn),可能得出的合規(guī)與否的判斷會(huì)完全不同。而PromptPilot能做的就是讓模型在與用戶不斷交互的過(guò)程中個(gè),把評(píng)估標(biāo)準(zhǔn)背后的意圖給抽取出來(lái)。

在這個(gè)過(guò)程中,大量的case就顯得非常重要。

火山引擎大模型算法工程師王鐵飛,介紹了PromptPilot的四個(gè)模塊,分別是:

數(shù)據(jù)智擎工坊(Data Engineering)、Prompt 臻化聯(lián)動(dòng)艙(Prompt優(yōu)化和聯(lián)動(dòng)精調(diào))、Badecase洞察站(Badecase檢測(cè))和 AI方案生成器(Solution)

這四個(gè)模塊可以理解為SDK數(shù)據(jù)閉環(huán)回流圖的細(xì)化。

從實(shí)操來(lái)看,整體的流程與8月份對(duì)外披露的升級(jí)版變化不大。整套系統(tǒng)給人的感覺(jué)是,在批量測(cè)試之前,人基本能改的地方,都開(kāi)放給了人手動(dòng)修改和評(píng)分;當(dāng)然,相應(yīng)的自動(dòng)化能力也沒(méi)落下。

測(cè)試下來(lái)的感覺(jué)有點(diǎn)像一輛汽車,既有手動(dòng)擋又有自動(dòng)擋。

比如一些媒體老師,拿官方的案例,閉著眼睛一直讓自動(dòng)化流程走到底,總體也能跑通,拿一個(gè)還不錯(cuò)的測(cè)試分?jǐn)?shù);開(kāi)發(fā)者則喜歡一邊讓自動(dòng)流程跑,每跑一步,就上手優(yōu)化一下,再接著跑,編prompt甚至能玩出一點(diǎn)vibe coding的感覺(jué)。

如許偉所說(shuō),PrompPilot希望把能力“交給專家”,所以產(chǎn)品方面能明顯看到給用戶留了很多能力植入和交互的地方。

首先,用戶在一鍵生成Prompt的時(shí)候可以提前加入知識(shí)庫(kù)的文檔。

用戶可以導(dǎo)入簡(jiǎn)單的任務(wù)描述,也可以直接把領(lǐng)導(dǎo)給你的任務(wù)說(shuō)明一股腦扔進(jìn)去。

因?yàn)榧幢闵尚Ч患眩彩强梢灾С謩澗€局部提修改意見(jiàn),當(dāng)然直接上手改也是可以的。

跳測(cè)試。

這里給數(shù)據(jù)集輸入一個(gè)case(填寫變量)

變量可以從數(shù)據(jù)集里隨機(jī)抓,也可以AI生成以后自己改。

模型會(huì)跑回答。

跑完回答后,可以直接在模型回答里改,改到滿意為止。

如果太復(fù)雜的問(wèn)題,可以在下方添加到評(píng)測(cè)集里,多輸出幾個(gè)標(biāo)準(zhǔn)答案,可以幫助模型表現(xiàn)更好。

當(dāng)然也可以批量上傳評(píng)測(cè)集,評(píng)測(cè)完成后給所有的結(jié)果手動(dòng)打分和輸入評(píng)測(cè)標(biāo)準(zhǔn)。同理,評(píng)測(cè)標(biāo)準(zhǔn)可以自動(dòng)生成,也可以手動(dòng)改寫輸入。

然后AI會(huì)自動(dòng)生成打分的分?jǐn)?shù),打完分以后可以讓PromptPilot進(jìn)行自動(dòng)優(yōu)化.

然后這個(gè)時(shí)候你才進(jìn)入到PromptPilot核心能力的大門,也就是剛才提到的Prompt臻化聯(lián)動(dòng)倉(cāng)(Prompt優(yōu)化和聯(lián)動(dòng)精調(diào))

如果不滿意的話,可以重新再來(lái)一遍,然后模型會(huì)不斷微調(diào),把分?jǐn)?shù)拉上去,表現(xiàn)不好的BadCase會(huì)被收錄到“錯(cuò)題本”里,并導(dǎo)出一個(gè)智能優(yōu)化的報(bào)告。

不要小看這個(gè)流程,它其實(shí)解決了獨(dú)立開(kāi)發(fā)者的幾個(gè)頭疼的問(wèn)題:

上下文能力和模型評(píng)估能力。

案圖示例里只有幾十個(gè)case,但如果像agent創(chuàng)業(yè)者,動(dòng)輒數(shù)千個(gè)case涌入進(jìn)來(lái),這套流程的威力就會(huì)顯現(xiàn)出來(lái)了。這不是一個(gè)簡(jiǎn)單的prompt編寫能力,而是幫助開(kāi)發(fā)者直抵agent的核心。

我想甚至可以這么說(shuō):大模型+PromptPilot,其實(shí)就已經(jīng)可以成為一個(gè)簡(jiǎn)單版的DIY生產(chǎn)力agent了。

所以在交流環(huán)節(jié),有開(kāi)發(fā)者站起來(lái)的第一個(gè)問(wèn)題就是,這玩意兒能不能接到非火山云的場(chǎng)景里,比如他自己玩的端側(cè)模型(其實(shí)我猜他可能想說(shuō)阿里云、騰訊云之類的友商,但不太好意思)。

王鐵飛立刻說(shuō)是可以的,他們已經(jīng)開(kāi)了API接口,能力是完全開(kāi)放的,開(kāi)發(fā)者直接自己接就可以了。

PromptPilot 團(tuán)隊(duì)至少在發(fā)布會(huì)上展現(xiàn)了很包容性的姿態(tài),他們甚至可以支持所謂的“Repurpose”的功能——就是如果你使用了一個(gè)較大較強(qiáng)的模型,但因?yàn)楦鞣N原因需要降級(jí)模型能力,PromptPilot可以幫你在執(zhí)行這個(gè)特定的任務(wù)能力方面,盡量拉齊到原先的水平上。

我個(gè)人粗淺的理解是:相當(dāng)于你原本開(kāi)奔馳大G跑高速,但120邁勻速有很多車,換飛度的性價(jià)比其實(shí)更高。但在上高速,駕駛員對(duì)路況不熟悉,寧愿先用大奔把成功率跑上去,然后慢慢再去探尋成本的邊界,而PromptPilot在這個(gè)時(shí)候可以成為你換車的工具箱之一。

所以從這個(gè)角度來(lái)說(shuō),PromptPilot不是一個(gè)簡(jiǎn)單的prompt工具,而是大模型落地的橋梁。它既能通過(guò)對(duì)話和評(píng)分,把人的需求溝通明白,也能以此為抓手,再對(duì)模型能力進(jìn)行規(guī)劃和精調(diào)。

在所有的AI云廠都在布局agent服務(wù)能力的今天,PromptPilot未來(lái)會(huì)長(zhǎng)成什么樣,是一件值得期待的事情。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一場(chǎng)2-0,踢出瘋狂8連勝,孔帕尼神了:目標(biāo)直指三冠王

一場(chǎng)2-0,踢出瘋狂8連勝,孔帕尼神了:目標(biāo)直指三冠王

足球狗說(shuō)
2026-04-23 05:09:13
藏在成都的5家“國(guó)寶級(jí)”中醫(yī)院!每一家都有看家本領(lǐng),快收藏

藏在成都的5家“國(guó)寶級(jí)”中醫(yī)院!每一家都有看家本領(lǐng),快收藏

荷蘭豆愛(ài)健康
2026-04-22 19:18:04
一個(gè)消息震動(dòng)中東,阿聯(lián)酋突然爆出大數(shù)字,美以這下捅了馬蜂窩

一個(gè)消息震動(dòng)中東,阿聯(lián)酋突然爆出大數(shù)字,美以這下捅了馬蜂窩

流史歲月
2026-04-22 10:18:10
特朗普想逼伊朗簽協(xié)議,伊方“全球通緝犯”總司令硬剛,直接打臉

特朗普想逼伊朗簽協(xié)議,伊方“全球通緝犯”總司令硬剛,直接打臉

琨玉秋霜
2026-04-23 03:04:47
“磨膝大戶”被公布,是跑步的20倍,醫(yī)生:不想軟骨磨光,早扔掉

“磨膝大戶”被公布,是跑步的20倍,醫(yī)生:不想軟骨磨光,早扔掉

垚垚分享健康
2026-04-19 14:35:09
喜歡吊帶裙:不是因?yàn)樯聿?,是因?yàn)樽杂?>
    </a>
        <h3>
      <a href=疾跑的小蝸牛
2026-04-22 22:13:19
南通百億超級(jí)工程,官宣!

南通百億超級(jí)工程,官宣!

南通樓市說(shuō)說(shuō)
2026-04-22 14:05:02
3艘俄軍艦被炸沉!局勢(shì)觸及核紅線,美方:俄羅斯或動(dòng)用核武器!

3艘俄軍艦被炸沉!局勢(shì)觸及核紅線,美方:俄羅斯或動(dòng)用核武器!

小嵩
2026-04-23 05:11:23
“被忽視”的豪華SUV,從21.98萬(wàn)一口氣降到12萬(wàn)多,可惜無(wú)人識(shí)貨

“被忽視”的豪華SUV,從21.98萬(wàn)一口氣降到12萬(wàn)多,可惜無(wú)人識(shí)貨

隔壁說(shuō)車?yán)贤?/span>
2026-04-22 08:14:09
鄧文迪近照大變樣,成歐美最流行的海湖莊園臉,57像37看著好年輕

鄧文迪近照大變樣,成歐美最流行的海湖莊園臉,57像37看著好年輕

小娛樂(lè)悠悠
2026-04-22 09:50:39
山西忻州市公務(wù)員局發(fā)布情況說(shuō)明:考生楊某媛(女)為山西忻州籍,與自媒體貼文中所分析的楊某媛并非同一人

山西忻州市公務(wù)員局發(fā)布情況說(shuō)明:考生楊某媛(女)為山西忻州籍,與自媒體貼文中所分析的楊某媛并非同一人

揚(yáng)子晚報(bào)
2026-04-22 17:03:42
中超第7輪結(jié)束:大連英博5連勝!上海申花7場(chǎng)不?。?>
    </a>
        <h3>
      <a href=中超第7輪結(jié)束:大連英博5連勝!上海申花7場(chǎng)不??! 順靜自然
2026-04-23 01:03:32
泄露“刺殺伊朗新最高領(lǐng)袖穆杰塔巴”計(jì)劃,美核武安全主管被查!巴西總統(tǒng):趕緊給特朗普頒個(gè)獎(jiǎng),就不會(huì)再有戰(zhàn)爭(zhēng)了

泄露“刺殺伊朗新最高領(lǐng)袖穆杰塔巴”計(jì)劃,美核武安全主管被查!巴西總統(tǒng):趕緊給特朗普頒個(gè)獎(jiǎng),就不會(huì)再有戰(zhàn)爭(zhēng)了

每日經(jīng)濟(jì)新聞
2026-04-22 17:50:53
外交部:日本涉靖國(guó)神社一系列消極動(dòng)向公然挑釁國(guó)際正義,粗暴踐踏人類良知

外交部:日本涉靖國(guó)神社一系列消極動(dòng)向公然挑釁國(guó)際正義,粗暴踐踏人類良知

每日經(jīng)濟(jì)新聞
2026-04-23 00:04:36
長(zhǎng)盈精密:公司位于深圳市寶安區(qū)燕羅街道的機(jī)器人智能制造產(chǎn)業(yè)園已經(jīng)投入使用

長(zhǎng)盈精密:公司位于深圳市寶安區(qū)燕羅街道的機(jī)器人智能制造產(chǎn)業(yè)園已經(jīng)投入使用

每日經(jīng)濟(jì)新聞
2026-04-22 16:15:09
美公布第二款六代機(jī)!網(wǎng)友喊話:中國(guó)七代機(jī)發(fā)動(dòng)機(jī)都搞出來(lái)了

美公布第二款六代機(jī)!網(wǎng)友喊話:中國(guó)七代機(jī)發(fā)動(dòng)機(jī)都搞出來(lái)了

春序娛樂(lè)
2026-04-23 00:52:42
國(guó)務(wù)院國(guó)資委回復(fù):國(guó)有企業(yè)與子公司之間是否可以進(jìn)行實(shí)物資產(chǎn)的無(wú)償劃轉(zhuǎn)?

國(guó)務(wù)院國(guó)資委回復(fù):國(guó)有企業(yè)與子公司之間是否可以進(jìn)行實(shí)物資產(chǎn)的無(wú)償劃轉(zhuǎn)?

審計(jì)之家
2026-04-22 09:34:42
晚年兩性關(guān)系真相!79歲奶奶直言:男人過(guò)了75,只剩這兩個(gè)好處

晚年兩性關(guān)系真相!79歲奶奶直言:男人過(guò)了75,只剩這兩個(gè)好處

皓皓情感說(shuō)
2026-04-22 08:19:04
黑龍江省綏化市人大常委會(huì)原黨組書記李元學(xué)被雙開(kāi)

黑龍江省綏化市人大常委會(huì)原黨組書記李元學(xué)被雙開(kāi)

界面新聞
2026-04-22 11:00:00
一日西甲動(dòng)向:皇馬2-1勝拿下三分,巴薩在追逐米蘭雙雄主力選手

一日西甲動(dòng)向:皇馬2-1勝拿下三分,巴薩在追逐米蘭雙雄主力選手

里芃芃體育
2026-04-23 05:00:03
2026-04-23 05:59:00
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進(jìn)入GenAl。
272文章數(shù) 37關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

伊朗議長(zhǎng):不可能重新開(kāi)放霍爾木茲海峽

頭條要聞

伊朗議長(zhǎng):不可能重新開(kāi)放霍爾木茲海峽

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

蜜雪冰城泰國(guó)代言人 被扒出辱華黑歷史

財(cái)經(jīng)要聞

醫(yī)院專家號(hào)"秒空"!警方牽出黑色產(chǎn)業(yè)鏈

汽車要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

親子
旅游
家居
本地
公開(kāi)課

親子要聞

兼顧專業(yè)哺喂與綠色環(huán)保,貝親發(fā)布自然實(shí)感凈澈系列奶瓶

旅游要聞

“運(yùn)上行”周五首航

家居要聞

極簡(jiǎn)繪夢(mèng) 克制和諧

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版