国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一曲新詞酒一杯,喝到Harness我就醉

0
分享至

現(xiàn)在Harness已是AI業(yè)界的熱詞。Anthropic和OpenAI在二三月間于官網(wǎng)技術(shù)博客上發(fā)文介紹后,如今人人都在聊。

AI明星林俊旸近日于社交媒體上轉(zhuǎn)發(fā)一篇斯坦福大學(xué)研究人員的Harness新產(chǎn)品論文時(shí)稱:“現(xiàn)在模型+harness的模式已經(jīng)超過(guò)單純的AI模型。Harness的設(shè)計(jì)和質(zhì)量能顯著影響AI智能體性能。開發(fā)Harness是正確的道路”。

當(dāng)概念已經(jīng)被炒熱成這樣,那么就需要捋清概念:何謂AI的Harness?

01

Harness起源:拿AI管AI寫AI

AI現(xiàn)在是產(chǎn)學(xué)研齊頭前進(jìn)的行業(yè),說(shuō)概念,先從實(shí)例和溯源說(shuō)起。

Anthropic的Claude Code現(xiàn)在是AI智能體編程的頭部產(chǎn)品。Claude Code的爸爸、從原初雛形至今的創(chuàng)作者和負(fù)責(zé)人鮑里斯·切爾尼(Boris Cherny)在社交媒體和出席各種播客節(jié)目時(shí)詳細(xì)描述了自己開發(fā)Claude Code的歷程。

在切爾尼的描述中,工作量增加后,團(tuán)隊(duì)成員開始用Claude Code寫Claude Code自己的代碼、并用AI管理寫代碼的AI。

切爾尼說(shuō),自己會(huì)在工作機(jī)器上開五個(gè)以上終端標(biāo)簽頁(yè),每個(gè)標(biāo)簽頁(yè)里都是一個(gè)獨(dú)立運(yùn)作的Claude Code副本。如果終端標(biāo)簽頁(yè)不夠使,他將編程任務(wù)“溢出”進(jìn)Claude Code的Web或桌面端app,和標(biāo)簽頁(yè)的子副本都是隔離分別運(yùn)行。

每次寫碼從進(jìn)入總管這些副本的Claude Code的計(jì)劃模式(Plan Mode)開始,訂好工作流程:

第一批Claude Code的子副本寫代碼。

第二批子副本做檢查代碼的評(píng)審(Reviewer),關(guān)注代碼的邊界條件、風(fēng)格一致性和可維護(hù)性等易失誤處。

第三批子副本再審核第二批代碼的工作是否符合md(Markdown)文件的要求。

子副本們之前的常見(jiàn)錯(cuò)誤、期望達(dá)到的代碼風(fēng)格、常用命令與文件目錄、動(dòng)作禁則,簡(jiǎn)潔概括后寫入總管的Claude Code的md文件中,作為以后AI自動(dòng)寫碼的指導(dǎo)。

“用AI管AI寫AI代碼”的模式下,切爾尼個(gè)人每天能發(fā)出10-30個(gè)合并代碼的拉取請(qǐng)求(PR),數(shù)月內(nèi)不用手動(dòng)寫碼,效率激增。依靠這種模式,Anthropic才能達(dá)到現(xiàn)在幾乎隔日一次重大更新的產(chǎn)品發(fā)布頻率。



如果熟悉Anthropic的官網(wǎng)更新動(dòng)態(tài),就會(huì)發(fā)現(xiàn)《為長(zhǎng)期應(yīng)用運(yùn)行開發(fā)的Harness設(shè)計(jì)》(Harness design for long-running application development)這篇3月熱門文章的內(nèi)容,切爾尼提前兩三個(gè)月在播客上就嘮過(guò)了。

3月熱文中的“三智能體”Harness架構(gòu),三層的規(guī)劃者(Planner)、生成器(Generator)、評(píng)估器(Evaluator),基本是切爾尼上節(jié)目時(shí)的大白話內(nèi)容,不過(guò)做了概括后再包裝。

02

Harness本質(zhì):高成本高效率的多智能體架構(gòu)

切爾尼描述的這個(gè)過(guò)程就是Harness的本質(zhì)。Harness不只是自動(dòng)完成任務(wù)的子智能體、不只是總管子智能體工作的上層智能體、也不只是告訴AI工作事項(xiàng)的md文件,而是總括了這些的AI智能體自動(dòng)運(yùn)轉(zhuǎn)的整體流程。

使用Harness這個(gè)字眼來(lái)描述此流程,是借用電氣工程中的“線束工程”概念。電氣工程的“線束”統(tǒng)籌的是線路與信號(hào)走向,AI智能體的Harness統(tǒng)籌的是子智能體與模塊的動(dòng)作功能,殊途同歸。

當(dāng)然,真要咬文嚼字起來(lái),Harness可以翻譯成中文中的“輐”與“軛”,是連接馬匹與車身的傳動(dòng)兼指向車具。不過(guò)古天主教和尚的“若無(wú)必要,勿增實(shí)體”原則在六七百年后的AI時(shí)代更加有用,不用新造字眼給大眾增加理解負(fù)擔(dān),真要中文意譯,用電氣工程中已通行、最簡(jiǎn)潔的“線束”最合適。

如果更仔細(xì)考證技術(shù)底蘊(yùn),能發(fā)現(xiàn)在2025年6月中Anthropic發(fā)布的官網(wǎng)文章《我司如何構(gòu)建多智能體》,已經(jīng)開始嘗試多智能體Harness架構(gòu)。以Claude Opus 4為上層智能體底座、Sonnet 4為子智能體底座的多智能體架構(gòu),在他們的內(nèi)部評(píng)測(cè)中,性能比Opus 4單一模型強(qiáng)出90.2%。

高效率的同義詞往往是高成本。2026年3月Anthropic的Harness文章中示例,用同一組提示詞,讓AI自行編寫一個(gè)2D復(fù)古小游戲。以此對(duì)比Opus 4.5單一模型和多智能體Harness架構(gòu)的性能:?jiǎn)我荒P瓦\(yùn)行20分鐘,成本9美元,成品不可用;全套harness運(yùn)行6小時(shí),成本200美元,成品可用。

該文除了展現(xiàn)Harness架構(gòu)性能,也以此做了Opus 4.6更新的廣告:“Opus 4.6計(jì)劃更仔細(xì),運(yùn)行智能體任務(wù)的時(shí)長(zhǎng)更久,能在更大的代碼庫(kù)中更可靠地運(yùn)行,并有更好的代碼審查和調(diào)試功能來(lái)自我糾正?!?/p>

用白話說(shuō),就是更強(qiáng)的模型才能驅(qū)動(dòng)更高效的Harness,有多快馬跑多快車。從2025年6月至今,多智能體架構(gòu)耗費(fèi)token的速度始終是普通聊天機(jī)器人的15倍以上,但將工作流拆分成子任務(wù)集合完成的效率也不減此數(shù)。顧客們要不要掏錢惠顧模型廠,須有一番思量。

03

Harness精髓:用AI體現(xiàn)傳統(tǒng)軟件工程要?jiǎng)t

00后程序員趙晨陽(yáng)現(xiàn)在由開源項(xiàng)目SGLang衍生的“基數(shù)方舟AI”(RadixArk AI)公司供職,按他在社交媒體上的解析,現(xiàn)在業(yè)界狂炒Harness,反而很不AI風(fēng),是疊床架屋地增加智識(shí)負(fù)擔(dān)。

趙晨陽(yáng)認(rèn)為,所有Harness的關(guān)鍵點(diǎn),都是用AI重新實(shí)現(xiàn)了一遍“古代”傳統(tǒng)軟件工程原則中的要點(diǎn):

不在AI聊天機(jī)器人的每次對(duì)話紀(jì)錄用提示詞重復(fù)闡明工作準(zhǔn)則,而將準(zhǔn)則保存在AI智能體的md文件,這是“文檔即代碼”(docs-as-code)原則在AI中的體現(xiàn);

不期待一個(gè)超級(jí)AI模型解決整個(gè)工作任務(wù),將工作任務(wù)拆成分隔的專門版塊,讓單個(gè)子智能體只處理單一版塊,這是“關(guān)注點(diǎn)分離”(separation of concerns)和“單一職責(zé)”(single responsibility)原則在AI中的體現(xiàn);



將AI子智能體在工作流中的權(quán)責(zé)結(jié)構(gòu)化,不讓總管的AI上層智能體自行猜測(cè),這是“左移約束”(shift-left constraints)原則在AI中的體現(xiàn)。

Anthropic的研究員尼古拉斯·卡利尼在2月底公布的實(shí)驗(yàn),也體現(xiàn)了此原則。卡利尼使用了約2萬(wàn)美元的API總額度、并發(fā)約兩千次Claude Code會(huì)話、并行16個(gè)Claude Opus 4.6驅(qū)動(dòng)的子智能體、用時(shí)兩周、生成了10萬(wàn)行Rust代碼,最后構(gòu)建出可運(yùn)行C編譯器。

按Anthropic官網(wǎng)上的卡利尼自述,他的精力不在寫提示詞上,提示詞可以盡量簡(jiǎn)單,工作的重點(diǎn)是設(shè)計(jì)子智能體架構(gòu)的基礎(chǔ)環(huán)境:測(cè)試、運(yùn)行、反饋等機(jī)制,如此才能讓多AI智能體無(wú)人工干預(yù)自行運(yùn)轉(zhuǎn)。

ChatGPT奇跡的三年內(nèi),第一年大家在思考如何給AI聊天機(jī)器人寫出更好的提示詞、在聊天窗口調(diào)用大模型的性能。

第二年大家發(fā)現(xiàn)完成調(diào)用不用人類來(lái)做提示詞仙人,讓AI自己學(xué)會(huì)調(diào)用不同大模型和同一大模型的不同功能API,這是Manus和AI智能體火熱的一年。

第三年大家發(fā)現(xiàn)可以讓AI自己學(xué)會(huì)自動(dòng)調(diào)用并讀懂用戶終端里的本地文件、和云端的各種AI子智能體,這是OpenClaw和Harness架構(gòu)火熱的一年。

時(shí)代趨勢(shì)是AI的調(diào)用層級(jí)越來(lái)越高,完成的任務(wù)越來(lái)越復(fù)雜。但技術(shù)皆有脈絡(luò)可循,基礎(chǔ)原理并不是大眾不能理解的黑魔法。(作者/李熙)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
活久見(jiàn)!持倉(cāng)1617萬(wàn),千萬(wàn)黃金持倉(cāng)賬戶火爆全網(wǎng),戶主只買不賣…

活久見(jiàn)!持倉(cāng)1617萬(wàn),千萬(wàn)黃金持倉(cāng)賬戶火爆全網(wǎng),戶主只買不賣…

火山詩(shī)話
2026-04-11 15:08:05
樊振東退出世乒賽僅2天,國(guó)際乒聯(lián)主席表態(tài),12個(gè)字信息量有點(diǎn)大

樊振東退出世乒賽僅2天,國(guó)際乒聯(lián)主席表態(tài),12個(gè)字信息量有點(diǎn)大

林子說(shuō)事
2026-04-11 13:22:42
李斌:不是所有的隱藏式門把手都不安全 蔚來(lái)的是個(gè)例外

李斌:不是所有的隱藏式門把手都不安全 蔚來(lái)的是個(gè)例外

快科技
2026-04-10 12:20:06
金平日:與金正日爭(zhēng)權(quán)失敗,駐外30年躲過(guò)暗殺,因這件事允許回國(guó)

金平日:與金正日爭(zhēng)權(quán)失敗,駐外30年躲過(guò)暗殺,因這件事允許回國(guó)

阿胡
2025-04-03 13:59:42
為啥上海沒(méi)有想象中那么繁華?網(wǎng)友:你沒(méi)機(jī)會(huì)見(jiàn)到上海繁華的一面

為啥上海沒(méi)有想象中那么繁華?網(wǎng)友:你沒(méi)機(jī)會(huì)見(jiàn)到上海繁華的一面

帶你感受人間冷暖
2026-04-11 00:30:08
4299元!剛發(fā)布的這款Pro新機(jī)把我整不會(huì)了,但好像又有點(diǎn)香

4299元!剛發(fā)布的這款Pro新機(jī)把我整不會(huì)了,但好像又有點(diǎn)香

科技堡壘
2026-04-10 09:16:56
一場(chǎng)葬禮,徹底戳穿陳麗華遲重瑞婚姻真相,林大慶評(píng)價(jià)一針見(jiàn)血

一場(chǎng)葬禮,徹底戳穿陳麗華遲重瑞婚姻真相,林大慶評(píng)價(jià)一針見(jiàn)血

小僫搞笑解說(shuō)
2026-04-11 04:43:05
峰學(xué)未來(lái)直播間重亮:李麗婧發(fā)了一條沒(méi)標(biāo)點(diǎn)的微博

峰學(xué)未來(lái)直播間重亮:李麗婧發(fā)了一條沒(méi)標(biāo)點(diǎn)的微博

一盅情懷
2026-04-11 18:02:57
DJI把電機(jī)塞進(jìn)自行車,1.5kg重量讓傳統(tǒng)廠商集體沉默

DJI把電機(jī)塞進(jìn)自行車,1.5kg重量讓傳統(tǒng)廠商集體沉默

摸魚算法
2026-04-11 08:15:33
1962年,夢(mèng)露現(xiàn)身肯尼迪生日宴,一條鑲滿鉆石的緊身長(zhǎng)裙驚艷世人

1962年,夢(mèng)露現(xiàn)身肯尼迪生日宴,一條鑲滿鉆石的緊身長(zhǎng)裙驚艷世人

照見(jiàn)古今
2026-04-09 18:22:22
伊能靜長(zhǎng)文控訴!十年沒(méi)二人世界,她抑郁是秦昊缺位還是自作自受

伊能靜長(zhǎng)文控訴!十年沒(méi)二人世界,她抑郁是秦昊缺位還是自作自受

劉森森
2026-04-11 16:11:41
廣西人口首次跌破5千萬(wàn)!柳州南寧等14城,樓市迎來(lái)新大考

廣西人口首次跌破5千萬(wàn)!柳州南寧等14城,樓市迎來(lái)新大考

柳州樓市觀察
2026-04-11 16:27:02
全紅嬋風(fēng)波大結(jié)局!事件涉多位運(yùn)動(dòng)員,一人已被抓,處罰結(jié)果曝光

全紅嬋風(fēng)波大結(jié)局!事件涉多位運(yùn)動(dòng)員,一人已被抓,處罰結(jié)果曝光

動(dòng)物奇奇怪怪
2026-04-11 18:49:46
中國(guó)已無(wú)退路了!美軍為中美選好了主戰(zhàn)場(chǎng),決心要跟中國(guó)打場(chǎng)大戰(zhàn)

中國(guó)已無(wú)退路了!美軍為中美選好了主戰(zhàn)場(chǎng),決心要跟中國(guó)打場(chǎng)大戰(zhàn)

一簌月光
2026-04-10 00:45:15
逼走樊振東?打壓陳夢(mèng)?排擠張繼科?8年了,劉國(guó)梁終于迎來(lái)正名

逼走樊振東?打壓陳夢(mèng)?排擠張繼科?8年了,劉國(guó)梁終于迎來(lái)正名

阿斚田侃故事
2026-03-15 06:16:26
米萊砍掉一半政府、削掉補(bǔ)貼,阿根廷沒(méi)崩,反而撐住了

米萊砍掉一半政府、削掉補(bǔ)貼,阿根廷沒(méi)崩,反而撐住了

桂系007
2026-04-11 03:43:09
新中國(guó)十位國(guó)家級(jí)女領(lǐng)導(dǎo)人

新中國(guó)十位國(guó)家級(jí)女領(lǐng)導(dǎo)人

祁州校尉
2026-04-11 09:00:31
鄭麗文:只要對(duì)兩岸和平有幫助的事,都愿意去做

鄭麗文:只要對(duì)兩岸和平有幫助的事,都愿意去做

澎湃新聞
2026-04-11 08:03:37
工信部原黨組副書記、副部長(zhǎng)蘇波:我們有可能在“十五五”末期建成新能源汽車強(qiáng)國(guó)

工信部原黨組副書記、副部長(zhǎng)蘇波:我們有可能在“十五五”末期建成新能源汽車強(qiáng)國(guó)

每日經(jīng)濟(jì)新聞
2026-04-11 10:51:07
原來(lái)我們都被他騙了?陳坤兒子的生母,其實(shí)早在14年前就公開了

原來(lái)我們都被他騙了?陳坤兒子的生母,其實(shí)早在14年前就公開了

凡知
2026-04-11 19:10:48
2026-04-11 22:16:49
字母榜 incentive-icons
字母榜
讓未來(lái)不止于大。
2367文章數(shù) 8057關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

特朗普:美方開始清理霍爾木茲海峽

頭條要聞

特朗普:美方開始清理霍爾木茲海峽

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂(lè)要聞

鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

家居
旅游
藝術(shù)
本地
公開課

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

旅游要聞

火出圈!成都人民公園相親角被老外包圍了

藝術(shù)要聞

花6億,爛尾12年,福建一處“頂奢別墅”,野草都長(zhǎng)到三樓了

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版