国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

年度??l(fā)布丨邁向AI Agent普及的未來(lái)

0
分享至


AI引發(fā)的創(chuàng)新浪潮正在重塑每一種客戶體驗(yàn)、每一家公司乃至每一個(gè)行業(yè)。而且,變革才剛剛開(kāi)始,技術(shù)迭代的速度遠(yuǎn)超我們以往所見(jiàn)的一切。不久前,人們還在測(cè)試各類聊天機(jī)器人,如今幾乎每天都有新的應(yīng)用場(chǎng)景與技術(shù)方案誕生。

然而,許多企業(yè)尚未看到AI承諾的價(jià)值真正兌現(xiàn),其真正潛能也尚未完全釋放。不過(guò),這一局面正在迅速改變:AI助手正逐步讓位于能代人執(zhí)行任務(wù)、將工作流自動(dòng)化的AI Agent。

這是AI發(fā)展軌跡的拐點(diǎn),標(biāo)志著AI正從技術(shù)奇觀變?yōu)閯?chuàng)造真實(shí)價(jià)值的工具。AI Agent的到來(lái),也是AI投資開(kāi)始產(chǎn)生實(shí)質(zhì)商業(yè)回報(bào)的起點(diǎn)。未來(lái),數(shù)十億個(gè)Agents將遍布每家公司、每個(gè)可想象的領(lǐng)域。這場(chǎng)變革對(duì)各行業(yè)的影響,將不亞于互聯(lián)網(wǎng)與云計(jì)算的普及。

問(wèn)題是,企業(yè)今天該如何出發(fā)?

01

普及AI Agent的美好前景與挑戰(zhàn)

目前,Agent已在加速醫(yī)療發(fā)現(xiàn)、優(yōu)化客戶服務(wù)、提升薪酬處理效率等領(lǐng)域發(fā)揮作用;在某些場(chǎng)景中,Agent將個(gè)人效能提升了10倍,讓人們有更多時(shí)間投入創(chuàng)新。若人人都能獲得這般賦能,無(wú)疑是極具價(jià)值的愿景。


“在某些場(chǎng)景中,AI Agent將個(gè)人效能提升了10倍,讓人們有更多時(shí)間投入創(chuàng)新。”

—— Matt Garman

亞馬遜云科技CEO

然而,要邁向 AI Agent普及的未來(lái),讓每個(gè)組織都能從AI中收獲實(shí)際價(jià)值與成果,說(shuō)起來(lái)容易,做起來(lái)難。

每個(gè)Agent的核心都由三大關(guān)鍵組件構(gòu)成:一、作為Agent大腦的模型,負(fù)責(zé)推理、規(guī)劃與執(zhí)行;二、定義 Agent身份的代碼,明確Agent的能力并指引其決策流程;三、工具,為Agent注入生命力,如后端 API、知識(shí)庫(kù)與數(shù)據(jù)庫(kù)接口,執(zhí)行現(xiàn)實(shí)操作的代碼解釋器或網(wǎng)絡(luò)瀏覽器等。

要讓Agent釋放真正的價(jià)值,就必須將這些組件高效協(xié)同起來(lái)。這一任務(wù),面臨著 5 大挑戰(zhàn):

第一,企業(yè)需具備大規(guī)模、快速部署Agents的能力。這要求企業(yè)擁有可支撐業(yè)務(wù)從零快速擴(kuò)展至數(shù)千并發(fā)會(huì)話的基礎(chǔ)設(shè)施,通過(guò)完善的會(huì)話隔離機(jī)制支持Agents長(zhǎng)時(shí)間穩(wěn)定運(yùn)行,并防止敏感數(shù)據(jù)在不同Agents間泄露;

第二,Agent必須具備處理海量數(shù)據(jù)、應(yīng)對(duì)邊緣案例的能力。要讓Agent真正落地生產(chǎn)環(huán)境,需要為其配備精密的記憶管理系統(tǒng),既能精準(zhǔn)管理會(huì)話及交互過(guò)程中的上下文信息,又能跨會(huì)話記憶用戶偏好;

第三,身份與訪問(wèn)管理的安全挑戰(zhàn)。若缺乏完善的安全管控機(jī)制,Agent可能無(wú)意中訪問(wèn)或暴露不應(yīng)接觸的敏感數(shù)據(jù)。在生產(chǎn)環(huán)境中,必須建立固若金湯的身份與訪問(wèn)管理體系:既要精準(zhǔn)驗(yàn)證用戶身份,也要嚴(yán)格授權(quán)Agent訪問(wèn)對(duì)應(yīng)工具的權(quán)限;

第四,實(shí)現(xiàn)與生產(chǎn)環(huán)境的無(wú)縫連接。當(dāng)Agent進(jìn)入生產(chǎn)環(huán)境時(shí),絕不可能孤立運(yùn)行,而是會(huì)融入更龐大的業(yè)務(wù)系統(tǒng)。Agent需與業(yè)務(wù)應(yīng)用所需的API、數(shù)據(jù)庫(kù)及各類服務(wù)安全集成;

第五,具備全鏈路可觀測(cè)與快速調(diào)試能力。畢竟,無(wú)法觀測(cè)的問(wèn)題必然難以修復(fù);一旦出現(xiàn)問(wèn)題,必須快速定位并解決。

如何應(yīng)對(duì)這些挑戰(zhàn)?關(guān)鍵在于融合四大核心要素:

一是AI基礎(chǔ)設(shè)施,能提供強(qiáng)大且具成本效益的算力支撐;二是推理系統(tǒng),可提供豐富的模型選擇及高性價(jià)比的模型服務(wù);三是數(shù)據(jù)能力,能將企業(yè)獨(dú)有數(shù)據(jù)高效轉(zhuǎn)化為新的核心競(jìng)爭(zhēng)優(yōu)勢(shì);四是完整的系統(tǒng)化構(gòu)建工具,讓AI Agent的構(gòu)建過(guò)程簡(jiǎn)單高效,且成果可信賴、高度可靠。

02

AI基礎(chǔ)設(shè)施的5大屬性

構(gòu)建真正能創(chuàng)造價(jià)值的Agent,首要前提是擁有可擴(kuò)展、強(qiáng)大的AI基礎(chǔ)設(shè)施,為所有環(huán)節(jié)提供動(dòng)力。即通過(guò)高度可擴(kuò)展且安全的云服務(wù),為AI工作負(fù)載提供極致性能,以低成本完成模型訓(xùn)練、定制與推理。


“AI會(huì)讓攻擊者也更高效,因此云提供商必須將安全作為最高優(yōu)先級(jí)?!?/p>

—— Peter DeSantis

亞馬遜云科技公用計(jì)算高級(jí)副總裁

這要求突破基礎(chǔ)設(shè)施的可能性邊界,為Agent系統(tǒng)與應(yīng)用打造全新的基礎(chǔ)構(gòu)建模塊,并以全新視角重構(gòu)所有工作流程,強(qiáng)化云計(jì)算的5大基礎(chǔ)屬性:

安全性:不僅是好人利用AI提升效率,壞人也在使用相同的工具。AI讓攻擊者也更高效,云提供商必須將安全作為最高優(yōu)先級(jí);

可用性:AI應(yīng)用的部署規(guī)??涨?,需要經(jīng)過(guò)最嚴(yán)苛工作負(fù)載考驗(yàn)的云基礎(chǔ)設(shè)施;

彈性:AI工作負(fù)載需求激增,客戶期望獲得與Amazon S3相同的彈性體驗(yàn);

成本:AI訓(xùn)練和推理的成本極高,成本控制能力成為關(guān)鍵競(jìng)爭(zhēng)力;

敏捷性:企業(yè)的AI轉(zhuǎn)型充滿不確定性,需要具備快速啟動(dòng)、優(yōu)化和調(diào)整的能力。

因此,亞馬遜云科技圍繞這5大屬性所做的持續(xù)投入,不僅是為了解決過(guò)往的技術(shù)痛點(diǎn),更成為支撐Agent落地的硬核基座。

2010 年,Amazon EC2 曾面臨嚴(yán)重的虛擬化性能抖動(dòng)問(wèn)題。當(dāng)時(shí),業(yè)界普遍認(rèn)為虛擬化永遠(yuǎn)無(wú)法達(dá)到裸金屬性能,但亞馬遜云科技通過(guò)深入優(yōu)化,最終開(kāi)發(fā)出 Amazon Nitro 系統(tǒng),將虛擬化從服務(wù)器轉(zhuǎn)移到專用硬件,完全消除了抖動(dòng)問(wèn)題,性能甚至超越裸金屬。Amazon Nitro 的成功,開(kāi)啟了亞馬遜云科技的自研芯片之路,也證明了通過(guò)掌控芯片、硬件與系統(tǒng)架構(gòu),能夠?qū)崿F(xiàn)商用硬件難以企及的性能與效率提升。這一理念也延續(xù)到了服務(wù)器處理器 Amazon Graviton與AI加速器Amazon Trainium的開(kāi)發(fā)中。

最新一代服務(wù)器CPU Amazon Graviton5,實(shí)現(xiàn)了重大的架構(gòu)突破。早期客戶已在生產(chǎn)環(huán)境中驗(yàn)證了其卓越性能,多家企業(yè)的實(shí)踐數(shù)據(jù)顯示:Airbnb(愛(ài)彼迎) 實(shí)現(xiàn)了25%的性能提升,軟件公司Atlassian 延遲降低20%,無(wú)人機(jī)公司Honeycomb 每核心性能提升36%,思愛(ài)普的SAP HANA OLTP查詢性能提升 60%;蘋(píng)果公司將核心服務(wù)用Swift重寫(xiě)并遷移至Amazon Graviton服務(wù)器后,實(shí)現(xiàn)了40% 的性能提升和30%的成本降低。


“最新一代服務(wù)器CPU Amazon Graviton5,已實(shí)現(xiàn)重大架構(gòu)突破?!?/p>

—— Dave Brown

亞馬遜云科技計(jì)算與機(jī)器學(xué)習(xí)服務(wù)副總裁

2013 年,亞馬遜云科技的一個(gè)小團(tuán)隊(duì)提出了一個(gè)看似不可能的想法:讓開(kāi)發(fā)者只需提交代碼,無(wú)需管理服務(wù)器(即 Serverless 架構(gòu))。這一創(chuàng)新想法,最終演變?yōu)?Amazon Lambda這一革命性的服務(wù)。它改變了應(yīng)用開(kāi)發(fā)模式,讓開(kāi)發(fā)者從代碼而非服務(wù)器開(kāi)始思考。十年后,Amazon Lambda仍是從概念到生產(chǎn)落地的最快路徑之一。而Amazon Lambda Managed Instances(托管實(shí)例)的突破,重新定義了Serverless 計(jì)算,為視頻處理、機(jī)器學(xué)習(xí)預(yù)處理、高吞吐量分析等傳統(tǒng)上不適合Amazon Lambda的工作負(fù)載打開(kāi)了大門。

推理請(qǐng)求的處理包含四大階段:分詞、預(yù)填充、解碼、去分詞。每個(gè)階段對(duì)系統(tǒng)資源的需求完全不同:有的屬于CPU密集型,有的屬于GPU計(jì)算密集型,有的對(duì)內(nèi)存帶寬要求極高,有的則對(duì)延遲極為敏感。在全球規(guī)模的應(yīng)用場(chǎng)景下,數(shù)千家客戶、數(shù)百萬(wàn)級(jí)請(qǐng)求、數(shù)十種模型同時(shí)運(yùn)行,且每個(gè)請(qǐng)求的資源配置會(huì)在流程中動(dòng)態(tài)變化。這帶來(lái)了前所未有的擴(kuò)展挑戰(zhàn)。亞馬遜云科技從零開(kāi)始研發(fā),設(shè)計(jì)出Project Mantle推理引擎,為客戶帶來(lái)了更穩(wěn)定的延遲表現(xiàn)、更高的吞吐量、更優(yōu)的資源利用率以及更強(qiáng)的系統(tǒng)韌性。

在非結(jié)構(gòu)化數(shù)據(jù)的整合與連接方面,Amazon Nova多模態(tài)嵌入模型,支持文本、文檔、圖像、視頻及音頻等多種數(shù)據(jù)類型,能將這些不同類型的數(shù)據(jù)轉(zhuǎn)換為共享向量空間,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的統(tǒng)一理解。此外,亞馬遜云科技已將向量能力集成至旗下所有數(shù)據(jù)服務(wù)中,使客戶無(wú)需學(xué)習(xí)全新的技術(shù)棧即可快速應(yīng)用。

在自研芯片的協(xié)同創(chuàng)新方面,Amazon Trainium3 服務(wù)器首次在同一服務(wù)器板上集成了Amazon Trainium、Amazon Graviton與Amazon Nitro三款自研芯片。該服務(wù)器的所有組件均支持頂部維護(hù),且可實(shí)現(xiàn)全機(jī)器人組裝,能夠大幅加快部署速度。人工智能公司Anthropic已在 Amazon Trainium上完成Claude最新一代模型的訓(xùn)練與運(yùn)行;Descartes AI(笛卡爾AI)通過(guò)使用 Amazon Trainium3與Nki優(yōu)化實(shí)時(shí)視頻生成模型,實(shí)現(xiàn)了4倍的幀率提升,并達(dá)成80%的張量核心利用率,這一表現(xiàn)遠(yuǎn)超傳統(tǒng) GPU 系統(tǒng)。

03

推理:按需定制模型的開(kāi)放平臺(tái)

在著手構(gòu)建生成式AI應(yīng)用時(shí),企業(yè)首先需要明確的核心問(wèn)題是:選擇哪一個(gè)模型?哪一個(gè)模型能帶來(lái)最優(yōu)成本、最低時(shí)延以及最佳的回答質(zhì)量?很多時(shí)候,問(wèn)題的答案是組合使用多種模型——因?yàn)闆](méi)有任何一款模型可以“包攬所有場(chǎng)景”。因此,一個(gè)安全、可擴(kuò)展、功能完備的推理平臺(tái)必不可少。

Amazon Bedrock正是這樣的平臺(tái),可加速生成式AI應(yīng)用的落地進(jìn)程,助力企業(yè)從原型階段快速邁向生產(chǎn)環(huán)節(jié)。企業(yè)可按需定制模型,以匹配自身的業(yè)務(wù)場(chǎng)景和性能要求,獲得融合自有數(shù)據(jù)的工具,并按需添加各類安全防護(hù)機(jī)制。

如今,全球各行各業(yè)、不同規(guī)模的公司,包括BMW(寶馬)、GoDaddy(一家提供域名注冊(cè)和互聯(lián)網(wǎng)主機(jī)服務(wù)的公司)、Strava(美國(guó)健身運(yùn)動(dòng)和社交應(yīng)用平臺(tái))等超過(guò) 50 家企業(yè),均在使用Amazon Bedrock。部分企業(yè)通過(guò)Amazon Bedrock處理的Token數(shù)量已突破萬(wàn)億。

作為平臺(tái),Amazon Bedrock一直在持續(xù)、快速地豐富模型陣容。這其中,既有開(kāi)源權(quán)重模型,也有專有模型;既有通用模型,也有專用模型;既有超大模型,也有輕量模型。過(guò)去一年,Amazon Bedrock 提供的模型數(shù)量幾乎翻了一番,還將引入 Google(谷歌)的Gemma、MiniMax(上海稀宇科技)的M2、NVIDIA(英偉達(dá)) 的Nemotron,以及Mistral AI(法國(guó)米斯特拉爾)的Mistral Large和Mistral 3等開(kāi)源權(quán)重模型。

除了第三方模型,亞馬遜云科技自研的基礎(chǔ)模型家族Amazon Nova也在不斷擴(kuò)展,支持更多使用場(chǎng)景,不僅贏得Dentsu(日本電通)這樣的營(yíng)銷巨頭的認(rèn)可,還受到Infosys(印孚瑟斯)、Blue Origin(藍(lán)色起源)、Robinhood (羅賓漢)等科技領(lǐng)軍企業(yè),以及NinjaTech AI(忍者科技)這類創(chuàng)新型初創(chuàng)公司的青睞。最新版本的Amazon Nova 2,可提供兼具成本優(yōu)化、低時(shí)延與前沿智能的模型。其中,Amazon Nova 2 Omni是業(yè)內(nèi)首款同時(shí)支持文本、圖像、視頻和音頻輸入,并可生成文本和圖像的多模態(tài)推理模型。

Amazon Bedrock與Amazon Nova讓企業(yè)擁有充分的選擇自由:需要效率時(shí)調(diào)用高效模型,需要算力時(shí)啟用強(qiáng)大模型,需要復(fù)雜推理時(shí)則使用高推理能力模型。內(nèi)容營(yíng)銷公司 Gradial正借此打造極具實(shí)用價(jià)值的能力,破解創(chuàng)意落地執(zhí)行的最大瓶頸。目前,營(yíng)銷內(nèi)容運(yùn)營(yíng)仍高度依賴人工,流程繁瑣——從創(chuàng)意簡(jiǎn)報(bào)到最終上線,需要 4~6 周時(shí)間,涉及多達(dá)20個(gè)環(huán)節(jié),需設(shè)計(jì)師、工程師、文案和網(wǎng)站策略師等多個(gè)角色協(xié)同完成。Gradial編排的AI Agents,不僅能無(wú)縫銜接不同系統(tǒng)和角色,大幅加速?gòu)膭?chuàng)意到落地的全過(guò)程,還能提供精準(zhǔn)的內(nèi)容優(yōu)化建議,助力企業(yè)高效觸達(dá)并轉(zhuǎn)化目標(biāo)受眾。

04

數(shù)據(jù):強(qiáng)化競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵

AI能否為企業(yè)和用戶創(chuàng)造巨大價(jià)值,關(guān)鍵在于能否讓AI深入理解企業(yè)的獨(dú)有數(shù)據(jù)。企業(yè)的獨(dú)有數(shù)據(jù)是構(gòu)建差異化競(jìng)爭(zhēng)優(yōu)勢(shì)的核心資產(chǎn)。如果 Agent能更深入地理解業(yè)務(wù)、數(shù)據(jù)和工作流程,就能解鎖更多應(yīng)用可能。

釋放Agent真正價(jià)值的核心要義,是將大模型與企業(yè)的獨(dú)有數(shù)據(jù)及知識(shí)產(chǎn)權(quán)深度融合。這首先需要將企業(yè)數(shù)據(jù)遷移至云端,在此基礎(chǔ)上,確保模型能夠安全、高效地訪問(wèn)與使用這些數(shù)據(jù)。

第三方模型最初通常無(wú)法理解企業(yè)的專屬業(yè)務(wù),也無(wú)法訪問(wèn)企業(yè)專有數(shù)據(jù)。企業(yè)也不愿讓第三方模型接觸這些數(shù)據(jù)——畢竟沒(méi)有企業(yè)愿意將自身專有數(shù)據(jù)嵌入公共模型,進(jìn)而被競(jìng)爭(zhēng)對(duì)手或其他方利用。這正是Amazon Bedrock內(nèi)部設(shè)立嚴(yán)格數(shù)據(jù)隔離機(jī)制的原因所在。

企業(yè)可以通過(guò) RAG(檢索增強(qiáng)生成)或向量數(shù)據(jù)庫(kù)等技術(shù),在推理階段為所選模型動(dòng)態(tài)注入上下文信息,幫助模型在企業(yè)的海量數(shù)據(jù)中精準(zhǔn)導(dǎo)航,返回高度相關(guān)的結(jié)果。然而,這類方法的效果終究存在局限,企業(yè)更期望通過(guò)某種方式,讓模型真正理解自身的業(yè)務(wù)數(shù)據(jù),并深度掌握企業(yè)積淀的深厚領(lǐng)域知識(shí)與專業(yè)經(jīng)驗(yàn)。例如,某家硬件企業(yè)正致力于加速新產(chǎn)品研發(fā)進(jìn)程,其理想的模型能力是:能夠理解企業(yè)過(guò)往的產(chǎn)品設(shè)計(jì)邏輯、制造工藝偏好、項(xiàng)目成功與失敗案例,以及現(xiàn)有流程的各類約束條件,并整合所有這些信息,為設(shè)計(jì)工程師提供智能、精準(zhǔn)的決策指導(dǎo)。

既然如此,企業(yè)為何不直接訓(xùn)練一個(gè)專屬的定制模型呢?可行的路徑主要有兩條。第一條路徑是從零開(kāi)始構(gòu)建企業(yè)專屬模型,將企業(yè)的專有數(shù)據(jù)深度融入模型訓(xùn)練過(guò)程。然而,這種方式不僅成本極高,還很可能無(wú)法獲取構(gòu)建模型通用智能所需的全部數(shù)據(jù);即便數(shù)據(jù)儲(chǔ)備充足,企業(yè)也可能缺乏預(yù)訓(xùn)練“前沿大模型”所需的技術(shù)能力與經(jīng)驗(yàn)。因此,對(duì)大多數(shù)企業(yè)而言,這條路徑并不具備可行性。

第二條路徑是從開(kāi)源權(quán)重模型入手,再通過(guò)技術(shù)手段對(duì)模型進(jìn)行定制化修改。這種方式的核心優(yōu)勢(shì)是具備極高的靈活性,企業(yè)可通過(guò)微調(diào)、強(qiáng)化學(xué)習(xí)等技術(shù)手段調(diào)整模型權(quán)重,從而打造出高度聚焦于自身核心業(yè)務(wù)場(chǎng)景的專用模型。然而,實(shí)踐證明這種方法同樣存在顯著局限:想要讓模型掌握預(yù)訓(xùn)練階段未曾接觸過(guò)的全新領(lǐng)域知識(shí),難度極高;更關(guān)鍵的是,模型的定制化程度越高、注入的專有數(shù)據(jù)越多,就越容易出現(xiàn)“遺忘”現(xiàn)象,丟失早期預(yù)訓(xùn)練獲得的核心能力,尤其是關(guān)鍵的核心推理能力。這一現(xiàn)象類似于人類學(xué)習(xí)新語(yǔ)言的過(guò)程:若在幼年時(shí)期學(xué)習(xí),往往更容易掌握;若成年后才開(kāi)始學(xué)習(xí),難度則會(huì)顯著提升。模型的定制化訓(xùn)練同樣面臨類似的挑戰(zhàn)。

Amazon Nova Forge則探索出了第三條創(chuàng)新路徑——開(kāi)放訓(xùn)練模型。通過(guò)這一平臺(tái),企業(yè)可獨(dú)家訪問(wèn)多個(gè)Amazon Nova模型的訓(xùn)練檢查點(diǎn),并在模型訓(xùn)練的全流程中,將企業(yè)專有數(shù)據(jù)與亞馬遜云科技精心設(shè)計(jì)的訓(xùn)練數(shù)據(jù)集進(jìn)行深度融合,最終生成一款既能深刻理解企業(yè)業(yè)務(wù)數(shù)據(jù),又不會(huì)遺忘原有核心能力的企業(yè)專屬模型。

大型社交新聞與內(nèi)容分享平臺(tái)Reddit(紅迪網(wǎng)),在其聊天與搜索業(yè)務(wù)場(chǎng)景中,嘗試?yán)蒙墒?AI對(duì)平臺(tái)內(nèi)容進(jìn)行多維度安全審核,但審核效果始終未達(dá)預(yù)期。Reddit曾進(jìn)行過(guò)多輪嘗試,例如微調(diào)現(xiàn)有模型,甚至嘗試為不同安全審核維度分別部署多個(gè)模型,但仍難以滿足其社區(qū)特有的內(nèi)容審核需求。借助Amazon Nova Forge,Reddit在模型預(yù)訓(xùn)練階段就將其專有的社區(qū)數(shù)據(jù)進(jìn)行深度整合,使模型能夠形成獨(dú)特的“融合表征”能力,從而自然地將模型的通用語(yǔ)言理解能力,與Reddit社區(qū)特有的知識(shí)體系深度結(jié)合。Reddit也因此首次成功構(gòu)建出一款同時(shí)滿足高準(zhǔn)確性、高成本效益,且更易于部署與運(yùn)維的專屬安全審核模型。

05

工具:圍繞四大支柱構(gòu)建生產(chǎn)級(jí)Agent

AI Agent足以成為科技史上的關(guān)鍵轉(zhuǎn)折點(diǎn)。人們不再受限于代碼語(yǔ)法的熟悉度,也無(wú)需記住成百上千的API調(diào)用與參數(shù),只需用自然語(yǔ)言描述想要實(shí)現(xiàn)的目標(biāo),Agent就會(huì)生成方案、編寫(xiě)代碼、調(diào)用工具、執(zhí)行完整解決方案。同時(shí),有了Agent,以往需數(shù)年的工程開(kāi)發(fā),現(xiàn)在僅需數(shù)月;過(guò)去需數(shù)月的任務(wù),如今可壓縮至數(shù)周甚至數(shù)日。因此,全球的構(gòu)建者正借助Agent解決極其復(fù)雜的難題,構(gòu)建前所未有的創(chuàng)新事物。


“大多數(shù)企業(yè)陷入了‘概念驗(yàn)證監(jiān)獄’的困境,使得無(wú)數(shù)精彩的Agent原型無(wú)法走向生產(chǎn)環(huán)境。”

—— Swami Sivasubramanian

亞馬遜云科技Agentic AI副總裁

然而,現(xiàn)實(shí)的核心難題在于,構(gòu)建與擴(kuò)展這些強(qiáng)大的Agent,往往比它們要解決的難題更為復(fù)雜。其結(jié)果是,大多數(shù)企業(yè)陷入了“概念驗(yàn)證監(jiān)獄”(POC Jail)的困境,無(wú)數(shù)精彩的Agents原型無(wú)法走向生產(chǎn)環(huán)境。這就要求有一套完備、系統(tǒng)的工具鏈,讓Agent易于構(gòu)建、高效運(yùn)行、可信可控、穩(wěn)定可靠。

1

易于建構(gòu)

第一步,構(gòu)建Agent應(yīng)該極為簡(jiǎn)單,能讓開(kāi)發(fā)者用最少代碼創(chuàng)建Agent。這正是 Amazon Strands Agents SDK的特點(diǎn)。對(duì)TypeScript的原生支持,使其能適配這一全球最流行的編程語(yǔ)言之一;而對(duì)邊緣設(shè)備的支持,則讓Strands解鎖了汽車、游戲、機(jī)器人等領(lǐng)域的全新應(yīng)用場(chǎng)景?,F(xiàn)在,幾乎每位開(kāi)發(fā)者都能在筆記本電腦上試驗(yàn)與構(gòu)建Agent。

第二步,填補(bǔ)從概念驗(yàn)證(POC)到生產(chǎn)落地的鴻溝,同樣應(yīng)該簡(jiǎn)單易行。一個(gè)真正智能且行為可控的托管系統(tǒng),如Amazon Bedrock AgentCore正是為此而生。它能解決一系列核心問(wèn)題:身份與訪問(wèn)管理;管控 Agent的交互過(guò)程與行為邊界,同時(shí)保障Agent能夠自由推理、采取最佳行動(dòng)并響應(yīng)業(yè)務(wù)請(qǐng)求;能夠在數(shù)千個(gè)模擬場(chǎng)景中評(píng)估與測(cè)試Agent;不僅能通過(guò)“短期記憶”能力處理即時(shí)對(duì)話流,通過(guò)“長(zhǎng)期記憶”能力捕捉跨會(huì)話的洞察,更具備情境記憶(Episodic Memory)能力,記住用戶行為背后的時(shí)間背景與觸發(fā)原因,從過(guò)往經(jīng)驗(yàn)中學(xué)習(xí)——將每一次交互存儲(chǔ)為獨(dú)立的情境片段,在新的對(duì)話時(shí)自動(dòng)識(shí)別相似情境片段中的行為模式,并主動(dòng)提供切實(shí)可行的解決方案。這就像人類記住生命中的特定事件那樣,經(jīng)歷得越多,Agent就越聰明。例如,用戶獨(dú)自出差時(shí),Agent會(huì)自動(dòng)預(yù)訂航班起飛前 45 分鐘到達(dá)機(jī)場(chǎng)的專車;用戶拖家?guī)Э诼眯袝r(shí),Agent會(huì)自動(dòng)識(shí)別過(guò)往的相似經(jīng)驗(yàn),將提前45分鐘的專車調(diào)整為提前兩小時(shí)。

2

高效運(yùn)行

效率不僅關(guān)乎成本控制,還包含延遲(響應(yīng)速度)、規(guī)模(流量峰值處理能力)、敏捷性(迭代速度)三大核心維度。大多數(shù)Agents將時(shí)間花在編寫(xiě)代碼、分析搜索結(jié)果、創(chuàng)建內(nèi)容、執(zhí)行預(yù)定義工作流等常規(guī)性工作任務(wù)上。因此,如果能為這些高頻場(chǎng)景的任務(wù)定制專用模型,就能大幅提升Agent的運(yùn)行效率。

具體而言,有幾項(xiàng)核心技術(shù)可顯著提升效率。第一,監(jiān)督微調(diào)技術(shù),可將Agent從 “通才”培養(yǎng)為垂直領(lǐng)域的“專家”,就像把全科醫(yī)生訓(xùn)練成心臟病專家,使其精準(zhǔn)聚焦于特定業(yè)務(wù)需求。第二,模型蒸餾技術(shù)。當(dāng)面臨內(nèi)存不足等硬件限制,或需部署更輕量、更快速的模型時(shí),企業(yè)可選擇模型蒸餾技術(shù)。這一過(guò)程類似于行業(yè)大師培養(yǎng)聰慧學(xué)徒:“弟子”不僅會(huì)模仿導(dǎo)師輸出答案,更能學(xué)習(xí)其底層的思考邏輯與推理路徑,掌握導(dǎo)師的置信度水平、決策邏輯模式乃至核心識(shí)別策略。蒸餾模型往往能帶來(lái)10倍的推理速度提升,同時(shí)保留導(dǎo)師模型 95%~98% 的核心性能,可謂事半功倍。第三,強(qiáng)化學(xué)習(xí)技術(shù),包括基于人類反饋的強(qiáng)化學(xué)習(xí) (RLHF) 與基于 AI 反饋的強(qiáng)化學(xué)習(xí) (RLAIF) 兩種核心范式。一般而言,傳統(tǒng)強(qiáng)化學(xué)習(xí)的研發(fā)投入大、周期長(zhǎng),并非普通企業(yè)能夠承受。因此,Amazon Bedrock設(shè)計(jì)出“強(qiáng)化微調(diào)功能”,以掃清所有技術(shù)難關(guān)、降低研發(fā)成本,幫助客戶提升模型的任務(wù)執(zhí)行精度,使客戶無(wú)需深厚的機(jī)器學(xué)習(xí)專業(yè)知識(shí),也不必準(zhǔn)備海量標(biāo)注數(shù)據(jù),即使是普通開(kāi)發(fā)者也能輕松上手。

3

可信可控

你的Agent會(huì)將資金轉(zhuǎn)到正確的賬戶嗎?當(dāng)它們代表你操作時(shí),會(huì)嚴(yán)格遵守當(dāng)?shù)氐姆煞ㄒ?guī)嗎?你是否愿意授予Agent訪問(wèn)信用卡的權(quán)限?它會(huì)不會(huì)拿著你的資金去進(jìn)行非必要的消費(fèi)?這些問(wèn)題的核心,都關(guān)乎大語(yǔ)言模型的“幻覺(jué)”問(wèn)題——即模型在面對(duì)復(fù)雜規(guī)則或邏輯推理時(shí),容易產(chǎn)生錯(cuò)誤輸出。更糟糕的是,大語(yǔ)言模型還可能被惡意行為者誘導(dǎo),產(chǎn)生有害行為。

這樣的Agent顯然無(wú)法在生產(chǎn)環(huán)境中長(zhǎng)期部署,在涉及資金安全、人身安全等敏感事務(wù)時(shí),更不能讓它們投入使用。然而,如果對(duì)Agent完全缺乏信任,企業(yè)就會(huì)采取過(guò)度保守的策略,在每個(gè)執(zhí)行步驟都引入額外的人工審核監(jiān)督,或通過(guò)硬編碼(hard code)的方式固定所有執(zhí)行步驟。這兩種方式都會(huì)大幅削弱Agent的創(chuàng)造性與自主決策能力。

亞馬遜云科技用神經(jīng)符號(hào)AI(Neuro-Symbolic AI)技術(shù)——即形式推理與大語(yǔ)言模型的深度融合,來(lái)破解這一難題。這一技術(shù)能夠在Agent的構(gòu)建初期,就輕松為其設(shè)定清晰的約束條件,既給予Agent盡可能多的自主運(yùn)作空間,同時(shí)又明確其安全運(yùn)作的邊界范圍,并確保Agent會(huì)嚴(yán)格遵循這些約束條件,即便約束條件十分微妙或復(fù)雜。2025年夏天正式發(fā)布的全新Agentic IDE(集成開(kāi)發(fā)環(huán)境)——Amazon Kiro,就可讓開(kāi)發(fā)者通過(guò)自然語(yǔ)言描述來(lái)定義整個(gè)應(yīng)用程序或功能特性的需求,自動(dòng)分析應(yīng)用需求、識(shí)別驗(yàn)收標(biāo)準(zhǔn)并轉(zhuǎn)換為標(biāo)準(zhǔn)化規(guī)范,進(jìn)而指導(dǎo)代碼生成、測(cè)試用例生成,甚至可形式化證明程序的正確性。

4

穩(wěn)定可靠

部分Agents能夠準(zhǔn)確完成單次任務(wù),但當(dāng)要求它們重復(fù)執(zhí)行時(shí),卻容易出現(xiàn)偏差,更無(wú)法保障持續(xù)、穩(wěn)定的重復(fù)執(zhí)行。

21世紀(jì)初期,企業(yè)流程自動(dòng)化的核心挑戰(zhàn),主要由機(jī)器人流程自動(dòng)化(RPA)技術(shù)解決。大語(yǔ)言模型適應(yīng)復(fù)雜業(yè)務(wù)場(chǎng)景的能力,遠(yuǎn)勝于傳統(tǒng) RPA 技術(shù)。它們能夠操控瀏覽器、通過(guò)邏輯推理解決復(fù)雜問(wèn)題、實(shí)現(xiàn)端到端工作流自動(dòng)化,甚至可跨不同系統(tǒng)界面協(xié)同運(yùn)作。然而,編排這些大語(yǔ)言模型的運(yùn)作流程極為復(fù)雜,因此,為其構(gòu)建完善的錯(cuò)誤處理與流程回溯機(jī)制至關(guān)重要。在傳統(tǒng)自動(dòng)化腳本中,工程師能夠確切定位錯(cuò)誤發(fā)生的節(jié)點(diǎn);而大語(yǔ)言模型可能需要在錯(cuò)誤路徑上執(zhí)行多次操作后,才會(huì)意識(shí)到問(wèn)題所在。因此,對(duì)許多企業(yè)而言,使用這些大語(yǔ)言模型開(kāi)展大規(guī)模的企業(yè)流程自動(dòng)化操作,不僅耗時(shí)耗力,還容易出錯(cuò),實(shí)用性較低。

那么,能否讓大語(yǔ)言模型的自動(dòng)化能力,從一開(kāi)始就兼具簡(jiǎn)單易用性與高可靠性呢?答案并非僅僅是訓(xùn)練更優(yōu)秀的模型,更需要將優(yōu)質(zhì)模型整合為端到端自動(dòng)化服務(wù)的核心組成部分。Amazon Nova Act便是專為構(gòu)建與管理自動(dòng)化生產(chǎn)級(jí)UI工作流的AI Agent團(tuán)隊(duì)打造的平臺(tái),在企業(yè)級(jí)復(fù)雜工作流場(chǎng)景中,已實(shí)現(xiàn) 90%的高可靠性表現(xiàn)。其獨(dú)特之處在于,并非“在罐子里培養(yǎng)大腦”(僅訓(xùn)練模型能力),而是讓“大腦”(模型)與“手腳”(執(zhí)行工具)協(xié)同訓(xùn)練,實(shí)現(xiàn)“出廠即能穩(wěn)定運(yùn)作”。

傳統(tǒng)的模仿學(xué)習(xí)方式,僅能讓Agent觀察并模仿專家的操作行為,但Agent永遠(yuǎn)無(wú)法理解這些行為背后的因果邏輯關(guān)系。因此,亞馬遜云科技轉(zhuǎn)向了強(qiáng)化學(xué)習(xí)技術(shù),打造了數(shù)百個(gè)強(qiáng)化學(xué)習(xí)“健身房”——即模擬真實(shí)企業(yè)環(huán)境的訓(xùn)練平臺(tái),涵蓋 CRM、HR 系統(tǒng)、任務(wù)跟蹤器等各類業(yè)務(wù)系統(tǒng)的模擬環(huán)境。在這些“健身房”中,Agent可運(yùn)行數(shù)千個(gè)典型工作流,通過(guò)數(shù)十萬(wàn)次交互進(jìn)行試錯(cuò)學(xué)習(xí)。每次成功完成任務(wù)會(huì)獲得正向獎(jiǎng)勵(lì),每次失敗則會(huì)獲得負(fù)向懲罰。通過(guò)這種強(qiáng)化學(xué)習(xí)方式,Amazon Nova Act能夠可靠地解決真實(shí)世界中的各類企業(yè)級(jí)業(yè)務(wù)用例。在RealBench、ScreenSpot等關(guān)鍵行業(yè)基準(zhǔn)測(cè)試中,Amazon Nova Act的表現(xiàn)與業(yè)界最佳模型相當(dāng),甚至更為出色。

我們正處于一個(gè)前所未有的變革時(shí)代,AI Agent技術(shù)將徹底重塑企業(yè)的核心運(yùn)營(yíng)方式。基于強(qiáng)大且具成本效益的AI基礎(chǔ)設(shè)施、豐富的模型選擇與高性價(jià)比的推理系統(tǒng)、能將企業(yè)數(shù)據(jù)轉(zhuǎn)化為核心競(jìng)爭(zhēng)優(yōu)勢(shì)的工具鏈,以及完整的AI Agent構(gòu)建與管理系統(tǒng)這四大核心支柱,企業(yè)將真正收獲AI的全部?jī)r(jià)值。隨著數(shù)十億Agents在各行各業(yè)規(guī)?;涞剡\(yùn)行,企業(yè)將實(shí)現(xiàn)全方位的 10 倍效率躍升,解鎖未來(lái)的無(wú)限創(chuàng)新可能。

掃碼獲取??瘍?nèi)容

內(nèi)容來(lái)源:《邁向AI Agent普及的未來(lái)》專刊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
幾百名癌癥科專家已證實(shí):吸煙和肺癌的關(guān)系,最好花點(diǎn)時(shí)間看看

幾百名癌癥科專家已證實(shí):吸煙和肺癌的關(guān)系,最好花點(diǎn)時(shí)間看看

九哥聊軍事
2026-02-03 19:49:59
蘭姐坐灣灣飛北京,箖玥舍不得她走!汪大爺體檢問(wèn)題多,并未同行

蘭姐坐灣灣飛北京,箖玥舍不得她走!汪大爺體檢問(wèn)題多,并未同行

小徐講八卦
2026-03-04 16:06:04
我給82歲獨(dú)居老人送飯8年,小區(qū)拆遷她將680萬(wàn)全給了侄女

我給82歲獨(dú)居老人送飯8年,小區(qū)拆遷她將680萬(wàn)全給了侄女

城事錄主
2026-02-27 13:39:41
奉勸所有40到50歲后的中年人,只要不被開(kāi)除,干到退休就是成功

奉勸所有40到50歲后的中年人,只要不被開(kāi)除,干到退休就是成功

歲月有情1314
2026-03-03 14:49:44
皇馬3名球員被禁賽,呂迪格膝擊仍未被處罰,韋洛亞面臨傷病挑戰(zhàn)

皇馬3名球員被禁賽,呂迪格膝擊仍未被處罰,韋洛亞面臨傷病挑戰(zhàn)

夏侯看英超
2026-03-05 01:59:39
30歲小叔子和35歲嫂子去趕集,路過(guò)苞谷地,嫂子說(shuō)這樣一句話

30歲小叔子和35歲嫂子去趕集,路過(guò)苞谷地,嫂子說(shuō)這樣一句話

熱心市民小黃
2026-03-04 08:12:16
卡里克:進(jìn)球能極大提升謝什科的信心,他一直在不斷進(jìn)步

卡里克:進(jìn)球能極大提升謝什科的信心,他一直在不斷進(jìn)步

懂球帝
2026-03-05 04:07:07
2-1絕殺!亞洲杯爆冷,中國(guó)女足出線形勢(shì)反轉(zhuǎn):拿第1名=直通四強(qiáng)

2-1絕殺!亞洲杯爆冷,中國(guó)女足出線形勢(shì)反轉(zhuǎn):拿第1名=直通四強(qiáng)

何老師呀
2026-03-04 23:09:21
NBA新秀榜:克努佩爾繼續(xù)榜首,弗拉格第二,哈珀升至第四

NBA新秀榜:克努佩爾繼續(xù)榜首,弗拉格第二,哈珀升至第四

懂球帝
2026-03-05 00:33:09
郭艾倫明晚死磕高詩(shī)巖:恩怨拉滿,一場(chǎng)注定沸騰的CBA大戰(zhàn)

郭艾倫明晚死磕高詩(shī)巖:恩怨拉滿,一場(chǎng)注定沸騰的CBA大戰(zhàn)

徐扙老表哥
2026-03-05 00:00:51
拒絕皇馬要求!姆巴佩團(tuán)隊(duì)翻臉,不愿復(fù)出對(duì)陣曼城,要失寵了

拒絕皇馬要求!姆巴佩團(tuán)隊(duì)翻臉,不愿復(fù)出對(duì)陣曼城,要失寵了

阿泰希特
2026-03-04 14:01:21
只打4天就虛了?美軍司令緊急求救,特朗普不在乎,就要踩死油門

只打4天就虛了?美軍司令緊急求救,特朗普不在乎,就要踩死油門

寄星夜幕星河
2026-03-05 04:08:48
贅婿被賭王三太趕出門了

贅婿被賭王三太趕出門了

毒舌扒姨太
2026-03-04 22:44:00
中國(guó)三大長(zhǎng)壽食物,魚(yú)只能排到第三,第一名很多人想不到!

中國(guó)三大長(zhǎng)壽食物,魚(yú)只能排到第三,第一名很多人想不到!

江江食研社
2026-02-12 12:30:10
愛(ài)潑斯坦幫兇醫(yī)生曝光:直接在餐桌上給女孩縫針,太狠了……

愛(ài)潑斯坦幫兇醫(yī)生曝光:直接在餐桌上給女孩縫針,太狠了……

新歐洲
2026-03-04 19:48:55
指尖de溫柔

指尖de溫柔

有一點(diǎn)可愛(ài)
2026-03-04 20:55:03
二叔坐牢十年回來(lái),全家沒(méi)人理,我給他端了碗餃子,他送我三套房

二叔坐牢十年回來(lái),全家沒(méi)人理,我給他端了碗餃子,他送我三套房

千秋文化
2026-02-17 14:52:56
父親出軌35年,臨終把17套別墅全給了情婦,我媽卻笑著點(diǎn)頭。

父親出軌35年,臨終把17套別墅全給了情婦,我媽卻笑著點(diǎn)頭。

煙火人間故事匯
2026-03-04 18:55:03
央視元宵晚會(huì)收官:3人零差評(píng),2人翻紅,1人升咖,唯他不如不來(lái)

央視元宵晚會(huì)收官:3人零差評(píng),2人翻紅,1人升咖,唯他不如不來(lái)

好賢觀史記
2026-03-04 09:22:31
炸鍋!斯洛特下課倒計(jì)時(shí)?利物浦連夜敲定新帥

炸鍋!斯洛特下課倒計(jì)時(shí)?利物浦連夜敲定新帥

瀾歸序
2026-03-05 01:00:44
2026-03-05 04:56:49
哈佛商業(yè)評(píng)論 incentive-icons
哈佛商業(yè)評(píng)論
全球商界譽(yù)為“管理圣經(jīng)”
5719文章數(shù) 35250關(guān)注度
往期回顧 全部

科技要聞

多位核心離職,阿里親手廢掉最強(qiáng)AI天團(tuán)?

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

體育要聞

2026年中超,為什么值得你多看一眼?

娛樂(lè)要聞

謝謝謝娜 貢獻(xiàn)出26年內(nèi)娛的第一個(gè)笑話

財(cái)經(jīng)要聞

人大代表建議:將農(nóng)民養(yǎng)老金提到500元

汽車要聞

鴻蒙智行首款獵裝車 尚界Z7/Z7T首發(fā)

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
時(shí)尚
旅游
手機(jī)

房產(chǎn)要聞

400組,30套!聚億·椰海錦程為何能在春節(jié)火出圈?

數(shù)碼要聞

蘋(píng)果發(fā)布新款MacBook Pro:首發(fā)M5 Pro/Max芯片 17999元起

女人不管多大年紀(jì),都要準(zhǔn)備一條黑裙子,百搭舒適又顯氣質(zhì)

旅游要聞

一夜爆火!淮安元宵燈光秀,解鎖運(yùn)河新玩法

手機(jī)要聞

一加15T 全面升級(jí),官方劇透來(lái)了

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版