国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

英偉達(dá)最新研究:小模型才是智能體的未來(lái)!

0
分享至

  

  英偉達(dá)研究院和佐治亞理工大學(xué)的研究人員最近發(fā)表了一篇論文,拋出了一個(gè)非共識(shí)的觀點(diǎn):

  小語(yǔ)言模型(SLM)才是AI智能體的未來(lái),而不是那些龐大的大型語(yǔ)言模型。

  

  https://arxiv.org/abs/2506.02153v1

  作者核心理由主要是以下三點(diǎn):

  首先,SLM已經(jīng)足夠強(qiáng)大,能處理AI智能體中大多數(shù)重復(fù)、專一的任務(wù);其次,它們天生更適合智能體系統(tǒng)的架構(gòu),靈活且易集成;最后,從經(jīng)濟(jì)角度看,SLM更省錢(qián)、更高效,能大幅降低AI運(yùn)行成本。

  

  想象一下,AI智能體系統(tǒng)就像一個(gè)虛擬團(tuán)隊(duì),能自動(dòng)分解任務(wù)、調(diào)用工具(比如瀏覽器或代碼編輯器),最終解決問(wèn)題。目前,大多數(shù)AI智能體都依賴LLM作為“大腦”,因?yàn)長(zhǎng)LM聊天能力強(qiáng)、知識(shí)廣博,能處理各種復(fù)雜問(wèn)題。

  論文指出,2024年AI智能體市場(chǎng)已達(dá)52億美元,預(yù)計(jì)到2034年飆升至2000億美元,企業(yè)中超過(guò)一半已經(jīng)在用。但問(wèn)題來(lái)了:AI智能體的任務(wù)往往重復(fù)單一,比如“檢查郵件”“生成報(bào)告”,用LLMs這種“全能選手”來(lái)干這些活,就好像用超級(jí)計(jì)算機(jī)玩掃雷,開(kāi)蘭博基尼送披薩——過(guò)于浪費(fèi)資源。

  而且不單是浪費(fèi),智能體系統(tǒng)任務(wù)的特點(diǎn)也使得小模型能更好的適配智能體生態(tài),從而更有可能交付出更符合要求的結(jié)果。

  因?yàn)楸举|(zhì)上AI智能體不是聊天機(jī)器人,而是“工具箱+大腦”的系統(tǒng)。SLM小巧,訓(xùn)練/微調(diào)成本低(幾小時(shí)GPU就行),易適應(yīng)新需求(如新法規(guī))。這帶來(lái)“民主化”,從而能讓更多人能開(kāi)發(fā)智能體,減少偏見(jiàn),促進(jìn)創(chuàng)新。

  作者指出,智能體任務(wù)只用LLM的一小部分技能,如格式嚴(yán)格的工具調(diào)用。而AI智能體系統(tǒng)天然異構(gòu)就利于混用模型,主智能體用LLM,子任務(wù)用SLM。

  而如果大量采用SLM,還能發(fā)揮數(shù)據(jù)收集優(yōu)勢(shì):智能體運(yùn)行時(shí),自然產(chǎn)生的專精數(shù)據(jù),可以用來(lái)微調(diào)SLM,形成良性循環(huán),從而使得結(jié)果越來(lái)越好。

  01

  什么是SLM

  論文對(duì)SLM給出了一個(gè)實(shí)用的定義:

  SLMs:能裝進(jìn)普通消費(fèi)電子設(shè)備(如手機(jī)或筆記本),推理速度快,能實(shí)時(shí)服務(wù)一個(gè)用戶的智能體請(qǐng)求。目前,10億參數(shù)以下的模型可以算是SLM。而其他更大的模型,通常需要云端服務(wù)器支持。

  為什么這樣定義?SLM像“便攜大腦”,適合終端部署;LLM像“宇宙級(jí)超級(jí)電腦”,但延遲高、成本大。

  作者給了一個(gè)很極端但是又很有意思的例子做比喻:如果AI無(wú)限大,會(huì)受光速限制沒(méi)法實(shí)時(shí)互動(dòng);無(wú)限小,又太弱沒(méi)法做事。人類大腦就是平衡點(diǎn),SLM就像人類大腦這個(gè)平衡點(diǎn),高效,易于迭代。

  作者對(duì)比兩種類型的智能體結(jié)構(gòu):

  

  
在左側(cè),一個(gè)語(yǔ)言模型與用戶聊天并直接觸發(fā)每個(gè)工具,因此整個(gè)流程都位于該單個(gè)模型中。

  在右側(cè),一個(gè)小型控制器程序處理工具調(diào)用,讓模型專注于對(duì)話或特定推理。

  這種拆分使得為大多數(shù)調(diào)用插入小型語(yǔ)言模型變得容易,節(jié)省成本,并將大型模型僅保留用于不太常見(jiàn)的開(kāi)放式問(wèn)答或者推理步驟。

  論文表示,最前沿的小模型如Phi-3和Hymba,在工具使用、常識(shí)推理和指令遵循方面,性能足以媲美30B到70B的大模型,但在實(shí)際工作流中的計(jì)算量卻降低了10-30倍。

  英偉達(dá)還對(duì)三款真實(shí)世界的AI智能體進(jìn)行了測(cè)試,發(fā)現(xiàn):

  MetaGPT:60%的任務(wù)可以用SLM取代

  Open Operator:40%的任務(wù)可以用SLM取代

  Cradle(圖形界面自動(dòng)化):70%的任務(wù)可以用SLM取代

  02

  SLM那么好,為什么還要用LLM呢?

  論文認(rèn)為AI智能體沒(méi)有大規(guī)模利用SLM的主要原因還是因?yàn)槁窂揭蕾嚒?/p>

  大量資金(高達(dá)570億美元)被投入了中心化的大模型基礎(chǔ)設(shè)施,團(tuán)隊(duì)傾向于重復(fù)使用付費(fèi)設(shè)置,而不是轉(zhuǎn)向更輕的本地選項(xiàng),短期內(nèi)難以轉(zhuǎn)變。

  行業(yè)內(nèi)對(duì)「大即是好」的偏見(jiàn)依然強(qiáng)烈。對(duì)小型模型的研究一直在追逐用于大型模型的相同廣泛基準(zhǔn),而這些測(cè)試都體現(xiàn)不出于小模型在智能體任務(wù)上的優(yōu)秀表現(xiàn)。

  SLM幾乎沒(méi)有GPT-4那樣的熱度,小模型也不像讓大模型那樣經(jīng)歷了一輪一輪的營(yíng)銷熱潮,因此許多構(gòu)建者從未嘗試過(guò)更便宜更合理的路線。

  對(duì)此,論文認(rèn)為如果研究任務(wù)員和智能體搭建者能夠做到一下幾點(diǎn),那么將能很好的發(fā)揮SLM在智能體方面的潛力。

  -收集梳理數(shù)據(jù)

  -針對(duì)特定任務(wù)微調(diào)SLM

  -把任務(wù)進(jìn)行聚類并建立SLM的“技能”

  03

  華人作者介紹

  SHIZHE DIAO

  

  根據(jù)他領(lǐng)英公開(kāi)的資料,他先后就讀于北京師范大學(xué),香港科技大學(xué),曾經(jīng)在UIUC做過(guò)訪問(wèn)學(xué)者。

  

  曾經(jīng)在字節(jié)AI LAB做過(guò)實(shí)習(xí),2024年加入英偉達(dá)擔(dān)任研究科學(xué)家。

  

  Xin Dong

  

  根據(jù)他的個(gè)人博客,他博士畢業(yè)于哈佛大學(xué)。曾經(jīng)在騰訊,Meta等公司有過(guò)工作和實(shí)習(xí)經(jīng)歷。

  

  Yonggan Fu

  

  根據(jù)他的領(lǐng)英公開(kāi)資料,他本科畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),在萊斯大學(xué)和喬治亞理工完成了自己的博士學(xué)業(yè)。

  

  在Meta和英偉達(dá)實(shí)習(xí)過(guò),現(xiàn)為英偉達(dá)研究科學(xué)家。

  

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
白宮不排除動(dòng)武,美軍開(kāi)始調(diào)動(dòng),歐洲如臨大敵,5國(guó)統(tǒng)一陣線防御

白宮不排除動(dòng)武,美軍開(kāi)始調(diào)動(dòng),歐洲如臨大敵,5國(guó)統(tǒng)一陣線防御

夢(mèng)在深巷aqa
2026-01-08 09:14:27
美國(guó)破防也沒(méi)轍,抓捕馬杜羅不到24小時(shí),中國(guó)牽頭辦金磚聯(lián)合軍演

美國(guó)破防也沒(méi)轍,抓捕馬杜羅不到24小時(shí),中國(guó)牽頭辦金磚聯(lián)合軍演

田柳
2026-01-08 09:00:03
又砍下20+8+6!抱歉東契奇:你從歷史第一變成了歷史第二

又砍下20+8+6!抱歉東契奇:你從歷史第一變成了歷史第二

籃球大視野
2026-01-07 16:43:07
楊瀚森美國(guó)深夜收喜訊,小楊獲生涯首個(gè)大獎(jiǎng),留洋NBA迎2大突破

楊瀚森美國(guó)深夜收喜訊,小楊獲生涯首個(gè)大獎(jiǎng),留洋NBA迎2大突破

二哥聊球
2026-01-07 11:47:16
雷軍發(fā)文!網(wǎng)友徹底沸騰:趕緊約

雷軍發(fā)文!網(wǎng)友徹底沸騰:趕緊約

大象新聞
2026-01-07 08:09:06
特朗普低估中國(guó),一拳肯定打不倒,王毅新年第一訪,穩(wěn)住后方陣腳

特朗普低估中國(guó),一拳肯定打不倒,王毅新年第一訪,穩(wěn)住后方陣腳

愛(ài)史紀(jì)
2026-01-07 16:52:38
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來(lái)

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來(lái)

小哥很OK
2025-12-12 14:33:01
張學(xué)良到了晚年才吐露心聲:我這輩子從來(lái)不信迷信,然而在老虎廳除掉楊宇霆之后,我卻不得不改變想法

張學(xué)良到了晚年才吐露心聲:我這輩子從來(lái)不信迷信,然而在老虎廳除掉楊宇霆之后,我卻不得不改變想法

清風(fēng)鑒史
2025-12-26 17:05:13
湖南一男子在高速上開(kāi)車使用輔助駕駛,酣睡20公里后撞上護(hù)欄

湖南一男子在高速上開(kāi)車使用輔助駕駛,酣睡20公里后撞上護(hù)欄

環(huán)球網(wǎng)資訊
2026-01-07 19:35:13
費(fèi)迪南德談梅西與C羅:若只踢一場(chǎng)比賽,我會(huì)選擇C羅

費(fèi)迪南德談梅西與C羅:若只踢一場(chǎng)比賽,我會(huì)選擇C羅

懂球帝
2026-01-08 06:50:47
河南一地漫山遍野都是淘玉人,鎮(zhèn)政府:確有大量游客來(lái)?yè)?,?dāng)?shù)卮迕穹Q曾挖到一塊石頭出了兩個(gè)手鐲賣了3000元

河南一地漫山遍野都是淘玉人,鎮(zhèn)政府:確有大量游客來(lái)?yè)?,?dāng)?shù)卮迕穹Q曾挖到一塊石頭出了兩個(gè)手鐲賣了3000元

觀威海
2026-01-07 19:18:04
于曉光做夢(mèng)沒(méi)想到,韓國(guó)總統(tǒng)訪華僅3天,46歲秋瓷炫竟意外火出圈

于曉光做夢(mèng)沒(méi)想到,韓國(guó)總統(tǒng)訪華僅3天,46歲秋瓷炫竟意外火出圈

素衣讀史
2026-01-06 16:55:53
萬(wàn)里“大逃殺”!油輪火線“入籍”俄羅斯,已被美軍追了18天,俄方派潛艇等海軍護(hù)航!美??哲姶笈e出動(dòng),為抓油輪還是“聲東擊西”?

萬(wàn)里“大逃殺”!油輪火線“入籍”俄羅斯,已被美軍追了18天,俄方派潛艇等海軍護(hù)航!美??哲姶笈e出動(dòng),為抓油輪還是“聲東擊西”?

每日經(jīng)濟(jì)新聞
2026-01-07 13:48:18
西工大連夜宣布好消息!全世界都沒(méi)想到,中國(guó)居然“彎道超車”

西工大連夜宣布好消息!全世界都沒(méi)想到,中國(guó)居然“彎道超車”

愛(ài)吃醋的貓咪
2026-01-05 21:28:30
曾揚(yáng)言讓中國(guó)給全世界道歉,慘遭央視開(kāi)除的阿丘,如今過(guò)得怎么樣

曾揚(yáng)言讓中國(guó)給全世界道歉,慘遭央視開(kāi)除的阿丘,如今過(guò)得怎么樣

廚房里的神
2026-01-07 08:27:10
最后33秒威少一攻一防,就是詹姆斯趕走他的真正原因!錯(cuò)怪詹皇了

最后33秒威少一攻一防,就是詹姆斯趕走他的真正原因!錯(cuò)怪詹皇了

嘴炮體壇
2026-01-07 16:00:20
新增7座過(guò)江通道、加快貫通“六縱六橫”高鐵網(wǎng),江蘇交通運(yùn)輸“十五五”新藍(lán)圖定了

新增7座過(guò)江通道、加快貫通“六縱六橫”高鐵網(wǎng),江蘇交通運(yùn)輸“十五五”新藍(lán)圖定了

現(xiàn)代快報(bào)
2026-01-07 23:54:10
曼聯(lián)2-2爆冷送溫暖!狂轟30腳戰(zhàn)平倒數(shù)第2!弗萊徹執(zhí)教無(wú)緣開(kāi)門(mén)紅

曼聯(lián)2-2爆冷送溫暖!狂轟30腳戰(zhàn)平倒數(shù)第2!弗萊徹執(zhí)教無(wú)緣開(kāi)門(mén)紅

球叮足球
2026-01-08 09:35:14
主持人李靜自曝絕經(jīng)過(guò)程,很快失去性魅力,連男人也沒(méi)興趣了

主持人李靜自曝絕經(jīng)過(guò)程,很快失去性魅力,連男人也沒(méi)興趣了

阿器談史
2025-12-30 17:26:47
王曉晨當(dāng)街發(fā)脾氣,黑臉生氣伸手怒指,俞灝明買甜品討好很卑微

王曉晨當(dāng)街發(fā)脾氣,黑臉生氣伸手怒指,俞灝明買甜品討好很卑微

瘋說(shuō)時(shí)尚
2026-01-06 16:10:59
2026-01-08 10:04:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽(tīng)到營(yíng)銷這兩個(gè)字都有點(diǎn)惡心

頭條要聞

牛彈琴:美國(guó)又干了件石破天驚的事 俄羅斯遭沉重打擊

頭條要聞

牛彈琴:美國(guó)又干了件石破天驚的事 俄羅斯遭沉重打擊

體育要聞

賣水果、搬磚的小伙,與哈蘭德?tīng)?zhēng)英超金靴

娛樂(lè)要聞

《馬背搖籃》首播,革命的樂(lè)觀主義故事

財(cái)經(jīng)要聞

農(nóng)大教授科普:無(wú)需過(guò)度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

燃油駕趣+智能電感雙Buff 試駕全新奧迪Q5L

態(tài)度原創(chuàng)

房產(chǎn)
健康
手機(jī)
本地
公開(kāi)課

房產(chǎn)要聞

最新!??诙址?,漲價(jià)房源突然猛增30%

這些新療法,讓化療不再那么痛苦

手機(jī)要聞

小米:強(qiáng)烈推薦老款SU7排單用戶升級(jí)新一代SU7!會(huì)優(yōu)先排產(chǎn)

本地新聞

“閩東利劍·惠民安商”高效執(zhí)行專項(xiàng)行動(dòng)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版