国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

「思考用時(shí)100秒」成歷史?AI推理太耗時(shí),伯克利整了個(gè)大活兒

0
分享至

“已思考(用時(shí) XXX 秒)……”看到這行字,大家是不是已經(jīng)開始不耐煩了?盡管 AI 這幾年確實(shí)越來越聰明、也越來越全能了,但在遇到某些奇怪的推理題目或橫跨多個(gè) App 的復(fù)雜任務(wù)時(shí),這些更聰明、更謹(jǐn)慎的 AI 大模型,響應(yīng)時(shí)間反而越慢。



(圖源:deepseek)

針對(duì)「轉(zhuǎn)圈圈」這一現(xiàn)象,伯克利人工智能研究實(shí)驗(yàn)室(BAIR)日前發(fā)布了一篇新的博客,提出了不一樣的解決方案——自適應(yīng)并行推理(Adaptive Parallel Reasoning,APR)。

AI 推理為什么要「轉(zhuǎn)圈圈」?

在展開 APR 這個(gè)概念之前,我們要先聊聊為什么現(xiàn)在的 AI 普遍都有會(huì)在某個(gè)環(huán)節(jié)卡住。

目前主流模型普遍采用的「順序推理」的模式:大模型接到復(fù)雜任務(wù)后,會(huì)先把任務(wù)分割成一個(gè)個(gè)邏輯相連的小任務(wù),然后從頭到尾一步步推,之后再驗(yàn)證結(jié)果。



左為順序推理(SR),右為并行推理(APR)

圖片來源:BAIR

從好的方面看,這種推理方式準(zhǔn)確性相對(duì)有保障,推理過程也更為清晰。比如上個(gè)月雷科技體驗(yàn)用 ChatGPT 畫原創(chuàng)漫畫時(shí),展開推理窗口我們就能看到 AI 從頭到尾設(shè)計(jì)故事、對(duì)白和規(guī)劃畫面的過程。



圖片來源:雷科技

但這還沒完,為了保證推理結(jié)果的準(zhǔn)確性,主流模型還會(huì)采用一個(gè)名為「推理時(shí)拓展」(Inference-time scaling)的推理模式。用人話來解釋,就是模型推理得出結(jié)果后,會(huì)再發(fā)起一次推理來驗(yàn)證這個(gè)結(jié)果。只有多次推理結(jié)果一致,才會(huì)輸出最終結(jié)果。

很顯然,「驗(yàn)算」次數(shù)多了,推理的耗時(shí)就長了,用戶的等到時(shí)間也就長了。

當(dāng)然了,順序推理也有自己的好處。對(duì)于那些特別復(fù)雜的推理任務(wù),順序推理的模式能保證推理結(jié)果的可溯源性。只要點(diǎn)開推理過程,我們能人工檢查每一步驟的推理結(jié)果,可以相對(duì)輕松地找到 AI 在哪個(gè)步驟的運(yùn)算出了問題。

那代價(jià)是什么呢?

很顯然,「順序推理+推理時(shí)拓展」的推理模式需要更長的推理時(shí)間,用戶等待時(shí)間更長;逐步拆解任務(wù)再重新推理的方式,也會(huì)顯著提高模型推理的 Token 用量。更不用說這種計(jì)算模式很容易突破任務(wù)的實(shí)際文本窗口大小,任務(wù)多跑幾次可能就丟掉上下文了。

本來用改進(jìn)推理結(jié)果的推理模式,最后反而成為壓垮 AI 大模型的罪魁禍?zhǔn)住?/strong>

為了解決「推理排隊(duì)」的問題,AI 行業(yè)提出了「并行推理」的模式。其本質(zhì)依舊是將推理步驟拆成多個(gè)小任務(wù)。在過去兩年里,不少 AI 研究員都提出了針對(duì)并行推理模式的結(jié)果驗(yàn)證方式。

但問題是,采用「并行推理」的 AI 大模型通常會(huì)用額外的外部模型來拆解任務(wù),大模型本身并不能決定一個(gè)任務(wù)要被拆解、細(xì)化到什么程度:簡單任務(wù)拆太細(xì)會(huì)浪費(fèi) Token,復(fù)雜任務(wù)如果拆得不夠細(xì),也可能會(huì)計(jì)算結(jié)果。

讓大模型學(xué)會(huì)自己拆分任務(wù)

那如果我們讓 AI 大模型自己決定任務(wù)拆解的程度呢?自適應(yīng)并行推理要做的就是這件事。

顧名思義,自適應(yīng)并行推理(APR)和傳統(tǒng)的并行推理最大的區(qū)別,在于模型可以在順序推理和并行推理之間動(dòng)態(tài)自由切換。

對(duì)于簡單的計(jì)算或邏輯請(qǐng)求,比如「105 能否被 7 整除」或「明天天氣如何」這類題目,采用自適應(yīng)并行推理的模型會(huì)采用標(biāo)準(zhǔn)的順序推理模式,甚至可能都不需要推理時(shí)拓展來確保結(jié)果準(zhǔn)確性,自然也不需要把請(qǐng)求拆分成多個(gè)獨(dú)立項(xiàng)目了。



左為順序推理(SR),右為自適應(yīng)并行推理(APR)

圖片來源:BAIR

但如果遇到復(fù)雜的數(shù)學(xué)推理,或者明顯帶有步驟、上下文關(guān)系的邏輯請(qǐng)求,比如在應(yīng)對(duì)「導(dǎo)入并分析 2026 F1 中國站排位賽漢密爾頓在 T14 的尾速,并于 2025 年的數(shù)據(jù)做對(duì)比,數(shù)據(jù)可視化輸出」這種問題時(shí):

采用自適應(yīng)并行推理的模型,就會(huì)在不超出單個(gè)上下文窗口的前提下,將整個(gè)任務(wù)拆分成多個(gè)彼此相互獨(dú)立的小任務(wù),并「并行處理」(即同時(shí)處理)沒有上下文關(guān)系的任務(wù),從而節(jié)約整個(gè)大任務(wù)的耗時(shí)。

其次,傳統(tǒng)的并行推理會(huì)讓幾個(gè) AI 重復(fù)處理同一個(gè)小任務(wù),這本質(zhì)上是在浪費(fèi) Token。而自適應(yīng)并行推理則是讓 AI 在拆分前就完成分工,進(jìn)一步減少 Token 的浪費(fèi)。



兩種不同推理模式示意圖

圖片來源:BAIR

甚至因?yàn)樽赃m應(yīng)并行推理模式會(huì)把任務(wù)鏈拆分成彼此之間獨(dú)立的小任務(wù),這一模式還巧妙規(guī)避了超長文本窗口常見的 AI 幻覺問題。這其實(shí)也很好理解,畢竟讓 6 個(gè)人分別做 4 小時(shí)的數(shù)學(xué)題,答案的正確率肯定比讓一個(gè)人連做 24 小時(shí)要高得多。

讓 AI 以機(jī)器的方式「并行思考」

話又說回來,盡管自適應(yīng)并行推理的概念為 AI 大模型提供了一種新的工作模式,但它背后也有自己的風(fēng)險(xiǎn)。

并行推理訓(xùn)練框架 Parallel-R1 的作者就指出,自適應(yīng)并行推理模式的訓(xùn)練存在「模型回滾」的情況:就像真正的「打工人」一樣,只要?jiǎng)h掉針對(duì)自適應(yīng)并行推理模式的「獎(jiǎng)勵(lì)」,AI 模型就會(huì)回歸到傳統(tǒng)的順序推理模式,重返自己的「舒適區(qū)」。

另外,讓模型自己評(píng)估任務(wù)復(fù)雜性、自行拆解任務(wù)的做法,也可能導(dǎo)致模型搞錯(cuò)子任務(wù)的主次,對(duì)真正的推理難題視而不見,在一些細(xì)枝末節(jié)的問題上鉆牛角尖。且對(duì)于 AI 模型這種帶有「概率」「抽卡」屬性的技術(shù)而言,在推理過程中引入更多 AI「主觀判斷」的環(huán)節(jié),必然會(huì)影響最終結(jié)果的穩(wěn)定性。

可以肯定的是,作為 AI 推理的新方案,自適應(yīng)并行推理還需要時(shí)間去完善。



圖片來源:Claude

但從用戶的角度看,在 AI Agent 時(shí)代,過去那種「插科打諢」純聊天的 AI 對(duì)話場(chǎng)景已經(jīng)非常少見了:昨天,Claude 上線了與微軟 365 套件的互通能力;三月份,OpenAI 發(fā)布了可以原生操作電腦的 ChatGPT 5.4……毫無疑問,跨應(yīng)用長任務(wù)鏈能力是未來 AI 的競爭點(diǎn)。

再加上長任務(wù)鏈「環(huán)環(huán)相扣」的特點(diǎn)也會(huì)成倍放大 AI 大模型推理效率的短板,以前上學(xué)時(shí)老師說的「一人耽誤一分鐘,全班耽誤半小時(shí)」的情況,將會(huì)出現(xiàn)在 AI Agent 中。在這樣的背景下,盡管自適應(yīng)并行推理方案還不穩(wěn)定,但考慮到其「降本增效」的能力,雷科技認(rèn)為應(yīng)該會(huì)有越來越多的 AI 服務(wù)加入到自適應(yīng)并行推理陣營中。

進(jìn)一步講,從 AI 的發(fā)展來看,雷科技認(rèn)為這種從順序思考到自適應(yīng)并行思考的改變,其實(shí)也是AI 大模型從「模擬人類思考」轉(zhuǎn)向「發(fā)揮機(jī)器優(yōu)勢(shì)」的里程碑。

線性、順序的推理方式,本質(zhì)上是讓機(jī)器模擬人類的思維。從好的方面看,這種推理方式讓 AI 大模型擁有了人類思考嚴(yán)謹(jǐn)、一環(huán)扣一環(huán)的特點(diǎn)。但硅基芯片多線程的特點(diǎn),天生就適合并行計(jì)算,這種底層架構(gòu)的差異意味著「并行思考」才是真正適合 AI 的思考方式。

讓 AI 以人的方式思考,像是讓人形機(jī)器人拉黃包車;讓 AI 以 AI 的方式思考,AI 才算真正走進(jìn)「機(jī)械時(shí)代」。

可以肯定的是,當(dāng)這種「非線性」的思維方式成為主流后,AI Agent 的交互模式也會(huì)跟著發(fā)生變化。當(dāng)前的 AI 為了證明自己有在思考,會(huì)把推理過程體現(xiàn)出來,始終脫離不了「文本窗」的限制。而「并行」運(yùn)算時(shí)代的 AI,必然會(huì)「黑盒」化——后臺(tái)推理「火力全開」,前臺(tái)直接輸出結(jié)果。

到那時(shí)候,AI 自然也不需要向用戶證明「自己在思考」;「已思考 XXX 秒」這種沒有意義的提示,也將徹底消失在 AI 時(shí)代中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
吳君如很早就說過了,陳妍希私下就是這樣穿

吳君如很早就說過了,陳妍希私下就是這樣穿

八卦王者
2026-05-10 13:24:46
中國首款定制癌癥疫苗落地!11大癌種可申請(qǐng),晚期患者絕處逢生

中國首款定制癌癥疫苗落地!11大癌種可申請(qǐng),晚期患者絕處逢生

新時(shí)代的兩性情感
2026-05-10 09:40:15
國家力挺!張雪機(jī)車獲200畝用地+2.4億授信,研發(fā)占比9.33%!

國家力挺!張雪機(jī)車獲200畝用地+2.4億授信,研發(fā)占比9.33%!

世界圈
2026-05-10 08:51:12
男子打車點(diǎn)承擔(dān)高速費(fèi)不給,司機(jī)原路返回,可以雙輸,但不能單贏

男子打車點(diǎn)承擔(dān)高速費(fèi)不給,司機(jī)原路返回,可以雙輸,但不能單贏

一盅情懷
2026-05-10 15:46:38
難以饒?。×裆弮H退款女孩過分言論曝光:臉真大,不知羞恥的東西

難以饒?。×裆弮H退款女孩過分言論曝光:臉真大,不知羞恥的東西

小徐講八卦
2026-05-09 10:31:23
震驚!小馬云18歲成年首播,在線人數(shù)破7萬,與女生接吻刷爆網(wǎng)絡(luò)

震驚!小馬云18歲成年首播,在線人數(shù)破7萬,與女生接吻刷爆網(wǎng)絡(luò)

火山詩話
2026-05-09 16:02:57
縣交警隊(duì)長被舉報(bào)工作日KTV飲酒;鎮(zhèn)雄公安:事先已請(qǐng)假,未違規(guī)違紀(jì)

縣交警隊(duì)長被舉報(bào)工作日KTV飲酒;鎮(zhèn)雄公安:事先已請(qǐng)假,未違規(guī)違紀(jì)

大風(fēng)新聞
2026-05-10 15:07:12
中紀(jì)委連發(fā)禁令:機(jī)關(guān)事業(yè)單位職工注意,這7種飯局一參加就出局

中紀(jì)委連發(fā)禁令:機(jī)關(guān)事業(yè)單位職工注意,這7種飯局一參加就出局

細(xì)說職場(chǎng)
2026-05-10 09:55:02
入戶調(diào)查全面鋪開,挨家挨戶上門登記,到底查什么?一文講清楚

入戶調(diào)查全面鋪開,挨家挨戶上門登記,到底查什么?一文講清楚

健身狂人
2026-05-10 15:17:47
正負(fù)值-23+5次失誤,他的大合同被雷霆打沒了

正負(fù)值-23+5次失誤,他的大合同被雷霆打沒了

聽我說球
2026-05-10 11:23:35
他活埋近5000紅軍,逃往國外安享晚年,如今國內(nèi)竟還有人紀(jì)念他!

他活埋近5000紅軍,逃往國外安享晚年,如今國內(nèi)竟還有人紀(jì)念他!

興趣知識(shí)
2026-05-08 00:23:54
曝光!剪一次頭!!20萬美元!

曝光!剪一次頭!!20萬美元!

柚子說球
2026-05-10 11:24:26
國家反詐平臺(tái)竟成“內(nèi)鬼”撈錢工具,最堅(jiān)固的盾,成了最利的刀?

國家反詐平臺(tái)竟成“內(nèi)鬼”撈錢工具,最堅(jiān)固的盾,成了最利的刀?

迷世書童H9527
2026-05-10 10:10:43
史詩級(jí)合作!英偉達(dá)聯(lián)手康寧光連接擴(kuò)產(chǎn) 10倍 5大供應(yīng)商直接起飛

史詩級(jí)合作!英偉達(dá)聯(lián)手康寧光連接擴(kuò)產(chǎn) 10倍 5大供應(yīng)商直接起飛

元芳說投資
2026-05-10 06:20:08
工黨真正輸?shù)舻?,不只是選票,而是英國底層民眾的耐心

工黨真正輸?shù)舻模恢皇沁x票,而是英國底層民眾的耐心

斌聞天下
2026-05-10 07:10:03
汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

露珠聊影視
2026-05-09 22:16:53
英國政壇地震,斯塔默“首相生涯面臨終結(jié)”?

英國政壇地震,斯塔默“首相生涯面臨終結(jié)”?

上觀新聞
2026-05-10 15:27:19
“吳媽”扮演者去世

“吳媽”扮演者去世

魯中晨報(bào)
2026-05-10 10:14:03
4只皮皮蝦1035元,官方回應(yīng)是否“帶客吃回扣”

4只皮皮蝦1035元,官方回應(yīng)是否“帶客吃回扣”

中國新聞周刊
2026-05-09 19:38:06
事態(tài)升級(jí)!三亞海鮮商戶集體憤怒,官方協(xié)會(huì)發(fā)聲,游客仍有條退路

事態(tài)升級(jí)!三亞海鮮商戶集體憤怒,官方協(xié)會(huì)發(fā)聲,游客仍有條退路

觀察鑒娛
2026-05-10 09:44:36
2026-05-10 18:43:00
雷科技 incentive-icons
雷科技
專注AI硬科技
36819文章數(shù) 812087關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

面對(duì)中方強(qiáng)硬態(tài)度 世界杯中國轉(zhuǎn)播費(fèi)從3億美元腰斬

頭條要聞

面對(duì)中方強(qiáng)硬態(tài)度 世界杯中國轉(zhuǎn)播費(fèi)從3億美元腰斬

體育要聞

那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

娛樂要聞

大S女兒玥兒開通賬號(hào),用煙花緬懷母親

財(cái)經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
教育
手機(jī)
健康

數(shù)碼要聞

華為智慧屏S7正式開售,300Hz Super MiniLED超清護(hù)眼

藝術(shù)要聞

中國民生銀行總行新大樓掛牌!北京CBD“竹樓”成地標(biāo)

教育要聞

小升初必考!梯形面積的計(jì)算技巧!

手機(jī)要聞

W18周:蘋果第五,OPPO第二,vivo第三

干細(xì)胞能讓人“返老還童”嗎

無障礙瀏覽 進(jìn)入關(guān)懷版