国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

LoPA:上海交大與華為聯(lián)手破解AI推理新困境

0
分享至


說起人工智能的文字生成,我們可以把它想象成一個(gè)非常特殊的打字機(jī)。傳統(tǒng)的AI語言模型就像一個(gè)按部就班的打字員,必須一個(gè)字母一個(gè)字母地慢慢敲打,前面的字母沒打完,后面的就得等著。但最近,上海交通大學(xué)和華為公司的研究團(tuán)隊(duì)開發(fā)出了一種全新的"打字方式",讓AI能夠同時(shí)敲打多個(gè)鍵盤,大大加快了文字生成的速度。

這項(xiàng)由上海交通大學(xué)嚴(yán)志杰教授領(lǐng)導(dǎo),華為公司多名研究人員參與的研究發(fā)表于2025年12月,論文編號為arXiv:2512.16229v2。研究團(tuán)隊(duì)開發(fā)的技術(shù)叫做"LoPA"(Lookahead Parallel Decoding),簡單來說就是"向前看的并行解碼"技術(shù)。他們的方法成功讓AI語言模型的推理速度提升了近10倍,在某些測試中達(dá)到了每秒生成1073個(gè)詞匯的驚人速度。

要理解這項(xiàng)突破的重要性,我們需要先了解AI語言模型是如何工作的。就像廚師按照菜譜一步步做菜一樣,傳統(tǒng)的AI模型必須按順序生成每一個(gè)詞匯。當(dāng)它要寫"今天天氣很好"這句話時(shí),必須先確定"今天",然后才能考慮"天氣",接著是"很",最后是"好"。這種串行的工作方式雖然準(zhǔn)確,但速度相對較慢,特別是在處理長篇內(nèi)容時(shí)。

近年來出現(xiàn)了一種新型的AI模型,叫做擴(kuò)散大語言模型(dLLM)。這類模型的工作原理更像是藝術(shù)家創(chuàng)作一幅畫——先有一個(gè)模糊的輪廓,然后逐步細(xì)化各個(gè)部分,最終得到完整的作品。在文字生成中,這意味著模型可以同時(shí)考慮句子中的多個(gè)位置,理論上能夠并行生成多個(gè)詞匯。

然而,擴(kuò)散模型在實(shí)際應(yīng)用中遇到了一個(gè)關(guān)鍵問題:雖然理論上可以并行工作,但由于置信度機(jī)制的限制,實(shí)際上每次前向傳播只能確定1到3個(gè)詞匯。這就像一個(gè)廚師雖然有多個(gè)爐灶,但因?yàn)閷Σ俗V不夠熟悉,每次只敢使用一個(gè)爐灶做菜,大大浪費(fèi)了廚房的潛力。

研究團(tuán)隊(duì)通過深入分析發(fā)現(xiàn),問題的根源在于"詞匯填充順序"(Token Filling Order)的選擇。在擴(kuò)散模型中,決定先填充哪個(gè)位置、后填充哪個(gè)位置,會顯著影響模型的置信度分布。就像拼圖游戲一樣,如果你選擇了錯誤的拼圖策略——比如先拼邊緣還是先拼中心——會直接影響后續(xù)步驟的難度和效率。

基于這個(gè)洞察,研究團(tuán)隊(duì)開發(fā)了LoPA技術(shù)。這個(gè)技術(shù)的核心思想非常巧妙:既然我們無法提前知道哪種填充順序最好,那就同時(shí)嘗試多種可能的順序,然后選擇最有潛力的那一個(gè)。

具體來說,LoPA的工作過程可以比作一個(gè)經(jīng)驗(yàn)豐富的象棋大師在下棋時(shí)的思考過程。當(dāng)面臨一個(gè)復(fù)雜局面時(shí),大師不會只考慮一種走法,而是會在腦海中同時(shí)模擬多種可能的走法,預(yù)測每種走法可能導(dǎo)致的后續(xù)局面,然后選擇最有希望獲勝的那一步。

LoPA技術(shù)分為三個(gè)階段。首先是"分支準(zhǔn)備階段",系統(tǒng)會基于當(dāng)前的文本狀態(tài),創(chuàng)建一個(gè)主要分支和多個(gè)探索分支。主要分支采用傳統(tǒng)的置信度驅(qū)動策略,而探索分支則會嘗試不同的詞匯填充順序。這就像一個(gè)導(dǎo)航系統(tǒng)同時(shí)規(guī)劃多條可能的路線。

接下來是"并行驗(yàn)證階段",系統(tǒng)會同時(shí)評估所有分支的可行性。這個(gè)過程非常高效,因?yàn)樗蟹种Э梢栽谝淮吻跋騻鞑ブ型瑫r(shí)處理,就像一臺超級計(jì)算機(jī)同時(shí)運(yùn)行多個(gè)模擬程序。

最后是"最優(yōu)選擇階段",系統(tǒng)會根據(jù)每個(gè)分支的"未來并行化潛力"來選擇最佳路徑。這個(gè)評估標(biāo)準(zhǔn)非常聰明:它不僅考慮當(dāng)前步驟的質(zhì)量,更重要的是預(yù)測選擇這個(gè)分支后,在下一步能夠并行處理多少個(gè)詞匯。

研究團(tuán)隊(duì)將LoPA技術(shù)應(yīng)用到了D2F模型上,這是目前最先進(jìn)的擴(kuò)散大語言模型之一。實(shí)驗(yàn)結(jié)果令人印象深刻:在數(shù)學(xué)問題求解任務(wù)(GSM8K)上,LoPA將模型的并行度提升到10.1,也就是說每次前向傳播能夠確定超過10個(gè)詞匯,比傳統(tǒng)方法提升了3倍以上。在代碼生成任務(wù)(HumanEval+)上,并行度達(dá)到了8.3,同樣實(shí)現(xiàn)了顯著提升。

更重要的是,這種速度提升并沒有犧牲生成質(zhì)量。在保持與原始模型相當(dāng)甚至更好的準(zhǔn)確率的同時(shí),LoPA實(shí)現(xiàn)了大幅度的加速。這就像找到了一種既快又好的新烹飪方法,既節(jié)省時(shí)間又保證了菜品質(zhì)量。

為了將算法上的改進(jìn)轉(zhuǎn)化為實(shí)際的系統(tǒng)性能提升,研究團(tuán)隊(duì)還開發(fā)了專門的分布式推理系統(tǒng),叫做"LoPA-Dist"。這個(gè)系統(tǒng)引入了"分支并行"(Branch Parallelism)的概念,將不同的探索分支分配給不同的計(jì)算設(shè)備,實(shí)現(xiàn)真正的并行計(jì)算。

LoPA-Dist系統(tǒng)有兩個(gè)版本:針對英偉達(dá)CUDA平臺優(yōu)化的LoPA-Dist-NV和針對華為昇騰910C芯片優(yōu)化的LoPA-Dist-Ascend。兩個(gè)版本都實(shí)現(xiàn)了接近線性的擴(kuò)展性,也就是說使用的計(jì)算設(shè)備越多,性能提升越明顯。

在華為昇騰平臺上,LoPA-Dist-Ascend達(dá)到了單樣本每秒1073.9個(gè)詞匯的驚人吞吐量。要知道,人類的正常閱讀速度大約是每分鐘200-300個(gè)詞,這意味著這個(gè)AI系統(tǒng)的文本生成速度比人類閱讀速度快了十幾倍。

系統(tǒng)設(shè)計(jì)中最巧妙的部分是KV緩存管理協(xié)議。在傳統(tǒng)的語言模型中,為了避免重復(fù)計(jì)算,系統(tǒng)會緩存之前計(jì)算的中間結(jié)果。但在LoPA的多分支架構(gòu)中,不同分支會產(chǎn)生不同的緩存狀態(tài),如何保持一致性成了技術(shù)難點(diǎn)。研究團(tuán)隊(duì)設(shè)計(jì)了兩階段更新機(jī)制:先讓各個(gè)設(shè)備預(yù)寫入自己的緩存,然后在確定最優(yōu)分支后,將獲勝分支的緩存廣播到所有設(shè)備,確保全局一致性。

研究團(tuán)隊(duì)在多個(gè)標(biāo)準(zhǔn)測試集上驗(yàn)證了LoPA的效果。在數(shù)學(xué)推理任務(wù)上,LoPA不僅大幅提升了速度,還略微改善了準(zhǔn)確率。在代碼生成任務(wù)上,速度提升同樣顯著,而準(zhǔn)確率基本保持不變。這證明了LoPA是一個(gè)真正意義上的"免費(fèi)午餐"——既快又好。

特別值得注意的是,LoPA技術(shù)具有很強(qiáng)的通用性。研究團(tuán)隊(duì)證明,這個(gè)技術(shù)不僅適用于D2F模型,也可以輕松集成到其他基于置信度驅(qū)動的擴(kuò)散語言模型中,是一個(gè)真正的"即插即用"解決方案。

從技術(shù)角度來看,LoPA的創(chuàng)新在于它改變了我們對并行化的思考方式。傳統(tǒng)的方法試圖在固定的生成策略下擠壓更多的并行性,而LoPA則從根本上質(zhì)疑了生成策略的選擇,通過動態(tài)優(yōu)化策略來釋放更多的并行化潛力。

對于普通用戶來說,這項(xiàng)技術(shù)的應(yīng)用前景非常廣闊。更快的語言模型意味著更流暢的AI對話體驗(yàn),更高效的文檔生成,以及更實(shí)時(shí)的翻譯服務(wù)。當(dāng)AI助手能夠幾乎瞬間理解并回應(yīng)用戶的復(fù)雜請求時(shí),人機(jī)交互的體驗(yàn)將發(fā)生質(zhì)的飛躍。

對于企業(yè)和開發(fā)者來說,LoPA技術(shù)意味著可以用更少的計(jì)算資源提供更好的AI服務(wù)。這不僅降低了運(yùn)營成本,也讓高質(zhì)量的AI服務(wù)更加普及和可及。

研究團(tuán)隊(duì)的工作還展現(xiàn)了學(xué)術(shù)界與產(chǎn)業(yè)界合作的典型成功案例。上海交通大學(xué)提供了理論創(chuàng)新和算法設(shè)計(jì),華為公司貢獻(xiàn)了工程實(shí)現(xiàn)和系統(tǒng)優(yōu)化經(jīng)驗(yàn),雙方的結(jié)合產(chǎn)生了既有理論深度又有實(shí)用價(jià)值的研究成果。

展望未來,LoPA技術(shù)開啟了擴(kuò)散語言模型優(yōu)化的新方向。研究團(tuán)隊(duì)在論文中指出,除了分支置信度之外,還可以探索其他的分支選擇標(biāo)準(zhǔn),比如考慮輸出多樣性、穩(wěn)定性等因素。此外,LoPA的思想也可能啟發(fā)其他類型AI模型的優(yōu)化工作。

這項(xiàng)研究的另一個(gè)重要意義在于它證明了在AI大模型時(shí)代,算法創(chuàng)新仍然具有巨大的價(jià)值。雖然現(xiàn)在的趨勢是通過增加模型規(guī)模和計(jì)算資源來提升性能,但LoPA展示了聰明的算法設(shè)計(jì)同樣能夠帶來顯著的性能突破,而且往往更加經(jīng)濟(jì)和環(huán)保。

說到底,LoPA技術(shù)就像給AI語言模型裝上了一個(gè)"智能大腦",讓它能夠同時(shí)思考多種可能性,選擇最優(yōu)的生成策略。這不僅大大提升了AI的工作效率,也為我們展示了人工智能優(yōu)化的新可能性。隨著這類技術(shù)的不斷發(fā)展和完善,我們有理由期待一個(gè)更加智能、高效的AI時(shí)代的到來。

Q&A

Q1:LoPA技術(shù)具體是什么?

A:LoPA是"向前看的并行解碼"技術(shù),由上海交通大學(xué)和華為聯(lián)合開發(fā)。它讓AI語言模型能夠同時(shí)嘗試多種不同的詞匯生成順序,然后選擇最有效率的那一種,從而大幅提升文本生成速度,最高可達(dá)每秒1073個(gè)詞匯。

Q2:LoPA技術(shù)會影響AI生成內(nèi)容的質(zhì)量嗎?

A:不會。實(shí)驗(yàn)結(jié)果顯示,LoPA在大幅提升生成速度的同時(shí),還能保持甚至略微改善生成質(zhì)量。在數(shù)學(xué)推理和代碼生成等任務(wù)上,準(zhǔn)確率都與原始模型相當(dāng)或更好,實(shí)現(xiàn)了速度和質(zhì)量的雙重提升。

Q3:普通用戶什么時(shí)候能體驗(yàn)到LoPA技術(shù)?

A:LoPA是一個(gè)即插即用的技術(shù),可以輕松集成到現(xiàn)有的AI語言模型中。隨著技術(shù)的進(jìn)一步成熟和推廣,預(yù)計(jì)很快就能在各種AI助手、翻譯工具和文檔生成服務(wù)中體驗(yàn)到更快更流暢的AI響應(yīng)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
央視跨年晚會比拼酒量,茅臺冠名主角搶天時(shí),汾酒地利人和被摩擦

央視跨年晚會比拼酒量,茅臺冠名主角搶天時(shí),汾酒地利人和被摩擦

動物奇奇怪怪
2026-01-01 03:52:34
剛剛,甘肅定西發(fā)生地震

剛剛,甘肅定西發(fā)生地震

甘肅交通廣播
2025-12-31 18:02:30
深圳一名幼兒園家長帶幼兒在馬路上值護(hù)學(xué)崗,怕孩子亂跑緊拽其衣領(lǐng),教育局工作人員:正核實(shí),按要求是自愿報(bào)名

深圳一名幼兒園家長帶幼兒在馬路上值護(hù)學(xué)崗,怕孩子亂跑緊拽其衣領(lǐng),教育局工作人員:正核實(shí),按要求是自愿報(bào)名

極目新聞
2025-12-31 13:18:58
煙草新規(guī)出擊!平價(jià)煙管夠、假煙無處藏,3億煙民的好日子來了?

煙草新規(guī)出擊!平價(jià)煙管夠、假煙無處藏,3億煙民的好日子來了?

復(fù)轉(zhuǎn)這些年
2025-12-30 23:37:15
中國政府呼吁謹(jǐn)慎前往日本,復(fù)旦大學(xué)馮瑋卻推薦中國學(xué)生去日本

中國政府呼吁謹(jǐn)慎前往日本,復(fù)旦大學(xué)馮瑋卻推薦中國學(xué)生去日本

百態(tài)人間
2025-12-30 05:00:03
更炸裂的來了,南博的水太深

更炸裂的來了,南博的水太深

亮見
2025-12-22 14:34:33
徹底脫胎換骨!目前喜迎5連勝的快船,或有望挑戰(zhàn)一波10連勝!

徹底脫胎換骨!目前喜迎5連勝的快船,或有望挑戰(zhàn)一波10連勝!

田先生籃球
2025-12-31 21:09:26
“央視當(dāng)家花旦”朱迅:生命終將結(jié)束,為何不勇敢面對生命的終點(diǎn)

“央視當(dāng)家花旦”朱迅:生命終將結(jié)束,為何不勇敢面對生命的終點(diǎn)

豐譚筆錄
2025-12-25 11:25:18
切爾西換帥!多方信號直指馬雷斯卡離隊(duì) 老板秘密接觸新帥候選人

切爾西換帥!多方信號直指馬雷斯卡離隊(duì) 老板秘密接觸新帥候選人

瀾歸序
2026-01-01 01:32:33
英超2-2,28歲AC米蘭舊將一球一助,35歲曼聯(lián)舊將破門+罰丟點(diǎn)球

英超2-2,28歲AC米蘭舊將一球一助,35歲曼聯(lián)舊將破門+罰丟點(diǎn)球

凌空倒鉤
2025-12-31 07:52:57
全款買下360萬的房子,房產(chǎn)證上卻沒有我的名字,弟弟說讓我刷卡

全款買下360萬的房子,房產(chǎn)證上卻沒有我的名字,弟弟說讓我刷卡

小秋情感說
2025-12-30 13:46:49
定價(jià)來了!2019年-2024年次新飛天“i茅臺”價(jià)格2649元/瓶-1909元/瓶

定價(jià)來了!2019年-2024年次新飛天“i茅臺”價(jià)格2649元/瓶-1909元/瓶

每日經(jīng)濟(jì)新聞
2026-01-01 00:38:05
新婚夜,新郎被咯得生痛,掀開被子一看,先勃然大怒后喜不自勝

新婚夜,新郎被咯得生痛,掀開被子一看,先勃然大怒后喜不自勝

書寫傳奇
2025-12-28 09:19:49
全身而退!北京一家5口完美套現(xiàn)24億,臨走前又坑了甘肅國資一把

全身而退!北京一家5口完美套現(xiàn)24億,臨走前又坑了甘肅國資一把

文史旺旺旺
2025-12-27 18:22:03
喜馬拉雅山的神秘部落:喜歡吃素,無婚姻制度,其繁衍方式特殊

喜馬拉雅山的神秘部落:喜歡吃素,無婚姻制度,其繁衍方式特殊

老謝談史
2025-12-30 17:23:53
二百多名軍官被槍斃、撤職、處分,長津湖戰(zhàn)役中失職的志愿軍88師

二百多名軍官被槍斃、撤職、處分,長津湖戰(zhàn)役中失職的志愿軍88師

丞丞故事匯
2025-12-28 00:13:54
為什么成功人士的精力都非常旺盛?網(wǎng)友:幾乎不管任何瑣碎的事情

為什么成功人士的精力都非常旺盛?網(wǎng)友:幾乎不管任何瑣碎的事情

另子維愛讀史
2025-12-29 17:29:04
女主持車禍去世,年僅38歲!好友透露其被“老頭樂”撞倒

女主持車禍去世,年僅38歲!好友透露其被“老頭樂”撞倒

深圳晚報(bào)
2025-12-31 08:14:08
改寫乾坤!捷克“獨(dú)角鯨”導(dǎo)彈可能成為烏克蘭2026年的秘密武器

改寫乾坤!捷克“獨(dú)角鯨”導(dǎo)彈可能成為烏克蘭2026年的秘密武器

軍迷戰(zhàn)情室
2025-12-29 22:10:06
“饅頭臉”混進(jìn)央視劇,真實(shí)顏值嚇人,張鐸演技再好,也帶不動!

“饅頭臉”混進(jìn)央視劇,真實(shí)顏值嚇人,張鐸演技再好,也帶不動!

付老師種植技術(shù)團(tuán)隊(duì)
2025-12-31 22:27:12
2026-01-01 05:15:00
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
895文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

日企代表團(tuán)推遲原定訪華行程 外交部回應(yīng)

頭條要聞

日企代表團(tuán)推遲原定訪華行程 外交部回應(yīng)

體育要聞

羅馬諾:國米和巴薩再次就轉(zhuǎn)會聯(lián)系了坎塞洛的團(tuán)隊(duì)

娛樂要聞

官宣才兩天就翻車?七七被連環(huán)爆料

財(cái)經(jīng)要聞

高培勇:分配制度改革是提振消費(fèi)的抓手

汽車要聞

凱迪拉克純電中型SUV 售價(jià)不足24萬/33寸曲面屏

態(tài)度原創(chuàng)

旅游
家居
健康
藝術(shù)
公開課

旅游要聞

香港舉行“新希望、新開始”跨年倒數(shù)活動

家居要聞

無形有行 自然與靈感詩意

元旦舉家出行,注意防流感

藝術(shù)要聞

中國博物館全書!看遍中國8000年頂流審美

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版