国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

百度百舸持續(xù)開源生產(chǎn)級代碼,聯(lián)合SGLang 社區(qū)打造先進(jìn) AI Infra

0
分享至

當(dāng)前,Token 的消耗量呈現(xiàn)出年均百倍增長的態(tài)勢。國家數(shù)據(jù)局統(tǒng)計顯示,截至今年6月底,我國日均Token消耗量從2024年初的1000億,已經(jīng)突破至30萬億,1年半時間增長了300多倍。

隨著以DeepSeek、Ernie 為代表的 MoE 類推理模型爆火,大規(guī)模分布式推理系統(tǒng)的建設(shè)成了支持 AI 落地的挑戰(zhàn)。推理成本、推理效率、推理穩(wěn)定性,正在取代參數(shù)規(guī)模,成為決定AI商業(yè)化上限的關(guān)鍵變量。

圍繞這一新的行業(yè)挑戰(zhàn),在12月14日由百度百舸與SGLang社區(qū)聯(lián)合主辦的技術(shù)分享活動上,百度百舸將自己在生產(chǎn)系統(tǒng)上的最新實踐成果,SGLang將業(yè)界最新成果和動態(tài),做了一次系統(tǒng)性分享。

百度百舸持續(xù)開源生產(chǎn)級代碼,聯(lián)合 SGLang 社區(qū)打造先進(jìn) AI Infra

在活動開場致辭中,百度智能云AI計算首席科學(xué)家王雁鵬明確表示:百度百舸正在將生產(chǎn)級代碼持續(xù)開源到開源社區(qū)。百度在大規(guī)模生產(chǎn)環(huán)境中積累的大模型訓(xùn)推系統(tǒng)的各種能力,包括經(jīng)過大規(guī)模系統(tǒng)打磨過的高度穩(wěn)定的、高度優(yōu)化的各種核心組件,都將逐一向行業(yè)分享。

同時,王雁鵬強(qiáng)調(diào),開源并非一時的決定,而是百度堅信的技術(shù)方向和演進(jìn)路徑。未來,百度會持續(xù)聯(lián)合各個社區(qū),以開源的力量推動行業(yè)共同成長。



(百度智能云AI計算首席科學(xué)家王雁鵬)

作為大模型時代崛起的重要開源項目之一的SGLang,百度智能云10月份攜手SGLang社區(qū),將一套針對DeepSeek-V3.2推理性能優(yōu)化的 MTP(Multi-Token Prediction,多token預(yù)測)技術(shù)代碼正式開源。SGLang 社區(qū)表示這是一項巨大的貢獻(xiàn),社區(qū)實測顯示,采用這套技術(shù),DeepSeek-V3.2模型解碼吞吐量能提升超過2倍。



在王雁鵬看來,推理引擎正變得越來越重要。智能經(jīng)濟(jì)時代,推理引擎消耗的算力,將成為最核心的生產(chǎn)資料。如果推理成本做不到足夠低,身處大模型產(chǎn)業(yè)鏈上的玩家,就將失去競爭力,難以獲取Scaling的效益。

在本次 Meetup 中,百度百舸團(tuán)隊圍繞如何建設(shè)大規(guī)模分布式推理基礎(chǔ)設(shè)施、DeepSeek V3.2 推理引擎等方面展開了系統(tǒng)性分享。

百度主任架構(gòu)師田健重點介紹了百度百舸在大規(guī)模分布式推理集群基礎(chǔ)設(shè)施上的實踐。

隨著大模型到達(dá)千億、萬億規(guī)模的時代,其推理的部署也遇到了“不可能三角”的挑戰(zhàn),需要在模型規(guī)模指數(shù)級增長、部署效率與穩(wěn)定性和資源成本與彈性之間,尋求新的平衡。

百度百舸新一代大規(guī)模分布式推理基礎(chǔ)設(shè)施,以三大核心支柱破解大模型部署困局:通過自動化編排將分布式實例“原子化”,大幅簡化跨節(jié)點管理復(fù)雜度;創(chuàng)新“靜默實例”技術(shù)實現(xiàn)秒級資源激活,靈活應(yīng)對潮汐流量;依托高性能流量調(diào)度與“班車調(diào)度”算法,極致壓榨集群性能。

百度高級架構(gòu)師劉偉分享了百度百舸基于萬卡級生產(chǎn)系統(tǒng)實戰(zhàn)經(jīng)驗,面向DeepSeek V3.2在推理引擎層面做的深度優(yōu)化工作:通過輕量級CP讓長文本推理的TTFT近乎線性降低,更創(chuàng)新研發(fā)ESS系統(tǒng)破解長文本推理的顯存墻困境。

面對DeepSeek V3等MoE模型部署中FFN計算密度不足、GPU利用率低的痛點,百度高級工程師劉國維帶來了百度百舸在DeepSeek V3系列模型上的AE分離框架實戰(zhàn),展示了在復(fù)雜并行與分離架構(gòu)下,百度百舸如何在性能、穩(wěn)定性與運維復(fù)雜度之間取得工程平衡。

SGLang 社區(qū):推理框架的邊界正在被不斷拓展

來自SGLang 社區(qū)的 5 位開發(fā)者分享 了4 個業(yè)內(nèi)最新進(jìn)展,展現(xiàn)了 SGLang 社區(qū)在行業(yè)最前沿的動態(tài)。

SGLang 核心開發(fā)者張懿帶來了SGLang在Linear Model優(yōu)化與Diffusion支持上的最新進(jìn)展。

隨著長序列推理場景等的普及,傳統(tǒng)KV Cache管理方式面臨挑戰(zhàn)。SGLang 在內(nèi)存管理、投機(jī)推理適配等方面進(jìn)行了大量工程優(yōu)化,使推理框架能夠更好地適配新一代模型結(jié)構(gòu)。

在此基礎(chǔ)上,面向DeepSeek等主流模型所指向的統(tǒng)一模型技術(shù)迭代路線,SGLang也在嘗試從語言模型走向統(tǒng)一生成引擎。11月上線的SGLang Diffusion,便對外釋放了一個強(qiáng)烈信號,即SGLang的目標(biāo)并不是一個LLM引擎,而是統(tǒng)一推理執(zhí)行層。

來自SGLang Diffusionteam的范舒翼、陳茜,系統(tǒng)介紹了面向圖像與視頻生成的高性能推理引擎 SGLang Diffusion。在圖像與視頻生成場景中,SGLang Diffusion通過Pipeline組合、并行策略與Kernel復(fù)用,將Diffusion推理性能整體拉升到Diffusers的2–6倍區(qū)間,為未來DeepSeek等“理解+生成”統(tǒng)一模型的問世,預(yù)留了系統(tǒng)優(yōu)化空間。

在推理加速方向,SGLang開發(fā)者李升桂帶來了SpecForge項目,解決了投機(jī)推理在真實系統(tǒng)中落地難、穩(wěn)定性差的問題,讓這一理論上成熟的方法,真正具備工程可用性。

同時,來自SGLang RL Team成員李冀,也展示了SGLang在強(qiáng)化學(xué)習(xí)場景下的最新進(jìn)展,進(jìn)一步拓展了推理框架的適用邊界。

隨著大模型發(fā)展重心從訓(xùn)練范式加速轉(zhuǎn)向推理范式,Token消耗需求呈現(xiàn)出遠(yuǎn)超以往的增長曲線。百度將持續(xù)聯(lián)合開源社區(qū),打造行業(yè)領(lǐng)先的AI Infra,不斷逼近推理系統(tǒng)的上限,持續(xù)滿足行業(yè)對Token消耗年增百倍的訴求。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對這5種疾病有好處,建議常吃

茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對這5種疾病有好處,建議常吃

阿纂看事
2025-10-13 15:36:03
赤身被吊在房梁上,下體被插上銅棒通電,遺照卻一直被日寇供奉著

赤身被吊在房梁上,下體被插上銅棒通電,遺照卻一直被日寇供奉著

興趣知識
2025-12-03 16:21:36
多名院士呼吁:糖尿病這6種食物必須得吃,否則血糖越控越差

多名院士呼吁:糖尿病這6種食物必須得吃,否則血糖越控越差

紙上的心語
2025-12-11 21:09:06
特朗普,敢不敢動武?

特朗普,敢不敢動武?

中國新聞周刊
2025-12-19 09:24:14
2026星象加持!四大好運星座逆襲指南,事業(yè)財運全面開掛

2026星象加持!四大好運星座逆襲指南,事業(yè)財運全面開掛

朗威談星座
2025-12-20 02:48:03
如果王曼昱排名世界第一,球迷對世界排名的評價,又會改變

如果王曼昱排名世界第一,球迷對世界排名的評價,又會改變

子水體娛
2025-12-18 22:38:23
中美貿(mào)易大利好!美國或進(jìn)一步降低關(guān)稅!

中美貿(mào)易大利好!美國或進(jìn)一步降低關(guān)稅!

新浪財經(jīng)
2025-12-19 07:43:38
香港再無董建華

香港再無董建華

華人星光
2025-11-25 12:01:27
釋永信做夢也想不到,釋印樂真實人品被扒后,少林寺再迎五大變化

釋永信做夢也想不到,釋印樂真實人品被扒后,少林寺再迎五大變化

小莜讀史
2025-12-19 18:26:39
江蘇這 3個縣,被聯(lián)合國評定為 “千年古縣”,有你家鄉(xiāng)嗎?

江蘇這 3個縣,被聯(lián)合國評定為 “千年古縣”,有你家鄉(xiāng)嗎?

牛鍋巴小釩
2025-12-19 13:30:39
600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

極目新聞
2025-12-19 07:21:26
震驚!南博最大的受害者不是龐叔令后人,而是前博物館館長姚遷…

震驚!南博最大的受害者不是龐叔令后人,而是前博物館館長姚遷…

火山詩話
2025-12-19 06:05:11
上海著名百貨商場官宣改名、啟動不停業(yè)改造!屋頂觀景平臺目測要火

上海著名百貨商場官宣改名、啟動不停業(yè)改造!屋頂觀景平臺目測要火

新民晚報
2025-12-19 19:28:59
可控核聚變“八龍”全解讀:分工清晰各有絕技?。ǜ焦桑?>
    </a>
        <h3>
      <a href=普陀動物世界
2025-12-17 14:51:43
商業(yè)航天進(jìn)入井噴期!火箭、衛(wèi)星、運營產(chǎn)業(yè)鏈最強(qiáng)6巨頭名單在此

商業(yè)航天進(jìn)入井噴期!火箭、衛(wèi)星、運營產(chǎn)業(yè)鏈最強(qiáng)6巨頭名單在此

小白鴿財經(jīng)
2025-12-19 07:05:03
美國四星上將坦言:全球戰(zhàn)力最強(qiáng)的國家只有3個,其他的不值一提

美國四星上將坦言:全球戰(zhàn)力最強(qiáng)的國家只有3個,其他的不值一提

迷彩前沿
2025-11-25 12:17:57
家長用“巴掌大蛋糕”給兒子過生日,男孩表情快哭了,父母被罵慘

家長用“巴掌大蛋糕”給兒子過生日,男孩表情快哭了,父母被罵慘

妍妍教育日記
2025-12-19 19:05:24
NVIDIA RTX PRO 5000 72GB正式上市!顯存狂增50%、性能提升3.5倍

NVIDIA RTX PRO 5000 72GB正式上市!顯存狂增50%、性能提升3.5倍

快科技
2025-12-19 11:14:07
新聞聯(lián)播:胡春華最新動態(tài)!

新聞聯(lián)播:胡春華最新動態(tài)!

社評
2025-12-18 16:46:51
美國經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日報》

美國經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日報》

那些看得見的老照片
2025-12-17 17:13:44
2025-12-20 04:00:49
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10011文章數(shù) 489326關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

家居
旅游
藝術(shù)
親子
房產(chǎn)

家居要聞

高端私宅 理想隱居圣地

旅游要聞

打開深圳冬天的方式 來沙井“蠔”運當(dāng)頭

藝術(shù)要聞

諸樂三的寫意花鳥

親子要聞

寶媽必學(xué),為什么教孩子不舒服的觸摸要拒絕是錯誤的?

房產(chǎn)要聞

廣州有態(tài)度,一座國際化社區(qū)給出的城市答案

無障礙瀏覽 進(jìn)入關(guān)懷版