国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

比現(xiàn)有框架快22倍,浙大開源EasySteer:LLM Steering統(tǒng)一框架

0
分享至



大語言模型 (LLM) 在部署后如何靈活地控制其行為,一直是業(yè)界面臨的核心挑戰(zhàn)。微調(diào)代價(jià)高昂且存在災(zāi)難性遺忘風(fēng)險(xiǎn),提示工程又只能提供表層的控制,缺乏行為保證。LLM Steering 技術(shù)通過在推理階段對(duì)模型隱藏狀態(tài)進(jìn)行定向操作,在不修改模型權(quán)重的情況下實(shí)現(xiàn)精準(zhǔn)行為控制,為這一問題提供了一條輕量且可行的路徑。

近年來,社區(qū)已涌現(xiàn)出 repeng、pyreft、EasyEdit2 等代表性框架,分別在分析式向量提取、學(xué)習(xí)式表征微調(diào)、綜合編輯等方向做出了重要探索。不過,隨著 Steering 技術(shù)從單一實(shí)驗(yàn)場景走向多目標(biāo)、大規(guī)模的生產(chǎn)部署,現(xiàn)有框架在推理效率、控制粒度和算法擴(kuò)展性上仍有進(jìn)一步提升的空間。

在此背景下,浙江大學(xué)研究團(tuán)隊(duì)提出了EasySteer——一個(gè)基于 vLLM 構(gòu)建的高性能、可擴(kuò)展 LLM Steering 統(tǒng)一框架。該框架通過與 vLLM 推理引擎的深度集成,相比現(xiàn)有 Steering 框架實(shí)現(xiàn)了 10.8-22.3 倍的推理加速,同時(shí)提供更細(xì)粒度的干預(yù)控制,并為八大應(yīng)用場景提供了預(yù)計(jì)算 Steering 向量與完整復(fù)現(xiàn)示例,方便研究者快速上手和對(duì)照復(fù)現(xiàn)。



  • 論文地址:https://arxiv.org/abs/2509.25175
  • 開源代碼:https://github.com/ZJU-REAL/EasySteer
  • 演示視頻:https://www.youtube.com/watch?v=3rRGzZmhrXg
  • 簡易 demo:https://huggingface.co/spaces/zjuxhl/EasySteer

設(shè)計(jì)動(dòng)機(jī):從研究原型到生產(chǎn)部署的新需求

隨著 Steering 技術(shù)在安全控制、推理優(yōu)化、幻覺緩解等方向不斷取得進(jìn)展,實(shí)際應(yīng)用中對(duì)框架提出了更高的要求。研究者總結(jié)了三個(gè)關(guān)鍵方向:


高吞吐推理:一方面,Steering 研究中大量的評(píng)測、消融實(shí)驗(yàn)需要反復(fù)推理,低效的推理后端會(huì)嚴(yán)重拖慢科研迭代速度;另一方面,生產(chǎn)環(huán)境通常需要處理大規(guī)模并發(fā)請(qǐng)求,只有具備足夠的吞吐能力,Steering 技術(shù)才具備實(shí)際部署的可能性。利用 vLLM 等專用推理引擎的連續(xù)批處理能力,可以同時(shí)在科研效率和生產(chǎn)落地兩個(gè)層面帶來實(shí)質(zhì)性提升。


精細(xì)粒度控制:現(xiàn)有框架大多支持層級(jí)和位置級(jí)別的干預(yù),但在更細(xì)粒度的場景下仍有局限。例如,token 級(jí)別的條件干預(yù)(如僅在特定 token 出現(xiàn)時(shí)觸發(fā))、多向量協(xié)同等能力,對(duì)于復(fù)雜場景(如推理步邊界的選擇性干預(yù))至關(guān)重要。


便捷的算法集成:Steering 方法迭代迅速,框架需要提供低門檻的插件機(jī)制,方便研究者快速實(shí)現(xiàn)和對(duì)比新算法。



框架設(shè)計(jì)

EasySteer 由四個(gè)模塊組成,覆蓋從向量生成到應(yīng)用部署的完整流程:




Steering 向量生成模塊:同時(shí)支持分析式(CAA、PCA、線性探針、SAE 等)和學(xué)習(xí)式(LoReFT、LM-Steer 等)兩大類方法,通過統(tǒng)一的隱藏狀態(tài)捕獲接口,研究者可以在同一框架內(nèi)便捷地生成和對(duì)比不同類型的 Steering 向量。

Steering 向量應(yīng)用模塊:是 EasySteer 的核心,主要解決三個(gè)問題:通過非侵入式的動(dòng)態(tài)模型包裝器兼容多種 LLM 架構(gòu);通過解耦的算法接口支持自定義 Steering 算法的即插即用;通過精細(xì)的參數(shù)控制支持條件干預(yù)、多向量協(xié)同等高級(jí)策略。


交互式演示系統(tǒng):提供基于 Web 的界面,集成推理、多輪對(duì)話、向量提取和訓(xùn)練功能,支持基線與 Steering 輸出的并排對(duì)比。


資源庫:提供覆蓋安全、推理、知識(shí)、真實(shí)性、語言、情感、人格、風(fēng)格八大場景的預(yù)計(jì)算 Steering 向量,每個(gè)場景都附帶從數(shù)據(jù)準(zhǔn)備到應(yīng)用的完整復(fù)現(xiàn)流程。



性能評(píng)估

框架推理效率

研究者在 NVIDIA A6000 GPU (48GB) 上,使用 DeepSeek-R1-Distill-Qwen-1.5B 進(jìn)行了系統(tǒng)性基準(zhǔn)測試。



在 Steering 開銷方面,EasySteer 在全層干預(yù)的批量推理場景下,短序列吞吐量為 8991 tokens/s,長序列為 7074 tokens/s,相比無 Steering 基線(10248 / 7563 tokens/s)分別下降約 12% 和 6%。即使同時(shí)應(yīng)用三個(gè) Steering 向量到所有層,長序列吞吐仍保持在 6854 tokens/s,為基線的約 91%。整體來看,Steering 操作帶來的額外開銷較為可控。

在框架對(duì)比方面,以長序列批量推理為例,EasySteer 的吞吐量(7074 tokens/s)約為 pyreft(653 tokens/s)的 10.8 倍、repeng(317 tokens/s)的 22.3 倍。

框架有效性驗(yàn)證


過度思考緩解:研究者參照 SEAL 方法,從 1000 個(gè) MATH 訓(xùn)練樣本中提取三種行為向量(執(zhí)行、反思、轉(zhuǎn)換),在推理步邊界處增強(qiáng)執(zhí)行向量、抑制反思和轉(zhuǎn)換向量。在 DeepSeek-R1-Distill-Qwen-1.5B 上,SEAL Steering 將 GSM8K 準(zhǔn)確率從 79.6% 提升至 82.3%,同時(shí) token 使用量減少約 40%。MATH500 上準(zhǔn)確率從 70.8% 提升至 78.4%。7B 模型同樣展現(xiàn)了效率收益,GSM8K 和 MATH500 分別減少了 13.3% 和 16.8% 的 token 消耗。


幻覺緩解:在 TruthfulQA 數(shù)據(jù)集上進(jìn)行兩折交叉驗(yàn)證,分析式方法和學(xué)習(xí)式方法均取得了不同程度的提升。其中,PCA 方法在 Llama-3.1-8B-Instruct 上將多選準(zhǔn)確率從 50.55% 提升至 62.67%;LoReFT 在 Qwen2.5-1.5B-Instruct 上將開放式問答準(zhǔn)確率從 27.17% 提升至 33.41%。分析式方法在提升準(zhǔn)確率的同時(shí)通常能較好地保持語言流暢度,學(xué)習(xí)式方法則在準(zhǔn)確率和流暢度之間存在一定的權(quán)衡。


定性效果:EasySteer 在八大場景中均展現(xiàn)了有效的行為控制能力。例如,安全場景下可將模型從生成不當(dāng)內(nèi)容引導(dǎo)為拒絕回答;推理場景下可將簡單算術(shù)題的冗長推演簡化為直接輸出結(jié)果;語言場景下可將回復(fù)從英文切換為中文輸出。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太可恨!飛機(jī)一落地上海,女孩立馬報(bào)案!更多年輕受害人浮出水面……

太可恨!飛機(jī)一落地上海,女孩立馬報(bào)案!更多年輕受害人浮出水面……

環(huán)球網(wǎng)資訊
2026-03-26 21:48:04
調(diào)查發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過不了半個(gè)月,會(huì)迎來4大改善

調(diào)查發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過不了半個(gè)月,會(huì)迎來4大改善

39健康網(wǎng)
2026-03-02 12:30:48
連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對(duì)話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設(shè)置反轉(zhuǎn)劇情,沒想到會(huì)這么火

連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對(duì)話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設(shè)置反轉(zhuǎn)劇情,沒想到會(huì)這么火

極目新聞
2026-03-25 19:37:57
驚呆了!網(wǎng)傳某婦產(chǎn)醫(yī)院一少婦哭求醫(yī)生,改她兒子的血型鑒定書…

驚呆了!網(wǎng)傳某婦產(chǎn)醫(yī)院一少婦哭求醫(yī)生,改她兒子的血型鑒定書…

火山詩話
2026-03-26 11:40:00
出大事了,特朗普通報(bào)全球,美頭號(hào)敵人已亮相,擔(dān)心的事即將發(fā)生

出大事了,特朗普通報(bào)全球,美頭號(hào)敵人已亮相,擔(dān)心的事即將發(fā)生

策略述
2026-03-26 13:45:17
日均接診1.5萬人次、手術(shù)500臺(tái),廣東這家華南醫(yī)療航母火遍全省

日均接診1.5萬人次、手術(shù)500臺(tái),廣東這家華南醫(yī)療航母火遍全省

健身狂人
2026-03-27 00:11:10
即將淪為“窮人房”的5種房子,不好住不好賣,聰明人已逐漸轉(zhuǎn)手

即將淪為“窮人房”的5種房子,不好住不好賣,聰明人已逐漸轉(zhuǎn)手

貓叔東山再起
2026-03-26 09:10:08
勇士雙殺籃網(wǎng)鎖定附加賽,桑托斯生涯之夜,庫明加換波神真賺了?

勇士雙殺籃網(wǎng)鎖定附加賽,桑托斯生涯之夜,庫明加換波神真賺了?

司峰阿道
2026-03-26 14:45:09
中國軍事專家送日本3句話,太絕了,真不是嚇唬他們

中國軍事專家送日本3句話,太絕了,真不是嚇唬他們

安安說
2026-03-26 11:21:19
14.99萬!“史上最便宜”特斯拉來了

14.99萬!“史上最便宜”特斯拉來了

首席品牌觀察
2026-03-24 16:18:39
中國公布喜訊

中國公布喜訊

楊興文
2026-03-26 21:08:26
“面相騙不了人”這句話,在他身上,以一種讓人揪心的方式被驗(yàn)證

“面相騙不了人”這句話,在他身上,以一種讓人揪心的方式被驗(yàn)證

動(dòng)物奇奇怪怪
2026-03-26 01:52:14
中土敲定合作,一根管道連通兩國,這是對(duì)俄羅斯的警告?

中土敲定合作,一根管道連通兩國,這是對(duì)俄羅斯的警告?

近史博覽
2026-03-27 02:18:27
俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動(dòng)?

俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動(dòng)?

項(xiàng)鵬飛
2026-03-24 20:28:43
毛新宇參觀祖宅時(shí)突然發(fā)現(xiàn)家譜記載:原來毛主席是毛太華第20代孫

毛新宇參觀祖宅時(shí)突然發(fā)現(xiàn)家譜記載:原來毛主席是毛太華第20代孫

老杉說歷史
2026-03-14 20:54:20
奴顏媚骨具象化,高市早苗三十年前照片被扒出,原來她從未變過!

奴顏媚骨具象化,高市早苗三十年前照片被扒出,原來她從未變過!

社會(huì)醬
2026-03-23 17:34:19
強(qiáng)闖中國駐日使館不法之徒照片曝光,3月15日剛晉升三等陸尉

強(qiáng)闖中國駐日使館不法之徒照片曝光,3月15日剛晉升三等陸尉

澎湃新聞
2026-03-26 14:34:04
300元搶紅薯葉,國內(nèi)僅2元一斤!美國高校:抑制96%肺部異變

300元搶紅薯葉,國內(nèi)僅2元一斤!美國高校:抑制96%肺部異變

果殼
2026-03-26 09:29:42
女同主播出軌大哥 被"正宮"直播對(duì)質(zhì)!真實(shí)長相曝光

女同主播出軌大哥 被"正宮"直播對(duì)質(zhì)!真實(shí)長相曝光

游民星空
2026-03-25 20:08:13
浙江男子馬達(dá)加斯加開“手機(jī)網(wǎng)吧”爆火:全天候營業(yè),收費(fèi)1.5元/小時(shí),每天約200人次來玩

浙江男子馬達(dá)加斯加開“手機(jī)網(wǎng)吧”爆火:全天候營業(yè),收費(fèi)1.5元/小時(shí),每天約200人次來玩

極目新聞
2026-03-26 19:21:35
2026-03-27 03:27:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

旅游
健康
親子
數(shù)碼
公開課

旅游要聞

河南開封萬歲山武俠城,游客買300元門票:給妻子拍照被保安阻攔

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務(wù)“健康關(guān)”如何保障?

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版