国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

難以置信!DeepSeek 新變體速度提升200%,企業(yè)部署成本銳減60%

0
分享至

距離DeepSeek發(fā)布其熱門開源模型 DeepSeek 的最新版本 R1-0528,才剛過去一個多月,本周,一家 24 年歷史的德國公司 TNG 技術(shù)咨詢有限公司發(fā)布了一個此類改編版本:DeepSeek-TNG R1T2 Chimera,這是其 Chimera 大型語言模型系列的最新型號。

R1T2 在效率和速度上實現(xiàn)了顯著提升,其智能基準(zhǔn)分?jǐn)?shù)達(dá)到 R1-0528 的 90% 以上,同時生成答案所需的輸出 token 數(shù)量不到 R1-0528 的 40%。

這意味著它能產(chǎn)生更簡短的回復(fù),直接轉(zhuǎn)化為更快的推理速度和更低的計算成本。在 TNG的AI 代碼共享社區(qū)上,該公司稱其 “比常規(guī) R1快約 20%,比 R1-0528快兩倍以上”。

對此,AI 開發(fā)者社區(qū)的反響極為熱烈。社區(qū)高級負(fù)責(zé)人寫道:“天?。eepSeek R1T2,比 R1-0528 快 200%,比 R1 快 20%。在 GPQA 和 AIME 24 上顯著優(yōu)于 R1,通過專家組裝法結(jié)合 DS V3、R1 和 R1-0528 構(gòu)建,且采用 MIT 許可證,可在社區(qū) 上獲取?!?/p>

這一提升得益于 TNG 的專家組裝(AoE)方法,這是一種通過選擇性合并多個預(yù)訓(xùn)練模型的內(nèi)部參數(shù)來構(gòu)建 LLM 的技術(shù)。作為原始 R1T Chimera 的后繼者,R1T2 引入了新的 “三思維”(Tri-Mind)配置,集成了三個父模型:DeepSeek-R1-0528、DeepSeek-R1 和 DeepSeek-V3-0324。其結(jié)果是一個經(jīng)過精心設(shè)計的模型,既能保持高推理能力,又能顯著降低推理成本。

而且,R1T2 的構(gòu)建無需進(jìn)一步微調(diào)或再訓(xùn)練。它繼承了 R1-0528 的推理優(yōu)勢、R1 的結(jié)構(gòu)化思維模式,以及 V3-0324 簡潔的指令導(dǎo)向特性,為企業(yè)和研究應(yīng)用提供了一個更高效且有能力的模型。

01

專家組裝(AoE)與

專家混合(MoE)的區(qū)別

專家混合(MoE)是一種架構(gòu)設(shè)計,其中不同組件根據(jù)輸入有條件地激活。在 DeepSeek-V3 或 Mixtral 等 MoE LLM 中,任何給定 token 的前向傳播過程中,僅激活模型專家層的一部分。這使得超大型模型能夠?qū)崿F(xiàn)更高的參數(shù)數(shù)量和專業(yè)化,同時保持推理成本可控,因為每個 token 僅評估網(wǎng)絡(luò)的一小部分。

專家組裝(AoE)是一種模型合并技術(shù),而非架構(gòu)。它用于通過選擇性插值多個預(yù)訓(xùn)練 MoE 模型的權(quán)重張量來創(chuàng)建新模型。AoE 中的 “專家” 指的是被合并的模型組件,通常是 MoE 層內(nèi)的路由專家張量,而非運行時動態(tài)激活的專家。

TNG 對 AoE 的實現(xiàn)主要側(cè)重于合并路由專家張量,同時通常保留來自更快模型的更高效共享層和注意力層。這種方法使生成的 Chimera 模型能夠繼承推理能力,而無需復(fù)制最強(qiáng)父模型的冗長或延遲。

02

性能與速度:基準(zhǔn)測試的實際結(jié)果

E-25 和 GPQA-Diamond 測試集衡量,R1T2 實現(xiàn)了其最智能父模型 DeepSeek-R1-0528 90% 至 92% 的推理性能。然而,與 DeepSeek-R1-0528 不同,R1T2 被設(shè)計為更加簡潔。它能以少得多的詞匯量提供同樣智能的響應(yīng)。TNG 并非關(guān)注原始處理時間或每秒 token 數(shù),而是以每個答案的輸出 token 數(shù)來衡量 “速度”,這是成本和延遲的實用代理指標(biāo)。

根據(jù) TNG 共享的基準(zhǔn)測試,R1T2 生成響應(yīng)所需的 token 數(shù)約為 R1-0528 的 40%。這意味著輸出長度減少 60%,直接縮短推理時間和計算負(fù)載,將響應(yīng)速度提升 2 倍,即 200%。與原始 DeepSeek-R1 相比,R1T2 平均也約縮短 20%,為高吞吐量或成本敏感的部署提供了顯著的效率提升。這種效率并未以智能為代價。

03

部署注意事項與可用性

R1T2 根據(jù)寬松的 MIT 許可證發(fā)布,現(xiàn)已在社區(qū)上提供,這意味著它是開源的,可用于構(gòu)建商業(yè)應(yīng)用。TNG 指出,盡管該模型非常適合一般推理任務(wù),但由于繼承自 DeepSeek-R1 的局限性,目前不建議用于需要函數(shù)調(diào)用或工具使用的用例。這些問題可能在未來的更新中解決。

對企業(yè)技術(shù)決策者的意義

對于CTO、AI 平臺所有者、工程負(fù)責(zé)人和 IT 采購團(tuán)隊而言,R1T2 帶來了切實的好處和戰(zhàn)略選擇:

更低的推理成本:每個任務(wù)的輸出 token 更少,R1T2 減少了 GPU 時間和能源消耗,直接轉(zhuǎn)化為基礎(chǔ)設(shè)施節(jié)省 —— 這在高吞吐量或?qū)崟r環(huán)境中尤為重要。

無開銷的高推理質(zhì)量:它保留了 R1-0528 等頂級模型的大部分推理能力,但沒有其冗長性。這非常適合數(shù)學(xué)、編程、邏輯等結(jié)構(gòu)化任務(wù),這些任務(wù)更偏好簡潔的答案。

開放且可修改:MIT 許可證允許完全的部署控制和自定義,支持在受監(jiān)管或空氣隔離環(huán)境中進(jìn)行私有托管、模型對齊或進(jìn)一步訓(xùn)練。

新興的模塊化:AoE 方法預(yù)示著未來模型將以模塊化方式構(gòu)建,使企業(yè)能夠通過重組現(xiàn)有模型的優(yōu)勢來組裝專用變體,而無需從頭開始再訓(xùn)練。

注意事項:依賴函數(shù)調(diào)用、工具使用或高級代理編排的企業(yè)應(yīng)注意當(dāng)前的局限性,盡管未來的 Chimera 更新可能會解決這些差距。

關(guān)于首席信息官

公眾號“首席信息官 ”由資深媒體人創(chuàng)辦,致力于用專業(yè)的文字,精準(zhǔn)的洞察,特色的服務(wù),深入的踐行服務(wù)企業(yè)數(shù)智化領(lǐng)域,為產(chǎn)業(yè)的發(fā)展點燃“微光”!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“微退休”成體制內(nèi)新趨勢:還有3-5年退休,不用硬扛到最后一刻

“微退休”成體制內(nèi)新趨勢:還有3-5年退休,不用硬扛到最后一刻

侃故事的阿慶
2026-04-08 16:43:46
晚清名妓楊翠喜真容:貌美如花,身價達(dá)12000金,李叔同因她出家

晚清名妓楊翠喜真容:貌美如花,身價達(dá)12000金,李叔同因她出家

阿器談史
2026-04-08 21:17:54
5月1日開始,高速收費正式調(diào)整!車主速看,省錢避坑全攻略

5月1日開始,高速收費正式調(diào)整!車主速看,省錢避坑全攻略

華庭講美食
2026-04-09 18:41:47
伊朗低額懸賞美上校:荒誕又羞辱

伊朗低額懸賞美上校:荒誕又羞辱

小眼睛小世界
2026-04-09 09:49:01
鄭麗文大陸行第二天:美團(tuán)王興接待,馬伯庸樊登陪同,嚴(yán)月霞保鏢

鄭麗文大陸行第二天:美團(tuán)王興接待,馬伯庸樊登陪同,嚴(yán)月霞保鏢

影像溫度
2026-04-08 22:26:47
你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
游戲結(jié)束,李嘉誠套現(xiàn)960多億,轉(zhuǎn)手增持石油,中方港口管控升級

游戲結(jié)束,李嘉誠套現(xiàn)960多億,轉(zhuǎn)手增持石油,中方港口管控升級

影孖看世界
2026-04-09 22:08:46
首冠將至,傳奇歸來!時隔25年,老牌勁旅最快周末重返英超

首冠將至,傳奇歸來!時隔25年,老牌勁旅最快周末重返英超

嗨皮看球
2026-04-09 17:36:29
梁天怎么也想不到,自己主動收的演員徒弟,如今竟在名導(dǎo)手里火了

梁天怎么也想不到,自己主動收的演員徒弟,如今竟在名導(dǎo)手里火了

以茶帶書
2026-04-09 23:14:14
410次開房記錄曝光!從臨時工“睡”到副處長,她只用了不到3年

410次開房記錄曝光!從臨時工“睡”到副處長,她只用了不到3年

愛寫的櫻桃
2026-04-06 08:05:03
女王最后的夏天:手背淤青,強(qiáng)撐完成首相任命儀式,只有女兒陪著

女王最后的夏天:手背淤青,強(qiáng)撐完成首相任命儀式,只有女兒陪著

照見古今
2026-04-09 18:19:59
簽了?;鹨矝]用!美國85名議員聯(lián)手逼宮,堅持罷免特朗普

簽了?;鹨矝]用!美國85名議員聯(lián)手逼宮,堅持罷免特朗普

滄海旅行家
2026-04-09 15:00:24
特朗普癲狂表演踐踏人類文明底線

特朗普癲狂表演踐踏人類文明底線

烽火瞭望者
2026-04-09 20:06:12
2025年地區(qū)“財富榜”:北京人均存款35.6萬,上海29萬

2025年地區(qū)“財富榜”:北京人均存款35.6萬,上海29萬

中國能源網(wǎng)
2026-03-25 14:14:03
津巴布韋明確解除鋰礦出口禁令前提條件? 中資鋰企:在談判中,頭部企業(yè)進(jìn)展會很快

津巴布韋明確解除鋰礦出口禁令前提條件? 中資鋰企:在談判中,頭部企業(yè)進(jìn)展會很快

財聯(lián)社
2026-04-09 21:37:03
多納魯馬:未向國家隊要過一分錢,參加世界杯就是我們的獎勵

多納魯馬:未向國家隊要過一分錢,參加世界杯就是我們的獎勵

懂球帝
2026-04-09 22:49:07
NBA常規(guī)賽明天4月10日焦點戰(zhàn)!湖人避免四連敗,火箭沖擊8連勝

NBA常規(guī)賽明天4月10日焦點戰(zhàn)!湖人避免四連敗,火箭沖擊8連勝

薇說體育
2026-04-09 15:54:56
太慘!25歲捕魚明星墜入冰海掙扎無果身亡,母親含淚發(fā)聲

太慘!25歲捕魚明星墜入冰海掙扎無果身亡,母親含淚發(fā)聲

動物奇奇怪怪
2026-04-07 17:02:35
帕米爾高原被我國收回,一經(jīng)勘探后悔不已:撿了芝麻,丟了西瓜?

帕米爾高原被我國收回,一經(jīng)勘探后悔不已:撿了芝麻,丟了西瓜?

史記云煙
2026-04-08 14:53:05
歐冠:齊達(dá)內(nèi)目睹皇馬輸給拜仁的反應(yīng)

歐冠:齊達(dá)內(nèi)目睹皇馬輸給拜仁的反應(yīng)

星耀國際足壇
2026-04-09 21:02:59
2026-04-10 01:23:00
首席信息官 incentive-icons
首席信息官
以數(shù)字化和商業(yè)創(chuàng)新為視角
508文章數(shù) 130關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

媒體:"渾身是血"的美軍上校藏身山縫 15分鐘內(nèi)被轉(zhuǎn)移

頭條要聞

媒體:"渾身是血"的美軍上校藏身山縫 15分鐘內(nèi)被轉(zhuǎn)移

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財經(jīng)要聞

停火又懸了,最糟糕的情況要來了?

汽車要聞

文飛掌舵,給神行者帶來了什么?

態(tài)度原創(chuàng)

手機(jī)
本地
親子
時尚
公開課

手機(jī)要聞

榮耀600系列再次曝光:AI兩億主攝+AI按鍵,電池超大!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

親子要聞

白血病的雷,早在胎兒時期就已埋下,但未必會炸

越來越流行的松弛感穿搭,照著穿就很好看

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版