国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)模型崛起!DeepSeek憑借創(chuàng)新架構(gòu)與工具思維,引領(lǐng)行業(yè)新潮流

0
分享至

1

大家好,這里是小銳的科技觀察專欄。今天我們要剖析的是2025年底大模型賽道上演的一場驚天逆轉(zhuǎn)——當(dāng)所有人都以為閉源時代將徹底封王之際,Google Gemini 3 Pro強勢登場,掀起“開源已至天花板”的輿論風(fēng)暴,仿佛開源陣營只能淪為技術(shù)演進(jìn)中的配角。

2

就在這一片唱衰聲中,DeepSeek于12月1日突然亮劍:其V3.2版本推理能力直逼GPT-5水準(zhǔn),而Speciale分支更是在國際數(shù)學(xué)奧林匹克競賽中斬獲金牌,得分高達(dá)35分。令人震驚的是,其所依賴的算力資源遠(yuǎn)遜于科技巨頭,這場逆襲究竟是偶然爆發(fā),還是揭示了開源突破閉源壁壘的深層密碼?



3

從“極限論”到“并跑證明”

4

回顧2025年的大模型格局,堪稱閉源體系的巔峰之年。隨著Gemini 3 Pro橫空出世,在多項權(quán)威基準(zhǔn)測試中全面壓制開源對手,原本關(guān)于“Scaling Law是否觸頂”的學(xué)術(shù)探討,迅速演變?yōu)樾袠I(yè)對“開源生存空間”的集體憂慮。

5

當(dāng)時近三成研究機構(gòu)對開源前景表示悲觀,有觀點甚至斷言:“開源只能承接閉源不愿深耕的邊緣場景?!闭窃谶@種壓抑氛圍下,DeepSeek的發(fā)布如同一道閃電劃破陰霾,重新點燃了整個生態(tài)的信心。



6

發(fā)布當(dāng)日,DeepSeek一口氣推出兩款核心模型:V3.2在復(fù)雜推理任務(wù)中與GPT-5比肩,雖稍弱于Gemini 3 Pro,但已穩(wěn)超Kimi K2 Thinking,創(chuàng)下國產(chǎn)開源模型的新高紀(jì)錄;

7

而Speciale則在數(shù)學(xué)證明、邏輯推導(dǎo)及多輪工具協(xié)同方面表現(xiàn)驚艷,IMO測試中以35分摘得金牌,這組硬核數(shù)據(jù)直接擊碎了“開源已達(dá)性能天花板”的迷思。



8

在算力投入明顯不占優(yōu)勢的前提下,竟能與頂級閉源模型同臺競技,意義遠(yuǎn)超單一性能突破。更重要的是,它向世界宣告:開源并非注定追隨,而是具備獨立進(jìn)化的可能性。

9

過去普遍認(rèn)為,開源唯有通過復(fù)制閉源路徑才能追趕,但DeepSeek用實證說明:無需盲目堆疊參數(shù)和計算資源,也能實現(xiàn)跨越式創(chuàng)新。而這背后所蘊藏的,正是打破閉源壟斷的關(guān)鍵鑰匙。



10

架構(gòu)革新讓算力“花在刀刃上”

11

DeepSeek之所以能夠逆襲,根本原因不在規(guī)模擴張,而在算力使用效率的革命性提升,這一點在其自研的稀疏注意力機制DSA(Dynamic Sparse Attention)中體現(xiàn)得淋漓盡致。

12

行業(yè)熟知的事實是,傳統(tǒng)Transformer架構(gòu)存在一個致命瓶頸:注意力運算復(fù)雜度隨序列長度呈平方增長,處理長文本時極易引發(fā)算力崩塌,尤其是面對128K級別的上下文,成本急劇飆升。



13

DeepSeek的DSA架構(gòu)則引入了一種“智能篩選引擎”——即閃電索引器。該模塊采用FP8低精度運行多個輕量級索引頭,快速識別輸入中最關(guān)鍵的token關(guān)聯(lián)對,僅對這些核心片段進(jìn)行高精度精算,其余部分則跳過冗余計算。

14

經(jīng)此優(yōu)化,注意力機制的計算負(fù)擔(dān)由O(n2)降至接近線性O(shè)(n log n),即便處理超長文檔,系統(tǒng)負(fù)載依然保持平穩(wěn),極大釋放了長上下文的應(yīng)用潛力。



15

更為巧妙的是,DeepSeek并未貿(mào)然切換底層結(jié)構(gòu),而是設(shè)計了“密集預(yù)熱—稀疏過渡”雙階段訓(xùn)練流程:初期保留完整注意力模式,專注于訓(xùn)練索引器模擬原始行為;

16

待收斂后再逐步啟用稀疏連接,實現(xiàn)架構(gòu)遷移的無縫銜接。這種漸進(jìn)式策略既保障了模型穩(wěn)定性,又顯著提升了推理效率,在Fiction.liveBench等長文本測評中,V3.2的信息召回率與上下文連貫性均有明顯躍升。



17

除了架構(gòu)層面的突破,任務(wù)執(zhí)行邏輯的重構(gòu)也帶來了能效倍增。以往模型調(diào)用外部工具遵循“思考→調(diào)用→終止”的單向鏈條,每次交互都需重啟推理過程,造成大量token浪費。

18

DeepSeek提出的“Thinking in Tool-Use”新范式,則構(gòu)建起“思考→調(diào)用→再思考→再調(diào)用”的閉環(huán)流程,將歷史推理軌跡持續(xù)保留在上下文中,工具返回新信息后可直接延續(xù)原有思維路徑。



19

實測數(shù)據(jù)顯示,企業(yè)利用V3.2批量處理工單時,重復(fù)推理產(chǎn)生的token消耗下降約30%,因狀態(tài)丟失導(dǎo)致的邏輯中斷頻率也大幅降低。

20

正是這種“架構(gòu)+邏輯”的雙重升級,徹底重塑了大模型的競爭維度:過去拼的是“誰更大”,如今比的是“誰更高效”與“誰更會思考”。DeepSeek已然成為這場效率革命的領(lǐng)航者。



21

Agent成為能力躍遷的核心引擎

22

如果說DSA架構(gòu)是支撐性能飛躍的“硬件底座”,那么將Agent從輔助功能升維為核心執(zhí)行中樞,則是DeepSeek最具戰(zhàn)略遠(yuǎn)見的布局,這一步不僅契合市場需求,更精準(zhǔn)踩中了開源落地的關(guān)鍵節(jié)點。

23

許多人尚未察覺,2025年的產(chǎn)業(yè)風(fēng)向已經(jīng)發(fā)生根本轉(zhuǎn)變:企業(yè)不再為“能聊天”的對話機器人買單,轉(zhuǎn)而青睞那些真正“能辦事”的智能體。



24

自動生成報告、批量修復(fù)代碼缺陷、自動化處理客戶服務(wù)請求——這些具備實際執(zhí)行力的功能,正成為AI商業(yè)變現(xiàn)的核心支柱。相關(guān)統(tǒng)計顯示,當(dāng)年企業(yè)對Agent類產(chǎn)品的付費意愿同比增長達(dá)120%,遠(yuǎn)遠(yuǎn)甩開傳統(tǒng)對話模型的增長曲線。

25

DeepSeek早已洞察趨勢,在V3.2的研發(fā)中傾注大量資源打造Agent能力體系:構(gòu)建了1800個多樣化智能體仿真環(huán)境,生成85000條高難度任務(wù)指令,且全部由自動化環(huán)境生成器與評分系統(tǒng)完成標(biāo)注,再結(jié)合強化學(xué)習(xí)形成反饋閉環(huán)。



26

相較于依賴人工對話語料的傳統(tǒng)訓(xùn)練方式,這套方法更能錘煉真實場景下的任務(wù)完成能力,最終使Agent成功率相較同類開源模型高出25%以上。

27

為了進(jìn)一步提升穩(wěn)定性,團隊自主研發(fā)GRPO(Generalized Reward Policy Optimization)強化學(xué)習(xí)算法,將推理一致性、語言準(zhǔn)確性和任務(wù)達(dá)成度統(tǒng)一量化為綜合獎勵信號,有效防止訓(xùn)練過程中出現(xiàn)能力退化或邏輯漂移。



28

另一大關(guān)鍵設(shè)計是上下文狀態(tài)持久化機制:只有當(dāng)用戶發(fā)送全新請求時才會重置思維鏈路,而在工具調(diào)用過程中,所有中間推理結(jié)果均被完整保留。例如在跨部門財務(wù)報表整合任務(wù)中,模型無需反復(fù)重建分析框架,效率自然大幅提升。

29

從系統(tǒng)架構(gòu)來看,DeepSeek已將Agent視為“模型操作系統(tǒng)”的核心組件:主模型作為內(nèi)核,Agent承擔(dān)進(jìn)程調(diào)度角色,工具則是可插拔的功能模塊。誰能率先確立Agent的技術(shù)標(biāo)準(zhǔn),誰就有可能掌握下一代AI平臺的話語權(quán)。這一戰(zhàn)略布局的價值,遠(yuǎn)超短期性能指標(biāo)的提升。



30

后訓(xùn)練讓開源“以弱勝強”

31

當(dāng)然,DeepSeek并未回避自身短板:V3.2在常識覆蓋廣度上仍不及最新閉源模型,Speciale版本因推理深度過高導(dǎo)致token開銷過大,難以普及至日常應(yīng)用場景。

32

但它所提供的應(yīng)對方案,恰恰體現(xiàn)了開源陣營“以巧破力”的智慧路徑:既然無法在資源上抗衡,那就把訓(xùn)練做得更深、更精、更聚焦。這套被稱為“后訓(xùn)練三件套”的方法論,堪稱開源提效的教科書級實踐。



33

第一式為專家蒸餾法:針對V3.2定制開發(fā)數(shù)學(xué)、編程、邏輯推理等六大領(lǐng)域?qū)佟皩<夷P汀?,每個子模型都在特定任務(wù)上訓(xùn)練至極致水平,隨后將其輸出的高質(zhì)量推理軌跡反哺主模型。

34

這種做法既規(guī)避了多任務(wù)混合訓(xùn)練帶來的能力稀釋問題,又通過共享隱層表征維持了跨領(lǐng)域的知識遷移能力,效果遠(yuǎn)優(yōu)于通用語料混訓(xùn)。



35

第二式為多軌強化學(xué)習(xí):將相當(dāng)于預(yù)訓(xùn)練10%的算力投入到后訓(xùn)練階段,這在開源項目中極為罕見。整個過程無需人工干預(yù),依靠任務(wù)環(huán)境自動反饋打分,形成“設(shè)定目標(biāo)→執(zhí)行→評估→優(yōu)化”的自主進(jìn)化循環(huán)。

36

這類基于結(jié)構(gòu)化任務(wù)的訓(xùn)練樣本稀缺且實用性強,所培養(yǎng)出的能力更具實戰(zhàn)價值,遠(yuǎn)非閑聊式對話所能比擬。



37

第三式為工具與思維鏈深度融合:為解決模型“不懂何時調(diào)用工具”的難題,DeepSeek設(shè)計了冷啟動提示模板,在初始推理流中嵌入典型工具使用案例,引導(dǎo)模型逐步習(xí)得“邊思考邊調(diào)用”的習(xí)慣。

38

再配合“工具調(diào)用不重置狀態(tài)”的機制設(shè)計,避免每次交互都從零開始,實測中token冗余率下降超過40%。這些看似細(xì)微的工程調(diào)整,實則共同指向一個終極目標(biāo):最大化單位token的智能產(chǎn)出密度,將有限資源集中于最關(guān)鍵的認(rèn)知環(huán)節(jié)。



39

歸根結(jié)底,Gemini 3 Pro代表的是“更大、更快、更強”的規(guī)模驅(qū)動路線,而DeepSeek開辟的是一條“更輕、更穩(wěn)、更聰明”的效率優(yōu)先路徑。

40

2025年末的這場技術(shù)反轉(zhuǎn)充分證明:開源模型不必在資源消耗上與閉源硬碰硬,只要在架構(gòu)設(shè)計、戰(zhàn)略定位和訓(xùn)練工藝上持續(xù)深耕,完全有能力撕裂封閉系統(tǒng)的護(hù)城河。對于整個AI生態(tài)而言,這種“以智取勝”的發(fā)展模式,或許才是真正可持續(xù)的未來方向。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
冬至前夜探訪成都“羊肉湯一條街”:生意不如往年火爆 有商家表示“不漲價”

冬至前夜探訪成都“羊肉湯一條街”:生意不如往年火爆 有商家表示“不漲價”

封面新聞
2025-12-21 10:33:14
泰國牽頭成立反電詐國家聯(lián)盟,近60國簽署,中國柬埔寨缺席

泰國牽頭成立反電詐國家聯(lián)盟,近60國簽署,中國柬埔寨缺席

環(huán)球熱點快評
2025-12-21 07:57:38
迪麗熱巴“天使蹲”火出圈,顏值驚艷全網(wǎng),醫(yī)生:無基礎(chǔ)者慎入

迪麗熱巴“天使蹲”火出圈,顏值驚艷全網(wǎng),醫(yī)生:無基礎(chǔ)者慎入

悠悠說世界
2025-12-21 08:34:39
山東艦出海干了件大事,日本自衛(wèi)隊的真實水平,被解放軍試出來了

山東艦出海干了件大事,日本自衛(wèi)隊的真實水平,被解放軍試出來了

空天力量
2025-12-20 20:28:35
兩岸好消息:“承認(rèn)”共屬中國!臺當(dāng)局終于做對1次,熟悉統(tǒng)一

兩岸好消息:“承認(rèn)”共屬中國!臺當(dāng)局終于做對1次,熟悉統(tǒng)一

愛吃醋的貓咪
2025-12-20 21:11:30
商戰(zhàn)小說作家林健鋒逝世,享年54歲

商戰(zhàn)小說作家林健鋒逝世,享年54歲

澎湃新聞
2025-12-21 11:56:27
杜江激動壞了!霍思燕帶狗參加國際比賽,拿下冠軍!唯一的中國隊

杜江激動壞了!霍思燕帶狗參加國際比賽,拿下冠軍!唯一的中國隊

老琴才是我的外號
2025-12-21 08:02:51
周大福今年第三次調(diào)價,有人搶“末班車”入手金飾,一晚省下5萬元

周大福今年第三次調(diào)價,有人搶“末班車”入手金飾,一晚省下5萬元

極目新聞
2025-12-20 21:57:34
震驚!呂梁博物館征集文物公告,評論區(qū)遭網(wǎng)友“慰問”,被迫刪除

震驚!呂梁博物館征集文物公告,評論區(qū)遭網(wǎng)友“慰問”,被迫刪除

火山詩話
2025-12-21 11:17:28
北京一副局長騎電動車送外賣,“原以為騎手最關(guān)心社保政策,沒想到他們張口就是‘別罰我款’”

北京一副局長騎電動車送外賣,“原以為騎手最關(guān)心社保政策,沒想到他們張口就是‘別罰我款’”

第一財經(jīng)資訊
2025-12-21 08:55:57
除了戰(zhàn)敗認(rèn)輸,已經(jīng)無路可走?洪森軍隊遭重創(chuàng):柬埔寨或爆發(fā)內(nèi)亂

除了戰(zhàn)敗認(rèn)輸,已經(jīng)無路可走?洪森軍隊遭重創(chuàng):柬埔寨或爆發(fā)內(nèi)亂

策前論
2025-12-20 23:12:53
這次,美國徹底把我們打醒了!

這次,美國徹底把我們打醒了!

戎評
2025-12-20 14:02:05
臉都不要了,但還是低估了他們的無恥

臉都不要了,但還是低估了他們的無恥

胖胖說他不胖
2025-12-21 11:00:20
上海這里已23個年頭!剛上市已售罄,有人一口氣買下20萬,近期熱火朝天

上海這里已23個年頭!剛上市已售罄,有人一口氣買下20萬,近期熱火朝天

新民晚報
2025-12-21 12:33:31
17場0球 觀眾狂噓!皇馬巨星心態(tài)炸了:賽后5分鐘耍脾氣

17場0球 觀眾狂噓!皇馬巨星心態(tài)炸了:賽后5分鐘耍脾氣

葉青足球世界
2025-12-21 09:00:01
普京戀愛了!網(wǎng)傳普京女友是她——被譽為“俄羅斯最柔軟的女人”

普京戀愛了!網(wǎng)傳普京女友是她——被譽為“俄羅斯最柔軟的女人”

觸摸史跡
2025-12-20 20:05:30
深圳“多管局局長”,什么來頭?

深圳“多管局局長”,什么來頭?

中國新聞周刊
2025-12-20 12:50:51
不打了!突發(fā)嚴(yán)重扭傷!這可是快船的首發(fā)核心

不打了!突發(fā)嚴(yán)重扭傷!這可是快船的首發(fā)核心

籃球?qū)崙?zhàn)寶典
2025-12-21 15:07:13
考古最新證實:阿房宮既沒建好也沒被火燒,杜牧《阿房宮賦》所描述的阿房宮景象非寫實之作

考古最新證實:阿房宮既沒建好也沒被火燒,杜牧《阿房宮賦》所描述的阿房宮景象非寫實之作

大象新聞
2025-12-21 10:49:06
甘肅一轎車高速狂飆近500公里無法減速,駕駛問題還是車輛問題?網(wǎng)友吵翻了

甘肅一轎車高速狂飆近500公里無法減速,駕駛問題還是車輛問題?網(wǎng)友吵翻了

紅星新聞
2025-12-20 20:12:39
2025-12-21 15:16:49
大魚簡科 incentive-icons
大魚簡科
那些看向大海的人,終會成為大海。
3617文章數(shù) 280關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

被欠錢球迷去世5天后 前國腳戴琳還清欠款多給了5000

頭條要聞

被欠錢球迷去世5天后 前國腳戴琳還清欠款多給了5000

體育要聞

送快船西部墊底!鵜鶘大勝步行者獲4連勝

娛樂要聞

鹿晗關(guān)曉彤戀愛期間毫不避諱?

財經(jīng)要聞

老房子“強制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

房產(chǎn)
本地
數(shù)碼
時尚
公開課

房產(chǎn)要聞

中交·藍(lán)色港灣一周年暨藍(lán)調(diào)生活沙龍圓滿舉行

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

數(shù)碼要聞

華為MateBook Fold折疊電腦獲HarmonyOS 6.0.0.120 SP1升級

中年女人,冬天這么穿羽絨服、大衣,優(yōu)雅都藏在這3個細(xì)節(jié)里

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版