国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

2025,國(guó)產(chǎn)推理大模型的“五軍之戰(zhàn)”?

0
分享至

如果AI停留在模型層,那它只是一個(gè)工具,只有在AI真正落地,在不同場(chǎng)景的行業(yè)生根發(fā)芽,具備特定行業(yè)特定問(wèn)題的解決方案,且國(guó)產(chǎn)自主可控,整個(gè)中國(guó)的AI行業(yè)才有繼續(xù)向前的動(dòng)力。

自年初DeepSeek橫空出世,無(wú)論是國(guó)外的OpenAI,國(guó)內(nèi)的新銳“六小虎”到老牌大廠,都在加速布局推理大模型的研發(fā)與應(yīng)用。

無(wú)論是今年“新上牌桌”的DeepSeek,后來(lái)居上的字節(jié)豆包,還是國(guó)產(chǎn)路線自主可控的科大訊飛,專利數(shù)量一騎絕塵的阿里通義,加上擁有國(guó)內(nèi)最大潛在用戶群體,摸著DeepSeek過(guò)河的騰訊混元,一個(gè)季度過(guò)去,各家紛紛迭代了最新的推理大模型。起碼在國(guó)產(chǎn)推理大模型領(lǐng)域,已經(jīng)形成了“五軍之戰(zhàn)”的競(jìng)爭(zhēng)態(tài)勢(shì)。

相較傳統(tǒng)的基礎(chǔ)大模型,推理大模型通過(guò)海量多模態(tài)數(shù)據(jù)的強(qiáng)化訓(xùn)練,不僅顯著提升了跨領(lǐng)域知識(shí)遷移能力,更在復(fù)雜場(chǎng)景下的邏輯推理和問(wèn)題解決層面取得突破。

其技術(shù)升級(jí)方向,已從單純的語(yǔ)言處理轉(zhuǎn)向STEM領(lǐng)域的深度滲透——在科研數(shù)據(jù)處理、工程設(shè)計(jì)優(yōu)化、數(shù)學(xué)建模等專業(yè)場(chǎng)景中,推理模型正在不斷替代傳統(tǒng)分析工具,甚至在醫(yī)療診斷、金融風(fēng)控等垂直領(lǐng)域中,不斷展現(xiàn)令人驚艷的潛力。

依托各自的優(yōu)勢(shì)領(lǐng)域,各家也正在重構(gòu)屬于自己的AI技術(shù)生態(tài):以DeepSeek為代表的創(chuàng)業(yè)公司聚焦STEM領(lǐng)域的垂直突破,通過(guò)打造科研輔助平臺(tái)積累技術(shù)勢(shì)能;老牌巨頭如阿里云、騰訊云則依托云計(jì)算基礎(chǔ)設(shè)施,推動(dòng)推理模型向產(chǎn)業(yè)端的規(guī)模化落地,科大訊飛則在不斷提升模型性能,比肩國(guó)際一線水平的同時(shí),尋求底層算力的國(guó)產(chǎn)化替代,以求在不斷激烈的國(guó)內(nèi)外競(jìng)爭(zhēng)中,保持產(chǎn)品和技術(shù)的自主可控。

對(duì)各路大模型廠商而言,推理大模型,無(wú)疑是一把通往AI時(shí)代的鑰匙和機(jī)遇。無(wú)論是專業(yè)工具型應(yīng)用,還是面向C端消費(fèi)者的App,科技廠商之間的生態(tài)位爭(zhēng)奪日趨白熱化——他們心中都很明白,誰(shuí)能跑出AI時(shí)代第一個(gè)超級(jí)應(yīng)用,誰(shuí)就能成為AI時(shí)代的“超級(jí)大廠”。

01 國(guó)產(chǎn)推理大模型的“涌現(xiàn)時(shí)刻”

在DeepSeek橫空出世之前,OpenAI等一眾歐美廠商,試圖用高成本、高算力、高參數(shù)的“三高策略”,成為AI時(shí)代的壟斷者,進(jìn)而收割全世界。大大小小的國(guó)產(chǎn)廠商,不管技術(shù)實(shí)力高低,背靠資源多少,只要入局AI大模型,無(wú)一例外都要走上這條“力大磚飛”的技術(shù)路徑。

春節(jié)前后推出的DeepSeek,則用更低的效能標(biāo)準(zhǔn),比肩頭部的模型性能告訴行業(yè),訓(xùn)練一個(gè)推理大模型“并沒(méi)有那么貴”。

從整體參數(shù)上看,DeepSeek的參數(shù)規(guī)模,相較主流大模型降低90%,訓(xùn)練成本降低80%,但整體性能,并不比國(guó)外一線大模型差;加之開(kāi)源API免費(fèi)調(diào)用,為推理大模型的發(fā)展,提供了一條截然不同的新路徑——僅需激活37億參數(shù),即可部署滿血版R1推理模型,推理效率較傳統(tǒng)架構(gòu)提升3倍以上。

有驗(yàn)證過(guò)的技術(shù)路徑在前,國(guó)內(nèi)一線大模型廠商隨之迎頭追趕,大有后來(lái)居上的趨勢(shì):

阿里旗下的Qwen團(tuán)隊(duì),于3月推出了開(kāi)源大語(yǔ)言模型(LLM)QwQ-32B,對(duì)標(biāo)OpenAI的o1-preview。QwQ-32B采用了多階段強(qiáng)化學(xué)習(xí)訓(xùn)練方法,在數(shù)學(xué)問(wèn)題、編碼能力和通用問(wèn)題解決能力上得到增強(qiáng)。

相比DeepSeek-R1,QwQ-32B的顯存需求更小——通常在GPU上需要24GB vRAM,滿血版DeepSeek-R1則需要超過(guò)1500GB vRAM。

騰訊押注推理大模型的時(shí)間相對(duì)較晚,但自混元接入DeepSeek之后,追趕速度相較以往快了不少——35天“更新”30次后,混元大模型團(tuán)隊(duì)于3月21日推出了自研深度思考模型混元T1正式版。它摒棄了以往的純Transformer架構(gòu),轉(zhuǎn)而將混合Mamba架構(gòu)應(yīng)用于推理大模型。

相對(duì)于DeepSeek,T1正式版的吐字速度達(dá)到了60~80token/s,實(shí)際生成速度快于DeepSeek-R1。在體現(xiàn)推理模型基礎(chǔ)能力的常見(jiàn)基準(zhǔn)測(cè)試上,如大語(yǔ)言模型評(píng)估增強(qiáng)數(shù)據(jù)集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,落后于o1。

字節(jié)方面,于4月發(fā)布的最新推理模型Seed-Thinking-v1.5,同樣采用DeepSeek-R1的MoE架構(gòu),但參數(shù)量降低至200B總參數(shù)和20B激活參數(shù)。相比前者671B總參數(shù)和37B激活參數(shù),輕量化的趨勢(shì)更為明顯。

在多項(xiàng)性能自動(dòng)評(píng)估中,Seed-Thinking-v1.5在AIME 2024基準(zhǔn)測(cè)試中取得86.7,與OpenAI的o3-mini-high模型的性能相當(dāng)。執(zhí)行GPQA任務(wù)時(shí),Seed-Thinking-v1.5達(dá)到77.3%的準(zhǔn)確率,接近o3-mini-high的性能。在Codeforces等代碼生成場(chǎng)景中,Seed-Thinking-v1.5的性能與Gemini 2.5 Pro 的性能相當(dāng),但仍落后于o3-mini-high。

科大訊飛方面,則是在4月21日官宣了旗下深度推理大模型——星火X1的升級(jí)。相較其他國(guó)內(nèi)廠商,升級(jí)版星火X1首創(chuàng)了“直覺(jué)快思考”與“深度慢思考”雙模式融合架構(gòu)。

具體而言,快思考模式支持實(shí)時(shí)翻譯、百科問(wèn)答等低延遲任務(wù);慢思考模式則通過(guò)多步驟邏輯鏈拆解復(fù)雜問(wèn)題(如數(shù)學(xué)證明、法律條文解析),模擬人類專家的推理過(guò)程。

針對(duì)更復(fù)雜場(chǎng)景的數(shù)據(jù)稀缺問(wèn)題,升級(jí)版X1則提出了基于問(wèn)題難度的分階段訓(xùn)練框架。通過(guò)動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,顯著提升長(zhǎng)思維鏈(如50步推理)的穩(wěn)定性和準(zhǔn)確性,在數(shù)學(xué)競(jìng)賽題(如AIME、MATH 500)上的準(zhǔn)確率較前代提升12%。

從參數(shù)規(guī)模而言,星火X1的模型參數(shù)規(guī)模較業(yè)界同類模型有所縮減,但在整體性能上,已經(jīng)能夠與OpenAI的o1模型及DeepSeek的R1模型相抗衡。

02 全國(guó)產(chǎn)算力,為什么是趨勢(shì)

整體來(lái)看,DeepSeek的輕量化技術(shù)路徑,很大程度上改寫了推理大模型的進(jìn)化規(guī)則。各家廠商技術(shù)路徑雖有些許差異,參數(shù)規(guī)模的“輕量化”和企業(yè)級(jí)應(yīng)用的提速確是實(shí)實(shí)在在。

但對(duì)各家廠商而言,推理大模型的推出只是產(chǎn)業(yè)端應(yīng)用的第一步。隨著推理大模型領(lǐng)域愈發(fā)激烈的全球化競(jìng)爭(zhēng),各家廠商勢(shì)必要依據(jù)自身的行業(yè)生態(tài),進(jìn)行相關(guān)的產(chǎn)業(yè)化布局。

譬如,騰訊依托自身的C端用戶優(yōu)勢(shì),率先在C端發(fā)力。AppGrowing數(shù)據(jù)顯示,截至2月27日,騰訊元寶在27天里投放共花了2.81億元。對(duì)應(yīng)的C端用戶數(shù)量則不斷上升——到3月3日為止,元寶在蘋果應(yīng)用商店的下載量甚至超過(guò)DeepSeek,到達(dá)榜首。

在“見(jiàn)真章”的B端,騰訊經(jīng)過(guò)C端用戶的迭代反饋,推出了混合專家模型MoE架構(gòu),并通過(guò)騰訊混元+開(kāi)源模型的多模型解決方案,開(kāi)始在政務(wù)、零售、金融、工業(yè)等30多個(gè)行業(yè)落地。這對(duì)于底層架構(gòu)和算力支持,無(wú)疑提出了更高的要求。

更兼愈發(fā)激烈的中美科技博弈,使得基于先進(jìn)算力的推理大模型,面臨迫在眉睫的制裁風(fēng)險(xiǎn)。4月16日,美國(guó)政府突然宣布,對(duì)英偉達(dá)H20芯片實(shí)施“無(wú)限期出口許可限制”。

這意味著,從算力層面開(kāi)始的國(guó)產(chǎn)替代,將不再是一種戰(zhàn)略選擇,而成為一種生存剛需。

在此背景下,科大訊飛的模型訓(xùn)練和模型推理,選擇使用全國(guó)產(chǎn)算力平臺(tái),無(wú)疑具有行業(yè)示范效應(yīng)。

早在兩年前,科大訊飛即與華為合作,建設(shè)了首個(gè)萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)“飛星一號(hào)”,最高能支持萬(wàn)億參數(shù)大模型訓(xùn)練??拼笥嶏w董事長(zhǎng)劉慶峰在今年年初透露,“飛星二號(hào)”將在2025年交付使用首批算力。

今年3月,訊飛與華為昇騰團(tuán)隊(duì),實(shí)現(xiàn)在國(guó)產(chǎn)算力集群上,MoE模型的大規(guī)??绻?jié)點(diǎn)專家并行集群推理,這也是業(yè)界首個(gè)基于國(guó)產(chǎn)算力的全新解決方案。一個(gè)月后,MoE模型的集群推理性能實(shí)現(xiàn)翻番。同時(shí),華為昇騰910B的推理效率,相對(duì)A100,也從原先的從55%提升到85%。

就產(chǎn)品意義而言,基于全國(guó)產(chǎn)算力升級(jí)后的星火X1,在知識(shí)問(wèn)答、數(shù)學(xué)能力等通用任務(wù)上效果顯著提升,不僅是70B參數(shù)大模型中最好的深度推理模型,而且在參數(shù)量小于業(yè)界同類模型的情況下,獲得了比肩國(guó)際頂尖模型水平的效果。

全國(guó)產(chǎn)的行業(yè)意義遠(yuǎn)不止于此。訊飛星火X1根植于完全自主可控的大模型底座,在模型迭代時(shí),可以實(shí)現(xiàn)更加靈活的參數(shù)規(guī)模調(diào)整,和更深的訓(xùn)練優(yōu)化。行業(yè)大模型的效果相比通用款,提升約在10%左右;疊加具體場(chǎng)景調(diào)優(yōu),效果可進(jìn)一步提升10%到20%。

成本方面,星火X1通過(guò)“快思考、慢思考統(tǒng)一模型”,也顯著降低了硬件資源需求。以國(guó)產(chǎn)昇騰910B為參考系,星火X1做行業(yè)落地定制(SFT和強(qiáng)化學(xué)習(xí))需要16張卡,滿血版 DeepSeek需要256張卡,硬件投入約為后者的 1/16。

推理方面,星火X1模型僅需4張華為910B算力卡即可完成私有化部署,對(duì)比DeepSeek滿血版R1模型,在性能類似的情況下硬件投入只需要 1/8。

更少的算力需求,不輸友商的模型效果,這無(wú)疑從戰(zhàn)略層面,論證了基于國(guó)產(chǎn)算力訓(xùn)練的全棧自主可控的大模型,具備登頂業(yè)界最高水平的可行性和創(chuàng)新的可持續(xù)性。

03 走入中國(guó)AI的下一個(gè)十年

一如科大訊飛董事長(zhǎng)劉慶峰所言,“今天是一個(gè)通用模型和專用模型相結(jié)合——‘通專結(jié)合’,端測(cè)模型和云端模型相結(jié)合,軟件和硬件相結(jié)合的、全新的大模型落地時(shí)代?!?/p>

如果AI停留在模型層,那它只是一個(gè)工具,只有在AI真正落地,在不同場(chǎng)景的行業(yè)生根發(fā)芽,具備特定行業(yè)特定問(wèn)題的解決方案,且國(guó)產(chǎn)自主可控,整個(gè)中國(guó)的AI行業(yè)才有繼續(xù)向前的動(dòng)力。

若將視角投向產(chǎn)業(yè)應(yīng)用端,我們大可發(fā)現(xiàn),推理大模型的國(guó)內(nèi)外競(jìng)爭(zhēng),本質(zhì)上仍然是中國(guó)AI產(chǎn)業(yè)從技術(shù)跟跑到生態(tài)領(lǐng)跑的戰(zhàn)略轉(zhuǎn)型。

站在2025年回望,這場(chǎng)始于模型性能追逐的“五軍之戰(zhàn)”,到產(chǎn)業(yè)端落地的不斷深入,終將成為產(chǎn)業(yè)生態(tài)的全面融合。誰(shuí)先將推理能力轉(zhuǎn)化為行業(yè)生產(chǎn)力,誰(shuí)就能在AI產(chǎn)業(yè)競(jìng)賽中穿越周期,引領(lǐng)變革。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
繼母燙幼子下體逼吃大便 姐弟慘遭虐待生母怒討說(shuō)法

繼母燙幼子下體逼吃大便 姐弟慘遭虐待生母怒討說(shuō)法

大象新聞
2026-03-25 12:09:04
遼寧高速127個(gè)收費(fèi)站關(guān)閉

遼寧高速127個(gè)收費(fèi)站關(guān)閉

娛樂(lè)圈見(jiàn)解說(shuō)
2026-03-26 10:28:08
猝死三件套:熬夜、咖啡、跑步——人生最后一課

猝死三件套:熬夜、咖啡、跑步——人生最后一課

水滴的聲音
2026-03-25 08:36:43
人民日?qǐng)?bào)痛批大學(xué)生 “沉睡” 現(xiàn)象:躺平四年,畢業(yè)真的會(huì)失業(yè)!

人民日?qǐng)?bào)痛批大學(xué)生 “沉睡” 現(xiàn)象:躺平四年,畢業(yè)真的會(huì)失業(yè)!

復(fù)轉(zhuǎn)這些年
2026-03-25 10:02:32
5分鐘開(kāi)通國(guó)家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

5分鐘開(kāi)通國(guó)家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

叮當(dāng)當(dāng)科技
2026-03-20 03:29:51
張雪峰被曝心臟驟停搶救,前一天還在大魚(yú)大肉,一人吃6個(gè)菜

張雪峰被曝心臟驟停搶救,前一天還在大魚(yú)大肉,一人吃6個(gè)菜

映射生活的身影
2026-03-24 18:27:44
上海滬牌,基本停發(fā)了

上海滬牌,基本停發(fā)了

侃故事的阿慶
2026-03-24 18:13:29
第21次1000賽四強(qiáng)!薩巴倫卡橫掃晉級(jí),背靠背躋身陽(yáng)光雙賽半決賽

第21次1000賽四強(qiáng)!薩巴倫卡橫掃晉級(jí),背靠背躋身陽(yáng)光雙賽半決賽

全景體育V
2026-03-26 08:39:10
2387億一夜歸零!江蘇前首富“凈身出戶”?曾被許家印坑了200億

2387億一夜歸零!江蘇前首富“凈身出戶”?曾被許家印坑了200億

次元君情感
2026-03-26 04:49:41
4月1日起執(zhí)行!高血壓糖尿病患者注意這3件事現(xiàn)在辦,看病少花錢

4月1日起執(zhí)行!高血壓糖尿病患者注意這3件事現(xiàn)在辦,看病少花錢

觀星賞月
2026-03-26 09:17:28
美軍司令:一旦臺(tái)海戰(zhàn)爭(zhēng)打響,6個(gè)航母戰(zhàn)斗群2個(gè)陸戰(zhàn)師將全都出動(dòng)

美軍司令:一旦臺(tái)海戰(zhàn)爭(zhēng)打響,6個(gè)航母戰(zhàn)斗群2個(gè)陸戰(zhàn)師將全都出動(dòng)

混沌錄
2026-03-24 22:31:03
河南00后游戲主播因手長(zhǎng)得像“奶龍”卻打出五殺戰(zhàn)績(jī)火了,本人回應(yīng):是天生殘疾,一開(kāi)始很自卑

河南00后游戲主播因手長(zhǎng)得像“奶龍”卻打出五殺戰(zhàn)績(jī)火了,本人回應(yīng):是天生殘疾,一開(kāi)始很自卑

大象新聞
2026-03-25 19:45:06
特朗普支持率公布

特朗普支持率公布

第一財(cái)經(jīng)資訊
2026-03-25 08:31:57
“感謝中產(chǎn)家庭,讓我偶爾能洗頭,”12歲女孩低認(rèn)知炫耀,被群嘲

“感謝中產(chǎn)家庭,讓我偶爾能洗頭,”12歲女孩低認(rèn)知炫耀,被群嘲

妍妍教育日記
2026-03-23 20:06:00
張?zhí)鞇?ài)太豐滿了!穿掛脖裙兜不住好身材,真讓人心動(dòng)!

張?zhí)鞇?ài)太豐滿了!穿掛脖裙兜不住好身材,真讓人心動(dòng)!

東方不敗然多多
2026-03-09 06:31:29
姆巴佩:無(wú)法想象沒(méi)有內(nèi)馬爾的世界杯,但我也不能去反對(duì)安帥

姆巴佩:無(wú)法想象沒(méi)有內(nèi)馬爾的世界杯,但我也不能去反對(duì)安帥

懂球帝
2026-03-26 07:00:47
公安部172號(hào)令落地:70歲駕照不再終身有效,2026年這些事必須辦

公安部172號(hào)令落地:70歲駕照不再終身有效,2026年這些事必須辦

小怪吃美食
2026-03-24 17:29:52
獨(dú)立百年的蒙古國(guó),正在把中國(guó)人40年的努力悄悄毀掉

獨(dú)立百年的蒙古國(guó),正在把中國(guó)人40年的努力悄悄毀掉

犀利辣椒
2026-03-19 06:40:31
上海為什么能成為中國(guó)的F1"痛城"?

上海為什么能成為中國(guó)的F1"痛城"?

新浪財(cái)經(jīng)
2026-03-25 14:12:26
江蘇一女子嫌婆婆寄的咸菜臟,轉(zhuǎn)手送給了領(lǐng)導(dǎo),誰(shuí)料,半個(gè)月后推開(kāi)領(lǐng)導(dǎo)辦公室大門,眼前一幕讓她愣??!

江蘇一女子嫌婆婆寄的咸菜臟,轉(zhuǎn)手送給了領(lǐng)導(dǎo),誰(shuí)料,半個(gè)月后推開(kāi)領(lǐng)導(dǎo)辦公室大門,眼前一幕讓她愣?。?/a>

不二大叔
2026-03-25 21:36:11
2026-03-26 11:36:49
競(jìng)合人工智能 incentive-icons
競(jìng)合人工智能
專注于探討人工智能領(lǐng)域最新動(dòng)態(tài)、技術(shù)突破和行業(yè)應(yīng)用。
122文章數(shù) 20關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

36歲男子辭百萬(wàn)年薪工作 在電商賣玩具半年賺了300萬(wàn)

頭條要聞

36歲男子辭百萬(wàn)年薪工作 在電商賣玩具半年賺了300萬(wàn)

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂(lè)要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡(jiǎn)

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
健康
親子
游戲
公開(kāi)課

房產(chǎn)要聞

質(zhì)價(jià)比標(biāo)桿!三亞首創(chuàng)浮島全景艙亮相,還得是萬(wàn)科!

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

親子要聞

你娃三歲前已經(jīng)當(dāng)夠大孝子了

新馬里奧兄弟重制MC評(píng)分86!痛點(diǎn)解決 畫面性能暴漲

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版