国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude擋不住DeepSeek,國(guó)產(chǎn)算力革命已經(jīng)引爆,靜悄悄的AI突圍戰(zhàn)到了下半場(chǎng)

0
分享至

志明與春嬌,AI看小刀,大家好,我是刀哥,今天給大家講講DeepSeek V3.2不為人知的秘密

昨天下午DeepSeek V3.2發(fā)布,今天凌晨Claude Sonnet 4.5發(fā)布,大家很關(guān)心技術(shù)細(xì)節(jié)。其實(shí)Claude 4.5領(lǐng)先的那一點(diǎn)點(diǎn)編程上的技術(shù)優(yōu)勢(shì),不出3個(gè)月就會(huì)被國(guó)產(chǎn)后來(lái)者趕超。

而DeepSeek V3.2 發(fā)布公告里邊的一段話卻非常非常重要,不得不說(shuō),從V3.1開(kāi)始的伏筆,已經(jīng)開(kāi)始大展宏圖!

咱們從2025年初到現(xiàn)在,按時(shí)間線捋一捋。

春節(jié)突襲

大年初四,華為云和硅基流動(dòng)把基于昇騰云的DeepSeek服務(wù)上線了。意思很直白:模型到算力,盡量用國(guó)產(chǎn)堆起來(lái)。

結(jié)果一上線就擠爆。原本準(zhǔn)備的910B卡很快頂滿,只能連夜緊急加卡,才把服務(wù)穩(wěn)住。那天之后,很多人第一次直觀感受到:國(guó)貨之光來(lái)了,國(guó)產(chǎn)大模型第一次熱起來(lái)了。

從2023年,李彥宏說(shuō)文心一言離GPT4只差一兩個(gè)月的笑柄,到DeepSeek的迎頭追上,我們用了兩年時(shí)間!


適配優(yōu)化,蟄伏期

2025年3月初,華為CloudMatrix 384超節(jié)點(diǎn)上線,384張昇騰卡互聯(lián),初期吞吐指標(biāo)不漂亮,大家一邊踩坑一邊補(bǔ)齊軟硬件配合,芯片—算子—框架—調(diào)度一層層摳。

4月10日的發(fā)布會(huì)上(華為云生態(tài)大會(huì)),對(duì)外報(bào)了一組關(guān)鍵數(shù)字: 在50ms時(shí)延約束下單卡Decode吞吐突破1920 Tokens/s ,對(duì)比初期提升顯著,有對(duì)標(biāo)H100的意思。

同時(shí)還有一條更“現(xiàn)實(shí)”的:在910B上推理的單位成本,按官方給的口徑明顯壓下來(lái)了,量級(jí)級(jí)別的下降,至于有人說(shuō)到“每百萬(wàn)token 0.27美元”這種超細(xì)數(shù)字。

協(xié)同優(yōu)化:模型從設(shè)計(jì)期就盯國(guó)產(chǎn)芯片特性

8月,DeepSeek發(fā)了V3.1。思路很清楚:推理時(shí)支持“思考/非思考”兩種模式,配合混合推理策略;底層精度上更多用FP8/低精度量化方案,目標(biāo)就是在不明顯損傷效果的前提下,把吞吐、時(shí)延和成本繼續(xù)壓。

最關(guān)鍵的一句:這套設(shè)計(jì)從一開(kāi)始就對(duì)國(guó)產(chǎn)芯片的算力特點(diǎn)做了適配。換句話說(shuō),不是先做個(gè)通用版再硬塞到國(guó)產(chǎn)芯片上跑,而是“模型-框架-芯片”一起調(diào)。這個(gè)路徑對(duì)國(guó)產(chǎn)生態(tài)很重要。

這次的V3.2 ,第一段只說(shuō)了效率優(yōu)化和新機(jī)制引入


其實(shí)大招在后邊!

“使用高級(jí)語(yǔ)言 TileLang 進(jìn)行快速原型開(kāi)發(fā),以支持更深入的探索。在最后階段,以 TileLang 作為精度基線,逐步使用底層語(yǔ)言實(shí)現(xiàn)更高效的版本?!?/p>


這里必須介紹下 TileLang。 TileLang是一門主要面向AI計(jì)算的開(kāi)源編程語(yǔ)言,它的核心目標(biāo)是讓開(kāi)發(fā)者能更輕松、高效地編寫(xiě)出高性能的AI算子(即計(jì)算核心),從而解放生產(chǎn)力。

在2025年華為全聯(lián)接大會(huì)上,北京大學(xué)團(tuán)隊(duì)展示的TileLang成果已成功應(yīng)用于華為的昇騰(Ascend)AI芯片平臺(tái)。我們不跟英偉達(dá)玩了,華為昇騰香起來(lái)了!

DeepSeek發(fā)布完半小時(shí),華為官宣:

華為宣布昇騰已快速基于 vLLM/SGLang 等推理框架完成適配部署,實(shí)現(xiàn) DeepSeek-V3.2-Exp 0day 支持,并面向開(kāi)發(fā)者開(kāi)源所有推理代碼和算子實(shí)現(xiàn)。


這不是明擺著,事先就準(zhǔn)備好的公關(guān)稿,事先就適配好了新模型嗎?

生態(tài)發(fā)力:不是一家獨(dú)唱,而是一起上牌桌

9月開(kāi)始,國(guó)產(chǎn)算力這邊的新聞密度明顯提高。

  • 阿里平頭哥在通用并行處理/AI方向的自研芯片有新進(jìn)展,媒體報(bào)道里多次提到“對(duì)標(biāo)高端GPU檔位、強(qiáng)調(diào)成本優(yōu)化”。號(hào)稱“超過(guò)A800/比肩H20、降本40%”

  • 華為給出了昇騰路線的更清晰節(jié)奏,軟硬件配套在國(guó)內(nèi)場(chǎng)景里落地速度在加快。

  • GPU創(chuàng)業(yè)公司摩爾線程IPO進(jìn)程的推進(jìn)和審核節(jié)奏明顯提速。用市場(chǎng)行為說(shuō)話:資金對(duì)“國(guó)產(chǎn)算力能跑起來(lái)”這件事,愿意下注。

這不是“替代”的單點(diǎn)突破,而是“可用-好用-便宜可規(guī)模”的系統(tǒng)工程開(kāi)始見(jiàn)效。

格局變化:從“備胎”到“優(yōu)選”

梁文峰與最高領(lǐng)導(dǎo)人的會(huì)面,被外界解讀為國(guó)家層面對(duì)其技術(shù)路線和發(fā)展方向的高度認(rèn)可。這不僅是個(gè)人的榮光,更是整個(gè)行業(yè)的強(qiáng)心劑。

過(guò)去一年最大的變化,是認(rèn)知層面的:越來(lái)越多團(tuán)隊(duì)在產(chǎn)品方案評(píng)審里,會(huì)優(yōu)先按國(guó)產(chǎn)芯片的特性來(lái)做模型/工程設(shè)計(jì),而不是“能不能先用國(guó)外方案救急”。

  • 多家機(jī)構(gòu)的測(cè)算都在強(qiáng)調(diào)一個(gè)趨勢(shì):NVIDIA在國(guó)內(nèi)的份額在回落,本土AI芯片份額抬到“約三成區(qū)間”已是普遍預(yù)期。

  • 規(guī)模這塊,行業(yè)預(yù)測(cè)2025年的國(guó)內(nèi)“智能算力”總量會(huì)邁過(guò)“千EFLOPS”門檻。

1 EFLOPS = 每秒100億億次計(jì)算(1后面跟著18個(gè)零,即 101? 次浮點(diǎn)運(yùn)算)。

所以,1037.3 EFLOPS = 每秒能完成 1037.3 × 101? 次計(jì)算。

一張RTX 4090在AI常用精度(如FP8)下的理論算力約 1.3 PFLOPS(即0.0013 EFLOPS)。要達(dá)到1037.3 EFLOPS,理論上需要 約80萬(wàn)張RTX 4090 同時(shí)滿負(fù)荷運(yùn)行——還不算通信、調(diào)度、軟件損耗?,F(xiàn)實(shí)中,可能需要超過(guò)100萬(wàn)張才能穩(wěn)定輸出這個(gè)水平。

從“有沒(méi)有”到“好不好用、貴不貴”,國(guó)產(chǎn)算力正在進(jìn)入“比性價(jià)比、比可獲得性”的階段。

后記

君不見(jiàn),碼農(nóng)炒股群里,從言必稱FAANG,美股七姐妹,到現(xiàn)在中際旭創(chuàng)、新易盛、勝宏、寒武紀(jì)聊得飛起,重倉(cāng)科創(chuàng),中國(guó)公司再不是當(dāng)年的吳下阿蒙,不是緬A,大家開(kāi)始了價(jià)值投資。

世界大舞臺(tái),中美同臺(tái)競(jìng)技,中國(guó)不再落后挨打。


從模仿到自立,從追趕到協(xié)同,我們正在書(shū)寫(xiě)屬于自己的AI新篇章!

后臺(tái)回復(fù)【deepseek】,一起聊聊DeepSeek的這次更新。


不刷短視頻,讀我的公眾號(hào)長(zhǎng)文還讀完了?您真是一股清流!如果覺(jué)得寫(xiě)得不錯(cuò),歡迎點(diǎn)贊、在看、關(guān)注。如果有不同看法,歡迎在評(píng)論區(qū)或者后臺(tái)留言討論。

我是刀哥,大廠工作過(guò)幾年,現(xiàn)在是出海創(chuàng)業(yè)者,深入研究AI工具和AI編程。關(guān)注我,了解更多AI知識(shí)!我們下期再見(jiàn)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣東一貨車撞落限高架致路人死亡,司機(jī)獲刑后家屬質(zhì)疑:違規(guī)限高架是主因,事發(fā)前多次被撞壞未整改,已上訴

廣東一貨車撞落限高架致路人死亡,司機(jī)獲刑后家屬質(zhì)疑:違規(guī)限高架是主因,事發(fā)前多次被撞壞未整改,已上訴

大風(fēng)新聞
2026-01-10 11:04:42
特朗普表明“棄臺(tái)”立場(chǎng),直言中方怎么做是自由,但別讓我不高興

特朗普表明“棄臺(tái)”立場(chǎng),直言中方怎么做是自由,但別讓我不高興

博覽歷史
2026-01-09 18:17:28
深夜利空,8個(gè)龍頭年報(bào)業(yè)績(jī)暴雷,5股陷入虧損,千萬(wàn)別踩雷

深夜利空,8個(gè)龍頭年報(bào)業(yè)績(jī)暴雷,5股陷入虧損,千萬(wàn)別踩雷

風(fēng)風(fēng)順
2026-01-10 00:57:49
從“備胎”到核心!拉什福德逆襲成巴薩之寶

從“備胎”到核心!拉什福德逆襲成巴薩之寶

星耀國(guó)際足壇
2026-01-10 23:25:04
“歡迎宴”后因老板稱呼問(wèn)題起爭(zhēng)執(zhí) 42歲新員工咬掉老員工鼻子獲刑3年7個(gè)月

“歡迎宴”后因老板稱呼問(wèn)題起爭(zhēng)執(zhí) 42歲新員工咬掉老員工鼻子獲刑3年7個(gè)月

紅星新聞
2026-01-10 16:10:16
從高處跌落的硅膠臉?lè)蛉耍罕痪?個(gè)月瘦到80斤,頭發(fā)花白眼神驚恐

從高處跌落的硅膠臉?lè)蛉耍罕痪?個(gè)月瘦到80斤,頭發(fā)花白眼神驚恐

照見(jiàn)古今
2025-12-12 18:19:05
1983年嚴(yán)打后,重刑犯都被遣送大西北,最終是什么結(jié)局?

1983年嚴(yán)打后,重刑犯都被遣送大西北,最終是什么結(jié)局?

觀史搜尋著
2025-12-03 22:30:28
76年華國(guó)鋒秘密詢問(wèn)吳德:你在衛(wèi)戍區(qū)的搭檔是否可靠,吳作何回答

76年華國(guó)鋒秘密詢問(wèn)吳德:你在衛(wèi)戍區(qū)的搭檔是否可靠,吳作何回答

春秋硯
2026-01-10 09:30:19
古天樂(lè)被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

古天樂(lè)被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

封面新聞
2026-01-08 09:37:07
肥腸再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):常吃肥腸,身體會(huì)收獲3大好處

肥腸再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):常吃肥腸,身體會(huì)收獲3大好處

全球軍事記
2025-12-29 21:28:37
67歲千萬(wàn)富翁李幼斌:錢再多有何用?中老年人當(dāng)醒悟

67歲千萬(wàn)富翁李幼斌:錢再多有何用?中老年人當(dāng)醒悟

半身Naked
2026-01-09 23:07:33
多哈冠軍賽4強(qiáng)戰(zhàn)直播調(diào)整:陳幸同對(duì)陣張本美和,CCTV5不播

多哈冠軍賽4強(qiáng)戰(zhàn)直播調(diào)整:陳幸同對(duì)陣張本美和,CCTV5不播

大昆說(shuō)臺(tái)球
2026-01-10 05:34:31
中微公司公告:尹志堯因從外籍恢復(fù)中國(guó)籍 為依法辦稅擬套現(xiàn)近1億元

中微公司公告:尹志堯因從外籍恢復(fù)中國(guó)籍 為依法辦稅擬套現(xiàn)近1億元

快科技
2026-01-10 19:28:08
原來(lái)一切都是故意的,閆學(xué)晶的目的達(dá)到了,別提多高興了

原來(lái)一切都是故意的,閆學(xué)晶的目的達(dá)到了,別提多高興了

手工制作阿殲
2026-01-08 13:41:25
太驚艷:倪妮穿V領(lǐng)吊帶裙亮相,身材火辣!

太驚艷:倪妮穿V領(lǐng)吊帶裙亮相,身材火辣!

小小一米月兒
2026-01-11 01:45:03
金·卡戴珊太放得開(kāi),裙子勒出褶皺都要穿小碼,沙漏身材欣賞不來(lái)

金·卡戴珊太放得開(kāi),裙子勒出褶皺都要穿小碼,沙漏身材欣賞不來(lái)

心靈得以滋養(yǎng)
2026-01-10 12:28:56
親眼目睹藏族少女天葬之行,參加全過(guò)程后心悸:顛覆我對(duì)生死的認(rèn)知

親眼目睹藏族少女天葬之行,參加全過(guò)程后心悸:顛覆我對(duì)生死的認(rèn)知

古怪奇談錄
2025-09-09 14:36:35
“死了么”App爆火!登頂蘋(píng)果付費(fèi)榜一,網(wǎng)友:“活著不好么?”

“死了么”App爆火!登頂蘋(píng)果付費(fèi)榜一,網(wǎng)友:“活著不好么?”

LOGO研究所
2026-01-10 17:54:50
逛完這個(gè)展會(huì),我看到了國(guó)產(chǎn)智能硬件的底氣。

逛完這個(gè)展會(huì),我看到了國(guó)產(chǎn)智能硬件的底氣。

差評(píng)XPIN
2026-01-10 00:09:23
心臟支架一放,人生倒計(jì)時(shí)就開(kāi)始了?醫(yī)生說(shuō)出實(shí)話:這4點(diǎn)要注意

心臟支架一放,人生倒計(jì)時(shí)就開(kāi)始了?醫(yī)生說(shuō)出實(shí)話:這4點(diǎn)要注意

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-01-05 12:18:04
2026-01-11 02:15:00
刀哥聊AI
刀哥聊AI
深度評(píng)測(cè)AI工具、AI大模型,資深大廠架構(gòu)師,出海智能硬件創(chuàng)業(yè)者
100文章數(shù) 12關(guān)注度
往期回顧 全部

科技要聞

必看 | 2026開(kāi)年最頂格的AI對(duì)話

頭條要聞

特朗普簽署行政令 宣布進(jìn)入國(guó)家緊急狀態(tài)

頭條要聞

特朗普簽署行政令 宣布進(jìn)入國(guó)家緊急狀態(tài)

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂(lè)要聞

吳速玲曝兒子Joe是戀愛(ài)腦

財(cái)經(jīng)要聞

這不算詐騙嗎?水滴保誘導(dǎo)扣款惹眾怒

汽車要聞

寶馬25年全球銷量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

親子
本地
時(shí)尚
房產(chǎn)
公開(kāi)課

親子要聞

方媛曬三個(gè)女兒:大寶趴地上畫(huà)畫(huà)。二寶讀英文書(shū),三胎睡嬰兒車?yán)?/h3>

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

伊姐周六熱推:電視劇《小城大事》;電視劇《軋戲》......

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版