国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeekV4 與美團(tuán) LongCat 同時(shí)「破萬(wàn)億」,釋放了哪些信號(hào)?

0
分享至



國(guó)內(nèi)AI 企業(yè)開(kāi)始嘗試鋪設(shè)自己的軌道。

撰文|藍(lán)洞商業(yè) 于瑋琳

今年伊始,海外科技圈都在關(guān)注中國(guó)的算力問(wèn)題。

1 月,馬斯克在播客中稱,中國(guó)在AI 算力上「將遠(yuǎn)超世界其他地區(qū)」。2 月,OpenAI 首席執(zhí)行官奧特曼說(shuō),中國(guó)在人工智能領(lǐng)域的技術(shù)進(jìn)步 「快得驚人」。英偉達(dá)CEO黃仁勛也多次公開(kāi)表示:「限制中國(guó)的AI技術(shù),反而會(huì)加速其自主研發(fā)」。

2025年可以說(shuō)是供給端的集結(jié)之年。摩爾線程、沐曦股份等國(guó)產(chǎn)GPU接連登陸資本市場(chǎng),國(guó)產(chǎn)大模型的產(chǎn)業(yè)基礎(chǔ)進(jìn)一步加深。2026年,變化向產(chǎn)業(yè)鏈下游傳導(dǎo),4月下旬,多款國(guó)產(chǎn)大模型發(fā)布新版本。

4月20日,月之暗面推出擅長(zhǎng)長(zhǎng)程代碼編寫(xiě)的Kimi K2.6模型;4月24日,DeepSeek V4發(fā)布;隨后美團(tuán)LongCat-2.0-Preview開(kāi)放測(cè)試,兩者總參數(shù)規(guī)模均突破萬(wàn)億,且均支持1M超長(zhǎng)上下文。

值得一提的是,DeepSeek V4完成了從英偉達(dá)體系向華為昇騰平臺(tái)的遷移與適配;而美團(tuán)LongCat2.0則是訓(xùn)練推理全程基于國(guó)產(chǎn)算力的萬(wàn)億參數(shù)大模型,使用了5萬(wàn)至6萬(wàn)張國(guó)產(chǎn)算力芯片。

長(zhǎng)久以來(lái),中國(guó)AI從業(yè)者,普遍策略是搭上已有的成熟方案?,F(xiàn)在,國(guó)內(nèi)AI企業(yè)開(kāi)始嘗試鋪設(shè)自己的軌道。

在荒野修路

你該如何完成一次艱難的任務(wù)呢?

科幻作家阿瑟·克拉克的答案是:「唯一的辦法是讓不可能本身,成為前進(jìn)的起點(diǎn)。」

DeepSeek V4從最初定檔到最終發(fā)布,時(shí)間調(diào)整了多次。外部普遍推測(cè),原因之一,就是需要將核心代碼從英偉達(dá)的CUDA遷移出來(lái)。

CUDA生態(tài)經(jīng)過(guò)十幾年的打磨,已是一個(gè)功能強(qiáng)大、工具完備的開(kāi)發(fā)平臺(tái)。國(guó)產(chǎn)算力生態(tài)尚在構(gòu)建初期。遷移代碼的過(guò)程,意味著開(kāi)發(fā)團(tuán)隊(duì)需要做大量底層框架的重構(gòu)工作。

最終DeepSeek做到了,V4發(fā)布兩日后,摩根大通在報(bào)告中指出,V4成功適配華為昇騰芯片,驗(yàn)證了國(guó)產(chǎn)算力在前沿AI推理上的可行性;且DeepSeek通過(guò)混合注意力架構(gòu)等底層技術(shù)創(chuàng)新,顯著降低了推理成本。

DeepSeek用技術(shù)極客的方式降本增效,通過(guò)重寫(xiě)半個(gè)大模型的工作量完成硬核遷移。同日開(kāi)放測(cè)試的美團(tuán)LongCat-2.0-Preview,則是直接跑在國(guó)產(chǎn)算力之上。

國(guó)產(chǎn)算力在工程層面,有哪些難點(diǎn)?不妨以LongCat-2.0-Preview為例看看。

第一個(gè)難點(diǎn),是物理層面的。國(guó)產(chǎn)硬件底座的顯存容量和帶寬與英偉達(dá)芯片有差異,訓(xùn)練部署萬(wàn)億參數(shù)模型時(shí),美團(tuán)團(tuán)隊(duì)在工程方面有不小的挑戰(zhàn),需要用更多精力去調(diào)試并行策略、優(yōu)化顯存。

第二難點(diǎn),是軟件生態(tài)的成熟度,針對(duì)國(guó)產(chǎn)芯片的特性,確保訓(xùn)練全程的精確可復(fù)現(xiàn),團(tuán)隊(duì)需要重寫(xiě)和優(yōu)化核心算子,以及自研全確定性的算子。

第三個(gè)難點(diǎn),是萬(wàn)卡集群的穩(wěn)定性,在動(dòng)用5萬(wàn)-6萬(wàn)張國(guó)產(chǎn)算力卡的超大規(guī)模集群上,硬件故障難以避免。為此,團(tuán)隊(duì)構(gòu)建了一套完整的容錯(cuò)與自動(dòng)恢復(fù)體系。

最后,針對(duì)國(guó)產(chǎn)硬件的特點(diǎn),團(tuán)隊(duì)在訓(xùn)練框架和模型結(jié)構(gòu)進(jìn)行針對(duì)性的親和設(shè)計(jì),打破了通用框架的適配局限,提升了計(jì)算性能。

DeepSeek的算法優(yōu)化降低了算力的門檻,把模型的價(jià)格打了下來(lái);美團(tuán)的工程實(shí)踐則證明國(guó)產(chǎn)芯片的可行性。這些探索,也給國(guó)產(chǎn)芯片生態(tài)沉淀出工程能力和經(jīng)驗(yàn)。

梁文鋒曾說(shuō):「我們不是有意成為一條鯰魚(yú),只是不小心成了一條鯰魚(yú)」,而今「鯰魚(yú)效應(yīng)」已經(jīng)顯現(xiàn),DeepSeek并不獨(dú)行。

從單點(diǎn)到系統(tǒng)

騰訊云的湯道生曾有這樣一個(gè)比喻:「大模型是發(fā)動(dòng)機(jī),使用者是駕駛員」。使用者很容易注意到發(fā)動(dòng)機(jī)的性能,但優(yōu)秀的駕駛員,會(huì)意識(shí)到燃料與底盤同樣重要。

中國(guó)算力的發(fā)展,依賴的是整條產(chǎn)業(yè)鏈的協(xié)同進(jìn)步。各個(gè)環(huán)節(jié)的核心企業(yè),都在持續(xù)補(bǔ)足短板。

在制造端,公開(kāi)數(shù)據(jù)表明,中國(guó)芯片產(chǎn)量節(jié)節(jié)攀升,但卻是「啞鈴型」結(jié)構(gòu),28nm以上成熟制程占絕對(duì)主力,14nm及以下先進(jìn)制程產(chǎn)能依然稀缺。

面對(duì)EUV光刻機(jī)缺位的現(xiàn)實(shí),中芯國(guó)際、華虹半導(dǎo)體等企業(yè)正推進(jìn)多重曝光等工藝攻關(guān),試圖在物理極限中尋找平衡點(diǎn)。多方報(bào)道顯示,中芯國(guó)際的N+2工藝(等效7nm)良率已經(jīng)突破80%,這意味著已經(jīng)跨過(guò)了商業(yè)化量產(chǎn)的門檻。

在算力端,國(guó)產(chǎn)芯片在單卡算力上與英偉達(dá)仍存在差距。華為昇騰910C等產(chǎn)品的實(shí)踐表明,通過(guò)極致的集群線性加速比,也能跑通體量巨大的模型訓(xùn)練。

「得生態(tài)者得天下」。英偉達(dá)CUDA構(gòu)建的護(hù)城河之所以深厚,一個(gè)重要原因是形成了普適性的軟硬件兼容標(biāo)準(zhǔn)。

行業(yè)從業(yè)者也意識(shí)到這一點(diǎn)。比如寒武紀(jì)推出基礎(chǔ)軟件平臺(tái),兼容主流框架,降低開(kāi)發(fā)者的遷移門檻。智源人工智能研究院牽頭的開(kāi)源系統(tǒng),構(gòu)建了統(tǒng)一的底層接口,讓上層模型可以運(yùn)行在多種不同的國(guó)產(chǎn)芯片上。

國(guó)內(nèi)互聯(lián)網(wǎng)大廠也有很多動(dòng)作,百度的雙軌戰(zhàn)略,字節(jié)跳動(dòng)的千億投入,都在為算力底座尋找更優(yōu)解。

據(jù)公開(kāi)數(shù)據(jù)梳理,在過(guò)去幾年中,美團(tuán)至少布局了21家覆蓋半導(dǎo)體/智能硬件和通用大模型領(lǐng)域的相關(guān)公司。其中,既包括芯片算力層的摩爾線程、沐曦股份,以及視覺(jué)芯片領(lǐng)域的愛(ài)芯元智;也包括新材料等細(xì)分賽道的廣州眾山、東方算芯等多家企業(yè)。

在技術(shù)長(zhǎng)期保持跟進(jìn)的同時(shí),產(chǎn)業(yè)資本也在做算力的投資人和共建者,逐漸形成正向循環(huán)。

從數(shù)字世界,到現(xiàn)實(shí)任務(wù)

「當(dāng)下人工智能正處于第三次浪潮的重要拐點(diǎn),大模型正推動(dòng)其從弱人工智能邁向通用人工智能,更關(guān)鍵的是,推動(dòng)機(jī)器人從1.0專用機(jī)器人時(shí)代進(jìn)入2.0通用具身智能時(shí)代?!?/p>

北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)的話,點(diǎn)出AI能力的重要落點(diǎn),是物理世界。

一方面,眾多國(guó)產(chǎn)廠商正致力于讓大模型在云端「讀萬(wàn)卷書(shū)」,提升模型的智慧、邏輯推理的嚴(yán)密性。另一方面,也要讓大模型「行萬(wàn)里路」,比如文心大模型被植入到自動(dòng)駕駛的決策系統(tǒng)中;混元大模型的工業(yè)質(zhì)檢方案,已出現(xiàn)在多個(gè)流水線場(chǎng)景。

美團(tuán)的外賣、到店、酒旅等業(yè)務(wù),構(gòu)成了日常生活中最復(fù)雜的任務(wù)執(zhí)行網(wǎng)絡(luò)。這里有海量的的真實(shí)場(chǎng)景:從商家后廚的出餐速度,到騎手在暴雨中的配送路徑,再到用戶深夜的一句「想吃火鍋」。

王興曾明確提出,要將美團(tuán)App率先升級(jí)成「AI-powered App」。這意味著,LongCat的訓(xùn)練目標(biāo)不僅是回答「哪家的小炒肉好吃」,更要「找到這家店,選出最佳的團(tuán)購(gòu)券,然后預(yù)定2個(gè)周五晚上7點(diǎn)鐘的座位」。

這意味著任務(wù)交付的效果尤為重要,也解釋了美團(tuán)為何強(qiáng)調(diào)要打造物理世界的AI底座。

從參數(shù)提升到算力跑通,國(guó)產(chǎn)大模型正在完成從「能用」到「好用」的進(jìn)階。

這條路沒(méi)有捷徑。未來(lái),當(dāng)算法、算力、資金與場(chǎng)景持續(xù)產(chǎn)生化學(xué)反應(yīng),中國(guó)AI 的故事,也將從「單點(diǎn)突破」翻到「系統(tǒng)進(jìn)化」這一頁(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
44歲前TVB花旦失落金像獎(jiǎng)不氣餒,自爆廣州祖業(yè)已被親戚分光

44歲前TVB花旦失落金像獎(jiǎng)不氣餒,自爆廣州祖業(yè)已被親戚分光

TVB劇評(píng)社
2026-05-01 21:24:01
最新官宣!山東5月起統(tǒng)一調(diào)整,60周歲以上老人出游不用再買門票

最新官宣!山東5月起統(tǒng)一調(diào)整,60周歲以上老人出游不用再買門票

林子說(shuō)事
2026-05-01 19:55:14
孩子脫臼復(fù)位只收100元,家長(zhǎng)舉報(bào)亂收費(fèi)!衛(wèi)健委:應(yīng)收110元,你還少給了!家長(zhǎng)拒繳費(fèi)后離開(kāi)!

孩子脫臼復(fù)位只收100元,家長(zhǎng)舉報(bào)亂收費(fèi)!衛(wèi)健委:應(yīng)收110元,你還少給了!家長(zhǎng)拒繳費(fèi)后離開(kāi)!

醫(yī)脈圈
2026-04-25 20:04:06
一眼慌神,半生淪陷

一眼慌神,半生淪陷

青蘋果sht
2026-04-12 05:52:03
章若楠空杯到底有多美?網(wǎng)友說(shuō):這顏值誰(shuí)頂?shù)米?,難怪都想娶!

章若楠空杯到底有多美?網(wǎng)友說(shuō):這顏值誰(shuí)頂?shù)米?,難怪都想娶!

老吳教育課堂
2026-04-30 12:14:14
腦有沒(méi)有萎縮,睡覺(jué)就知?提醒:睡覺(jué)時(shí)出現(xiàn)這4個(gè)癥狀,盡早篩查

腦有沒(méi)有萎縮,睡覺(jué)就知?提醒:睡覺(jué)時(shí)出現(xiàn)這4個(gè)癥狀,盡早篩查

芹姐說(shuō)生活
2026-04-22 23:45:31
被指“賣黨求榮”后,韓國(guó)瑜用14字回應(yīng),鄭麗文發(fā)聲…

被指“賣黨求榮”后,韓國(guó)瑜用14字回應(yīng),鄭麗文發(fā)聲…

福建睿平
2026-05-01 08:29:52
北京千億更新清單下發(fā):故宮旁退租,五環(huán)外搬遷,誰(shuí)在受益?

北京千億更新清單下發(fā):故宮旁退租,五環(huán)外搬遷,誰(shuí)在受益?

右耳遠(yuǎn)聞
2026-04-30 18:35:07
狂救6個(gè)賽點(diǎn)!國(guó)羽3-2死里逃生,李詩(shī)灃帶傷封神太催淚!

狂救6個(gè)賽點(diǎn)!國(guó)羽3-2死里逃生,李詩(shī)灃帶傷封神太催淚!

生活新鮮市
2026-05-01 01:50:53
杜鋒發(fā)言引球迷不滿,遼寧主帥有信心拿下生死戰(zhàn),趙繼偉帶病出戰(zhàn)

杜鋒發(fā)言引球迷不滿,遼寧主帥有信心拿下生死戰(zhàn),趙繼偉帶病出戰(zhàn)

中國(guó)籃壇快訊
2026-05-02 00:03:53
95年我相親碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹難忘一幕

95年我相親碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹難忘一幕

白云故事
2025-03-04 05:45:02
打進(jìn)全部大師賽決賽,辛納為三巨頭后歷史第四人

打進(jìn)全部大師賽決賽,辛納為三巨頭后歷史第四人

懂球帝
2026-05-02 00:10:14
合同到期!CBA超級(jí)外援恐遭多支球隊(duì)哄搶,本賽季場(chǎng)均狂砍27+5+5

合同到期!CBA超級(jí)外援恐遭多支球隊(duì)哄搶,本賽季場(chǎng)均狂砍27+5+5

老葉評(píng)球
2026-05-01 17:33:03
希勒:雙紅會(huì)平局雙方都可以接受;維拉會(huì)完全壓制熱刺

希勒:雙紅會(huì)平局雙方都可以接受;維拉會(huì)完全壓制熱刺

懂球帝
2026-05-02 00:10:14
31場(chǎng)不?。∧吕锬釆W奪取歐冠主動(dòng)權(quán),入主皇馬,需挑戰(zhàn)克洛普

31場(chǎng)不敗!穆里尼奧奪取歐冠主動(dòng)權(quán),入主皇馬,需挑戰(zhàn)克洛普

嗨皮看球
2026-05-01 17:56:15
中國(guó)AI大模型周調(diào)用量大降,為啥大家不用了?

中國(guó)AI大模型周調(diào)用量大降,為啥大家不用了?

江瀚視野
2026-05-01 08:00:43
心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團(tuán)滅?真相讓人沉默

心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團(tuán)滅?真相讓人沉默

超人強(qiáng)動(dòng)物俱樂(lè)部
2026-05-01 19:55:04
人活著,說(shuō)到底就三樣?xùn)|西:生理需求居首,真正懂的人沒(méi)幾個(gè)

人活著,說(shuō)到底就三樣?xùn)|西:生理需求居首,真正懂的人沒(méi)幾個(gè)

朗威談星座
2026-05-01 14:28:21
一張“初三女孩體測(cè)”照片,讓家長(zhǎng)被數(shù)萬(wàn)網(wǎng)友指責(zé):太不用心了!

一張“初三女孩體測(cè)”照片,讓家長(zhǎng)被數(shù)萬(wàn)網(wǎng)友指責(zé):太不用心了!

川渝視覺(jué)
2026-04-25 20:19:24
85-64,廣東擊敗廣州,賽后還有4個(gè)好消息,杜鋒令人捉摸不透

85-64,廣東擊敗廣州,賽后還有4個(gè)好消息,杜鋒令人捉摸不透

生活新鮮市
2026-05-02 01:23:09
2026-05-02 02:31:00
藍(lán)洞商業(yè)
藍(lán)洞商業(yè)
原創(chuàng)、深度的新經(jīng)濟(jì)人物和事件
691文章數(shù) 773關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

頭條要聞

美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

體育要聞

無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

娛樂(lè)要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財(cái)經(jīng)要聞

GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

汽車要聞

限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
數(shù)碼
房產(chǎn)
公開(kāi)課

這個(gè)夏天,彩色褲子又火了!

手機(jī)要聞

曝iPhone18Pro相機(jī)史詩(shī)級(jí)升級(jí),這次你期待嗎?

數(shù)碼要聞

原相光學(xué)鼠標(biāo)傳感器新品PAW3955將至,VGN、阿斯盾官宣采用

房產(chǎn)要聞

所有戶型全賣爆!??赥OP級(jí)豪宅,景觀樣板間五一全線開(kāi)放!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版