国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

SemiAnalysis:下游大模型公司已經(jīng)爆賺,英偉達(dá)、臺(tái)積電還能賺更多

0
分享至

AI價(jià)值鏈正在經(jīng)歷結(jié)構(gòu)性重估。過去賺走大部分利潤(rùn)的芯片制造商正面臨下游模型廠商的快速追趕,但上游的利潤(rùn)空間遠(yuǎn)未觸及天花板。

SemiAnalysis分析指出,Anthropic年化收入在數(shù)月內(nèi)從90億美元升至逾440億美元,推理毛利率從38%增至70%以上。英偉達(dá)目前的定價(jià)框架仍以成本為導(dǎo)向,尚未反映推理工作負(fù)載經(jīng)濟(jì)學(xué)的變化。一旦框架調(diào)整,英偉達(dá)系統(tǒng)定價(jià)具備40%以上的上調(diào)空間。臺(tái)積電N3制程產(chǎn)能同樣處于價(jià)值重分配的核心位置。

支撐此判斷的關(guān)鍵在于供需兩端的結(jié)構(gòu)性錯(cuò)配:N3制程預(yù)計(jì)2026年下半年利用率將超過100%,DRAM工廠已逾90%滿負(fù)荷運(yùn)行,而前沿模型的Token需求仍在以復(fù)合速度擴(kuò)張。這一背景下,英偉達(dá)通過SOCAMM內(nèi)存模塊實(shí)現(xiàn)差異化定價(jià)的窗口已經(jīng)打開。

AI價(jià)值洼地轉(zhuǎn)移:基礎(chǔ)設(shè)施層讓位于模型層

從2023年至2025年初,AI價(jià)值鏈中的絕大部分利潤(rùn)積聚于基礎(chǔ)設(shè)施層。英偉達(dá)率先爆發(fā),隨后電力資產(chǎn)Vistra與GE Vernova分別在2024年上漲265%和146%,存儲(chǔ)廠商SanDisk、Western Digital、Seagate和Micron在2025年均實(shí)現(xiàn)逾200%漲幅。

這一格局的背面,是模型創(chuàng)建者與推理服務(wù)商長(zhǎng)期承受的低毛利困境。彼時(shí)AI的實(shí)際使用價(jià)值有限,市場(chǎng)對(duì)AI投資回報(bào)的質(zhì)疑聲不斷。

轉(zhuǎn)折點(diǎn)出現(xiàn)在2025年12月。隨著Agentic AI(智能體AI)真正走向?qū)嵱,AI的經(jīng)濟(jì)邏輯被徹底改寫。SemiAnalysis披露,其自身年化Token消耗支出已接近員工薪酬的30%,每名員工每月消耗Token量接近50億個(gè),是Meta內(nèi)部人均用量的5倍以上。大量原本需要初級(jí)分析師數(shù)小時(shí)完成的工作——包括財(cái)務(wù)建模、數(shù)據(jù)可視化、盈利分析——如今只需數(shù)美元的Token支出即可完成。

SemiAnalysis估算,其團(tuán)隊(duì)在Anthropic Claude上的年化支出峰值已達(dá)1095萬美元,而由此帶來的競(jìng)爭(zhēng)優(yōu)勢(shì)遠(yuǎn)超這一成本。Anthropic隨即受益:ARR從90億美元飆升至440億美元以上,推理毛利率從38%升至超過70%。

Token成本驟降,模型廠商利潤(rùn)率擴(kuò)張具有持續(xù)性

驅(qū)動(dòng)模型廠商毛利率躍升的另一核心因素,是Token生產(chǎn)成本的大幅下降。

從硬件維度看,在8K輸入、1K輸出的標(biāo)準(zhǔn)推理任務(wù)上,經(jīng)過完整軟件優(yōu)化(含寬EP、計(jì)算與預(yù)取分離、多令牌預(yù)測(cè))的B300系統(tǒng)每秒每GPU可產(chǎn)生約14000個(gè)Token,而未優(yōu)化版本僅約1000個(gè)——同款硬件上,軟件優(yōu)化單獨(dú)貢獻(xiàn)了14倍的吞吐量提升。若進(jìn)一步疊加硬件升級(jí),最優(yōu)配置的GB300 NVL72相比H100的FP8吞吐量提升約17倍,切換至H100原生不支持的FP4精度后,差距擴(kuò)大至32倍,而GB300每GPU總擁有成本僅高出約70%。

從定價(jià)結(jié)構(gòu)看,Agentic工作負(fù)載具有極高的輸入輸出比(Claude Code使用場(chǎng)景約為300:1)與極高的緩存命中率(90%以上),使得絕大多數(shù)Token落入最低計(jì)費(fèi)檔。SemiAnalysis估算,Opus 4.7在智能體任務(wù)上的真實(shí)混合成本約為每百萬Token0.99美元,遠(yuǎn)低于標(biāo)價(jià)的每百萬輸入Token5美元。

即便面對(duì)Anthropic對(duì)Opus系列的大幅降價(jià)——Opus 4.5的定價(jià)較此前降低三分之二——SemiAnalysis認(rèn)為Anthropic的單位毛利實(shí)際上有所提升:一方面,生產(chǎn)成本隨硬件升級(jí)進(jìn)一步下降;另一方面,用戶大規(guī)模從Sonnet切換至Opus,推高了混合ASP。

更具戰(zhàn)略意義的是,Anthropic在高端產(chǎn)品線上仍擁有定價(jià)主導(dǎo)權(quán)。Opus Fast定價(jià)為常規(guī)Opus的6倍,而已宣布的Mythos定價(jià)為每百萬Token25美元/125美元,是常規(guī)Opus的5倍。SemiAnalysis明確表示,若Anthropic愿意開放每百萬Token150美元/750美元的Mythos Fast,其團(tuán)隊(duì)仍會(huì)購(gòu)買——因?yàn)樯a(chǎn)力提升的價(jià)值遠(yuǎn)超成本。


模型廠商的定價(jià)權(quán)為何難以被競(jìng)爭(zhēng)侵蝕

對(duì)于前沿模型高利潤(rùn)率是否可持續(xù),最常見的質(zhì)疑來自競(jìng)爭(zhēng)壓力。SemiAnalysis給出了兩個(gè)反駁理由。

其一,前沿閉源模型與開源模型之間的能力差距依然顯著,且短期內(nèi)難以彌合。以Kimi K2.6(每百萬Token0.95美元/4美元)為代表的低價(jià)開源模型對(duì)Opus定價(jià)幾乎不構(gòu)成實(shí)質(zhì)性壓制。

其二,算力約束意味著任何一家前沿實(shí)驗(yàn)室都無法獨(dú)自服務(wù)整個(gè)市場(chǎng)。Anthropic已通過將Claude Code鎖定在100美元以上月訂閱門檻、限制第三方接入等方式主動(dòng)管理需求側(cè)。Token需求在可預(yù)見的未來將持續(xù)超出供給,這意味著有能力提供真正前沿質(zhì)量的實(shí)驗(yàn)室,可以按照Token所創(chuàng)造的經(jīng)濟(jì)價(jià)值而非競(jìng)爭(zhēng)性成本來制定價(jià)格。

英偉達(dá)的定價(jià)克制:監(jiān)管邏輯還是戰(zhàn)略誤判

面對(duì)AI價(jià)值鏈的深刻重構(gòu),英偉達(dá)迄今未對(duì)其定價(jià)框架作出實(shí)質(zhì)性調(diào)整,這是一個(gè)值得關(guān)注的結(jié)構(gòu)性問題。

英偉達(dá)目前的定價(jià)仍主要以成本為錨,反映的是需求價(jià)值隨時(shí)間遞減的舊范式——而這一假設(shè)已不再成立。當(dāng)前需求增長(zhǎng)并非線性,而是以復(fù)合速度擴(kuò)張,由智能體工作負(fù)載爆發(fā)與每個(gè)工作流程Token消耗量的持續(xù)躍升共同驅(qū)動(dòng)。

SemiAnalysis認(rèn)為,英偉達(dá)保持定價(jià)克制,部分原因在于監(jiān)管層面的顧慮。英偉達(dá)在GPU、互聯(lián)與軟件棧上的主導(dǎo)地位已引發(fā)日益密切的反壟斷關(guān)注。在下游AI實(shí)驗(yàn)室同樣大幅盈利的背景下,激進(jìn)提價(jià)可能加劇監(jiān)管風(fēng)險(xiǎn),也可能加速客戶向TPU、Trainium等替代平臺(tái)分散。

在此意義上,英偉達(dá)的行為模式與臺(tái)積電頗為相似。臺(tái)積電長(zhǎng)期以來即便在滿負(fù)荷運(yùn)營(yíng)、扮演先進(jìn)制程供應(yīng)瓶頸的情況下,也未將定價(jià)提升至稀缺溢價(jià)的極限,而是優(yōu)先維護(hù)生態(tài)系統(tǒng)長(zhǎng)期穩(wěn)定與客戶關(guān)系。這一邏輯可概括為"AI央行"——通過適度讓利支撐下游生態(tài)擴(kuò)張,而非最大化短期利潤(rùn)提取,以確保自身在AI時(shí)代的長(zhǎng)期主導(dǎo)地位。

然而,這一策略存在真實(shí)的機(jī)會(huì)成本。在算力需求持續(xù)超過供給的結(jié)構(gòu)性背景下,掌握稀缺資源卻未充分定價(jià),相當(dāng)于將價(jià)值拱手相讓給生態(tài)鏈中游和下游。臺(tái)積電在N3制程上同樣如此——SemiAnalysis直接指出這是"戰(zhàn)略失誤",至少應(yīng)要求更大規(guī)模的預(yù)付款安排。

Rubin定價(jià)空間:SOCAMM成為利潤(rùn)新杠桿

英偉達(dá)即將推出的Vera Rubin VR NVL72系統(tǒng),提供了一個(gè)重新評(píng)估定價(jià)框架的契機(jī)。

從成本角度看,據(jù)測(cè)算,VR NVL72實(shí)現(xiàn)與GB300 NVL72相同的15.6%項(xiàng)目IRR(5年期,15%預(yù)付款)所需的最低GPU租金約為每小時(shí)4.92美元。從價(jià)值角度看,若以FP8密集算力維度錨定當(dāng)前GB300每PFLOP租金約0.70美元,VR NVL72對(duì)應(yīng)的理論最高定價(jià)約為每GPU每小時(shí)12.25美元,是成本地板價(jià)的約2.5倍。

這一巨大價(jià)差表明,英偉達(dá)在VR NVL72定價(jià)上擁有充足的上調(diào)空間。SemiAnalysis估算,若英偉達(dá)將系統(tǒng)定價(jià)提升約40%,仍可為Neocloud保留足夠的利潤(rùn)空間——即便Neocloud將租金提價(jià)至每小時(shí)8美元以上,對(duì)應(yīng)每PFLOP成本仍低于歷史趨勢(shì)線。

在具體機(jī)制上,SOCAMM成為最關(guān)鍵的定價(jià)杠桿。不同于GB300將LPDDR5X內(nèi)存直接焊接于主板、嵌入整體系統(tǒng)定價(jià),VR NVL72采用可插拔的SOCAMM模塊,允許英偉達(dá)將內(nèi)存作為獨(dú)立計(jì)費(fèi)項(xiàng)目單獨(dú)列示和定價(jià)。

SOCAMM(Small Outline Compression Attached Memory Module,小型化壓縮附加內(nèi)存模組)是英偉達(dá)主導(dǎo)、聯(lián)合三星、SK海力士和美光等內(nèi)存廠商開發(fā)的新型模塊化內(nèi)存標(biāo)準(zhǔn),基于LPDDR5X(或未來LPDDR6)DRAM技術(shù),面向AI服務(wù)器與個(gè)人AI超級(jí)計(jì)算機(jī)場(chǎng)景。

模型顯示,英偉達(dá)在2026年第一季度支付的SOCAMM合同價(jià)格約為每GB 8美元,較上季度大幅提升,主要反映LPDDR5X供應(yīng)緊張與整體DRAM價(jià)格上行。基于對(duì)2026年底移動(dòng)DRAM定價(jià)的預(yù)測(cè),2026年底SOCAMM定價(jià)或超過每GB 13美元,全年均值約10美元為合理假設(shè)。

在此基礎(chǔ)上,SemiAnalysis認(rèn)為英偉達(dá)在SOCAMM上收取60%毛利率具有合理性:一是內(nèi)存供應(yīng)全面緊張,英偉達(dá)在SOCAMM采購(gòu)上具有優(yōu)先獲取權(quán);二是VR NVL72在性能/TCO維度遠(yuǎn)超同期競(jìng)品,客戶缺乏可替代選項(xiàng);三是英偉達(dá)本身已面臨SOCAMM采購(gòu)成本的大幅上漲,向下游傳導(dǎo)具有合理依據(jù)。

此外,內(nèi)存定價(jià)不像GPU定價(jià)那樣面臨反壟斷顧慮,這給了英偉達(dá)更大的差異化定價(jià)空間——包括對(duì)Neocloud與超大規(guī)模云廠商實(shí)施差別定價(jià)。目前,英偉達(dá)在網(wǎng)絡(luò)設(shè)備上已對(duì)Neocloud收取約為超大規(guī)模云廠商兩倍的價(jià)格,同樣的邏輯完全可以延伸至內(nèi)存層面。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
東航就一航班飛機(jī)與廊橋發(fā)生局部碰擦致歉:機(jī)上旅客安全

東航就一航班飛機(jī)與廊橋發(fā)生局部碰擦致歉:機(jī)上旅客安全

界面新聞
2026-05-02 13:39:19
0-3大反超?想多了!78分,西部最差季后賽球隊(duì)誕生

0-3大反超?想多了!78分,西部最差季后賽球隊(duì)誕生

體育新角度
2026-05-02 14:04:47
影帝這么矮小!五一假期梁朝偉現(xiàn)身南京,身高與隨性穿搭引發(fā)熱議

影帝這么矮小!五一假期梁朝偉現(xiàn)身南京,身高與隨性穿搭引發(fā)熱議

火山詩(shī)話
2026-05-02 08:30:27
簍子越捅越大!招體育生當(dāng)醫(yī)生、院長(zhǎng)兒子吃空餉,不能再挖了

簍子越捅越大!招體育生當(dāng)醫(yī)生、院長(zhǎng)兒子吃空餉,不能再挖了

小鋭?dòng)性捳f
2026-05-02 10:42:33
慘無人道!以軍用軍犬強(qiáng)奸巴勒斯坦囚犯,全程錄像,受害者:想死

慘無人道!以軍用軍犬強(qiáng)奸巴勒斯坦囚犯,全程錄像,受害者:想死

史行途
2026-05-01 12:29:39
繼亨德利后,世錦賽六冠王戴維斯也痛批艾倫:“這讓斯諾克蒙羞”

繼亨德利后,世錦賽六冠王戴維斯也痛批艾倫:“這讓斯諾克蒙羞”

求球不落諦
2026-05-02 10:35:55
李亞鵬香港慈善晚會(huì)請(qǐng)了30家公司,只獲得336萬元善款,王菲力挺

李亞鵬香港慈善晚會(huì)請(qǐng)了30家公司,只獲得336萬元善款,王菲力挺

椰黃娛樂
2026-05-02 12:22:54
吳宜澤艾倫打破單局時(shí)長(zhǎng)歷史紀(jì)錄,老球王怒了:這是斯諾克的恥辱

吳宜澤艾倫打破單局時(shí)長(zhǎng)歷史紀(jì)錄,老球王怒了:這是斯諾克的恥辱

楊華評(píng)論
2026-05-02 02:40:37
地球已經(jīng)裝不下追覓這么牛的公司了

地球已經(jīng)裝不下追覓這么牛的公司了

老斯基財(cái)經(jīng)
2026-04-30 11:05:19
荷蘭發(fā)達(dá)到什么程度了?人口僅1700萬,卻擁有12個(gè)世界五百?gòu)?qiáng)!

荷蘭發(fā)達(dá)到什么程度了?人口僅1700萬,卻擁有12個(gè)世界五百?gòu)?qiáng)!

抽象派大師
2026-04-30 00:16:18
日本著名馬桶公司TOTO殺入芯片行業(yè)大獲成功

日本著名馬桶公司TOTO殺入芯片行業(yè)大獲成功

爆角追蹤
2026-05-01 19:37:18
萬科這顆雷,炸出了地鐵公司的真面目

萬科這顆雷,炸出了地鐵公司的真面目

梳子姐
2026-05-01 21:31:42
美國(guó)最高院最新裁決,川普陣營(yíng)贏得壓倒性勝利

美國(guó)最高院最新裁決,川普陣營(yíng)贏得壓倒性勝利

壹家言
2026-05-02 09:21:56
吳宜澤連輸5局原因曝光艾倫斯諾克小丑希金斯13-11墨菲趙心童服氣

吳宜澤連輸5局原因曝光艾倫斯諾克小丑希金斯13-11墨菲趙心童服氣

曹說體育
2026-05-02 10:13:38
詹姆斯:我早已碾壓時(shí)間老人 打雷霆一定要減少失誤保護(hù)球權(quán)

詹姆斯:我早已碾壓時(shí)間老人 打雷霆一定要減少失誤保護(hù)球權(quán)

羅說NBA
2026-05-02 12:57:07
重磅:烏克蘭擊中兩架俄軍最強(qiáng)的蘇57戰(zhàn)機(jī)!奔襲1700公里

重磅:烏克蘭擊中兩架俄軍最強(qiáng)的蘇57戰(zhàn)機(jī)!奔襲1700公里

項(xiàng)鵬飛
2026-05-01 21:35:04
電磁爐為啥悄無聲息退出中國(guó)家庭??jī)?nèi)行人透底玄機(jī),看完徹底懂了

電磁爐為啥悄無聲息退出中國(guó)家庭??jī)?nèi)行人透底玄機(jī),看完徹底懂了

老特有話說
2026-04-30 11:36:13
范冰冰 大方公開 :18億是真 ,沒打算復(fù)合。

范冰冰 大方公開 :18億是真 ,沒打算復(fù)合。

In風(fēng)尚
2026-05-02 06:04:17
44.4噸钚與9萬億軍費(fèi):日本“核突破”倒計(jì)時(shí),中方已正式出手

44.4噸钚與9萬億軍費(fèi):日本“核突破”倒計(jì)時(shí),中方已正式出手

起喜電影
2026-05-02 12:21:54
“最美丈母娘”沈丹萍:女兒婚房?jī)H40平米,她處處替女婿家著想

“最美丈母娘”沈丹萍:女兒婚房?jī)H40平米,她處處替女婿家著想

細(xì)品名人
2026-05-02 05:59:32
2026-05-02 14:35:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
145550文章數(shù) 2653435關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

雷軍很努力 小米還是跌破了30港元大關(guān)

頭條要聞

男子被診斷為疑似肝癌 輾轉(zhuǎn)其他醫(yī)院檢查均無癌癥依據(jù)

頭條要聞

男子被診斷為疑似肝癌 輾轉(zhuǎn)其他醫(yī)院檢查均無癌癥依據(jù)

體育要聞

休賽期總冠軍,輪到休斯頓火箭

娛樂要聞

白百何罕曬大兒子 18歲元寶越來越帥

科技要聞

AI熱潮耗盡庫(kù)存,Mac Mini起售調(diào)高200美元

汽車要聞

新紀(jì)錄!零跑汽車4月交付達(dá)71387臺(tái)

態(tài)度原創(chuàng)

親子
房產(chǎn)
時(shí)尚
旅游
軍事航空

親子要聞

萌星秀秀:小萌星甜甜朗誦唐詩(shī)三首

房產(chǎn)要聞

所有戶型全賣爆!?赥OP級(jí)豪宅,景觀樣板間五一全線開放!

聰明女人衣服從來不買太多!這三種精品提前準(zhǔn)備好,耐穿又實(shí)用

旅游要聞

“五一”美團(tuán)小團(tuán)游訂單增27%,新疆、云南、北京居熱度Top3

軍事要聞

特朗普:對(duì)伊戰(zhàn)事結(jié)束 無限期延長(zhǎng);

無障礙瀏覽 進(jìn)入關(guān)懷版