国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI價(jià)格倒掛終結(jié):算力、模型同步漲價(jià),純應(yīng)用公司死局

0
分享至

文 | 舒書

近日,AI產(chǎn)業(yè)的價(jià)格邏輯正在發(fā)生根本性逆轉(zhuǎn)。

過去兩年,算力貴、模型補(bǔ)貼是常態(tài)——算力成本高企,但模型API價(jià)格被廠商壓到成本線以下,靠資本輸血維持低價(jià)幻覺?,F(xiàn)在,這條產(chǎn)業(yè)鏈正在經(jīng)歷成本傳導(dǎo):算力漲價(jià)終于傳導(dǎo)到了模型層,模型也開始漲了。

據(jù)IT桔子數(shù)據(jù),2026年Q1,已有超過10家AI應(yīng)用初創(chuàng)公司停止運(yùn)營或轉(zhuǎn)型(樣本覆蓋約200家純API創(chuàng)業(yè)公司)。這不是短期回調(diào),是AI產(chǎn)業(yè)的刮骨療毒——純應(yīng)用公司的好日子,徹底結(jié)束了。

一、算力漲了多少?——數(shù)據(jù)說話,但注意價(jià)格雙軌

先看一組可追溯的第三方數(shù)據(jù)(2025年初→2026年4月):


注1:TFLOPS(每秒萬億次浮點(diǎn)運(yùn)算)是衡量AI芯片算力的核心指標(biāo)。

注2:463%漲幅是現(xiàn)貨價(jià)或補(bǔ)貼退坡后的恢復(fù)價(jià)。頭部大廠(字節(jié)、阿里、騰訊)及AI獨(dú)角獸通常與云廠商簽有長協(xié)價(jià)或擁有自有算力儲(chǔ)備,實(shí)際成本漲幅遠(yuǎn)低于此。漲價(jià)對(duì)中小創(chuàng)業(yè)者的打擊是毀滅性的,而對(duì)有儲(chǔ)備的大廠是利潤修復(fù)——馬太效應(yīng)正在加速行業(yè)洗牌。

算力漲價(jià)的底層動(dòng)因:HBM內(nèi)存由SK海力士、三星、美光三家壟斷,2025年下半年以來價(jià)格漲幅超過50%,直接推高AI芯片成本。CoWoS封裝產(chǎn)能同樣供不應(yīng)求,臺(tái)積電2025年產(chǎn)能翻倍后仍無法滿足需求,2026年訂單已排至年底。這兩個(gè)環(huán)節(jié)是算力漲價(jià)的硬約束,短期內(nèi)無解。

算力不是成本,是AI產(chǎn)業(yè)的硬通貨。HBM和CoWoS不是漲價(jià)的誘因,是卡脖子的命門。

二、Token消耗的真實(shí)結(jié)構(gòu):工具調(diào)用才是大頭

行業(yè)熱議思考Token海嘯,但公開數(shù)據(jù)揭示了另一個(gè)真相。

據(jù)OpenAI 2025年12月公開的技術(shù)博客,GPT-4的推理成本中,約60-70%來自工具調(diào)用和上下文處理,這一比例在復(fù)雜Agent任務(wù)中會(huì)更高。以“訂機(jī)票+酒店+租車”的復(fù)合任務(wù)為例:用戶輸入占比不足1%,模型內(nèi)部推理(思考鏈)約占5-10%,工具調(diào)用(API交互)約占85-90%,最終輸出不足5%。

關(guān)鍵發(fā)現(xiàn):Token消耗的大頭是工具調(diào)用,不是模型思考。這意味著關(guān)閉思考鏈只能省5-10%,省不了大頭;調(diào)用次數(shù)由任務(wù)復(fù)雜度決定,技術(shù)優(yōu)化空間有限;Agent成本大頭是反復(fù)調(diào)用外部工具,不是模型推理。

三、誰在受益,誰在受損?——產(chǎn)業(yè)鏈傳導(dǎo)分析


真正的受損者是純API創(chuàng)業(yè)公司和出海開發(fā)者。它們無自有流量生態(tài)、無算力囤貨、無私有化部署能力,更無法向用戶轉(zhuǎn)嫁成本。

四、技術(shù)壓制:從模型優(yōu)化到駕馭工程

漲價(jià)沒有失控,是因?yàn)榧夹g(shù)在反向省Token。但技術(shù)不是無限的。技術(shù)能緩沖漲價(jià)壓力,但擋不住需求爆發(fā)——該漲的,終究躲不過。


技術(shù)能省多少?據(jù)NVIDIA 2025年GTC大會(huì)公開數(shù)據(jù),通過量化+KV Cache優(yōu)化,推理成本可降低50-70%。但同期Agent任務(wù)復(fù)雜度提升,據(jù)OpenAI披露,GPT-4到GPT-4o的推理成本下降了50%,但用戶調(diào)用量增長了5倍。技術(shù)優(yōu)化追不上需求膨脹。

駕馭工程(Harness Engineering)正在成為2026年最關(guān)鍵的降本新范式。上述技術(shù)屬于模型側(cè)優(yōu)化——讓模型更小、更快。而在應(yīng)用側(cè),如何通過工程框架約束AI的行為,避免其胡思亂想和無效循環(huán),是更直接的降本手段。

駕馭工程是一套為AI智能體構(gòu)建運(yùn)行環(huán)境、約束規(guī)則與反饋閉環(huán)的工程化新范式。據(jù)LangChain 2025年Q4報(bào)告(測(cè)試場(chǎng)景:復(fù)雜Agent任務(wù),如多輪客服、自動(dòng)化流程),使用完善的Harness框架后,Agent任務(wù)的平均Token消耗可降低40-60%。某電商AI客服公司應(yīng)用Harness框架后,單次對(duì)話平均Token消耗從12,000降至5,000,降幅58%。但需注意,簡單任務(wù)(如單輪問答)中搭建Harness框架的成本可能高于收益,中小團(tuán)隊(duì)也面臨技術(shù)門檻。

有沒這套馬具,Token消耗可能相差數(shù)倍。這不僅是技術(shù)優(yōu)化,更是從算法題轉(zhuǎn)向工程題的關(guān)鍵。

一位云廠商技術(shù)負(fù)責(zé)人在2025年Q4公開演講中指出:“我們的推理成本每年能降30%,但客戶用量每年漲200%。技術(shù)是緩沖器,不是剎車?!?/p>

五、開源模型:純應(yīng)用公司的替代路徑

前面我們討論的都是閉源模型API漲價(jià),但開源模型提供了另一條路。

Llama 3、Qwen2.5、DeepSeek-V3等開源模型,允許企業(yè)私有化部署。據(jù)Meta 2025年7月發(fā)布的Llama 3技術(shù)報(bào)告,在多項(xiàng)基準(zhǔn)測(cè)試中,Llama 3 70B的性能已接近GPT-4,但部署成本僅為GPT-4 API調(diào)用的20-30%。

開源模型的破局價(jià)值:

成本斷崖下降:部署開源模型后,邊際成本趨近于“電費(fèi)+硬件折舊”

數(shù)據(jù)安全:私有化部署,數(shù)據(jù)不出域

可定制:企業(yè)可根據(jù)場(chǎng)景精調(diào),不受API限制

但開源模型不是萬能藥:

部署門檻高:需要自建算力、運(yùn)維團(tuán)隊(duì)。據(jù)智東西2026年1月調(diào)研,一個(gè)3人精調(diào)團(tuán)隊(duì)在一線城市的年薪資成本約150萬

模型能力與閉源頂尖仍有差距:據(jù)LMSYS Chatbot Arena Leaderboard 2026年2月數(shù)據(jù),Llama 3 405B與GPT-4o仍有約5%的Elo分差

精調(diào)需要專業(yè)人才:不是“下載即用”

一位AI基礎(chǔ)設(shè)施服務(wù)商在2026年Q1公開分享中指出:“我們的客戶中,約60%已從純API轉(zhuǎn)向開源模型+私有化部署,平均成本降低60-70%?!?/p>

六、國產(chǎn)替代:昇騰的真實(shí)水平

華為昇騰是國產(chǎn)替代的核心選項(xiàng)。根據(jù)華為2025年9月全聯(lián)接大會(huì)公開數(shù)據(jù)及IDC 2025年Q4報(bào)告:


遷移的核心難點(diǎn):CUDA代碼需重寫為CANN,部分算子缺失需自研,集群穩(wěn)定性仍在追趕。

華為官方數(shù)據(jù)顯示,昇騰910B在典型推理場(chǎng)景中可達(dá)H100的70-80%性能。據(jù)華為昇騰社區(qū)2026年1月公開案例,某互聯(lián)網(wǎng)公司從英偉達(dá)遷移到昇騰,耗時(shí)5個(gè)月,綜合算力成本降低35%。

轉(zhuǎn)型失敗案例:據(jù)InfoQ 2025年12月報(bào)道,某AI公司因未充分評(píng)估遷移成本,倉促從英偉達(dá)遷移到昇騰,3個(gè)月后因集群穩(wěn)定性問題導(dǎo)致服務(wù)中斷,最終放棄遷移,損失超200萬。教訓(xùn):國產(chǎn)替代需要充分的技術(shù)儲(chǔ)備和測(cè)試周期,不是即插即用。

中小企業(yè)實(shí)操路徑:

  • 算力租賃:華為云、曙光智算等平臺(tái)提供昇騰算力租賃,按小時(shí)計(jì)費(fèi),無需自建
  • 開源+國產(chǎn)算力組合:Qwen/Llama + 昇騰,形成“軟件+硬件”雙國產(chǎn)化
  • 參考成本:昇騰算力租賃約¥8-12/卡/小時(shí),約為H100國內(nèi)租賃價(jià)的40-50%
七、中美差異:美國漲價(jià)是賺更多,中國漲價(jià)是活下去


本質(zhì)差異:美國漲價(jià)是賺更多,中國漲價(jià)是活下去。這種差異正在產(chǎn)生深遠(yuǎn)影響:一是倒逼國內(nèi)企業(yè)加速國產(chǎn)算力替代,昇騰、寒武紀(jì)等廠商迎來窗口期;二是迫使中小企業(yè)從燒錢換增長轉(zhuǎn)向精細(xì)化運(yùn)營,不具備成本控制能力的玩家將被加速淘汰。

據(jù)公開財(cái)報(bào),OpenAI 2025年?duì)I收37億美元,目標(biāo)2026年翻倍。字節(jié)豆包、阿里千問至今仍在虧損。一位云廠商高管在2026年Q1公開采訪中坦言:“我們?cè)谥袊腁PI定價(jià)是全球最低的,漲一點(diǎn)只是從虧本變成微虧?!?/p>

八、端側(cè)遷移:純應(yīng)用公司的逃生通道

端側(cè)AI正在成為純應(yīng)用公司的諾亞方舟。隨著2025-2026年手機(jī)和PC NPU性能爆發(fā)(驍龍8 Gen 5 NPU算力達(dá)45 TOPS,蘋果M4芯片NPU達(dá)38 TOPS),大量輕量級(jí)應(yīng)用正在從云端遷移到端側(cè)。

端側(cè)遷移的具體路徑:

  • 端側(cè)模型選型:輕量級(jí)任務(wù)用MobileLLM、TinyLlama(百M(fèi)B級(jí)別),中等任務(wù)用Phi-3、Qwen-1.8B(1-3GB)
  • 部署成本:端側(cè)推理邊際成本為零,但需投入開發(fā)成本(模型轉(zhuǎn)換、端側(cè)適配),據(jù)行業(yè)調(diào)研,單次端側(cè)適配成本約20-50萬
  • 適用場(chǎng)景:修圖、翻譯、語音助理、本地文檔處理等對(duì)實(shí)時(shí)性要求高、對(duì)模型能力要求適中的場(chǎng)景

據(jù)Counterpoint 2025年Q4報(bào)告,2026年全球端側(cè)AI推理占比預(yù)計(jì)將從2024年的15%提升至35%。端側(cè)推理不僅是技術(shù)路徑,更是純應(yīng)用公司對(duì)抗云端漲價(jià)的唯一逃生通道。

九、隱性驗(yàn)證成本與數(shù)據(jù)閉環(huán):從成本中心到戰(zhàn)略投資

單純看Token價(jià)格是不夠的。對(duì)于B2B應(yīng)用,最大的成本往往不是生成Token,而是人工驗(yàn)證AI輸出是否正確。

隨著模型漲價(jià),純應(yīng)用公司為了省錢會(huì)使用更便宜的模型,這會(huì)導(dǎo)致準(zhǔn)確率下降,進(jìn)而人工審核成本上升,最終出現(xiàn)省了Token錢,賠了人工費(fèi)的惡性循環(huán)。

但這里存在一個(gè)戰(zhàn)略選擇:這筆高昂的人工驗(yàn)證成本是純粹的損耗,還是可以轉(zhuǎn)化為未來的資產(chǎn)?

  • 純損耗型驗(yàn)證:僅為了糾錯(cuò)而進(jìn)行的人工審核,是純粹的成本中心。這是大多數(shù)純應(yīng)用公司的現(xiàn)狀。
  • 投資型驗(yàn)證:將人工糾正后的正確數(shù)據(jù)回流到系統(tǒng)中,用于精調(diào)自己的小模型。

據(jù)Scale AI 2025年Q4報(bào)告(模型能力衡量標(biāo)準(zhǔn)為任務(wù)準(zhǔn)確率),采用投資型驗(yàn)證策略的AI公司,平均6-9個(gè)月后模型準(zhǔn)確率提升40-60%,API調(diào)用量下降50-70%。

中小企業(yè)低成本搭建數(shù)據(jù)閉環(huán)的簡化路徑:

  • 無專業(yè)精調(diào)團(tuán)隊(duì)時(shí):使用開源精調(diào)平臺(tái)(如Unsloth、Axolotl),降低技術(shù)門檻
  • 數(shù)據(jù)量不足時(shí):采用LoRA等低秩適應(yīng)方法,僅需數(shù)百條標(biāo)注數(shù)據(jù)即可啟動(dòng)
  • 驗(yàn)證成本分?jǐn)偅簩⑷斯徍艘暈閿?shù)據(jù)生產(chǎn),而非成本消耗

這是純應(yīng)用公司從死局走向破局的唯一路徑——用短期驗(yàn)證成本換取長期數(shù)據(jù)壁壘。

十、未來拐點(diǎn):三種情景推演


關(guān)鍵變量:據(jù)晚點(diǎn)LatePost 2026年2月報(bào)道,字節(jié)自研AI芯片預(yù)計(jì)2026年Q4量產(chǎn),騰訊自研芯片計(jì)劃2027年Q2落地;據(jù)Gartner 2025年Q4預(yù)測(cè),2026年Agentic AI市場(chǎng)規(guī)模將增長300%;據(jù)36氪2026年3月報(bào)道,頭部云廠商已形成不打價(jià)格戰(zhàn)的默契。

十一、結(jié)語:未來1-2年,AI產(chǎn)業(yè)將迎來洗牌期

算力即鑄幣權(quán)。有算力囤貨的廠商能穿越周期,沒有算力、沒有私有化部署能力的純應(yīng)用公司,正在被擠出牌桌。

駕馭工程是純應(yīng)用公司活下去的必修課。沒有Harness框架的AI應(yīng)用,Token消耗可能是別人的2-3倍。這不是錦上添花,是生死線。但需注意,簡單任務(wù)中搭建Harness框架的成本可能高于收益,企業(yè)應(yīng)根據(jù)任務(wù)復(fù)雜度評(píng)估投入產(chǎn)出比。

數(shù)據(jù)閉環(huán)是純應(yīng)用公司翻盤的唯一機(jī)會(huì)。用短期驗(yàn)證成本換取長期數(shù)據(jù)壁壘——這是從死局走向破局的唯一路徑。

端側(cè)遷移是輕量級(jí)應(yīng)用的逃生通道。對(duì)于非重度依賴大算力的應(yīng)用,遷移到用戶本地NPU可將Token成本降為零。

未來1-2年,AI產(chǎn)業(yè)將迎來洗牌期。存活者必是具備算力或數(shù)據(jù)壁壘的企業(yè)。這場(chǎng)算力漲價(jià)是AI產(chǎn)業(yè)從草莽時(shí)代走向精耕時(shí)代的轉(zhuǎn)折。純應(yīng)用公司的紅利期,結(jié)束了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
火箭官宣:杜蘭特右膝挫傷缺席首輪G1 隊(duì)內(nèi)訓(xùn)練撞到隊(duì)友受傷

火箭官宣:杜蘭特右膝挫傷缺席首輪G1 隊(duì)內(nèi)訓(xùn)練撞到隊(duì)友受傷

醉臥浮生
2026-04-19 07:21:53
魏建軍當(dāng)眾批評(píng)營銷團(tuán)隊(duì)“犯罪”,魏牌的豪華差在哪?

魏建軍當(dāng)眾批評(píng)營銷團(tuán)隊(duì)“犯罪”,魏牌的豪華差在哪?

汽車公社
2026-04-19 08:34:58
騙子問你是本人嗎?教你一句反問,對(duì)方瞬間掛電話

騙子問你是本人嗎?教你一句反問,對(duì)方瞬間掛電話

小虎新車推薦員
2026-04-17 12:53:56
蘇林剛夸完復(fù)興號(hào),后腳越南列車就著火:越南高鐵到底差在哪?

蘇林剛夸完復(fù)興號(hào),后腳越南列車就著火:越南高鐵到底差在哪?

芳芳?xì)v史燴
2026-04-18 17:40:21
財(cái)政壓力的下半場(chǎng):退休人員占比近四成,才是硬賬

財(cái)政壓力的下半場(chǎng):退休人員占比近四成,才是硬賬

超先聲
2026-01-09 16:45:39
婆婆把整只雞全給小姑子,從那以后連吃2個(gè)月素菜,婆婆繃不住了

婆婆把整只雞全給小姑子,從那以后連吃2個(gè)月素菜,婆婆繃不住了

阿凱銷售場(chǎng)
2026-04-18 16:38:05
湖南天氣:暴雨、大暴雨今晚到,最低10℃

湖南天氣:暴雨、大暴雨今晚到,最低10℃

三湘都市報(bào)
2026-04-19 09:00:12
鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

環(huán)球網(wǎng)資訊
2026-04-11 21:50:22
無東里無死神,詹姆斯再創(chuàng)紀(jì)錄!命中率超高湖人半場(chǎng)未能擴(kuò)大分差

無東里無死神,詹姆斯再創(chuàng)紀(jì)錄!命中率超高湖人半場(chǎng)未能擴(kuò)大分差

大漠風(fēng)光
2026-04-19 10:16:20
人民日?qǐng)?bào)嚴(yán)選40首巔峰詩詞,每一首都是天花板,收藏轉(zhuǎn)發(fā)!

人民日?qǐng)?bào)嚴(yán)選40首巔峰詩詞,每一首都是天花板,收藏轉(zhuǎn)發(fā)!

大象新聞
2026-03-24 07:13:24
老美為什么寧愿熊貓做大,也不愿意扶持三哥工業(yè)化來制衡熊貓

老美為什么寧愿熊貓做大,也不愿意扶持三哥工業(yè)化來制衡熊貓

步論天下事
2026-04-17 15:29:16
肯納德狂砍!湖人107-98逆轉(zhuǎn)火箭,詹姆斯助攻全場(chǎng)

肯納德狂砍!湖人107-98逆轉(zhuǎn)火箭,詹姆斯助攻全場(chǎng)

銜春信
2026-04-19 11:58:10
恒大0.69%清償率:一個(gè)時(shí)代神話的墓志銘

恒大0.69%清償率:一個(gè)時(shí)代神話的墓志銘

流蘇晚晴
2026-04-17 18:20:43
經(jīng)歷三次離婚后我才懂:所有夫妻關(guān)系破裂,都源于這三個(gè)原因

經(jīng)歷三次離婚后我才懂:所有夫妻關(guān)系破裂,都源于這三個(gè)原因

千秋文化
2026-03-01 22:12:24
江西“射里頭”火了!全國奇葩地名大賞

江西“射里頭”火了!全國奇葩地名大賞

深度報(bào)
2026-04-18 21:53:14
巴拿馬港口風(fēng)波未平 美國為何又盯上錢凱港?

巴拿馬港口風(fēng)波未平 美國為何又盯上錢凱港?

看看新聞Knews
2026-04-18 17:04:26
北京國際電影節(jié)開幕,韓紅幽默點(diǎn)評(píng):我不知道李乃文是不是真的他唱的

北京國際電影節(jié)開幕,韓紅幽默點(diǎn)評(píng):我不知道李乃文是不是真的他唱的

鄉(xiāng)野小珥
2026-04-17 09:13:02
美國的陰謀藏不住了!臺(tái)海南海就是幌子,真正目標(biāo)是中國最大王牌

美國的陰謀藏不住了!臺(tái)海南海就是幌子,真正目標(biāo)是中國最大王牌

歲暮的歸南山
2026-04-18 20:00:55
臉沒恢復(fù)就別出來拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

臉沒恢復(fù)就別出來拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

白面書誏
2026-04-14 18:34:11
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
2026-04-19 12:36:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132461文章數(shù) 862104關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

體育要聞

掘金擒狼開門紅:五花肉與小辣椒

娛樂要聞

張?zhí)鞇墼u(píng)論區(qū)淪陷!被曝卷入小三風(fēng)波

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

健康
親子
本地
公開課
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

不能隱瞞爸爸媽媽的四件事兒

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗宣布關(guān)閉霍爾木茲海峽

無障礙瀏覽 進(jìn)入關(guān)懷版