国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI 的「成本」,正在把所有人都拖下水

0
分享至

“大模型成本每年降 10 倍”這句咒語,救不了你的 AI 付費訂閱。

本文編譯自 Hacking News 熱榜文章《tokens are getting more expensive》。

作者 | Ethan Ding

編譯 | 王啟隆

出品丨AI 科技大本營(ID:rgznai100)

想象一下,你開了家 AI 公司,心里清楚得很:用戶最多只肯掏 20 美元一個月。

行,你心想,這不就是風(fēng)投圈的經(jīng)典劇本嘛——先虧本賺吆喝,用利潤換增長。你也把什么獲客成本、用戶終身價值之類的黑話算得明明白白。

但好戲登場了:你肯定看過那張刷屏的 a16z 神圖,說大模型的成本正以每年 10 倍的速度跳水。

于是你盤算著:今年我 20 美元/月能打平,等明年模型便宜 10 倍,Boom!90% 的利潤率到手。虧損只是暫時的,盈利是必然的。

這套算盤,簡單到剛?cè)胄械耐顿Y經(jīng)理都能一眼看懂:

  • 第一年:20 美元/月,勉強收支平衡。

  • 第二年:算力成本降 10 倍,利潤率飆到 90%。

  • 第三年:可以開始挑游艇了。

這策略聽著沒毛病:“大模型推理成本每半年降 3 倍,我們死不了?!?/p>

然而 18 個月過去了,利潤率還是負得觸目驚心……有些公司已經(jīng)倒閉清算,連 Anthropic(Claude 的公司)本周都不得不撤回了他們最初那個“200 美元/月不限量”的旗艦套餐。

所有公司,依舊在流血。

模型的確變便宜了——GPT-3.5 的價格只有過去的十分之一。但不知怎的,利潤反而更差了。

事情不對勁了,對吧?

沒人想要昨天的報紙

GPT-3.5 是便宜了 10 倍。但它現(xiàn)在的吸引力,就像在 iPhone 15 發(fā)布會現(xiàn)場兜售諾基亞。

當(dāng)一個新模型頂著“地表最強”(SOTA)的光環(huán)發(fā)布時,99% 的需求會瞬間涌向它。用戶對他們付費的產(chǎn)品,也是同樣的期待。

現(xiàn)在,我們來看看那些“地表最強”模型——也就是在任何時間點都占據(jù) 99% 需求的模型的真實定價歷史:

發(fā)現(xiàn)什么了嗎?

當(dāng) GPT-4 以 60 美元的“天價”發(fā)布時,盡管上一代王者 GPT-3.5 已經(jīng)便宜了 26 倍,但所有人還是撲向了 GPT-4。

當(dāng) Claude 3 Opus 以同樣的價格登場時,即便 GPT-4 已經(jīng)降價,人們還是紛紛“叛逃”。

所謂的“成本下降 10 倍”是真的,但僅限于那些跟“小霸王學(xué)習(xí)機”一個年代感的舊模型。

所以,“成本會下降”這個策略的第一個支柱就塌了:市場的需求永遠只追逐“當(dāng)下最好的那款模型”。而最好的模型,價格永遠都差不多,因為它就代表了今天頂尖算力所能達到的成本極限。

這就像指著一輛 95 年的老本田說“這車現(xiàn)在真便宜!”,完全沒抓住重點。是,那輛特定的車是便宜了。但 2025 款的豐田凱美瑞,建議零售價還是 3 萬美元。

當(dāng)你花時間與一個 AI 相處時——無論是編程、寫作還是思考——你總是本能地追求最高質(zhì)量。沒人會打開 Claude 然后想:“要不……我換個爛點的版本,幫老板省點錢?”

我們是認知上的“貪婪”生物。我們想要能搞到手的最好的“大腦”,尤其是在天平的另一端是我們自己寶貴的時間。

模型的“胃口”,比我們想的要大得多

“好吧,那也還能接受,對吧?我們永遠保持收支平衡不就行了?”

呵,少年,你還是太天真了。

雖然每一代頂尖模型的“單價”(per token)沒有變得更貴,但另一件更可怕的事情發(fā)生了。

它們消耗的“算力單位”(token)數(shù)量,發(fā)生了核爆炸。

過去,你問 ChatGPT 一個問題,它回你一句話?,F(xiàn)在,一個“深度研究”任務(wù),它會花 3 分鐘做計劃,20 分鐘閱讀資料,再花 5 分鐘為你重寫報告。而最新的 Claude 3 Opus,你跟它說句“你好”,它都能自己“思考”上 20 分鐘。

模型的進化,帶來了一個誰也沒預(yù)料到的結(jié)果:AI 能完成的任務(wù)的“長度”,每六個月就翻一番。過去返回 1000 個 token 的任務(wù),現(xiàn)在能返回 10 萬個。

把這個趨勢推演下去,數(shù)學(xué)模型會變得相當(dāng)瘋狂:

今天,一個 20 分鐘的“深度研究”任務(wù)成本大約是 1 美元。到 2027 年,我們將擁有可以連續(xù)運行 24 小時而“不掉線”的智能體(Agent)……再結(jié)合頂尖模型那雷打不動的價格?

這意味著,一個用戶,一天,光是一個任務(wù),就要花掉 72 美元。而且,你還能同時開好幾個。

一旦我們能部署這種可以異步運行 24 小時的智能體,我們就不會只給它一個指令然后傻等。我們會成批地下達任務(wù)。整個“AI 工人大軍”會并行解決問題,燒起 token 來,就像燒柴火一樣。

顯而易見——我必須強調(diào)這一點——每月 20 美元的訂閱費,連一個用戶每天跑一次 1 美元的“深度研究”任務(wù)都撐不住。但這恰恰是我們正在狂奔的方向。模型能力的每一次提升,都意味著它們能有意義地、在同一時間消耗掉更多算力。

這就像你費老大勁兒,造了個更省油的發(fā)動機,結(jié)果轉(zhuǎn)頭就用它去驅(qū)動一輛巨無霸卡車。沒錯,每加侖油是能跑更遠了,但你現(xiàn)在要用掉比以前多 50 倍的油。

這就是那個把無數(shù) AI 公司逼入絕境的“成本陷阱”——任何采用“固定月費 + 高強度算力消耗”商業(yè)模式的創(chuàng)業(yè)公司,都感覺自己正被人用槍指著腦袋。

Anthropic 的悲壯嘗試

Claude那個“不限量”套餐的實驗,是我們見過應(yīng)對這場風(fēng)暴的最精妙嘗試。他們幾乎用盡了所有招數(shù),但最終還是被碾得粉碎。

他們的劇本,說實話非常聰明:

  1. 定 10 倍的價格:別人收 20 美元,我收 200 美元/月。給自己留足流血前的緩沖墊。

  2. 根據(jù)負載自動切換模型:任務(wù)重的時候,從昂貴的 Opus 切換到便宜的 Sonnet;讀資料這種小事,就用最便宜的 Haiku。這就像給大腦裝了個自動降頻省電的開關(guān)。

  3. 把計算任務(wù)甩給用戶的電腦:既然用戶的 CPU 閑著也是閑著,干嘛要花錢用我自己的服務(wù)器?

盡管有這么多天才的工程設(shè)計,token 的消耗量還是如超新星爆發(fā)一般。

一百億個 tokens。一個月。

這相當(dāng)于一個人在一個月里讀了 125 萬遍《戰(zhàn)爭與和平》。

怎么做到的?即便是連續(xù)跑 10-20 分鐘的任務(wù),怎么能消耗掉這么多?

事實證明,10-20 分鐘的連續(xù)運行,剛好足夠讓用戶發(fā)現(xiàn)“for 循環(huán)”的妙用。一旦 token 的消耗與用戶在屏幕前的時間脫鉤,物理定律就開始接管一切了。

讓 Claude 執(zhí)行一個任務(wù),檢查自己的工作,重構(gòu),優(yōu)化,再來一遍……直到公司破產(chǎn)。

用戶在一夜之間,從聊天者變成了 API 的指揮官,在 Anthropic 的服務(wù)器上 7x24 小時地跑著代碼轉(zhuǎn)換引擎。從聊天到智能體(Agent)的進化,一夜之間就完成了。消耗量暴增 1000 倍。這不是漸變,是相變。

所以 Anthropic 撤回了“不限量”。他們本可以試試 2000 美元/月,但教訓(xùn)不在于他們收費不夠高,而在于:

在這個新世界里,任何訂閱制的“固定價格”,都無法承載“不限量”的使用。

這盤數(shù),已經(jīng)從根本上算不通了。

所有人的“囚徒困境”

這就把其他所有人都推到了一個絕境。

每家 AI 公司都知道,按使用量計費能救命。他們也知道,這會要了他們的命。當(dāng)你老老實實地按 $0.01/1k tokens 收費時,你那被風(fēng)投喂飽的競爭對手,正用 20 美元/月“不限量”的口號搶走你所有用戶。

猜猜用戶會去哪?

經(jīng)典的囚徒困境:

  • 所有人都按量計費→ 行業(yè)可持續(xù)發(fā)展

  • 所有人都包月→ 一起卷向深淵

  • 你按量,別人包月→ 你一個人先死

  • 你包月,別人按量→ 你贏了(然后晚點再死)

所以,每個人都選擇了“背叛”。每個人都在補貼那些“超級用戶”。每個人都在畫著那條漂亮的“曲棍球桿式”增長曲線。每個人也最終都會發(fā)布那篇“關(guān)于定價的重要更新”的公告。

那些頭部的 AI 編程公司,他們都懂這筆賬。他們選擇了要今天的增長,明天的利潤,以及未來的破產(chǎn)——但那是下一任 CEO 要頭疼的事。

說實話?這可能是對的。在圈地運動中,市場份額比利潤率更重要。只要 VC 們還愿意繼續(xù)開支票來掩蓋這糟糕的單位經(jīng)濟模型……

不信?去問問 Jasper(曾經(jīng)的 AI 寫作獨角獸),當(dāng)音樂停止時會發(fā)生什么。

如何逃離這場“死亡擠壓”?

難道就真的無路可逃了嗎?

有三 條路可走:

1. 從第一天起就按使用量計費

沒有補貼,沒有“先圈人后變現(xiàn)”,只有誠實的經(jīng)濟模型。理論上很美。

但現(xiàn)實是,你找一個正在爆發(fā)式增長的、面向消費者的、按量計費的 AI 公司給我看看?消費者討厭計價器。他們寧愿為“無限”多付錢,也不愿收到一張意料之外的賬單。所有成功的消費者訂閱服務(wù)——Netflix、Spotify、ChatGPT——都是固定費率。計價器一開,增長就死。

2. 用超高的“轉(zhuǎn)換成本”來鎖定高利潤

這就是 Devin(那個爆火的 AI 程序員)正在賭的。他們最近宣布了與花旗和高盛的合作,向這兩家公司的數(shù)萬名軟件工程師部署 Devin。

問個問題:你寧愿從高盛那里拿到 1000 萬美元的年收入,還是從 50 萬個開發(fā)者那里拿到 5 億美元?

答案顯而易見:那 1000 萬美元意味著長達六個月的部署、合規(guī)審查、安全審計和采購地獄。這種合同極難贏得——但一旦贏了,就幾乎不可能流失。

當(dāng)競爭對手出現(xiàn)時,你已經(jīng)深深地嵌入了對方的官僚體系中,換掉你的成本高到讓 CFO 寧愿去死。因為轉(zhuǎn)換成本足夠高,客戶對價格也就不那么敏感了,這才能帶來 80-90% 的驚人利潤。

3. 垂直整合:在基礎(chǔ)設(shè)施上賺錢

這是 Replit 的玩法:把 AI 編程助手和應(yīng)用托管、數(shù)據(jù)庫管理、部署監(jiān)控等服務(wù)打包在一起。我在每個 token 上都虧錢,但我從新一代開發(fā)者使用的其他所有服務(wù)層上把錢賺回來。

把 AI 當(dāng)作“鉤子”,用來拉動其他能跟 AWS 競爭的服務(wù)的消費。你賣的不是 AI 算力,你賣的是算力之外的一切。AI 只是你的市場營銷費用。

這招的絕妙之處在于,代碼生成天然地會創(chuàng)造對托管、數(shù)據(jù)庫、監(jiān)控的需求。讓 OpenAI 和 Anthropic 去把 AI 算力的價格卷到零吧,你擁有了除此之外的一切。

至于那些還在玩“固定費率、不惜一切代價增長”游戲的公司?

他們是行尸走肉。只是葬禮定在了今年第四季度,而且會辦得非常風(fēng)光。

前路何方

我總能看到創(chuàng)始人們指著那句“明年的模型會便宜 10 倍!”的口號,仿佛抓住了救命稻草。

是啊,沒錯。

但你的用戶,會對它有 20 倍的期待。

終點線,正在以比你奔跑更快的速度遠離你。

即使是像 Anthropic 這樣擁有全球最頂級應(yīng)用層的公司,也無法讓“固定月費+不限量使用”的模式運轉(zhuǎn)下去。

雖然“早起的鳥兒有蟲吃”這句老話沒錯,但如果你只是起得早,卻沒有任何計劃,那你也只是第一個趕到墓地而已。

這個世界,不會再有谷歌開出 24 億美元的支票來收購一個負利潤的公司了。當(dāng)你的云服務(wù)賬單已經(jīng)超過了你的總收入時,根本不存在“以后再想辦法”這回事。

那么,在這個世界里,你到底該如何建立一家公司?

答案,或許是成為一個“新云商”(Neocloud)——但這是后話了。

不過,至少,明年的模型,確實會便宜 10 倍的。:)

原文鏈接:
https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

(投稿或?qū)で髨蟮溃簔hanghy@csdn.net)

AI 產(chǎn)品爆發(fā),但你的痛點解決了嗎?

2025 全球產(chǎn)品經(jīng)理大會

8 月 15–16 日

北京·威斯汀酒店

互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實戰(zhàn)一線的產(chǎn)品人

12 大專題分享,洞察趨勢、拆解路徑、對話未來。

立即掃碼領(lǐng)取大會PPT

搶占 AI 產(chǎn)品下一波紅利

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
穿“鳥”的人少了,穿“山”的人多了?商場這一幕,太真實了

穿“鳥”的人少了,穿“山”的人多了?商場這一幕,太真實了

白色得季節(jié)
2026-03-06 10:44:56
王健林預(yù)言又準了!2026年,房價要上漲!

王健林預(yù)言又準了!2026年,房價要上漲!

貓叔東山再起
2026-03-08 09:15:03
婆婆把我備的年貨全搬去小叔子家,我過年啥也不買飯桌上她一開口

婆婆把我備的年貨全搬去小叔子家,我過年啥也不買飯桌上她一開口

阿凱銷售場
2026-03-08 09:02:29
黃有龍做夢也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

黃有龍做夢也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

查爾菲的筆記
2025-12-16 15:14:06
美伊開戰(zhàn),越南和菲律賓被打醒!特朗普沒想到:亞太盟友變天了

美伊開戰(zhàn),越南和菲律賓被打醒!特朗普沒想到:亞太盟友變天了

阿芒娛樂說
2026-03-08 04:32:59
簡直離譜,蘋果新款 MacBook 不再附送充電器了!

簡直離譜,蘋果新款 MacBook 不再附送充電器了!

XCiOS俱樂部
2026-03-08 10:31:19
郝龍斌要求大陸承諾:只要臺灣不“獨立”,大陸就不會對臺動武

郝龍斌要求大陸承諾:只要臺灣不“獨立”,大陸就不會對臺動武

琴音繚繞回
2026-03-07 17:17:22
在中國一顆也賣不出去!NVIDIA無奈停產(chǎn)H200芯片:加速Vera Rubin量產(chǎn)

在中國一顆也賣不出去!NVIDIA無奈停產(chǎn)H200芯片:加速Vera Rubin量產(chǎn)

快科技
2026-03-06 12:05:08
汪小菲曝親媽私生活猛料,張?zhí)m公開財產(chǎn)分配,馬筱梅的態(tài)度被罵慘

汪小菲曝親媽私生活猛料,張?zhí)m公開財產(chǎn)分配,馬筱梅的態(tài)度被罵慘

秋姐居
2026-03-07 19:18:45
蘋果頂級服務(wù)拒絕清庫存!主動取消M4 MacBook訂單:換成最新M5

蘋果頂級服務(wù)拒絕清庫存!主動取消M4 MacBook訂單:換成最新M5

快科技
2026-03-06 17:42:15
美國人終于發(fā)現(xiàn)了:中國的東風(fēng)導(dǎo)彈,不用擊沉我們航母,擦著即傷

美國人終于發(fā)現(xiàn)了:中國的東風(fēng)導(dǎo)彈,不用擊沉我們航母,擦著即傷

紀中百大事
2026-03-06 10:02:29
這8種房子千萬不能買,住也不能住,賣也不能賣,心累!

這8種房子千萬不能買,住也不能住,賣也不能賣,心累!

一枚大裝家
2026-03-07 22:25:03
伊朗最高領(lǐng)袖選舉會議將在24小時內(nèi)舉行 多架美軍轟炸機飛抵英軍基地 特朗普稱無計劃部署地面部隊 沖突第一周伊朗共打擊超200處美以目標

伊朗最高領(lǐng)袖選舉會議將在24小時內(nèi)舉行 多架美軍轟炸機飛抵英軍基地 特朗普稱無計劃部署地面部隊 沖突第一周伊朗共打擊超200處美以目標

每日經(jīng)濟新聞
2026-03-08 12:02:43
平頂山舅舅舅媽吃絕戶,亡母被再婚嫁給親弟弟:更多關(guān)鍵環(huán)節(jié)曝光

平頂山舅舅舅媽吃絕戶,亡母被再婚嫁給親弟弟:更多關(guān)鍵環(huán)節(jié)曝光

壹月情感
2026-03-05 16:00:17
有房子的恭喜了!代表提出“取消公攤面積”,已購房人有補償嗎?

有房子的恭喜了!代表提出“取消公攤面積”,已購房人有補償嗎?

專業(yè)聊房君
2026-03-07 16:59:21
這三個國家原本屬于中國,獨立后現(xiàn)狀凄慘,如今他們后悔了嗎?

這三個國家原本屬于中國,獨立后現(xiàn)狀凄慘,如今他們后悔了嗎?

人間無味啊
2026-02-06 06:13:50
OpenClaw養(yǎng)蝦很火,但我勸普通人先別折騰

OpenClaw養(yǎng)蝦很火,但我勸普通人先別折騰

董指導(dǎo)聊科技
2026-03-07 19:48:43
我敢保證:十年后北京朝陽這 3 個地方,你高攀不起

我敢保證:十年后北京朝陽這 3 個地方,你高攀不起

音樂時光的娛樂
2026-03-07 15:09:11
請收藏!WTT重慶冠軍賽賽程出爐,看點全梳理不錯過每個精彩瞬間

請收藏!WTT重慶冠軍賽賽程出爐,看點全梳理不錯過每個精彩瞬間

乒談
2026-03-08 00:10:21
嬪妃侍寢有兩條鐵律:除了不能出聲,還有一條則難以啟齒

嬪妃侍寢有兩條鐵律:除了不能出聲,還有一條則難以啟齒

長風(fēng)文史
2026-02-01 18:54:57
2026-03-08 15:04:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術(shù)的創(chuàng)造者和使用者
2639文章數(shù) 7660關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財經(jīng)要聞

油價要失控?

汽車要聞

9分鐘充飽 全新騰勢Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

本地
藝術(shù)
數(shù)碼
手機
健康

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

藝術(shù)要聞

“北京意象·活力通州”繪畫作品展 | 油畫作品選

數(shù)碼要聞

技嘉發(fā)布Z890 Plus主板,為英特爾Arrow Lake Refresh處理器鋪路

手機要聞

紅魔手機風(fēng)冷散熱逆襲!曾被嘲,友商現(xiàn)跟風(fēng)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進入關(guān)懷版