国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型價(jià)格戰(zhàn),還能再狠一點(diǎn)

0
分享至

誰也不曾想到,大模型產(chǎn)業(yè)的首次“集體會(huì)戰(zhàn)”,居然圍繞價(jià)格展開。

5月6日,私募巨頭幻方旗下的深度求索,打響了降價(jià)第一槍。深度求索發(fā)布的模型DeepSeek-V2(32k),在數(shù)學(xué)、編程、中英文等能力上已逼近GPT-4;然而,DeepSeek-V2的使用價(jià)格僅約為GPT-4o的1/35。

DeepSeek-V2的輸入與輸出價(jià)格分別為1元/百萬tokens和2元/百萬tokens,遠(yuǎn)低于市場(chǎng)價(jià)。

比拼多多砍一刀還便宜的價(jià)格,驚動(dòng)了不少美國專家。知名分析師Dylan Patel讀完DeepSeek-V2的論文后,激動(dòng)地表示,“這可能是今年最好的一篇。[1]”

DeepSeek-V2的論文

一周后,“卷王”字節(jié)跳動(dòng)又添一把火。

豆包通用模型Pro-32k的輸入價(jià)格,被一刀砍到了更低的0.8元/百萬tokens?;鹕揭婵偛米T待表示,“豆包比行業(yè)價(jià)格低了99.3%,大模型從此以厘計(jì)價(jià)?!?/p>

眼看友商如此不講武德,其他科技公司再也坐不住了。

阿里率先回?fù)?,一狠心,大舉下調(diào)了所有模型的價(jià)格。

幾個(gè)小時(shí)后,百度干脆沖向競(jìng)價(jià)終點(diǎn):宣布兩款輕量級(jí)模型全面免費(fèi)。緊接著,科大訊飛星火Lite API、騰訊混元大模型lite 256k也相繼宣布免費(fèi)。

如此盛況,很難不讓人夢(mèng)回那段滴滴大戰(zhàn)快的、ofo摩拜互扯頭發(fā)的激情歲月。

然而,圍繞大模型的價(jià)格戰(zhàn),遠(yuǎn)不如網(wǎng)約車、共享單車那般直觀,各種專業(yè)名詞讓人摸不著頭腦。所以,這些大模型公司,到底在熱鬧些什么?


價(jià)格戰(zhàn)的B面

想要理解這點(diǎn),首先得知曉大模型的商業(yè)模式。以阿里云為例,它所提供的大模型服務(wù),共有3種[2]:

(1)基礎(chǔ)服務(wù):模型推理。

模型推理,指的是根據(jù)輸入的信息內(nèi)容,給出回答的過程。換句話說,推理就是“實(shí)際使用”模型的過程。

阿里云預(yù)置了多個(gè)性能不同的“標(biāo)準(zhǔn)版模型”,供用戶推理。該服務(wù)的計(jì)費(fèi)方式很簡單,即“以量計(jì)價(jià)”:以消耗的token數(shù)量為單位,用得越多,費(fèi)用越高。并且性能越好的模型,收費(fèi)越貴。

token是大模型用來衡量文本長度的一種計(jì)數(shù)單位,可以簡單理解為“字?jǐn)?shù)”。3本篇幅為75萬字的《三國演義》,大約需要125萬個(gè)token。

(2)進(jìn)階服務(wù):模型微調(diào)。

如果覺得“標(biāo)準(zhǔn)版模型”不好用,阿里云還提供了“定制研發(fā)”服務(wù),即模型微調(diào)。具體收費(fèi),則取決于“定制研發(fā)”消耗的計(jì)算資源與開發(fā)周期。

(3)超進(jìn)階服務(wù):模型部署。

當(dāng)用戶需要長期使用大模型時(shí),最好的方式是將它部署到獨(dú)占實(shí)例中。

獨(dú)占實(shí)例,指的是直接承包一個(gè)或多個(gè)物理服務(wù)器的全部資源。翻譯成人話就是,不再只是租一個(gè)商鋪,而是將整個(gè)商業(yè)廣場(chǎng)都租下來。

這么做的好處在于,沒有別的商戶和你搶計(jì)算資源,響應(yīng)速度更快。

其收費(fèi)模式,也是以量計(jì)價(jià),但有兩種形式:阿里是直接按照“商業(yè)廣場(chǎng)”消耗的計(jì)算資源計(jì)費(fèi);除此之外,百度還支持按照模型推理的token數(shù)量計(jì)費(fèi)。

這3種收費(fèi)模式,面向的是企業(yè)與個(gè)人開發(fā)者,代表了大模型開發(fā)由淺入深的過程。而各大科技公司瘋狂砍價(jià)的,其實(shí)是上文提到的“基礎(chǔ)服務(wù)”,即“標(biāo)準(zhǔn)版模型”的推理費(fèi)用。

推理費(fèi)用的具體定價(jià),又分成了“輸入”和“輸出”兩部分。

簡單來說,輸入就是用戶提問的內(nèi)容,而輸出則是大模型的回答??萍脊就鶗?huì)根據(jù)輸入和輸出的token數(shù)量(字?jǐn)?shù)),進(jìn)行兩次計(jì)費(fèi)。

這種復(fù)雜又細(xì)微的差異,很容易成為科技公司的套路。

例如字節(jié)跳動(dòng)的“0.8元/百萬tokens”“比行業(yè)價(jià)格低99.3%”,其實(shí)只是輸入價(jià)格。豆包通用模型Pro-32k的輸出價(jià)格仍是2元/百萬tokens,與DeepSeek-V2等同行持平。

由此可見,別看大模型價(jià)格戰(zhàn)打得火熱,背后實(shí)則另有洞天。


降價(jià)的千層套路

可以發(fā)現(xiàn),本輪價(jià)格戰(zhàn)最為活躍的,基本上都是云計(jì)算公司,代表廠商是BAT和字節(jié)跳動(dòng)。

它們之所以敢如此降價(jià),還是因?yàn)槟軓膭e的地方彌補(bǔ)損失,羊毛出在羊身上。

正如前文提到,降價(jià)乃至免費(fèi)的,其實(shí)只是基礎(chǔ)服務(wù)。

毫無疑問,這可以幫助中小開發(fā)者以更低的成本構(gòu)建應(yīng)用。然而,當(dāng)開發(fā)者或者企業(yè),需要更貼合自身業(yè)務(wù),深入使用大模型時(shí),往往繞不開進(jìn)階的模型微調(diào)和模型部署——這兩項(xiàng)服務(wù),可不是本次價(jià)格戰(zhàn)的主角。

例如百度宣布免費(fèi)的ERNIE-Speed-8K,如果實(shí)際部署,收費(fèi)就變成了5元/百萬tokens[3]。

與此同時(shí),各家降價(jià)最狠的,其實(shí)都是輕量級(jí)的預(yù)置模型;相比之下,性能更強(qiáng)悍的“超大杯”模型,實(shí)際降價(jià)幅度沒有那么夸張。

例如阿里的Qwen-Max,實(shí)際與字節(jié)跳動(dòng)的豆包通用模型Pro-32k一樣,只是降低了輸入的價(jià)格;而隔壁的百度,壓根沒提超大杯模型。

云計(jì)算廠商的價(jià)格戰(zhàn),更像是用“免費(fèi)游戲”的形式吸引更多玩家加入;但若想繼續(xù)“升級(jí)變強(qiáng)”,該氪金還得氪金。

當(dāng)然,云計(jì)算廠商并非唯一的參與者。

以深度求索與智譜AI為代表的明星初創(chuàng)公司,之所以也敢跟進(jìn)內(nèi)卷,很大程度上是因?yàn)橛谐渥愕膹椝帲绕涫撬懔Y源。

早在大模型尚未爆發(fā)的2020年,背靠私募巨頭幻方的深度求索,就投資了上億元籌建AI超級(jí)計(jì)算機(jī)。

目前,幻方是除BAT、商湯、字節(jié)跳動(dòng)外,第六家擁有1萬張以上英偉達(dá)A100 GPU儲(chǔ)備的中國公司[4]。

而智譜AI則背靠阿里和騰訊,是估值過百億的AI獨(dú)角獸公司。

2020年時(shí),智譜AI也碰巧囤積了不少GPU資源。 其CEO張鵬曾在接受《中國企業(yè)家》采訪時(shí)提到:

當(dāng)時(shí),他認(rèn)識(shí)的一家云計(jì)算廠商,有一批GPU積灰了。 這批GPU原本是供應(yīng)給游戲公司的,但陰差陽錯(cuò)之下,對(duì)方又不買了。 張鵬知道這個(gè)消息后,順勢(shì)接盤了這批計(jì)算資源[5]。

現(xiàn)金流、算力資源都充足的情況下,即便燒錢換市場(chǎng),這些初創(chuàng)公司也能扛得住。

那么問題來了:當(dāng)年移動(dòng)互聯(lián)網(wǎng)補(bǔ)貼換市場(chǎng),尚可以簡單粗暴地歸因?yàn)椤凹夹g(shù)門檻低”;主打一手高科技的大模型,怎么也沒走出價(jià)格戰(zhàn)的怪圈?


必經(jīng)之路

大模型智能化帶給世人的震撼,往往讓人忽視它的本質(zhì),其實(shí)是一種基礎(chǔ)設(shè)施。

去年,知名計(jì)算機(jī)科學(xué)家吳恩達(dá)曾在公開演講中提到:

AI其實(shí)是一系列工具的集合。這些工具包括了監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),以及現(xiàn)在的生成式人工智能。 所有這些都是通用技術(shù),意味著它與電力和互聯(lián)網(wǎng)等其他通用技術(shù),并沒有什么區(qū)別[6]。

電力與互聯(lián)網(wǎng),并沒法直接創(chuàng)造價(jià)值;真正改變世界的,其實(shí)電燈、電腦、電商、電子游戲。

然而,應(yīng)用的爆發(fā)其實(shí)有一個(gè)前提:即基礎(chǔ)設(shè)施足夠便宜。此前,大模型應(yīng)用沒能快速鋪開的一個(gè)主要困境,正是使用成本過高。

哄哄模擬器就是一個(gè)典型的案例。

今年年初,一位名叫王登科的獨(dú)立開發(fā)者,開發(fā)了一款模擬“生氣女朋友”形象的AI應(yīng)用。該應(yīng)用的玩法很簡單,用戶必須斗智斗勇哄好對(duì)話窗口里的AI女友。

因?yàn)榻换ズ唵魏土⒁忸H有情趣,哄哄模擬器上線第一天就吸引了60多萬用戶。

突然的爆紅,卻讓王登科哭笑不得。哄哄模擬器使用了預(yù)置的GPT-3.5模型,運(yùn)營一早上就花了他2000多美金的推理費(fèi)用。

這就相當(dāng)于,開發(fā)了個(gè)App,還沒想到咋賺錢,先交了1萬塊錢電費(fèi)。

縱觀歷史可以發(fā)現(xiàn),當(dāng)年移動(dòng)互聯(lián)網(wǎng)的大規(guī)模普及,也是建立在基礎(chǔ)設(shè)施降本之上的。

2014年的一份調(diào)查報(bào)告顯示,當(dāng)時(shí)由于流量費(fèi)用高昂,手機(jī)用戶每天使用流量不會(huì)超過3小時(shí)。且不使用移動(dòng)網(wǎng)絡(luò)時(shí),很多用戶會(huì)選擇將其關(guān)閉,以防止手機(jī)應(yīng)用在后臺(tái)消耗流量[7]。

彼時(shí),大多數(shù)用戶,都曾做過“一覺醒來房子歸中國移動(dòng)”的噩夢(mèng)。

2013年的時(shí)候,快手就明確了“短視頻社區(qū)”的定位,但增長相對(duì)緩慢。這背后,很難說沒有大環(huán)境的原因。

事實(shí)上,直到電信運(yùn)營商開始大搞“降費(fèi)提速”,短視頻行業(yè)才真正開始爆發(fā)。

2019年,手機(jī)上網(wǎng)流量資費(fèi)較2014年時(shí)已下降了超90%[8]。至此,手機(jī)淘寶、微信、抖音等才逐漸成為字面意義上的“國民應(yīng)用”。

由此可見,降價(jià)其實(shí)是大模型產(chǎn)業(yè)發(fā)展的必經(jīng)之路。

也許在這輪價(jià)格戰(zhàn)中,云計(jì)算廠商與初創(chuàng)公司,各有各的小九九;但對(duì)開發(fā)者和普通用戶來說,建議可以打得再狠一點(diǎn)。


參考資料

[1] OpenAI Is Doomed,SemiAnalysis

[2] 阿里云大模型服務(wù)平臺(tái)百煉

[3] 千帆大模型平臺(tái)

[4] 量化巨頭發(fā)布第一代大模型:免費(fèi)商用,完全開源,澎湃新聞

[5] 智譜AI CEO張鵬:中國大模型創(chuàng)業(yè)者,不再追隨OpenAI,中國企業(yè)家

[6] Andrew Ng: Opportunities in AI - 2023,Stanford Online

[7] 2014年中國手機(jī)流量使用報(bào)告:近四成用戶流量不夠用,中國新聞網(wǎng)

[8] 工業(yè)和信息化部組織召開“提速降費(fèi)”用戶面對(duì)面座談會(huì)

編輯:陳彬

視覺設(shè)計(jì):疏睿

責(zé)任編輯:陳彬

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗專家會(huì)議成員:必須加快國家領(lǐng)導(dǎo)層選舉

伊朗專家會(huì)議成員:必須加快國家領(lǐng)導(dǎo)層選舉

界面新聞
2026-03-07 20:02:32
印度回應(yīng)美國30天豁免令:印方購買俄石油從不需要得到任何國家許可

印度回應(yīng)美國30天豁免令:印方購買俄石油從不需要得到任何國家許可

財(cái)聯(lián)社
2026-03-07 17:43:12
重力炸彈即將大規(guī)模上場(chǎng),波斯面臨更大的壓力

重力炸彈即將大規(guī)模上場(chǎng),波斯面臨更大的壓力

高博新視野
2026-03-06 17:49:29
京東剛發(fā)了2025年財(cái)報(bào),用“慘不忍睹”形容毫不為過。

京東剛發(fā)了2025年財(cái)報(bào),用“慘不忍睹”形容毫不為過。

流蘇晚晴
2026-03-07 18:24:50
萬萬沒想到!兩會(huì)最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動(dòng)

萬萬沒想到!兩會(huì)最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動(dòng)

查爾菲的筆記
2026-03-05 20:24:50
尼克松晚年坦言:他很后悔當(dāng)初訪華,只因毛主席識(shí)破的訪華計(jì)謀!

尼克松晚年坦言:他很后悔當(dāng)初訪華,只因毛主席識(shí)破的訪華計(jì)謀!

冰語歷史
2026-03-07 06:23:39
伊朗發(fā)視頻嘲諷:500萬美元導(dǎo)彈摧毀10美元假直升機(jī) 這就是所謂的“精準(zhǔn)勝利”

伊朗發(fā)視頻嘲諷:500萬美元導(dǎo)彈摧毀10美元假直升機(jī) 這就是所謂的“精準(zhǔn)勝利”

閃電新聞
2026-03-07 14:00:07
墻倒眾人推!多人再錘張杰出軌,拿謝娜當(dāng)跳板,薛之謙才是大贏家

墻倒眾人推!多人再錘張杰出軌,拿謝娜當(dāng)跳板,薛之謙才是大贏家

離離言幾許
2026-03-05 12:33:31
16GB+1TB!新機(jī)官宣:3月10日,全面開售!

16GB+1TB!新機(jī)官宣:3月10日,全面開售!

科技堡壘
2026-03-07 11:00:58
美國完全沒料到!伊朗大阿亞圖拉全球追殺令,3億教徒裁決特朗普

美國完全沒料到!伊朗大阿亞圖拉全球追殺令,3億教徒裁決特朗普

好賢觀史記
2026-03-07 16:38:35
證監(jiān)會(huì)發(fā)布短線交易監(jiān)管新規(guī) 自2026年4月7日起施行

證監(jiān)會(huì)發(fā)布短線交易監(jiān)管新規(guī) 自2026年4月7日起施行

每日經(jīng)濟(jì)新聞
2026-03-07 15:52:02
請(qǐng)注意:10日美以將進(jìn)入伊朗空域全面轟炸,福特號(hào)已前往波斯灣

請(qǐng)注意:10日美以將進(jìn)入伊朗空域全面轟炸,福特號(hào)已前往波斯灣

邵旭峰域
2026-03-07 17:50:03
伊朗這場(chǎng)仗,已經(jīng)卷入了18個(gè)國家

伊朗這場(chǎng)仗,已經(jīng)卷入了18個(gè)國家

鳳眼論
2026-03-07 07:52:20
36歲女子洗澡熱水器突然爆炸,全身95%皮膚嚴(yán)重燙傷,當(dāng)事人:熱水器多年長時(shí)間通電感應(yīng)器失效

36歲女子洗澡熱水器突然爆炸,全身95%皮膚嚴(yán)重燙傷,當(dāng)事人:熱水器多年長時(shí)間通電感應(yīng)器失效

I河源
2026-03-06 23:37:32
伊朗女足被逼唱國歌!否則親屬將被逮捕 遭批:叛國者 可判絞刑

伊朗女足被逼唱國歌!否則親屬將被逮捕 遭批:叛國者 可判絞刑

念洲
2026-03-07 20:39:56
伊朗軍方:任何向敵人提供領(lǐng)空和領(lǐng)土的國家都是合法打擊目標(biāo)

伊朗軍方:任何向敵人提供領(lǐng)空和領(lǐng)土的國家都是合法打擊目標(biāo)

新華社
2026-03-07 20:10:07
淪為共享單車的女色虎

淪為共享單車的女色虎

深度報(bào)
2026-03-05 22:39:27
西貝再暴大雷!總部人去樓空,新任領(lǐng)導(dǎo)威逼員工,300人討薪無門

西貝再暴大雷!總部人去樓空,新任領(lǐng)導(dǎo)威逼員工,300人討薪無門

離離言幾許
2026-03-07 15:53:37
隨著海港1-2輸河南,海牛1-3,中超最新積分:榜首領(lǐng)先墊底隊(duì)12分

隨著海港1-2輸河南,海牛1-3,中超最新積分:榜首領(lǐng)先墊底隊(duì)12分

小火箭愛體育
2026-03-07 21:38:06
韓磊稅務(wù)罰單落地,豪宅被查封,一首歌收85萬為何還要逃稅?

韓磊稅務(wù)罰單落地,豪宅被查封,一首歌收85萬為何還要逃稅?

老特有話說
2026-03-06 21:52:34
2026-03-07 23:23:00
遠(yuǎn)川科技評(píng)論 incentive-icons
遠(yuǎn)川科技評(píng)論
用投資視角,扒巨頭秘史
377文章數(shù) 2281關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

針對(duì)"不敢休、不讓休"怪圈 國家出手了

頭條要聞

日本求美國給個(gè)準(zhǔn)話 美方避而不談

頭條要聞

日本求美國給個(gè)準(zhǔn)話 美方避而不談

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財(cái)產(chǎn)分配

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

本地
游戲
家居
親子
公開課

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

《殺戮尖塔2》破44萬在線!輝煌神作再創(chuàng)新高

家居要聞

暖棕撞色 輕法奶油風(fēng)

親子要聞

有些一個(gè)人去產(chǎn)檢的孕婦不值得可憐!網(wǎng)友:出事了罵一頓都是輕的

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版