国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI的命門,決定了大模型公司的未來

0
分享至


如果Scaling Law是指導(dǎo)大模型能力提升最重要的標(biāo)尺,那么“算力成本控制”就是大模型行業(yè)發(fā)展和商業(yè)化的基石。

年初DeepSeek在國外開源社區(qū)首先爆火,一個很重要的原因就是,DeepSeek幾乎將同性能模型的推理算力和訓(xùn)練算力成本都降到了10%以內(nèi)。MoE架構(gòu)也在GPT-4發(fā)布之后,逐漸取代了稠密架構(gòu),成為了幾乎所有大模型開發(fā)商的默認(rèn)選項,最核心的原因也是能夠有效降低模型推理的算力成本。

而OpenAI伴隨著GPT-5發(fā)布第一次與用戶見面的“路由(routing)”功能,設(shè)計本意也是代替用戶來把簡單問題匹配到低消耗模型,復(fù)雜問題匹配到能力和算力消耗高的推理模型,從而有效提升用戶體驗和算力效率,但卻變成AI圈最知名的“降本增笑”事件。


即便是GPT-5發(fā)布接近了一個月,OpenAI還是沒有能讓所有用戶滿意,網(wǎng)友依然還在吐槽,GPT-5沒有辦法解決一些很簡單的問題。雖然隨著OpenAI回滾了GPT-4o,還讓用戶能夠手動在推理模型和基本模型間切換,讓大多數(shù)用戶開始同意OpenAI宣稱的“GPT-5性能明顯強于之前的模型”,但是Sam Altman自己也沒有辦法否認(rèn),GPT-5的發(fā)布確實是漏洞百出。


而造成翻車最直接的原因,就是他們強推的路由功能沒有能夠?qū)⒂脩舻念A(yù)期和相應(yīng)的模型能力匹配好。

01

那么問題來了,為什么OpenAI要冒著GPT-5“發(fā)布即翻車”的風(fēng)險,也要強推路由功能?


第一個最直接的原因就是,在GPT-5發(fā)布之前,OpenAI并行推出了5個以上的模型,讓用戶能夠根據(jù)自己需求來選擇合適的模型。隨著模型越來越多,別說普通用戶了,就是ChatGPT的重度用戶,有時候也很難決定使用哪個模型是最合適自己當(dāng)前任務(wù)的。


對于立志于將ChatGPT打造成為AI時代超級APP的OpenAI,不可能允許這樣的情況持續(xù)存在。特別是對于大量沒有接觸過大模型的普通用戶,替他們針對不同的任務(wù)選擇合適的模型,是OpenAI在某一個時間點必須要做的事情。

而另一個更深層次的原因在于,從算力成本的角度出發(fā),自從推理模型出現(xiàn)之后,每一次對于大模型的詢問,都需要在推理模式和非推理模式之間進(jìn)行一次選擇。而這種調(diào)配“深度思考”能力的效率,決定了大模型產(chǎn)品對于算力的使用效率。

根據(jù)學(xué)術(shù)界對于推理模型和非推理模型的研究結(jié)果,推理模型和飛推理模型的算力差異巨大,可能達(dá)到5-6倍。對于復(fù)雜問題,通過思維鏈等技術(shù)進(jìn)行推理后內(nèi)部消耗的推理token數(shù)可能高達(dá)上萬個。


而在延遲上,推理過程和非推理過程的差異就更加巨大了,根據(jù)OpenAI自己發(fā)布的數(shù)據(jù),使用推理模型回答復(fù)雜問題所需要的時間,可能是使用非推理模型的60倍以上。

而就算對于很多需要復(fù)雜推理的任務(wù)在消耗了巨大的算力以及大量的時間之后, 之后給出的結(jié)果和準(zhǔn)確性差異往往就在5%左右。為了這5%的性能提升,消耗多大的算力合適呢?


做一個簡單的算術(shù)題,如果OpenAI將所有任務(wù)都默認(rèn)使用推理模型來完成,路由功能能夠幫助OpenAI識別出10%的問題可以通過簡單的非推理模型完成,就可能將算力成本降低8%(推理非推理算力比值為5:1)。

如果將這個比例進(jìn)一步提高,能夠降低的算力成本將更加可觀。對于OpenAI這樣一個需要服務(wù)數(shù)億用戶,而且算力供應(yīng)依然非常緊張的公司來說,路由功能是否能發(fā)揮作用可以說關(guān)系到自身商業(yè)模式是否可持續(xù)的核心能力。

在行業(yè)層面,第三方平臺(如 OpenRouter)把“自動路由與回退(fallback)”做成基建能力:當(dāng)主模型擁塞、限流或內(nèi)容拒絕時,按策略自動切換到次優(yōu)模型,以穩(wěn)定用戶體驗。微軟的Azure這樣的AI算力云供應(yīng)商,也將不同模型之間的路由能力作為AI云計算的一大賣點。


也許,GPT-5發(fā)布之后,對于OpenAI來說最重要的事情就是在“質(zhì)量-延遲-成本”的三角中尋找每條請求的最優(yōu)平衡點。而目前官方對 GPT-5 的定位與“內(nèi)置思考(built-in thinking)”敘事,實際上就是把“路由+推理強度”做成默認(rèn)能力,并在 ChatGPT 端通過“Auto/Fast/Thinking”給了用戶一定程度的可見與可控性。

02

為大模型打造一個高效的路由功能到底有多難?

這個問題,外媒在一篇報道中向UIUC的一名計算機專業(yè)的助理教授求證,得到的回答是“可能是一個亞馬遜推薦系統(tǒng)級別的問題,需要大量專家努力工作數(shù)年時間才能獲得一個滿意的結(jié)果?!蹦P拖到y(tǒng)層面的路由功能本質(zhì)是“多目標(biāo)+強約束”的工程問題。 路由不是只拼準(zhǔn)確率,還要在質(zhì)量、延遲、成本、配額/峰值容量、成功率之間做實時優(yōu)化。


而且從理論上來說,語義級別的路由功能在效率上來看,遠(yuǎn)遠(yuǎn)不是這問題的最優(yōu)解。DeepSeek在上周放出的DeepSeek V3.1就在嘗試將推理模型和非推理模型混合起來,在一個更深層次上打造出一個效率更高的路由系統(tǒng),從而從根本上提高大模型的“推理-非推理”的選擇效率。

根據(jù)網(wǎng)友體驗之后的感受,新的混合推理模型相比之前R1有著更快的思考速度:相較于 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短的時間內(nèi)得出答案。

并且在回答性能相似的前提下,輸出長度有明顯的下降:新的推理模型在簡單問題上,推理過程有約10%以上的縮短。正式輸出的部分,新模型大幅精簡,平均僅有1000字,比R1 0528的平均2100字的水平提高了接近一倍。

但是另一方面,新的混合推理模型也爆出了一些不太穩(wěn)定的問:比如會不時的在很多輸出中出現(xiàn)莫名其妙的“極”bug:答案中出現(xiàn)很多完全不相關(guān)的“極”


而且在R1上就存在的中英夾雜的情況似乎變得更加嚴(yán)重了,就像一個剛回國不久的留學(xué)生,在很多中文任務(wù)中會顯得很出戲。

即使像DeepSeek這樣的國內(nèi)最頂尖的大模型團(tuán)隊,將“推理-非推理”選擇功能內(nèi)置到模型內(nèi)部,模型的穩(wěn)定性上也會出現(xiàn)一定程度的問題。而OpenAI和DeepSeek在自己各自首個推出的試圖高效調(diào)度“深度思考”能力的模型上都出現(xiàn)了不同程度的翻車,側(cè)面反應(yīng)出要處理好這個問題的難度。

03

提高效率的另一面,是OpenAI依然處于對于算力的“極度渴求”的狀態(tài)中。


年初DeepSeekV3和R1的推出引發(fā)的全世界對于英偉達(dá)等算力供應(yīng)商未來前景的擔(dān)憂,在短短幾個月之后就演變成了“AI成本悖論”——token單價下降但是模型的性能不斷成長,使得原本交由模型處理本來會顯得不經(jīng)濟的任務(wù)也能交給大模型處理,模型能夠處理的任務(wù)將更多樣與復(fù)雜,從而會進(jìn)一步推高token總量的需求。

OpenAI 正在推進(jìn)代號Stargate的基礎(chǔ)設(shè)施擴張計劃:2025 年 7 月,OpenAI 與 Oracle 宣布在美國新增 4.5 GW 數(shù)據(jù)中心能力。


昨天,外媒也報道OpenAI 正物色印度當(dāng)?shù)睾献骰锇椋⒂媱澰谛碌吕镌O(shè)立辦公室,把印度(其第二大用戶市場)的用戶增長與本地算力配置對接起來,在印度建設(shè)至少1Gw規(guī)模的數(shù)據(jù)中心。


“AI成本悖論”一方面不斷推高英偉達(dá)和AI云服務(wù)商的業(yè)績,同時也對像能夠有效降低模型算力需求的“路由”功能提出了更高的要求。

Sam Altman 反復(fù)強調(diào)“2025 年底上線的GPU 超過 100 萬片”的目標(biāo),且把長遠(yuǎn)愿景瞄準(zhǔn)“一億 GPU 量級”。這類表態(tài)從側(cè)面說明:即便推理單價在下降,更復(fù)雜的任務(wù)與更高的調(diào)用量讓大模型的“總賬單”并不會自動下降——必須靠路由把昂貴的推理時段“留給更需要的人”。

如果從大模型的第一性原理出發(fā),所有大模型公司追求的最終極標(biāo)準(zhǔn),就是不斷提升“算力兌換智力”的效率。而高效調(diào)度“深度思考”的能力,在推理大模型時代某種程度決定了大模型公司能否在系統(tǒng)和商業(yè)效率以及用戶體驗上領(lǐng)先全行業(yè)。


歡迎在評論區(qū)留言~
如需開白請加小編微信:dongfangmark


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
再見了48V12Ah鉛酸電池,2026年買新國標(biāo)電動自行車,選這4種電池

再見了48V12Ah鉛酸電池,2026年買新國標(biāo)電動自行車,選這4種電池

電動車的那些事兒
2026-01-07 08:03:26
泡泡瑪特回應(yīng)李在镕買了100個Labubu

泡泡瑪特回應(yīng)李在镕買了100個Labubu

中新經(jīng)緯
2026-01-06 20:16:13
32歲未婚獨生女重度抑郁了!父母雙亡,只留下一套房和160萬存款

32歲未婚獨生女重度抑郁了!父母雙亡,只留下一套房和160萬存款

火山詩話
2026-01-05 08:57:12
接觸的人多了你會明白如果一個人還在穿5年前的衣服只說明3個問題

接觸的人多了你會明白如果一個人還在穿5年前的衣服只說明3個問題

深度報
2026-01-05 22:52:09
七八十年代流行全國的“的確良”,為何突然消失了?其實它改了名

七八十年代流行全國的“的確良”,為何突然消失了?其實它改了名

云霄紀(jì)史觀
2026-01-06 02:00:19
美國強擄馬杜羅,委內(nèi)瑞拉31噸黃金歸屬案重新浮出水面!

美國強擄馬杜羅,委內(nèi)瑞拉31噸黃金歸屬案重新浮出水面!

金十?dāng)?shù)據(jù)
2026-01-07 08:26:43
沈祥福、高洪波、楊晨當(dāng)選北京市足協(xié)副主席

沈祥福、高洪波、楊晨當(dāng)選北京市足協(xié)副主席

澎湃新聞
2026-01-07 04:22:04
穆里尼奧和阿莫林對曼聯(lián)都諱莫如深,原來封口費,不包含違約金里

穆里尼奧和阿莫林對曼聯(lián)都諱莫如深,原來封口費,不包含違約金里

穆里尼奧主義者
2026-01-07 08:19:20
廣東最好高校最新排名公布暨大44,廣工接近深大,莞工138

廣東最好高校最新排名公布暨大44,廣工接近深大,莞工138

戶外小阿隋
2026-01-07 00:52:13
美的集團(tuán)方洪波罕見在《新聞聯(lián)播》露臉

美的集團(tuán)方洪波罕見在《新聞聯(lián)播》露臉

一見財經(jīng)
2026-01-07 08:30:26
陜西一老漢,把西鳳酒灌入茅臺瓶,拿去鑒定沒想到被行家說是真品

陜西一老漢,把西鳳酒灌入茅臺瓶,拿去鑒定沒想到被行家說是真品

濤哥美食匯
2026-01-06 09:01:22
特斯拉突然官宣:26.35萬起,新車正式發(fā)布!

特斯拉突然官宣:26.35萬起,新車正式發(fā)布!

高科技愛好者
2026-01-06 22:54:18
密密麻麻!浙江24歲女子后悔,短短一年內(nèi)敏感部位全長滿!醫(yī)生:早該重視了……

密密麻麻!浙江24歲女子后悔,短短一年內(nèi)敏感部位全長滿!醫(yī)生:早該重視了……

臺州交通廣播
2026-01-07 06:53:53
芯片禁令升級!荷蘭正式發(fā)布DUV斷供通告,美方圍堵計劃會得逞嗎

芯片禁令升級!荷蘭正式發(fā)布DUV斷供通告,美方圍堵計劃會得逞嗎

科學(xué)知識點秀
2026-01-07 08:00:04
出大事了,托卡耶夫犯了大忌,參拜日本明治神宮,還要給日稀土?

出大事了,托卡耶夫犯了大忌,參拜日本明治神宮,還要給日稀土?

無情有思可
2025-12-31 18:01:20
蘇富比5.9億“稀世粉鉆”慘遭流拍,西方巨頭破防:河南負(fù)全責(zé)!

蘇富比5.9億“稀世粉鉆”慘遭流拍,西方巨頭破防:河南負(fù)全責(zé)!

詩意世界
2025-12-31 17:59:26
外交部回應(yīng)“中國沒有譴責(zé)俄羅斯”

外交部回應(yīng)“中國沒有譴責(zé)俄羅斯”

臺州交通廣播
2026-01-06 21:24:37
調(diào)崗調(diào)到舒服崗位是什么體驗?網(wǎng)友:這簡直是世外桃源

調(diào)崗調(diào)到舒服崗位是什么體驗?網(wǎng)友:這簡直是世外桃源

另子維愛讀史
2025-12-26 16:14:37
勇士輸快船后,伊塞亞·托馬斯盛贊庫里為勇士球迷奉獻(xiàn)“表演”

勇士輸快船后,伊塞亞·托馬斯盛贊庫里為勇士球迷奉獻(xiàn)“表演”

好火子
2026-01-07 04:32:08
“浙BA”余姚隊隨隊工作人員張挺,多次比賽中情緒激動做出不當(dāng)舉動,處罰措施公布

“浙BA”余姚隊隨隊工作人員張挺,多次比賽中情緒激動做出不當(dāng)舉動,處罰措施公布

都市快報橙柿互動
2026-01-07 00:49:32
2026-01-07 09:11:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

馬斯克殺瘋了!xAI官宣200億美元融資

頭條要聞

河北農(nóng)村居民:"煤改氣"后 160平空間燃?xì)赓M最少8千元

頭條要聞

河北農(nóng)村居民:"煤改氣"后 160平空間燃?xì)赓M最少8千元

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財經(jīng)要聞

茅臺為何要和分銷商徹底說拜拜?

汽車要聞

摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

時尚
房產(chǎn)
本地
藝術(shù)
公開課

冬天穿衣既要有溫度又要有風(fēng)度!看看這些穿搭,優(yōu)雅又顯瘦

房產(chǎn)要聞

爆發(fā)!三亞開年超千畝城更計劃曝光,香港城砸下100億!

本地新聞

云游內(nèi)蒙|初見呼和浩特,古今交融的北疆都會

藝術(shù)要聞

你也在學(xué)書法?先楷后行的秘密曝光!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版