国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中國(guó)開(kāi)源模型,如何超越2025年

0
分享至

臨近年底,全球大模型競(jìng)爭(zhēng)已提前拉開(kāi)2026年序幕。

在中國(guó),MiniMax與月之暗面相繼開(kāi)源旗艦?zāi)P,百度高達(dá)2.4萬(wàn)億參數(shù)規(guī)模的文心5.0正式登場(chǎng),社區(qū)還在等待阿里的Qwen以及DeepSeek的下一步。在美國(guó),OpenAI的GPT-5.1今日發(fā)布,谷歌的Gemini 3已經(jīng)拉滿預(yù)期,馬斯克也曾預(yù)告Grok 5年底登場(chǎng)。

短短一年,中國(guó)開(kāi)源模型從不為世界所知,崛起至讓硅谷倍感壓力。“價(jià)廉物美”是今年中國(guó)開(kāi)源模型主調(diào),甚至,部分模型可以打著“發(fā)布時(shí)間差”,宣告在選定測(cè)試基準(zhǔn)上后發(fā)制人的超越。但隨著商業(yè)化壓力劇增,明年,開(kāi)源與閉源相互攻防,將圍繞著token經(jīng)濟(jì)學(xué)展開(kāi)。

基準(zhǔn)飽和,擴(kuò)展不靈

過(guò)去一年,中國(guó)開(kāi)源模型參與的全球AI競(jìng)爭(zhēng),核心敘事就是在訓(xùn)練與推理上花更少的錢,接近前沿模型的水平。隨著內(nèi)部混亂不已的Meta逐步退出競(jìng)爭(zhēng),開(kāi)源AI的競(jìng)賽;明年的目標(biāo)是進(jìn)一步縮小與最領(lǐng)先的閉源模型之間的性能差距。

市場(chǎng)對(duì)中國(guó)開(kāi)源模型在部分基準(zhǔn)測(cè)試中取得短暫領(lǐng)先感到興奮。但這種“錯(cuò)覺(jué)”不會(huì)一直持續(xù)下去。一方面,開(kāi)源模型更新頻率更高,追趕差距往往只是發(fā)布時(shí)間的錯(cuò)位;另一方面,擴(kuò)展定律邊際放緩,也在為中國(guó)短期內(nèi)逼近前沿打開(kāi)了時(shí)間窗口。追趕者天然具備成本優(yōu)勢(shì)。

基準(zhǔn)測(cè)試已經(jīng)飽和。大模型的真實(shí)進(jìn)步,越來(lái)越難被基準(zhǔn)捕捉。行業(yè)正在吸取Meta在Llama4上的教訓(xùn),拒絕以打榜基準(zhǔn)為目標(biāo)而主動(dòng)“作弊”,但很多時(shí)候,模型被測(cè)試集“污染”的情況仍然難以避免。當(dāng)模型在基準(zhǔn)分?jǐn)?shù)上差距越來(lái)越難以分辨,各家公司開(kāi)始靠營(yíng)銷來(lái)“差異化”自己,進(jìn)一步降低了基準(zhǔn)公信力。這又放大了外界對(duì)開(kāi)源模型測(cè)試成績(jī)的質(zhì)疑。某些情況下,第三方配置環(huán)境與參數(shù)的不同也會(huì)導(dǎo)致測(cè)試水平波動(dòng)。

行業(yè)需要更新驗(yàn)證創(chuàng)新的基準(zhǔn),也需要重新探索創(chuàng)新的路徑。硅谷大神卡帕西,只依賴最終獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí),往往會(huì)誤獎(jiǎng)中間的錯(cuò)誤步驟,也錯(cuò)過(guò)過(guò)程中的靈光一閃。中國(guó)研究團(tuán)隊(duì)也質(zhì)疑,可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)(RLVR)并未真正涌現(xiàn)超出預(yù)訓(xùn)練的推理能力。大模型對(duì)這個(gè)世界的理解,仍然是預(yù)訓(xùn)練數(shù)據(jù)集“分布內(nèi)”的知識(shí),但是,大模型預(yù)訓(xùn)練擴(kuò)展定律卻已經(jīng)“死亡”。

行業(yè)正在探索新的可能。Transformer八子中的Ashish Vaswani,批評(píng)業(yè)界對(duì)后訓(xùn)練的沉迷是短期驅(qū)動(dòng),掩蓋了預(yù)訓(xùn)練創(chuàng)新的長(zhǎng)期改進(jìn)空間;Llion Jones正在重新審視那些可以追溯到Transformer之前的想法。傳言離開(kāi)Meta的楊立昆,醞釀在世界模型領(lǐng)域創(chuàng)業(yè),加入與李飛飛團(tuán)隊(duì)的競(jìng)爭(zhēng)。但這些嘗試都仍處于早期,解不了近憂。

創(chuàng)新“停滯”倒逼著商業(yè)變現(xiàn),對(duì)AI泡沫的。明年,開(kāi)源模型與閉源模型的性能競(jìng)爭(zhēng),最終將落在token經(jīng)濟(jì)學(xué)之上。它與當(dāng)前絕大多數(shù)評(píng)測(cè)基準(zhǔn)沒(méi)有直接關(guān)系。這次,OpenAI發(fā)布GPT-5.1,就已經(jīng)跳出了這個(gè)數(shù)字游戲。一切,最終用戶說(shuō)了算,在工作場(chǎng)景中創(chuàng)造價(jià)值說(shuō)了算。

token經(jīng)濟(jì)學(xué)

這一輪AI創(chuàng)新的基本元素是token。它的單位成本與消耗量決定了任務(wù)成本,任務(wù)的經(jīng)濟(jì)價(jià)值又決定了token的價(jià)值。當(dāng)然,經(jīng)濟(jì)還涉及“周轉(zhuǎn)率”。吞吐這些token的速度,決定著單位時(shí)間能創(chuàng)造多少價(jià)值。

中國(guó)開(kāi)源模型仍在以極致性價(jià)比,向美國(guó)閉源陣營(yíng)施壓。目前,在Artificial Analysis的榜單中,最新發(fā)布的MiniMax-M2與Kimi-K2-Thinking,都處于性能表現(xiàn)略遜于GPT-5(high),但單位成本優(yōu)勢(shì)明顯的象限內(nèi)。其他處于這一象限模型,也大多出自中國(guó)企業(yè)之手。價(jià)廉物美是中國(guó)開(kāi)源模型今年崛起的基調(diào),明年也將如此。


中國(guó)的這一優(yōu)勢(shì),來(lái)自算力“卡脖子”的倒逼創(chuàng)新。為了突破算力限制,中國(guó)開(kāi)源大模型普遍將自注意力機(jī)制等優(yōu)化作為創(chuàng)新重點(diǎn),盡可能地。DeepSeek與智譜還,以應(yīng)對(duì)越來(lái)越長(zhǎng)的上下文窗口。今年,DeepSeek帶動(dòng)了中國(guó),也引發(fā)了一波又一波的價(jià)格戰(zhàn)。明年,中國(guó)開(kāi)源模型會(huì)不會(huì)進(jìn)一步卷到自研模型的歐美企業(yè)數(shù)量進(jìn)一步收斂?

但并非只有算法才會(huì)影響的token單位成本。AI芯片與內(nèi)存、通信硬件的性能及其能效,也發(fā)揮重要作用。黃仁勛一直鼓吹“買得越多,省得越多”,就是從硬件與基礎(chǔ)設(shè)施層面優(yōu)化能效,降低運(yùn)營(yíng)成本的邏輯。這是美國(guó)的強(qiáng)項(xiàng)。

今年以來(lái),中國(guó)開(kāi)源模型已經(jīng)開(kāi)始推進(jìn)。螞蟻集團(tuán)在國(guó)產(chǎn)異構(gòu)集群上完成了對(duì)2900億規(guī)模參數(shù)Ling-Plus的訓(xùn)練,成本較H800降低20%;DeepSeek“指導(dǎo)”芯片與基礎(chǔ)設(shè)施廠商針對(duì)性地優(yōu)化,尤其是DeepSeek V3.2-Exp發(fā)布后,華為昇騰和寒武紀(jì)均。明年,中國(guó)開(kāi)源模型是否會(huì)交付一款完全基于國(guó)產(chǎn)算力技術(shù)棧的前沿開(kāi)源模型?

但token的單位成本不是決定token經(jīng)濟(jì)學(xué)的一切。甚至,完成一項(xiàng)任務(wù)的總token成本,都不是上述因素所能完全左右的。

如果算力一定,那么,大模型的速度、性能與成本在實(shí)際工作負(fù)載中需要權(quán)衡。大模型的速度,包括延遲(Latency,即首個(gè)token的生成時(shí)間)與吞吐率(Throughput,即每個(gè)token的生成速度)等。中國(guó)開(kāi)源模型在算力資源有限的情況下,要追平性能,價(jià)格更低,不得不犧牲部分速度優(yōu)先級(jí),這直接影響用戶體驗(yàn)。事實(shí)上,很長(zhǎng)一段時(shí)間,這也是Anthropic所面對(duì)的問(wèn)題,直至今年它與亞馬遜、谷歌深度綁定,賬面投入數(shù)百億美元,補(bǔ)上與OpenAI的算力差距。

此外,token單位成本優(yōu)勢(shì)還可能被“冗長(zhǎng)思考”侵蝕。很多用戶和開(kāi)發(fā)者已經(jīng)注意到,似乎DeepSeek-R1等開(kāi)源模型,在回答問(wèn)題時(shí)往往缺乏“節(jié)制”,使用了過(guò)多的token。尤其是簡(jiǎn)單問(wèn)題,它。Kimi-K2-Thinking也犯了這個(gè)毛病,影響了用戶體驗(yàn),削弱了成本優(yōu)勢(shì)。月之暗面創(chuàng)始人楊植麟解釋,現(xiàn)階段該模型優(yōu)先考慮絕對(duì)性能,token效率會(huì)在后續(xù)得到改善。

未來(lái),在多智能體協(xié)作中,冗余消耗和記憶占用,短板效應(yīng)會(huì)更加明顯。OpenAI就非常重視這一問(wèn)題,即使初期體驗(yàn)不佳,被用戶指責(zé)“黑箱”,還是堅(jiān)持讓,根據(jù)對(duì)話類型、復(fù)雜度、所需工具和明確意圖快速?zèng)Q定調(diào)用哪個(gè)模型。這次的GPT-5.1也不例外,它能更精準(zhǔn)地根據(jù)問(wèn)題調(diào)整思考時(shí)間。


聲勢(shì)強(qiáng),商業(yè)弱

中國(guó)的開(kāi)源模型正在贏得硅谷的青睞。無(wú)論AI基礎(chǔ)設(shè)施層還是應(yīng)用層的企業(yè),都樂(lè)意在合適場(chǎng)景下部署或調(diào)用這些“夠好用又夠便宜”的模型。懸念在于,它們能否在不斷增長(zhǎng)的市場(chǎng)中,分得更大的一塊。

中國(guó)開(kāi)源模型確實(shí)能夠創(chuàng)造價(jià)值。月初,在多模型API聚合平臺(tái)OpenRouter上,對(duì)中國(guó)開(kāi)源模型的API的調(diào)用,占據(jù)了20%以上的市場(chǎng)份額。它還沒(méi)算上用戶私有部署的開(kāi)源模型。今年8月,中國(guó)開(kāi)源模型的全球累計(jì)下載量就已經(jīng)超越了美國(guó)。對(duì)于成本敏感的全球南方國(guó)家而言更是如此。上個(gè)月,彭博社驚呼中國(guó)AI模型正在非洲崛起,當(dāng)?shù)仄髽I(yè)家齊聚一堂,聆聽(tīng)華為云撒哈拉以南非洲地區(qū)首席架構(gòu)師宣講DeepSeek。


中國(guó)開(kāi)源模型往往會(huì)針對(duì)某些細(xì)分應(yīng)用場(chǎng)景迭代。它們往往是基于業(yè)務(wù)數(shù)據(jù)積累與實(shí)際需求的微創(chuàng)新。今年,騰訊、阿里、字節(jié)跳動(dòng)幾乎同時(shí)開(kāi)源了自己的翻譯模型Hunyuan-MT-7B、Qwen3-MT與Seed-X-7B。針對(duì)特定市場(chǎng)的翻譯問(wèn)題遠(yuǎn)未解決,而且需求巨大,社交、電商等場(chǎng)景下高頻調(diào)用,值得做到像編碼模型這樣專。共享民宿巨頭Airbnb的CEO布萊恩·切斯基(Brian Chesky)就說(shuō),他們使用OpenAI的最新版本,但很大程度上更依賴于Qwen模型。非洲企業(yè)也反饋歐美模型對(duì)非洲語(yǔ)言的token切分并不合理。

但是,從看,中國(guó)開(kāi)源模型仍然無(wú)法與美國(guó)前沿模型相匹敵,也難以撼動(dòng)硅谷巨頭的生態(tài)。開(kāi)源模型的市場(chǎng)份額,并沒(méi)有體現(xiàn)為這些企業(yè)的收入份額。年底,OpenAI的ARR或達(dá)200億美元,Anthropic則有望實(shí)現(xiàn)90億美元。沒(méi)有一家中國(guó)初創(chuàng)企業(yè)可以達(dá)到這一體量,它們面臨投資者的壓力。

越來(lái)越多中國(guó)開(kāi)源模型已經(jīng),這次Kimi-K2-Thinking就強(qiáng)化了工具調(diào)用能力。中國(guó)SaaS企業(yè)先天不足,明年,開(kāi)源模型加持的智能體能否打開(kāi)中國(guó)企業(yè)服務(wù)的市場(chǎng)?

事實(shí)上,規(guī)模就是創(chuàng)新。開(kāi)源模型初創(chuàng)企業(yè)并不直接占有ChatGPT那樣的海量用戶數(shù)據(jù),同時(shí)缺乏集中、持續(xù)的用戶反饋機(jī)制,在長(zhǎng)尾需求、細(xì)節(jié)優(yōu)化與真實(shí)交互方面存在劣勢(shì)。阿里巴巴與字節(jié)跳動(dòng)等具備全棧技術(shù)、垂直整合能力與龐大用戶生態(tài)的互聯(lián)網(wǎng)巨頭,可以通過(guò)賦能內(nèi)部業(yè)務(wù)形成閉環(huán),而初創(chuàng)企業(yè)很難逾越這一壁壘。

此外,盡管大模型在基準(zhǔn)測(cè)試中考得越來(lái)越好,但,它嵌入實(shí)際工作流的效果仍然不佳。Anthropic、OpenAI和Cohere正在招聘“前沿部署工程師”,以應(yīng)對(duì)定制服務(wù)挑戰(zhàn)。而開(kāi)源模型廠商對(duì)此的響應(yīng)更為困難。

2026年,開(kāi)源仍然是中國(guó)的確定敘事。它意味著國(guó)產(chǎn)算力生態(tài)協(xié)同,也意味著科技普惠與自立自強(qiáng)。但是,開(kāi)源模型的陣容或?qū)㈦S著商業(yè)閉環(huán)的推進(jìn)而改寫,美團(tuán)、小米、螞蟻等公司可能頻繁地露臉。競(jìng)爭(zhēng)品類的激增,將讓更多歐美模型廠商承受價(jià)格壓力,不斷構(gòu)建差異化體驗(yàn),或者擠破泡沫。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不戰(zhàn)而勝!對(duì)手門?艘騻速,德約生涯第65次躋身大滿貫八強(qiáng)

不戰(zhàn)而勝!對(duì)手門?艘騻速,德約生涯第65次躋身大滿貫八強(qiáng)

全景體育V
2026-01-25 17:37:59
“美國(guó)斬殺線”事件詳細(xì)梳理:最新爆料美女留學(xué)生當(dāng)“狗”太辣眼

“美國(guó)斬殺線”事件詳細(xì)梳理:最新爆料美女留學(xué)生當(dāng)“狗”太辣眼

聽(tīng)風(fēng)聽(tīng)你
2026-01-24 20:54:06
替補(bǔ)出場(chǎng)2分鐘染黃!拜合拉木賽后手指著裁判說(shuō)話 39度高燒仍拼命

替補(bǔ)出場(chǎng)2分鐘染黃!拜合拉木賽后手指著裁判說(shuō)話 39度高燒仍拼命

風(fēng)過(guò)鄉(xiāng)
2026-01-25 10:59:52
國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

霹靂炮
2026-01-19 22:24:13
雷軍無(wú)奈宣布:全部下架!

雷軍無(wú)奈宣布:全部下架!

電動(dòng)知家
2026-01-25 15:31:25
記者:徐彬與中國(guó)U23在吉達(dá)告別,已正式啟程前往英國(guó)迎接新挑戰(zhàn)

記者:徐彬與中國(guó)U23在吉達(dá)告別,已正式啟程前往英國(guó)迎接新挑戰(zhàn)

懂球帝
2026-01-25 16:26:22
58歲那英改走顏值路線?過(guò)度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

58歲那英改走顏值路線?過(guò)度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

鋒哥與八卦哥
2026-01-25 13:26:51
出大事了!中國(guó)收到“戰(zhàn)書”,這次不是美國(guó),中方已經(jīng)做好準(zhǔn)備

出大事了!中國(guó)收到“戰(zhàn)書”,這次不是美國(guó),中方已經(jīng)做好準(zhǔn)備

愛(ài)吃醋的貓咪
2026-01-23 20:27:00
武漢理工畢業(yè)做保安!男子被學(xué)校約談后,稱保安比送外賣掙得多…

武漢理工畢業(yè)做保安!男子被學(xué)校約談后,稱保安比送外賣掙得多…

火山詩(shī)話
2026-01-25 09:02:44
一語(yǔ)道破女留學(xué)生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

一語(yǔ)道破女留學(xué)生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

每日一見(jiàn)
2026-01-23 15:07:50
云南毒紅薯升級(jí)!調(diào)查組介入,網(wǎng)友扒出黑幕,難怪商戶敢主動(dòng)投毒

云南毒紅薯升級(jí)!調(diào)查組介入,網(wǎng)友扒出黑幕,難怪商戶敢主動(dòng)投毒

云舟史策
2026-01-24 16:14:54
李亞鵬曝光捐贈(zèng)名單,向太發(fā)聲:我捐了幾百萬(wàn),王菲默默支持了幾千萬(wàn),也是不夠的……

李亞鵬曝光捐贈(zèng)名單,向太發(fā)聲:我捐了幾百萬(wàn),王菲默默支持了幾千萬(wàn),也是不夠的……

都市快報(bào)橙柿互動(dòng)
2026-01-24 19:48:42
首映僅150萬(wàn),《舒克貝塔》票房撲街,鄭淵潔父子虧到懷疑人生

首映僅150萬(wàn),《舒克貝塔》票房撲街,鄭淵潔父子虧到懷疑人生

電影票房預(yù)告片
2026-01-25 00:00:56
個(gè)稅降了,2026年1月15日起執(zhí)行

個(gè)稅降了,2026年1月15日起執(zhí)行

會(huì)計(jì)人
2026-01-25 12:03:57
女友懷孕收15萬(wàn)元彩禮,被退婚后控告男友強(qiáng)奸,男方起訴退還全部彩禮,法院判了

女友懷孕收15萬(wàn)元彩禮,被退婚后控告男友強(qiáng)奸,男方起訴退還全部彩禮,法院判了

南國(guó)今報(bào)
2026-01-25 17:09:35
安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

澎湃新聞
2026-01-25 14:07:05
好消息!鐵路新規(guī):60歲以上老人乘坐高鐵火車,可享受5大福利

好消息!鐵路新規(guī):60歲以上老人乘坐高鐵火車,可享受5大福利

巢客HOME
2026-01-25 06:50:03
青島回應(yīng)“學(xué)生械斗”:系A(chǔ)I生成的不實(shí)信息

青島回應(yīng)“學(xué)生械斗”:系A(chǔ)I生成的不實(shí)信息

極目新聞
2026-01-24 23:30:18
株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

以茶帶書
2026-01-24 23:18:39
1550億美元身家的黃仁勛現(xiàn)身上海一菜場(chǎng),商戶:他在我的栗子店消費(fèi)65元,還給我簽名紅包

1550億美元身家的黃仁勛現(xiàn)身上海一菜場(chǎng),商戶:他在我的栗子店消費(fèi)65元,還給我簽名紅包

極目新聞
2026-01-25 15:58:12
2026-01-25 19:08:49
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

科技要聞

黃仁勛在上海逛菜市場(chǎng),可能惦記著三件事

頭條要聞

游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

頭條要聞

游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

體育要聞

中國(guó)足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

娛樂(lè)要聞

王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開(kāi)除

財(cái)經(jīng)要聞

隋廣義等80人被公訴 千億騙局進(jìn)入末路

汽車要聞

別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
親子
本地
手機(jī)

數(shù)碼要聞

AMD核顯規(guī)劃分化,中端APU將沿用RDNA3.5舊架構(gòu)直至2029年

房產(chǎn)要聞

正式官宣!三亞又一所名校要來(lái)了!

親子要聞

她是折翼的蝴蝶寶貝,卻也是被父母捧在手心的無(wú)價(jià)之寶!!素材來(lái)源

本地新聞

云游中國(guó)|格爾木的四季朋友圈,張張值得你點(diǎn)贊

手機(jī)要聞

榮耀泡泡瑪特聯(lián)名手機(jī)今日開(kāi)售:首銷即引爆,線下再現(xiàn)排隊(duì)熱潮

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版