國產(chǎn)大模型密集發(fā)布，“春節(jié)AI競賽”提前開幕

2026-01-28 17:04:49　來源: 第一財(cái)經(jīng)資訊

上海舉報(bào)

分享至

近日，多家國產(chǎn)模型廠商更新模型進(jìn)展，包括DeepSeek開源新的OCR 2模型、Kimi發(fā)布并開源Kimi K2.5模型、阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking，頭部模型的密集更新使中國模型在當(dāng)日霸榜海外社交平臺X的熱點(diǎn)前三位。據(jù)一位行業(yè)人士透露，下周也有多款國產(chǎn)模型產(chǎn)品將更新發(fā)布。

2025年春節(jié)DeepSeek憑R1的出色表現(xiàn)引發(fā)破圈傳播，使得這一節(jié)點(diǎn)成為綜合流量窗口、商業(yè)競爭、技術(shù)節(jié)奏等多方面因素的集中展現(xiàn)，也讓大眾對2026年春節(jié)國產(chǎn)模型競賽翹首以盼。2026年春晚更是因字節(jié)跳動火山引擎與豆包大模型、騰訊元寶、百度的提前卡位鎖定熱度。

多位行業(yè)人士對第一財(cái)經(jīng)表示，節(jié)前大模型行業(yè)的密集動作，是行業(yè)開始邁向工程化成熟期的關(guān)鍵信號，包括模型從參數(shù)競賽轉(zhuǎn)向工程優(yōu)化，產(chǎn)品交付從實(shí)驗(yàn)室Demo走向規(guī)模化服務(wù)，生態(tài)協(xié)同從單點(diǎn)突破走向系統(tǒng)協(xié)同。

聚焦多模態(tài)與推理方向

1月27日，DeepSeek與Kimi再次同日發(fā)布模型，此前已有數(shù)次模型與論文發(fā)布“撞車”，足見行業(yè)關(guān)注度爭奪之激烈。

Kimi官方將K2.5定義為公司迄今為止最智能的模型，包括Agent、代碼、圖像、視頻及一系列通用智能任務(wù)表現(xiàn)；同時(shí)，這也是Kimi迄今最全能的模型，包括原生多模態(tài)架構(gòu)設(shè)計(jì)，同時(shí)支持視覺與文本輸入、思考與非思考模式、對話與 Agent任務(wù)。

同日發(fā)布的DeepSeek-OCR2模型是去年10月官方推出的DeepSeek-OCR模型的迭代版本，團(tuán)隊(duì)采用了創(chuàng)新的DeepEncoder V2方法，讓AI能夠根據(jù)圖像的含義動態(tài)重排圖像的各個(gè)部分，而不再只是機(jī)械地從左到右掃描，這種方式模擬了人類在觀看場景時(shí)所遵循的邏輯流程。

升級后的OCR 2模型在處理布局復(fù)雜的圖片時(shí)，表現(xiàn)優(yōu)于傳統(tǒng)的視覺語言模型。官方提到，DeepSeek的OCR模型主要面向兩大生產(chǎn)級應(yīng)用場景：一是為DeepSeek大語言模型提供圖像/文檔讀取服務(wù)，二是用于批量 PDF 處理的預(yù)訓(xùn)練數(shù)據(jù)流水線。

DeepSeek認(rèn)為，第一代OCR的光學(xué)壓縮是邁向原生多模態(tài)的初步探索，而OCR 2 的類LLM編碼器架構(gòu)是在這一方向上的進(jìn)一步推進(jìn)�？雌饋鞤eepSeek正在多模態(tài)領(lǐng)域進(jìn)行更多技術(shù)探索，這正是當(dāng)前DeepSeek所缺乏的部分，而業(yè)內(nèi)普遍認(rèn)為多模態(tài)是未來大模型行業(yè)的重要趨勢。

暖哇科技首席數(shù)據(jù)官陳鴻對第一財(cái)經(jīng)表示，團(tuán)隊(duì)正在評測DeepSeek最新推出的OCR2模型。DeepSeek第一代OCR更偏向于技術(shù)論文性質(zhì)，主要是為了驗(yàn)證其技術(shù)路線的理論可行性，實(shí)際應(yīng)用效果囿于訓(xùn)練數(shù)據(jù)和模型尺寸還比較有限。對于OCR2模型，他認(rèn)為其核心是讓模型能理解圖像中的像素信息背后實(shí)則蘊(yùn)含邏輯關(guān)聯(lián)與文本語義，這是OCR任務(wù)的本質(zhì)，理應(yīng)能帶來性能提升。

除了原生多模態(tài)深化外，推理工程化提效也是今年主流模型的一大趨勢。

1月早先時(shí)間，阿里開源多款模型，包括全系列語音合成模型Qwen3-TTS，專為多模態(tài)信息檢索與跨模態(tài)理解設(shè)計(jì)的Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列等，均在多模態(tài)領(lǐng)域?qū)崿F(xiàn)了進(jìn)一步的性能提升。從近期阿里大模型產(chǎn)品的發(fā)布來看，一方面，大模型能力提升仍是模型更新及競爭的主線；另一方面，近一年來，阿里對大模型布局的“全尺寸、全模態(tài)、全場景”戰(zhàn)略進(jìn)一步加深，在多模態(tài)、跨模態(tài)領(lǐng)域的更新加快。

楓清科技創(chuàng)始人兼CEO高雪峰對第一財(cái)經(jīng)表示，近一段時(shí)間，不論是DeepSeek發(fā)表的論文，還是阿里千問和Kimi發(fā)布的全新大模型，他們的技術(shù)創(chuàng)新都指向了一個(gè)核心點(diǎn)：進(jìn)一步提升推理性能、降低推理成本和模型訓(xùn)練門檻，讓AI大模型更易用、實(shí)用和好用。

性價(jià)比遠(yuǎn)比“第一”更重要

大模型行業(yè)競爭日趨激烈，頭部公司積極卡位，爭取在競爭中占據(jù)更有利位置。高雪峰認(rèn)為，這種良性的競爭，將進(jìn)一步縮短國產(chǎn)大模型與國外大模型之間的差距。

各家模型都有自己的優(yōu)勢場景，企業(yè)也不會只用一家模型。陳鴻對第一財(cái)經(jīng)表示，模型優(yōu)勢的變化很快，基本按月、季度迭代，每次基座模型的迭代和更新，團(tuán)隊(duì)都會用實(shí)際任務(wù)去做評測，選擇對應(yīng)最好的。

“2025年初我們還在使用海外的ChatGPT 4.5，當(dāng)時(shí)它的效果最好，但DeepSeek 推出后，雖效果略遜一籌，價(jià)格卻僅為前者的十分之一，幾乎成為無可替代的選擇�！标慀檶τ浾弑硎荆瑯I(yè)界可能執(zhí)著于模型在基準(zhǔn)測試中的排名，但對企業(yè)而言，性價(jià)比遠(yuǎn)比“第一”更重要。

大模型的調(diào)用成本也在持續(xù)下降。陳鴻透露，從暖哇科技的業(yè)務(wù)來看，2025年初到年末，客戶的token調(diào)用量實(shí)現(xiàn)多倍增長，但token調(diào)用費(fèi)用卻大大降低。

在暖哇科技的保險(xiǎn)業(yè)務(wù)場景下，目前通用模型有兩個(gè)選項(xiàng)：一是豆包，更適合對話場景及需要高情商表達(dá)的交互；二是DeepSeek V3.2模型，性價(jià)比突出。此外，在編程領(lǐng)域，智譜的表現(xiàn)也受到行業(yè)認(rèn)可，如果需要精調(diào)，千問是一個(gè)很好的基座選擇。陳鴻透露，暖哇科技目前的精調(diào)模型就是基于千問32B版本開發(fā)的。

高雪峰也發(fā)現(xiàn)，2025年大模型整體的Token成本明顯降低。DeepSeek、阿里、字節(jié)等主流的通用大模型在2025年都進(jìn)行了大幅降價(jià)，目前，國內(nèi)主流商用模型API已經(jīng)進(jìn)入“厘時(shí)代”�？聪蛭磥�，成本的持續(xù)下降是AI技術(shù)創(chuàng)新發(fā)展的必然，也正因如此，AI才能真正從C端嘗鮮邁向B端規(guī)模化落地，從而發(fā)揮更大的作用和價(jià)值。

對于節(jié)前大模型行業(yè)的密集發(fā)布與更新，大模型生態(tài)社區(qū)OpenCSG（開放傳神）創(chuàng)始人陳冉則認(rèn)為，這是行業(yè)進(jìn)入了一個(gè)新的“工程化成熟期”的標(biāo)志，從拼規(guī)模轉(zhuǎn)向拼效率與落地能力。

高雪峰對第一財(cái)經(jīng)表示，開源正在加速技術(shù)迭代并大幅降低成本，使大模型從少數(shù)巨頭能力走向產(chǎn)業(yè)基礎(chǔ)設(shè)施。隨著成本持續(xù)下降，Agentic AI智能體將從“能對話”邁向“能執(zhí)行、能創(chuàng)造價(jià)值”，智能體時(shí)代的黎明即將到來。

隨著巨頭的持續(xù)發(fā)力，高雪峰判斷，通用大模型行業(yè)的馬太效應(yīng)將日益凸顯，呈現(xiàn)出強(qiáng)者恒強(qiáng)的局面，中小玩家的機(jī)會更多出現(xiàn)在細(xì)分行業(yè)和領(lǐng)域，如制造、金融、教育、醫(yī)療等領(lǐng)域的大模型。

陳鴻認(rèn)為，各廠商的核心主線還是圍繞自身生態(tài)位推進(jìn)。以DeepSeek為例，其技術(shù)核心一直聚焦效率優(yōu)化，以極低的算力成本對外輸出服務(wù)，成為性價(jià)比極高的模型。而阿里作為大廠，旗下千問模型有明確的性能追求，在編程、推理、多模態(tài)多方向持續(xù)迭代，其開源版本是繼續(xù)精調(diào)模型的優(yōu)秀基座。

不過，高雪峰認(rèn)為，企業(yè)在推動AI大模型應(yīng)用過程中，仍面臨模型存在幻覺、可解釋性和推理能力薄弱等挑戰(zhàn)，這也是楓清科技在解決的部分。

未來應(yīng)用廠商更希望大模型在哪些方面實(shí)現(xiàn)突破？陳鴻認(rèn)為，推理能力的動態(tài)優(yōu)化是非常剛需的，當(dāng)前模型的推理開關(guān)要么全開要么全關(guān)，缺乏靈活性，而人類會根據(jù)信息完備度動態(tài)決定是否深度思考。若模型能自主判斷是否需要推理、是否缺少信息，就能在更多業(yè)務(wù)場景中應(yīng)用推理模型，避免不必要的算力消耗。

其次，多模態(tài)技術(shù)的落地優(yōu)化很重要，當(dāng)前多模態(tài)模型仍是“抽卡機(jī)制”，生成圖像、語音等內(nèi)容時(shí)需反復(fù)調(diào)整提示詞，就像抽盲盒，難以滿足專業(yè)場景需求。

誰能解決這些問題，誰就能在應(yīng)用領(lǐng)域更加向前一步。

模型廠商技術(shù)指標(biāo)逐漸聚焦

技術(shù)方向上，多模態(tài)、Agent等方面已在行業(yè)內(nèi)形成共識，但在實(shí)際落地過程中，成本把控能力、推理能力、工程化能力等方面逐漸成為考驗(yàn)?zāi)Ｐ蛷S商的重要指標(biāo)。

Kimi創(chuàng)始人楊植麟表示，Kimi本身預(yù)訓(xùn)練策略乃至整個(gè)模型的設(shè)計(jì)策略，都是圍繞兩個(gè)維度展開：提升token efficiency（token效率）是Kimi團(tuán)隊(duì)認(rèn)為進(jìn)行預(yù)訓(xùn)練時(shí)一項(xiàng)極為重要的指標(biāo)與優(yōu)化方案；第二個(gè)維度是實(shí)現(xiàn)long context（長上下文），因?yàn)檠娱L上下文能有效降低損失，這也解釋了為何當(dāng)前許多復(fù)雜的Agent任務(wù)必須在超長上下文中才能完成——延長上下文必然會降低loss，而一個(gè)優(yōu)秀的架構(gòu)能使損耗下降得更多。

紫荊芯界產(chǎn)品副總裁邵巍注意到行業(yè)模型和應(yīng)用發(fā)布的節(jié)奏正在加快，有公司提速至每半年一次發(fā)布旗艦?zāi)Ｐ�，甚至縮短到了四五個(gè)月一次。這說明一方面，負(fù)責(zé)軟件開發(fā)的員工在不斷推進(jìn)模型的研發(fā)；另一方面，負(fù)責(zé)應(yīng)用開發(fā)的員工也在持續(xù)迭代更新。無論是長上下文還是Agent等方面的發(fā)展，實(shí)際上都對推理能力提出了更高的要求。

商湯小浣熊負(fù)責(zé)人賈安亞在實(shí)際服務(wù)產(chǎn)業(yè)客戶的過程中發(fā)現(xiàn)，軟件開發(fā)與辦公緊密關(guān)聯(lián)著企業(yè)的核心資產(chǎn)——代碼、文件及數(shù)據(jù)。不少企業(yè)客戶雖然對某些單一功能非常認(rèn)可，但在實(shí)際落地過程中，平臺需要提供一個(gè)全面且高效的解決方案，包括整體延遲性能、精度等，整體方案效果需達(dá)到95%以上，且需要完全可用。這對于模型推理是一個(gè)較大的挑戰(zhàn)，因?yàn)槠髽I(yè)對芯片的投資及推理投入都有一個(gè)綜合的性價(jià)比考量，這就要求平臺必須考慮如何將大模型以最高效率部署到機(jī)器上進(jìn)行推理。

大模型的頻繁更新對需要完成硬件適配的企業(yè)用戶難言友好。賈安亞團(tuán)隊(duì)近期正在合作一家頭部金融客戶，為其制定的整套解決方案旨在服務(wù)數(shù)千名員工，涵蓋從進(jìn)銷存到日常運(yùn)營等多個(gè)方面。對于這些一線業(yè)務(wù)人員來說，重要的是如何利用大量不同類型的數(shù)據(jù)（包括圖片、表格和PDF文件）在系統(tǒng)上實(shí)現(xiàn)高效且準(zhǔn)確的端到端處理。從技術(shù)角度來看，這意味著不僅要進(jìn)行語言推理，還需要處理多模態(tài)數(shù)據(jù)，并保證超長上下文的支持及各種文件類型的處理能力。此外，還需確保整個(gè)過程既快速又精確，并且用戶可以在過程中隨時(shí)檢查進(jìn)度，并直接應(yīng)用最終結(jié)果。

客戶既要求功能全面又要求性能卓越，這使得近期大模型行業(yè)除了產(chǎn)品的密集更新，還要在與產(chǎn)業(yè)鏈上下游加速聯(lián)動，在軟硬雙端從算法與架構(gòu)層面降低行業(yè)成本上下功夫。

在浙江算力科技董事長錢敏勇看來，實(shí)施路徑上，推理成本的降低短期內(nèi)仍依賴工程優(yōu)化，包括整體架構(gòu)、算法以及軟件棧的優(yōu)化。但從長期角度來看，新型硬件和芯片的創(chuàng)新將會帶來更為深遠(yuǎn)的影響。

煒燁智算董事長兼CEO周韡韡認(rèn)為，AI已經(jīng)從“看中學(xué)”階段發(fā)展到了“干中學(xué)”的階段。在基礎(chǔ)設(shè)施方面，基礎(chǔ)設(shè)施模型及其生態(tài)系統(tǒng)將會朝著基模生態(tài)一體化的方向發(fā)展。行業(yè)已經(jīng)結(jié)束了模型的盲目競爭，進(jìn)入了以推理能力為主導(dǎo)的時(shí)代。

（本報(bào)記者陳楊園對此文亦有貢獻(xiàn)）

聲明：包含AI生成內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.