国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)大模型密集發(fā)布,“春節(jié)AI競賽”提前開幕

0
分享至


近日,多家國產(chǎn)模型廠商更新模型進(jìn)展,包括DeepSeek開源新的OCR 2模型、Kimi發(fā)布并開源Kimi K2.5模型、阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,頭部模型的密集更新使中國模型在當(dāng)日霸榜海外社交平臺X的熱點(diǎn)前三位。據(jù)一位行業(yè)人士透露,下周也有多款國產(chǎn)模型產(chǎn)品將更新發(fā)布。

2025年春節(jié)DeepSeek憑R1的出色表現(xiàn)引發(fā)破圈傳播,使得這一節(jié)點(diǎn)成為綜合流量窗口、商業(yè)競爭、技術(shù)節(jié)奏等多方面因素的集中展現(xiàn),也讓大眾對2026年春節(jié)國產(chǎn)模型競賽翹首以盼。2026年春晚更是因字節(jié)跳動火山引擎與豆包大模型、騰訊元寶、百度的提前卡位鎖定熱度。

多位行業(yè)人士對第一財(cái)經(jīng)表示,節(jié)前大模型行業(yè)的密集動作,是行業(yè)開始邁向工程化成熟期的關(guān)鍵信號,包括模型從參數(shù)競賽轉(zhuǎn)向工程優(yōu)化,產(chǎn)品交付從實(shí)驗(yàn)室Demo走向規(guī)模化服務(wù),生態(tài)協(xié)同從單點(diǎn)突破走向系統(tǒng)協(xié)同。


聚焦多模態(tài)與推理方向

1月27日,DeepSeek與Kimi再次同日發(fā)布模型,此前已有數(shù)次模型與論文發(fā)布“撞車”,足見行業(yè)關(guān)注度爭奪之激烈。

Kimi官方將K2.5定義為公司迄今為止最智能的模型,包括Agent、代碼、圖像、視頻及一系列通用智能任務(wù)表現(xiàn);同時(shí),這也是Kimi迄今最全能的模型,包括原生多模態(tài)架構(gòu)設(shè)計(jì),同時(shí)支持視覺與文本輸入、思考與非思考模式、對話與 Agent任務(wù)。

同日發(fā)布的DeepSeek-OCR2模型是去年10月官方推出的DeepSeek-OCR模型的迭代版本,團(tuán)隊(duì)采用了創(chuàng)新的DeepEncoder V2方法,讓AI能夠根據(jù)圖像的含義動態(tài)重排圖像的各個(gè)部分,而不再只是機(jī)械地從左到右掃描,這種方式模擬了人類在觀看場景時(shí)所遵循的邏輯流程。

升級后的OCR 2模型在處理布局復(fù)雜的圖片時(shí),表現(xiàn)優(yōu)于傳統(tǒng)的視覺語言模型。官方提到,DeepSeek的OCR模型主要面向兩大生產(chǎn)級應(yīng)用場景:一是為DeepSeek大語言模型提供圖像/文檔讀取服務(wù),二是用于批量 PDF 處理的預(yù)訓(xùn)練數(shù)據(jù)流水線。

DeepSeek認(rèn)為,第一代OCR的光學(xué)壓縮是邁向原生多模態(tài)的初步探索,而OCR 2 的類LLM編碼器架構(gòu)是在這一方向上的進(jìn)一步推進(jìn)?雌饋鞤eepSeek正在多模態(tài)領(lǐng)域進(jìn)行更多技術(shù)探索,這正是當(dāng)前DeepSeek所缺乏的部分,而業(yè)內(nèi)普遍認(rèn)為多模態(tài)是未來大模型行業(yè)的重要趨勢。

暖哇科技首席數(shù)據(jù)官陳鴻對第一財(cái)經(jīng)表示,團(tuán)隊(duì)正在評測DeepSeek最新推出的OCR2模型。DeepSeek第一代OCR更偏向于技術(shù)論文性質(zhì),主要是為了驗(yàn)證其技術(shù)路線的理論可行性,實(shí)際應(yīng)用效果囿于訓(xùn)練數(shù)據(jù)和模型尺寸還比較有限。對于OCR2模型,他認(rèn)為其核心是讓模型能理解圖像中的像素信息背后實(shí)則蘊(yùn)含邏輯關(guān)聯(lián)與文本語義,這是OCR任務(wù)的本質(zhì),理應(yīng)能帶來性能提升。

除了原生多模態(tài)深化外,推理工程化提效也是今年主流模型的一大趨勢。

1月早先時(shí)間,阿里開源多款模型,包括全系列語音合成模型Qwen3-TTS,專為多模態(tài)信息檢索與跨模態(tài)理解設(shè)計(jì)的Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列等,均在多模態(tài)領(lǐng)域?qū)崿F(xiàn)了進(jìn)一步的性能提升。從近期阿里大模型產(chǎn)品的發(fā)布來看,一方面,大模型能力提升仍是模型更新及競爭的主線;另一方面,近一年來,阿里對大模型布局的“全尺寸、全模態(tài)、全場景”戰(zhàn)略進(jìn)一步加深,在多模態(tài)、跨模態(tài)領(lǐng)域的更新加快。

楓清科技創(chuàng)始人兼CEO高雪峰對第一財(cái)經(jīng)表示,近一段時(shí)間,不論是DeepSeek發(fā)表的論文,還是阿里千問和Kimi發(fā)布的全新大模型,他們的技術(shù)創(chuàng)新都指向了一個(gè)核心點(diǎn):進(jìn)一步提升推理性能、降低推理成本和模型訓(xùn)練門檻,讓AI大模型更易用、實(shí)用和好用。


性價(jià)比遠(yuǎn)比“第一”更重要

大模型行業(yè)競爭日趨激烈,頭部公司積極卡位,爭取在競爭中占據(jù)更有利位置。高雪峰認(rèn)為,這種良性的競爭,將進(jìn)一步縮短國產(chǎn)大模型與國外大模型之間的差距。

各家模型都有自己的優(yōu)勢場景,企業(yè)也不會只用一家模型。陳鴻對第一財(cái)經(jīng)表示,模型優(yōu)勢的變化很快,基本按月、季度迭代,每次基座模型的迭代和更新,團(tuán)隊(duì)都會用實(shí)際任務(wù)去做評測,選擇對應(yīng)最好的。

“2025年初我們還在使用海外的ChatGPT 4.5,當(dāng)時(shí)它的效果最好,但DeepSeek 推出后,雖效果略遜一籌,價(jià)格卻僅為前者的十分之一,幾乎成為無可替代的選擇!标慀檶τ浾弑硎荆瑯I(yè)界可能執(zhí)著于模型在基準(zhǔn)測試中的排名,但對企業(yè)而言,性價(jià)比遠(yuǎn)比“第一”更重要。

大模型的調(diào)用成本也在持續(xù)下降。陳鴻透露,從暖哇科技的業(yè)務(wù)來看,2025年初到年末,客戶的token調(diào)用量實(shí)現(xiàn)多倍增長,但token調(diào)用費(fèi)用卻大大降低。

在暖哇科技的保險(xiǎn)業(yè)務(wù)場景下,目前通用模型有兩個(gè)選項(xiàng):一是豆包,更適合對話場景及需要高情商表達(dá)的交互;二是DeepSeek V3.2模型,性價(jià)比突出。此外,在編程領(lǐng)域,智譜的表現(xiàn)也受到行業(yè)認(rèn)可,如果需要精調(diào),千問是一個(gè)很好的基座選擇。陳鴻透露,暖哇科技目前的精調(diào)模型就是基于千問32B版本開發(fā)的。

高雪峰也發(fā)現(xiàn),2025年大模型整體的Token成本明顯降低。DeepSeek、阿里、字節(jié)等主流的通用大模型在2025年都進(jìn)行了大幅降價(jià),目前,國內(nèi)主流商用模型API已經(jīng)進(jìn)入“厘時(shí)代”?聪蛭磥,成本的持續(xù)下降是AI技術(shù)創(chuàng)新發(fā)展的必然,也正因如此,AI才能真正從C端嘗鮮邁向B端規(guī)模化落地,從而發(fā)揮更大的作用和價(jià)值。

對于節(jié)前大模型行業(yè)的密集發(fā)布與更新,大模型生態(tài)社區(qū)OpenCSG(開放傳神)創(chuàng)始人陳冉則認(rèn)為,這是行業(yè)進(jìn)入了一個(gè)新的“工程化成熟期”的標(biāo)志,從拼規(guī)模轉(zhuǎn)向拼效率與落地能力。

高雪峰對第一財(cái)經(jīng)表示,開源正在加速技術(shù)迭代并大幅降低成本,使大模型從少數(shù)巨頭能力走向產(chǎn)業(yè)基礎(chǔ)設(shè)施。隨著成本持續(xù)下降,Agentic AI智能體將從“能對話”邁向“能執(zhí)行、能創(chuàng)造價(jià)值”,智能體時(shí)代的黎明即將到來。

隨著巨頭的持續(xù)發(fā)力,高雪峰判斷,通用大模型行業(yè)的馬太效應(yīng)將日益凸顯,呈現(xiàn)出強(qiáng)者恒強(qiáng)的局面,中小玩家的機(jī)會更多出現(xiàn)在細(xì)分行業(yè)和領(lǐng)域,如制造、金融、教育、醫(yī)療等領(lǐng)域的大模型。

陳鴻認(rèn)為,各廠商的核心主線還是圍繞自身生態(tài)位推進(jìn)。以DeepSeek為例,其技術(shù)核心一直聚焦效率優(yōu)化,以極低的算力成本對外輸出服務(wù),成為性價(jià)比極高的模型。而阿里作為大廠,旗下千問模型有明確的性能追求,在編程、推理、多模態(tài)多方向持續(xù)迭代,其開源版本是繼續(xù)精調(diào)模型的優(yōu)秀基座。

不過,高雪峰認(rèn)為,企業(yè)在推動AI大模型應(yīng)用過程中,仍面臨模型存在幻覺、可解釋性和推理能力薄弱等挑戰(zhàn),這也是楓清科技在解決的部分。

未來應(yīng)用廠商更希望大模型在哪些方面實(shí)現(xiàn)突破?陳鴻認(rèn)為,推理能力的動態(tài)優(yōu)化是非常剛需的,當(dāng)前模型的推理開關(guān)要么全開要么全關(guān),缺乏靈活性,而人類會根據(jù)信息完備度動態(tài)決定是否深度思考。若模型能自主判斷是否需要推理、是否缺少信息,就能在更多業(yè)務(wù)場景中應(yīng)用推理模型,避免不必要的算力消耗。

其次,多模態(tài)技術(shù)的落地優(yōu)化很重要,當(dāng)前多模態(tài)模型仍是“抽卡機(jī)制”,生成圖像、語音等內(nèi)容時(shí)需反復(fù)調(diào)整提示詞,就像抽盲盒,難以滿足專業(yè)場景需求。

誰能解決這些問題,誰就能在應(yīng)用領(lǐng)域更加向前一步。


模型廠商技術(shù)指標(biāo)逐漸聚焦

技術(shù)方向上,多模態(tài)、Agent等方面已在行業(yè)內(nèi)形成共識,但在實(shí)際落地過程中,成本把控能力、推理能力、工程化能力等方面逐漸成為考驗(yàn)?zāi)P蛷S商的重要指標(biāo)。

Kimi創(chuàng)始人楊植麟表示,Kimi本身預(yù)訓(xùn)練策略乃至整個(gè)模型的設(shè)計(jì)策略,都是圍繞兩個(gè)維度展開:提升token efficiency(token效率)是Kimi團(tuán)隊(duì)認(rèn)為進(jìn)行預(yù)訓(xùn)練時(shí)一項(xiàng)極為重要的指標(biāo)與優(yōu)化方案;第二個(gè)維度是實(shí)現(xiàn)long context(長上下文),因?yàn)檠娱L上下文能有效降低損失,這也解釋了為何當(dāng)前許多復(fù)雜的Agent任務(wù)必須在超長上下文中才能完成——延長上下文必然會降低loss,而一個(gè)優(yōu)秀的架構(gòu)能使損耗下降得更多。

紫荊芯界產(chǎn)品副總裁邵巍注意到行業(yè)模型和應(yīng)用發(fā)布的節(jié)奏正在加快,有公司提速至每半年一次發(fā)布旗艦?zāi)P,甚至縮短到了四五個(gè)月一次。這說明一方面,負(fù)責(zé)軟件開發(fā)的員工在不斷推進(jìn)模型的研發(fā);另一方面,負(fù)責(zé)應(yīng)用開發(fā)的員工也在持續(xù)迭代更新。無論是長上下文還是Agent等方面的發(fā)展,實(shí)際上都對推理能力提出了更高的要求。

商湯小浣熊負(fù)責(zé)人賈安亞在實(shí)際服務(wù)產(chǎn)業(yè)客戶的過程中發(fā)現(xiàn),軟件開發(fā)與辦公緊密關(guān)聯(lián)著企業(yè)的核心資產(chǎn)——代碼、文件及數(shù)據(jù)。不少企業(yè)客戶雖然對某些單一功能非常認(rèn)可,但在實(shí)際落地過程中,平臺需要提供一個(gè)全面且高效的解決方案,包括整體延遲性能、精度等,整體方案效果需達(dá)到95%以上,且需要完全可用。這對于模型推理是一個(gè)較大的挑戰(zhàn),因?yàn)槠髽I(yè)對芯片的投資及推理投入都有一個(gè)綜合的性價(jià)比考量,這就要求平臺必須考慮如何將大模型以最高效率部署到機(jī)器上進(jìn)行推理。

大模型的頻繁更新對需要完成硬件適配的企業(yè)用戶難言友好。賈安亞團(tuán)隊(duì)近期正在合作一家頭部金融客戶,為其制定的整套解決方案旨在服務(wù)數(shù)千名員工,涵蓋從進(jìn)銷存到日常運(yùn)營等多個(gè)方面。對于這些一線業(yè)務(wù)人員來說,重要的是如何利用大量不同類型的數(shù)據(jù)(包括圖片、表格和PDF文件)在系統(tǒng)上實(shí)現(xiàn)高效且準(zhǔn)確的端到端處理。從技術(shù)角度來看,這意味著不僅要進(jìn)行語言推理,還需要處理多模態(tài)數(shù)據(jù),并保證超長上下文的支持及各種文件類型的處理能力。此外,還需確保整個(gè)過程既快速又精確,并且用戶可以在過程中隨時(shí)檢查進(jìn)度,并直接應(yīng)用最終結(jié)果。

客戶既要求功能全面又要求性能卓越,這使得近期大模型行業(yè)除了產(chǎn)品的密集更新,還要在與產(chǎn)業(yè)鏈上下游加速聯(lián)動,在軟硬雙端從算法與架構(gòu)層面降低行業(yè)成本上下功夫。

在浙江算力科技董事長錢敏勇看來,實(shí)施路徑上,推理成本的降低短期內(nèi)仍依賴工程優(yōu)化,包括整體架構(gòu)、算法以及軟件棧的優(yōu)化。但從長期角度來看,新型硬件和芯片的創(chuàng)新將會帶來更為深遠(yuǎn)的影響。

煒燁智算董事長兼CEO周韡韡認(rèn)為,AI已經(jīng)從“看中學(xué)”階段發(fā)展到了“干中學(xué)”的階段。在基礎(chǔ)設(shè)施方面,基礎(chǔ)設(shè)施模型及其生態(tài)系統(tǒng)將會朝著基模生態(tài)一體化的方向發(fā)展。行業(yè)已經(jīng)結(jié)束了模型的盲目競爭,進(jìn)入了以推理能力為主導(dǎo)的時(shí)代。

(本報(bào)記者陳楊園對此文亦有貢獻(xiàn))

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
00后逆襲典范:森日向子(Hinako Mori)的多元成長之路

00后逆襲典范:森日向子(Hinako Mori)的多元成長之路

管鮑老四級
2026-01-28 16:09:57
上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

一方聊市
2026-01-19 13:13:48
熔斷!印尼股市暴跌8%

熔斷!印尼股市暴跌8%

證券時(shí)報(bào)
2026-01-28 18:03:07
鄭麗文好猛,送高市早苗一記重拳!大陸決定:給國民黨一個(gè)大面子

鄭麗文好猛,送高市早苗一記重拳!大陸決定:給國民黨一個(gè)大面子

面包夾知識
2026-01-28 12:51:18
湖南開放大學(xué)黨委書記龍獻(xiàn)忠接受審查調(diào)查

湖南開放大學(xué)黨委書記龍獻(xiàn)忠接受審查調(diào)查

界面新聞
2026-01-28 09:03:23
分手14年,釋小龍何潔境遇天差地別,一個(gè)身家過億,一個(gè)養(yǎng)不起娃

分手14年,釋小龍何潔境遇天差地別,一個(gè)身家過億,一個(gè)養(yǎng)不起娃

查爾菲的筆記
2026-01-09 22:17:44
德約科維奇:為對手感到遺憾,今天我本該是被淘汰的一方

德約科維奇:為對手感到遺憾,今天我本該是被淘汰的一方

懂球帝
2026-01-28 15:39:38
縣長在辦公室打麻將被市委書記掀翻,縣長揚(yáng)言要報(bào)復(fù),結(jié)局如何?

縣長在辦公室打麻將被市委書記掀翻,縣長揚(yáng)言要報(bào)復(fù),結(jié)局如何?

葉天辰故事會
2025-02-20 14:35:03
邵式平主政江西建設(shè)南昌時(shí),被上級批評,邵:繼續(xù)干,上面我頂著

邵式平主政江西建設(shè)南昌時(shí),被上級批評,邵:繼續(xù)干,上面我頂著

丞丞故事匯
2025-12-28 01:04:59
突然爆雷,人去樓空,有人投入700多萬元!

突然爆雷,人去樓空,有人投入700多萬元!

財(cái)經(jīng)保探長
2025-12-26 11:24:43
從30萬跌到16萬,這四款豪華B級車腰斬甩賣,誰買誰是大贏家

從30萬跌到16萬,這四款豪華B級車腰斬甩賣,誰買誰是大贏家

西莫的藝術(shù)宮殿
2026-01-28 17:38:38
雙色球第26013期紅藍(lán)數(shù)據(jù)

雙色球第26013期紅藍(lán)數(shù)據(jù)

芭比衣櫥
2026-01-28 14:09:58
海軍開國大將九個(gè)子女出一部副兩副主席三將軍,兒媳全國聞名

海軍開國大將九個(gè)子女出一部副兩副主席三將軍,兒媳全國聞名

嘮叨說歷史
2026-01-27 15:05:40
戰(zhàn)爭或開打?美航母就位,最壞情況要來了,中方連說三個(gè)“反對”

戰(zhàn)爭或開打?美航母就位,最壞情況要來了,中方連說三個(gè)“反對”

近史博覽
2026-01-26 14:35:18
特朗普惱羞成怒,他猛然發(fā)現(xiàn):美國最大的王牌,對中國已不起作用

特朗普惱羞成怒,他猛然發(fā)現(xiàn):美國最大的王牌,對中國已不起作用

樂天閑聊
2026-01-28 15:18:24
現(xiàn)貨白銀回吐盤中3.5%漲幅,現(xiàn)跌0.29%

現(xiàn)貨白銀回吐盤中3.5%漲幅,現(xiàn)跌0.29%

界面新聞
2026-01-28 19:10:07
汪小菲接倆娃回北京,玥兒長高超像大S,打雪仗時(shí)一個(gè)動作好暖心

汪小菲接倆娃回北京,玥兒長高超像大S,打雪仗時(shí)一個(gè)動作好暖心

樂悠悠娛樂
2026-01-26 15:20:29
中農(nóng)聯(lián)合連收4個(gè)漲停板

中農(nóng)聯(lián)合連收4個(gè)漲停板

證券時(shí)報(bào)
2026-01-28 10:11:14
案例:復(fù)旦博士姜文華判處死刑,女學(xué)生曝光其習(xí)慣,有一點(diǎn)很奇怪

案例:復(fù)旦博士姜文華判處死刑,女學(xué)生曝光其習(xí)慣,有一點(diǎn)很奇怪

清茶淺談
2025-01-18 15:14:28
理想汽車暴力自救:關(guān)店100家,告別擴(kuò)張時(shí)代轉(zhuǎn)向增效降本

理想汽車暴力自救:關(guān)店100家,告別擴(kuò)張時(shí)代轉(zhuǎn)向增效降本

燕梳樓頻道
2026-01-27 20:26:13
2026-01-28 20:23:00
第一財(cái)經(jīng)資訊 incentive-icons
第一財(cái)經(jīng)資訊
第一財(cái)經(jīng)官方賬號
242820文章數(shù) 621349關(guān)注度
往期回顧 全部

科技要聞

它是神也是毒!Clawdbot改名卷入千萬詐騙

頭條要聞

知名企業(yè)家熊海濤被留置 被指與成都主要領(lǐng)導(dǎo)違紀(jì)有關(guān)

頭條要聞

知名企業(yè)家熊海濤被留置 被指與成都主要領(lǐng)導(dǎo)違紀(jì)有關(guān)

體育要聞

沒天賦的CBA第一小前鋒,秘訣只有一個(gè)字

娛樂要聞

王祖賢入駐某音:一條7秒視頻吸粉55萬

財(cái)經(jīng)要聞

從萬科退休20天后,郁亮疑似失聯(lián)

汽車要聞

新手必看!冰雪路面不敢開?記住這4點(diǎn) 關(guān)鍵時(shí)刻真能保命

態(tài)度原創(chuàng)

親子
房產(chǎn)
教育
公開課
軍事航空

親子要聞

寶藍(lán)和爸爸叔叔準(zhǔn)備了很多玩具,一起去捉昆蟲,太有趣了~

房產(chǎn)要聞

實(shí)景兌現(xiàn)在即!綠城,在海棠灣重新定義終極旅居想象!

教育要聞

高二上學(xué)期,期中英語80多,有沒有人現(xiàn)身說法自己如何逆襲?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗豎起巨幅宣傳畫:一艘美軍航母被炸

無障礙瀏覽 進(jìn)入關(guān)懷版