国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2026 AI 商業(yè)中場:從原生多模態(tài)到超級入口

0
分享至



AI 的競爭成為模型公司全棧能力和創(chuàng)新的博弈。

文丨江思遠

2000 年,美國互聯(lián)網(wǎng)泡沫破滅時,Google 面臨巨大的商業(yè)化壓力。當(dāng)時他們搜索引擎的流量暴漲,但離盈利還有一段距離。Google 曾嘗試把自己的技術(shù)授權(quán)給友商,以賺取微薄的 “經(jīng)費”。但還是無法支撐公司的長遠發(fā)展。

公司作為商業(yè)組織本質(zhì)是逐利的。但有技術(shù)信仰的企業(yè),往往會在短期利益與長期投入之間,選擇那條更難、更慢、也更燒錢的路徑。

Google 沒有放棄技術(shù)。2002 年,Google 的工程師們發(fā)現(xiàn),用戶在搜索框中輸入關(guān)鍵詞,不只是為了搜尋信息,也是在表達購買意圖。Google 將 “用戶搜索意圖” 與 “商業(yè)廣告” 通過競價排名結(jié)合,在行業(yè)中找到了一個獨特的身位,將技術(shù)和商業(yè)化真正連接了起來。

偉大的技術(shù)突破往往能帶企業(yè)打開新的市場。蘋果未止步于個人電腦,而締造出了劃時代的 iPhone;字節(jié)跳動抓住推薦算法,才完成對信息流的重構(gòu);OpenAI 固執(zhí)地進行大模型訓(xùn)練,讓算法涌現(xiàn)出了智能。

但過去兩年,AI 技術(shù)受困于找不到落地場景,商業(yè)化受阻。2025 年,DeepSeek 在保持成本優(yōu)勢的同時,展現(xiàn)出接近人類的思考能力,讓 C 端用戶對 AI 的價值有了新的認知。不久后,OpenAI 的原生多模態(tài)模型 GPT-4o,展現(xiàn)了其對圖片內(nèi)容的理解能力,讓 AI 生成 “吉卜力” 畫風(fēng)的圖片引爆社交網(wǎng)絡(luò)。

AI 技術(shù)的進展帶來了解決以下兩大難題的可能性,讓市場重新評估 AI 的商業(yè)潛力。

- 物理: AI 對真實世界的理解和執(zhí)行能力不足。

- 商業(yè): 推理成本過高,限制了 AI 的大規(guī)模應(yīng)用。

2025 年底,百度發(fā)布文心大模型 5.0,Google 發(fā)布 Gemini 3,模型實現(xiàn)在統(tǒng)一原生架構(gòu)下能理解圖片、看懂視頻,大模型統(tǒng)一原生多模態(tài)的潛力被逐步看到。

技術(shù)進步也帶來商業(yè)化的可能。目前,大模型有望通過算法層、架構(gòu)層、系統(tǒng)層,乃至芯片側(cè)的全棧優(yōu)化,降低推理成本,提高模型效能,如 Anthropic 的 Claude 系列、Google 的 Gemini 系列、百度文心系列。

AI 行業(yè)的競爭不止在于算力、數(shù)據(jù),也成為一個公司全棧工程能力和基礎(chǔ)創(chuàng)新的綜合博弈。

AI 能力正從文本生成走向原生多模態(tài)

大模型還無法做到完全理解用戶的意圖,但語言模型正在進入 “收益平臺期”——盡管算力、數(shù)據(jù)投入指數(shù)級增加,但大模型在預(yù)測下一個 Token 的任務(wù)上,所表現(xiàn)出的泛化性曲線已明顯放緩。單一文本維度的縮放路徑,無法滿足大模型智能繼續(xù)進化的目標(biāo)。

業(yè)界一個廣泛流傳的觀點是,大模型要理解世界。“現(xiàn)在的大模型達不到 AGI”,大模型理解世界,需要視覺、聽覺、語言等多種感官信息的融合。兩位圖靈獎得主,楊立昆、Geoffrey Hinton 都曾提出類似的觀點。

目前,多數(shù)多模態(tài)模型就像 “傳話筒”,圖像、語音等信號需經(jīng)過獨立模型解碼后再轉(zhuǎn)譯給語言模型,最終實現(xiàn)理解、生成。構(gòu)建原生多模態(tài)大模型,可以讓模型從訓(xùn)練階段起,就具備理解圖片、語音等各種模態(tài)信息的能力。

原生多模態(tài)模型就是能像人一樣,“端到端” 理解各種模態(tài)的信息——前者訓(xùn)練時只需專注處理單一模態(tài)信息,難在保持 “傳話” 過程中不出現(xiàn)信息失真的現(xiàn)象;后者則是在訓(xùn)練時就要讓模型理解圖片、視頻、語音等信息,但難在讓各種類型數(shù)據(jù)的意義互通。但原生多模態(tài)模型在訓(xùn)推中需要處理大量多模態(tài)的數(shù)據(jù),給架構(gòu)設(shè)計、訓(xùn)練過程和推理等多個層面都帶來了指數(shù)級的壓力。

Google 從開始訓(xùn)練 Gemini 系列,便確定原生多模態(tài)的技術(shù)路徑。但訓(xùn)練數(shù)據(jù)較難統(tǒng)一,剛開始 Google 的模型在應(yīng)用側(cè)的效果并算不突出。直到 2025 年末,Gemini 3.0 展現(xiàn)的多模態(tài)理解能力,讓業(yè)界重新相信了 “原生多模態(tài)”。

2025 年,國內(nèi)企業(yè)發(fā)布的模型開始呈現(xiàn)原生多模態(tài)轉(zhuǎn)向,發(fā)布的模型有各自的特點。階躍星辰的 Step-3 針對國產(chǎn)芯片帶寬進行了優(yōu)化,降低了企業(yè)的商用成本;智譜的 GLM-4.6V 和字節(jié)的豆包大模型 1.8,都是將工具調(diào)用能力原生融入大模型,讓 AI 可以行動;阿里發(fā)布的 Qwen 3-Omni 主要通過優(yōu)化用戶交互與開源,擴大生態(tài)。



百度文心大模型 5.0 則專注于模型本身,發(fā)布了參數(shù)量達 2.4 萬億的原生全模態(tài)大模型。在國內(nèi)為數(shù)不多的全模態(tài)模型中,參數(shù)量最大,并在底層架構(gòu)實現(xiàn)了文本、圖像、音頻、視頻多模態(tài)的統(tǒng)一。



真實世界本質(zhì)是跨模態(tài)的信號流,大模型要理解世界,原生多模態(tài)是技術(shù)上的趨勢。以百度文心大模型 5.0 為例,其文本與視覺理解能力體現(xiàn)出的泛化性,均在 LMArena 大模型競技場相應(yīng)領(lǐng)域的全球排行榜中,占據(jù)前列。



通過原生多模態(tài)架構(gòu),模型能捕捉到更多非語言信息,AI 能夠像人類一樣感知現(xiàn)實,并通過 Agent 建立與世界更深層的連接。這也讓大模型切入具身智能、智能座艙、消費硬件等萬億美金級賽道的商業(yè)場景成為可能。

推理成本定義 AI 商業(yè)化拐點

2024 年底,行業(yè)從 “快思考” 轉(zhuǎn)向 “慢思考”。慢思考是讓模型在回答問題之前,先模仿人類思考路徑,在后臺列出完整思維鏈條,自我修正后再生成回答。慢思考模式下用戶每提一個問題,單次消耗的 token 數(shù)量都激增。

OpenRouter 發(fā)布的年度報告指出,2025 年推理任務(wù)消耗 token 的占比不斷升高,模型專用于推理類任務(wù)的調(diào)用量,占 token 消耗總額的超 50% 。用戶規(guī)模擴大后,模型廠商需為用戶消耗的 token 支付高額的成本。

能否降低推理成本,成為 AI 走向商業(yè)化的關(guān)鍵。

2025 年初,DeepSeek 憑借 MLA 架構(gòu)和精細化的 MoE 設(shè)計,顯著降低大模型計算消耗的同時,提高了模型的性能,被行業(yè)視為 “效率標(biāo)桿”。

但 DeepSeek 只是語言模型。語言模型的降本經(jīng)驗并不能直接平移到多模態(tài)領(lǐng)域。GPT-5、Gemini 3、豆包 1.8、文心 5.0 等原生多模態(tài)模型,需要處理視覺和音頻流,其對訓(xùn)練算力的需求是純文本模型的 5 到 10 倍,推理過程也更加復(fù)雜。GPT-4o 訓(xùn)練投入超 1000 PFlop/s-day,大約相當(dāng)于數(shù)千臺頂級 GPU 滿負荷運行數(shù)周。



原生多模態(tài)模型若要實現(xiàn) DeepSeek 式的降本,僅靠模型層面的算法創(chuàng)新是不夠的。以文心 5.0 為例,依托飛槳深度學(xué)習(xí)框架進行大規(guī)模 MoE 模型訓(xùn)練,模型預(yù)訓(xùn)練性能較基線提速 230%,激活參數(shù)比低至 3%。

在國產(chǎn)芯片替代的大背景下,大模型降本需要同時掌握芯片、框架、模型和應(yīng)用四個層面的自主權(quán),對企業(yè)全棧系統(tǒng)工程能力提出了更高的要求。目前國內(nèi)具備這種閉環(huán)能力的只有百度和華為。

當(dāng)推理成本降低,模型可以在后臺持續(xù)完成自我博弈、工具調(diào)用和邏輯反思,以 Manus 為代表的通用 Agent 就能實現(xiàn)在網(wǎng)頁間穿梭,完成報表分析。這不光重塑了軟件,也驅(qū)動模型能力從 “云端” 向 “端側(cè)” 下沉。原本昂貴的 AI 被嘗試融合進 AI 眼鏡、智能座艙和手機 OS 中。

顯然,AI 的下半場不再只是比拼模型規(guī)模,而是比 “誰能以更低的成本提供更深的智能”。在這場效率革命中,降本不是目的,而是手段。

誰是 AI 時代下一個 “超級入口”?

2000 年,百度也憑借自身技術(shù),為搜狐、新浪、網(wǎng)易等門戶網(wǎng)站提供搜索方面的支持。彼時,這些門戶網(wǎng)站雖然擁有龐大的搜索流量,但 “搜索” 卻僅被其視為一個附屬的功能模塊,沒進行深度優(yōu)化。2001 年,李彥宏力排眾議要推出自己的門戶網(wǎng)站,以搜索引擎為核心的入口 “百度”(Baidu.com)應(yīng)運而生。

百度憑借超鏈分析技術(shù)和精準(zhǔn)的中文分詞,從門戶網(wǎng)站的索引中脫穎而出。那時,百度的成功在于解決了 “搜得準(zhǔn)” 的問題。百度成為了最初的 “平臺級入口”。

時間回到 2025 年,AI 技術(shù)讓 “超級入口” 的邏輯發(fā)生了質(zhì)變,下一代超級入口正從 “匯聚流量的 app” 轉(zhuǎn)向 “多模態(tài)的智能助手”。

在 “超級入口” 之爭上,國內(nèi)能與大廠競爭的創(chuàng)業(yè)公司屈指可數(shù)。大廠不會放棄任何一種擴張的可能。字節(jié)跳動、阿里、騰訊與百度正依托各自的生態(tài),搶占 “平臺級入口” 這一高地。

12 月 1 日,字節(jié)發(fā)布和中興努比亞合作開發(fā)的豆包手機助手,試圖重塑人機交互的底層邏輯。用戶僅通過語音交互,就可以讓豆包手機助手直接接管用戶屏幕。

同期,阿里調(diào)動整個集團資源,打造 AI 時代的超級助手。阿里成立千問 C 端事業(yè)群,將之前阿里云事業(yè)部下通義千問 APP 改名 “千問 APP” 發(fā)布,以 “一周一更新” 的速度迭代。近日,千問 APP 已接入高德地圖,未來阿里或把夸克、UC、天貓精靈等功能也整合進千問 APP。

百度基于搜索,也上線了百度文心助手,對標(biāo) Gemini 3,競爭超級入口。百度搜索全面升級文心助手 AIGC 創(chuàng)作能力,支持 AI 圖片、AI 視頻、AI 音樂、AI 播客等多種模態(tài)創(chuàng)作。從硬件布局的演進趨勢來看,百度可以依托文心 5.0 大模型的技術(shù)底座,通過蘿卜快跑接管物理空間,用小度占據(jù)家庭交互入口,讓信息實現(xiàn)從虛擬空間向真實空間的滲透。

幾周前,Google 將 Gemini 3 嵌入核心搜索業(yè)務(wù),通過跨應(yīng)用的數(shù)據(jù)調(diào)取,實時生成能與用戶交互的 UI 頁面,向用戶直接交付搜索結(jié)果。Google 通過自研 AI 芯片和 Google Cloud 支持大模型訓(xùn)練、推理,訓(xùn)練出的先進的模型又能與自身搜索、云盤、Android 生態(tài)等入口融合,繼續(xù)產(chǎn)生相應(yīng)領(lǐng)域的高質(zhì)量數(shù)據(jù),持續(xù)推動智能升級。

有行業(yè)人士認為,Google 已形成 “算力-模型-數(shù)據(jù)-應(yīng)用” 的系統(tǒng)級飛輪,而百度是中國為數(shù)不多能與 Google 對標(biāo)的 “AI 六邊形戰(zhàn)士”。因為下個時代的 AI 競爭的不止是模型能力,而是演進為全棧式的系統(tǒng)競爭,比拼的是誰能完成 “算力—系統(tǒng)—模型—入口—資源—行動能力” 六個層面的閉環(huán)。

他們認為,百度依托昆侖芯、智能云作為算力與系統(tǒng)底座,以文心大模型作為能力中樞,鏈接搜索、網(wǎng)盤、小度等流量入口,并通過搜索、地圖與自動駕駛等業(yè)務(wù)將能力落地到現(xiàn)實世界,形成了六大要素閉環(huán),是國內(nèi)最接近 “AI 六邊形戰(zhàn)士” 形態(tài)的公司之一,具備長期演進的系統(tǒng)飛輪能力。



圖源網(wǎng)絡(luò)

水面之下,騰訊同樣暗流涌動。12 月下旬,騰訊新成立 AI Infra 部、AI Data 部、數(shù)據(jù)計算平臺部,27 歲的前 OpenAI 研究員姚順雨出任 “CEO / 總裁辦公室” 首席 AI 科學(xué)家。過去數(shù)月里,騰訊也以加倍薪資挖角 AI 人才,強化研發(fā)體系。

在生成式人工智能的第一波流量交鋒中,有的公司水漲船高,有的公司陷入沉靜。但在喧囂之下,堅守 “技術(shù)信仰” 的企業(yè),正在等待那個規(guī)則被重新定義的時刻。

題圖來源:Transformers: Dark of the Moon

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
9000mAh!新機官宣:12月26日,開啟預(yù)售!

9000mAh!新機官宣:12月26日,開啟預(yù)售!

科技堡壘
2025-12-26 15:16:24
陳婷:我這輩子最驕傲的就是在19歲那年給50歲的張藝謀生兒子!

陳婷:我這輩子最驕傲的就是在19歲那年給50歲的張藝謀生兒子!

小熊侃史
2025-12-24 07:25:06
柿子立大功?武大研究發(fā)現(xiàn):柿子可在32小時清除20%有害菌群?

柿子立大功?武大研究發(fā)現(xiàn):柿子可在32小時清除20%有害菌群?

看世界的人
2025-11-29 13:55:27
十年前花百萬在燕郊買房的人,如今過得怎樣?結(jié)局真悲慘!

十年前花百萬在燕郊買房的人,如今過得怎樣?結(jié)局真悲慘!

飛鳥避雷曝光
2025-12-25 21:00:08
獲得中方承諾后,澤連斯基又拿到7420億,英媒:美國威脅西方

獲得中方承諾后,澤連斯基又拿到7420億,英媒:美國威脅西方

兵說
2025-12-25 11:53:46
一碗雞蛋羹毒倒一家人?醫(yī)生警告:雞蛋盡量別這樣吃,比農(nóng)藥還毒

一碗雞蛋羹毒倒一家人?醫(yī)生警告:雞蛋盡量別這樣吃,比農(nóng)藥還毒

二大爺觀世界
2025-12-25 17:52:11
年營收300萬,28個員工,最后利潤8萬塊:這就是最真實小老板!

年營收300萬,28個員工,最后利潤8萬塊:這就是最真實小老板!

熊林老師
2025-11-17 18:00:03
帶你看看真實的外蒙古,讓蒙古回歸已然成為一件不可能的事

帶你看看真實的外蒙古,讓蒙古回歸已然成為一件不可能的事

侃侃兒談
2025-12-05 08:26:01
他真是最低調(diào)的“星二代”了,父母姐姐都超牛,卻從未公開提及過

他真是最低調(diào)的“星二代”了,父母姐姐都超牛,卻從未公開提及過

娛人細品
2025-12-25 15:54:07
北京國安將入準(zhǔn)入名單!1隊或解散,媒體人:進名單不一定沒糾紛

北京國安將入準(zhǔn)入名單!1隊或解散,媒體人:進名單不一定沒糾紛

奧拜爾
2025-12-26 14:06:28
午睡半小時錯了?醫(yī)生告誡:上了60歲后,午睡請注意3點

午睡半小時錯了?醫(yī)生告誡:上了60歲后,午睡請注意3點

風(fēng)信子的花
2025-11-23 17:02:02
汪文斌最新署名文章

汪文斌最新署名文章

新京報
2025-12-25 15:06:10
如今“家喻戶曉”的明代畫家仇英,他在古代畫家中歷史地位如何?

如今“家喻戶曉”的明代畫家仇英,他在古代畫家中歷史地位如何?

老范談史
2025-12-25 10:24:43
注意!多地充電價格調(diào)整,2026年網(wǎng)約車司機跑車成本要漲了

注意!多地充電價格調(diào)整,2026年網(wǎng)約車司機跑車成本要漲了

網(wǎng)約車觀察室
2025-12-26 09:53:51
CCTV5直播,U23男足大戰(zhàn)伊拉克U23,王鈺棟領(lǐng)銜,贏球能沖擊八強

CCTV5直播,U23男足大戰(zhàn)伊拉克U23,王鈺棟領(lǐng)銜,贏球能沖擊八強

體壇小快靈
2025-12-26 12:19:12
高市早苗出招:拼速度的時候到了!日本高層赴俄,在中國背后捅刀

高市早苗出招:拼速度的時候到了!日本高層赴俄,在中國背后捅刀

阿笎評論哥
2025-12-26 15:18:49
徐湖平跑不了!收藏家顏明:江南春剛調(diào)撥出去,隔天就被陸挺買走

徐湖平跑不了!收藏家顏明:江南春剛調(diào)撥出去,隔天就被陸挺買走

放開他讓wo來
2025-12-24 10:20:32
江疏影與大佬海外產(chǎn)子真相曝光,39歲近照引關(guān)注

江疏影與大佬海外產(chǎn)子真相曝光,39歲近照引關(guān)注

暖心萌阿菇?jīng)?/span>
2025-12-25 04:33:19
報名截止!43人參加國乒競聘,總教練、副總教練人選即將浮出水面

報名截止!43人參加國乒競聘,總教練、副總教練人選即將浮出水面

曹說體育
2025-12-26 13:47:37
盧偉冰“799元”口誤引爆熱搜,網(wǎng)友:像極自導(dǎo)自演的套路

盧偉冰“799元”口誤引爆熱搜,網(wǎng)友:像極自導(dǎo)自演的套路

熱點菌本君
2025-12-26 15:35:35
2025-12-26 16:43:00
晚點LatePost
晚點LatePost
晚一點,好一點。商業(yè)的真相總是在晚點?!锻睃cLatePost》官方賬號
2996文章數(shù) 21864關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

北京50歲女子因"不會做飯"偷外賣 曾就職外企收入穩(wěn)定

頭條要聞

北京50歲女子因"不會做飯"偷外賣 曾就職外企收入穩(wěn)定

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天深夜道歉,只字未提五月天阿信

財經(jīng)要聞

資管江湖的人事“寒冬”

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

數(shù)碼
手機
游戲
公開課
軍事航空

數(shù)碼要聞

手勢更精準(zhǔn),捏一捏就能操控!小米 Watch 5評測

手機要聞

iPhone背面有隱藏按鍵?蘋果官方回應(yīng):已推出幾年

內(nèi)存暴走!次世代主機恐要延期 現(xiàn)役主機還要漲價?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進入關(guān)懷版