国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

文心一言4.5只是頭菜,百度想做的大概率還是平臺(tái)

0
分享至

我看了下 Github 上發(fā)布詳情,發(fā)現(xiàn)這次百度這次的開源模型反而不是重點(diǎn),它的胃口主要在于生態(tài)。

簡(jiǎn)單來說,AI大模型必定會(huì)有一代更比一代強(qiáng),但是生態(tài)基礎(chǔ)不一樣,它更像是挖金礦的鏟子,用戶忠誠(chéng)度極高。

文心 4.5 的 Github 鏈接: https://github.com/PaddlePaddle/ERNIE

文心 Ernie4.5 ,這次一共發(fā)布了 10 款大模型,但實(shí)際上涵蓋了三個(gè)品類:

  • LLM :傳統(tǒng)的大語言模型,也就是純文字的那種,主流的 MoE 混合專家模型,有兩個(gè) size ,一個(gè)大的 300B ,一個(gè)小的 21B ,跨度很大。

  • VLM :視覺語言模型,也就是現(xiàn)在主流的多模態(tài)模型,可以無縫的處理文字 / 圖片 / 視頻,但是目前只能輸出文字,比如讓它描述個(gè)圖片視頻什么的。

  • Dense Model :這個(gè)是跟 MoE 相對(duì)的稠密模型,也就是這種模型每推理一次,就會(huì)用到所有的參數(shù),代價(jià)就是消耗的計(jì)算量大,所以這個(gè)類目只有 0.3B 的模型,非常適合跑在端側(cè)。



異構(gòu)MoE

單純從發(fā)布的 10 個(gè)大模型來看,可以很清晰地看到百度在盡可能的探索 AI 大模型的所有主流方向, Reasoning 推理, MoE , Dense ,端側(cè)等等。

但是它這個(gè) MoE 有亮點(diǎn),那就是 Multimodal Heterogeneous MoE Pre-Training , MoE 我們大家應(yīng)該都不陌生,像 DeepSeek R1 就是一個(gè) MoE 的混合專家模型,也就是大模型,但是推理的時(shí)候只執(zhí)行一部分,所以兼?zhèn)淞速|(zhì)量和速度。

而 Ernie 的這個(gè) MoE ,首先它是多模態(tài)的,可以處理除了文本之外的圖片和視頻,這就要求在訓(xùn)練的時(shí)候適配多模態(tài),其次更重要的是 Heterogeneous 異構(gòu)這個(gè)詞,一般來說,之前的多模態(tài)大模型,訓(xùn)練的時(shí)候就像是一口 “ 大熔爐 ” ,所有的內(nèi)容進(jìn)行都先 encoding ,換句話說,各種模型的數(shù)據(jù)最終都會(huì)轉(zhuǎn)換成數(shù)學(xué)里面的向量。

再簡(jiǎn)單一點(diǎn)兒,那就是不管你是普通話還是什么方言,最終都要轉(zhuǎn)換成英文表達(dá)。


這里面就有問題了,因?yàn)閳D像和文字本來就是兩種不同的表達(dá)方式,那么用這種 “ 一鍋燴 ” 的方式,為了學(xué)好圖像,可能會(huì)犧牲一些語言的精細(xì)度;為了更好地理解語法,可能會(huì)忽略圖像的細(xì)節(jié)。最終得到的可能是一個(gè) “ 折中 ” 的模型,而不是一個(gè) “ 雙料冠軍 ” 。

文心 4.5 做的事其實(shí)直覺上很簡(jiǎn)單,它不再是簡(jiǎn)單地將圖像和文本數(shù)據(jù) “ 攪拌 ” 在一起喂給模型,而是設(shè)計(jì)了一個(gè) 分工明確、調(diào)度智能、訓(xùn)練有方 的 “ 專家委員會(huì) ” 系統(tǒng)。通過 異構(gòu)結(jié)構(gòu) 實(shí)現(xiàn)物理隔離,通過 隔離路由 實(shí)現(xiàn)任務(wù)的精準(zhǔn)分配,再通過 兩種特殊的損失函數(shù) 從數(shù)學(xué)上保證了專家團(tuán)隊(duì)的專業(yè)性和學(xué)習(xí)過程的公平性。

最終達(dá)到的效果是 “ 相互促進(jìn) (mutual reinforcement)” ,即文本知識(shí)的學(xué)習(xí)可以幫助模型更好地理解圖像,反過來也一樣。

性能

性能大家可以自己去對(duì)比,畢竟都是些打榜的 benchmark 結(jié)果,不能當(dāng)成使用效果來看,具體怎么樣,得看自己的需求,沒有什么模型十全十美。


生態(tài)

我甚至覺得這部分才是大頭,因?yàn)榘俣绕鋵?shí)一直做的深度學(xué)習(xí)框架 飛槳( PaddlePaddle ) ,在國(guó)內(nèi)還是挺有基礎(chǔ)的,因?yàn)槟P涂赡軙?huì)過時(shí),但是生態(tài)可是一個(gè)長(zhǎng)期主義的典型代表。


這次隨模型一同發(fā)布的,還有文心大模型開發(fā)套件 ERNIEKit 和高效部署套件 FastDeploy 。 ERNIEKit 覆蓋了從微調(diào)( SFT )、對(duì)齊( DPO )到量化的全流程開發(fā),而 FastDeploy 則解決了多硬件平臺(tái)(如各種芯片)的高效推理部署問題。

這一整套 “ 全家桶 ” 式的解決方案,極大地降低了開發(fā)者使用文心大模型的門檻。

對(duì)于百度來說,我一直是跟 Google 對(duì)標(biāo)的,畢竟大家都是做搜索引擎出身,再加上本身有的大量語料資源,計(jì)算資源,是可以下盤大棋的,如果一旦習(xí)慣了這套從開發(fā)到部署的流暢體驗(yàn),就會(huì)自然而然地被留在飛槳的生態(tài)系統(tǒng)中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
賴清德若赴民意機(jī)構(gòu)做彈劾說明要坐哪? 韓國(guó)瑜旁早備“特別席”

賴清德若赴民意機(jī)構(gòu)做彈劾說明要坐哪? 韓國(guó)瑜旁早備“特別席”

海峽導(dǎo)報(bào)社
2025-12-27 11:44:02
聽聞黃百韜自殺,粟裕一頭栽倒,后來其妻透露:他不敢向主席訴苦

聽聞黃百韜自殺,粟裕一頭栽倒,后來其妻透露:他不敢向主席訴苦

史之銘
2025-12-28 22:41:42
喪心病狂!41國(guó)乒奧運(yùn)冠軍全家遭死亡威脅:有人要?dú)⑺滥闳?>
    </a>
        <h3>
      <a href=梅亭談
2025-12-28 22:39:12
400萬億什么時(shí)候來?等待我們的是什么?

400萬億什么時(shí)候來?等待我們的是什么?

混知房產(chǎn)
2025-11-13 20:41:06
七連勝,杜鋒:缺兵少將拿下山西很不容易,希望年輕小將努力成長(zhǎng)

七連勝,杜鋒:缺兵少將拿下山西很不容易,希望年輕小將努力成長(zhǎng)

懂球帝
2025-12-28 23:50:06
從爭(zhēng)冠核心到軟肋!8000萬歐巨星或淪為替補(bǔ),斯洛特面臨艱難抉擇

從爭(zhēng)冠核心到軟肋!8000萬歐巨星或淪為替補(bǔ),斯洛特面臨艱難抉擇

銳評(píng)利物浦
2025-12-28 23:42:35
278架無人機(jī)襲擊俄羅斯,莫斯科遭30架無人機(jī)襲擊,俄羅斯也挨炸

278架無人機(jī)襲擊俄羅斯,莫斯科遭30架無人機(jī)襲擊,俄羅斯也挨炸

山河路口
2025-12-28 23:26:03
NVIDIA花200億美元收購Grop:補(bǔ)足GPU短板 未來市值看上7.5萬億

NVIDIA花200億美元收購Grop:補(bǔ)足GPU短板 未來市值看上7.5萬億

安兔兔
2025-12-28 22:02:44
烈士王偉的遺孀阮國(guó)琴,獲特招入伍,如今已是海軍上校,依舊單身

烈士王偉的遺孀阮國(guó)琴,獲特招入伍,如今已是海軍上校,依舊單身

文史達(dá)觀
2025-12-28 06:45:07
蒙古國(guó)大膽想法:拿400平方公里和中國(guó)換通道?想將稀土運(yùn)往美國(guó)

蒙古國(guó)大膽想法:拿400平方公里和中國(guó)換通道?想將稀土運(yùn)往美國(guó)

游者走天下
2025-12-26 16:20:18
沙利文終于承認(rèn),佩洛西竄臺(tái)是步臭棋,臺(tái)海環(huán)境已發(fā)生不可逆改變

沙利文終于承認(rèn),佩洛西竄臺(tái)是步臭棋,臺(tái)海環(huán)境已發(fā)生不可逆改變

叮當(dāng)當(dāng)科技
2025-12-28 22:56:02
樂子大了!越南高鐵項(xiàng)目給中國(guó)挖坑,結(jié)果掉進(jìn)去了

樂子大了!越南高鐵項(xiàng)目給中國(guó)挖坑,結(jié)果掉進(jìn)去了

超級(jí)學(xué)爸蛋總
2025-12-28 23:28:22
“苦等9年”的沈夢(mèng)辰:住2億別墅,請(qǐng)4個(gè)保姆,光鮮背后也有淚水

“苦等9年”的沈夢(mèng)辰:住2億別墅,請(qǐng)4個(gè)保姆,光鮮背后也有淚水

老范談史
2025-12-26 14:41:29
黎筍之子黎堅(jiān)誠(chéng)坦言:父親選擇同中國(guó)開戰(zhàn),是其畢生最大的失策

黎筍之子黎堅(jiān)誠(chéng)坦言:父親選擇同中國(guó)開戰(zhàn),是其畢生最大的失策

磊子講史
2025-12-24 11:04:05
乒超大結(jié)局:王楚欽衛(wèi)冕男團(tuán)冠軍 瓜分100萬獎(jiǎng)金 孫穎莎也是贏家

乒超大結(jié)局:王楚欽衛(wèi)冕男團(tuán)冠軍 瓜分100萬獎(jiǎng)金 孫穎莎也是贏家

侃球熊弟
2025-12-28 20:17:13
烏專家:中國(guó)“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們?cè)斐?.0!

烏專家:中國(guó)“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們?cè)斐?.0!

小莜讀史
2025-12-25 20:46:05
與丈夫相愛10年,還有2個(gè)女兒,卻抵不過27歲戲子,她:永不再見

與丈夫相愛10年,還有2個(gè)女兒,卻抵不過27歲戲子,她:永不再見

云霄紀(jì)史觀
2025-12-28 19:08:07
一分惜敗!一戰(zhàn)封神!NBA49年,只有他才敢這么玩!

一分惜?。∫粦?zhàn)封神!NBA49年,只有他才敢這么玩!

籃球盛世
2025-12-28 20:08:39
宋曉峰豪宅曝光,室內(nèi)有電梯,為直播建豪華工作室,ktv飯店都有

宋曉峰豪宅曝光,室內(nèi)有電梯,為直播建豪華工作室,ktv飯店都有

一娛三分地
2025-12-28 22:55:42
他當(dāng)縱隊(duì)司令優(yōu)柔寡斷,降為副司令打得毫不猶豫,此人是哪位將軍

他當(dāng)縱隊(duì)司令優(yōu)柔寡斷,降為副司令打得毫不猶豫,此人是哪位將軍

云霄紀(jì)史觀
2025-12-28 22:40:49
2025-12-29 00:11:00
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

頭條要聞

澤連斯基:若要烏就領(lǐng)土問題讓步 "和平計(jì)劃"應(yīng)全民公投

頭條要聞

澤連斯基:若要烏就領(lǐng)土問題讓步 "和平計(jì)劃"應(yīng)全民公投

體育要聞

MVP概率達(dá)82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

教育
健康
游戲
房產(chǎn)
藝術(shù)

教育要聞

地理干貨|高中地理易錯(cuò)知識(shí)點(diǎn)期末整理

這些新療法,讓化療不再那么痛苦

醉酒兔女郎護(hù)送回家!重磅更新可偷看裙底?

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

藝術(shù)要聞

世界第二高樓變“廣告塔”,激怒馬來西亞人!

無障礙瀏覽 進(jìn)入關(guān)懷版