国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

百度大模型又支棱起來了嗎?文心一言 5.0 我實測了

0
分享至

免責(zé):

本文純個人觀點,僅測試文本理解、代碼生成能力,結(jié)果不代表 ERNIE 5.0 完整、真實水平。

省流

  • 1、生成速度很慢

  • 2、網(wǎng)頁版居然沒有 html 預(yù)覽功能,這事兒不難啊,Kimi、Qwen 都可以

  • 3、各種拉垮,6 個題目,沒有 1 個可以與 Kimi K2 Thinking 掰手腕,只有最后1題完成度高,能勉強與Qwen-3Max對比

  • 4、它對指令的理解很差,但凡與圖像生成沾邊的都會忽略指令,開始直接 AI 繪圖,即便你已經(jīng)明確告訴它了實現(xiàn)方式也不行。

  • 5、或許我不應(yīng)該測試它最新這個多模態(tài)版 ERNIE 5.0,1022 版本的文心 5.0 號稱文本能力更強,我沒再測。但是話說回來了,多模態(tài)就可以不遵守指令嗎?

  • 6、它太喜歡畫畫了

大家好,我是 Ai 學(xué)習(xí)的老章

最近一周國產(chǎn)大模型還是很熱鬧的

阿里更新了 Qwen DeepResearch、微博開源了基于 Qwen2.5-Math-1.5B 微調(diào) VibeThinker 1.5B 大模型

最讓我感興趣的是“支棱起來”的百度 ERNIE 5.0 來了,對標(biāo) ChatGPT,原生全模態(tài)支持。

官方宣稱的模型特色之處:

原生統(tǒng)一多模態(tài)建模技術(shù),結(jié)合文本、圖像、音頻和視頻進行理解和生成 采用超過 2.4T 的 MoE 架構(gòu),每次推理激活不到 3 個,降低計算量同時提升推理效率 在 40 多項基準(zhǔn)測試中表現(xiàn)出前沿水平的性能

基準(zhǔn)測試對比情況

1、文本處理,各項基準(zhǔn)平均值,穩(wěn)贏 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,還有幾個基準(zhǔn)能打贏 GPT-5


2、視覺理解各種領(lǐng)先,N 多項上 Gemini-2.5-Pro、GPT-5 都手下敗將


3、圖像生成秒殺 GPT-image 和谷歌的 Nano-Banana、視頻生成與 Veo3 旗鼓相當(dāng)


4、音頻理解、STT、語音識別都各種強過 GPT-4o-Audio、Gemini-2.5-Pro


真實水平咋樣呢,我就直接單測試其文本處理、代碼能力吧

這些題目與之前我測試 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距

測試平臺為官方網(wǎng)站:https://ernie.baidu.com/

模型選擇文心 5.0 Preview


ERNIE 5.0 1022 預(yù)覽版具有更強的文字能力,ERNIE 5.0 預(yù)覽版是最新版本 測試 1:總結(jié)朱自清《背影》繪制 SVG

字都出格了,跟 Kimi K2 Thinking 沒法比,也比不上一樣沒能正確識別出 4 次背影但繪制 svg 正常的 Qwen3-Max,

Kimi K2 Thinking
Qwen3-Max


測試 2:生成器官分布

怎么就出發(fā)了繪圖功能呢?


即便告訴它給我 svg 代碼,依然失敗



測試 3:用 html 創(chuàng)建一個帶有旋轉(zhuǎn)星云和動態(tài)光照的 3D 粒子星系。

思考過程看,也是用 Three.js 創(chuàng)建 3D 場景、相機和渲染器,但是太太太簡陋了

完敗與 K2 Thinking 和 Qwen3-Max


沒有對比就沒有傷害


測試 4:發(fā)揮你的最大才能,用你最擅長的工具,生成一組數(shù)據(jù)后繪制數(shù)據(jù)大屏,主題自擬。

ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 腳本生成 csv 數(shù)據(jù)集,但是可視化時,它告訴我要用Power BI實現(xiàn)。。。


K2 Thinking 生成的是"未來智慧城市運營中心"主題的數(shù)據(jù)大屏,包含動態(tài)生成的多維度城市運營數(shù)據(jù)。一共 285 行代碼。前兩次均報 bug,第三次成功生成!


對比 Qwen3-Max??,它第一次的代碼也報錯,第二次成功


測試 5:3D 動畫演示月食原理及全過程

不遵指令,后面我追問了,給我 html 代碼,依然是繪圖



Kimi K2??

測試 6:生成一個動態(tài)網(wǎng)頁,展現(xiàn)絢麗多彩的煙花盛況,樣式要多,顏色要炫

這次遵守指令了,思考過程是用 html+CSS+js 實現(xiàn),效果如下,除了相比 K2 和 Qwen 功能上少了,完成度還不錯,甚至比 Qwen3-Max 還要好點的感覺

K2 Thinking 碾壓 Qwen3-Max 的視頻

最后再說一句,即便是我切換成 10 月份擅長文本生成的文心 5.0,它的指令遵循也不穩(wěn)定,它太喜歡畫畫了,思考過要用 html5 和 webgl 實現(xiàn)后,pia 一下直接 AI 繪畫了


最后再推薦一個我正在學(xué)習(xí)的強化學(xué)習(xí)課程



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
哈登34+6,快船三連勝!大洛9記三分,一戰(zhàn)看清三位球星真實發(fā)揮

哈登34+6,快船三連勝!大洛9記三分,一戰(zhàn)看清三位球星真實發(fā)揮

老梁體育漫談
2025-12-27 13:40:40
73歲普京高調(diào)認(rèn)愛,這就是相差41歲的“一見鐘情”

73歲普京高調(diào)認(rèn)愛,這就是相差41歲的“一見鐘情”

吃瓜局
2025-12-26 15:30:08
精準(zhǔn)斬首!泰國無人機斬首行動震驚東南亞!洪森指揮鏈遭團滅!

精準(zhǔn)斬首!泰國無人機斬首行動震驚東南亞!洪森指揮鏈遭團滅!

深度報
2025-12-24 22:47:16
被排隊斬殺的美國人為什么不反抗?

被排隊斬殺的美國人為什么不反抗?

觀雨大神經(jīng)
2025-12-26 19:55:35
布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

釘釘陌上花開
2025-12-27 11:43:14
多家博物館公告:暫停開放

多家博物館公告:暫停開放

深圳晚報
2025-12-26 23:58:02
僅維持8天,越南高鐵夢碎了,越南首富緊急撤資,中國幸運避坑!

僅維持8天,越南高鐵夢碎了,越南首富緊急撤資,中國幸運避坑!

博覽歷史
2025-12-26 19:12:15
“蹭準(zhǔn)毒品擦邊球”?霸王茶姬回應(yīng)高濃度咖啡因爭議

“蹭準(zhǔn)毒品擦邊球”?霸王茶姬回應(yīng)高濃度咖啡因爭議

深圳晚報
2025-12-26 23:58:38
韓束:旗下所有產(chǎn)品均未添加人表皮生長因子成分

韓束:旗下所有產(chǎn)品均未添加人表皮生長因子成分

界面新聞
2025-12-27 13:43:31
關(guān)于在烏克蘭的傷亡,做一道簡單計算題:參戰(zhàn)的90萬俄軍去哪兒了

關(guān)于在烏克蘭的傷亡,做一道簡單計算題:參戰(zhàn)的90萬俄軍去哪兒了

鷹眼Defence
2025-12-26 18:03:30
越南這場鬧劇,終于還是沒演下去,670億美金的高鐵夢徹底碎了!

越南這場鬧劇,終于還是沒演下去,670億美金的高鐵夢徹底碎了!

青青子衿
2025-12-27 02:06:04
M豆吳夢夢接受BBC專訪:我的人生就沒有婚姻這個選項

M豆吳夢夢接受BBC專訪:我的人生就沒有婚姻這個選項

吃瓜黨二號頭目
2025-12-27 11:23:24
一場1-0!讓曼聯(lián)進前5,歐冠近在咫尺:和切爾西同分,3豪門爭四

一場1-0!讓曼聯(lián)進前5,歐冠近在咫尺:和切爾西同分,3豪門爭四

體育知多少
2025-12-27 08:15:48
80輛油罐車駛?cè)肜蠐耄伤葡蚣砥艺斔,柬工業(yè)體系究竟有多爛?

80輛油罐車駛?cè)肜蠐,疑似向柬埔寨輸送,柬工業(yè)體系究竟有多爛?

百科密碼
2025-12-26 14:21:30
大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

歷史總在押韻
2025-12-26 21:34:35
太稀罕了!深圳一家公司通知供應(yīng)商趕緊對賬,12月底結(jié)清所有貨款

太稀罕了!深圳一家公司通知供應(yīng)商趕緊對賬,12月底結(jié)清所有貨款

火山詩話
2025-12-27 09:04:18
“AI教母”李飛飛最新采訪:K12教育是浪費學(xué)生時間,靠AI都可以做到

“AI教母”李飛飛最新采訪:K12教育是浪費學(xué)生時間,靠AI都可以做到

智車星球
2025-12-24 22:53:38
剛剛,美國發(fā)出最高預(yù)警:疫情已完全失控!2026年人類面臨大考?

剛剛,美國發(fā)出最高預(yù)警:疫情已完全失控!2026年人類面臨大考?

徐德文科學(xué)頻道
2025-12-26 20:21:51
爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

娜烏和西卡
2025-12-27 10:38:23
AI大神吳恩達:很多計算機專業(yè)應(yīng)屆生找不到工作,是因為高校課程嚴(yán)重滯后

AI大神吳恩達:很多計算機專業(yè)應(yīng)屆生找不到工作,是因為高校課程嚴(yán)重滯后

爆角追蹤
2025-12-27 12:33:54
2025-12-27 13:59:00
機器學(xué)習(xí)與Python社區(qū) incentive-icons
機器學(xué)習(xí)與Python社區(qū)
機器學(xué)習(xí)算法與Python
3235文章數(shù) 11081關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美國聯(lián)邦政府終止撥款加州高鐵 美國加州撤銷相關(guān)訴訟

頭條要聞

美國聯(lián)邦政府終止撥款加州高鐵 美國加州撤銷相關(guān)訴訟

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

劉宇寧:我的價值不需要靠番位來證明

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

本地
時尚
親子
房產(chǎn)
家居

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

推廣中獎名單-更新至2025年12月15日推廣

親子要聞

多吃富含葉黃素的食物對保持孩子眼健康有補益

房產(chǎn)要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

無障礙瀏覽 進入關(guān)懷版