国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek專家模式實(shí)測:落差有點(diǎn)巨大

0
分享至

4月8日凌晨,看到有朋友說DeepSeek更新了,我瞬間清醒了,不困了,難道真是V4更新了?

打開官網(wǎng)一看, 又雙叒叕 不是 V 4,模型還是 V 3.2,只是上線了一個專家模式,號稱:“擅長復(fù)雜問題,高峰需要等待?!?/p>


根據(jù)我在網(wǎng)上四處瀏覽的體感,這個模式應(yīng)該直接就是全量上線了,所有打開官網(wǎng)和app的用戶應(yīng)該都能看到了。

而根據(jù)我使用 C hatGPT的經(jīng)驗(yàn),快速模式和專家模式,應(yīng)該分別對應(yīng)instant和thinking模式。


前者回答很快,能提供聊天時的實(shí)時感和沉浸感,但答案深度有限,復(fù)雜問題給不出什么有效回答,后者相對較慢,但能夠回答較為復(fù)雜的研究級問題。

但是在熬了大半夜體驗(yàn)了一陣子這個專家模式以后,我只能說:我沒有看到太強(qiáng)的提升和太多的變化。

ChatGPT的thinking模式,大約會花幾分鐘到十幾分鐘,給出一個全面而有深度的回答,當(dāng)然這也取決于你問了什么問題。


而在多次交替用同一個問題測試 DeepSeek新上的 兩個模式后,我發(fā)現(xiàn)就連專家模式,竟然也很少用超過5秒鐘時間來答題(如果有測出10秒以上的歡迎發(fā)給我)。

這,快得有點(diǎn)離譜了,有些問題反而是快速模式花了更多的時間,雖然也就可能多了1-2秒。


與之相伴的是,問題的答案,確實(shí)都答在點(diǎn)上,但基本也沒有特別讓我印象深刻的。

也許,回答問題的時長,并不能直接證明答案一定好或不好,但如果你長期使用多個大模型產(chǎn)品,就會知道,時長和答案質(zhì)量之間,還是非常正相關(guān)的。

還有一個點(diǎn),專家模式,居然暫時不支持上傳附件,然而快速模式可以,也就是說這個專家模式居然還不是多模態(tài)的。

然后,我用了一個陷阱問題去問 DeepSeek的專家模式:outlook有兩個o, 結(jié)果令我吃驚,他居然真的說有兩個o,還說我觀察力滿分??


然后我接著說,有3個o,他馬上改口了,還對我發(fā)起了聊天小表情


等于很多模型以前出現(xiàn)過的過度諂媚 ( sycophancy ) 問題,在這個專家模式身上又出來了。

然后我繼續(xù)調(diào)戲他,他繼續(xù)附和我,還要和我握手


剛剛好在一年前,我寫過一篇,當(dāng)時也是為了看看 諂媚程度的問題, 但那純粹是一個搞笑測試,問的問題都是文科性質(zhì)的沒有唯一正確答案的那種問題,也是一些需要高情商才能答好的問題。


為什么新的模式似乎提升有限?以下是我暫時唯一想到的理由。

根據(jù)The Infomration 4月3日的報道, DeepSeek 為了適配國產(chǎn)芯片,在開發(fā)進(jìn)度和性能上,都做出了不小的犧牲。

DeepSeek以前一直在英偉達(dá)的芯片上訓(xùn)練,現(xiàn)在要遷移了,模型的有些部分要重寫了。


為了V4模型能在國產(chǎn)芯片上流暢運(yùn)行,導(dǎo)致本來今年2月要發(fā)布的V4,也遲遲未能發(fā)布。


甚至,為了讓國產(chǎn)芯片贏得更多發(fā)展機(jī)會, DeepSeek 還拒絕了讓英偉達(dá)提前接觸V4。


2月,中國的春節(jié),本來也是很多人(包括我在內(nèi))認(rèn)為DeepSeek要發(fā)布V4的“最后時間點(diǎn)”,畢竟一年還沒有一個大版本的升級,似乎著實(shí)有點(diǎn)說不過去了。

我當(dāng)然覺得,網(wǎng)上對于DeepSeek的新版本發(fā)布,每一次的猜測都太夸張了,給的預(yù)期也過高了。

自25年1月的R1發(fā)布后,關(guān)于V4和R2什么時候來、以及性能有多牛逼的猜測,就沒斷過。

最夸張的有說去年3月就要發(fā)布的,然后我從25年3月一直關(guān)注到現(xiàn)在,整整一年過去了,DeepSeek每一次的升級,都“精準(zhǔn)”避開了媒體做出的那些最激進(jìn)的預(yù)測,只是發(fā)布了一些“微小”的改進(jìn)。

我當(dāng)然敬佩梁文峰的定力,看看國產(chǎn)三大AI產(chǎn)品,,都是很驚人的。

但其實(shí)回頭來看,大部分是被外界的聲音和競爭推著走的,有點(diǎn)為了內(nèi)卷而內(nèi)卷,實(shí)質(zhì)性的模型能力提升,其實(shí)是不多的。

而且春節(jié)之后的競爭格局,相比之前似乎完全沒有受到影響。只看活躍度的話,。

而千問在30億補(bǔ)貼后,,似乎都是來自競品的同學(xué)。

還有一個這次模型能力提升有限的“微小”理由是,DeepSeek這次的升級,其實(shí)恐怕只是一次產(chǎn)品形態(tài)的升級,而不是模型能力的升級。

它是在現(xiàn)有模型能力的基礎(chǔ)之上,用產(chǎn)品化的更新,根據(jù)不同的用戶需求和使用場景,把用戶引導(dǎo)到快速或?qū)<覂煞N模式上。


需求、功能和場景,這其實(shí)是傳統(tǒng)互聯(lián)網(wǎng)時代的產(chǎn)品經(jīng)理會做的事。

這可能也正是因?yàn)槟P湍芰Φ倪M(jìn)步慢于預(yù)期,倒逼出了先上線這類產(chǎn)品化更新。

但是,為了配合國產(chǎn)芯片而放慢了模型的更新,卻也是得不償失的,至少 我個人是這么認(rèn)為的。

保持模型能力盡量接近國外頂級付費(fèi)模型,才是最重要的事。

這個過程中,就應(yīng)該用上所有能用上的最強(qiáng)的卡,畢竟深度求索只是個“小”公司。

等待和配合國產(chǎn)芯片的能力慢慢追上英偉達(dá)的事(如果真有可能的話),應(yīng)該交給那些不差錢的大廠們。

大廠就應(yīng)該少燒點(diǎn)補(bǔ)貼外賣的錢,多在芯片上投資,你們覺得呢?

AI,畢竟是artifical intelligence,不是Wai Mai啊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
活塞頭牌躺了11場,球隊反而從東部第一變"更好了"

活塞頭牌躺了11場,球隊反而從東部第一變"更好了"

籃壇第一線
2026-04-09 08:04:28
廣東21歲美女抑郁癥自殺,上月寫好了遺書,留下8萬存款

廣東21歲美女抑郁癥自殺,上月寫好了遺書,留下8萬存款

180視角
2026-04-08 10:02:54
直播間被指涉黃!中華老字號海河乳品道歉:相關(guān)店鋪商品已下架

直播間被指涉黃!中華老字號海河乳品道歉:相關(guān)店鋪商品已下架

界面新聞
2026-04-08 09:25:10
即期布倫特原油價格漲至144.42美元/桶 創(chuàng)歷史新高

即期布倫特原油價格漲至144.42美元/桶 創(chuàng)歷史新高

每日經(jīng)濟(jì)新聞
2026-04-08 05:48:03
當(dāng)思想家揮刀自宮,其理論便徹底走向了反人類反人性

當(dāng)思想家揮刀自宮,其理論便徹底走向了反人類反人性

壹家言
2026-03-27 21:13:25
不跑不跳!一個被嚴(yán)重低估的“長壽動作”藏著6大好處,醫(yī)生都在推薦

不跑不跳!一個被嚴(yán)重低估的“長壽動作”藏著6大好處,醫(yī)生都在推薦

黃河新聞網(wǎng)呂梁
2026-04-06 09:33:08
非夫妻開房,民警提醒:只要不干這個,誰管你是不是夫妻

非夫妻開房,民警提醒:只要不干這個,誰管你是不是夫妻

君說輿情
2026-04-07 08:35:16
山東旋轉(zhuǎn)門后續(xù):逼員工鞠躬的家長懵了,監(jiān)控+通報雙雙打臉!

山東旋轉(zhuǎn)門后續(xù):逼員工鞠躬的家長懵了,監(jiān)控+通報雙雙打臉!

奇思妙想草葉君
2026-04-07 21:39:15
降級也去!曼城新星鐵心加盟熱刺,對瓜迪奧拉徹底失望

降級也去!曼城新星鐵心加盟熱刺,對瓜迪奧拉徹底失望

瀾歸序
2026-04-09 05:43:11
阿聯(lián)酋和科威特遭導(dǎo)彈與無人機(jī)襲擊

阿聯(lián)酋和科威特遭導(dǎo)彈與無人機(jī)襲擊

界面新聞
2026-04-08 18:39:34
訂單排到2028年!光通信這波不是炒概念,是真金白銀的產(chǎn)業(yè)爆發(fā)

訂單排到2028年!光通信這波不是炒概念,是真金白銀的產(chǎn)業(yè)爆發(fā)

Thurman在昆明
2026-04-08 08:36:14
毛主席曾預(yù)言:這兩個國家將來對中國最大威脅,如今果然應(yīng)驗(yàn)

毛主席曾預(yù)言:這兩個國家將來對中國最大威脅,如今果然應(yīng)驗(yàn)

鍋鍋愛歷史
2026-03-27 10:28:43
2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

觸摸史跡
2026-04-08 16:02:42
馬競歐冠逃點(diǎn)?后衛(wèi)禁區(qū)內(nèi)用手接門將傳球!巴薩暴怒:正考慮上訴

馬競歐冠逃點(diǎn)?后衛(wèi)禁區(qū)內(nèi)用手接門將傳球!巴薩暴怒:正考慮上訴

我愛英超
2026-04-09 06:00:01
白宮:美伊首輪會談將于11日上午在伊斯蘭堡舉行

白宮:美伊首輪會談將于11日上午在伊斯蘭堡舉行

界面新聞
2026-04-09 06:54:02
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
中美德“盾構(gòu)機(jī)”速度差距:德國每小時6米,美國3.6米,中國呢?

中美德“盾構(gòu)機(jī)”速度差距:德國每小時6米,美國3.6米,中國呢?

蜉蝣說
2026-04-08 15:30:34
深圳地鐵突然火了!網(wǎng)友:已加入“必吃榜”

深圳地鐵突然火了!網(wǎng)友:已加入“必吃榜”

深圳晚報
2026-04-08 12:58:04
甜妹田曦薇殺瘋了,這露肩魚尾裙下的腰臀比,誰看了不迷糊?

甜妹田曦薇殺瘋了,這露肩魚尾裙下的腰臀比,誰看了不迷糊?

娛樂領(lǐng)航家
2026-04-08 19:00:04
+7,沒有三巨頭,殘陣湖人這么強(qiáng)嗎?

+7,沒有三巨頭,殘陣湖人這么強(qiáng)嗎?

體育新角度
2026-04-08 22:08:39
2026-04-09 08:40:49
柳胖胖 incentive-icons
柳胖胖
36氪、虎嗅、鈦媒體專欄作者
221文章數(shù) 387關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

一天之內(nèi) 以軍空襲黎巴嫩致254死1165傷

頭條要聞

一天之內(nèi) 以軍空襲黎巴嫩致254死1165傷

體育要聞

40歲,但實(shí)力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財經(jīng)要聞

局勢再升級!霍爾木茲海峽關(guān)閉

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

家居
游戲
本地
公開課
軍事航空

家居要聞

自在恣意 侘寂風(fēng)別墅

索尼疑似在PS5測試版中 調(diào)整了系統(tǒng)主頁面UI

本地新聞

跟著歌聲游安徽,聽古村回響

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霍爾木茲海峽已再次關(guān)閉

無障礙瀏覽 進(jìn)入關(guān)懷版