国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

麻省理工科技評論:DeepSeek新版本V4之所以重要,有三個原因

0
分享至



周五,中國人工智能公司DeepSeek發(fā)布了其備受期待的新一代旗艦模型V4的預覽版。值得注意的是,得益于全新的設(shè)計,該模型能夠更高效地處理大量文本,因此可以處理比上一代更長的提示信息。與DeepSeek之前的模型一樣,V4是開源的,這意味著任何人都可以下載、使用和修改它。

V4 是 DeepSeek自2025 年 1 月發(fā)布推理模型R1 以來最重要的版本。R1 在有限的計算資源下訓練而成,其強大的性能和效率震驚了全球人工智能行業(yè),使 DeepSeek 幾乎一夜之間從一支名不見經(jīng)傳的研究團隊躍升為中國最知名的 AI 公司。它也帶動了其他中國 AI 公司 發(fā)布開源模型的浪潮。

此后 DeepSeek 一直保持相對低調(diào)——但本月初,它在其模型的在線版本中添加了“專家”和“閃光”模式,這實際上是在預告 V4 的發(fā)布,引發(fā)了人們的猜測,認為這些更新與即將發(fā)布的更大版本有關(guān)。

雖然該公司已成為中國人工智能雄心的有力象征,但其重返尖端前沿模型領(lǐng)域之前,經(jīng)歷了數(shù)月的審查——包括重大人員離職、先前模型發(fā)布延遲以及來自美國和中國政府日益嚴格的審查。

那么,V4 會像 R1 那樣撼動人工智能領(lǐng)域嗎?幾乎肯定不會,但以下三個重要原因說明這次發(fā)布意義重大。

1.它為開源模式開辟了新天地。

與之前的R1一樣,DeepSeek聲稱V4的性能可以媲美市面上最好的模型,而價格卻低得多。這對開發(fā)者和使用這項技術(shù)的公司來說無疑是個好消息,因為這意味著他們可以自主地使用前沿的AI功能,而無需擔心成本飆升。

新模型有兩個版本,均可在 DeepSeek 的網(wǎng)站和應(yīng)用程序中獲取,開發(fā)者還可以通過 API 訪問這兩個版本。V4-Pro 是專為編碼和復雜智能體任務(wù)而設(shè)計的大型模型,而 V4-Flash 則是運行速度更快、成本更低的精簡版。兩個版本都提供推理模式,模型可以仔細解析用戶的提示,并在解決問題的過程中逐步展示解題過程。



中國頂級人工智能模型如何克服美國制裁

對于 V4-Pro,DeepSeek 的收費標準為每百萬輸入令牌 1.74 美元,每百萬輸出令牌 3.48 美元,遠低于 OpenAI 和 Anthropic 的同類產(chǎn)品。V4-Flash 的價格更低,每百萬輸入令牌約 0.14 美元,每百萬輸出令牌約 0.28 美元,是目前市面上最便宜的頂級型號之一。因此,它對于構(gòu)建應(yīng)用程序來說極具吸引力。

就性能而言,V4 相較于 R1 有了巨大的提升,這或許并不令人意外——而且它似乎足以媲美幾乎所有最新的主流 AI 模型。根據(jù)該公司公布的結(jié)果,在主要基準測試中,DeepSeek V4-Pro 的表現(xiàn)與領(lǐng)先的閉源模型不相上下,與 Anthropic 的 Claude-Opus-4.6、OpenAI 的 GPT-5.4 和 Google 的 Gemini-3.1 等模型的性能相當。與其他開源模型(例如阿里巴巴的 Qwen-3.5 或 Z.ai 的 GLM-5.1)相比,DeepSeek V4 在編程、數(shù)學和 STEM 問題上均表現(xiàn)優(yōu)異,使其成為迄今為止最強大的開源模型之一。

DeepSeek 還表示,V4-Pro 目前在智能編碼任務(wù)基準測試中位列最強開源模型之列,并在其他衡量執(zhí)行多步驟問題能力的測試中表現(xiàn)出色。該公司公布的基準測試結(jié)果顯示,其寫作能力和世界知識儲備也處于領(lǐng)先地位。

在與該型號一同發(fā)布的技術(shù)報告中,DeepSeek 分享了對 85 位經(jīng)驗豐富的開發(fā)人員進行的內(nèi)部調(diào)查結(jié)果:超過 90% 的受訪者將 V4-Pro 列為他們進行編碼任務(wù)的首選型號之一。

DeepSeek 表示,它已專門針對 Claude Code、OpenClaw 和 CodeBuddy 等流行的代理框架對 V4 進行了優(yōu)化。

2. 它實現(xiàn)了內(nèi)存效率的新方法。

V4 的關(guān)鍵創(chuàng)新之一是其更大的上下文窗口——即模型一次可以處理的文本量。兩個版本都能處理 100 萬個詞元,足以容納《指環(huán)王》三卷和《霍比特人》的總和。該公司表示,這一上下文窗口大小現(xiàn)已成為所有 DeepSeek 服務(wù)的默認設(shè)置,并且與 Gemini 和 Claude 等尖端模型的版本相當。

但重要的是,我們不僅要了解 DeepSeek 實現(xiàn)了這一飛躍,還要了解它是如何實現(xiàn)的。V4 版本對公司之前的模型進行了重大架構(gòu)改進——尤其是在注意力機制方面。注意力機制是人工智能模型的一項重要特性,它能幫助模型理解提示文本中各個部分之間的關(guān)系。隨著提示文本長度的增加,這種比較的成本也隨之大幅上升,使得注意力機制成為長上下文模型的主要瓶頸之一。



DeepSeek可能已經(jīng)找到了一種提高人工智能記憶能力的新方法

DeepSeek 的創(chuàng)新之處在于,它讓模型更有選擇性地關(guān)注特定內(nèi)容。V4 版本不再將所有早期文本視為同等重要,而是壓縮舊信息,專注于當前最有可能重要的部分,同時保留附近的完整文本,以免遺漏重要細節(jié)。

DeepSeek 表示,這顯著降低了使用長上下文的成本。在包含 100 萬個令牌的上下文中,V4-Pro 的計算能力僅為上一代產(chǎn)品 V3.2 的 27%,內(nèi)存使用量也降至 10%。V4-Flash 的降幅更大,計算能力和內(nèi)存使用量分別僅為 10% 和 7%。在實際應(yīng)用中,這可以降低構(gòu)建需要處理海量數(shù)據(jù)的工具的成本,例如能夠讀取整個代碼庫的 AI 編碼助手,或者能夠分析大量文檔且不會忘記先前內(nèi)容的科研代理。

DeepSeek 對長上下文窗口的興趣并非始于 V4。在過去一年半的時間里,該公司悄然發(fā)表了一系列論文,探討人工智能模型如何“記住”信息,并嘗試使用壓縮和數(shù)學技術(shù)來擴展人工智能模型實際能夠處理的信息量。

3.這標志著邁出了遠離英偉達的艱難道路的第一步。

V4 是 DeepSeek 首款針對中國國產(chǎn)芯片(例如華為 Ascend)進行優(yōu)化的型號——此舉使得此次發(fā)布會在某種程度上考驗了中國本土人工智能產(chǎn)業(yè)能否開始擺脫對美國芯片巨頭英偉達的依賴。

這在很大程度上在意料之中,因為《The Information》本月早些時候 報道稱,DeepSeek并未向英偉達和AMD等美國芯片制造商提供V4的提前訪問權(quán)限,盡管提前提供訪問權(quán)限通常是為了讓芯片制造商在新模型發(fā)布前優(yōu)化其支持。據(jù)報道,該公司僅向中國芯片制造商提供了提前訪問權(quán)限。

華為周五表示,其基于昇騰950系列的昇騰超級節(jié)點產(chǎn)品將支持DeepSeek V4。這意味著希望運行自行修改版DeepSeek V4的公司和個人用戶將能夠輕松使用華為芯片。

人工智能現(xiàn)狀:中國即將贏得這場競賽嗎?

路透社此前報道稱,中國政府官員建議DeepSeek在其訓練過程中集成華為芯片。這種壓力符合中國產(chǎn)業(yè)政策的總體趨勢:戰(zhàn)略性行業(yè)往往被推動,有時甚至是被強制要求,以符合國家自力更生的目標。但在人工智能領(lǐng)域,這種緊迫性尤為突出。自2022年以來,美國出口管制措施切斷了中國企業(yè)獲取英偉達最強大芯片的渠道,之后又限制了對降級版中國市場芯片的獲取。北京的回應(yīng)是加快推進國產(chǎn)人工智能技術(shù)棧的建設(shè),涵蓋芯片、軟件框架和數(shù)據(jù)中心等各個方面。

據(jù)報道,中國政府一直在推動數(shù)據(jù)中心和公共計算項目更多地使用國產(chǎn)芯片,包括禁止使用外國制造的芯片、實行采購配額制,以及要求將英偉達芯片與華為和寒武紀等中國公司的替代芯片搭配使用。

然而,替換英偉達芯片并非簡單地更換芯片就能完成的。英偉達的優(yōu)勢不僅在于其芯片本身,更在于開發(fā)者多年來圍繞這些芯片構(gòu)建的軟件生態(tài)系統(tǒng)。轉(zhuǎn)向華為昇騰芯片意味著需要調(diào)整模型代碼、重建工具,并證明基于這些芯片構(gòu)建的系統(tǒng)足夠穩(wěn)定,能夠滿足高強度使用需求。

需要明確的是,DeepSeek似乎并未完全擺脫對英偉達芯片的依賴。該公司的技術(shù)報告顯示,它使用國產(chǎn)芯片來運行模型進行推理,也就是在用戶要求模型完成任務(wù)時。但清華大學計算機科學教授劉志遠告訴《麻省理工科技評論》,DeepSeek似乎只針對國產(chǎn)芯片調(diào)整了V4模型的部分訓練流程。報告并未說明一些關(guān)鍵的長上下文特征是否針對國產(chǎn)芯片進行了適配,因此劉志遠認為V4模型可能仍然主要在英偉達芯片上進行訓練。由于這些問題涉及政治敏感性,多位匿名消息人士告訴《麻省理工科技評論》,國產(chǎn)芯片的性能仍然不如英偉達芯片,但更適合用于推理而非訓練。

DeepSeek還將V4未來的成本與此次硬件升級掛鉤。該公司表示,華為昇騰950超級節(jié)點在今年下半年開始大規(guī)模出貨后,V4-Pro的價格可能會大幅下降。

如果成功,V4 可能是中國正在成功構(gòu)建并行人工智能基礎(chǔ)設(shè)施的早期跡象。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中興通訊發(fā)布一季報:營收349.9億元,算力占比升至27%

中興通訊發(fā)布一季報:營收349.9億元,算力占比升至27%

新浪財經(jīng)
2026-04-25 18:53:27
閆闖 被問買問界M6和Model Y哪個好? 被旁邊大哥一句話干沉默了

閆闖 被問買問界M6和Model Y哪個好? 被旁邊大哥一句話干沉默了

周哥一影視
2026-04-11 03:19:35
四川達州一女神太漂亮了,這是什么逆天顏值,媲美西施并不過分

四川達州一女神太漂亮了,這是什么逆天顏值,媲美西施并不過分

情感大頭說說
2026-04-04 09:49:49
美國已保不住日本,俄羅斯通告全球:中國的一切都在按照計劃進行

美國已保不住日本,俄羅斯通告全球:中國的一切都在按照計劃進行

阿柒的訊
2026-04-24 19:11:19
曼聯(lián)名宿斯科爾斯愛女僅穿內(nèi)衣錄美妝視頻!引粉絲驚呼:美絕了

曼聯(lián)名宿斯科爾斯愛女僅穿內(nèi)衣錄美妝視頻!引粉絲驚呼:美絕了

仰臥撐FTUer
2026-04-25 09:53:02
被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

夜深愛雜談
2025-12-02 20:51:10
古代黑科技秦直道,很多地方2000多年寸草不生,至今仍可使用

古代黑科技秦直道,很多地方2000多年寸草不生,至今仍可使用

抽象派大師
2026-04-24 12:20:31
都說國外好,今天說點大實話:加拿大和國內(nèi),根本是兩個世界

都說國外好,今天說點大實話:加拿大和國內(nèi),根本是兩個世界

千秋文化
2026-04-23 20:16:03
今天才知道:冰箱冷凍室不能放這4樣,放了冰箱容易炸,真可怕

今天才知道:冰箱冷凍室不能放這4樣,放了冰箱容易炸,真可怕

Home范
2026-04-20 11:07:38
Pure日月評論:飛天茅臺酒變天了!

Pure日月評論:飛天茅臺酒變天了!

馬蹄燙嘴說美食
2026-04-25 21:52:18
西方紛紛撤退,中國堅持死磕。為啥全世界就中國拼命搞核聚變?

西方紛紛撤退,中國堅持死磕。為啥全世界就中國拼命搞核聚變?

知識TNT
2026-04-25 09:40:10
國民黨、民眾黨聯(lián)手彈劾賴清德 5月19日將投票表決 此前累計超500萬人參與網(wǎng)絡(luò)聯(lián)署

國民黨、民眾黨聯(lián)手彈劾賴清德 5月19日將投票表決 此前累計超500萬人參與網(wǎng)絡(luò)聯(lián)署

每日經(jīng)濟新聞
2026-04-24 18:53:33
雙子星閃耀!哈珀卡斯爾同場砍25+:比肩杜蘭特韋少

雙子星閃耀!哈珀卡斯爾同場砍25+:比肩杜蘭特韋少

體壇周報
2026-04-25 15:59:10
李金羽:為上一輪的失利向球迷致歉,接下來我們都會全力以赴

李金羽:為上一輪的失利向球迷致歉,接下來我們都會全力以赴

懂球帝
2026-04-25 22:34:05
中國首店!這家國際知名巧克力品牌落子淮海中路,超大巧克力墻,還有上海限定口味!

中國首店!這家國際知名巧克力品牌落子淮海中路,超大巧克力墻,還有上海限定口味!

上海黃浦
2026-04-25 21:08:11
天津賴老師被停課,才知道她早有“前科”!

天津賴老師被停課,才知道她早有“前科”!

牛鍋巴小釩
2026-04-25 18:14:48
扎哈羅娃抨擊西方對烏克蘭襲擊俄羅斯導致的環(huán)境破壞“視而不見”

扎哈羅娃抨擊西方對烏克蘭襲擊俄羅斯導致的環(huán)境破壞“視而不見”

山河路口
2026-04-24 19:06:09
退休前4-5年是黃金期!糊涂人混日子,聰明人都在悄悄布局

退休前4-5年是黃金期!糊涂人混日子,聰明人都在悄悄布局

瓜哥的動物日記
2026-04-25 21:05:57
iOS 26.4.2 續(xù)航測試出爐,這幾款機型崩了

iOS 26.4.2 續(xù)航測試出爐,這幾款機型崩了

簡科技
2026-04-25 13:43:43
丁俊暉拒絕連輸4局!單桿69分止損,6-8落后趙心童,小特優(yōu)勢縮水

丁俊暉拒絕連輸4局!單桿69分止損,6-8落后趙心童,小特優(yōu)勢縮水

劉姚堯的文字城堡
2026-04-25 23:48:43
2026-04-26 00:23:05
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
340文章數(shù) 6692關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預言的"災難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

頭條要聞

媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

教育
旅游
手機
公開課
軍事航空

教育要聞

十大優(yōu)勢專業(yè),數(shù)學單科加權(quán)……一文看懂川大2026強基計劃

旅游要聞

五一悠享寶山濱江|活力全開·追風運動之旅

手機要聞

最新手機市場份額出爐:華為斷層第一,小米榮耀壓力山大!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長:戰(zhàn)事不會“沒完沒了”

無障礙瀏覽 進入關(guān)懷版