国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛送馬斯克的3萬塊個人超算,要借Mac Studio才能流暢運行?首批真實體驗來了

0
分享至

  2000 億參數(shù)、3 萬塊人民幣、128GB 內存,這臺被稱作「全球最小超算」的機器,真的能讓我們在桌面上跑起大模型嗎?

  

  

  

  

  向左滑動查看更多內容, 圖片來自 x@nvidia

  ,而后也親自去到 OpenAI 總部,送給奧特曼。從 CES 登場到如今落地,這臺個人超算終于要來到我們手上。

  

  官網(wǎng)發(fā)售情況,售價 3999 美元,也提供了華碩、聯(lián)想、戴爾等七個電腦品牌的發(fā)售版本;鏈接:https://marketplace.nvidia.com/en-us/developer/dgx-spark/

  NVIDIA DGX Spark,一臺個人 AI 超級計算機,目標用戶是科研人員、數(shù)據(jù)科學家和學生等,為他們提供高性能桌面級 AI 計算能力,幫助他們完成 AI 模型的開發(fā)和創(chuàng)新。

  聽著很強大,但普通人能想到的玩法,無非還是:

  本地跑大模型:跟它聊天的內容只留在自己電腦里,絕對安全。

  本地搞創(chuàng)作:不受限制地生成圖片和視頻,告別會員和積分。

  打造私人助理:把自己的資料都喂給它,訓練一個只懂你的「賈維斯」。

  

  部分顯卡租賃平臺顯示的 A100 售價為 7元/時

  實際上,DXG Spark GB10 Grace Blackwell 超級芯片的能力,或許可以拓展它的應用場景,但是具體能做些什么?又做得怎么樣?3 萬塊的售價,能租 4000 小時的 A100,你真會把它放在桌上跑跑大模型嗎?

  我們收集了目前網(wǎng)絡上關于 DGX Spark 多個詳細評測,試圖在我們的實際體驗之前,帶大家看看這臺設備,到底值不值 3 萬塊。

  太長不看版:

  1.

  性能定位:輕量模型表現(xiàn)出色,1200 億參數(shù)的大模型也能穩(wěn)穩(wěn)跑起來。總體水平介于 RTX 5070 和 RTX 5070 Ti 之間

  2.

  最大短板:和手機一樣的 273 GB/s 內存帶寬是限制。算力足夠,但數(shù)據(jù)傳輸慢。體驗就像一個腦子轉得飛快但說話結巴的人。

  3.

  邪修玩法:用一臺 Mac Studio M3 Ultra 來「輔佐」它。DGX Spark 負責快速思考,Mac Studio 負責流暢表達,強行解決「結巴」問題。

  4.

  生態(tài)豐富:官方提供了超過 20 種開箱即用的玩法,從生成視頻到搭建多智能體助手,AI全家桶都給你配齊了。

  

  只比 Mac Mini 強一點點?

  話不多說,先看數(shù)據(jù)。

  

  每秒處理填充和解碼的平均 token 數(shù)量,DGX Spark 排在 RTX 5080 后,圖片由 ChatGPT 制作

  DGX Spark 對比 Mac Mini M4 Pro 還是要強上不少,尤其是在 Prefill 階段。但是在 Decode 階段,優(yōu)勢就沒有這么明顯了。Mac Mini M4 Pro 在 DeepSeek R1 開源模型上的 平均TPS 能做到 17.8,而 DGX Spark 也才 33.1。

  快速做個名詞解釋,來看看 AI 推理的兩個階段到底是什么

  簡單來說,當我們在 AI 聊天框里輸入問題,模型生成答案的過程可以分為兩個關鍵步驟:

  1. Prefill(預填充/閱讀理解階段)

  AI 拿到我們的問題后,快速閱讀和理解你輸入的每一個字(即提示詞)。

  這個階段處理得越快,我們等待 AI 吐出第一個字的時間就越短,也就是常用來宣傳 AI 能力的指標,首字響應時間,TTFT(Time To First Token, TTFT) 越短。

  

  Apple 宣傳 M5 芯片能力使用首詞元相應速度

  2. Decode(解碼/生成答案階段)

  就像 AI 已經想好了答案,開始逐字逐句地打字輸出給我們。

  決定 AI 打字的速度,也就是我們常說的 TPS(每秒生成詞元數(shù))。這個數(shù)值越高,我們看到答案完整顯示的速度就越快。

  

  Tips:什么是 TPS?

  TPS 是 Token Per Second(每秒處理詞元數(shù))的簡稱,可以理解為 AI 的工作效率或打字速度。

  Prefill 階段的 TPS: 代表 AI 讀懂問題的速度。

  Decode 階段的 TPS: 代表 AI 給我們生成答案的速度。

  

  所以 DGX Spark 在給我們回答時,第一個字很快能出來,但是后續(xù)它的打字速度,很慢。要知道,Mac Mini M4 Pro 的價格才 10999 元,24GB 統(tǒng)一內存的版本。

  為什么會這樣?這項測試是由大模型競技場的團隊 LMSYS,在他們的 SGLang 項目和 Ollama 上,選擇上圖中六個不同的設備,運行多個開源大語言模型完成的。

  

  SGLang 是由 LMSYS 團隊開發(fā)的高性能推理框架,F(xiàn)P8、MXFP4、q4_K_M、q8_0 是指大語言模型的量化格式,即對大模型進行壓縮,用不同的二進制存儲方式

  測試的項目包括了 1200 億參數(shù)的本地大模型,也有 80 億的較小模型,此外 Batch Size 批次大小和 SGLang 與 Ollama 兩種框架的差別,都會對 DGX Spark 的表現(xiàn),產生不同的影響。

  例如,評測團隊提到,DGX Spark 在批次大小為 1 時,每秒解碼的次元數(shù)只有 20 個,但是當批次大小設置為 32,每秒解碼詞元上升到 370。

  一般來說,批次大小設置越大,每次要處理的內容越多,對 GPU 的性能要求越高。

  而 DGX Spark 的 AI 能力,根據(jù)其所采用的 GB10 Grace Blackwell 芯片架構,以及 1 PFLOP 的稀疏 FP4 張量的性能,定位是在 RTX 5070 和 RTX 5070 Ti 之間。

  





  上下滑動查看更多內容,部分結果對比

  所以開頭那張顯示結果的圖,其實并不能全面的展示 DGX Spark 的能力,因為它平均了所有模型測試的結果。但不同批次大小的模型推理、以及不同參數(shù)的模型,它最終展示出的性能,都會有所不同。

  綜合來看,DGX Spark 的優(yōu)點是:

  算力強:能處理大批量任務,AI 核心能力在 RTX 5070 級別。

  內存大:128GB 的海量內存,讓它能輕松運行千億級別的大模型。

  

  但它的短板,致命且清晰——帶寬。

  Prefill 階段拼的是算力(腦子快不快),Decode 階段拼的則是帶寬(嘴巴快不快)。

  DGX Spark 的問題就是:腦子(算力)很快,但嘴巴(帶寬)跟不上。

  打個比方,它的數(shù)據(jù)通道就像一根細水管:

  DGX Spark用的內存是LPDDR5X(手機和筆記本電腦常用),帶寬只有273 GB/s

  作為對比,高端游戲顯卡RTX 5090用的GDDR7內存,帶寬高達1800 GB/s,那是一根消防水管。

  這就是為什么 DGX Spark 在打字階段(Decode)表現(xiàn)平平的根本原因。

  LMSYS 將評測的詳細結果放在了 Google 文檔中,我們把數(shù)據(jù)交給 Kimi 智能體,得到了一份詳細的可視化報告,原始數(shù)據(jù)的預覽,也可以點擊 Kimi 預覽報告下載選項獲取。

  

  https://www.kimi.com/chat/199e183a-7402-8641-8000-0909324fe3fb

  帶寬限制?連接一臺 Mac Studio 破解

  帶寬是短板,但已經有更極客的團隊,找到了榨干 DGX Spark 全部算力的方法。

  那就是找一個帶寬更快的桌面設備,Mac Studio M3 Ultra,利用其 819 GB/s 的速度,把大模型的推理速度愣是整體提升了 2.8 倍。

  拿到兩臺 DGX Spark 早期訪問權限的 EXO Lab,就直接把大模型推理的 Prefill 和 Decode 兩個階段,分別給了 DGX Spark 和 Mac Studio 來承擔,這又叫做 PD 分離。

  

  和我們之前介紹的預填充、解碼兩個階段一樣,一個依賴算力,一個依賴帶寬。如上圖所示,黃色代表預填充階段,它決定著 TTFT,首個次元生成時間;而藍色代表解碼階段,它決定了 TPS,每秒生成的詞元數(shù)。

  

  EXO Lab 的做法就是將 Decode 交給 Mac Studio。

  但 PD 分離的實現(xiàn)也不并不簡單,EXO 團隊要解決的還有一個問題,如何將 DGX Spark 設備上,預填充階段生成的內容(KV 緩存),傳輸?shù)教幚斫獯a的設備上。

  這部分數(shù)據(jù)量很大,如果兩臺設備之間,傳輸時間太長,甚至可能會抵消性能提升的效果。

  EXO 的答案是:流水線式分層計算與傳輸。DGX Spark 在處理第一層預填充時,計算出的 KV 緩存會立即開始傳輸給 Mac Studio,而 DGX Spark 則繼續(xù)進行第二層的預填充工作。

  

  這種分層流水線的方式,能讓計算和數(shù)據(jù)傳輸?shù)臅r間完全重疊。最終,當所有層的預填充完成,Mac Studio 已經拿到完整的 KV 緩存,可以立即開始解碼。

  

  雖然這套方案,在某種程度上解決了 DGX Spark 帶寬限制的問題,提升了 3 倍的速度,但是費用也漲了 3 倍。兩臺 DGX Spark 和一臺 Mac Studio M3 Ultra 的費用,快接近 10 萬元人民幣。

  如果還是用來跑一個本地大模型,未免太過于殺雞用牛刀。

  性能評測之外,還能做些什么

  273 GB/s 的帶寬,也并不是 DGX Spark 的全部,128GB 的統(tǒng)一內存,用在數(shù)據(jù)中心級別的 GB10 架構顯卡,支持每秒一千萬億次計算(1 Petaflop),以及桌面級設計,都有機會拓展它的應用場景。

  我們在 YouTube 上找了一些博主的開箱和上手體驗視頻,一起看看這臺優(yōu)點和短板都很明顯的設備,可以做點什么。

  本地 AI 視頻生成

  生文模型現(xiàn)在基本上都免費使用,但是生視頻的模型,大多數(shù)都需要充值會員,或者積分制。

  博主 BijianBowen 利用 ComfyUI 框架,以及阿里的 Wan 2.2 14B 文本到視頻模型,直接根據(jù) DXG Spark 官方的 Playbooks(操作指南),配置了一個視頻生成項目。

  

  NVIDIA DGX Spark – 非贊助的評測(與 Strix Halo 對比、優(yōu)缺點)視頻來源:https://youtu.be/Pww8rIzr1pg

  在視頻生成過程中,他提到即使命令后顯示 GPU 的溫度已經達到了 60-70 攝氏度,但是聽不到一點噪音,風扇轉動的聲音也沒有。

  

  

  

  

  

  

  向左滑動查看更多內容, 大部分博主有提到,DGX Spark 確實比較「安靜」,設備拆解相當工整,來自 storagereview.com

  除了用在視頻生成和圖像生成的 ComfyUI 提供了在 DGX Spark 上操作的指南,還有在本地運行大模型的桌面工具 LM Studio,也發(fā)布了博客提到支持 DGX Spark。

  工具調用,搭建多智能體聊天機器人

  Level1Techs 分享了自己用 DGX Spark 并行運行,多個 LLMs 和 VLMs,來實現(xiàn)智能體之間的交互。

  

  深入探討英偉達的 DGX Spark,視頻來源:https://youtu.be/Lqd2EuJwOuw

  得益于 128GB 的大內存,他可以選擇 1200 億參數(shù)的 GPT-OSS、67 億的 DeepSeek-Coder、以及 Qwen3-Embedding-4B 和 Qwen2.5-VL:7B-Instruct 四個模型,來處理不同的任務。

  這個項目也是 Nvidia 官方提供的指南,在他們官網(wǎng),提供了超過 20 種玩法,并且每一種用法,都給出了預計需要的時間,以及詳細的步驟。

  

  https://build.nvidia.com/spark

  像是搭建一個文本到知識圖譜的系統(tǒng),把非結構化文本文檔,轉換為結構化知識結點。

  

  視頻搜索和摘要總結。

  

  我們在 Reddit 上也發(fā)現(xiàn)一些拿到了 DGX Spark 的用戶,開啟了 AMA(Ask Me Anything) 活動。博主分享了自己的測試結果,同樣提到 AI 能力對標 RTX 5070。

  還有有人問,是否可以運行一波 Karpathy 新推出的 nanochat 項目。

  

  上下滑動查看更多內容, https://www.reddit.com/r/LocalLLaMA/comments/1o7gpr8/got_the_dgx_spark_ask_me_anything/

  后續(xù)應該還會有更多 DGX Spark 的基準測試結果,和更全面的使用指南更新,APPSO 的 DGX Spark 正快馬加鞭趕來。

  

  DGX Spark 的存在,看起來更像是 AI 狂飆時代下的一個實驗,一臺數(shù)據(jù)中心級算力的桌面機器,試探著我們對本地 AI 的幻想邊界。

  真正的問題除了 DGX Spark 能不能跑,還有當我們每個人都能擁有一臺超算時,我們可以拿它做什么。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
謝逸楓:顫抖吧!前十一月全國賣地收入史無前例下跌,怎么辦?

謝逸楓:顫抖吧!前十一月全國賣地收入史無前例下跌,怎么辦?

謝逸楓看樓市
2025-12-19 10:25:32
今年“無痕褲”又火了!闊腿褲反而下崗,配羽絨服保暖與時尚兼顧

今年“無痕褲”又火了!闊腿褲反而下崗,配羽絨服保暖與時尚兼顧

何有強
2025-12-19 08:27:06
荷蘭不給晶圓,聞泰有新招

荷蘭不給晶圓,聞泰有新招

觀察者網(wǎng)
2025-12-20 08:36:14
津媒:津門虎個別球員的傷病康復比較復雜,甚至會影響到冬訓

津媒:津門虎個別球員的傷病康復比較復雜,甚至會影響到冬訓

懂球帝
2025-12-20 09:50:13
一篇內參讓領導人反思,中央由此取消副總理級專機,她究竟寫了什么

一篇內參讓領導人反思,中央由此取消副總理級專機,她究竟寫了什么

瑾瑜聊情感
2025-08-23 09:43:36
茅臺動真格了!1169元飛天無限量供應,百萬黃牛徹底慌了

茅臺動真格了!1169元飛天無限量供應,百萬黃牛徹底慌了

時間最美的安排
2025-12-19 11:01:48
日哈14項協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

日哈14項協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

靚仔情感
2025-12-20 09:38:40
“臺灣永遠都不會是中國的一部分”,她被全民唾罵,被明星扇耳光

“臺灣永遠都不會是中國的一部分”,她被全民唾罵,被明星扇耳光

春秋論娛
2025-12-20 07:09:56
大鵬受趙本山邀請主持活動,卻把酬勞上交趙本山:我不值這么多錢

大鵬受趙本山邀請主持活動,卻把酬勞上交趙本山:我不值這么多錢

攬星河的筆記
2025-12-19 20:25:08
苗原:足協(xié)第二批處罰名單都是大佬!李平康:郝偉處罰年限被公布

苗原:足協(xié)第二批處罰名單都是大佬!李平康:郝偉處罰年限被公布

耀眼的星火
2025-12-20 05:55:49
全民漲工資,即將進入落實階段…

全民漲工資,即將進入落實階段…

大碗樓市
2025-12-20 08:08:42
泰國軍方發(fā)言人:鏟平所有電詐園區(qū)

泰國軍方發(fā)言人:鏟平所有電詐園區(qū)

Ck的蜜糖
2025-12-16 15:25:09
南京博物院與兩條人命

南京博物院與兩條人命

常識群
2025-12-19 15:13:01
“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

小熊侃史
2025-12-19 11:04:19
15:00,央視不播!中國男足vs韓國,1-0=首勝,平局將造殘酷一幕

15:00,央視不播!中國男足vs韓國,1-0=首勝,平局將造殘酷一幕

侃球熊弟
2025-12-20 00:20:03
杰倫布朗30+9+7懷特9記三分,熱火雙核啞火,凱爾特人主場雪恥

杰倫布朗30+9+7懷特9記三分,熱火雙核啞火,凱爾特人主場雪恥

釘釘陌上花開
2025-12-20 10:32:39
斯諾克賽程:11局6勝產生決賽名額,常冰玉PK小鋼炮,新王誕生?

斯諾克賽程:11局6勝產生決賽名額,常冰玉PK小鋼炮,新王誕生?

劉姚堯的文字城堡
2025-12-20 06:46:39
2025最慘大撤退:18萬家快遞驛站,快把所有人得罪光了

2025最慘大撤退:18萬家快遞驛站,快把所有人得罪光了

金錯刀
2025-12-14 15:34:35
愛德華茲:庫里總是堅持不懈,他總會在大家最需要的時候挺身而出

愛德華茲:庫里總是堅持不懈,他總會在大家最需要的時候挺身而出

懂球帝
2025-12-20 09:09:06
一屋子科班演員,演不過一個跨界主持人?被罵出戲不是沒有原因的

一屋子科班演員,演不過一個跨界主持人?被罵出戲不是沒有原因的

一娛三分地
2025-12-17 18:18:38
2025-12-20 11:00:49
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
5943文章數(shù) 26729關注度
往期回顧 全部

數(shù)碼要聞

微軟商城Surface獨家好價,支付寶付款額外補貼、至高優(yōu)惠6000+

頭條要聞

媒體:日本惡意滋擾遼寧艦編隊 還挑撥中國與越南關系

頭條要聞

媒體:日本惡意滋擾遼寧艦編隊 還挑撥中國與越南關系

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

戚薇女兒大變樣,10歲就進入“尷尬期”

財經要聞

日本加息落地:暴跌沒有,麻煩在后頭

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

健康
教育
時尚
旅游
本地

這些新療法,讓化療不再那么痛苦

教育要聞

“一塊正經肉沒有”,母親嫌初中兒子太能吃,網(wǎng)友:你當雞養(yǎng)呢?

今年冬天流行的“露襪”穿法,時髦又減齡!

旅游要聞

新聞1+1丨冰雪旅游,今冬如何添新意?

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

無障礙瀏覽 進入關懷版