国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

橫跨大西洋11小時,中國開發(fā)者用Mac跑Llama 70 B?評論區(qū)吵翻了

0
分享至


新智元報道

編輯:Aeneas

【新智元導(dǎo)讀】一位中國開發(fā)者,在橫跨大西洋的航程中,在飛機(jī)上用 MacBook 本地跑 Llama 70B,整整 11 小時沒有網(wǎng)絡(luò),帖子瞬間在X上爆火!但是隨后,越來越多網(wǎng)友發(fā)現(xiàn),這故事不太對?。?/strong>

一位中國開發(fā)者,在橫跨大西洋的 11 小時航程中,拒絕了 25 美元的機(jī)上網(wǎng)絡(luò),卻在萬米高空完成了一整套復(fù)雜的客戶項(xiàng)目交付?

沒有 Cloud API,沒有 Anthropic,沒有 OpenAI,甚至沒有一格信號。

只有一臺 MacBook Pro M4、一段自己寫的編排腳本,以及Llama 70B這個本地AI模型,然后就把項(xiàng)目跑通了?

舷窗外是白云與藍(lán)天,沒有 WiFi;小桌板上是一臺 MacBook,終端開著兩個窗口,本地運(yùn)行著一個推理服務(wù)器

因?yàn)樘^炸裂,這個帖子一經(jīng)發(fā)出,就在技術(shù)社區(qū)傳開了。

本地推理的時代,真的來了?


在萬米高空,

用MacBook跑Llama 70B

據(jù)說,故事的主角是一位中國開發(fā)者。

在飛往大洋彼岸的靠窗座位上,他打開64GB內(nèi)存的MacBook Pro,面對的是堆積如山的客戶任務(wù)隊(duì)列。

接下來整整11個小時,都沒有網(wǎng)絡(luò)。

換做普通人,此刻已經(jīng)乖乖掏出信用卡,支付那昂貴且延遲極高的 25 美元機(jī)上 Wi-Fi。

但他選擇了另一條路:本地推理。

他啟動了通過llama.cpp運(yùn)行的Llama 3.3 70B

生成速度 71 tokens/秒,上下文約 60,000 tokens,內(nèi)存占用 48.6 GiB / 64 GiB,起飛時電池剩余 3 小時 21 分鐘。


為了讓這個龐然大物在64GB內(nèi)存的機(jī)器上跑起來,他甚至為自己編寫了一個「離線編排器」腳本。

最令人拍案叫絕的,是他給AI下達(dá)的系統(tǒng)提示詞。

你是一個運(yùn)行在單臺 MacBook 上的離線編排器。沒有網(wǎng)絡(luò)。你唯一的資源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服務(wù),以及 3 小時 21 分鐘的電池預(yù)算。

處理 /Users/dev/work/queue.jsonl 中的任務(wù)隊(duì)列(每行一個客戶任務(wù))。對每個任務(wù):起草 → 運(yùn)行本地評估 → 保存產(chǎn)物到 /Users/dev/work/done/。每 12 個任務(wù)保存一次上下文檢查點(diǎn),以便更換電池后恢復(fù)。僅在隊(duì)列為空或電池低于 5% 時停止。

因此,這個系統(tǒng)完全清楚自己所處的困境。

它知道自己未來 11 小時與世隔絕,知道內(nèi)存和電池是有限的奢侈品,甚至知道在飛機(jī)降落前,它必須獨(dú)自處理所有的邏輯。

系統(tǒng)在一個循環(huán)中運(yùn)行:從任務(wù)隊(duì)列中取出一個任務(wù),進(jìn)行推理處理,保存生成結(jié)果,寫入檢查點(diǎn)。一個接一個,就這樣持續(xù)執(zhí)行。


只有當(dāng)電量低于 5% 時,調(diào)度器才會自動暫停,等待筆記本切換到備用移動電源,然后從上一次的檢查點(diǎn)繼續(xù)運(yùn)行。

飛行過程中,系統(tǒng)日志里寫下了這樣的內(nèi)容:

「已保存上下文檢查點(diǎn) 8 / 12(pos_min = 488,pos_max = 50118,大小 = 62.813 MiB)」

「已恢復(fù)上下文檢查點(diǎn)(pos_min = 488,pos_max = 50118)」

「提示處理進(jìn)度:n_tokens = 50 / 60,818」

「任務(wù) 37016 完成 | 處理速度 = 71 tokens/s → 輸出至 /Users/dev/work/done/proposal_westside.md」

有人驚呼:這是我過去一年里見過的最干凈利落的離線 AI 工作流程!

11 小時航程,WiFi 花費(fèi)為 0,當(dāng)飛機(jī)輪子觸碰跑道的那一刻,他合上電腦,所有的客戶提案已經(jīng)整整齊齊地躺在done/文件夾里。

系統(tǒng)不再是一個只會復(fù)讀的復(fù)讀機(jī),而是一個具備資源意識的管理者。

這正是「Self-aware Computing」最迷人的地方。

網(wǎng)友打假:

技術(shù)神話,還是「賽博爽文」?

不過,文章在社區(qū)瘋傳后,很快引來了技術(shù)極客們的質(zhì)疑。

資深開發(fā)者們紛紛掏出計算器,開始瘋狂「對線」。

第一刀:內(nèi)存與權(quán)重的「不可能三角」

Llama 3.3 70B 如果以 BF16(半精度)運(yùn)行,光模型權(quán)重就需要約140GB內(nèi)存。要在 64GB 的 MacBook 上跑起來,簡直就像把大象塞進(jìn)冰箱。

64GB 內(nèi)存大概率只能跑 4-bit 量化版本,算上 60k 的上下文 KV Cache,內(nèi)存占用至少也要 40GB+,BF16 絕無可能。

非要說的話,要在64GB上跑70B,只有一條路——量化。4-bit量化后模型約35GB,加上KV緩存和系統(tǒng)開銷,勉強(qiáng)能塞進(jìn)去。


但量化版本和BF16是兩回事,精度、推理質(zhì)量都會打折扣。

帖子里寫的是「bf16」。看起來,這個細(xì)節(jié)要么是不懂,要么是故意的。





第二刀:71 tokens/s 的「神仙速度」

帖子聲稱生成速度71 tokens/s。

根據(jù) M4 芯片的實(shí)際表現(xiàn),本地運(yùn)行 70B 規(guī)模的模型,生成速度通常在 5-12 tokens/s 之間。

71 tokens/s 是什么概念?這幾乎是頂級 H100 集群的響應(yīng)速度。

「這個速度可能是 8B 模型或者是某種極致的投機(jī)采樣,70B 跑出這個速度,MacBook 怕是要起火?!?/p>

評論區(qū)一位用戶直接亮出自己的實(shí)測數(shù)據(jù):M5 Max 128GB(注意,128GB,是帖子里設(shè)備內(nèi)存的兩倍),跑同款模型量化版llama.cpp,實(shí)測12.8 tokens/s。



更高端的硬件,跑更輕的量化版本,速度反而只有帖子聲稱的五分之一,因此,原帖中說的速度幾乎不可能實(shí)現(xiàn)。

第三刀:11小時續(xù)航

帖子中提到的「更換電池」引發(fā)了老用戶的集體懷舊:現(xiàn)代 MacBook Pro 都是一體化設(shè)計,所謂的「換電池」,大概率是切換到了大功率的備用充電寶(如百瓦快充移動電源)。

MacBook Pro M4 Max官方標(biāo)稱續(xù)航約18小時,那是輕度使用。持續(xù)滿載跑70B推理,GPU和內(nèi)存全程拉滿,實(shí)際續(xù)航會大幅縮水。

雖然帖子里提到「切換到備用充電寶后恢復(fù)」——但跨大西洋航班經(jīng)濟(jì)艙的USB口功率通常只有7.5W到18W,而M4 Max滿載功耗超過40W。

因此,續(xù)航11小時這個說法幾乎站不住腳。


故事是假的,但范式轉(zhuǎn)向是真的

面對質(zhì)疑,我們需要剝開數(shù)據(jù)的水份,看清這件事背后真正令科技圈高潮的原因。

長期以來,我們已經(jīng)習(xí)慣了「云端成癮」。

沒有 GPT-4 的 API,很多開發(fā)者甚至不知道該如何寫代碼;沒有網(wǎng)絡(luò),AI 就變成了一個啞巴。

現(xiàn)在,本地推理,確實(shí)在發(fā)生一場靜悄悄的革命。

2024年,在筆記本上跑7B模型還需要各種技巧。

2026年,M4 Mac上跑70B量化版已經(jīng)是日常操作。雖然速度不快,大概10來個tokens/s,但已經(jīng)能用。

真實(shí)的使用場景不是「飛機(jī)上交付完整項(xiàng)目」這種聽起來很爽的敘事,而是一些更樸素的東西,比如離線環(huán)境下的文檔問答,隱私敏感場景下不想把數(shù)據(jù)傳上云等等。

這些場景不性感,但實(shí)用。

現(xiàn)在,llama.cpp的mlx后端已經(jīng)針對Apple Silicon做了深度優(yōu)化,Ollama也把部署門檻壓到了一條命令。

即便 71 tokens/s 的速度存疑,BF16 的精度可能有夸張,但這種「在孤島上建立文明」的技術(shù)浪漫主義,才是最牛的。

未來,最頂尖的開發(fā)者或許不再是那個最會調(diào)優(yōu)云端 Prompt 的人,而是那個能在資源枯竭、完全離線的極端環(huán)境下,手搓出一個「自感知、自循環(huán)」AI 系統(tǒng)的人。

下一次坐飛機(jī),你準(zhǔn)備好帶上你的「數(shù)字大腦」了嗎?

參考資料:

https://x.com/servasyy_ai/status/2050098091789828376

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
英國法院裁定三星向中興賠償3.92億美元,被指嚴(yán)重低估專利價值

英國法院裁定三星向中興賠償3.92億美元,被指嚴(yán)重低估專利價值

澎湃新聞
2026-05-02 20:34:26
韓媒:韓國隊(duì)尤伯杯奪冠鞏固女羽霸主地位 韓網(wǎng)友贊金佳恩創(chuàng)造奇跡

韓媒:韓國隊(duì)尤伯杯奪冠鞏固女羽霸主地位 韓網(wǎng)友贊金佳恩創(chuàng)造奇跡

勁爆體壇
2026-05-03 21:52:12
章盟主重倉:北方稀土、西部材料、東材科技、四川黃金含金量誰高

章盟主重倉:北方稀土、西部材料、東材科技、四川黃金含金量誰高

長風(fēng)價值掘金
2026-05-03 21:02:12
95年我相親碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹難忘一幕

95年我相親碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹難忘一幕

白云故事
2025-03-04 05:45:02
美國警告賴清德當(dāng)局,只要大陸決定武力統(tǒng)一,臺灣的結(jié)局只有一個

美國警告賴清德當(dāng)局,只要大陸決定武力統(tǒng)一,臺灣的結(jié)局只有一個

貓女的小樹屋
2026-05-02 10:14:06
王鷗官宣單身:不賣慘的單親媽媽,打了一手溫情牌

王鷗官宣單身:不賣慘的單親媽媽,打了一手溫情牌

東方不敗然多多
2026-05-03 19:36:04
從高點(diǎn)暴跌20%!華爾街預(yù)言:金價將復(fù)制2008年,3年暴漲178%!

從高點(diǎn)暴跌20%!華爾街預(yù)言:金價將復(fù)制2008年,3年暴漲178%!

觸摸史跡
2026-05-03 19:59:43
姓名是否只能改一次?多地回應(yīng)

姓名是否只能改一次?多地回應(yīng)

澎湃新聞
2026-05-03 17:02:26
中國拒接8500億美債,救美國就是救中國的時代,徹底終結(jié)

中國拒接8500億美債,救美國就是救中國的時代,徹底終結(jié)

生活新鮮市
2026-05-03 07:28:34
934元平板背后:小米在賭一個被忽視的市場

934元平板背后:小米在賭一個被忽視的市場

我是一個粉刷匠2
2026-04-21 14:58:01
朝鮮在俄陣亡2300人,烏軍卻未找到一具尸體!這才是烏軍厲害之處

朝鮮在俄陣亡2300人,烏軍卻未找到一具尸體!這才是烏軍厲害之處

阿訊說天下
2026-05-01 09:47:47
誰是A股“王中王”?看榜單!

誰是A股“王中王”?看榜單!

新浪財經(jīng)
2026-05-03 13:44:51
60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

暖風(fēng)吹過竹林
2026-04-24 09:22:48
湯杯決賽前法國隊(duì)突然改名單!“手滑”還是戰(zhàn)術(shù)?國羽沉默

湯杯決賽前法國隊(duì)突然改名單!“手滑”還是戰(zhàn)術(shù)?國羽沉默

曹老師評球
2026-05-03 21:55:06
布朗:賽前45分鐘才知道塔圖姆不打 心態(tài)沒變化仍想全力爭勝

布朗:賽前45分鐘才知道塔圖姆不打 心態(tài)沒變化仍想全力爭勝

北青網(wǎng)-北京青年報
2026-05-03 20:01:02
勞倫·桑切斯紐約出街,豪門嬌妻演繹干練優(yōu)雅風(fēng)

勞倫·桑切斯紐約出街,豪門嬌妻演繹干練優(yōu)雅風(fēng)

述家娛記
2026-05-02 13:11:24
獎金465萬!吳宜澤奪冠賠率領(lǐng)先墨菲 放話:要像趙心童一樣奪冠

獎金465萬!吳宜澤奪冠賠率領(lǐng)先墨菲 放話:要像趙心童一樣奪冠

風(fēng)過鄉(xiāng)
2026-05-03 07:21:16
太尷尬!烏克蘭名模戛納豪擲半億辦婚禮,美照還沒發(fā)完,就被罵到不敢回嘴……

太尷尬!烏克蘭名模戛納豪擲半億辦婚禮,美照還沒發(fā)完,就被罵到不敢回嘴……

新歐洲
2026-05-01 18:51:00
潘石屹再次預(yù)判我國樓市!不出意外,未來3年,樓市或迎來3大走向

潘石屹再次預(yù)判我國樓市!不出意外,未來3年,樓市或迎來3大走向

巢客HOME
2026-05-03 05:05:03
今日金價,大家要有心理準(zhǔn)備了,金價或?qū)⒂瓉泶箫L(fēng)暴

今日金價,大家要有心理準(zhǔn)備了,金價或?qū)⒂瓉泶箫L(fēng)暴

花小貓的美食日常
2026-05-03 01:38:36
2026-05-04 02:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15123文章數(shù) 66834關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

高端小區(qū)多位業(yè)主拒收房:小區(qū)車位數(shù)量“蒸發(fā)”約1/3

頭條要聞

高端小區(qū)多位業(yè)主拒收房:小區(qū)車位數(shù)量“蒸發(fā)”約1/3

體育要聞

曼聯(lián)3-2雙殺利物浦!提前三輪鎖定歐冠資格 梅努制勝

娛樂要聞

黃曉明五一帶娃去游樂場 父子幸福同框

財經(jīng)要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
本地
公開課

藝術(shù)要聞

看!比利時畫家圖森特如何用油畫定義女性優(yōu)雅!

親子要聞

寶藍(lán)和叔叔在家挖了一個洞,來到了一個室內(nèi)彈床游樂場真有趣~

旅游要聞

日照五蓮:文旅盛宴激活假日經(jīng)濟(jì)

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版