国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

他究竟說了什么,竟因為一場訪談,被馬斯克立即開除

0
分享至

馬斯克旗下xAI一名工程師,名叫Sulaiman Ghori(下面就叫他阿蘇吧),這兩天把xAI再次拱上輿論風(fēng)口:1月18日,在接受一家播客訪談時,他口無遮攔,透露了xAI內(nèi)部運作許多細(xì)節(jié)以及和特斯拉合作的一些核心戰(zhàn)略。結(jié)果節(jié)目播出后第二天,馬斯克立馬跳起來把人開了。

阿蘇是一名灣區(qū)的機器學(xué)習(xí)工程師,在加入xAI之前,他成立了一家AI初創(chuàng)公司。后來,xAI的聯(lián)合創(chuàng)始人Greg Yang聯(lián)系了阿蘇,并把他招進(jìn)了xAI。入職后,阿蘇參與了很多不同項目,包括Grok的X平臺集成工作、圖像及視頻生成器Gork Imagine、AI軟件業(yè)務(wù)、MacronHard、人類模擬器等等。

也因為此,他接觸和掌握了大量xAI內(nèi)部的核心信息。不過也許是天性使然,他并未能識別出真實世界和內(nèi)部表達(dá)之間的界限,在訪談中毫無保留地坦誠了所有信息。

那么阿蘇在訪談中究竟說了些什么呢?以下是播客以及文字實錄,訪談時長1小時10分,文字整理有部分刪減,其中小標(biāo)題為編者所加,全文9000字左右,閱讀大約需要20分鐘。如果現(xiàn)在沒有完整時間,可以加個星標(biāo)、或者用收聽模式閱讀。

以下,enjoy:

0:41 xAI全力沖刺AGI
1:46 馬斯克預(yù)判瓶頸
3:05 馬斯克的時間線哲學(xué)
9:23 利用特斯拉百萬車算力
11:59 虛擬Optimus機器人,取代數(shù)字任務(wù)
13:14 馬斯克如何解決極端問題
20:33 馬斯克Cybertruck賭注
21:12 如何在122天內(nèi)建成Colossus
25:51 xAI招聘強度極高,短期內(nèi)海量面試
34:55 馬斯克不斷調(diào)整他對項目時間線的預(yù)估
40:36 在xAI工作最爽的體驗
48:25 以為虛擬機器人是員工
50:00 虛擬機器人最大的失誤
53:23 與馬斯克開會的感覺
54:22 馬斯克雖強勢,但愿意被實驗證明自己錯了
59:21 當(dāng)馬斯克在X上看到錯誤的Grok輸出時會發(fā)生什么

一切都應(yīng)該是“昨天就完成”

要么慢慢等死,要么自己把一切都建出來

機架當(dāng)天搭好,當(dāng)天就開始訓(xùn)練

主持人(Ti Morse)很高興邀請到 xAI 的工程師 Sulaiman Ghori。我從2023年,也就是馬斯克剛啟動 xAI 的時候,就一直在關(guān)注這家公司。我覺得它可能是史上增長最快的公司之一。你能不能聊聊,現(xiàn)在 xAI 到底發(fā)生了什么?

阿蘇:是的,我們基本上沒有真正意義上的截止日期,一切都應(yīng)該是“昨天就完成”。至少在公司內(nèi)部,沒有任何人為制造的阻礙。馬斯克一直強調(diào)“追根溯源”,找到最底層、最根本的限制是什么,如果是物理層面的限制,那我們會盡可能快地直面它、解決它。


這在軟件領(lǐng)域其實挺反常的,因為軟件工程師通常不會去思考“物理極限”這種事,但在 xAI,我們確實會這樣做。而且嚴(yán)格來說,我們現(xiàn)在已經(jīng)不完全是一家純軟件公司了。說實話,我們最大的優(yōu)勢可能就在硬件上。因為在部署規(guī)模這件事上,幾乎沒有任何其他公司能接近我們。

主持人: 馬斯克非常擅長提前預(yù)判瓶頸,甚至能提前幾個月、幾年看到未來的問題,然后倒推現(xiàn)在應(yīng)該怎么布局。那在 xAI,普通工程師是怎么在日常工作中采用這種思維方式的?

阿蘇:通常當(dāng)我們啟動一個新項目時,要么是團(tuán)隊里的人,要么是馬斯克本人,會很快提出一個非常核心的指標(biāo),這個指標(biāo)通常直接關(guān)聯(lián)到財務(wù)回報、物理回報,或者兩者兼而有之。之后,幾乎所有事情都會圍繞這個指標(biāo)展開。

我們不接受“人為限制”,如果真的有極限,那它必須是一個足夠底層、足夠真實的物理或理論限制,而不是因為流程、習(xí)慣或慣性導(dǎo)致的。尤其是在軟件領(lǐng)域,過去十多年 Web 開發(fā)的環(huán)境讓很多人默認(rèn)接受了一些“速度和延遲就是這樣”的結(jié)論,但這些結(jié)論很多時候并不成立。如果你把這些東西拆掉,很多系統(tǒng)都可以輕松提速 2 到 8 倍。

主持人: 你最近一次親身經(jīng)歷“傳統(tǒng)認(rèn)知被打破”是什么時候?

阿蘇:最近的一次是在我們做“巨硬”模型(macrohard)的時候。得益于我們非常強的超級計算團(tuán)隊,他們基本上拆除了傳統(tǒng)訓(xùn)練流程里的大多數(shù)障礙。我們基本能做到:一個機架當(dāng)天搭好,當(dāng)天就開始訓(xùn)練,有時甚至幾小時內(nèi)就能跑起來。

主持人: 這聽起來完全不正常,通常這些事情要花好幾天甚至幾周。

阿蘇:是的。過去十年,大家習(xí)慣把這些事情外包給 AWS 或 Google,你能用多少資源,完全取決于他們給你多少。但在 AI 時代,這是不可接受的。所以只有兩個選擇:要么慢慢等死,要么自己把一切都建出來。

直接利用特斯拉車隊部署計算機

同時推進(jìn)二三十個方向的實驗

馬斯克最擅長的就是快速“拆彈”

“我還能怎么幫你們把這件事做得更快?”

主持人: 你能講講你加入xAI,以及最初幾周是什么樣的嗎?

阿蘇:我當(dāng)時在做自己的創(chuàng)業(yè)項目,搬到灣區(qū)后,Greg Yang(xAI 的核心成員之一)聯(lián)系了我。他的招聘能力真的很強。一開始我還以為那是垃圾郵件,差點就刪掉了,但我看到域名是 xAI,才意識到不對勁。

后來我再次聯(lián)系 Greg,他直接說“明天來面試吧”。面完之后,下周一我就入職了。入職第一天,沒人告訴我該干嘛,只給了我一臺電腦和一張工牌。我甚至沒有被分配座位,只能坐在當(dāng)天沒來人的桌子上。

后來我主動去找 Greg,才開始參與Grok的 X 平臺集成工作。很快我發(fā)現(xiàn)一個很震撼的事情:我從座位上站起來,指一圈辦公室,就能指出每一個系統(tǒng)是誰親手寫的。這種感覺非???。當(dāng)時工程團(tuán)隊只有一百多人,比其他大模型實驗室小一個數(shù)量級,但我們已經(jīng)做出了Grok3。

主持人: xAI用122天建成 Colossus 數(shù)據(jù)中心,這在業(yè)內(nèi)幾乎是神話。黃仁勛也一直在公開稱贊你們。這種基礎(chǔ)設(shè)施能力,對公司文化產(chǎn)生了什么影響?

阿蘇:它讓模型和產(chǎn)品團(tuán)隊可以默認(rèn):我們需要的資源一定會到位。我們確實不算“資源匱乏”,甚至已經(jīng)在同時推進(jìn)二三十個方向的實驗。

實際上,Grok 4、Grok 5 的規(guī)模和設(shè)計,在我入職前就已經(jīng)規(guī)劃好了。這種確定性讓我們能更長期地思考。比如我們原本認(rèn)為系統(tǒng)的最低延遲下限要高得多,結(jié)果發(fā)現(xiàn)真實物理條件允許我們做到快三倍。我們現(xiàn)在在做的一些新架構(gòu),如果沒有極高的實驗頻率,根本無法推進(jìn),因為它們不建立在任何已有研究之上,需要新的預(yù)訓(xùn)練方式和新數(shù)據(jù)集。

這時基礎(chǔ)設(shè)施就成了關(guān)鍵。比如一個問題是:如果我們要部署 100 萬個“人類模擬器”,那意味著100萬臺計算機,這怎么可能?答案很快就出現(xiàn)了:Tesla 車載計算機。這些設(shè)備在資本效率上遠(yuǎn)超云計算或傳統(tǒng)服務(wù)器。我們甚至可以直接在車上運行完整的“人類數(shù)字工作站”,成本極低。

主持人: 也就是說,可以直接利用現(xiàn)有的特斯拉車隊?

阿蘇:是的。北美有幾百萬輛特斯拉,大部分時間它們是閑置、充電、聯(lián)網(wǎng)的。我們可以付費給車主,在不影響使用的情況下運行人類模擬器。這幾乎不需要額外基建,只是一個軟件問題。

Ti Morse:馬斯克 最擅長的似乎就是快速“拆彈”。你有沒有親眼見過某個重大問題,被他非常迅速地解決?

阿蘇:最明顯的是基礎(chǔ)設(shè)施建設(shè)。尤其是在新硬件上線時,驅(qū)動、編譯器、算子經(jīng)常會出問題。有幾次他在會議中聽到這些障礙,直接打一個電話,第二天 Nvidia 的軟件補丁就到位了,我們并肩把問題解決,然后立刻開始訓(xùn)練模型。

原本需要幾周的溝通,被壓縮成一天。很多時候,會議快結(jié)束時,他會直接問一句:“我還能怎么幫你們把這件事做得更快?”

主持人: 我知道你們在并行推進(jìn)很多不同的產(chǎn)品,這在某種程度上也是不得不這么做。但在大多數(shù)組織里,同時在多個方向推進(jìn),其實很難始終保持對單一目標(biāo)的專注。你們是如何做到的?

阿蘇:關(guān)鍵在于規(guī)模擴(kuò)大之后的信息流動方式。我們并不是隨時對所有項目都有完整視圖,通常是在全員會議,或者和不同人私下聊天時,才逐漸拼湊出大家各自在做什么、進(jìn)度如何。

在這里,當(dāng)你提出一個想法,反饋通常只有兩種:要么是“這想法很蠢”,要么是“那為什么這還沒做完?”如果是后者,那你就直接去做,做完就結(jié)束了。幾乎不需要同步、不需要審批,也不需要等任何人。

主持人: 在馬斯克的公司里,好像你可以直接“要責(zé)任”,然后就進(jìn)入一種“成王敗寇”的狀態(tài)。事情做成了,你就能繼續(xù)要更多責(zé)任;做不成,就出局。你的體驗是這樣嗎?

阿蘇:完全是這樣。我參與過很多不同的項目,大多數(shù)時候只是因為有人找我?guī)兔?,我就一直幫下去,最后發(fā)現(xiàn)自己莫名其妙就“擁有”了那一整塊技術(shù)棧,甚至好幾塊。對所有人來說都是如此。如果你在幾天內(nèi)快速迭代并解決了某個問題,那這塊基本就歸你了。沒有任何正式流程。

說實話,我們的 HR 系統(tǒng)早就失真了。官方記錄里我可能還在做語音和 iOS,安全系統(tǒng)甚至認(rèn)為我還在負(fù)責(zé) X 的集成,但這些都沒人更新,也沒人關(guān)心。

小到可憐的團(tuán)隊規(guī)模

卻有著驚人的創(chuàng)造力和能量

工程師和馬斯克打賭

24小時內(nèi)在新GPU上跑起來

就能拿到一輛Cybertruck

主持人: 那你從入職到現(xiàn)在,大概都做過哪些項目?

阿蘇:一開始我做的是 Grok 和相關(guān)集成,也和后端團(tuán)隊一起解決穩(wěn)定性和擴(kuò)展問題,因為當(dāng)時增長非常快。后來我基本是一個人把桌面端產(chǎn)品體系搭建到內(nèi)部可用狀態(tài)。再之后,我被拉去支援 Imagine 的發(fā)布和 iOS。
說實話,xAI 的 iOS 團(tuán)隊小得離譜,你根本猜不到有多少人。

主持人: 五個人?三個人?

阿蘇:三個人。當(dāng)時我就是第三個。相對于用戶規(guī)模來說,這簡直不可思議,但每個人都非常強。這也是我第一次感覺到,必須拼命工作才能跟上團(tuán)隊整體的速度和水平。

主持人: 什么時候你第一次意識到,自己真的被“用到了極限”?

阿蘇:是在 Imagine 項目上。那是一種 24 小時一輪的迭代節(jié)奏。我們每天晚上發(fā)布版本,第二天早上拿到全部反饋,然后立刻修 bug、加新功能、適配最新模型輸出。循環(huán)極快。那可能是我人生中連續(xù)在辦公室待得最長的一段時間。

主持人: 那段時間持續(xù)了多久?

阿蘇:大概兩三個月。那段時間基本沒有周末。但我并不討厭,反而很高興知道自己能承受這種強度。之后我被調(diào)去做 MacroHard 產(chǎn)品,當(dāng)時整個項目只有兩個人。我從立項開始就一直在做這個項目。

主持人: Colossus 數(shù)據(jù)中心的建設(shè)過程本身就像戰(zhàn)爭故事合集。電力、芯片、GPU、冷卻,全是瓶頸。你在其中的感受是什么?

阿蘇:真的有太多戰(zhàn)爭故事了。有一次,Tyler (Tyer Storm,xAI工程師)跟馬斯克打了個賭,說如果能在 24 小時內(nèi)讓新 GPU 完成訓(xùn)練運行,就能拿到一輛 Cybertruck。結(jié)果當(dāng)晚我們就跑起來了。那輛車現(xiàn)在我在食堂窗戶外還能看到。

主持人: 還有沒有那種“本不該成功,但卻成功了”的故事?

阿蘇:比如說,Colossus 用地的租約本質(zhì)上是臨時的。這是為了最快拿到許可、盡快開工。我相信之后會轉(zhuǎn)為正式許可,但當(dāng)下是“技術(shù)上臨時”。

主持人這聽起來像是利用制度漏洞?

阿蘇:本地和州政府有一種特殊條款,允許“臨時地面設(shè)施”,原本是給嘉年華之類用的。所以是的,我們算是“嘉年華公司”。但122天就建完了。

如何做規(guī)劃:

從“最高杠桿點”進(jìn)行倒推

先刪掉不必要的東西

等發(fā)現(xiàn)真的需要,再加回來

找到那些“10行解法”,敢于挑戰(zhàn)需求的人

主持人: 你們?nèi)绾卧跇O不確定的情況下做 12 到 24 個月的規(guī)劃?

阿蘇:我們總是從“最高杠桿點”倒推。比如,如果目標(biāo)是在某個時間點實現(xiàn) 1000 萬或 1 億美元收入,那從經(jīng)濟(jì)角度看,最值得做的事情是什么?先確定系統(tǒng)和產(chǎn)品形態(tài),再推導(dǎo)需要什么軟件、什么物理資源。物理條件反而通常是最后才確定的。

主持人:是不是也在用 SpaceX 那套“先刪再加”的方法?

阿蘇:是的,經(jīng)常這樣。先刪掉不必要的東西,等發(fā)現(xiàn)真的需要,再加回來。

主持人: 最近一次是什么時候?

阿蘇:就是今天。MacroHard 需要在各種不同硬件上部署,顯示器從 30 年前的老設(shè)備到最新的 5K 顯示器都要支持。我把多個視頻編碼器的特殊分支邏輯刪掉了,結(jié)果發(fā)現(xiàn)某些編碼器在 5K 分辨率下有像素上限,只好把那一層特殊處理再加回來。

主持人: 你覺得關(guān)于 xAI,還有哪些事情值得被更多人知道?

阿蘇:這里有很多“怪人”,但都是正向的怪人。在這里,杠桿效應(yīng)非常強。你能用比過去少得多的時間和精力,做成大得多的事,這和你共事的人、內(nèi)部工具、以及管理方式高度相關(guān)。

主持人: 那什么樣的人會想來這里工作?

阿蘇:大多數(shù)人一開始都非常有熱情,而且高度使命驅(qū)動。有的人追求管理影響力,有的人更想“擁有”技術(shù)棧的一大塊。比如現(xiàn)在,我們在重寫核心生產(chǎn) API,幾乎是一個人帶著 28個agent 在干,而且干得很好。你完全可以一個人負(fù)責(zé)極大一部分代碼。

主持人: xAI 在招聘上還有哪些不尋常的做法?

阿蘇我曾經(jīng)連續(xù)兩三周,每周面 20 多個人。我有一道自己曾經(jīng)解決過的計算機視覺問題,會讓候選人在半小時內(nèi)嘗試實現(xiàn)。問題本身非常簡單,但很多人會過度設(shè)計。

我特別看重能不能找到“10行解法”。因為我們要跑在跨度 30 到 40 年的硬件和系統(tǒng)上,如果不追求極簡,下周代碼就會膨脹到千萬行。AI 很容易寫出 200 行代碼,但真正重要的是,誰能先想到那 10 行。

主持人: 你剛才提到“杠桿效應(yīng)”,那你個人在招人或合作時,還會特別看重哪些“放大器”?

阿蘇:我非??粗啬切└矣谔魬?zhàn)需求、敢于挑戰(zhàn)我的人。我是從 Chester Z Ford 那里學(xué)到這一點的,我覺得這個方法特別好。他在招聘時,經(jīng)常會在題目里故意加入一個錯誤的需求、不可能完成的條件,或者邏輯上不成立的設(shè)定。他期待候選人能站出來說:“這個是錯的,這個不可能實現(xiàn),你這里有問題。”如果對方什么都不說,直接照著做,那他基本就不會招這個人。我后來也完全照著這個方式來用,效果非常好。

越是聰明的人其實越樂于合作

抱怨完“完全不合理”的交付時間

轉(zhuǎn)念就想怎么在期限內(nèi)把事情做完

永遠(yuǎn)可以嘗試用一個月去做一件

原本要一年才能完成的事

主持人: 節(jié)奏這么快,而你又不斷在不同項目之間切換,你通常是怎么在一個新任務(wù)或新項目上快速“上手”的?

阿蘇:這要看具體情況。如果是代碼量比較大的項目,那就老老實實地讀代碼,用最原始的方法,一路 go to definition,反復(fù)跳轉(zhuǎn)。其實這樣理解得非常快。當(dāng)然,如果是一個正在高速演進(jìn)中的項目,那就不一樣了,可能同時存在二三十個版本,你甚至分不清哪個才是“當(dāng)前主線”。


這種時候就只能去找人聊。好在大家都非常開放,這是我入職后最驚喜的一點。我原本以為這里的人會非常聰明、但也可能很傲慢,結(jié)果恰恰相反:大家都很聰明,而且非常友好、樂于幫忙,真的有一種“在同一條船上”的感覺。


因為節(jié)奏太快,我們基本不寫文檔,根本來不及寫?,F(xiàn)在我們甚至在嘗試,用系統(tǒng)自動生成文檔。另一方面,我們有 Grok,而且可以無限制使用,這本身就是一種巨大優(yōu)勢。我們可以去嘗試很多“看起來很蠢”的想法,看它到底行不行。在別的創(chuàng)業(yè)公司,這樣的實驗可能要燒掉幾十萬甚至上百萬美元的算力成本,而我們幾乎是零成本。這意味著我們可以失敗很多次,而失敗次數(shù)越多,成功的實驗反而越多。

主持人: 你有沒有經(jīng)歷過那種,原本覺得一個項目周期應(yīng)該很長,但最后卻被你們硬生生壓縮了幾周甚至幾個月的情況?

阿蘇:基本上每一次都是這樣。每次從內(nèi)部會議或者和外部人溝通完,聽到一個看起來“完全不合理”的交付時間,我們通常會先花幾分鐘抱怨一下,然后剩下的時間就全部用來想:怎么在這個時間內(nèi)把事情做完。

你會發(fā)現(xiàn),所謂的“時間預(yù)估”,其實是建立在一堆假設(shè)之上的。當(dāng)時間被砍到原來的二分之一、甚至十分之一時,你就會重新審視這些假設(shè):哪些是真正必要的?哪些可以刪掉?每推翻一個假設(shè),時間線就會直接縮短一截。這樣反復(fù)幾次,往往就能滿足看起來“不可能”的要求。

主持人: 在 SpaceX 和特斯拉上,馬斯克的時間預(yù)期往往比現(xiàn)實短很多,但正因為這個激進(jìn)預(yù)期,事情最終反而做得更快。在 xAI 這邊是不是類似?而且你們現(xiàn)在看起來甚至更接近他給出的時間線。

阿蘇:我覺得他本人也在不斷校準(zhǔn)自己的時間判斷。畢竟現(xiàn)在已經(jīng)多次在極大規(guī)模上部署過硬件,所以對周期的把握比過去準(zhǔn)很多。而且他的時間線更新得非???,有時候幾乎是按天更新的。比如某個硬件訂單如果能插進(jìn)生產(chǎn)批次,就可能一下子省掉一兩個月。

在軟件側(cè)也是同樣的邏輯。他一直說的一點是:你永遠(yuǎn)可以嘗試用一個月去做一件原本要一年才能完成的事。你也許做不完,但可能兩個月就搞定了,那依然快得多。

馬斯克已經(jīng)不招AI研究員了

只招工程師

xAI內(nèi)部只有三個層級

幾乎所有管理層都會寫代碼

一些看起來“不該出現(xiàn)在這里”的人

最后卻做成了非常大的事情

主持人: 我記得馬斯克曾說過,現(xiàn)在已經(jīng)沒有“AI 研究員”這種角色了,只有工程師。

阿蘇:是的,有一次我們在討論招聘描述時,他花了十幾分鐘反復(fù)強調(diào):工程師,工程師,只要是優(yōu)秀的問題解決者就行,不管背景是做模型、做基礎(chǔ)設(shè)施還是別的。

主持人: 為什么這個定義這么重要?

阿蘇:因為它足夠?qū)?。這樣一來,來自非常不同背景的人都能進(jìn)入這個系統(tǒng)。SpaceX 早期也有很多類似的例子,一些看起來“不該出現(xiàn)在這里”的人,最后卻做成了非常大的事情

主持人: 對你個人來說,每天在這里工作,最有趣的是什么?

阿蘇:沒人跟我說“不”。如果我有一個好想法,通常當(dāng)天就能實現(xiàn)、展示,然后跑評測、給客戶看、或者直接給馬斯克看。當(dāng)天就能知道這是不是正確方向。沒有冗長討論,沒有官僚流程,這一點我非常喜歡。


我原本以為,從極小的創(chuàng)業(yè)公司跳到一家 100 人規(guī)模的公司,必然會犧牲一些自由度。但相對于馬斯克的其他公司,這里依然非常小,也確實非常扁平,幾乎沒有額外負(fù)擔(dān)。

主持人: 有沒有哪些你入職前的假設(shè),被徹底打破了?

阿蘇:我原以為會是非常自上而下的管理,但實際上比我想象中更自下而上。整個公司基本只有三層:工程師、創(chuàng)始人和少數(shù)管理者、然后就是 馬斯克

管理層級極少,而且幾乎所有管理者都會寫代碼。即便現(xiàn)在有些人要管上百人,但本質(zhì)上他們依然是工程師。我記得入職第一周吃晚飯時,坐在我旁邊的人說他在做銷售,我心想“算了,不聊了”。結(jié)果他開始給我講他正在訓(xùn)練的模型。后來我才發(fā)現(xiàn),銷售團(tuán)隊全是工程師。當(dāng)時公司里,非工程師的人可能不到 8 個。每個人都在為這臺機器貢獻(xiàn)力量。

主持人: 是不是因為層級少,工程師可以更直接理解客戶問題,然后迅速落地?

阿蘇:是的。層級越多,信息損失越嚴(yán)重。語言本身就是有損的。如果你從客戶到銷售,再到經(jīng)理,再到工程師,每一層都是一次“壓縮”,最后拿到的信息已經(jīng)嚴(yán)重失真。而如果工程師直接面對客戶,就只壓縮一次,解決方案自然會好得多。

主持人: 你覺得團(tuán)隊人數(shù)這么少,反而是一件好事嗎?

阿蘇:是的,絕對是。我一直認(rèn)為,一件本來一個人就能完成的工作,如果交給兩個人來做,往往反而會花兩倍的時間,這個規(guī)律在任何規(guī)模下都成立。尤其是在現(xiàn)在這個階段,你已經(jīng)不需要像過去那樣親自寫那么多代碼了,你更多是在做決策、做架構(gòu)設(shè)計。某種意義上,每個人都可以是架構(gòu)師,并不需要那么多“手”,一個人的大腦能完成的事情比以前多得多。

馬斯克如何開會:

要么是非常高層的反饋

要么是非常底層的細(xì)節(jié)

常會出現(xiàn)那種“沖鋒式”的時刻

比如馬斯克半夜突然進(jìn)公司

醒著的人直接拉來開始處理

主持人: 你參與過的馬斯克會議一般是什么樣的?

阿蘇:其實都挺簡單的,而且我運氣不錯,大多數(shù)都進(jìn)行得比較順利。所謂“順利”,通常意味著反饋很少,或者只是點個頭,表示方向是對的,下周再更新。如果出現(xiàn)了明確的反饋,甚至要求徹底改變方向,那通常說明我們在某個地方出了問題。反而從上往下的節(jié)奏,有時候確實會顯得有點混亂。

主持人: 在 SpaceX 那樣的環(huán)境里,成本和零件細(xì)節(jié)極其重要。但在這里,馬斯克給反饋的方式是不是不太一樣?

阿蘇:通常要么是非常高層的反饋,要么是非常底層的細(xì)節(jié),中間層反而不多。高層反饋可能是產(chǎn)品方向、用戶定位,比如只聚焦某一個細(xì)分市場,或者干脆不要做某件事。而在底層層面,尤其是涉及算力效率或延遲時,他幾乎總會給出一個非常具體的建議,比如“試試這個”。他也非常愿意被證明是錯的,但前提是要有實驗結(jié)果,而不是觀點之爭。只要實驗結(jié)果足夠有說服力,我們就會采納。

主持人: 能舉些具體的例子嗎?

阿蘇:比如在算力效率上選擇小模型,帶來了很多我們原本沒想到的改進(jìn)。有些是直接的,有些是間接的。最明顯的好處當(dāng)然是速度大幅提升,但更重要的是,小模型讓迭代速度變得極快。特斯拉在自動駕駛上也發(fā)現(xiàn)了這一點。以前可能四周才能發(fā)布一個版本,現(xiàn)在一周就可以。這也是為什么我們可以同時跑二十多個實驗,很多連鎖效應(yīng)都源自這個小模型決策。

Ti Morse:我看到過一些情況,有人在 X 上指出 Grok 的回答明顯不對,馬斯克說“我們會修”,然后十幾個小時后問題就解決了。內(nèi)部一般是怎么處理這種事情的?

阿蘇:他會直接指出哪里出了問題。只要當(dāng)時有清醒的人,就會立刻拉一個線程開始處理,必要時再拉幾個人進(jìn)來。問題解決之后,會做一次復(fù)盤,讓所有人都清楚問題是怎么發(fā)生的,以及未來如何避免。犯一次錯是可以接受的,但同樣的錯誤犯第二次,就是大問題了。

主持人: 在 SpaceX 的發(fā)展歷史中,包括在特斯拉,也經(jīng)常會出現(xiàn)那種“沖鋒式”的時刻,比如馬斯克半夜突然進(jìn)公司,直接全員通知說所有能來的人都得來,一起連夜推進(jìn)事情。這里也發(fā)生過類似的情況嗎?

阿蘇:這種情況更多出現(xiàn)在大模型相關(guān)的項目上。就 Macro這條線來說,我們已經(jīng)在“戰(zhàn)情室”模式下連續(xù)運轉(zhuǎn)了四個月了,所以基本一直都處在那種高強度推進(jìn)狀態(tài)。

主持人: 那你們真的在門口掛了個“戰(zhàn)情室”的牌子嗎?

阿蘇:其實有過。最早的那個戰(zhàn)情室,后來我們把東西全都搬走了。有一次他走進(jìn)那個房間,發(fā)現(xiàn)里面空無一人,就問“人呢?怎么回事?”然后他又走到我們現(xiàn)在所在的地方,也就是原本的健身房。我們把健身房清空了,把所有人都塞進(jìn)來,然后他就在那里臨時開始挨個問項目進(jìn)展。那一晚真的很漫長。

主持人: 在這種很多事情被突然打亂、然后迅速往前推進(jìn)的夜晚,或者說在這種“沖鋒時刻”,你的感受是什么?

阿蘇:我前幾天剛好看到 Igor(Igor Babuschkin,xAI聯(lián)合創(chuàng)始人)發(fā)過一條內(nèi)容,大意是:有些月份,幾天就過去了;但有些夜晚,仿佛發(fā)生了好幾個月的事情。那一晚絕對就是后者。當(dāng)然,“幾個月”可能有點夸張,但我覺得如果按正常節(jié)奏推進(jìn),我們可能也能在幾周內(nèi)達(dá)到同樣的技術(shù)結(jié)果。但把這件事壓縮到一個晚上完成,意義完全不一樣,那確實是一次極限推進(jìn),而且非常累。

主持人: 有沒有出現(xiàn)過那種情況,比如公司里的人連續(xù)五天、甚至一周幾乎都沒離開過辦公室?

阿蘇:有的。模型搜索階段經(jīng)常會導(dǎo)致很多人直接在公司通宵。

主持人: 你剛才提到公司里有五六個睡眠艙,大家輪流用?

阿蘇:對,有一些睡眠艙,現(xiàn)在還有幾張上下鋪,條件就沒那么好了,但確實能睡。后來那張“帳篷”的照片傳出來之后,很多人都發(fā)給我。我只能說,帳篷是有的,但我從沒見過一次性全都搭出來的情況。

我骨子里還是一個創(chuàng)業(yè)者

在這里個人的杠桿效應(yīng)最大

能產(chǎn)生的直接影響更大

主持人 在加入現(xiàn)在這家公司之前,你嘗試過創(chuàng)辦多家公司,也同時做過很多不同的項目。是什么讓你選擇來這里?是使命感、文化,還是別的什么因素?

阿蘇:說實話,我一直都挺“馬斯克粉”的

(看到這,想到第二天他就要被開除,挺心酸的)
。他從小就是我的個人英雄之一,尤其是看到獵鷹火箭第一次成功回收的時候,給我留下了非常深的印象。我還專門去現(xiàn)場看了第五次星艦發(fā)射,那次是第一次成功捕獲,真的非常震撼,是我這輩子看過最酷的事情。所以,只要是和這些事情哪怕沾一點邊的項目,對我來說都非常有吸引力。

主持人: 那為什么不是 SpaceX 或 Tesla,而是選擇了現(xiàn)在這家公司?

阿蘇:我骨子里還是一個創(chuàng)業(yè)者。這家公司是幾家里面最小、也最新的一家。我當(dāng)時的判斷是,而且后來基本也被證明是對的,在這里個人的杠桿效應(yīng)最大。因為從比例上看,你在公司里所占的比重遠(yuǎn)遠(yuǎn)高于那些更大的公司。這并不是說在大公司就做不了酷的事情,或者個人不重要,而是這里你能產(chǎn)生的直接影響更大。

Ti Morse:謝謝你接受今天的訪談。


小編:
說實話,整理完整場訪談,似乎并沒有從中看到什么會絕對導(dǎo)致阿蘇“應(yīng)當(dāng)”被開除掉的內(nèi)容。有些可能比較敏感,比如將幾百萬輛特斯拉變成車載分布式計算機啥的。相反,阿蘇在訪談中講了大量非常有“營養(yǎng)”和值得思考的內(nèi)容。從這個意義上講,這真的是一場值得正兒八經(jīng)推薦的訪談。

問馬會繼續(xù)整理并發(fā)布那些高價值的內(nèi)容。如果你也對一個全新的未來充滿好奇,也在尋找能夠穿越周期的力量,歡迎關(guān)注AskMusk,或者添加主理人VX:askmusk001

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國被氣死,中國高超導(dǎo)彈用水泥造: 想了100種可能都沒試過水泥

美國被氣死,中國高超導(dǎo)彈用水泥造: 想了100種可能都沒試過水泥

基斯默默
2026-04-10 22:52:21
還是服軟了,巴拿馬用舉國代價證明,中國惹不起,美國靠不住

還是服軟了,巴拿馬用舉國代價證明,中國惹不起,美國靠不住

動漫里的童話
2026-04-12 08:47:53
馬克龍賭輸了!簽涉臺聲明討好日本,反被中方精準(zhǔn)拿捏,太丟人

馬克龍賭輸了!簽涉臺聲明討好日本,反被中方精準(zhǔn)拿捏,太丟人

安安說
2026-04-11 11:47:45
為啥淘寶,拼多多幾塊錢的東西還能包郵?看完你就明白了!

為啥淘寶,拼多多幾塊錢的東西還能包郵?看完你就明白了!

呼呼歷史論
2026-04-10 21:17:24
西班牙人球員不滿:都看到了,這就是巴薩球員對同行的尊重

西班牙人球員不滿:都看到了,這就是巴薩球員對同行的尊重

天光破云來
2026-04-12 10:19:29
后來,我才明白,斷聯(lián)后不刪除、不拉黑、不聯(lián)系的人,不是在等對方回頭,而是在等自己放下

后來,我才明白,斷聯(lián)后不刪除、不拉黑、不聯(lián)系的人,不是在等對方回頭,而是在等自己放下

品讀時刻
2026-04-12 09:08:19
湖人裁掉巴夫金!被呼吁簽回昔日控衛(wèi),這可是湖人選中的榜眼秀

湖人裁掉巴夫金!被呼吁簽回昔日控衛(wèi),這可是湖人選中的榜眼秀

林子說事
2026-04-12 00:05:38
特朗普的一句“YES”,讓中國在中東無法再低調(diào)了!

特朗普的一句“YES”,讓中國在中東無法再低調(diào)了!

觸摸史跡
2026-04-12 10:27:57
"翻臉"是遲早的事?王濛怒甩李小冉當(dāng)眾黑臉,內(nèi)娛惡俗一幕被揭開

"翻臉"是遲早的事?王濛怒甩李小冉當(dāng)眾黑臉,內(nèi)娛惡俗一幕被揭開

離離言幾許
2026-04-11 15:21:33
1180一張!謝娜成都演唱會兩萬多人預(yù)約,粉絲賭張杰空降性價比高

1180一張!謝娜成都演唱會兩萬多人預(yù)約,粉絲賭張杰空降性價比高

天天熱點見聞
2026-04-12 10:33:50
數(shù)百名醫(yī)生強調(diào):只要做過肺部CT,患者一定多加關(guān)注這5點!

數(shù)百名醫(yī)生強調(diào):只要做過肺部CT,患者一定多加關(guān)注這5點!

醫(yī)學(xué)科普匯
2026-04-09 17:01:02
歐爾班沒想到,他從搬來的美國救兵,變成了壓垮他的最后一根稻草

歐爾班沒想到,他從搬來的美國救兵,變成了壓垮他的最后一根稻草

黑鷹觀軍事
2026-04-11 19:18:22
丹麥華裔王妃文雅麗回香港娘家,還帶上27歲大兒子,母子倆長得像

丹麥華裔王妃文雅麗回香港娘家,還帶上27歲大兒子,母子倆長得像

健身狂人
2026-04-01 17:56:50
鄭永年:不用糾結(jié)特朗普到底什么意思,中美客觀上已經(jīng)是G2了

鄭永年:不用糾結(jié)特朗普到底什么意思,中美客觀上已經(jīng)是G2了

上觀新聞
2026-04-11 14:49:04
004核航母落空?美媒:除關(guān)鍵術(shù)落后,多個原因讓中國不必要造它

004核航母落空?美媒:除關(guān)鍵術(shù)落后,多個原因讓中國不必要造它

溫讀史
2026-04-12 10:25:41
這四種病都不是病?而是年齡到了!過度治療反而傷身,坦然接受

這四種病都不是病?而是年齡到了!過度治療反而傷身,坦然接受

醫(yī)學(xué)科普匯
2026-04-10 20:15:11
阿斯:賽后巴薩球迷在諾坎普歡呼超5分鐘,鼓勵球隊逆轉(zhuǎn)馬競

阿斯:賽后巴薩球迷在諾坎普歡呼超5分鐘,鼓勵球隊逆轉(zhuǎn)馬競

懂球帝
2026-04-12 07:33:07
時隔半世紀(jì)人類再出發(fā),美國繞月展示的技術(shù)差距,中國必須正視

時隔半世紀(jì)人類再出發(fā),美國繞月展示的技術(shù)差距,中國必須正視

無人傾聽無人傾聽
2026-04-10 22:43:33
浙江金華一催收公司被查,100余人被帶走,催收員月傭金超11萬!

浙江金華一催收公司被查,100余人被帶走,催收員月傭金超11萬!

一口老湯
2026-04-12 09:10:03
兒子辦滿月酒親戚嫌遠(yuǎn)都不來,我不生氣過年他們想來我關(guān)機回娘家

兒子辦滿月酒親戚嫌遠(yuǎn)都不來,我不生氣過年他們想來我關(guān)機回娘家

荷蘭豆愛健康
2026-04-12 07:21:49
2026-04-12 11:27:00
問問馬斯克AskMusk incentive-icons
問問馬斯克AskMusk
了解馬斯克,關(guān)注我們就對了
270文章數(shù) 618關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議 將返回美國

頭條要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議 將返回美國

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

鄭鈞回應(yīng)兒子走路:會監(jiān)督他挺直腰板

財經(jīng)要聞

三輪磋商談至深夜 美伊談判三大議題仍待解

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

游戲
時尚
數(shù)碼
家居
軍事航空

現(xiàn)實比游戲更瘋狂!萊斯特演員:GTA6或難達(dá)前作沖擊感

春季穿衣別死氣沉沉,看看這27套日常穿搭,活力時尚又減齡

數(shù)碼要聞

蘋果高端款 Mac mini 與 Mac Studio 多款配置在官網(wǎng)出現(xiàn)缺貨狀況

家居要聞

復(fù)古風(fēng)格 自然簡約

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進(jìn)入關(guān)懷版