国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MIT天才博士剛畢業(yè),就被前OpenAI CTO搶走!年薪或300萬(wàn)起步

0
分享至

  

  新智元報(bào)道

  編輯:桃子

  【新智元導(dǎo)讀】MIT天才博士,清華學(xué)霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預(yù)訓(xùn)練。

  MIT天才博士一畢業(yè),火速加盟OpenAI前CTO初創(chuàng)!

  最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學(xué)位。

  下一步,他將加入Thinking Machines,專注于大模型預(yù)訓(xùn)練的工作。

  

  評(píng)論區(qū)下方,英偉達(dá)科學(xué)家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。

  

  

  清華雙學(xué)位學(xué)霸,MIT博士開(kāi)掛人生

  打開(kāi)他的個(gè)人主頁(yè),多元而充實(shí)的經(jīng)歷便映入眼簾。

  肖光烜本科畢業(yè)于清華大學(xué),拿到了雙學(xué)位,主修的是計(jì)算機(jī)科學(xué),金融學(xué)是第二學(xué)位。

  

  在此期間,他獲得了清華大學(xué)綜合優(yōu)秀獎(jiǎng)學(xué)金(2019)、全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(CUMCM)一等獎(jiǎng)(2020)、國(guó)家獎(jiǎng)學(xué)金(2020)、清華大學(xué)「未來(lái)學(xué)者」獎(jiǎng)學(xué)金(2021)等多項(xiàng)獎(jiǎng)項(xiàng)。

  他曾于2020–2021年作為訪問(wèn)生(Visiting Student),前往斯坦福大學(xué)計(jì)算機(jī)系開(kāi)展科研工作。

  2022年,肖光烜加入MIT攻讀博士學(xué)位,導(dǎo)師為韓松(Song Han)教授。

  個(gè)人研究方向聚焦于:深度學(xué)習(xí)的高效算法與系統(tǒng),尤其是大規(guī)?;A(chǔ)模型(Foundation Model)。

  

  他于2022年9月至2026年1月,在MIT EECS擔(dān)任全職研究助理(Research Assistant)。

  讀博期間,肖光烜曾多次進(jìn)入全球頂級(jí)科技大廠從事前沿研究實(shí)習(xí),具備了豐富的一線工業(yè)研發(fā)的經(jīng)驗(yàn)。

  2023年,他曾加入Meta實(shí)習(xí),研究方向?yàn)椤噶魇秸Z(yǔ)言模型的高效注意力機(jī)制」,相關(guān)成果發(fā)表在arxiv上。

  

  論文地址:https://arxiv.org/pdf/2309.17453

  2024年2-5月期間,他作為英偉達(dá)實(shí)習(xí)生,研究方向是為長(zhǎng)上下文大語(yǔ)言模型推理加速。

  他和團(tuán)隊(duì)提出了DuoAttention,結(jié)合檢索與流式注意力頭,實(shí)現(xiàn)高效推理。

  

  論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

  隨后,他又參與了多項(xiàng)核心研究項(xiàng)目,其中包括:

  XAttention:基于反對(duì)角評(píng)分的塊稀疏注意力機(jī)制

  StreamingVLM:面向無(wú)限視頻流的實(shí)時(shí)理解模型

  FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優(yōu)化

  值得一提的是,肖光烜在研究之外,還有豐富的興趣愛(ài)好,比如足球、乒乓球、圍棋、鋼琴。

  他曾擔(dān)任所在院系足球隊(duì)的隊(duì)長(zhǎng)兼先鋒,貝多芬的作品是個(gè)人最愛(ài)。

  

  一篇博士論文,破解LLM三大難題

  比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。

  

  不得不承認(rèn),如今大模型已經(jīng)無(wú)所不能,但它們依然太貴了。

  顯存爆炸、推理太慢、長(zhǎng)上下文直接OOM(內(nèi)存溢出),這是幾乎所有LLM工程團(tuán)隊(duì)每天都在面對(duì)的現(xiàn)實(shí)。

  Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個(gè)罕見(jiàn)的、從工程到理論、從算法到架構(gòu)的完整答案。

  論文中, 他們提出了SmoothQuant,解決了一個(gè)長(zhǎng)期困擾工業(yè)界的問(wèn)題——激活值異常(activation outliers)。

  SmoothQuant通過(guò)一個(gè)巧妙的數(shù)學(xué)等價(jià)變換,把量化難點(diǎn)從「激活」轉(zhuǎn)移到「權(quán)重」。

  結(jié)果,它實(shí)現(xiàn)了首個(gè)在十億級(jí)模型上W8A8無(wú)損量化,無(wú)需重新訓(xùn)練,顯存更小、推理更快。

  針對(duì)超長(zhǎng)序列的處理,作者在StreamingLLM中發(fā)現(xiàn)了「注意力匯點(diǎn)」(attention sink)現(xiàn)象——

  即使沒(méi)有任何語(yǔ)義,初始token會(huì)被后續(xù)token持續(xù)關(guān)注。這些token的作用不是「理解」,而是數(shù)值穩(wěn)定。

  結(jié)果,實(shí)現(xiàn)了常數(shù)內(nèi)存的流式推理,模型上下文長(zhǎng)度從數(shù)千token擴(kuò)展到百萬(wàn)級(jí)。

  更進(jìn)一步,他們又把這一思想推廣到多模態(tài),StreamingVLM可以在保持時(shí)間一致性的同時(shí)處理長(zhǎng)達(dá)數(shù)小時(shí)的視頻內(nèi)容。

  對(duì)于超長(zhǎng)上下文場(chǎng)景,團(tuán)隊(duì)又提出一個(gè)互補(bǔ)方案,分別針對(duì)不同的性能瓶頸。

  KVCache太大,采用DuoAttention

  注意力頭本身就有分工:少數(shù)負(fù)責(zé)「全局檢索」,多數(shù)只看「最近上下文」。

  DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

  預(yù)填充(Prefill)太慢,采用XAttention

  利用反對(duì)角線評(píng)分機(jī)制,僅識(shí)別、計(jì)算必要的注意力塊,從而實(shí)現(xiàn)顯著的加速效果。

  論文的最后,并沒(méi)有止步于「優(yōu)化現(xiàn)有模型」,通過(guò)對(duì)MoBA(塊混合注意力) 的信噪比分析,作者證明了:

  理論上,block越小越好。

  但現(xiàn)實(shí)是,GPU不答應(yīng),于是有了FlashMoBA,一種定制化的CUDA內(nèi)核,使小塊架構(gòu)在實(shí)踐中可行,并實(shí)現(xiàn)了最高可達(dá)9倍的速度提升。

  這篇論文的價(jià)值在于,構(gòu)建了一整套高效大模型的完整框架,既回應(yīng)了當(dāng)下的現(xiàn)實(shí)挑戰(zhàn),也為下一代計(jì)算高效、普惠可及的AGI奠定了基礎(chǔ)。

  平均350萬(wàn)年薪,碾壓OpenAI

  最后來(lái)到一個(gè)大家比較感興趣的話題——薪資。

  去年,硅谷人才爭(zhēng)奪戰(zhàn)激烈,BI一篇獨(dú)家挖到了Thinking Machines(TML)給員工們開(kāi)出的薪資——

  基礎(chǔ)年薪高達(dá)50萬(wàn)美元(約350萬(wàn)元)。

  

  據(jù)BI獲取的招聘數(shù)據(jù),TML向兩名技術(shù)員工支付了45萬(wàn)美元的基礎(chǔ)年薪,另一名員工的年薪則高達(dá)50萬(wàn)美元。

  第四名員工被列為「聯(lián)合創(chuàng)始人/機(jī)器學(xué)習(xí)專家」,其年薪同樣為45萬(wàn)美元。

  這些薪酬數(shù)據(jù),來(lái)自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

  總體來(lái)看,TML為這四名技術(shù)員工提供的平均年薪達(dá)到462,500美元。

  相較之下,TML明顯高于業(yè)內(nèi)更為成熟LLM公司——

  OpenAI在相關(guān)申報(bào)文件中列出的29名技術(shù)員工,平均年薪為292,115美元。

  其中最高薪資為53萬(wàn)美元,最低為20萬(wàn)美元。

  Anthropic向14名技術(shù)員工支付的平均年薪為387,500美元,薪資區(qū)間在30萬(wàn)至69萬(wàn)美元之間。

  雖然比起Meta瘋狂的超1萬(wàn)億美元薪酬還差得遠(yuǎn),但這一水平也在硅谷數(shù)一數(shù)二。

  果然,21世紀(jì)最貴的還是人才。

  

  參考資料:

  https://x.com/Guangxuan_Xiao/status/2008779396497502337

  https://guangxuanx.com/

  https://scholar.google.com/citations?user=sRGO-EcAAAAJ

  https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

  https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
暫停都不會(huì)叫?許利民或下課,首鋼新帥3選1,李春江有機(jī)會(huì)

暫停都不會(huì)叫?許利民或下課,首鋼新帥3選1,李春江有機(jī)會(huì)

樂(lè)聊球
2026-01-10 08:22:33
2026車市開(kāi)年遇冷:補(bǔ)貼堆成山,為啥就是賣(mài)不動(dòng)?

2026車市開(kāi)年遇冷:補(bǔ)貼堆成山,為啥就是賣(mài)不動(dòng)?

車德鋼
2026-01-08 16:00:29
百年一遇!1 月過(guò)后,3 生肖橫財(cái)連連,日子越來(lái)越好

百年一遇!1 月過(guò)后,3 生肖橫財(cái)連連,日子越來(lái)越好

人閒情事
2026-01-10 16:24:18
斯普利特服了!給楊瀚森特殊優(yōu)待,單獨(dú)擁抱小楊,這簡(jiǎn)直就是五贏

斯普利特服了!給楊瀚森特殊優(yōu)待,單獨(dú)擁抱小楊,這簡(jiǎn)直就是五贏

嘴炮體壇
2026-01-10 23:32:17
重磅!曝華為下屬公司將上市,市值將超萬(wàn)億!

重磅!曝華為下屬公司將上市,市值將超萬(wàn)億!

電動(dòng)知家
2026-01-10 17:51:43
痛心!日照34歲醫(yī)生疑自殺離世,疑痔瘡手術(shù)疼痛導(dǎo)致,醫(yī)院回應(yīng)

痛心!日照34歲醫(yī)生疑自殺離世,疑痔瘡手術(shù)疼痛導(dǎo)致,醫(yī)院回應(yīng)

鋭娛之樂(lè)
2026-01-09 16:05:30
末代皇帝:溥儀回到故宮時(shí)買(mǎi)了票,發(fā)現(xiàn)了自己藏在椅子底下的寶貝

末代皇帝:溥儀回到故宮時(shí)買(mǎi)了票,發(fā)現(xiàn)了自己藏在椅子底下的寶貝

銘記歷史呀
2026-01-10 12:27:42
周末大消息!商業(yè)航天6股業(yè)績(jī)飆漲,最高677%,社保外資提前布局

周末大消息!商業(yè)航天6股業(yè)績(jī)飆漲,最高677%,社保外資提前布局

股市皆大事
2026-01-10 21:43:16
商業(yè)航天+核聚變!5家硬核隱形冠軍全解析,搶占雙萬(wàn)億賽道風(fēng)口

商業(yè)航天+核聚變!5家硬核隱形冠軍全解析,搶占雙萬(wàn)億賽道風(fēng)口

Thurman在昆明
2026-01-10 09:35:46
“演員閆學(xué)晶”,被禁止關(guān)注

“演員閆學(xué)晶”,被禁止關(guān)注

第一財(cái)經(jīng)資訊
2026-01-10 10:23:52
廣東3消息!杜鋒遭遼籃下馬威,徐杰莫蘭德友好寒暄,王少杰復(fù)出

廣東3消息!杜鋒遭遼籃下馬威,徐杰莫蘭德友好寒暄,王少杰復(fù)出

多特體育說(shuō)
2026-01-10 21:31:05
一場(chǎng)1-2讓弗蘭克主場(chǎng)出局:4場(chǎng)不勝,8億歐豪陣也沒(méi)用

一場(chǎng)1-2讓弗蘭克主場(chǎng)出局:4場(chǎng)不勝,8億歐豪陣也沒(méi)用

足球狗說(shuō)
2026-01-11 07:01:32
NBA生涯前20場(chǎng)楊瀚森50+25+14!王治郅108+38+6,姚明和周琦呢?

NBA生涯前20場(chǎng)楊瀚森50+25+14!王治郅108+38+6,姚明和周琦呢?

兵哥籃球故事
2026-01-10 14:10:07
96年臺(tái)海危機(jī),是誰(shuí)揪出了劉連昆,邵正宗這兩個(gè)間諜

96年臺(tái)海危機(jī),是誰(shuí)揪出了劉連昆,邵正宗這兩個(gè)間諜

鶴羽說(shuō)個(gè)事
2026-01-07 11:24:29
狂轟5球+終結(jié)5場(chǎng)不勝!切爾西新帥首秀大勝,將對(duì)決阿森納

狂轟5球+終結(jié)5場(chǎng)不勝!切爾西新帥首秀大勝,將對(duì)決阿森納

足球狗說(shuō)
2026-01-11 07:42:11
美國(guó)綁架馬杜羅之后,美國(guó)議員擔(dān)心,這要是把中國(guó)教會(huì)了可咋整?

美國(guó)綁架馬杜羅之后,美國(guó)議員擔(dān)心,這要是把中國(guó)教會(huì)了可咋整?

通文解武
2026-01-11 08:20:14
悲報(bào):日本客戶聯(lián)系了中國(guó)的電路板制造商,得到消息是不能再向日本供貨了

悲報(bào):日本客戶聯(lián)系了中國(guó)的電路板制造商,得到消息是不能再向日本供貨了

日本物語(yǔ)
2026-01-10 20:31:28
蔣萬(wàn)安四歲時(shí)與母親黃美倫的合影,母親年輕時(shí)漂亮又有氣質(zhì)

蔣萬(wàn)安四歲時(shí)與母親黃美倫的合影,母親年輕時(shí)漂亮又有氣質(zhì)

大江
2026-01-09 16:27:54
離婚傳聞?wù)嫦啻蟀變H1天,惡心一幕上演,王石被曝三位美女作陪

離婚傳聞?wù)嫦啻蟀變H1天,惡心一幕上演,王石被曝三位美女作陪

冷紫葉
2026-01-10 18:19:50
單打四強(qiáng)出爐!國(guó)乒3人晉級(jí),陳幸同絕殺張本美和;韓日均剩獨(dú)苗

單打四強(qiáng)出爐!國(guó)乒3人晉級(jí),陳幸同絕殺張本美和;韓日均剩獨(dú)苗

莼侃體育
2026-01-11 05:00:21
2026-01-11 10:04:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14306文章數(shù) 66452關(guān)注度
往期回顧 全部

教育要聞

原本10大熱門(mén)專業(yè),如今變成10大天坑專業(yè),為什么變得這么快?

頭條要聞

"國(guó)共論壇"被指即將重啟 鄭麗文:感受到大陸誠(chéng)意善

頭條要聞

"國(guó)共論壇"被指即將重啟 鄭麗文:感受到大陸誠(chéng)意善

體育要聞

詹皇曬照不滿打手沒(méi)哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂(lè)要聞

吳速玲曝兒子Joe是戀愛(ài)腦

財(cái)經(jīng)要聞

這不算詐騙嗎?水滴保誘導(dǎo)扣款惹眾怒

科技要聞

必看 | 2026開(kāi)年最頂格的AI對(duì)話

汽車要聞

寶馬25年全球銷量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
本地
教育
家居

數(shù)碼要聞

Mac mini問(wèn)世21年 蘋(píng)果最小臺(tái)式機(jī)起起伏伏又與做回主角

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

教育要聞

如何看待部分學(xué)校早晨推遲到校時(shí)間

家居要聞

木色留白 演繹現(xiàn)代自由

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版