国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MIT天才博士剛畢業(yè),就被前OpenAI CTO搶走!年薪或300萬(wàn)起步

0
分享至

MIT天才博士,清華學(xué)霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預(yù)訓(xùn)練。

MIT天才博士一畢業(yè),火速加盟OpenAI前CTO初創(chuàng)!

最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學(xué)位。

下一步,他將加入Thinking Machines,專(zhuān)注于大模型預(yù)訓(xùn)練的工作。


評(píng)論區(qū)下方,英偉達(dá)科學(xué)家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



清華雙學(xué)位學(xué)霸,MIT博士開(kāi)掛人生

打開(kāi)他的個(gè)人主頁(yè),多元而充實(shí)的經(jīng)歷便映入眼簾。

肖光烜本科畢業(yè)于清華大學(xué),拿到了雙學(xué)位,主修的是計(jì)算機(jī)科學(xué),金融學(xué)是第二學(xué)位。


在此期間,他獲得了清華大學(xué)綜合優(yōu)秀獎(jiǎng)學(xué)金(2019)、全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(CUMCM)一等獎(jiǎng)(2020)、國(guó)家獎(jiǎng)學(xué)金(2020)、清華大學(xué)「未來(lái)學(xué)者」獎(jiǎng)學(xué)金(2021)等多項(xiàng)獎(jiǎng)項(xiàng)。

他曾于2020–2021年作為訪(fǎng)問(wèn)生(Visiting Student),前往斯坦福大學(xué)計(jì)算機(jī)系開(kāi)展科研工作。

2022年,肖光烜加入MIT攻讀博士學(xué)位,導(dǎo)師為韓松(Song Han)教授。

個(gè)人研究方向聚焦于:深度學(xué)習(xí)的高效算法與系統(tǒng),尤其是大規(guī)模基礎(chǔ)模型(Foundation Model)。


他于2022年9月至2026年1月,在MIT EECS擔(dān)任全職研究助理(Research Assistant)。

讀博期間,肖光烜曾多次進(jìn)入全球頂級(jí)科技大廠(chǎng)從事前沿研究實(shí)習(xí),具備了豐富的一線(xiàn)工業(yè)研發(fā)的經(jīng)驗(yàn)。


論文地址:https://arxiv.org/pdf/2309.17453

2024年2-5月期間,他作為英偉達(dá)實(shí)習(xí)生,研究方向是為長(zhǎng)上下文大語(yǔ)言模型推理加速。

他和團(tuán)隊(duì)提出了DuoAttention,結(jié)合檢索與流式注意力頭,實(shí)現(xiàn)高效推理。


論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

隨后,他又參與了多項(xiàng)核心研究項(xiàng)目,其中包括:

  • XAttention:基于反對(duì)角評(píng)分的塊稀疏注意力機(jī)制

  • StreamingVLM:面向無(wú)限視頻流的實(shí)時(shí)理解模型

  • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優(yōu)化

值得一提的是,肖光烜在研究之外,還有豐富的興趣愛(ài)好,比如足球、乒乓球、圍棋、鋼琴。

他曾擔(dān)任所在院系足球隊(duì)的隊(duì)長(zhǎng)兼先鋒,貝多芬的作品是個(gè)人最?lèi)?ài)。


一篇博士論文,破解LLM三大難題

比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


不得不承認(rèn),如今大模型已經(jīng)無(wú)所不能,但它們依然太貴了。

顯存爆炸、推理太慢、長(zhǎng)上下文直接OOM(內(nèi)存溢出),這是幾乎所有LLM工程團(tuán)隊(duì)每天都在面對(duì)的現(xiàn)實(shí)。

Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個(gè)罕見(jiàn)的、從工程到理論、從算法到架構(gòu)的完整答案。

論文中, 他們提出了SmoothQuant,解決了一個(gè)長(zhǎng)期困擾工業(yè)界的問(wèn)題——激活值異常(activation outliers)。

SmoothQuant通過(guò)一個(gè)巧妙的數(shù)學(xué)等價(jià)變換,把量化難點(diǎn)從「激活」轉(zhuǎn)移到「權(quán)重」。

結(jié)果,它實(shí)現(xiàn)了首個(gè)在十億級(jí)模型上W8A8無(wú)損量化,無(wú)需重新訓(xùn)練,顯存更小、推理更快。

針對(duì)超長(zhǎng)序列的處理,作者在StreamingLLM中發(fā)現(xiàn)了「注意力匯點(diǎn)」(attention sink)現(xiàn)象——

即使沒(méi)有任何語(yǔ)義,初始token會(huì)被后續(xù)token持續(xù)關(guān)注。這些token的作用不是「理解」,而是數(shù)值穩(wěn)定。

結(jié)果,實(shí)現(xiàn)了常數(shù)內(nèi)存的流式推理,模型上下文長(zhǎng)度從數(shù)千token擴(kuò)展到百萬(wàn)級(jí)。

更進(jìn)一步,他們又把這一思想推廣到多模態(tài),StreamingVLM可以在保持時(shí)間一致性的同時(shí)處理長(zhǎng)達(dá)數(shù)小時(shí)的視頻內(nèi)容。

對(duì)于超長(zhǎng)上下文場(chǎng)景,團(tuán)隊(duì)又提出一個(gè)互補(bǔ)方案,分別針對(duì)不同的性能瓶頸。

  • KVCache太大,采用DuoAttention

注意力頭本身就有分工:少數(shù)負(fù)責(zé)「全局檢索」,多數(shù)只看「最近上下文」。

DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

  • 預(yù)填充(Prefill)太慢,采用XAttention

利用反對(duì)角線(xiàn)評(píng)分機(jī)制,僅識(shí)別、計(jì)算必要的注意力塊,從而實(shí)現(xiàn)顯著的加速效果。

論文的最后,并沒(méi)有止步于「優(yōu)化現(xiàn)有模型」,通過(guò)對(duì)MoBA(塊混合注意力) 的信噪比分析,作者證明了:

理論上,block越小越好。

但現(xiàn)實(shí)是,GPU不答應(yīng),于是有了FlashMoBA,一種定制化的CUDA內(nèi)核,使小塊架構(gòu)在實(shí)踐中可行,并實(shí)現(xiàn)了最高可達(dá)9倍的速度提升。

這篇論文的價(jià)值在于,構(gòu)建了一整套高效大模型的完整框架,既回應(yīng)了當(dāng)下的現(xiàn)實(shí)挑戰(zhàn),也為下一代計(jì)算高效、普惠可及的AGI奠定了基礎(chǔ)。

平均350萬(wàn)年薪,碾壓OpenAI

最后來(lái)到一個(gè)大家比較感興趣的話(huà)題——薪資。

去年,硅谷人才爭(zhēng)奪戰(zhàn)激烈,BI一篇獨(dú)家挖到了Thinking Machines(TML)給員工們開(kāi)出的薪資——

基礎(chǔ)年薪高達(dá)50萬(wàn)美元(約350萬(wàn)元)。


據(jù)BI獲取的招聘數(shù)據(jù),TML向兩名技術(shù)員工支付了45萬(wàn)美元的基礎(chǔ)年薪,另一名員工的年薪則高達(dá)50萬(wàn)美元。

第四名員工被列為「聯(lián)合創(chuàng)始人/機(jī)器學(xué)習(xí)專(zhuān)家」,其年薪同樣為45萬(wàn)美元。

這些薪酬數(shù)據(jù),來(lái)自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

總體來(lái)看,TML為這四名技術(shù)員工提供的平均年薪達(dá)到462,500美元。

相較之下,TML明顯高于業(yè)內(nèi)更為成熟LLM公司——

OpenAI在相關(guān)申報(bào)文件中列出的29名技術(shù)員工,平均年薪為292,115美元。

其中最高薪資為53萬(wàn)美元,最低為20萬(wàn)美元。

Anthropic向14名技術(shù)員工支付的平均年薪為387,500美元,薪資區(qū)間在30萬(wàn)至69萬(wàn)美元之間。

雖然比起Meta瘋狂的超1億美元薪酬還差得遠(yuǎn),但這一水平也在硅谷數(shù)一數(shù)二。

果然,21世紀(jì)最貴的還是人才。


參考資料:

https://x.com/Guangxuan_Xiao/status/2008779396497502337

https://guangxuanx.com/

https://scholar.google.com/citations?user=sRGO-EcAAAAJ

https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

文章來(lái)源:新智元。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
許世友晚年三次自殺,用毛巾勒脖子,拔掉靜脈插管,醫(yī)生:何苦啊

許世友晚年三次自殺,用毛巾勒脖子,拔掉靜脈插管,醫(yī)生:何苦啊

搜史君
2026-02-25 15:20:07
秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認(rèn)了,憑什么還要跪岳飛的母親?

秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認(rèn)了,憑什么還要跪岳飛的母親?

不八卦掌門(mén)人
2026-02-23 13:35:25
央媒對(duì)谷愛(ài)凌的稱(chēng)呼變了,七字之差釋放強(qiáng)烈信號(hào),鄧亞萍說(shuō)得太對(duì)

央媒對(duì)谷愛(ài)凌的稱(chēng)呼變了,七字之差釋放強(qiáng)烈信號(hào),鄧亞萍說(shuō)得太對(duì)

TVB的四小花
2026-02-25 07:32:05
吳石后人有點(diǎn)意思:明明父親是烈士,兒子吳韶成在河南卻格外低調(diào)

吳石后人有點(diǎn)意思:明明父親是烈士,兒子吳韶成在河南卻格外低調(diào)

冰雅憶史
2026-02-25 09:17:13
荷蘭沒(méi)回頭路了!中國(guó)子公司宣布:正式換國(guó)內(nèi)供應(yīng)商,不再合作!

荷蘭沒(méi)回頭路了!中國(guó)子公司宣布:正式換國(guó)內(nèi)供應(yīng)商,不再合作!

時(shí)尚的弄潮
2026-02-25 15:10:22
國(guó)防部重磅定調(diào),從臺(tái)軍到臺(tái)獨(dú)武裝,稱(chēng)謂之變藏統(tǒng)一加速信號(hào)

國(guó)防部重磅定調(diào),從臺(tái)軍到臺(tái)獨(dú)武裝,稱(chēng)謂之變藏統(tǒng)一加速信號(hào)

華山穹劍
2026-02-25 19:19:18
2026年公務(wù)員政審三代最新標(biāo)準(zhǔn)

2026年公務(wù)員政審三代最新標(biāo)準(zhǔn)

深度報(bào)
2026-02-22 22:51:50
前國(guó)腳高峰現(xiàn)狀:54歲很顯老,妻子也是運(yùn)動(dòng)員,二兒子和繼父更親

前國(guó)腳高峰現(xiàn)狀:54歲很顯老,妻子也是運(yùn)動(dòng)員,二兒子和繼父更親

以茶帶書(shū)
2026-02-25 19:52:54
18點(diǎn)05,CCTV直播!中國(guó)男籃vs日本 媒體人曝新消息 預(yù)測(cè)首發(fā)如下

18點(diǎn)05,CCTV直播!中國(guó)男籃vs日本 媒體人曝新消息 預(yù)測(cè)首發(fā)如下

大秦壁虎白話(huà)體育
2026-02-25 17:00:28
長(zhǎng)得太漂亮了,真正的珠圓玉潤(rùn),標(biāo)準(zhǔn)的東方美女!

長(zhǎng)得太漂亮了,真正的珠圓玉潤(rùn),標(biāo)準(zhǔn)的東方美女!

TVB的四小花
2026-02-25 15:16:05
漲停,17萬(wàn)手封單!A股第一名

漲停,17萬(wàn)手封單!A股第一名

新浪財(cái)經(jīng)
2026-02-25 16:56:34
民調(diào)飆升,點(diǎn)名蔣萬(wàn)安接替賴(lài)清德?只怕趕走臺(tái)獨(dú),又迎來(lái)更難纏的

民調(diào)飆升,點(diǎn)名蔣萬(wàn)安接替賴(lài)清德?只怕趕走臺(tái)獨(dú),又迎來(lái)更難纏的

不似少年游
2026-02-25 07:35:29
日元購(gòu)買(mǎi)力狂降,對(duì)人民幣急速貶值,中國(guó)游客不去經(jīng)濟(jì)還有希望嗎

日元購(gòu)買(mǎi)力狂降,對(duì)人民幣急速貶值,中國(guó)游客不去經(jīng)濟(jì)還有希望嗎

次元君情感
2026-02-25 19:21:48
孕婦深夜路邊直播求救,稱(chēng)羊水破了老公不管?民警搜尋近一小時(shí)發(fā)現(xiàn)其編造引流:已批評(píng)教育

孕婦深夜路邊直播求救,稱(chēng)羊水破了老公不管?民警搜尋近一小時(shí)發(fā)現(xiàn)其編造引流:已批評(píng)教育

極目新聞
2026-02-25 19:04:50
一年掉粉120萬(wàn)!頂流網(wǎng)紅瑤一瑤「被迫表演」炸上熱搜,網(wǎng)友吵翻

一年掉粉120萬(wàn)!頂流網(wǎng)紅瑤一瑤「被迫表演」炸上熱搜,網(wǎng)友吵翻

雷科技
2026-02-25 17:37:34
iPhone 18 Pro靈動(dòng)島縮小35%,將首發(fā)搭載基于臺(tái)積電2nm工藝制造的A20 Pro芯片

iPhone 18 Pro靈動(dòng)島縮小35%,將首發(fā)搭載基于臺(tái)積電2nm工藝制造的A20 Pro芯片

中國(guó)能源網(wǎng)
2026-02-24 12:01:06
上海海港官宣:安佩姆租借加盟

上海海港官宣:安佩姆租借加盟

五星體育
2026-02-25 16:57:41
訂單排到年底!亨通、永鼎、華工、烽火,誰(shuí)是光通信里最能漲的?

訂單排到年底!亨通、永鼎、華工、烽火,誰(shuí)是光通信里最能漲的?

Thurman在昆明
2026-02-25 04:45:03
爭(zhēng)議?楊瀚森紀(jì)念杯的中國(guó)地圖缺少臺(tái)灣海南地區(qū) 開(kāi)拓者已下架視頻

爭(zhēng)議?楊瀚森紀(jì)念杯的中國(guó)地圖缺少臺(tái)灣海南地區(qū) 開(kāi)拓者已下架視頻

風(fēng)過(guò)鄉(xiāng)
2026-02-25 19:51:50
馬筱梅分享兒子睜眼照!闊嘴大鼻好像媽媽?zhuān)m姐大方曬孫子沒(méi)拘束

馬筱梅分享兒子睜眼照!闊嘴大鼻好像媽媽?zhuān)m姐大方曬孫子沒(méi)拘束

樂(lè)悠悠娛樂(lè)
2026-02-25 15:07:24
2026-02-25 20:36:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5374文章數(shù) 64616關(guān)注度
往期回顧 全部

教育要聞

教育部:將嚴(yán)查擠占體育課 課間不準(zhǔn)學(xué)生出教室等行為

頭條要聞

新房被淹男子12年未交物業(yè)費(fèi) 春節(jié)前后家中停水超50天

頭條要聞

新房被淹男子12年未交物業(yè)費(fèi) 春節(jié)前后家中停水超50天

體育要聞

曝雄鹿計(jì)劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂(lè)要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

科技要聞

“機(jī)器人只跳舞,沒(méi)什么用”

汽車(chē)要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

游戲
教育
家居
手機(jī)
公開(kāi)課

《Reloadian》正式亮相Steam新品試玩節(jié)

教育要聞

教育部:學(xué)生每天體育2小時(shí)、課間15分鐘已在全國(guó)所有省份部署推開(kāi)

家居要聞

藝居辦公 溫度與效率

手機(jī)要聞

國(guó)產(chǎn)雙雄交卷了!華為Mate80銷(xiāo)量311萬(wàn)、小米17系列超350萬(wàn)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版