国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MIT天才博士剛畢業(yè),就被前OpenAI CTO搶走!年薪或300萬(wàn)起步

0
分享至

  

  新智元報(bào)道

  編輯:桃子

  【新智元導(dǎo)讀】MIT天才博士,清華學(xué)霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預(yù)訓(xùn)練。

  MIT天才博士一畢業(yè),火速加盟OpenAI前CTO初創(chuàng)!

  最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學(xué)位。

  下一步,他將加入Thinking Machines,專注于大模型預(yù)訓(xùn)練的工作。

  

  評(píng)論區(qū)下方,英偉達(dá)科學(xué)家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。

  

  

  清華雙學(xué)位學(xué)霸,MIT博士開掛人生

  打開他的個(gè)人主頁(yè),多元而充實(shí)的經(jīng)歷便映入眼簾。

  肖光烜本科畢業(yè)于清華大學(xué),拿到了雙學(xué)位,主修的是計(jì)算機(jī)科學(xué),金融學(xué)是第二學(xué)位。

  

  在此期間,他獲得了清華大學(xué)綜合優(yōu)秀獎(jiǎng)學(xué)金(2019)、全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(CUMCM)一等獎(jiǎng)(2020)、國(guó)家獎(jiǎng)學(xué)金(2020)、清華大學(xué)「未來(lái)學(xué)者」獎(jiǎng)學(xué)金(2021)等多項(xiàng)獎(jiǎng)項(xiàng)。

  他曾于2020–2021年作為訪問(wèn)生(Visiting Student),前往斯坦福大學(xué)計(jì)算機(jī)系開展科研工作。

  2022年,肖光烜加入MIT攻讀博士學(xué)位,導(dǎo)師為韓松(Song Han)教授。

  個(gè)人研究方向聚焦于:深度學(xué)習(xí)的高效算法與系統(tǒng),尤其是大規(guī)?;A(chǔ)模型(Foundation Model)。

  

  他于2022年9月至2026年1月,在MIT EECS擔(dān)任全職研究助理(Research Assistant)。

  讀博期間,肖光烜曾多次進(jìn)入全球頂級(jí)科技大廠從事前沿研究實(shí)習(xí),具備了豐富的一線工業(yè)研發(fā)的經(jīng)驗(yàn)。

  2023年,他曾加入Meta實(shí)習(xí),研究方向?yàn)椤噶魇秸Z(yǔ)言模型的高效注意力機(jī)制」,相關(guān)成果發(fā)表在arxiv上。

  

  論文地址:https://arxiv.org/pdf/2309.17453

  2024年2-5月期間,他作為英偉達(dá)實(shí)習(xí)生,研究方向是為長(zhǎng)上下文大語(yǔ)言模型推理加速。

  他和團(tuán)隊(duì)提出了DuoAttention,結(jié)合檢索與流式注意力頭,實(shí)現(xiàn)高效推理。

  

  論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

  隨后,他又參與了多項(xiàng)核心研究項(xiàng)目,其中包括:

  XAttention:基于反對(duì)角評(píng)分的塊稀疏注意力機(jī)制

  StreamingVLM:面向無(wú)限視頻流的實(shí)時(shí)理解模型

  FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優(yōu)化

  值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

  他曾擔(dān)任所在院系足球隊(duì)的隊(duì)長(zhǎng)兼先鋒,貝多芬的作品是個(gè)人最愛。

  

  一篇博士論文,破解LLM三大難題

  比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。

  

  不得不承認(rèn),如今大模型已經(jīng)無(wú)所不能,但它們依然太貴了。

  顯存爆炸、推理太慢、長(zhǎng)上下文直接OOM(內(nèi)存溢出),這是幾乎所有LLM工程團(tuán)隊(duì)每天都在面對(duì)的現(xiàn)實(shí)。

  Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個(gè)罕見的、從工程到理論、從算法到架構(gòu)的完整答案。

  論文中, 他們提出了SmoothQuant,解決了一個(gè)長(zhǎng)期困擾工業(yè)界的問(wèn)題——激活值異常(activation outliers)。

  SmoothQuant通過(guò)一個(gè)巧妙的數(shù)學(xué)等價(jià)變換,把量化難點(diǎn)從「激活」轉(zhuǎn)移到「權(quán)重」。

  結(jié)果,它實(shí)現(xiàn)了首個(gè)在十億級(jí)模型上W8A8無(wú)損量化,無(wú)需重新訓(xùn)練,顯存更小、推理更快。

  針對(duì)超長(zhǎng)序列的處理,作者在StreamingLLM中發(fā)現(xiàn)了「注意力匯點(diǎn)」(attention sink)現(xiàn)象——

  即使沒(méi)有任何語(yǔ)義,初始token會(huì)被后續(xù)token持續(xù)關(guān)注。這些token的作用不是「理解」,而是數(shù)值穩(wěn)定。

  結(jié)果,實(shí)現(xiàn)了常數(shù)內(nèi)存的流式推理,模型上下文長(zhǎng)度從數(shù)千token擴(kuò)展到百萬(wàn)級(jí)。

  更進(jìn)一步,他們又把這一思想推廣到多模態(tài),StreamingVLM可以在保持時(shí)間一致性的同時(shí)處理長(zhǎng)達(dá)數(shù)小時(shí)的視頻內(nèi)容。

  對(duì)于超長(zhǎng)上下文場(chǎng)景,團(tuán)隊(duì)又提出一個(gè)互補(bǔ)方案,分別針對(duì)不同的性能瓶頸。

  KVCache太大,采用DuoAttention

  注意力頭本身就有分工:少數(shù)負(fù)責(zé)「全局檢索」,多數(shù)只看「最近上下文」。

  DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

  預(yù)填充(Prefill)太慢,采用XAttention

  利用反對(duì)角線評(píng)分機(jī)制,僅識(shí)別、計(jì)算必要的注意力塊,從而實(shí)現(xiàn)顯著的加速效果。

  論文的最后,并沒(méi)有止步于「優(yōu)化現(xiàn)有模型」,通過(guò)對(duì)MoBA(塊混合注意力) 的信噪比分析,作者證明了:

  理論上,block越小越好。

  但現(xiàn)實(shí)是,GPU不答應(yīng),于是有了FlashMoBA,一種定制化的CUDA內(nèi)核,使小塊架構(gòu)在實(shí)踐中可行,并實(shí)現(xiàn)了最高可達(dá)9倍的速度提升。

  這篇論文的價(jià)值在于,構(gòu)建了一整套高效大模型的完整框架,既回應(yīng)了當(dāng)下的現(xiàn)實(shí)挑戰(zhàn),也為下一代計(jì)算高效、普惠可及的AGI奠定了基礎(chǔ)。

  平均350萬(wàn)年薪,碾壓OpenAI

  最后來(lái)到一個(gè)大家比較感興趣的話題——薪資。

  去年,硅谷人才爭(zhēng)奪戰(zhàn)激烈,BI一篇獨(dú)家挖到了Thinking Machines(TML)給員工們開出的薪資——

  基礎(chǔ)年薪高達(dá)50萬(wàn)美元(約350萬(wàn)元)。

  

  據(jù)BI獲取的招聘數(shù)據(jù),TML向兩名技術(shù)員工支付了45萬(wàn)美元的基礎(chǔ)年薪,另一名員工的年薪則高達(dá)50萬(wàn)美元。

  第四名員工被列為「聯(lián)合創(chuàng)始人/機(jī)器學(xué)習(xí)專家」,其年薪同樣為45萬(wàn)美元。

  這些薪酬數(shù)據(jù),來(lái)自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

  總體來(lái)看,TML為這四名技術(shù)員工提供的平均年薪達(dá)到462,500美元。

  相較之下,TML明顯高于業(yè)內(nèi)更為成熟LLM公司——

  OpenAI在相關(guān)申報(bào)文件中列出的29名技術(shù)員工,平均年薪為292,115美元。

  其中最高薪資為53萬(wàn)美元,最低為20萬(wàn)美元。

  Anthropic向14名技術(shù)員工支付的平均年薪為387,500美元,薪資區(qū)間在30萬(wàn)至69萬(wàn)美元之間。

  雖然比起Meta瘋狂的超1萬(wàn)億美元薪酬還差得遠(yuǎn),但這一水平也在硅谷數(shù)一數(shù)二。

  果然,21世紀(jì)最貴的還是人才。

  

  參考資料:

  https://x.com/Guangxuan_Xiao/status/2008779396497502337

  https://guangxuanx.com/

  https://scholar.google.com/citations?user=sRGO-EcAAAAJ

  https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

  https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
燕麥立大功!研究發(fā)現(xiàn):早餐常吃燕麥的人,不用太久,或有5好處

燕麥立大功!研究發(fā)現(xiàn):早餐常吃燕麥的人,不用太久,或有5好處

小胡軍事愛好
2025-11-28 09:45:23
震撼!曾精確預(yù)言911的盲眼神婆預(yù)測(cè)今年8大事件,有一條暗指中國(guó)

震撼!曾精確預(yù)言911的盲眼神婆預(yù)測(cè)今年8大事件,有一條暗指中國(guó)

刀刃故事
2024-11-22 01:55:03
特朗普:伊朗提議進(jìn)行談判

特朗普:伊朗提議進(jìn)行談判

一種觀點(diǎn)
2026-01-12 19:34:26
AI應(yīng)用爆了,002131,超300萬(wàn)手封漲停!谷歌出手,AI購(gòu)物迎來(lái)重磅利好,機(jī)構(gòu)扎堆盯上7只概念股

AI應(yīng)用爆了,002131,超300萬(wàn)手封漲停!谷歌出手,AI購(gòu)物迎來(lái)重磅利好,機(jī)構(gòu)扎堆盯上7只概念股

數(shù)據(jù)寶
2026-01-12 12:36:09
C羅再度斬獲大獎(jiǎng) 但卻遭到了網(wǎng)友的嘲諷:笑話獎(jiǎng)!C羅不應(yīng)獲獎(jiǎng)嗎

C羅再度斬獲大獎(jiǎng) 但卻遭到了網(wǎng)友的嘲諷:笑話獎(jiǎng)!C羅不應(yīng)獲獎(jiǎng)嗎

體壇八點(diǎn)半的那些事兒
2026-01-12 18:50:04
印度衛(wèi)星發(fā)射任務(wù)失敗

印度衛(wèi)星發(fā)射任務(wù)失敗

上觀新聞
2026-01-12 14:29:03
難以置信!閆學(xué)晶賬號(hào)剛禁封,又驚現(xiàn)閆學(xué)晶小號(hào),直言“能咋地”

難以置信!閆學(xué)晶賬號(hào)剛禁封,又驚現(xiàn)閆學(xué)晶小號(hào),直言“能咋地”

火山詩(shī)話
2026-01-11 10:45:26
莫言:動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

莫言:動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

詩(shī)詞中國(guó)
2026-01-12 19:48:56
乒乓球女單最新排名出爐!孫穎莎第1,陳幸同超越蒯曼,朱雨玲第5

乒乓球女單最新排名出爐!孫穎莎第1,陳幸同超越蒯曼,朱雨玲第5

齊帥
2026-01-12 16:12:15
中方廣發(fā)邀請(qǐng)?zhí)?,多?guó)積極派兵,1國(guó)拒絕派兵,金磚內(nèi)部冒出刺頭

中方廣發(fā)邀請(qǐng)?zhí)?,多?guó)積極派兵,1國(guó)拒絕派兵,金磚內(nèi)部冒出刺頭

時(shí)時(shí)有聊
2026-01-11 19:26:09
對(duì) “臺(tái)獨(dú)劊子手”陳舒怡,必須抓捕歸案以平民憤、告忠魂!

對(duì) “臺(tái)獨(dú)劊子手”陳舒怡,必須抓捕歸案以平民憤、告忠魂!

達(dá)文西看世界
2026-01-12 14:14:16
特朗普取打擊伊朗匯報(bào),美國(guó)對(duì)伊朗的打擊可能隨時(shí)開始

特朗普取打擊伊朗匯報(bào),美國(guó)對(duì)伊朗的打擊可能隨時(shí)開始

邵旭峰域
2026-01-12 17:57:06
爭(zhēng)議!烏克蘭名將0-2不敵薩巴倫卡 拒絕握手:我的國(guó)家正承受災(zāi)難

爭(zhēng)議!烏克蘭名將0-2不敵薩巴倫卡 拒絕握手:我的國(guó)家正承受災(zāi)難

風(fēng)過(guò)鄉(xiāng)
2026-01-11 21:45:41
你知道女性的陰道有多長(zhǎng)嗎?或許與你所想,完全不同!

你知道女性的陰道有多長(zhǎng)嗎?或許與你所想,完全不同!

戰(zhàn)爭(zhēng)茶館
2025-11-26 10:33:50
小波特轉(zhuǎn)會(huì)勇士!星空體育爆料三方交易內(nèi)幕!

小波特轉(zhuǎn)會(huì)勇士!星空體育爆料三方交易內(nèi)幕!

小椰的影視寶庫(kù)
2026-01-12 14:41:25
A股:從今天起,歷史或?qū)Ⅲ@人相似!4500點(diǎn)大級(jí)別主升浪要來(lái)了嗎?

A股:從今天起,歷史或?qū)Ⅲ@人相似!4500點(diǎn)大級(jí)別主升浪要來(lái)了嗎?

股市皆大事
2026-01-12 09:10:15
國(guó)籍爭(zhēng)議不到1年,人民日?qǐng)?bào)公開點(diǎn)名谷愛凌,鄧亞萍的話有人信了

國(guó)籍爭(zhēng)議不到1年,人民日?qǐng)?bào)公開點(diǎn)名谷愛凌,鄧亞萍的話有人信了

閱微札記
2025-12-22 14:28:33
中國(guó)是如何擁有殲20的?美國(guó)五角大樓:中國(guó)瞞了全世界!

中國(guó)是如何擁有殲20的?美國(guó)五角大樓:中國(guó)瞞了全世界!

聞識(shí)
2025-12-28 22:02:30
外交部:目前沒(méi)有得到有中國(guó)公民在伊朗傷亡的報(bào)告

外交部:目前沒(méi)有得到有中國(guó)公民在伊朗傷亡的報(bào)告

環(huán)球網(wǎng)資訊
2026-01-12 16:04:42
電影《我不是藥神》原型陸勇時(shí)隔五年重返印度,確診白血病23年后計(jì)劃今年停止服藥,他去年又開設(shè)新公司

電影《我不是藥神》原型陸勇時(shí)隔五年重返印度,確診白血病23年后計(jì)劃今年停止服藥,他去年又開設(shè)新公司

極目新聞
2026-01-10 17:00:13
2026-01-12 20:15:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14319文章數(shù) 66454關(guān)注度
往期回顧 全部

教育要聞

新華視評(píng)搞錯(cuò)了,不是學(xué)校責(zé)任轉(zhuǎn)嫁家長(zhǎng),而是家長(zhǎng)責(zé)任轉(zhuǎn)嫁學(xué)校

頭條要聞

特朗普:伊朗談判前美或先行動(dòng) 正考慮"非常強(qiáng)硬選項(xiàng)"

頭條要聞

特朗普:伊朗談判前美或先行動(dòng) 正考慮"非常強(qiáng)硬選項(xiàng)"

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

教育
數(shù)碼
旅游
游戲
時(shí)尚

教育要聞

【資訊】第12場(chǎng)課堂教學(xué)數(shù)字化評(píng)價(jià)項(xiàng)目教研活動(dòng)在河源舉辦

數(shù)碼要聞

CES2026黑馬出圈:Baseus倍思全場(chǎng)景智能產(chǎn)品狂攬國(guó)際權(quán)威獎(jiǎng)項(xiàng)

旅游要聞

吉鏡頭|冰雕祈年殿 “刷屏” 長(zhǎng)春!文化廣場(chǎng)成全國(guó)游客打卡地

法系DH太帥了!魔獸12.0惡魔獵手重做曝光,噬滅成新版本必玩專精

伊姐周日熱推:電視劇《御賜小仵作2》;電視劇《偶像瘋子》......

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版