国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大廠搶郭達(dá)雅進(jìn)行時(shí)!DeepSeek核心成員還是個(gè)“綜藝巨佬”

0
分享至

DeepSeek,又有核心工程師流入江湖——

郭達(dá)雅,V2、V3、R1等一系列模型的核心作者,被曝離職。

這位被導(dǎo)師寄予厚望成為“中山大學(xué)雷軍”的技術(shù)天才,在學(xué)術(shù)與競(jìng)賽領(lǐng)域有著近乎傳奇的履歷。

他自述在入學(xué)博士后的第三天便完成了畢業(yè)所需的論文發(fā)表要求,展現(xiàn)出驚人的科研效率。

他還多次在騰訊廣告算法大賽中蟬聯(lián)冠軍,并在ATEC科技精英賽和微信大數(shù)據(jù)挑戰(zhàn)賽中斬獲頭籌。被調(diào)侃還沒畢業(yè)就有著百萬(wàn)獎(jiǎng)金。

而且新時(shí)代的工程師,甚至還出現(xiàn)過綜藝?yán)铩?/p>

在真人秀《燃燒吧!天才程序員》中,他作為僅有的兩名SSS級(jí)“巨佬”選手,在60小時(shí)的極限挑戰(zhàn)中展現(xiàn)了頂尖的編碼實(shí)力……

消息傳到外網(wǎng),也引發(fā)了很多網(wǎng)友的關(guān)注,有人表示,希望這不會(huì)給DeepSeek-V4帶來影響。


畢竟,郭達(dá)雅從博士畢業(yè)后入職DeepSeek開始,就參與了Coder、Math等專項(xiàng)模型,以及從V2、V3到R1的完整研發(fā)鏈條,還都是核心作者。

所以郭達(dá)雅,究竟是哪一種天才少年?

DeepSeek多款模型核心作者

郭達(dá)雅于2023年博士畢業(yè)后加入DeepSeek,專注代碼智能和大語(yǔ)言模型推理。

促使他加入DeepSeek的原因很簡(jiǎn)單:有一位師姐在DeepSeek工作,和他聊起公司追求AGI的愿景,這與他的價(jià)值觀比較吻合。

當(dāng)時(shí),我的一位師姐在 DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推動(dòng)人類社會(huì)的加速發(fā)展。這跟我的價(jià)值觀是相合的。 同時(shí),DeepSeek有比較多的資源投入研發(fā),領(lǐng)導(dǎo)層也希望打造一個(gè)有創(chuàng)新氛圍和自由的公司。我有這樣的熱情去做這件事,我也想追求這樣的工作環(huán)境。最終,我選擇加入了DeepSeek。

目前,郭達(dá)雅的個(gè)人主頁(yè)還沒有更新,仍然顯示為DeepSeek研究員。


DeepSeek的一系列模型,包括V2、V3和R1,還有Math、Coder、Prover和V2-Prover,郭達(dá)雅全都是核心貢獻(xiàn)者。


按時(shí)間順序梳理,第一條是2024年1月的代碼大模型DeepSeek-Coder。

這個(gè)項(xiàng)目推出了從1.3B到33B的一系列開源代碼模型,在多項(xiàng)基準(zhǔn)上做到了當(dāng)時(shí)的開源代碼模型SOTA。


第二項(xiàng)成果關(guān)于數(shù)學(xué)推理,也就是2024年2月的DeepSeek-Math。

它以DeepSeek-Coder-Base-v1.5 7B為基礎(chǔ),針對(duì)數(shù)學(xué)能力進(jìn)行了繼續(xù)訓(xùn)練,額外使用了120B數(shù)學(xué)相關(guān)token。

更關(guān)鍵的是,DeepSeek-Math的論文中提出了GRPO這個(gè)新型強(qiáng)化學(xué)習(xí)方法,后來成為了R1推理的關(guān)鍵。


緊接著是形式化證明,2024年5月,DeepSeek發(fā)布了DeepSeek-Prover。

這個(gè)項(xiàng)目面向Lean 4定理證明,核心方法是大規(guī)模合成formal proof數(shù)據(jù),并在此基礎(chǔ)上微調(diào)DeepSeek-Math 7B。

結(jié)果,模型在Lean 4 miniF2F上whole-proof generation準(zhǔn)確率達(dá)到 46.3%(64 samples),累計(jì)到52%,高于GPT-4的23.0%;在FIMO基準(zhǔn)上證明了148題中的5題,而GPT-4得分為0。

這項(xiàng)成果說明,DeepSeek的模型不只能完成一般數(shù)學(xué)推理,還延伸到了更硬核的形式化推理方向。


還有我們更熟悉的V2、V3和R1,在這個(gè)研發(fā)過程中,DeepSeek證明了不依賴人工標(biāo)注的推理軌跡,僅通過純強(qiáng)化學(xué)習(xí),也能把大模型的推理能力激發(fā)出來,并自然涌現(xiàn)出自反思、驗(yàn)證、動(dòng)態(tài)策略調(diào)整等行為模式。

DeepSeek-R1的相關(guān)論文,后來還登上了Nature封面,該論文披露,R1的訓(xùn)練成本僅約29.4萬(wàn)美元(折合人民幣約208萬(wàn))。


總之,任職期間,郭達(dá)雅并不只是參與單點(diǎn)項(xiàng)目,而是參與了貫穿DeepSeek一整段主線的研發(fā)過程。

而在這一系列的成功背后,有他從中學(xué)時(shí)期便已經(jīng)產(chǎn)生的對(duì)計(jì)算機(jī)、對(duì)編程的深厚興趣。

“希望他成為中山大學(xué)的雷軍”

郭達(dá)雅曾就讀于珠海一中,從中學(xué)時(shí)期便展現(xiàn)出對(duì)計(jì)算機(jī)科學(xué)的濃厚興趣。

在接受珠海一中的訪談時(shí),郭達(dá)雅表示,自己選擇計(jì)算機(jī)專業(yè)是興趣使然,并且這種興趣正是產(chǎn)生于中學(xué)期間。

興趣是我選擇計(jì)算機(jī)專業(yè)并取得如今成就的重要因素,而這一興趣的萌芽正源自珠海一中。 回想高中時(shí)光,學(xué)校豐富的實(shí)踐活動(dòng)和課程不僅拓寬了我的視野,也讓我在信息課上第一次接觸到計(jì)算機(jī)編程。 最初的我對(duì)編程一無所知,但很快便被其嚴(yán)謹(jǐn)?shù)倪壿嬓院蜔o限的創(chuàng)造力深深吸引。 通過編寫簡(jiǎn)單的代碼,我不僅感受到算法的精妙,還體會(huì)到數(shù)學(xué)在實(shí)際應(yīng)用中的強(qiáng)大作用。 這段經(jīng)歷讓我對(duì)計(jì)算機(jī)科學(xué)產(chǎn)生了濃厚興趣,也讓我在高考結(jié)束后毫不猶豫地選擇了計(jì)算機(jī)專業(yè)。

2014年,郭達(dá)雅被中山大學(xué)計(jì)算機(jī)學(xué)院錄取,隨后留在中大繼續(xù)直博深造。


來源:中山大學(xué)網(wǎng)站

大四時(shí),他入選中山大學(xué)與微軟亞洲研究院聯(lián)合培養(yǎng)博士生項(xiàng)目,師從印鑒教授和周明博士,研究方向是自然語(yǔ)言處理。周明則后來在大模型浪潮中,創(chuàng)辦了瀾舟科技。

京東探索研究院副院長(zhǎng)、階躍星辰Tech Fellow段楠的博士生導(dǎo)師也是周明,兩人算是師出同門。

而郭達(dá)雅在中山大學(xué)對(duì)他進(jìn)行的采訪中表示,自己在剛?cè)雽W(xué)的第三天,就完成了中大博士畢業(yè)的論文發(fā)表要求。

讀博期間,郭達(dá)雅的實(shí)習(xí)是在聯(lián)培單位MSRA完成的。

其間,郭達(dá)雅完成了CodeBert以及GraphCodeBert的研究,分別發(fā)表在EMNLP 2020 Findings和ICLR 2021上。

CodeBert開發(fā)了一個(gè)雙模態(tài)預(yù)訓(xùn)練模型,首次實(shí)現(xiàn)了自然語(yǔ)言(NL)和編程語(yǔ)言(PL)的雙模態(tài)預(yù)訓(xùn)練,填補(bǔ)了此前沒有模型能同時(shí)處理NL和PL混合輸入的空白。


而GraphCodeBert則在此基礎(chǔ)上,首次將代碼的數(shù)據(jù)流結(jié)構(gòu)納入預(yù)訓(xùn)練,讓模型對(duì)代碼的理解更深入。


畢業(yè)時(shí),郭達(dá)雅的博士論文《基于預(yù)訓(xùn)練的程序理解與生成》,獲評(píng)2023年中山大學(xué)優(yōu)秀博士學(xué)位論文。

這篇論文主要以程序理解與生成為研究課題,并針對(duì)該領(lǐng)域現(xiàn)有研究工作在數(shù)據(jù)與模型方面存在的問題,提出了基于代碼預(yù)訓(xùn)練的方法和模型,目的是利用人工智能技術(shù)提高軟件開發(fā)的效率。

從會(huì)議到博士論文,再到DeepSeek期間的工作,郭達(dá)雅的工作幾乎是一直圍繞著Coding展開,這也增加了曝料中他離職后負(fù)責(zé)Coding這一說法的可信度。

DeepSeek-V3發(fā)布后,他的導(dǎo)師印鑒教授,還特別寄語(yǔ),希望他能成為“中山大學(xué)的雷軍”。

截至目前,郭達(dá)雅已在NeurIPS、ACL、EMNLP等國(guó)際頂級(jí)AI會(huì)議發(fā)表論文十余篇,谷歌學(xué)術(shù)引用量超1300次。

此外,在數(shù)據(jù)挖掘競(jìng)賽方面,郭達(dá)雅也長(zhǎng)期活躍于一線賽場(chǎng):

2021、2022年,他連續(xù)兩年拿下螞蟻集團(tuán)主辦的ATEC科技精英賽冠軍;

2022年微信大數(shù)據(jù)挑戰(zhàn)賽,3200支隊(duì)伍同臺(tái)競(jìng)技,他帶隊(duì)奪冠,成功將30萬(wàn)大獎(jiǎng)收入囊中。


來源:中山大學(xué)網(wǎng)站

而郭達(dá)雅最具代表性的戰(zhàn)績(jī),是在騰訊廣告算法大賽中連續(xù)奪冠

作為DYG戰(zhàn)隊(duì)核心成員,他在2019年獲得冠軍,并于2020年實(shí)現(xiàn)衛(wèi)冕,利用BERT算法拿下50萬(wàn)元大獎(jiǎng);2021年又成功奪冠。

也算是騰訊廣告算法大賽名人堂選手了。

One More Thing

有意思的是,學(xué)術(shù)和競(jìng)賽全面開花的郭達(dá)雅,還有不太“科研”的一面——上綜藝。


在以程序員為主題的綜藝真人秀《燃燒吧!天才程序員》中,郭達(dá)雅和另外15名選手一起展開了60小時(shí)的代碼極限挑戰(zhàn)。

節(jié)目組把選手分成了S、SS、SSS三個(gè)級(jí)別,SSS級(jí)的“巨佬”只有2名,郭達(dá)雅就是其中之一。

郭達(dá)雅一出場(chǎng)便引人矚目,“巨佬來了”“神一樣的存在”。

不僅強(qiáng),而且頭發(fā)還挺茂密。

但現(xiàn)在,秦失其鹿,天下共逐之…

誰(shuí)又能得到郭達(dá)雅呢?

參考鏈接:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
[2]https://guoday.github.io/
[3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
[4]https://sai.sysu.edu.cn/node/545

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新代言人火爆全球,以色列慌了

新代言人火爆全球,以色列慌了

俠客棧
2026-04-18 13:14:53
每體:據(jù)相關(guān)人士透露,梅西收購(gòu)科爾內(nèi)利亞大約花費(fèi)200萬(wàn)歐

每體:據(jù)相關(guān)人士透露,梅西收購(gòu)科爾內(nèi)利亞大約花費(fèi)200萬(wàn)歐

懂球帝
2026-04-19 15:11:13
特朗普稱自己是“和平締造者”:算上伊朗和黎巴嫩,我平息了十場(chǎng)戰(zhàn)爭(zhēng)

特朗普稱自己是“和平締造者”:算上伊朗和黎巴嫩,我平息了十場(chǎng)戰(zhàn)爭(zhēng)

瀟湘晨報(bào)
2026-04-19 10:34:10
為啥淘寶,拼多多幾塊錢的東西還能包郵?看完你就明白了!

為啥淘寶,拼多多幾塊錢的東西還能包郵?看完你就明白了!

呼呼歷史論
2026-04-10 21:17:24
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

小哥很OK
2025-12-12 14:33:01
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
幾乎都是假貨!利潤(rùn)高達(dá)2400%,可為何消費(fèi)者還爭(zhēng)相購(gòu)買?

幾乎都是假貨!利潤(rùn)高達(dá)2400%,可為何消費(fèi)者還爭(zhēng)相購(gòu)買?

小熊侃史
2026-04-09 09:36:50
何潤(rùn)東“西楚霸王項(xiàng)羽”造型亮相沒騎馬引熱議,本人回應(yīng)

何潤(rùn)東“西楚霸王項(xiàng)羽”造型亮相沒騎馬引熱議,本人回應(yīng)

韓小娛
2026-04-19 08:56:44
回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風(fēng)韻猶存

回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風(fēng)韻猶存

胡一舸南游y
2026-04-04 15:41:43
突發(fā):無線電沉默、作戰(zhàn)部隊(duì)部署表明美國(guó)將發(fā)動(dòng)軍事行動(dòng)

突發(fā):無線電沉默、作戰(zhàn)部隊(duì)部署表明美國(guó)將發(fā)動(dòng)軍事行動(dòng)

深度報(bào)
2026-04-19 21:50:51
蔣介石曾孫蔣友松發(fā)聲,要求兩蔣懸棺必須遷移,這次真要?dú)w鄉(xiāng)?

蔣介石曾孫蔣友松發(fā)聲,要求兩蔣懸棺必須遷移,這次真要?dú)w鄉(xiāng)?

鑒史錄
2026-04-18 18:08:29
心源性猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧可打打牌,建議別做這7事

心源性猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧可打打牌,建議別做這7事

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-03-29 23:50:13
【意甲】萊昂妙傳拉比奧建功 米蘭1比0小勝結(jié)束連敗

【意甲】萊昂妙傳拉比奧建功 米蘭1比0小勝結(jié)束連敗

體壇周報(bào)
2026-04-20 00:00:16
鎖定降級(jí)!海牛剛看到一絲希望,就收到國(guó)際足聯(lián)處罰,保級(jí)懸了

鎖定降級(jí)!海牛剛看到一絲希望,就收到國(guó)際足聯(lián)處罰,保級(jí)懸了

體壇風(fēng)之子
2026-04-19 17:43:12
日本爆冷奪冠!朝鮮U20女足全場(chǎng)0進(jìn)球,球員賽后黑臉拒絕握手

日本爆冷奪冠!朝鮮U20女足全場(chǎng)0進(jìn)球,球員賽后黑臉拒絕握手

談史論天地
2026-04-19 13:52:15
第一,張雪機(jī)車WSBK荷蘭站第二回合熱身賽成績(jī)出爐

第一,張雪機(jī)車WSBK荷蘭站第二回合熱身賽成績(jī)出爐

貝殼財(cái)經(jīng)
2026-04-19 17:56:03
4.5億司機(jī)注意!6月1日最嚴(yán)新規(guī)實(shí)施,公安部:專盯狀態(tài)別大意

4.5億司機(jī)注意!6月1日最嚴(yán)新規(guī)實(shí)施,公安部:專盯狀態(tài)別大意

復(fù)轉(zhuǎn)這些年
2026-04-19 22:51:10
和黃圣依離婚后,楊子去娘家接娃,14歲安迪駝背自卑,9歲弟弟帥

和黃圣依離婚后,楊子去娘家接娃,14歲安迪駝背自卑,9歲弟弟帥

椰黃娛樂
2026-04-19 12:34:43
麥金:被追成3-3無法接受;我們要全力沖擊前五和打歐聯(lián)杯

麥金:被追成3-3無法接受;我們要全力沖擊前五和打歐聯(lián)杯

懂球帝
2026-04-19 23:28:59
醫(yī)生發(fā)現(xiàn):吃一根香菜,就等于喝了一杯降糖茶,真的假的?

醫(yī)生發(fā)現(xiàn):吃一根香菜,就等于喝了一杯降糖茶,真的假的?

清歡百味
2026-04-19 17:38:59
2026-04-20 01:40:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5482文章數(shù) 64624關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

手機(jī)
藝術(shù)
家居
旅游
房產(chǎn)

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

藝術(shù)要聞

超模施特洛耶克寫真曝光,簡(jiǎn)直美到窒息,別錯(cuò)過!

家居要聞

法式線條 時(shí)光靜淌

旅游要聞

北京投入2.2億元建成和田“三館一院”

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘?,突然殺入神秘房企!

無障礙瀏覽 進(jìn)入關(guān)懷版