国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

起底 GPT Image 2 團(tuán)隊(duì)后,我扒出了一張華人師徒網(wǎng)

0
分享至

GPT Image 2 正式上線后,AI 圖像生成領(lǐng)域現(xiàn)在只剩兩個(gè)段位:GPT Image 2,以及其它。

在大模型競技場中,GPT Image 2 以 241 分的絕對優(yōu)勢遙遙領(lǐng)先,但比起跑分,這份研發(fā)名單其實(shí)更有看頭。


搞出這個(gè)模型的 OpenAI 核心團(tuán)隊(duì),滿打滿算只有 13 個(gè)人。


并且華人還占據(jù)了團(tuán)隊(duì)的半壁江山。仔細(xì)看他們的履歷,你會發(fā)現(xiàn)不少人來 OpenAI 之前,就已經(jīng)在中國某所大學(xué)、某個(gè)實(shí)驗(yàn)室甚至科研夏令營里打過照面了。

AI 圈就是個(gè)巨大的熟人局。

1

流水的硅谷大廠,鐵打的師徒局

陳博遠(yuǎn)是 GPT Image 2 的絕對核心成員,而他的成長卻是華人學(xué)術(shù)「傳幫帶」的縮影。

高中時(shí),陳博遠(yuǎn)在無錫參加科研夏令營,當(dāng)時(shí)他未學(xué)過編程,在此認(rèn)識了后來成為 Google DeepMind 資深研究員的華人學(xué)者夏斐。夏斐向他介紹深度學(xué)習(xí),成為他進(jìn)入 AI 領(lǐng)域的引路人。


兩人此后一直保持聯(lián)系。本科階段,陳博遠(yuǎn)就讀于 UC Berkeley 計(jì)算機(jī)科學(xué)與數(shù)學(xué)專業(yè),進(jìn)入 EECS 榮譽(yù)班,GPA 達(dá) 3.96,師從 Pieter Abbeel 從事相關(guān)研究,還于 2017 年創(chuàng)辦機(jī)器人教育公司,經(jīng)營至 2020 年。


MIT 讀博第一年,陳博遠(yuǎn)因無論文產(chǎn)出陷入困境,夏斐提供關(guān)鍵支持,協(xié)助他發(fā)表第一篇有影響力的論文 NLMap。夏斐還兩次邀請他到 DeepMind 實(shí)習(xí),2023 年實(shí)習(xí)期間,他主導(dǎo)搭建多模態(tài)大語言模型數(shù)據(jù)合成管線,其總結(jié)的指令微調(diào)技術(shù)被用于 Gemini 2.0 研發(fā)。


https://www.boyuan.space/

帶著這些積累,陳博遠(yuǎn)在 2025 年 6 月加入 OpenAI。除此之外,他還是 Sora 視頻生成團(tuán)隊(duì)的成員,身兼數(shù)職。


在 MIT 期間,陳博遠(yuǎn)師從助理教授 Vincent Sitzmann,在計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)做世界模型方向的研究。而 Kiwhan Song,就是同一個(gè)實(shí)驗(yàn)室里、同一個(gè)導(dǎo)師帶出來的同門師兄弟。


https://kiwhan.dev/

Sitzmann 實(shí)驗(yàn)室的核心研究方向是「世界模型」,簡單說就是讓 AI 通過心理模擬器預(yù)判物理世界的變化,而不只是單純模仿像素。這種研究思路,或許也直接影響了 GPT Image 2 的技術(shù)方向。

兩人在博士期間多次合作,聯(lián)合發(fā)表了《History-Guided Video Diffusion》和《Large Video Planner》兩篇論文,主要探索如何把擴(kuò)散模型和序列生成結(jié)合起來,讓模型在生成內(nèi)容之前,先理清時(shí)序和空間上的因果邏輯。


https://arxiv.org/abs/2502.06764

值得一提的是,Kiwhan Song 正是「長脖子」貼紙風(fēng)格漫畫頭像的創(chuàng)作者。


除了這兩位同門,團(tuán)隊(duì)里還有兩位華人成員,他們來自工業(yè)界積累多年的華人研究員網(wǎng)絡(luò)。

Jianfeng Wang 在微軟工作了近 9 年,以首席研究員的身份專注于大規(guī)模多模態(tài)表示學(xué)習(xí),在 DALL-E 3 研發(fā)期間,就和 OpenAI 團(tuán)隊(duì)有過深入合作。加入 OpenAI 后,他主要負(fù)責(zé)提升模型的指令遵循能力和對世界知識的理解。


https://scholar.google.com/citations?user=vJWEw\_8AAAAJ&hl=en

Bing Liang 則在谷歌深耕了 5 年多,以高級軟件工程師的身份參與了 Imagen 3、Veo 視頻模型和 Gemini 多模態(tài)系列的核心研發(fā)工作,去年 8 月加入 OpenAI,負(fù)責(zé)圖像生成相關(guān)的研究。


https://www.linkedin.com/in/bing-liang/

他們帶來的不只是自己的個(gè)人能力,還有競爭對手多年積累的工程經(jīng)驗(yàn),以及曾經(jīng)踩過的坑,為團(tuán)隊(duì)省去了不少彎路。

1

給天才們搭好戲臺子

Weixin Liang 和 Yuguang Yang 是團(tuán)隊(duì)里另一個(gè)值得關(guān)注的組合,兩人都畢業(yè)于浙江大學(xué)竺可楨學(xué)院,有著相同的本科背景。

Yuguang Yang 的履歷跨度很大。本科時(shí)在竺可楨學(xué)院學(xué)工程,博士階段則去了約翰斯·霍普金斯大學(xué),攻讀計(jì)算化學(xué)物理與機(jī)器學(xué)習(xí)專業(yè),拿到學(xué)位后,先后在亞馬遜 Alexa 做語音識別方向的深度學(xué)習(xí)研究,之后又去了微軟 Bing,負(fù)責(zé)查詢理解與大規(guī)模檢索相關(guān)工作。


他還曾在清華大學(xué)做過訪問研究,研究方向是用于納米機(jī)器人在人體血管中導(dǎo)航的強(qiáng)化學(xué)習(xí)算法,期間發(fā)表了 7 篇同行評審的期刊論文。這種跨學(xué)科的積累,在 GPT Image 2 的發(fā)布演示中也能直接看到。


和 Yuguang Yang 相比,Weixin Liang 的成長路徑更偏向?qū)W術(shù)。他在斯坦福 AI 實(shí)驗(yàn)室(SAIL)攻讀博士,期間和 Christopher Manning、Li Fei-Fei、James Zou 等多位知名教授都有過合作。


https://ai.stanford.edu/~wxliang/

在 Meta 實(shí)習(xí)期間,他發(fā)表了論文《Mixture-of-Transformers(MoT)》,通過引入模態(tài)解耦的混合專家模型架構(gòu),對 Transformer 的每一個(gè)非嵌入?yún)?shù),包括前饋網(wǎng)絡(luò)、注意力矩陣和層歸一化,都實(shí)施了模態(tài)感知的稀疏化處理,最終將多模態(tài)預(yù)訓(xùn)練的計(jì)算成本降低了 66%,還在 30B 參數(shù)規(guī)模下完成了預(yù)訓(xùn)練驗(yàn)證。

多模態(tài)模型因?yàn)橐瑫r(shí)處理文本和高分辨率圖像,計(jì)算量很容易呈指數(shù)級增長,而 MoT 憑借模態(tài)解耦的注意力機(jī)制,在預(yù)訓(xùn)練階段就高效分配了不同模態(tài)之間的權(quán)重,很好地解決了這個(gè)問題。這項(xiàng)研究后來也被稱為「推動(dòng)多模態(tài)理解與生成統(tǒng)一的奠基性貢獻(xiàn)」,在多模態(tài)建模領(lǐng)域引發(fā)了大量關(guān)注。


https://arxiv.org/abs/2411.04996

近年來,清華姚班、浙大竺可楨學(xué)院、中科大學(xué)少年班、上海交大等學(xué)校的畢業(yè)生,已成為 OpenAI、Anthropic、DeepMind、Meta 等海外 AI 實(shí)驗(yàn)室的核心力量。

除了上述成員,團(tuán)隊(duì)還有幾位核心研究者,各自發(fā)揮重要作用:

Kenji Hata:斯坦福計(jì)算機(jī)科學(xué)碩士,曾任職于 Google Research。加入 OpenAI 后,參與 4o 圖像生成(即 GPT-Image-1)、Sora 2 等多款模型研發(fā),是團(tuán)隊(duì)中模型迭代經(jīng)歷最完整的成員之一。

Ayaan Haque:加入 OpenAI 前為 Luma AI 研究員,參與訓(xùn)練視頻生成模型 Dream Machine。這段經(jīng)歷讓他具備處理高維時(shí)序數(shù)據(jù)的能力,在 OpenAI 主要負(fù)責(zé) GPT Image 2 及思考模式研發(fā)。

Dibya Bhattacharjee:耶魯計(jì)算機(jī)科學(xué)本碩,曾在谷歌深耕近 5 年。2024 年 2 月加入 OpenAI 負(fù)責(zé)圖像生成研究,在發(fā)布活動(dòng)中演示模型多規(guī)格生成能力,是模型輸出格式「開箱即用」的關(guān)鍵成員。

Mengchao Z.:上海交大本科、德克薩斯 A&M 大學(xué)碩士,工程背景扎實(shí)。加入 OpenAI 前主導(dǎo)大規(guī)模推薦系統(tǒng)架構(gòu)設(shè)計(jì),目前負(fù)責(zé)將模型技術(shù)能力轉(zhuǎn)化為可用產(chǎn)品形態(tài)。

此外,團(tuán)隊(duì)里還有多名成員的身份信息目前暫時(shí)無法查詢。


師門脈絡(luò)積累了研究品味,高校背景奠定了基礎(chǔ)認(rèn)知,這種由師門、同窗、前同事織就的人才網(wǎng)絡(luò),天然形成了一種極高密度的信任——由于價(jià)值觀和工程語言的高度統(tǒng)一,創(chuàng)新的磨合成本幾乎為零。

如果只是重金挖走一兩個(gè)陳博遠(yuǎn),其實(shí)治標(biāo)不治本。找不到同伴,也就很難復(fù)現(xiàn)這種自然涌現(xiàn)的創(chuàng)新。大廠的組織結(jié)構(gòu)決定了層級和目標(biāo)明確對商業(yè)化有利,但對于需要自由探索的基礎(chǔ)研究,往往形成了某種約束。

AI 的競爭,歸根結(jié)底是關(guān)于「人」的故事,比起尋找下一個(gè)陳博遠(yuǎn),我們更需要搭建一個(gè)讓陳博遠(yuǎn)們能在本土自然相遇、互相成就的生態(tài)。

文章轉(zhuǎn)載于APPSO,歡迎點(diǎn)擊下方卡片關(guān)注。

點(diǎn)個(gè)愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
上映多時(shí)票房只有零元,一個(gè)觀眾都沒有,五一檔最慘電影誕生了

上映多時(shí)票房只有零元,一個(gè)觀眾都沒有,五一檔最慘電影誕生了

影視高原說
2026-05-01 08:47:30
打服了對手!塞爾比瓦菲、艾倫齊夸贊吳宜澤,他會是斯諾克新冠軍

打服了對手!塞爾比瓦菲、艾倫齊夸贊吳宜澤,他會是斯諾克新冠軍

里芃芃體育
2026-05-03 11:15:13
希金斯:墨菲這屆世錦賽就像神一樣,意志力比拼里我關(guān)鍵黑球手軟

希金斯:墨菲這屆世錦賽就像神一樣,意志力比拼里我關(guān)鍵黑球手軟

楊華評論
2026-05-03 02:48:59
蜜月回家發(fā)現(xiàn)婚房被丈母娘一家十口霸占,我笑著離開并決定離婚

蜜月回家發(fā)現(xiàn)婚房被丈母娘一家十口霸占,我笑著離開并決定離婚

曉艾故事匯
2026-04-05 16:11:46
摩根大通女高管被控性侵已婚印度裔男下屬,女方否認(rèn),公司調(diào)查稱并無證據(jù)

摩根大通女高管被控性侵已婚印度裔男下屬,女方否認(rèn),公司調(diào)查稱并無證據(jù)

紅星新聞
2026-05-02 16:01:48
女子找到工作月薪12000,僅面試一次老板就同意,入職兩天沒人理

女子找到工作月薪12000,僅面試一次老板就同意,入職兩天沒人理

丫頭舫
2026-05-01 22:17:59
網(wǎng)絡(luò)瘋傳賴清德妻子在美國購買億元豪宅,賴辦回應(yīng)了

網(wǎng)絡(luò)瘋傳賴清德妻子在美國購買億元豪宅,賴辦回應(yīng)了

海峽導(dǎo)報(bào)社
2026-05-02 10:52:21
倫敦世乒賽最新戰(zhàn)報(bào):國乒2連勝!張本智和慘敗,張本美和轟11-0

倫敦世乒賽最新戰(zhàn)報(bào):國乒2連勝!張本智和慘敗,張本美和轟11-0

羙晞
2026-05-03 09:15:03
中國對非洲國家實(shí)施零關(guān)稅,唯一例外的斯威士蘭格外“搶眼”

中國對非洲國家實(shí)施零關(guān)稅,唯一例外的斯威士蘭格外“搶眼”

深度報(bào)
2026-05-02 22:10:20
他是混血兒,出道20年默默無聞,《愛情沒有神話》和王菊搭戲火了

他是混血兒,出道20年默默無聞,《愛情沒有神話》和王菊搭戲火了

芬霏劇時(shí)光
2026-05-02 14:14:15
困獸之局:伊朗的窒息時(shí)刻

困獸之局:伊朗的窒息時(shí)刻

民間胡扯老哥
2026-05-02 11:36:28
誰能想到!日本前首相在中國的土地上發(fā)聲:美國是全球最大威脅!

誰能想到!日本前首相在中國的土地上發(fā)聲:美國是全球最大威脅!

娛樂圈的筆娛君
2026-05-03 12:06:23
1-3大冷!國乒不敵韓國,比輸球還可怕,雪藏王楚欽 暴露3大短板

1-3大冷!國乒不敵韓國,比輸球還可怕,雪藏王楚欽 暴露3大短板

大秦壁虎白話體育
2026-05-03 07:02:21
專家呼吁:馬上停用6種食用油,它是肝癌加速器!再香也別吃

專家呼吁:馬上停用6種食用油,它是肝癌加速器!再香也別吃

橘子約定
2026-05-03 09:43:10
格力原董事長周樂偉投案,全網(wǎng)找董明珠:踢走十年,她憑什么反殺

格力原董事長周樂偉投案,全網(wǎng)找董明珠:踢走十年,她憑什么反殺

戶外釣魚哥阿旱
2026-05-03 03:28:33
晚飯七分飽被推翻了?提醒:過了62歲,吃飯盡量要做到這5點(diǎn)

晚飯七分飽被推翻了?提醒:過了62歲,吃飯盡量要做到這5點(diǎn)

芹姐說生活
2026-05-02 15:28:33
中國代表:要防止朝鮮半島生戰(zhàn)生亂

中國代表:要防止朝鮮半島生戰(zhàn)生亂

新華社
2026-05-01 09:27:03
排隊(duì)8小時(shí)充電,今年五一高速上1540萬輛電車打了一場漂亮翻身仗

排隊(duì)8小時(shí)充電,今年五一高速上1540萬輛電車打了一場漂亮翻身仗

金哥說新能源車
2026-05-02 14:04:53
霸氣 張雪舉杯邀請現(xiàn)場朋友慶祝奪冠 妻子:全場消費(fèi)都由我們買單

霸氣 張雪舉杯邀請現(xiàn)場朋友慶祝奪冠 妻子:全場消費(fèi)都由我們買單

風(fēng)過鄉(xiāng)
2026-05-03 08:27:36
一位親子鑒定師的自述:我從業(yè)10年,給上千個(gè)男人檢測出了綠帽子

一位親子鑒定師的自述:我從業(yè)10年,給上千個(gè)男人檢測出了綠帽子

千秋文化
2026-05-02 19:48:10
2026-05-03 12:55:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
3054文章數(shù) 10493關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

上海科技大學(xué)王晨輝教授因營救至親不幸去世 年僅39歲

頭條要聞

上海科技大學(xué)王晨輝教授因營救至親不幸去世 年僅39歲

體育要聞

裁判準(zhǔn)備下班,結(jié)果吳宜澤進(jìn)了決賽

娛樂要聞

蔡卓妍婚后首現(xiàn)身 戴結(jié)婚戒指笑容不斷

財(cái)經(jīng)要聞

后巴菲特時(shí)代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

健康
數(shù)碼
教育
時(shí)尚
軍事航空

干細(xì)胞治燒燙傷面臨這些“瓶頸”

數(shù)碼要聞

Perplexity稱贊Mac mini是其Personal Computer的最佳本地部署平臺

教育要聞

能者不想干,中學(xué)行政“空心化”何時(shí)休?

春天別總傻傻穿一身黑,看看這些日常穿搭,高級舒適又優(yōu)雅

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進(jìn)入關(guān)懷版