国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

騰訊混元3年變形始末

0
分享至

2026.01.12


本文字?jǐn)?shù):7212,閱讀時(shí)長大約12分鐘

作者 |新皮層NewNewThing 陸彥君 吳洋洋

2025年11月下旬,大學(xué)畢業(yè)生林楓在深圳參加了騰訊青云計(jì)劃閉門會(huì)。活動(dòng)采取定向邀請(qǐng)制,為期兩天,會(huì)議內(nèi)容除了郵輪觀光、參觀騰訊總部,還有一個(gè)環(huán)節(jié)是部門見面會(huì)——姚順雨在現(xiàn)場。

這次見面會(huì)兩個(gè)小時(shí)左右,姚順雨是開場發(fā)言者,他講了大概只有20分鐘,但富有雄心。

「他說混元的目標(biāo)是對(duì)標(biāo)全球最頂尖的一批大模型?!沽謼鲗?duì)第一財(cái)經(jīng)「新皮層」說。

林楓對(duì)姚順雨印象深刻,除了「感覺他是主導(dǎo)混元大模型研發(fā)進(jìn)度的管理者」,他還是林楓在現(xiàn)場看到的騰訊高管中為數(shù)不多的年輕人。


姚順雨,2025年下半年加入騰訊,此前任職于OpenAI。

青云計(jì)劃是騰訊2023年下半年提出的面向優(yōu)秀畢業(yè)生的AI人才專項(xiàng)招聘,對(duì)標(biāo)字節(jié)跳動(dòng)的Top Seed人才計(jì)劃。

與青云計(jì)劃同時(shí)進(jìn)行的是騰訊持續(xù)一年的高薪挖人行動(dòng)。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對(duì)象之一是字節(jié)跳動(dòng)。字節(jié)跳動(dòng)2-2職級(jí)的候選人,跳槽到騰訊后可以獲得T12或T13的職級(jí),相當(dāng)于在字節(jié)跳動(dòng)的原職位連升兩級(jí)。而且,薪酬也會(huì)直接翻倍,有的甚至?xí)嵘?00%?!高@種行情最近一個(gè)月才出現(xiàn),以前字節(jié)2-2的候選人會(huì)定下T9或T10的職級(jí),薪資漲幅只有30%?!乖S嵐說。

2025年的騰訊就是2024年的字節(jié)跳動(dòng)。2024年,字節(jié)跳動(dòng)加速基礎(chǔ)模型的研發(fā)進(jìn)度,第一個(gè)動(dòng)作也是搶人才——它當(dāng)時(shí)的搶人對(duì)象主要是阿里巴巴,一年后,騰訊「接棒」,從字節(jié)跳動(dòng)搶奪人才。

多位接近騰訊的人士對(duì)「新皮層」稱,騰訊大概2024年年底就開始大規(guī)模對(duì)外招募基礎(chǔ)模型相關(guān)的人才,并啟動(dòng)一系列組織架構(gòu)調(diào)整。2025年9月姚順雨的加入加速了這一進(jìn)程。

姚順雨新政

最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型WizardLM團(tuán)隊(duì)核心成員孫慶豐、微軟亞洲研究院視覺計(jì)算組前首席研究員胡瀚、微軟WizardLM團(tuán)隊(duì)項(xiàng)目創(chuàng)建者徐燦陸續(xù)加入騰訊。然后是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職于微軟亞洲研究院。

「騰訊只看來自DeepSeek、月之暗面、字節(jié)和阿里這4家基座模型團(tuán)隊(duì)的候選人,其他公司是不看的?!菇咏v訊招聘的人士陳立峰對(duì)「新皮層」說。

他對(duì)「新皮層」稱,2025年年中,字節(jié)跳動(dòng)曾通過發(fā)放「豆包虛擬股」激勵(lì)員工,相當(dāng)于為其大模型團(tuán)隊(duì)漲薪。但正是在這輪股權(quán)激勵(lì)期間,部分字節(jié)豆包員工乘勢轉(zhuǎn)身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節(jié)跳動(dòng)員工,加入混元后能拿到年薪300萬以上的Offer。

2025年12月,字節(jié)跳動(dòng)再次向全球員工發(fā)布了一封漲薪郵件,將公司整體獎(jiǎng)金和調(diào)薪投入分別提升35%和1.5倍,以確保員工薪酬的競爭力和激勵(lì)回報(bào)在全球各個(gè)市場都「領(lǐng)先于頭部水平」。

在字節(jié)的防守下,騰訊的搶人計(jì)劃也加大了力度?!敢樣甑募尤胧球v訊混元人才招聘的一個(gè)關(guān)鍵節(jié)點(diǎn)。」許嵐說,姚順雨來之前,高管加盟騰訊「屬于大廠間的正常人才流動(dòng)」,姚順雨加入后,混元不僅加強(qiáng)了招聘力度,「對(duì)候選人信息的保密性處理也升級(jí)了」。以姚順雨的加入為節(jié)點(diǎn),騰訊招募了更多大語言模型(LLM)相關(guān)的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內(nèi)的加入者主要研究方向都以多模態(tài)為主。


多位招聘方人士告訴「新皮層」,姚順雨會(huì)在與LLM相關(guān)的招聘中擔(dān)任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位T12職級(jí)的人才來自字節(jié)Seed團(tuán)隊(duì)和DeepSeek,其中一位負(fù)責(zé)預(yù)訓(xùn)練的數(shù)據(jù)工作,還有一位和姚順雨一起做大模型的前沿探索。

部分混元員工因?yàn)橐樣甑牡絹硇判膫湓??!杆麄冋J(rèn)為姚順雨可能會(huì)為內(nèi)部爭取更多激勵(lì),就像字節(jié)Seed為團(tuán)隊(duì)成員發(fā)豆包股一樣?!乖S嵐說,姚順雨接手騰訊混元大模型不久,就與每位團(tuán)隊(duì)成員都有過接觸、聊天,還參加了不同研究小組的團(tuán)建和聚餐。

姚順雨的舉動(dòng)獲得了部分員工的信任。一位內(nèi)部員工認(rèn)為他「性格討喜,跟著他干活有信心」,另一位內(nèi)部員工認(rèn)為他「管理能力出色」。但也有部分混元成員開始擔(dān)心能力不足被調(diào)整,開始主動(dòng)尋求外部機(jī)會(huì)。「從混元離職的人可能會(huì)變多,無論主動(dòng)還是被動(dòng)?!乖S嵐說。

換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同于混元大模型前任領(lǐng)導(dǎo)者的觀念。

接近騰訊混元的人士告訴「新皮層」,相較于前任負(fù)責(zé)人,姚順雨更加重視后訓(xùn)練——這在很多人的意料之中,姚順雨此前的主要工作都與后訓(xùn)練更相關(guān)。不過除此之外,他還打算從預(yù)訓(xùn)練的數(shù)據(jù)部分入手,「從數(shù)據(jù)開始重新訓(xùn)練混元」,這相當(dāng)于回到起點(diǎn)。林楓稱,姚順雨在11月的青云計(jì)劃閉門會(huì)上還提出過一個(gè)明確要降低「發(fā)版速度」的計(jì)劃,「他說以前混元模型在內(nèi)部更新版本的速度很快,有時(shí)候一周就會(huì)發(fā)布兩個(gè)版本。他來到這里的第一件事就是降低發(fā)版速度,打磨好整體模型再發(fā)?!沽謼髡f。

在被騰訊挖角之前,姚順雨只在OpenAI工作過一年,深度參與Operator、Deep Research等智能體項(xiàng)目。更早之前,他剛剛從普林斯頓博士畢業(yè),研究方向是自然語言處理與強(qiáng)化學(xué)習(xí)。攻讀博士學(xué)位期間,他的主要科研成果有兩個(gè),一個(gè)是ToT(Tree of Thoughts,思維樹),這個(gè)計(jì)算框架讓AI在解決復(fù)雜問題時(shí)能夠?qū)栴}拆解為多步思維步驟并探索多條路徑,最終找到最優(yōu)路徑。還有一個(gè)是ReAct,這個(gè)算法讓大模型可以邊推理邊行動(dòng)。ToT和ReAct都可應(yīng)用于模型的后訓(xùn)練階段,提升模型的多步推理和動(dòng)手操作能力。OpenAI的Operator、Deep Research等智能體項(xiàng)目中都有ToT和ReAct的影子。

也就是說,騰訊把姚順雨從OpenAI挖過來時(shí),他只有一年的工作經(jīng)驗(yàn)。但騰訊提供的可能是國內(nèi)大模型人才戰(zhàn)中無論職位還是薪酬都最高的標(biāo)準(zhǔn)。2025年9月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。這個(gè)數(shù)字不一定真實(shí),但1998年出生的姚順雨一定是國內(nèi)大廠中最年輕的大語言模型(LLM)「一號(hào)位」。

2025年12月,騰訊宣布混元組織架構(gòu)調(diào)整,官宣姚順雨出任「CEO/總裁辦公室」首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào),他同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時(shí)在香港辦公室工作。另據(jù)一位騰訊內(nèi)部人士稱,騰訊的CEO/總裁辦公室在列的人員名單上只有姚順雨一個(gè)人。

這是2023年啟動(dòng)大模型研發(fā)以來,騰訊第一次把大語言模型變成一把手工程。而且,這個(gè)模型負(fù)責(zé)人對(duì)下轄的團(tuán)隊(duì)擁有直接而全面的管理權(quán)和人事權(quán)?!竸肫绞秦?cái)務(wù)出身,并非技術(shù)背景。姚順雨直接向他匯報(bào),獲得資源支持的效率就更高了?!跪v訊AI Lab離職員工秦瑩瑩對(duì)「新皮層」說,在此之前,騰訊的自研模型混元有著很長的向上匯報(bào)鏈路,以及復(fù)雜的向下管理體系。

混元跟著跑

2025年從年頭沖刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領(lǐng)域開始著急。令這家大公司著急的直接原因就是,其自研模型混元的表現(xiàn)在大模型競爭中不夠靠前。

「很多公司發(fā)新模型時(shí),會(huì)被拿來在Benchmark中對(duì)比的模型基本就是GPT、Claude、Gemini、千問、Kimi和DeepSeek,你不會(huì)看到豆包,也不會(huì)看到混元?!挂晃淮竽P蜆I(yè)內(nèi)人士對(duì)「新皮層」說,這種選擇基本代表了行業(yè)對(duì)誰在模型第一梯隊(duì)的認(rèn)知。

馬化騰在2023年5月的股東大會(huì)稱,「對(duì)于工業(yè)革命(級(jí)的機(jī)遇)來講,早一個(gè)月(還是晚一個(gè)月)把電燈泡拿出來,在長的時(shí)間跨度上來看是不那么重要的。」但大模型如今已經(jīng)變成了一門「實(shí)驗(yàn)科學(xué)」,「從基礎(chǔ)架構(gòu)到注意力機(jī)制,從參數(shù)量到優(yōu)化算法……每個(gè)環(huán)節(jié)都有多種方案,你需要做實(shí)驗(yàn)才知道能不能行得通、在多大規(guī)模的參數(shù)量上行得通。」上述大模型業(yè)內(nèi)人士說。這種實(shí)驗(yàn)性意味著,晚起步雖然有成熟方案可以借鑒,但也會(huì)比其他選手缺少從實(shí)驗(yàn)中積累的經(jīng)驗(yàn),行動(dòng)越慢差距越大、越難追趕。

騰訊是國內(nèi)大廠中最晚推出自研大模型的公司。2022年11月的最后一天,OpenAI發(fā)布ChatGPT。4個(gè)月后,2023年3月,百度發(fā)布了第一代大模型文心一言;同年4月,阿里巴巴發(fā)布通義千問大模型;同年8月,字節(jié)跳動(dòng)也發(fā)布了首代大模型云雀(注:后更名為豆包大模型)。

騰訊的起跑速度就慢于這3家公司。2023年2月,騰訊才開始組建一個(gè)叫「混元助手」的團(tuán)隊(duì),從各事業(yè)群集結(jié)人才,由時(shí)任騰訊AI Lab主任張正友擔(dān)任項(xiàng)目總負(fù)責(zé)人。

多位騰訊離職員工對(duì)「新皮層」稱,騰訊在大模型領(lǐng)域的緩慢起跑與公司內(nèi)部節(jié)奏有相當(dāng)大關(guān)系。在ChatGPT發(fā)布的2022年,騰訊正在經(jīng)歷多重低谷。

低谷之一是游戲業(yè)務(wù)。2022年,中國游戲行業(yè)版號(hào)獲批通過的總量同比減少了32%,是過往年份中數(shù)量最少的一年。另一位騰訊離職員工告訴「新皮層」,游戲是騰訊最賺錢的業(yè)務(wù)之一,受版號(hào)銳減影響,游戲營收不確定性變高,公司當(dāng)年就進(jìn)行了「降本增效」,就連騰訊TEG(技術(shù)工程事業(yè)群)這樣的技術(shù)中臺(tái)也要自負(fù)盈虧。后來主導(dǎo)混元模型研發(fā)的張正友所領(lǐng)導(dǎo)的AI Lab就隸屬于TEG?!改菚r(shí)AI Lab并不鼓勵(lì)研究員發(fā)論文,員工若要參加學(xué)術(shù)會(huì)議,還要蹭高校的預(yù)算才能去開會(huì)?!顾麑?duì)「新皮層」說。

騰訊AI Lab離職員工秦瑩瑩稱,AI Lab在2016年成立時(shí)主要任務(wù)還是做基礎(chǔ)研究。但2018年左右,AI Lab就拆分成了兩個(gè)部分,只有少部分人繼續(xù)留做AI基礎(chǔ)研究,其他大部分成員都要開始服務(wù)于公司的游戲與廣告業(yè)務(wù)。

而且,這位AI Lab離職員工稱,在游戲業(yè)務(wù)陷入危機(jī)之前,騰訊在2020年左右面臨過一個(gè)更大的危機(jī):QQ的「孵化器魔法」失效了。


2020年之前,騰訊的很多新業(yè)務(wù)、新產(chǎn)品——比如QQ音樂、騰訊視頻——都是通過QQ孵化成功的。那時(shí)QQ扮演了一個(gè)分發(fā)渠道和入口的角色——就像今天抖音在豆包的分發(fā)中所扮演的角色一樣。但在2020年左右,騰訊的很多新業(yè)務(wù)都難以復(fù)制過去的成功路徑,比如騰訊電商、對(duì)標(biāo)今日頭條的天天快報(bào),以及對(duì)標(biāo)抖音和快手的騰訊微視,都沒有獲得預(yù)期的成功。2020年,騰訊的另一大分發(fā)渠道——微信——的月活用戶已經(jīng)達(dá)到12.25億,成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的超級(jí)入口,但它至今沒有施展比肩當(dāng)年QQ孵化新產(chǎn)品的魔法。

眾多新業(yè)務(wù)中,唯一一個(gè)被騰訊高層認(rèn)為有潛力的是視頻號(hào)。上述騰訊離職員工稱,2022年,騰訊創(chuàng)始人、董事長兼CEO馬化騰在內(nèi)部員工大會(huì)上稱「微信事業(yè)群最亮眼的業(yè)務(wù)是視頻號(hào),基本上是全場的希望」。到了2023年,馬化騰又在股東大會(huì)上表示「AI是類似工業(yè)革命一樣幾百年不遇的機(jī)會(huì)」,但整個(gè)2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰(zhàn)略上多么強(qiáng)調(diào)過大模型,不斷被強(qiáng)調(diào)的依然是視頻號(hào)。

根據(jù)上述騰訊AI Lab離職員工的說法,2023年時(shí)騰訊內(nèi)部不同事業(yè)部如果想要訓(xùn)練模型,需要向公司總辦申請(qǐng)預(yù)算和立項(xiàng),「當(dāng)時(shí)訓(xùn)練模型的成本還很高,一次試錯(cuò)動(dòng)輒幾百萬美元。就算訓(xùn)練成功,模型的用途是什么?那時(shí)候還沒人能說清楚。」這位騰訊AI Lab離職員工稱。

一號(hào)位難當(dāng)

3年的大模型軍備競賽已經(jīng)讓業(yè)界發(fā)現(xiàn),大模型不僅是門實(shí)驗(yàn)科學(xué),還開創(chuàng)了前所未有的開發(fā)范式:它無法通過工業(yè)時(shí)代那樣主要依靠自上而下的明確規(guī)劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個(gè)技術(shù)骨干的開發(fā)模式不同,大模型開發(fā)是一種系統(tǒng)工程,如果沒有一號(hào)位頭腦中對(duì)模型從預(yù)訓(xùn)練數(shù)據(jù)到預(yù)訓(xùn)練架構(gòu)和算法、后訓(xùn)練路徑以及基礎(chǔ)設(shè)施層面的整體實(shí)驗(yàn)構(gòu)想,一個(gè)模型無法從多個(gè)技術(shù)骨干的暴力開發(fā)中產(chǎn)生。

上述騰訊AI Lab離職員工告訴「新皮層」,啟動(dòng)大模型研發(fā)后的3年中,騰訊很長時(shí)間里沒有為混元團(tuán)隊(duì)匹配到一位合適的技術(shù)領(lǐng)導(dǎo)者。微信團(tuán)隊(duì)也曾訓(xùn)練過一個(gè)模型,后來放棄了。

上述騰訊AI Lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負(fù)責(zé)人:張正友與蔣杰。張正友的研究方向是計(jì)算機(jī)視覺,他發(fā)明的平板攝像機(jī)標(biāo)定法在全球被普遍采用,被稱為「張氏方法」。但大模型中最核心的模型是LLM,LLM的核心是自然語言處理,而非圖像處理。

「張正友管理了近半年后,并沒有交出夠好的成果。蔣杰之后主動(dòng)接手了混元項(xiàng)目,因?yàn)樗J(rèn)為大模型可以服務(wù)于廣告投放?!骨噩摤撜f。

蔣杰2012年加入騰訊,是騰訊企業(yè)發(fā)展事業(yè)群(CDG)與技術(shù)工程事業(yè)群(TEG)副總裁,負(fù)責(zé)騰訊廣告平臺(tái)產(chǎn)品技術(shù)管理工作。

在蔣杰的總負(fù)責(zé)下,劉威和王迪都曾短暫地直接管理過混元一段時(shí)間,「劉威類似于統(tǒng)籌者,王迪類似于執(zhí)行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術(shù)背景也都與自然語言處理關(guān)聯(lián)不深,其中劉威的核心工作方向是計(jì)算機(jī)視覺,他在2024年年底從騰訊離職后,創(chuàng)辦了一家叫ReBirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導(dǎo)混元LLM模型前主要在TEG負(fù)責(zé)數(shù)據(jù)與搜廣推算法方面的工作。

2024年11月,蔣杰也開始不再實(shí)際管理混元項(xiàng)目下的LLM部分了,只實(shí)際負(fù)責(zé)混元多模態(tài)模型。前述騰訊AI Lab離職員工稱,當(dāng)時(shí)整個(gè)LLM團(tuán)隊(duì)都在等待一位據(jù)說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。

在姚順雨負(fù)責(zé)混元LLM模型并直接向騰訊總裁劉熾平匯報(bào)之前,混元的LLM負(fù)責(zé)人是個(gè)向上、向下都很難推動(dòng)工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣杰帶隊(duì)期間,混元LLM模型曾有一個(gè)小組長,但他的職級(jí)并不高,距離觸達(dá)劉熾平至少存在大模型技術(shù)負(fù)責(zé)人王迪、混元大模型負(fù)責(zé)人蔣杰、TEG總裁盧山三個(gè)層級(jí)。這種架構(gòu)使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

對(duì)下管理方面,這位組長也需要橫跨TEG的多個(gè)部門,才能接觸到他的項(xiàng)目相關(guān)成員。2023年成立的混元是一個(gè)虛擬團(tuán)隊(duì),其成員來自AI Lab,甚至是TEG的多個(gè)部門。

秦瑩瑩對(duì)「新皮層」說,機(jī)器學(xué)習(xí)部、數(shù)據(jù)平臺(tái)部等部門均隸屬于TEG舊的組織架構(gòu),而非混元團(tuán)隊(duì)。抽調(diào)去參與混元項(xiàng)目的員工們還要額外服務(wù)于騰訊不同部門、不同業(yè)務(wù)的AI需求?!富煸行“肽甑臅r(shí)間比較混亂,職責(zé)與權(quán)限沒有梳理清楚。無論是張正友還是蔣杰,都沒能把團(tuán)隊(duì)真正整合起來。」她說。


直到2025年4月,騰訊才從組織上配備了一個(gè)類似字節(jié)Seed那樣的獨(dú)立團(tuán)隊(duì),在TEG體系內(nèi)成立大語言模型部與多模態(tài)模型部。12月官宣姚順雨入職后,騰訊進(jìn)一步調(diào)整組織架構(gòu),新成立了AI Infra部、AI Data部與數(shù)據(jù)計(jì)算平臺(tái)部,第一次從組織架構(gòu)上匹配大模式時(shí)代的研發(fā)需求。

多位招聘方人士及騰訊員工對(duì)「新皮層」稱,騰訊AI Lab目前已被逐漸弱化,多位成員已經(jīng)離職,AI Lab副主任俞棟也將于1月底離開。許嵐告訴「新皮層」,AI Lab現(xiàn)在的工作重點(diǎn)就是做探索性研究、對(duì)外發(fā)表論文。這意味著騰訊2016年成立的AI Lab實(shí)際上已經(jīng)反過來成為混元的一個(gè)下屬部門,而不再是它的上層管理機(jī)構(gòu)。

「新皮層」獲得的消息稱,隨著俞棟離職,AI Lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個(gè)方向是胡瀚負(fù)責(zé)的多模態(tài)理解方向,以及一位來自字節(jié)Seed前成員負(fù)責(zé)的多模態(tài)理解和生成統(tǒng)一方向。

直到2025年年底,混元才變成一個(gè)更接近于字節(jié)Seed的架構(gòu),而類似的組織架構(gòu)調(diào)整,字節(jié)在2023年下半年就動(dòng)手了。這個(gè)遲來但大手筆的調(diào)整意味著,擺在姚順雨這位27歲大語言模型一號(hào)位面前的障礙,騰訊已基本為其掃清。

加速理論與甜蜜期

進(jìn)入大模型軍備競賽的第三年,落后者趕上先發(fā)者的最優(yōu)路徑已經(jīng)非常清晰:要想快速交出符合市場預(yù)期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想著如何創(chuàng)新、彎道超車。

最能說明這一成功法則的例子就是Google。2025年之前,「起個(gè)大早趕個(gè)晚集」在國內(nèi)形容的是百度,在硅谷形容的則是Google——它發(fā)明了大模型的基礎(chǔ)架構(gòu)Transformer,但在自ChatGPT發(fā)布以來的全球模型競賽中,Google的Gemini始終被認(rèn)為落后于OpenAI的GPT和Anthropic的Claude。

上述大模型業(yè)內(nèi)人士告訴「新皮層」,Gemini 2.0發(fā)布之前,Google一直堅(jiān)持Encoder+Decoder(注:編碼器+解碼器,Google在2017年發(fā)明 Transformer 架構(gòu)時(shí)的原始形態(tài))架構(gòu)。2024年2月發(fā)布Gemini 1.5時(shí),其模型論文中還在強(qiáng)調(diào)該架構(gòu)為什么更優(yōu),但到了2024年年底發(fā)布Gemini 2.0時(shí),Google不再宣傳Encoder+Decoder的架構(gòu)如何富有潛力,而是開始和OpenAI一樣采取Decoder only(注:純解碼器)架構(gòu)。

不再偏執(zhí)地堅(jiān)持自研架構(gòu)后,Google很快就帶著2025年3月發(fā)布的Gemini 2.5重回業(yè)界視野,11月發(fā)布的Gemini 3.0直接讓OpenAI拉響「紅色警報(bào)」,以應(yīng)對(duì)Gemini帶來的流量壓力。根據(jù)SimilarWeb統(tǒng)計(jì)的11月數(shù)據(jù),用戶在Gemini上的平均停留時(shí)間已超越了ChatGPT。

這位業(yè)內(nèi)人士告訴「新皮層」,DeepSeek 2024年12月和2025年2月先后發(fā)布并開源的V3和R1模型,也分別扮演了GPT的Decoder only架構(gòu)曾經(jīng)扮演的角色——告訴大家一個(gè)類GPT-4和OpenAI o1效果的模型可能是怎樣的架構(gòu)。其中,V3模型為業(yè)界提供了一個(gè)可以訓(xùn)練出等效于GPT-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個(gè)MoE(混和專家模型)架構(gòu),而不能是稠密模型;時(shí)隔一個(gè)多月后發(fā)布的R1模型又提供了類OpenAI o1的推理模型「配方」——表明強(qiáng)化學(xué)習(xí)可以直接通過對(duì)有推理步驟的語料的模仿學(xué)習(xí)實(shí)現(xiàn)。

「此前,大家其實(shí)不知道GPT-4是怎么訓(xùn)練出來的,也不知道o1是怎么訓(xùn)練出來的?!惯@位業(yè)內(nèi)人士說,整個(gè)2024年,國內(nèi)大模型公司的主要目標(biāo)就是「趕上GPT-4」,但不知道如何趕上,OpenAI從GPT 3.5開始就不再在論文中公開其模型核心架構(gòu)和算法、甚至不發(fā)表技術(shù)報(bào)告了。

DeepSeek V3和R1模型的發(fā)布和開源加速了全球類GPT-4和OpenAI o1模型的推出。聘任一個(gè)在OpenAI直接參與過模型后訓(xùn)練、并接觸過其預(yù)訓(xùn)練的研究者擔(dān)任LLM模型負(fù)責(zé)人,對(duì)騰訊混元來說是也是一種加速。


姚順雨加入騰訊兩個(gè)月后,2025年12月初,騰訊發(fā)布混元2.0模型,總參數(shù)為4060億。其英文名更新為HY2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職后的成果。但按照業(yè)內(nèi)訓(xùn)練一代模型的周期來看,混元2.0不太會(huì)是姚順雨從零開始訓(xùn)練的模型。

「模型參數(shù)量與模型能力之間是必要不充分關(guān)系,參數(shù)量大,模型性能不一定強(qiáng),但參數(shù)量小,模型潛力一定有限?!股鲜鰳I(yè)內(nèi)人士說,姚順雨大概率會(huì)訓(xùn)練出一個(gè)參數(shù)量更大的模型,估計(jì)需要大半年時(shí)間——在有「配方」、有更多資源的條件下,時(shí)間可能會(huì)更短。這意味著,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實(shí)際成果,才能在騰訊這個(gè)有著11萬人的大廠坐穩(wěn)大模型一號(hào)位。

2025年4月,姚順雨在其個(gè)人博客中寫下《The Second Half》(下半場)一文,「宣布」大模型已經(jīng)具備足夠的推理能力,大模型競爭已經(jīng)完成上半場的預(yù)訓(xùn)練戰(zhàn)斗,進(jìn)入以后訓(xùn)練和Agent開發(fā)為主題的下半場。但在騰訊,他得重新鏖戰(zhàn)上半場。

一位接近騰訊混元的人士對(duì)「新皮層」稱,混元下一個(gè)版本將是一個(gè)Agent模型,主要由姚順雨主導(dǎo)訓(xùn)練。

(應(yīng)采訪對(duì)象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王杰夫、實(shí)習(xí)記者李昂、肖赫對(duì)本文亦有貢獻(xiàn))

微信編輯| 七三

第一財(cái)經(jīng)持續(xù)追蹤財(cái)經(jīng)熱點(diǎn)。若您掌握公司動(dòng)態(tài)、行業(yè)趨勢、金融事件等有價(jià)值的線索,歡迎提供。專用郵箱:bianjibu@yicai.com

(注:我們會(huì)對(duì)線索進(jìn)行核實(shí)。您的隱私將嚴(yán)格保密。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1984年賀子珍在上海病逝,市委不敢定喪葬規(guī)格,鄧小平看后只說了一句話,結(jié)局出人意料

1984年賀子珍在上海病逝,市委不敢定喪葬規(guī)格,鄧小平看后只說了一句話,結(jié)局出人意料

歷史回憶室
2026-01-11 22:43:10
王毅同索馬里外長德埃電話會(huì)談

王毅同索馬里外長德埃電話會(huì)談

界面新聞
2026-01-11 18:49:08
63歲老年癡呆父親顫巍巍掏出所有錢,哽咽求女兒:可以帶我去找媽媽嗎?

63歲老年癡呆父親顫巍巍掏出所有錢,哽咽求女兒:可以帶我去找媽媽嗎?

瀟湘晨報(bào)
2026-01-12 11:14:11
杜蘭特23分火箭爆冷輸7連敗國王 阿門31+13申京復(fù)出遭隔扣

杜蘭特23分火箭爆冷輸7連敗國王 阿門31+13申京復(fù)出遭隔扣

醉臥浮生
2026-01-12 12:30:05
大結(jié)局!林昀儒4:0世界亞軍,斬獲男單冠軍,國乒男單女單0冠收官

大結(jié)局!林昀儒4:0世界亞軍,斬獲男單冠軍,國乒男單女單0冠收官

國乒二三事
2026-01-12 01:50:39
沒錢還硬裝?寧夏一笑成名拒絕百萬簽約的小女孩,現(xiàn)在成了這樣

沒錢還硬裝?寧夏一笑成名拒絕百萬簽約的小女孩,現(xiàn)在成了這樣

不寫散文詩
2026-01-11 19:40:42
重慶合川請(qǐng)大家吃殺豬飯的女子三天漲粉超56萬,當(dāng)?shù)匚穆眠B夜召開復(fù)盤會(huì)

重慶合川請(qǐng)大家吃殺豬飯的女子三天漲粉超56萬,當(dāng)?shù)匚穆眠B夜召開復(fù)盤會(huì)

極目新聞
2026-01-12 13:44:34
伊朗首次切斷衛(wèi)星互聯(lián)網(wǎng),啟動(dòng)對(duì)星鏈的阻斷開關(guān)

伊朗首次切斷衛(wèi)星互聯(lián)網(wǎng),啟動(dòng)對(duì)星鏈的阻斷開關(guān)

隨波蕩漾的漂流瓶
2026-01-12 11:59:29
馬杜羅被捕三分鐘前才知道美軍來了:貼身衛(wèi)士的驚魂親歷

馬杜羅被捕三分鐘前才知道美軍來了:貼身衛(wèi)士的驚魂親歷

斌聞天下
2026-01-12 07:30:03
讓人眼紅??!上海一程序員曬出年收入52.8萬,年終獎(jiǎng)132000引熱議

讓人眼紅??!上海一程序員曬出年收入52.8萬,年終獎(jiǎng)132000引熱議

火山詩話
2026-01-12 10:03:09
美國抓走馬杜羅后,我找了個(gè)委內(nèi)瑞拉的朋友聊了聊,聽聽他怎么說?

美國抓走馬杜羅后,我找了個(gè)委內(nèi)瑞拉的朋友聊了聊,聽聽他怎么說?

喀秋莎大世界
2026-01-11 21:39:19
林詩棟被訓(xùn)懵了!王皓瘋狂輸出:你XX反手那么強(qiáng) 你啊 別慌別亂啊

林詩棟被訓(xùn)懵了!王皓瘋狂輸出:你XX反手那么強(qiáng) 你啊 別慌別亂啊

風(fēng)過鄉(xiāng)
2026-01-12 12:52:23
特朗普發(fā)圖自稱委內(nèi)瑞拉代總統(tǒng)

特朗普發(fā)圖自稱委內(nèi)瑞拉代總統(tǒng)

界面新聞
2026-01-12 11:13:10
A股歷史第七次成交額達(dá)3萬億元

A股歷史第七次成交額達(dá)3萬億元

每日經(jīng)濟(jì)新聞
2026-01-12 14:05:05
庫里31+5勇士不敵老鷹結(jié)束連勝,巴特勒30+7+6約翰遜23+11

庫里31+5勇士不敵老鷹結(jié)束連勝,巴特勒30+7+6約翰遜23+11

湖人崛起
2026-01-12 11:58:38
網(wǎng)約車的戾氣已經(jīng)到什么程度了:司機(jī)奉勸乘客少說話,不然容易出事

網(wǎng)約車的戾氣已經(jīng)到什么程度了:司機(jī)奉勸乘客少說話,不然容易出事

六子吃涼粉
2026-01-12 08:42:18
多家存儲(chǔ)封測廠漲價(jià):漲幅約三成 后續(xù)不排除啟動(dòng)第二波漲價(jià)

多家存儲(chǔ)封測廠漲價(jià):漲幅約三成 后續(xù)不排除啟動(dòng)第二波漲價(jià)

財(cái)聯(lián)社
2026-01-12 09:18:10
當(dāng)美國“不演了”,世界將面臨什么

當(dāng)美國“不演了”,世界將面臨什么

上觀新聞
2026-01-12 06:30:31
我連夜啃完馬斯克這173分鐘視頻,很震撼

我連夜啃完馬斯克這173分鐘視頻,很震撼

販財(cái)局
2026-01-11 18:19:53
格陵蘭島本就不是丹麥的!從歷史根兒上算,真正歸屬早有定論

格陵蘭島本就不是丹麥的!從歷史根兒上算,真正歸屬早有定論

福建平子
2026-01-12 10:33:34
2026-01-12 14:44:49
第一財(cái)經(jīng)資訊 incentive-icons
第一財(cái)經(jīng)資訊
第一財(cái)經(jīng)官方賬號(hào)
241075文章數(shù) 621171關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬元

頭條要聞

德國就"奪島"發(fā)聲:國際法原則適用所有國家 包括美國

頭條要聞

德國就"奪島"發(fā)聲:國際法原則適用所有國家 包括美國

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

藝術(shù)
健康
數(shù)碼
手機(jī)
旅游

藝術(shù)要聞

畫完這組畫,他抑郁了,后來自殺了

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

數(shù)碼要聞

諾基亞與海信達(dá)成專利訴訟和解,就視頻技術(shù)簽署許可協(xié)議

手機(jī)要聞

iQOO Z11 Turbo官宣搭載2億大底超級(jí)主攝,支持4倍無損變焦

旅游要聞

安化縣南金鄉(xiāng)寶塔山村獲評(píng)湖南省星級(jí)鄉(xiāng)村旅游區(qū)(點(diǎn))

無障礙瀏覽 進(jìn)入關(guān)懷版