国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

騰訊混元3年變形始末

0
分享至

2026.01.12


本文字?jǐn)?shù):7212,閱讀時(shí)長大約12分鐘

作者 |新皮層NewNewThing 陸彥君 吳洋洋

2025年11月下旬,大學(xué)畢業(yè)生林楓在深圳參加了騰訊青云計(jì)劃閉門會。活動采取定向邀請制,為期兩天,會議內(nèi)容除了郵輪觀光、參觀騰訊總部,還有一個(gè)環(huán)節(jié)是部門見面會——姚順雨在現(xiàn)場。

這次見面會兩個(gè)小時(shí)左右,姚順雨是開場發(fā)言者,他講了大概只有20分鐘,但富有雄心。

「他說混元的目標(biāo)是對標(biāo)全球最頂尖的一批大模型!沽謼鲗Φ谝回(cái)經(jīng)「新皮層」說。

林楓對姚順雨印象深刻,除了「感覺他是主導(dǎo)混元大模型研發(fā)進(jìn)度的管理者」,他還是林楓在現(xiàn)場看到的騰訊高管中為數(shù)不多的年輕人。


姚順雨,2025年下半年加入騰訊,此前任職于OpenAI。

青云計(jì)劃是騰訊2023年下半年提出的面向優(yōu)秀畢業(yè)生的AI人才專項(xiàng)招聘,對標(biāo)字節(jié)跳動的Top Seed人才計(jì)劃。

與青云計(jì)劃同時(shí)進(jìn)行的是騰訊持續(xù)一年的高薪挖人行動。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對象之一是字節(jié)跳動。字節(jié)跳動2-2職級的候選人,跳槽到騰訊后可以獲得T12或T13的職級,相當(dāng)于在字節(jié)跳動的原職位連升兩級。而且,薪酬也會直接翻倍,有的甚至?xí)嵘?00%。「這種行情最近一個(gè)月才出現(xiàn),以前字節(jié)2-2的候選人會定下T9或T10的職級,薪資漲幅只有30%!乖S嵐說。

2025年的騰訊就是2024年的字節(jié)跳動。2024年,字節(jié)跳動加速基礎(chǔ)模型的研發(fā)進(jìn)度,第一個(gè)動作也是搶人才——它當(dāng)時(shí)的搶人對象主要是阿里巴巴,一年后,騰訊「接棒」,從字節(jié)跳動搶奪人才。

多位接近騰訊的人士對「新皮層」稱,騰訊大概2024年年底就開始大規(guī)模對外招募基礎(chǔ)模型相關(guān)的人才,并啟動一系列組織架構(gòu)調(diào)整。2025年9月姚順雨的加入加速了這一進(jìn)程。

姚順雨新政

最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型WizardLM團(tuán)隊(duì)核心成員孫慶豐、微軟亞洲研究院視覺計(jì)算組前首席研究員胡瀚、微軟WizardLM團(tuán)隊(duì)項(xiàng)目創(chuàng)建者徐燦陸續(xù)加入騰訊。然后是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職于微軟亞洲研究院。

「騰訊只看來自DeepSeek、月之暗面、字節(jié)和阿里這4家基座模型團(tuán)隊(duì)的候選人,其他公司是不看的。」接近騰訊招聘的人士陳立峰對「新皮層」說。

他對「新皮層」稱,2025年年中,字節(jié)跳動曾通過發(fā)放「豆包虛擬股」激勵員工,相當(dāng)于為其大模型團(tuán)隊(duì)漲薪。但正是在這輪股權(quán)激勵期間,部分字節(jié)豆包員工乘勢轉(zhuǎn)身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節(jié)跳動員工,加入混元后能拿到年薪300萬以上的Offer。

2025年12月,字節(jié)跳動再次向全球員工發(fā)布了一封漲薪郵件,將公司整體獎金和調(diào)薪投入分別提升35%和1.5倍,以確保員工薪酬的競爭力和激勵回報(bào)在全球各個(gè)市場都「領(lǐng)先于頭部水平」。

在字節(jié)的防守下,騰訊的搶人計(jì)劃也加大了力度!敢樣甑募尤胧球v訊混元人才招聘的一個(gè)關(guān)鍵節(jié)點(diǎn)!乖S嵐說,姚順雨來之前,高管加盟騰訊「屬于大廠間的正常人才流動」,姚順雨加入后,混元不僅加強(qiáng)了招聘力度,「對候選人信息的保密性處理也升級了」。以姚順雨的加入為節(jié)點(diǎn),騰訊招募了更多大語言模型(LLM)相關(guān)的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內(nèi)的加入者主要研究方向都以多模態(tài)為主。


多位招聘方人士告訴「新皮層」,姚順雨會在與LLM相關(guān)的招聘中擔(dān)任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位T12職級的人才來自字節(jié)Seed團(tuán)隊(duì)和DeepSeek,其中一位負(fù)責(zé)預(yù)訓(xùn)練的數(shù)據(jù)工作,還有一位和姚順雨一起做大模型的前沿探索。

部分混元員工因?yàn)橐樣甑牡絹硇判膫湓觥!杆麄冋J(rèn)為姚順雨可能會為內(nèi)部爭取更多激勵,就像字節(jié)Seed為團(tuán)隊(duì)成員發(fā)豆包股一樣!乖S嵐說,姚順雨接手騰訊混元大模型不久,就與每位團(tuán)隊(duì)成員都有過接觸、聊天,還參加了不同研究小組的團(tuán)建和聚餐。

姚順雨的舉動獲得了部分員工的信任。一位內(nèi)部員工認(rèn)為他「性格討喜,跟著他干活有信心」,另一位內(nèi)部員工認(rèn)為他「管理能力出色」。但也有部分混元成員開始擔(dān)心能力不足被調(diào)整,開始主動尋求外部機(jī)會!笍幕煸x職的人可能會變多,無論主動還是被動。」許嵐說。

換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同于混元大模型前任領(lǐng)導(dǎo)者的觀念。

接近騰訊混元的人士告訴「新皮層」,相較于前任負(fù)責(zé)人,姚順雨更加重視后訓(xùn)練——這在很多人的意料之中,姚順雨此前的主要工作都與后訓(xùn)練更相關(guān)。不過除此之外,他還打算從預(yù)訓(xùn)練的數(shù)據(jù)部分入手,「從數(shù)據(jù)開始重新訓(xùn)練混元」,這相當(dāng)于回到起點(diǎn)。林楓稱,姚順雨在11月的青云計(jì)劃閉門會上還提出過一個(gè)明確要降低「發(fā)版速度」的計(jì)劃,「他說以前混元模型在內(nèi)部更新版本的速度很快,有時(shí)候一周就會發(fā)布兩個(gè)版本。他來到這里的第一件事就是降低發(fā)版速度,打磨好整體模型再發(fā)!沽謼髡f。

在被騰訊挖角之前,姚順雨只在OpenAI工作過一年,深度參與Operator、Deep Research等智能體項(xiàng)目。更早之前,他剛剛從普林斯頓博士畢業(yè),研究方向是自然語言處理與強(qiáng)化學(xué)習(xí)。攻讀博士學(xué)位期間,他的主要科研成果有兩個(gè),一個(gè)是ToT(Tree of Thoughts,思維樹),這個(gè)計(jì)算框架讓AI在解決復(fù)雜問題時(shí)能夠?qū)栴}拆解為多步思維步驟并探索多條路徑,最終找到最優(yōu)路徑。還有一個(gè)是ReAct,這個(gè)算法讓大模型可以邊推理邊行動。ToT和ReAct都可應(yīng)用于模型的后訓(xùn)練階段,提升模型的多步推理和動手操作能力。OpenAI的Operator、Deep Research等智能體項(xiàng)目中都有ToT和ReAct的影子。

也就是說,騰訊把姚順雨從OpenAI挖過來時(shí),他只有一年的工作經(jīng)驗(yàn)。但騰訊提供的可能是國內(nèi)大模型人才戰(zhàn)中無論職位還是薪酬都最高的標(biāo)準(zhǔn)。2025年9月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。這個(gè)數(shù)字不一定真實(shí),但1998年出生的姚順雨一定是國內(nèi)大廠中最年輕的大語言模型(LLM)「一號位」。

2025年12月,騰訊宣布混元組織架構(gòu)調(diào)整,官宣姚順雨出任「CEO/總裁辦公室」首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào),他同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時(shí)在香港辦公室工作。另據(jù)一位騰訊內(nèi)部人士稱,騰訊的CEO/總裁辦公室在列的人員名單上只有姚順雨一個(gè)人。

這是2023年啟動大模型研發(fā)以來,騰訊第一次把大語言模型變成一把手工程。而且,這個(gè)模型負(fù)責(zé)人對下轄的團(tuán)隊(duì)擁有直接而全面的管理權(quán)和人事權(quán)。「劉熾平是財(cái)務(wù)出身,并非技術(shù)背景。姚順雨直接向他匯報(bào),獲得資源支持的效率就更高了。」騰訊AI Lab離職員工秦瑩瑩對「新皮層」說,在此之前,騰訊的自研模型混元有著很長的向上匯報(bào)鏈路,以及復(fù)雜的向下管理體系。

混元跟著跑

2025年從年頭沖刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領(lǐng)域開始著急。令這家大公司著急的直接原因就是,其自研模型混元的表現(xiàn)在大模型競爭中不夠靠前。

「很多公司發(fā)新模型時(shí),會被拿來在Benchmark中對比的模型基本就是GPT、Claude、Gemini、千問、Kimi和DeepSeek,你不會看到豆包,也不會看到混元!挂晃淮竽P蜆I(yè)內(nèi)人士對「新皮層」說,這種選擇基本代表了行業(yè)對誰在模型第一梯隊(duì)的認(rèn)知。

馬化騰在2023年5月的股東大會稱,「對于工業(yè)革命(級的機(jī)遇)來講,早一個(gè)月(還是晚一個(gè)月)把電燈泡拿出來,在長的時(shí)間跨度上來看是不那么重要的!沟竽P腿缃褚呀(jīng)變成了一門「實(shí)驗(yàn)科學(xué)」,「從基礎(chǔ)架構(gòu)到注意力機(jī)制,從參數(shù)量到優(yōu)化算法……每個(gè)環(huán)節(jié)都有多種方案,你需要做實(shí)驗(yàn)才知道能不能行得通、在多大規(guī)模的參數(shù)量上行得通!股鲜龃竽P蜆I(yè)內(nèi)人士說。這種實(shí)驗(yàn)性意味著,晚起步雖然有成熟方案可以借鑒,但也會比其他選手缺少從實(shí)驗(yàn)中積累的經(jīng)驗(yàn),行動越慢差距越大、越難追趕。

騰訊是國內(nèi)大廠中最晚推出自研大模型的公司。2022年11月的最后一天,OpenAI發(fā)布ChatGPT。4個(gè)月后,2023年3月,百度發(fā)布了第一代大模型文心一言;同年4月,阿里巴巴發(fā)布通義千問大模型;同年8月,字節(jié)跳動也發(fā)布了首代大模型云雀(注:后更名為豆包大模型)。

騰訊的起跑速度就慢于這3家公司。2023年2月,騰訊才開始組建一個(gè)叫「混元助手」的團(tuán)隊(duì),從各事業(yè)群集結(jié)人才,由時(shí)任騰訊AI Lab主任張正友擔(dān)任項(xiàng)目總負(fù)責(zé)人。

多位騰訊離職員工對「新皮層」稱,騰訊在大模型領(lǐng)域的緩慢起跑與公司內(nèi)部節(jié)奏有相當(dāng)大關(guān)系。在ChatGPT發(fā)布的2022年,騰訊正在經(jīng)歷多重低谷。

低谷之一是游戲業(yè)務(wù)。2022年,中國游戲行業(yè)版號獲批通過的總量同比減少了32%,是過往年份中數(shù)量最少的一年。另一位騰訊離職員工告訴「新皮層」,游戲是騰訊最賺錢的業(yè)務(wù)之一,受版號銳減影響,游戲營收不確定性變高,公司當(dāng)年就進(jìn)行了「降本增效」,就連騰訊TEG(技術(shù)工程事業(yè)群)這樣的技術(shù)中臺也要自負(fù)盈虧。后來主導(dǎo)混元模型研發(fā)的張正友所領(lǐng)導(dǎo)的AI Lab就隸屬于TEG!改菚r(shí)AI Lab并不鼓勵研究員發(fā)論文,員工若要參加學(xué)術(shù)會議,還要蹭高校的預(yù)算才能去開會!顾麑Α感缕印拐f。

騰訊AI Lab離職員工秦瑩瑩稱,AI Lab在2016年成立時(shí)主要任務(wù)還是做基礎(chǔ)研究。但2018年左右,AI Lab就拆分成了兩個(gè)部分,只有少部分人繼續(xù)留做AI基礎(chǔ)研究,其他大部分成員都要開始服務(wù)于公司的游戲與廣告業(yè)務(wù)。

而且,這位AI Lab離職員工稱,在游戲業(yè)務(wù)陷入危機(jī)之前,騰訊在2020年左右面臨過一個(gè)更大的危機(jī):QQ的「孵化器魔法」失效了。


2020年之前,騰訊的很多新業(yè)務(wù)、新產(chǎn)品——比如QQ音樂、騰訊視頻——都是通過QQ孵化成功的。那時(shí)QQ扮演了一個(gè)分發(fā)渠道和入口的角色——就像今天抖音在豆包的分發(fā)中所扮演的角色一樣。但在2020年左右,騰訊的很多新業(yè)務(wù)都難以復(fù)制過去的成功路徑,比如騰訊電商、對標(biāo)今日頭條的天天快報(bào),以及對標(biāo)抖音和快手的騰訊微視,都沒有獲得預(yù)期的成功。2020年,騰訊的另一大分發(fā)渠道——微信——的月活用戶已經(jīng)達(dá)到12.25億,成為移動互聯(lián)網(wǎng)時(shí)代的超級入口,但它至今沒有施展比肩當(dāng)年QQ孵化新產(chǎn)品的魔法。

眾多新業(yè)務(wù)中,唯一一個(gè)被騰訊高層認(rèn)為有潛力的是視頻號。上述騰訊離職員工稱,2022年,騰訊創(chuàng)始人、董事長兼CEO馬化騰在內(nèi)部員工大會上稱「微信事業(yè)群最亮眼的業(yè)務(wù)是視頻號,基本上是全場的希望」。到了2023年,馬化騰又在股東大會上表示「AI是類似工業(yè)革命一樣幾百年不遇的機(jī)會」,但整個(gè)2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰(zhàn)略上多么強(qiáng)調(diào)過大模型,不斷被強(qiáng)調(diào)的依然是視頻號。

根據(jù)上述騰訊AI Lab離職員工的說法,2023年時(shí)騰訊內(nèi)部不同事業(yè)部如果想要訓(xùn)練模型,需要向公司總辦申請預(yù)算和立項(xiàng),「當(dāng)時(shí)訓(xùn)練模型的成本還很高,一次試錯(cuò)動輒幾百萬美元。就算訓(xùn)練成功,模型的用途是什么?那時(shí)候還沒人能說清楚!惯@位騰訊AI Lab離職員工稱。

一號位難當(dāng)

3年的大模型軍備競賽已經(jīng)讓業(yè)界發(fā)現(xiàn),大模型不僅是門實(shí)驗(yàn)科學(xué),還開創(chuàng)了前所未有的開發(fā)范式:它無法通過工業(yè)時(shí)代那樣主要依靠自上而下的明確規(guī)劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個(gè)技術(shù)骨干的開發(fā)模式不同,大模型開發(fā)是一種系統(tǒng)工程,如果沒有一號位頭腦中對模型從預(yù)訓(xùn)練數(shù)據(jù)到預(yù)訓(xùn)練架構(gòu)和算法、后訓(xùn)練路徑以及基礎(chǔ)設(shè)施層面的整體實(shí)驗(yàn)構(gòu)想,一個(gè)模型無法從多個(gè)技術(shù)骨干的暴力開發(fā)中產(chǎn)生。

上述騰訊AI Lab離職員工告訴「新皮層」,啟動大模型研發(fā)后的3年中,騰訊很長時(shí)間里沒有為混元團(tuán)隊(duì)匹配到一位合適的技術(shù)領(lǐng)導(dǎo)者。微信團(tuán)隊(duì)也曾訓(xùn)練過一個(gè)模型,后來放棄了。

上述騰訊AI Lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負(fù)責(zé)人:張正友與蔣杰。張正友的研究方向是計(jì)算機(jī)視覺,他發(fā)明的平板攝像機(jī)標(biāo)定法在全球被普遍采用,被稱為「張氏方法」。但大模型中最核心的模型是LLM,LLM的核心是自然語言處理,而非圖像處理。

「張正友管理了近半年后,并沒有交出夠好的成果。蔣杰之后主動接手了混元項(xiàng)目,因?yàn)樗J(rèn)為大模型可以服務(wù)于廣告投放。」秦瑩瑩說。

蔣杰2012年加入騰訊,是騰訊企業(yè)發(fā)展事業(yè)群(CDG)與技術(shù)工程事業(yè)群(TEG)副總裁,負(fù)責(zé)騰訊廣告平臺產(chǎn)品技術(shù)管理工作。

在蔣杰的總負(fù)責(zé)下,劉威和王迪都曾短暫地直接管理過混元一段時(shí)間,「劉威類似于統(tǒng)籌者,王迪類似于執(zhí)行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術(shù)背景也都與自然語言處理關(guān)聯(lián)不深,其中劉威的核心工作方向是計(jì)算機(jī)視覺,他在2024年年底從騰訊離職后,創(chuàng)辦了一家叫ReBirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導(dǎo)混元LLM模型前主要在TEG負(fù)責(zé)數(shù)據(jù)與搜廣推算法方面的工作。

2024年11月,蔣杰也開始不再實(shí)際管理混元項(xiàng)目下的LLM部分了,只實(shí)際負(fù)責(zé)混元多模態(tài)模型。前述騰訊AI Lab離職員工稱,當(dāng)時(shí)整個(gè)LLM團(tuán)隊(duì)都在等待一位據(jù)說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。

在姚順雨負(fù)責(zé)混元LLM模型并直接向騰訊總裁劉熾平匯報(bào)之前,混元的LLM負(fù)責(zé)人是個(gè)向上、向下都很難推動工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣杰帶隊(duì)期間,混元LLM模型曾有一個(gè)小組長,但他的職級并不高,距離觸達(dá)劉熾平至少存在大模型技術(shù)負(fù)責(zé)人王迪、混元大模型負(fù)責(zé)人蔣杰、TEG總裁盧山三個(gè)層級。這種架構(gòu)使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

對下管理方面,這位組長也需要橫跨TEG的多個(gè)部門,才能接觸到他的項(xiàng)目相關(guān)成員。2023年成立的混元是一個(gè)虛擬團(tuán)隊(duì),其成員來自AI Lab,甚至是TEG的多個(gè)部門。

秦瑩瑩對「新皮層」說,機(jī)器學(xué)習(xí)部、數(shù)據(jù)平臺部等部門均隸屬于TEG舊的組織架構(gòu),而非混元團(tuán)隊(duì)。抽調(diào)去參與混元項(xiàng)目的員工們還要額外服務(wù)于騰訊不同部門、不同業(yè)務(wù)的AI需求。「混元有小半年的時(shí)間比較混亂,職責(zé)與權(quán)限沒有梳理清楚。無論是張正友還是蔣杰,都沒能把團(tuán)隊(duì)真正整合起來。」她說。


直到2025年4月,騰訊才從組織上配備了一個(gè)類似字節(jié)Seed那樣的獨(dú)立團(tuán)隊(duì),在TEG體系內(nèi)成立大語言模型部與多模態(tài)模型部。12月官宣姚順雨入職后,騰訊進(jìn)一步調(diào)整組織架構(gòu),新成立了AI Infra部、AI Data部與數(shù)據(jù)計(jì)算平臺部,第一次從組織架構(gòu)上匹配大模式時(shí)代的研發(fā)需求。

多位招聘方人士及騰訊員工對「新皮層」稱,騰訊AI Lab目前已被逐漸弱化,多位成員已經(jīng)離職,AI Lab副主任俞棟也將于1月底離開。許嵐告訴「新皮層」,AI Lab現(xiàn)在的工作重點(diǎn)就是做探索性研究、對外發(fā)表論文。這意味著騰訊2016年成立的AI Lab實(shí)際上已經(jīng)反過來成為混元的一個(gè)下屬部門,而不再是它的上層管理機(jī)構(gòu)。

「新皮層」獲得的消息稱,隨著俞棟離職,AI Lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個(gè)方向是胡瀚負(fù)責(zé)的多模態(tài)理解方向,以及一位來自字節(jié)Seed前成員負(fù)責(zé)的多模態(tài)理解和生成統(tǒng)一方向。

直到2025年年底,混元才變成一個(gè)更接近于字節(jié)Seed的架構(gòu),而類似的組織架構(gòu)調(diào)整,字節(jié)在2023年下半年就動手了。這個(gè)遲來但大手筆的調(diào)整意味著,擺在姚順雨這位27歲大語言模型一號位面前的障礙,騰訊已基本為其掃清。

加速理論與甜蜜期

進(jìn)入大模型軍備競賽的第三年,落后者趕上先發(fā)者的最優(yōu)路徑已經(jīng)非常清晰:要想快速交出符合市場預(yù)期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想著如何創(chuàng)新、彎道超車。

最能說明這一成功法則的例子就是Google。2025年之前,「起個(gè)大早趕個(gè)晚集」在國內(nèi)形容的是百度,在硅谷形容的則是Google——它發(fā)明了大模型的基礎(chǔ)架構(gòu)Transformer,但在自ChatGPT發(fā)布以來的全球模型競賽中,Google的Gemini始終被認(rèn)為落后于OpenAI的GPT和Anthropic的Claude。

上述大模型業(yè)內(nèi)人士告訴「新皮層」,Gemini 2.0發(fā)布之前,Google一直堅(jiān)持Encoder+Decoder(注:編碼器+解碼器,Google在2017年發(fā)明 Transformer 架構(gòu)時(shí)的原始形態(tài))架構(gòu)。2024年2月發(fā)布Gemini 1.5時(shí),其模型論文中還在強(qiáng)調(diào)該架構(gòu)為什么更優(yōu),但到了2024年年底發(fā)布Gemini 2.0時(shí),Google不再宣傳Encoder+Decoder的架構(gòu)如何富有潛力,而是開始和OpenAI一樣采取Decoder only(注:純解碼器)架構(gòu)。

不再偏執(zhí)地堅(jiān)持自研架構(gòu)后,Google很快就帶著2025年3月發(fā)布的Gemini 2.5重回業(yè)界視野,11月發(fā)布的Gemini 3.0直接讓OpenAI拉響「紅色警報(bào)」,以應(yīng)對Gemini帶來的流量壓力。根據(jù)SimilarWeb統(tǒng)計(jì)的11月數(shù)據(jù),用戶在Gemini上的平均停留時(shí)間已超越了ChatGPT。

這位業(yè)內(nèi)人士告訴「新皮層」,DeepSeek 2024年12月和2025年2月先后發(fā)布并開源的V3和R1模型,也分別扮演了GPT的Decoder only架構(gòu)曾經(jīng)扮演的角色——告訴大家一個(gè)類GPT-4和OpenAI o1效果的模型可能是怎樣的架構(gòu)。其中,V3模型為業(yè)界提供了一個(gè)可以訓(xùn)練出等效于GPT-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個(gè)MoE(混和專家模型)架構(gòu),而不能是稠密模型;時(shí)隔一個(gè)多月后發(fā)布的R1模型又提供了類OpenAI o1的推理模型「配方」——表明強(qiáng)化學(xué)習(xí)可以直接通過對有推理步驟的語料的模仿學(xué)習(xí)實(shí)現(xiàn)。

「此前,大家其實(shí)不知道GPT-4是怎么訓(xùn)練出來的,也不知道o1是怎么訓(xùn)練出來的!惯@位業(yè)內(nèi)人士說,整個(gè)2024年,國內(nèi)大模型公司的主要目標(biāo)就是「趕上GPT-4」,但不知道如何趕上,OpenAI從GPT 3.5開始就不再在論文中公開其模型核心架構(gòu)和算法、甚至不發(fā)表技術(shù)報(bào)告了。

DeepSeek V3和R1模型的發(fā)布和開源加速了全球類GPT-4和OpenAI o1模型的推出。聘任一個(gè)在OpenAI直接參與過模型后訓(xùn)練、并接觸過其預(yù)訓(xùn)練的研究者擔(dān)任LLM模型負(fù)責(zé)人,對騰訊混元來說是也是一種加速。


姚順雨加入騰訊兩個(gè)月后,2025年12月初,騰訊發(fā)布混元2.0模型,總參數(shù)為4060億。其英文名更新為HY2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職后的成果。但按照業(yè)內(nèi)訓(xùn)練一代模型的周期來看,混元2.0不太會是姚順雨從零開始訓(xùn)練的模型。

「模型參數(shù)量與模型能力之間是必要不充分關(guān)系,參數(shù)量大,模型性能不一定強(qiáng),但參數(shù)量小,模型潛力一定有限!股鲜鰳I(yè)內(nèi)人士說,姚順雨大概率會訓(xùn)練出一個(gè)參數(shù)量更大的模型,估計(jì)需要大半年時(shí)間——在有「配方」、有更多資源的條件下,時(shí)間可能會更短。這意味著,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實(shí)際成果,才能在騰訊這個(gè)有著11萬人的大廠坐穩(wěn)大模型一號位。

2025年4月,姚順雨在其個(gè)人博客中寫下《The Second Half》(下半場)一文,「宣布」大模型已經(jīng)具備足夠的推理能力,大模型競爭已經(jīng)完成上半場的預(yù)訓(xùn)練戰(zhàn)斗,進(jìn)入以后訓(xùn)練和Agent開發(fā)為主題的下半場。但在騰訊,他得重新鏖戰(zhàn)上半場。

一位接近騰訊混元的人士對「新皮層」稱,混元下一個(gè)版本將是一個(gè)Agent模型,主要由姚順雨主導(dǎo)訓(xùn)練。

(應(yīng)采訪對象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王杰夫、實(shí)習(xí)記者李昂、肖赫對本文亦有貢獻(xiàn))

微信編輯| 七三

第一財(cái)經(jīng)持續(xù)追蹤財(cái)經(jīng)熱點(diǎn)。若您掌握公司動態(tài)、行業(yè)趨勢、金融事件等有價(jià)值的線索,歡迎提供。專用郵箱:bianjibu@yicai.com

(注:我們會對線索進(jìn)行核實(shí)。您的隱私將嚴(yán)格保密。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鬧大了!閆學(xué)晶兒子是中戲新疆班,網(wǎng)友呼吁嚴(yán)查,這下她真要哭了

鬧大了!閆學(xué)晶兒子是中戲新疆班,網(wǎng)友呼吁嚴(yán)查,這下她真要哭了

非常先生看娛樂
2026-01-09 17:10:34
獨(dú)家深度:星鏈1.5萬顆VS中國4萬顆,中美太空6G基建大戰(zhàn)開打!

獨(dú)家深度:星鏈1.5萬顆VS中國4萬顆,中美太空6G基建大戰(zhàn)開打!

人工智能學(xué)家
2026-01-11 17:48:08
勁爆!楊瀚森防守封神,力壓濃眉約基奇,NBA中鋒排名前六!

勁爆!楊瀚森防守封神,力壓濃眉約基奇,NBA中鋒排名前六!

多多體育
2026-01-12 10:57:38
0勝7負(fù),從爭冠熱門到瀕臨解散,杜蘭特又失算了,大交易真要來了

0勝7負(fù),從爭冠熱門到瀕臨解散,杜蘭特又失算了,大交易真要來了

毒舌NBA
2026-01-12 13:49:55
還記得他嗎?曾和詹姆斯齊名,全美公認(rèn)第1控衛(wèi),卻在NBA徹底迷失

還記得他嗎?曾和詹姆斯齊名,全美公認(rèn)第1控衛(wèi),卻在NBA徹底迷失

大衛(wèi)的籃球故事
2026-01-11 14:31:29
江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

陳意小可愛
2026-01-10 01:19:36
杜蘭特放心了!火箭補(bǔ)強(qiáng)新目標(biāo)!國王三分神射蒙克或加盟

杜蘭特放心了!火箭補(bǔ)強(qiáng)新目標(biāo)!國王三分神射蒙克或加盟

湖人侃球師
2026-01-12 15:05:15
55年,一位國軍大佬對妻子說:若跟了毛澤東,我就是十大元帥之首

55年,一位國軍大佬對妻子說:若跟了毛澤東,我就是十大元帥之首

興趣知識
2026-01-12 14:31:46
別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國

別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國

LULU生活家
2025-12-29 18:30:47
黃雅瓊這也太美了!白羽絨服造型清純,網(wǎng)友:這就是冠軍氣場?

黃雅瓊這也太美了!白羽絨服造型清純,網(wǎng)友:這就是冠軍氣場?

科學(xué)發(fā)掘
2026-01-12 15:07:57
光明正大摸魚!25歲女子在初創(chuàng)公司沒事做,老板:你無聊就看電視

光明正大摸魚!25歲女子在初創(chuàng)公司沒事做,老板:你無聊就看電視

唐小糖說情感
2026-01-10 21:27:48
擁有400億資產(chǎn)的“黑老大”劉漢死刑后,美貌前妻楊雪下場如何?

擁有400億資產(chǎn)的“黑老大”劉漢死刑后,美貌前妻楊雪下場如何?

豐譚筆錄
2026-01-12 07:55:06
全紅嬋罕見染發(fā)留長發(fā)!沒回國家隊(duì)在老家干農(nóng)活 網(wǎng)友:拿到駕照了?

全紅嬋罕見染發(fā)留長發(fā)!沒回國家隊(duì)在老家干農(nóng)活 網(wǎng)友:拿到駕照了?

手工制作阿殲
2026-01-12 11:53:42
《乘風(fēng)2026》陣容爭議!張曼玉李小冉簽約,歐陽三姐妹合體引熱議

《乘風(fēng)2026》陣容爭議!張曼玉李小冉簽約,歐陽三姐妹合體引熱議

兔子雜談i
2026-01-11 07:55:09
人緣很好,開拓者隊(duì)記Holdahl快問快答:楊瀚森?我的兄弟

人緣很好,開拓者隊(duì)記Holdahl快問快答:楊瀚森?我的兄弟

懂球帝
2026-01-12 15:28:24
特朗普:臺灣問題中國自己解決,但別讓我不高興,外交部回應(yīng)亮了

特朗普:臺灣問題中國自己解決,但別讓我不高興,外交部回應(yīng)亮了

趣文說娛
2026-01-12 15:02:31
解雇穆里尼奧后 費(fèi)內(nèi)巴切就奪冠 貢多齊首秀首球+冠軍+MVP

解雇穆里尼奧后 費(fèi)內(nèi)巴切就奪冠 貢多齊首秀首球+冠軍+MVP

智道足球
2026-01-11 16:50:16
曾是央視知名主持,如今桂林街頭買菜!她的選擇為何讓人深思?

曾是央視知名主持,如今桂林街頭買菜!她的選擇為何讓人深思?

全球風(fēng)情大揭秘
2026-01-11 23:10:48
楊本芬:60年婚姻有性無愛,丈夫不出軌無家暴,卻被精神凌虐

楊本芬:60年婚姻有性無愛,丈夫不出軌無家暴,卻被精神凌虐

跳跳歷史
2026-01-10 11:36:59
中國企業(yè)這波贏麻了!美國商務(wù)部悄悄撤回對中國無人機(jī)的限制計(jì)劃

中國企業(yè)這波贏麻了!美國商務(wù)部悄悄撤回對中國無人機(jī)的限制計(jì)劃

扶蘇聊歷史
2026-01-12 15:35:12
2026-01-12 16:23:00
第一財(cái)經(jīng)資訊 incentive-icons
第一財(cái)經(jīng)資訊
第一財(cái)經(jīng)官方賬號
241075文章數(shù) 621172關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬元

頭條要聞

女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

頭條要聞

女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

A股大漲 兩市成交額3.6萬億創(chuàng)歷史新高

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

健康
家居
手機(jī)
游戲
親子

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

家居要聞

包絡(luò)石木為生 野性舒適

手機(jī)要聞

真我Neo8手機(jī)官宣搭載三星顯示最新、最強(qiáng)M14旗艦發(fā)光材料

《神界》確認(rèn)首發(fā)支持合作模式 可打MOD擴(kuò)展人數(shù)

親子要聞

人財(cái)兩空!廣東寶媽梁海燕去世,因羊水栓塞導(dǎo)致,十天花費(fèi)超50萬

無障礙瀏覽 進(jìn)入關(guān)懷版