国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

被低估的Hy3 preview:騰訊基模能力正在重回牌桌

0
分享至

文 | 劃重點(diǎn)KeyPoints,作者|林易,編輯|重點(diǎn)君

上周,騰訊混元Hy3 preview發(fā)布并開源。坦白講,第一波行業(yè)討論并沒有想象中熱烈,畢竟在GPT-5.5和DeepSeek V4前后腳上線的夾擊下,一個(gè)不到300B參數(shù)的預(yù)覽版似乎很難激起太多水花。

我們拿著這款模型,在復(fù)雜推理、代碼開發(fā)、智能體落地三大核心場景做了幾天的深度實(shí)測,最終得出一個(gè)結(jié)論:行業(yè)普遍低估了這次更新的分量。

在我們看來,這是騰訊大模型徹底重構(gòu)的拐點(diǎn),是屬于騰訊的Gemini 2.5時(shí)刻。

大家一定記得谷歌大模型曾經(jīng)的窘境。2023年底初代Gemini高調(diào)發(fā)布,本欲對標(biāo)GPT-4改寫行業(yè)格局,卻因演示內(nèi)容爭議、實(shí)測能力不及預(yù)期陷入口碑泥潭,在此后一年多時(shí)間始終被GPT系列全面壓制,這家AI領(lǐng)域的老牌巨頭一度被行業(yè)唱衰 “掉隊(duì)”。但隨著DeepMind創(chuàng)始人哈撒比斯全面接管AI核心研發(fā),對AI業(yè)務(wù)從組織架構(gòu)到技術(shù)路線的全鏈路推倒重構(gòu),打破算法研發(fā)與算力基建的部門壁壘、砍掉冗余管理層級、推翻初代模型的路徑依賴、重構(gòu)訓(xùn)練體系與研發(fā)范式,最終憑借Gemini 2.5實(shí)現(xiàn)了核心能力的飛躍,重回全球大模型第一梯隊(duì)。

現(xiàn)在,騰訊正在經(jīng)歷類似的時(shí)刻。據(jù)我們了解,Hy3 preview之后,騰訊下一代基礎(chǔ)大模型參數(shù)將更大,綜合能力將大幅提升。

實(shí)測之后,最強(qiáng)的感受是“穩(wěn)了”

先說復(fù)雜推理。

我們給Hy3 preview的第一類題,是多條件、多輪推翻的推理任務(wù):一家公司有5個(gè)部門、8個(gè)項(xiàng)目、12個(gè)人員,項(xiàng)目之間存在排期依賴、預(yù)算約束和人員沖突,要求模型給出可執(zhí)行排期,并解釋為什么某些方案不可行。

這類題最容易暴露模型的問題,前面算對,后面忘條件;局部合理,整體沖突;看起來寫了一大段,真正落到執(zhí)行表格里全是漏洞。


Hy3 preview的表現(xiàn)不算驚艷到碾壓,但有兩個(gè)明顯變化:一是它會(huì)主動(dòng)拆任務(wù),把約束條件先列出來;二是在發(fā)現(xiàn)沖突時(shí),會(huì)回到原條件里重新校準(zhǔn),而不是硬編一個(gè)答案。

這一點(diǎn)很關(guān)鍵,畢竟在Agent時(shí)代,模型最怕是太會(huì)說,錯(cuò)了還說得很完整。

第二類是代碼。

我們讓它寫一個(gè)小型數(shù)據(jù)分析腳本:讀取多張表,清洗異常值,按照不同維度生成統(tǒng)計(jì)結(jié)果,并給出可視化建議。進(jìn)一步提高難度后,又讓它根據(jù)報(bào)錯(cuò)信息修復(fù)依賴、字段缺失和邊界條件。


這部分最明顯的變化是,Hy3 preview不再像過去一些通用模型那樣只會(huì)寫一段看起來像代碼的代碼。它能理解任務(wù)結(jié)構(gòu),也能在報(bào)錯(cuò)后定位問題,修復(fù)思路比較清楚。

雖然在復(fù)雜工程項(xiàng)目里還不能說已經(jīng)達(dá)到頂級Coding Agent水平,但對騰訊自己的開發(fā)者工具、辦公智能體而言,已經(jīng)到了可用性明顯提高的區(qū)間。

第三類是智能體。

我們設(shè)計(jì)了一個(gè)更接近真實(shí)辦公的場景:用戶只說一句“幫我整理這周競品動(dòng)態(tài),輸出一頁匯報(bào)提綱”,模型需要自己拆成搜索、篩選、去重、歸納、生成標(biāo)題、壓縮成匯報(bào)提綱結(jié)構(gòu)等步驟。測試重點(diǎn)是它能不能在長鏈路中不跑偏。


Hy3 preview在這類任務(wù)上給人的感覺是開始有執(zhí)行感了。它會(huì)區(qū)分哪些信息該進(jìn)入正文,哪些只是背景;會(huì)把任務(wù)拆成階段;也能在中間結(jié)果不完整時(shí)提示需要補(bǔ)充,而不是直接腦補(bǔ)到底。

這就是我們說的Gemini 2.5時(shí)刻,可以說是底層能力終于能支撐真實(shí)應(yīng)用往前走。

三個(gè)月完成推倒重來

很多人不知道,Hy3 preview從預(yù)訓(xùn)練啟動(dòng)到正式發(fā)布,只用了短短三個(gè)月。

而在大模型行業(yè),完成一次完整的底座模型訓(xùn)練與迭代,行業(yè)常規(guī)周期至少在6個(gè)月以上,當(dāng)年Meta、谷歌完成模型體系的重構(gòu),更是花了6-12個(gè)月的時(shí)間。

能在三個(gè)月完成這場極限挑戰(zhàn),核心原因在于,騰訊對混元大模型做了一場徹頭徹尾的推倒重來,而非在上一代版本上的縫縫補(bǔ)補(bǔ)。

這場重構(gòu)始于組織與人才體系的徹底洗牌。前OpenAI明星研究員姚順雨出任騰訊首席AI科學(xué)家后,首先收攏了分散的AI研發(fā)力量,撤銷原有AI Lab,將AI Infra部與大語言模型部合二為一,打破了算法研發(fā)與基礎(chǔ)設(shè)施割裂的壁壘。


同時(shí),團(tuán)隊(duì)推行極致的扁平化管理,取消總經(jīng)理、總監(jiān)等管理層級頭銜,全面實(shí)行方向負(fù)責(zé)人制,決策鏈路大幅縮短,跨部門協(xié)作效率實(shí)現(xiàn)了質(zhì)的飛躍。

其次是技術(shù)底座與訓(xùn)練范式的全面重建。

Hy3 preview沒有沿用任何上一代的訓(xùn)練框架,Agent系統(tǒng)幾乎從零搭建,預(yù)訓(xùn)練與強(qiáng)化學(xué)習(xí)的AI Infra基礎(chǔ)設(shè)施、數(shù)據(jù)集全部重新開發(fā)。技術(shù)路線上,團(tuán)隊(duì)選擇了經(jīng)過行業(yè)驗(yàn)證的MoE混合專家架構(gòu),總參數(shù)295B,激活參數(shù)僅21B,在保證能力的同時(shí),把推理效率做到了極致,全棧優(yōu)化后推理效率較上一代提升40%。

更關(guān)鍵的是訓(xùn)練范式的底層轉(zhuǎn)向:從過去重度依賴SFT監(jiān)督微調(diào),全面轉(zhuǎn)向以RL強(qiáng)化學(xué)習(xí)為核心的后訓(xùn)練體系。如果說SFT是給模型灌輸標(biāo)準(zhǔn)答案,那RL就是教會(huì)模型獨(dú)立判斷、解決未知問題。

這讓模型擺脫了刷榜強(qiáng)、實(shí)戰(zhàn)弱的困境,在千變?nèi)f化的真實(shí)場景中,擁有了持續(xù)進(jìn)化的能力。

三個(gè)月完成全鏈路重構(gòu),不僅證明了騰訊團(tuán)隊(duì)的工程化能力,更意味著這套全新的研發(fā)體系已經(jīng)跑通。后續(xù)的正式版、更大參數(shù)的迭代版本,都能在這套體系里實(shí)現(xiàn)快速落地,騰訊的模型迭代速度,只會(huì)越來越快。

預(yù)覽版還只是開胃菜

很多人只盯著Hy3 preview的參數(shù)和榜單數(shù)字,卻忽略了一個(gè)關(guān)鍵信息:這只是一個(gè)預(yù)覽版,真正的重頭戲還在后面。

而騰訊能在大模型賽道實(shí)現(xiàn)長期追趕,最核心的底牌,是國內(nèi)無人能及的全場景應(yīng)用生態(tài)。

目前,Hy3 preview已經(jīng)成為騰訊十余款核心產(chǎn)品的首選模型,這在混元的歷史上還是第一次。從C端的元寶、QQ、騰訊文檔、微信讀書,到B端的CodeBuddy、WorkBuddy、騰訊云,再到垂類場景的和平精英AI NPC、微信公眾號(hào)AI分身、騰訊智能客服,這款預(yù)覽版模型已經(jīng)完成了全場景的快速落地。

在元寶對話場景,模型帶來了更具活人感的交互體驗(yàn),不僅能精準(zhǔn)理解用戶的模糊需求,還能在多輪對話中保持情商在線、內(nèi)容貼合語境;在騰訊文檔AI PPT 場景,模型生成成功率提升20%,耗時(shí)縮短20%,徹底解決了過往內(nèi)容幻覺、主題偏離的問題;在和平精英的游戲場景,AI NPC不僅能精準(zhǔn)完成人設(shè)扮演,還能適配局內(nèi)復(fù)雜的對戰(zhàn)場景,回復(fù)節(jié)奏完全貼近真實(shí)玩家;在企業(yè)辦公場景,CodeBuddy、WorkBuddy憑借模型的能力升級,首Token延遲降低54%,端到端時(shí)長降低47%,能穩(wěn)定驅(qū)動(dòng)數(shù)百步的復(fù)雜Agent工作流。

而這只是開始。騰訊手握微信、QQ兩大國民級入口,覆蓋社交、游戲、廣告、金融、辦公、生活服務(wù)等幾乎所有互聯(lián)網(wǎng)場景,每天觸達(dá)十億級用戶。一旦“真實(shí)場景- 用戶反饋 - 模型訓(xùn)練 - 能力升級 - 更多場景”的正向飛輪徹底轉(zhuǎn)起來,騰訊大模型的長期進(jìn)化潛力,是純做底座的模型廠商無法比擬的。

AI大模型的競爭,是一場曠日持久的馬拉松。這個(gè)賽道里,從來沒有永遠(yuǎn)的領(lǐng)先者,也沒有永遠(yuǎn)的落后者。真正決定長期勝負(fù)的,是能不能找對正確的方向,能不能完成持續(xù)的自我迭代,能不能把模型能力轉(zhuǎn)化為真實(shí)的用戶價(jià)值。

Hy3 preview的發(fā)布,可以說是讓騰訊重回牌桌的起點(diǎn)。它證明了騰訊已經(jīng)找對了實(shí)用為王的正確路線,完成了從組織到技術(shù)的全鏈路重構(gòu)。

騰訊有領(lǐng)先的人才隊(duì)伍,不缺數(shù)據(jù),正在補(bǔ)齊算力短板,還有豐富的應(yīng)用場景,隨著時(shí)間推移,做不出頂尖大模型的概率只會(huì)越來越小。

接下來,當(dāng)模型能力與騰訊的場景生態(tài)完成深度咬合,這場屬于騰訊的AI反擊,才剛剛拉開序幕。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
利潤559萬到市值一萬億:誰在把中際旭創(chuàng)的“命大”包裝成神話?

利潤559萬到市值一萬億:誰在把中際旭創(chuàng)的“命大”包裝成神話?

新浪財(cái)經(jīng)
2026-04-26 22:41:16
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

喜歡歷史的阿繁
2026-04-26 12:24:07
日本政府圖謀出口二手武器,不斷突破“紅線”引擔(dān)憂

日本政府圖謀出口二手武器,不斷突破“紅線”引擔(dān)憂

參考消息
2026-04-26 20:00:08
1984年中美黑鷹直升機(jī)交易內(nèi)幕:原計(jì)劃提供100架,為何只有24架

1984年中美黑鷹直升機(jī)交易內(nèi)幕:原計(jì)劃提供100架,為何只有24架

文史達(dá)觀
2026-04-27 17:47:47
002378,一季度凈利潤暴增近800%!

002378,一季度凈利潤暴增近800%!

證券時(shí)報(bào)e公司
2026-04-27 20:40:53
妹子,你露個(gè)大白胸脯,在這兒干什么呢?

妹子,你露個(gè)大白胸脯,在這兒干什么呢?

飛娛日記
2026-04-18 10:48:09
女人只要嘗過男人這三種滋味,心就被拴死了,趕都趕不走

女人只要嘗過男人這三種滋味,心就被拴死了,趕都趕不走

荷蘭豆愛健康
2026-04-27 18:36:33
斯諾克賽程:決出4席8強(qiáng),吳宜澤生死戰(zhàn),火箭沖8冠,5虎變3虎?

斯諾克賽程:決出4席8強(qiáng),吳宜澤生死戰(zhàn),火箭沖8冠,5虎變3虎?

劉姚堯的文字城堡
2026-04-27 07:56:16
CBA季后賽賽程出爐,預(yù)測這4隊(duì)進(jìn)8強(qiáng),常規(guī)賽單項(xiàng)獎(jiǎng),老六等入選

CBA季后賽賽程出爐,預(yù)測這4隊(duì)進(jìn)8強(qiáng),常規(guī)賽單項(xiàng)獎(jiǎng),老六等入選

第五才子
2026-04-27 11:17:31
回來了!你好,隆多!已經(jīng)面試NBA球隊(duì)主帥

回來了!你好,隆多!已經(jīng)面試NBA球隊(duì)主帥

籃球?qū)崙?zhàn)寶典
2026-04-27 19:00:50
記者:恰爾汗奧盧可能賽季報(bào)銷,世界杯時(shí)才能復(fù)出

記者:恰爾汗奧盧可能賽季報(bào)銷,世界杯時(shí)才能復(fù)出

懂球帝
2026-04-27 18:48:21
雞蛋能不能天天吃?醫(yī)生忠告:過了60歲以后,吃雞蛋牢記5個(gè)關(guān)鍵

雞蛋能不能天天吃?醫(yī)生忠告:過了60歲以后,吃雞蛋牢記5個(gè)關(guān)鍵

芹姐說生活
2026-04-27 17:13:55
湖人故意輸球還是真打不過?雷迪克早給出“答案”,詹姆斯盡力了

湖人故意輸球還是真打不過?雷迪克早給出“答案”,詹姆斯盡力了

麥子的籃球故事
2026-04-27 15:20:19
4月底截止!退休老人這3件事不辦,5月養(yǎng)老金、醫(yī)保全受影響

4月底截止!退休老人這3件事不辦,5月養(yǎng)老金、醫(yī)保全受影響

頤年齋
2026-04-27 08:30:27
三大利好!外資大舉加倉(名單)

三大利好!外資大舉加倉(名單)

證券之星
2026-04-27 16:16:04
天地會(huì)逃到海外,成立了一個(gè)國家,面積比兩個(gè)日本大,至今說漢語

天地會(huì)逃到海外,成立了一個(gè)國家,面積比兩個(gè)日本大,至今說漢語

史之銘
2026-04-27 16:15:05
Coco死不悔改,解封后又開始爆料!謝賢解衣供她取暖,還借花獻(xiàn)佛

Coco死不悔改,解封后又開始爆料!謝賢解衣供她取暖,還借花獻(xiàn)佛

娛樂團(tuán)長
2026-04-25 19:23:12
陜西廣電《都市快報(bào)》記者王景文因病去世,年僅51歲

陜西廣電《都市快報(bào)》記者王景文因病去世,年僅51歲

澎湃新聞
2026-04-27 10:18:27
申京談艾頓肘擊:我沒想到他會(huì)被驅(qū)逐,既然都吹了那就這樣吧

申京談艾頓肘擊:我沒想到他會(huì)被驅(qū)逐,既然都吹了那就這樣吧

懂球帝
2026-04-27 14:44:26
2026-04-27 21:51:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132829文章數(shù) 862118關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實(shí)測出來了

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險(xiǎn)

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險(xiǎn)

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財(cái)經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會(huì)越走越寬

態(tài)度原創(chuàng)

手機(jī)
教育
游戲
本地
軍事航空

手機(jī)要聞

1999元起!萬級長續(xù)航的vivo Y600 Pro正式發(fā)布

教育要聞

文科大撤退,歷史首當(dāng)其沖

再引爭議!PS5實(shí)體版黑旗RE也要強(qiáng)制聯(lián)網(wǎng)安裝

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

軍事要聞

伊朗外長折返伊斯蘭堡內(nèi)情披露

無障礙瀏覽 進(jìn)入關(guān)懷版