国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

拿了30個(gè)冠軍的騰訊翻譯模型,實(shí)際表現(xiàn)又如何?

0
分享至

騰訊在Hugging Face上發(fā)布了一個(gè)專門(mén)用來(lái)翻譯的模型,叫做Hunyuan-MT-7B。根據(jù)它的官方介紹,這個(gè)翻譯模型在WMT25競(jìng)賽中,該模型在參與的31個(gè)語(yǔ)言類別中有30個(gè)獲得了第一名。并且在同等規(guī)模模型中實(shí)現(xiàn)了行業(yè)領(lǐng)先的性能。

而Hunyuan-MT-7B的集成模型Hunyuan-MT-Chimera-7B,是業(yè)界首個(gè)開(kāi)源翻譯集成模型,將翻譯質(zhì)量提升至新高度。所謂集成模型,是指一種機(jī)器學(xué)習(xí)方法。它的核心思想是,不依賴單個(gè)模型進(jìn)行預(yù)測(cè)或判斷,而是將多個(gè)模型的預(yù)測(cè)結(jié)果結(jié)合起來(lái),從而獲得比任何一個(gè)單一模型都更好、更穩(wěn)定的最終結(jié)果。

那么回到翻譯這個(gè)事上來(lái),Chimera的邏輯就是讓MT-7B翻譯系統(tǒng)生成多個(gè)不同的翻譯候選版本,會(huì)分析這些候選版本,將它們各自的優(yōu)點(diǎn)整合起來(lái)。最后,生成一個(gè)質(zhì)量超越了任何一個(gè)單一候選版本的、更優(yōu)的最終譯文。

但是由于官網(wǎng)目前只有MT-7B這一種版本,因此本文只對(duì)該版本進(jìn)行了測(cè)試。

01

這里我使用的都是很常見(jiàn)的英語(yǔ)臺(tái)詞,出自各種經(jīng)典讀物。

出自《羅密歐與朱麗葉》,原文通常被翻譯為“姓名算得了什么?我們所稱的玫瑰,換個(gè)名字還是一樣芳香”

出自《雙城記》,這個(gè)翻譯的非常精準(zhǔn)。

出自《了不起的蓋茨比》,同樣也翻譯得非常精準(zhǔn)。

接下來(lái),提高難度,我開(kāi)始用一些現(xiàn)代英語(yǔ)臺(tái)詞來(lái)測(cè)試模型的翻譯效果。

這句話是《英雄聯(lián)盟》戲命師 燼的選定語(yǔ)音,我于殺戮之中盛放,亦如黎明中的花朵。

這句話來(lái)自電影《蜘蛛俠》,通常我們翻譯成“能力越大,責(zé)任越大”。

既然英語(yǔ)差不多沒(méi)問(wèn)題,就來(lái)試試日語(yǔ)和韓語(yǔ)。

這是《游戲王5D'S》紅蓮魔龍召喚臺(tái)詞,王者的鼓動(dòng),現(xiàn)在于此列成陣勢(shì)!看著這天地鳴動(dòng)的力量吧!同調(diào)召喚,吾之魂,紅蓮魔龍!日語(yǔ)中的鼓動(dòng)(こどう)并非全部都是心跳的意思,也可以指脈動(dòng)、律動(dòng)、震動(dòng)等等。

今ここに列をなす,要拆分出來(lái)理解。其中“今”代表此時(shí)此刻,“ここに”是在這里,指的是地點(diǎn),“列をなす”是組成一列,而混元將其簡(jiǎn)單譯作“此刻在此匯聚”并不是很合適。

在韓語(yǔ)方面,Hunyuan-MT-7B也表現(xiàn)得不錯(cuò)。

這是K/DA歌曲《POP STAR》中阿卡麗(田小娟)的第一句歌詞,即便是英語(yǔ)和韓語(yǔ)混雜,MT-7B翻譯得依然非常準(zhǔn)確。

如果帶著Emoji一起翻譯,那么混元MT可能會(huì)出現(xiàn)吞字的情況。比如圖中的許秀虧桑提圣經(jīng),混元沒(méi)有翻譯出??201。?? 是 ?? ???的縮寫(xiě),??是魔法,???是抵抗力,因此 ??201 的意思是魔法抗性是201。

02

從官方發(fā)布的技術(shù)報(bào)告來(lái)看,騰訊混元MT設(shè)計(jì)的目標(biāo)是提供高質(zhì)量的多語(yǔ)言互譯能力,現(xiàn)階段支持包括中文、英文、日文以及哈薩克語(yǔ)、維吾爾語(yǔ)、蒙古語(yǔ)、藏語(yǔ)等5種中國(guó)少數(shù)民族語(yǔ)言在內(nèi)的33種語(yǔ)言之間的雙向翻譯。

混元MT的構(gòu)建采用了一套完整的、系統(tǒng)化的訓(xùn)練框架,這個(gè)框架將模型的訓(xùn)練過(guò)程分解為幾個(gè)前后銜接的階段,旨在逐步提升模型的翻譯能力。整個(gè)流程從未經(jīng)特定任務(wù)訓(xùn)練的基礎(chǔ)模型開(kāi)始,通過(guò)一系列專門(mén)針對(duì)機(jī)器翻譯的優(yōu)化步驟,最終產(chǎn)出具備專業(yè)翻譯能力的模型。

訓(xùn)練流程的第一個(gè)環(huán)節(jié)是通用預(yù)訓(xùn)練。這個(gè)階段的目標(biāo)是構(gòu)建一個(gè)具備廣泛知識(shí)和多語(yǔ)言基礎(chǔ)理解能力的基座模型,即Hunyuan-7B-Base。在訓(xùn)練過(guò)程中,模型學(xué)習(xí)了包含中文、英文以及其他多種語(yǔ)言在內(nèi)的數(shù)據(jù),其中非中英文的多語(yǔ)言數(shù)據(jù)量達(dá)到了1.3萬(wàn)億個(gè)tokens。

為了確保訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,研發(fā)團(tuán)隊(duì)建立了一套數(shù)據(jù)質(zhì)量評(píng)估體系。該體系從知識(shí)價(jià)值、真實(shí)性和寫(xiě)作風(fēng)格三個(gè)維度對(duì)文本進(jìn)行打分,并根據(jù)數(shù)據(jù)來(lái)源的特性,對(duì)不同維度的權(quán)重進(jìn)行調(diào)整。比如翻譯專業(yè)知識(shí)的網(wǎng)站,就會(huì)優(yōu)先選擇知識(shí)價(jià)值得分高的數(shù)據(jù)。

同時(shí),為了保證內(nèi)容覆蓋面的均衡,還建立了學(xué)科、行業(yè)和內(nèi)容主題三個(gè)層面的標(biāo)簽系統(tǒng),用以調(diào)整不同領(lǐng)域數(shù)據(jù)的比例,并過(guò)濾掉低質(zhì)量或不相關(guān)的內(nèi)容。通過(guò)這一階段的訓(xùn)練,Hunyuan-7B-Base模型在通用知識(shí)、邏輯推理、數(shù)學(xué)、編程和多語(yǔ)言能力上奠定了基礎(chǔ)。

接下來(lái)的第二個(gè)環(huán)節(jié)是面向機(jī)器翻譯的預(yù)訓(xùn)練。這個(gè)階段在通用基座模型的基礎(chǔ)上,加入了大量為翻譯任務(wù)篩選的單語(yǔ)和雙語(yǔ)語(yǔ)料,目的是使模型的能力向翻譯領(lǐng)域傾斜和深化。單語(yǔ)數(shù)據(jù)主要來(lái)源于mC4和OSCAR等公開(kāi)數(shù)據(jù)集,并經(jīng)過(guò)了嚴(yán)格的清洗流程,包括語(yǔ)言識(shí)別、文檔級(jí)別去重以及使用語(yǔ)言模型過(guò)濾掉高困惑度的低質(zhì)量文本。

雙語(yǔ)平行語(yǔ)料則來(lái)自O(shè)PUS和ParaCrawl等公開(kāi)數(shù)據(jù)集,團(tuán)隊(duì)使用CometKiwi等無(wú)需參考譯文的質(zhì)量評(píng)估工具進(jìn)行篩選,以保證句對(duì)的質(zhì)量。為了確定不同來(lái)源數(shù)據(jù)的最佳混合比例,團(tuán)隊(duì)采用了一種名為RegMix的策略,通過(guò)在小規(guī)模模型上進(jìn)行實(shí)驗(yàn),找到能夠使訓(xùn)練損失最小化的數(shù)據(jù)配比,并將其應(yīng)用于正式的訓(xùn)練中。

此外,為了防止模型在學(xué)習(xí)新知識(shí)時(shí)遺忘通用預(yù)訓(xùn)練階段學(xué)到的能力,訓(xùn)練數(shù)據(jù)中還包含了20%的原始預(yù)訓(xùn)練語(yǔ)料作為重放數(shù)據(jù)。

完成兩個(gè)預(yù)訓(xùn)練階段后,模型進(jìn)入第三個(gè)環(huán)節(jié),即后訓(xùn)練階段。這一階段通過(guò)監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RL)等技術(shù),將模型的翻譯能力進(jìn)行精細(xì)化調(diào)優(yōu)和對(duì)齊。監(jiān)督微調(diào)分為兩個(gè)步驟。第一步使用約300萬(wàn)句對(duì)的平行語(yǔ)料,旨在增強(qiáng)模型的基礎(chǔ)翻譯能力和遵循指令的能力。

這些數(shù)據(jù)來(lái)自多個(gè)來(lái)源,包括Flores-200開(kāi)發(fā)集、往年的WMT評(píng)測(cè)測(cè)試集、人工標(biāo)注的中文與少數(shù)民族語(yǔ)言互譯數(shù)據(jù)集,以及使用DeepSeek-V3-0324模型生成的合成數(shù)據(jù)。數(shù)據(jù)同樣經(jīng)過(guò)CometKiwi和GEMBA等質(zhì)量評(píng)估指標(biāo)的篩選。第二步則使用一個(gè)規(guī)模更小但質(zhì)量更高的數(shù)據(jù)集(約26.8萬(wàn)句對(duì))對(duì)模型進(jìn)行進(jìn)一步的精煉。這些數(shù)據(jù)經(jīng)過(guò)了更嚴(yán)格的篩選過(guò)程,并對(duì)多輪評(píng)估中得分一致性較差的樣本進(jìn)行了人工校驗(yàn)。

監(jiān)督微調(diào)之后是強(qiáng)化學(xué)習(xí)階段。機(jī)器翻譯任務(wù)的輸出具有語(yǔ)義多樣性,難以用簡(jiǎn)單的規(guī)則進(jìn)行評(píng)估,這為強(qiáng)化學(xué)習(xí)的應(yīng)用帶來(lái)了挑戰(zhàn)。為解決此問(wèn)題,混元MT采用了GRPO算法,并設(shè)計(jì)了一個(gè)復(fù)合獎(jiǎng)勵(lì)函數(shù)。

該獎(jiǎng)勵(lì)函數(shù)包含三個(gè)部分:第一部分是質(zhì)量感知獎(jiǎng)勵(lì),使用與人類譯員判斷高度相關(guān)的XCOMET-XXL評(píng)分和基于DeepSeek-V3-0324模型的GEMBA框架評(píng)分,共同評(píng)估翻譯的整體質(zhì)量;第二部分是術(shù)語(yǔ)感知獎(jiǎng)勵(lì),它利用詞對(duì)齊工具提取源文和譯文中的術(shù)語(yǔ)等關(guān)鍵信息,通過(guò)計(jì)算二者的重合率來(lái)獎(jiǎng)勵(lì)模型,促使模型更關(guān)注專業(yè)術(shù)語(yǔ)的準(zhǔn)確翻譯;第三部分是重復(fù)懲罰,用于檢測(cè)和懲罰模型在訓(xùn)練后期可能出現(xiàn)的重復(fù)輸出,以維持生成內(nèi)容的多樣性和訓(xùn)練的穩(wěn)定性。

經(jīng)過(guò)這一系列后訓(xùn)練流程,最終產(chǎn)出的模型即為Hunyuan-MT-7B。

03

在Hunyuan-MT-7B的基礎(chǔ)上,系統(tǒng)還構(gòu)建了Hunyuan-MT-Chimera-7B模型。該模型采用了一種弱到強(qiáng)的強(qiáng)化學(xué)習(xí)方法。正如前文所述,其核心思想是在推理時(shí),首先生成多個(gè)不同的翻譯候選結(jié)果,然后利用一個(gè)基于Hunyuan-MT-7B訓(xùn)練的融合模型,將這些候選結(jié)果的優(yōu)點(diǎn)整合起來(lái),生成一個(gè)質(zhì)量超越任何單一候選結(jié)果的最終譯文。

這個(gè)融合模型的訓(xùn)練同樣使用強(qiáng)化學(xué)習(xí),其獎(jiǎng)勵(lì)函數(shù)由XCOMET-XXL評(píng)分、DeepSeek-V3-0324評(píng)分和重復(fù)懲罰項(xiàng)構(gòu)成。這種方法有效地利用了集成學(xué)習(xí)的優(yōu)勢(shì),在不增加基礎(chǔ)模型參數(shù)量的情況下,進(jìn)一步提升了翻譯的上限。

在性能表現(xiàn)上,混元MT系統(tǒng)在多個(gè)公開(kāi)評(píng)測(cè)基準(zhǔn)上進(jìn)行了測(cè)試。結(jié)果顯示,無(wú)論是在WMT24pp還是FLORES-200等通用翻譯測(cè)試集上,7B參數(shù)規(guī)模的Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B,其翻譯質(zhì)量均超過(guò)了現(xiàn)有的同等規(guī)模開(kāi)源模型,也優(yōu)于一些知名的商業(yè)翻譯系統(tǒng)和參數(shù)量遠(yuǎn)大于它的通用大模型。

特別是在中文與少數(shù)民族語(yǔ)言互譯這個(gè)方向上,混元MT的表現(xiàn)顯著優(yōu)于所有其他對(duì)比模型,這體現(xiàn)了其在低資源語(yǔ)言翻譯方向上的針對(duì)性優(yōu)化取得了成效。人工評(píng)測(cè)的結(jié)果也證實(shí)了這一點(diǎn),在包含社交、郵件、購(gòu)物、導(dǎo)航等多個(gè)生活場(chǎng)景的中英互譯測(cè)試中,Hunyuan-MT-7B的翻譯質(zhì)量與Gemini-2.5-Pro、DeepSeek-V3-0324等頂尖的大型模型處于同一水平,表明通過(guò)面向翻譯任務(wù)的系統(tǒng)性優(yōu)化,中等規(guī)模的模型同樣可以達(dá)到很高的翻譯水準(zhǔn)。

歡迎在評(píng)論區(qū)留言~
如需開(kāi)白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《叵測(cè)》和《鋼鐵森林》各看6集,一部已經(jīng)棄劇,一部熬夜狂追!

《叵測(cè)》和《鋼鐵森林》各看6集,一部已經(jīng)棄劇,一部熬夜狂追!

李虰手工制作
2026-04-04 08:47:03
晴天霹靂!東契奇常規(guī)賽報(bào)銷!!

晴天霹靂!東契奇常規(guī)賽報(bào)銷!!

柚子說(shuō)球
2026-04-04 08:18:07
比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

共工之錨
2026-03-29 18:26:19
去了一趟埃及才明白:當(dāng)?shù)厝藢?duì)中國(guó)制造的依賴,超乎你的想象

去了一趟埃及才明白:當(dāng)?shù)厝藢?duì)中國(guó)制造的依賴,超乎你的想象

復(fù)轉(zhuǎn)這些年
2026-04-03 13:29:19
這兩樁好事,上海男籃都要!

這兩樁好事,上海男籃都要!

新民晚報(bào)
2026-04-04 09:14:19
臺(tái)網(wǎng)紅“館長(zhǎng)”自曝遇人生最低潮,嘆“難道要支持貪污才有錢(qián)賺?”

臺(tái)網(wǎng)紅“館長(zhǎng)”自曝遇人生最低潮,嘆“難道要支持貪污才有錢(qián)賺?”

海峽導(dǎo)報(bào)社
2026-04-04 09:45:03
CCTV5直播!王楚欽迎戰(zhàn)大黑馬,孫穎莎沖擊3連冠,女單或包攬4強(qiáng)

CCTV5直播!王楚欽迎戰(zhàn)大黑馬,孫穎莎沖擊3連冠,女單或包攬4強(qiáng)

體育就你秀
2026-04-04 05:05:03
李綺虹移居加拿大22年,自曝住在人口稀少城市,每日素顏生活樸實(shí)

李綺虹移居加拿大22年,自曝住在人口稀少城市,每日素顏生活樸實(shí)

臨云史策
2026-04-03 12:04:33
伊朗圍著飛行員狩獵戰(zhàn)機(jī),美軍第二次波黑救援失敗,大批戰(zhàn)機(jī)出事

伊朗圍著飛行員狩獵戰(zhàn)機(jī),美軍第二次波黑救援失敗,大批戰(zhàn)機(jī)出事

堅(jiān)果甜瓜
2026-04-04 07:43:48
DDR5崩盤(pán)!黃牛囤了一屋子內(nèi)存!

DDR5崩盤(pán)!黃牛囤了一屋子內(nèi)存!

中國(guó)半導(dǎo)體論壇
2026-04-03 10:23:10
過(guò)去30年,中國(guó)三次忍辱負(fù)重“裝孫子”躲過(guò)美國(guó)阻擊,終迎大發(fā)展

過(guò)去30年,中國(guó)三次忍辱負(fù)重“裝孫子”躲過(guò)美國(guó)阻擊,終迎大發(fā)展

阿胡
2024-06-13 14:25:16
為什么不能讓家里女人掌握經(jīng)濟(jì)大權(quán) 網(wǎng)友講出一例例實(shí)例觸目驚心

為什么不能讓家里女人掌握經(jīng)濟(jì)大權(quán) 網(wǎng)友講出一例例實(shí)例觸目驚心

侃神評(píng)故事
2026-03-29 19:35:03
股市的風(fēng)險(xiǎn)正在聚集!價(jià)格已經(jīng)失效

股市的風(fēng)險(xiǎn)正在聚集!價(jià)格已經(jīng)失效

睿知睿見(jiàn)
2026-04-03 07:35:53
美以伊戰(zhàn)事進(jìn)入第三十六天,最新動(dòng)態(tài)

美以伊戰(zhàn)事進(jìn)入第三十六天,最新動(dòng)態(tài)

參考消息
2026-04-04 09:34:05
7歲女孩課間吵架后恐水,24小時(shí)內(nèi)離世,竟是3個(gè)月前留下的禍根

7歲女孩課間吵架后恐水,24小時(shí)內(nèi)離世,竟是3個(gè)月前留下的禍根

云景侃記
2026-04-03 17:17:22
下周行情(4.7日-10日)要點(diǎn)早知道

下周行情(4.7日-10日)要點(diǎn)早知道

玉名W
2026-04-04 09:50:12
再見(jiàn)!麻豆傳媒突然官宣,永久關(guān)停

再見(jiàn)!麻豆傳媒突然官宣,永久關(guān)停

我不叫阿哏
2026-04-03 15:25:28
澳門(mén)世界杯:4月4日賽程公布,國(guó)乒5人出戰(zhàn),小莫對(duì)決松島輝空

澳門(mén)世界杯:4月4日賽程公布,國(guó)乒5人出戰(zhàn),小莫對(duì)決松島輝空

乒談
2026-04-04 00:08:54
伊朗正以被擊落的F15戰(zhàn)機(jī)為誘餌,對(duì)救人心切的美軍實(shí)施圍點(diǎn)打援

伊朗正以被擊落的F15戰(zhàn)機(jī)為誘餌,對(duì)救人心切的美軍實(shí)施圍點(diǎn)打援

丹妮觀
2026-04-04 06:39:36
吃蘭州拉面的人為什么越來(lái)越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說(shuō)錯(cuò)話

吃蘭州拉面的人為什么越來(lái)越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說(shuō)錯(cuò)話

另子維愛(ài)讀史
2026-02-27 20:31:34
2026-04-04 10:24:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
258文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國(guó)產(chǎn)手機(jī)廠商集體漲價(jià)

頭條要聞

伊朗懸賞追捕美軍飛行員 呼吁民眾"看到他們就開(kāi)槍"

頭條要聞

伊朗懸賞追捕美軍飛行員 呼吁民眾"看到他們就開(kāi)槍"

體育要聞

被NBA選中20年后,他重新回到籃球場(chǎng)

娛樂(lè)要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

劉紀(jì)鵬:只盼長(zhǎng)慢牛,鞏固4000點(diǎn)是關(guān)鍵

汽車(chē)要聞

17萬(wàn)級(jí)海豹07EV 不僅續(xù)航長(zhǎng)還有9分鐘滿電的快樂(lè)

態(tài)度原創(chuàng)

手機(jī)
時(shí)尚
家居
本地
軍事航空

手機(jī)要聞

為什么友商都在漲,只有iPhone不漲價(jià),五點(diǎn)原因望周知!

Softfit穿搭火了,穿出春日松弛感和氛圍美

家居要聞

溫馨多元 愛(ài)的具象化

本地新聞

跟著歌聲游安徽,聽(tīng)古村回響

軍事要聞

俄國(guó)防部:一架蘇-30戰(zhàn)機(jī)在克里米亞墜毀

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版