国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Qwen3 Embedding:新一代文本表征與排序模型

0
分享至

點(diǎn)擊下方“JavaEdge”,選擇“設(shè)為星標(biāo)”

第一時(shí)間關(guān)注技術(shù)干貨!


免責(zé)聲明~ 任何文章不要過(guò)度深思! 萬(wàn)事萬(wàn)物都經(jīng)不起審視,因?yàn)槭郎蠜](méi)有同樣的成長(zhǎng)環(huán)境,也沒(méi)有同樣的認(rèn)知水平,更「沒(méi)有適用于所有人的解決方案」; 不要急著評(píng)判文章列出的觀點(diǎn),只需代入其中,適度審視一番自己即可,能「跳脫出來(lái)從外人的角度看看現(xiàn)在的自己處在什么樣的階段」才不為俗人。 怎么想、怎么做,全在乎自己「不斷實(shí)踐中尋找適合自己的大道」

本文已收錄在Github,關(guān)注我,緊跟本系列專欄文章,咱們下篇再續(xù)!

  • 魔都架構(gòu)師 | 全網(wǎng)30W技術(shù)追隨者

  • 大廠分布式系統(tǒng)/數(shù)據(jù)中臺(tái)實(shí)戰(zhàn)專家

  • 主導(dǎo)交易系統(tǒng)百萬(wàn)級(jí)流量調(diào)優(yōu) & 車聯(lián)網(wǎng)平臺(tái)架構(gòu)

  • AIGC應(yīng)用開(kāi)發(fā)先行者 | 區(qū)塊鏈落地實(shí)踐者

  • 以技術(shù)驅(qū)動(dòng)創(chuàng)新,我們的征途是改變世界!

  • 實(shí)戰(zhàn)干貨:編程嚴(yán)選網(wǎng)

本文已收錄在Github,關(guān)注我,緊跟本系列專欄文章,咱們下篇再續(xù)!

  • 魔都架構(gòu)師 | 全網(wǎng)30W技術(shù)追隨者

  • 大廠分布式系統(tǒng)/數(shù)據(jù)中臺(tái)實(shí)戰(zhàn)專家

  • 主導(dǎo)交易系統(tǒng)百萬(wàn)級(jí)流量調(diào)優(yōu) & 車聯(lián)網(wǎng)平臺(tái)架構(gòu)

  • AIGC應(yīng)用開(kāi)發(fā)先行者 | 區(qū)塊鏈落地實(shí)踐者

  • 以技術(shù)驅(qū)動(dòng)創(chuàng)新,我們的征途是改變世界!

  • 實(shí)戰(zhàn)干貨:編程嚴(yán)選網(wǎng)

qwen正式發(fā)布 Qwen3 Embedding 系列模型, Qwen 模型家族的新成員。該系列模型專為文本表征、檢索與排序任務(wù)設(shè)計(jì),基于 Qwen3 基礎(chǔ)模型進(jìn)行訓(xùn)練,充分繼承了 Qwen3 在多語(yǔ)言文本理解能力方面的優(yōu)勢(shì)。在多項(xiàng)基準(zhǔn)測(cè)試中,Qwen3 Embedding 系列在文本表征和排序任務(wù)中展現(xiàn)了卓越的性能。 qwen使用了 Apache 2.0 協(xié)議在 Hugging Face 和 ModelScope 上開(kāi)源了這一系列的文本表征及排序模型,并在 GitHub 公布了技術(shù)報(bào)告及相關(guān)代碼。

排序模型評(píng)測(cè)結(jié)果

Model

Param

MTEB-R

CMTEB-R

MMTEB-R

MLDR

MTEB-Code

FollowIR

Qwen3-Embedding-0.6B

0.6B

5.09

Jina-multilingual-reranker-v2-base

0.3B

gte-multilingual-reranker-base

0.3B

BGE-reranker-v2-m3

0.6B

Qwen3-Reranker-0.6B

0.6B

5.41

Qwen3-Reranker-4B

4B

Qwen3-Reranker-8B

8B

8.05

★ Note: q'wen使用MTEB(eng, v2), MTEB(cmn, v1), MTEB (Multilingual) 以及MTEB (Code)中的檢索數(shù)據(jù)集進(jìn)行測(cè)試, 分別記作MTEB-R, CMTEB-R, MMTEB-R, MTEB-Code. 排序結(jié)果基于Qwen3-Embedding-0.6B的top-100向量召回結(jié)果進(jìn)行排序. ”

主要特點(diǎn):

卓越的泛化性: Qwen3 Embedding 系列在多個(gè)下游任務(wù)評(píng)估中達(dá)到行業(yè)領(lǐng)先水平。其中,8B 參數(shù)規(guī)模的Embedding模型在MTEB多語(yǔ)言Leaderboard榜單中位列第一(截至 2025 年 6 月 5 日,得分70.58),性能超越眾多商業(yè) API 服務(wù)。此外,該系列的排序模型在各類文本檢索場(chǎng)景中表現(xiàn)出色,顯著提升了搜索結(jié)果的相關(guān)性。

靈活的模型架構(gòu): Qwen3 Embedding 系列提供從 0.6B 到 8B 參數(shù)規(guī)模的 3 種模型配置,以滿足不同場(chǎng)景下的性能與效率需求。開(kāi)發(fā)者可以靈活組合表征與排序模塊,實(shí)現(xiàn)功能擴(kuò)展。此外,模型支持以下定制化特性:1) 表征維度自定義:允許用戶根據(jù)實(shí)際需求調(diào)整表征維度,有效降低應(yīng)用成本;2) 指令適配優(yōu)化:支持用戶自定義指令模板,以提升特定任務(wù)、語(yǔ)言或場(chǎng)景下的性能表現(xiàn)。

全面的多語(yǔ)言支持: Qwen3 Embedding 系列支持超過(guò) 100 種語(yǔ)言,涵蓋主流自然語(yǔ)言及多種編程語(yǔ)言。該系列模型具備強(qiáng)大的多語(yǔ)言、跨語(yǔ)言及代碼檢索能力,能夠有效應(yīng)對(duì)多語(yǔ)言場(chǎng)景下的數(shù)據(jù)處理需求。

模型總覽

Model Type

Models

Size

Layers

Sequence Length

Embedding Dimension

MRL Support

Instruction Aware

Text Embedding

Qwen3-Embedding-0.6B

0.6B

28

32K

1024

Yes

Yes

Qwen3-Embedding-4B

4B

36

32K

2560

Yes

Yes

Qwen3-Embedding-8B

8B

36

32K

4096

Yes

Yes

Text Reranking

Qwen3-Reranker-0.6B

0.6B

28

32K

Yes

Qwen3-Reranker-4B

4B

36

32K

Yes

Qwen3-Reranker-8B

8B

36

32K

Yes

注:MRL Support表示 Embedding 模型是否支持最終向量的自定義維度。Instruction Aware表示 Embedding 或 Reranking 模型是否支持根據(jù)不同任務(wù)定制輸入指令。

模型架構(gòu)

基于 Qwen3 基礎(chǔ)模型, qwen的 Embedding 模型和 Reranking 模型分別采用了雙塔結(jié)構(gòu)和單塔結(jié)構(gòu)的設(shè)計(jì)。通過(guò) LoRA 微調(diào), qwen最大限度地保留并繼承了基礎(chǔ)模型的文本理解能力。具體實(shí)現(xiàn)如下:1) Embedding 模型接收單段文本作為輸入,取模型最后一層[EOS]標(biāo)記對(duì)應(yīng)的隱藏狀態(tài)向量,作為輸入文本的語(yǔ)義表示;2) Reranking 模型則接收文本對(duì)(例如用戶查詢與候選文檔)作為輸入,利用單塔結(jié)構(gòu)計(jì)算并輸出兩個(gè)文本的相關(guān)性得分。

Qwen3 Embedding 系列模型的訓(xùn)練繼承了 GTE-Qwen 系列的多階段訓(xùn)練范式,但針對(duì)具體應(yīng)用場(chǎng)景進(jìn)行了深度優(yōu)化。在 Embedding 模型的訓(xùn)練過(guò)程中, qwen采用三階段訓(xùn)練架構(gòu):第一階段通過(guò)超大規(guī)模弱監(jiān)督數(shù)據(jù)進(jìn)行對(duì)比學(xué)習(xí)預(yù)訓(xùn)練;第二階段基于高質(zhì)量標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練;最終通過(guò)模型融合策略融合多個(gè)候選模型,以提升整體性能。這種分階段訓(xùn)練機(jī)制有效平衡了模型的泛化能力與任務(wù)適配性。

在 Reranking 模型的訓(xùn)練中,基于實(shí)驗(yàn)驗(yàn)證結(jié)果, qwen直接采用高質(zhì)量標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練,以提升訓(xùn)練效率。特別需要說(shuō)明的是,在 Embedding 模型的第一階段弱監(jiān)督訓(xùn)練中, qwen構(gòu)建了多任務(wù)適配的 Prompt 體系,利用 Qwen3 基礎(chǔ)模型的文本生成能力, qwen針對(duì)不同任務(wù)類型和語(yǔ)言特性,動(dòng)態(tài)生成了一系列弱監(jiān)督文本對(duì),突破了傳統(tǒng)方法依賴社區(qū)論壇或開(kāi)源數(shù)據(jù)篩選獲取弱監(jiān)督文本對(duì)的局限性,實(shí)現(xiàn)了大規(guī)模弱監(jiān)督數(shù)據(jù)的高效生成。

Qwen3 Embedding 系列模型是一個(gè)新的起點(diǎn),依托于 Qwen 基礎(chǔ)模型的持續(xù)優(yōu)化, qwen將繼續(xù)提升文本表征與排序模型的訓(xùn)練效率,以增強(qiáng)模型在實(shí)際場(chǎng)景中的部署性能。此外, qwen還計(jì)劃拓展多模態(tài)表征體系,構(gòu)建跨模態(tài)語(yǔ)義理解能力。 qwen期待更多開(kāi)發(fā)者基于 Qwen3 Embedding 系列探索更廣泛的應(yīng)用場(chǎng)景,推動(dòng)模型在不同業(yè)務(wù)場(chǎng)景中的深入應(yīng)用。

加我好友,一起AI探索交流!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

劍道萬(wàn)古似長(zhǎng)夜
2026-01-11 10:49:28
36歲哺乳期媽媽在私人工作室打玻尿酸,喊了聲疼后單眼永久性失明

36歲哺乳期媽媽在私人工作室打玻尿酸,喊了聲疼后單眼永久性失明

半島晨報(bào)
2026-01-11 20:44:48
德媒認(rèn)為,即便解放軍在臺(tái)灣實(shí)施斬首戰(zhàn)術(shù),中國(guó)得手的可能也不高

德媒認(rèn)為,即便解放軍在臺(tái)灣實(shí)施斬首戰(zhàn)術(shù),中國(guó)得手的可能也不高

安安說(shuō)
2026-01-12 09:39:31
神仙姐姐的野生圖,太美了。

神仙姐姐的野生圖,太美了。

微微熱評(píng)
2026-01-09 12:20:53
78年,我和弟弟去大伯家借10斤大米,回家后母親敞開(kāi)米袋子哭了

78年,我和弟弟去大伯家借10斤大米,回家后母親敞開(kāi)米袋子哭了

小月文史
2024-08-30 15:32:41
24歲才進(jìn)NBA薪水卻提升了700倍,32歲數(shù)據(jù)不降反升,他是勵(lì)志代表

24歲才進(jìn)NBA薪水卻提升了700倍,32歲數(shù)據(jù)不降反升,他是勵(lì)志代表

大衛(wèi)的籃球故事
2026-01-12 10:14:51
弗里克神了!率巴薩衛(wèi)冕西超杯斬獲4冠,拉菲尼亞:沒(méi)他我早走了

弗里克神了!率巴薩衛(wèi)冕西超杯斬獲4冠,拉菲尼亞:沒(méi)他我早走了

聽(tīng)我說(shuō)球
2026-01-12 09:36:45
許利民怒批球員擺大牌!賽后整頓更衣室,怒批一人不是周琦而是他

許利民怒批球員擺大牌!賽后整頓更衣室,怒批一人不是周琦而是他

理工男評(píng)籃球
2026-01-12 00:01:12
星光大賞生圖成“照妖鏡”,排骨胸、假屁股,女星真實(shí)樣貌全暴露

星光大賞生圖成“照妖鏡”,排骨胸、假屁股,女星真實(shí)樣貌全暴露

八卦南風(fēng)
2025-12-22 11:20:59
出大事了,高市13天后要下臺(tái),日本突然棄美投韓,兩國(guó)秘密結(jié)盟

出大事了,高市13天后要下臺(tái),日本突然棄美投韓,兩國(guó)秘密結(jié)盟

阿器談史
2026-01-11 17:20:31
多家設(shè)計(jì)院中層年薪被曝光!

多家設(shè)計(jì)院中層年薪被曝光!

黯泉
2026-01-11 23:26:46
霍啟剛公布個(gè)人名下財(cái)產(chǎn)!全球共有35個(gè)物業(yè),收租頗豐生活卻節(jié)儉

霍啟剛公布個(gè)人名下財(cái)產(chǎn)!全球共有35個(gè)物業(yè),收租頗豐生活卻節(jié)儉

阿纂看事
2026-01-10 22:39:19
聯(lián)賽第一!上海末節(jié)只丟8分大勝山西豪取9連勝 洛夫頓29+15

聯(lián)賽第一!上海末節(jié)只丟8分大勝山西豪取9連勝 洛夫頓29+15

醉臥浮生
2026-01-11 21:38:17
演員孫濤力挺閆學(xué)晶后續(xù):抖音評(píng)論區(qū)徹底淪陷了,各種調(diào)侃他

演員孫濤力挺閆學(xué)晶后續(xù):抖音評(píng)論區(qū)徹底淪陷了,各種調(diào)侃他

小徐講八卦
2026-01-10 14:14:29
雙匯創(chuàng)始人萬(wàn)?。撼鲕壟貢?shū)20年,給美國(guó)輸送35億,卻被兒子揭發(fā)

雙匯創(chuàng)始人萬(wàn)?。撼鲕壟貢?shū)20年,給美國(guó)輸送35億,卻被兒子揭發(fā)

火之文
2026-01-11 16:45:05
4-1逆轉(zhuǎn)!阿森納成功翻盤,曼城切爾西紛紛晉級(jí),熱刺早早出局

4-1逆轉(zhuǎn)!阿森納成功翻盤,曼城切爾西紛紛晉級(jí),熱刺早早出局

足球狗說(shuō)
2026-01-12 00:00:29
伊朗抗議難動(dòng)搖伊斯蘭共和國(guó)根基,但美以軍事干涉變量不可控

伊朗抗議難動(dòng)搖伊斯蘭共和國(guó)根基,但美以軍事干涉變量不可控

澎湃新聞
2026-01-12 10:04:30
中國(guó)“南天門計(jì)劃”曝光:十萬(wàn)噸級(jí)空天母艦“鸞鳥(niǎo)”可搭載88架“玄女”無(wú)人空天戰(zhàn)機(jī),能在大氣層外作戰(zhàn),使用粒子加速炮、高超聲速導(dǎo)彈等武器

中國(guó)“南天門計(jì)劃”曝光:十萬(wàn)噸級(jí)空天母艦“鸞鳥(niǎo)”可搭載88架“玄女”無(wú)人空天戰(zhàn)機(jī),能在大氣層外作戰(zhàn),使用粒子加速炮、高超聲速導(dǎo)彈等武器

每日經(jīng)濟(jì)新聞
2026-01-11 16:30:15
茅臺(tái)鎮(zhèn)一酒廠91噸基酒拍賣,僅1人報(bào)名,評(píng)估價(jià)548萬(wàn),以373萬(wàn)元成交

茅臺(tái)鎮(zhèn)一酒廠91噸基酒拍賣,僅1人報(bào)名,評(píng)估價(jià)548萬(wàn),以373萬(wàn)元成交

紅星新聞
2026-01-11 13:19:15
特朗普稱在考慮干預(yù)伊朗局勢(shì)的“強(qiáng)硬選項(xiàng)”

特朗普稱在考慮干預(yù)伊朗局勢(shì)的“強(qiáng)硬選項(xiàng)”

新華社
2026-01-12 09:35:21
2026-01-12 10:32:49
JavaEdge incentive-icons
JavaEdge
Java 技術(shù)
466文章數(shù) 457關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

牛彈琴:新的戰(zhàn)爭(zhēng)一觸即發(fā) 美國(guó)和以色列可能弄巧成拙

頭條要聞

牛彈琴:新的戰(zhàn)爭(zhēng)一觸即發(fā) 美國(guó)和以色列可能弄巧成拙

體育要聞

U23國(guó)足形勢(shì):末輪不負(fù)泰國(guó)即確保晉級(jí)

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

時(shí)尚
健康
數(shù)碼
教育
公開(kāi)課

普通人就該照搬這些穿搭!衣服不用買太貴,自然耐看又舒適

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

2025年中國(guó)電視出貨量創(chuàng)下16年新低 同比下滑8.5%

教育要聞

學(xué)霸要怎么培養(yǎng)?我從管理的角度聊一聊!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版