国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

只靠國(guó)產(chǎn)算力預(yù)訓(xùn)練,穩(wěn)!全流程開源,「開元」盛世真來(lái)了

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】當(dāng)算力受限、數(shù)據(jù)參差,如何訓(xùn)練出高效可用的端側(cè)模型?鵬城實(shí)驗(yàn)室聯(lián)合清華不僅給出了答案,更將每一步都開源共享。

如果實(shí)驗(yàn)室只有國(guó)產(chǎn)算力、有限資源與開源數(shù)據(jù),能否玩轉(zhuǎn)端側(cè)模型的預(yù)訓(xùn)練?

鵬城實(shí)驗(yàn)室與清華大學(xué)PACMAN實(shí)驗(yàn)室聯(lián)合發(fā)布了鵬城腦海?2.1?開元?2B(PCMind?2.1?Kaiyuan?2B,簡(jiǎn)稱開元?2B)模型,并以全流程開源的方式回應(yīng)了這一挑戰(zhàn)——從訓(xùn)練數(shù)據(jù)、數(shù)據(jù)處理框架、訓(xùn)練框架、完整技術(shù)報(bào)告到最終模型權(quán)重,全部開源。


模型鏈接:https://huggingface.co/thu-pacman/PCMind-2.1-Kaiyuan-2B

數(shù)據(jù)集:https://huggingface.co/datasets/thu-pacman/PCMind-2.1-Kaiyuan-2B

技術(shù)報(bào)告:https://arxiv.org/abs/2512.07612

數(shù)據(jù)處理框架:https://github.com/thu-pacman/Kaiyuan-Spark

訓(xùn)練框架:https://github.com/thu-pacman/kaiyuan-mindformers


此次開源不僅為國(guó)內(nèi)研究者提供了一條可復(fù)現(xiàn)、可迭代的技術(shù)路徑,也展現(xiàn)了在國(guó)產(chǎn)計(jì)算平臺(tái)上實(shí)現(xiàn)高效、穩(wěn)定預(yù)訓(xùn)練的完整解決方案。

開元?2B的訓(xùn)練依托鵬城腦海 2計(jì)算平臺(tái),數(shù)據(jù)處理基于華為鯤鵬920,訓(xùn)練系統(tǒng)基于華為昇騰 910A。

由于昇騰910A僅支持FP16精度(類似于NVIDIA V100),訓(xùn)練穩(wěn)定性成為首要挑戰(zhàn)。

為此,研究團(tuán)隊(duì)在 Qwen3?1.7B 的架構(gòu)基礎(chǔ)上,引入了三明治范數(shù)(Sandwich Norm)軟裁剪(Soft Clipping)兩項(xiàng)關(guān)鍵技術(shù)。

三明治范數(shù)在Transformer每層前后保留歸一化層,有效控制梯度傳播中的數(shù)值范圍

軟裁剪通過對(duì)輸出logits應(yīng)用tanh非線性變換,將數(shù)值穩(wěn)定在合理區(qū)間內(nèi),防止訓(xùn)練發(fā)散




加上三明治范數(shù)和軟裁剪前后的數(shù)值穩(wěn)定性對(duì)比

這些技術(shù)不僅使訓(xùn)練在FP16環(huán)境下保持穩(wěn)定,也為后續(xù)國(guó)產(chǎn)平臺(tái)上的大規(guī)模訓(xùn)練提供了重要參考。

開源數(shù)據(jù)

去重、評(píng)價(jià)與高效利用

當(dāng)前開源預(yù)訓(xùn)練數(shù)據(jù)規(guī)模已達(dá)TB級(jí)別,來(lái)源多樣、質(zhì)量不均,如何從中篩選出高質(zhì)量部分并制定混合策略,是訓(xùn)練優(yōu)質(zhì)模型的基礎(chǔ)。

開元?2B面對(duì)兩個(gè)核心問題:

  1. 如何從海量數(shù)據(jù)中篩選高質(zhì)量子集?

  2. 如何在不同數(shù)據(jù)集之間建立統(tǒng)一的質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)?


全局去重的高效實(shí)現(xiàn):Kaiyuan?Spark框架

研究團(tuán)隊(duì)開發(fā)了Kaiyuan?Spark數(shù)據(jù)處理框架,采用樹狀流水線設(shè)計(jì),全程YAML配置管理,易于復(fù)現(xiàn)與擴(kuò)展。

結(jié)合諸葛弩計(jì)算框架進(jìn)行本地加速,在 MinHash 去重任務(wù)中實(shí)現(xiàn)端到端2.5倍的加速比,高效完成TB級(jí)數(shù)據(jù)的全局模糊去重。

分位標(biāo)定(Quantile Benchmarking)

為解決數(shù)據(jù)集之間質(zhì)量標(biāo)簽不可比的問題,團(tuán)隊(duì)提出分位標(biāo)定:通過設(shè)計(jì)小規(guī)模探針實(shí)驗(yàn),構(gòu)建數(shù)據(jù)質(zhì)量分?jǐn)?shù)與下游任務(wù)表現(xiàn)之間的映射關(guān)系。


分位標(biāo)定流程示意圖

具體做法為:從不同數(shù)據(jù)集中按質(zhì)量分位數(shù)抽取多個(gè)子集,然后使用小規(guī)模模型進(jìn)行訓(xùn)練測(cè)試,最后根據(jù)下游任務(wù)表現(xiàn)反向標(biāo)定各數(shù)據(jù)集的質(zhì)量區(qū)間。

該方法成本低、可遷移,為后續(xù)大規(guī)模訓(xùn)練的數(shù)據(jù)配比提供了科學(xué)依據(jù)。

關(guān)鍵發(fā)現(xiàn)

基于分位標(biāo)定,團(tuán)隊(duì)得出若干有趣發(fā)現(xiàn):

數(shù)據(jù)集的優(yōu)勢(shì)與任務(wù)類型相關(guān)

Fineweb?Edu在知識(shí)問答與閱讀理解類任務(wù)上表現(xiàn)更好,DCLM?Baseline 在常識(shí)推理類任務(wù)中略有優(yōu)勢(shì)。


DCLM Baseline和Fineweb-Edu在MMLU和WinoGrande上的分位標(biāo)定結(jié)果

同一數(shù)據(jù)集內(nèi)部質(zhì)量差異巨大

最高與最低質(zhì)量數(shù)據(jù)在ARC?Easy上的表現(xiàn)相差可達(dá)8%?15%


DCLM Baseline和Fineweb-Edu在ARC-Easy上的分位標(biāo)定結(jié)果

可以看到,高質(zhì)量數(shù)據(jù)占比雖小,卻是提升模型能力的關(guān)鍵。

數(shù)據(jù)利用策略

動(dòng)態(tài)調(diào)整與課程學(xué)習(xí)

針對(duì)數(shù)據(jù)分布不均的問題,開元?2B提出三個(gè)策略。

多階段動(dòng)態(tài)比例調(diào)整

隨著訓(xùn)練推進(jìn),逐步提升數(shù)學(xué)、代碼、中文等領(lǐng)域數(shù)據(jù)的比例,緩解模型遺忘,使關(guān)鍵領(lǐng)域在訓(xùn)練后期得到充分學(xué)習(xí)。


多階段調(diào)整數(shù)據(jù)比例

策略性數(shù)據(jù)重復(fù)


小規(guī)模實(shí)驗(yàn)表明,對(duì)高質(zhì)量數(shù)據(jù)進(jìn)行適度重復(fù)訓(xùn)練,效果優(yōu)于單輪訓(xùn)練。開元?2B在訓(xùn)練后期逐步提高高質(zhì)量數(shù)據(jù)的重復(fù)比例。

以Fineweb-Edu為例:Top 10%的高質(zhì)量數(shù)據(jù)在整個(gè)訓(xùn)練過程中出現(xiàn)多次,中低質(zhì)量數(shù)據(jù)僅出現(xiàn)一次,從而優(yōu)化數(shù)據(jù)效用分布。


Fineweb-Edu在多階段訓(xùn)練中采樣比例變化

多領(lǐng)域混合課程學(xué)習(xí)

研究團(tuán)隊(duì)提出Curriculum Decay Model Average,在課程學(xué)習(xí)的基礎(chǔ)上引入權(quán)重平均,緩解訓(xùn)練噪聲,提升收斂穩(wěn)定性。


論文鏈接:https://arxiv.org/abs/2511.18903

該方法通過領(lǐng)域內(nèi)質(zhì)量排序領(lǐng)域間比例均衡的結(jié)合,實(shí)現(xiàn)多領(lǐng)域數(shù)據(jù)的漸進(jìn)式學(xué)習(xí)。


學(xué)習(xí)率衰減會(huì)影響課程學(xué)習(xí)效果


不同學(xué)習(xí)率衰減條件下,最優(yōu)的課程學(xué)習(xí)+權(quán)重平均配置(Ascend+EMA)要強(qiáng)于最優(yōu)的常見做法(Uniform+WSD)


多領(lǐng)域課程的實(shí)現(xiàn)

配合精心設(shè)計(jì)的學(xué)習(xí)率調(diào)度方案,模型在高質(zhì)量數(shù)據(jù)上得以充分學(xué)習(xí),最終在多類評(píng)測(cè)中接近千問系列(僅開源權(quán)重)的模型表現(xiàn)。

全流程開源

推動(dòng)國(guó)產(chǎn)AI生態(tài)共建

開元?2B不僅是一次端側(cè)模型訓(xùn)練的實(shí)踐,更是一次全棧開源、全流程透明的技術(shù)示范。

從數(shù)據(jù)處理框架Kaiyuan?Spark、訓(xùn)練數(shù)據(jù)集,到數(shù)據(jù)評(píng)價(jià)體系、課程學(xué)習(xí)策略,所有環(huán)節(jié)均公開可復(fù)現(xiàn)。訓(xùn)練中涉及的所有原始數(shù)據(jù)集均具有寬松的開源協(xié)議(如CC、Apache、MIT、ODC等,詳細(xì)列表技術(shù)報(bào)告附錄B),個(gè)人、院校、企業(yè)均可自由使用,進(jìn)一步提升了訓(xùn)練的可復(fù)現(xiàn)性。

注:目前部分聲稱「開放」的公開數(shù)據(jù)集,事實(shí)上本身并非使用自由許可證授權(quán),或者間接混入了帶有非自由許可證的原始數(shù)據(jù);另有大量的公開數(shù)據(jù)集,對(duì)來(lái)源數(shù)據(jù)的許可證未加任何篩選或說明。在模型訓(xùn)練中使用此類數(shù)據(jù)集并發(fā)布或使用,都可能帶來(lái)潛在的法律合規(guī)風(fēng)險(xiǎn)。

這為國(guó)內(nèi)研究者在國(guó)產(chǎn)算力平臺(tái)上開展模型預(yù)訓(xùn)練提供了完整工具箱,也為構(gòu)建開放、協(xié)作的 AI 研發(fā)生態(tài)邁出堅(jiān)實(shí)一步。

模型權(quán)重、技術(shù)報(bào)告與相關(guān)代碼已在官方平臺(tái)發(fā)布,歡迎開發(fā)者、研究者共同參與測(cè)試、改進(jìn)與拓展。

結(jié)語(yǔ)

真正的技術(shù)進(jìn)步源自開放的協(xié)作與共享,開元?2B是一個(gè)起點(diǎn),未來(lái)與社區(qū)一起,在國(guó)產(chǎn)算力的土壤上,生長(zhǎng)出更多創(chuàng)新的AI成果,從開元系列,開啟國(guó)產(chǎn)算力訓(xùn)練的「開元盛世」。

附錄









左右滑動(dòng)查看

參考資料:

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
錢再多有啥用?身價(jià)上億美金的貝克漢姆現(xiàn)狀,給所有運(yùn)動(dòng)員提了醒

錢再多有啥用?身價(jià)上億美金的貝克漢姆現(xiàn)狀,給所有運(yùn)動(dòng)員提了醒

人間無(wú)味啊
2025-12-24 19:34:17
人生贏家!32歲蓉城國(guó)腳圣誕節(jié)領(lǐng)證,嬌妻驚艷:超模氣質(zhì)+大長(zhǎng)腿

人生贏家!32歲蓉城國(guó)腳圣誕節(jié)領(lǐng)證,嬌妻驚艷:超模氣質(zhì)+大長(zhǎng)腿

我愛英超
2025-12-25 21:10:49
外賣員深夜接到訂單,地址是郊區(qū)公墓,開門的竟是失蹤的未婚妻

外賣員深夜接到訂單,地址是郊區(qū)公墓,開門的竟是失蹤的未婚妻

罪案洞察者
2025-12-22 11:12:39
達(dá)成了!西蒙斯正式收購(gòu)!這可是NBA狀元秀

達(dá)成了!西蒙斯正式收購(gòu)!這可是NBA狀元秀

籃球?qū)崙?zhàn)寶典
2025-12-25 22:19:36
曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

古希臘掌管松餅的神
2025-12-24 13:29:23
外國(guó)人是如何被中餐征服的?網(wǎng)友:我這邊中餐廳都只有中國(guó)人吃

外國(guó)人是如何被中餐征服的?網(wǎng)友:我這邊中餐廳都只有中國(guó)人吃

帶你感受人間冷暖
2025-12-26 00:05:14
央視怒批!又一網(wǎng)紅食品暴雷,溢價(jià)66倍還傷肝腎,很多家庭都在吃

央視怒批!又一網(wǎng)紅食品暴雷,溢價(jià)66倍還傷肝腎,很多家庭都在吃

八斗小先生
2025-12-25 16:12:02
突發(fā)!知名港星舉家搬離香港移居深圳,宣布這輩子不再搬家

突發(fā)!知名港星舉家搬離香港移居深圳,宣布這輩子不再搬家

胡一舸南游y
2025-12-25 17:21:23
羅馬諾:曼聯(lián)已與魯本·內(nèi)維斯的經(jīng)紀(jì)人進(jìn)行談判;馬卡報(bào)記者:巴薩正努力永久簽下拉什福德

羅馬諾:曼聯(lián)已與魯本·內(nèi)維斯的經(jīng)紀(jì)人進(jìn)行談判;馬卡報(bào)記者:巴薩正努力永久簽下拉什福德

MUREDS
2025-12-25 23:52:18
從歐冠黑馬到降級(jí)熱門:赫羅納的崩盤,始于管理失敗

從歐冠黑馬到降級(jí)熱門:赫羅納的崩盤,始于管理失敗

樂道足球
2025-12-25 17:09:36
中方原油被搶,中美代表安理會(huì)激烈交鋒,美國(guó)這次玩砸了

中方原油被搶,中美代表安理會(huì)激烈交鋒,美國(guó)這次玩砸了

現(xiàn)代小青青慕慕
2025-12-25 19:57:59
錢再多有啥用?身價(jià)5億英鎊的貝克漢姆現(xiàn)狀,給所有運(yùn)動(dòng)員提了醒

錢再多有啥用?身價(jià)5億英鎊的貝克漢姆現(xiàn)狀,給所有運(yùn)動(dòng)員提了醒

洲洲影視娛評(píng)
2025-12-25 20:19:03
一夜爆兩冷門!總冠軍狂輸32分,昔日豪強(qiáng)慘敗黑馬,4位主帥下課

一夜爆兩冷門!總冠軍狂輸32分,昔日豪強(qiáng)慘敗黑馬,4位主帥下課

老吳說體育
2025-12-26 00:42:28
“毀掉”孩子內(nèi)驅(qū)力很簡(jiǎn)單,一直陪他寫作業(yè)就行,很多家長(zhǎng)還在做

“毀掉”孩子內(nèi)驅(qū)力很簡(jiǎn)單,一直陪他寫作業(yè)就行,很多家長(zhǎng)還在做

枕邊聊育兒
2025-12-24 09:02:59
官媒對(duì)成龍的稱呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話有人信了

官媒對(duì)成龍的稱呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話有人信了

振華觀史
2025-12-23 20:24:20
金價(jià)這么高,還能追漲嗎?世界黃金協(xié)會(huì):43%央行表示明年接著買

金價(jià)這么高,還能追漲嗎?世界黃金協(xié)會(huì):43%央行表示明年接著買

時(shí)代周報(bào)
2025-12-25 17:44:08
她真正值錢的不是那幾棟房子,而是北京地圖上那幾個(gè)

她真正值錢的不是那幾棟房子,而是北京地圖上那幾個(gè)

小光侃娛樂
2025-12-25 04:50:03
國(guó)防部:解放軍全時(shí)待戰(zhàn)、隨時(shí)能戰(zhàn)、戰(zhàn)之必勝

國(guó)防部:解放軍全時(shí)待戰(zhàn)、隨時(shí)能戰(zhàn)、戰(zhàn)之必勝

界面新聞
2025-12-25 15:58:25
國(guó)王大孫女獨(dú)美!英王室圣誕禮拜,金發(fā)夏洛特公主打假莉莉貝特

國(guó)王大孫女獨(dú)美!英王室圣誕禮拜,金發(fā)夏洛特公主打假莉莉貝特

另子維愛讀史
2025-12-25 21:51:31
恭喜!馬龍升任國(guó)家級(jí)教練,或成國(guó)乒競(jìng)聘大黑馬,執(zhí)教樊振東?

恭喜!馬龍升任國(guó)家級(jí)教練,或成國(guó)乒競(jìng)聘大黑馬,執(zhí)教樊振東?

法老不說教
2025-12-24 19:11:00
2025-12-26 01:56:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14182文章數(shù) 66397關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

韓國(guó)"最毒"財(cái)閥千金被捕 韓國(guó)人稱"經(jīng)過她身邊就會(huì)死"

頭條要聞

韓國(guó)"最毒"財(cái)閥千金被捕 韓國(guó)人稱"經(jīng)過她身邊就會(huì)死"

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財(cái)經(jīng)要聞

新規(guī)來(lái)了,年化超24%的小貸被即刻叫停

汽車要聞

速來(lái)!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
親子
時(shí)尚
軍事航空

藝術(shù)要聞

你絕對(duì)沒見過的美麗風(fēng)景,快來(lái)看看!

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬(wàn)家,又一波巨頭涌向海南!

親子要聞

祝福你的生活每天像糖一樣甜

冬季穿衣別顯得太臃腫!大衣收腰、搭配圍巾,有質(zhì)感又高級(jí)

軍事要聞

澤連斯基版“和平計(jì)劃”透露哪些信息

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版