国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

神仙打架+1!訊飛星火X2硬核亮相,行業(yè)深度全面升級

0
分享至

鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

今天,國產大模型再次迎來硬核進階!

科大訊飛小年放出推理王炸——星火大模型X2。

什么概念呢?從星火X1.5到星火X2,僅僅間隔3個月,推理性能直接飆升50%~

不僅快,而且猛。更重要的是,完全基于國產算力



一方面,模型通用能力突出,Benchmark評測穩(wěn)居行業(yè)一流水平,即使是和GPT-5.2、Gemini-3-Pro這些國際頂尖模型同臺競技也毫不遜色。

尤其是在數學計算、邏輯推理等核心能力上表現亮眼;同時130多種語言綜合能力依舊穩(wěn)穩(wěn)在線,繼續(xù)保持“國家隊”水準。



另一方面,星火X2將升級的重點放在了場景落地上。

依靠深度優(yōu)化的算法、高質量垂域數據和行業(yè)專家的參與,三位一體推動行業(yè)大模型更進一步,為各行各業(yè)提供更精準、更具實操性的支持。

正如科大訊飛董事長劉慶峰在1024開發(fā)者節(jié)所說——做更懂你的AI,滿血歸來的星火X2現在用通用底座+行業(yè)專才雙輪驅動,再次印證了其在國產大模型賽道的實踐底氣。

通用能力全面升級

星火大模型作為訊飛AI架構的底層基石,按照慣例,每一次升級,都有著顯著的能力躍遷。

這一次更甚:直接將深度推理訓練效率再度提升50%

眾所周知,隨著Scaling Laws邊際效益遞減,越到后期,大模型性能提升就越難。即使是1%的能力躍遷,都意味著算力和算法的指數級倍增。

而在行業(yè)普遍面臨增長瓶頸的當下,星火X2能夠實現50%的性能躍遷實屬不易。

其背后釋放的信號,比數字本身更值得深思,這透露出科大訊飛在模型核心架構和技術上有了更深層次的突破。

具體先看核心能力對比。

橫向對比來看,星火X2 Thinking的各項評分已經穩(wěn)居國產第一梯隊,在多個維度上也與GPT-5.2 (xhigh)和Gemini-3-Pro非常接近。

其中,在多語言和翻譯能力上顯著優(yōu)于友商模型,在數學和邏輯推理上也緊隨GPT和Gemini其后。



再看星火X2在高難度基準測試中的表現,可以說含金量杠杠的。

比如在AIME 2025測試中,星火X2斬獲95.7分,僅次于GPT-5.2 (xhigh),展現出其處理競賽級數學的頂尖能力。

在MMLU Pro里,星火X2的87.3分不僅在國產模型中奪冠,且與GPT-5.2持平,說明其知識廣度和深度已達國際一流水準。

在代表未來方向的智能體維度上,星火X2也是再度領跑國產模型,驗證了它在理解復雜指令和調用工具方面的進階。



總的來說,星火X2在數據上的亮眼表現,不僅彰顯了訊飛在數學和邏輯推理領域的領先地位,更標志著其通用智力已足以比肩國際頂尖模型。

接下來咱們還是實測見真章。

先來一道去年11月哈佛-麻省理工數學錦標賽(HMMT)里的英文題目試試水~

之所以選擇這個題目,一則是避免數據污染,題目比較新,能夠避免模型“見”過該題目;其二是HMMT是全球難度最高的數學競賽之一,能夠更好地考驗星火X2的即時邏輯推理能力。

  • A positive integer n is imbalanced if strictly more than 99 percent of the positive divisors of n are strictly less than 1 percent of n. Given that M is an imbalanced multiple of 2000, compute the minimum possible number of positive divisors of M.



果不其然非常出色,星火X2迅速給出了詳細的解答過程和正確答案。換言之,它徹底吃透了英文數學題目的底層邏輯,而非簡單依賴中文語境。



再試試西班牙語:



同樣也是流暢給出了正確結果。



那么它是如何做到的呢?

首先,星火X2在模型架構上繼承了星火X1.5的MoE稀疏架構,參數同樣為293B。

但與之不同的是,在星火X1.5的基礎之上,星火X2結合權重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信進行了針對性技術創(chuàng)新:

  • 訓推采樣校準強化學習算法:

在大模型,尤其是MoE架構中,往往存在訓推分布不一致的問題,這會導致模型在訓練階段學到的規(guī)律無法直接適用到實際推理應用中,甚至會出現模型性能坍塌。

為此,星火X2提出訓練與推理概率重采樣自適應校準算法,讓算法能夠根據訓練的實時進度,自動調整校準力度,確保專家模型能夠時刻保持邏輯閉環(huán)。

  • 遞歸式高難數據合成方法:

在模型訓練中,由于深度推理數據極度匱乏,星火X2專門設計了多輪迭代式推導的數據合成方案。

通過多輪迭代和遞歸修正,能夠最終形成一套從問題到正確推導過程的高質量語料,完成對模型深度推理準確率的提升。

  • 多階段RL高吞吐采樣方法:

在突破國產算力瓶頸上,星火X2設計了P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案。

他們將大模型推理過程中物理特性完全不同的兩個階段——Prefill(預填充)和Decoding(解碼),從硬件執(zhí)行層面進行徹底分離,直接解決了國產化平臺在高吞吐采樣下的效率干擾,訓練效率提升10%。

  • 服務高性能部署優(yōu)化算法:

這一步是讓星火X2推理性能大幅度提升的關鍵。

通過對模型進行輕量化壓縮,可實現單臺服務器內部的批量專家并行,也就是單機大EP并行部署。

充分解決了國產算力平臺的關鍵瓶頸——輕量化落地高效推理,讓模型不僅能跑,還能跑得快。

帶動行業(yè)大模型實現突破

除了通用能力的全面釋放,星火大模型此次升級的重中之重,在于深度場景化。

這是科大訊飛從星火大模型誕生之初,就始終強調的核心邏輯:要在發(fā)展技術力的同時,更注重技術與用戶體驗、場景落地的結合。


圖片源自智能超參數

具體體現在醫(yī)療、教育、汽車和智能體四個方面:

賦能醫(yī)療領域,持續(xù)保持業(yè)界領先

依托星火X2底座的算力優(yōu)化與推理躍遷,星火醫(yī)療大模型的核心能力也得到了全面進化,繼續(xù)保持行業(yè)翹楚。

在基于居民健康檔案的智能健康分析、智能報告解讀、運動飲食建議、輔助診療、智能用藥審核等高精度核心場景中,星火大模型更是顯著優(yōu)于GPT-5.2和另外兩款國產大模型,樹立了醫(yī)療專業(yè)大模型的新標桿。



此外,星火醫(yī)療大模型也已率先通過上海市醫(yī)療大模型應用檢測驗證中心評測驗證。

這是國內首個專門針對醫(yī)療大模型的評測平臺,代表了目前國內最頂尖、最權威的標準,說明訊飛已經在醫(yī)療AI合規(guī)上走到了行業(yè)前列。

而在面向用戶的C端,“訊飛曉醫(yī)”APP也同步完成升級,包括多輪主動問診、多輪咨詢問答、問用藥、檢查檢驗單解讀、體檢報告單解讀等多任務。



可見,“訊飛曉醫(yī)”在星火X2的加持下,已經成為了普通用戶可用的且能力業(yè)界頂尖的數字醫(yī)生。

賦能教育領域,實現個性化教學

而在教育領域,星火大模型也讓原先基礎的搜索工具,進化為一對一特級老師。

其率先上線錯因貫穿的個性化學習能力,能夠通過你的整張卷子、整道題的解題思路,精準捕捉到你的知識點黑洞,比如是定理沒記牢呢,還是運算粗心大意了。

同時它能夠像閱卷老師一樣,在錯誤之處精準批注,實現步驟級批改。

這種模式下,AI更符合蘇格拉底式的教學理念,也就是通過不斷提問,引導學生自己思考并得出結論。

它不是直接告訴學生答案,而是教會學生如何進行思維拆解、如何自己悟出來。而這類啟發(fā)式講解,也是未來AI教育的主導路線。



體現在硬件上,就是科大訊飛的AI學習機。它在1對1精準學、答疑輔導和互動課等多功能上,持續(xù)領先同行業(yè),能夠幫助學生更精準地提高學習效率,以及增強學習興趣。

賦能汽車領域,全面升級智能座艙交互系統(tǒng)

與此同時,星火大模型在多尺寸中小模型上也同步進行了升級,并精準將其應用在汽車智能座艙交互系統(tǒng)中。

過去用戶必須說出精準指令才能實現交互,比如調低空調至24度。但如果說“我有點冷”或者“風太大”這類模糊指令,系統(tǒng)往往只會回復“對不起,我沒有聽懂”。

但現在這個問題隨著星火X2的到來迎刃而解。

模型在人人/人機對話判斷、模糊意圖理解、高情商回復等方面的交互體驗顯著提升,尤其是在模糊意圖上實現了跨越式突破,終于具備了實際可用的語義聯(lián)想和推理能力。



賦能智能體平臺和精品智能體新升級

另外值得關注的是,智能體的突破。

星火X2從根本上解決了智能體在工作環(huán)境中長期以來的痛點,在長時復雜任務規(guī)劃、多工具組合調用以及長上下文等方面均實現了顯著提升。

其中星辰Agent平臺,整合了語音識別、語音交互、圖像理解等百余種能力,集成超130萬個智能體,在星火X2幫助下,進一步強化了智能體在思考和執(zhí)行上的表現,更能支撐起復雜的企業(yè)場景。

比如面向企業(yè)采購場景的招采智能體,核心場景效率提升超3倍,還能像搭積木一樣定制專用智能體,開發(fā)時間從原先的幾天直接縮短至分鐘級。

目前訊飛開放平臺已正式上線星火X2 API,平臺新注冊開發(fā)者可直接領取100萬Tokens免費額度

在訊飛星火網頁版和APP均可體驗,星火APP 5.2.0新版本也同步上線~

國產算力突圍下的訊飛星火

總的來說,星火X2更像是一塊國產算力的試金石。

在過去幾年里,國內AI行業(yè)發(fā)展受限的根本原因就在于算力。算力被扼住脖子后,模型性能始終無法突破國際一流水平。

而當所有人都在質疑國產算力時,訊飛咬牙給它做成了。而且是國內主流大模型中,唯一基于全國產算力訓練的通用大模型。



模型實現了完全自主可控,一是算力自主,模型的訓練和推理過程完全基于全國產算力平臺;二是技術自主,整個模型框架均由訊飛自研,在此基礎上構建起特有的研發(fā)生態(tài)。

核心原因就在于訊飛走了最務實的一條路:不再單純追求實驗室里的高分,而是依據自己深耕多年的行業(yè)經驗一舉扎根在最難的場景應用中。

訊飛順勢提出了“1+N”戰(zhàn)略,即1個通用底座大模型,和N個底座大模型賦能的多領域行業(yè)大模型,然后通過軟硬一體化,讓大模型搭載到硬件上,以看得見摸得著的方式迅速落地轉化。

簡單來說,訊飛的差異化路徑就是底座自主、硬件協(xié)同、場景為王

而星火X2反向證明了這條路值得繼續(xù)探索,即使是在算力重壓下,單靠算法創(chuàng)新和場景優(yōu)化也能補足當中的差距,換來中國AI在全行業(yè)的先發(fā)優(yōu)勢。

顯然,國產大模型已步入應用紅利期,而訊飛率先摘到了果實。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
給人養(yǎng)了7年閑人,廣汽終于要關閉洛杉磯的研發(fā)中心

給人養(yǎng)了7年閑人,廣汽終于要關閉洛杉磯的研發(fā)中心

與車同樂
2025-12-04 10:05:02
小楊阿姨在老家休假,直播揭露馬筱梅生產內幕,憂心失業(yè)!

小楊阿姨在老家休假,直播揭露馬筱梅生產內幕,憂心失業(yè)!

古希臘掌管月桂的神
2026-02-24 20:03:51
無名指超食指長之人,這4樣東西別去碰,恐會泄漏你的福氣!

無名指超食指長之人,這4樣東西別去碰,恐會泄漏你的福氣!

一根香煙的少女
2025-09-22 16:52:27
巴拿馬政府強行接管長和營運的兩個港口,中方回應:將堅決維護企業(yè)的正當合法權益!

巴拿馬政府強行接管長和營運的兩個港口,中方回應:將堅決維護企業(yè)的正當合法權益!

每日經濟新聞
2026-02-24 18:05:18
斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

達文西看世界
2026-01-18 20:56:11
美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

觸摸史跡
2026-02-22 23:53:20
黃金大變,一落千丈

黃金大變,一落千丈

戶外釣魚哥阿旱
2026-02-25 02:28:17
特朗普八成來不了|吹訪問北京熱過頭,玩梗太低級,會出幺蛾子嗎

特朗普八成來不了|吹訪問北京熱過頭,玩梗太低級,會出幺蛾子嗎

薦史
2026-02-25 02:06:46
林強涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責任

林強涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責任

一盅情懷
2026-02-24 13:46:35
過年如果沒人找你吃飯、喝茶、聚會,電話幾乎沒有,說明3個問題

過年如果沒人找你吃飯、喝茶、聚會,電話幾乎沒有,說明3個問題

木言觀
2026-02-23 14:37:20
虎跳峽8歲男童墜亡:不是意外,是父親兩次糊涂操作,親手斷生路

虎跳峽8歲男童墜亡:不是意外,是父親兩次糊涂操作,親手斷生路

老特有話說
2026-02-24 17:19:32
芯片還沒量產,先產300個“臺積寶寶”!這產能太驚人!

芯片還沒量產,先產300個“臺積寶寶”!這產能太驚人!

達文西看世界
2026-02-24 20:28:49
不要輕易做手術!醫(yī)生提醒:62歲后,這5類手術可盡量避免

不要輕易做手術!醫(yī)生提醒:62歲后,這5類手術可盡量避免

今日養(yǎng)生之道
2026-02-15 14:14:53
伊朗要死!

伊朗要死!

求實處
2026-02-22 17:53:28
以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

八斗小先生
2025-12-26 09:33:27
美國深夜收到消息:中國發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

美國深夜收到消息:中國發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

東極妙嚴
2026-02-24 15:24:06
這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

蜉蝣說
2026-01-29 14:46:50
事實證明,《鏢人》不是輸給了《飛馳人生3》,而是輸給了自己

事實證明,《鏢人》不是輸給了《飛馳人生3》,而是輸給了自己

娛樂圈筆娛君
2026-02-24 16:27:26
河南打人事件后續(xù):傷情鑒定已出,家屬拒和解,打人夫妻會判刑嗎

河南打人事件后續(xù):傷情鑒定已出,家屬拒和解,打人夫妻會判刑嗎

奇思妙想草葉君
2026-02-24 22:13:45
大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

青仔的世界
2026-02-16 11:54:44
2026-02-25 03:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12196文章數 176392關注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機器人Unitree As2

頭條要聞

男子摟住繼女強吻動作親密 當地婦聯(lián)介入

頭條要聞

男子摟住繼女強吻動作親密 當地婦聯(lián)介入

體育要聞

蘇翊鳴總結米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經要聞

縣城消費「限時繁榮」了十天

汽車要聞

入門即滿配 威蘭達AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

本地
親子
游戲
藝術
公開課

本地新聞

春花齊放2026:《駿馬奔騰迎新歲》

親子要聞

如果你們生在清朝,可能都是特權階級了

LOL傳奇選手公布戀情!發(fā)博曬照被夸夫妻相,女方身份曝光

藝術要聞

投資95億,高428米!海南第一高樓最新進展

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版