国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

0
分享至



作者 商迪安

喧囂的紅包大戰(zhàn)之外,推理模型成為大模型廠商競爭的無聲戰(zhàn)場。去年12月24日,字節(jié)跳動Seed團隊宣布推出形式化數(shù)學(xué)推理專用模型Seed Prover 1.5。1月26日,阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking。2月11日,科大訊飛升級發(fā)布旗下深度推理模型星火X2。

美國公司把推理當(dāng)作通往通用智能的必經(jīng)臺階,中國公司則把它當(dāng)作下一輪商業(yè)化的分水嶺:當(dāng)多模態(tài)把輸入做得更豐富、通用模型把對話做得更順滑,推理模型開始把重點放在另一件事上——更穩(wěn)定的思考鏈路、更可控的輸出邊界、更高的準(zhǔn)確率與一致性。三條路線正在分野:多模態(tài)追求感知與交互的上限,通用模型追求覆蓋與成本的平衡,推理模型追求把復(fù)雜問題拆解、把結(jié)果做對、把過程跑穩(wěn)。

科大訊飛選的是第三條,而且?guī)缀跏侵袊竽P凸纠镒睢皩μ柸胱钡倪x擇。訊飛的優(yōu)勢從來不是做一個最吸睛的聊天入口,而是長期在教育、醫(yī)療、司法、政企等縱深行業(yè)里,把 AI 變成可交付、可驗收、可規(guī)?;纳a(chǎn)力工具。行業(yè)客戶要的不是偶爾靈光一現(xiàn)的回答,而是穩(wěn)定的正確、可復(fù)現(xiàn)的質(zhì)量、足夠低的幻覺概率,以及在流程里能被審計、能被追責(zé)的執(zhí)行。推理模型天然更適合這類需求:它把不確定性壓到更窄的區(qū)間,把輸出從好不好聊,推向能不能用、敢不敢用、能不能持續(xù)用。

在這樣的背景下,基于全國產(chǎn)算力訓(xùn)練的深度推理大模型訊飛星火 X2 上線,就不只是一次常規(guī)迭代,而更像是訊飛把自身戰(zhàn)略定位寫進模型底座的一次確認。從 X1.5 到 X2,訊飛把升級重點放在兩件事上:一是整體能力上臺階,尤其在數(shù)學(xué)、答題、語言理解與智能體能力上,追求對標(biāo)全球最高水平;二是把推理能力進一步壓進行業(yè)場景,讓行業(yè)大模型繼續(xù)領(lǐng)先,并在產(chǎn)品與方案層面出現(xiàn)肉眼可見的進步。

外部公開高難任務(wù)效果對比



推理模型之所以更像訊飛的路徑,關(guān)鍵在于穩(wěn)定與準(zhǔn)確這兩個詞在行業(yè)里意味著什么。醫(yī)療場景里,一個建議要能站得住腳,最好還能解釋得清楚、依據(jù)能回溯;教育場景里,一個解題過程要能復(fù)現(xiàn),錯因定位要能貫穿,才能形成學(xué)習(xí)閉環(huán);司法場景里,任何提效都必須建立在可核驗的證據(jù)鏈和流程合規(guī)之上;政企場景更是如此,模型不是為了展示能力,而是要落在規(guī)則、制度和責(zé)任體系里。推理模型把模型能力從展示型的聰明,推向工程化的可靠,正好與訊飛多年積累的行業(yè)數(shù)據(jù)、專家協(xié)同、交付體系形成互相加成。

因此,X2 的行業(yè)敘事也更強調(diào)可用性與落地。醫(yī)療上,星火醫(yī)療大模型 X2 強調(diào)在多個關(guān)鍵任務(wù)上超越外部主流模型,并首發(fā)大模型賦能下的超擬人外呼隨訪,把能力從問答延伸到患者管理;個人健康助手率先通過權(quán)威評測驗證,補齊行業(yè)最在意的信任鏈條。教育上,X2 底座全面賦能,業(yè)內(nèi)率先實現(xiàn)錯因貫穿的個性化學(xué)習(xí)能力,讓啟發(fā)式講解與個性化答疑更契合學(xué)生思路,從 AI 學(xué)習(xí)機的自主學(xué)習(xí)閉環(huán)到校園教學(xué)的小時級反饋,去做因材施教與減負增效這道長期題。司法上,圍繞案多人少的痛點,以庭審時長縮短、檢察辦案提效 3 倍等指標(biāo)來證明可交付。汽車座艙則把推理能力轉(zhuǎn)成模糊意圖理解,讓交互從口令式控制走向更自然的對話式協(xié)作,像老朋友一樣讀懂潛臺詞。

更值得注意的是,訊飛把推理模型與智能體平臺綁在一起。行業(yè)客戶真正想要的往往不是一個更強的模型,而是一套能把復(fù)雜任務(wù)拆成可執(zhí)行步驟、能調(diào)用工具、能在長時任務(wù)中保持一致性的系統(tǒng)能力。X2 帶來的智能體能力提升,與星辰 Agent 平臺升級、企業(yè)級精品智能體的擴容形成閉環(huán):模型負責(zé)更可靠地思考,平臺負責(zé)更可控地執(zhí)行,最后在招采、行業(yè)分析等場景里用準(zhǔn)確率與效率提升去完成驗收。

全國產(chǎn)算力訓(xùn)練,則是這條路徑的另一塊拼圖。對訊飛來說,國產(chǎn)化不是口號,而是把推理能力做成可部署、可規(guī)?;⒖沙掷m(xù)迭代的工程路線。行業(yè)縱深意味著客戶分布廣、算力與部署條件差異大、合規(guī)要求更復(fù)雜,模型必須能在不同環(huán)境中穩(wěn)定運行,并且能隨著數(shù)據(jù)與專家共創(chuàng)不斷增強。在這種語境下,推理模型的穩(wěn)定與準(zhǔn)確,再疊加國產(chǎn)化算力平臺的可控性,構(gòu)成了訊飛在行業(yè)戰(zhàn)場上更適配的底層能力組合。

如果把多模態(tài)、通用、推理三條路線看作三種不同的勝負手,那么訊飛顯然不是去追逐最熱鬧的那一條,而是在選擇最能把優(yōu)勢放大的那一條。X2 的上線,強化的是一種更務(wù)實的判斷:當(dāng)模型競爭從發(fā)布會走進業(yè)務(wù)流程,決定勝負的往往不是誰更會聊天,而是誰更可靠、誰更穩(wěn)定、誰更能在真實場景里持續(xù)做對并被信任。對于一個把行業(yè)縱深作為長期戰(zhàn)略定位的公司來說,推理模型不是新賽道,而是把舊優(yōu)勢升級成新底座的最短路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上?;π敲瓦_,一家4口全端“鐵飯碗”,兒女憑實力爭光

上?;π敲瓦_,一家4口全端“鐵飯碗”,兒女憑實力爭光

白面書誏
2026-02-19 17:16:58
歐冠冷門誕生!一場1-2,國際米蘭被博德閃耀淘汰,羅納爾多觀賽

歐冠冷門誕生!一場1-2,國際米蘭被博德閃耀淘汰,羅納爾多觀賽

足球評論qs
2026-02-25 05:53:12
電影《飛馳人生3》票房破30億元 光線傳媒:從該片收入約5000萬元

電影《飛馳人生3》票房破30億元 光線傳媒:從該片收入約5000萬元

快科技
2026-02-24 22:37:13
民調(diào)飆升,點名蔣萬安接替賴清德?只怕趕走臺獨,又迎來更難纏的

民調(diào)飆升,點名蔣萬安接替賴清德?只怕趕走臺獨,又迎來更難纏的

蘭妮搞笑分享
2026-02-24 20:23:08
輕傷二級,法律給不了“血債血償”,但公道必須讓施暴者“社死”

輕傷二級,法律給不了“血債血償”,但公道必須讓施暴者“社死”

剛哥說法365
2026-02-24 17:12:01
拉杜卡努終止年薪13萬美元耐克合同,轉(zhuǎn)投費德勒同門品牌

拉杜卡努終止年薪13萬美元耐克合同,轉(zhuǎn)投費德勒同門品牌

網(wǎng)球之家
2026-02-24 22:29:08
化工漲停潮!社?;鹬貍}18家,年報最高增1000%,市盈率低至14

化工漲停潮!社?;鹬貍}18家,年報最高增1000%,市盈率低至14

說故事的阿襲
2026-02-25 02:42:19
42歲曲婉婷現(xiàn)狀,面相越來越西方化,住小公寓穿起球毛衣賬號被封

42歲曲婉婷現(xiàn)狀,面相越來越西方化,住小公寓穿起球毛衣賬號被封

削桐作琴
2026-02-23 22:00:18
斯諾克最新形勢:第2輪8場對陣揭曉,中國德比上演,1場冠軍PK!

斯諾克最新形勢:第2輪8場對陣揭曉,中國德比上演,1場冠軍PK!

劉姚堯的文字城堡
2026-02-24 08:57:26
微信顯示一條橫杠,證明已經(jīng)不是對方好友了

微信顯示一條橫杠,證明已經(jīng)不是對方好友了

匹夫來搞笑
2026-02-23 15:23:30
現(xiàn)貨黃金跌近2%

現(xiàn)貨黃金跌近2%

證券時報
2026-02-24 22:47:05
山東濟寧男子花5600元套中汽車,老板卻耍賴,民警到場才服軟退錢

山東濟寧男子花5600元套中汽車,老板卻耍賴,民警到場才服軟退錢

奇思妙想草葉君
2026-02-23 18:37:59
2025華為營收超8800億,卻被稱“再入寒冬”?

2025華為營收超8800億,卻被稱“再入寒冬”?

財視傳播
2026-02-24 11:55:09
安踏全球零售總部即將竣工!辦公區(qū)自帶跑道,上班等于健身

安踏全球零售總部即將竣工!辦公區(qū)自帶跑道,上班等于健身

GA環(huán)球建筑
2026-02-24 23:18:02
馬云預(yù)言應(yīng)驗了?未來5年,把存款換成4個資產(chǎn),或?qū)⒁率碂o憂?

馬云預(yù)言應(yīng)驗了?未來5年,把存款換成4個資產(chǎn),或?qū)⒁率碂o憂?

璀璨幻行者
2026-01-31 18:59:25
賈家被抄家的根本原因,就是賈元春省親,可惜賈家沒懂皇帝的用意

賈家被抄家的根本原因,就是賈元春省親,可惜賈家沒懂皇帝的用意

千秋文化
2026-02-20 20:23:09
墨西哥頭號毒梟斃命引發(fā)犯罪集團全國性報復(fù),度假勝地變“人間戰(zhàn)區(qū)”

墨西哥頭號毒梟斃命引發(fā)犯罪集團全國性報復(fù),度假勝地變“人間戰(zhàn)區(qū)”

紅星新聞
2026-02-24 15:39:08
張?zhí)m曝馬筱梅生子細節(jié),對準(zhǔn)S家句句戳心,強調(diào)和大S子女是一家人

張?zhí)m曝馬筱梅生子細節(jié),對準(zhǔn)S家句句戳心,強調(diào)和大S子女是一家人

東方不敗然多多
2026-02-25 05:22:36
潘石屹再開金口預(yù)判我國樓市!如不出意外,未來3年或迎3大走向

潘石屹再開金口預(yù)判我國樓市!如不出意外,未來3年或迎3大走向

巢客HOME
2026-02-25 00:30:04
誰懂??!要是我是王藝迪,新加坡大滿貫一打完,

誰懂??!要是我是王藝迪,新加坡大滿貫一打完,

小光侃娛樂
2026-02-24 16:07:06
2026-02-25 07:04:49
電廠 incentive-icons
電廠
探索科技公司的未知,為你充電
1996文章數(shù) 1055關(guān)注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機器人Unitree As2

頭條要聞

男子摟住繼女強吻動作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強吻動作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經(jīng)要聞

縣城消費「限時繁榮」了十天

汽車要聞

入門即滿配 威蘭達AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

本地
藝術(shù)
時尚
數(shù)碼
公開課

本地新聞

春花齊放2026:《駿馬奔騰迎新歲》

藝術(shù)要聞

高劍父寫梅,筆走龍蛇

闊腿褲失寵了?這4條褲子承包你整個春天的時髦!

數(shù)碼要聞

《死亡擱淺2》PC版推薦配置RTX 3060可FHD 60幀,Steam國區(qū)298元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版