国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

0
分享至


AGI的路怎么走?階躍星辰的答案是以巧見大,唯快不破

作者丨董子博

編輯丨林覺民


就在昨天,階躍星辰登頂了全球模型榜單——他們最新開源的Agent基座模型Step 3.5 Flash,發(fā)布首日便登上全球模型平臺OpenRouter最快模型榜,而發(fā)布后僅用短短兩天,就獲得了OpenRouter“熱度趨勢榜排名第一的好成績,其數(shù)據(jù)是基于全球開發(fā)者與用戶的實(shí)際模型調(diào)用量。也就是說,Step 3.5 Flash以硬實(shí)力贏得了用戶的“用腳投票”。


(圖為Step 3.5 Flash 登頂 OpenRouter 的Trending 榜單)

對階躍來說,拿下榜單第一并不新鮮,而這個成績有意思的地方在于,它點(diǎn)破了當(dāng)前AI應(yīng)用深化的一個普遍瓶頸:模型越來越聰明,能處理的任務(wù)越來越復(fù)雜,但用戶和開發(fā)者在真實(shí)使用時(shí),最直接的感官體驗(yàn)卻是——“

這里的“慢”,不是指回答一句“你好”的速度,而是當(dāng)用戶任務(wù)變得復(fù)雜,任務(wù)鏈和工作流明顯變長(比如分析整篇財(cái)報(bào)、編寫復(fù)雜函數(shù)、或同時(shí)完成圖文音視頻多模態(tài)輸出等等)時(shí),AI的處理速度必然下降,用戶的等待時(shí)間可能會被拖得很長。

漫長的等待——本身就嚴(yán)重限制了 AI 在實(shí)際工作流中的可用性;而如果等了半天,AI 拿出的結(jié)果還不能令人滿意,用戶的流失就已成定局。

而過去外界的一貫認(rèn)知中,“快”=小參數(shù)模型的敏捷調(diào)用、輸出;“慢”=更大參數(shù)量級的模型和細(xì)致的思考。此前,模型要的是的平衡,而今天,階躍的Step 3.5 Flash卻敢于對世界說:我全都要!

01
MoE架構(gòu):

不要大而全,我要以巧見大

論速度,Step 3.5 Flash 有多快?

在復(fù)雜推理場景下,保證穩(wěn)定性的同時(shí)Step 3.5 FlashNVDIA Hopper GPU的最高推理速度可以達(dá)到每秒350Token,實(shí)現(xiàn)點(diǎn)擊即輸出的秒速體驗(yàn)。

榜單上,Step 3.5 Flash 以每秒 167 個 Token 的速度排名第九,但排在它前面的,多是在為專有硬件環(huán)境定制的模型和 8b-120b 規(guī)模不等的小型模型。


(圖為 Step 3.5 Flash 在 OpenRouter 的 Fastest 榜位居前列)

而 Step 3.5 Flash 的參數(shù)量是 1960 億,足以作為基座模型為 Agent 提供強(qiáng)勁的動力。


(Reddit平臺用戶評價(jià):終于有東西能在我那只有120GB顯存的破電腦上運(yùn)行了)

跑分測試上,Step 3.5 Flash 一馬當(dāng)先,并且尤其擅長 Agent 場景和數(shù)學(xué)任務(wù)。在 τ2-Bench、BrowseComp 等測試,以及 LiveCodeBench V6 代碼挑戰(zhàn)和 AIME 2025 數(shù)學(xué)競賽中,Step 3.5 Flash 都拿出了不錯的成績。


圖注:Step 3.5 Flash 僅憑 11B 激活參數(shù)(總規(guī)模 196B MoE)便達(dá)到了頂尖級別的智能水平,足以媲美領(lǐng)先的閉源及開源模型(數(shù)據(jù)來源:階躍星辰官方Tech Report)

實(shí)踐上,Step 3.5 Flash 還在多步推理的結(jié)構(gòu)化輸出、復(fù)雜邏輯求解、后端自動化和長時(shí)間運(yùn)行任務(wù)中,已經(jīng)具備了企業(yè)級應(yīng)用落地的能力。而針對高頻工具調(diào)用和對行為可預(yù)測性有強(qiáng)要求的系統(tǒng)環(huán)境,Step 3.5 Flash 也能輕松駕馭。

“快”很容易,“強(qiáng)”也很容易。要理解 Step 3.5 Flash 為何能做到又快又強(qiáng),首先要了解的,是它采用的“稀疏混合專家(MoE)架構(gòu)”——這是一個在追求超大模型時(shí)代里,回歸工程理性的設(shè)計(jì)。

傳統(tǒng)的千億參數(shù)大模型像一個“全能巨人”,處理任何問題,無論難易,都要動用全部腦力(激活所有參數(shù))。

每一次都“全力出擊”,這固然能保證能力,但計(jì)算成本極高的同時(shí),也讓推理緩慢、能耗巨大,算力的浪費(fèi)也同樣不可避免。

Step 3.5 Flash 的思路則不同。

作為一個總參數(shù)量1960億的Agent 原生基座模型,它被精巧地組織成了許多個“專家小組”。當(dāng)一個問題輸入時(shí),一個智能的路由機(jī)制會迅速判斷:“這個問題主要由哪幾個專家小組來處理最合適?”然后,只激活這些相關(guān)的“專家”——大約110億參數(shù)——來工作。


(海外用戶評價(jià):它僅使用11b的活躍參數(shù),所以運(yùn)行速度極快。老實(shí)說,我對它毫無延遲的運(yùn)行表現(xiàn)著迷。)

你可以把它想象成一個高度專業(yè)化的超級顧問團(tuán)。接到一個金融分析任務(wù),系統(tǒng)不會喚醒團(tuán)里的醫(yī)學(xué)專家或文學(xué)教授,而是精準(zhǔn)地調(diào)度金融、數(shù)據(jù)分析、邏輯推理這幾個小組來協(xié)同工作。

這種設(shè)計(jì),既能讓每次推理實(shí)際消耗的計(jì)算資源大幅減少,提升了計(jì)算速度,成本也隨之下降;又能背靠“顧問團(tuán)”1960 億參數(shù)的“總知識庫”,在需要處理復(fù)雜、跨界問題時(shí),依然有能力調(diào)動不同領(lǐng)域的“專家”進(jìn)行深度協(xié)作,讓輸出保質(zhì)保量。

憑借著更聰明的調(diào)用,Step 3.5 Flash 采用的稀疏 MoE 架構(gòu),打破了“大模型”必須“力大磚飛”的固有印象,讓 AI 的能力和速度,成為了可以兼得的“魚與熊掌”。

02
不只是
跑得快,更是想得流暢

光是有了更高效的架構(gòu)還不夠,Step 3.5 Flash 在具體工程實(shí)現(xiàn)上也做了不少優(yōu)化,確保在真實(shí)場景中“跑”得流暢。

首先是處理長文本的“巧勁”。

人要學(xué)會快速瀏覽文本,就必須學(xué)會“一目十行”——AI 也一樣,面對一個超長文本還要快速輸出內(nèi)容,就不能在生成新詞時(shí),每次都全文逐字閱讀理解。這被稱為“全注意力”機(jī)制,雖然輸出效果更好,但 AI 的計(jì)算量會隨著文本長度呈平方級增長,是導(dǎo)致處理長文本時(shí)速度劇降、延遲飆升的主要原因。

要一目十行,模型就必須采取滑動窗口注意力(Sliding-Window Attention, SWA)的機(jī)制。

所謂滑動窗口,是基于一個符合直覺的觀察:在理解一個長句子或段落時(shí),當(dāng)前詞的含義最受其“鄰近”詞匯的影響,而距離很遠(yuǎn)的詞影響相對較小。在這種機(jī)制下,模型能更專注于一個窗口中臨近詞匯的內(nèi)容,讀的內(nèi)容變少了,處理速度當(dāng)然更快,成本也自然更低。

而 Step 3.5 Flash 則是博采眾長,采用了 3:1 的滑動窗口與全局注意力混合架構(gòu)(SWA + Full Attention),對 256K 上下文有著高效的處理能力。

不光得快,Step 3.5 Flash得快。

傳統(tǒng)的模式,AI 生成 Token,要一個一個地“往外蹦”,在追求 AI 快交互的今天,這樣的速度明顯不夠。

而 Step 3.5 Flash 采用了多 Token 預(yù)測(Multi-Token Prediction, MTP-3) 的技術(shù),一次可以完成多個 Token 的預(yù)測,這相當(dāng)于讓 Token 的輸出從“單車道”變成了“多車道”,直接讓文本生成的吞吐效率翻了倍。

有了稀疏 MoE 架構(gòu),再整合了更先進(jìn)的技術(shù)模式,給市場帶來的震撼是直接的:AI在處理復(fù)雜、多步任務(wù)時(shí)的“遲滯感”正在被抹平。無論是代碼生成、長文檔分析還是需要多輪思考的規(guī)劃任務(wù),響應(yīng)都變得更加即時(shí)和連貫。

Step 3.5 Flash 的出現(xiàn),對于那些希望將 AI 深度集成到自動化工作流中的開發(fā)者而言,標(biāo)志著一個實(shí)用的拐點(diǎn)——一個既聰明又敏捷的“AI大腦已經(jīng)觸手可及。

03

結(jié)語

模型能力的升級,在今天似乎已經(jīng)不是新鮮事——而 Step 3.5 Flash 的強(qiáng)勢登場,卻打破了過往的技術(shù)預(yù)設(shè)。

Step 3.5 Flash 所代表的,不僅僅是一個模型版本的迭代,更是一種技術(shù)路徑的明確:通往更強(qiáng)大的人工智能的道路,不一定只靠無限制地堆疊參數(shù),通過架構(gòu)創(chuàng)新和工程優(yōu)化,在效能與能力之間取得精妙平衡,同樣是關(guān)鍵且務(wù)實(shí)的一步。

Step 3.5 Flash 登榜的勝利,不止是模型技術(shù)的勝利,更是模型工程的勝利,是階躍星辰在追尋 AGI 的路上,邁出的堅(jiān)實(shí)一步。

今天,Step 3.5 Flash 已在 OpenRouter、GitHub、階躍 AI APP 和網(wǎng)頁端等多端同步上線,面向開發(fā)者提供免費(fèi)試用與快速部署支持。而同時(shí),階躍星辰也已啟動了下一代 Step 4 的研發(fā),并邀請全球開發(fā)者“深度參與共創(chuàng)”,讓模型從工程中來,到工程中去,用最“落地”的方式做最“高級”的事情。

從 Step 3.5 Flash 開始,市場便能夠看到一條通往 AGI 更清晰的路徑——通過構(gòu)建更快、更穩(wěn)、更易獲取的智能基座,降低每一個創(chuàng)新者構(gòu)建高級AI應(yīng)用的門檻。

當(dāng)無數(shù)開發(fā)者可以基于這樣的基座,在面對千行百業(yè)的具體問題時(shí),都能創(chuàng)造出屬于自己的智能體,并且以更便宜、更便捷的方式滿足自己的實(shí)際需求,那時(shí)的我們距離AGI,或許可以又近了一點(diǎn)點(diǎn)。

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普“停戰(zhàn)”,還挺諷刺的

特朗普“停戰(zhàn)”,還挺諷刺的

中國新聞周刊
2026-03-10 22:22:09
深圳上線“政務(wù)龍蝦”,卻被發(fā)現(xiàn)政務(wù)系統(tǒng)還在用IE瀏覽器,網(wǎng)友擔(dān)心信息遭泄露

深圳上線“政務(wù)龍蝦”,卻被發(fā)現(xiàn)政務(wù)系統(tǒng)還在用IE瀏覽器,網(wǎng)友擔(dān)心信息遭泄露

小蘿卜絲
2026-03-10 17:33:28
曝伊朗女足已正式登機(jī)離開澳洲:多人落淚+反抗未果 有2人成功留下

曝伊朗女足已正式登機(jī)離開澳洲:多人落淚+反抗未果 有2人成功留下

風(fēng)過鄉(xiāng)
2026-03-10 21:14:19
李斌談超快充和換電模式:超快再快不可能有換電快,超快充對電池壽命和安全性等有損害

李斌談超快充和換電模式:超快再快不可能有換電快,超快充對電池壽命和安全性等有損害

中國能源網(wǎng)
2026-03-10 11:33:11
火爆全網(wǎng)的“養(yǎng)龍蝦”,第一批受害者已出現(xiàn)!有人被AI燒掉數(shù)萬元

火爆全網(wǎng)的“養(yǎng)龍蝦”,第一批受害者已出現(xiàn)!有人被AI燒掉數(shù)萬元

派大星紀(jì)錄片
2026-03-10 11:13:04
難以置信!網(wǎng)傳一女子征婚,稱網(wǎng)貸欠200多萬,誰幫還債就嫁給誰

難以置信!網(wǎng)傳一女子征婚,稱網(wǎng)貸欠200多萬,誰幫還債就嫁給誰

火山詩話
2026-03-10 13:46:15
出售藍(lán)軍23.5億鎊去向爭議,英國政府下最后通牒,阿布抗?fàn)幗?年

出售藍(lán)軍23.5億鎊去向爭議,英國政府下最后通牒,阿布抗?fàn)幗?年

夏侯看英超
2026-03-11 01:34:41
北大醫(yī)學(xué)專家胡大一:睡覺,一個讓你延長生命的革命性新秘方

北大醫(yī)學(xué)專家胡大一:睡覺,一個讓你延長生命的革命性新秘方

新浪財(cái)經(jīng)
2026-03-10 00:31:51
給屁眼做美白,已經(jīng)成為歐美上流社會的肛需

給屁眼做美白,已經(jīng)成為歐美上流社會的肛需

beebee
2026-03-10 11:09:50
證據(jù)確鑿!導(dǎo)致伊朗小學(xué)165人喪生的那枚導(dǎo)彈不是“戰(zhàn)斧”

證據(jù)確鑿!導(dǎo)致伊朗小學(xué)165人喪生的那枚導(dǎo)彈不是“戰(zhàn)斧”

山間聽雨
2026-03-10 22:09:43
金與正發(fā)出警告:后果可怕,不堪設(shè)想!

金與正發(fā)出警告:后果可怕,不堪設(shè)想!

IN朝鮮
2026-03-10 16:38:48
伊朗南部3省宣布支持巴列維,川普與內(nèi)塔爆發(fā)口水戰(zhàn),欲打退堂鼓

伊朗南部3省宣布支持巴列維,川普與內(nèi)塔爆發(fā)口水戰(zhàn),欲打退堂鼓

史政先鋒
2026-03-10 21:00:09
中國游客不來了,日本政府大力歡迎印度游客!日本空姐崩潰:他們用完的廁所簡直是災(zāi)難!

中國游客不來了,日本政府大力歡迎印度游客!日本空姐崩潰:他們用完的廁所簡直是災(zāi)難!

東京新青年
2026-03-10 18:52:49
伊朗德黑蘭突降“黑雨”!有民眾呼吸困難 喉嚨刺痛

伊朗德黑蘭突降“黑雨”!有民眾呼吸困難 喉嚨刺痛

閃電新聞
2026-03-10 19:30:10
國家互聯(lián)網(wǎng)應(yīng)急中心發(fā)布OpenClaw安全應(yīng)用風(fēng)險(xiǎn)提示

國家互聯(lián)網(wǎng)應(yīng)急中心發(fā)布OpenClaw安全應(yīng)用風(fēng)險(xiǎn)提示

界面新聞
2026-03-10 19:29:53
不怕被報(bào)復(fù)?伊朗女足5人摘下頭巾!獲準(zhǔn)留在澳洲 球員家人遭逮捕

不怕被報(bào)復(fù)?伊朗女足5人摘下頭巾!獲準(zhǔn)留在澳洲 球員家人遭逮捕

念洲
2026-03-10 07:46:07
中國女足4-0戰(zhàn)勝對手,晉級四強(qiáng)

中國女足4-0戰(zhàn)勝對手,晉級四強(qiáng)

大嘴說臺球
2026-03-10 21:43:09
于東來公布公司40億資產(chǎn)利潤分配方案:胖東來12名店長共分2.4億,每人2000萬元

于東來公布公司40億資產(chǎn)利潤分配方案:胖東來12名店長共分2.4億,每人2000萬元

大象新聞
2026-03-10 14:46:05
這菜再貴也要吃,大量上市!通便排毒,殺菌消炎,提高免疫力

這菜再貴也要吃,大量上市!通便排毒,殺菌消炎,提高免疫力

阿龍美食記
2026-03-10 16:31:51
陳都靈太嫩了

陳都靈太嫩了

阿廢冷眼觀察所
2026-02-28 11:28:38
2026-03-11 02:47:01
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7111文章數(shù) 20739關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

財(cái)經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

游戲
旅游
藝術(shù)
數(shù)碼
本地

《德波尼亞》Steam 免費(fèi)領(lǐng) / 《超級馬力歐銀河大電影》最終預(yù)告曝光

旅游要聞

奇花藝境展推出多次打卡票種,滬上春日花事持續(xù)煥新

藝術(shù)要聞

震撼!美國油畫家約書亞·拉洛克的作品讓人驚嘆不已!

數(shù)碼要聞

M5 Max 版 16 英寸 MacBook Pro 體驗(yàn):算力巔峰與專業(yè)視界

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

無障礙瀏覽 進(jìn)入關(guān)懷版