国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

0
分享至

就在昨天,階躍星辰登頂了全球模型榜單——他們最新開源的Agent基座模型Step 3.5 Flash,發(fā)布首日便登上全球模型平臺OpenRouter的“最快模型榜”,而發(fā)布后僅用短短兩天,就獲得了OpenRouter“熱度趨勢榜”排名第一的好成績,其數據是基于全球開發(fā)者與用戶的實際模型調用量。也就是說,Step 3.5 Flash以硬實力贏得了用戶的“用腳投票”。


(圖為Step 3.5 Flash 登頂 OpenRouter 的Trending 榜單)

對階躍來說,拿下榜單第一并不新鮮,而這個成績有意思的地方在于,它點破了當前AI應用深化的一個普遍瓶頸:模型越來越“聰明”,能處理的任務越來越復雜,但用戶和開發(fā)者在真實使用時,最直接的感官體驗卻是——“慢”。

這里的“慢”,不是指回答一句“你好”的速度,而是當用戶任務變得復雜,任務鏈和工作流明顯變長(比如分析整篇財報、編寫復雜函數、或同時完成圖文音視頻多模態(tài)輸出等等)時,AI的處理速度必然下降,用戶的等待時間可能會被拖得很長。

漫長的等待——本身就嚴重限制了AI在實際工作流中的可用性;而如果等了半天,AI拿出的結果還不能令人滿意,用戶的流失就已成定局。

而過去外界的一貫認知中,“快”=小參數模型的敏捷調用、輸出;“慢”=更大參數量級的模型和細致的思考。此前,模型要的是“快”和“好”的平衡,而今天,階躍的Step 3.5 Flash卻敢于對世界說:“我全都要!”

稀疏MoE架構:不要“大而全”,我要“以巧見大”

論速度,Step 3.5 Flash有多快?

在復雜推理場景下,保證穩(wěn)定性的同時,Step 3.5 Flash在NVDIA Hopper GPU的最高推理速度可以達到每秒350個Token,實現“點擊即輸出”的秒速體驗。

榜單上,Step 3.5 Flash以每秒167個Token的速度排名第九,但排在它前面的,多是在為專有硬件環(huán)境定制的模型和8b-120b規(guī)模不等的小型模型。


(圖為Step 3.5 Flash在OpenRouter的Fastest榜位居前列)

而Step 3.5 Flash的參數量是1960億,足以作為基座模型為Agent提供強勁的動力。


(Reddit平臺用戶評價:終于有東西能在我那只有120GB顯存的破電腦上運行了)

跑分測試上,Step 3.5 Flash一馬當先,并且尤其擅長Agent場景和數學任務。在τ2-Bench、BrowseComp等測試,以及LiveCodeBench V6代碼挑戰(zhàn)和AIME 2025數學競賽中,Step 3.5 Flash都拿出了不錯的成績。


圖注:Step 3.5 Flash僅憑11B激活參數(總規(guī)模196B MoE)便達到了頂尖級別的智能水平,足以媲美領先的閉源及開源模型(數據來源:階躍星辰官方Tech Report)

實踐上,Step 3.5 Flash還在多步推理的結構化輸出、復雜邏輯求解、后端自動化和長時間運行任務中,已經具備了企業(yè)級應用落地的能力。而針對高頻工具調用和對行為可預測性有強要求的系統(tǒng)環(huán)境,Step 3.5 Flash也能輕松駕馭。

“快”很容易,“強”也很容易。要理解Step 3.5 Flash為何能做到又快又強,首先要了解的,是它采用的“稀疏混合專家(MoE)架構”——這是一個在追求“超大模型”時代里,回歸工程理性的設計。

傳統(tǒng)的千億參數大模型像一個“全能巨人”,處理任何問題,無論難易,都要動用全部腦力(激活所有參數)。

每一次都“全力出擊”,這固然能保證能力,但計算成本極高的同時,也讓推理緩慢、能耗巨大,算力的浪費也同樣不可避免。

Step 3.5 Flash的思路則不同。

作為一個總參數量1960億的Agent原生基座模型,它被精巧地組織成了許多個“專家小組”。當一個問題輸入時,一個智能的路由機制會迅速判斷:“這個問題主要由哪幾個專家小組來處理最合適?”然后,只激活這些相關的“專家”——大約110億參數——來工作。


(海外用戶評價:它僅使用11b的活躍參數,所以運行速度極快。老實說,我對它毫無延遲的運行表現著迷。)

你可以把它想象成一個高度專業(yè)化的超級顧問團。接到一個金融分析任務,系統(tǒng)不會喚醒團里的醫(yī)學專家或文學教授,而是精準地調度金融、數據分析、邏輯推理這幾個小組來協(xié)同工作。

這種設計,既能讓每次推理實際消耗的計算資源大幅減少,提升了計算速度,成本也隨之下降;又能背靠“顧問團”1960億參數的“總知識庫”,在需要處理復雜、跨界問題時,依然有能力調動不同領域的“專家”進行深度協(xié)作,讓輸出保質保量。

憑借著更聰明的調用,Step 3.5 Flash采用的稀疏MoE架構,打破了“大模型”必須“力大磚飛”的固有印象,讓AI的能力和速度,成為了可以兼得的“魚與熊掌”。

不只是“跑得快”,更是“想得流暢”

光是有了更高效的架構還不夠,Step 3.5 Flash在具體工程實現上也做了不少優(yōu)化,確保在真實場景中“跑”得流暢。

首先是處理長文本的“巧勁”。

人要學會快速瀏覽文本,就必須學會“一目十行”——AI也一樣,面對一個超長文本還要快速輸出內容,就不能在生成新詞時,每次都全文逐字閱讀理解。這被稱為“全注意力”機制,雖然輸出效果更好,但AI的計算量會隨著文本長度呈平方級增長,是導致處理長文本時速度劇降、延遲飆升的主要原因。

要一目十行,模型就必須采取滑動窗口注意力(Sliding-Window Attention, SWA)的機制。

所謂滑動窗口,是基于一個符合直覺的觀察:在理解一個長句子或段落時,當前詞的含義最受其“鄰近”詞匯的影響,而距離很遠的詞影響相對較小。在這種機制下,模型能更專注于一個窗口中臨近詞匯的內容,讀的內容變少了,處理速度當然更快,成本也自然更低。

而Step 3.5 Flash則是博采眾長,采用了3:1的滑動窗口與全局注意力混合架構(SWA + Full Attention),對256K上下文有著高效的處理能力。

不光“看”得快,Step 3.5 Flash還“寫”得快。

傳統(tǒng)的模式,AI生成Token,要一個一個地“往外蹦”,在追求AI快交互的今天,這樣的速度明顯不夠。

而Step 3.5 Flash采用了多Token預測(Multi-Token Prediction, MTP-3)的技術,一次可以完成多個Token的預測,這相當于讓Token的輸出從“單車道”變成了“多車道”,直接讓文本生成的吞吐效率翻了倍。

有了稀疏MoE架構,再整合了更先進的技術模式,給市場帶來的震撼是直接的:AI在處理復雜、多步任務時的“遲滯感”正在被抹平。無論是代碼生成、長文檔分析還是需要多輪思考的規(guī)劃任務,響應都變得更加即時和連貫。

Step 3.5 Flash的出現,對于那些希望將AI深度集成到自動化工作流中的開發(fā)者而言,標志著一個實用的拐點——一個既聰明又敏捷的“AI大腦”已經觸手可及。

結語

模型能力的升級,在今天似乎已經不是新鮮事——而Step 3.5 Flash的強勢登場,卻打破了過往的技術預設。

Step 3.5 Flash所代表的,不僅僅是一個模型版本的迭代,更是一種技術路徑的明確:通往更強大的人工智能的道路,不一定只靠無限制地堆疊參數,通過架構創(chuàng)新和工程優(yōu)化,在效能與能力之間取得精妙平衡,同樣是關鍵且務實的一步。

Step 3.5 Flash登榜的勝利,不止是模型技術的勝利,更是模型工程的勝利,是階躍星辰在追尋AGI的路上,邁出的堅實一步。

今天,Step 3.5 Flash已在OpenRouter、GitHub、階躍AI APP和網頁端等多端同步上線,面向開發(fā)者提供免費試用與快速部署支持。而同時,階躍星辰也已啟動了下一代Step 4的研發(fā),并邀請全球開發(fā)者“深度參與共創(chuàng)”,讓模型從工程中來,到工程中去,用最“落地”的方式做最“高級”的事情。

從Step 3.5 Flash開始,市場便能夠看到一條通往AGI更清晰的路徑——通過構建更快、更穩(wěn)、更易獲取的智能基座,降低每一個創(chuàng)新者構建高級AI應用的門檻。

當無數開發(fā)者可以基于這樣的基座,在面對千行百業(yè)的具體問題時,都能創(chuàng)造出屬于自己的智能體,并且以更便宜、更便捷的方式滿足自己的實際需求,那時的我們距離AGI,或許可以又近了一點點。

雷峰網

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當事人拒和解

天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當事人拒和解

社會日日鮮
2026-02-25 12:17:53
平頂山再通報“夫妻毆打15歲女生”:如此囂張,離不開這三個原因

平頂山再通報“夫妻毆打15歲女生”:如此囂張,離不開這三個原因

英軍眼
2026-02-25 10:53:41
特朗普突然喊停先不打伊朗,他還有另外一場硬仗要打

特朗普突然喊停先不打伊朗,他還有另外一場硬仗要打

梁訊
2026-02-25 15:42:26
圍爐煮茶,為啥涼了?

圍爐煮茶,為啥涼了?

放牛娃的遐想
2026-02-25 08:14:29
貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網暴慘了

貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網暴慘了

聽風喃
2026-02-25 13:53:39
難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產,掛一籠土雞

難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產,掛一籠土雞

火山詩話
2026-02-24 21:56:12
俄記者曝大瓜:俄軍進攻潛力耗盡,英國否定英法用核彈保護烏克蘭

俄記者曝大瓜:俄軍進攻潛力耗盡,英國否定英法用核彈保護烏克蘭

史政先鋒
2026-02-25 19:08:44
宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

爆角追蹤
2026-02-25 10:08:50
痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

離離言幾許
2026-02-25 10:43:45
“太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

“太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

都市快報橙柿互動
2026-02-25 11:28:41
TVB“御用爛仔”演員游飚去世,終年57歲,李力持發(fā)文悼念

TVB“御用爛仔”演員游飚去世,終年57歲,李力持發(fā)文悼念

紅星新聞
2026-02-25 11:05:07
中到大雨局部暴雨!廣東天氣即將“大變臉”

中到大雨局部暴雨!廣東天氣即將“大變臉”

深圳晚報
2026-02-25 08:12:15
碳訊 | 罕見!1760臺風機集體停機

碳訊 | 罕見!1760臺風機集體停機

環(huán)球零碳
2026-02-24 20:16:57
李小璐的新瓜,信息量有點大啊…

李小璐的新瓜,信息量有點大啊…

美芽
2026-02-25 18:13:04
突發(fā)!香港一女警頭部中槍身亡,多名親友到場痛哭!港警重案組跟進,港警一哥周一鳴親到觀塘警署了解事件!

突發(fā)!香港一女警頭部中槍身亡,多名親友到場痛哭!港警重案組跟進,港警一哥周一鳴親到觀塘警署了解事件!

澳門月刊
2026-02-25 13:31:47
蘋果新品官宣:2月24日,正式開售

蘋果新品官宣:2月24日,正式開售

科技堡壘
2026-02-24 15:01:58
大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

離離言幾許
2026-02-25 16:13:29
比爾蓋茨承認出軌,與俄羅斯核物理學家有染,否認與愛潑斯坦有關

比爾蓋茨承認出軌,與俄羅斯核物理學家有染,否認與愛潑斯坦有關

社會醬
2026-02-25 16:46:40
平頂山夫妻打人事件:共毆打4人。先毆打三位路人,發(fā)現打錯人后又毆打15歲女孩。

平頂山夫妻打人事件:共毆打4人。先毆打三位路人,發(fā)現打錯人后又毆打15歲女孩。

貼小君
2026-02-25 16:52:25
多地4S店關閉!寶馬開年“大跳水”:7系降超40萬,銷量跌回7年前

多地4S店關閉!寶馬開年“大跳水”:7系降超40萬,銷量跌回7年前

新浪財經
2026-02-25 15:28:38
2026-02-26 00:12:49
雷峰網 incentive-icons
雷峰網
關注智能與未來!
68592文章數 656079關注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經要聞

上海樓市放大招,地產預期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

時尚
健康
親子
教育
本地

“復古甜心”穿搭突然大火!春天穿時髦又減齡

轉頭就暈的耳石癥,能開車上班嗎?

親子要聞

幼時生病迎來的是責備而非關心!女子自嘲:直到當媽后才理解

教育要聞

教育部:將嚴查擠占體育課、課間不準學生出教室等行為

本地新聞

津南好·四時總相宜

無障礙瀏覽 進入關懷版