国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi K2.6 開源直逼 GPT-5.4:漲 58% 的 API 定價,暴露了月之暗面的真實意圖

0
分享至


4月20日晚間,月之暗面(Moonshot AI)正式發(fā)布并開源最新旗艦?zāi)P?Kimi K2.6。該模型在長程編碼、Agent 集群調(diào)度及自主執(zhí)行能力上實現(xiàn)顯著躍升,多項基準測試成績持平或超越 GPT-5.4、Claude Opus 4.6 等國際頂尖閉源模型。

一周之內(nèi),Anthropic 發(fā)布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview,DeepSeek V4 亦將于下旬發(fā)布。Kimi K2.6 在這個密集窗口期登場,是月之暗面在 AI 競爭從"算法創(chuàng)新"轉(zhuǎn)向"工程化落地"關(guān)鍵節(jié)點的一次戰(zhàn)略展示。

長程編碼:從單輪補全到系統(tǒng)級優(yōu)化


與此前大模型在代碼任務(wù)中多局限于"單輪補全"或"簡單腳本編寫"不同,Kimi K2.6 的核心進步在于處理復(fù)雜系統(tǒng)工程的能力。據(jù)官方技術(shù)博客披露,K2.6 可自主完成從需求分析、代碼實現(xiàn)、測試驗證到性能優(yōu)化的全流程閉環(huán),單次任務(wù)可修改超過 4000 行代碼。

兩項實測案例展現(xiàn)了這一能力。

案例一:Zig 語言重寫推理引擎

在 Mac 本地部署 Qwen3.5-0.8B 模型時,K2.6 跨語言使用小眾的 Zig 語言進行推理優(yōu)化,歷經(jīng) 12 小時連續(xù)運行、4000 余次工具調(diào)用及 14 輪迭代,將推理吞吐量從 15 tokens/s 提升至 193 tokens/s,最終速度超越主流推理框架 LM Studio 約 20%。


案例二:8 年引擎的性能重構(gòu)

在對擁有 8 年歷史的開源金融撮合引擎 exchange-core 的優(yōu)化中,K2.6 在 13 小時的執(zhí)行過程中迭代了 12 種優(yōu)化策略,發(fā)起 1000 余次工具調(diào)用,通過分析 CPU 與內(nèi)存火焰圖定位隱藏瓶頸,將核心線程拓撲從 4ME+2RE 重構(gòu)為 2ME+1RE。即便引擎已接近性能極限,K2.6 仍將中位吞吐量從 0.43 提升至 1.24 MT/s(提升 185%),峰值吞吐量從 1.23 提升至 2.86 MT/s(提升 133%)。


"這不再是簡單的'做題',而是在解決真實的工程問題。"多位開發(fā)者在體驗后反饋,K2.6 已具備從編碼到前端設(shè)計再到全棧交付的專業(yè)級 Web 應(yīng)用構(gòu)建能力。在官方的 Code-Driven Design 內(nèi)部評測中,K2.6 在落地頁構(gòu)建、全棧應(yīng)用開發(fā)等四類任務(wù)上表現(xiàn)接近 Google AI Studio。

基準測試:編碼領(lǐng)先,推理仍有差距

官方公布的基準測試數(shù)據(jù)顯示,K2.6 在工程類任務(wù)中全面領(lǐng)先,但純推理能力與國際頂尖閉源模型仍有距離。


編碼與 Agent 任務(wù)方面,K2.6 在 SWE-Bench Pro 中取得 58.6%,領(lǐng)先所有參與對比的模型;在 Terminal-Bench 2.0 中以 66.7% 超越 GPT-5.4 和 Claude Opus 4.6 的 65.4%;在博士級難度的 Humanity's Last Exam(工具增強版)中以 54.0% 位居第一;DeepSearchQA 的 F1 分數(shù)達 92.5%,大幅領(lǐng)先 GPT-5.4 的 78.6%。

然而,在不使用工具的純推理測試中,K2.6 的短板同樣明顯。HLE-Full 僅得 34.7%,低于 GPT-5.4 的 39.8% 和 Gemini 3.1 Pro 的 44.4%;在視覺推理類基準如 MathVision(87.4% vs GPT-5.4 的 92.0%)上,差距同樣存在。這套基準測試描繪了一個清晰的輪廓:K2.6 的工程化與工具調(diào)度能力已躋身全球第一梯隊,但在純粹的知識推理和視覺理解層面,仍需持續(xù)追趕。

Agent 集群:300 子 Agent 并行,協(xié)作步驟三倍擴展

K2.6 的 Agent 集群架構(gòu)相比 K2.5 實現(xiàn)了三倍量級的擴展——子 Agent 從 100 個提升至 300 個,協(xié)作步驟從 1500 步擴展至 4000 步。這種橫向擴展的"群體智能"架構(gòu)使 K2.6 能夠在一次自主運行中并行完成深度搜索、文檔分析、網(wǎng)頁生成、PPT 制作和表格輸出的端到端交付。

案例:天體論文一鍵轉(zhuǎn)化為學(xué)術(shù)技能

K2.6 驅(qū)動的 Agent 集群將一篇天體物理論文轉(zhuǎn)化為可復(fù)用的學(xué)術(shù)技能,最終產(chǎn)出一份 7000 字的研究論文、一個包含 2 萬多條數(shù)據(jù)記錄的結(jié)構(gòu)化數(shù)據(jù)集及 14 張?zhí)煳募増D表。上傳的文檔格式不受限——PDF、表格、PPT、Word 均可轉(zhuǎn)化為技能資產(chǎn)。


官方案例視頻截圖

在招聘場景中,Agent 集群可基于上傳的簡歷自動生成 100 個子 Agent,分別為用戶匹配 100 個加州崗位并定制化簡歷。官方博客還展示了 30 家零售門店的本地化頁面生成案例,300 個子 Agent 各自完成從文案撰寫到落地頁構(gòu)建的全流程。

更值得關(guān)注的是 Claw Groups 的研究預(yù)覽。這是一個異構(gòu) Agent 生態(tài),允許來自不同設(shè)備、運行不同模型、攜帶各自工具鏈的 Agent 與人類作為真正的協(xié)作者共同運行。K2.6 在其中擔任自適應(yīng)協(xié)調(diào)者,根據(jù)技能畫像動態(tài)匹配任務(wù),并在 Agent 故障或卡頓時自動重新分配。

月之暗面透露,內(nèi)部團隊已使用 Claw Groups 運行端到端的內(nèi)容生產(chǎn)和營銷活動。這一布局顯示出月之暗面正試圖從單一模型提供商向 Agent 生態(tài)基礎(chǔ)設(shè)施服務(wù)商轉(zhuǎn)型。

商業(yè)化:輸入成本上漲 58%

在商業(yè)層面,以美元計價,Kimi API K2.6 每百萬 Token 的輸入價格(緩存未命中)為 $0.95,較 K2.5 的 $0.60 上漲約 58%;輸出價格為 $4.00,較 K2.5 的 $3.00 上漲約 33%;緩存命中價格則為 $0.16/MTok。上下文窗口為 262,144 tokens(約 256K)。


價格調(diào)整背后,是長程編碼與 Agent 自主運行帶來的 Token 消耗遠超傳統(tǒng)對話模型。K2.6 支持最長 5 天的持續(xù)自主運行,官方內(nèi)部團隊已使用 K2.6 驅(qū)動的 Agent 獨立運行 5 天,完成監(jiān)控、事件響應(yīng)和系統(tǒng)運維任務(wù)。這意味著單位任務(wù)中的 Token 消耗量遠非普通 API 調(diào)用可比。

與此同時,Kimi Agent 模式已內(nèi)置上百個官方推薦技能,并支持將任意高質(zhì)量文件——PDF、表格、PPT、Word 文檔——轉(zhuǎn)化為可復(fù)用技能,捕獲并保存文檔的結(jié)構(gòu)與風(fēng)格特征。這種將非結(jié)構(gòu)化數(shù)據(jù)標準化為"技能資產(chǎn)"的能力,是月之暗面在企業(yè)服務(wù)市場構(gòu)建壁壘的關(guān)鍵布局。

在 Meta 發(fā)布閉源旗艦 Muse Spark 的行業(yè)背景下,月之暗面堅持將 K2.6 全面開源。

月之暗面創(chuàng)始人楊植麟在 3 月 26 日的中關(guān)村論壇年會上明確表態(tài):"如果模型能力能做到一樣的水平,開源會是絕對的勝利。"在他看來,開源的核心價值在于構(gòu)建生態(tài)共贏的合作模式,通過催生海量應(yīng)用場景,形成遠超閉源模式的市場總量。

Kimi K2.6 的開源,正是這一邏輯的延續(xù)。但開源并不等于免費——API 定價的上漲表明,月之暗面正通過分級計費策略,在保障高端企業(yè)用戶服務(wù)質(zhì)量的同時探索可持續(xù)的 B 端盈利模式。

隨著 DeepSeek V4、阿里 Qwen3.6 等重磅模型的集體登場,2026 年大模型行業(yè)的洗牌已然加速。K2.6 的基準測試成績證明,國產(chǎn)開源模型已在工程化場景中站穩(wěn)第一梯隊,但在純推理和視覺理解能力上仍有追趕空間。開源社區(qū)的繁榮與商業(yè)化變現(xiàn)之間的平衡,仍是月之暗面乃至整個行業(yè)接下來必須面對的長期考題。(本文首發(fā)鈦媒體APP,作者 | AGI Signal,編輯 | 秦聰慧)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
雷霆三少誰賺得最多?哈登4.2億,杜蘭特5.9億,看到威少我服了

雷霆三少誰賺得最多?哈登4.2億,杜蘭特5.9億,看到威少我服了

云隱南山
2026-04-22 03:15:00
農(nóng)婦去北京找丈夫被警衛(wèi)阻攔,當說出丈夫名字后,被緊急送去見首長

農(nóng)婦去北京找丈夫被警衛(wèi)阻攔,當說出丈夫名字后,被緊急送去見首長

睡前講故事
2025-04-25 15:11:25
伊朗贏得談判僵局,特朗普宣布無限期?;穑。?!

伊朗贏得談判僵局,特朗普宣布無限期?;穑。。?/a>

山河路口
2026-04-22 12:50:43
預(yù)測交易所最新數(shù)據(jù): 詹姆斯下賽季留在湖人或退役概率達50%

預(yù)測交易所最新數(shù)據(jù): 詹姆斯下賽季留在湖人或退役概率達50%

懂球帝
2026-04-22 15:56:11
CBA最新消息!杜鋒面臨下課,孫銘徽正式復(fù)出

CBA最新消息!杜鋒面臨下課,孫銘徽正式復(fù)出

體壇瞎白話
2026-04-22 07:32:53
“難怪窮女孩嫁不到真少爺”,高鐵小少爺事件,撕碎普通家長幻想

“難怪窮女孩嫁不到真少爺”,高鐵小少爺事件,撕碎普通家長幻想

妍妍教育日記
2026-04-22 12:05:03
沈騰一家近況!王琦復(fù)胖目測200斤疑懷二胎,7歲兒子胖乎乎也有肚腩

沈騰一家近況!王琦復(fù)胖目測200斤疑懷二胎,7歲兒子胖乎乎也有肚腩

八卦王者
2026-04-21 15:01:28
美國軍方做出大膽預(yù)測:解放軍武力收臺時間曝光,竟然大幅度提前

美國軍方做出大膽預(yù)測:解放軍武力收臺時間曝光,竟然大幅度提前

時光流轉(zhuǎn)追夢人
2026-04-19 11:14:47
谷雨后,不建議買5種蔬菜,口感不好,還沒營養(yǎng),菜販自己都不吃

谷雨后,不建議買5種蔬菜,口感不好,還沒營養(yǎng),菜販自己都不吃

阿龍美食記
2026-04-22 18:39:10
全球巨頭,開始豪賭“去”中國化

全球巨頭,開始豪賭“去”中國化

米宅海外
2026-04-22 08:04:46
史上最搶手皇后,6位帝王輪番霸占60年不停歇,48歲還被人爭著要

史上最搶手皇后,6位帝王輪番霸占60年不停歇,48歲還被人爭著要

小豫講故事
2026-04-12 06:00:09
廣東60歲金融老將突然被帶走,曾任東莞銀行副行長至少15年

廣東60歲金融老將突然被帶走,曾任東莞銀行副行長至少15年

湘財Plus
2026-04-22 14:21:13
突發(fā)!SpaceX 擬 600 億美元收購 Cursor,AI 編程最賺錢獨角獸易主?

突發(fā)!SpaceX 擬 600 億美元收購 Cursor,AI 編程最賺錢獨角獸易主?

鈦媒體APP
2026-04-22 09:44:01
中國軍艦大片震撼上新!“雷達一開,其他都是透明的……”

中國軍艦大片震撼上新!“雷達一開,其他都是透明的……”

環(huán)球網(wǎng)資訊
2026-04-22 09:00:22
不敵銅梁龍!上海海港做出重要決定:申訴漏判2點球 楊希禁區(qū)被推

不敵銅梁龍!上海海港做出重要決定:申訴漏判2點球 楊希禁區(qū)被推

球場新視角1號
2026-04-22 16:48:51
以色列士兵砸碎耶穌雕像!褻瀆行為震驚全球,內(nèi)塔尼亞胡慌忙道歉

以色列士兵砸碎耶穌雕像!褻瀆行為震驚全球,內(nèi)塔尼亞胡慌忙道歉

青煙小先生
2026-04-22 11:41:22
開了一年的Model Y,我把賬單攤桌上,發(fā)現(xiàn)“省錢”這事水太深了!

開了一年的Model Y,我把賬單攤桌上,發(fā)現(xiàn)“省錢”這事水太深了!

小李子體育
2026-04-20 18:05:08
他從正部降到副廳,級別恢復(fù)后不想上任,宋任窮:這是中央的決定

他從正部降到副廳,級別恢復(fù)后不想上任,宋任窮:這是中央的決定

鑒史錄
2026-04-20 20:54:57
8歲考出760高分,智商230碾壓愛因斯坦,天才陶哲軒如今現(xiàn)狀如何

8歲考出760高分,智商230碾壓愛因斯坦,天才陶哲軒如今現(xiàn)狀如何

大魚簡科
2026-04-22 17:11:04
姜文32歲女兒官宣懷孕!肚大如籮近臨盆,生圖下四肢纖細臉小一圈

姜文32歲女兒官宣懷孕!肚大如籮近臨盆,生圖下四肢纖細臉小一圈

往史過眼云煙
2026-04-22 19:41:00
2026-04-22 21:20:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
132627文章數(shù) 862113關(guān)注度
往期回顧 全部

科技要聞

對話梅濤:沒有視頻底座,具身智能走不遠

頭條要聞

伊朗扣留兩艘船并強調(diào)"紅線" 責(zé)令美國釋放被扣貨船

頭條要聞

伊朗扣留兩艘船并強調(diào)"紅線" 責(zé)令美國釋放被扣貨船

體育要聞

網(wǎng)易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財經(jīng)要聞

醫(yī)院專家號"秒空"!警方牽出黑色產(chǎn)業(yè)鏈

汽車要聞

純電續(xù)航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

房產(chǎn)
教育
游戲
健康
軍事航空

房產(chǎn)要聞

官宣!今年9月起,廣州中小學(xué)“重點班”將成歷史!

教育要聞

叮咚!全??苿?chuàng)青年聚集!“搖籃杯”科創(chuàng)作品展!

曝PS5等主機將再次漲價!成本上漲壓力難以抑制

干細胞抗衰4大誤區(qū),90%的人都中招

軍事要聞

特朗普宣布延長?;?伊朗表態(tài)

無障礙瀏覽 進入關(guān)懷版