国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

迄今為止最強大的開源模型:Kimi K2 Thinking ,比肩閉源模型

0
分享至

大家好,我是 Ai 學(xué)習(xí)的老章

Kimi 也算我們的???,尤其是 K2 模型,十分亮眼,目前也是我 Agent 常配模型之一

昨晚 ,剛剛模型文件開源,技術(shù)博客也發(fā)布了,本文做個梳理。
K2 Thinking 實測

先看幾個網(wǎng)友實測:

啟用 Kimi 工具調(diào)用,直接生成數(shù)學(xué)和物理解釋動畫

將公式渲染進行量子場論的動畫推理

太空侵略者游戲

K2 Thinking 簡介

kimi-k2-thinking模型是具有通用 Agentic 能力和推理能力的思考模型,它擅長深度推理,并可通過多步工具調(diào)用,幫助解決各類難題。

什么讓它與眾不同:
? 原生 INT4 量化 → 2 倍快速推理
占用內(nèi)存減半,無精度損失
256K 上下文,支持 200-300 次工具調(diào)用


Kimi K2 Thinking 上下文長度為 256k。(從常規(guī)的 Kimi K2 的 128k 提升而來),總參數(shù) 1T,激活參數(shù) 32B

官方釋放的基準測試結(jié)果:

在 HLE (44.9%) 和 BrowseComp (60.2%) 上達到 SOTA
最多可以執(zhí)行 200 – 300 個連續(xù)的工具調(diào)用 無需人工干預(yù)
在推理、自主搜索和編程方面表現(xiàn)出色


需要指出的是,Kimi 非常自信的與最強的閉源模型進行對比,在多個基準中結(jié)果反超閉源模型。

下面是更全面的對比結(jié)果,確實不需要與其他開源模型比參數(shù)了:


artificialanalysis.ai 也對 Kimi K2 Thinking 做了基準測試,結(jié)果也十分優(yōu)秀

? Kimi K2 Thinking 在 2-Bench Telecom 代理工具使用基準測試中獲得了 93% 的成績,這是一個 agentic tool 基準測試,模型作為客戶服務(wù)代理進行操作。在長期代理上下文中的工具使用是 Kimi K2 Instruct 的強項,而新的 Thinking 變體在此方面取得了顯著進步。


K2 Thinking 本地部署

K2 Thinking 的模型文件只有 594GB


https://huggingface.co/moonshotai/Kimi-K2-Thinking

K2 Instruct 和 K2 Instruct 0905 的大小則超過 1TB,為何 Thinking 之后 594GB 呢?

這是因為 K2 Thinking 使用 INT4 精度而非 FP8,Moonshot 在后訓(xùn)練階段使用量化感知訓(xùn)練來實現(xiàn)這一點,這意味著推理和訓(xùn)練的效率提升。使用 INT4 的一個潛在原因是,Blackwell 的 NVIDIA GPU 不支持 FP4,因此 INT4 更適合在較陳舊的硬件上實現(xiàn)效率提升。

vLLM Day 0 支持 K2 Thinking 的部署,命令如下

# 安裝
uv venv
source .venv/bin/activate
uv pip install -U vllm --pre --extra-index-url https://wheels.vllm.ai/nightly --extra-index-url https://download.pytorch.org/whl/cu129 --index-strategy unsafe-best-match # for xformers

# 部署
vllm serve moonshotai/Kimi-K2-Thinking \
--trust-remote-code \
--tensor-parallel-size 8 \
--enable-auto-tool-choice \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2 \

## `--reasoning-parser` 標志指定用于從模型輸出中提取推理內(nèi)容的推理解析器。

要啟動 Kimi-K2-Thinking 需要 8 個 141GB 的 H200/H20,成本還是蠻高的,不過即便再量化,估計向下空間也不大了吧?已經(jīng) int4 了,還能怎樣。

推薦使用 解碼上下文(DCP)并行部署,添加 --decode-context-parallel-size number 來啟用解碼上下文并行:

vllm serve moonshotai/Kimi-K2-Thinking \
--trust-remote-code \
--tensor-parallel-size 8 \
--decode-context-parallel-size 8 \
--enable-auto-tool-choice \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2 \

配合 DCP 后,優(yōu)勢顯著(43% 更快的 Token 生成,26% 更高的吞吐量),同時幾乎沒有缺點(中位數(shù)延遲改善微乎其微)

指標

TP8

TP8+DCP8

變更

改進 (%)

請求吞吐量 (req/s)

1.25

1.57

+25.6%

輸出標記吞吐量 (tok/s)

+43.1%

平均 TTFT(秒)

+16.0%

中位數(shù) TTFT(秒)

后面我會拿之前的用例詳細測試一下,同時也把 Claude code 后臺模型改成 K2 Thinking 多用一用

如有能再量化同時保障效果不打大折扣,把部署成本控制在 4 卡就好了,我也可以本地部署試試了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
王思聰,名下資產(chǎn)被法拍,“估值-166萬元,起拍價10.75萬元”!相關(guān)公司曾紅極一時,后被曝出大規(guī)模裁員、關(guān)店

王思聰,名下資產(chǎn)被法拍,“估值-166萬元,起拍價10.75萬元”!相關(guān)公司曾紅極一時,后被曝出大規(guī)模裁員、關(guān)店

每日經(jīng)濟新聞
2025-12-25 13:45:25
“讓W(xué)indows Phone回來!”網(wǎng)友向微軟請愿:重啟曾經(jīng)的第三大OS

“讓W(xué)indows Phone回來!”網(wǎng)友向微軟請愿:重啟曾經(jīng)的第三大OS

CSDN
2025-12-25 18:24:24
臺南恒春外海發(fā)生激烈對峙,054A向美軍MQ4C喊話:通報你的意圖!

臺南恒春外海發(fā)生激烈對峙,054A向美軍MQ4C喊話:通報你的意圖!

朔方瞭望
2025-12-25 15:58:23
東莞最新人口數(shù)據(jù)!

東莞最新人口數(shù)據(jù)!

東莞房視
2025-12-25 10:51:58
1斤80元!2019年,山東男子剝1600多張皮,肉全扔溝里被發(fā)現(xiàn)

1斤80元!2019年,山東男子剝1600多張皮,肉全扔溝里被發(fā)現(xiàn)

萬象硬核本尊
2025-12-25 17:41:00
湖人獲2大好消息!圣誕大戰(zhàn)或成驗貨之戰(zhàn),八村壘價值被低估了?

湖人獲2大好消息!圣誕大戰(zhàn)或成驗貨之戰(zhàn),八村壘價值被低估了?

小路看球
2025-12-25 17:40:09
國民黨通過藍白協(xié)商機制,確認新北等四縣市共推“能勝選的人”

國民黨通過藍白協(xié)商機制,確認新北等四縣市共推“能勝選的人”

海峽導(dǎo)報社
2025-12-24 17:20:20
無錫又一大綜合體,明天開業(yè)!

無錫又一大綜合體,明天開業(yè)!

江南晚報
2025-12-25 16:19:11
26央視春晚再度官宣,出來一群“牛鬼蛇神”,他們不再被追捧

26央視春晚再度官宣,出來一群“牛鬼蛇神”,他們不再被追捧

小張帥
2025-12-24 15:56:14
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們造出2.0!

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們造出2.0!

小莜讀史
2025-12-25 20:46:05
公安部:“反催收”等新形態(tài)“黑灰產(chǎn)”在金融領(lǐng)域迅速擴張

公安部:“反催收”等新形態(tài)“黑灰產(chǎn)”在金融領(lǐng)域迅速擴張

澎湃新聞
2025-12-25 11:40:26
“黑幫洪門”強勢回歸!消滅臺獨,賴清德傻眼了,洪門有多厲害?

“黑幫洪門”強勢回歸!消滅臺獨,賴清德傻眼了,洪門有多厲害?

混沌錄
2025-10-18 23:32:06
牡丹花下死,“縱欲過度”的張雨綺,把自己的路越走越窄

牡丹花下死,“縱欲過度”的張雨綺,把自己的路越走越窄

花語舞者
2025-12-24 19:04:15
小米17 Ultra已發(fā)布,選購指南:6999元起,找準需求才不花冤枉錢

小米17 Ultra已發(fā)布,選購指南:6999元起,找準需求才不花冤枉錢

數(shù)碼八叔
2025-12-25 23:29:04
房租從10萬到16萬,陳豪悄悄搬進中半山豪宅,收入實力藏不住了

房租從10萬到16萬,陳豪悄悄搬進中半山豪宅,收入實力藏不住了

橙星文娛
2025-12-24 13:47:07
太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

好賢觀史記
2025-12-23 18:14:27
丁偉晉升為浙江稠州男籃總教練,未被裁直接升職

丁偉晉升為浙江稠州男籃總教練,未被裁直接升職

格斗社
2025-12-25 22:32:44
女研究生和大15歲導(dǎo)師聊天記錄流出,關(guān)心和照顧被疑,別有用心!

女研究生和大15歲導(dǎo)師聊天記錄流出,關(guān)心和照顧被疑,別有用心!

詩意世界
2025-12-23 11:48:10
吳桂英主持召開長沙市推進湖南湘江新區(qū)高質(zhì)量發(fā)展協(xié)調(diào)小組會議

吳桂英主持召開長沙市推進湖南湘江新區(qū)高質(zhì)量發(fā)展協(xié)調(diào)小組會議

新浪財經(jīng)
2025-12-25 21:25:22
阿信致謝朱孝天,發(fā)長文回應(yīng)摔下舞臺

阿信致謝朱孝天,發(fā)長文回應(yīng)摔下舞臺

看度新聞
2025-12-23 11:46:53
2025-12-26 00:03:00
機器學(xué)習(xí)與Python社區(qū) incentive-icons
機器學(xué)習(xí)與Python社區(qū)
機器學(xué)習(xí)算法與Python
3234文章數(shù) 11081關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

韓國"最毒"財閥千金被捕 韓國人稱"經(jīng)過她身邊就會死"

頭條要聞

韓國"最毒"財閥千金被捕 韓國人稱"經(jīng)過她身邊就會死"

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財經(jīng)要聞

新規(guī)來了,年化超24%的小貸被即刻叫停

汽車要聞

速來!智界在上海西岸準備了年末潮流盛典

態(tài)度原創(chuàng)

家居
游戲
親子
公開課
軍事航空

家居要聞

經(jīng)典彌新 品味浪漫居所

逆水寒頂流主播沉迷倩女!三界的魅力藏不住了

親子要聞

中國兒童癌癥生存率如何?《柳葉刀》發(fā)布重磅研究

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基版“和平計劃”透露哪些信息

無障礙瀏覽 進入關(guān)懷版