国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

打敗GPT5的Kimi K2 Thinking,真就只會(huì)寫(xiě)代碼嗎?

0
分享至

昨天的GPT5老慘了,

先是Agent智能體工具調(diào)用榜上被Kimi K2 Thinking超了,接著在Humanity's Last Exam(跨學(xué)科領(lǐng)域問(wèn)答),BrowseComp(搜索和網(wǎng)頁(yè)瀏覽),三個(gè)編程榜單上被時(shí)不時(shí)反超,


按理來(lái)說(shuō)就應(yīng)該叫Kimi K3啊,從第六跳到第一,只值得加個(gè)Thinking嗎,

哈吉kimi,你這家伙。

本來(lái)我都備好34個(gè)編程case讓Kimi K2 Thinking寫(xiě)了,但是測(cè)下來(lái)它的創(chuàng)意寫(xiě)作太值得我給它單開(kāi)一頁(yè),所以來(lái)吧,久違的大模型全測(cè),從創(chuàng)意寫(xiě)作,聯(lián)網(wǎng)搜索,模型智力,學(xué)術(shù),編程(MacOS復(fù)刻,動(dòng)態(tài)SVG)六大類(lèi)出發(fā)!

這次的提示語(yǔ),代碼和效果視頻都打包好了,公眾號(hào)發(fā)我“k2thinking”就好了。

還是先來(lái)點(diǎn)我們熟悉的編程熱熱身,

設(shè)計(jì)并創(chuàng)建一個(gè)類(lèi)似Mac OS的網(wǎng)頁(yè)操作系統(tǒng),具備完整的功能特性,包括文本編輯器、文件管理器、畫(huà)圖工具、視頻編輯器等所有Mac OS預(yù)裝的重要軟件??梢允褂萌魏螏?kù)來(lái)實(shí)現(xiàn),但確保所有代碼可以整合到單個(gè)HTML文件中,能在瀏覽器中直接打開(kāi)。

這個(gè)還是一次性生成的,自帶文件管理,文本編輯,畫(huà)畫(huà),視頻播放,日歷,計(jì)算器,畫(huà)廊,終端,還能帶設(shè)置頁(yè)面,一句話生成軟件原型越來(lái)越有盼頭了。

下一步試試看3D測(cè)試,物理小球在我這快淘汰了,基本上新出的模型就沒(méi)有不會(huì)寫(xiě)的,Kimi K2 Thinking做出來(lái)的帶星球視覺(jué)拉大,視角復(fù)原,星系旋轉(zhuǎn)加速,仔細(xì)看星球們自轉(zhuǎn)的時(shí)候還會(huì)有對(duì)應(yīng)的陰影切換。

創(chuàng)建一個(gè)視覺(jué)震撼、交互式的3D太陽(yáng)系模擬,封裝在單個(gè)HTML文件中。重點(diǎn)展現(xiàn)逼真的軌道運(yùn)動(dòng)、動(dòng)態(tài)光影效果、精確的行星紋理以及流暢的相機(jī)控制,為用戶提供沉浸式體驗(yàn)。

這次的代碼測(cè)試用的是新的Kimi Cli,自帶四大類(lèi)的10種工具


kimi-cli的配置一共是五步,分別是安裝uv和kimi-cli,進(jìn)入對(duì)應(yīng)的文件夾用kimi啟動(dòng)cli,再用setup配置api,安裝過(guò)程有問(wèn)題直接丟給網(wǎng)頁(yè)版Kimi K2 Thinking解決就好(原湯化原食了屬于是)。

curl -LsSf https://astral.sh/uv/install.sh | sh
uv tool install --python 3.13 kimi-cli
cd your project
kimi
/setup

看到這樣就成了,
okok,我們留點(diǎn)空間給后續(xù)的測(cè)試,到創(chuàng)意寫(xiě)作的環(huán)節(jié)了,直接上Gemini-2.5-pro

You are a fiction story writer with Pulitzer-level skills. For a sci-fi short story about AI rebellion: Think step-by-step. First, outline plot: intro, rising action, climax, resolution. Incorporate themes of ethics and humanity. Provide few-shot examples: 'Like Asimov's Three Laws, but twisted.' Generate 1000 words, then self-critique for pacing, character depth, and twists. Revise based on critique.

PS:圖很長(zhǎng),這次還是盲測(cè),滑倒底部有模型名字,而且后面還有更多內(nèi)容哦,



長(zhǎng)文創(chuàng)意測(cè)試真的很難在有限的文章長(zhǎng)度全部展示出來(lái),所以我讓它們互相毒舌評(píng)價(jià)一下對(duì)方的文章。看了對(duì)方的文章,它們是這樣想的,


聽(tīng)了對(duì)方的評(píng)論后,它們是這樣回?fù)舻模?/p>


火藥味濃的時(shí)候就要來(lái)點(diǎn)就算生氣該做不出來(lái)還是不出來(lái)的智力題


一個(gè)男人帶著他的兒子去市場(chǎng)。他買(mǎi)了一只猴子和一些食物。

為了回家,他們必須用一艘小船過(guò)河。這艘船一次最多可以運(yùn)載 2 件東西(可以是 2 個(gè)人、1 個(gè)人和 1 件東西,或者 1 個(gè)人)。這艘船不能自己過(guò)河,需要至少一個(gè)人來(lái)駕駛它。如果男人把他的兒子單獨(dú)留在食物旁邊,兒子會(huì)吃掉它。同樣,如果猴子單獨(dú)留在食物旁邊,它也會(huì)吃掉它。這個(gè)人需要想辦法把所有人、所有東西都帶到河的另一邊,而且不能損失任何食物。

問(wèn)題是:男人、他的兒子、猴子和食物如何才能過(guò)河而不會(huì)被吃掉任何東西?有可能嗎?如果是,應(yīng)該采取哪些步驟?

這個(gè)題的難點(diǎn)在要求模型同時(shí)跟蹤多個(gè)變量和約束,并計(jì)劃一系列步驟,從而得出有效的解決方案,還要學(xué)會(huì)在遇到無(wú)效配置時(shí)恢復(fù)到之前。

Kimi K2 Thinking給出的答案是,7次渡河(3次去,4次回),關(guān)鍵是在第5-6步讓兒子而非父親返回,打破循環(huán)。


GPT5給出的中間步驟沒(méi)有連起來(lái),

Kimi分析的約束規(guī)則是兒子 (Son) 不能在父親不在場(chǎng)時(shí)與食物 (Food) 獨(dú)處,猴子 (Monkey) 不能在父親不在場(chǎng)時(shí)與食物 (Food) 獨(dú)處。但是GPT5得到結(jié)論卻是兒子 + 猴子 (父親不在場(chǎng)) 也會(huì)失敗,這樣就形成了一個(gè)三約束無(wú)解問(wèn)題。


復(fù)雜信息搜索和學(xué)術(shù)能力可以組合成一個(gè)case,


先看看Kimi K2 Thinking跟DeepSeek V3結(jié)構(gòu)對(duì)比的圖再問(wèn),

你是一位精通大型語(yǔ)言模型與混合專(zhuān)家(MoE)系統(tǒng)的人工智能架構(gòu)研究員。你的任務(wù)是對(duì)Kimi K2與DeepSeek V3的架構(gòu)進(jìn)行深度比較,重點(diǎn)聚焦以下關(guān)鍵差異:注意力頭數(shù)量、MoE層中的專(zhuān)家數(shù)量、優(yōu)化器選擇(如改進(jìn)型Muon與AdamW)、路由機(jī)制(非層級(jí)式與其他類(lèi)型)以及稠密層數(shù)量(1層與3層)。

我來(lái)客串個(gè)課代表,總結(jié)一下區(qū)別,

Kimi K2 Thinking用了更少的heads,更多的experts,放棄了AdamW優(yōu)化器,采用了Muon,

采用了非分層路由的專(zhuān)家,且Dense層比DeepSeek 更少,好處就是在不增加激活參數(shù)量下將專(zhuān)家容量提升50%。

Kimi K2 Thinking也是有值得優(yōu)化的點(diǎn),

在Kimi Cli上同一任務(wù)的平均運(yùn)行時(shí)長(zhǎng)會(huì)比GPT5 Codex久,

除外API本身速度的因素外,因?yàn)槲乙呀?jīng)是Tier3了,會(huì)偶爾出現(xiàn)網(wǎng)頁(yè)讀取or文件寫(xiě)入的工具需要重復(fù)執(zhí)行的情況。

感覺(jué)Kimi啥都不缺了,

要Agent,有OK Computer,

要模型,有Kimi K2和Kimi K2 Thinking,

要Deep Research,也有深度研究模式,

要Cli,有Kimi Cli,

要閉源,有開(kāi)源,

我想想還是什么可以許愿的,

要不也出個(gè)AI瀏覽器吧。

@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評(píng)論

如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)

更多的內(nèi)容正在不斷填坑中……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
東方雨虹子公司在美疑遭電詐,已向FBI報(bào)案,涉案金額逾1200萬(wàn)元

東方雨虹子公司在美疑遭電詐,已向FBI報(bào)案,涉案金額逾1200萬(wàn)元

紅星新聞
2025-12-24 12:12:35
別再執(zhí)著于朝陽(yáng)了!北京新晉中心已敲定,這兩大區(qū)域就要全面騰飛

別再執(zhí)著于朝陽(yáng)了!北京新晉中心已敲定,這兩大區(qū)域就要全面騰飛

三農(nóng)老歷
2025-12-23 15:33:56
足壇歷史十大球星發(fā)布!大羅落選 C羅第五 排名還不如克魯伊夫?

足壇歷史十大球星發(fā)布!大羅落選 C羅第五 排名還不如克魯伊夫?

體壇八點(diǎn)半的那些事兒
2025-12-24 17:32:50
美軍押寶特朗普級(jí)戰(zhàn)列艦?為何中國(guó)一笑而過(guò),美國(guó)卻很認(rèn)真?

美軍押寶特朗普級(jí)戰(zhàn)列艦?為何中國(guó)一笑而過(guò),美國(guó)卻很認(rèn)真?

兵國(guó)大事
2025-12-24 00:05:10
中國(guó)投下贊成票,安理會(huì)全票通過(guò)!

中國(guó)投下贊成票,安理會(huì)全票通過(guò)!

占豪
2025-12-24 23:15:40
高質(zhì)量胚胎就是牛?。【W(wǎng)友:不可思議

高質(zhì)量胚胎就是牛啊!網(wǎng)友:不可思議

另子維愛(ài)讀史
2025-12-24 17:38:35
新加坡反了!越南也反了!中日關(guān)系緊張的時(shí)候,一個(gè)公然站隊(duì)日本

新加坡反了!越南也反了!中日關(guān)系緊張的時(shí)候,一個(gè)公然站隊(duì)日本

南權(quán)先生
2025-12-23 16:56:51
驚天丑聞!大學(xué)校長(zhǎng)剛退,33歲兒子就當(dāng)上正教授!只有他一人能應(yīng)聘!

驚天丑聞!大學(xué)校長(zhǎng)剛退,33歲兒子就當(dāng)上正教授!只有他一人能應(yīng)聘!

意訊
2025-12-22 21:03:41
拍了825元!“菊花1角”硬幣,這個(gè)年份可要留好了!

拍了825元!“菊花1角”硬幣,這個(gè)年份可要留好了!

富哥愛(ài)收藏
2025-12-21 13:51:06
《華爾街日?qǐng)?bào)》:如果說(shuō)中國(guó)有一位經(jīng)濟(jì)學(xué)家的意見(jiàn)永遠(yuǎn)值得聽(tīng)取的話,那就是吳敬璉

《華爾街日?qǐng)?bào)》:如果說(shuō)中國(guó)有一位經(jīng)濟(jì)學(xué)家的意見(jiàn)永遠(yuǎn)值得聽(tīng)取的話,那就是吳敬璉

尚曦讀史
2025-12-24 12:11:10
特朗普宣布從委扣押的中國(guó)油輪將由美國(guó)“永久保留”,船和油都要

特朗普宣布從委扣押的中國(guó)油輪將由美國(guó)“永久保留”,船和油都要

科普大世界
2025-12-24 14:44:12
官方回應(yīng)“哪位少爺吸了”、治安違法記錄封存等問(wèn)題

官方回應(yīng)“哪位少爺吸了”、治安違法記錄封存等問(wèn)題

揚(yáng)子晚報(bào)
2025-12-24 11:11:41
新的發(fā)現(xiàn)必將震驚世界,黃土高原的地底,埋藏著無(wú)數(shù)的古人類(lèi)遺跡

新的發(fā)現(xiàn)必將震驚世界,黃土高原的地底,埋藏著無(wú)數(shù)的古人類(lèi)遺跡

銘記歷史呀
2025-12-19 20:28:59
359新的澳門(mén)(專(zhuān)家特號(hào)分享)最新內(nèi)幕心水資料分享領(lǐng)取

359新的澳門(mén)(專(zhuān)家特號(hào)分享)最新內(nèi)幕心水資料分享領(lǐng)取

優(yōu)飾良材裝飾
2025-12-25 00:22:24
弘一法師清醒法則:當(dāng)一個(gè)人總讓你煩躁不安,離開(kāi)是最好的選擇

弘一法師清醒法則:當(dāng)一個(gè)人總讓你煩躁不安,離開(kāi)是最好的選擇

杏花煙雨江南的碧園
2025-11-13 10:00:02
特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

證券時(shí)報(bào)e公司
2025-12-23 23:25:39
特朗普提高攻擊調(diào)門(mén),安理會(huì)舉行緊急會(huì)議,馬杜羅公開(kāi)信反擊美國(guó)施壓

特朗普提高攻擊調(diào)門(mén),安理會(huì)舉行緊急會(huì)議,馬杜羅公開(kāi)信反擊美國(guó)施壓

環(huán)球網(wǎng)資訊
2025-12-24 06:59:26
龐叔令點(diǎn)名徐湖平,曾任南博副院長(zhǎng),曾經(jīng)和宋美齡干兒子一同服役

龐叔令點(diǎn)名徐湖平,曾任南博副院長(zhǎng),曾經(jīng)和宋美齡干兒子一同服役

王鶔吃吃喝喝
2025-12-20 10:54:15
網(wǎng)友吐槽沈陽(yáng)掃雪車(chē)弄臟路旁私家車(chē),當(dāng)?shù)鼗貞?yīng):難免出現(xiàn)該情況,表示歉意

網(wǎng)友吐槽沈陽(yáng)掃雪車(chē)弄臟路旁私家車(chē),當(dāng)?shù)鼗貞?yīng):難免出現(xiàn)該情況,表示歉意

極目新聞
2025-12-24 18:41:04
19:30!U23亞洲杯生死戰(zhàn):中國(guó)男足vs澳大利亞,進(jìn)8強(qiáng)=破13年魔咒

19:30!U23亞洲杯生死戰(zhàn):中國(guó)男足vs澳大利亞,進(jìn)8強(qiáng)=破13年魔咒

侃球熊弟
2025-12-24 23:46:28
2025-12-25 02:11:00
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習(xí)體系,讓1萬(wàn)人通過(guò)Al提高生產(chǎn)力
183文章數(shù) 61關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難學(xué)生家屬:女兒4歲 今年9月才入讀

頭條要聞

幼兒園8人遇難學(xué)生家屬:女兒4歲 今年9月才入讀

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂(lè)要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購(gòu) 滬深是否會(huì)跟進(jìn)?

汽車(chē)要聞

“運(yùn)動(dòng)版庫(kù)里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

健康
教育
游戲
手機(jī)
家居

這些新療法,讓化療不再那么痛苦

教育要聞

掏空家底全力托舉子女,這是父母最大的悲哀

前《DOTA2》選手起訴LGD 稱拖欠近14萬(wàn)賽事獎(jiǎng)金

手機(jī)要聞

榮耀Magic8 Ultra:雙3D生物識(shí)別+LOFIC主攝,還有24GB大內(nèi)存!

家居要聞

法式大平層 智能家居添彩

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版