国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)大模型年前集中爆發(fā),Kimi新模型k1.5對標(biāo)OpenAI o1滿血版(附帶技術(shù)報告解讀)

0
分享至

大洋彼岸的 OpenAI 遲遲沒有發(fā)布 GPT-5,一度讓業(yè)界懷疑 Scaling Law 是否已經(jīng)失效。然而,國內(nèi)多個團(tuán)隊卻接連推出重磅 AI 大模型,用事實證明 Scaling 依然有效,只不過并不是無腦堆硬件、堆算力。

Kimi k1.5的這次推出的大模型就是以推理能力見長的模型。

不知道你們有沒有注意到Recipe這個詞,在Kimi k1.5的技術(shù)報告提到了好多次,它的意思是「菜譜」,相當(dāng)于說把一道菜需要的原材料、炊具以及注意事項都明明白白告訴你了。

技術(shù)報告鏈接:

https://github.com/MoonshotAI/Kimi-k1.5/blob/main/Kimi_k1.5.pdf

可以說,一向閉源的Kimi這次的技術(shù)報告可以理解為「半開源」,就像把西紅柿雞蛋的做法一步步的列出來,你模仿它的方法即可,唯一不同的就是具體的操作差異。

比如你的火力大一點兒,鍋的材質(zhì)不同等等,并且Kimi k1.5的性能在好幾個方面的性能都已經(jīng)事實上的超過了OpenAI o1滿血版,可以說是含金量非常高的一次「半開源」。

特別是OpenAI o3,也就是在FrontierMath這個非常難的數(shù)學(xué)測試集上達(dá)到了變態(tài)成績后的幾周,被曝出暗中資助了這個比賽的丑聞。

如果o3是靠在數(shù)據(jù)集和答案上預(yù)訓(xùn)練出來的,那么它這種既當(dāng)運動員也當(dāng)裁判員的操作,也才拿到了25%左右的正確率,這只能證明o3僅是o1的特殊微調(diào)版,只是用來維持OpenAI紙面榮譽的工具。

那Kimi k1.5的含金量就直線上升了,long CoT在Math數(shù)學(xué)推理,Code編程能力以及Vision視覺多模態(tài)上的表現(xiàn),4/6超過了最強的o1正式版模型。

Kimi k1.5還用了Long2short的方法,將Long CoT的能力遷移到Short CoT上,也在大多數(shù)的任務(wù)上達(dá)到了SOTA的水平,最牛的是在AIME的Pass@1實驗中,效果遠(yuǎn)超其他幾家(第一個子圖藍(lán)色的Kimi獨樹一幟)。

特別是Long2short之后迭代出來的幾個short CoT,在下面這兩個數(shù)學(xué)數(shù)據(jù)集上的性能甚至超過了long CoT,可見CoT可以深挖甚至scaling的地方還有很多。

這些數(shù)據(jù)基本上表明了OpenAI o1滿血版的性能全面在Kimi k1.5上實現(xiàn),更重要的是Kimi K系列的快速迭代能力,從初代 Kimi k0 math 到Top級別的 Kimi 1.5,就倆月多點,直接數(shù)學(xué)偏科到全科專精。

其中第一個長上下文是最近發(fā)布的幾個大模型的共性,因為初代LLM的思路簡單直接,就是一問一答,單步操作;

但是后來發(fā)現(xiàn)這樣的單步操作對于比較復(fù)雜的問題,比如數(shù)學(xué)物理等需要更多邏輯思考且一步完不成的任務(wù),就需要思維鏈(CoT)這樣的技術(shù),相比起初代LLM,推理大模型可以將復(fù)雜的任務(wù)分成簡單的單步任務(wù)進(jìn)行。

這樣的好處很直接,不過缺點也很明顯,那就是這些思考過程明顯是需要更多的“記憶力”,換到LLM大模型領(lǐng)域就是上下文長度了,理論上越長越好,最近發(fā)布的MiniMax-01就把上下文長度記錄拉到了400萬。

Kimi k1.5并沒有在極限上下文上做文章,而是將long context長度定為128K,然后用Partial Rollout的方法重復(fù)利用歷史記錄,而不是重新生成,這樣的策略從結(jié)果上表明非常有效。

再加上如果用過OpenAI o1的話,很多簡單的問題o1會出現(xiàn)過度思考(overthinking)的現(xiàn)象,其實這也是一種對于計算能力的浪費以及策略不夠優(yōu)化的表現(xiàn)。

菜譜也提到了這個點,他們采用了長度懲罰(Length Penalty)的措施,倒逼大模型跟人類對齊,畢竟人類不會對一個簡單問題思考6分鐘。

最后,我特意看了看Kimi微信公眾號對于自己新模型的介紹,開頭的一句話特別契合Kimi k1.5這個模型。

簡單的方法在很多時候被認(rèn)為是取巧的,但事實支配上人類社會以及整個自然界運轉(zhuǎn)的規(guī)律都是非常簡潔且優(yōu)雅的,既不存在無限資源這種美夢,也沒有出現(xiàn)普遍的窮思竭慮。

總的來說,Kimi k1.5的這次更新,無疑將中國的大模型和國外最頂尖的OpenAI差距拉到了幾乎同一個水平線,同時這次的「半開源」更是給AI 大模型社區(qū)注入了一些「做菜秘訣」,相信這些東西可以讓整個大模型社區(qū)的進(jìn)化速度更進(jìn)一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
這6個“先進(jìn)設(shè)計”,若你家里一樣都沒有,說明已經(jīng)落伍了!

這6個“先進(jìn)設(shè)計”,若你家里一樣都沒有,說明已經(jīng)落伍了!

家居設(shè)計師蘇哥
2025-12-28 14:01:53
9冠夢又碎,申真谞一路落后負(fù)王星昊,中國2名棋手全勝殺進(jìn)4強

9冠夢又碎,申真谞一路落后負(fù)王星昊,中國2名棋手全勝殺進(jìn)4強

真理是我親戚
2025-12-28 11:33:29
《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無愧

《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無愧

白面書誏
2025-12-26 16:04:00
曾被吹捧上天,如今卻淪為笑柄的6個坑人物品,大家別再買了!

曾被吹捧上天,如今卻淪為笑柄的6個坑人物品,大家別再買了!

室內(nèi)設(shè)計師有料兒
2025-12-27 17:07:20
繼海南之后,廣西和云南多地也開始驅(qū)趕房車,究竟為哪般?

繼海南之后,廣西和云南多地也開始驅(qū)趕房車,究竟為哪般?

趣味萌寵的日常
2025-12-17 00:13:52
票房會破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應(yīng)驗了

票房會破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應(yīng)驗了

小丸子的娛樂圈
2025-12-26 17:59:11
搶中國原油的美軍,意識到玩砸了,收到最新命令,60天內(nèi)不能動手

搶中國原油的美軍,意識到玩砸了,收到最新命令,60天內(nèi)不能動手

近史博覽
2025-12-26 11:41:41
28到31日白天廣東大部晴到多云

28到31日白天廣東大部晴到多云

廣東天氣
2025-12-28 13:20:06
洪森直接開罵了,指著他那個48歲的兒子

洪森直接開罵了,指著他那個48歲的兒子

百態(tài)人間
2025-12-23 16:39:10
張水華失去排名資格!疑被田協(xié)競賽管理系統(tǒng)除名,處分后遺癥來了

張水華失去排名資格!疑被田協(xié)競賽管理系統(tǒng)除名,處分后遺癥來了

一枚野球君
2025-12-28 12:10:47
古今最豪放的詩詞,我只服這十首,全是巔峰之作!

古今最豪放的詩詞,我只服這十首,全是巔峰之作!

長風(fēng)文史
2025-12-12 09:02:41
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場“社死”

就一點
2025-10-09 12:19:42
共青團(tuán)武漢市委書記皮惠蘭履新武漢市委市直機關(guān)工委

共青團(tuán)武漢市委書記皮惠蘭履新武漢市委市直機關(guān)工委

澎湃新聞
2025-12-28 17:26:28
特朗普下令開火,美軍不宣而戰(zhàn),30艘船只被擊沉,上百人當(dāng)場死亡

特朗普下令開火,美軍不宣而戰(zhàn),30艘船只被擊沉,上百人當(dāng)場死亡

現(xiàn)代小青青慕慕
2025-12-28 11:20:26
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

科普100克克
2025-12-07 18:20:34
日本媒體繃不住了!中國大型CP32漫展,宣布禁止日本動漫參展

日本媒體繃不住了!中國大型CP32漫展,宣布禁止日本動漫參展

扶蘇聊歷史
2025-12-27 14:05:24
陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

鄉(xiāng)野小珥
2025-12-23 05:38:57
37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責(zé)造謠者

37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責(zé)造謠者

滄海一書客
2025-12-27 00:16:56
日本軍援12國加碼挑釁,拉夫羅夫發(fā)出最重警告:高市早苗別玩火

日本軍援12國加碼挑釁,拉夫羅夫發(fā)出最重警告:高市早苗別玩火

荷蘭豆愛健康
2025-12-28 20:33:41
2025-12-28 21:47:01
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

本地
教育
藝術(shù)
公開課
軍事航空

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

教育要聞

從2026年北京選調(diào)擬錄用名單看升學(xué):這些大學(xué)最受青睞

藝術(shù)要聞

驚艷!陳紅20年前沙發(fā)照曝光,宛如人間尤物!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

與特朗普會晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進(jìn)入關(guān)懷版