国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi沒有DeepSeek的命

0
分享至


  • 2024

或許你還記得,在并不遙遠的2024 年,Kimi是中國AI當紅炸子雞:10億美金融資、Kimi概念股多次漲停、200萬字輸入碾壓GPT、激進的投流推廣策略。

但他們當時獲得的曝光度,遠超自己的技術影響力。

事實上,那個200萬字的模型,后來能用到的人微乎其微。后來了解到,那是個實驗性模型,每次運行成本接近 3 位數(shù),完全不具備大規(guī)模服務用戶的可能性。

那時的技術圈,對 Kimi 是不屑一顧的。

但是靠著200萬字的噱頭,Kimi還是站住了「長文本」標簽和用戶心智。

  • 2025

2025 年初,DeepSeek 橫空出世,真正靠技術實力成為中國AI技術的代言人。

到了 2025年中,Kimi 已快一年沒任何融資的消息。被「唱衰」成為主旋律,員工開始流失,業(yè)內(nèi)基本給這個創(chuàng)業(yè)項目判了死刑。

如果你從2025年年中開始,閉關了 9 個月,到2026年3月看到新聞:

  • Kimi 最新估值 1200 億;

  • Kimi 20 天收入超過去一年;

  • Kimi的模型被3500億估值的最火AI編程工具Cursor套殼并實錘(你閉關了9個月,所以不知道最火的AI編程工具已經(jīng)是 Claude Code了,Cursor已成老二);

  • Kimi新模型被承載了互聯(lián)網(wǎng)20%流量、市值超過 5000 億Cloudflare引入為主力模型;

  • Kimi新模型成為全球最大獨立AI搜索應用Perplexity唯一引入的開源模型和中國模型;

  • Kimi新技術「注意力殘差」開始改造深度學習架構10多年來的地基,并得到前OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy、OpenAI推理模型之父 Jerry Tworek 以及馬斯克稱贊;

  • 楊植麟成為英偉達2026 GTC年度大會唯一受邀做演講的全球獨立大模型公司代表……

你很可能會驚掉下巴。

大家說「AI 一天,人間一年」,AI 領域 9 個月確實發(fā)生了很多事情。

但歸根結底是一件事情,AI技術的范式發(fā)生了變化。這個變化最常見、最偷懶的概括是從 Chat 到 Agent。

對全世界的 3000萬程序員來說,變化是,最受推崇的工具從Cursor 變成 Claude Code。

對總是率先擁抱新技術的 early adopter 來說,變化是更頻繁地打開那個類似 DOS 系統(tǒng)的黑白命令行終端……

對AI公司來說,變化是大家陸續(xù)發(fā)現(xiàn):更會聊天的模型,遠不如會寫代碼和調(diào)用工具的模型有價值。

最酷的產(chǎn)品從ChatGPT變成Claude Code,最酷的創(chuàng)業(yè)公司也從 OpenAI 變成了 Anthropic。

回到 2025 年初的中國市場。

DeepSeek R1 因為復刻并開源了 OpenAI o1 的「深度思考」能力爆火,另一個「通用 Agent」產(chǎn)品 Manus 也橫空出世……

彼時的中國AI公司,大多數(shù)在忙著復現(xiàn) DeepSeek R1,推出能「深度思考」的新模型。少數(shù)公司意識到 Manus 背后的那個模型,才是更值得花資源「復現(xiàn)」的東西?;蛘咭庾R到了,但沒有分配到足夠的資源,或找到方法。

Manus的一個很大的價值,就是可視化呈現(xiàn)了Claude模型的多輪工具調(diào)用能力。正如一位大模型公司的技術專家在自己的博客中寫到,「絕大多數(shù) Agent 產(chǎn)品,離了 Claude 以后,什么都不是。」

直到 2025年7月,中國第一個主打Agent能力的模型才悄然出現(xiàn)。7月11日,Kimi K2 發(fā)布,喊的是 Open Agentic Intelligence。這里顯然藏著他們的野心:復現(xiàn) Claude 模型的 Agent 能力,并開源出去。就像 DeepSeek R1 復現(xiàn) OpenAI o1并開源出去。

發(fā)布 5 天后,7月16日,英國的 Nature 自然雜志發(fā)現(xiàn)了這個模型的價值,用「另一個DeepSeek時刻」來形容。

發(fā)布10天后,7月21日,Anthropic聯(lián)合創(chuàng)始人Jack Clark在自己的博客中介紹了 K2,評價稱:

在我看來,Kimi 是一款還不錯的模型,落后美國最前沿幾個月,延續(xù)了 DeepSeek 的軌跡。其編碼和工具調(diào)用分數(shù)已足夠高,我預計現(xiàn)實中會有人真正用它,因此觀察其采用率能折射競爭力。

7 月底,楊植麟在播客專訪中,解釋了 K2 為什么沒有先做「深度思考」,而是在 Agent 需要的編程和工具調(diào)用能力上發(fā)力。他用「缸中之腦」來形容主打深度思考的模型。對了,楊植麟這篇采訪值得多看幾遍,他講了很多技術層面更本質(zhì)的東西,比如編程和Agent的關系,思考和工具調(diào)用的關系。

因為 K2 和后續(xù) K2 Thinking 模型的表現(xiàn),Kimi 的融資在年底終于續(xù)上了,5 億美金,IDG和幾家老股東繼續(xù)加持。

  • 2026

2026 年春節(jié)前后,這個瘋狂的大模型發(fā)布季,Kimi 是第一個交卷的選手。可能也是讓同行們最難受的一個,因為 K2.5萬億參數(shù)、圖片和視頻的多模態(tài)理解能力,支持思考和非思考模式。其他創(chuàng)業(yè)公司同行發(fā)布的都是純文本模型。有實力把多模態(tài)能力融入旗艦模型的,只有大廠的閉源模型。

3月16號,Kimi團隊發(fā)布了Attention Residuals的技術論文,挑戰(zhàn)已有 10 年歷史的神經(jīng)網(wǎng)絡底層殘差連接機制。OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy銳評Kimi「讓我們意識到根本沒有把Attention is All You Need理解透徹」,要知道,Attention is All You Need就是開啟大模型時代的圣杯,哪怕考慮到AI圈的通詞膨脹,這個評價也是前所未有的高。據(jù)說,論文第一作者是一位僅 17歲的高中生,天才出少年,真是令人感慨。

3月17號,Kimi 模型繼年初的 CES 2026 之后,在黃仁勛的 GTC 2026 主旨演講中再度成為英偉達展示下一代芯片和推理性能的御用模型。


3月18號,作為英偉達的GTC年度大會唯一受邀的中國獨立大模型公司代表,楊植麟的現(xiàn)場演講全是干貨,上來就把優(yōu)化器、注意力機制、殘差連接三大核心模塊比作有8-11年歷史的陳舊技術標準,是繼續(xù)Scaling的障礙,用新的技術突破表明「每一項基礎技術都值得重新思考」。

然后是這幾天人盡皆知的「Cursor丑聞」,誰能想到,估值500億美金的全球最大編程助手Cursor,重磅推出的新一代編程模型Composer 2——跑分超過Claude Opus 4.6——竟然是套的Kimi K2.5的殼??

身為Token中介定位的Cursor之所以要發(fā)力「自研」,主要還是為了擺脫它對Anthropic和OpenAI的高度依賴,卡脖子這事兒可不分國界,Anthropic也真的曾經(jīng)斷供Windsurf這類編程工具,在既當裁判員又當運動員的環(huán)境下,Cursor希望獨立自主的心情,完全可以理解。

只是能力和愿景之間的巨大鴻溝,讓Cursor選擇了抹掉來自Kimi的底座模型名字,靠代筆求融資,事情最后也算是體面收場,Cursor的聯(lián)合創(chuàng)始人公開道歉,在技術報告中給除了選擇 Kimi K2.5 作為底座模型的詳細理由,而Kimi官方也回應表示,很高興Cursor使用Kimi K2.5作為基座,雙方通過推理服務商 Fireworks AI 做了技術授權。

根據(jù)小道消息, 2026 年春節(jié)前后,Kimi 陸續(xù)以投前 48 億美元、60 億美元、100億美元的估值完成總額近 20 億美元的融資,3月份開啟的 180 億美元輪次份額也要排隊才能拿到。

這當然也受益于兩個同行在港股的超常表現(xiàn),但更重要的還是靠自己的 K2和后續(xù)的模型實際表現(xiàn),包括前文題庫的 Cursor、Cloudflare、Perplexity、黃仁勛、馬斯克、馬克·安德森、查馬斯等不斷發(fā)來的「金水」,以及K2.5發(fā)布后20天收入超過過去一年的財務表現(xiàn)。

一位 Kimi 的朋友在私下聊天里說,制約業(yè)務發(fā)展的只有算力,現(xiàn)在至少還有 10 倍的需求沒有滿足。有多少卡,就能有多少收入。據(jù)我跟另一個大廠工作的朋友了解,現(xiàn)在有些大廠在編程工具中接入的Kimi模型,甚至要通過預購才能拿到足夠的額度。

這 9 個月,Kimi 算是完成了一次逆天改命。

DeepSeek V3不是一天煉成的。其背后的幻方量化基因,決定了他們從 2023 年起就走上了一條與硅谷截然不同的極致能效比之路。在 2023 到 2024 年的大部分時間里,他們游離于主流敘事之外,潛心自研 MLA(多頭潛在注意力機制) 與 DeepSeekMoE 架構,試圖在有限的算力下壓榨出超越物理極限的性能。直到 2025 年成就自己,也給其他AI創(chuàng)業(yè)公司帶來信心。

所有人都在期待 DeepSeek 的下一代模型繼續(xù)驚艷全場,但媒體上三番五次的「狼來了」把戲只會消磨大家的注意力。技術突破,哪是那么容易的事情,我們完全有理由更有耐心地等待 DeepSeek 團隊的下一個作品。

Kimi K2 也不是一天煉成的。他們實際上跟 DeepSeek R1同一天發(fā)布了無人問津的K1.5模型,被OpenAI官方認為是率先復現(xiàn)o1的兩個公司之一。他們在被唱衰最厲害的2025年初發(fā)布了Moonlight系列小型MoE模型,用來驗證下一代二階優(yōu)化器技術,并且最終應用到萬億的K2模型上。現(xiàn)在Muon已取代已經(jīng)用了10年的標準技術Adam,成為Kimi、GLM-5、DeepSeek Engram在內(nèi)的新模型都開始采用的新標準。

正所謂,「出來混,總要還的?!筀imi 在2024年提前享受了C位和曝光,2026年沒再復現(xiàn)該屬于自己的流量。

各有各的命。

作為兩家?guī)缀跬瑫r起步的創(chuàng)業(yè)公司,我佩服他們那種從來不認為市場格局已定、相信技術才是最大變量、敢于追逐AGI 的勇氣和年輕生猛、戰(zhàn)績可查、永遠相信細水長流的力量。

即使站在 2026年3月底這個時間節(jié)點看,2022年底開始的這場AI革命也才進行了3年半的時間,一切才剛剛開始。為什么下一個 OpenAI 和 Anthropic 不能是一家中國公司?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
屢教不改!跳水世界杯將開賽,陳芋汐迎壞消息,全紅嬋事件再上演

屢教不改!跳水世界杯將開賽,陳芋汐迎壞消息,全紅嬋事件再上演

以茶帶書
2026-04-29 17:03:50
王楚欽:誰敢說穩(wěn)贏我們?反正我不信 放馬過來 看看能打成什么樣

王楚欽:誰敢說穩(wěn)贏我們?反正我不信 放馬過來 看看能打成什么樣

念洲
2026-04-29 14:48:01
高校丨“大儒”楊念群被舉報與十數(shù)名女子發(fā)生不正當關系,自稱“學術布拉德皮特”(簡明版)

高校丨“大儒”楊念群被舉報與十數(shù)名女子發(fā)生不正當關系,自稱“學術布拉德皮特”(簡明版)

忘憂雜話店
2026-04-29 15:25:20
重大進展!我國新發(fā)現(xiàn)13個億噸級油田

重大進展!我國新發(fā)現(xiàn)13個億噸級油田

看看新聞Knews
2026-04-29 12:28:10
名宿稱趙心童戰(zhàn)略智謀不如對手,亨德利直言墨菲這狀態(tài)很難被擊敗

名宿稱趙心童戰(zhàn)略智謀不如對手,亨德利直言墨菲這狀態(tài)很難被擊敗

楊華評論
2026-04-30 00:54:29
安德拉達被禁賽13場!染紅后一拳擊倒對手,3人合計禁賽19場

安德拉達被禁賽13場!染紅后一拳擊倒對手,3人合計禁賽19場

奧拜爾
2026-04-29 21:51:34
受賄數(shù)額特別巨大,廣西壯族自治區(qū)黨委原副書記、自治區(qū)政府原主席藍天立被提起公訴

受賄數(shù)額特別巨大,廣西壯族自治區(qū)黨委原副書記、自治區(qū)政府原主席藍天立被提起公訴

界面新聞
2026-04-29 10:03:28
辣眼!侃爺澳洲妻子再穿暴露連體衣,大方展示...!外媒都看不下去了

辣眼!侃爺澳洲妻子再穿暴露連體衣,大方展示...!外媒都看不下去了

澳洲紅領巾
2026-04-29 14:44:16
為什么住院14天必須出院

為什么住院14天必須出院

老郭在學習
2026-04-29 13:49:19
浙江力克寧波總分1-0:程帥澎14分傷退 約翰遜13+7+4帽超楊瀚森

浙江力克寧波總分1-0:程帥澎14分傷退 約翰遜13+7+4帽超楊瀚森

醉臥浮生
2026-04-29 21:35:01
“老俞絕不虧待自己” 東方甄選主播集體離職后,俞敏洪獲價值5000萬港元獎勵,粉絲心寒掀退費潮

“老俞絕不虧待自己” 東方甄選主播集體離職后,俞敏洪獲價值5000萬港元獎勵,粉絲心寒掀退費潮

新浪財經(jīng)
2026-04-29 17:07:23
北約傻眼:俄羅斯直接把繳獲的M1主戰(zhàn)坦克和豹2主戰(zhàn)坦克送給了朝鮮

北約傻眼:俄羅斯直接把繳獲的M1主戰(zhàn)坦克和豹2主戰(zhàn)坦克送給了朝鮮

阿龍聊軍事
2026-04-29 17:12:43
90后救人夫妻找到!人民日報點名,工作單位曝光,難怪會不顧一切

90后救人夫妻找到!人民日報點名,工作單位曝光,難怪會不顧一切

奇思妙想草葉君
2026-04-29 18:37:49
無緣衛(wèi)冕世錦賽!趙心童10-13出局 輸球原因曝光 中國球員剩獨苗

無緣衛(wèi)冕世錦賽!趙心童10-13出局 輸球原因曝光 中國球員剩獨苗

侃球熊弟
2026-04-29 23:58:39
“我已經(jīng)跑路了,你們?nèi)蟀赴伞蹦凶釉p騙熟人350 余萬元后朋友圈宣告跑路,上海警方跨省將其抓獲歸案!

“我已經(jīng)跑路了,你們?nèi)蟀赴伞蹦凶釉p騙熟人350 余萬元后朋友圈宣告跑路,上海警方跨省將其抓獲歸案!

新民晚報
2026-04-29 08:35:49
97年我跑長途捎了一位尼姑,尼姑下車時送我三句話,三年后全應驗

97年我跑長途捎了一位尼姑,尼姑下車時送我三句話,三年后全應驗

千秋文化
2026-04-29 19:09:51
96歲奶奶擺攤10年還清2077萬,但凡稍微“體面”一點,都說不口

96歲奶奶擺攤10年還清2077萬,但凡稍微“體面”一點,都說不口

走讀新生
2026-04-29 10:48:15
能讓方丈給自己全身開光,真不是一般人的待遇和幸運呀?

能讓方丈給自己全身開光,真不是一般人的待遇和幸運呀?

情感大頭說說
2026-04-30 01:15:41
“手術必須100%成功,不接受任何意外”這句話說完,三甲醫(yī)院主任霸氣回懟:不擔風險,手術暫停!

“手術必須100%成功,不接受任何意外”這句話說完,三甲醫(yī)院主任霸氣回懟:不擔風險,手術暫停!

醫(yī)護健康科普
2026-04-29 17:16:58
奧斯卡提名演員消失3個月:一條沒證實的八卦,如何逼他退出互聯(lián)網(wǎng)

奧斯卡提名演員消失3個月:一條沒證實的八卦,如何逼他退出互聯(lián)網(wǎng)

娛圈觀察員
2026-04-29 02:50:15
2026-04-30 04:32:50
闌夕 incentive-icons
闌夕
最具觀點的互聯(lián)網(wǎng)商業(yè)評論
2481文章數(shù) 73966關注度
往期回顧 全部

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

頭條要聞

伊朗提出先解除封鎖 特朗普回應

頭條要聞

伊朗提出先解除封鎖 特朗普回應

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節(jié)目組2小時

財經(jīng)要聞

蘇州,率先進入牛市

汽車要聞

技術天花板再摸高 全能型的奕境X9首秀

態(tài)度原創(chuàng)

本地
時尚
游戲
數(shù)碼
公開課

本地新聞

用青花瓷的方式,打開西溪濕地

夏天穿維希格,原來這么好看

平等曹飛所有老玩家的危機合約,為何是二游高難玩法最高的山?

數(shù)碼要聞

極米RS30系列投影儀發(fā)布,8822-13499元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版