楊植麟帶隊發(fā)論文，Kimi下一代模型架構曝光，推理之父驚呼：深度學習2.0要來了！

2026-03-18 02:45:47　來源: 智東西

北京舉報

分享至

智東西
作者｜陳駿達
編輯｜云鵬

“一切都需要被重新思考，深度學習2.0時代即將來臨?！?/strong>在讀完下方這篇來自月之暗面的最新論文后，前OpenAI大牛、“推理模型之父”Jerry Tworek發(fā)出感嘆。

智東西3月16日報道，今天，月之暗面發(fā)布論文，提前預覽了下一代模型的關鍵模塊——注意力殘差（Attention Residuals，簡稱AttnRes）。論文的核心亮點在于對大模型中最基礎、但長期被忽視的結構——殘差連接（Residual Connection）進行了重新設計。

在傳統(tǒng)Transformer架構中，每一層都會將前一層的輸出與當前層的計算結果直接相加，這種“等權累加”的方式雖然穩(wěn)定了深度網(wǎng)絡訓練，但隨著模型層數(shù)不斷增加，所有歷史層的表示被簡單疊加，容易導致信息被逐漸稀釋，深層網(wǎng)絡的表達能力受到限制。

AttnRes用注意力機制替代固定的殘差相加方式，讓每一層能夠從所有歷史層表示中動態(tài)選擇最有用的信息。每一層相當于一個查詢（Query），在之前層的表示中進行檢索并分配權重，使模型能更靈活地利用不同層級的特征。

在實現(xiàn)層面，論文還提出了塊級注意力殘差（Block AttnRes）來解決大模型訓練時的計算和通信開銷問題。

實驗中，月之暗面將AttnRes集成到Kimi Linear架構（總參數(shù)量48B/激活參數(shù)量3B）中，在1.4T token上進行預訓練。AttnRes緩解了預歸一化的稀釋問題，產(chǎn)生更均勻的跨深度輸出幅度和梯度分布，從而緩解深層模型訓練中的不穩(wěn)定問題。

在相同計算預算下，引入AttnRes的模型在多個基準測試中均取得穩(wěn)定提升，尤其是在數(shù)學推理、科學問答以及代碼生成等需要復雜推理能力的任務上。

此外，Block AttnRes的驗證損失為1.692，而基線為1.714，相當于約1.25倍的計算效率優(yōu)勢。

這篇論文在大模型圈引發(fā)廣泛討論，月之暗面官方在X平臺發(fā)布的帖子閱讀量已逼近60萬次。除了Jerry Tworek之外，OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy也評論道：“隨機梯度下降（常用的優(yōu)化算法之一）也是一種ResNet，殘差流就是權重……看來我們還沒把‘Attention is All You Need’ 這句話完全按字面意思理解透。”

月之暗面的數(shù)十名研究員參與了這項研究，對項目貢獻最大的三位研究員包括Guangyu Chen、Yu Zhang（Kimi-Linear一作）、Jialin Su。月之暗面的三位聯(lián)合創(chuàng)始人楊植麟、吳育昕、周昕宇帶領團隊完成了這項研究。

一、標準殘差連接，面臨“等權累加”之困

由知名華人AI學者何愷明等人提出的標準殘差連接，最早在ResNet中系統(tǒng)化提出，并迅速成為現(xiàn)代深度神經(jīng)網(wǎng)絡的核心結構之一。

隨著深度學習的發(fā)展，這一設計不僅在計算機視覺中取得巨大成功，也逐漸成為大型語言模型和各類Transformer系統(tǒng)中的基礎構建模塊。

其核心思想非常直觀：讓網(wǎng)絡學習“殘差”（即輸入與輸出之間的差值），而不是直接擬合完整映射。標準殘差連接中，每一層的輸入等于所有之前層輸出的累積和。殘差連接實際上是一種跨深度的信息聚合機制，所有層的貢獻權重都是1，也就是均勻加權。

在現(xiàn)代大模型中，殘差結構通常還會與PreNorm（預歸一化）結合使用。具體做法是在每個子層計算之前先進行層歸一化，然后再進入注意力或前饋網(wǎng)絡模塊，最后再通過殘差連接將輸出加回原始表示。

這種結構在Transformer模型中被廣泛采用，因為它能夠進一步改善訓練穩(wěn)定性，使梯度在深層網(wǎng)絡中更容易傳播，并避免訓練后期出現(xiàn)數(shù)值不穩(wěn)定的問題。

標準殘差連接之所以能獲得廣泛采用，在于其解決了深層網(wǎng)絡訓練困難的問題，允許梯度繞過復雜變換，緩解了梯度消失的問題。同時，殘差使每層對表示的修改是漸進的，不會破壞已有表示。模型訓練更穩(wěn)定、更容易優(yōu)化。

然而，這一方式也存在一些局限性。標準殘差連接中所有層的權重一致，但現(xiàn)實情況是不同層信息的重要性不同。理想情況下應該采用可學習的權重。

此外，學習時，每層網(wǎng)絡只能看到壓縮后的狀態(tài)，導致許多早期信息被混合壓縮，無法單獨訪問某一層輸出，導致信息不可逆的丟失。同時，后期層在模型的貢獻中變大，早期層被逐漸淹沒。

模型剪枝（prune）等方式對模型性能影響不大，這一現(xiàn)象也從側面證明，當前廣泛采用的殘差結構，使很多層貢獻很小。

正是在這樣的背景下，月之暗面的研究團隊提出了一種新的思路：用習得的softmax注意力機制來替代固定的殘差累積，也就是AttnRes。

二、用注意力替代固定權重，讓每一層學會“檢索”歷史

在AttnRes中，每一層在計算時不再僅僅依賴上一層的輸出，而是可以對之前多個層的表示進行一次注意力檢索。模型通過學習得到的一組權重，對不同層的輸出進行加權組合，從而生成當前層的輸入表示。

由于這些權重通過softmax歸一化，它們能夠反映不同層在當前上下文中的相對重要性，使信息聚合過程更加靈活和自適應。

這種機制帶來的一個直接好處是，模型能夠更有效地利用早期層的信息。由于每一層都可以直接訪問歷史層的表示，早期信息不再被完全壓縮到單一狀態(tài)中，而是可以在需要時被重新調(diào)用。

這種“跨層檢索”的能力，使得深層網(wǎng)絡在信息利用上更加接近于Transformer在時間維度上的注意力機制。

對于每個token，完整AttnRes需要O(L2d)的算術運算和O(Ld)的內(nèi)存來存儲層輸出。由于深度遠小于序列長度，算術成本適中。

當然，如果讓每一層都對所有歷史層進行注意力計算，也就是使用全注意力殘差，計算成本會迅速增加。為了解決這一問題，研究團隊進一步提出了Block AttnRes（塊注意力殘差）的結構設計。

該方法將網(wǎng)絡層劃分為若干塊，每個塊內(nèi)部保持常規(guī)計算方式，而跨塊之間則使用壓縮后的表示進行注意力交互。

通過這種方式，模型在保持靈活信息檢索能力的同時，也能有效控制計算復雜度，使這一機制在大規(guī)模模型中仍然具有可行性。

▲從左到右：傳統(tǒng)殘差、全注意力殘差、塊注意力殘差

三、基礎設施協(xié)同優(yōu)化，計算效率達1.25倍

不過，Block AttnRes也給基礎設施帶來新的挑戰(zhàn)。

在訓練階段，Block AttnRes帶來更多的流水線并行中通信開銷。標準殘差結構在流水線階段之間只需傳輸固定大小的隱藏狀態(tài)，而Block AttnRes需要在每個階段訪問此前所有塊的表征。

如果采用樸素實現(xiàn)，就必須在階段轉(zhuǎn)換時重復傳輸完整的歷史塊表示，通信量會隨著塊數(shù)量累積呈平方增長。為了解決這一問題，月之暗面引入跨階段緩存（cross-stage cache）機制，大幅減少冗余通信。

同時，每個塊只需在虛擬階段中存儲一次，結合激活檢查點機制后，每層激活內(nèi)存占用與標準Transformer基本一致，因此整體訓練的額外開銷很小，在實際系統(tǒng)中端到端訓練時間增加不到4%。

在推理階段，Block AttnRes的主要挑戰(zhàn)來自跨層塊表征的重復訪問和長上下文緩存帶來的內(nèi)存壓力。為此他們采用了兩階段計算策略，首先在階段一中對緩存的塊表征執(zhí)行一次批量查詢，為同一塊內(nèi)的所有層同時計算塊間注意力，從而將原本每層都需要訪問歷史塊的操作合并為一次矩陣計算，顯著降低內(nèi)存讀取次數(shù)。

隨后在階段二中按順序計算塊內(nèi)各層的注意力，并通過在線softmax將結果與階段一的輸出合并，這一階段可以與周圍算子進行內(nèi)核融合，從而進一步減少I/O開銷。

此外，為緩解長上下文預填充時塊表征緩存過大的問題，系統(tǒng)將這些表征沿序列維度在張量并行設備之間進行分片，使每個設備只存儲部分序列。通過兩階段計算和序列分片的結合，BlockAttnRes在推理時僅帶來不到2%的延遲開銷，同時顯著降低了長上下文場景下的顯存需求。

在實驗方面，研究團隊將這一結構集成到Kimi Linear架構中進行驗證。

實驗表明，在相同參數(shù)規(guī)模下，引入Block AttnRes后，模型在多個基準測試中都取得了性能提升。其中提升最多的是多步推理基準測試GPQA-Diamond，采用AttnRes的模型得分提升幅度超過了20%。

與此同時，該方法還表現(xiàn)出良好的計算效率，Block AttnRes在損失函數(shù)上與使用1.25倍計算量訓練的基線模型相當。

結語：將注意力引入“網(wǎng)絡深度維度”，有望成為下一代模型關鍵架構

通過將注意力機制引入深度維度，Attention Residuals為深層網(wǎng)絡提供了一種更加靈活的信息聚合方式，使模型能夠動態(tài)選擇歷史表示，而不是被動接受均勻累積的結果。這一思路有望進一步提升深層模型的信息利用效率。

從架構演進的角度來看，這項工作也提出了一個值得關注的思路：在過去，注意力機制主要用于解決序列維度上的信息交互問題，而AttnRes則將注意力引入到了“網(wǎng)絡深度維度”，讓模型能夠在不同層之間建立更加靈活的信息通路，可能為下一代大模型架構演進提供新的方向。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關推薦

熱點推薦

月之暗面楊植麟：未來每個研究員將配海量Token，AI研發(fā)將進入AI 主導時代

每日經(jīng)濟新聞 2026-03-25 14:51:04
14 跟貼 14

對話鹿明機器人：在具身智能的“數(shù)據(jù)荒”里，做一個送水人｜AI Founder 請回答

鈦媒體APP 2026-01-11 12:48:38
0 跟貼 0

北大團隊提出 SHINE：任意文本轉(zhuǎn)化大模型 LoRA，僅一次前向傳播

機器之心Pro 2026-03-23 15:46:38
0 跟貼 0

清華聯(lián)手千問重塑歸一化范式，讓 Transformer 回歸「深度」學習

機器之心Pro 2026-02-10 18:50:12
0 跟貼 0

一文速通「機器人3D場景表示」發(fā)展史

機器之心Pro 2026-01-23 13:01:05
0 跟貼 0

英偉達23人夢之隊，讓AI用7天干翻了自己的GPU專家

鈦媒體APP 2026-03-26 17:44:44
0 跟貼 0

在線等：如何優(yōu)雅地分走鵝廠這600+萬？

量子位 2026-03-26 16:24:03
0 跟貼 0

30位大佬閉門爭論2小時：工業(yè)AI如何落地

虎嗅APP 2026-03-26 17:43:08
0 跟貼 0

黃仁勛聲稱“AGI已經(jīng)實現(xiàn)”，前提是重新定義了AGI

DeepTech深科技 2026-03-24 18:17:04
1 跟貼 1

這個AI能自己造AI，十幾分鐘寫完代碼，一天交付可用模型

DeepTech深科技 2026-03-26 13:20:36
0 跟貼 0

Sora 2意外停擺，這個國產(chǎn)視頻生成創(chuàng)業(yè)團隊，直接「開源」三連擊

機器之心Pro 2026-03-26 14:27:52
0 跟貼 0

全球頂尖大模型一夜慘遭血洗！最難測試人類拿滿分，AI第一名得0.2%分

新智元 2026-03-26 18:14:12
0 跟貼 0

港中深-跨維智能提出EVA框架，強化學習讓視頻世界模型“動”起來

機器之心Pro 2026-03-26 16:08:37
0 跟貼 0

高通萬衛(wèi)星談終端大模型優(yōu)勢：個性化與數(shù)據(jù)推理

量子位 2025-12-11 03:38:41
0 跟貼 0

陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0

谷歌殺入AI音樂牌桌！實測一鍵生成3分鐘歌曲，可精細控制段落

智東西 2026-03-26 18:50:06
0 跟貼 0

從匹配困境到推理突破：阿里REG4Rec 激活生成式推薦的個性化潛力

機器之心Pro 2026-03-02 16:10:32
0 跟貼 0

一天蒸發(fā)6200億！谷歌算法黑科技擊潰存儲股，華爾街痛批市場“不懂技術”

每日經(jīng)濟新聞 2026-03-26 19:00:13
0 跟貼 0

機器人的算法太恐怖了

阿朵看劇 2026-03-22 08:53:18
1 跟貼 1

內(nèi)存通脹“終結者”？谷歌公開最新極限壓縮算法

鈦媒體APP 2026-03-26 14:33:20
0 跟貼 0

張少康辭去廣東省人民政府副省長職務

新快報新聞 2026-03-26 11:50:03
14 跟貼 14

中遠海運恢復海灣國家訂艙船舶暫不過霍爾木茲海峽

財聯(lián)社 2026-03-25 20:20:04
11811 跟貼 11811

于東來從30歲開始吃藥，拍CT上百次，身體出什么問題都不足為奇，哪天說不定沒了就沒了

新聞晨報 2026-03-25 21:24:37
4386 跟貼 4386

深度長文：原子無意識，為什么由原子組成的人類會產(chǎn)生意識？

宇宙時空 2026-03-25 11:45:33
8 跟貼 8

溫情的外套，搖滾的內(nèi)核，教科書公路電影《陽光小美女》

壹哥追劇 2026-03-26 14:00:08
1 跟貼 1

月之暗面據(jù)稱考慮赴香港進行IPO

財聯(lián)社 2026-03-26 17:46:09
0 跟貼 0

CVPR 2026 | 從視覺Token內(nèi)在變化量出發(fā)，實現(xiàn)VLM無損加速1.87倍

機器之心Pro 2026-03-16 11:56:33
0 跟貼 0

宜賓青年街幼兒園學前教育集團開展“建構游戲中的深度學習”教研活動

中國網(wǎng) 2026-03-25 17:50:07
0 跟貼 0

視覺模型既懂語義，又能還原細節(jié)，南洋理工&商湯提出棱鏡假說

機器之心Pro 2026-01-13 18:26:48
0 跟貼 0

“根本不敢上路”！深圳男子買全新百萬豪車，修了15次還是壞的！很多車主受害

南方都市報 2026-03-26 09:26:45
12 跟貼 12

破解反手數(shù)值怪！全面解析高效對抗策略

膠片記憶館 2026-03-24 10:11:50
0 跟貼 0

千萬粉絲大V，微博賬號被禁止關注

第一財經(jīng)資訊 2026-03-26 12:19:47
1 跟貼 1

收評：滬指跌1.09% 全市場成交額不足2萬億元

證券時報 2026-03-26 15:22:10
193 跟貼 193

10元/斤，最近這一口“鮮貨”正肥！杭州一攤主：一天上百斤不夠賣

環(huán)球網(wǎng)資訊 2026-03-25 13:22:33
432 跟貼 432

俄羅斯意外成為中東戰(zhàn)場外最大贏家拿下越南大單

澎湃新聞 2026-03-25 19:52:29
1284 跟貼 1284

OpenAI關停Sora！25個月從封神到退場

量子位 2026-03-25 20:15:20
0 跟貼 0

CVPR 2026 | BiMotion：用 B 樣條曲線重新定義 3D 角色運動生成

機器之心Pro 2026-03-26 11:42:56
0 跟貼 0

火車站“老師兒！出租車在這乘坐”標語引熱議，網(wǎng)友稱一看就是山東濟南，車站工作人員：在當?shù)剡@是尊稱

極目新聞 2026-03-26 12:06:40
79 跟貼 79

小米回應新SU7爭議/谷歌說安卓已超越iOS/Sora停服迪士尼深感震驚

雷科技 2026-03-26 09:21:57
1 跟貼 1

五年級數(shù)學中點模型求陰影部分面積

天天數(shù)理學習分享 2026-03-22 13:47:40
4 跟貼 4

410次開房記錄流出：央企“女老虎”陶荔芳，背后還有多少同伙
深度報
2025-12-14 22:36:54

如果美國解體，猶太財閥的巨資何處安放下一個宿主，答案超乎想象
芳芳歷史燴
2026-03-25 22:24:25

國產(chǎn)筆記本CPU偷梁換柱翻車！官方終于回應：生產(chǎn)失誤、全額退款
快科技
2026-03-25 10:14:04

現(xiàn)實中的大齡剩女最后妥協(xié)了嗎？網(wǎng)友爆笑評論，真是一言難盡。
侃神評故事
2026-03-25 11:30:09

悲催！遼寧一200多斤男子飲酒時突發(fā)腦出血，8個月身孕妻子崩潰了
火山詩話
2026-03-26 13:34:59

老人離世房產(chǎn)未過戶，2026年法律新規(guī)：繼承權真的會作廢嗎？
復轉(zhuǎn)這些年
2026-03-22 17:48:38

闞清子產(chǎn)后現(xiàn)身機場！手上鴿子蛋大鉆戒搶鏡，富豪老公拎包似保姆
老好人的憤怒
2026-03-26 18:02:04

油價反轉(zhuǎn)！95號汽油破9元后迎下調(diào)，4月7日調(diào)價最新預測
復轉(zhuǎn)這些年
2026-03-26 09:40:14

游戲結束，國債突破39萬億，美聯(lián)儲通知全世界，中方分批運回金條
涵豆說娛
2026-03-26 11:46:21

女孩“全損課本”火了，自認為是清北的料子，老師：自我感動罷了
復轉(zhuǎn)這些年
2026-03-23 20:48:15

為什么女教師成了單身女的最重災區(qū)?
深度報
2026-03-24 22:03:07

國產(chǎn)螺絲刀在海外躥紅，在TikTok狂賣2800萬
跨境派Pro
2026-03-23 14:16:59

高三男孩喀納斯湖失蹤,母親守岸7天后直言放棄,意外竟在此時發(fā)生
古怪奇談錄
2025-10-16 10:53:42

向鵬林詩棟退出世界杯
乒乓11分
2026-03-26 09:48:25

社?；鸪止墒兄稻忧暗闹貍}股一覽
證券時報
2026-03-26 07:34:15

改期！除了阿森納曼城，包括英超四大豪門，7場比賽時間可能變化
嗨皮看球
2026-03-26 18:36:10

美方提“15點計劃”，伊朗稱“又一個謊言”，美國“一邊準備談判一邊握拳”
環(huán)球網(wǎng)資訊
2026-03-26 06:58:33

山東女子造出“天眼導彈”，突破中國導彈50年難關，坐擁26項專利
策略述
2026-03-26 13:44:30

眉毛冒出一根很長的毛？不要大意！俗話說“眉生長毛，必有一遭”
一根香煙的少婦
2026-03-17 17:54:13

A股:今天收3889.08，尾盤已明確，做好準備，明天周五，要變盤了
虎哥閑聊
2026-03-26 15:09:13

2026-03-26 19:36:49

智東西

聚焦智能變革，服務產(chǎn)業(yè)升級。

11436文章數(shù) 117015關注度

往期回顧全部

科技要聞

Meta高管狂分百億期權，700名員工卻下崗

外賣大戰(zhàn)迎來終局？分析人士：監(jiān)管傳遞明確信號

OpenAI的Sora不跳動了

紅極一時卻草草收場，Sora宣布正式關停

“扛不住”內(nèi)存漲價潮：小米手機毛利率跌至8.3%

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

島上設陷阱、海上堵兩頭伊朗在哈爾克島布下天羅地網(wǎng)

原正部級劉慧被開除黨籍：結交政治騙子匿名誣告他人

美國總統(tǒng)特朗普公開宣布訪華行程外交部回應

以方：伊朗海軍司令身亡其負責封鎖霍爾木茲海峽

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

島上設陷阱、海上堵兩頭伊朗在哈爾克島布下天羅地網(wǎng)

原正部級劉慧被開除黨籍：結交政治騙子匿名誣告他人

美國總統(tǒng)特朗普公開宣布訪華行程外交部回應

以方：伊朗海軍司令身亡其負責封鎖霍爾木茲海峽

體育要聞

申京努力了，然而杜蘭特啊

加時被轟15-0！火箭憾負森林狼杜蘭特30分申京30+6

約基奇23+21+19創(chuàng)紀錄！掘金險勝獨行俠穆雷53+9三分賽季新高

東契奇43分湖人勝步行者勒布朗23+9+9海斯21+10

快船大勝橫掃猛龍：小卡27+6連49場20+ 馬瑟林23分加蘭24分

娛樂要聞

劉曉慶妹妹發(fā)聲！稱姐姐受身邊人挑撥

章若楠穿粉裙胡同里漫步對鏡甜笑驚艷回眸

央視《家事法庭》出圈理由：遲蓬的演技，任敏的臉蛋，龔俊的衣品

看了劉曉慶的遭遇，就知道豪門為何“去父留子”，還是他們懂繼承

劉曉慶與外甥矛盾被扒，曾吐槽戀愛后反骨，忍受不了外甥重視女友

財經(jīng)要聞

油價"馴服"特朗普？一到100美元就TACO

跌光2500億！泡泡瑪特股價崩塌

這次石油危機，中國車接棒？

長護險誰能享受？享受多少？解答來了

酷派集團獨董郭敬暉被立案調(diào)查并實施留置

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

全面進階全新一代繽果Pro將于明日亮相

挑戰(zhàn)在深圳改裝展找10臺有品味的中國改裝車！結果出乎意料…

售32.29萬起全新奧迪A6L上市仍提供3.0T V6

6臺大三排SUV將公布價格：比亞迪零跑開戰(zhàn)，小鵬出“大灣區(qū)攬勝”

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

旅游

房產(chǎn)

家居

教育要聞

2026人工智能時代下的教育課堂變革

一圖讀懂，黑龍江物理類考生排多少名，能被哈工程各專業(yè)組錄取？

全國多所中小學取消早讀

3月21日雅思小作文示范寫作 | 動態(tài)柱英國某診所非醫(yī)療崗位員工數(shù)量

2026高考撿漏指南：西安藏著4所“就業(yè)王炸”院校，考生閉眼沖

皮衣+裙，高級到炸

2026年了，最好看的還是“這件針織”！

《非窮盡列舉》，好看又絕望

女人過了40歲別胡亂穿衣，趕緊看看這些日系穿搭，舒適又耐看

旅游要聞

魯冰花開啦！快來新鄉(xiāng)南太行八里溝赴一場春日之約

方松街道｜來方松來放松｜不必遠行！家門口的春日賞花指南來啦→

三國蜀道、熊貓家園多條主題線路帶你解鎖春假新玩法

香港“復活節(jié)+清明”連休5天，機票預訂熱度增長近4倍

房產(chǎn)要聞

突發(fā)，三亞又有大批征遷補償方案出爐！

質(zhì)價比標桿！三亞首創(chuàng)浮島全景艙亮相，還得是萬科！

41億！259畝！建學?！齺嗊@個大城更，最新方案曝光！

北上廣深二手房集體回暖！三月小陽春行情全面兌現(xiàn)

家居要聞

傍海而居靜觀蝴蝶海

輕奢堇天府小資情調(diào)

智慧生活奢享家居

時空交織空間綺夢

手機 / 數(shù)碼

房產(chǎn) / 家居

楊植麟帶隊發(fā)論文，Kimi下一代模型架構曝光，推理之父驚呼：深度學習2.0要來了！

Meta高管狂分百億期權，700名員工卻下崗

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

申京努力了，然而杜蘭特啊

劉曉慶妹妹發(fā)聲！稱姐姐受身邊人挑撥

油價"馴服"特朗普？一到100美元就TACO

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

2026人工智能時代下的教育課堂變革

皮衣+裙，高級到炸

突發(fā)，三亞又有大批征遷補償方案出爐！

傍海而居 靜觀蝴蝶海

楊植麟帶隊發(fā)論文，Kimi下一代模型架構曝光，推理之父驚呼：深度學習2.0要來了！

Meta高管狂分百億期權，700名員工卻下崗

申京努力了，然而杜蘭特啊

劉曉慶妹妹發(fā)聲！稱姐姐受身邊人挑撥

皮衣+裙，高級到炸

突發(fā)，三亞又有大批征遷補償方案出爐！

傍海而居靜觀蝴蝶海