国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

<samp id="sqwko"><kbd id="sqwko"></kbd></samp>

<table id="sqwko"><dl id="sqwko"></dl></table>

<samp id="sqwko"></samp>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊免費(fèi)郵箱

注冊VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

人大高瓴趙鑫團(tuán)隊新作：先拆掉 RLVR，再重建推理模型訓(xùn)練

2026-01-16 19:36:42　來源: AI科技評論

廣東舉報

0

分享至

A3PO：針對冷門正確與自信錯誤 token 的非對稱強(qiáng)化學(xué)習(xí)方法。

作者丨鄭佳美

編輯丨岑峰

當(dāng)大語言模型開始被要求解數(shù)學(xué)題、寫證明、規(guī)劃任務(wù)流程，人們才真正意識到一件事：會生成并不等于會推理。

過去幾年，行業(yè)把大模型推向前所未有的規(guī)模，用 RLHF 和各種獎勵技術(shù)把答案校準(zhǔn)得越來越像人類。但一個越來越尖銳的現(xiàn)實問題也隨之浮現(xiàn)：模型為什么有時一本正經(jīng)地胡說八道？為什么在同一訓(xùn)練框架下，它有時異常自信卻錯誤，有時又顯得畏首畏尾？在人們不斷強(qiáng)化學(xué)習(xí)信號、追求更高分?jǐn)?shù)的同時，一個關(guān)鍵問題始終沒有被真正回答：正樣本與負(fù)樣本到底在模型內(nèi)部改變了什么。

正是在這樣的背景下，來自人大高瓴學(xué)院的趙鑫團(tuán)隊把注意力放在了這一核心問題上。他們沒有急于再提出一個更大的模型或更復(fù)雜的算法，而是刻意退后一步，圍繞 RLVR 框架設(shè)計了一整套系統(tǒng)實驗：如果只用正樣本會發(fā)生什么，只用負(fù)樣本又會產(chǎn)生怎樣的行為變化。模型是在真正形成推理能力，還是被獎勵函數(shù)推著走向某些看似合理的套路？進(jìn)一步地，在一條完整的推理鏈中，是否存在少數(shù)關(guān)鍵 token，像岔路口一樣決定模型是走向正確，還是自信地偏離軌道。

圍繞這些問題，研究團(tuán)隊完成了論文《A3PO: Adaptive Asymmetric Advantage Shaping for Reasoning Models》，并提出了推理模型訓(xùn)練方法A3PO。與其說這是一次方法層面的創(chuàng)新，不如說它首先完成了一次機(jī)制澄清：正樣本主要收縮策略空間，使模型在既有正確路徑上更加篤定，負(fù)樣本則擴(kuò)張策略空間，推動模型跳出舊有模式持續(xù)探索，而真正決定訓(xùn)練走向的，并非整條樣本本身，而是推理過程中那些冷門卻正確、以及自信但錯誤的關(guān)鍵 token。

在這一認(rèn)識基礎(chǔ)上形成的 A3PO 方法，將訓(xùn)練重點(diǎn)從整體樣本轉(zhuǎn)向關(guān)鍵決策點(diǎn)，使推理模型的學(xué)習(xí)過程變得更加可解釋、也更可控制。這一轉(zhuǎn)變表明，推理大模型的進(jìn)步不再只是依賴規(guī)模和算力，而正在走向?qū)τ?xùn)練機(jī)制本身的深入理解。

論文地址：https://arxiv.org/pdf/2512.21625v1

01
正樣本「收縮」vs 負(fù)樣本「探索」

實驗中，研究人員首先對比了正樣本和負(fù)樣本，并發(fā)現(xiàn)它們在訓(xùn)練過程中起到的作用完全不同。

具體表現(xiàn)為，當(dāng)只用正樣本訓(xùn)練（PSR）時，模型會變得越來越確定：熵迅速下降，輸出分布越來越尖銳，答案長度明顯變短，經(jīng)常直接給出結(jié)果而不展開完整推理。這說明正樣本更多是在強(qiáng)化已經(jīng)正確的推理路徑，讓模型不斷重復(fù)熟悉的解題套路，同時也會抑制繼續(xù)探索新路徑。

與此相反，只用負(fù)樣本訓(xùn)練（NSR）時，模型的熵保持在較高水平甚至上升，回答長度變長，推理步驟增多，表現(xiàn)出更強(qiáng)的嘗試和探索傾向。這是因為負(fù)樣本訓(xùn)練主要在削弱錯誤 token 的概率，使原本集中的概率被分散到其他候選路徑上，從而帶來更強(qiáng)的探索能力。

不過，實驗也表明，兩種極端方式其實都不理想：只用正樣本容易出現(xiàn) reward hacking，只報答案不推理，只用負(fù)樣本訓(xùn)練不穩(wěn)定，甚至可能生成亂碼。整體比較下來，正負(fù)樣本同時使用（DAPO）時訓(xùn)練曲線更平穩(wěn)，泛化能力也最好。

在此基礎(chǔ)上，研究人員又引入銳化（sharpen）和發(fā)現(xiàn)（discovery）兩個指標(biāo)來刻畫模型生成內(nèi)容的變化。銳化指標(biāo)反映模型是否在重復(fù)歷史正確答案中已經(jīng)出現(xiàn)過的 n-gram，而發(fā)現(xiàn)指標(biāo)反映是否產(chǎn)生了新的、從未出現(xiàn)過的 n-gram。

結(jié)果顯示，在銳化指標(biāo)上，PSR 高于 DAPO，DAPO 又高于 NSR，在發(fā)現(xiàn)指標(biāo)上則相反，NSR 最高，DAPO 居中，PSR 最低。這表明正樣本更像在磨刀，使已有正確模式變得更熟練、更穩(wěn)定，而負(fù)樣本更像在開路，推動模型尋找新的推理方式，兩者結(jié)合才能既保證穩(wěn)定性，又拓展能力上限。

研究團(tuán)隊還從極性級 advantage的角度分析了正負(fù)樣本權(quán)重的影響。以 Qwen2.5-7B-Math 為例，當(dāng)增大正樣本權(quán)重（如 P2N1、P1N0.5）時，訓(xùn)練獎勵上升更快，但熵明顯下降、輸出變短，探索能力減弱，權(quán)重過大時甚至?xí)^擬合既有模式，而當(dāng)增大負(fù)樣本權(quán)重（如 P1N5）時，熵和輸出長度都更高，探索更充分，但獎勵上升變慢，模型表現(xiàn)得更加謹(jǐn)慎。

實驗表明，決定訓(xùn)練動態(tài)的關(guān)鍵不在于各自權(quán)重的絕對大小，而在于正負(fù)樣本之間的比例，例如 P2N1 與 P1N0.5 的比例相同，曲線表現(xiàn)也非常相似?？傮w來看，正負(fù) advantage 比例大約在 1:2 左右時，能夠較好地兼顧收斂速度與探索能力。

最后，在token 級別的實驗中，研究人員進(jìn)一步分析了哪些 token 在訓(xùn)練中最關(guān)鍵。結(jié)果發(fā)現(xiàn)，并不是所有 token 都同等重要，而是兩類最關(guān)鍵：一類是正樣本中的低概率 token，即冷門但正確的推理步驟，另一類是負(fù)樣本中的高概率 token，也就是模型非常自信但實際上是錯誤的部分。

前者需要重點(diǎn)獎勵，以保留多樣但正確的推理路徑，后者需要重點(diǎn)懲罰，防止模型固執(zhí)地堅持錯誤答案。新提出的 A3PO 方法正是圍繞這兩類關(guān)鍵 token 進(jìn)行非對稱加權(quán)設(shè)計的，這一點(diǎn)也得到了實驗數(shù)據(jù)的支持。

在 Qwen2.5-7B-Math 上，A3PO 在 AIME24 與 AIME25 上分別從 DAPO 的 27.6 和 21.4 提升到 31.5 和 24.8；在 Qwen3-8B-Base 上，也從 34.2/26.1 提升到 37.8/30.4；在 DeepSeek-R1 蒸餾模型上，則從 60.8/50.8 提升到 65.2/54.1。并且，這些提升不僅出現(xiàn)在單一數(shù)據(jù)集上，而是在 AIME、MATH500、GPQA 等多個基準(zhǔn)上同時出現(xiàn)，其中多項結(jié)果還通過了顯著性檢驗。

因此，可以認(rèn)為A3PO 在保持較強(qiáng)探索能力的同時，確實在不同模型與不同評測任務(wù)上帶來了穩(wěn)定且明確的性能提升。

02
在機(jī)制分析基礎(chǔ)上構(gòu)建 A3PO

為了得到全面的實驗結(jié)果，研究人員首先圍繞 RLVR 框架搭建了一系列對照實驗，目的是不急于提出新方法，而是先把正樣本和負(fù)樣本的作用拆開來看，分別考察只用正樣本、只用負(fù)樣本以及正負(fù)樣本同時使用時模型的具體表現(xiàn)。

實驗選擇了三種類型不同的大語言模型作為基座，包括數(shù)學(xué)能力增強(qiáng)的 Qwen2.5-7B-Math、通用預(yù)訓(xùn)練模型 Qwen3-8B-Base 以及經(jīng)過推理蒸餾的 DeepSeek-R1-Distill-Qwen-7B，并分別在三種訓(xùn)練范式下進(jìn)行對比：只使用正樣本更新的 PSR，只使用負(fù)樣本更新的 NSR，以及同時利用正負(fù)樣本、目前較常用的 DAPO 方法。

整個訓(xùn)練過程中不僅跟蹤模型的熵、生成回答長度和獎勵值等指標(biāo)，以反映其確定性與探索性的變化，還在驗證集上測試 AIME25 的 Avg@32 和 Pass@32 等指標(biāo)，來評估真實推理能力。

在確認(rèn)正負(fù)樣本都發(fā)揮重要且不同作用之后，研究人員進(jìn)一步進(jìn)行粗粒度的參數(shù)控制實驗，從極性層面調(diào)整 advantage 權(quán)重。在 Qwen2.5-7B-Math 上，將 RLVR 的損失函數(shù)拆分為正樣本項和負(fù)樣本項，通過設(shè)置不同的權(quán)重組合（如正負(fù) 1:5 或 2:1 等），系統(tǒng)比較不同權(quán)重比例下模型的熵、輸出長度、訓(xùn)練獎勵以及 AIME24 上的表現(xiàn)，從而分析正負(fù)樣本整體權(quán)重對訓(xùn)練動態(tài)的影響。

在此基礎(chǔ)上，研究視角被進(jìn)一步細(xì)化到 token 層面。研究人員不再僅討論“正負(fù)樣本整體重要與否”，而是考察一條推理序列內(nèi)部不同 token 的差異作用。具體做法是根據(jù) token 的熵和概率兩個維度，挑選出正樣本和負(fù)樣本中高熵與低熵、高概率與低概率的不同 token 類型，然后分別對這些 token 的 advantage 進(jìn)行大幅放縮，例如乘以 0.2 或 5，觀察模型訓(xùn)練曲線與生成行為隨之發(fā)生的變化，從而找出真正對訓(xùn)練最敏感、最關(guān)鍵的 token 區(qū)域。

在完成以上一系列分析之后，研究團(tuán)隊提出了新的 A3PO 方法，其核心思想是在 RLVR 目標(biāo)中引入自適應(yīng)且非對稱的 token 級 advantage 加權(quán)機(jī)制：對正樣本中低概率的 token 給予更高獎勵，以鼓勵保留多樣但正確的推理路徑，對負(fù)樣本中高概率的 token 給予更強(qiáng)懲罰，以重點(diǎn)糾正模型自信但錯誤的推理。同時，這些加權(quán)系數(shù)在訓(xùn)練過程中逐步衰減，使模型能夠從前期的更強(qiáng)探索自然過渡到后期的穩(wěn)定收斂。

實驗采用與前述相同的三種模型，在 DAPO-Math 數(shù)據(jù)集上進(jìn)行訓(xùn)練，基于 Verl 與 vLLM 的離線強(qiáng)化學(xué)習(xí)框架，每個提示生成 8 個樣本，訓(xùn)練 300 步，并與 GRPO、DAPO、W-REINFORCE、DAPO-Fork-Tokens 和 Lp-Reg 等方法進(jìn)行對比，測試任務(wù)涵蓋 AIME24、AIME25、MATH500、GPQA 與 LiveCodeBench 等多個推理基準(zhǔn)。

此外，研究團(tuán)隊還系統(tǒng)評估了 A3PO 在不同模型規(guī)模和不同訓(xùn)練數(shù)據(jù)集上的泛化能力，并對其關(guān)鍵超參數(shù)（包括 token 選擇比例、初始縮放系數(shù) ρ 以及衰減系數(shù) α）進(jìn)行了敏感性分析，從而形成完整的實驗設(shè)計框架。

03
正負(fù)樣本作用邊界的重新界定

整體來看，這項研究的核心意義在于，它把原本相對模糊的 RLVR 訓(xùn)練過程，轉(zhuǎn)化為一個具有清晰結(jié)構(gòu)和內(nèi)部機(jī)制解釋的框架。過去在強(qiáng)化學(xué)習(xí)訓(xùn)練推理模型時，人們大致知道需要正樣本，也會使用負(fù)樣本，但往往難以回答一個根本問題：正負(fù)樣本各自在訓(xùn)練中究竟起什么作用，它們?nèi)绾胃淖兡Ｐ偷膶W(xué)習(xí)動力學(xué)。

這項工作通過系統(tǒng)實驗給出了明確答案：正樣本主要收縮策略空間，使模型已經(jīng)掌握的正確模式更加集中和穩(wěn)定，負(fù)樣本則擴(kuò)張策略空間，迫使模型脫離舊有模式，去探索新的推理路徑。更重要的是，研究并未停留在正樣本銳化能力、負(fù)樣本促進(jìn)探索這樣的概括層面，而是進(jìn)一步指出訓(xùn)練質(zhì)量真正取決于哪些具體決策點(diǎn)被重點(diǎn)強(qiáng)化。

研究表明，正樣本中那些原本選擇概率較低但通向正確答案的 token，以及負(fù)樣本中那些模型高度自信卻指向錯誤答案的 token，對探索與利用平衡具有決定性影響。

A3PO 的設(shè)計正是把這一認(rèn)識具體化為訓(xùn)練原則，在這些關(guān)鍵拐點(diǎn)上進(jìn)行非對稱 advantage 放大，并隨訓(xùn)練進(jìn)程逐步衰減這種偏置。由此，強(qiáng)化學(xué)習(xí)不再只是簡單地增加正確獎勵或扣減錯誤分?jǐn)?shù)，而是轉(zhuǎn)向圍繞關(guān)鍵局部決策點(diǎn)有針對性地塑造策略分布。這樣的視角，使正負(fù)樣本從被動的數(shù)據(jù)來源，轉(zhuǎn)變?yōu)榭杀痪?xì)調(diào)控的優(yōu)化工具，也把方法研究從經(jīng)驗性調(diào)參提升到機(jī)制性設(shè)計層面。

從更長遠(yuǎn)看，這一思路為大模型對齊、多模態(tài)推理以及智能體決策中的強(qiáng)化學(xué)習(xí)提供了共同的方向，即不再平均對待所有行為信號，而是抓住那些對整體策略結(jié)構(gòu)影響最大的關(guān)鍵 token 和關(guān)鍵狀態(tài)進(jìn)行重點(diǎn)塑形。

04
背后的學(xué)術(shù)力量

這篇論文的通訊作者為趙鑫，現(xiàn)任中國人民大學(xué)高瓴人工智能學(xué)院教授、長聘副教授，同時他也是國家優(yōu)青項目獲得者。

趙鑫教授于 2014 年 7 月在北京大學(xué)取得博士學(xué)位，之后就職于中國人民大學(xué)，至今一直從事教學(xué)與科研工作。他的主要研究領(lǐng)域為信息檢索與自然語言處理，目前已發(fā)表學(xué)術(shù)論文 200 余篇，谷歌學(xué)術(shù)引用量超過 1.8 萬次。

他牽頭開發(fā)了開源推薦系統(tǒng)工具 RecBole（伯樂）和文本生成工具 TextBox（妙筆），并組織撰寫了《A Survey of Large Language Models》綜述論文及中文專著《大語言模型》。

趙鑫教授先后獲得吳文俊人工智能優(yōu)秀青年獎（2020）、ECIR 2021 時間檢驗獎、RecSys 2022 最佳學(xué)生論文提名、CIKM 2022 最佳資源論文提名等榮譽(yù)稱號，同時入選中國科協(xié)青年人才托舉工程、北京智源青年科學(xué)家和 CCF–IEEE CS 青年科學(xué)家計劃，其系列研究成果還榮獲教育部自然科學(xué)一等獎、北京市自然科學(xué)二等獎及中國計算機(jī)學(xué)會自然科學(xué)二等獎。

參考鏈接：https://gsai.ruc.edu.cn/waynexinzhao

未經(jīng)「AI科技評論」授權(quán)，嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載！

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán)，轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

訓(xùn)練到推理「瘦身」演進(jìn)：首篇高效擴(kuò)散語言模型（dLLM）深度綜述

機(jī)器之心Pro 2026-03-10 10:00:07
0 跟貼 0
不平衡數(shù)據(jù)下對比學(xué)習(xí)的理論分析：從訓(xùn)練動態(tài)到剪枝解決方案

機(jī)器之心Pro 2026-03-10 16:37:38
0 跟貼 0

OpenAI測謊13款大模型：Claude 3.7封神，GPT-5.2近乎失控！

新智元 2026-03-09 09:36:47
1 跟貼 1

多模態(tài)推理新范式ThinkMorph ，文字與圖像在統(tǒng)一架構(gòu)共同演化

機(jī)器之心Pro 2026-03-10 16:02:54
0 跟貼 0
情感識別不再是分類題：EmotionThinker讓SpeechLLM 學(xué)會解釋情緒

機(jī)器之心Pro 2026-02-25 13:45:15
0 跟貼 0

首個千萬美金ARR的AI4S公司，完成AI設(shè)計新分子商業(yè)應(yīng)用

機(jī)器之心Pro 2026-03-10 16:28:07
0 跟貼 0

劍指阿里字節(jié)！報道：騰訊秘密布局微信AI智能體，年內(nèi)或向全用戶開放

華爾街見聞官方 2026-03-10 23:09:43
0 跟貼 0
讓兩個大模型在線吵架，跑通全網(wǎng)95%科研代碼｜深勢Deploy-Master

機(jī)器之心Pro 2026-01-09 14:22:47
0 跟貼 0

釘釘發(fā)布DeepResearch多智能體框架，已在真實企業(yè)部署

機(jī)器之心Pro 2025-11-12 13:06:22
2 跟貼 2
陶哲軒親測Claude跑崩電腦，全靠這份保姆級指令清單翻盤

新智元 2026-03-11 01:37:25
0 跟貼 0
Jeff Dean新訪談：未來開發(fā)者人均50個智能體，寫需求成核心技能

量子位 2026-03-10 15:12:54
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡智機(jī)器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
瘋狂的OpenClaw：Token放量、資本熱捧，大廠卡位戰(zhàn)已打響！風(fēng)險不容忽視

每日經(jīng)濟(jì)新聞 2026-03-10 23:38:34
0 跟貼 0
高通萬衛(wèi)星談終端大模型優(yōu)勢：個性化與數(shù)據(jù)推理

量子位 2025-12-11 03:38:41
0 跟貼 0
別再讓大模型“想太多”！最新研究揭示 LLM 推理效率的關(guān)鍵瓶頸

機(jī)器之心Pro 2026-03-10 19:10:08
0 跟貼 0
3B打32B？海外病毒式傳播的小模型，竟然來自BOSS直聘

機(jī)器之心Pro 2026-03-09 14:09:17
1 跟貼 1
怕血管硬化這個指標(biāo)一定要化驗

普外耿醫(yī)生 2026-03-06 11:55:13
0 跟貼 0
大風(fēng)315 | 游客稱飛3000公里在西雙版納一景區(qū)游玩，因明星錄制綜藝節(jié)目被清場；景區(qū)：具體情況需由游客回應(yīng)

大風(fēng)新聞 2026-03-09 17:06:09
6941 跟貼 6941
年齡大不用愁，盯好這3個指標(biāo)，早了解多活一天算一天！

大步搞笑 2026-03-10 09:59:35
1 跟貼 1
倆法國小伙辭職走路到中國:耗時2年走出新疆花了45天

新民周刊 2026-03-10 16:44:38
3084 跟貼 3084
伊朗媒體發(fā)布一則用玩具模型制作的視頻，講述戰(zhàn)爭如何結(jié)束

車馬點(diǎn)兵V 2026-03-08 13:42:50
1 跟貼 1
5個衰老的“指標(biāo)”！如果一個沒有，說明你還很年輕

財?shù)芰娜松?2026-03-06 15:49:34
2 跟貼 2
紫牛頭條 | 買時宣稱功能永久免費(fèi)，用后卻被要求付費(fèi)升級！顧客投訴知名品牌電動車“言而無信”

揚(yáng)子晚報 2026-03-10 07:15:24
3774 跟貼 3774
微軟等提出ARO優(yōu)化器：訓(xùn)練提速1/3，揭示矩陣優(yōu)化新「藍(lán)?！?/a>

機(jī)器之心Pro 2026-03-10 12:37:29
0 跟貼 0
Parallel-Probe問世，并行推理效率提升35.8%

機(jī)器之心Pro 2026-03-09 13:58:54
0 跟貼 0
突發(fā)！微信絕密「龍蝦」爆出，14億用戶體驗或?qū)㈩嵏?/a>

新智元 2026-03-11 01:36:21
0 跟貼 0
Energy Distance：度量兩個多元分布差異的統(tǒng)計方法

deephub 2026-03-06 20:59:28
6 跟貼 6
女子在杭州西湖景區(qū)把“西泠印社”認(rèn)成“杜帥冷面”，網(wǎng)友：四個字認(rèn)錯五個，當(dāng)事人：沒有文化確實不行

揚(yáng)子晚報 2026-03-06 17:44:56
1442 跟貼 1442
274科學(xué)家竟拿百姓做實驗，不料出現(xiàn)意外！終極對決6

長河電影 2026-03-06 17:01:21
1 跟貼 1
中國成品油價迎四年來最大漲幅

環(huán)球網(wǎng)資訊 2026-03-10 09:34:47
4997 跟貼 4997
央視攀登者欄目《剝繭》開年懸疑黑馬！

沒刺的刺猬 2026-03-10 14:40:16
1 跟貼 1
“見過搶米搶面，沒見過搶塑料”，中東開戰(zhàn)，東莞一個小鎮(zhèn)大堵車！貿(mào)易商：潑天的富貴來了，干嘛不抓?。繕I(yè)內(nèi)提醒：只是虛假繁榮

每日經(jīng)濟(jì)新聞 2026-03-10 21:06:07
48 跟貼 48
GDC2026｜百萬銷量CRPG先鋒團(tuán)隊，罕見分享30000個變量后的敘事秘訣

競核 2026-03-10 15:44:31
0 跟貼 0
北京這所高校研究成果入選初中教材

現(xiàn)代教育報 2026-03-10 20:57:23
0 跟貼 0
開個好頭，先收藏這份基因調(diào)控秘籍（300 份好禮免費(fèi)領(lǐng)）

生物學(xué)霸 2026-03-10 17:24:08
0 跟貼 0
全網(wǎng)售罄、多地斷貨！老板懵了：以前堆成山都賣不掉，結(jié)果現(xiàn)在價格暴漲

掌上春城 2026-03-10 20:24:37
366 跟貼 366
中朝國際旅客列車3月12日起雙向開行

中國鐵路 2026-03-10 20:40:01
1602 跟貼 1602
全國人大代表汪勇：外賣員面臨雙重困境

看看新聞Knews 2026-03-10 21:38:04
0 跟貼 0

申京拒絕參加訓(xùn)練，暗諷杜蘭特毀了火箭，愿意離開球隊加盟雄鹿

申京拒絕參加訓(xùn)練，暗諷杜蘭特毀了火箭，愿意離開球隊加盟雄鹿

易易熱愛生活

2026-03-09 21:52:33

美國、德國、英國、法國、意大利、加拿大和日本將召開緊急會議

美國、德國、英國、法國、意大利、加拿大和日本將召開緊急會議

澎湃新聞

2026-03-09 21:58:04

劉亦菲看朱一龍的眼神拉著長長的絲，看來朱一龍是她喜歡的類型。

劉亦菲看朱一龍的眼神拉著長長的絲，看來朱一龍是她喜歡的類型。

情感大頭說說

2026-03-11 00:31:17

美國對中國滲透沒白費(fèi)，扶持的“內(nèi)鬼”，終于開始在中國露頭了

美國對中國滲透沒白費(fèi)，扶持的“內(nèi)鬼”，終于開始在中國露頭了

歷史求知所

2025-12-01 11:30:06

美媒評論東風(fēng)5C導(dǎo)彈：恐怖！如果丟一枚到美國，會造成怎樣的景象

美媒評論東風(fēng)5C導(dǎo)彈：恐怖！如果丟一枚到美國，會造成怎樣的景象

朝子亥

2026-03-10 19:15:03

3月10日人民幣對美元中間價調(diào)升176個基點(diǎn)

3月10日人民幣對美元中間價調(diào)升176個基點(diǎn)

證券時報

2026-03-10 09:43:08

這是目前為止，我見過腰最細(xì)的女生，沒有之一

這是目前為止，我見過腰最細(xì)的女生，沒有之一

草莓解說體育

2026-03-03 19:15:05

再無瓜葛！梅西表態(tài)：絕不介入巴薩選舉！只留傳奇不涉權(quán)力紛爭

再無瓜葛！梅西表態(tài)：絕不介入巴薩選舉！只留傳奇不涉權(quán)力紛爭

體育閑話說

2026-03-10 14:29:32

新領(lǐng)袖上臺不到24小時，伊朗突然提出?；穑_出的條件讓美國沉默

新領(lǐng)袖上臺不到24小時，伊朗突然提出?；穑_出的條件讓美國沉默

Ck的蜜糖

2026-03-11 00:51:10

湖北武漢一女子將萬元壓歲錢存銀行沒到賬？原因竟是網(wǎng)購褲子里有張銀行卡，存錢時拿錯了，女子向民警求助，最新進(jìn)展！

湖北武漢一女子將萬元壓歲錢存銀行沒到賬？原因竟是網(wǎng)購褲子里有張銀行卡，存錢時拿錯了，女子向民警求助，最新進(jìn)展！

環(huán)球網(wǎng)資訊

2026-03-10 11:41:14

已停訓(xùn)達(dá)4個月！18歲全紅嬋解鎖新身份：穿西裝亮相首次個人代言

已停訓(xùn)達(dá)4個月！18歲全紅嬋解鎖新身份：穿西裝亮相首次個人代言

風(fēng)過鄉(xiāng)

2026-03-10 12:37:34

中科院女博導(dǎo)埃及去世后續(xù)！死因曝光，學(xué)生曝內(nèi)幕，更多細(xì)節(jié)流出

中科院女博導(dǎo)埃及去世后續(xù)！死因曝光，學(xué)生曝內(nèi)幕，更多細(xì)節(jié)流出

奇思妙想草葉君

2026-03-10 23:42:46

美媒終于查出內(nèi)幕：伊朗導(dǎo)彈指哪打哪，原來有人用衛(wèi)星暗中報位置

美媒終于查出內(nèi)幕：伊朗導(dǎo)彈指哪打哪，原來有人用衛(wèi)星暗中報位置

無情有思ss

2026-03-11 01:06:32

上海交大解剖322名腦梗死者，驚訝發(fā)現(xiàn)：患腦梗的人，有8大共性

上海交大解剖322名腦梗死者，驚訝發(fā)現(xiàn)：患腦梗的人，有8大共性

侯醫(yī)生談健康

2026-03-08 15:40:05

38歲男子喉嚨痛以為是“上火”，結(jié)果被確診為急性心肌梗死，醫(yī)生：牙齒以下，肚臍以上出現(xiàn)不明原因疼痛或不適需警惕

38歲男子喉嚨痛以為是“上火”，結(jié)果被確診為急性心肌梗死，醫(yī)生：牙齒以下，肚臍以上出現(xiàn)不明原因疼痛或不適需警惕

觀威海

2026-03-08 10:15:02

全新一代奧迪A6L開啟預(yù)售：32.3萬元起降價超10萬元

全新一代奧迪A6L開啟預(yù)售：32.3萬元起降價超10萬元

快科技

2026-03-10 12:34:30

難怪特朗普想要?；穑瑳]有等來伊朗的投降書，反而先等來一個噩耗

難怪特朗普想要?；穑瑳]有等來伊朗的投降書，反而先等來一個噩耗

春風(fēng)笑語

2026-03-11 00:48:04

59歲宋祖英現(xiàn)身活動狀態(tài)驚艷！短發(fā)利落大氣，黑色套裝優(yōu)雅端莊

59歲宋祖英現(xiàn)身活動狀態(tài)驚艷！短發(fā)利落大氣，黑色套裝優(yōu)雅端莊

琴聲飛揚(yáng)

2026-02-12 11:51:25

此人上梁山前武功蓋世，上山后卻從不上陣打仗，宋江也拿他沒辦法

此人上梁山前武功蓋世，上山后卻從不上陣打仗，宋江也拿他沒辦法

銘記歷史呀

2026-03-10 16:19:05

不到24小時反轉(zhuǎn)，以色列被騙，特拉維夫抗議，特朗普遇難題

不到24小時反轉(zhuǎn)，以色列被騙，特拉維夫抗議，特朗普遇難題

舊鐵皮往南開

2026-03-11 00:23:59

點(diǎn)評學(xué)術(shù)，服務(wù)AI

7111文章數(shù) 20739關(guān)注度

往期回顧全部

科技要聞

全民"養(yǎng)蝦"背后：大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話官方回應(yīng)

體育要聞

加蘭沒那么差，但鱸魚會用嗎？

娛樂要聞

《逐玉》注水風(fēng)波升級！315評論區(qū)淪陷

財經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐最高1000萬！

汽車要聞

MG4有SUV衍生上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

房產(chǎn)

親子

公開課

本地新聞

云游中國｜候鳥高顏值亮相！沉浸式打卡青海濕地

看來看去這些才是適合普通人的穿搭！不花哨、不繁瑣，提氣質(zhì)

房產(chǎn)要聞

信號！千億巨頭入局，三亞開啟新一輪大征拆！

親子要聞

家長和同學(xué)們都應(yīng)該知道的20英里法則

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產(chǎn)30天

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版