国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

StepFun團(tuán)隊(duì)打造32B參數(shù)深度研究智能體

0
分享至


這項(xiàng)由StepFun公司Agent團(tuán)隊(duì)在2024年12月完成的研究,發(fā)表在arXiv平臺(tái)上,論文編號(hào)為arXiv:2512.20491v1。對(duì)于關(guān)注人工智能發(fā)展的讀者,可以通過(guò)這個(gè)編號(hào)查詢到完整的技術(shù)論文。

當(dāng)你需要深入研究某個(gè)復(fù)雜話題時(shí),比如了解某個(gè)行業(yè)的發(fā)展趨勢(shì)、分析一項(xiàng)政策的影響,或者撰寫(xiě)一份詳盡的市場(chǎng)報(bào)告,你可能會(huì)花費(fèi)數(shù)小時(shí)甚至數(shù)天時(shí)間在網(wǎng)上搜索信息、整理資料、交叉驗(yàn)證數(shù)據(jù)。而現(xiàn)在,一種被稱(chēng)為"深度研究智能體"的AI系統(tǒng)正在試圖接手這項(xiàng)繁重的工作。

StepFun公司的研究團(tuán)隊(duì)最近開(kāi)發(fā)了一款名為Step-DeepResearch的AI系統(tǒng),這就像是為你配備了一位永不疲倦的研究助手。這位助手不僅能夠在互聯(lián)網(wǎng)的海量信息中快速尋找相關(guān)資料,還能像資深研究員一樣進(jìn)行深度分析、交叉驗(yàn)證信息的真實(shí)性,最終為你撰寫(xiě)出一份專(zhuān)業(yè)級(jí)別的研究報(bào)告。

更令人驚喜的是,這個(gè)系統(tǒng)只使用了320億個(gè)參數(shù)——在AI領(lǐng)域,這算是"中等身材"的模型。相比之下,許多頂級(jí)AI系統(tǒng)都擁有千億甚至萬(wàn)億級(jí)別的參數(shù)。然而,Step-DeepResearch卻能在性能上與OpenAI的深度研究系統(tǒng)和谷歌的Gemini深度研究系統(tǒng)相提并論,而成本卻只有它們的十分之一。

這個(gè)成果的意義不僅僅在于技術(shù)突破,更在于它讓高質(zhì)量的AI研究助手變得更加經(jīng)濟(jì)實(shí)用。就像智能手機(jī)讓通信技術(shù)普及到每個(gè)人手中一樣,Step-DeepResearch正在讓專(zhuān)業(yè)級(jí)的研究能力變得更加觸手可及。

一、從信息搜索到深度研究:AI助手的進(jìn)化之路

要理解Step-DeepResearch的創(chuàng)新之處,我們首先需要明白傳統(tǒng)搜索和真正的研究之間的區(qū)別。

當(dāng)你在搜索引擎中輸入關(guān)鍵詞時(shí),你得到的通常是一系列網(wǎng)頁(yè)鏈接和片段信息。這就像在圖書(shū)館里隨機(jī)翻閱書(shū)籍,你可能會(huì)找到一些有用的信息片段,但要將這些零散的信息整合成完整、可信的知識(shí)體系,還需要大量的人工分析和判斷。

真正的研究工作則完全不同。一位經(jīng)驗(yàn)豐富的研究員在開(kāi)始工作時(shí),首先會(huì)明確研究目標(biāo),然后制定詳細(xì)的調(diào)研計(jì)劃。接著,他們會(huì)系統(tǒng)性地收集信息,不僅要找到相關(guān)資料,還要評(píng)估這些資料的可靠性,尋找不同來(lái)源之間的關(guān)聯(lián)性和矛盾點(diǎn)。在分析過(guò)程中,研究員會(huì)不斷調(diào)整自己的研究方向,深入挖掘重要發(fā)現(xiàn),并最終將所有發(fā)現(xiàn)整合成一份邏輯清晰、論據(jù)充分的報(bào)告。

現(xiàn)有的AI系統(tǒng)在處理研究任務(wù)時(shí)往往表現(xiàn)得更像高效的搜索引擎,而非真正的研究助手。它們能夠快速找到大量信息,但在信息整合、邏輯分析和質(zhì)量控制方面還存在明顯不足。特別是在處理開(kāi)放性問(wèn)題時(shí),這些系統(tǒng)容易陷入簡(jiǎn)單的信息堆砌,缺乏深度的洞察和批判性思考。

StepFun的研究團(tuán)隊(duì)認(rèn)識(shí)到了這個(gè)問(wèn)題的核心:要讓AI真正具備研究能力,不能僅僅提升其信息檢索速度,而是要讓它學(xué)會(huì)像人類(lèi)研究員一樣思考和工作。

二、化整為零的智慧:原子能力訓(xùn)練法

StepFun團(tuán)隊(duì)采用了一種被他們稱(chēng)為"原子能力"的訓(xùn)練方法,這就像是把復(fù)雜的研究工作拆解成一個(gè)個(gè)基本技能,然后逐一訓(xùn)練AI掌握每項(xiàng)技能。

這種方法類(lèi)似于培訓(xùn)一位新手研究員的過(guò)程。你不會(huì)期望一個(gè)剛?cè)肼毜膶?shí)習(xí)生立即能夠完成高質(zhì)量的研究報(bào)告,而是會(huì)先教他們?nèi)绾沃贫ㄑ芯坑?jì)劃,如何高效搜索信息,如何辨別信息的可靠性,以及如何撰寫(xiě)專(zhuān)業(yè)報(bào)告。只有當(dāng)這些基礎(chǔ)技能都熟練掌握后,他們才能勝任復(fù)雜的研究任務(wù)。

研究團(tuán)隊(duì)將深度研究能力分解為四個(gè)核心的原子能力:規(guī)劃與任務(wù)分解、深度信息搜索、反思與驗(yàn)證、以及報(bào)告撰寫(xiě)。

在規(guī)劃與任務(wù)分解方面,系統(tǒng)需要學(xué)會(huì)將一個(gè)模糊的研究需求轉(zhuǎn)化為具體可執(zhí)行的子任務(wù)。比如,當(dāng)用戶詢問(wèn)"分析人工智能對(duì)教育行業(yè)的影響"時(shí),系統(tǒng)需要自動(dòng)將這個(gè)寬泛的問(wèn)題細(xì)分為多個(gè)具體方向:AI在個(gè)性化學(xué)習(xí)中的應(yīng)用、對(duì)傳統(tǒng)教學(xué)方法的沖擊、教師角色的變化、教育成本的影響等等。為了訓(xùn)練這種能力,研究團(tuán)隊(duì)采用了"逆向工程"的方法:他們收集了大量高質(zhì)量的研究報(bào)告,然后讓AI系統(tǒng)根據(jù)報(bào)告內(nèi)容反推出可能的研究規(guī)劃,從而學(xué)習(xí)專(zhuān)業(yè)的任務(wù)分解思路。

深度信息搜索能力則要求系統(tǒng)不僅能找到相關(guān)信息,還要能夠進(jìn)行多層次的關(guān)聯(lián)性挖掘。這就像一位偵探在調(diào)查案件時(shí),不僅要收集直接證據(jù),還要找出各種線索之間的隱秘聯(lián)系。研究團(tuán)隊(duì)通過(guò)構(gòu)建基于知識(shí)圖譜的訓(xùn)練數(shù)據(jù),讓系統(tǒng)學(xué)會(huì)從一個(gè)信息節(jié)點(diǎn)出發(fā),逐步擴(kuò)展到相關(guān)的信息網(wǎng)絡(luò)。比如,在研究某個(gè)公司的發(fā)展歷程時(shí),系統(tǒng)不僅會(huì)查找該公司的官方信息,還會(huì)主動(dòng)搜索其競(jìng)爭(zhēng)對(duì)手、行業(yè)政策變化、關(guān)鍵人物履歷等相關(guān)信息,構(gòu)建完整的信息畫(huà)像。

反思與驗(yàn)證能力可能是最具挑戰(zhàn)性的一項(xiàng)。在現(xiàn)實(shí)研究中,信息的準(zhǔn)確性和可靠性至關(guān)重要。一個(gè)專(zhuān)業(yè)的研究員會(huì)本能地質(zhì)疑信息來(lái)源,對(duì)比不同渠道的數(shù)據(jù),尋找可能的偏見(jiàn)或錯(cuò)誤。為了讓AI系統(tǒng)具備這種能力,研究團(tuán)隊(duì)設(shè)計(jì)了一種"錯(cuò)誤-反思循環(huán)"的訓(xùn)練方法。系統(tǒng)在生成初步結(jié)論后,會(huì)被要求主動(dòng)尋找可能的反證,檢驗(yàn)自己的推理過(guò)程,并在發(fā)現(xiàn)問(wèn)題時(shí)及時(shí)修正。

報(bào)告撰寫(xiě)能力則關(guān)注如何將收集到的信息轉(zhuǎn)化為清晰、有說(shuō)服力的文字表達(dá)。這不僅僅是語(yǔ)言技能,更涉及邏輯結(jié)構(gòu)、論證方式和讀者需求的把握。研究團(tuán)隊(duì)通過(guò)分析大量專(zhuān)業(yè)報(bào)告的寫(xiě)作模式,讓系統(tǒng)學(xué)會(huì)根據(jù)不同的研究主題和目標(biāo)受眾調(diào)整寫(xiě)作風(fēng)格和結(jié)構(gòu)。

這種原子能力訓(xùn)練法的優(yōu)勢(shì)在于,每項(xiàng)技能都可以獨(dú)立優(yōu)化和驗(yàn)證,同時(shí)它們又能夠有機(jī)結(jié)合,形成完整的研究workflow。這就像是在組裝一臺(tái)精密機(jī)器,每個(gè)零部件都經(jīng)過(guò)精心設(shè)計(jì)和測(cè)試,最終組合出的成品自然具備了卓越的性能。

三、三階段漸進(jìn)訓(xùn)練:從知識(shí)積累到技能整合

StepFun團(tuán)隊(duì)采用了一種三階段的漸進(jìn)式訓(xùn)練方法,這個(gè)過(guò)程就像是培養(yǎng)一位研究員從學(xué)徒到專(zhuān)家的成長(zhǎng)歷程。

第一階段被稱(chēng)為"智能體中期訓(xùn)練",這個(gè)階段的目標(biāo)是為AI系統(tǒng)打下堅(jiān)實(shí)的知識(shí)基礎(chǔ)和基本能力。研究團(tuán)隊(duì)使用了大量的領(lǐng)域知識(shí)、學(xué)術(shù)文獻(xiàn)和高質(zhì)量文檔來(lái)訓(xùn)練系統(tǒng)。這就像是讓一個(gè)新入學(xué)的研究生花費(fèi)大量時(shí)間閱讀專(zhuān)業(yè)書(shū)籍和論文,建立對(duì)各個(gè)領(lǐng)域的基本認(rèn)知。

在這個(gè)階段,訓(xùn)練分為兩個(gè)子階段:32K上下文訓(xùn)練和128K上下文訓(xùn)練。這里的"上下文長(zhǎng)度"可以理解為系統(tǒng)的"記憶容量"。32K上下文意味著系統(tǒng)可以同時(shí)記住大約3萬(wàn)個(gè)詞匯的內(nèi)容,這足以處理一篇中等長(zhǎng)度的學(xué)術(shù)論文。而128K上下文則將這個(gè)容量擴(kuò)展到約12萬(wàn)詞匯,基本可以同時(shí)處理多篇論文或一本小冊(cè)子的內(nèi)容。

在32K訓(xùn)練階段,系統(tǒng)主要學(xué)習(xí)基礎(chǔ)的閱讀理解、知識(shí)整合和簡(jiǎn)單推理能力。訓(xùn)練數(shù)據(jù)包括維基百科條目、學(xué)術(shù)文章摘要、專(zhuān)業(yè)知識(shí)問(wèn)答等。這個(gè)階段的重點(diǎn)是讓系統(tǒng)建立對(duì)世界知識(shí)的廣泛理解,就像是為一位未來(lái)的研究員建立廣博的知識(shí)基礎(chǔ)。

128K訓(xùn)練階段則引入了更復(fù)雜的任務(wù),包括長(zhǎng)文檔分析、工具調(diào)用和多輪推理。在這個(gè)階段,系統(tǒng)開(kāi)始學(xué)習(xí)如何使用搜索工具、如何處理復(fù)雜的查詢請(qǐng)求,以及如何在長(zhǎng)時(shí)間的思考過(guò)程中保持邏輯的一致性。這就像是讓研究生開(kāi)始接觸實(shí)際的研究項(xiàng)目,學(xué)習(xí)使用各種研究工具和方法。

第二階段是"監(jiān)督微調(diào)",這個(gè)階段的重點(diǎn)是將之前學(xué)到的各種能力整合起來(lái),形成完整的研究流程。如果說(shuō)前一階段是在學(xué)習(xí)各種獨(dú)立的技能,那么這個(gè)階段就是在學(xué)習(xí)如何協(xié)調(diào)這些技能來(lái)完成復(fù)雜任務(wù)。

研究團(tuán)隊(duì)為這個(gè)階段準(zhǔn)備了兩類(lèi)高質(zhì)量的訓(xùn)練數(shù)據(jù):深度搜索任務(wù)和深度研究任務(wù)。深度搜索任務(wù)專(zhuān)注于訓(xùn)練系統(tǒng)的信息檢索和多跳推理能力,比如"找出某個(gè)技術(shù)發(fā)展的完整時(shí)間線,包括關(guān)鍵節(jié)點(diǎn)、重要人物和技術(shù)突破"。深度研究任務(wù)則要求系統(tǒng)完成端到端的研究流程,從理解用戶需求到最終提交格式化的研究報(bào)告。

這個(gè)階段特別注重軌跡質(zhì)量的控制。研究團(tuán)隊(duì)采用了"正確且最短"的原則來(lái)篩選訓(xùn)練數(shù)據(jù),只保留那些既能得出正確結(jié)論又使用最少步驟的推理過(guò)程。這樣做的目的是讓系統(tǒng)學(xué)會(huì)高效工作,避免冗余的搜索行為。同時(shí),他們還故意保留了一些包含工具調(diào)用錯(cuò)誤的訓(xùn)練樣本,讓系統(tǒng)學(xué)會(huì)在遇到問(wèn)題時(shí)如何自我糾正。

第三階段是"強(qiáng)化學(xué)習(xí)",這是整個(gè)訓(xùn)練過(guò)程中最具創(chuàng)新性的部分。在這個(gè)階段,系統(tǒng)不再依賴預(yù)設(shè)的標(biāo)準(zhǔn)答案,而是通過(guò)與真實(shí)環(huán)境的交互來(lái)學(xué)習(xí)和改進(jìn)。

強(qiáng)化學(xué)習(xí)階段的核心是一套基于評(píng)分準(zhǔn)則的獎(jiǎng)勵(lì)機(jī)制。研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)專(zhuān)門(mén)的評(píng)判系統(tǒng),能夠從多個(gè)維度評(píng)估研究報(bào)告的質(zhì)量,包括信息完整性、邏輯嚴(yán)密性、引用準(zhǔn)確性等。這個(gè)評(píng)判系統(tǒng)就像是一位嚴(yán)格的導(dǎo)師,會(huì)對(duì)系統(tǒng)生成的每一份報(bào)告進(jìn)行詳細(xì)評(píng)估,并給出具體的改進(jìn)建議。

在訓(xùn)練過(guò)程中,系統(tǒng)會(huì)反復(fù)嘗試完成各種研究任務(wù),每次完成后都會(huì)收到詳細(xì)的反饋。通過(guò)這種方式,系統(tǒng)逐漸學(xué)會(huì)了什么樣的研究策略更有效,什么樣的信息更值得信賴,以及如何寫(xiě)出更有說(shuō)服力的報(bào)告。

這種三階段訓(xùn)練方法的巧妙之處在于,它模擬了人類(lèi)專(zhuān)家的成長(zhǎng)路徑。從廣泛學(xué)習(xí)基礎(chǔ)知識(shí),到在指導(dǎo)下練習(xí)具體技能,再到在實(shí)踐中不斷改進(jìn),每個(gè)階段都有明確的目標(biāo)和相應(yīng)的訓(xùn)練策略。

四、成本革命:用更少資源做更多事情

Step-DeepResearch最引人注目的特點(diǎn)之一是它在成本控制方面的突破性表現(xiàn)。在AI領(lǐng)域,通常存在一個(gè)普遍認(rèn)知:更強(qiáng)的性能需要更大的模型,而更大的模型意味著更高的成本。然而,StepFun團(tuán)隊(duì)的工作打破了這種固有印象。

為了理解這種成本優(yōu)勢(shì)的意義,我們可以把AI模型比作不同級(jí)別的專(zhuān)業(yè)顧問(wèn)。傳統(tǒng)的大型AI系統(tǒng)就像是聘請(qǐng)頂級(jí)咨詢公司的資深合伙人,他們能力出眾但費(fèi)用昂貴。而Step-DeepResearch更像是一位經(jīng)過(guò)專(zhuān)業(yè)訓(xùn)練的中級(jí)專(zhuān)家,在特定領(lǐng)域的表現(xiàn)不遜色于頂級(jí)專(zhuān)家,但成本卻大大降低。

具體的數(shù)據(jù)對(duì)比更能說(shuō)明這種優(yōu)勢(shì)的顯著程度。在研究質(zhì)量評(píng)估測(cè)試中,Step-DeepResearch達(dá)到了61.4%的高分,僅略低于谷歌Gemini深度研究系統(tǒng)的63.7%分?jǐn)?shù),但卻大幅領(lǐng)先于其他開(kāi)源模型。更重要的是,完成一次研究任務(wù),Step-DeepResearch的成本不到0.5元人民幣,而頂級(jí)商業(yè)系統(tǒng)如Gemini和OpenAI的成本分別約為6.65元和5.32元。

這種成本差異的背后反映了StepFun團(tuán)隊(duì)在模型架構(gòu)和訓(xùn)練策略上的創(chuàng)新思路。傳統(tǒng)的做法往往是通過(guò)增加模型參數(shù)來(lái)提升性能,這就像是通過(guò)增加員工數(shù)量來(lái)提高工作效率。然而,StepFun團(tuán)隊(duì)選擇了一條不同的路徑:與其盲目擴(kuò)大模型規(guī)模,不如優(yōu)化訓(xùn)練方法,讓較小的模型也能掌握專(zhuān)業(yè)技能。

他們的方法論可以概括為"精準(zhǔn)訓(xùn)練"。就像一位優(yōu)秀的教練能夠讓普通運(yùn)動(dòng)員在特定項(xiàng)目上達(dá)到專(zhuān)業(yè)水準(zhǔn)一樣,研究團(tuán)隊(duì)通過(guò)精心設(shè)計(jì)的訓(xùn)練數(shù)據(jù)和訓(xùn)練流程,讓32B參數(shù)的模型在深度研究任務(wù)上表現(xiàn)出色。這種方法的核心在于,與其讓模型學(xué)習(xí)所有可能的技能,不如專(zhuān)注于研究任務(wù)最關(guān)鍵的核心能力。

成本優(yōu)勢(shì)的另一個(gè)來(lái)源是系統(tǒng)架構(gòu)的簡(jiǎn)化。許多商業(yè)深度研究系統(tǒng)采用復(fù)雜的多智能體協(xié)作架構(gòu),需要多個(gè)AI系統(tǒng)同時(shí)工作來(lái)完成一項(xiàng)任務(wù)。這就像是組建一個(gè)多部門(mén)的項(xiàng)目團(tuán)隊(duì),雖然專(zhuān)業(yè)化程度高,但協(xié)調(diào)成本也相應(yīng)增加。Step-DeepResearch采用單一智能體架構(gòu),通過(guò)內(nèi)化各種研究能力,避免了多系統(tǒng)協(xié)調(diào)的復(fù)雜性和額外開(kāi)銷(xiāo)。

這種成本革命的意義遠(yuǎn)遠(yuǎn)超出了技術(shù)層面。對(duì)于中小企業(yè)、研究機(jī)構(gòu)甚至個(gè)人用戶來(lái)說(shuō),高質(zhì)量的AI研究助手不再是昂貴的奢侈品,而是可負(fù)擔(dān)的實(shí)用工具。這就像當(dāng)年個(gè)人電腦的普及一樣,技術(shù)進(jìn)步讓原本只有大公司才能承擔(dān)的計(jì)算能力走進(jìn)了千家萬(wàn)戶。

五、真實(shí)世界的考驗(yàn):ADR-Bench評(píng)測(cè)體系

為了真正驗(yàn)證Step-DeepResearch的實(shí)用性,StepFun團(tuán)隊(duì)開(kāi)發(fā)了一套名為ADR-Bench的全新評(píng)測(cè)體系。這套評(píng)測(cè)體系的設(shè)計(jì)理念與傳統(tǒng)的AI評(píng)估方法截然不同,它更加注重模擬真實(shí)世界中的研究需求。

傳統(tǒng)的AI評(píng)測(cè)往往像是標(biāo)準(zhǔn)化考試,有固定的題目和標(biāo)準(zhǔn)答案。雖然這種方法便于量化比較,但與現(xiàn)實(shí)中的研究工作相去甚遠(yuǎn)。真實(shí)的研究任務(wù)通常是開(kāi)放性的,沒(méi)有標(biāo)準(zhǔn)答案,需要綜合考慮多個(gè)維度的因素。

ADR-Bench的設(shè)計(jì)更像是一場(chǎng)實(shí)戰(zhàn)演練。評(píng)測(cè)包含110個(gè)真實(shí)研究場(chǎng)景,涵蓋法律、金融、教育、醫(yī)療、科技等九個(gè)不同領(lǐng)域。這些場(chǎng)景都來(lái)自真實(shí)的業(yè)務(wù)需求,比如"分析某項(xiàng)政策對(duì)特定行業(yè)的長(zhǎng)期影響"或"評(píng)估新技術(shù)的市場(chǎng)前景和風(fēng)險(xiǎn)"。

評(píng)測(cè)體系采用了兩套互補(bǔ)的評(píng)估方法。對(duì)于專(zhuān)業(yè)領(lǐng)域的任務(wù),比如法律和金融分析,系統(tǒng)采用專(zhuān)家制定的詳細(xì)評(píng)分準(zhǔn)則。這些準(zhǔn)則就像專(zhuān)業(yè)考試的評(píng)分標(biāo)準(zhǔn),關(guān)注知識(shí)的準(zhǔn)確性、分析的深度和結(jié)論的可靠性。對(duì)于一般領(lǐng)域的任務(wù),則采用人工對(duì)比評(píng)估的方式,由專(zhuān)業(yè)評(píng)估員直接比較不同系統(tǒng)生成的報(bào)告質(zhì)量。

這種評(píng)估方式的優(yōu)勢(shì)在于它能夠捕捉到傳統(tǒng)評(píng)測(cè)方法難以量化的因素。比如,報(bào)告的可讀性、邏輯結(jié)構(gòu)的清晰度、以及對(duì)用戶真實(shí)需求的理解程度。這些因素在實(shí)際應(yīng)用中往往比純粹的知識(shí)準(zhǔn)確性更加重要。

在ADR-Bench的測(cè)試中,Step-DeepResearch展現(xiàn)出了令人印象深刻的性能。在與頂級(jí)商業(yè)系統(tǒng)的對(duì)比中,它在70個(gè)測(cè)試案例中勝率保持在50%以上,與Gemini和MiniMax等知名系統(tǒng)的對(duì)比中,勝負(fù)比例達(dá)到了47:23,顯示出明顯的優(yōu)勢(shì)。

更重要的是,測(cè)試結(jié)果顯示Step-DeepResearch在不同類(lèi)型的研究任務(wù)中都表現(xiàn)穩(wěn)定。無(wú)論是需要深度專(zhuān)業(yè)知識(shí)的法律分析,還是需要綜合判斷的商業(yè)決策支持,系統(tǒng)都能提供高質(zhì)量的輸出。這種一致性對(duì)于實(shí)際應(yīng)用來(lái)說(shuō)極其重要,用戶可以信賴系統(tǒng)在各種場(chǎng)景下的表現(xiàn)。

測(cè)試還揭示了Step-DeepResearch的一些獨(dú)特優(yōu)勢(shì)。在信息完整性方面,系統(tǒng)能夠全面覆蓋研究主題的各個(gè)重要方面,避免遺漏關(guān)鍵信息。在內(nèi)容深度方面,系統(tǒng)擅長(zhǎng)提供具體的數(shù)據(jù)支撐和深入的分析洞察,而不是停留在表面的描述。在需求匹配度方面,系統(tǒng)能夠準(zhǔn)確理解用戶的真實(shí)意圖,并相應(yīng)調(diào)整研究重點(diǎn)和報(bào)告風(fēng)格。

六、技術(shù)創(chuàng)新的核心:ReAct框架的優(yōu)化應(yīng)用

Step-DeepResearch在技術(shù)實(shí)現(xiàn)上采用了一種被稱(chēng)為ReAct的工作框架,這個(gè)框架的核心思想是讓AI系統(tǒng)像人類(lèi)研究員一樣進(jìn)行"推理-行動(dòng)-觀察"的循環(huán)過(guò)程。

ReAct框架可以比作一位經(jīng)驗(yàn)豐富的偵探的工作方式。當(dāng)偵探接到一個(gè)案件時(shí),他首先會(huì)分析現(xiàn)有信息,形成初步的推理和假設(shè)(推理階段)。然后基于這些推理,制定具體的調(diào)查行動(dòng),比如走訪證人、搜集物證、查閱檔案等(行動(dòng)階段)。在執(zhí)行這些行動(dòng)后,偵探會(huì)仔細(xì)觀察和分析獲得的新信息(觀察階段),然后基于新的發(fā)現(xiàn)更新自己的推理,開(kāi)始下一輪的推理-行動(dòng)-觀察循環(huán)。

在Step-DeepResearch的應(yīng)用中,這個(gè)循環(huán)過(guò)程被精心優(yōu)化以適應(yīng)深度研究的特殊需求。在推理階段,系統(tǒng)不僅要分析當(dāng)前掌握的信息,還要識(shí)別信息缺口,判斷哪些方面需要進(jìn)一步調(diào)研。這種能力類(lèi)似于一位資深分析師能夠快速識(shí)別報(bào)告中的薄弱環(huán)節(jié)。

行動(dòng)階段則涉及多種專(zhuān)門(mén)的工具調(diào)用。系統(tǒng)配備了一套完整的研究工具箱,包括網(wǎng)絡(luò)搜索、文檔分析、數(shù)據(jù)提取等功能。更重要的是,系統(tǒng)能夠根據(jù)當(dāng)前的研究需求智能選擇最合適的工具。比如,在研究歷史事件時(shí),系統(tǒng)會(huì)優(yōu)先使用權(quán)威歷史資料庫(kù);在分析市場(chǎng)趨勢(shì)時(shí),系統(tǒng)會(huì)重點(diǎn)關(guān)注財(cái)經(jīng)數(shù)據(jù)平臺(tái)。

觀察階段是整個(gè)框架中最具挑戰(zhàn)性的部分。系統(tǒng)需要對(duì)獲取的信息進(jìn)行質(zhì)量評(píng)估,識(shí)別可能的偏見(jiàn)或錯(cuò)誤,并判斷信息的相關(guān)性和可靠性。這就像是一位經(jīng)驗(yàn)豐富的記者在核實(shí)消息來(lái)源的可信度。

StepFun團(tuán)隊(duì)在ReAct框架的基礎(chǔ)上增加了幾個(gè)關(guān)鍵的改進(jìn)。首先是上下文管理機(jī)制,確保系統(tǒng)在長(zhǎng)時(shí)間的研究過(guò)程中能夠保持對(duì)重要信息的記憶。這就像是給研究員配備了一個(gè)永不遺忘的電子筆記本。

其次是引用追蹤系統(tǒng),確保最終報(bào)告中的每個(gè)重要觀點(diǎn)都能追溯到可靠的信息源。這種設(shè)計(jì)不僅提高了報(bào)告的可信度,也便于讀者進(jìn)行進(jìn)一步的驗(yàn)證和深入研究。

最后是質(zhì)量控制機(jī)制,系統(tǒng)在生成最終報(bào)告前會(huì)進(jìn)行多輪自我檢查,識(shí)別邏輯矛盾、事實(shí)錯(cuò)誤或論證不足的地方。這個(gè)過(guò)程類(lèi)似于專(zhuān)業(yè)研究員在提交報(bào)告前的反復(fù)修改和完善。

七、實(shí)戰(zhàn)表現(xiàn):從理論到應(yīng)用的完美轉(zhuǎn)化

為了驗(yàn)證Step-DeepResearch在實(shí)際應(yīng)用中的表現(xiàn),研究團(tuán)隊(duì)進(jìn)行了大量的實(shí)戰(zhàn)測(cè)試,結(jié)果展現(xiàn)了系統(tǒng)從理論設(shè)計(jì)到實(shí)際應(yīng)用的成功轉(zhuǎn)化。

在一項(xiàng)涉及復(fù)雜技術(shù)分析的測(cè)試中,系統(tǒng)被要求研究"大模型在代碼工程能力方面的最新進(jìn)展"。這個(gè)任務(wù)需要系統(tǒng)不僅要了解技術(shù)發(fā)展的歷史脈絡(luò),還要分析不同研究方法的優(yōu)劣,識(shí)別數(shù)據(jù)處理的最佳實(shí)踐,并總結(jié)當(dāng)前的開(kāi)源資源狀況。

Step-DeepResearch的處理過(guò)程展現(xiàn)了其強(qiáng)大的綜合能力。系統(tǒng)首先準(zhǔn)確理解了用戶需求的多層次結(jié)構(gòu),識(shí)別出用戶特別關(guān)心數(shù)據(jù)構(gòu)造細(xì)節(jié)和開(kāi)源可用性。然后,系統(tǒng)系統(tǒng)性地搜集了相關(guān)領(lǐng)域的十多項(xiàng)重要研究,包括SWE-bench系列、SWE-smith、SWE-Factory等前沿工作。

在信息分析階段,系統(tǒng)不僅收集了這些研究的基本信息,還深入分析了它們的數(shù)據(jù)處理pipeline、核心機(jī)制和開(kāi)源狀況。最終生成的報(bào)告不僅信息全面,而且結(jié)構(gòu)清晰,甚至包含了詳細(xì)的對(duì)比表格,總結(jié)了不同方法在數(shù)據(jù)來(lái)源、格式轉(zhuǎn)換、清洗步驟等關(guān)鍵維度的差異。

這個(gè)案例的對(duì)比結(jié)果particularly令人印象深刻。與未經(jīng)過(guò)中期訓(xùn)練的基礎(chǔ)模型相比,Step-DeepResearch在需求理解、信息完整性和內(nèi)容深度方面都表現(xiàn)出顯著優(yōu)勢(shì)?;A(chǔ)模型的輸出往往停留在表面描述,缺乏系統(tǒng)性的分析框架,而Step-DeepResearch則能提供專(zhuān)業(yè)級(jí)別的深度分析。

在另一項(xiàng)財(cái)務(wù)分析測(cè)試中,系統(tǒng)被要求分析"直播電商市場(chǎng)的周期性變化和未來(lái)趨勢(shì)"。這類(lèi)任務(wù)需要系統(tǒng)整合歷史數(shù)據(jù)、政策變化、競(jìng)爭(zhēng)格局等多維度信息,并給出前瞻性的判斷。

Step-DeepResearch在處理這個(gè)任務(wù)時(shí)展現(xiàn)了出色的時(shí)序分析能力。系統(tǒng)準(zhǔn)確識(shí)別了直播電商發(fā)展的關(guān)鍵時(shí)間節(jié)點(diǎn),分析了增長(zhǎng)和下滑的深層原因,并基于這些分析提出了對(duì)未來(lái)發(fā)展的預(yù)判。報(bào)告不僅包含了詳實(shí)的數(shù)據(jù)支撐,還提供了風(fēng)險(xiǎn)預(yù)警和機(jī)會(huì)識(shí)別,完全達(dá)到了專(zhuān)業(yè)分析師的水準(zhǔn)。

特別值得注意的是,系統(tǒng)在處理這類(lèi)開(kāi)放性任務(wù)時(shí)表現(xiàn)出的適應(yīng)性。它能夠根據(jù)不同的研究主題調(diào)整分析框架和重點(diǎn),比如對(duì)技術(shù)類(lèi)話題更注重創(chuàng)新點(diǎn)和實(shí)現(xiàn)細(xì)節(jié),對(duì)商業(yè)類(lèi)話題更關(guān)注市場(chǎng)影響和競(jìng)爭(zhēng)態(tài)勢(shì)。這種靈活性對(duì)于實(shí)際應(yīng)用來(lái)說(shuō)極其重要。

測(cè)試結(jié)果還揭示了系統(tǒng)在引用管理方面的優(yōu)勢(shì)。在所有生成的報(bào)告中,重要觀點(diǎn)都有明確的信息源引用,便于讀者進(jìn)行事實(shí)核查。這種嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度使得系統(tǒng)生成的報(bào)告具備了專(zhuān)業(yè)研究的可信度。

八、性能標(biāo)桿:與頂級(jí)系統(tǒng)的全面對(duì)比

為了客觀評(píng)估Step-DeepResearch的性能水平,研究團(tuán)隊(duì)將其與當(dāng)前市場(chǎng)上最頂級(jí)的深度研究系統(tǒng)進(jìn)行了全面對(duì)比,結(jié)果展現(xiàn)了令人印象深刻的競(jìng)爭(zhēng)力。

在標(biāo)準(zhǔn)化評(píng)測(cè)Research Rubrics上,Step-DeepResearch取得了61.42分的高分,在所有參測(cè)系統(tǒng)中排名第二,僅次于谷歌的Gemini DeepResearch(63.69分),但顯著超越了OpenAI DeepResearch(60.67分)。這個(gè)成績(jī)特別令人矚目,因?yàn)镾tep-DeepResearch使用的參數(shù)量遠(yuǎn)小于這些商業(yè)系統(tǒng)。

更詳細(xì)的分析顯示,Step-DeepResearch在不同評(píng)估維度上都表現(xiàn)出色。在隱含標(biāo)準(zhǔn)和明確標(biāo)準(zhǔn)的理解方面,系統(tǒng)分別獲得了54.5分和72.0分,顯示出強(qiáng)大的任務(wù)理解和執(zhí)行能力。在引用質(zhì)量方面,系統(tǒng)以57.0分與Gemini并列第一,體現(xiàn)了其在學(xué)術(shù)嚴(yán)謹(jǐn)性方面的優(yōu)勢(shì)。

在自建的ADR-Bench評(píng)測(cè)中,Step-DeepResearch的表現(xiàn)更加出色。在70個(gè)測(cè)試案例的人工對(duì)比評(píng)估中,系統(tǒng)與各主流競(jìng)爭(zhēng)對(duì)手的勝負(fù)比都保持在有利位置。特別是與一些知名的商業(yè)系統(tǒng)相比,Step-DeepResearch在信息完整性和內(nèi)容深度方面展現(xiàn)出明顯優(yōu)勢(shì)。

這些對(duì)比結(jié)果的意義不僅在于數(shù)字本身,更在于它們揭示的技術(shù)路徑的有效性。傳統(tǒng)觀念認(rèn)為,要達(dá)到頂級(jí)性能必須依賴大規(guī)模的模型和復(fù)雜的系統(tǒng)架構(gòu)。但Step-DeepResearch的成功證明,通過(guò)精心設(shè)計(jì)的訓(xùn)練策略和優(yōu)化的系統(tǒng)架構(gòu),中等規(guī)模的模型同樣可以在特定領(lǐng)域達(dá)到世界一流的水準(zhǔn)。

成本效益分析更加突出了Step-DeepResearch的價(jià)值主張。在達(dá)到接近頂級(jí)系統(tǒng)性能的同時(shí),其運(yùn)行成本僅為主要商業(yè)競(jìng)爭(zhēng)對(duì)手的十分之一到二十分之一。這種成本優(yōu)勢(shì)為大規(guī)模應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

九、未來(lái)展望:智能研究助手的無(wú)限可能

Step-DeepResearch的成功不僅僅是一個(gè)技術(shù)里程碑,更重要的是它為我們展示了智能研究助手的無(wú)限可能性。

從技術(shù)發(fā)展的角度看,Step-DeepResearch驗(yàn)證了"精準(zhǔn)訓(xùn)練"策略的有效性。這種方法論的成功為AI領(lǐng)域提供了一個(gè)重要啟示:與其盲目追求模型規(guī)模的增長(zhǎng),不如專(zhuān)注于訓(xùn)練方法的優(yōu)化。這就像在體育訓(xùn)練中,科學(xué)的訓(xùn)練方法往往比簡(jiǎn)單的運(yùn)動(dòng)量增加更能提升運(yùn)動(dòng)員的成績(jī)。

在實(shí)際應(yīng)用層面,Step-DeepResearch的低成本特性使得高質(zhì)量AI研究助手的普及成為可能。小型企業(yè)的市場(chǎng)分析師、學(xué)術(shù)機(jī)構(gòu)的研究員、甚至個(gè)人投資者,都可能擁有專(zhuān)業(yè)級(jí)的研究支持。這種技術(shù)的民主化將極大地提升社會(huì)整體的信息處理和決策制定能力。

從研究方法論的角度,Step-DeepResearch代表了AI系統(tǒng)設(shè)計(jì)思路的重要轉(zhuǎn)變。傳統(tǒng)的AI系統(tǒng)往往試圖成為"萬(wàn)能專(zhuān)家",掌握所有可能的知識(shí)和技能。而Step-DeepResearch則專(zhuān)注于成為"領(lǐng)域?qū)<?,在特定的研究任務(wù)上達(dá)到人類(lèi)專(zhuān)家的水準(zhǔn)。這種專(zhuān)業(yè)化的設(shè)計(jì)理念可能會(huì)成為未來(lái)AI系統(tǒng)開(kāi)發(fā)的重要方向。

當(dāng)然,研究團(tuán)隊(duì)也清醒地認(rèn)識(shí)到當(dāng)前系統(tǒng)還存在的局限性。比如在處理高度專(zhuān)業(yè)化的科學(xué)研究時(shí),系統(tǒng)可能缺乏足夠深入的領(lǐng)域知識(shí)。在面對(duì)需要?jiǎng)?chuàng)造性思維的開(kāi)放性問(wèn)題時(shí),系統(tǒng)的表現(xiàn)還有改進(jìn)空間。在信息真實(shí)性驗(yàn)證方面,雖然系統(tǒng)已經(jīng)具備了基本的交叉驗(yàn)證能力,但在面對(duì)故意誤導(dǎo)信息時(shí)仍需進(jìn)一步加強(qiáng)。

研究團(tuán)隊(duì)已經(jīng)規(guī)劃了多個(gè)改進(jìn)方向。首先是多智能體協(xié)作機(jī)制的引入,通過(guò)讓多個(gè)專(zhuān)門(mén)化的AI系統(tǒng)協(xié)同工作,提高復(fù)雜任務(wù)的處理能力。其次是環(huán)境交互能力的增強(qiáng),讓系統(tǒng)能夠在動(dòng)態(tài)變化的信息環(huán)境中進(jìn)行持續(xù)學(xué)習(xí)和適應(yīng)。最后是獎(jiǎng)勵(lì)機(jī)制的進(jìn)一步優(yōu)化,引入更多維度的質(zhì)量評(píng)估標(biāo)準(zhǔn),確保系統(tǒng)生成的內(nèi)容不僅準(zhǔn)確,而且清晰易懂。

Step-DeepResearch的成功為我們描繪了一個(gè)令人興奮的未來(lái)圖景:每個(gè)人都可能擁有一位永不疲倦、知識(shí)淵博的研究助手,幫助我們?cè)谛畔⒈ǖ臅r(shí)代中找到真正有價(jià)值的洞察。這不僅會(huì)改變我們獲取和處理信息的方式,更可能會(huì)推動(dòng)整個(gè)社會(huì)的知識(shí)生產(chǎn)和決策制定向更加科學(xué)、高效的方向發(fā)展。

Q&A

Q1:Step-DeepResearch相比其他AI研究系統(tǒng)有什么優(yōu)勢(shì)?

A:Step-DeepResearch最大的優(yōu)勢(shì)是成本效益比。它只用320億參數(shù)就能達(dá)到與GPT-4和Gemini相近的研究質(zhì)量,但成本只有它們的十分之一。同時(shí),它采用端到端的單一智能體架構(gòu),避免了復(fù)雜系統(tǒng)的協(xié)調(diào)問(wèn)題,在信息完整性、引用質(zhì)量等方面表現(xiàn)出色。

Q2:普通用戶現(xiàn)在能使用Step-DeepResearch嗎?

A:這是StepFun公司的研究項(xiàng)目,論文剛發(fā)布,具體的產(chǎn)品化時(shí)間和使用方式還需要等待官方公布。不過(guò)從技術(shù)角度看,由于其低成本特性,未來(lái)很可能會(huì)比現(xiàn)有的商業(yè)深度研究系統(tǒng)更容易獲得和使用。

Q3:Step-DeepResearch生成的報(bào)告可信度如何?

A:系統(tǒng)在可信度方面表現(xiàn)不錯(cuò),它具備交叉驗(yàn)證能力,會(huì)主動(dòng)尋找不同信息源進(jìn)行對(duì)比,所有重要觀點(diǎn)都有明確的引用來(lái)源。在專(zhuān)業(yè)評(píng)測(cè)中,它的引用質(zhì)量得分與谷歌Gemini并列第一。不過(guò)和所有AI系統(tǒng)一樣,重要決策前還是建議人工核實(shí)關(guān)鍵信息。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國(guó)攔截售臺(tái)武器,會(huì)發(fā)生什么?

“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國(guó)攔截售臺(tái)武器,會(huì)發(fā)生什么?

扶蘇聊歷史
2025-12-27 10:30:21
俄羅斯運(yùn)輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

俄羅斯運(yùn)輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

史政先鋒
2025-12-31 21:38:56
下月起,看病開(kāi)藥新規(guī)!6類(lèi)藥超7天全自費(fèi),慢病一次開(kāi)3個(gè)月

下月起,看病開(kāi)藥新規(guī)!6類(lèi)藥超7天全自費(fèi),慢病一次開(kāi)3個(gè)月

蜉蝣說(shuō)
2025-12-30 11:59:54
龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂

龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂

滄海一書(shū)客
2025-12-25 19:27:44
剛剛!濱江道、世紀(jì)鐘、解放橋跨年夜震撼一幕···

剛剛!濱江道、世紀(jì)鐘、解放橋跨年夜震撼一幕···

天津人
2025-12-31 22:59:53
攤牌了!徐帆回應(yīng)婚變傳聞才4個(gè)月左右 ,馮小剛就連演都懶得演了

攤牌了!徐帆回應(yīng)婚變傳聞才4個(gè)月左右 ,馮小剛就連演都懶得演了

阿廢冷眼觀察所
2025-12-10 06:53:04
孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國(guó)乒教練組競(jìng)聘已結(jié)束

孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國(guó)乒教練組競(jìng)聘已結(jié)束

三十年萊斯特城球迷
2025-12-31 22:34:39
浙江足協(xié)官方:寧波職業(yè)足球俱樂(lè)部成立,新賽季亮相中甲

浙江足協(xié)官方:寧波職業(yè)足球俱樂(lè)部成立,新賽季亮相中甲

懂球帝
2025-12-31 14:41:11
李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個(gè)人

李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個(gè)人

璀璨幻行者
2026-01-01 01:51:57
隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

止境
2026-01-01 00:43:43
李在明動(dòng)身訪華前,先給了中國(guó)一記下馬威,高市早苗卻笑不出來(lái)?

李在明動(dòng)身訪華前,先給了中國(guó)一記下馬威,高市早苗卻笑不出來(lái)?

策前論
2025-12-31 18:05:08
美媒評(píng)各隊(duì)2025年最后悔決策:開(kāi)拓者選瀚森在列 失誤比助攻還多

美媒評(píng)各隊(duì)2025年最后悔決策:開(kāi)拓者選瀚森在列 失誤比助攻還多

羅說(shuō)NBA
2025-12-31 21:38:12
姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

振華觀史
2025-12-31 09:33:49
洛克希德·馬丁生產(chǎn)線停了,是中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)。

洛克希德·馬丁生產(chǎn)線停了,是中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)。

百態(tài)人間
2025-12-31 16:18:36
36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

瓜汁橘長(zhǎng)Dr
2025-12-29 17:52:06
在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個(gè)股受影響

在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個(gè)股受影響

股市皆大事
2025-12-31 20:52:15
回國(guó)后我才敢說(shuō):越南是我去過(guò)的所有國(guó)家中,最被低估的

回國(guó)后我才敢說(shuō):越南是我去過(guò)的所有國(guó)家中,最被低估的

阿纂看事
2025-12-29 09:43:52
被處決毒梟要水喝,3停5口是17年前教的暗號(hào):我是臥底,有內(nèi)鬼!

被處決毒梟要水喝,3停5口是17年前教的暗號(hào):我是臥底,有內(nèi)鬼!

星宇共鳴
2025-12-29 09:56:33
洗浴中心成跨年熱門(mén)目的地,KTV一房難求,長(zhǎng)沙進(jìn)入全國(guó)休閑玩樂(lè)交易規(guī)模前十城市

洗浴中心成跨年熱門(mén)目的地,KTV一房難求,長(zhǎng)沙進(jìn)入全國(guó)休閑玩樂(lè)交易規(guī)模前十城市

瀟湘晨報(bào)
2025-12-31 20:38:14
這4個(gè)器官“用得勤”的人,更長(zhǎng)壽

這4個(gè)器官“用得勤”的人,更長(zhǎng)壽

大象新聞
2025-05-20 19:23:04
2026-01-01 03:03:00
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專(zhuān)注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
895文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

日企代表團(tuán)推遲原定訪華行程 外交部回應(yīng)

頭條要聞

日企代表團(tuán)推遲原定訪華行程 外交部回應(yīng)

體育要聞

布基納法索2-0蘇丹,拉西納-特拉奧雷破門(mén),阿爾塞納-夸西鎖定勝局

娛樂(lè)要聞

官宣才兩天就翻車(chē)?七七被連環(huán)爆料

財(cái)經(jīng)要聞

高培勇:分配制度改革是提振消費(fèi)的抓手

汽車(chē)要聞

凱迪拉克純電中型SUV 售價(jià)不足24萬(wàn)/33寸曲面屏

態(tài)度原創(chuàng)

本地
親子
旅游
藝術(shù)
軍事航空

本地新聞

即將過(guò)去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

親子要聞

爺孫話兩岸/鄭麗文

旅游要聞

香港舉行“新希望、新開(kāi)始”跨年倒數(shù)活動(dòng)

藝術(shù)要聞

中國(guó)博物館全書(shū)!看遍中國(guó)8000年頂流審美

軍事要聞

沉浸式感受"正義使命-2025"演習(xí)現(xiàn)場(chǎng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版