国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

機(jī)器學(xué)習(xí)工程師的秘密武器:Meta 如何讓AI變身"實(shí)戰(zhàn)專家"

0
分享至

人工智能發(fā)展到今天,就像一個(gè)聰明但缺乏實(shí)戰(zhàn)經(jīng)驗(yàn)的學(xué)生。它們能在考試中取得高分,但一旦面對真實(shí)世界的復(fù)雜問題,往往就束手無策。特別是在機(jī)器學(xué)習(xí)工程(MLE)領(lǐng)域,現(xiàn)有的AI助手就像一個(gè)只會(huì)背書卻沒有動(dòng)手能力的理論家,無法勝任那些需要反復(fù)試錯(cuò)、持續(xù)優(yōu)化的實(shí)際工程任務(wù)。


這項(xiàng)由Meta AI公司研究團(tuán)隊(duì)完成的突破性研究發(fā)表于2026年4月,論文編號(hào)為arXiv:2604.04872v1。他們的核心發(fā)現(xiàn)徹底改變了我們對AI訓(xùn)練的認(rèn)知:通過創(chuàng)造一個(gè)名為SandMLE的"微型沙盒訓(xùn)練場",成功地讓AI模型學(xué)會(huì)了像經(jīng)驗(yàn)豐富的工程師那樣思考和行動(dòng)。這種方法不僅將訓(xùn)練效率提升了13倍以上,更重要的是,它讓AI首次具備了在真實(shí)機(jī)器學(xué)習(xí)項(xiàng)目中獨(dú)立探索、試錯(cuò)和改進(jìn)的能力。

研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)關(guān)鍵問題:傳統(tǒng)的機(jī)器學(xué)習(xí)工程訓(xùn)練就像讓學(xué)徒在真實(shí)的大型工廠里學(xué)習(xí)操作,每次試錯(cuò)都需要消耗大量時(shí)間和資源。而他們的解決方案則是搭建一個(gè)功能完備但規(guī)模精小的"實(shí)驗(yàn)工廠",讓AI在這里快速掌握核心技能,然后再應(yīng)用到真實(shí)環(huán)境中。這種訓(xùn)練方式在三個(gè)不同規(guī)模的模型上都取得了顯著成效,性能提升幅度從20.3%到66.9%不等,證明了方法的普遍適用性。

更令人驚喜的是,通過這種方式訓(xùn)練的AI模型展現(xiàn)出了強(qiáng)大的"舉一反三"能力。它們不僅能在相似任務(wù)上表現(xiàn)出色,還能適應(yīng)完全不同的工作環(huán)境和框架,就像一個(gè)真正的專家能夠在不同公司、不同項(xiàng)目中都發(fā)揮出色一樣。這項(xiàng)研究為AI從"理論派"向"實(shí)戰(zhàn)派"的轉(zhuǎn)變提供了可行的路徑,有望在不久的將來讓AI助手真正成為工程師們得力的工作伙伴。

### 一、從理論到實(shí)踐的鴻溝:為什么AI在真實(shí)工程中表現(xiàn)不佳

要理解這項(xiàng)研究的重要性,我們不妨回到一個(gè)熟悉的場景:學(xué)車。剛從駕校畢業(yè)的新手司機(jī)雖然通過了所有理論考試,但第一次獨(dú)自上路時(shí)往往手忙腳亂。AI模型在機(jī)器學(xué)習(xí)工程中遇到的正是同樣的困境。

傳統(tǒng)的AI訓(xùn)練方式就像讓學(xué)生只在教室里學(xué)習(xí)駕駛理論,卻從未真正握過方向盤。當(dāng)這些AI面對真實(shí)的機(jī)器學(xué)習(xí)項(xiàng)目時(shí),它們往往只能機(jī)械地模仿專家的操作步驟,而無法根據(jù)具體情況靈活調(diào)整策略。更關(guān)鍵的是,真正的工程工作需要大量的試錯(cuò)過程,就像新手司機(jī)需要在實(shí)際駕駛中逐漸熟悉油門和剎車的感覺一樣。

研究團(tuán)隊(duì)發(fā)現(xiàn),現(xiàn)有AI系統(tǒng)面臨的最大障礙并非智力不足,而是缺乏"在做中學(xué)"的機(jī)會(huì)。機(jī)器學(xué)習(xí)工程任務(wù)天生就需要反復(fù)迭代:寫代碼、運(yùn)行測試、分析結(jié)果、修改參數(shù)、再次測試。這個(gè)過程就像烹飪一道復(fù)雜菜肴,廚師需要不斷品嘗、調(diào)味、再品嘗,直到達(dá)到完美的口感。然而,傳統(tǒng)的AI訓(xùn)練方法只能讓模型觀看"烹飪教學(xué)視頻",卻無法給它們真正的"下廚機(jī)會(huì)"。

更糟糕的是,在真實(shí)的機(jī)器學(xué)習(xí)項(xiàng)目中,每一次"嘗試"都異常昂貴。運(yùn)行一次完整的機(jī)器學(xué)習(xí)流程可能需要幾分鐘甚至幾小時(shí),就像每次練習(xí)炒菜都需要準(zhǔn)備一桌滿漢全席的食材。這種高昂的試錯(cuò)成本使得傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法在機(jī)器學(xué)習(xí)工程領(lǐng)域幾乎不可行。如果一個(gè)AI需要嘗試數(shù)千次才能掌握一項(xiàng)技能,而每次嘗試都需要200秒的運(yùn)行時(shí)間,那么完整的訓(xùn)練過程將耗費(fèi)數(shù)十萬秒,這在實(shí)際應(yīng)用中是完全不可接受的。

這就是為什么現(xiàn)有的機(jī)器學(xué)習(xí)工程AI大多采用"監(jiān)督學(xué)習(xí)"的方式,即讓模型觀摩專家的操作記錄并嘗試模仿。這種方法就像讓學(xué)生通過觀看錄像學(xué)習(xí)外科手術(shù),雖然能掌握基本流程,但遇到意外情況時(shí)往往無所適從。真正的專家技能需要在實(shí)踐中磨練,需要經(jīng)歷無數(shù)次失敗和修正,這正是傳統(tǒng)AI訓(xùn)練方法所缺失的關(guān)鍵環(huán)節(jié)。

### 二、沙盒訓(xùn)練場的誕生:小環(huán)境培養(yǎng)大能力

面對這樣的困境,Meta AI的研究團(tuán)隊(duì)提出了一個(gè)富有創(chuàng)意的解決方案:SandMLE系統(tǒng)。這個(gè)系統(tǒng)的核心思想就像為學(xué)習(xí)者創(chuàng)建一個(gè)"微縮版練習(xí)場",在這里可以快速、低成本地進(jìn)行大量實(shí)踐。

SandMLE的工作原理可以用學(xué)習(xí)駕駛的比喻來理解。傳統(tǒng)方法就像讓新手司機(jī)直接在高速公路上練車,不僅危險(xiǎn)而且成本高昂。而SandMLE則相當(dāng)于建造了一個(gè)設(shè)施完備的駕駛訓(xùn)練場:道路標(biāo)識(shí)、交通信號(hào)、各種路況一應(yīng)俱全,但規(guī)模適中,讓學(xué)習(xí)者能夠在安全的環(huán)境中快速積累經(jīng)驗(yàn)。

這個(gè)"訓(xùn)練場"是如何建造的呢?研究團(tuán)隊(duì)設(shè)計(jì)了一套精巧的四步流程,就像一個(gè)專業(yè)的游戲設(shè)計(jì)團(tuán)隊(duì)在創(chuàng)建訓(xùn)練關(guān)卡。首先,"數(shù)據(jù)策略師"這個(gè)角色負(fù)責(zé)分析現(xiàn)有的真實(shí)項(xiàng)目,提取出其中的核心挑戰(zhàn)和結(jié)構(gòu)特征,就像游戲設(shè)計(jì)師會(huì)研究真實(shí)戰(zhàn)爭的戰(zhàn)術(shù)要素來設(shè)計(jì)戰(zhàn)略游戲。這個(gè)過程完全忽略具體的領(lǐng)域背景,專注于抽象的數(shù)學(xué)和邏輯關(guān)系。

接下來,"機(jī)器學(xué)習(xí)開發(fā)者"角色開始構(gòu)建具體的訓(xùn)練數(shù)據(jù)。這個(gè)過程就像制作電影道具:雖然是人工制作的,但必須足夠逼真,能夠重現(xiàn)真實(shí)環(huán)境中的各種復(fù)雜情況。關(guān)鍵的創(chuàng)新在于,他們將每個(gè)訓(xùn)練任務(wù)的數(shù)據(jù)規(guī)模嚴(yán)格控制在50到200個(gè)樣本之間,就像將一個(gè)需要處理百萬級數(shù)據(jù)的真實(shí)項(xiàng)目壓縮成一個(gè)精簡但完整的迷你版本。

然后是"運(yùn)維工程師"的工作,負(fù)責(zé)構(gòu)建自動(dòng)化的評估系統(tǒng)。這就像為訓(xùn)練場安裝了精密的計(jì)時(shí)器和評分系統(tǒng),能夠即時(shí)準(zhǔn)確地判斷每一次練習(xí)的成果。這個(gè)系統(tǒng)不僅能給出最終得分,還設(shè)置了多個(gè)中間里程碑,就像駕駛考試中的分項(xiàng)評分,讓AI能夠理解自己在哪些方面做得好,哪些方面還需要改進(jìn)。

最后,"技術(shù)寫作者"負(fù)責(zé)將整個(gè)訓(xùn)練場景包裝成清晰的任務(wù)描述。這就像為每個(gè)訓(xùn)練項(xiàng)目編寫詳細(xì)的使用說明書,確保AI能夠準(zhǔn)確理解任務(wù)要求和評判標(biāo)準(zhǔn)。

這套系統(tǒng)最巧妙的地方在于它的"以假亂真"能力。雖然訓(xùn)練數(shù)據(jù)是人工生成的,但它們保持了真實(shí)項(xiàng)目的所有核心復(fù)雜性:數(shù)據(jù)分布的不均衡、特征之間的復(fù)雜關(guān)系、各種現(xiàn)實(shí)中常見的噪聲干擾等等。就像一個(gè)優(yōu)秀的飛行模擬器,雖然你沒有真正升空,但能夠體驗(yàn)到真實(shí)飛行中的各種挑戰(zhàn)和決策點(diǎn)。

更重要的是,這個(gè)系統(tǒng)具有強(qiáng)大的可擴(kuò)展性。從60個(gè)基礎(chǔ)任務(wù)開始,系統(tǒng)能夠自動(dòng)生成848個(gè)不同的訓(xùn)練場景,涵蓋了從醫(yī)療保健到零售電商、從圖像分析到文本處理的各種應(yīng)用領(lǐng)域。這就像從幾個(gè)基礎(chǔ)的駕駛場景(停車、并線、轉(zhuǎn)彎)可以組合出無數(shù)種復(fù)雜的駕駛情況一樣。

### 三、強(qiáng)化學(xué)習(xí)的革命:讓AI在試錯(cuò)中成長

有了這個(gè)高效的訓(xùn)練環(huán)境,研究團(tuán)隊(duì)就能夠?qū)嵤┱嬲膹?qiáng)化學(xué)習(xí)訓(xùn)練了。強(qiáng)化學(xué)習(xí)的核心理念就像訓(xùn)練一只寵物:通過獎(jiǎng)懲機(jī)制讓它逐漸學(xué)會(huì)正確的行為模式。但在機(jī)器學(xué)習(xí)工程的背景下,這個(gè)過程變得異常復(fù)雜和精妙。

傳統(tǒng)的強(qiáng)化學(xué)習(xí)就像訓(xùn)練動(dòng)物做單一的把戲,比如讓狗學(xué)會(huì)握手。而機(jī)器學(xué)習(xí)工程需要的是一系列復(fù)雜的連貫動(dòng)作,就像訓(xùn)練一只導(dǎo)盲犬不僅要學(xué)會(huì)基本的行走,還要能夠判斷交通狀況、避開障礙物、在復(fù)雜環(huán)境中做出正確決策。這種多步驟、長序列的學(xué)習(xí)過程被稱為"軌跡級強(qiáng)化學(xué)習(xí)"。

在SandMLE系統(tǒng)中,AI的學(xué)習(xí)過程就像一個(gè)新手工程師的成長歷程。它首先接到一個(gè)項(xiàng)目需求(任務(wù)描述),然后開始思考解決方案,編寫代碼,運(yùn)行測試,查看結(jié)果,根據(jù)反饋調(diào)整策略,再次嘗試。這個(gè)過程可能需要重復(fù)十幾次甚至幾十次,每一步都是一個(gè)學(xué)習(xí)的機(jī)會(huì)。

研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)巧妙的獎(jiǎng)勵(lì)系統(tǒng),就像一個(gè)經(jīng)驗(yàn)豐富的導(dǎo)師在旁邊指導(dǎo)。這個(gè)系統(tǒng)不僅關(guān)注最終結(jié)果,更重視過程中的每個(gè)重要節(jié)點(diǎn)。當(dāng)AI成功生成了格式正確的代碼時(shí),它會(huì)得到基礎(chǔ)分?jǐn)?shù)。當(dāng)代碼能夠正常運(yùn)行時(shí),分?jǐn)?shù)進(jìn)一步提升。當(dāng)結(jié)果超過預(yù)設(shè)的性能閾值時(shí),AI會(huì)獲得更高的獎(jiǎng)勵(lì)。這種分層獎(jiǎng)勵(lì)機(jī)制就像游戲中的經(jīng)驗(yàn)值系統(tǒng),讓AI能夠清楚地感知到自己的進(jìn)步。

更有趣的是,研究團(tuán)隊(duì)采用了一種叫做GRPO(群體相對策略優(yōu)化)的訓(xùn)練方法。這個(gè)方法的核心思想就像組織一場友誼賽:讓多個(gè)AI同時(shí)嘗試解決同一個(gè)問題,然后根據(jù)相對表現(xiàn)來調(diào)整訓(xùn)練策略。表現(xiàn)好的AI會(huì)得到正向激勵(lì),表現(xiàn)差的則會(huì)受到負(fù)向反饋,但這種比較是在同一批次內(nèi)進(jìn)行的,確保了評判的公平性。

這種訓(xùn)練方式的效果非常顯著。在傳統(tǒng)方法下,AI往往只能機(jī)械地重復(fù)專家的操作步驟,就像背誦教科書的學(xué)生。而通過強(qiáng)化學(xué)習(xí)訓(xùn)練的AI展現(xiàn)出了真正的"工程師思維":它們會(huì)主動(dòng)嘗試不同的解決方案,在遇到錯(cuò)誤時(shí)能夠分析原因并調(diào)整策略,甚至能夠在面對新問題時(shí)遷移已有的經(jīng)驗(yàn)。

訓(xùn)練過程中最有趣的發(fā)現(xiàn)是AI的"成長軌跡"。小規(guī)模的8B參數(shù)模型在訓(xùn)練初期經(jīng)常產(chǎn)生格式錯(cuò)誤的輸出,就像初學(xué)者總是犯一些低級錯(cuò)誤。但隨著訓(xùn)練的進(jìn)行,它們逐漸掌握了基本規(guī)范。而大規(guī)模的30B參數(shù)模型則展現(xiàn)出了更快的學(xué)習(xí)速度和更強(qiáng)的穩(wěn)定性,就像天賦更高的學(xué)生能夠更快地掌握復(fù)雜概念。

### 四、跨領(lǐng)域適應(yīng)能力:一技通萬技精

SandMLE訓(xùn)練系統(tǒng)最令人印象深刻的特點(diǎn)之一,就是它培養(yǎng)出的AI具有強(qiáng)大的跨領(lǐng)域適應(yīng)能力。這就像一個(gè)在駕校學(xué)會(huì)開車的司機(jī),不僅能駕駛教練車,還能快速適應(yīng)轎車、SUV,甚至貨車等不同車型。

為了驗(yàn)證這種適應(yīng)能力,研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)巧妙的實(shí)驗(yàn)。他們讓經(jīng)過SandMLE訓(xùn)練的AI在完全不同的工作框架下執(zhí)行任務(wù),就像讓一個(gè)習(xí)慣了某種工作流程的員工突然換到一個(gè)使用完全不同系統(tǒng)的公司。結(jié)果表明,這些AI不僅能夠正常工作,還能保持甚至提升原有的性能水平。

具體來說,研究團(tuán)隊(duì)測試了三種不同的工作框架:AIDE、AIRA和MLE-Agent。每種框架就像不同的"工作風(fēng)格"或"公司文化"。AIDE注重系統(tǒng)性的問題分解,AIRA強(qiáng)調(diào)迭代式的優(yōu)化過程,而MLE-Agent則采用更加靈活的交互方式。在傳統(tǒng)的訓(xùn)練方法下,AI往往只能在特定框架下發(fā)揮作用,換個(gè)環(huán)境就水土不服。

但經(jīng)過SandMLE訓(xùn)練的AI展現(xiàn)出了令人驚訝的適應(yīng)性。在MLE-Dojo基準(zhǔn)測試中,30B規(guī)模的模型在使用MLE-Agent框架時(shí)達(dá)到了83.9%的有效提交率和38.56的人類排名得分。這個(gè)成績意味著AI的表現(xiàn)已經(jīng)超過了大多數(shù)人類參與者,達(dá)到了專業(yè)工程師的水平。

更有趣的是,不同規(guī)模的模型展現(xiàn)出了不同的適應(yīng)特征。小規(guī)模模型就像經(jīng)驗(yàn)較少但學(xué)習(xí)能力強(qiáng)的新手,在熟悉的環(huán)境下表現(xiàn)穩(wěn)定,換環(huán)境時(shí)需要一定的適應(yīng)期。而大規(guī)模模型則像經(jīng)驗(yàn)豐富的專家,無論在哪種環(huán)境下都能快速找到最佳工作方式。

這種跨框架的適應(yīng)能力說明了SandMLE訓(xùn)練的深層價(jià)值:它不僅教會(huì)了AI特定的技能,更重要的是培養(yǎng)了AI的"學(xué)習(xí)能力"和"問題解決思維"。這就像優(yōu)秀的教育不應(yīng)該只讓學(xué)生背誦標(biāo)準(zhǔn)答案,而應(yīng)該培養(yǎng)他們的思考方法和解決問題的能力。

研究團(tuán)隊(duì)還發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:AI的這種適應(yīng)能力會(huì)隨著測試時(shí)間的延長而進(jìn)一步提升。當(dāng)給AI更多的思考和嘗試時(shí)間時(shí),它們的表現(xiàn)會(huì)顯著改善。在最長30輪的交互測試中,AI的成功率從初始的5%提升到了55%,展現(xiàn)出了真正的"越戰(zhàn)越勇"特質(zhì)。

### 五、里程碑式獎(jiǎng)勵(lì)機(jī)制:化復(fù)雜為簡單的智慧

SandMLE系統(tǒng)的另一個(gè)重要?jiǎng)?chuàng)新在于它的獎(jiǎng)勵(lì)設(shè)計(jì)機(jī)制。傳統(tǒng)的AI訓(xùn)練就像一個(gè)嚴(yán)苛的老師,只在學(xué)期末給出一個(gè)總成績,學(xué)生完全不知道自己在學(xué)習(xí)過程中哪些地方做得對,哪些地方還需要改進(jìn)。而SandMLE采用了一種叫做"里程碑式獎(jiǎng)勵(lì)"的方法,就像一個(gè)耐心的導(dǎo)師會(huì)在學(xué)習(xí)過程的每個(gè)關(guān)鍵節(jié)點(diǎn)給予及時(shí)的反饋和鼓勵(lì)。

這個(gè)獎(jiǎng)勵(lì)系統(tǒng)的設(shè)計(jì)極其精妙。它包含了多個(gè)層次的評判標(biāo)準(zhǔn),從最基礎(chǔ)的格式要求到最高級的性能表現(xiàn)。當(dāng)AI剛開始學(xué)習(xí)時(shí),它可能連正確的代碼格式都寫不出來,這時(shí)系統(tǒng)會(huì)專注于基礎(chǔ)的格式獎(jiǎng)勵(lì)。一旦AI掌握了基本格式,系統(tǒng)就開始關(guān)注代碼是否能夠成功執(zhí)行。當(dāng)執(zhí)行成功后,系統(tǒng)進(jìn)一步評估結(jié)果的質(zhì)量,設(shè)置了銅牌、銀牌、金牌等不同的性能檔次。

這種分層獎(jiǎng)勵(lì)的好處就像登山時(shí)設(shè)置的多個(gè)休息點(diǎn)。如果只有山頂一個(gè)目標(biāo),攀登者很容易在中途放棄,因?yàn)槟繕?biāo)太過遙遠(yuǎn)。但如果沿途設(shè)置多個(gè)小目標(biāo),每達(dá)到一個(gè)目標(biāo)都能獲得成就感,這樣更容易堅(jiān)持到最后。對AI而言,這種設(shè)計(jì)讓它能夠在學(xué)習(xí)過程中持續(xù)獲得正向反饋,避免陷入"不知道該往哪個(gè)方向努力"的困境。

為了驗(yàn)證這種獎(jiǎng)勵(lì)機(jī)制的有效性,研究團(tuán)隊(duì)專門進(jìn)行了對比實(shí)驗(yàn)。他們創(chuàng)建了一個(gè)"稀疏獎(jiǎng)勵(lì)"的版本,只在AI達(dá)到最高性能標(biāo)準(zhǔn)時(shí)才給予獎(jiǎng)勵(lì),其他時(shí)候完全沒有反饋。結(jié)果非常明顯:使用稀疏獎(jiǎng)勵(lì)的AI就像在黑暗中摸索的盲人,學(xué)習(xí)效率極其低下。而使用里程碑式獎(jiǎng)勵(lì)的AI則展現(xiàn)出了穩(wěn)定的進(jìn)步軌跡。

特別有趣的是不同規(guī)模模型對獎(jiǎng)勵(lì)機(jī)制的反應(yīng)。30B參數(shù)的大模型在稀疏獎(jiǎng)勵(lì)條件下的表現(xiàn)下降最為嚴(yán)重,成功率從27.3%驟降到13.6%。這個(gè)現(xiàn)象說明,越是復(fù)雜的模型,越需要細(xì)致的指導(dǎo)。這就像天賦很高的學(xué)生如果缺乏適當(dāng)?shù)囊龑?dǎo),反而可能迷失方向。

研究團(tuán)隊(duì)還發(fā)現(xiàn),合理的獎(jiǎng)勵(lì)權(quán)重分配至關(guān)重要。他們將格式獎(jiǎng)勵(lì)設(shè)為0.1,執(zhí)行獎(jiǎng)勵(lì)設(shè)為0.3,各個(gè)性能檔次的獎(jiǎng)勵(lì)分別設(shè)為0.1到0.2不等。這種分配就像營養(yǎng)搭配:基礎(chǔ)技能(格式和執(zhí)行)占據(jù)了較大比重,確保AI首先掌握基本功,然后再追求更高的性能表現(xiàn)。

### 六、訓(xùn)練動(dòng)態(tài)的深度洞察:AI成長的軌跡

通過深入分析AI在訓(xùn)練過程中的表現(xiàn)變化,研究團(tuán)隊(duì)發(fā)現(xiàn)了許多有趣的現(xiàn)象,就像心理學(xué)家觀察兒童成長過程中的各種里程碑事件。這些發(fā)現(xiàn)不僅驗(yàn)證了SandMLE方法的有效性,更為我們理解AI的學(xué)習(xí)機(jī)制提供了寶貴的洞察。

訓(xùn)練過程中最顯著的現(xiàn)象是不同規(guī)模模型展現(xiàn)出的截然不同的學(xué)習(xí)軌跡。8B參數(shù)的小模型就像一個(gè)充滿好奇心但經(jīng)驗(yàn)不足的新手,在訓(xùn)練初期表現(xiàn)出明顯的不穩(wěn)定性。它的有效提交率在0.1到0.8之間大幅波動(dòng),就像初學(xué)者時(shí)好時(shí)壞的表現(xiàn)。但隨著訓(xùn)練的深入,這個(gè)模型逐漸找到了自己的節(jié)奏,表現(xiàn)趨于穩(wěn)定。

14B參數(shù)的中等模型則展現(xiàn)出更加均衡的發(fā)展軌跡,就像一個(gè)學(xué)習(xí)能力和穩(wěn)定性都比較均衡的學(xué)生。它能夠較快地達(dá)到較高的性能水平,但偶爾還會(huì)出現(xiàn)小的波動(dòng),需要時(shí)間來鞏固所學(xué)的技能。

最有趣的是30B參數(shù)的大模型。它就像一個(gè)天賦異稟的學(xué)生,不僅學(xué)習(xí)速度快,還能保持持續(xù)穩(wěn)定的高水平表現(xiàn)。在訓(xùn)練的后期階段,這個(gè)模型能夠維持接近完美的有效提交率,展現(xiàn)出了真正的"專家級"穩(wěn)定性。

訓(xùn)練獎(jiǎng)勵(lì)的變化曲線也透露出了重要信息。所有模型都展現(xiàn)出了清晰的上升趨勢,但上升的速度和最終達(dá)到的高度各不相同。大模型不僅起點(diǎn)更高,上升速度也更快,最終達(dá)到的性能天花板也更高。這個(gè)現(xiàn)象說明,模型規(guī)模的增加不僅帶來了更強(qiáng)的能力,也帶來了更高的學(xué)習(xí)效率。

驗(yàn)證獎(jiǎng)勵(lì)的變化更加平穩(wěn),這說明AI確實(shí)在學(xué)習(xí)真正有用的技能,而不是簡單地過度擬合訓(xùn)練數(shù)據(jù)。這就像一個(gè)學(xué)生不僅能在平時(shí)練習(xí)中表現(xiàn)優(yōu)異,在正式考試中也能維持同樣的水平。

訓(xùn)練過程中另一個(gè)重要發(fā)現(xiàn)是"技能習(xí)得的順序性"。AI首先掌握的是基本的格式規(guī)范,這相當(dāng)于學(xué)會(huì)了"說話的基本語法"。然后它們開始學(xué)習(xí)如何讓代碼成功運(yùn)行,這就像學(xué)會(huì)了"表達(dá)完整的意思"。最后才是學(xué)習(xí)如何優(yōu)化性能,達(dá)到專家級的水準(zhǔn)。

這種學(xué)習(xí)順序與人類專家的成長過程驚人地相似。新手程序員首先關(guān)注的是代碼能否運(yùn)行,然后才考慮效率和優(yōu)化。SandMLE訓(xùn)練出的AI自然地遵循了這種學(xué)習(xí)規(guī)律,說明這種訓(xùn)練方法確實(shí)抓住了技能學(xué)習(xí)的本質(zhì)規(guī)律。

### 七、實(shí)戰(zhàn)檢驗(yàn):真實(shí)世界中的表現(xiàn)

任何訓(xùn)練方法的最終價(jià)值都在于實(shí)戰(zhàn)表現(xiàn)。就像一個(gè)駕校培養(yǎng)的司機(jī)最終要在真實(shí)道路上接受考驗(yàn)一樣,經(jīng)過SandMLE訓(xùn)練的AI也需要在真實(shí)的機(jī)器學(xué)習(xí)工程任務(wù)中證明自己的能力。

研究團(tuán)隊(duì)選擇了兩個(gè)具有挑戰(zhàn)性的真實(shí)基準(zhǔn)測試:MLE-Bench-Lite和MLE-Dojo。這兩個(gè)測試就像AI界的"高考"和"研究生入學(xué)考試",涵蓋了從基礎(chǔ)技能到高級應(yīng)用的各個(gè)方面。測試任務(wù)都是真實(shí)的機(jī)器學(xué)習(xí)競賽項(xiàng)目,需要AI從頭開始分析數(shù)據(jù)、設(shè)計(jì)模型、優(yōu)化參數(shù)、生成最終結(jié)果。

在MLE-Bench-Lite測試中,SandMLE訓(xùn)練的AI展現(xiàn)出了壓倒性的優(yōu)勢。8B參數(shù)的模型獲得了22.7%的獎(jiǎng)牌率,這個(gè)成績已經(jīng)能夠匹敵一些大規(guī)模的商業(yè)AI系統(tǒng)。更令人驚訝的是,這些相對較小的模型在某些方面甚至超越了參數(shù)規(guī)模大它們幾倍的競爭對手。

14B和30B規(guī)模的模型表現(xiàn)更加出色,分別達(dá)到了22.7%和27.3%的獎(jiǎng)牌率。這些成績的含義非常重要:它們意味著AI已經(jīng)能夠在相當(dāng)比例的真實(shí)機(jī)器學(xué)習(xí)項(xiàng)目中達(dá)到獲獎(jiǎng)水平的表現(xiàn),這在傳統(tǒng)訓(xùn)練方法下是很難實(shí)現(xiàn)的。

更重要的是AI展現(xiàn)出的"全面發(fā)展"特征。傳統(tǒng)的AI往往在某些特定類型的任務(wù)上表現(xiàn)出色,但在其他任務(wù)上就力不從心。而SandMLE訓(xùn)練的AI在各種不同類型的任務(wù)上都保持了穩(wěn)定的高水平表現(xiàn),從圖像處理到文本分析,從回歸預(yù)測到分類識(shí)別,都展現(xiàn)出了專業(yè)級的能力。

在更具挑戰(zhàn)性的MLE-Dojo測試中,AI的表現(xiàn)同樣令人印象深刻。這個(gè)測試更加接近真實(shí)世界的工作環(huán)境,不僅要求AI具備技術(shù)能力,還要求它們能夠在有限的時(shí)間內(nèi)高效工作,處理各種意外情況。30B模型在這個(gè)測試中獲得了38.56的人類排名得分,這意味著它的表現(xiàn)超過了大約60%的人類參與者。

特別值得注意的是AI在"有效提交率"方面的表現(xiàn)。在許多情況下,傳統(tǒng)方法訓(xùn)練的AI雖然可能偶爾產(chǎn)生高質(zhì)量的結(jié)果,但經(jīng)常因?yàn)楦袷藉e(cuò)誤或執(zhí)行失敗而無法提交有效的答案。而SandMLE訓(xùn)練的AI在這方面表現(xiàn)出了高度的可靠性,大模型的有效提交率甚至達(dá)到了100%。

這種可靠性在實(shí)際應(yīng)用中的價(jià)值不可估量。一個(gè)偶爾表現(xiàn)出色但經(jīng)常出錯(cuò)的AI助手就像一個(gè)技術(shù)很好但經(jīng)常遲到的員工,在實(shí)際工作中很難被信任。而高可靠性的AI則能夠成為工程師真正依賴的工作伙伴。

### 八、規(guī)模效應(yīng)的啟示:大模型的獨(dú)特優(yōu)勢

在SandMLE的研究中,一個(gè)特別有趣的發(fā)現(xiàn)是不同規(guī)模模型展現(xiàn)出的差異化表現(xiàn)。這些差異不僅僅是性能數(shù)字上的不同,更反映了AI能力發(fā)展的內(nèi)在規(guī)律,就像觀察不同年齡段學(xué)生的學(xué)習(xí)特點(diǎn)一樣。

8B參數(shù)的小模型就像一個(gè)聰明但經(jīng)驗(yàn)不足的新手。它在訓(xùn)練初期經(jīng)常犯一些"低級錯(cuò)誤",比如生成格式不正確的代碼或者在簡單問題上卡住。但這個(gè)模型有一個(gè)重要優(yōu)勢:它敢于嘗試各種不同的解決策略,展現(xiàn)出了強(qiáng)烈的"探索精神"。雖然這種探索有時(shí)會(huì)導(dǎo)致失敗,但也正是這種勇于試錯(cuò)的特質(zhì)讓它能夠發(fā)現(xiàn)一些意想不到的解決方案。

14B參數(shù)的中等模型則更像一個(gè)經(jīng)驗(yàn)和能力都比較均衡的員工。它很少犯基礎(chǔ)性錯(cuò)誤,能夠穩(wěn)定地完成大部分任務(wù),同時(shí)還保持著一定的創(chuàng)新能力。這種模型在實(shí)際應(yīng)用中往往具有很高的實(shí)用價(jià)值,因?yàn)樗瓤煽坑植皇ъ`活性。

30B參數(shù)的大模型展現(xiàn)出了真正的"專家級"特征。最顯著的表現(xiàn)是它幾乎從訓(xùn)練開始就能產(chǎn)生格式正確的輸出,很少因?yàn)榛A(chǔ)錯(cuò)誤而失分。更重要的是,這個(gè)模型展現(xiàn)出了強(qiáng)大的"元學(xué)習(xí)"能力:它不僅能快速掌握具體的技能,還能理解不同技能之間的內(nèi)在聯(lián)系,能夠?qū)⒃谝粋€(gè)任務(wù)中學(xué)到的經(jīng)驗(yàn)遷移到其他相關(guān)任務(wù)中。

一個(gè)特別有趣的發(fā)現(xiàn)是關(guān)于"初始化策略"的影響。對于小模型,先進(jìn)行監(jiān)督學(xué)習(xí)預(yù)訓(xùn)練再進(jìn)行強(qiáng)化學(xué)習(xí)能夠顯著提升性能。這就像新手司機(jī)需要先在教練指導(dǎo)下學(xué)習(xí)基本操作,再獨(dú)自練習(xí)復(fù)雜技巧。但對于大模型,這種預(yù)訓(xùn)練的必要性就不那么明顯了,它們能夠直接通過強(qiáng)化學(xué)習(xí)掌握所有必要的技能。

這個(gè)現(xiàn)象揭示了一個(gè)重要規(guī)律:模型規(guī)模的增加不僅帶來了更強(qiáng)的表現(xiàn)能力,也帶來了更高的學(xué)習(xí)效率和更強(qiáng)的自主性。大模型就像天賦異稟的學(xué)生,能夠更快地理解復(fù)雜概念,更好地整合不同知識(shí)點(diǎn),也更少依賴外部指導(dǎo)。

研究團(tuán)隊(duì)還發(fā)現(xiàn)了一個(gè)有趣的"穩(wěn)定性遞增"現(xiàn)象。隨著模型規(guī)模的增加,AI的表現(xiàn)變得越來越穩(wěn)定。小模型的表現(xiàn)往往有較大波動(dòng),就像新手的發(fā)揮不夠穩(wěn)定。而大模型則能夠持續(xù)保持高水平的表現(xiàn),展現(xiàn)出了真正的"專業(yè)素養(yǎng)"。

這些發(fā)現(xiàn)對AI系統(tǒng)的實(shí)際部署具有重要意義。對于資源有限的應(yīng)用場景,中等規(guī)模的模型可能是最佳選擇,因?yàn)樗鼈冊诔杀竞托阅苤g達(dá)到了良好的平衡。而對于對可靠性要求極高的關(guān)鍵應(yīng)用,大模型則是不二選擇,盡管成本更高,但它們提供的穩(wěn)定性和準(zhǔn)確性是無可替代的。

### 九、技術(shù)創(chuàng)新的深層機(jī)制:為什么SandMLE如此有效

SandMLE系統(tǒng)的成功不是偶然的,它的背后有著深刻的技術(shù)創(chuàng)新和理論基礎(chǔ)。理解這些創(chuàng)新機(jī)制對于把握AI發(fā)展的未來方向具有重要意義。

首先是"微縮復(fù)制"的核心理念。傳統(tǒng)的機(jī)器學(xué)習(xí)訓(xùn)練面臨著一個(gè)根本矛盾:真實(shí)任務(wù)太復(fù)雜太耗時(shí),而簡化任務(wù)又缺乏真實(shí)性。SandMLE巧妙地解決了這個(gè)矛盾,它的方法就像制作精密的建筑模型:保持建筑的所有關(guān)鍵結(jié)構(gòu)特征和比例關(guān)系,但將整體規(guī)??s小到可以放在桌面上操作。

這種微縮并非簡單的數(shù)據(jù)削減,而是一個(gè)精心設(shè)計(jì)的"精華提取"過程。研究團(tuán)隊(duì)開發(fā)的多智能體生成系統(tǒng)能夠識(shí)別出真實(shí)任務(wù)中的核心挑戰(zhàn)元素:數(shù)據(jù)分布的復(fù)雜性、特征之間的非線性關(guān)系、各種現(xiàn)實(shí)噪聲的影響等等。然后在微縮版本中完整地重現(xiàn)這些挑戰(zhàn),確保AI在小規(guī)模環(huán)境中學(xué)到的技能能夠無縫遷移到大規(guī)模應(yīng)用中。

第二個(gè)關(guān)鍵創(chuàng)新是"合成數(shù)據(jù)的真實(shí)化"技術(shù)。傳統(tǒng)的合成數(shù)據(jù)往往過于理想化,就像教科書中的標(biāo)準(zhǔn)例題,與現(xiàn)實(shí)世界的復(fù)雜情況相去甚遠(yuǎn)。SandMLE的數(shù)據(jù)生成系統(tǒng)則更像一個(gè)經(jīng)驗(yàn)豐富的出題老師,不僅要確保問題有明確的答案,還要模擬各種可能在現(xiàn)實(shí)中遇到的干擾因素和邊界情況。

這個(gè)系統(tǒng)特別巧妙的地方在于它的"對抗性設(shè)計(jì)"思維。數(shù)據(jù)策略師不僅要生成訓(xùn)練數(shù)據(jù),還要主動(dòng)注入各種"困難因素":數(shù)據(jù)不平衡、特征噪聲、邊界案例等等。這就像一個(gè)嚴(yán)格的教練不僅要教學(xué)員基本動(dòng)作,還要模擬各種可能在比賽中遇到的困難情況。通過這種"魔鬼訓(xùn)練",AI獲得了更強(qiáng)的魯棒性和適應(yīng)能力。

第三個(gè)重要?jiǎng)?chuàng)新是"漸進(jìn)式評估體系"的設(shè)計(jì)。傳統(tǒng)評估就像期末考試,只看最終結(jié)果。而SandMLE采用了類似"過程性評價(jià)"的方法,將復(fù)雜的機(jī)器學(xué)習(xí)工程任務(wù)分解為多個(gè)可觀察、可評估的子目標(biāo)。這不僅為AI提供了更密集的學(xué)習(xí)信號(hào),也讓研究者能夠更好地理解AI的學(xué)習(xí)過程和能力發(fā)展軌跡。

這種評估體系的設(shè)計(jì)借鑒了教育心理學(xué)中的"最近發(fā)展區(qū)"理論。對于不同能力水平的AI,系統(tǒng)會(huì)自動(dòng)調(diào)整評估標(biāo)準(zhǔn)和獎(jiǎng)勵(lì)分布,確保每個(gè)AI都能在適合自己當(dāng)前水平的挑戰(zhàn)中獲得最大的學(xué)習(xí)效果。這就像一個(gè)優(yōu)秀的老師會(huì)根據(jù)學(xué)生的具體情況調(diào)整教學(xué)難度和評價(jià)標(biāo)準(zhǔn)。

第四個(gè)創(chuàng)新是"多樣性保證機(jī)制"。從60個(gè)種子任務(wù)擴(kuò)展到848個(gè)訓(xùn)練任務(wù),這個(gè)擴(kuò)展過程不是簡單的數(shù)量堆積,而是一個(gè)系統(tǒng)性的"變異和篩選"過程。系統(tǒng)會(huì)自動(dòng)確保生成的任務(wù)在難度分布、問題類型、數(shù)據(jù)特征等多個(gè)維度上保持合理的多樣性,避免AI陷入局部最優(yōu)或過度特化。

最后是"自適應(yīng)訓(xùn)練策略"的實(shí)現(xiàn)。不同于傳統(tǒng)的固定訓(xùn)練流程,SandMLE能夠根據(jù)AI當(dāng)前的能力水平和學(xué)習(xí)進(jìn)度自動(dòng)調(diào)整訓(xùn)練強(qiáng)度和重點(diǎn)。這就像一個(gè)智能的私人教練,會(huì)根據(jù)學(xué)員的體能狀況和訓(xùn)練目標(biāo)實(shí)時(shí)調(diào)整訓(xùn)練計(jì)劃。

這些創(chuàng)新機(jī)制的有機(jī)結(jié)合創(chuàng)造了一個(gè)前所未有的AI訓(xùn)練環(huán)境:既保持了真實(shí)世界任務(wù)的復(fù)雜性和挑戰(zhàn)性,又實(shí)現(xiàn)了高效的大規(guī)模訓(xùn)練,同時(shí)還具備了強(qiáng)大的泛化能力和適應(yīng)性。這正是SandMLE能夠在機(jī)器學(xué)習(xí)工程領(lǐng)域取得突破性成果的根本原因。

說到底,SandMLE的成功揭示了AI訓(xùn)練領(lǐng)域的一個(gè)重要趨勢:從簡單的模仿學(xué)習(xí)向真正的智能培養(yǎng)轉(zhuǎn)變。就像人類教育從死記硬背向能力培養(yǎng)轉(zhuǎn)變一樣,AI訓(xùn)練也正在從單純的數(shù)據(jù)擬合向綜合能力培養(yǎng)發(fā)展。Meta AI團(tuán)隊(duì)的這項(xiàng)研究為這種轉(zhuǎn)變提供了一個(gè)可行的技術(shù)路徑,也為AI助手真正融入人類的工作和生活開辟了新的可能性。

這種訓(xùn)練方式培養(yǎng)出的AI不僅僅是更好的工具,更像是具備了真正學(xué)習(xí)能力和適應(yīng)能力的智能伙伴。它們能夠在面對新問題時(shí)主動(dòng)思考,在遇到挫折時(shí)調(diào)整策略,在不同環(huán)境中發(fā)揮穩(wěn)定的作用。這樣的AI助手距離成為人類真正的工作伙伴又近了一步,也讓我們對人工智能的未來有了更多期待和想象空間。未來隨著這種訓(xùn)練方法的進(jìn)一步完善和推廣,我們很可能會(huì)看到更多領(lǐng)域中出現(xiàn)真正智能化的AI助手,它們不僅能夠完成預(yù)定的任務(wù),更能夠像經(jīng)驗(yàn)豐富的專家一樣,在復(fù)雜多變的現(xiàn)實(shí)環(huán)境中發(fā)揮創(chuàng)造性和適應(yīng)性。

Q&A

Q1:SandMLE是什么,它如何解決AI訓(xùn)練中的問題?

A:SandMLE是Meta AI開發(fā)的一個(gè)AI訓(xùn)練框架,專門用于培養(yǎng)機(jī)器學(xué)習(xí)工程能力。它的核心創(chuàng)新是創(chuàng)建"微型沙盒訓(xùn)練場",將真實(shí)的機(jī)器學(xué)習(xí)項(xiàng)目壓縮成只有50-200個(gè)樣本的小規(guī)模版本,但保持所有核心復(fù)雜性。這樣AI可以快速進(jìn)行大量試錯(cuò)練習(xí),訓(xùn)練效率提升13倍以上,讓AI首次能夠像真正的工程師一樣在實(shí)踐中學(xué)習(xí)和成長。

Q2:為什么傳統(tǒng)的AI訓(xùn)練方法在機(jī)器學(xué)習(xí)工程任務(wù)上效果不好?

A:傳統(tǒng)方法面臨"實(shí)踐成本過高"的根本問題。真實(shí)的機(jī)器學(xué)習(xí)工程任務(wù)需要處理大量數(shù)據(jù),每次試錯(cuò)都要花費(fèi)幾分鐘到幾小時(shí),讓AI無法進(jìn)行充分的實(shí)踐學(xué)習(xí)。就像讓學(xué)生只能在真實(shí)工廠里學(xué)習(xí)操作技能一樣,成本太高且風(fēng)險(xiǎn)太大。而且傳統(tǒng)方法主要靠模仿專家操作,缺乏真正的試錯(cuò)探索機(jī)會(huì),導(dǎo)致AI只會(huì)背誦流程,不具備獨(dú)立解決問題的能力。

Q3:經(jīng)過SandMLE訓(xùn)練的AI在實(shí)際應(yīng)用中表現(xiàn)如何?

A:表現(xiàn)非常出色且具有強(qiáng)大的適應(yīng)能力。在真實(shí)測試中,不同規(guī)模的模型性能提升了20.3%到66.9%不等,大規(guī)模模型甚至能超過60%的人類參與者。更重要的是,這些AI展現(xiàn)出了跨框架、跨領(lǐng)域的適應(yīng)能力,能在完全不同的工作環(huán)境中保持高水平表現(xiàn),就像真正的專家能夠在不同公司都發(fā)揮作用一樣。它們的可靠性也大幅提升,避免了傳統(tǒng)AI經(jīng)常出現(xiàn)的格式錯(cuò)誤和執(zhí)行失敗問題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
出海更難了!俄朝圖們江公路大橋合攏,預(yù)計(jì)今年6月正式通車

出海更難了!俄朝圖們江公路大橋合攏,預(yù)計(jì)今年6月正式通車

全城探秘
2026-04-22 16:41:13
我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
任澤平退款731萬,恒大高管們開始退錢了

任澤平退款731萬,恒大高管們開始退錢了

互聯(lián)網(wǎng)大觀
2026-04-22 13:44:17
伊朗“宮斗”分出勝負(fù)?12小時(shí)就改口要談判,改革派重新占據(jù)上風(fēng)

伊朗“宮斗”分出勝負(fù)?12小時(shí)就改口要談判,改革派重新占據(jù)上風(fēng)

民間胡扯老哥
2026-04-22 05:07:48
騰訊與阿里巴巴洽談投資DeepSeek 估值超過200億美元

騰訊與阿里巴巴洽談投資DeepSeek 估值超過200億美元

財(cái)聯(lián)社
2026-04-22 19:24:36
日艦闖臺(tái)海3天后,高市被逼辭職,岸田已扛旗,052D抵近奄美大島

日艦闖臺(tái)海3天后,高市被逼辭職,岸田已扛旗,052D抵近奄美大島

古事尋蹤記
2026-04-22 07:16:16
情侶約會(huì)求“刺激”,雙雙被抓,審訊時(shí)互相甩鍋

情侶約會(huì)求“刺激”,雙雙被抓,審訊時(shí)互相甩鍋

深圳晚報(bào)
2026-04-22 10:11:17
山西忻州市公務(wù)員局發(fā)布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

山西忻州市公務(wù)員局發(fā)布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

環(huán)球網(wǎng)資訊
2026-04-22 16:51:03
醫(yī)院的專家號(hào)剛放出就瞬間“秒空”,上海三甲醫(yī)院緊急報(bào)警!警方:對倒賣醫(yī)院號(hào)源犯罪團(tuán)伙的李某、鄭某等人依法刑事拘留

醫(yī)院的專家號(hào)剛放出就瞬間“秒空”,上海三甲醫(yī)院緊急報(bào)警!警方:對倒賣醫(yī)院號(hào)源犯罪團(tuán)伙的李某、鄭某等人依法刑事拘留

大風(fēng)新聞
2026-04-22 15:12:13
深度 |大限到期,一日之內(nèi)極限反轉(zhuǎn),特朗普為何延長?;穑恳晾蕿楹尾活I(lǐng)情?

深度 |大限到期,一日之內(nèi)極限反轉(zhuǎn),特朗普為何延長?;??伊朗為何不領(lǐng)情?

上觀新聞
2026-04-22 17:19:03
烏克蘭沒錢打俄羅斯了!國庫見底外援青黃不接,普通人積蓄一夜縮水民不聊生

烏克蘭沒錢打俄羅斯了!國庫見底外援青黃不接,普通人積蓄一夜縮水民不聊生

網(wǎng)易新聞出品
2026-04-22 18:42:46
朝鮮發(fā)聲痛批日本,要求日本向中國道歉:針對中國駐日使館的連環(huán)恐怖威脅,是對國際法的粗暴違反與公然挑釁

朝鮮發(fā)聲痛批日本,要求日本向中國道歉:針對中國駐日使館的連環(huán)恐怖威脅,是對國際法的粗暴違反與公然挑釁

大風(fēng)新聞
2026-04-22 18:42:23
央視曝光:“哪吒”造車3年虧損183億,多地國資投資難追回,倒貼式招商引資傷了誰?

央視曝光:“哪吒”造車3年虧損183億,多地國資投資難追回,倒貼式招商引資傷了誰?

新京報(bào)政事兒
2026-04-21 23:04:31
演員王大陸一審被判刑

演員王大陸一審被判刑

極目新聞
2026-04-22 12:35:08
高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計(jì)6月28日運(yùn)營

高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計(jì)6月28日運(yùn)營

新京報(bào)
2026-04-22 13:06:20
2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

天馬幸福的人生
2026-04-22 06:41:59
英雄航天員陳冬肩章已更為少將軍銜 系我國第二批航天員,在軌時(shí)長超400天

英雄航天員陳冬肩章已更為少將軍銜 系我國第二批航天員,在軌時(shí)長超400天

紅星新聞
2026-04-22 16:31:28
季后賽破5000分!杜蘭特復(fù)出23+6仍輸 下半場僅3分全場9失誤

季后賽破5000分!杜蘭特復(fù)出23+6仍輸 下半場僅3分全場9失誤

醉臥浮生
2026-04-22 13:17:43
爆料瘋傳!中南醫(yī)院“王護(hù)士長”被扒,她到底有沒有問題?

爆料瘋傳!中南醫(yī)院“王護(hù)士長”被扒,她到底有沒有問題?

墜入二次元的海洋
2026-04-22 10:14:47
5月1日起正式嚴(yán)打!8類灰色行為直接入刑,所有人務(wù)必警惕

5月1日起正式嚴(yán)打!8類灰色行為直接入刑,所有人務(wù)必警惕

另子維愛讀史
2026-04-22 07:39:03
2026-04-22 19:56:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
8088文章數(shù) 562關(guān)注度
往期回顧 全部

科技要聞

對話梅濤:沒有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

朝鮮發(fā)聲痛批日本 要求日本向中國道歉

頭條要聞

朝鮮發(fā)聲痛批日本 要求日本向中國道歉

體育要聞

網(wǎng)易傳媒再度簽約法國隊(duì)和阿根廷隊(duì)

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

家居
本地
親子
藝術(shù)
公開課

家居要聞

極簡繪夢 克制和諧

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

親子要聞

今起幼兒信息登記!登記后這兩樣保存好,后續(xù)報(bào)名都要用

藝術(shù)要聞

無花不風(fēng)景

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版