国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI能寫代碼卻算不對(duì)小學(xué)乘法,大模型缺陷曝光

0
分享至

哈嘍,大家好,我是小今。這篇來(lái)聊聊AI的奇怪反差:能寫復(fù)雜代碼卻算不對(duì)小學(xué)乘法?這背后藏著大模型的致命短板!你敢信?

能幫程序員寫復(fù)雜代碼、給研究員做邏輯推理的頂尖AI大模型,面對(duì)小學(xué)四年級(jí)水平的四位數(shù)乘法題,正確率居然不到1%?這不是網(wǎng)上的搞笑段子,而是芝加哥大學(xué)牽頭的科研團(tuán)隊(duì)實(shí)打?qū)嵉难芯堪l(fā)現(xiàn),連麻省理工、哈佛的研究者還有谷歌DeepMind的專家都參與了這項(xiàng)研究,成果已經(jīng)發(fā)布在arXiv預(yù)印本服務(wù)器上。





“偏科”AI的怪象:崎嶇的前沿

研究團(tuán)隊(duì)把這種奇特的現(xiàn)象叫做“崎嶇前沿”,特別形象。你可以想象一個(gè)學(xué)生,奧數(shù)題能拿國(guó)際金牌,但簡(jiǎn)單的加減乘除卻頻頻出錯(cuò),簡(jiǎn)直就是個(gè)“偏科怪才”。我們的AI大模型就像這個(gè)學(xué)生,在需要大量數(shù)據(jù)模式識(shí)別和復(fù)雜推理的任務(wù)中表現(xiàn)卓越,可一旦遇到需要精確、一步步來(lái)、環(huán)環(huán)相扣的基礎(chǔ)數(shù)學(xué)運(yùn)算,它就徹底歇菜了。

更讓人不解的是,無(wú)論是只有兩層的“小”模型,還是結(jié)構(gòu)復(fù)雜、參數(shù)龐大的十二層“大”模型,在這種基礎(chǔ)乘法題上都無(wú)一幸免,集體“翻車”。這表明問(wèn)題并非出在模型大小上,而是更深層次的根本性缺陷。那么,究竟是什么讓AI擁有了“高智商低情商”般的算術(shù)能力呢?





忘性大?AI的“長(zhǎng)程依賴”困境

其實(shí),核心問(wèn)題出在AI的“記性”上,或者說(shuō),它在處理任務(wù)時(shí),無(wú)法有效“記住中間步驟”。用專業(yè)術(shù)語(yǔ)講,這叫“長(zhǎng)程依賴”問(wèn)題。

回想我們小時(shí)候?qū)W乘法,比如讓你算3876乘以5214。我們是不是得先算3876乘以4,得出第一個(gè)部分積,然后記下進(jìn)位,接著算3876乘以10(其實(shí)是乘以1),把第二個(gè)部分積寫下來(lái),再記住進(jìn)位,依此類推,直到算出所有部分積。

最后,我們會(huì)把這些暫時(shí)存放在腦子里或草稿紙上的中間結(jié)果,一步步累加起來(lái),才能得出最終的答案。這個(gè)“暫存中間信息,并在后續(xù)步驟中持續(xù)調(diào)用”的能力,就是我們?nèi)祟惤鉀Q乘法問(wèn)題的關(guān)鍵,也是“長(zhǎng)程依賴”的最好體現(xiàn)。乘法運(yùn)算環(huán)環(huán)相扣,每一步的計(jì)算都緊密依賴前面的中間結(jié)果和進(jìn)位,漏掉一步,或者記錯(cuò)了任何一個(gè)中間值,最終結(jié)果就可能謬之千里。



但面對(duì)乘法這種需要嚴(yán)格按照邏輯鏈條一步步推進(jìn)、精確計(jì)算中間結(jié)果并持續(xù)依賴的任務(wù),光靠“找規(guī)律”就徹底抓瞎了。它無(wú)法像我們一樣,在“腦子”里建立一個(gè)臨時(shí)的“草稿紙”,用來(lái)存儲(chǔ)和調(diào)用這些關(guān)鍵的中間信息。





陷入“局部最優(yōu)解”的泥潭

更糟糕的是,標(biāo)準(zhǔn)的AI訓(xùn)練方法,還常常會(huì)讓模型陷入一種“局部最優(yōu)解”的困境。你可以想象你在爬山,想找這座山的最高峰,結(jié)果你爬到一個(gè)小土坡,以為那就是山頂了,于是就在這個(gè)小土坡上反復(fù)打轉(zhuǎn),再怎么努力,也永遠(yuǎn)到不了真正的最高峰。

AI也是如此。在訓(xùn)練乘法時(shí),它可能學(xué)會(huì)了一些“表面規(guī)律”,比如某些數(shù)字的組合偶爾會(huì)對(duì)應(yīng)某個(gè)結(jié)果,但它并沒(méi)有掌握乘法背后的真正邏輯。它在這些“小土坡”上反復(fù)優(yōu)化,殊不知,真正的“高峰”需要完全不同的攀登路徑,也就是需要一套能夠處理中間信息和邏輯依賴的機(jī)制。

所以,即便我們把模型做得再大,訓(xùn)練時(shí)間再長(zhǎng),只要它的架構(gòu)上不支持存儲(chǔ)和調(diào)用中間信息,乘法題它還是算不對(duì)。這就像給一個(gè)沒(méi)有“計(jì)算器”功能的大腦,塞再多的數(shù)據(jù),它也無(wú)法完成復(fù)雜的計(jì)算。





曙光乍現(xiàn):ICoT與AI的“邏輯復(fù)蘇”

不過(guò),研究團(tuán)隊(duì)并沒(méi)有止步于發(fā)現(xiàn)問(wèn)題,他們也帶來(lái)了解決之道!他們開(kāi)發(fā)了一種名為“隱式思維鏈”(ICoT,Implicit Chain of Thought)的訓(xùn)練方法。用這種方法訓(xùn)練出來(lái)的模型,在四位數(shù)乘法上的準(zhǔn)確率竟然能達(dá)到驚人的100%!這簡(jiǎn)直是奇跡!

為了弄明白ICoT為什么如此有效,團(tuán)隊(duì)仔細(xì)對(duì)比了用ICoT訓(xùn)練的模型和標(biāo)準(zhǔn)模型,就像給AI做了一次深度腦部解剖,結(jié)果發(fā)現(xiàn)了三個(gè)關(guān)鍵性的差異,揭示了AI如何從“算數(shù)盲”變身為“數(shù)學(xué)天才”的秘密。



第一個(gè)也是最關(guān)鍵的差異是,ICoT模型竟然“學(xué)會(huì)了做筆記”!它能清晰地追蹤乘法過(guò)程中的所有中間信息,比如每一步的部分積、進(jìn)位數(shù)字。研究人員甚至可以從模型的內(nèi)部狀態(tài)里,直接“讀”出這些關(guān)鍵的中間值,就像從一份整潔的草稿紙上查看步驟一樣。

而標(biāo)準(zhǔn)模型呢?這些信息早就混成一團(tuán),根本無(wú)法辨認(rèn)。這就像一個(gè)學(xué)霸做數(shù)學(xué)題,每一步都寫得清清楚楚,而學(xué)渣則全靠腦子記,結(jié)果腦子一團(tuán)漿糊,最終答案自然天差地別。ICoT幫助AI重建了記憶的鏈條,讓它不再“忘事”。



這種有條理的分工協(xié)作,讓信息處理變得高效有序。反觀標(biāo)準(zhǔn)模型,它的注意力是混亂的,東看一眼,西記一下,根本無(wú)法有效組織和處理信息。



最令人拍案叫絕的,是第三個(gè)差異:ICoT模型竟然在訓(xùn)練過(guò)程中“無(wú)師自通”,自己發(fā)明了一套高效的計(jì)算工具!它沒(méi)有把數(shù)字僅僅當(dāng)作是符號(hào),而是把數(shù)字編碼成了類似波形的模式,并且還使用了一種叫做“閔可夫斯基和”的幾何方法來(lái)計(jì)算乘法。

請(qǐng)注意,這些能力可不是研究人員一行行代碼寫進(jìn)去教它的,而是模型在訓(xùn)練過(guò)程中,為了解決乘法問(wèn)題,自己慢慢摸索、涌現(xiàn)出來(lái)的!這簡(jiǎn)直就像AI為了完成任務(wù),自己創(chuàng)造了一套“數(shù)學(xué)語(yǔ)言”和計(jì)算方法,其自主學(xué)習(xí)和創(chuàng)新的潛力,令人嘆為觀止。





簡(jiǎn)單的改動(dòng),巨大的飛躍:未來(lái)的希望

基于這些突破性的發(fā)現(xiàn),研究團(tuán)隊(duì)還給出了一個(gè)簡(jiǎn)單得令人難以置信的修復(fù)方案:給標(biāo)準(zhǔn)模型的訓(xùn)練過(guò)程,僅僅加一個(gè)小小的目標(biāo),讓它學(xué)會(huì)追蹤每一步的累加總和,把中間值和部分積傳遞下去。就這么一個(gè)看似微不足道的小改動(dòng),原本正確率不到1%的雙層模型,準(zhǔn)確率直接飆升到了99%!

而且,還不用額外教一步步推理的方法。更厲害的是,經(jīng)過(guò)這樣訓(xùn)練的模型,甚至自己摸索出了新的計(jì)算策略,比如能夠同時(shí)處理多個(gè)數(shù)字對(duì)的乘法,大大提高了效率。

這說(shuō)明,有時(shí)候解決AI難題,并不需要堆砌更多的數(shù)據(jù)或更大的模型,而是需要找到那個(gè)關(guān)鍵的“引導(dǎo)點(diǎn)”,輕輕撥動(dòng)一下,就能觸發(fā)它潛藏的巨大潛能。





告別“野路子”:AI的未來(lái)在于邏輯與記憶

或許有人會(huì)說(shuō),不就是個(gè)乘法題嗎,犯得著這么較真?但這項(xiàng)研究的意義,遠(yuǎn)不止讓AI會(huì)算乘法那么簡(jiǎn)單。它像一面鏡子,照出了整個(gè)AI行業(yè)的一個(gè)深層誤區(qū):我們不能盲目地認(rèn)為模型越大、訓(xùn)練數(shù)據(jù)越多,AI的能力就一定越強(qiáng)。



牽頭這項(xiàng)研究的譚晨浩教授一針見(jiàn)血地指出,現(xiàn)在AI越來(lái)越多地參與到關(guān)鍵決策中,所以搞懂它到底是怎么學(xué)習(xí)、怎么“思考”的,比它能做什么,有時(shí)候更重要。這項(xiàng)研究的核心價(jià)值在于告訴我們:想讓AI真正變強(qiáng),關(guān)鍵不是一味地堆參數(shù)、堆數(shù)據(jù),而是要給它正確的“引導(dǎo)”,在架構(gòu)上支持它的記憶和邏輯能力。

這相當(dāng)于在提醒我們,AI在數(shù)學(xué)問(wèn)題上之所以表現(xiàn)不穩(wěn)定,是因?yàn)樗恢庇谩罢乙?guī)律”這種“野路子”去解決需要嚴(yán)格邏輯推理的問(wèn)題,就像一個(gè)廚師試圖用錘子去切菜。未來(lái)的AI系統(tǒng),可能需要把“記憶”和“邏輯運(yùn)算”這兩種能力區(qū)分開(kāi)來(lái),分別給它們提供更專門的支持,才能從根本上解決“能寫代碼卻算不對(duì)乘法”的尷尬。

這項(xiàng)研究為AI的發(fā)展指明了一個(gè)新的方向:與其盲目地追求模型規(guī)模的“高大上”,不如先把AI最基礎(chǔ)的“記憶和邏輯能力”打磨好。畢竟,一個(gè)連基礎(chǔ)乘法都搞不定的AI,你讓它去處理再?gòu)?fù)雜的推理任務(wù),里面也可能藏著巨大的隱患。只有打好地基,大廈才能真正穩(wěn)固。



聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美軍沒(méi)有政委,為什么能把軍隊(duì)管得服服帖帖?

美軍沒(méi)有政委,為什么能把軍隊(duì)管得服服帖帖?

扶蘇聊歷史
2026-01-06 15:25:46
此人乃開(kāi)國(guó)大將,6子3將軍2副主席1副部長(zhǎng),虎父無(wú)犬子

此人乃開(kāi)國(guó)大將,6子3將軍2副主席1副部長(zhǎng),虎父無(wú)犬子

莫地方
2025-10-23 15:01:51
完勝!奎因成遼粵大戰(zhàn)主角,賽前諷刺,賽中挑釁球迷,賽后也嘲諷

完勝!奎因成遼粵大戰(zhàn)主角,賽前諷刺,賽中挑釁球迷,賽后也嘲諷

鄒維體育
2026-01-11 21:34:40
又上頭了!后場(chǎng)新星要是在最后時(shí)刻留在場(chǎng)上,馬刺估計(jì)要輸球了?

又上頭了!后場(chǎng)新星要是在最后時(shí)刻留在場(chǎng)上,馬刺估計(jì)要輸球了?

稻谷與小麥
2026-01-12 01:00:16
給2025年最好的10部動(dòng)作片排個(gè)名:《匿殺》第7,《捕風(fēng)追影》第2

給2025年最好的10部動(dòng)作片排個(gè)名:《匿殺》第7,《捕風(fēng)追影》第2

皮皮電影
2026-01-04 09:50:59
讓人倒吸一口涼氣:烏軍3個(gè)旅反攻俄軍2個(gè)軍:24小時(shí)竟打進(jìn)市中心

讓人倒吸一口涼氣:烏軍3個(gè)旅反攻俄軍2個(gè)軍:24小時(shí)竟打進(jìn)市中心

瞳哥視界
2025-12-24 21:36:08
留給大清的時(shí)間,真的不多了

留給大清的時(shí)間,真的不多了

我是歷史其實(shí)挺有趣
2026-01-03 08:50:37
被低估的世界級(jí)后衛(wèi)!年僅22歲讓姆皇成背景板,未來(lái)十年防線無(wú)憂

被低估的世界級(jí)后衛(wèi)!年僅22歲讓姆皇成背景板,未來(lái)十年防線無(wú)憂

銳評(píng)利物浦
2026-01-11 23:58:59
炸裂!曼聯(lián)世界級(jí)巨星或?qū)㈦x隊(duì),阿莫林下課成導(dǎo)火索?

炸裂!曼聯(lián)世界級(jí)巨星或?qū)㈦x隊(duì),阿莫林下課成導(dǎo)火索?

奶蓋熊本熊
2026-01-11 03:11:54
410次開(kāi)房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開(kāi)房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報(bào)
2025-12-14 22:36:54
為啥說(shuō)不要隨便介入他人因果?網(wǎng)友:幫人介紹對(duì)象算嘛

為啥說(shuō)不要隨便介入他人因果?網(wǎng)友:幫人介紹對(duì)象算嘛

帶你感受人間冷暖
2026-01-12 00:10:11
不要聽(tīng)他們說(shuō)什么,要看他們?cè)趺醋觯?>
    </a>
        <h3>
      <a href=胖胖說(shuō)他不胖
2026-01-09 11:00:09
許利民發(fā)布會(huì)怒懟隊(duì)員:吊兒郎當(dāng)沒(méi)責(zé)任感 輸?shù)氖侨溯數(shù)氖潜本┬蜗?>
    </a>
        <h3>
      <a href=818體育
2026-01-11 23:28:09
表面“黃花大閨女”,背地卻偷偷生子的4位女星,最后一個(gè)想不到

表面“黃花大閨女”,背地卻偷偷生子的4位女星,最后一個(gè)想不到

青史樓蘭
2026-01-04 09:24:27
沒(méi)錢還硬裝?寧夏一笑成名拒絕百萬(wàn)簽約的小女孩,現(xiàn)在成了這樣

沒(méi)錢還硬裝?寧夏一笑成名拒絕百萬(wàn)簽約的小女孩,現(xiàn)在成了這樣

不寫散文詩(shī)
2026-01-11 19:40:42
我國(guó)癌癥高發(fā),電飯煲是“幫兇”?提醒:4種省錢行為確實(shí)要不得

我國(guó)癌癥高發(fā),電飯煲是“幫兇”?提醒:4種省錢行為確實(shí)要不得

DrX說(shuō)
2026-01-09 14:21:49
曬曬我在宜家買的8件“小破爛”,我承認(rèn),用之前小瞧了它們

曬曬我在宜家買的8件“小破爛”,我承認(rèn),用之前小瞧了它們

美家指南
2026-01-09 15:36:19
倒閉率達(dá)43%,多地門店跑路!曾月入5萬(wàn)的躺賺行業(yè),現(xiàn)也扛不住了

倒閉率達(dá)43%,多地門店跑路!曾月入5萬(wàn)的躺賺行業(yè),現(xiàn)也扛不住了

財(cái)經(jīng)八卦
2025-12-17 20:32:35
李昊2次神撲!國(guó)足1-0贏澳大利亞,2輪4分領(lǐng)跑,誕生5個(gè)不可思議

李昊2次神撲!國(guó)足1-0贏澳大利亞,2輪4分領(lǐng)跑,誕生5個(gè)不可思議

球場(chǎng)沒(méi)跑道
2026-01-11 21:44:20
石宇奇衛(wèi)冕失??!第2局1-6退賽,3國(guó)分4金,國(guó)羽2冠3亞收官!

石宇奇衛(wèi)冕失??!第2局1-6退賽,3國(guó)分4金,國(guó)羽2冠3亞收官!

劉姚堯的文字城堡
2026-01-11 16:58:24
2026-01-12 01:48:49
最終你成為了過(guò)客
最終你成為了過(guò)客
最終你成為了過(guò)客
173文章數(shù) 187關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

體育要聞

U23國(guó)足形勢(shì):末輪不負(fù)泰國(guó)即確保晉級(jí)

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣平臺(tái)"燒錢搶存量市場(chǎng)"迎來(lái)終局?

汽車要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

時(shí)尚
健康
家居
教育
軍事航空

當(dāng)一個(gè)57歲的女人,決定從零開(kāi)始

這些新療法,讓化療不再那么痛苦

家居要聞

木色留白 演繹現(xiàn)代自由

教育要聞

ai時(shí)代下貝校家長(zhǎng)在用ai輔導(dǎo)孩子

軍事要聞

俄大使:馬杜羅夫婦被控制時(shí)身邊沒(méi)人

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版