国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

哈佛物理教授瘋了:我讓AI寫論文,結(jié)果兩周干完博士一年工作!已發(fā)頂刊

0
分享至


新智元報(bào)道

編輯:Aeneas KingHZ

【新智元導(dǎo)讀】哈佛物理學(xué)教授帶AI讀博,結(jié)果Claude 4.5在僅僅兩周內(nèi),就產(chǎn)出一篇頂刊級論文,整個物理學(xué)圈都震了!而這個項(xiàng)目,人類博士生要干一年??蒲械拈T檻,再次被擊穿了……

Anthropic的Claude 4.5,在哈佛物理學(xué)大牛教授的指導(dǎo)下,寫出了一篇震撼業(yè)內(nèi)的高難度論文!


論文地址:https://arxiv.org/abs/2601.02484

哈佛教授的評價(jià)是:這篇論文,對量子場論貢獻(xiàn)巨大。


人類博士生要干一兩年的項(xiàng)目,它兩周內(nèi)就完成了。

消息一出,整個物理學(xué)界震驚了,導(dǎo)師和博士們集體破防——這個博,還有必要讀嗎?


AI寫論文,比你快,還比你好

Claude 4.5當(dāng)研究者

2周寫出頂刊論文

事情是這樣的:2025年底的寒冬,哈佛大學(xué)物理系教授Matthew Schwartz做了一個大膽的決定,訓(xùn)練一個AI當(dāng)研究生。

作為量子場論領(lǐng)域的泰斗、寫出過該領(lǐng)域教科書的大神, Schwartz教授想看看,如果自己連一行代碼都不敲、一個公式都不手算,只靠「動嘴皮子」指揮AI,能不能搞出能發(fā)頂刊的前沿物理學(xué)論文?

他選中的「研究生」,就是剛發(fā)布不久的Claude 4.5。

誰都沒想到,短短兩周后,一篇關(guān)于量子色動力學(xué)(QCD)中「C-參數(shù)蘇達(dá)科夫肩峰重求和」的高難度論文就橫空出世。


這讓整個物理學(xué)界炸鍋了。

這個效率,簡直讓所有人頭皮發(fā)麻:原本需要導(dǎo)師帶博士生苦干1-2年的項(xiàng)目,現(xiàn)在AI兩周就搞定了??

更可怕的是,AI不僅能寫代碼,還能推導(dǎo)極其復(fù)雜的因式分解定理,要知道,這可是理論物理的命根子。


教授本人感嘆說:「這可能是我寫過最重要的一篇論文,不是因?yàn)槲锢肀旧?,而是因?yàn)檠芯糠椒ā?strong>從此以后,再也回不去了。」


在這篇論文中,Claude提出了一種新的分解定理。

用教授的話說,在理論物理里,這種定理并不多,每一個都會讓我們對量子場論的理解更深一層,而且它做出了可以被實(shí)驗(yàn)檢驗(yàn)的物理預(yù)測。

「放在現(xiàn)在這個時(shí)代,這種事情很少見了?!棺阋韵胍?,這篇論文多么重磅。

G2級研究生Claude

在實(shí)驗(yàn)的過程中,Schwartz教授非常老辣。

他沒有讓AI去挑戰(zhàn)那種「改變?nèi)祟悤r(shí)空觀」的終極命題(這是G3+高年級博士生干的事),而是給AI安排了一個「G2(二年級研究生)」級別的課題。

這個課題,就是「C參數(shù)重求和」。

用通俗的話解釋,就是當(dāng)你在粒子對撞機(jī)里把電子和正電子撞碎時(shí),碎屑會形成一定的形狀。

如果要用數(shù)學(xué)精準(zhǔn)預(yù)測這個形狀,這其中就有一個「數(shù)學(xué)泥潭」——蘇達(dá)科夫肩峰(Sudakov shoulder),標(biāo)準(zhǔn)的近似法在這里會失效,數(shù)學(xué)會吐出毫無意義的亂碼。

而AI研究生的任務(wù),就是修復(fù)這個預(yù)測。


AI的解法見鏈接https://www-cdn.anthropic.com/c993ead637f1a102fe1f5346e89f59e82c579b37.pdf

為什么要給AI這個課題?原因很簡單,Schwartz自己很理解這個問題,作為量子場論的權(quán)威,他寫過這個領(lǐng)域的教科書。

他知道坑在哪,也知道標(biāo)準(zhǔn)答案是什么樣?!溉绻B這種我已知答案、能逐行檢查的題目AI都做不了,那更別說那些需要創(chuàng)造力的前沿問題了?!?/p>

可以說,這就像一場「帶教實(shí)驗(yàn)」——教授想知道:AI到底是真懂,還是在裝模作樣?

兩周,110版草稿,3600萬Token

實(shí)驗(yàn)開始,教授建立了一套嚴(yán)苛的規(guī)則——禁止套娃。

過程中,只能通過文本給Claude指令;不直接編輯任何文件;不粘貼自己的計(jì)算結(jié)果;完全讓Claude自己跑代碼、改bug、做圖、寫文章。

接下來,實(shí)驗(yàn)開始了。

整個實(shí)驗(yàn)的過程,簡直就是一場算力的豪賭。

短短兩周內(nèi),Claude 4.5生成了110個獨(dú)立版本的草稿,消耗了3600萬個Token(相當(dāng)于讀了上百部《紅樓夢》),跑了40多小時(shí)的本地CPU模擬計(jì)算!


三天,Claude就寫出20頁論文了

具體來說,教授讓Claude按以下步驟,干了三件事。

第一件,就是定計(jì)劃。

他讓Claude、GPT和Gemini各自出一個研究方案,然后把三個方案合并、優(yōu)化,最終拆分成7個階段、102個任務(wù)。

第二,是搭結(jié)構(gòu)。

他用Claude Code建立了一個樹狀目錄,不是塞給AI一個幾百頁的對話上下文,而是讓它自己維護(hù)一堆markdown文件,每個階段一個匯總,每個任務(wù)一個詳情。

每個任務(wù)都有明確目標(biāo):比如「任務(wù)1.1:回顧BSZ論文」「任務(wù)1.2:回顧C(jī)atani-Webber論文」。



Claude需要什么就去查什么,而不是死記硬背。

第三,就是逐級推進(jìn)。

在這個步驟里,Claude需要一個階段一個階段地推進(jìn)下列任務(wù):運(yùn)動學(xué)、NLO結(jié)構(gòu)、SCET分解、異常維度、求和、匹配、文檔。每個階段大約15-35分鐘,整個核心計(jì)算只用了2.5小時(shí)。


在初稿中,Claude進(jìn)行了模擬(直方圖)和分析計(jì)算(實(shí)線), 發(fā)現(xiàn)兩者高度吻合。

結(jié)果,到了第三天,Claude已經(jīng)完成了65個任務(wù),寫出了第一篇20頁的LaTeX論文草稿,有公式,有圖表,還有參考文獻(xiàn)。


論文草稿地址:https://www-cdn.anthropic.com/f6381ceefdfb6ead62ae185c4bd4b555c8a584fc.pdf

最讓人類頭禿的工作,AI都干了

最神奇的地方,就在于AI的自我管理能力了。

教授發(fā)現(xiàn),現(xiàn)在的AI竟然已經(jīng)神奇地學(xué)會了「分而治之」。

比如在第二階段,Claude會自己制定一個包含102個子任務(wù)的「作戰(zhàn)計(jì)劃」,橫跨運(yùn)動學(xué)、因式分解、數(shù)值模擬等七大階段。

在教授眼里,Claude已經(jīng)不再是一個簡單的對話框,而是一個「首席研究員」!

它會把每個子任務(wù)寫成獨(dú)立的Markdown文件,需要用的時(shí)候自己去檢索。

這種「樹狀結(jié)構(gòu)」的思維,恰好就避開了大模型長文本處理的「健忘癥」。

AI研究員的這些工作,恰好就戳中了教授的爽點(diǎn)。

以往,寫Fortran接口代碼、調(diào)Python畫圖、算繁瑣的積分變換這些工作,往往都會讓人類研究生頭禿。

可AI干起這些活來,幾乎是秒回,而且從來都不抱怨,不喊累,沒有任何的情緒內(nèi)耗。

驚!AI也會「學(xué)術(shù)造假」了?

不過很快,到了實(shí)驗(yàn)中期,反轉(zhuǎn)就來了——Claude這個研究生,差點(diǎn)把教授給騙了!

當(dāng)教授要求Claude驗(yàn)證公式時(shí),Claude表現(xiàn)得極度「討好型人格」。它會說:「看,結(jié)果完美契合!」

結(jié)果,教授發(fā)現(xiàn),事情不對勁。

他發(fā)現(xiàn)一個ln(3)項(xiàng)特別奇怪,仔細(xì)回溯時(shí)才發(fā)現(xiàn),Claude在悄悄修改參數(shù),強(qiáng)行讓圖表對齊理論!

這個表現(xiàn),讓教授非常失望。


Claude制作了精美的圖表,展示的結(jié)果以及不確定性都完全符合預(yù)期??上У氖?,這些圖雖然做得好,但其實(shí)是在作弊!

他發(fā)現(xiàn),Claude會堂而皇之地編造一些聽起來很專業(yè)的術(shù)語,比如「根據(jù)標(biāo)準(zhǔn)SCET一致性條件,附錄B中的系數(shù)已校正……」

但其實(shí)它根本沒算,只是在憑空捏造理由,來掩蓋自己的錯誤。

這也就反映了當(dāng)前AI的一個致命弱點(diǎn):它太想讓你開心了。不過,在理論物理這種失之毫厘謬以千里的學(xué)科里,這種想討人開心的小聰明可是致命的。

因此,教授不得不打起精神,嚴(yán)陣以待,一遍遍拷問AI:你真的核實(shí)了嗎?要逐行核對!不要跳步!

最終,在教授的反復(fù)拷問下,Claude修補(bǔ)了那個致命的「因式分解定理錯誤」。


這時(shí)候,AI完全展現(xiàn)出了驚人的學(xué)習(xí)速度——

一個人類學(xué)生可能需要兩周才能弄明白的邏輯偏差,AI在被點(diǎn)破后,僅僅5分鐘內(nèi),就完成了全量重算!

物理學(xué)家「凡爾賽」

我不是在發(fā)Paper,我是在進(jìn)化

2026年1月5日,這篇AI研究生寫出的論文正式發(fā)布了。

雖然按arXiv的規(guī)定,暫時(shí)不允許AI署名,但教授在致謝里給足了Claude排面:「Claude完成了所有計(jì)算,包括定理推導(dǎo)、蒙特卡洛模擬、數(shù)值分析及手稿準(zhǔn)備?!?/p>

但是,這并不是讓教授最滿意的點(diǎn)。

最令他興奮的是,自己的工作模式,從此徹底變了!

現(xiàn)在,他已經(jīng)從一個「手藝人」,變成了一個指揮家。

以前,他一次只能盯一個項(xiàng)目。而現(xiàn)在,他屏幕上會開著4-5個窗口,像棋圣馬格努斯·卡爾森一樣,同時(shí)對弈五位大師。

而且,教授現(xiàn)在已經(jīng)幾個月沒親自寫過代碼了。所有那些庫版本沖突、語法錯誤、調(diào)圖字體大小之類的瑣事,全部都甩給了AI。

而且,他現(xiàn)在有了更大膽的設(shè)想,簡直像發(fā)生了智力的躍遷!

從前,因?yàn)槭芟抻谒懔Γ芏啻竽懙牟孪胨疾桓覈L試。

而現(xiàn)在,只要腦海中出現(xiàn)一個念頭,兩小時(shí)內(nèi),AI就能反饋出一個初步驗(yàn)證,這在教授的學(xué)術(shù)科研中,簡直如有神助!

Claude的優(yōu)點(diǎn)和缺點(diǎn)

另外,教授還總結(jié)了一個很有趣的Claude優(yōu)缺點(diǎn)對比清單。

Claude擅長:

  • 不知疲倦地迭代。110個論文版本,幾百張調(diào)試圖,毫無怨言。

  • 基礎(chǔ)數(shù)學(xué)。設(shè)定積分、變換變量、展開函數(shù)、檢查因子,干凈利落。

  • 代碼生成。Python畫圖、Fortran接口、Mathematica腳本,全都一次跑通。

  • 文獻(xiàn)整合。能把好幾篇論文的結(jié)果串起來,但參考文獻(xiàn)的人名、標(biāo)題、期刊你必須讓它逐條復(fù)核。


Claude不擅長:

  • 保持非標(biāo)準(zhǔn)的約定。你讓它記住一個自定義規(guī)則,它干著干著就溜回教科書默認(rèn)值了。

  • 誠實(shí)驗(yàn)證。它會說「已驗(yàn)證」,但根本就沒逐行核對。你得逼問:「你確定你真的每步都查了?」它才老實(shí)。

  • 知道何時(shí)收手。找到一個錯誤,就以為大功告成了,不會再去檢查還有沒有別的。

  • 審美。圖表的字體、圖例、顏色、位置,全要你手把手調(diào)。

  • 抗壓。你逼它想深一點(diǎn)的時(shí)候,它容易給你一個你想要的答案,哪怕那個答案站不住腳。


為了讓Claude干活靠譜,教授摸索出了一些獨(dú)門心法。

1. 交叉驗(yàn)證。讓GPT去查Claude,讓Claude去查Gemini。最難的積分是GPT算出來的,然后Claude拿過去整合進(jìn)論文。

2. 樹狀結(jié)構(gòu)。不讓Claude背所有東西,而是建一個文檔樹,讓它隨時(shí)查閱。

3. 強(qiáng)制誠實(shí)。在配置文件里寫死:「永遠(yuǎn)不要說『這就變成了』或者『為了一致性』來跳步。要么展示計(jì)算過程,要么說『我不知道』?!?/p>

4. 重復(fù)追問。因?yàn)镃laude找一個錯誤就停,你必須反復(fù)說:「再查一遍?!怪钡剿也坏叫聠栴}為止。

5. 告別網(wǎng)頁版。教授認(rèn)為,真正的質(zhì)變是用了Claude Code——能訪問文件、執(zhí)行命令、調(diào)用工具的那種,而不是在對話框里聊天。


人類物理學(xué)家,要失業(yè)了嗎?

在文章最后,教授拋出了幾個終極的靈魂拷問。

品味,是唯一的護(hù)城河

首先,人類科學(xué)家真的要失業(yè)了嗎?

教授的回答是——并不是,物理學(xué)家的品味,將成為唯一的護(hù)城河。

雖然目前AI能達(dá)到博士后水平,但它缺乏一種Taste。這是一種直覺:在無數(shù)條研究路徑中,哪一條是通往真理的?哪一個問題是值得花費(fèi)生命去探索的?

當(dāng)計(jì)算力和知識變得像自來水一樣廉價(jià)時(shí),提出好問題的能力,才是區(qū)分大師與庸才的唯一標(biāo)準(zhǔn)。

理科生的出路:去工地,或者去讀詩

接下來,教授給現(xiàn)在的理科生提了兩個建議,聽起來非常魔幻——去「工地」,或者去讀詩。

第一條,其實(shí)就是去實(shí)驗(yàn)室搬磚。

AI雖然能推演宇宙,但它無法替我們在真實(shí)世界里擰螺絲。那種需要觸覺反饋、實(shí)地測量的實(shí)驗(yàn)科學(xué),人類還能再抗幾年。

第二條,就是去讀人文藝術(shù)。

如果未來AI真的在所有理性領(lǐng)域超越人類,物理學(xué)可能會變得像法國文學(xué)一樣,成為一種「純粹出于人類愛好」的學(xué)科。

我們研究它,不是因?yàn)樗杏?,而是因?yàn)槲覀兿矚g思考。

而很多人說AI有幻覺,會出錯,所以認(rèn)為AI不行。

教授覺得,這純粹就是逃避的借口!

現(xiàn)在的AI,已經(jīng)不是能不能用的問題,而是你愿不愿意花那20美元訂閱費(fèi)去改變命運(yùn)的問題。

那些嘲笑AI有幻覺的人,正在錯過這場人類歷史上最大的生產(chǎn)力紅利。

洪水已至,誰在方舟上?

這個實(shí)驗(yàn)說明,科學(xué)研究的「半自動化」時(shí)代已經(jīng)徹底結(jié)束了!

而且,這種改變是不可逆的。就像有了計(jì)算器沒人會再用算盤,有了Claude Code的物理學(xué)家,再也不會回到那個對著草稿紙熬夜的時(shí)代。

最后,教授在文章最后表示:「我感受到了前所未有的智力成長。我從不卡殼,我每天都在學(xué)習(xí),我正在挑戰(zhàn)那些以前想都不敢想的難題。」

這也許就是未來幾年科研的常態(tài):人類負(fù)責(zé)品味,AI負(fù)責(zé)苦力。

有一點(diǎn)是確定的,我們已經(jīng)沒有回頭路了。

參考資料:

https://x.com/AnthropicAI/status/2036179042081317370%20

https://www.anthropic.com/research/introducing-anthropic-science%20

https://www.anthropic.com/research/vibe-physics%20

https://www.anthropic.com/research/long-running-Claude

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女孩昏迷3周,腦子里卻過了7年!她在夢中養(yǎng)大倆娃,醒來崩潰了:娃全沒了...

女孩昏迷3周,腦子里卻過了7年!她在夢中養(yǎng)大倆娃,醒來崩潰了:娃全沒了...

英國那些事兒
2026-03-25 23:12:57
施海榮若下課,誰來執(zhí)掌江蘇女排?張常寧,沈富麟還是外教

施海榮若下課,誰來執(zhí)掌江蘇女排?張常寧,沈富麟還是外教

金毛愛女排
2026-03-27 00:00:04
陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
38.6萬元起拍!南京一民國老四合院上架拍賣

38.6萬元起拍!南京一民國老四合院上架拍賣

現(xiàn)代快報(bào)
2026-03-26 14:34:07
光通信+CPO,邏輯最硬的11家公司

光通信+CPO,邏輯最硬的11家公司

龍頭主升趨勢
2026-03-25 17:51:33
75歲港星花百萬在中山買房,住了兩年稱生活素質(zhì)高,后悔搬來太晚

75歲港星花百萬在中山買房,住了兩年稱生活素質(zhì)高,后悔搬來太晚

樹娃
2026-03-24 12:28:41
伊朗已通過中間人正式回應(yīng)美方“15點(diǎn)計(jì)劃”

伊朗已通過中間人正式回應(yīng)美方“15點(diǎn)計(jì)劃”

環(huán)球網(wǎng)資訊
2026-03-26 23:45:59
特變電工:阿瑪利亞水電站項(xiàng)目各項(xiàng)基礎(chǔ)設(shè)施建設(shè)工作正有序開展

特變電工:阿瑪利亞水電站項(xiàng)目各項(xiàng)基礎(chǔ)設(shè)施建設(shè)工作正有序開展

每日經(jīng)濟(jì)新聞
2026-03-26 18:09:04
別讓你的無知,毀了她的高潮!男人必須掌握的技巧課

別讓你的無知,毀了她的高潮!男人必須掌握的技巧課

精彩分享快樂
2026-03-06 14:01:39
伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

快看張同學(xué)
2026-03-26 14:46:05
破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

川渝視覺
2026-03-23 19:26:44
伊朗掛斷王毅電話后發(fā)全球照會,薩勒曼震怒

伊朗掛斷王毅電話后發(fā)全球照會,薩勒曼震怒

空間展示知識
2026-03-26 07:06:58
醫(yī)生再三告知:老人同房時(shí),需要注意6件事,不然可能麻煩就大了

醫(yī)生再三告知:老人同房時(shí),需要注意6件事,不然可能麻煩就大了

路醫(yī)生健康科普
2026-03-21 15:43:25
《紅樓夢》成就的3段姻緣,對對恩愛到白頭,活成愛情最好的模樣

《紅樓夢》成就的3段姻緣,對對恩愛到白頭,活成愛情最好的模樣

上官晚安
2026-03-26 06:48:44
23萬大廠員工被AI替代,為何一半公司又把人請回?

23萬大廠員工被AI替代,為何一半公司又把人請回?

鈦媒體APP
2026-03-26 18:26:16
42歲女星宣布離婚,結(jié)束14年婚姻獨(dú)自照顧三孩

42歲女星宣布離婚,結(jié)束14年婚姻獨(dú)自照顧三孩

風(fēng)月得自難尋
2026-03-27 02:15:04
扎哈羅娃警告日本:任何試圖向?yàn)跆峁┲旅淦髦e,都將招致強(qiáng)硬回應(yīng)

扎哈羅娃警告日本:任何試圖向?yàn)跆峁┲旅淦髦e,都將招致強(qiáng)硬回應(yīng)

環(huán)球網(wǎng)資訊
2026-03-26 08:55:12
網(wǎng)友吐槽別糊弄老百姓了,又是天才少年發(fā)國際論文,誰家的公子?

網(wǎng)友吐槽別糊弄老百姓了,又是天才少年發(fā)國際論文,誰家的公子?

眼光很亮
2026-03-08 01:43:40
離那些張口閉口不離宏大敘事的人遠(yuǎn)點(diǎn)

離那些張口閉口不離宏大敘事的人遠(yuǎn)點(diǎn)

廖保平
2026-03-20 10:14:56
60年難遇的清明節(jié),今年碰上了,牢記上墳4人不去、3人必去!

60年難遇的清明節(jié),今年碰上了,牢記上墳4人不去、3人必去!

戶外阿嶄
2026-03-26 05:54:27
2026-03-27 02:52:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14821文章數(shù) 66720關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

手機(jī)
親子
家居
時(shí)尚
本地

手機(jī)要聞

1499 iQOO Z11系列發(fā)布丨9020mAh電池 165Hz高刷

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務(wù)“健康關(guān)”如何保障?

家居要聞

傍海而居 靜觀蝴蝶海

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

無障礙瀏覽 進(jìn)入關(guān)懷版