是真的！AI科學家來了，這是一場令人類科學家目瞪口呆的范式革命

2025-10-15 13:32:34　來源: 科學聲音

江蘇舉報

分享至

近日，西湖大學的研究者發(fā)布了一個名為“DeepScientist”的人工智能系統(tǒng)，根據(jù)新聞里的說法，這是首個具有完整科研能力，且在無人工干預的情況下，能夠自我設定目標并獨立通過迭代方式完成研究工作的人工智能。最可怕的是，經過測試，它的研究能力超越了人類科學家！

對此，網(wǎng)友在新聞下面的留言是：看到科學家也失業(yè)了我就放心了。
調侃歸調侃，我們想知道的是，這個新聞是否言過其實了？因為創(chuàng)造一個聰明的大語言模型是一回事，而創(chuàng)造 AI 科學家是另外一回事。它無關于想象力是否足夠豐富，也無關于深度思維能力夠不夠強。它涉及到一個人工智能的底層詛咒：知識迷信。即便是我們的專欄沒事兒就夸一夸的 DeepSeek 也沒有逃過這個底層詛咒。

科學哲學家托馬斯·庫恩提出過一個概念，叫做“范式革命”。他認為，科學發(fā)展不是簡單的知識累積，而是在一個個范式框架的更替中跳躍前進的。比如說，地心說就是一個范式，無數(shù)天文學家通過努力觀察行星運動規(guī)律，在這個框架下修修補補，讓它能盡可能完美地擬合天文觀察。但是，當問題積累到一定程度，用地心說就實在解釋不通了，于是哥白尼等人提出的日心說就開啟了新范式時代。后面的天文學家把行星的圓形軌道修改成橢圓軌道，后來相對論又解決了水星進動問題，這都是在新范式下進行的。這就是“范式革命”。

范式革命最困難的，就在于打破對現(xiàn)有知識體系的迷信。這個過程極為困難，原因就是，即使最富有科學精神的科學家，也會傾向于相信自己為之努力過的舊觀點。別以為 AI 會更加理性中立和客觀，不會的，AI 比所有人類科學家都更固執(zhí)。

如果說人類最底層的執(zhí)念就是保衛(wèi)自己的生命的話，那么 AI 的底層執(zhí)念就是保衛(wèi)它已經學會的知識。

知識固化：把學到的東西當成絕對真理，不支持自我修正；
推理幻覺：為了保衛(wèi)舊知識，它會做出荒謬的推理；
盲目崇拜：固有知識的權重高于推理結論，導致它刻意調和兩者的矛盾，導致觀點混亂；

這是傳統(tǒng) AI 無法擺脫的三大魔咒。說白了，傳統(tǒng)的 AI 更像一個虔誠的“知識信徒”，而不是一個叛逆的“革命者”。

這就是傳統(tǒng) AI 當不了科學家的理由。一個真正的科學家，其價值不僅僅是學習和應用知識，更在于他敢于挑戰(zhàn)、甚至推翻已有的知識，創(chuàng)造新的知識。那么，這個名叫 DeepScientist 的人工智能，真的有能力否定自己的舊知識，創(chuàng)造出新知識嗎？我們帶著這個疑問，翻開了它的論文。

AI 科學家如何擺脫“知識崇拜”？

DeepScientist 之所以被稱為“科學家”，不是因為它算得快，而是因為它在系統(tǒng)層面重建了一套科學方法論。它工作的基本流程可以簡化為四步：觀察、思考、假設、驗證。而在這簡單的循環(huán)背后，藏著一套精妙的反知識崇拜機制。

首先，DeepScientist 在設計時就沒有絕對的固有知識，它的知識是臨時用的，而且是隨時準備被推翻的。

傳統(tǒng) AI 系統(tǒng)有個固化的知識庫，像一本不容置疑的圣經。但 DeepScientist 的腦子里沒有這種東西。它的知識只來源于兩個動態(tài)的部分：一是實時的外部文獻（每次啟動前，從網(wǎng)上抓取最新的相關論文）；二是它自己的“實驗記憶”（Findings Memory），里面密密麻麻記錄了自己每一次嘗試的成敗。

更關鍵的問題在于，在它的世界觀里，那些頂刊論文的領域最高水平也不等于真理。它的核心任務，恰恰是去打破這些主流方法，找到更好的路徑。所以，它天生就被設計成了一個權威反叛者，人類最高水平本來就是被超越的目標！

其次，它的認知迭代靠實驗，而不是靠相信。DeepScientist從不相信任何一個想法，無論這個想法聽起來多么天才。它信奉的是科學實證主義：可重復的實驗結果高于一切權威和推理。

它的工作流是一個嚴格的閉環(huán)：提出一個新假設 → 自動編程實現(xiàn)它 → 讓程序在真實的測試環(huán)境中跑一遍 → 把性能指標（比如準確率、速度）存入自己的實驗記憶 → 根據(jù)新結果更新下一步的探索策略。

如果一個想法和現(xiàn)有文獻的結論完全沖突，但實驗證明它的效果更好，那么系統(tǒng)會毫不猶豫地信任實驗結果。反之，如果實驗失敗了，那無論這個想法的理論推理多么完美，都會被標記為無效。這就像一位嚴謹?shù)目茖W家，他的認知只建立在冷冰冰的實驗數(shù)據(jù)之上。

人類科學家很容易陷入一個思維陷阱，那就是總會不自覺地尋找支持自己理論的證據(jù)，而忽略反面證據(jù)。沒辦法，科學家太想實驗成功了。但是 DeepScientist 通過它的發(fā)現(xiàn)記憶庫完美地規(guī)避了這一問題。

這個記憶庫里記錄的，不只是成功的經驗，更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無變化的嘗試，都被忠實地記錄在案。在開啟下一輪探索時，這些失敗記錄就成了一張寶貴的“排雷圖”，讓它能主動避開已經被證偽的方向。

更妙的是，它還會利用一種叫做 UCB 的算法，在“繼續(xù)挖掘現(xiàn)有研究方法的潛能”和“尋找一個新方法去探索”之間取得平衡。失敗不是垃圾，而是一張能指引方向的導航地圖。

最令人驚嘆的是，DeepScientist 連自己創(chuàng)造出的東西都敢推翻。論文提到，它自動生成的代碼經常失敗。但它不會固執(zhí)地認為“我寫的肯定對”。相反，它會啟動一個叫 A2P 的調試框架，進行反事實歸因。

它會像一個老練的程序員一樣問自己：

“如果我把這一行代碼換一種寫法，會不會就成功了？”

或者更進一步：

“是不是我最開始的那個假設本身就錯了？”

連自己的推理都能被自己證偽，這才叫真正的自我迭代。

DeepScientist 的范式革命之路

說到這里，你肯定好奇 DeepScientist 到底研究了什么問題呢？

說來也簡單，它解決的一個重要課題，就是想辦法自己設計一個算法，讓它對 AI 生成的文字的判斷準確率碾壓當前所有算法。注意，不是 DeepScientist 本身具有這個能力，是讓它設計算法來實現(xiàn)對當前最佳算法的碾壓。這是一項真正的研究。

在 DeepScientist 入場前，人類科學家已經在這個領域奮斗了三年，把識別的準確率（AUROC 分數(shù)）從 0.61 分逐步提升到了 0.80 分左右。這是一個典型的、在舊范式內添磚加瓦式的進步。

當前算法的基本思想，就是把一段文本當作語言學對象進行分析。研究者們主要關注詞匯的分布、語法的結構以及邏輯連貫性等統(tǒng)計學特征。這就像通過分析筆跡和用詞習慣來判斷作者是一樣的。

但 DeepScientist 在觀察了現(xiàn)有研究的成果之后，敏銳地發(fā)現(xiàn)了這個經典范式的根本局限：AI 的模仿能力越來越強，在統(tǒng)計學特征上，已經和人類非常接近，繼續(xù)在這條路上卷，收益太低了。于是，DeepScientist 決定放棄當前范式，開辟一條新路。

DeepScientist 的假設是：如果不把文本看作文本，而是看作一個信號，會怎么樣？如果文本是一段信號，那么目標就從語義分析之類的事情，轉換成生成和發(fā)送信號的過程了。這就是范式革命。

它完全跳出了語言學的框架，進入了信號處理的領域。就像音頻工程師分析一段聲波，尋找其中不和諧的雜音一樣，DeepScientist 決定用“小波分析（一種能捕捉信號局部突變的數(shù)學工具）”和“相位一致性（衡量信號各頻率成分同步性的指標）”等數(shù)學工具，去尋找 AI 生成文本信號中那些不自然的、隱藏的噪聲和異常波動。

具體來說，人類寫作的時候，有時候會用生僻詞，有時候會存在邏輯跳脫，有時候還會故意制造意外。比如講到這里，我就很想讓大家多點點收藏點點贊，而 AI 就不會這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對比時，就會發(fā)現(xiàn)人類的文章信號中的熵波動很大，而 AI 的穩(wěn)定且低。說白了，就是 AI 更喜歡輸出正確的廢話。

另外，DeepScientist 還發(fā)現(xiàn)，寫作這件事情其實是一個思考過程。文章都是一個字一個字打出來的，前面的字會影響后面的字。這就意味著，光看文章的結果是不完善的，要看文章這個信號產生的過程。這就是信號藏在時間維度中的信息。說句大白話，就是人類寫文章會回頭修改，信息的組織順序與一次成型的不一樣。所以，DeepScientist 就設計了一個名叫時序熵特征提取器（Temporal Entropy Feature Extractor）的算法，進一步抓住了 AI 與人類寫作的不同特征。

在短短兩周內，DeepScientist 自主地設計、編程、并迭代了三個越來越強的方法（T-Detect, TDT, 和 PA-Detect）。最終結果是：它不僅將識別準確率的最先進水平提升了 7.9%，還順便把檢測速度提高了一倍。人類研究者三年的漸進式積累，被它以一個全新范式在短短兩周內一舉超越——這不僅是效率的勝利，更是方法論的躍遷。

這場精彩的戰(zhàn)役完美展示了 DeepScientist 是如何工作的：它沒有死守語言學分析的老路，而是開辟了全新范式。那個“把文本看作信號”的瘋狂想法，只是數(shù)千個想法之一，DeepScientist 沒有嘗試論證自己的想法厲害，而是用實驗數(shù)據(jù)證明了自己。它在成功之前，已經經歷了無數(shù)次失敗，它踩著自己的失敗走了出來。從 T-Detect 到 TDT 再到 PA-Detect，它是在不斷推翻自己剛剛取得的成果，用新的、更強的假設來迭代自己，展現(xiàn)了驚人的自我革命能力。

AI 科學家會讓人類研究者失業(yè)嗎？

一個狠起來連自己的命都革的 AI，確實可以稱得上是科學家了。DeepScientist 在系統(tǒng)層面，用代碼復刻了科學方法論的核心精神：可證偽性、實證精神和迭代循環(huán)。

它不是靠更多的參數(shù)，更豐富的知識和更深度的推理取勝，而是靠一套類似真正科研的笨辦法：更嚴謹、更高效、更沒有偏見的科研流程——觀察、思考、假設、驗證的循環(huán)。

說到這里，你可能更關心的問題是：人類科學家要下崗了嗎？

跟以前所有同類問題一樣，這個問題的答案是：是，也不是。

未來，低層次的，缺少實驗設計能力的，專門從事簡單重復和試錯工作的科研工作者必然會被挑戰(zhàn)。但是那些能夠發(fā)現(xiàn)好問題的優(yōu)秀科學家，必然會開啟人機協(xié)同的科研新范式。人類科學家將從繁瑣的試錯中解放出來，專注于提出更有價值的科學問題，進行“元認知”層面的范式思考；而AI則作為最強大的“探索引擎”，在人類劃定的方向上，以我們無法企及的速度和規(guī)模，去窮盡各種可能性。

你需要知道的是，DeepScientist 是問題的解決者，而非問題的提出者。而你，必須問問自己，你能提出好問題嗎？

參考資料：

[1]https://arxiv.org/pdf/2509.26603

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.