国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

是真的!AI科學家來了,這是一場令人類科學家目瞪口呆的范式革命

0
分享至

近日,西湖大學的研究者發(fā)布了一個名為“DeepScientist”的人工智能系統(tǒng),根據(jù)新聞里的說法,這是首個具有完整科研能力,且在無人工干預的情況下,能夠自我設定目標并獨立通過迭代方式完成研究工作的人工智能。最可怕的是,經過測試,的研究能力超越了人類科學家!

對此,網(wǎng)友在新聞下面的留言是:看到科學家也失業(yè)了我就放心了。
調侃歸調侃,我們想知道的是,這個新聞是否言過其實了?因為創(chuàng)造一個聰明的大語言模型是一回事,而創(chuàng)造 AI 科學家是另外一回事。它無關于想象力是否足夠豐富,也無關于深度思維能力夠不夠強。它涉及到一個人工智能的底層詛咒:知識迷信。即便是我們的專欄沒事兒就夸一夸的 DeepSeek 也沒有逃過這個底層詛咒。

科學哲學家托馬斯·庫恩提出過一個概念,叫做“范式革命”。他認為,科學發(fā)展不是簡單的知識累積,而是在一個個范式框架的更替中跳躍前進的。比如說,地心說就是一個范式,無數(shù)天文學家通過努力觀察行星運動規(guī)律,在這個框架下修修補補,讓它能盡可能完美地擬合天文觀察。但是,當問題積累到一定程度,用地心說就實在解釋不通了,于是哥白尼等人提出的日心說就開啟了新范式時代。后面的天文學家把行星的圓形軌道修改成橢圓軌道,后來相對論又解決了水星進動問題,這都是在新范式下進行的。這就是“范式革命”。

范式革命最困難的,就在于打破對現(xiàn)有知識體系的迷信。這個過程極為困難,原因就是,即使最富有科學精神的科學家,也會傾向于相信自己為之努力過的舊觀點。別以為 AI 會更加理性中立和客觀,不會的,AI 比所有人類科學家都更固執(zhí)。

如果說人類最底層的執(zhí)念就是保衛(wèi)自己的生命的話,那么 AI 的底層執(zhí)念就是保衛(wèi)它已經學會的知識。

  • 知識固化:把學到的東西當成絕對真理,不支持自我修正;
  • 推理幻覺:為了保衛(wèi)舊知識,它會做出荒謬的推理;
  • 盲目崇拜:固有知識的權重高于推理結論,導致它刻意調和兩者的矛盾,導致觀點混亂;

這是傳統(tǒng) AI 無法擺脫的三大魔咒。說白了,傳統(tǒng)的 AI 更像一個虔誠的“知識信徒”,而不是一個叛逆的“革命者”。

這就是傳統(tǒng) AI 當不了科學家的理由。一個真正的科學家,其價值不僅僅是學習和應用知識,更在于他敢于挑戰(zhàn)、甚至推翻已有的知識,創(chuàng)造新的知識。那么,這個名叫 DeepScientist 的人工智能,真的有能力否定自己的舊知識,創(chuàng)造出新知識嗎?我們帶著這個疑問,翻開了它的論文。

AI 科學家如何擺脫“知識崇拜”?

DeepScientist 之所以被稱為“科學家”,不是因為它算得快,而是因為它在系統(tǒng)層面重建了一套科學方法論。它工作的基本流程可以簡化為四步:觀察、思考、假設、驗證。而在這簡單的循環(huán)背后,藏著一套精妙的反知識崇拜機制。

首先,DeepScientist 在設計時就沒有絕對的固有知識,它的知識是臨時用的,而且是隨時準備被推翻的。

傳統(tǒng) AI 系統(tǒng)有個固化的知識庫,像一本不容置疑的圣經。但 DeepScientist 的腦子里沒有這種東西。它的知識只來源于兩個動態(tài)的部分:一是實時的外部文獻(每次啟動前,從網(wǎng)上抓取最新的相關論文);二是它自己的“實驗記憶”(Findings Memory),里面密密麻麻記錄了自己每一次嘗試的成敗。

更關鍵的問題在于,的世界觀里,那些頂刊論文的領域最高水平也不等于真理。它的核心任務,恰恰是去打破這些主流方法,找到更好的路徑。所以,它天生就被設計成了一個權威反叛者,人類最高水平本來就是被超越的目標!

其次,它的認知迭代靠實驗,而不是靠相信。DeepScientist從不相信任何一個想法,無論這個想法聽起來多么天才。它信奉的是科學實證主義:可重復的實驗結果高于一切權威和推理。

它的工作流是一個嚴格的閉環(huán):提出一個新假設 → 自動編程實現(xiàn)它 → 讓程序在真實的測試環(huán)境中跑一遍 → 把性能指標(比如準確率、速度)存入自己的實驗記憶 → 根據(jù)新結果更新下一步的探索策略。

如果一個想法和現(xiàn)有文獻的結論完全沖突,但實驗證明它的效果更好,那么系統(tǒng)會毫不猶豫地信任實驗結果。反之,如果實驗失敗了,那無論這個想法的理論推理多么完美,都會被標記為無效。這就像一位嚴謹?shù)目茖W家,他的認知只建立在冷冰冰的實驗數(shù)據(jù)之上。

人類科學家很容易陷入一個思維陷阱,那就是總會不自覺地尋找支持自己理論的證據(jù),而忽略反面證據(jù)。沒辦法,科學家太想實驗成功了。但是 DeepScientist 通過它的發(fā)現(xiàn)記憶庫完美地規(guī)避了這一問題。

這個記憶庫里記錄的,不只是成功的經驗,更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無變化的嘗試,都被忠實地記錄在案。在開啟下一輪探索時,這些失敗記錄就成了一張寶貴的“排雷圖”,讓它能主動避開已經被證偽的方向。

更妙的是,它還會利用一種叫做 UCB 的算法,在“繼續(xù)挖掘現(xiàn)有研究方法的潛能”和“尋找一個新方法去探索”之間取得平衡。失敗不是垃圾,而是一張能指引方向的導航地圖。

最令人驚嘆的是,DeepScientist 連自己創(chuàng)造出的東西都敢推翻。論文提到,它自動生成的代碼經常失敗。但它不會固執(zhí)地認為“我寫的肯定對”。相反,它會啟動一個叫 A2P 的調試框架,進行反事實歸因。

它會像一個老練的程序員一樣問自己:

“如果我把這一行代碼換一種寫法,會不會就成功了?”

或者更進一步:

“是不是我最開始的那個假設本身就錯了?”

連自己的推理都能被自己證偽,這才叫真正的自我迭代。

DeepScientist 的范式革命之路

說到這里,你肯定好奇 DeepScientist 到底研究了什么問題呢?

說來也簡單,它解決的一個重要課題,就是想辦法自己設計一個算法,讓它對 AI 生成的文字的判斷準確率碾壓當前所有算法。注意,不是 DeepScientist 本身具有這個能力,是讓它設計算法來實現(xiàn)對當前最佳算法的碾壓。這是一項真正的研究。

在 DeepScientist 入場前,人類科學家已經在這個領域奮斗了三年,把識別的準確率(AUROC 分數(shù))從 0.61 分逐步提升到了 0.80 分左右 。這是一個典型的、在舊范式內添磚加瓦式的進步。

當前算法的基本思想,就是把一段文本當作語言學對象進行分析。研究者們主要關注詞匯的分布、語法的結構以及邏輯連貫性等統(tǒng)計學特征。這就像通過分析筆跡和用詞習慣來判斷作者是一樣的。

但 DeepScientist 在觀察了現(xiàn)有研究的成果之后,敏銳地發(fā)現(xiàn)了這個經典范式的根本局限:AI 的模仿能力越來越強,在統(tǒng)計學特征上,已經和人類非常接近,繼續(xù)在這條路上卷,收益太低了。于是,DeepScientist 決定放棄當前范式,開辟一條新路。

DeepScientist 的假設是:如果不把文本看作文本,而是看作一個信號,會怎么樣?如果文本是一段信號,那么目標就從語義分析之類的事情,轉換成生成和發(fā)送信號的過程了。這就是范式革命。

它完全跳出了語言學的框架,進入了信號處理的領域。就像音頻工程師分析一段聲波,尋找其中不和諧的雜音一樣,DeepScientist 決定用“小波分析(一種能捕捉信號局部突變的數(shù)學工具)”和“相位一致性(衡量信號各頻率成分同步性的指標)”等數(shù)學工具,去尋找 AI 生成文本信號中那些不自然的、隱藏的噪聲和異常波動。

具體來說,人類寫作的時候,有時候會用生僻詞,有時候會存在邏輯跳脫,有時候還會故意制造意外。比如講到這里,我就很想讓大家多點點收藏點點贊,而 AI 就不會這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對比時,就會發(fā)現(xiàn)人類的文章信號中的熵波動很大,而 AI 的穩(wěn)定且低。說白了,就是 AI 更喜歡輸出正確的廢話。

另外,DeepScientist 還發(fā)現(xiàn),寫作這件事情其實是一個思考過程。文章都是一個字一個字打出來的,前面的字會影響后面的字。這就意味著,光看文章的結果是不完善的,要看文章這個信號產生的過程。這就是信號藏在時間維度中的信息。說句大白話,就是人類寫文章會回頭修改,信息的組織順序與一次成型的不一樣。所以,DeepScientist 就設計了一個名叫時序熵特征提取器(Temporal Entropy Feature Extractor)的算法,進一步抓住了 AI 與人類寫作的不同特征。

在短短兩周內,DeepScientist 自主地設計、編程、并迭代了三個越來越強的方法(T-Detect, TDT, 和 PA-Detect)。最終結果是:它不僅將識別準確率的最先進水平提升了 7.9%,還順便把檢測速度提高了一倍 。人類研究者三年的漸進式積累,被它以一個全新范式在短短兩周內一舉超越——這不僅是效率的勝利,更是方法論的躍遷。

這場精彩的戰(zhàn)役完美展示了 DeepScientist 是如何工作的:它沒有死守語言學分析的老路,而是開辟了全新范式。那個“把文本看作信號”的瘋狂想法,只是數(shù)千個想法之一,DeepScientist 沒有嘗試論證自己的想法厲害,而是用實驗數(shù)據(jù)證明了自己。它在成功之前,已經經歷了無數(shù)次失敗,它踩著自己的失敗走了出來。從 T-Detect 到 TDT 再到 PA-Detect,它是在不斷推翻自己剛剛取得的成果,用新的、更強的假設來迭代自己,展現(xiàn)了驚人的自我革命能力。

AI 科學家會讓人類研究者失業(yè)嗎?

一個狠起來連自己的命都革的 AI,確實可以稱得上是科學家了。DeepScientist 在系統(tǒng)層面,用代碼復刻了科學方法論的核心精神:可證偽性、實證精神和迭代循環(huán)。

它不是靠更多的參數(shù),更豐富的知識和更深度的推理取勝,而是靠一套類似真正科研的笨辦法:更嚴謹、更高效、更沒有偏見的科研流程——觀察、思考、假設、驗證的循環(huán)。

說到這里,你可能更關心的問題是:人類科學家要下崗了嗎?

跟以前所有同類問題一樣,這個問題的答案是:是,也不是。

未來,低層次的,缺少實驗設計能力的,專門從事簡單重復和試錯工作的科研工作者必然會被挑戰(zhàn)。但是那些能夠發(fā)現(xiàn)好問題的優(yōu)秀科學家,必然會開啟人機協(xié)同的科研新范式。人類科學家將從繁瑣的試錯中解放出來,專注于提出更有價值的科學問題,進行“元認知”層面的范式思考;而AI則作為最強大的“探索引擎”,在人類劃定的方向上,以我們無法企及的速度和規(guī)模,去窮盡各種可能性。

你需要知道的是,DeepScientist 是問題的解決者,而非問題的提出者。而你,必須問問自己,你能提出好問題嗎?

參考資料:

[1]https://arxiv.org/pdf/2509.26603

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
深圳大勝1-0浙江:賀希寧32+5總分升隊史第二 史密斯27+9

深圳大勝1-0浙江:賀希寧32+5總分升隊史第二 史密斯27+9

醉臥浮生
2026-05-07 22:00:41
秋千墜亡女子身后排隊游客發(fā)聲:該女子同行朋友開玩笑稱“沒綁緊”嚇唬她,事發(fā)后其朋友一直哭泣,深感愧疚

秋千墜亡女子身后排隊游客發(fā)聲:該女子同行朋友開玩笑稱“沒綁緊”嚇唬她,事發(fā)后其朋友一直哭泣,深感愧疚

洪觀新聞
2026-05-07 14:44:22
三年套現(xiàn)15億,賣掉摩拜單車的創(chuàng)始人胡瑋煒,竟然活成了這樣!

三年套現(xiàn)15億,賣掉摩拜單車的創(chuàng)始人胡瑋煒,竟然活成了這樣!

青眼財經
2026-05-07 22:06:34
硅谷大轉向,一個極其危險的信號出現(xiàn)了

硅谷大轉向,一個極其危險的信號出現(xiàn)了

新浪財經
2026-05-07 09:45:54
京圈大佬飯局爆猛料:陳冠?,F(xiàn)在,根本瞧不上內娛這三瓜倆棗

京圈大佬飯局爆猛料:陳冠?,F(xiàn)在,根本瞧不上內娛這三瓜倆棗

西樓知趣雜談
2026-05-07 12:40:04
皇馬激烈沖突細節(jié)曝光!巴爾韋德撞桌出血 拒絕握手+爆鏟楚阿梅尼

皇馬激烈沖突細節(jié)曝光!巴爾韋德撞桌出血 拒絕握手+爆鏟楚阿梅尼

奧拜爾
2026-05-07 22:22:52
女孩體驗“懸崖秋千”墜亡,曾有網(wǎng)友3月預言“一年內準出事”......

女孩體驗“懸崖秋千”墜亡,曾有網(wǎng)友3月預言“一年內準出事”......

新民周刊
2026-05-07 17:31:40
1800萬存銀行被員工“轉走炒股”,最新進展:吉林農商銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

1800萬存銀行被員工“轉走炒股”,最新進展:吉林農商銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

洪觀新聞
2026-05-07 14:33:26
萬萬沒料到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

萬萬沒料到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

童叔不飆車
2026-05-08 01:31:29
5月6日,注定是要被寫進金融史的一天

5月6日,注定是要被寫進金融史的一天

識局Insight
2026-05-07 14:22:01
網(wǎng)傳山西大同訂婚強奸案男主出獄后發(fā)文:一天刑期未減,因我始終沒有認罪

網(wǎng)傳山西大同訂婚強奸案男主出獄后發(fā)文:一天刑期未減,因我始終沒有認罪

互聯(lián)網(wǎng)大觀
2026-05-07 18:16:26
稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

六子吃涼粉
2026-05-06 18:14:18
被困霍爾木茲海峽69天,19名中國船員海上堅守:導彈在頭頂飛,淡水告急,船艙熱如巨型蒸籠,蔬果價格高昂,“擔心炮彈難以入眠”

被困霍爾木茲海峽69天,19名中國船員海上堅守:導彈在頭頂飛,淡水告急,船艙熱如巨型蒸籠,蔬果價格高昂,“擔心炮彈難以入眠”

極目新聞
2026-05-07 18:51:02
黑龍江兩名失蹤女孩已遇害,知情人透露,只因爺爺說了一句話

黑龍江兩名失蹤女孩已遇害,知情人透露,只因爺爺說了一句話

魔都姐姐雜談
2026-05-07 15:39:54
星空衛(wèi)視宣布暫停,大量網(wǎng)友涌向評論區(qū)

星空衛(wèi)視宣布暫停,大量網(wǎng)友涌向評論區(qū)

南方都市報
2026-05-07 12:27:53
31分史詩逆轉!中國U17男籃轟29-0加時翻盤 姚嘉澤轟32+10

31分史詩逆轉!中國U17男籃轟29-0加時翻盤 姚嘉澤轟32+10

醉臥浮生
2026-05-07 22:55:24
整整一周未發(fā)聲,伊朗最高領袖突然與總統(tǒng)會面,美伊談判進入終局推演?

整整一周未發(fā)聲,伊朗最高領袖突然與總統(tǒng)會面,美伊談判進入終局推演?

國是直通車
2026-05-07 22:41:03
魏鳳和案、李尚福案一審宣判

魏鳳和案、李尚福案一審宣判

界面新聞
2026-05-07 18:01:52
最新:曝烏克蘭攻入俄羅斯領土布良斯克!摧毀俄戰(zhàn)術防御系統(tǒng)

最新:曝烏克蘭攻入俄羅斯領土布良斯克!摧毀俄戰(zhàn)術防御系統(tǒng)

項鵬飛
2026-05-07 20:17:44
“機車女神”痞幼拿下張雪,評論區(qū)直接吵瘋!

“機車女神”痞幼拿下張雪,評論區(qū)直接吵瘋!

品牌新
2026-05-07 17:28:42
2026-05-08 04:31:00
科學聲音 incentive-icons
科學聲音
普及科學知識,傳播科學精神
376文章數(shù) 35324關注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

日媒詢問中國是否希望恢復中日之間人員往來 中方回應

頭條要聞

日媒詢問中國是否希望恢復中日之間人員往來 中方回應

體育要聞

巴黎再進歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

Lisa主持!寧藝卓觀看脫衣秀風波升級

財經要聞

人均年薪406萬,這家ST公司驚呆市場!

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

房產
健康
教育
旅游
藝術

房產要聞

負債23億,抵押482畝地!海南這家巨頭,慘遭拍賣!

干細胞治燒燙傷面臨這些“瓶頸”

教育要聞

二模很重要!2026臨沂二模、青島二模語文、數(shù)學試題及答案!

旅游要聞

在上圖文字奇旅中尋找她的筆跡(邊玩邊贏獎,互動體驗開啟預約?。?/h3>

藝術要聞

探索施密德的油畫,感受無法抵擋的藝術魅力!

無障礙瀏覽 進入關懷版