国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌最新論文宣告AI成獨立科研主體

0
分享至

日前,谷歌DeepMind 與多所頂尖學(xué)術(shù)機構(gòu)的研究者聯(lián)合發(fā)布論文《Aletheia:自主攻克FirstProof數(shù)學(xué)難題挑戰(zhàn)賽》(arXiv:2602.21201) 。


論文的核心是,評估名為 Aletheia 的數(shù)學(xué)研究代理系統(tǒng)在 FirstProof 這一公開挑戰(zhàn)中的表現(xiàn)。

在沒有人類干預(yù)的情況下,Aletheia成功完成多道研究級數(shù)學(xué)難題。

這不是簡單的“算對了題”,而是達(dá)到了接近學(xué)術(shù)發(fā)表標(biāo)準(zhǔn)的證明水平。

這意味著 AI 開始真正觸及“數(shù)學(xué)創(chuàng)造力”,這個長期被認(rèn)為是人類專屬的領(lǐng)域。

FirstProof 不是簡單的算術(shù)或者基礎(chǔ)證明題,而是由專業(yè)數(shù)學(xué)家設(shè)定的一組十個研究級難度的問題。

這些問題往往涉及抽象概念和嚴(yán)謹(jǐn)推理,傳統(tǒng)上只有受過訓(xùn)練的數(shù)學(xué)家才能應(yīng)對。組織方希望通過這個挑戰(zhàn)評估當(dāng)前 AI 在數(shù)學(xué)領(lǐng)域的真實能力邊界。


Aletheia 也并不是一個普通的自動答題機器人,而是一個結(jié)合了生成式模型和驗證機制的智能體,基于谷歌最新的大模型架構(gòu) Gemini 3 Deep Think。

它的設(shè)計目標(biāo)不僅是輸出答案,而是在 無人類干預(yù)的前提下 盡可能自動地提出數(shù)學(xué)證明。

也就是說,從理解題意、構(gòu)思思路、生成證明草稿,到最終輸出一段嚴(yán)謹(jǐn) LaTeX 格式的證明文本,整個過程都是由智能體自主完成的。

Aletheia 由三個核心模塊構(gòu)成:

猜想生成:從數(shù)學(xué)文獻中識別有價值的開放問題,并生成形式化命題。

自主證明搜索:結(jié)合符號推理、啟發(fā)式搜索與自我修正,尋找形式化證明。

嚴(yán)謹(jǐn)驗證:使用自動證明檢驗器與自我批判機制,過濾無效論證并確保正確性。


整個流程完全自動化,無需人類撰寫提示、選擇問題或?qū)徍酥虚g步驟。Aletheia 自主判斷哪些問題可解、哪些方向有價值、以及證明何時完成且正確。

論文作者為了評估其真實能力,在整個流程中嚴(yán)格排除了人為提示和干預(yù),只保留最終專家對結(jié)果的判斷與評價。

在 FirstProof 的十個問題中,Aletheia 成功給出了六個問題的可評估解答,被獨立數(shù)學(xué)專家(有些來自論文作者之外的學(xué)術(shù)界)認(rèn)為,滿足出版前的“可修訂發(fā)表”標(biāo)準(zhǔn)。


更重要的是,這種能力是在沒有人工設(shè)計思路的情況下實現(xiàn)的,充分體現(xiàn)了 AI 在數(shù)學(xué)推理上從輔助工具向真正“研究伙伴”的轉(zhuǎn)變。

值得注意的是,Aletheia 并不是在所有問題上都做到了完美。在那些極其復(fù)雜或高度依賴深厚數(shù)學(xué)直覺的問題上,它仍然無法給出有效輸出。所以說,暫時它還不是完全合格的數(shù)學(xué)家。

但總的來說,這項工作標(biāo)志著 AI 在數(shù)學(xué)研究領(lǐng)域取得了實質(zhì)性的進展。

從 ChatGPT 或 Gemini 這類大語言模型能會話式討論數(shù)學(xué),到 Aletheia 能在沒有人類引導(dǎo)的情況下解決復(fù)雜證明問題,是科研史上的一次重要里程碑。

雖然距離完全取代人類數(shù)學(xué)家還有很長的路要走,但這一成果無疑推動了人工智能在創(chuàng)意推理與科學(xué)發(fā)現(xiàn)方面的邊界。

這不僅對數(shù)學(xué)界是重要突破,也預(yù)示著未來 AI 將在數(shù)學(xué)、物理、計算機科學(xué),乃至整個基礎(chǔ)科研領(lǐng)域,承擔(dān)越來越重要的角色。

也就是說,AI第一次真正從“輔助工具”進化為獨立科研主體,開創(chuàng)了“AI自主做科學(xué)研究”的全新范式。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
每體:FIFA將因拉菲尼亞傷病向巴薩作出賠償,金額約14.4萬歐

每體:FIFA將因拉菲尼亞傷病向巴薩作出賠償,金額約14.4萬歐

懂球帝
2026-03-28 21:40:23
iOS 緊急發(fā)布系統(tǒng)更新提醒,建議升級!

iOS 緊急發(fā)布系統(tǒng)更新提醒,建議升級!

花果科技
2026-03-29 00:02:21
贏了!德國芯片高管:美國制裁基本無效 ,中國幾乎統(tǒng)治20+nm芯片

贏了!德國芯片高管:美國制裁基本無效 ,中國幾乎統(tǒng)治20+nm芯片

尋墨閣
2026-03-29 04:09:17
越打越出驚喜!以色列傳來好消息,美軍徹底歇菜:8年無法再開戰(zhàn)

越打越出驚喜!以色列傳來好消息,美軍徹底歇菜:8年無法再開戰(zhàn)

知法而形
2026-03-26 17:28:20
同樣是跟腱斷裂復(fù)出,塔圖姆與杜蘭特的效率根本不是一個級別!

同樣是跟腱斷裂復(fù)出,塔圖姆與杜蘭特的效率根本不是一個級別!

田先生籃球
2026-03-28 23:03:18
江蘇一市紀(jì)委監(jiān)委通報:張國光、顧峰、李軍、史肇源被查

江蘇一市紀(jì)委監(jiān)委通報:張國光、顧峰、李軍、史肇源被查

揚子晚報
2026-03-28 08:07:08
中國軍媒公布伊朗戰(zhàn)爭5 個教訓(xùn),讓我們看到哪些用鮮血換來的經(jīng)驗

中國軍媒公布伊朗戰(zhàn)爭5 個教訓(xùn),讓我們看到哪些用鮮血換來的經(jīng)驗

知識TNT
2026-03-26 11:48:40
2020年女子當(dāng)眾扇兒子耳光,兒子直接跳樓,如今女子已自殺身亡

2020年女子當(dāng)眾扇兒子耳光,兒子直接跳樓,如今女子已自殺身亡

觀察鑒娛
2026-03-18 09:09:10
歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
黃仁勛最新驚人觀點:英語專業(yè)將血洗計算機,文科成AI時代新貴族

黃仁勛最新驚人觀點:英語專業(yè)將血洗計算機,文科成AI時代新貴族

南宗歷史
2026-03-28 19:31:50
神曲《老鼠愛大米》綜藝翻紅!原創(chuàng)楊臣剛曾自曝靠這首歌賺1.7億,最新聲明:稱未經(jīng)授權(quán)不得翻唱或用于商演

神曲《老鼠愛大米》綜藝翻紅!原創(chuàng)楊臣剛曾自曝靠這首歌賺1.7億,最新聲明:稱未經(jīng)授權(quán)不得翻唱或用于商演

大象新聞
2026-03-28 15:45:26
美最新戰(zhàn)報:伊朗導(dǎo)彈發(fā)射率跌90%,話音剛落,中東首個叛徒現(xiàn)身

美最新戰(zhàn)報:伊朗導(dǎo)彈發(fā)射率跌90%,話音剛落,中東首個叛徒現(xiàn)身

探源歷史
2026-03-29 03:49:11
霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態(tài)絕了

霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態(tài)絕了

橙星文娛
2026-03-28 11:42:28
中國移動正式發(fā)布通知:全國將統(tǒng)一執(zhí)行:4月30日起

中國移動正式發(fā)布通知:全國將統(tǒng)一執(zhí)行:4月30日起

觸摸史跡
2026-03-27 15:11:23
米蘭寶格麗之夜合影:劉亦菲被擠,安妮海瑟薇靠邊,C位讓人意外

米蘭寶格麗之夜合影:劉亦菲被擠,安妮海瑟薇靠邊,C位讓人意外

TVB的四小花
2026-03-29 04:26:05
陳赫第二任老婆張子萱,紅毯大翻車!雙馬尾配白裙,被嘲又老又小

陳赫第二任老婆張子萱,紅毯大翻車!雙馬尾配白裙,被嘲又老又小

一盅情懷
2026-03-28 15:39:06
遭外機雷達(dá)照射挑釁 殲-10C飛行員“奪槍反打”

遭外機雷達(dá)照射挑釁 殲-10C飛行員“奪槍反打”

環(huán)球網(wǎng)資訊
2026-03-28 11:15:53
娃哈哈被曝大規(guī)模停產(chǎn),“連AD鈣奶和營養(yǎng)快線都讓停了”,知情人:正常排產(chǎn)調(diào)整,“宗馥莉的管理方式和宗慶后確實不一樣”

娃哈哈被曝大規(guī)模停產(chǎn),“連AD鈣奶和營養(yǎng)快線都讓停了”,知情人:正常排產(chǎn)調(diào)整,“宗馥莉的管理方式和宗慶后確實不一樣”

每日經(jīng)濟新聞
2026-03-28 11:57:07
隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調(diào)和

隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調(diào)和

南海浪花
2026-03-28 11:44:31
2026 世界杯最強攻擊線TOP 10 ,阿根廷僅第 5,第一毫無懸念

2026 世界杯最強攻擊線TOP 10 ,阿根廷僅第 5,第一毫無懸念

瀾歸序
2026-03-29 04:03:53
2026-03-29 04:59:00
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應(yīng)用精選與評測
465文章數(shù) 69關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負(fù)責(zé)人王云鶴確認(rèn)離職

頭條要聞

美媒:和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

數(shù)碼
親子
教育
時尚
公開課

數(shù)碼要聞

蘋果或重啟與長江存儲合作 國行機型擬采用國產(chǎn)NAND

親子要聞

小孩子能口無遮攔到什么程度!網(wǎng)友:恨不得當(dāng)場找個地縫鉆進去

教育要聞

嚴(yán)絲合縫的教材閱讀法?????

和田曦薇一樣嫩嘟嘟,這3個變美技巧你一定不能錯過!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版