国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Gemini聯(lián)手頂尖學(xué)者破解理論科學(xué)難題:推翻人類學(xué)者的假設(shè)

0
分享至

此前,業(yè)界對AI 能力的評價往往基于“會不會做題”,比如能不能在高考試題上擊敗人類考生、在奧數(shù)競賽中斬獲幾塊金牌,又或者寫出的代碼夠不夠格通過互聯(lián)網(wǎng)大廠的筆試……

但在這些看似“人類一敗涂地,AI大獲全勝”的測試背后,科學(xué)界一直存在一種冷靜甚至審慎的看法:AI 確實很會“做題”,但它能解決那些人類尚未解決的“真問題”嗎?畢竟,背誦教科書是一回事,拓展人類知識的邊界則是完全不同的另一回事。

許多科學(xué)家曾認(rèn)為,目前的 AI 或許只能做簡單的模仿者,無法進行深度的邏輯推理和創(chuàng)新。然而,Google Research 最新發(fā)布的一項重磅研究打破了這種質(zhì)疑,并向我們展示:AI 不僅是只會做選擇題的學(xué)生,還可以成為人類頂尖學(xué)者的“左膀右臂”,共同攻克多個困擾學(xué)界已久的難題。


(來源:arXiv)

2 月 3 日,Google Research 聯(lián)合卡內(nèi)基梅隆大學(xué)、哈佛大學(xué)、麻省理工學(xué)院等多所頂尖高校研究人員共同在預(yù)印本平臺 arXiv 提交了一篇論文:《利用 Gemini 加速科學(xué)研究:案例研究與通用技術(shù)》(Accelerating Scientific Research with Gemini: Case Studies and Common Techniques),詳細(xì)記錄了前沿大語言模型,特別是具備增強推理能力的 Gemini Deep Think 及其變體,如何從傳統(tǒng)的輔助工具轉(zhuǎn)變?yōu)槔碚摽茖W(xué)研究中的實質(zhì)性合作者。

研究團隊通過展示 Gemini 系列大型語言模型在理論計算機科學(xué)、物理學(xué)、經(jīng)濟學(xué)等多個領(lǐng)域的實際應(yīng)用,證實了 Gemini 在解決開放性數(shù)學(xué)問題、反駁長期存在的猜想以及生成復(fù)雜新證明方面具備卓越性能,還總結(jié)出了一套行之有效的人機協(xié)作方法論。

為了讓 Gemini 真正參與專家級的科研工作,研究人員首先構(gòu)建了幾項關(guān)鍵的協(xié)作規(guī)則。首先是“迭代提示與改進”,即模型很少能一次性解決深奧問題,需要通過多輪對話,由人類研究員將大問題分解為可驗證的子任務(wù),并提供高層級的證明框架(即“腳手架”),引導(dǎo)模型逐步填補技術(shù)細(xì)節(jié)。

其次是“思想的異花授粉”(Cross-Pollination of Ideas),團隊利用模型攝取了跨學(xué)科海量文獻的優(yōu)勢,借助其識別出不同數(shù)學(xué)領(lǐng)域之間,可能被人類專家忽視的隱秘聯(lián)系。

此外還有“神經(jīng)符號循環(huán)”(Neuro-Symbolic Loops)技術(shù),即將模型嵌入自動化的編程環(huán)境中,讓模型生成數(shù)學(xué)公式,同時編寫代碼對假設(shè)進行數(shù)值驗證,根據(jù)執(zhí)行錯誤(如 Python 回溯信息)自主修正推導(dǎo)路徑,從而在沒有人類干預(yù)的情況下修剪無效的推理分支,形成一個自我修正的閉環(huán)。


(來源:Google Research)

這些框架搭建完成后,Gemini 隨即在分屬多個領(lǐng)域的科學(xué)研究中展現(xiàn)出巨大的應(yīng)用潛力。首先,在密碼學(xué)領(lǐng)域,Gemini 指出了一種前沿協(xié)議的致命漏洞。這一名為“簡潔非交互式論證”(SNARGs)的協(xié)議,旨在保護區(qū)塊鏈和隱私計算,如果這個錯誤未被發(fā)現(xiàn),未來的數(shù)字安全可能面臨巨大風(fēng)險。

具體來看,針對一篇聲稱基于容錯學(xué)習(xí)(LWE)假設(shè)實現(xiàn)簡潔非交互式論證(SNARGs)的預(yù)印本論文,研究人員設(shè)計了一種“對抗性自我糾正”的提示策略,要求模型嚴(yán)格批判自己的發(fā)現(xiàn)。結(jié)果,Gemini 敏銳地指出,論文中“完美一致性”定義與實際構(gòu)造僅能實現(xiàn)“統(tǒng)計一致性”之間存在嚴(yán)重的邏輯缺陷,這一發(fā)現(xiàn)隨后得到了密碼學(xué)專家和論文原作者的確認(rèn)。

“在線次模福利最大化”(online submodular welfare maximization)是一個經(jīng)典的經(jīng)濟學(xué)與算法問題,研究如何在需求未知且逐個出現(xiàn)的情況下,例如在實時廣告競價或云計算資源分配中,將資源分給不同的人以最大化整體滿意度。這里的“次?!敝傅氖沁呺H效益遞減,即擁有的越多,新獲得的價值就越低。

此前,谷歌研究科學(xué)家尼蒂什·科魯拉(Nitish Korula)等人提出過一個與之相關(guān)的猜想,認(rèn)為某種貪婪算法的效率界限可以被進一步提升。基于此,Gemini 并未順著原假設(shè)的思路進一步證實,反而自主構(gòu)建了一個涉及 3 個物品和 2 個代理的具體反例,并通過繁瑣的期望計算成功反駁了該猜想。這是 AI 罕見地在研究者沒有給出明確答案的情況下,直接利用真實科研語境否定了一位人類學(xué)者(還是谷歌自己人)提出的猜想。


(來源:Recherche-Research-Google)

借助掌握海量跨學(xué)科知識的優(yōu)勢,Gemini 在數(shù)學(xué)領(lǐng)域的難題中另辟蹊徑,為算法難題提供頗具創(chuàng)新性的幾何解法。最大割(Max-Cut)是一個圖論問題,旨在尋找一種分割方式,使被切斷的連接線數(shù)量最大,這也是網(wǎng)絡(luò)流和芯片設(shè)計中常用的基礎(chǔ)算法之一。

為解決其中關(guān)于近似算法精度的一個長期開放問題,Gemini 跳出了傳統(tǒng)的組合優(yōu)化思路,將其重構(gòu)為一個幾何泛函分析問題,并創(chuàng)造性地建議應(yīng)用斯通-魏爾斯特拉斯(Stone-Weierstrass)定理(一項關(guān)于函數(shù)逼近的數(shù)學(xué)定理)來建立必要的方差界限。


(來源:Google Research)

在計算幾何領(lǐng)域中,針對斯坦納樹問題(如何以最短路徑連接多個點),存在一個關(guān)于“單純形是最佳圖嵌入結(jié)構(gòu)”的猜想。Gemini 發(fā)現(xiàn),解決問題的關(guān)鍵實際在于希爾伯特空間映射中的基爾斯布勞恩(Kirszbraun)擴展定理,這個定理通常用于分析函數(shù)的平滑性(Lipschitz 連續(xù)性),人類研究者此前往往認(rèn)為它過于深奧而不予考慮。但 Gemini 正是借助這一晦澀的數(shù)學(xué)工具,成功完成了從任意圖嵌入到星形圖嵌入的形式化映射證明。


(來源:Google Research)

類似地,正則二分圖常用于通信網(wǎng)絡(luò)建模,為改進其完美匹配數(shù)量下界,Gemini 綜合運用了統(tǒng)計物理中的貝特(Bethe)近似、數(shù)論中的互質(zhì)整數(shù)分析以及譜圖理論中的伊原-巴斯(Ihara-Bass)恒等式,給出了比施賴弗(Schrijver)界限更強的理論結(jié)果。

涉及復(fù)雜運算和算法優(yōu)化的學(xué)科時,Gemini 展現(xiàn)出驚人的“精算師”與“優(yōu)化師”能力。在理論天體物理學(xué)中,科學(xué)家試圖通過引力波探測宇宙大爆炸后的遺跡——宇宙弦。然而,預(yù)測其引力輻射涉及一個極度振蕩且具有嚴(yán)重奇點的球面積分計算,這是該領(lǐng)域的一個長期難題。

為此,研究團隊構(gòu)建了一個神經(jīng)符號系統(tǒng),Gemini 在其中推導(dǎo)數(shù)學(xué)公式,并編寫 Python 代碼與數(shù)值基準(zhǔn)進行比對。通過這種反饋循環(huán),AI 自主發(fā)現(xiàn)了六種不同的解析路徑,最終結(jié)合蓋根鮑爾(Gegenbauer)多項式展開,為這一難題推導(dǎo)出一個精確的閉式解。

在大數(shù)據(jù)處理中,如何在有限的內(nèi)存中從海量數(shù)據(jù)流里篩選出最有價值的信息(次模函數(shù)最大化)是一個核心問題,Gemini 敏銳地發(fā)現(xiàn),現(xiàn)有分析中存在一個潛在自由度:算法中的閾值參數(shù)不應(yīng)是全局固定的,而應(yīng)根據(jù)處理狀態(tài)動態(tài)調(diào)整。

通過引入狀態(tài)依賴閾值,AI 推導(dǎo)并證明出一個優(yōu)化的遞推關(guān)系,將算法的近似比從約 0.55 精確提升到了 2-√2。同時,在流算法的香農(nóng)熵(Shannon Entropy)估計中,AI 觀察到,算法其實只需依賴低階矩,從而避開了高方差區(qū)域,這一洞察直接將內(nèi)部狀態(tài)變化的復(fù)雜度界限從多項式級大幅優(yōu)化至多對數(shù)級別。

此外,論文還證實,Gemini 已經(jīng)有能力重塑論文寫作的全流程,甚至出現(xiàn)了“代碼化”論文寫作的趨勢。例如,在理論計算機科學(xué)領(lǐng)域,著名的復(fù)雜性理論專家、Computational Complexity 博客博主蘭斯·福特諾(Lance Fortnow)嘗試使用集成了 AI 的 IDE 開發(fā)環(huán)境,通過高層級的提示進行“氛圍編程”(Vibe-coding)。

當(dāng)對復(fù)雜性類 SP2(涉及博弈論與計算復(fù)雜性)進行研究時,Gemini 不僅可在幾乎沒有人工干預(yù)的情況下,自主生成關(guān)于搜索問題與決策問題等價性的主要證明,被指出推論中的假設(shè)錯誤后,還迅速將證明策略修正為歸約法,幾乎獨立完成了一篇高質(zhì)量理論論文的初稿。

論文還在更多學(xué)科中考驗了 Gemini 解決實際難題的能力。如在機制設(shè)計領(lǐng)域,AI 幫助將原論文中基于有理數(shù)報價的結(jié)論推廣到了實數(shù)域,利用拓?fù)鋵W(xué)和序理論替代了原有的計數(shù)性論證。

在信息論領(lǐng)域,AI 通過分析優(yōu)化圖景和利用超壓縮性不等式(Hypercontractivity),對著名的庫爾塔德-庫馬爾(Courtade-Kumar)猜想做出了實質(zhì)性貢獻,包括將其推廣到非平衡函數(shù)以及改進了高噪聲區(qū)間的界限。

這一系列成果表明,前沿 AI 模型已經(jīng)具備了在理論科學(xué)中進行實質(zhì)性貢獻的能力,而非簡單的輔助工具。它不僅能優(yōu)化算法、推導(dǎo)公式,還能跨越學(xué)科壁壘,甚至從人類專家的盲點區(qū)域找到新的可能性。

然而,論文也強調(diào),目前的這種成功仍高度依賴于人類專家的“腳手架”支持和嚴(yán)格驗證,類似于目前已廣為人知的“Vibe-coding”,這種人機協(xié)作模式被形象地稱為“Vibe-proving”——即利用 AI 的直覺生成證明草稿,再由人類進行嚴(yán)格審查。

為了徹底解決模型可能產(chǎn)生的幻覺問題,未來的研究方向?qū)⑹怯美?Lean 或 Coq 等交互式定理證明器,將 AI 生成的非形式化數(shù)學(xué)推導(dǎo)轉(zhuǎn)化為絕對嚴(yán)謹(jǐn)?shù)男问交C明,從而在根本上保證科學(xué)發(fā)現(xiàn)的正確性,甚至有望得到同行評審的信任。

參考資料:

https://arxiv.org/pdf/2602.03837

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
高速服務(wù)區(qū)如何盈利?多數(shù)人只上廁所或接熱水,聽保安怎么說?

高速服務(wù)區(qū)如何盈利?多數(shù)人只上廁所或接熱水,聽保安怎么說?

寄星夜幕星河
2026-02-17 20:39:30
2-1逆轉(zhuǎn)!歐冠淘汰賽:超巨鎖定勝局 13.6億豪門雙殺死敵復(fù)仇晉級

2-1逆轉(zhuǎn)!歐冠淘汰賽:超巨鎖定勝局 13.6億豪門雙殺死敵復(fù)仇晉級

狍子歪解體壇
2026-02-26 06:06:37
雷軍帶火蕉內(nèi)滑雪服:客服表示299元優(yōu)惠已結(jié)束,當(dāng)前為629元

雷軍帶火蕉內(nèi)滑雪服:客服表示299元優(yōu)惠已結(jié)束,當(dāng)前為629元

PChome電腦之家
2026-02-24 17:02:37
離婚后首個春節(jié),楊子一個人陪母親回河北,眾人向他下跪磕頭拜年

離婚后首個春節(jié),楊子一個人陪母親回河北,眾人向他下跪磕頭拜年

卷史
2026-02-26 10:13:32
閻王爺開示:親人托夢從不說話,地下缺了3樣?xùn)|西,魂魄難安

閻王爺開示:親人托夢從不說話,地下缺了3樣?xùn)|西,魂魄難安

古怪奇談錄
2025-11-29 13:56:49
對比《供應(yīng)商行為準(zhǔn)則》:蘋果165頁涵蓋方方面面,華為僅7頁全是官話

對比《供應(yīng)商行為準(zhǔn)則》:蘋果165頁涵蓋方方面面,華為僅7頁全是官話

爆角追蹤
2026-02-26 13:51:08
同樣煮餃子,“蓋蓋煮”和“不蓋蓋煮”區(qū)別大,難怪煮出來不一樣

同樣煮餃子,“蓋蓋煮”和“不蓋蓋煮”區(qū)別大,難怪煮出來不一樣

阿龍美食記
2026-02-23 17:00:18
攜程聯(lián)合創(chuàng)始人范敏、季琦辭任董事職務(wù)

攜程聯(lián)合創(chuàng)始人范敏、季琦辭任董事職務(wù)

界面新聞
2026-02-26 10:54:06
已婚也逃不過!在愛潑斯坦的安排下,比爾蓋茨和安妮·海瑟薇會面

已婚也逃不過!在愛潑斯坦的安排下,比爾蓋茨和安妮·海瑟薇會面

風(fēng)流女漢
2026-02-25 07:25:20
天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當(dāng)事人拒和解

天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當(dāng)事人拒和解

社會日日鮮
2026-02-25 12:17:53
箖箖玥兒抱弟弟,全網(wǎng)淚目:這才是最治愈的手足情!

箖箖玥兒抱弟弟,全網(wǎng)淚目:這才是最治愈的手足情!

笑飲孤鴻非
2026-02-26 05:35:00
離場前8分鐘得到2分,掘金官方:穆雷下半場因生病提前退賽

離場前8分鐘得到2分,掘金官方:穆雷下半場因生病提前退賽

懂球帝
2026-02-26 13:29:05
中國打造重機槍,不小心犯一個低級錯誤,結(jié)果卻意外造就世界之最

中國打造重機槍,不小心犯一個低級錯誤,結(jié)果卻意外造就世界之最

墨蘭史書
2026-02-08 16:55:05
原來他已去世8年,和朱媛媛是同學(xué)曾在中戲任教,女兒也是演員

原來他已去世8年,和朱媛媛是同學(xué)曾在中戲任教,女兒也是演員

攬星河的筆記
2026-02-25 19:52:14
黃蒙蒙 | “照料的女兒,繼承的兒子”:豫東農(nóng)村家庭養(yǎng)老觀察

黃蒙蒙 | “照料的女兒,繼承的兒子”:豫東農(nóng)村家庭養(yǎng)老觀察

新鄉(xiāng)土
2026-02-25 11:12:48
56歲李靜飛清邁陪戴軍過春節(jié),兩個人手牽手散步,相處更像夫妻

56歲李靜飛清邁陪戴軍過春節(jié),兩個人手牽手散步,相處更像夫妻

柒佰娛
2026-02-26 10:54:00
28歲北京獨子王荻娶50歲德國妻子,寧斷香火也要成婚,現(xiàn)狀太意外

28歲北京獨子王荻娶50歲德國妻子,寧斷香火也要成婚,現(xiàn)狀太意外

談史論天地
2026-02-25 06:53:06
默茨今天到訪杭州宇樹,德國“工業(yè)404”的解藥在中國?

默茨今天到訪杭州宇樹,德國“工業(yè)404”的解藥在中國?

極目新聞
2026-02-26 13:50:11
中央明確!2025年起,不能申請因病提前退休

中央明確!2025年起,不能申請因病提前退休

微法官
2026-02-26 08:05:59
小獵豹老婆打緊縮針!金晨的鼻子“罷工”!

小獵豹老婆打緊縮針!金晨的鼻子“罷工”!

八卦瘋叔
2026-02-26 11:47:39
2026-02-26 14:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16323文章數(shù) 514657關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

賴清德改口稱“大陸”被指釋出善意 國民黨發(fā)言人表態(tài)

頭條要聞

賴清德改口稱“大陸”被指釋出善意 國民黨發(fā)言人表態(tài)

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

短劇市場風(fēng)云突變!有人投百萬賠得精光

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

藝術(shù)
旅游
數(shù)碼
家居
公開課

藝術(shù)要聞

2025年百家金陵畫展 | 油畫作品選刊

旅游要聞

水潤壽鄉(xiāng) 文旅煥新——眉山市彭山區(qū)擘畫現(xiàn)代化都市圈文旅融合新圖景

數(shù)碼要聞

華碩靈耀14雙屏2026筆記本上市:Ultra X9 388H,14999元起

家居要聞

歸隱于都市 慢享自由

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版