国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌與OpenAI同獲ICPC 2025金牌!GPT-5滿分奪冠,Gemini攻破人類隊(duì)伍都沒解出的難題

0
分享至


整理 | 鄭麗媛

出品 | CSDN(ID:CSDNnews)

在過去幾十年里,國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽(ICPC)一直被視為計(jì)算機(jī)程序設(shè)計(jì)領(lǐng)域的“奧林匹克”。然而今年,賽場(chǎng)上的風(fēng)頭卻被兩位“非人類”選手搶走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。

GPT-5 和 Gemini 2.5 Deep Think 作為參賽模型,受 ICPC 官方規(guī)則與組織監(jiān)督,參與了與人類選手相同的解題環(huán)節(jié)。雖然它們并非與學(xué)生團(tuán)隊(duì)直接同場(chǎng)競(jìng)技,卻交出了驚艷答卷:

● GPT-5 拿下滿分,12 道題全解,相當(dāng)于“金牌”水準(zhǔn)。

● Gemini 2.5 Deep Think 在 677 分鐘內(nèi)解出 12 題中的 10 題,也達(dá)到金牌級(jí)別。根據(jù)谷歌的說法,這樣的成績(jī)放在人類排名里將是全球第二。

要知道,本屆 ICPC 的人類金牌隊(duì)伍來自圣彼得堡國(guó)立大學(xué)、東京大學(xué)、北京交通大學(xué)和清華大學(xué)??杉幢闶沁@些頂尖學(xué)府的強(qiáng)隊(duì),也沒有任何一支做到全對(duì)(最好成績(jī)是 11/12)。換句話說,這是 AI 第一次在這類算法競(jìng)賽中實(shí)現(xiàn)了“超車”。



ICPC:程序員的“林匹克

ICPC 是全球最頂尖的大學(xué)生編程賽事,自 1970 年代起,這項(xiàng)賽事就匯聚了全球高校最頂尖的算法天才。今年,ICPC 總決賽共有來自 103 個(gè)國(guó)家、139 所高校的戰(zhàn)隊(duì)參賽,大賽規(guī)則看似簡(jiǎn)單:

● 每支隊(duì)伍由三名大學(xué)生組成;

● 5 小時(shí)內(nèi)解答 12 道算法題;

● 排名取決于解題數(shù)和用時(shí)。

但背后的難度遠(yuǎn)超一般編程比賽。據(jù)悉,ICPC 的題目常涉及圖論、數(shù)論、動(dòng)態(tài)規(guī)劃、組合優(yōu)化、網(wǎng)絡(luò)流等前沿算法。既考察編碼速度,也考察數(shù)學(xué)功底與團(tuán)隊(duì)合作。歷年來,能在 ICPC 拿到金牌的隊(duì)伍,幾乎都成為了全球科技公司的核心技術(shù)人才。

也正因?yàn)?ICPC 的權(quán)威與挑戰(zhàn)性,本屆 AI 的入局顯得尤為標(biāo)志性:這是把AI直接推上了最嚴(yán)苛的算法競(jìng)技場(chǎng)。


GPT-5 給出完美答卷,Gemini 2.5解出人類沒有答出的問題C

根據(jù) OpenAI 官方披露,GPT-5 參賽時(shí)并沒有針對(duì) ICPC 做特別訓(xùn)練,也沒有任何“外掛”工具。它像其他人類隊(duì)伍一樣:直接拿到同樣的 PDF 賽題、通過官方判題系統(tǒng)提交答案、在 5 小時(shí)內(nèi)完成所有解答。

結(jié)果令人瞠目:有 11 道題都是一遍過,唯一的難題在第 9 次提交時(shí)才解出,最終達(dá)成 12/12 滿分——要知道,今年人類最強(qiáng)隊(duì)伍的成績(jī)是 11/12,而 GPT-5 直接拿下滿分,這在 ICPC 的歷史上極為罕見。

基于此,OpenAI 也在 X 平臺(tái)分享了 GPT-5 的成績(jī):

“我們?cè)?ICPC 的 AI 賽道正式參賽,同樣是 5 小時(shí)解 12 道題,答案由 ICPC 評(píng)測(cè)系統(tǒng)實(shí)時(shí)判定。結(jié)果顯示,12 道題中有 11 道題一次提交就通過,最難的一題則是在第 9 次提交時(shí)才解出。最終,GPT-5 完成了全部 12 道題,而最好的人類隊(duì)伍只解出 11 道?!?/blockquote>

與此同時(shí),Google 也公布了 Gemini 2.5 Deep Think 的比賽細(xì)節(jié):45 分鐘內(nèi)解出 8 題;3 小時(shí)內(nèi)解出 10 題;更令人震驚的是,Gemini 在比賽前半小時(shí)內(nèi),就成功解決了問題 C——一道沒有任何大學(xué)隊(duì)伍解出的難題。


據(jù)悉,這道題目要求:在由多個(gè)水庫(kù)和管道組成的復(fù)雜網(wǎng)絡(luò)中,找到一種管道開關(guān)配置,使所有水庫(kù)在最短時(shí)間內(nèi)被注滿。每條管道可以開、關(guān)或部分開啟,組合幾乎無限,導(dǎo)致搜索最優(yōu)解極其困難。

面對(duì)這道題,Gemini 2.5 Deep Think 的解題思路堪稱“巧妙”:

1、先為每個(gè)水庫(kù)設(shè)定一個(gè)“優(yōu)先級(jí)值”,表示它相對(duì)于其他水庫(kù)應(yīng)被分配的程度;

2、在給定優(yōu)先級(jí)值后,通過動(dòng)態(tài)規(guī)劃找到最優(yōu)管道配置;

3、進(jìn)一步應(yīng)用極小化極大定理,將問題轉(zhuǎn)化為尋找“最受約束”的優(yōu)先級(jí)組合;

4、最后在凸優(yōu)化空間中,利用嵌套三分搜索快速收斂到最優(yōu)解。

這一思路并非賽題官方題解的“標(biāo)準(zhǔn)做法”,而是模型自己推演出的路徑。換句話說,Gemini 在賽場(chǎng)上展示了超越記憶的原創(chuàng)性算法思維。為此Google 也在博客中強(qiáng)調(diào),這不僅是一次正確解答,更是一次“創(chuàng)造性突破”。


為什么這次意義非凡?

其實(shí),大模型在各種考試、基準(zhǔn)測(cè)試中的高分表現(xiàn)早已不是新聞:

● ChatGPT、Gemini 等 LLM 在 SAT、律師資格考試、托福等人類考試中屢屢高分;

● 今年7月,Gemini在國(guó)際數(shù)學(xué)奧林匹克(IMO) 拿到金牌;

● 在各種 NLP、邏輯推理 benchmark 上,LLM 也早已“刷榜”。

但這些成績(jī)往往被質(zhì)疑為“靠記憶訓(xùn)練數(shù)據(jù)”或“靠海量算力暴力搜索”。而 ICPC 這種現(xiàn)場(chǎng)算法競(jìng)賽不同:首先題目新穎,幾乎不可能出現(xiàn)在訓(xùn)練語料中;其次需要綜合運(yùn)用數(shù)學(xué)建模、推理和代碼實(shí)現(xiàn);最為重要的是,必須在有限時(shí)間內(nèi)找到解法,而不是離線慢慢思考。

此次GPT-5 與 Gemini 2.5 Deep Think在ICPC中的表現(xiàn),證明了它們已經(jīng)具備臨場(chǎng)推理、抽象建模、創(chuàng)造性解題的能力,這比在標(biāo)準(zhǔn)化考試中得高分更能說明問題。為此在社交媒體上,許多 AI 工程師感嘆:“過去我們擔(dān)心 AI 只是會(huì)背題庫(kù);現(xiàn)在它在現(xiàn)場(chǎng)比賽里擊敗人類冠軍。這感覺像是見證了‘人機(jī)智力平權(quán)’的時(shí)刻?!?/p>

這不是終點(diǎn),而是一個(gè)開始。接下來,AI 是否會(huì)把這種能力擴(kuò)展到更復(fù)雜的現(xiàn)實(shí)問題中還有待考驗(yàn),但可以確定的是:如今,AI 不再只是“會(huì)寫代碼的助手”,而是真正具備了與人類智力正面對(duì)抗的實(shí)力。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中國(guó)駐伊朗女記者:爆炸中躲進(jìn)衛(wèi)生間趕稿,不是最窘的事

中國(guó)駐伊朗女記者:爆炸中躲進(jìn)衛(wèi)生間趕稿,不是最窘的事

上觀新聞
2026-03-07 15:07:07
伊朗說具備進(jìn)行超半年高強(qiáng)度戰(zhàn)爭(zhēng)能力

伊朗說具備進(jìn)行超半年高強(qiáng)度戰(zhàn)爭(zhēng)能力

界面新聞
2026-03-08 12:31:03
河北女子吃螺螄粉被潑紅油,當(dāng)事人回應(yīng),原因曝光,恐面臨處罰

河北女子吃螺螄粉被潑紅油,當(dāng)事人回應(yīng),原因曝光,恐面臨處罰

奇思妙想草葉君
2026-03-07 23:57:51
就在下周一,或迎來本年度飆升!加滿一箱油要貴20元

就在下周一,或迎來本年度飆升!加滿一箱油要貴20元

都市快報(bào)橙柿互動(dòng)
2026-03-07 23:13:42
當(dāng)年的東北“地下市長(zhǎng)”,霸占過20多位女明星,狠起來連自己都砍

當(dāng)年的東北“地下市長(zhǎng)”,霸占過20多位女明星,狠起來連自己都砍

為什么有冬天夏天
2024-05-08 23:38:12
女子相親帶男閨蜜蹭飯,狂點(diǎn)8000元海鮮,男方逃單失聯(lián),警方介入

女子相親帶男閨蜜蹭飯,狂點(diǎn)8000元海鮮,男方逃單失聯(lián),警方介入

離離言幾許
2026-03-07 15:52:24
伊朗客商冒戰(zhàn)火轉(zhuǎn)賬,義烏老板拒收:“錢別轉(zhuǎn),你留著,希望你平安”

伊朗客商冒戰(zhàn)火轉(zhuǎn)賬,義烏老板拒收:“錢別轉(zhuǎn),你留著,希望你平安”

新民晚報(bào)
2026-03-08 09:05:08
公共走廊被鄰居安廚房裝馬桶后續(xù):房主發(fā)聲,鄰居給2個(gè)解決方案

公共走廊被鄰居安廚房裝馬桶后續(xù):房主發(fā)聲,鄰居給2個(gè)解決方案

天天熱點(diǎn)見聞
2026-03-07 13:02:00
為啥有些人超害怕安檢?網(wǎng)友:沒有好心態(tài)不要干安檢

為啥有些人超害怕安檢?網(wǎng)友:沒有好心態(tài)不要干安檢

帶你感受人間冷暖
2026-03-06 00:31:11
伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

書紀(jì)文譚
2026-03-07 15:19:19
誤拿凳子被潑螺螄粉湯后續(xù):原視頻曝光,當(dāng)朋友面干壞事全網(wǎng)社死

誤拿凳子被潑螺螄粉湯后續(xù):原視頻曝光,當(dāng)朋友面干壞事全網(wǎng)社死

離離言幾許
2026-03-07 21:05:01
伊朗強(qiáng)硬派否定總統(tǒng)道歉言論,稱對(duì)目標(biāo)的猛烈攻擊將繼續(xù)下去

伊朗強(qiáng)硬派否定總統(tǒng)道歉言論,稱對(duì)目標(biāo)的猛烈攻擊將繼續(xù)下去

近距離
2026-03-08 07:50:15
伊朗軍方?jīng)]給總統(tǒng)面子,主戰(zhàn)派全面開火,這一次真要反美打到底了

伊朗軍方?jīng)]給總統(tǒng)面子,主戰(zhàn)派全面開火,這一次真要反美打到底了

頭條爆料007
2026-03-08 10:51:17
女子花8萬元做醫(yī)美后右臉面癱,涉事門店:或是術(shù)后正常反應(yīng);當(dāng)?shù)匦l(wèi)健委已介入

女子花8萬元做醫(yī)美后右臉面癱,涉事門店:或是術(shù)后正常反應(yīng);當(dāng)?shù)匦l(wèi)健委已介入

環(huán)球網(wǎng)資訊
2026-03-08 13:31:20
B-52重返戰(zhàn)場(chǎng):當(dāng)美軍開始用二戰(zhàn)式轟炸,戰(zhàn)爭(zhēng)其實(shí)已經(jīng)結(jié)束了一半

B-52重返戰(zhàn)場(chǎng):當(dāng)美軍開始用二戰(zhàn)式轟炸,戰(zhàn)爭(zhēng)其實(shí)已經(jīng)結(jié)束了一半

斌聞天下
2026-03-07 07:30:03
爆火全球的OpenClaw到底是啥?一文給你講透!

爆火全球的OpenClaw到底是啥?一文給你講透!

秋葉PPT
2026-03-08 08:23:56
毫無人性!伊朗65所學(xué)校、14個(gè)醫(yī)療中心和13個(gè)紅新月會(huì)所屬中心遭攻擊

毫無人性!伊朗65所學(xué)校、14個(gè)醫(yī)療中心和13個(gè)紅新月會(huì)所屬中心遭攻擊

臺(tái)州交通廣播
2026-03-07 18:40:58
伊朗小學(xué)遭襲致超165人遇難,大多是10歲左右的小女孩,特朗普發(fā)聲:是伊朗干的,伊朗的彈藥襲擊“非常不準(zhǔn)確”

伊朗小學(xué)遭襲致超165人遇難,大多是10歲左右的小女孩,特朗普發(fā)聲:是伊朗干的,伊朗的彈藥襲擊“非常不準(zhǔn)確”

每日經(jīng)濟(jì)新聞
2026-03-08 14:13:38
特朗普發(fā)表聲明:伊朗已向其中東鄰國(guó)投降!這是由于美以的持續(xù)攻擊才實(shí)現(xiàn)的

特朗普發(fā)表聲明:伊朗已向其中東鄰國(guó)投降!這是由于美以的持續(xù)攻擊才實(shí)現(xiàn)的

爆角追蹤
2026-03-07 21:09:51
毛骨悚然!網(wǎng)傳西安二婚大專女,找月薪2萬985未婚男,全款車房…

毛骨悚然!網(wǎng)傳西安二婚大專女,找月薪2萬985未婚男,全款車房…

火山詩(shī)話
2026-03-08 06:10:43
2026-03-08 14:56:51
AI科技大本營(yíng) incentive-icons
AI科技大本營(yíng)
連接AI技術(shù)的創(chuàng)造者和使用者
2639文章數(shù) 7660關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財(cái)經(jīng)要聞

油價(jià)要失控?

汽車要聞

9分鐘充飽 全新騰勢(shì)Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

藝術(shù)
旅游
本地
手機(jī)
公開課

藝術(shù)要聞

“北京意象·活力通州”繪畫作品展 | 油畫作品選

旅游要聞

舌尖上的春天:到云南西盟赴一場(chǎng)“春宴”

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

手機(jī)要聞

紅魔手機(jī)風(fēng)冷散熱逆襲!曾被嘲,友商現(xiàn)跟風(fēng)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版