国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI理科碾壓人類狀元,卻被這道“文科題”戳中了死穴...

0
分享至


誰敢信?

日本最難考的頂尖學府——東京大學和京都大學,剛剛被AI實現(xiàn)了突破。

不僅是考上,成績還大幅領先。

在LifePrompt公司和日本老牌補習機構(gòu)“河合塾”搞的一場閉卷盲測中,OpenAI的最新大模型ChatGPT 5.2 Thinking,大幅領先人類頂尖考生。

但值得注意的是。

在翻看這份成績單時,我們發(fā)現(xiàn)了一個AI得分率僅為25%的“顯著薄弱環(huán)節(jié)”。

這個大坑,或許恰好是當代高考生和準大學生們的“核心競爭力所在”。

多考50分,數(shù)學拿滿分

先來看一眼這份成績單。

這可不是開卷考試。測試全程物理斷網(wǎng),AI只能憑自己的“腦力”(預訓練權重)硬做。

結(jié)果呢?

在號稱日本地獄級難度的東大理科三類(醫(yī)學部)考試里,滿分550分,ChatGPT 5.2拿了503分。

作為參照,今年考上這個專業(yè)的人類最高分,僅僅是453分。

整整高了50分!

更值得注意的是,它的數(shù)學直接拿了滿分,英語得分率也穩(wěn)穩(wěn)踩在90%的基準線上。

京都大學同樣取得了突破性成績。在醫(yī)學部考試中,AI獲得1176分,把人類狀元的1098分遠遠甩在身后。

要知道,AI進化速度令人矚目。

回看2024年,老前輩GPT-4在這套卷子面前未能通過所有科目,連最低錄取線都沒夠到。

2025年,加了強化學習的o1模型終于首次達到錄取合格線。

結(jié)果才過了一年,ChatGPT 5.2以最高分通過考試。

得分率25%的短板

數(shù)學滿分,英語90%,理應是無敵的存在了吧?

但是!

在這份優(yōu)異的成績單中,有一科的成績明顯不足——

世界史論述題,滿分60,它只拿了15分,得分率僅為25%。


為何一個擁有龐大知識儲備、數(shù)學能力極強的模型,會在文科論述題上表現(xiàn)明顯不佳?

閱卷的河合塾老師和技術社區(qū)的專家們給出了答案:因為這屆AI,嚴重缺乏結(jié)構(gòu)化組織能力(Structural organization)。

世界史論述題可不是背年份填空。

它需要你把歷史長河里的碎片串起來,理出政治和經(jīng)濟的因果,寫出一篇邏輯嚴密、首尾呼應的大文章。

一句話:需要人類的“宏大敘事”。

而這,恰恰是大模型目前的死穴。

當讓它寫上千字長文時,它寫著寫著就偏離了主題。

開發(fā)者社區(qū)做過極端測試:如果讓現(xiàn)在的AI去維持一個超長文本的“連貫思想主線”,往往在幾輪邏輯轉(zhuǎn)折后,它就開始出現(xiàn)結(jié)構(gòu)性斷裂(Structural collapse)。

更要命的是,在處理極度復雜的宏大卷宗時,它還可能遭遇“長期記憶坍縮”,上下文丟失,邏輯線瞬間重置。

也就是說,目前的大模型依然缺乏全局架構(gòu)能力。

它寫出來的東西,單看每一句辭藻都很華麗;但拼在一起,整體缺乏邏輯連貫性,完全沒有人類統(tǒng)領全局的“世界觀”。

準大學生的“反擊指南”

看懂了這個25%的軟肋,高考生和準大學生的破局方向也就清晰了。

日本人工智能學會會長Satoshi Kurihara教授說得好:人類絕對不該在同一條賽道上與AI直接競爭。

打個比方,你非要跟計算器比算數(shù)快,這顯然不是明智之舉。

在AI輕松超越人類頂尖理科考生的時代,準大學生們的技能樹,必須得換個點法了:

第一,減少對“規(guī)則內(nèi)機械做題”的依賴。

不管你微積分算得多快,法條背得多熟練,你都拼不過幾美分調(diào)用一次的API接口。

靠瘋狂刷題、機械記憶去換取職場高薪的路線,正在急速貶值。果斷把你的時間精力,從純粹的“拼記憶、拼算力”里抽離出來。

第二,將重心轉(zhuǎn)向“宏觀架構(gòu)能力”的培養(yǎng)。

AI連世界史大題都統(tǒng)籌不好,說明它目前根本當不了“總工程師”。

未來的高薪崗位,屬于那些懂行的“AI項目經(jīng)理”。

你需要重點培養(yǎng)的能力是:如何提出直擊本質(zhì)的犀利問題?如何把一個龐大模糊的任務,精準拆解成十幾個AI能聽懂的標準指令?最后,如何用人類的戰(zhàn)略眼光,把AI生成的一堆碎片,拼裝成一套能用的系統(tǒng)。

第三,去那些充滿復雜性和不確定性的現(xiàn)實場景中歷練。

AI喜歡干凈、透明、結(jié)構(gòu)化的數(shù)據(jù)。但在真實的社會里,到處是混沌、情緒和謊言。

在一場劍拔弩張的商務談判里,怎么察言觀色搞定客戶?

在公司不同派系的利益博弈中,怎么調(diào)解沖突?

面對一團亂麻的市場反饋,誰來頂住壓力拍板擔責?

這些需要同理心、信任背書、道德抉擇的“高感觸(High-touch)”領域,是AI目前無法有效介入的領域。

時代真的變了。機器的履帶已經(jīng)越過了知識評估的及格線。

與其在AI擅長的規(guī)則中過度內(nèi)卷,不如退一步,去填補那些技術無法替代的領域。(本文首發(fā)鈦媒體App,作者| AGI-Signal,編輯|林深)

聲明:

本文所涉數(shù)據(jù)及推演均嚴格基于客觀原始信息。包括LifePrompt對東京大學與京都大學的錄取分數(shù)線對比盲測數(shù)據(jù)、大語言模型在長文本結(jié)構(gòu)上的架構(gòu)缺陷剖析及相關人工智能專家訪談等。需警示的是,AI技術演進屬于極速變動的高壓領域,本文的客觀對比與能力推演不構(gòu)成任何教育、升學或財務投資建議。讀者在進行個人能力規(guī)劃與發(fā)展決策時,應充分評估技術變遷帶來的深遠影響。

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
32+30!史上最爛黑8搶7終于結(jié)束!23年了,魔術還是那么爛!

32+30!史上最爛黑8搶7終于結(jié)束!23年了,魔術還是那么爛!

貴圈真亂
2026-05-04 09:46:50
“中美局勢”可能發(fā)生反轉(zhuǎn)了! 而最先超過美國的,其實不是經(jīng)濟?

“中美局勢”可能發(fā)生反轉(zhuǎn)了! 而最先超過美國的,其實不是經(jīng)濟?

據(jù)說說娛樂
2026-05-04 10:59:02
曾經(jīng)的王牌專業(yè)涼了?985教授發(fā)文:帶的4位碩士無一人拿到offer

曾經(jīng)的王牌專業(yè)涼了?985教授發(fā)文:帶的4位碩士無一人拿到offer

黯泉
2026-05-03 12:31:13
剛剛,直線拉升!中東,最新消息

剛剛,直線拉升!中東,最新消息

中國基金報
2026-05-04 09:14:40
羅翔:如果一個人突然努力工作,業(yè)余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

羅翔:如果一個人突然努力工作,業(yè)余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

譚老師地理大課堂
2026-04-22 00:03:57
3-1領先慘遭逆轉(zhuǎn)!又一個老里?難怪球隊說什么都要裁他,太拉了

3-1領先慘遭逆轉(zhuǎn)!又一個老里?難怪球隊說什么都要裁他,太拉了

你的籃球頻道
2026-05-04 07:27:24
5月1日起全國高速不用ETC 憑車牌就可免卡上高速?官方回應:先別拆ETC 只是試點

5月1日起全國高速不用ETC 憑車牌就可免卡上高速?官方回應:先別拆ETC 只是試點

閃電新聞
2026-05-03 14:20:31
陜西11歲男童遺體被找到!生前把文具送給同學,生活處境讓人淚目

陜西11歲男童遺體被找到!生前把文具送給同學,生活處境讓人淚目

奇思妙想草葉君
2026-05-03 00:19:03
佛說:人若欠你,天必還你,即使再忙也要看完

佛說:人若欠你,天必還你,即使再忙也要看完

金沛的國學筆記
2026-05-02 11:42:14
上海VS山東G1拒絕爆冷!張鎮(zhèn)麟攜手洛夫頓挑大梁,邱彪敗仗吃定?

上海VS山東G1拒絕爆冷!張鎮(zhèn)麟攜手洛夫頓挑大梁,邱彪敗仗吃定?

老葉評球
2026-05-04 10:07:54
來吃一個最近華爾街的超級大瓜

來吃一個最近華爾街的超級大瓜

債市邦
2026-05-03 21:37:04
大特務毛人鳳子女現(xiàn)狀:長子是富士康董事長,三子是著名愛國華僑

大特務毛人鳳子女現(xiàn)狀:長子是富士康董事長,三子是著名愛國華僑

史之銘
2026-05-02 22:37:25
iPhone 18 Pro首發(fā)!iOS 27定檔6月:四款機型被淘汰

iPhone 18 Pro首發(fā)!iOS 27定檔6月:四款機型被淘汰

快科技
2026-05-04 09:13:04
日本人最有錢的時候吃得有多奢侈?深扒八十年代日本人奢華餐桌

日本人最有錢的時候吃得有多奢侈?深扒八十年代日本人奢華餐桌

食色那些事
2026-05-03 12:20:12
不用截機也不用包圍,賴清德回程的路,可能比出來時更難走

不用截機也不用包圍,賴清德回程的路,可能比出來時更難走

光輝與陰暗
2026-05-03 20:42:50
購買中國戰(zhàn)斗機不給錢,七次追債都沒還,這個囂張小國報應來了

購買中國戰(zhàn)斗機不給錢,七次追債都沒還,這個囂張小國報應來了

飄逸語人
2026-05-03 10:57:51
亮劍中趙剛死前透露:李云龍當年不顧降職也要斬山貓子是另有原因

亮劍中趙剛死前透露:李云龍當年不顧降職也要斬山貓子是另有原因

呆子的故事
2026-02-09 14:19:33
教育部正式設立太極拳本科專業(yè)

教育部正式設立太極拳本科專業(yè)

名人茍或
2026-05-04 07:38:20
港股全線大漲,半導體科網(wǎng)股爆發(fā),天數(shù)智芯飆漲12%,小米漲超8%

港股全線大漲,半導體科網(wǎng)股爆發(fā),天數(shù)智芯飆漲12%,小米漲超8%

21世紀經(jīng)濟報道
2026-05-04 10:38:36
周總理與十大元帥的關系,其實比毛主席與十大元帥更近

周總理與十大元帥的關系,其實比毛主席與十大元帥更近

元哥說歷史
2026-05-03 15:10:03
2026-05-04 12:39:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
133102文章數(shù) 862137關注度
往期回顧 全部

教育要聞

新傳考研名詞解釋:算法囚徒

頭條要聞

美軍將在霍爾木茲海峽有重大行動 由特朗普親自指示

頭條要聞

美軍將在霍爾木茲海峽有重大行動 由特朗普親自指示

體育要聞

曼聯(lián)3-2雙殺利物浦!提前三輪鎖定歐冠資格 梅努制勝

娛樂要聞

嚴浩翔新歌,父母離婚17年矛盾升級

財經(jīng)要聞

魔幻的韓國股市,父母給嬰兒開戶買股票

科技要聞

OpenAI“復活”了QQ寵物,網(wǎng)友直接玩瘋

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

藝術
本地
教育
房產(chǎn)
軍事航空

藝術要聞

奧托·馮·托倫:19世紀奧地利著名動物/風景畫家

本地新聞

用青花瓷的方式,打開西溪濕地

教育要聞

一模之后,中考之前……

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進入關懷版