国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.2發(fā)布即降智?背后華人被挖出,清北校友核心貢獻(xiàn)

0
分享至


新智元報(bào)道

編輯:Aeneas

【新智元導(dǎo)讀】號稱滿分屠榜的GPT-5.2,一發(fā)布就降智了?許多網(wǎng)友現(xiàn)身表示,似乎確實(shí)比開始弱了很多。但提前實(shí)測的網(wǎng)友表示,它的確很強(qiáng),甚至當(dāng)?shù)闷餑PT-6之稱!

昨夜,OpenAI放出了GPT-5.2炸彈。

根據(jù)官方公布的基準(zhǔn)測試,它幾乎完全碾壓Gemini 3 Pro。

GPT-5.2最擅長幫人們完成有經(jīng)濟(jì)價(jià)值的任務(wù),比如做電子表格、做PPT、寫代碼和審查代碼、分析長文檔等等。

而且號稱在GDPval等基準(zhǔn)測試中,有70.9%的時(shí)間能追趕甚至吊打?qū)I(yè)人士。

可以說,這是OpenAI進(jìn)入紅色預(yù)警,甚至不惜改變AGI目標(biāo),都要完成的一個(gè)產(chǎn)品,而且還身負(fù)著狙擊Gemini 3的重任。


所以,GPT-5.2實(shí)測起來,體感究竟如何?

GPT-5.2實(shí)測:一上線就降智?

出乎意料都是,一個(gè)GPT-5.2實(shí)測翻車的帖子,在X上火了。

如果向它提問:「garlic」中有多少個(gè)R?它會(huì)回答:0個(gè)。


相比之下,其他模型的表現(xiàn)就要穩(wěn)定得多。


歸根結(jié)底,這是LLM的一個(gè)底層問題:因?yàn)閠okenization而無法統(tǒng)計(jì)字母數(shù)量。

不過,只要強(qiáng)制選到Thinking版本,GPT-5.2就能答對這個(gè)問題了。



在reddit上,也有很多網(wǎng)友表示:在GPT-5.2剛發(fā)布的時(shí)候,似乎功能還很強(qiáng)。

結(jié)果幾個(gè)小時(shí)后,它緊接著就降智了。


有人表示,自己早上八點(diǎn)半開始用的時(shí)候還好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。


似乎每次新模型一發(fā)布,幾小時(shí)后就會(huì)被削弱,OpenAI這是什么操作?


大佬現(xiàn)身說法:還是挺強(qiáng)的

不過這點(diǎn)小插曲,還是沒有影響坊間的正面評論。

昨晚GPT-5.2一發(fā)布,網(wǎng)友們就被震撼了。

比如有人說,ARC-AGI 2的這次飛躍屬實(shí)瘋狂,OpenAI究竟是怎么做到的?




本來大家還以為OpenAI已經(jīng)落后谷歌了,看來并沒有!


看起來,OpenAI內(nèi)部還捂著不少厲害的東西沒發(fā)布。


而且,領(lǐng)略過GPT-5.2超強(qiáng)滿血版的用戶,對它是一致好評。


沃頓商學(xué)院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能還是令人印象很深刻的。


比如下面這個(gè)任務(wù):創(chuàng)建一個(gè)視覺上有趣的著色器,可以在twigl-dot-app中運(yùn)行,使其看起來像一座無限的新哥特式塔樓城市,部分淹沒在波濤洶涌的海洋中。

對于這個(gè)視頻,很多網(wǎng)友大加贊嘆:GPT-5.2不僅遵循了指令,還在代碼中選擇了非常合理的審美和結(jié)構(gòu)。



然后,教授又讓GPT-5.2繪制一張人類歷年考試成績的圖表。


這個(gè)任務(wù)十分復(fù)雜,因?yàn)樾枰谶^程中查找和交叉引用大量資料,然后一次性就生成有用的結(jié)果。

可以看到,GPT-5.2的表現(xiàn)十分驚艷。


這個(gè)Twigl代碼的實(shí)例,顯出了GPT-5.2的強(qiáng)大編碼能力。


推理、數(shù)學(xué)、編程的重大飛躍

Magicpathai的CEO表示,自己已經(jīng)測試GPT-5.2有一段時(shí)間了。

他對于這個(gè)模型的評價(jià)是——「復(fù)雜推理、數(shù)學(xué)、編程和模擬方面的一次重大飛躍」。


在下面這個(gè)實(shí)例中,它在單個(gè)文件中就構(gòu)建了一個(gè)完整的3D圖形引擎,還支持交互式控制,分辨率達(dá)到4K。

在這個(gè)視頻中,他還用GPT-5.2進(jìn)行了高難度推理。

有人質(zhì)疑道:這個(gè)圖形引擎會(huì)不會(huì)是GPT-5.2調(diào)庫完成的?CEO表示,所有代碼和圖形完全是從0開始寫的。


也就是說,GPT-5.2的進(jìn)步不是漸進(jìn)式的,而是編碼助手功能的徹底范式轉(zhuǎn)變。


網(wǎng)友們驚呼:這種進(jìn)步的速度,實(shí)在是令人頭暈?zāi)垦!?/p>


這位CEO對于GPT-5.2的評價(jià)是:它是OpenAI推出的最佳智能體模型,可以連續(xù)運(yùn)行大量工具而不會(huì)出現(xiàn)問題,并且比其前代產(chǎn)品速度更快。

為了測試它的功能,他構(gòu)建了一個(gè)智能體,可以同時(shí)使用GPT-5.2、5.1和5。

結(jié)果顯示,GPT-5.2調(diào)用工具時(shí)無需任何前導(dǎo)碼,而且即使在長時(shí)間會(huì)話中,也不會(huì)迷失方向。


還有人讓GPT-5.2用ASCII寫出了自己的內(nèi)心世界,答案很震撼。


總之,在大多數(shù)人的反饋中,GPT-5.2能穩(wěn)定地處理實(shí)際工作,條理清晰,工作流程順暢。


相比于會(huì)出現(xiàn)小中斷的舊模型,GPT-5.2對于任務(wù)的理解更強(qiáng),完成得也更順利。


ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分為90.5%,這就意味著,AI在一年內(nèi)效率已經(jīng)提高了約390倍。



背后神秘華人,浮出水面

同以往一樣,這次GPT-5.2的幕后功臣,依然有不少華人。

比如,最早預(yù)告GPT-5.2的OpenAI華人研究員、北大校友Yu Bai。


他本科在北大學(xué)習(xí)數(shù)學(xué),在斯坦福獲得統(tǒng)計(jì)學(xué)博士學(xué)位。


負(fù)責(zé)后訓(xùn)練的Yun Dai,本科來自清華大學(xué),在加州大學(xué)爾灣分校獲得了計(jì)算機(jī)科學(xué)碩士學(xué)位。


另一位OpenAI華人研究員Zuxin Liu,從事推理模型后訓(xùn)練工作。

他本科畢業(yè)于北航,在CMU攻讀碩士和博士學(xué)位。


Aston Zhang來自在伊利諾伊大學(xué)厄巴納-香檳分校攻讀博士學(xué)位,現(xiàn)在是OpenAI的研究員。


他感謝了團(tuán)隊(duì),尤其強(qiáng)調(diào)了GPT-5.2 Thinking的處理多步驟任務(wù)能力。


總之,昨晚的AI大戰(zhàn),OpenAI給出了強(qiáng)烈一擊。

接下來,谷歌又會(huì)拿出什么來應(yīng)對呢?

參考資料:

https://x.com/skirano/status/1999182295685644366

https://x.com/emollick/status/1999185085719887978

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
男子植6個(gè)心臟支架去世,該院醫(yī)生7次致電勸其再做手術(shù),稱外聘專家需湊夠患者,“多做1個(gè)支架多活十年”

男子植6個(gè)心臟支架去世,該院醫(yī)生7次致電勸其再做手術(shù),稱外聘專家需湊夠患者,“多做1個(gè)支架多活十年”

觀威海
2025-12-26 09:06:03
汪精衛(wèi)建立的“汪偽政府”到底多大?當(dāng)時(shí)國際上有哪些國家承認(rèn)?

汪精衛(wèi)建立的“汪偽政府”到底多大?當(dāng)時(shí)國際上有哪些國家承認(rèn)?

史之銘
2025-12-13 05:01:10
云南省省長:要深刻檢查反思,查明事故原因,嚴(yán)肅追究責(zé)任

云南省省長:要深刻檢查反思,查明事故原因,嚴(yán)肅追究責(zé)任

新京報(bào)
2025-12-25 17:36:10
再見庫明加,勇士籃網(wǎng)國王商討3方交易!27+冠軍前鋒輔佐庫里沖冠

再見庫明加,勇士籃網(wǎng)國王商討3方交易!27+冠軍前鋒輔佐庫里沖冠

毒舌NBA
2025-12-26 09:37:58
不查不知道,
一查才發(fā)現(xiàn),

不查不知道, 一查才發(fā)現(xiàn),

小光侃娛樂
2025-12-25 22:20:03
2005年必將載入人類史冊的7大事件

2005年必將載入人類史冊的7大事件

史政先鋒
2025-12-24 15:13:06
46條中日航線取消才1天,就炸出一群“牛鬼蛇神”,鄭強(qiáng)說對了

46條中日航線取消才1天,就炸出一群“牛鬼蛇神”,鄭強(qiáng)說對了

呼呼歷史論
2025-12-26 13:28:10
紫牛頭條 | 都以為他是醫(yī)生,實(shí)際是個(gè)糖藝師!小伙用解剖學(xué)手法“手搓”人像太逼真

紫牛頭條 | 都以為他是醫(yī)生,實(shí)際是個(gè)糖藝師!小伙用解剖學(xué)手法“手搓”人像太逼真

揚(yáng)子晚報(bào)
2025-12-25 20:39:06
霍思燕這次真的把我笑到了。別人參加活動(dòng)不是曬娃、秀恩愛,

霍思燕這次真的把我笑到了。別人參加活動(dòng)不是曬娃、秀恩愛,

小光侃娛樂
2025-12-26 07:55:03
張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

歷史回憶室
2025-12-16 14:26:14
上海警方:侯某,記21分+罰款3100元+暫扣車輛!

上海警方:侯某,記21分+罰款3100元+暫扣車輛!

新民晚報(bào)
2025-12-25 18:23:17
倒反天罡!小米高管稱“奔馳是面子,小米是里子”,網(wǎng)友炸鍋

倒反天罡!小米高管稱“奔馳是面子,小米是里子”,網(wǎng)友炸鍋

西門老爹
2025-12-26 15:04:43
姜昆回應(yīng),視頻為拼接,人一直在國內(nèi),蹭熱度的楊儀又被打臉了

姜昆回應(yīng),視頻為拼接,人一直在國內(nèi),蹭熱度的楊儀又被打臉了

李健政觀察
2025-12-26 12:19:52
又漲了!2026年1月起,深圳市醫(yī)療保險(xiǎn)繳費(fèi)比例上調(diào)通知!

又漲了!2026年1月起,深圳市醫(yī)療保險(xiǎn)繳費(fèi)比例上調(diào)通知!

上海當(dāng)?shù)貙?/span>
2025-12-26 10:47:54
呂良偉70大壽:楊受成彎腰舉杯、章小惠胖出水桶腰、王晶鍋蓋頭

呂良偉70大壽:楊受成彎腰舉杯、章小惠胖出水桶腰、王晶鍋蓋頭

小小李?yuàn)?/span>
2025-12-25 20:50:09
印度在這四個(gè)領(lǐng)域,悄悄領(lǐng)先了中國?這些數(shù)據(jù)讓人不得不服

印度在這四個(gè)領(lǐng)域,悄悄領(lǐng)先了中國?這些數(shù)據(jù)讓人不得不服

知識TNT
2025-12-25 11:03:56
吳尊一家過圣誕節(jié),被44歲的汪東城成功搶鏡!不結(jié)婚少年感仍然在

吳尊一家過圣誕節(jié),被44歲的汪東城成功搶鏡!不結(jié)婚少年感仍然在

小咪侃娛圈
2025-12-26 10:33:08
翻倍牛股,7連板,歷史新高!

翻倍牛股,7連板,歷史新高!

新浪財(cái)經(jīng)
2025-12-26 16:05:50
野外僅存600多只!浙江4人徒手抓26只,價(jià)值10多萬

野外僅存600多只!浙江4人徒手抓26只,價(jià)值10多萬

萬象硬核本尊
2025-12-25 20:18:21
“父母窮,孩子連穿粉色棉襖的資格都沒有”,家長直言:厭惡女兒

“父母窮,孩子連穿粉色棉襖的資格都沒有”,家長直言:厭惡女兒

妍妍教育日記
2025-12-26 17:57:01
2025-12-26 18:39:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14188文章數(shù) 66398關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

村民稱家中110只懷孕母羊被毒死 投毒者是父親好友

頭條要聞

村民稱家中110只懷孕母羊被毒死 投毒者是父親好友

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

數(shù)碼
游戲
手機(jī)
教育
軍事航空

數(shù)碼要聞

新一代顯示標(biāo)桿 榮耀WIN全球首發(fā)1.5K 185Hz直屏

韓國人果然還是太壓抑了!乳膠化冰這種劇情,到底怎么想出來的!

手機(jī)要聞

10000mAh電池+散熱風(fēng)扇!榮耀發(fā)布WIN系列電競旗艦

教育要聞

教育部禁令后學(xué)校抽成猛漲3倍!2年食堂返點(diǎn)330萬,竟然存私賬?

軍事要聞

烏最新20點(diǎn)俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進(jìn)入關(guān)懷版