国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

比DeepSeek貴了400倍,GPT-5.2想錢想瘋了?

0
分享至


比 DeepSeek 貴 400 倍,比谷歌的 Gemini 3 Pro 貴將近 10 倍。

OpenAI 剛剛發(fā)布的 GPT-5.2 ,到底是什么水平?


這么說吧,這家伙或許是最適合打工人的AI,因為它很可能開啟了 AI 從人類助手到專家的轉(zhuǎn)變。

首先是在專業(yè)知識上,GPT-5.2 有 7 成的把握,能打敗正在屏幕前,刷視頻的各位行業(yè)專家們。

只看跑分的話,這次的 GPT-5.2 在各個維度上,都要比 Gemini 3 Pro 高了那么一點點。

當(dāng)然,也只高了一點點,不排除 OpenAI 是對著 Gemini 刷分的可能。


但這次 OpenAI 最在意的,其實是最后的這個 GDPval 測試成績。

這是他們在今年的925提出來了的一個全新測試方式,用來衡量 AI ,能否真的來幫打工人完成工作。


于是他們找了九個領(lǐng)域四十四個行業(yè)的專家們過來,結(jié)合他們的工作環(huán)境來出了一堆題目。

然后來看 AI 能否完成這些專家們的工作。


而結(jié)果就是,最新的 GPT-5.2 能在七成的工作上,打平,甚至做的比人類更好。

咱們也簡單的體驗了一下這個新模型,讓 GPT-5.2 去互聯(lián)網(wǎng)上統(tǒng)計這些 AI 公司發(fā)布的所有模型。


然后把這些模型在各個排行榜上刷出來的分?jǐn)?shù)給統(tǒng)計下來,最后按照月份,把這些成績給做成表格。

結(jié)果在整整 14 分鐘的思考后。GPT-5.2 成功的幫咱們把這一系列數(shù)據(jù)收集,結(jié)果統(tǒng)計,表格繪制的任務(wù)都給完成掉了。


這么個完成度,確實看起來不錯。


除此之外,GPT-5.2還能完成一些復(fù)雜的表格工作,做出來的表格不但比過去的自己做的表格要美觀許多。


而且在各項任務(wù)的測試指標(biāo)上,也有了 9% 左右的提升。

在寫代碼這塊,GPT-5.2 也有了不少的提升,


產(chǎn)生幻覺的概率要比之前降低了 38%

屬于是想讓大家能用的更加放心了。

我們也簡單的測試了一下,但可能是因為有了 Gemini 珠玉在前的緣故,GPT-5.2 給我的感覺,就有那么一些平平無奇了。

讓它來寫個 Aimlab (練習(xí)瞄準(zhǔn)的小游戲)

它也確實能寫出來,寫出來的程序不但能跑,還能調(diào)整靶子大小,游戲時長這些基本參數(shù)。


這些都沒啥毛病,但就是有些太中規(guī)中矩了。

審美這塊,有點被上個月發(fā)布的 Gemini 3 給暴打了。


同樣一句話做出來的小游戲,Gemini 已經(jīng)開始考慮各種時髦的配色了,GPT 還在刷大白墻,做毛坯房。

當(dāng)然,也有可能是我沒有指定 GPT 要做成啥樣的緣故。

除了各項工作能力的提升之外,這次 GPT-5.2 還有一個非常有趣的變化。

它變的更能聽得懂人話了。

有人在測試的時候發(fā)現(xiàn),讓 GPT 寫 50 個創(chuàng)意,它就會認(rèn)認(rèn)真真的去寫 50 個創(chuàng)意,而不是像過去的模型一樣,寫 10 個點子就開始擺爛。


除此之外,在上下文能力上方面,OpenAI 也補(bǔ)強(qiáng)了一波,在插針實驗中,即便是文本長度到了 256K,成功率依舊是接近百分之百。


這相當(dāng)于幾十萬字的名著里,你偷偷在幾個地方加了點料,罵了我?guī)拙?,他都能精?zhǔn)找出來。

這對于寫代碼、搞學(xué)術(shù)、總結(jié)整理文書的打工人、科研狗來說,又是一大增強(qiáng)。

雖然上面的紙面實力這么強(qiáng),但,還是在一些地方翻了車。

比如在官方展示的圖像識別案例上,大伙們發(fā)現(xiàn),Gemini 3 Pro 的顆粒度直接爆殺 GPT 5.2.


也有人吐槽,新模型發(fā)了,那老版本估計又要降智了。。。

屬于是經(jīng)典老番了。

最后呢, GPT-5.2 的發(fā)布,其實也讓咱們看到了一種趨勢。

那就是在未來,頂級模型之間的差異,也可能越來越明顯,各個都偏那么一點點科。

比如 Gemini 可能在全模態(tài)領(lǐng)域一騎絕塵;GPT 在邏輯推理、生產(chǎn)力方面,也依舊走在同行前頭;Claude 則在代碼能力和寫作上,繼續(xù)遙遙領(lǐng)先。

畢竟在怎么實現(xiàn) AGI 這個問題上,大廠們的差異已經(jīng)凸顯。谷歌可能覺得,多模態(tài)能感知世界才是未來;OpenAI則信仰極致的邏輯推理和生產(chǎn)力的提升;Anthropic 認(rèn)為高維度的語義理解和對齊,才能通往 AGI。

反正 AI 大哥位置輪流坐的現(xiàn)狀,還在繼續(xù),按順序來,下一個出招的應(yīng)該是Anthropic 了。


對了,結(jié)尾我也想再催催,奧特曼答應(yīng)好各位哥們的成人模式,到底啥時候上啊?

撰文:江江 & 早起

編輯:江江 & 面線

美編:煥妍

圖片、資料來源:OpenAI 官網(wǎng)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
海南封關(guān)動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉(zhuǎn)港

海南封關(guān)動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉(zhuǎn)港

一盅情懷
2025-12-19 15:50:07
中央最近亮劍了,十五五規(guī)劃直接把“遮羞布”扯了下來。

中央最近亮劍了,十五五規(guī)劃直接把“遮羞布”扯了下來。

南權(quán)先生
2025-12-16 16:24:33
夫妻常年分居,究竟有多危險?響水金店付某婷事件戳破了多少家庭

夫妻常年分居,究竟有多危險?響水金店付某婷事件戳破了多少家庭

沒有偏旁的常慶
2025-11-27 08:00:06
固態(tài)電池出現(xiàn)變數(shù),安全測試全軍覆沒?

固態(tài)電池出現(xiàn)變數(shù),安全測試全軍覆沒?

環(huán)球零碳
2025-12-17 21:22:14
羅永浩吐槽電信寬帶:獨享千兆不足百兆,不解決要發(fā)瘋了

羅永浩吐槽電信寬帶:獨享千兆不足百兆,不解決要發(fā)瘋了

三言科技
2025-12-19 09:21:04
明朝的一首詞,抵得過千萬首唐詩宋詞,因為這首詞全篇都是名句

明朝的一首詞,抵得過千萬首唐詩宋詞,因為這首詞全篇都是名句

長風(fēng)文史
2025-12-18 15:00:28
老婆被外派非洲8年,直到偶遇她上司,驚訝知道:她5年前就離職了

老婆被外派非洲8年,直到偶遇她上司,驚訝知道:她5年前就離職了

農(nóng)村情感故事
2025-12-07 15:05:41
澳門回歸前,富商馬萬祺前來提醒:請向中央反映,澳門必須駐軍

澳門回歸前,富商馬萬祺前來提醒:請向中央反映,澳門必須駐軍

壹知眠羊
2025-12-19 07:17:58
一種讓你變老又頭禿的飲料,很多人天天在喝!

一種讓你變老又頭禿的飲料,很多人天天在喝!

貓大夫醫(yī)學(xué)科普
2025-12-19 06:47:52
外交部:中方在TikTok問題上的立場是一貫明確的

外交部:中方在TikTok問題上的立場是一貫明確的

環(huán)球網(wǎng)資訊
2025-12-19 15:50:37
央視直播一場英超,利物浦強(qiáng)強(qiáng)對話,阿森納對手不弱,曼城盼登頂

央視直播一場英超,利物浦強(qiáng)強(qiáng)對話,阿森納對手不弱,曼城盼登頂

嗨皮看球
2025-12-19 17:58:19
中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

慧眼看世界哈哈
2025-12-19 11:50:03
針對臺灣問題,攤牌了!美國國防部今天表態(tài)了!

針對臺灣問題,攤牌了!美國國防部今天表態(tài)了!

安安說
2025-12-19 09:59:44
寧靜太敢說!綜藝?yán)镌u張柏芝兒子“全是賠錢貨”,張柏芝霸氣回懟

寧靜太敢說!綜藝?yán)镌u張柏芝兒子“全是賠錢貨”,張柏芝霸氣回懟

好賢觀史記
2025-12-19 14:49:49
連續(xù)16年無緣執(zhí)法世界杯!韓媒熱議:恥辱,中國裁判都去了

連續(xù)16年無緣執(zhí)法世界杯!韓媒熱議:恥辱,中國裁判都去了

邱澤云
2025-12-19 15:15:17
劉威:何晴的離去我很遺憾,但并不想糾纏,只想珍惜眼前人

劉威:何晴的離去我很遺憾,但并不想糾纏,只想珍惜眼前人

樂悠悠娛樂
2025-12-19 13:07:58
英媒曝光俄絕密文件:一旦俄與北約開戰(zhàn),普京先打中國的兩個鄰國

英媒曝光俄絕密文件:一旦俄與北約開戰(zhàn),普京先打中國的兩個鄰國

滄海旅行家
2025-12-19 12:27:40
中方出面調(diào)停,柬泰表示歡迎

中方出面調(diào)停,柬泰表示歡迎

環(huán)球網(wǎng)資訊
2025-12-19 07:00:13
烏克蘭一位母親的采訪讓人破防:三個女兒都嫁中國人,不要彩禮

烏克蘭一位母親的采訪讓人破防:三個女兒都嫁中國人,不要彩禮

南權(quán)先生
2025-12-19 16:35:22
郎平前夫近況:15年堅持不娶全心陪伴女兒,今年過六旬再婚生子

郎平前夫近況:15年堅持不娶全心陪伴女兒,今年過六旬再婚生子

睿鑒歷史
2025-12-15 18:25:03
2025-12-19 19:47:00
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10007文章數(shù) 489324關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

“南京導(dǎo)航集體失靈”原因披露 北斗軍用頻率不受影響

頭條要聞

“南京導(dǎo)航集體失靈”原因披露 北斗軍用頻率不受影響

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

本地
親子
旅游
公開課
軍事航空

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

親子要聞

幼師專業(yè)大幅縮招,去年幼兒園教師減少超24萬

旅游要聞

冷空氣明晚殺到!暴跌10℃!入冬沖刺!我們準(zhǔn)備了安吉云上草原玩雪工會會員驚喜價→

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進(jìn)入關(guān)懷版