国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5能讓普通人變成博士,但魔法依舊沒有

0
分享至

千呼萬喚始出來的GPT-5終于在昨天晚上1點(diǎn)問世,在持續(xù)了一個(gè)小時(shí)10分鐘的發(fā)布會(huì)上,OpenAI向世人展示了一個(gè)性能絕對(duì)強(qiáng)大,更加易用,甚至能夠理解或者說準(zhǔn)確猜測(cè)用戶真實(shí)意圖并且交付符合預(yù)期的產(chǎn)品的大模型。

用Sam Altman在發(fā)布會(huì)上的話來說,GPT-5在各個(gè)領(lǐng)域都能達(dá)到博士的知識(shí)水平,能力可以比肩專業(yè)人士,從而讓普通人能夠完成以前自己無法想象的工作。

相比于OpenAI兩年前發(fā)布GPT-4時(shí),整個(gè)世界對(duì)于大模型的認(rèn)知和體驗(yàn)已經(jīng)充分得多。觀眾和用戶已經(jīng)不會(huì)對(duì)模型能夠看懂網(wǎng)絡(luò)梗圖這種事情感到驚嘆不已。但是作為一個(gè)幾乎每天都會(huì)使用AI產(chǎn)品的人來說,GPT-5的發(fā)布依然足夠驚艷。

最重要的原因就是,從發(fā)布會(huì)上傳達(dá)出的內(nèi)容,我能深切地感受到,OpenAI想讓大模型已經(jīng)從一個(gè)“玩弄”語言和“智能”,不時(shí)讓人感受到驚喜和挫敗的大玩具,加速進(jìn)化到一個(gè)生活中的可靠幫手。就像你的手機(jī)一樣,如果你離開它,你將深刻地感受到不方便,不習(xí)慣,甚至不安全。

下面我將用發(fā)布會(huì)的幾個(gè)瞬間來幫助大家理解這一切是怎么發(fā)生的。

孩子讓你給他解釋流體力學(xué)中的伯努利公式,以前的AI可能給你一篇文章,GPT-5能按照你的要求,一句話直接給你做一個(gè)可以互動(dòng)的頁面。

你想學(xué)習(xí)法語,GPT-5能按照你的要求去生成一個(gè)像多鄰國(guó)一樣的學(xué)習(xí)應(yīng)用,你可以用來背單詞,還能通過貪食蛇來幫你復(fù)習(xí)。如果你對(duì)生成的應(yīng)用有不滿意的地方,也可以直接通過自然語言讓GPT-5幫你修改。

如果你是一個(gè)創(chuàng)業(yè)公司的CFO,你可以讓GPT-5用大概3分鐘的時(shí)間,根據(jù)你的所有數(shù)據(jù),生成一個(gè)詳細(xì)的財(cái)務(wù)狀況的可互動(dòng)的演示板。而你需要的僅僅是一個(gè)100字左右的描述。GPT-5可以從零生成代碼,保證完成,它能猜測(cè)你想呈現(xiàn)的形式并自動(dòng)幫你優(yōu)化代碼和呈現(xiàn)的效果。

最夸張的是,演示中OpenAI的工作人員直接用3段提示詞,就讓GPT-5生成了一個(gè)帶射擊小游戲功能的城堡3D模型,還能和城堡上的士兵聊天。你點(diǎn)擊周圍的氣球,就能發(fā)射彈藥把氣球打爆,同時(shí)還會(huì)伴隨爆炸的音效。

從演示中我們可以看出,GPT-5已經(jīng)全面進(jìn)化成為一個(gè)直接輸出專業(yè)產(chǎn)品的萬能百寶箱。

但是說實(shí)話,最讓我感到觸動(dòng)的,是OpenAI關(guān)于醫(yī)療健康方面能力的介紹。OpenAI邀請(qǐng)了一個(gè)從3種癌癥中康復(fù)的患者,讓她聊了聊自己在抗癌過程中GPT-5給她的幫助。

她說,當(dāng)她得到診斷結(jié)果的時(shí)候,醫(yī)生給她提供了幾種治療方案進(jìn)行選擇。她在求助了GPT-5之后,才真正理解了自己面臨的情況,而將自己的情況和GPT-5詳細(xì)聊過之后,她做出了最適合自己的選擇,最終戰(zhàn)勝了病魔,獲得了重生。她很難想象如果沒有GPT-5的專業(yè)建議,完全沒有醫(yī)療專業(yè)知識(shí)的自己如何能夠理解醫(yī)生給她的方案和選擇,更不知道最后自己是否能挺過來。

看完發(fā)布會(huì)之后,能清晰地感覺到,大模型技術(shù)本身已經(jīng)進(jìn)入了一個(gè)相對(duì)穩(wěn)定的發(fā)展曲線。GPT-5發(fā)布代表著OpenAI也沒有其他“魔法”,讓大模型能力產(chǎn)生跨越式的發(fā)展。而接下來的AI巨頭們的冷兵器戰(zhàn)爭(zhēng),將會(huì)越加焦灼。

性能介紹

模型系統(tǒng)

GPT-5 不再是一個(gè)模型,而是一個(gè)模型系統(tǒng):

? 自動(dòng)切換器判斷查詢意圖

? 簡(jiǎn)單問題路由到聊天版本(極速響應(yīng))

? 復(fù)雜問題路由到推理版本(深度思考)

256k token上下文窗口,支持文本和圖像輸入,支持函數(shù)調(diào)用和結(jié)構(gòu)化輸出。

目前打開我自己的ChatGPT,發(fā)現(xiàn)左上角的模型選項(xiàng)已經(jīng)默認(rèn)為“GPT-5”,而且下拉選項(xiàng)中也不再能看到前代模型。正如奧特曼之前就承諾過的——GPT-5時(shí)代將不會(huì)再有繁瑣的模型選擇,由模型自行判斷用戶在當(dāng)下情境是需要快速響應(yīng),還是需要深度思考和推理。

編碼和寫作

OpenAI將GPT-5稱為“我們迄今為止最強(qiáng)大的編碼模型”,在復(fù)雜的前端生成和大型代碼庫的調(diào)試方面表現(xiàn)出色。它通常只需一次提示就能創(chuàng)建美觀且響應(yīng)迅速的網(wǎng)站、應(yīng)用程序和游戲,并兼具美感,直觀而優(yōu)雅地將創(chuàng)意轉(zhuǎn)化為現(xiàn)實(shí)。

此外,OpenAI也稱GPT-5是“我們迄今為止最強(qiáng)大的寫作工具”,可以寫出引人入勝、富有文學(xué)深度和節(jié)奏感的文本。它能夠更可靠地處理結(jié)構(gòu)模糊的寫作,例如持續(xù)不押韻的抑揚(yáng)格五音步或流暢自然的自由詩,將對(duì)形式的尊重與清晰的表達(dá)相結(jié)合。這意味著 ChatGPT 能夠更好地幫助用戶完成日常任務(wù),例如起草和編輯報(bào)告、電子郵件、備忘錄等。

我們也淺淺嘗試了一下新模型的作詩能力,以“秋天的第一杯奶茶”為題,的確比GPT-4要自然很多(AI味兒沒那么重了)。

評(píng)估

GPT-5 的全面智能化程度顯著提升,這體現(xiàn)在它在學(xué)術(shù)和人工評(píng)估基準(zhǔn)測(cè)試中的表現(xiàn)上,尤其是在數(shù)學(xué)、編碼、視覺感知和健康領(lǐng)域。

在數(shù)學(xué)(AIME 2025 無需工具測(cè)試得分 94.6%)、真實(shí)世界編碼(SWE-bench Verified 得分 74.9%,Aider Polyglot 得分 88%)、多模態(tài)理解(MMMU 得分 84.2%)和健康(HealthBench Hard 得分 46.2%)方面均創(chuàng)下了新的最高水平——這些提升在日常使用中得到了充分體現(xiàn)。

憑借 GPT-5 pro 的擴(kuò)展推理能力,該模型還在GPQA上創(chuàng)下了新的最高水平,無需工具測(cè)試得分高達(dá) 88.4%。

GPT-5已經(jīng)在LMArean登頂。

在Intelligence Analysis獲得的預(yù)覽訪問中,GPT-5同樣獲得了第一名。

幻覺降低

在啟用搜索的情況下,GPT-5出現(xiàn)事實(shí)性錯(cuò)誤的概率比GPT-4o降低約45%。在“思考(thinking)”模式下,這一概率比OpenAI o3降低80%。

除了事實(shí)性錯(cuò)誤之外,AI還經(jīng)?!氨犞劬φf瞎話”,比如明明做不到/沒有權(quán)限做的事情,它也許會(huì)元?dú)鉂M滿地告訴你已經(jīng)搞定了,GPT-5在“欺騙”方面也表現(xiàn)得更好、更誠實(shí)。例如,為了測(cè)試這一點(diǎn),OpenAI從多模態(tài)基準(zhǔn)測(cè)試 CharXiv 的提示中刪除了所有圖像,結(jié)果發(fā)現(xiàn) OpenAI o3 仍然能夠以 86.7% 的概率對(duì)不存在的圖像給出自信的答案,而 GPT-5 的這一比例僅為 9%。

更“高效”,更“節(jié)省”

在OpenAI的評(píng)估中,GPT-5(具備思考能力)的表現(xiàn)優(yōu)于 OpenAI o3,在視覺推理、代理編碼和研究生水平的科學(xué)問題解決等功能上,輸出 token 數(shù)量減少了 50% 至 80%。

也就是說,GPT-5 用更少的思考時(shí)間實(shí)現(xiàn)了更大的價(jià)值。

API

API價(jià)格方面,GPT-5性能最強(qiáng),價(jià)格卻低得離譜,看來OpenAI是掌握了跨代的優(yōu)化方法。

OpenAI和奧特曼對(duì)GPT-5無疑是寄予厚望的,他們也清楚,外界期待這一代模型已經(jīng)很久。

奧特曼稱,這還是第一次,真的像是在與某個(gè)領(lǐng)域的專家對(duì)話。如果說GPT-4o是大學(xué)生,那GPT-5就是博士級(jí)的專家。

這種重視,在發(fā)布會(huì)時(shí)長(zhǎng)上也有所體現(xiàn),以往的新模型發(fā)布,OpenAI的線上發(fā)布會(huì)只有半個(gè)小時(shí)左右,這次持續(xù)了一個(gè)小時(shí)以上。而奧特曼本人,也在發(fā)布會(huì)進(jìn)行的同時(shí),在X(前推特)上發(fā)帖進(jìn)行“文字直播”。

不過也許是心急,發(fā)布會(huì)PPT里出現(xiàn)大錯(cuò)誤——在“SWE-bench(人工驗(yàn)證版)”相關(guān)的圖表中,條形圖明顯不對(duì)。GPT-5不加思考(thinking)的準(zhǔn)確率為52.8%,在圖上卻高于OpenAI o3是69.1%,而o3的69.1%,又和GPT-4o的30.8%一樣高。

所以很尷尬的一幕出現(xiàn)了:奧特曼在“文字直播”發(fā)布會(huì),很多網(wǎng)友卻在評(píng)論區(qū)發(fā)這張截圖,戲謔OpenAI離了大譜的圖表。

奧特曼倒是大方轉(zhuǎn)發(fā)了消息并且稱已經(jīng)改正,一些粉絲認(rèn)為這只是無心之失。但不少人卻覺得這是“有意為之”,是為了讓GPT-5顯得厲害在圖表上玩花招,甚至稱之為“本世紀(jì)最大的圖表犯罪”。

這大概也在表明,GPT-5的發(fā)布會(huì)沒能讓所有人信服,不少人開始問“GPT-6什么時(shí)候出”。

馬斯克已經(jīng)跳出來,直言兩周前發(fā)布的Grok 4 Heavy比GPT-5更智能。

而一向喜歡潑冷水的AI學(xué)者蓋里·馬庫斯(Gary Marcus)在贊揚(yáng)GPT-5有很多良好進(jìn)展的同時(shí),稱這“并非一個(gè)巨大的飛躍”,GPT-5也夠不上外界的期待。

“顯然不是AGI?!?/p>

GPT-5是否足夠好?還需要更多時(shí)間檢驗(yàn)。也許OpenAI能從中學(xué)到的教訓(xùn)就是——做好外界的預(yù)期管理,不要拖延太久。

歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《叵測(cè)》和《鋼鐵森林》各看6集,一部已經(jīng)棄劇,一部熬夜狂追!

《叵測(cè)》和《鋼鐵森林》各看6集,一部已經(jīng)棄劇,一部熬夜狂追!

李虰手工制作
2026-04-04 08:47:03
晴天霹靂!東契奇常規(guī)賽報(bào)銷?。?>
    </a>
        <h3>
      <a href=晴天霹靂!東契奇常規(guī)賽報(bào)銷?。?/a> 柚子說球
2026-04-04 08:18:07
比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

共工之錨
2026-03-29 18:26:19
去了一趟埃及才明白:當(dāng)?shù)厝藢?duì)中國(guó)制造的依賴,超乎你的想象

去了一趟埃及才明白:當(dāng)?shù)厝藢?duì)中國(guó)制造的依賴,超乎你的想象

復(fù)轉(zhuǎn)這些年
2026-04-03 13:29:19
這兩樁好事,上海男籃都要!

這兩樁好事,上海男籃都要!

新民晚報(bào)
2026-04-04 09:14:19
臺(tái)網(wǎng)紅“館長(zhǎng)”自曝遇人生最低潮,嘆“難道要支持貪污才有錢賺?”

臺(tái)網(wǎng)紅“館長(zhǎng)”自曝遇人生最低潮,嘆“難道要支持貪污才有錢賺?”

海峽導(dǎo)報(bào)社
2026-04-04 09:45:03
CCTV5直播!王楚欽迎戰(zhàn)大黑馬,孫穎莎沖擊3連冠,女單或包攬4強(qiáng)

CCTV5直播!王楚欽迎戰(zhàn)大黑馬,孫穎莎沖擊3連冠,女單或包攬4強(qiáng)

體育就你秀
2026-04-04 05:05:03
李綺虹移居加拿大22年,自曝住在人口稀少城市,每日素顏生活樸實(shí)

李綺虹移居加拿大22年,自曝住在人口稀少城市,每日素顏生活樸實(shí)

臨云史策
2026-04-03 12:04:33
伊朗圍著飛行員狩獵戰(zhàn)機(jī),美軍第二次波黑救援失敗,大批戰(zhàn)機(jī)出事

伊朗圍著飛行員狩獵戰(zhàn)機(jī),美軍第二次波黑救援失敗,大批戰(zhàn)機(jī)出事

堅(jiān)果甜瓜
2026-04-04 07:43:48
DDR5崩盤!黃牛囤了一屋子內(nèi)存!

DDR5崩盤!黃牛囤了一屋子內(nèi)存!

中國(guó)半導(dǎo)體論壇
2026-04-03 10:23:10
過去30年,中國(guó)三次忍辱負(fù)重“裝孫子”躲過美國(guó)阻擊,終迎大發(fā)展

過去30年,中國(guó)三次忍辱負(fù)重“裝孫子”躲過美國(guó)阻擊,終迎大發(fā)展

阿胡
2024-06-13 14:25:16
為什么不能讓家里女人掌握經(jīng)濟(jì)大權(quán) 網(wǎng)友講出一例例實(shí)例觸目驚心

為什么不能讓家里女人掌握經(jīng)濟(jì)大權(quán) 網(wǎng)友講出一例例實(shí)例觸目驚心

侃神評(píng)故事
2026-03-29 19:35:03
股市的風(fēng)險(xiǎn)正在聚集!價(jià)格已經(jīng)失效

股市的風(fēng)險(xiǎn)正在聚集!價(jià)格已經(jīng)失效

睿知睿見
2026-04-03 07:35:53
美以伊戰(zhàn)事進(jìn)入第三十六天,最新動(dòng)態(tài)

美以伊戰(zhàn)事進(jìn)入第三十六天,最新動(dòng)態(tài)

參考消息
2026-04-04 09:34:05
7歲女孩課間吵架后恐水,24小時(shí)內(nèi)離世,竟是3個(gè)月前留下的禍根

7歲女孩課間吵架后恐水,24小時(shí)內(nèi)離世,竟是3個(gè)月前留下的禍根

云景侃記
2026-04-03 17:17:22
下周行情(4.7日-10日)要點(diǎn)早知道

下周行情(4.7日-10日)要點(diǎn)早知道

玉名W
2026-04-04 09:50:12
再見!麻豆傳媒突然官宣,永久關(guān)停

再見!麻豆傳媒突然官宣,永久關(guān)停

我不叫阿哏
2026-04-03 15:25:28
澳門世界杯:4月4日賽程公布,國(guó)乒5人出戰(zhàn),小莫對(duì)決松島輝空

澳門世界杯:4月4日賽程公布,國(guó)乒5人出戰(zhàn),小莫對(duì)決松島輝空

乒談
2026-04-04 00:08:54
伊朗正以被擊落的F15戰(zhàn)機(jī)為誘餌,對(duì)救人心切的美軍實(shí)施圍點(diǎn)打援

伊朗正以被擊落的F15戰(zhàn)機(jī)為誘餌,對(duì)救人心切的美軍實(shí)施圍點(diǎn)打援

丹妮觀
2026-04-04 06:39:36
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯(cuò)話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯(cuò)話

另子維愛讀史
2026-02-27 20:31:34
2026-04-04 10:24:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
258文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國(guó)產(chǎn)手機(jī)廠商集體漲價(jià)

頭條要聞

伊朗懸賞追捕美軍飛行員 呼吁民眾"看到他們就開槍"

頭條要聞

伊朗懸賞追捕美軍飛行員 呼吁民眾"看到他們就開槍"

體育要聞

被NBA選中20年后,他重新回到籃球場(chǎng)

娛樂要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

劉紀(jì)鵬:只盼長(zhǎng)慢牛,鞏固4000點(diǎn)是關(guān)鍵

汽車要聞

17萬級(jí)海豹07EV 不僅續(xù)航長(zhǎng)還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

游戲
旅游
家居
房產(chǎn)
公開課

操控足球巨星!盤點(diǎn)五款體育競(jìng)技游戲,讓你隨時(shí)開啟主場(chǎng)時(shí)刻

旅游要聞

山東聊城:萬畝梨園入畫屏

家居要聞

溫馨多元 愛的具象化

房產(chǎn)要聞

小陽春全面啟動(dòng)!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版