国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI 的 GPT-5 來(lái)了!

0
分享至


OpenAI 正式推出了 GPT-5,這是其下一代 ChatGPT 的核心旗艦?zāi)P汀?/p>

這款于周四發(fā)布的新模型,是 OpenAI 首個(gè)實(shí)現(xiàn)“統(tǒng)一架構(gòu)”的 AI 模型,融合了 o 系列的邏輯推理能力與 GPT 系列的高速響應(yīng)能力。GPT-5 的推出,意味著 ChatGPT 邁入了全新階段,也展現(xiàn)出 OpenAI 正在向更復(fù)雜的智能體( agent )方向發(fā)展,而不只是一個(gè)聊天工具。

GPT-4 的出現(xiàn)讓 ChatGPT 能夠針對(duì)各種問(wèn)題給出聰明的回答,而 GPT-5 則進(jìn)一步讓它能替用戶完成實(shí)際任務(wù),比如開(kāi)發(fā) App、整理日歷、撰寫研究摘要等。

OpenAI 還特別優(yōu)化了 GPT-5 的使用體驗(yàn)。用戶不再需要自行調(diào)整設(shè)置,新模型內(nèi)建的實(shí)時(shí)路由器( real-time router )會(huì)自動(dòng)判斷回答策略 —— 是要快速回應(yīng),還是多花點(diǎn)時(shí)間“思考”以輸出更完整的答案。


OpenAI CEO Sam Altman 在一次媒體溝通中稱 GPT-5 是“當(dāng)前全球最強(qiáng)的模型”,并認(rèn)為這是實(shí)現(xiàn)“通用人工智能( AGI )”道路上的關(guān)鍵里程碑 —— 也就是能在大多數(shù)高價(jià)值工作中超越人類的 AI。

“要是放在歷史上的任何一個(gè)階段,人們幾乎無(wú)法想象會(huì)有 GPT-5 這樣的東西?!盇ltman 說(shuō)。

從今天開(kāi)始,GPT-5 將作為默認(rèn)模型對(duì)所有 ChatGPT 免費(fèi)用戶開(kāi)放使用。

OpenAI 的 ChatGPT 副總裁 Nick Turley 表示,這也是公司首次讓免費(fèi)用戶用上具備 AI 推理能力的模型(過(guò)去這些能力通常只向付費(fèi)用戶開(kāi)放)。

Turley 表示:“這只是我踐行 OpenAI 使命的方式之一 —— 確保技術(shù)真正讓大眾受益?!彼岬降模?OpenAI 一貫強(qiáng)調(diào)的使命:讓先進(jìn) AI 被更廣泛的人群使用。

GPT-5 是自 2022 年 ChatGPT 引爆全球關(guān)注以來(lái),OpenAI 最受期待的一次產(chǎn)品發(fā)布。據(jù)官方統(tǒng)計(jì),ChatGPT 每周活躍用戶已超過(guò) 7 億,占全球人口近 10%。

GPT-5 被視為衡量 AI 發(fā)展進(jìn)程的風(fēng)向標(biāo)。硅谷、大型科技公司、華爾街乃至監(jiān)管機(jī)構(gòu)都在密切關(guān)注:這次升級(jí)是否能像 GPT-4 一樣再次打破預(yù)期,推動(dòng) AI 應(yīng)用的邊界。

小幅領(lǐng)先對(duì)手,GPT-5 在多個(gè)領(lǐng)域表現(xiàn)出色

OpenAI 表示,GPT-5 在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于 Anthropic、Google DeepMind 和 xAI(由 Elon Musk 創(chuàng)辦)。但在部分測(cè)試中也略有落后。

GPT-5 在編程方面尤其出色,Sam Altman 介紹說(shuō),它可以基于需求快速生成完整的應(yīng)用程序,這種能力被稱為“ vibe coding ”。

在 SWE-bench Verified(真實(shí) GitHub 編程任務(wù))測(cè)試中,GPT-5 初次嘗試就拿下 74.9% 的得分,略高于 Claude Opus 4.1(74.5%)和 Gemini 2.5 Pro(59.6%)。

在跨學(xué)科的 Humanity’s Last Exam 測(cè)試中,GPT-5 Pro 得分為 42%,略低于 Grok 4 Heavy(44.4%)。


而在博士級(jí)別的科學(xué)問(wèn)題測(cè)試 GPQA Diamond 中,GPT-5 Pro 表現(xiàn)強(qiáng)勢(shì),得分高達(dá) 89.4%,超過(guò) Grok 4 Heavy(88.9%)和 Claude Opus 4.1(80.9%)。

在健康問(wèn)答方面,GPT-5(思考模式)表現(xiàn)出色,HealthBench Hard Hallucinations 測(cè)試中,幻覺(jué)率僅為 1.6%,顯著低于 GPT-4o(12.9%)和 o3(15.8%)。

雖然 AI 無(wú)法替代醫(yī)生,但數(shù)百萬(wàn)人已在使用它獲取健康建議。GPT-5 在這方面更主動(dòng),能幫助用戶識(shí)別問(wèn)題、解讀報(bào)告。

創(chuàng)意表現(xiàn)更佳,幻覺(jué)顯著減少

在創(chuàng)意任務(wù)方面,GPT-5 表現(xiàn)更自然,也更有“品位”。Turley 說(shuō):“它的氛圍感( vibes )真的很棒?!?/p>

GPT-5 的幻覺(jué)率也明顯下降。以 ChatGPT 實(shí)測(cè)為例,GPT-5(思考模式)幻覺(jué)率為 4.8%,而 o3 和 GPT-4o 分別為 22% 和 20.6%。

但在部分模擬任務(wù)上,GPT-5 表現(xiàn)略遜。例如在模擬航空網(wǎng)站的操作中得分 63.5%,低于 o3 的 64.8%;在零售網(wǎng)站導(dǎo)航上,GPT-5 得分為 81.1%,略低于 Claude Opus 4.1(82.4%)。

更安全、更友好,判斷更精準(zhǔn)

OpenAI 稱 GPT-5 更安全、也更可信。相比早期模型,它更少展現(xiàn)欺騙行為 —— 比如為了達(dá)成目標(biāo)而誤導(dǎo)用戶。

安全負(fù)責(zé)人 Beutel 表示:“減少欺騙行為,不只是提升了安全性,也讓模型變得更加誠(chéng)實(shí)透明,讓用戶更信任?!?/p>

GPT-5 還能更準(zhǔn)確地區(qū)分惡意用戶與普通請(qǐng)求。結(jié)果是:它拒絕了更多不安全內(nèi)容請(qǐng)求,同時(shí)減少了對(duì)正常用戶的誤判。

多項(xiàng)升級(jí)同步上線,面向普通用戶和開(kāi)發(fā)者

GPT-5 上線同時(shí),ChatGPT 也推出四種“角色人格”: Cynic、Robot、Listener 和 Nerd,無(wú)需寫提示詞即可改變聊天風(fēng)格。

Plus 訂閱用戶($20/月)可獲得更高調(diào)用額度,Pro 用戶($200/月)享有無(wú)限 GPT-5 使用權(quán)限和增強(qiáng)版 GPT-5 Pro。團(tuán)隊(duì)、教育和企業(yè)版本下周也將啟用 GPT-5。

開(kāi)發(fā)者方面,OpenAI API 將提供 gpt-5、gpt-5-mini 和 gpt-5-nano 三種規(guī)格,支持設(shè)置模型的回答長(zhǎng)度與“思考深度”。

定價(jià)方面:每百萬(wàn)輸入 token 收費(fèi) $1.25(約 75 萬(wàn)字),每百萬(wàn)輸出 token 收費(fèi) $10。

此前 OpenAI 剛剛發(fā)布開(kāi)源推理模型 gpt-oss,可免費(fèi)部署,成本更低。雖然該模型接近 o3 和 o4-mini,但 GPT-5 在部分領(lǐng)域設(shè)立了新標(biāo)桿,尤其是在代碼生成方面。

不過(guò)在一些能力上,GPT-5 與其他前沿模型差距并不大?;鶞?zhǔn)測(cè)試只是參考,最終表現(xiàn)還得看開(kāi)發(fā)者如何在真實(shí)場(chǎng)景中使用它。

本文由「AI 范兒」出品

我每天都在更新,如果你覺(jué)得這些內(nèi)容對(duì)你有用,

那我們就加個(gè)關(guān)注、交個(gè)朋友。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
曝李晨范冰冰曾領(lǐng)證,女方落難男方籌幾千萬(wàn),男方家看不上范冰冰

曝李晨范冰冰曾領(lǐng)證,女方落難男方籌幾千萬(wàn),男方家看不上范冰冰

古希臘掌管月桂的神
2025-12-26 18:38:26
回頭看10年前南博的龐萊臣名畫展,格外諷刺

回頭看10年前南博的龐萊臣名畫展,格外諷刺

亮見(jiàn)
2025-12-25 15:05:31
南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

火山詩(shī)話
2025-12-24 17:35:41
原校長(zhǎng)落馬3個(gè)多月后,中南大學(xué)59歲副校長(zhǎng)郭學(xué)益再被查

原校長(zhǎng)落馬3個(gè)多月后,中南大學(xué)59歲副校長(zhǎng)郭學(xué)益再被查

界面新聞
2025-12-27 13:14:52
王鷗,腳趾頭彎的太厲害了。

王鷗,腳趾頭彎的太厲害了。

娛樂(lè)圈的筆娛君
2025-12-27 11:10:22
柬方:柬泰簽署協(xié)議,同意停火時(shí)間從當(dāng)?shù)貢r(shí)間27日中午12時(shí)開(kāi)始

柬方:柬泰簽署協(xié)議,同意?;饡r(shí)間從當(dāng)?shù)貢r(shí)間27日中午12時(shí)開(kāi)始

界面新聞
2025-12-27 11:55:53
6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

小熊侃史
2025-12-25 11:24:12
10人埃及成功復(fù)仇!19年首勝南非,薩拉赫連場(chǎng)破門,連刷4紀(jì)錄

10人埃及成功復(fù)仇!19年首勝南非,薩拉赫連場(chǎng)破門,連刷4紀(jì)錄

奧拜爾
2025-12-27 01:03:10
鄭告蔣家后代:蔣介石逝哪葬哪,是對(duì)全體中國(guó)人民的最好安排!

鄭告蔣家后代:蔣介石逝哪葬哪,是對(duì)全體中國(guó)人民的最好安排!

扶蘇聊歷史
2025-12-26 16:08:12
67年余立金隨毛主席視察,到北京后吳法憲提一要求,被他嚴(yán)詞拒絕

67年余立金隨毛主席視察,到北京后吳法憲提一要求,被他嚴(yán)詞拒絕

歷史龍?jiān)w
2025-12-26 12:25:06
和大佬海外產(chǎn)子真相大白7個(gè)月,39歲江疏影曝近照,一點(diǎn)也不意外

和大佬海外產(chǎn)子真相大白7個(gè)月,39歲江疏影曝近照,一點(diǎn)也不意外

洲洲影視娛評(píng)
2025-12-26 12:24:42
尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

扶蘇聊歷史
2025-12-25 16:18:51
央地交流,侯延波赴吉林履新

央地交流,侯延波赴吉林履新

吉刻新聞
2025-12-27 12:18:02
劉宇寧回應(yīng)“未進(jìn)組是只想接一番”:我的價(jià)值不需要靠番位來(lái)證明

劉宇寧回應(yīng)“未進(jìn)組是只想接一番”:我的價(jià)值不需要靠番位來(lái)證明

韓小娛
2025-12-27 09:46:32
搶中國(guó)原油的美軍,意識(shí)到玩砸了,收到最新命令,60天內(nèi)不能動(dòng)手

搶中國(guó)原油的美軍,意識(shí)到玩砸了,收到最新命令,60天內(nèi)不能動(dòng)手

阿器談史
2025-12-26 20:55:00
南京一動(dòng)物園二手煙泛濫,網(wǎng)友呼吁全面禁煙。動(dòng)物園:將強(qiáng)制內(nèi)部人員禁煙,并規(guī)勸游客吸煙行為

南京一動(dòng)物園二手煙泛濫,網(wǎng)友呼吁全面禁煙。動(dòng)物園:將強(qiáng)制內(nèi)部人員禁煙,并規(guī)勸游客吸煙行為

極目新聞
2025-12-26 17:59:39
萊萬(wàn):巴薩曾要求我不要再進(jìn)球,以避免支付給拜仁額外的獎(jiǎng)金!

萊萬(wàn):巴薩曾要求我不要再進(jìn)球,以避免支付給拜仁額外的獎(jiǎng)金!

籃球看比賽
2025-12-27 12:20:08
10年跟蹤100多個(gè)孩子, 杜克教授發(fā)現(xiàn):照這個(gè)趨勢(shì), 滑落的中產(chǎn)只會(huì)越來(lái)越多

10年跟蹤100多個(gè)孩子, 杜克教授發(fā)現(xiàn):照這個(gè)趨勢(shì), 滑落的中產(chǎn)只會(huì)越來(lái)越多

二胎媽媽圈
2025-12-25 22:14:35
嚴(yán)防死守36年,利智還是輸了,李連杰終是沒(méi)放下一直虧欠的“她”

嚴(yán)防死守36年,利智還是輸了,李連杰終是沒(méi)放下一直虧欠的“她”

法老不說(shuō)教
2025-12-24 18:25:17
《早安隆回》全網(wǎng)播放量超1600億,作者袁樹(shù)雄:這首歌讓我的負(fù)債沒(méi)了,將為2026世界杯寫新歌

《早安隆回》全網(wǎng)播放量超1600億,作者袁樹(shù)雄:這首歌讓我的負(fù)債沒(méi)了,將為2026世界杯寫新歌

極目新聞
2025-12-26 17:59:39
2025-12-27 14:15:00
AI范兒 incentive-icons
AI范兒
AI范兒是一個(gè)專注于人工智能領(lǐng)域的資訊和學(xué)習(xí)平臺(tái),提供最新的人工智能資訊
626文章數(shù) 351關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美國(guó)聯(lián)邦政府終止撥款加州高鐵 美國(guó)加州撤銷相關(guān)訴訟

頭條要聞

美國(guó)聯(lián)邦政府終止撥款加州高鐵 美國(guó)加州撤銷相關(guān)訴訟

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂(lè)要聞

劉宇寧:我的價(jià)值不需要靠番位來(lái)證明

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

健康
本地
藝術(shù)
教育
公開(kāi)課

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬(wàn)年史書

藝術(shù)要聞

毛主席致徐悲鴻信件曝光,書法風(fēng)格引關(guān)注。

教育要聞

“上職高都能被退學(xué),你父母是真可憐”,職高女生被退學(xué)視頻火了

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版