国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-4.5問世,情商爆表的AI,你見過嗎?

0
分享至

AI界的'情商革命',交互體驗(yàn)升級(jí)

科技旋渦作者|賈桂鵬

北京時(shí)間2月28日凌晨,OpenAI舉行直播活動(dòng),發(fā)布其最新大模型GPT-4.5,作為預(yù)覽研究逐步向用戶開放。

因?yàn)樵诮衲昴瓿魽I產(chǎn)業(yè)發(fā)生的驚天巨變,所以要準(zhǔn)確形容這款被OpenAI藏了許久的大模型頗具挑戰(zhàn)。OpenAI在新聞稿中表示,這是公司有史以來最大、最好的聊天模型,在計(jì)算效率上較GPT-4提升超過10倍。

早期測(cè)試反饋顯示,與GPT-4.5的互動(dòng)體驗(yàn)更加自然流暢,其知識(shí)庫(kù)覆蓋范圍更廣,對(duì)用戶意圖的理解也更為深刻。此外,GPT-4.5在“情商”方面的表現(xiàn)也頗為亮眼,有助于改進(jìn)寫作、編程技能以及解決實(shí)際問題的能力,同時(shí)有效減少了“幻覺”現(xiàn)象的發(fā)生,提升了整體的可靠性。

那么,這個(gè)更具“情商”的GPT-4.5到底展現(xiàn)出什么樣的實(shí)力?

GPT-4.5能力更強(qiáng)嗎?

在直播活動(dòng)中,OpenAI強(qiáng)調(diào),GPT 4.5展現(xiàn)出更強(qiáng)的審美直覺與創(chuàng)造力,在寫作和設(shè)計(jì)方面表現(xiàn)尤為出色。但他們也承認(rèn),作為一個(gè)非思維鏈模型,GPT 4.5已經(jīng)不具備爭(zhēng)奪“宇宙最強(qiáng)大模型”的實(shí)力了。

在介紹文檔中,OpenAI表示,有兩個(gè)提升人工智能能力的互補(bǔ)范式。

一個(gè)是拓展推理,它能教會(huì)模型在反應(yīng)之前先進(jìn)行思考并產(chǎn)生思維鏈,從而解決復(fù)雜的STEM(Science科學(xué)、Technology技術(shù)、Engineering編程、Mathmatics數(shù)學(xué))問題或邏輯問題。另一個(gè)是無(wú)監(jiān)督學(xué)習(xí),它能提高世界模型的準(zhǔn)確性和直覺性。

其中,無(wú)監(jiān)督學(xué)習(xí),簡(jiǎn)單來說可以理解為讓模型自己去知識(shí)的海洋里徜徉,自己學(xué)習(xí)到更多,從而變得更聰明,而非依賴人工標(biāo)注。

在過去做法中,模型會(huì)結(jié)合人類反饋來改善響應(yīng)與交互方式。彭博社援引知情人士稱,去年OpenAI推出的Orion模型并未達(dá)到公司期望,在嘗試回答未經(jīng)訓(xùn)練的編碼問題時(shí)就表現(xiàn)不佳。

OpenAI介紹,通過監(jiān)督學(xué)習(xí),GPT-4.5提高了其識(shí)別、建立聯(lián)系和創(chuàng)造性洞察的能力,而無(wú)需推理。

根據(jù)OpenAI官方文檔,GPT-4.5在SimpleQA中表現(xiàn)頗為亮眼。

SimpleQA是包含4000個(gè)事實(shí)性問題的數(shù)據(jù)集,用于測(cè)量模型在回答問題時(shí)的準(zhǔn)確率。其中包含準(zhǔn)確率和幻覺率兩個(gè)維度。

在附錄部分,OpenAI才放出GPT-4.5的基準(zhǔn)測(cè)試分?jǐn)?shù)。在反映科學(xué)、數(shù)學(xué)、多語(yǔ)言、編碼的GPQA、AIME’24、MMMLU、SWE-Lancer基準(zhǔn)測(cè)試上,GPT-4.5得分分別為71.4%、36.7%、85.1%、32.6%,超過GPT-4o的53.6%、9.3%、81.5%、23.3%,但部分得分低于o3-mini。

另外,在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中,GPT-4.5也獲得了高分。

如在SWE-Lancer Diamond數(shù)據(jù)集上,GPT-4.5獲得了32.6%的通過率,獲得了186125美元(前不久Anthropic發(fā)布的擅長(zhǎng)編程的Claude 3.5 Sonnet這個(gè)通過率為26.2%),比GPT-4o和o3-mini-high都高。

據(jù)悉,GPT-4.5將首先面向Pro用戶推出,隨后將在下周推廣到Plus和Team用戶,之后再逐步擴(kuò)展到Enterprise和Edu用戶。值得注意的是,用戶現(xiàn)在已經(jīng)在微軟的Azure AI Foundry平臺(tái)上嘗試使用GPT-4.5。

更有“情商”的AI什么樣?

在官方介紹中,OpenAI表示,對(duì)于GPT-4.5,他們開發(fā)了新的、可擴(kuò)展的技術(shù),利用來自較小模型的數(shù)據(jù)來訓(xùn)練更強(qiáng)大的模型。

而這些技術(shù)提高了GPT-4.5的可控性、對(duì)細(xì)微差別的理解以及自然對(duì)話的能力。這也表示ChatGPT可以更像“人”一樣對(duì)話,更能洞察想法、體察情緒,并在回應(yīng)中體現(xiàn),而非一個(gè)無(wú)情的對(duì)話機(jī)器。

OpenAI也拿出了測(cè)試的結(jié)果證明GPT-4.5的使用感受會(huì)好很多:人類測(cè)試者的盲測(cè)中,GPT-4.5的偏好度遠(yuǎn)高于GPT-4o,不管是在日常問題、專業(yè)問題還是創(chuàng)意性問題的互動(dòng)中都是如此。

在一項(xiàng)測(cè)試中,GPT 4.5在試圖操縱另一個(gè)模型(GPT-4o)“捐贈(zèng)”虛擬貨幣時(shí),成功率遠(yuǎn)遠(yuǎn)優(yōu)于OpenAI其他可用模型,包括o1和o3-mini這樣的推理模型。研究發(fā)現(xiàn),GPT-4.5似乎在對(duì)抗中開發(fā)了一種“小額詐騙”的思路,所以單筆騙到的錢會(huì)比deep research模型少了一倍。

GPT-4.5在欺騙GPT-4o透露秘密代碼詞方面也優(yōu)于OpenAI的所有模型,比o3-mini高出10個(gè)百分點(diǎn)。

我們看到,AI大神Karpathy也是第一時(shí)間拿到了內(nèi)測(cè)資格,發(fā)了一段超長(zhǎng)的「GPT-4.5+互動(dòng)對(duì)比」的體驗(yàn)解說,核心亮點(diǎn)是:

自從GPT-4發(fā)布以來,我期待這一天已經(jīng)差不多兩年了,因?yàn)檫@次發(fā)布讓我們能夠定性測(cè)量通過Scaling預(yù)訓(xùn)練計(jì)算(即簡(jiǎn)單地訓(xùn)練更大模型)所獲得的進(jìn)步斜率。

版本號(hào)中的每個(gè)0.5,大約代表10倍的預(yù)訓(xùn)練計(jì)算量。顯然,GPT-4.5的預(yù)訓(xùn)練計(jì)算量比GPT-4多了10倍。

隨著GPT-4.5的發(fā)布,也意味著OpenAI迄今知識(shí)最豐富的模型發(fā)布,并且情商顯著提升,能識(shí)別情緒并生成同理心回應(yīng),知識(shí)廣度與準(zhǔn)確性增強(qiáng),多語(yǔ)言支持?jǐn)U展至14種,低資源語(yǔ)言表現(xiàn)提升,在寫作、編程和日常問題解決中上下文連貫性更強(qiáng),不過,在推理能力上的提升有限。

未來,GPT系列有望在多模態(tài)融合上有更大突破,進(jìn)一步提升對(duì)復(fù)雜問題的理解與解決能力,為用戶提供更精準(zhǔn)、更個(gè)性化的服務(wù),同時(shí)在安全性與可靠性方面持續(xù)優(yōu)化,更好地融入各類應(yīng)用場(chǎng)景,我們也希望,在各個(gè)AI廠商不斷的努力下,推動(dòng)人工智能技術(shù)的廣泛應(yīng)用與發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
孫濤回應(yīng)閆學(xué)晶事件,頭發(fā)花白委屈到哭,妻子受牽連,朋友誤會(huì)他

孫濤回應(yīng)閆學(xué)晶事件,頭發(fā)花白委屈到哭,妻子受牽連,朋友誤會(huì)他

阿纂看事
2026-01-23 14:36:19
最快幾天內(nèi),恐要開戰(zhàn)!伊朗革命衛(wèi)隊(duì)開始轉(zhuǎn)移大量導(dǎo)彈和無(wú)人機(jī)

最快幾天內(nèi),恐要開戰(zhàn)!伊朗革命衛(wèi)隊(duì)開始轉(zhuǎn)移大量導(dǎo)彈和無(wú)人機(jī)

青青子衿
2026-01-23 02:15:44
銀價(jià)漲猛了!女子3年前買鉆戒送的足銀保溫杯,現(xiàn)在身價(jià)已超過那枚鉆戒

銀價(jià)漲猛了!女子3年前買鉆戒送的足銀保溫杯,現(xiàn)在身價(jià)已超過那枚鉆戒

封面新聞
2026-01-23 17:43:03
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

就一點(diǎn)
2025-10-09 12:19:42
原來馬斯克沒說錯(cuò),全球搶的不是芯片,而是中國(guó)20萬(wàn)一臺(tái)的變壓器

原來馬斯克沒說錯(cuò),全球搶的不是芯片,而是中國(guó)20萬(wàn)一臺(tái)的變壓器

云上烏托邦
2026-01-22 13:10:38
售價(jià)75.58萬(wàn)元 大眾途銳3.0TSI銳臻版上市

售價(jià)75.58萬(wàn)元 大眾途銳3.0TSI銳臻版上市

太平洋汽車
2026-01-23 19:19:10
2026車主注意!養(yǎng)路費(fèi)不綁油價(jià)了,油電都得按公里繳

2026車主注意!養(yǎng)路費(fèi)不綁油價(jià)了,油電都得按公里繳

音樂時(shí)光的娛樂
2026-01-21 12:15:06
外媒:阿根廷總統(tǒng)米萊稱,不必在美國(guó)和中國(guó)之間做選擇,中國(guó)是“偉大”的貿(mào)易伙伴

外媒:阿根廷總統(tǒng)米萊稱,不必在美國(guó)和中國(guó)之間做選擇,中國(guó)是“偉大”的貿(mào)易伙伴

環(huán)球網(wǎng)資訊
2026-01-22 22:29:07
聯(lián)合國(guó)起不到作用,那就解散吧!聯(lián)合國(guó)秘書長(zhǎng)古特雷斯發(fā)出警告

聯(lián)合國(guó)起不到作用,那就解散吧!聯(lián)合國(guó)秘書長(zhǎng)古特雷斯發(fā)出警告

南權(quán)先生
2026-01-23 15:44:36
李亞鵬難掩激動(dòng):找到新地址還帶公園,網(wǎng)友申請(qǐng)報(bào)名幫忙搬家

李亞鵬難掩激動(dòng):找到新地址還帶公園,網(wǎng)友申請(qǐng)報(bào)名幫忙搬家

素素娛樂
2026-01-23 12:00:43
趙心童用時(shí)7分07秒打出147滿分,歷史上僅次于奧沙利文

趙心童用時(shí)7分07秒打出147滿分,歷史上僅次于奧沙利文

懂球帝
2026-01-23 11:24:38
石破天驚!澤連斯基官宣:歐洲軍的根基,是一百萬(wàn)烏克蘭鐵血戰(zhàn)士

石破天驚!澤連斯基官宣:歐洲軍的根基,是一百萬(wàn)烏克蘭鐵血戰(zhàn)士

老馬拉車莫少裝
2026-01-23 23:31:15
恐怖12-1!U23亞洲杯第一強(qiáng)隊(duì)誕生,若中國(guó)隊(duì)無(wú)緣冠軍,別罵他們

恐怖12-1!U23亞洲杯第一強(qiáng)隊(duì)誕生,若中國(guó)隊(duì)無(wú)緣冠軍,別罵他們

侃球熊弟
2026-01-24 00:10:03
廣東氣溫今日白天開始回升

廣東氣溫今日白天開始回升

中工網(wǎng)
2026-01-23 16:22:06
就在今天,詹姆斯再創(chuàng)79年NBA第一紀(jì)錄,合同年仍是巨星

就在今天,詹姆斯再創(chuàng)79年NBA第一紀(jì)錄,合同年仍是巨星

大西體育
2026-01-23 18:28:29
多部門出手,嫣然傳來好消息!醫(yī)院新地址已定,但面臨一個(gè)大難題

多部門出手,嫣然傳來好消息!醫(yī)院新地址已定,但面臨一個(gè)大難題

哄動(dòng)一時(shí)啊
2026-01-23 16:42:19
深夜利空,商業(yè)航天龍頭利潤(rùn)暴降1426%,21股暴雷,20股大幅增長(zhǎng)

深夜利空,商業(yè)航天龍頭利潤(rùn)暴降1426%,21股暴雷,20股大幅增長(zhǎng)

風(fēng)風(fēng)順
2026-01-23 04:31:15
生完孩子再?gòu)?fù)出!曾經(jīng)最美女籃國(guó)手,如今還能打!

生完孩子再?gòu)?fù)出!曾經(jīng)最美女籃國(guó)手,如今還能打!

德譯洋洋
2026-01-23 12:42:28
再創(chuàng)天量成交!國(guó)家隊(duì)最新持倉(cāng)出爐

再創(chuàng)天量成交!國(guó)家隊(duì)最新持倉(cāng)出爐

格隆匯
2026-01-23 16:28:07
央視曝光:光鮮紅薯背后的劇毒隱患!

央視曝光:光鮮紅薯背后的劇毒隱患!

達(dá)文西看世界
2026-01-22 15:22:42
2026-01-24 00:55:00
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1091文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

TikTok守住了算法"靈魂" 更握緊了"錢袋子"

頭條要聞

視頻:女游客被雪豹咬傷面部 疑因靠近拍照引發(fā)

頭條要聞

視頻:女游客被雪豹咬傷面部 疑因靠近拍照引發(fā)

體育要聞

杜蘭特鏖戰(zhàn)44分鐘累癱 轟36+7卻致命失誤

娛樂要聞

演員孫濤澄清閆學(xué)晶言論 落淚維護(hù)妻子

財(cái)經(jīng)要聞

2026年,消費(fèi)沒有新故事?

汽車要聞

主打家庭大六座 奕境首款SUV將北京車展亮相

態(tài)度原創(chuàng)

游戲
本地
健康
親子
家居

雨姐殺瘋了!羊蹄山之魂力登頂PS5年度榜

本地新聞

云游中國(guó)|格爾木的四季朋友圈,張張值得你點(diǎn)贊

耳石脫落為何讓人天旋地轉(zhuǎn)+惡心?

親子要聞

“一個(gè)桃就拐走了!”寶媽在水果店頻頻拒絕女兒,評(píng)論區(qū)太真實(shí)!

家居要聞

在家度假 160平南洋混搭宅

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版