国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

OpenAI甩出GPT-5.5 Instant!幻覺暴降52%,話少三成,全員免費

0
分享至


智東西
作者 王涵
編輯 冰倩

智東西5月6日報道,今天,OpenAI正式推出GPT?5.5 Instant版,將從今天開始向所有ChatGPT用戶逐步推出,取代GPT?5.3 Instant成為默認模型。

此次更新主要體現(xiàn)在日常交互上,GPT?5.5 Instant的對話語氣更加自然,回答準確率更高且更緊湊,并且當用戶使用個性化功能時,模型還能夠調取過往的對話記錄,補充背景信息。

Sam Altman第一時間轉發(fā)官宣推文“強推”這一模型,并稱:“速度、智能、個性,再加上強大的記憶與個性化能力,這幾方面的改進組合在一起,當它們同時發(fā)揮作用時,給人的感覺已經遠不止是各部分簡單的相加,而是一種整體大于部分之和的體驗?!?/p>


在內部評估中,在醫(yī)學、法律和金融等領域,GPT?5.5 Instant的幻覺率比GPT?5.3 Instant減少了52.5%。

基準測試方面,在衡量科學圖表推理準確度的CharXiv-reasoning中,GPT-5.5 Instant比GPT-5.3 Instant提升了6.6%。多模態(tài)專家推理測試MMMU-Pro中,GPT-5.5 Instant的準確率提升了6.8%。

在文檔解析任務中,GPT-5.5 Instant的錯誤率降低了2.1%,相對降幅約14.4%。在博士級科學問答測試中,GPT-5.5 Instant的準確率提升了7.1%。在數學競賽AIME 2025中,其準確率漲了15.8%。




在API中,GPT?5.5 Instant的名稱為“chat?latest”。對于付費用戶,GPT?5.3 Instant在退役前還將保留三個月,可通過模型配置設置進行訪問。

基于過往對話、上傳文件及已連接Gmail的增強個性化功能,正在向網頁端的Plus和Pro用戶推出,即將登陸移動端,并計劃在未來幾周內擴展至Free、Go、Business和Enterprise用戶。

記憶來源功能正在向網頁端所有ChatGPT個人版套餐用戶推出,并將很快登陸移動端。特定個性化來源的可用性可能因地區(qū)而異。

在OpenAI官宣推文下方有,網友注意到了該模型的AIME成績的提升,認為“這表面上是產品更新,實則是純粹的推理能力升級,絕不僅僅是聊天的微調。這是一種“偷偷”發(fā)布思考模型的方式?!?/p>


還有網友發(fā)現(xiàn):“‘更溫暖、更簡潔’這兩點恰恰是用戶真正抱怨過的地方。有意思的是,今年最大的一次模型升級,本質上卻更像是一次‘性格補丁’?!?/p>


但也有不少網友對這次升級并不買賬,他們想要的是更實用的功能更新。甚至還有網友在懷念GPT-4o。



一、圖像解析能力提高,虛假信息減少52.5%

在內部評估中,對于涵蓋醫(yī)學、法律和金融等領域的高風險提示,GPT?5.5 Instant生成的虛假信息比GPT?5.3 Instant減少了52.5%。在用戶曾標記存在事實錯誤的特別具有挑戰(zhàn)性的對話中,它也減少了37.3%的不準確說法。

GPT-5.5 Instant提升了圖像解析、STEM學科(科學、技術、工程和數學)問答水平,還可智能判斷是否調用網絡搜索,從而給出更優(yōu)質的回復。

從案例中可以看出,GPT?5.5 Instant一開始認可了錯誤的解法,但隨后發(fā)現(xiàn)將x=3代回原方程時不成立。它識別出了實際的代數錯誤(用戶移項有誤),然后使用求根公式得出了正確的解。


而GPT?5.3 Instant雖然也發(fā)現(xiàn)了x=3不成立,但就此止步,錯誤地得出沒有實數解的結論,而不是重新檢查代數步驟并求解修正后的二次方程。


二、回答更緊湊,字數減少30.2%

此外,GPT?5.5 Instant的回答更加緊湊、切中要點,同時在保持溫暖感和個性化。

該模型能夠在傳達相同信息且更具實用性的同時,減少冗長和過度格式化導致的回答過長問題。其還會減少不必要的追問,并避免如隨意添加表情符號等讓回答顯得雜亂。



GPT?5.5 Instant使用的字數減少了30.2%,行數減少了29.2%。其回答語氣把握得當:非正式、實用且適合工作場合,同時避免了過度解釋。該模型針對不同情況提供了可實際使用的腳本,始終圍繞“界限”來闡述問題。

GPT?5.3的回答則更完整,尤其是“不要做什么”的部分,但對于一個非正式的日常建議類提示來說,略顯過于復雜,其結構和推敲程度可能超出了用戶的實際需求。

三、自動檢索歷史對話,記憶來源功能全系上線

GPT?5.5 Instant還能利用過往聊天記錄、上傳的文件以及Gmail中的上下文信息,從而使回答更具個性化。

該模型可智能判斷何時融入個性化元素以優(yōu)化回復,同時其檢索歷史對話、匹配上下文的速度大幅提升,無需用戶反復重復表述。



可以看到,GPT?5.5 Instant的回答能夠更好地引用過往對話和相關的已連接數據,從而提供更細致、高度個性化的建議。而GPT?5.3 Instant的回答雖然考慮到了用戶位于舊金山這一因素,但對于推薦嘗試的地方,給出的建議仍較為籠統(tǒng)。

ChatGPT全系模型現(xiàn)已上線記憶來源功能。用戶可查看個性化回答所引用的上下文依據,并獲得自主管控權限。

當模型生成個性化回復時,用戶能夠追溯答案所依托的具體上下文,包括已保存記憶及歷史對話記錄;對于過時、失效或無關的信息,可隨時進行刪除與更正。

此外,用戶分享對話內容時,記憶來源信息不會對外展示。同時該功能支持多種隱私管控方式:可單獨刪除不愿被引用的歷史對話,在設置界面編輯或清空已保存記憶,也可使用臨時對話模式,全程不調用、不更新個人記憶。


結語:交互質量與用戶可控性提升

在基礎能力趨于收斂的背景下,“怎么讓模型回答地更讓用戶舒服?”成為大模型廠商思考的問題。

GPT?5.5 Instant的更新給出了OpenAI的答案::其一,其減少了在專業(yè)知識問答方面的幻覺率;其二,回答的簡潔度與語氣調控被納入優(yōu)化目標;其三,記憶來源功能建立信任基礎。

客觀而言,這類“體驗型更新”難以通過傳統(tǒng)基準測試完全量化其價值,其真實效果還將取決于用戶在長期使用中的主觀感受。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
CCTV5直播!倫敦世乒賽!央視5.3-5.13日乒乓球節(jié)目預告

CCTV5直播!倫敦世乒賽!央視5.3-5.13日乒乓球節(jié)目預告

好乒乓
2026-05-05 12:32:03
米切爾:我罰球少是因為不假摔;不敢多聊,我朋友都被罰款了

米切爾:我罰球少是因為不假摔;不敢多聊,我朋友都被罰款了

懂球帝
2026-05-06 10:53:11
斯內德:阿森納該為阿爾特塔立雕像,憑借這陣容進決賽難以置信

斯內德:阿森納該為阿爾特塔立雕像,憑借這陣容進決賽難以置信

懂球帝
2026-05-06 05:45:09
特朗普稱暫?!白杂捎媱潯毙袆?>
    </a>
        <h3>
      <a href=特朗普稱暫?!白杂捎媱潯毙袆?/a> 財聯(lián)社
2026-05-06 07:00:15
返回臺島后,賴清德說了3句話,洪秀柱預判成真,大陸擲地有聲

返回臺島后,賴清德說了3句話,洪秀柱預判成真,大陸擲地有聲

清衣渡a
2026-05-06 09:43:01
郭艾倫:麥考爾剛來廣州第一天訓練給我整傷了 我們場下干了一架

郭艾倫:麥考爾剛來廣州第一天訓練給我整傷了 我們場下干了一架

狼叔評論
2026-05-05 21:50:05
皮爾斯:亞歷山大能演且會演!詹姆斯沒罰球因為太強壯!

皮爾斯:亞歷山大能演且會演!詹姆斯沒罰球因為太強壯!

歷史第一人梅西
2026-05-06 10:28:43
中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

桑啟紅原
2026-05-06 05:00:41
1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

草莓解說體育
2026-05-06 08:37:32
男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

新民晚報
2026-05-05 20:20:14
歐盟對俄釜底抽薪,斯洛伐克與亞美尼亞雙雙倒向烏克蘭

歐盟對俄釜底抽薪,斯洛伐克與亞美尼亞雙雙倒向烏克蘭

史政先鋒
2026-05-05 18:56:40
斯諾克世錦賽落幕!丁俊暉邊緣,2人身價暴漲,1人下桌,唯他被罵

斯諾克世錦賽落幕!丁俊暉邊緣,2人身價暴漲,1人下桌,唯他被罵

好賢觀史記
2026-05-06 09:59:33
小莉幫忙又陷爭議,網友:支持把老人送金小莉家撫養(yǎng)

小莉幫忙又陷爭議,網友:支持把老人送金小莉家撫養(yǎng)

映射生活的身影
2026-05-05 16:46:30
比預期多贏11分!老詹盡力了,16中3你跟我說怎么搶救

比預期多贏11分!老詹盡力了,16中3你跟我說怎么搶救

貴圈真亂
2026-05-06 11:40:11
快訊!烏克蘭消息!

快訊!烏克蘭消息!

故事終將光明磊落
2026-05-06 09:35:05
張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

阿廢冷眼觀察所
2026-05-06 02:00:26
工人脫崗睡覺、擅自搭建新產線,恩華藥業(yè)被查出多項重大隱患,去年凈利潤首次下滑

工人脫崗睡覺、擅自搭建新產線,恩華藥業(yè)被查出多項重大隱患,去年凈利潤首次下滑

紅星新聞
2026-05-05 18:21:19
純電版桑塔納?雖是惡搞,但熱度極高!

純電版桑塔納?雖是惡搞,但熱度極高!

熱點科技
2026-05-05 15:51:10
上海人去崇明再也不怕堵路上!直達地鐵今年年內將通車,這些景點終于藏不住了

上海人去崇明再也不怕堵路上!直達地鐵今年年內將通車,這些景點終于藏不住了

新民晚報
2026-05-05 16:35:04
孟庭葦遭家暴與張志鵬離婚,現(xiàn)與兒子相依為命

孟庭葦遭家暴與張志鵬離婚,現(xiàn)與兒子相依為命

蕭狡科普解說
2026-05-05 22:34:36
2026-05-06 12:07:00
智東西 incentive-icons
智東西
智東西,AI產業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產業(yè)變革。
11743文章數 117061關注度
往期回顧 全部

科技要聞

告別廢話文學與幻覺!GPT-5.5 Instant發(fā)布

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內心感到氣憤

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內心感到氣憤

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

吉利原生新能源越野架構亮相 AI如何帶來極致越野

態(tài)度原創(chuàng)

家居
游戲
本地
公開課
軍事航空

家居要聞

大膽前衛(wèi) 時尚大宅

大爆料!PS6掌機內存規(guī)格曝光!幾乎不拖累主機性能

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普威脅伊朗不要向美國船開火

無障礙瀏覽 進入關懷版