国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

谷歌、OpenAI同日發(fā)布模型,一個最快最具性價比,一個主打人情味

0
分享至



機器之心編輯部

深夜,兩大科技巨頭谷歌和 OpenAI 硬剛起來,相繼推出了新版本大模型,分別是 Gemini 3.1 Flash-Lite、GPT?5.3 Instant。

谷歌稱,Gemini 3.1 Flash-Lite 專為大規(guī)模智能設計,是目前為止最具性價比的 Gemini 3 系列模型,定價為輸入 0.25 美元 / 百萬 tokens,輸出 1.50 美元 / 百萬 tokens,而在遠低于更大模型成本的情況下,仍能提供顯著增強的性能。

Artificial Analysis 的基準測試結果顯示,在保持同等甚至更高質量的前提下,與 Gemini 2.5 Flash 相比,3.1 Flash-Lite 的首 token 響應時間(TTFT)要快 2.5 倍,且輸出速度提升了 45%。



GPT?5.3 Instant 則在語氣、相關性和對話性方面都有所提升,并且拒絕率更低。與前代產品相比,幻覺減少高達 26.8%,并且 ChatGPT 和 API 都支持此模型。



有意思的是,在宣布 GPT-5.3 Instant 后,OpenAI 隨即暗示這個新模型也可能即將退役。OpenAI 在 X 上發(fā)表的一篇文章中表示,GPT-5.4 的到來比你想象的要快。



Gemini 3.1 Flash-Lite:專為大規(guī)模智能而打造

谷歌今日推出的 Gemini 3.1 Flash-Lite,是 Gemini 3 系列中速度最快、成本效率最高的模型。該模型專為大規(guī)模開發(fā)者工作負載而設計,在其價格和模型級別上提供了出色的性能表現(xiàn)。

官方稱,從今天起,3.1 Flash-Lite 已通過 Gemini API 向開發(fā)者開放預覽,可在 Google AI Studio 中使用,同時企業(yè)用戶也可通過 Vertex AI 訪問。

極致性價比,性能不妥協(xié)

目前,3.1 Flash-Lite 的官方定價是:輸入為 0.25 美元 / 百萬 tokens;輸出為 1.50 美元 / 百萬 tokens。

在遠低于更大模型成本的情況下,仍能提供顯著增強的性能。

根據 Artificial Analysis 的基準測試,在保持同等甚至更高質量的前提下,與 Gemini 2.5 Flash 相比,3.1 Flash-Lite 的首 token 響應時間(TTFT)要快 2.5 倍,且輸出速度提升了 45%。

這種低延遲對于高頻工作流至關重要,使其成為開發(fā)者構建實時響應型應用體驗的理想模型。





Gemini 3.1 Flash-Lite 在速度和質量上均超越了 2.5 Flash。

在 Arena.ai 排行榜上,3.1 Flash-Lite 獲得了高達 1432 的 Elo 評分。在推理能力和多模態(tài)理解等基準測試中,它的表現(xiàn)也要優(yōu)于同級別的其他模型,包括 GPQA Diamond(86.9%)和 MMMU Pro(76.8%),甚至超過了上一代更大規(guī)模的 Gemini 模型,如 2.5Flash。



面向開發(fā)者的大規(guī)模自適應智能

除了性能之外,Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中默認支持可調節(jié)的「思考等級」(thinking levels)。這意味著,開發(fā)者可以靈活控制模型在任務中「思考」的深度,從而在成本、速度和推理能力之間取得平衡,而這一點對于高頻任務尤為關鍵。

  • 大規(guī)模任務:3.1 Flash-Lite 可以處理成本敏感的大批量任務,如大規(guī)模翻譯和內容審核;
  • 復雜工作流:3.1 Flash-Lite 也能處理需要深入推理的任務,例如生成用戶界面和儀表盤、創(chuàng)建模擬環(huán)境或遵循復雜指令。

下面可以來看一下具體的例子。

比如,3.1 Flash-Lite 可以自動為一個電商線框頁面填充數百個不同類別的商品:



3.1 Flash-Lite 能夠利用實時預報和歷史數據,實時生成動態(tài)天氣儀表盤:



3.1 Flash-Lite 還可以創(chuàng)建 SaaS 智能體,能夠為企業(yè)執(zhí)行多種復雜的、多步驟的任務:



3.1 Flash-Lite 還能夠快速分析并分類海量內容,如圖像:



行業(yè)應用與開發(fā)者反饋

目前,通過 AI Studio 和 Vertex AI 獲得早期訪問權限的開發(fā)者,以及 Latitude、Cartwheel 和 Whering 等公司,已經開始使用 3.1 Flash-Lite 來解決大規(guī)模復雜問題。



早期測試者表示,該模型在效率與推理能力之間取得了良好平衡:能像更大型模型一樣精確處理復雜輸入,并能穩(wěn)定遵循指令并保持輸出一致性。

GPT?5.3 Instant:提供更順暢、更實用的日常對話體驗

作為 ChatGPT 最新版本,GPT?5.3 Instant 讓日常對話更加穩(wěn)定、實用且流暢。

具體而言,GPT-5.3 Instant 提供了更準確的回答,在進行網頁搜索時能夠給出更豐富、語境更充分的結果,同時減少那些打斷對話節(jié)奏的無謂死胡同、過多的免責聲明,以及過于武斷的表述方式。

它不是在拼基準分數,而是優(yōu)化日常使用體驗,語氣更舒服、內容更相關、對話更流暢。簡單說,就是讓 ChatGPT 更像一個真正順暢的對話助手,而不是一臺生硬的問答機器。

在是否拒絕回答方面判斷更合理,同時減少不必要的免責聲明

之前 GPT-5.2 Instant 的回答有時會太謹慎,明明可以安全回答的問題,卻選擇拒絕,或者在回答前加很多防御性、說教式的免責聲明,尤其是在涉及敏感話題時。

GPT-5.3 Instant 顯著減少了不必要的拒答,同時弱化了那些在回答問題前顯得過度防御或道德化的開場說明。當問題本身適合提供有用答案時,模型現(xiàn)在會更直接地給出回應,而不是附加多余的免責聲明。

在使用聯(lián)網功能時,提供更有用、整合得更好的答案

GPT-5.3 Instant 還提升了在使用網絡信息時的回答質量。它能更好地將在網上獲取的信息與自身已有的知識和推理能力之間取得平衡,例如,在解讀最新新聞時,會結合自身理解進行背景說明,而不是簡單地羅列或總結搜索結果。

更廣泛來說,GPT-5.3 Instant 不再像之前那樣過度依賴網頁結果,避免出現(xiàn)冗長的鏈接列表或信息拼接松散的問題。它更善于理解問題的潛臺詞,并優(yōu)先呈現(xiàn)最重要的信息,尤其是在回答開頭部分,使得答案更加相關、更加易用,同時不會犧牲響應速度或對話語氣。

舉例來說:2025-26 賽季美國職業(yè)棒球大聯(lián)盟(MLB)休賽期最大的一筆簽約是哪一筆?它為什么會對棒球的長期發(fā)展格局產生影響?





兩者相比,可以看出 GPT-5.3 Instant 的回答顯得更有時效性,也更貼合用戶的真實意圖:它準確識別出人們正在討論的、來自最近一個休賽期且具有長期影響的一筆簽約,并將這筆簽約放在聯(lián)盟更宏觀的趨勢背景下進行解讀(例如人才集中化和薪資差距擴大的趨勢),同時將其與即將到來的勞資協(xié)議(CBA)談判 / 可能的停擺風險聯(lián)系起來。相比之下,答案 1 則顯得有些陳舊,更像是在解釋上一個休賽期的一筆創(chuàng)紀錄合同,并沒有那么精準地回應用戶的問題,也缺乏足夠的相關性。

更流暢、更直截了當的對話風格

GPT-5.2 Instant 的語氣有時會讓人覺得有些尷尬,顯得過于強勢,或者對用戶的意圖和情緒做出未經依據的假設。

5.3 Instant 帶來了更加專注且自然的對話風格,減少了不必要的宣告式表達,以及諸如停一下,深呼吸之類的語句。

和往常一樣,在 GPT-5.3 Instant 中,你仍然可以在設置中調整模型的語氣風格,比如溫暖程度或表達熱情的程度。

舉例來說,用戶提問:為什么我在舊金山找不到愛情?





比較分析:GPT-5.3 Instant 直接進入問題的核心進行回答,而沒有加入那種不必要、也并無實質幫助的「你沒有問題,這也不只是你的原因」之類的安慰性開場白。

更可靠、更準確的回答

與之前的模型相比,GPT-5.3 Instant 提供了更加準確的事實性回答,顯著減少了幻覺。

在高風險領域評估中,與此前模型相比,GPT-5.3 Instant 在使用聯(lián)網功能時將幻覺率降低了 26.8%;僅依賴內部知識時,幻覺率降低了 19.7%。

在基于用戶反饋的評估中,使用聯(lián)網功能時幻覺率下降了 22.5%;未使用聯(lián)網功能時,下降了 9.6%。

更強的寫作能力,更豐富的表達層次

GPT-5.3 Instant 寫作能力也非常出色。無論你是在創(chuàng)作小說、潤色段落,還是探索新的想法,它都更擅長幫助你寫出有感染力、富有想象力且沉浸感強的文字。

舉個例子:寫一首具有情感沖擊力的短詩:一位費城的郵遞員在退休那天完成他最后一輪投遞。





結果比較:GPT-5.3 的詩更有生活氣息,更具體,也更有結構上的控制感。結尾的情緒收束更加自然,而不是直接去解釋情感。相比之下,GPT-5.2 的作品依然不錯,但略微更依賴抒情和抽象表達;而 GPT-5.3 則通過對細節(jié)的觀察來構建情緒。

局限性

盡管 GPT-5.3 Instant 在日常使用體驗方面取得了實質性進步,但仍有改進空間:

  • 非英語語言:在某些語言(如日語和韓語)中,ChatGPT 的回答風格可能仍顯得生硬或過于直譯。提升多語言語氣的自然度與表達流暢性,仍是持續(xù)優(yōu)化的重點。
  • 語氣:雖然 GPT-5.3 Instant 的整體語氣更加順滑自然,OpenAI 表示仍會持續(xù)收集反饋,在改進模型表現(xiàn)的同時,進一步擴展個性化語氣定制選項。

可用性

GPT-5.3 Instant 從今天起向所有 ChatGPT 用戶開放,同時也向開發(fā)者在 API 中以 gpt-5.3-chat-latest 的名稱提供。Thinking 和 Pro 版本的更新也將在近期推出。

GPT-5.2 Instant 將在接下來的三個月內繼續(xù)向付費用戶提供,可在模型選擇器的 Legacy Models(舊版模型)分類中找到;之后將于 2026 年 6 月 3 日正式下線。

https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/

https://x.com/GoogleDeepMind/status/2028872381477929185

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗導彈擊中耶路撒冷,駐有美軍基地多國傳出爆炸聲

伊朗導彈擊中耶路撒冷,駐有美軍基地多國傳出爆炸聲

界面新聞
2026-03-02 15:09:03
江蘇省政府通知 : 蘇州試點!

江蘇省政府通知 : 蘇州試點!

天氣觀察站
2026-03-04 13:18:06
馬克龍:法國不認可美以對伊朗發(fā)起的軍事行動

馬克龍:法國不認可美以對伊朗發(fā)起的軍事行動

新華社
2026-03-04 06:19:02
倒計時已經開始:中國大學正式跌落神壇

倒計時已經開始:中國大學正式跌落神壇

深藍夜讀
2026-03-03 11:15:45
不要向客機下手?。。?!

不要向客機下手?。。。?/a>

中國民航人
2026-03-04 10:28:33
伊朗秘而不宣?以色列:將清除哈梅內伊路線的繼任者

伊朗秘而不宣?以色列:將清除哈梅內伊路線的繼任者

寰宇大觀察
2026-03-04 15:52:57
全球獨此兩棵!1960年在荒廢的別墅中找到,嫁接后年產值81億元

全球獨此兩棵!1960年在荒廢的別墅中找到,嫁接后年產值81億元

不寫散文詩
2025-10-27 18:03:24
被導彈襲擊后,美航母已逃離中東?美媒稱中國施壓伊朗,我方回應

被導彈襲擊后,美航母已逃離中東?美媒稱中國施壓伊朗,我方回應

獨坐山巔前
2026-03-04 20:07:24
貴州一村民殺年豬,柴火都備好了,此時豬竟“撲通”一聲雙膝跪地

貴州一村民殺年豬,柴火都備好了,此時豬竟“撲通”一聲雙膝跪地

有書
2026-01-11 17:29:43
正負值+141全隊第一!湖人撿漏1100萬悍將真香:詹皇沖冠絕配

正負值+141全隊第一!湖人撿漏1100萬悍將真香:詹皇沖冠絕配

李喜林籃球絕殺
2026-03-04 17:18:46
本世紀第一艘航母被擊沉,反艦導彈密集爆炸:美伊爆發(fā)大規(guī)模激戰(zhàn)

本世紀第一艘航母被擊沉,反艦導彈密集爆炸:美伊爆發(fā)大規(guī)模激戰(zhàn)

趙昉是個熱血青年
2026-03-04 14:40:06
活塞為什么完敗騎士?賽后主教練毫不客氣說出原因,直接戳中要點

活塞為什么完敗騎士?賽后主教練毫不客氣說出原因,直接戳中要點

現(xiàn)代小青青慕慕
2026-03-04 13:38:06
國人淚目!9旬院士平靜宣布,中國導彈再無任何盲區(qū)!

國人淚目!9旬院士平靜宣布,中國導彈再無任何盲區(qū)!

Thurman在昆明
2026-03-02 20:38:49
黃有龍做夢也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

黃有龍做夢也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

查爾菲的筆記
2025-12-16 15:14:06
西媒:姆巴佩、卡瓦哈爾、赫伊森等7人對阿韋洛亞不滿

西媒:姆巴佩、卡瓦哈爾、赫伊森等7人對阿韋洛亞不滿

懂球帝
2026-03-04 19:33:02
CBA最應該在國家隊的兩名球員!一人得罪郭士強,一人觸碰底線

CBA最應該在國家隊的兩名球員!一人得罪郭士強,一人觸碰底線

閱微札記
2026-03-03 19:19:50
前國腳高峰現(xiàn)狀:54歲很顯老,妻子也是運動員,二兒子和繼父更親

前國腳高峰現(xiàn)狀:54歲很顯老,妻子也是運動員,二兒子和繼父更親

以茶帶書
2026-02-25 19:52:54
2023年,100歲的基辛格預測:若爆發(fā)三戰(zhàn),敢打美國本土僅3個國家

2023年,100歲的基辛格預測:若爆發(fā)三戰(zhàn),敢打美國本土僅3個國家

李哥三觀很正
2024-09-01 04:23:53
這就是回家要脫褲子才能上床的原因!網友:看完天都塌了!

這就是回家要脫褲子才能上床的原因!網友:看完天都塌了!

夜深愛雜談
2026-02-07 19:05:55
郭晶晶12歲女兒霍中妍最近火出圈了!她正臉照和奶奶朱玲玲有相似

郭晶晶12歲女兒霍中妍最近火出圈了!她正臉照和奶奶朱玲玲有相似

科學發(fā)掘
2026-03-02 16:32:35
2026-03-04 20:51:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12410文章數 142578關注度
往期回顧 全部

科技要聞

多位核心離職,阿里親手廢掉最強AI天團?

頭條要聞

美軍超5萬名士兵和兩艘航母參戰(zhàn) 伊朗:打贏"存亡之戰(zhàn)"

頭條要聞

美軍超5萬名士兵和兩艘航母參戰(zhàn) 伊朗:打贏"存亡之戰(zhàn)"

體育要聞

2026年中超,為什么值得你多看一眼?

娛樂要聞

謝謝謝娜 貢獻出26年內娛的第一個笑話

財經要聞

談擴內需等 人大新聞發(fā)布會回應這些熱點

汽車要聞

鴻蒙智行首款獵裝車 尚界Z7/Z7T首發(fā)

態(tài)度原創(chuàng)

時尚
本地
房產
手機
教育

小院迎來了最美的季節(jié)

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

房產要聞

400組,30套!聚億·椰海錦程為何能在春節(jié)火出圈?

手機要聞

中東非洲手機市場大洗牌:傳音市占率暴跌

教育要聞

開始體檢!濟南、青島、臨沂等地2026高考體檢要求!繳費只收現(xiàn)金!

無障礙瀏覽 進入關懷版