国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全球大模型進(jìn)化的下一個(gè)方向,OpenAI的GPT-5做出來了

0
分享至



(OpenAICEO薩姆·奧爾特曼正在發(fā)布GPT-5 圖源/OpenAI官網(wǎng)直播)

GPT-5出現(xiàn),意味著大模型終于進(jìn)入了一個(gè)新競(jìng)爭(zhēng)點(diǎn)-能同時(shí)只會(huì)多個(gè)Agent協(xié)同工作,并處理復(fù)雜任務(wù)

文|《財(cái)經(jīng)》研究員 吳俊宇 周源

編輯|謝麗容

美國(guó)明星AI(人工智能)創(chuàng)業(yè)公司OpenAI的每一代旗艦?zāi)P停紩?huì)引領(lǐng)全球未來半年的技術(shù)潮流。美國(guó)西部時(shí)間8月7日,這家公司發(fā)布了GPT-5。

OpenAI CEO(首席執(zhí)行官)薩姆·奧爾特曼(Sam Altman)形容,GPT-3給人感覺像是在和高中生交談。雖然偶爾靈光乍現(xiàn),但也有很多惱人的地方。GPT-4o或許像在和一個(gè)大學(xué)生交談,它具備了真正的智能和實(shí)用性。而現(xiàn)在,有了GPT-5,就像是在和一位專家對(duì)話——一位在任何領(lǐng)域都能隨時(shí)待命、專業(yè)的博士級(jí)專家,他們能幫你實(shí)現(xiàn)任何目標(biāo)。GPT-5不僅能聊天,還能為你做事。

GPT-5是兩個(gè)模型(長(zhǎng)思考版+高效率版,前者可以深度思考,后者可以高效問答)組成的一個(gè)系統(tǒng)。它會(huì)在用戶提問時(shí),自動(dòng)判斷切換版本。

OpenAI官網(wǎng)披露的性能基準(zhǔn)測(cè)試結(jié)果顯示,GPT-5超越了上一代旗艦?zāi)P蚈penAI o3,GPT-5(長(zhǎng)思考版)幻覺數(shù)量比o3少了六倍。國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)Artificial Analysis長(zhǎng)期對(duì)全球主流模型進(jìn)行性能基準(zhǔn)測(cè)試,截至8月8日的測(cè)試結(jié)果顯示,GPT-5目前是全球性能最強(qiáng)的模型。


性能提升的同時(shí),GPT-5推理算力成本也大幅下降。OpenAI官網(wǎng)公布的測(cè)試結(jié)果顯示,GPT-5成本表現(xiàn)優(yōu)于 OpenAI o3,輸出token(AI推理算力計(jì)量單位,一個(gè)Token可以是單詞、標(biāo)點(diǎn)、數(shù)字、符號(hào)等)數(shù)量減少了50%-80%。


需要鞏固“脆弱的優(yōu)勢(shì)”

OpenAI一直是大模型賽道領(lǐng)頭羊,它是全球估值最高、收入最高的AI創(chuàng)業(yè)公司。截至今年8月,OpenAI再次融資83億美元,累計(jì)融資超過797億美元,估值3000億美元。

截至今年8月,ChatGPT日活躍用戶1.8億,付費(fèi)企業(yè)用戶數(shù)量500萬。截至今年4月,ChatGPT付費(fèi)個(gè)人用戶數(shù)量2000萬。


此前有媒體報(bào)道,截至今年7月末,OpenAI預(yù)計(jì)將實(shí)現(xiàn)120億美元的年度經(jīng)常性收入(ARR,Annual Recurring Revenue),同比增長(zhǎng)超過80%。其中消費(fèi)者訂閱(ChatGPT Plus等用戶訂閱產(chǎn)品)收入55億美元,商業(yè)與合作伙伴(ChatGPT Team和Enterprise企業(yè)部署版本)收入36億美元,API(軟件調(diào)用接口)調(diào)用收入29億美元,代碼專用產(chǎn)品收入4億美元。

OpenAI作為全球最大AI創(chuàng)業(yè)公司,融資、營(yíng)收、估值遠(yuǎn)超它的最大競(jìng)爭(zhēng)對(duì)手——全球第二大AI創(chuàng)業(yè)公司Anthropic。

Anthropic 2023年至今已完成14次融資,總金額182億美元。目前Anthropic估值615億美元。OpenAI估值是Anthropic的4.9倍。截至今年7月末,Anthropic年度經(jīng)常性收入預(yù)計(jì)約為50億美元。也就是說,OpenAI營(yíng)收規(guī)模是Anthropic的2.4倍。

雖然手握優(yōu)勢(shì),OpenAI面臨的市場(chǎng)競(jìng)爭(zhēng)卻變得更激烈。美國(guó)市場(chǎng),谷歌的Gemini、Anthropic、AI創(chuàng)業(yè)公司xAI都是它的直接競(jìng)爭(zhēng)對(duì)手。這幾家公司的旗艦?zāi)P秃蚈penAI的差距幾乎只在三個(gè)月以內(nèi)。中國(guó)市場(chǎng),兩款開源模型——阿里旗下的Qwen系列、AI創(chuàng)業(yè)公司深度求索旗下的DeepSeek系列,和OpenAI旗艦?zāi)P筒罹鄡H為3-6個(gè)月。

2024年以來,OpenAI模型迭代明顯在提速。但過去一年,OpenAI卻遭遇到了比過去更多的批評(píng)。模型迭代次數(shù)多,但性能提升卻未達(dá)公眾預(yù)期。OpenAI多位創(chuàng)始團(tuán)隊(duì)成員出走。這家公司堅(jiān)持的閉源商業(yè)模式也招致抱怨,業(yè)內(nèi)調(diào)侃OpenAI應(yīng)更名為“CloseAI”。


摩根大通7月18日研報(bào)指出,OpenAI融資主要被用于算力和人才投入,未來四年可能還要花費(fèi)約460億美元用于算力成本和員工薪酬,預(yù)計(jì)2029年才能盈利。摩根大通還認(rèn)為,谷歌的Gemini 2.5 Pro和中國(guó)的DeepSeek-R1崛起表明,大模型市場(chǎng)競(jìng)爭(zhēng)激烈,性價(jià)比日益重要。

一位中國(guó)云廠商大模型業(yè)務(wù)負(fù)責(zé)人今年4月曾對(duì)《財(cái)經(jīng)》表示,2025年大模型的發(fā)展主脈絡(luò)之一是,提升精度并降低算力成本,簡(jiǎn)單說就是多、快、好、省。

“卷模型”不能確保永遠(yuǎn)領(lǐng)先,但卻仍是維持優(yōu)勢(shì)的少數(shù)路徑之一。GPT-5正是在這個(gè)背景下誕生的——它在性能提升的同時(shí),還降低了算力成本。

為回應(yīng)“不如變成CloseAI”的批評(píng),OpenAI還在8月5日開源了兩款模型——gpt-oss-120b和gpt-oss-20b。市場(chǎng)普遍認(rèn)為,OpenAI此次開源的主要目的是擴(kuò)大自家模型在全球市場(chǎng)的影響力(報(bào)道詳見)。


搶占AI應(yīng)用爆發(fā)前夜的先機(jī)

AI應(yīng)用爆發(fā),尤其是Agent(智能體,一種輕量級(jí)的AI應(yīng)用)爆發(fā)是2025年大模型落地過程中最明顯的趨勢(shì)。

國(guó)際IT咨詢機(jī)構(gòu)Gartner預(yù)測(cè),到2028年,33%的企業(yè)軟件將包含Agent,2024年該比例不到1%;到2028年,15%的日常工作將由Agent自主完成,2024年該比例接近0%。

不過,2025年上半年,Agent被認(rèn)為并不成熟(報(bào)道詳見)。原因就是基礎(chǔ)模型能力還不夠強(qiáng)。

此次GPT-5兩項(xiàng)重要技術(shù)突破,都是在解決這一問題——一是多模態(tài)(文本、圖像、視頻、音頻等復(fù)雜格式資料)的模型能力,二是指令遵循和Agent工具使用能力。

OpenAI聯(lián)合創(chuàng)始人格雷格·布羅克曼(Greg Brockman)在GPT-5發(fā)布會(huì)以代碼場(chǎng)景舉例表示,GPT-5樹立了一個(gè)全新的標(biāo)準(zhǔn)。它在智能體代碼任務(wù)方面是最好的模型。你可以讓它完成一些非常復(fù)雜的事情。它會(huì)開始工作,調(diào)用許多工具,連續(xù)工作好幾分鐘,有時(shí)甚至更長(zhǎng),來完成你的目標(biāo)、你的指令,無論你想創(chuàng)建什么。

也就是說,隨著GPT-5的多模態(tài)理解能力、Agent工具使用能力成熟,意味著大模型能指揮多個(gè)Agent協(xié)同工作。它將具備駕馭Muti-Agent(多智能體)并處理復(fù)雜任務(wù)的能力。

GPT-5開啟了基礎(chǔ)大模型的一個(gè)新競(jìng)爭(zhēng)點(diǎn),它的基礎(chǔ)能力躍升意味著更多復(fù)雜的AI應(yīng)用將被解鎖。每誕生一批新的AI應(yīng)用,AI算力消耗也會(huì)指數(shù)級(jí)增長(zhǎng)。模型、應(yīng)用、算力的“飛輪”將加速轉(zhuǎn)動(dòng)。

字節(jié)跳動(dòng)火山引擎智能算法負(fù)責(zé)人、火山方舟負(fù)責(zé)人吳迪今年6月曾對(duì)《財(cái)經(jīng)》解釋上述邏輯。在他看來,無論是中國(guó)市場(chǎng)還是美國(guó)市場(chǎng),未來12個(gè)月基礎(chǔ)模型的能力還會(huì)不斷提升,有三個(gè)提升方向。

其一,多模態(tài)(文本+圖片+音頻+視頻)推理模型會(huì)成為主角,這是當(dāng)下正在發(fā)生的變化。AI將可以把文本、圖片、音頻、視頻等多種信息融合在一起進(jìn)行綜合推理。它將極大增強(qiáng)Agent對(duì)現(xiàn)實(shí)世界復(fù)雜信息的理解能力。

其二,視頻生成模型將成熟可用,預(yù)計(jì)今年末將迎來一輪爆發(fā)。這意味著Agent不僅能理解世界,還能以更動(dòng)態(tài)、更直觀的方式生成內(nèi)容和模擬過程。

其三,多步驟的復(fù)雜任務(wù)處理能力會(huì)大幅提升,預(yù)計(jì)今年末會(huì)有重大突破。這是Agent走向成熟的關(guān)鍵一步。當(dāng)模型能夠穩(wěn)定、可靠地規(guī)劃和執(zhí)行包含數(shù)十步甚至上百步的復(fù)雜任務(wù)時(shí),Agent“爛尾”的問題將從根本上被解決。

在吳迪看來,目前大部分Muti-Agent應(yīng)用都“像是玩具”,但基于這三條技術(shù)主線的突破,他給出了最終判斷——Muti-Agent應(yīng)用2025年末準(zhǔn)確率將會(huì)大幅提升。2025年底具備視覺理解、推理能力的AI應(yīng)用普及后,一個(gè)基礎(chǔ)任務(wù)消耗的算力可能就會(huì)超過10萬token。屆時(shí),token消耗量會(huì)快速爬坡。


新一輪模型競(jìng)賽拉開帷幕

模型、應(yīng)用、算力“飛輪”轉(zhuǎn)動(dòng)的基礎(chǔ),是不斷提升的模型能力。2025年,全球科技公司的大模型競(jìng)賽愈演愈烈,大模型迭代步伐都在加速。

大模型領(lǐng)域的知識(shí)迭代以“月”甚至“周”為單位。一篇論文、一個(gè)模型就可能顛覆原有的技術(shù)路線。一位資深算法工程師曾對(duì)《財(cái)經(jīng)》表示,大模型領(lǐng)域,每周都有大量學(xué)術(shù)論文被發(fā)表;幾乎每個(gè)月都有新的技術(shù)突破;幾乎每三四個(gè)月,領(lǐng)先的模型就會(huì)被趕超。

據(jù)《財(cái)經(jīng)》不完全統(tǒng)計(jì),2025年1月1日-8月8日的220天內(nèi),中美參與模型競(jìng)爭(zhēng)的11家科技公司(包括阿里、字節(jié)跳動(dòng)、騰訊、百度、華為、DeepSeek、月之暗面、谷歌、OpenAI、Anthropic、xAI)發(fā)布或迭代了至少32版大模型,平均每6.9天就會(huì)有一版新的大模型被發(fā)布。

基礎(chǔ)模型更新周期甚至越來越短。OpenAI的GPT-4.5到GPT-5更新周期是161天;OpenAI的o1到o3,更新周期132天;xAI的Grok 3到Grok 4,更新周期142天; DeepSeek-R1兩個(gè)版本,更新周期128天;DeepSeek-V3兩個(gè)版本,更新周期87天;谷歌Gemini 2.5兩個(gè)版本,更新周期僅42天。



GPT-5的發(fā)布,將倒逼中美科技公司展開新一輪大模型的競(jìng)賽——訓(xùn)練更強(qiáng)的模型、采購更大規(guī)模的算力,這條路徑在短時(shí)間內(nèi)不會(huì)改變。

當(dāng)前大模型的發(fā)展,有幾個(gè)關(guān)鍵基石。一是數(shù)據(jù)、二是算法、三是算力,它依賴“大力出奇跡”,即用巨大的資源投入來換取性能提升。

今年6月,杜克大學(xué)電子與計(jì)算機(jī)工程系教授陳怡然曾對(duì)《財(cái)經(jīng)》表示,AI演進(jìn)的基本路線,仍是大力出奇跡。大家一直在討論,這種模式未來何時(shí)是頭,潛力何時(shí)會(huì)被耗盡用盡,學(xué)術(shù)界也試圖尋找新的路徑。但目前并沒有其他行之有效的方式,所以產(chǎn)業(yè)界也沒有太多選擇,一直在沿著“大力出奇跡”往前走。

目前,中國(guó)科技公司,如阿里Qwen 3今年7月更新版本暫時(shí)追平了OpenAI今年4月發(fā)布的o3。GPT-5發(fā)布意味著,新一輪追趕又要開始。

《財(cái)經(jīng)》了解到,阿里大模型研發(fā)部門——通義實(shí)驗(yàn)室今年核心目標(biāo)之一就是,模型性能、下載量、衍生模型數(shù)量都要保持領(lǐng)先。

阿里云CTO(首席技術(shù)官)、通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人今年6月在魔搭開發(fā)者大會(huì)群訪環(huán)節(jié)曾對(duì)《財(cái)經(jīng)》表示,模型性能必須具備足夠的競(jìng)爭(zhēng)力,能夠在權(quán)威的、公認(rèn)的基準(zhǔn)測(cè)試(Benchmark)中證明自身實(shí)力。

他還提到,通義實(shí)驗(yàn)室一直將追蹤研判全球前沿技術(shù)動(dòng)態(tài)視為日常工作的一部分。他們不僅會(huì)關(guān)注人工智能頂會(huì)(AAAI、IJCAI、ICML、NIPS等頂級(jí)國(guó)際學(xué)術(shù)會(huì)議)的論文,還會(huì)密切跟蹤全球各大開源社區(qū)、技術(shù)博客以及頭部AI公司的產(chǎn)品發(fā)布。

上述資深算法工程師認(rèn)為,大模型領(lǐng)域,任何性能優(yōu)勢(shì)都只是暫時(shí)的,競(jìng)速是持續(xù)不斷的。



添加微信煩勞注明來意、姓名及職業(yè)

歡迎一切良性業(yè)務(wù)探討及線索提供 !



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
下車救人還是肇事逃逸?警方回應(yīng):真的是下車救人,網(wǎng)友們別再誤會(huì)了

下車救人還是肇事逃逸?警方回應(yīng):真的是下車救人,網(wǎng)友們別再誤會(huì)了

封面新聞
2025-12-28 13:05:04
蒙古國(guó)大膽想法:拿400平方公里和中國(guó)換通道?想將稀土運(yùn)往美國(guó)

蒙古國(guó)大膽想法:拿400平方公里和中國(guó)換通道?想將稀土運(yùn)往美國(guó)

游者走天下
2025-12-26 16:20:18
全球唯一中藥龍頭,回購2億全部注銷,市盈率13倍,股息率5%

全球唯一中藥龍頭,回購2億全部注銷,市盈率13倍,股息率5%

鵬哥投研
2025-12-28 15:19:14
結(jié)果出爐!連勝武獲勝,四藍(lán)委落敗,鄭麗文拋重磅,侯友宜尷尬了

結(jié)果出爐!連勝武獲勝,四藍(lán)委落敗,鄭麗文拋重磅,侯友宜尷尬了

南宮一二
2025-12-28 15:09:48
若澤連斯基選舉失敗會(huì)被清算嗎?

若澤連斯基選舉失敗會(huì)被清算嗎?

史政先鋒
2025-12-27 16:52:40
1960年代,許世友想要安徽一個(gè)湖,省委書記拍桌子:手伸太長(zhǎng)!結(jié)局誰也沒想到

1960年代,許世友想要安徽一個(gè)湖,省委書記拍桌子:手伸太長(zhǎng)!結(jié)局誰也沒想到

源溯歷史
2025-12-22 12:14:11
明后兩天江西陽光在線 元旦假期冷空氣開場(chǎng)

明后兩天江西陽光在線 元旦假期冷空氣開場(chǎng)

江西天氣
2025-12-28 17:14:42
收手吧沈騰,新片耗資1億,請(qǐng)來11位明星出演,首日票房?jī)H101萬

收手吧沈騰,新片耗資1億,請(qǐng)來11位明星出演,首日票房?jī)H101萬

韓馳
2025-12-28 15:11:05
沉默5天,蔡英文發(fā)文哀悼,賴清德時(shí)代或告終,鄭麗文重大失誤

沉默5天,蔡英文發(fā)文哀悼,賴清德時(shí)代或告終,鄭麗文重大失誤

云鵬敘事
2025-12-28 07:50:27
13年前,那個(gè)為200萬踢假球而鋃鐺入獄的前國(guó)腳祁宏,現(xiàn)過得如何

13年前,那個(gè)為200萬踢假球而鋃鐺入獄的前國(guó)腳祁宏,現(xiàn)過得如何

劉森森
2025-12-23 11:43:09
中國(guó)制造正在殺死歐洲圣誕市場(chǎng)?

中國(guó)制造正在殺死歐洲圣誕市場(chǎng)?

刺猬公社
2025-12-26 07:36:17
“奶奶喜喪,能來送送最后一程嗎?”哈爾濱女子因朋友少謙卑求助,眾多網(wǎng)友冒大雪趕來

“奶奶喜喪,能來送送最后一程嗎?”哈爾濱女子因朋友少謙卑求助,眾多網(wǎng)友冒大雪趕來

瀟湘晨報(bào)
2025-12-27 19:16:16
CBA新賽季,只有這四名外援,算得上是超級(jí)外援

CBA新賽季,只有這四名外援,算得上是超級(jí)外援

男足的小球童
2025-12-28 16:38:39
黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

百態(tài)人間
2025-12-27 16:40:18
博主生日想要愛馬仕沒錢,只能在租房吃泡面哭!網(wǎng)友:短劇看多了

博主生日想要愛馬仕沒錢,只能在租房吃泡面哭!網(wǎng)友:短劇看多了

另子維愛讀史
2025-12-28 17:08:03
史上最嚴(yán)電動(dòng)汽車電耗國(guó)標(biāo)來了!明年1月1日起實(shí)施,告別堆電池提升續(xù)航

史上最嚴(yán)電動(dòng)汽車電耗國(guó)標(biāo)來了!明年1月1日起實(shí)施,告別堆電池提升續(xù)航

紅星新聞
2025-12-28 12:25:13
天生沒手沒腳,父母讓他自生自滅,他卻靠自己娶妻生子靠嘴養(yǎng)家

天生沒手沒腳,父母讓他自生自滅,他卻靠自己娶妻生子靠嘴養(yǎng)家

削桐作琴
2025-12-28 14:23:45
固態(tài)電池神話破滅,中日韓千億投資恐打水漂

固態(tài)電池神話破滅,中日韓千億投資恐打水漂

菠蘿欣賞家本尊
2025-12-17 19:00:11
徐鶯太猛,連發(fā)68條懟亞洲周刊!破口大罵,毀了她博士的大好前程

徐鶯太猛,連發(fā)68條懟亞洲周刊!破口大罵,毀了她博士的大好前程

鋭娛之樂
2025-12-28 12:34:54
重磅!2026年起6大新規(guī)生效,你的生活將徹底改變!

重磅!2026年起6大新規(guī)生效,你的生活將徹底改變!

復(fù)轉(zhuǎn)這些年
2025-12-27 23:52:26
2025-12-28 17:47:00
財(cái)經(jīng)AI湃 incentive-icons
財(cái)經(jīng)AI湃
聚焦AI和產(chǎn)業(yè)AI化
570文章數(shù) 629關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

頭條要聞

賴清德彈劾案通過 臺(tái)媒體人:2026年要讓賴輸?shù)矫撗?/h3>

頭條要聞

賴清德彈劾案通過 臺(tái)媒體人:2026年要讓賴輸?shù)矫撗?/h3>

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

旅游
家居
手機(jī)
公開課
軍事航空

旅游要聞

新加坡旅游局?jǐn)y手廣州康輝,點(diǎn)燃馬年獅城旅行新熱度

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

手機(jī)要聞

機(jī)皇爭(zhēng)霸:vivo X300 Ultra與OPPO Find X9 Ultra,誰主沉浮

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

與特朗普會(huì)晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進(jìn)入關(guān)懷版