国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI、Anthropic發(fā)新模型,一個(gè)替你寫代碼,一個(gè)替公司管流程

0
分享至

凌晨,Anthropic和OpenAI同時(shí)上線了新模型Claude Opus 4.6和GPT-5.3-Codex,給兩家企業(yè)本就在為超級(jí)碗廣告互嗆的激烈氣氛又添了一把柴火。當(dāng)全美觀眾還在為它倆斥資數(shù)百萬(wàn)美元投放的互懟廣告津津樂道時(shí),它們已經(jīng)殺到了同日發(fā)新模型這樣的正面交鋒戰(zhàn)場(chǎng)上。

Anthropic發(fā)布Claude Opus 4.6:搭載處于Beta階段的1M上下文窗口

Anthropic發(fā)布了Claude Opus 4.6,其并非僅僅是參數(shù)量的增加,而是在多個(gè)關(guān)鍵維度上實(shí)現(xiàn)了實(shí)質(zhì)性的更聰明和更可用。一個(gè)值得關(guān)注的亮點(diǎn)是它那處于Beta階段的1M上下文窗口。過去的模型在處理極長(zhǎng)文本時(shí),經(jīng)常出現(xiàn)上下文腐化的問題,即模型性能隨著文本長(zhǎng)度增加而顯著下降,導(dǎo)致它忘記或者混淆較早之前的信息。

而Claude Opus 4.6在著名的大海撈針基準(zhǔn)測(cè)試MRCR v2上,成績(jī)達(dá)到了76%,遠(yuǎn)超前代Sonnet 4.5的18.5%,這證明它能夠真正有效地利用超長(zhǎng)下文,在海量文檔中精準(zhǔn)定位并提取被深埋的關(guān)鍵信息,從而勝任大型代碼庫(kù)分析、多篇論文綜述、跨會(huì)話長(zhǎng)程任務(wù)規(guī)劃等場(chǎng)景。


(來源:https://www.anthropic.com/news/claude-opus-4-6)

在推理能力和編碼能力上,Claude Opus 4.6在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中確立了行業(yè)領(lǐng)先地位,特別是在需要自主規(guī)劃和多步執(zhí)行的智能體編碼任務(wù)上。比如,在Terminal-Bench 2.0中它的測(cè)試成績(jī)排名第一。

實(shí)際表現(xiàn)就是,當(dāng)你交給它一個(gè)復(fù)雜的開發(fā)任務(wù)時(shí)間,它會(huì)進(jìn)行更加審慎的規(guī)劃,對(duì)代碼進(jìn)行更加徹底的自我審查和自我調(diào)試,并能在大型項(xiàng)目中保持更好的方向感和一致性。也就是說不再是簡(jiǎn)單地生成一段代碼,實(shí)際上是在扮演一個(gè)更有經(jīng)驗(yàn)的開發(fā)者角色。

為了讓這種深度能力更加容易被調(diào)控,Anthropic引入了努力程度(Effort)控制參數(shù),開發(fā)者現(xiàn)在可以在低、中、高、最大這四個(gè)級(jí)別中進(jìn)行選擇。

在高模式或者最大模式下,模型會(huì)投入更多計(jì)算資源進(jìn)行深度思考,非常適合解決一些棘手問題;而對(duì)于簡(jiǎn)單的查詢,切換到中模式或者低模式則可以獲得更快的響應(yīng)并能降低成本。與之配套的自適應(yīng)思考功能,則允許模型根據(jù)上下文自行判斷何時(shí)需要啟動(dòng)深度推理,進(jìn)一步提高了靈活性。

為了解決長(zhǎng)會(huì)話或智能體任務(wù)中必然遇到的上文長(zhǎng)度限制問題,API還能提供上下文壓縮Beta功能。當(dāng)對(duì)話接近預(yù)設(shè)的token閾值時(shí),模型會(huì)自動(dòng)將較早的上下文進(jìn)行智能摘要并替換,從而為新的交互騰出空間,讓超長(zhǎng)程任務(wù)成為了可能,而不僅僅是理論上地支持長(zhǎng)上下文。


(來源:https://www.anthropic.com/news/claude-opus-4-6)

在應(yīng)用層,Claude正在深度融入生產(chǎn)力工具鏈。Claude Code引入了智能體團(tuán)體的研究預(yù)覽功能,允許創(chuàng)建多個(gè)協(xié)同工作的AI智能體來并行處理任務(wù),例如同時(shí)對(duì)代碼庫(kù)的不同模塊進(jìn)行審查。

而對(duì)于更廣泛的辦公場(chǎng)景,Claude in Excel和全新推出的Claude in PowerPoint研究預(yù)覽版,將模型的推理能力和生成能力直接嵌入到電子表格和幻燈片制作中。它能執(zhí)行公式操作,也能通過理解你的數(shù)據(jù)意圖進(jìn)行多步規(guī)劃;在PPT中,它可以理解企業(yè)品牌模板和字體,生成風(fēng)格一致的內(nèi)容。

安全與能力對(duì)齊一直是Anthropic的重點(diǎn)之一。據(jù)了解,Opus 4.6在保持與頂尖模型相當(dāng)?shù)陌踩雷o(hù)水平的同時(shí),其過度拒絕的概率降低到了近期Claude模型中的最低點(diǎn)。這意味著它在有效攔截有害請(qǐng)求的同時(shí),對(duì)于普通問題和良性問題的回應(yīng)更加開放和有用。針對(duì)該模型的網(wǎng)絡(luò)安全能力,Anthropic也專門開發(fā)了新的檢測(cè)探針,并將其用于輔助發(fā)現(xiàn)和修復(fù)開源軟件漏洞等防御性用途。

總的來說,Claude Opus 4.6一定程度上代表著大模型正從對(duì)話式問答工具向可承擔(dān)復(fù)雜工作的智能體伙伴演進(jìn)。它對(duì)于超長(zhǎng)上下文的實(shí)用化支持、精細(xì)化的推理控制、以及深度集成的工作流,能夠進(jìn)一步地提高用戶效率。

OpenAI推出GPT-5.3-Codex:可能是目前最強(qiáng)大的智能體編碼模型

OpenAI此次推出的是GPT-5.3-Codex,被稱為是迄今為止最強(qiáng)大的智能體編碼模型,能夠獨(dú)立接管涉及研究、工具使用和復(fù)雜執(zhí)行的長(zhǎng)期任務(wù)。也就是說,一個(gè)可以持續(xù)工作數(shù)天之久、可以從零開始構(gòu)建出復(fù)雜游戲應(yīng)用的AI誕生了,在它工作的過程中你可以隨時(shí)和其對(duì)話并調(diào)整工作方向,無(wú)需擔(dān)心失去長(zhǎng)上下文記憶。


(來源:https://openai.com/index/introducing-gpt-5-3-codex/)

在多項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中,GPT-5.3-Codex都創(chuàng)下了新的行業(yè)紀(jì)錄,以77.3%的準(zhǔn)確率大幅超越了前代模型在衡量終端編程技能的Terminal-Bench 2.0基準(zhǔn)測(cè)試上的表現(xiàn),并在更嚴(yán)格的、涵蓋多語(yǔ)言的SWE-Bench Pro軟件工程測(cè)評(píng)中達(dá)到了領(lǐng)先水平。

GPT-5.3-Codex的能力邊界已經(jīng)從純粹的編碼拓展到整個(gè)知識(shí)工作領(lǐng)域。在衡量真實(shí)世界職業(yè)任務(wù)的GDPval評(píng)估中,其表現(xiàn)能力與OpenAI的通用旗艦?zāi)P虶PT-5.2相當(dāng)。在制作金融分析PPT、設(shè)計(jì)零售培訓(xùn)文檔以及編寫商業(yè)計(jì)劃書中,GPT-5.3-Codex能夠輸出專業(yè)的可使用內(nèi)容。


(來源:https://openai.com/index/introducing-gpt-5-3-codex/)

OpenAI透露,GPT-5.3-Codex的開發(fā)過程本身就是一個(gè)自我實(shí)現(xiàn)的范例,OpenAI利用該模型的早期版本來調(diào)試其自身的訓(xùn)練過程、管理部署并診斷測(cè)試結(jié)果,加速了整個(gè)模型的研發(fā)周期??偨Y(jié)來說,GPT-5.3-Codex的推出讓AI進(jìn)一步地從一個(gè)等待指令的編程工具轉(zhuǎn)變?yōu)橐粋€(gè)能主動(dòng)思考、跨領(lǐng)域執(zhí)行并與人類實(shí)時(shí)協(xié)作的電腦伙伴。

急于變現(xiàn)?OpenAI推出AI企業(yè)級(jí)產(chǎn)品Frontier

如果說這次同一天發(fā)布新品,OpenAI的贏點(diǎn)之一或許在多發(fā)了一樣新品,那就是企業(yè)級(jí)產(chǎn)品Frontier。它不是一個(gè)大模型,是一個(gè)專門為企業(yè)打造的、可用于規(guī)?;瘶?gòu)建、能夠部署和管理AI智能體的平臺(tái)。它的核心目標(biāo)是將模型能力,真正轉(zhuǎn)化為企業(yè)內(nèi)可協(xié)同、可管控、能直接創(chuàng)造價(jià)值的AI同事。


(來源:https://openai.com/index/introducing-openai-frontie)

過去幾年,盡管許多企業(yè)嘗試引入AI,但往往陷入了試點(diǎn)困境,一個(gè)個(gè)獨(dú)立的AI應(yīng)用像孤島一樣,缺乏對(duì)于企業(yè)整體業(yè)務(wù)背景的理解,難以融入核心流程。Frontier旨在解決這一問題,它為企業(yè)AI智能體提供了四大關(guān)鍵支撐:共享的業(yè)務(wù)背景理解、可靠的執(zhí)行環(huán)境、持續(xù)的學(xué)習(xí)優(yōu)化機(jī)制,以及明確的身份權(quán)限和安全邊界。

簡(jiǎn)單來說,F(xiàn)rontier試圖像培訓(xùn)一位剛?cè)肼毜男聠T工一樣,來配置一個(gè)AI智能體。它會(huì)打通企業(yè)內(nèi)部固有的數(shù)據(jù)倉(cāng)庫(kù)、CRM系統(tǒng)和內(nèi)部應(yīng)用,讓AI理解信息如何流動(dòng)、決策在何處產(chǎn)生。

在此基礎(chǔ)之上,AI智能體可以在一個(gè)受控的執(zhí)行環(huán)境中,使用工具、運(yùn)行代碼、處理文件,從而能夠?qū)嶋H地完成各種知識(shí)工作任務(wù),并在過程中積累記憶,以便能夠越做越好而不是越做越差。同時(shí),每個(gè)AI智能體都擁有獨(dú)立的身份和明確的權(quán)限護(hù)欄,確保其在敏感環(huán)境和受監(jiān)管的環(huán)境里也能被安全地使用。

目前,OpenAI已經(jīng)和惠普、甲骨文以及Uber等企業(yè)合作。OpenAI還舉了和一家大型制造商合作的案例,通過部署基于Frontier的智能體,后者將生產(chǎn)優(yōu)化分析工作從六周縮短到了一天。

其實(shí)也可以看出,OpenAI的變現(xiàn)愿望是非常強(qiáng)的,此次伴隨新模型一并推出Frontier,也反映出其戰(zhàn)略重心正從提供單一的模型API轉(zhuǎn)向深入的企業(yè)復(fù)雜工作量,深入到提供端到端解決方案的地步。對(duì)于希望將AI轉(zhuǎn)化為實(shí)際競(jìng)爭(zhēng)優(yōu)勢(shì)的企業(yè)而言,F(xiàn)rontier或許是一個(gè)值得關(guān)注的備選方案。

而這一凌晨對(duì)決何嘗不是一個(gè)新的超級(jí)碗時(shí)刻?Anthropic的創(chuàng)始人本來就是OpenAI的前員工,讓這一對(duì)決更是增加了火藥味。

整體來看,Claude Opus 4.6的核心優(yōu)勢(shì)在于精細(xì)控制和可靠性,GPT-5.3-Codex則展現(xiàn)了OpenAI的系統(tǒng)整合能力。前者勝在深度和可靠,后者強(qiáng)在廣度和進(jìn)化速度。未來到底孰強(qiáng)孰弱,主要還看誰(shuí)家產(chǎn)品能夠轉(zhuǎn)化為真正不可替代的產(chǎn)業(yè)發(fā)展成果。

參考資料:

https://www.anthropic.com/news/claude-opus-4-6

https://openai.com/index/introducing-gpt-5-3-codex/

https://openai.com/index/introducing-openai-frontier/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
雨+雨夾雪+中到大雪!河北大范圍雨雪要來!

雨+雨夾雪+中到大雪!河北大范圍雨雪要來!

掌中邯鄲
2026-02-25 11:10:27
AI除夕夜辱罵用戶,騰訊元寶回應(yīng)

AI除夕夜辱罵用戶,騰訊元寶回應(yīng)

IT之家
2026-02-25 14:57:08
“5億人在路上”的春節(jié),酒店業(yè)要“開悟”的6大趨勢(shì)

“5億人在路上”的春節(jié),酒店業(yè)要“開悟”的6大趨勢(shì)

空間秘探
2026-02-25 12:47:06
俄深夜收到消息,中美態(tài)度罕見一致!普京明白,絕不能再意氣用事

俄深夜收到消息,中美態(tài)度罕見一致!普京明白,絕不能再意氣用事

觸摸史跡
2026-02-25 18:35:40
演員陳麗君殺瘋了:臺(tái)北5場(chǎng)演出售票秒空,越劇演員憑借實(shí)力爆紅

演員陳麗君殺瘋了:臺(tái)北5場(chǎng)演出售票秒空,越劇演員憑借實(shí)力爆紅

影像溫度
2026-02-25 14:17:14
讓春晚導(dǎo)演向全國(guó)道歉,入美國(guó)籍卻回中國(guó)撈金,她到底什么來頭?

讓春晚導(dǎo)演向全國(guó)道歉,入美國(guó)籍卻回中國(guó)撈金,她到底什么來頭?

觀察鑒史
2024-09-15 17:25:45
新華鮮報(bào)|樂享消費(fèi)!節(jié)日支付數(shù)據(jù)看熱氣騰騰中國(guó)年

新華鮮報(bào)|樂享消費(fèi)!節(jié)日支付數(shù)據(jù)看熱氣騰騰中國(guó)年

新華社
2026-02-24 23:28:07
歐冠史詩(shī)級(jí)臥底!本塞拜尼單場(chǎng)解鎖失誤全成就,把多特坑出歐冠

歐冠史詩(shī)級(jí)臥底!本塞拜尼單場(chǎng)解鎖失誤全成就,把多特坑出歐冠

阿錯(cuò)田間生活
2026-02-26 06:47:45
香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠(chéng)花費(fèi)千萬(wàn)為他續(xù)命

香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠(chéng)花費(fèi)千萬(wàn)為他續(xù)命

郁郁乎文
2024-07-07 22:25:36
年薪比索博還高!利物浦這尊 “高薪水貨”,今夏必須套現(xiàn)

年薪比索博還高!利物浦這尊 “高薪水貨”,今夏必須套現(xiàn)

瀾歸序
2026-02-26 06:38:50
李中華揭秘2015年中泰空戰(zhàn)失利細(xì)節(jié):裝備和人的因素都存在

李中華揭秘2015年中泰空戰(zhàn)失利細(xì)節(jié):裝備和人的因素都存在

談史論天地
2026-02-10 14:00:07
普京將整個(gè)俄羅斯在烏克蘭的努力,化為泡影

普京將整個(gè)俄羅斯在烏克蘭的努力,化為泡影

走進(jìn)烏克蘭2022
2026-02-26 00:30:40
艾滋病新增130萬(wàn)!很多人中招很冤枉!在外“5不碰”一定要記死

艾滋病新增130萬(wàn)!很多人中招很冤枉!在外“5不碰”一定要記死

今朝牛馬
2025-12-31 19:31:04
太可惜!武漢知名連鎖餐廳已全部關(guān)閉

太可惜!武漢知名連鎖餐廳已全部關(guān)閉

趣味萌寵的日常
2026-02-26 00:42:06
陪伴6年,終于回本!高瓴資本突然減持格力,套現(xiàn)43億...

陪伴6年,終于回本!高瓴資本突然減持格力,套現(xiàn)43億...

金石隨筆
2026-02-26 00:12:30
山東省泰安市政協(xié)原副主席倪慶賓被“雙開”

山東省泰安市政協(xié)原副主席倪慶賓被“雙開”

界面新聞
2026-02-25 10:34:47
中國(guó)第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房?jī)?nèi)有特殊布置

中國(guó)第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房?jī)?nèi)有特殊布置

瓦倫西亞月亮
2026-02-20 17:37:18
陪睡陪玩只是冰山一角!萬(wàn)達(dá)蒸發(fā)820億,王思聰再陷丑聞

陪睡陪玩只是冰山一角!萬(wàn)達(dá)蒸發(fā)820億,王思聰再陷丑聞

風(fēng)信子的花
2026-02-25 14:50:42
范明南京豪宅首曝光,房子5年打造,院子500平起,藝術(shù)畫作堆滿屋

范明南京豪宅首曝光,房子5年打造,院子500平起,藝術(shù)畫作堆滿屋

林輕吟
2026-02-25 22:20:04
楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

手工制作阿殲
2026-02-22 13:25:34
2026-02-26 07:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16320文章數(shù) 514654關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

親子
時(shí)尚
健康
本地
游戲

親子要聞

產(chǎn)后性生活冷淡?找回“高潮”,是修復(fù)夫妻關(guān)系的第一步

“復(fù)古甜心”穿搭突然大火!春天穿時(shí)髦又減齡

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

本地新聞

津南好·四時(shí)總相宜

《如龍極3》中文配音訪談:中文配音與本地化并非易事

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版