国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

你的Office被兩個(gè)AI接管了:GPT寫(xiě)稿Claude審稿,微軟默認(rèn)開(kāi)啟

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】微軟最大的對(duì)手不是谷歌,是自己曾經(jīng)的獨(dú)家依賴(lài)。Copilot最新升級(jí)默認(rèn)GPT寫(xiě)稿、Claude審稿,Anthropic的Agent骨架更被直接焊進(jìn)Office。從綁定OpenAI到收編所有頂級(jí)模型,微軟押注的是:無(wú)論誰(shuí)贏,流量都經(jīng)過(guò)我。

單模型時(shí)代,結(jié)束了。

剛剛,微軟把Copilot的引擎換了,在Researcher中引入多模型智能。


從此,Copilot的Researcher智能體,默認(rèn)同時(shí)調(diào)用GPT和Claude。

這不是讓你手動(dòng)切模型的那種「多模型」,而是GPT寫(xiě)完初稿,Claude自動(dòng)扮演專(zhuān)家評(píng)審員逐條審查,審?fù)暝俳桓督o你。

一個(gè)負(fù)責(zé)「沖鋒」,一個(gè)負(fù)責(zé)「挑刺」。

微軟表示,這是Microsoft 365 Copilot深度研究代理Researcher邁出的重要一步。

Researcher專(zhuān)為在工作流程中處理復(fù)雜研究而設(shè)計(jì),這次通過(guò)兩項(xiàng)全新的多模型能力:「批判」(Critique)和「智囊團(tuán)」(Council),進(jìn)一步提升了準(zhǔn)確性、深度和可信度。

實(shí)測(cè)效果驚人。

在DRACO基準(zhǔn)測(cè)試中,這套「雙模型互搏」架構(gòu)綜合得分比此前一直被視為深度研究天花板的Perplexity Deep Research(搭載Claude Opus 4.6)高出13.8%。

但這還不是全部。

同一天上線(xiàn)的Copilot Cowork,微軟表示是把支撐Claude Cowork的技術(shù)平臺(tái)引入了Microsoft 365 Copilot,并與Work IQ、企業(yè)權(quán)限和治理體系深度整合,讓AI能自主規(guī)劃、跨工具推進(jìn)多步任務(wù)。

這已經(jīng)不是「接了個(gè)API」那么簡(jiǎn)單,而是在把外部前沿智能體能力,納入微軟自己的工作系統(tǒng)。

微軟的牌面已攤開(kāi):不把賭注壓在單一模型上,而是把Anthropic、OpenAI等前沿模型納入Copilot的多模型編排框架。

也就是說(shuō),Copilot正在從傳統(tǒng)AI助手,升級(jí)成一個(gè)面向企業(yè)工作的多模型執(zhí)行與編排系統(tǒng)。

Critique

讓AI自己審自己的作業(yè)

過(guò)去的AI研究工作流有一個(gè)結(jié)構(gòu)性盲區(qū):規(guī)劃、檢索、綜合、撰寫(xiě)全部壓在一個(gè)模型上。

讓模型既當(dāng)運(yùn)動(dòng)員又當(dāng)裁判,這樣幻覺(jué)幾乎是必然的。

微軟這次給出的解法是:把「生成」和「評(píng)估」拆成兩個(gè)獨(dú)立角色。

具體到大模型,是讓GPT負(fù)責(zé)上半場(chǎng):任務(wù)規(guī)劃、迭代檢索、起草初稿;Claude負(fù)責(zé)下半場(chǎng):以專(zhuān)家評(píng)審員的身份,基于結(jié)構(gòu)化評(píng)價(jià)量表(Rubric)逐條審查。

這個(gè)量表主要聚焦三個(gè)維度:

來(lái)源可靠性評(píng)估,審查引用是否權(quán)威、可驗(yàn)證;

報(bào)告完整性,檢查是否覆蓋了用戶(hù)請(qǐng)求的所有意圖;

嚴(yán)格的證據(jù)溯源,要求每一個(gè)關(guān)鍵結(jié)論都錨定到帶有精確引用的可靠來(lái)源。

更關(guān)鍵的是,審閱者的定位不是「第二作者」,而是「同行評(píng)審」。它不替你重寫(xiě),而是逼你寫(xiě)得更好。

微軟365和Copilot企業(yè)副總裁Nicole Herskowitz說(shuō):「我們不是簡(jiǎn)單地在Copilot里塞了多個(gè)模型,我們是讓客戶(hù)真正享受到模型協(xié)同工作的好處?!?/p>

未來(lái)這套機(jī)制還會(huì)升級(jí)為雙向互審:GPT也能審Claude的稿。

Critique已經(jīng)是Researcher的默認(rèn)模式,無(wú)需手動(dòng)開(kāi)啟。

其實(shí),這算不上什么技術(shù)花活,而是把學(xué)術(shù)界運(yùn)行了幾百年的同行評(píng)審制度,第一次工程化地嵌進(jìn)了AI系統(tǒng)。

用架構(gòu)設(shè)計(jì)來(lái)壓制幻覺(jué),而不是一味指望單個(gè)模型變得更聰明。

DRACO跑分拆解

13.8%的含金量

數(shù)據(jù)不說(shuō)謊。

DRACO(深度研究準(zhǔn)確性、完整性和客觀性)是由Perplexity和學(xué)術(shù)界研究人員于2026年2月推出的基準(zhǔn)測(cè)試,覆蓋10個(gè)領(lǐng)域、100項(xiàng)復(fù)雜研究任務(wù),全部源自真實(shí)使用場(chǎng)景。

每個(gè)問(wèn)題經(jīng)過(guò)5次獨(dú)立運(yùn)行取均值,評(píng)估維度包括事實(shí)準(zhǔn)確性、分析廣度和深度、表達(dá)質(zhì)量、引用質(zhì)量四項(xiàng)。

評(píng)委模型是GPT-5.2。

微軟特別強(qiáng)調(diào),采用了與基準(zhǔn)論文完全一致的評(píng)估協(xié)議和配置,確?!竿趶健构綄?duì)比。

搭載Critique的Researcher綜合得分實(shí)現(xiàn)了+7.0分(SEM±1.90)的顯著提升,比此前表現(xiàn)最好的Perplexity Deep Research高出13.88%。


DRACO基準(zhǔn)測(cè)試綜合得分對(duì)比圖:各深度研究系統(tǒng)(含Researcher with Critique、Perplexity Deep Research等)橫向得分對(duì)比。其中除Researcher with Critique外,其余對(duì)比結(jié)果引自Zhong et al., arXiv:2602.11685。

拆開(kāi)四個(gè)維度看:

分析廣度和深度提升最明顯,+3.33。其次是表達(dá)質(zhì)量+3.04,事實(shí)準(zhǔn)確性+2.58。引用質(zhì)量同樣有提升。

所有維度均達(dá)到統(tǒng)計(jì)學(xué)顯著(配對(duì)t檢驗(yàn),p<0.0001)。

真正值得注意的是那個(gè)+3.33。分析深度的飆升說(shuō)明Critique最大的價(jià)值不是糾錯(cuò),而是可以逼出更全面的分析視角。

在領(lǐng)域?qū)用妫?0個(gè)領(lǐng)域中有8個(gè)觀察到顯著提升,覆蓋醫(yī)學(xué)、技術(shù)、法律等核心場(chǎng)景。

僅有的兩個(gè)例外是「學(xué)術(shù)」和「大海撈針」,這兩個(gè)領(lǐng)域測(cè)試結(jié)果波動(dòng)較大。


DRACO基準(zhǔn)四項(xiàng)評(píng)測(cè)維度提升表:Researcher with Critique(多模型)相較單模型 Researcher,在分析廣度與深度、呈現(xiàn)質(zhì)量、事實(shí)準(zhǔn)確性和引用質(zhì)量上的提升,以及各項(xiàng)對(duì)最終總分的貢獻(xiàn)。

13.8%聽(tīng)起來(lái)是一個(gè)數(shù)字。

在深度研究這個(gè)賽道上,此前各家打得難分難解,Perplexity搭載Claude Opus 4.6好不容易爬到的天花板,現(xiàn)在被Critique一個(gè)架構(gòu)創(chuàng)新直接擊穿了。

當(dāng)你需要的不是一個(gè)答案

而是一場(chǎng)辯論

Critique解決的是「怎么讓一份報(bào)告更準(zhǔn)」的問(wèn)題。

但有些場(chǎng)景,你要的根本不是一份精修稿,而是兩個(gè)專(zhuān)家吵一架。

而這,就是Council的定位。

在模型選擇器中選「Model Council」,GPT和Claude會(huì)各自獨(dú)立生成一份完整報(bào)告,并排展示。

然后,一個(gè)專(zhuān)門(mén)的評(píng)委模型會(huì)對(duì)兩份報(bào)告進(jìn)行評(píng)估,生成一份綜述(Cover Letter),深入分析雙方在哪些觀點(diǎn)上達(dá)成一致、在何處存在分歧,以及各自帶來(lái)的獨(dú)特見(jiàn)解。


Council模式產(chǎn)品界面截圖:GPT和Claude各自生成的完整報(bào)告并排展示,附評(píng)委模型生成的Cover Letter綜述。

表面上看,這只是「多選一」變成了「全都看」,實(shí)質(zhì)上是把決策場(chǎng)景中的信息盲區(qū)暴露出來(lái)。

一個(gè)模型可能忽略的事實(shí)、權(quán)重不同的分析框架、另一條推理路徑……Council把這些全部擺到桌面上。

做季度戰(zhàn)略報(bào)告的時(shí)候,你希望看到一份精修稿,還是兩個(gè)專(zhuān)家各執(zhí)己見(jiàn)、讓你自己判斷?

Critique是「編輯審稿」模式,效率優(yōu)先。

Council是「專(zhuān)家會(huì)診」模式,決策優(yōu)先。

兩個(gè)模式精準(zhǔn)覆蓋了企業(yè)用AI做研究的兩種核心場(chǎng)景:日常產(chǎn)出要快要準(zhǔn),重大決策要全要思考全面。

Copilot Cowork

微軟把Anthropic的撒手锏搬進(jìn)了Office

如果說(shuō)Critique和Council改變的是研究質(zhì)量,Copilot Cowork改變的是工作方式本身。

Copilot Cowork直接基于Anthropic的Claude Cowork技術(shù)平臺(tái)構(gòu)建。

這里不是「接入」或者「兼容」,而是「基于其技術(shù)平臺(tái)構(gòu)建」。

它的工作方式很簡(jiǎn)單:你描述想要的結(jié)果,Copilot Cowork自動(dòng)制定計(jì)劃,跨工具和文件進(jìn)行邏輯推理,在推進(jìn)過(guò)程中實(shí)時(shí)展示進(jìn)度,你可以隨時(shí)介入和引導(dǎo)。


Copilot Cowork操作界面:描述目標(biāo) → 自動(dòng)規(guī)劃 → 跨工具執(zhí)行 → 實(shí)時(shí)進(jìn)度展示。

內(nèi)置Claude加上微軟原生技能:日歷管理、每日簡(jiǎn)報(bào)等,覆蓋從一次性雜事到每月預(yù)算審查的各類(lèi)任務(wù)。

Capital Group等機(jī)構(gòu)已經(jīng)在使用,反饋集中在規(guī)劃、排程、產(chǎn)出成果以及準(zhǔn)備管理層審查等高價(jià)值場(chǎng)景。

目前通過(guò)Frontier計(jì)劃向早期客戶(hù)開(kāi)放。

這意味著,微軟和Anthropic的關(guān)系,已經(jīng)從「模型供應(yīng)商」進(jìn)化到了「技術(shù)平臺(tái)共建」,Cowork把Claude的Agent骨架直接嵌進(jìn)了M365的肌肉里。

微軟本月早些時(shí)候已以測(cè)試模式發(fā)布Copilot Cowork,目標(biāo)是「抓住市場(chǎng)對(duì)自主AI智能體日益增長(zhǎng)的需求」。

所以,這不是一次產(chǎn)品更新,這是一次架構(gòu)級(jí)別的站隊(duì)。

微軟的真正野心

從AI助手到模型指揮中心

把以上所有動(dòng)作連起來(lái)看,微軟的戰(zhàn)略意圖已經(jīng)很清晰:它不再押注自己或者某一個(gè)模型能贏,而是轉(zhuǎn)向押注無(wú)論誰(shuí)贏,流量都經(jīng)過(guò)我

從對(duì)OpenAI的深度依賴(lài),到把Anthropic的技術(shù)深度整合進(jìn)產(chǎn)品線(xiàn),微軟正在從「模型選手」轉(zhuǎn)型為「編排層」。

Critique讓GPT和Claude協(xié)作,Council讓它們競(jìng)爭(zhēng),Cowork讓Anthropic的Agent能力直接為Office用戶(hù)服務(wù)。

這是平臺(tái)邏輯,不是模型邏輯。

正面戰(zhàn)場(chǎng)上,微軟同時(shí)在硬剛谷歌Gemini的多模態(tài)路線(xiàn)和Anthropic Claude Cowork的自主Agent路線(xiàn)。

但當(dāng)Anthropic、OpenAI、谷歌三巨頭的模型格局已經(jīng)成型,微軟的策略不是下場(chǎng)當(dāng)選手,而是用生態(tài)開(kāi)放把所有選手的能力收編進(jìn)自己的平臺(tái)。

對(duì)開(kāi)發(fā)者來(lái)說(shuō),信號(hào)已經(jīng)非常明確:未來(lái)的競(jìng)爭(zhēng)力不在于綁死一個(gè)模型,而在于編排多模型的能力

但市場(chǎng)對(duì)于微軟這次Copilot升級(jí),似乎并不買(mǎi)賬。

微軟股價(jià)當(dāng)日僅微漲約1%,本季度仍面臨近25%的跌幅:這是2008年金融危機(jī)以來(lái)最差的單季表現(xiàn)。

華爾街更在意的,可能是落地?cái)?shù)據(jù):多模型來(lái)回調(diào)用的成本誰(shuí)買(mǎi)單?企業(yè)員工真能把它融入日常工作流?

可以確定的是,這次升級(jí)改寫(xiě)了微軟與OpenAI的合作關(guān)系,OpenAI在微軟生態(tài)里的位置,已經(jīng)從「唯一的王牌」變成了「牌桌上的一張」。

而對(duì)Anthropic、OpenAI、谷歌三家來(lái)說(shuō),值得警惕的是:當(dāng)平臺(tái)方開(kāi)始把你的能力當(dāng)作可替換的模塊來(lái)編排,模型能力本身或許就不再是護(hù)城河了。

企業(yè)級(jí)AI正在從「聊天機(jī)器人」時(shí)代翻篇,進(jìn)入「工作系統(tǒng)」時(shí)代。

這個(gè)轉(zhuǎn)折點(diǎn)上,決定勝負(fù)的不再是誰(shuí)家的benchmark最高,而是誰(shuí)能把多個(gè)模型編排成一條可靠的、可審計(jì)的、可落地的工作流。

參考資料:

https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/

https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011

https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

飛娛日記
2026-03-19 07:26:09
傻眼!美國(guó)員工店內(nèi)熱舞TikTok引流突破780萬(wàn),老板:全員開(kāi)除,一個(gè)不留

傻眼!美國(guó)員工店內(nèi)熱舞TikTok引流突破780萬(wàn),老板:全員開(kāi)除,一個(gè)不留

北美省錢(qián)快報(bào)
2026-04-11 06:32:55
爭(zhēng)議拉滿(mǎn)!開(kāi)拓者最后2分鐘派楊瀚森,斯普利特向老板低頭了?

爭(zhēng)議拉滿(mǎn)!開(kāi)拓者最后2分鐘派楊瀚森,斯普利特向老板低頭了?

我是阿Sen
2026-04-11 13:50:08
太逗!1米60的張雪站女主播身邊多次踮腳 網(wǎng)友:他的形象足夠高大

太逗!1米60的張雪站女主播身邊多次踮腳 網(wǎng)友:他的形象足夠高大

風(fēng)過(guò)鄉(xiāng)
2026-04-11 08:15:29
關(guān)于兩岸和平統(tǒng)一,鄭麗文做出回應(yīng)!島內(nèi)蔣萬(wàn)安的表態(tài),讓人失望

關(guān)于兩岸和平統(tǒng)一,鄭麗文做出回應(yīng)!島內(nèi)蔣萬(wàn)安的表態(tài),讓人失望

生活魔術(shù)專(zhuān)家
2026-04-11 13:13:12
重慶今年夏天有多熱?最新預(yù)測(cè)來(lái)了……

重慶今年夏天有多熱?最新預(yù)測(cè)來(lái)了……

萬(wàn)州生活
2026-04-10 22:39:29
華國(guó)鋒題字震驚眾人!沒(méi)練書(shū)法的人寫(xiě)得竟比高手還好!

華國(guó)鋒題字震驚眾人!沒(méi)練書(shū)法的人寫(xiě)得竟比高手還好!

書(shū)畫(huà)相約
2026-04-10 08:19:50
莫氏雞煲日入數(shù)萬(wàn)?老板親自算賬回應(yīng),家族分錢(qián)才是真難題

莫氏雞煲日入數(shù)萬(wàn)?老板親自算賬回應(yīng),家族分錢(qián)才是真難題

行者聊官
2026-04-11 11:31:31
特斯拉遠(yuǎn)程鎖死500歐元破解設(shè)備,車(chē)主一覺(jué)醒來(lái)FSD沒(méi)了

特斯拉遠(yuǎn)程鎖死500歐元破解設(shè)備,車(chē)主一覺(jué)醒來(lái)FSD沒(méi)了

Ping值焦慮
2026-04-10 08:18:00
逼走陳忠和,打壓劉國(guó)梁,排擠郎平,90歲“體壇惡人”如今啥情況

逼走陳忠和,打壓劉國(guó)梁,排擠郎平,90歲“體壇惡人”如今啥情況

拳擊時(shí)空
2026-04-04 06:04:24
中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國(guó),30國(guó)大使將訪(fǎng)日

中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國(guó),30國(guó)大使將訪(fǎng)日

書(shū)紀(jì)文譚
2026-04-10 19:04:38
我?guī)?個(gè)同事?lián)屲?chē)票無(wú)一人付錢(qián),發(fā)車(chē)前10分鐘,我把他們的票都退了

我?guī)?個(gè)同事?lián)屲?chē)票無(wú)一人付錢(qián),發(fā)車(chē)前10分鐘,我把他們的票都退了

花小貓的美食日常
2026-04-11 12:07:34
住院時(shí)兒媳全程陪護(hù),出院當(dāng)天女兒拿來(lái)文件:爸,你看看這個(gè)

住院時(shí)兒媳全程陪護(hù),出院當(dāng)天女兒拿來(lái)文件:爸,你看看這個(gè)

紙鳶奇譚
2026-03-31 10:40:50
鄰居大爺把廁所排污管引到我的院子里,我沒(méi)爭(zhēng)辯,種滿(mǎn)了水葫蘆

鄰居大爺把廁所排污管引到我的院子里,我沒(méi)爭(zhēng)辯,種滿(mǎn)了水葫蘆

小秋情感說(shuō)
2026-04-10 09:39:17
24小時(shí)70架運(yùn)輸機(jī)抵達(dá)中東!美媒嘲諷:美國(guó)已經(jīng)淪為全世界笑柄

24小時(shí)70架運(yùn)輸機(jī)抵達(dá)中東!美媒嘲諷:美國(guó)已經(jīng)淪為全世界笑柄

咣當(dāng)?shù)厍?/span>
2026-04-11 13:18:34
Anthropic“過(guò)于先進(jìn),不予展示”的能力,被中國(guó)開(kāi)源模型放出來(lái)了

Anthropic“過(guò)于先進(jìn),不予展示”的能力,被中國(guó)開(kāi)源模型放出來(lái)了

觀察者網(wǎng)
2026-04-10 16:44:12
“崩老頭”月入兩三萬(wàn)?中國(guó)精神小妹批量收割,8090后搶著被崩?

“崩老頭”月入兩三萬(wàn)?中國(guó)精神小妹批量收割,8090后搶著被崩?

素衣讀史
2026-04-10 19:59:20
朋友圈里沒(méi)見(jiàn)到第二位是這個(gè)

朋友圈里沒(méi)見(jiàn)到第二位是這個(gè)

熊太行
2026-04-10 12:10:33
在黎巴嫩,政府和真主黨誰(shuí)說(shuō)了算?

在黎巴嫩,政府和真主黨誰(shuí)說(shuō)了算?

民言民語(yǔ)
2026-04-10 10:13:32
現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒(méi)人敢報(bào),原來(lái)央視記者就是那282人里的一個(gè)

現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒(méi)人敢報(bào),原來(lái)央視記者就是那282人里的一個(gè)

娛樂(lè)洞察點(diǎn)點(diǎn)
2026-04-11 03:16:04
2026-04-11 15:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14945文章數(shù) 66765關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

知名巨頭CEO在美國(guó)的住宅凌晨被投燃燒彈 他發(fā)文回應(yīng)

頭條要聞

知名巨頭CEO在美國(guó)的住宅凌晨被投燃燒彈 他發(fā)文回應(yīng)

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂(lè)要聞

浪姐7淘汰 該走的沒(méi)走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

健康
教育
時(shí)尚
手機(jī)
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

腦科學(xué)揭秘:7歲前不養(yǎng)成3個(gè)腦習(xí)慣,孩子上了小學(xué)天天被找家長(zhǎng)

這件人生單品,現(xiàn)在正是穿它的黃金期

手機(jī)要聞

小米三款手機(jī)今日起正式調(diào)價(jià)!REDMI K90 Pro Max上漲200元

軍事要聞

伊朗議長(zhǎng)帶四名遇難兒童照片赴美伊談判

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版