国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

跟OpenAI撕破臉、微軟喊話要“完全獨(dú)立”!靠不到10人、 一半GPU用量,推出三款王炸低價模型

0
分享至


整理|華衛(wèi)

昨日,科技巨頭微軟旗下研究實驗室 Microsoft AI 宣布推出三款基礎(chǔ) AI 模型,可生成文本、語音和圖像。目前三款模型均已登陸 Microsoft Foundry,其中轉(zhuǎn)錄和語音模型也已在 MAI Playground 中開放使用。

此次發(fā)布標(biāo)志著微軟在仍與 OpenAI 保持合作的同時,持續(xù)推進(jìn)構(gòu)建自有多模態(tài) AI 模型體系,更計劃在模型研發(fā)上與 OpenAI、谷歌及其他前沿實驗室直接競爭。

正面硬剛 OpenAI 和谷歌,

更便宜還更強(qiáng)?

MAI-Transcribe-1 是本次發(fā)布的核心產(chǎn)品。據(jù)介紹,這款語音轉(zhuǎn)文本模型專為復(fù)雜、真實場景下的世界級轉(zhuǎn)錄質(zhì)量而設(shè)計,可將全球使用量最高的 25 種語言的語音轉(zhuǎn)錄為文本,說話人分離、上下文定向優(yōu)化與流式轉(zhuǎn)寫功能均標(biāo)注為 “即將推出”。根據(jù)微軟的基準(zhǔn)測試結(jié)果,該模型在全部 25 種語言上優(yōu)于 OpenAI 的 Whisper-large-v3,在 22 種語言上超過谷歌 Gemini 3.1 Flash,并分別在 15 種語言上領(lǐng)先 ElevenLabs 的 Scribe v2 與 OpenAI 的 GPT-Transcribe。


該模型采用基于 Transformer 的文本解碼器與雙向音頻編碼器,支持 MP3、WAV、FLAC 格式文件,最大容量 200MB。微軟表示,其批量轉(zhuǎn)寫速度是現(xiàn)有 Azure Fast 服務(wù)的 2.5 倍。在行業(yè)標(biāo)準(zhǔn)多語言測試基準(zhǔn) FLEURS 上,該模型針對微軟產(chǎn)品使用量最高的 25 種語言,實現(xiàn)了最低的平均詞錯誤率,僅為 3.8%。微軟已在 Copilot 語音模式和 Microsoft Teams 中測試 MAI-Transcribe-1 用于對話轉(zhuǎn)寫,這一細(xì)節(jié)也凸顯出該公司正計劃迅速用自研模型替代第三方或舊版內(nèi)部模型。

MAI-Voice-1 是一款音頻生成模型,支持用戶在 1 秒內(nèi)生成 60 秒自然流暢的音頻,GPU 利用率極高。它能夠生成自然逼真的語音,細(xì)節(jié)豐富、情感飽滿且富有表現(xiàn)力,即使在長內(nèi)容中也能保留說話人的音色特征。并且,微軟在 Microsoft Foundry 中新增了安全創(chuàng)建自定義語音的功能,僅需幾秒音頻即可完成,能夠極大簡化開發(fā)者構(gòu)建語音交互體驗與智能語音助手的流程。

而 MAI-Image-2 為視頻生成模型,專為攝影師、設(shè)計師和視覺敘事創(chuàng)作者打造,滿足他們對自然光影、精準(zhǔn)膚色與紋理的要求,同時可在圖表、版式和視覺設(shè)計中生成清晰的畫面內(nèi)文字。最初,該模型于 3 月 19 日在全新大語言模型測試工具 MAI Playground 上線,在 Arena.ai 榜單上躋身前三模型系列后,進(jìn)一步大幅提升了 Copilot 上的圖像生成性能與速度。根據(jù)實際生產(chǎn)流量數(shù)據(jù),用戶在 Foundry 和 Copilot 上的生成速度至少提升至原來的 2 倍,同時畫質(zhì)保持一致。該模型也正在逐步向 Bing 和 PowerPoint 分批推送。


微軟在博客中表示,在日益擁擠的 LLM 市場中,這些模型的一大賣點是定價低于谷歌和 OpenAI 的同類產(chǎn)品。MAI-Transcribe-1 定價起步為每小時 0.36 美元。MAI-Voice-1 起步價為每百萬字符 22 美元,MAI-Image-2 則為文本輸入每百萬 tokens 5 美元、圖像輸出每百萬 tokens 33 美元。

微軟此次發(fā)布恰逢其處境微妙之際。這家公司的股票剛迎來 2008 年金融危機(jī)以來表現(xiàn)最差的一個季度,投資者愈發(fā)要求微軟拿出證據(jù),證明其數(shù)千億美元的 AI 基礎(chǔ)設(shè)施投入能夠轉(zhuǎn)化為實際收入。 這批定價極具競爭力、且旨在降低微軟自身銷售成本的模型,正是其應(yīng)對這一壓力的首個答卷。

不足 10 人研發(fā),

GPU 用量僅為競品一半

這些模型由微軟 MAI Superintelligence 團(tuán)隊研發(fā),同時也是團(tuán)隊打響的第一槍。該 AI 研究團(tuán)隊由微軟 AI 負(fù)責(zé)人 Mustafa Suleyman 牽頭,于 2025 年 11 月正式組建并公布,目標(biāo)是實現(xiàn)他所稱的 “AI 自給自足”。

在公開發(fā)布前的采訪中,Suleyman 表示:“我非常激動,我們首批推出的模型就已達(dá)到全球頂尖的轉(zhuǎn)寫水準(zhǔn)。不僅如此,我們實現(xiàn)同等效果所需的 GPU 資源僅為當(dāng)前行業(yè)頂尖競品的一半?!蓖瑫r,Suleyman 對其當(dāng)前的競爭地位信心十足:“我們現(xiàn)已躋身前三的 AI 實驗室,僅次于 OpenAI 與 Gemini。”

而 Suleyman 透露的最令人震驚的細(xì)節(jié),是研發(fā)這些模型的團(tuán)隊規(guī)模之小。“語音模型由 10 個人打造,速度、效率與準(zhǔn)確率的大幅提升,絕大部分來自模型架構(gòu)和我們使用的數(shù)據(jù)。圖像團(tuán)隊同樣不足 10 人。一切都源于模型與數(shù)據(jù)層面的創(chuàng)新,最終實現(xiàn)了頂尖性能。” 他表示,“我的理念一直是:人員要少而精,充分放權(quán)。因此我們采用極度扁平化的管理結(jié)構(gòu)。”

與之形成對比的是 Meta,Suleyman 在采訪中將其策略形容為 “大量招人,而非打造高效團(tuán)隊”,據(jù)稱該公司為頂尖研究員開出的薪酬包高達(dá) 1 億至 2 億美元。其次,小團(tuán)隊就能產(chǎn)出頂尖成果,極大優(yōu)化了經(jīng)濟(jì)效益。如果微軟僅用 10 名工程師、競品一半的 GPU 資源,就能做出行業(yè)頂尖的轉(zhuǎn)寫模型,其 AI 業(yè)務(wù)的利潤結(jié)構(gòu),將與那些燒錢換取相似基準(zhǔn)成績的公司截然不同。

當(dāng)被問及團(tuán)隊工作模式時,Suleyman 形容其環(huán)境更像初創(chuàng)公司的交易大廳,而非傳統(tǒng)的微軟工程部門?!皥F(tuán)隊成員圍坐在圓桌旁,不是傳統(tǒng)辦公桌,用筆記本電腦而非大屏顯示器。 他們?nèi)觳⒓鐓f(xié)作,沉浸式編碼,一個房間里有五六十人,從早到晚。”

此外,Suleyman 一直在為微軟的 AI 業(yè)務(wù)構(gòu)建一套名為 “人文主義 AI” 的理念品牌。他表示,“我認(rèn)為,人文主義超智能的初衷,是打造真正服務(wù)于人類的技術(shù)。人類將始終處于主導(dǎo)地位,技術(shù)也會始終與人類利益保持一致。”在模型發(fā)布的博客文章中,Suleyman 也寫道:“在 Microsoft AI,我們正在打造 Humanist AI。我們在創(chuàng)建 AI 模型時有獨(dú)特理念,以人為中心針對人類真實溝通方式進(jìn)行優(yōu)化,面向?qū)嶋H應(yīng)用進(jìn)行訓(xùn)練。很快,大家將在 Foundry 以及微軟各類產(chǎn)品和體驗中看到我們推出更多模型。”

Suleyman 還強(qiáng)調(diào)數(shù)據(jù)來源是微軟的競爭優(yōu)勢,稱他曾與微軟 CEO Satya Nadella 討論,要打造 “數(shù)據(jù)來源干凈合規(guī)的模型體系”。他隱晦地與開源方案做對比,指出 “很多開源模型的訓(xùn)練數(shù)據(jù)來源可以說并不合規(guī),這可能存在安全隱患。”

與 OpenAI 重新談判,

微軟計劃實現(xiàn) “完全獨(dú)立”

要理解這批模型的重要性,就必須看清促成這一切的協(xié)議層面重大轉(zhuǎn)變。盡管推出了自有模型,Suleyman 在接受外媒采訪時重申,微軟仍將繼續(xù)履行與 OpenAI 的合作承諾。不過他也透露,近期雙方對合作關(guān)系的重新談判,為微軟真正開展超智能研究掃清了障礙。

2025 年 10 月之前,微軟受合同限制,無法獨(dú)立研發(fā)通用人工智能。2019 年與 OpenAI 簽署的原始協(xié)議中,微軟獲得 OpenAI 模型授權(quán),作為交換為其搭建所需云基礎(chǔ)設(shè)施。但當(dāng) OpenAI 試圖將算力合作拓展至微軟之外,與軟銀等方達(dá)成合作時,微軟重啟了協(xié)議談判。正如 Suleyman 在 2025 年 12 月接受外媒采訪時所述,修訂后的協(xié)議意味著 “就在幾周前,微軟還因合同條款,被禁止獨(dú)立研發(fā)通用人工智能或超智能模型”。新條款讓微軟得以自研前沿模型,同時保留至 2032 年使用 OpenAI 所有模型的授權(quán)。

Suleyman 也在最新采訪中直言不諱地描述了這一變化。“去年 9 月,我們重新談判了與 OpenAI 的協(xié)議,這讓我們能夠獨(dú)立推進(jìn)自研超智能模型。” 他表示,“自那之后,我們開始整合算力、組建團(tuán)隊,并采購所需數(shù)據(jù)。”

同時,他迅速強(qiáng)調(diào),與 OpenAI 的合作關(guān)系保持不變。 Suleyman 稱,“與 OpenAI 的合作不會有任何改變,我們至少會合作至 2032 年,希望能更久。他們一直是我們極為出色的合作伙伴?!?目前,微軟已向該 AI 研究實驗室(OpenAI)投資超 130 億美元,并通過一項多年期合作協(xié)議,將其模型集成到微軟各類產(chǎn)品中。他還提到,微軟通過 Foundry API 提供 Anthropic 的 Claude 訪問服務(wù),將自身定位為 “平臺中的平臺”。

但 Suleyman 的潛臺詞顯而易見:微軟正在構(gòu)建獨(dú)立發(fā)展的能力。據(jù)外媒報道,Suleyman 今年 3 月在一份內(nèi)部備忘錄中寫道,他的目標(biāo)是 “未來 5 年,將全部精力投入超智能項目,為微軟打造世界級模型”。這一架構(gòu)調(diào)整讓 Suleyman 從 Copilot 日常產(chǎn)品工作中脫身,前 Snap 高管 Jacob Andreou 接任執(zhí)行副總裁,負(fù)責(zé)整合后的消費(fèi)及商用 Copilot 體驗業(yè)務(wù)。

Suleyman 在采訪中明確表示,語音轉(zhuǎn)寫、語音與圖像生成只是開端。當(dāng)被問及微軟是否會打造可與 GPT 正面競爭的前沿大語言模型時,他態(tài)度毫不含糊:“我們必將在所有模態(tài)上推出頂尖模型。我們的目標(biāo)是:一旦微軟有需要,就能以最高效率、最低價格提供世界一流技術(shù),并實現(xiàn)完全獨(dú)立?!?/p>

據(jù)悉,Suleyman 接受采訪之時,整個團(tuán)隊正齊聚此地開展為期一周的常規(guī)線下集中會議,Nadella 也專程到場。Suleyman 還透露了多年路線圖,包括 “搭建合適規(guī)模的 GPU 集群”,規(guī)劃 “未來 2 至 4 年實現(xiàn) AI 自給自足所需完成的全部目標(biāo),以及對應(yīng)的算力布局路線”。

https://microsoft.ai/news/today-were-announcing-3-new-world-class-mai-models-available-in-foundry/

https://venturebeat.com/technology/microsoft-launches-3-new-ai-models-in-direct-shot-at-openai-and-google

聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文


你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
93年我?guī)碗x婚鄰居收玉米,不小心碰到她胸口她紅著眼問彩禮給多少

93年我?guī)碗x婚鄰居收玉米,不小心碰到她胸口她紅著眼問彩禮給多少

那年秋天
2026-05-06 18:30:05
這妹子眼神太純欲了,打戲也很投入!

這妹子眼神太純欲了,打戲也很投入!

貴圈真亂
2026-05-07 12:34:08
一臺游戲機(jī)賣了37年,巴西人還在買

一臺游戲機(jī)賣了37年,巴西人還在買

像素與芯片
2026-05-05 21:43:09
東體:內(nèi)地媒體遲遲無法辦理世界杯簽證,體育版權(quán)定價應(yīng)回歸理性

東體:內(nèi)地媒體遲遲無法辦理世界杯簽證,體育版權(quán)定價應(yīng)回歸理性

懂球帝
2026-05-07 11:16:09
烏克蘭外長:普京關(guān)心的是閱兵,而不是人的生命;澤連斯基要報仇

烏克蘭外長:普京關(guān)心的是閱兵,而不是人的生命;澤連斯基要報仇

不要把蜜語說給側(cè)耳聽
2026-05-07 09:24:23
31歲中乙中場停賽7個月罰6萬 暴力染紅后威脅+推裁判 踹壞廣告板

31歲中乙中場停賽7個月罰6萬 暴力染紅后威脅+推裁判 踹壞廣告板

風(fēng)過鄉(xiāng)
2026-05-07 12:12:48
深圳24小時“食物銀行”火了!面包牛奶免費(fèi)領(lǐng),惠及人口幾十萬

深圳24小時“食物銀行”火了!面包牛奶免費(fèi)領(lǐng),惠及人口幾十萬

青眼財經(jīng)
2026-05-06 20:27:23
俄羅斯是真眼饞!中國大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

俄羅斯是真眼饞!中國大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

潮鹿逐夢
2026-05-06 16:44:26
大反轉(zhuǎn)!我國學(xué)者顛覆性發(fā)現(xiàn):補(bǔ)充Omega-3或損害大腦突觸功能,加速認(rèn)知衰退

大反轉(zhuǎn)!我國學(xué)者顛覆性發(fā)現(xiàn):補(bǔ)充Omega-3或損害大腦突觸功能,加速認(rèn)知衰退

醫(yī)諾維
2026-05-06 17:13:29
哈里梅根美國豪宅4億成交,"商業(yè)帝國"崩塌,褪去王室光環(huán)顯窘迫

哈里梅根美國豪宅4億成交,"商業(yè)帝國"崩塌,褪去王室光環(huán)顯窘迫

譯言
2026-05-07 08:34:31
東契奇?zhèn)笫状谓邮懿稍L:最初告訴我需要8周康復(fù)

東契奇?zhèn)笫状谓邮懿稍L:最初告訴我需要8周康復(fù)

體壇周報
2026-05-07 07:54:36
看這眼神和姿勢,下一步就應(yīng)是………

看這眼神和姿勢,下一步就應(yīng)是………

飛娛日記
2026-04-28 08:25:31
為什么準(zhǔn)噶爾蒙古選擇向東和清朝火拼,而沒有考慮西征西亞?

為什么準(zhǔn)噶爾蒙古選擇向東和清朝火拼,而沒有考慮西征西亞?

小豫講故事
2026-05-07 06:00:14
學(xué)生時代的王楚然,純欲天花板本人。原來?;ㄕ媸菑男∶赖酱蟮?

學(xué)生時代的王楚然,純欲天花板本人。原來?;ㄕ媸菑男∶赖酱蟮?

科學(xué)發(fā)掘
2026-05-05 20:07:45
堅守油車的理由是啥?網(wǎng)友分享太真實了,但很多人不買賬!

堅守油車的理由是啥?網(wǎng)友分享太真實了,但很多人不買賬!

夜深愛雜談
2026-05-06 20:49:01
返回臺島后,賴清德說了3句話,洪秀柱預(yù)判成真,大陸擲地有聲

返回臺島后,賴清德說了3句話,洪秀柱預(yù)判成真,大陸擲地有聲

說歷史的老牢
2026-05-06 09:59:45
五一行李箱墻刷屏全網(wǎng)!多地暖心接棒,“中國式”安全感火出圈

五一行李箱墻刷屏全網(wǎng)!多地暖心接棒,“中國式”安全感火出圈

孤酒老巷QA
2026-05-05 17:41:40
江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

觀察眼看世界
2026-05-07 11:02:46
華為員工家屬:失業(yè)靠老公養(yǎng)。每月給我2萬元,含房貸7000多元

華為員工家屬:失業(yè)靠老公養(yǎng)。每月給我2萬元,含房貸7000多元

螞蟻大喇叭
2026-05-06 16:50:28
赫格塞思表示盡管有沖突,但美伊停火“沒結(jié)束”

赫格塞思表示盡管有沖突,但美伊停火“沒結(jié)束”

參考消息
2026-05-06 11:46:14
2026-05-07 13:08:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1476文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰(zhàn)

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業(yè)照

財經(jīng)要聞

特朗普:美伊“很有可能”達(dá)成協(xié)議

汽車要聞

理想為什么不做轎車,有了解釋……

態(tài)度原創(chuàng)

旅游
房產(chǎn)
親子
教育
數(shù)碼

旅游要聞

“五一”假期盤點:文旅消費(fèi)亮點紛呈

房產(chǎn)要聞

五一海南樓市,太淡了!

親子要聞

大家好呀,我是優(yōu)奈!四個月啦

教育要聞

推開門,世界廣闊!廈門2026屆初三“二檢”語文作文題出爐

數(shù)碼要聞

三星筆記本版Exynos 2800芯片曝光:1.4nm十核CPU

無障礙瀏覽 進(jìn)入關(guān)懷版