国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MiniMax發(fā)布M2.1大語言模型,大幅提升多語言編程能力

0
分享至


中國人工智能初創(chuàng)公司MiniMax今日宣布發(fā)布M2.1模型,在現(xiàn)實世界復(fù)雜任務(wù)和智能體能力方面實現(xiàn)顯著性能提升,支持更多編程語言和辦公場景。

M2.1的核心亮點

M2.1的關(guān)鍵亮點包括在多種編程語言方面的編程技能大幅增強,涵蓋Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript和JavaScript等。在美學(xué)設(shè)計能力以及Web、Android和iOS用戶界面開發(fā)理解能力方面實現(xiàn)跳躍式提升。

M2.1相較于M2升級了系統(tǒng)性問題解決能力,不僅關(guān)注代碼執(zhí)行正確性,還注重遵循包含附加或復(fù)雜指導(dǎo)的指令。公司表示,這在真實辦公環(huán)境中提供了更高的可用性,即使是簡單的規(guī)則也可能包含復(fù)雜的細微差別。

為實現(xiàn)這一目標(biāo),公司不僅強調(diào)出色的編程能力,還增強了對話和寫作技能。該模型在日常對話、技術(shù)文檔編寫以及提供結(jié)構(gòu)化響應(yīng)方面表現(xiàn)出色。

開源智能體AI編碼代理公司Kilo Code Inc.的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Scott Breitenother表示:"我們的用戶已經(jīng)開始依賴MiniMax提供前沿級編程輔助,成本僅為同類產(chǎn)品的一小部分。早期測試顯示,M2.1在從架構(gòu)編排到代碼審查和部署的各個方面都表現(xiàn)出色。"

性能評估與基準(zhǔn)測試

MiniMax M2于今年10月底發(fā)布。公司表示,M2.1相比其前身在能力方面表現(xiàn)出顯著改進,特別是在多語言場景中。在這方面,它的表現(xiàn)超越了Anthropic公司的Claude Sonnet 4.5,接近Claude Opus 4.5(更大、更復(fù)雜的模型)。

作為評估的一部分,MiniMax建立了一個新的基準(zhǔn):VIBE(視覺交互執(zhí)行基準(zhǔn))。該測試套件涵蓋五個核心能力:Web、仿真、Android、iOS和后端開發(fā)。與其他基準(zhǔn)不同,VIBE采用智能體驗證者語言配置。這使其能夠評估生成應(yīng)用程序的交互邏輯和視覺美學(xué)。

M2.1在VIBE基準(zhǔn)測試中表現(xiàn)出公司所稱的"杰出性能",平均得分達到88.6分。它在VIBE-Web和VIBE-Android子集中表現(xiàn)特別出色,分別獲得91.5分和89.7分。

公司還針對Anthropic、谷歌、OpenAI和DeepSeek等大廠商,在編程和知識的綜合行業(yè)基準(zhǔn)測試中對新模型進行了測試,包括MMLU-Pro、人類最后考試和Toolathon(針對AI智能體)等。

該模型在智能體工具使用、現(xiàn)實世界知識和復(fù)雜問題解決能力方面表現(xiàn)出一致的高性能。在HLE無工具測試中獲得22.0分,這是一個具有挑戰(zhàn)性的學(xué)術(shù)基準(zhǔn),包含數(shù)千個涵蓋不同學(xué)科的研究生級別多模態(tài)問題。在同樣綜合的學(xué)科知識基準(zhǔn)MMLU上,該模型得分88分,與前沿模型相當(dāng)或緊隨其后。

該模型可通過MiniMax的應(yīng)用程序接口獲得,或從HuggingFace下載開放權(quán)重版本。目前頁面尚未開放。公司的旗艦服務(wù)MiniMax Agent基于新的MiniMax-2.1構(gòu)建。

Q&A

Q1:MiniMax M2.1模型支持哪些編程語言?

A:MiniMax M2.1支持多種主流編程語言,包括Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript和JavaScript等,在這些語言的編程技能方面實現(xiàn)了大幅增強。

Q2:VIBE基準(zhǔn)測試是什么?它如何評估模型性能?

A:VIBE是MiniMax建立的視覺交互執(zhí)行基準(zhǔn),涵蓋Web、仿真、Android、iOS和后端開發(fā)五個核心能力。它采用智能體驗證者語言配置,能夠評估生成應(yīng)用程序的交互邏輯和視覺美學(xué),M2.1在此基準(zhǔn)上獲得88.6分的平均成績。

Q3:MiniMax M2.1與其他主流AI模型相比表現(xiàn)如何?

A:在多語言場景中,M2.1超越了Claude Sonnet 4.5,接近Claude Opus 4.5的性能。在MMLU基準(zhǔn)測試中獲得88分,與Anthropic、谷歌、OpenAI等公司的前沿模型相當(dāng)或緊隨其后。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺武器,會發(fā)生什么?

“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺武器,會發(fā)生什么?

扶蘇聊歷史
2025-12-27 10:30:21
俄羅斯運輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

俄羅斯運輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

史政先鋒
2025-12-31 21:38:56
下月起,看病開藥新規(guī)!6類藥超7天全自費,慢病一次開3個月

下月起,看病開藥新規(guī)!6類藥超7天全自費,慢病一次開3個月

蜉蝣說
2025-12-30 11:59:54
龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報的真相太炸裂

龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報的真相太炸裂

滄海一書客
2025-12-25 19:27:44
剛剛!濱江道、世紀(jì)鐘、解放橋跨年夜震撼一幕···

剛剛!濱江道、世紀(jì)鐘、解放橋跨年夜震撼一幕···

天津人
2025-12-31 22:59:53
攤牌了!徐帆回應(yīng)婚變傳聞才4個月左右 ,馮小剛就連演都懶得演了

攤牌了!徐帆回應(yīng)婚變傳聞才4個月左右 ,馮小剛就連演都懶得演了

阿廢冷眼觀察所
2025-12-10 06:53:04
孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國乒教練組競聘已結(jié)束

孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國乒教練組競聘已結(jié)束

三十年萊斯特城球迷
2025-12-31 22:34:39
浙江足協(xié)官方:寧波職業(yè)足球俱樂部成立,新賽季亮相中甲

浙江足協(xié)官方:寧波職業(yè)足球俱樂部成立,新賽季亮相中甲

懂球帝
2025-12-31 14:41:11
李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個人

李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個人

璀璨幻行者
2026-01-01 01:51:57
隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

止境
2026-01-01 00:43:43
李在明動身訪華前,先給了中國一記下馬威,高市早苗卻笑不出來?

李在明動身訪華前,先給了中國一記下馬威,高市早苗卻笑不出來?

策前論
2025-12-31 18:05:08
美媒評各隊2025年最后悔決策:開拓者選瀚森在列 失誤比助攻還多

美媒評各隊2025年最后悔決策:開拓者選瀚森在列 失誤比助攻還多

羅說NBA
2025-12-31 21:38:12
姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

振華觀史
2025-12-31 09:33:49
洛克希德·馬丁生產(chǎn)線停了,是中國凍結(jié)了他們在華的全部資產(chǎn)。

洛克希德·馬丁生產(chǎn)線停了,是中國凍結(jié)了他們在華的全部資產(chǎn)。

百態(tài)人間
2025-12-31 16:18:36
36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

瓜汁橘長Dr
2025-12-29 17:52:06
在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個股受影響

在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個股受影響

股市皆大事
2025-12-31 20:52:15
回國后我才敢說:越南是我去過的所有國家中,最被低估的

回國后我才敢說:越南是我去過的所有國家中,最被低估的

阿纂看事
2025-12-29 09:43:52
被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內(nèi)鬼!

被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內(nèi)鬼!

星宇共鳴
2025-12-29 09:56:33
洗浴中心成跨年熱門目的地,KTV一房難求,長沙進入全國休閑玩樂交易規(guī)模前十城市

洗浴中心成跨年熱門目的地,KTV一房難求,長沙進入全國休閑玩樂交易規(guī)模前十城市

瀟湘晨報
2025-12-31 20:38:14
這4個器官“用得勤”的人,更長壽

這4個器官“用得勤”的人,更長壽

大象新聞
2025-05-20 19:23:04
2026-01-01 03:03:00
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實驗室。
895文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

日企代表團推遲原定訪華行程 外交部回應(yīng)

頭條要聞

日企代表團推遲原定訪華行程 外交部回應(yīng)

體育要聞

布基納法索2-0蘇丹,拉西納-特拉奧雷破門,阿爾塞納-夸西鎖定勝局

娛樂要聞

官宣才兩天就翻車?七七被連環(huán)爆料

財經(jīng)要聞

高培勇:分配制度改革是提振消費的抓手

汽車要聞

凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

態(tài)度原創(chuàng)

教育
健康
親子
房產(chǎn)
時尚

教育要聞

高考地理:修建水庫與拆除大壩

元旦舉家出行,注意防流感

親子要聞

爺孫話兩岸/鄭麗文

房產(chǎn)要聞

終于等來了!2026年首個買房大利好

靈感集結(jié),能量共振

無障礙瀏覽 進入關(guān)懷版