国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI Coding新王登場!MiniMax M2.1拿下多語言編程SOTA

0
分享至

  • 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

MiniMax最新旗艦級Coding & Agent模型M2.1,剛剛對外發(fā)布了。

一邊是港交所聆訊通過新進展,另一邊新模型還在嗖嗖嗖上新——而且還SOTA了。

這一次,它直接甩出了一份硬核成績單,在衡量多語言軟件工程能力的Multi-SWE-bench榜單中,以僅10B的激活參數(shù)拿下了49.4%的成績,超越了Claude Sonnet 4.5等國際頂尖競品,拿下全球SOTA。



它試圖解決的,就是此前模型身上嚴重的“學科偏科”問題。

所謂偏科,指的是過去的模型,寫寫Python腳本或Web前端頁面表現(xiàn)還可以,可一旦涉及到后端架構(gòu),亦或底層邏輯,表現(xiàn)往往會出現(xiàn)斷崖式下跌。

M2.1的核心進化,就在于它終于突破了這個難題,掌握了后端的開發(fā)規(guī)范。

M2.1的發(fā)布,也證明了MiniMax在推進上市流程的同時,仍保持著高頻的研發(fā)節(jié)奏。

更懂底層,10B激活參數(shù)拿下SOTA

M2.1將對工程上下文的理解,轉(zhuǎn)化為了對開發(fā)工具鏈的深度適配。它不僅能生成代碼,更能熟練配合Cursor、Claude Code等主流編程工具,在存量代碼庫中執(zhí)行精準的修復(Fix)或重構(gòu)(Refactor)。

這意味著它不再是一個只會寫新功能的菜鳥,而是一個能遵循既有架構(gòu)規(guī)范、進行工程級操作的熟手。

具體來說,M2.1系統(tǒng)性提升了Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript等語言的能力。

在WebDev與AppDev上,M2.1針對業(yè)界普遍存在的移動端開發(fā)短板,顯著加強了原生Android / iOS開發(fā)能力。

另外,M2.1作為率先引入Interleaved Thinking的模型系列,不僅能關注代碼執(zhí)行是否正確,還能同時關注模型對“復合指令約束”的整合執(zhí)行能力。

使用過程中,M2.1表現(xiàn)出了出色的泛化性,在Claude Code、Droid(Factory AI)、Cline等各類編程工具與Agent框架中均有出色表現(xiàn)。

為了驗證上述能力在真實環(huán)境中的表現(xiàn),MiniMax還構(gòu)建并開源了全新的測試基準VIBE(Visual & Interactive Benchmark for Execution in Application Development),將考核維度從純文本擴展到了Web、仿真、Android、iOS及后端五個領域。

M2.1最終取得了88.6的平均分,綜合水準逼近Claude Opus 4.5。特別是在開發(fā)環(huán)境最為復雜的Android子項上,它跑出了89.7分,這為那些試圖用AI解決原生客戶端難題的開發(fā)者提供了一個具備說服力的數(shù)據(jù)參考。



特點說了這么多,MiniMax M2.1面對真實的編程任務表現(xiàn)究竟如何,接下來就真刀真槍地試上一試。

實測MiniMax M2.1

先看第一個案例——H5小游戲開發(fā)。

為了更真實地模擬實際開發(fā)過程中的場景,我們沒有一次性提完所有需求,而是將開發(fā)過程分成了三個階段逐步進行。

我們要寫的是一個“星際彈弓”游戲,第一輪的目標是搭建出最基本的游戲界面和功能。



只用不到一分鐘,MiniMax M2.1就完成了HTML架構(gòu)、CSS屬性和JS腳本的搭建。



實際運行結(jié)果也證明,M2.1設計的代碼滿足了prompt當中的所有要求。



當然,這樣設計出來的游戲沒什么難度,我們需要在這個基礎之上增加一些額外設定,這便是第二輪的任務。



M2.1會讀取已有代碼和新的指令,在原有基礎之上進行多輪次的修改。



結(jié)果頁面當中也如期出現(xiàn)了“黑洞”,并且通過不斷刷新可以發(fā)現(xiàn),黑洞的大小和位置的確都是隨機產(chǎn)生的。



接著進行試玩檢驗,球的確會受到黑洞的引力吸引,并且被吸入之后游戲自動結(jié)束。



這下難度確實上來了,但是好像又太難了,這種水多加面、面多加水的需求,也是實際開發(fā)當中經(jīng)常遇到的情況,所以第三個階段就是再引入一些新機制,降低一下難度,順便再加一下視覺特效。



對照運行結(jié)果,逐一核對提示中的三點需求,確實都滿足了。



這樣這個“星際彈弓”游戲的開發(fā)過程就基本完成了,不過接下來還有一道加試題,用Python把這個程序重寫一遍。

M2.1理解了網(wǎng)頁版的程序邏輯之后,抓住了所要表達的內(nèi)容,并最終成功實現(xiàn)了從前端到Python的代碼遷移。



接下來我們換一種語言,測試一下最新模型的后端開發(fā)能力。

過去的模型一直按照前端思路在寫后端代碼,造成的結(jié)果就是實際跑不通或者并不實用,但實測M2.1之后,感覺后端這塊硬骨頭確確實實被啃下來了。

正好最近量子位官網(wǎng)后臺需要更新升級,我們就選擇了主流開發(fā)語言Java,實現(xiàn)的功能是權(quán)限設計體系。這是每個系統(tǒng)必不可少的體系,也是面向Agent大規(guī)模落地,從業(yè)者認為需要重新設計的關鍵部件。

因為這是一項系統(tǒng)任務,而非小修小補,所以我們沒有選擇直接用提示詞去生成代碼,而是先讓模型根據(jù)需求輸出了一份設計文檔,接著再根據(jù)設計文檔去實現(xiàn)代碼。



模型很快就輸出了一份Markdown文檔,內(nèi)容非常詳細,包括了權(quán)限設計需要實現(xiàn)哪些類。



類都包含什么方法和屬性,屬性的類型、方法的參數(shù)、返回值和注釋……都寫得很清晰。



同時還根據(jù)我的需求,把類之間的關系也寫清楚了,在設計之初很好地利用了Java語言的繼承特性。



最后也給出了幾個數(shù)據(jù)庫表設計的建議,定義好了需要哪些字段和對應屬性,看下來有沒有感覺比你那個不寫文檔的同事還好用(Doge)?



接下來我們回到和模型的對話,讓它根據(jù)它自己寫的設計文檔,生成代碼(doge)。

模型生成的速度依然很快,輸出的項目包結(jié)構(gòu)很清晰,分好了實體類、枚舉和實現(xiàn)邏輯等,代碼中也寫清楚了注釋。IDE的代碼行數(shù)統(tǒng)計插件顯示,這個小項目一共有1700多行代碼,而我只花了不到一分鐘時間,輸入了兩句話



接下來,我們又讓M2.1給它配上一套UI界面。

結(jié)果非常驚喜,前面階段所需的全部功能全都實現(xiàn)了。



再切換到低權(quán)限賬號,能夠進行的操作也匹配了一開始的設定。



總結(jié)下來呢,M2.1確實是在后端邏輯的設計上有兩把刷子,能夠完成一個項目從后端到前臺的完整交付。

當然它在多語言支持上修煉的本領還不止如此,像Rust這樣的小眾語言,M2.1也進行了專門學習。

比如官方展示的案例當中,M2.1用Rust打造了CLI + TUI雙模式的Linux安全審計利器,支持一鍵對進程、網(wǎng)絡和SSH等關鍵項的底層掃描與智能風險評級。



而且針對業(yè)界普遍存在的移動端開發(fā)短板,M2.1顯著加強了原生Android / iOS開發(fā)能力。

比如這個iOS桌面交互小組件,設計了“沉睡圣誕老人”點擊喚醒機制,邏輯完整且具備原生級的交互動畫效果。



MiniMax選擇在此時發(fā)新模型,背后又有怎樣的目的呢?

IPO前夕的硬核自證

在剛剛通過港交所聆訊這一微妙的時間節(jié)點,MiniMax選擇發(fā)布M2.1,是一種無聲的戰(zhàn)略宣言。

外界往往因Talkie、海螺等爆款產(chǎn)品給這家公司貼上感性的標簽,認為其長板在于語音和視頻等多模態(tài)交互。

但MiniMax今年在M2、M2.1上接連發(fā)力,證明了文本模型的coding、Agent實力。

長期以來,行業(yè)內(nèi)默認AI僅擅長Web前端或Python腳本等容錯率高的任務,而M2.1通過對齊崗位上下文——比如真正理解Go語言的并發(fā)模型或C++的內(nèi)存管理機制——打破了這一天花板。

M2.1同時也是MiniMax研發(fā)效率的一種具象化解釋。招股書披露,公司成立至今僅消耗約5億美元,便構(gòu)建了全模態(tài)能力。

支撐這一效能的關鍵,在于其內(nèi)部極高的“含AI量”——超過80%的代碼已由AI完成。M2.1本質(zhì)上就是這位在內(nèi)部長期服役的“AI實習生”的能力外溢。

這種“內(nèi)用轉(zhuǎn)外售”的路徑,意味著該模型在推向市場前,已經(jīng)作為生產(chǎn)力工具支撐了385人團隊的高強度迭代。

在流程高度AI化的背景下,MiniMax對AI原生組織產(chǎn)生了獨特的理解——AI需要在更多崗位工種、更真實的生產(chǎn)場景中創(chuàng)造價值。

正是基于這種理解,才有了這個模型的誕生。

對于開發(fā)者而言,這或許比單純的參數(shù)指標更具參考價值。

新模型展現(xiàn)的能力和價值,就是MiniMax最好的路演。

Talk is cheap,Show you Model~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“內(nèi)地還有1700的工作?”家長買399羽絨服,香港ip評論刺痛人心

“內(nèi)地還有1700的工作?”家長買399羽絨服,香港ip評論刺痛人心

妍妍教育日記
2025-12-27 11:54:21
王青山,被查!

王青山,被查!

中國基金報
2025-12-26 16:53:47
天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

舍長阿爺談事
2025-12-27 08:25:04
中國實現(xiàn)彎道超車!首條量子芯生產(chǎn)線投產(chǎn),外媒:一切都結(jié)束了!

中國實現(xiàn)彎道超車!首條量子芯生產(chǎn)線投產(chǎn),外媒:一切都結(jié)束了!

阿器談史
2025-12-26 21:58:39
朱楓利用養(yǎng)女阿菊與吳石接頭,犧牲后養(yǎng)女拒絕領尸被罵白眼狼50年

朱楓利用養(yǎng)女阿菊與吳石接頭,犧牲后養(yǎng)女拒絕領尸被罵白眼狼50年

睡前講故事
2025-12-22 15:00:53
里夫斯重傷!沒了,全都沒了!雷迪克暴怒!湖人天塌了

里夫斯重傷!沒了,全都沒了!雷迪克暴怒!湖人天塌了

五姑娘臺球
2025-12-27 11:57:01
日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

西樓知趣雜談
2025-12-20 22:00:18
世界杯決賽進球排行:C羅榜上無名梅西未進前三,第一名現(xiàn)年27歲

世界杯決賽進球排行:C羅榜上無名梅西未進前三,第一名現(xiàn)年27歲

姜大叔侃球
2025-12-27 12:51:40
CBA最新積分榜:京粵全勝領跑,廣廈排第三,遼寧跌至第七名!

CBA最新積分榜:京粵全勝領跑,廣廈排第三,遼寧跌至第七名!

章眽八卦
2025-12-27 12:00:27
立陶宛美女總理,身材火辣穿紅裙,剛上任就公然反華威脅中國

立陶宛美女總理,身材火辣穿紅裙,剛上任就公然反華威脅中國

米果說識
2025-12-27 11:56:47
外國人是如何被中餐征服的?網(wǎng)友:我這邊中餐廳都只有中國人吃

外國人是如何被中餐征服的?網(wǎng)友:我這邊中餐廳都只有中國人吃

帶你感受人間冷暖
2025-12-26 00:05:14
小米17 Ultra正式開售,限購2件,雷軍:史上最好看的小米影像旗艦

小米17 Ultra正式開售,限購2件,雷軍:史上最好看的小米影像旗艦

魯中晨報
2025-12-27 11:29:03
老外驚呼:中國的黨紀連官員吃飯都管得。

老外驚呼:中國的黨紀連官員吃飯都管得住!

中國日報
2025-12-25 14:19:57
日本發(fā)出擁核言論,多方反應強烈,島國核潛力究竟有多強?

日本發(fā)出擁核言論,多方反應強烈,島國核潛力究竟有多強?

史政先鋒
2025-12-25 12:59:58
老人被城管隊員推倒后離世快評,老人違法在前,妨礙城管執(zhí)法工作

老人被城管隊員推倒后離世快評,老人違法在前,妨礙城管執(zhí)法工作

無意爭春
2025-12-27 07:54:53
靈魂拷問:徐院長與“徐小姐”,究竟是何關系?

靈魂拷問:徐院長與“徐小姐”,究竟是何關系?

西門老爹
2025-12-24 11:50:15
1996年,士兵見一位 71 歲老人受凍,好心帶他進軍營取暖,誰料老人見到首長竟高聲呼喊:任務已完成!

1996年,士兵見一位 71 歲老人受凍,好心帶他進軍營取暖,誰料老人見到首長竟高聲呼喊:任務已完成!

文史明鑒
2025-12-25 17:31:12
微胖的女性顯瘦又顯身材的穿搭思路分享

微胖的女性顯瘦又顯身材的穿搭思路分享

牛彈琴123456
2025-12-27 11:36:15
日本發(fā)現(xiàn)原版吳三桂反叛檄文,揭開降清原因:難怪清廷要抹黑他

日本發(fā)現(xiàn)原版吳三桂反叛檄文,揭開降清原因:難怪清廷要抹黑他

掠影后有感
2025-12-25 12:43:41
不許大陸2027年收臺?特朗普突然宣布:2年后要對中國半導體加稅

不許大陸2027年收臺?特朗普突然宣布:2年后要對中國半導體加稅

楊門灼見
2025-12-27 10:58:42
2025-12-27 13:11:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11927文章數(shù) 176345關注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

賈國龍首次回應西貝風波 稱自己連續(xù)40天靠安眠藥入睡

頭條要聞

賈國龍首次回應西貝風波 稱自己連續(xù)40天靠安眠藥入睡

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

劉宇寧:我的價值不需要靠番位來證明

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

藝術
游戲
房產(chǎn)
旅游
家居

藝術要聞

毛主席致徐悲鴻信件曝光,書法風格引關注。

《拳皇98》版不知火舞最新雕像 性感無雙背壓巨大

房產(chǎn)要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

旅游要聞

山西省啟動達人共創(chuàng)計劃助力文旅發(fā)展

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

無障礙瀏覽 進入關懷版