国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Mistral開源兩大編程模型!大參數(shù)模型性能超Kimi、Qwen,小參數(shù)模型PC可跑

0
分享至


智東西
編譯 王欣逸
編輯 程茜

智東西12月10日消息,昨晚,法國大模型獨角獸Mistral AI發(fā)布并開源編程系列模型Devstral 2,該系列分為兩個不同規(guī)格的模型Devstral 2 132B和Devstral Small 2 24B。此外,Mistral還同時推出了原生CLI工具Mistral Vibe,能實現(xiàn)端到端的代碼自動化。此次發(fā)布距Mistral 3系列模型才過去一周。


Devstral 2參數(shù)為123B,支持256K上下文窗口,可以探索代碼庫,并能在保持架構(gòu)層面上下文理解的同時,進行跨文件協(xié)調(diào)更改;Devstral Small 2參數(shù)為24B,同樣具備256K上下文窗口,支持快速推理和反饋,可以定制和本地部署,同時還支持圖像輸入,可應用于多模態(tài)Agents。

在SWE-bench Verified編程基準測試中,Devstral 2取得了72.2%的成績,優(yōu)于Qwen 3 coder plus、Kimi K2 Thinking等開源模型,僅次于DeepSeek V3.2;Devstral Small 2取得了68.8%的成績,超過GPT-OOS-120B,和GLM 4.6持平;在針對實際編程任務進行的人工測試中,Devstral 2表現(xiàn)優(yōu)于DeepSeek V3.2;鶞蕼y試結(jié)果如下:


此外,在部署上,Devstral 2至少需要四塊H100級GPU,更輕量化的Devstral Small 2可以在消費級硬件上本地運行。

Mistral Vibe是一個由Devstral驅(qū)動的開源命令行編程助手,集成了文件操作、代碼搜索、版本控制及命令執(zhí)行等工具。

Mistral AI是一家法國創(chuàng)企,成立于2023年,由前DeepMind和Meta研究人員成立,專注于開源模型開發(fā)。今年9月,該公司宣布獲得17億歐元(約合人民幣139.9億元)C輪融資,估值達到117億歐元(約合人民幣962.6億元),英偉達曾三次投資這家公司。

一、基準測試位列開源第二,和頂尖閉源還有性能差距

據(jù)Mistral官網(wǎng),Devstral 2 123B支持探索代碼庫,能跨多個文件協(xié)調(diào)修改,還能保持上下文理解。它可以跟蹤框架依賴、檢測故障,并能通過修正后重試,從而解決如修復錯誤、改造遺留系統(tǒng)等復雜挑戰(zhàn)。

該模型支持微調(diào),可針對特定編程語言進行優(yōu)化,適配大型企業(yè)代碼庫的需求。

不過,Devstral 2以修改版的MIT協(xié)議發(fā)布,這一協(xié)議對大企業(yè)進行了限制:月收入超過2000萬美元(約合人民幣1.41億元)的公司,在未獲得Mistral單獨商業(yè)許可的情況下,無法使用該模型。

更輕量化的模型Devstral Small 2 24B支持快速推理、迭代反饋和定制,可本地部署,同時還支持圖像輸入,可應用于多模態(tài)Agents。

從基準測試來看,Devstral 2模型位列開源模型的第二名,并正趕超頂尖閉源模型。

Devstral 2在SWE-bench Verified編程基準測試中取得了72.2%的得分,Devstral Small 2取得了68%的得分,在開源模型中已經(jīng)達到了領(lǐng)先水平,Devstral 2的得分僅次于DeepSeek V3.2。


Devstral 2系列模型的亮點在于小參數(shù)設(shè)計,其模型在關(guān)鍵基準測試中展現(xiàn)出和頂尖開源模型齊平的性能,卻僅需后者幾分之一的參數(shù)量。

得分只比Devstral 2高0.9%的DeepSeek V3.2,其參數(shù)大小是Devstral 2的5倍,是Devstral Small 2的28倍,而表現(xiàn)次于Devstral 2的Kimi K2 Thinking,其參數(shù)大小是Devstral 2的8倍,是Devstral Small 2的41倍。


不過,Devstral 2系列模型與頂尖閉源模型之間還存在差距。

人工評測結(jié)果顯示,在Cline構(gòu)建的任務場景中,Devstral 2相對DeepSeek V3.2優(yōu)勢明顯,勝率為42.8%,敗率為28.6%。然而,Devstral 2相對頂尖閉源模型Claude Sonnet 4.5敗下陣來,勝率僅為21.4%,敗率為53.1%。


二、端到端代碼自動化,能進行架構(gòu)級推理

Mistral Vibe是基于Devstral模型構(gòu)建的開源命令行編程助手,能通過自然語言交互,接入IDE,實現(xiàn)對代碼庫的探索、修改與變更執(zhí)行。


Mistral Vibe提供了一個交互式對話界面,集成了文件操作、代碼搜索、版本控制及命令執(zhí)行等工具。

它能自動掃描用戶文件結(jié)構(gòu)及Git狀態(tài),提供相關(guān)上下文信息,能理解整個代碼庫的架構(gòu),并進行架構(gòu)級推理,此外,它還擁有智能引用、持久化歷史、自動補全和可自定義主題等功能。

開發(fā)者可以通過腳本編程方式運行Mistral Vibe,啟用工具執(zhí)行的自動批準功能,通過簡潔的config.toml配置文件管理本地模型與供應商設(shè)置,靈活控制工具權(quán)限。

結(jié)語:平衡高性能與小參數(shù),為企業(yè)提供了低門檻解決方案

從Mistral 3到Devstral 2系列、Mistral Vibe,Mistral AI正以相當快的進擊速度參與AI競爭,并在模型的高性能與輕量化間實現(xiàn)了平衡,從測試結(jié)果看,Devstral Small 2模型在參數(shù)僅為24B的情況下,依然優(yōu)于不少開源模型,和GLM 4.6打平。

Mistral AI在公告中提到,Devstral 2系列模型專為生產(chǎn)級工作流打造,并被定位為下一代SOTA編程模型。盡管和頂尖閉源編程模型還有很大差距,不過,對大多數(shù)企業(yè)而言,Devstral 2和Devstral Small 2可以作為一個低門檻的初步解決方案,尤其是在和Mistral Vibe的搭配使用上,Devstral 2系列模型或?qū)⒃谔囟ǖ纳a(chǎn)環(huán)節(jié)發(fā)揮作用。

來源:Mistral AI

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
火箭加時負鵜鶘!3種戰(zhàn)術(shù)全部失敗,烏度卡該背鍋?杜蘭特來錯隊

火箭加時負鵜鶘!3種戰(zhàn)術(shù)全部失敗,烏度卡該背鍋?杜蘭特來錯隊

熊哥愛籃球
2025-12-19 12:35:47
75年,毛主席得知一中將在蕪湖當?shù)匚睍,怒言:必須重新分?>
    </a>
        <h3>
      <a href=歷史龍元閣
2025-12-18 11:25:10
河北又有2名副市長被紀委帶走調(diào)查!

河北又有2名副市長被紀委帶走調(diào)查!

新牛城
2025-12-19 10:01:14
泰軍稱摧毀6個柬埔寨詐騙基地,回應未響應美方等;鸷粲酰簲財嗫鐕缸锔;目前泰柬沖突已致泰方42死、柬方18名平民遇難!

泰軍稱摧毀6個柬埔寨詐騙基地,回應未響應美方等;鸷粲酰簲財嗫鐕缸锔矗荒壳疤┘頉_突已致泰方42死、柬方18名平民遇難!

揚子晚報
2025-12-18 23:13:38
廣州,已倒閉餐廳最意難平top1…

廣州,已倒閉餐廳最意難平top1…

羊城攻略
2025-12-18 18:37:03
退捐還畫,兩難自解

退捐還畫,兩難自解

呦呦鹿鳴
2025-12-17 16:01:25
何晴離婚真相曝光!史曉燕力挺許亞軍:把何晴捧手里,曝劇組黑料

何晴離婚真相曝光!史曉燕力挺許亞軍:把何晴捧手里,曝劇組黑料

振華觀史
2025-12-19 09:51:22
辛選員工集體跑路,辛巴在崩潰邊緣

辛選員工集體跑路,辛巴在崩潰邊緣

電商派Pro
2025-12-18 10:05:26
稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經(jīng)過正規(guī)審批,價格比市場便宜

稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經(jīng)過正規(guī)審批,價格比市場便宜

觀威海
2025-12-18 10:18:04
剛剛,暴力拉升!漲停潮來了

剛剛,暴力拉升!漲停潮來了

中國基金報
2025-12-19 10:43:28
氣到甩手+要球被無視!休媒高呼把球給KD:15中12轟32+4帽太落寞

氣到甩手+要球被無視!休媒高呼把球給KD:15中12轟32+4帽太落寞

顏小白的籃球夢
2025-12-19 12:05:37
務實還是無奈,重慶市已經(jīng)放棄蘭渝高鐵

務實還是無奈,重慶市已經(jīng)放棄蘭渝高鐵

芭比衣櫥
2025-12-19 09:40:34
大鵬自曝被張朝陽“踢出局”!3000萬分紅泡湯,手機仍存離職信

大鵬自曝被張朝陽“踢出局”!3000萬分紅泡湯,手機仍存離職信

孟一宜
2025-12-19 10:20:28
重磅!巴薩給拉什福德下留隊最后通牒:2 大條件缺一不可

重磅!巴薩給拉什福德下留隊最后通牒:2 大條件缺一不可

瀾歸序
2025-12-19 01:49:25
午評:創(chuàng)業(yè)板指、深成指均漲近1% 大消費板塊集體爆發(fā)

午評:創(chuàng)業(yè)板指、深成指均漲近1% 大消費板塊集體爆發(fā)

財聯(lián)社
2025-12-19 11:34:05
1966年,27歲的胡友松發(fā)現(xiàn)生理期沒正常來,便問75歲的丈夫李宗仁

1966年,27歲的胡友松發(fā)現(xiàn)生理期沒正常來,便問75歲的丈夫李宗仁

忠于法紀
2025-12-18 19:56:53
中央最近亮劍了,十五五規(guī)劃直接把“遮羞布”扯了下來。

中央最近亮劍了,十五五規(guī)劃直接把“遮羞布”扯了下來。

南權(quán)先生
2025-12-16 16:24:33
12月18日俄烏最新:普京決定讓川普分一杯羹

12月18日俄烏最新:普京決定讓川普分一杯羹

西樓飲月
2025-12-18 18:05:04
河南一地學校禁燃油車接送學生,家長怒斥“荒唐至極”

河南一地學校禁燃油車接送學生,家長怒斥“荒唐至極”

西門老爹
2025-12-18 14:10:57
現(xiàn)在是12月19號上午,剛剛傳來5個驚天大消息,要來大動作了嗎?

現(xiàn)在是12月19號上午,剛剛傳來5個驚天大消息,要來大動作了嗎?

股市皆大事
2025-12-19 08:35:13
2025-12-19 13:00:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產(chǎn)業(yè)升級。
10938文章數(shù) 116929關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

頭條要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

本地
親子
房產(chǎn)
旅游
軍事航空

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

親子要聞

很多家長問支具鋁板是什么,名字叫指鋁板,網(wǎng)上都能搜到

房產(chǎn)要聞

萬科·三亞嘉瀾地,萬科高端旅居系1號作品全球發(fā)布

旅游要聞

北京周末可往返!賞冰雪、涮暖鍋、逛大集……官方推薦攻略來了→

軍事要聞

福建艦入列后首過臺海 臺方談為何"甲板上沒有艦載機"

無障礙瀏覽 進入關(guān)懷版