網易首頁 > 網易號 > 正文申請入駐

豆包 2.0 模型發(fā)布，全信息整理（全網最完整，另附 79 頁 Model Card）

2026-02-14 15:11:50　來源: 賽博禪心

北京舉報

分享至

今天 Seed2.0 全系列正式發(fā)布
Seed2.0，也就是豆包大模型2.0（Doubao-Seed-2.0）

包括 Pro、Lite、Mini 三款通用 Agent 模型加一個 Code 模型，圍繞 Agent 使用和大規(guī)模生產，做了系統(tǒng)性優(yōu)化

先看數(shù)據(jù)（本文里所有表格，都是我做的，好不好看?。。。?/p>

Seed2.0 核心評測數(shù)據(jù)總覽｜vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次過完核心部份：

多模態(tài)，數(shù)學與視覺推理 19 項基準 12 項第一，視覺感知、文檔理解、長上下文大部分基準 SOTA，EgoTempo 超過人類分數(shù)

LLM 科學能力，HealthBench 第一，SuperGPQA 超 GPT-5.2，整體與 Gemini 3 Pro、GPT-5.2 相當；在深度研究上也取得了不俗的成績

代碼，有明顯進步，部分高難基準與國際領先模型仍有差距

已上線，豆包 App 選「專家」模式 / TRAE 選「Doubao-Seed-2.0-Code」，全系列 API 已上線火山引擎，價格較同級 GPT 和 Claude 便宜一個數(shù)量級

Model Card 也有，同時發(fā)布的還有一份 79 頁的 Model Card，公眾號后臺回復「Seed2.0」，獲取這份 Model Card

先說定價

Seed2.0 全系列的這四款模型，API 已上線火山引擎。以下為分段計費中 ≤32k 輸入的價格，單位元/百萬 tokens，這里我也做了個對比圖：

價格對比（人民幣計價）

Pro（doubao-seed-2-0-pro-260215）旗艦全能，面向復雜推理與長鏈路 Agent 任務
輸入 3.2 / 輸出 16 / 緩存命中 0.64

Lite（doubao-seed-2-0-lite-260215）均衡型，綜合能力超 Seed1.8，兼顧質量與速度
輸入 0.6 / 輸出 3.6 / 緩存命中 0.12

Mini（doubao-seed-2-0-mini-260215）低時延高并發(fā)，256k 上下文，4 檔思考長度
輸入 0.2 / 輸出 2 / 緩存命中 0.04

Code（doubao-seed-2-0-code-preview-260215）編程加強版，適配 Claude Code 等 IDE 工具鏈
輸入 3.2 / 輸出 16 / 緩存命中 0.64

四款模型均支持文字、圖片、視頻輸入，文字輸出

token 定價，比海外模型低了約一個數(shù)量級。Agent 跑一次 workflow 消耗的 token 是人類對話的幾十倍

在現(xiàn)實世界的復雜任務中，大規(guī)模推理與長鏈路生成將消耗大量 token，這個成本變量會越來越重

火山引擎模型詳情頁：https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的優(yōu)化

Seed 團隊分析了通用模型在 MaaS 服務中的真實調用情況

MaaS 調用場景分布

Seed 通用模型 MaaS 服務在中國大陸的調用場景分布，數(shù)據(jù)來自「火山方舟協(xié)作獎勵計劃」

最高比例的需求是處理混雜圖表、文檔等非結構化信息的知識內容。企業(yè)端的典型模式：先讓模型做「讀得多、想得多」的任務，再進入復雜且專業(yè)的流程型工作

基于這個真實需求，Seed2.0 重點優(yōu)化三個方向：

?更穩(wěn)健的視覺與多模態(tài)理解：復雜文檔、表格、圖形、視頻內容的解析能力顯著提升
?更可靠的復雜指令執(zhí)行：多約束、多步驟、長鏈路任務的理解與執(zhí)行能力強化
?更靈活的推理選擇：Pro、Lite、Mini 三檔加 Code 模型，覆蓋不同場景

除了生產級需求，Seed2.0 還在推高模型智能上限。目前已經能從解決奧林匹克競賽類問題邁向支持研究級推理，比如嘗試探索埃爾德什級別的數(shù)學問題，也可以完成部分科學相關任務的編程工作

能解埃爾德什問題和能幫你整理一堆掃描版合同，是兩種能力
Seed2.0 兩個都在做

多模態(tài)理解：大部分基準 SOTA 數(shù)學與視覺推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數(shù)學推理基準上達到業(yè)界最優(yōu)水平。LogicVista、VisuLogic 等視覺解謎與邏輯推理基準上，較 Seed1.8 顯著提升

數(shù)學與視覺推理評測數(shù)據(jù)

標注 * 的數(shù)據(jù)引自公開技術報告

視覺感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基準中取得業(yè)界最高分。面對不同類型的視覺輸入時仍能保持準確且可信的感知和判斷能力

視覺感知與通用 VQA 評測數(shù)據(jù)

標注 * 的數(shù)據(jù)引自公開技術報告

文檔理解與長上下文

模型面對的，往往是復雜版式混排的原始材料。相比 Seed1.8，處理非結構化信息的能力顯著強化，ChartQAPro 與 OmniDocBench 1.5 達到頂尖水準

長上下文方面，DUDE、MMLongBench、MMLongBench-Doc 均取得業(yè)界最佳分數(shù)

文檔理解與長上下文評測數(shù)據(jù)

標注 * 的數(shù)據(jù)引自公開技術報告

視頻理解

時間序列與運動感知方面，TVBench、TempCompass、MotionBench 等關鍵測評處于領先位置

EgoTempo 超過人類分數(shù)（人類 63.2，Seed2.0 Pro 71.8），對「變化、動作、節(jié)奏」的捕捉更為穩(wěn)定

長視頻場景中，Seed2.0 在大部分評測上超越了其他頂尖模型，可以高效準確地處理小時級別的長視頻。視頻工具 VideoCut 進一步提高了長視頻處理的時長范圍和推理精度

流式實時視頻方面同樣表現(xiàn)優(yōu)異，能完成實時視頻流分析、環(huán)境感知、主動糾錯與情感陪伴，可應用于健身、穿搭等場景

視頻理解評測數(shù)據(jù)

標注 * 的數(shù)據(jù)引自公開技術報告

LLM 與 Agent：真實長程任務執(zhí)行能力提升

Seed 團隊觀察到一個典型失衡：模型已經可以順利解決競賽難題，但放在真實世界中，依然很難端到端地完成實際任務，比如一次性構建一個設計精良、功能完整的小程序

原因來自兩點。真實世界任務跨越更長時間尺度、包含多個階段，現(xiàn)有 LLM Agent 難以自主構建高效工作流。真實世界知識具有很強的領域壁壘且呈長尾分布，各行業(yè)的經驗不在訓練語料的高頻區(qū)

長尾領域知識

Seed2.0 通過系統(tǒng)性加強長尾領域知識來應對

SuperGPQA 超過 GPT-5.2，HealthBench 第一名，科學領域整體成績與 Gemini 3 Pro 和 GPT-5.2 相當。FrontierSci 等 STEM 基準表現(xiàn)突出，部分場景得分超過 Gemini 3 Pro

LLM 科學能力評測數(shù)據(jù) 指令遵循

Seed2.0 保持較強的一致性與可控性，為 Agent 模型在長鏈路、多步驟任務中嚴格按約束條件執(zhí)行奠定了基礎

指令遵循評測數(shù)據(jù) 深度研究

Seed2.0 在長鏈路任務中表現(xiàn)突出，尤其擅長連續(xù)完成「找資料、做歸納、寫結論」這類連續(xù)工作流

三項深度研究評測，Pro 和 Lite 都取得了不俗的成績

深度研究評測數(shù)據(jù) 真實世界任務

在具備直接經濟價值的現(xiàn)實任務評測中，Seed2.0 在客服問答、信息抽取、意圖識別、中小學階段問題解答等高頻場景上表現(xiàn)穩(wěn)定。GDPVal-Diamond、XPert Bench 等復雜專業(yè)任務基準上同樣取得有競爭力的結果

真實世界任務評測數(shù)據(jù) 科學發(fā)現(xiàn)

FrontierSci-research 等前沿科研基準上表現(xiàn)強勁，AInstein Bench 領先，體現(xiàn)出在科學發(fā)現(xiàn)場景中較強的假設驅動式推理能力

科學發(fā)現(xiàn)評測數(shù)據(jù) 從研究想法到實驗方案

Seed2.0 還能把「研究想法」推進到「形成可落地的實驗方案」

以高爾基體蛋白分析為例，模型把基因工程、小鼠模型構建、亞細胞分離與多組學分析串成一條完整流程，細化到關鍵環(huán)節(jié)怎么做、用什么做對照排除污染、用哪些指標評估純度

相關領域專家的反饋：方案在跨學科的實驗細節(jié)與步驟化表達上超出預期，能產出結構清晰、科學上相對可靠、具有可執(zhí)行性的實驗草案

高爾基體蛋白分析實驗方案示例代碼：有進步，有差距

端到端整體代碼生成、上下文學習方面取得了明顯進步

Vibe Coding 及上下文評測數(shù)據(jù)

部分高難基準上，與國際領先模型相比仍有提升空間

最后

除了火山 API 之外，Seed2.0 Pro 和 Code 還已分別上線：

? 豆包 App：選擇「專家」模式，開啟對話
? TRAE：在「內置模型」中選擇「Doubao-Seed-2.0-Code」

以及，火山的這個模型，也已上線方舟 Coding Plan，且首月低至 8.91 元

新春限時特惠 ?? 二月特別補貼

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

編程智能體的隱藏bug，被上交IPADS團隊用數(shù)學邏輯給揪出來了

DeepTech深科技 2026-04-18 11:18:39
0 跟貼 0
微軟提出Computer-Using World Model，教智能體理解動作的后果

機器之心Pro 2026-03-09 11:59:44
0 跟貼 0

Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
2 跟貼 2

從越用越便宜到越用越貴，誰在為AI的“算力饑渴”買單？

鈦媒體APP 2026-04-17 13:32:25
0 跟貼 0
OpenAI徹底重構Codex！長出獨立鼠標，自己排班狂卷打工人

新智元 2026-04-17 14:43:06
1 跟貼 1

三層防御仍然不夠，一條PR標題就能偷走你的API密鑰：AI Agent安全裂痕再現(xiàn)

鈦媒體APP 2026-04-18 10:44:12
0 跟貼 0

Elephant走紅：AI開始為“Token浪費”算細賬

華爾街見聞官方 2026-04-17 16:51:57
0 跟貼 0
“如果你為孩子玩手機、玩游戲而發(fā)愁......”男子支招兒：給他配個臺式電腦，不斷設置阻礙，讓他自己琢磨，動手能力絕對強，編程課都不用上了

河南都市頻道 2026-04-16 17:21:38
94 跟貼 94

Transformer與RNN合體，谷歌打下顯存門檻，解鎖超長上下文

機器之心Pro 2026-04-17 18:31:53
0 跟貼 0
真正值錢的 AI，都長在業(yè)務里

虎嗅APP 2026-04-17 21:07:32
0 跟貼 0
π0.7來了！涌現(xiàn)出組合泛化、跨本體遷移能力，VLA又行了？

機器之心Pro 2026-04-17 18:23:23
0 跟貼 0
單任務狂飆16小時！模型+Harness雙輪驅動，金融Agent跑通了

新智元 2026-04-17 21:12:05
3 跟貼 3
當老板與員工展開“蒸餾”對抗

經濟觀察報 2026-04-18 17:48:45
13 跟貼 13
不卷AlphaFold，OpenAI首個生命科學模型殺出，單項超越95%專家

新智元 2026-04-18 15:33:16
6 跟貼 6
π0.7的泛化能力有多強？零樣本純靠口述就能用空氣炸鍋

DeepTech深科技 2026-04-17 21:34:56
0 跟貼 0
1美元Token撬動4800美元收益!百萬美元級基準,最賺錢Agent出現(xiàn)了

機器之心Pro 2026-03-10 10:06:03
0 跟貼 0
倫理防線不可靠！分布偏移誘導，大模型進入暗黑模式

新智元 2026-04-18 18:17:38
0 跟貼 0
智元機器人，要做AI大模型平臺和開放生態(tài)

36氪 2026-04-18 10:05:08
1 跟貼 1
豆包做PPT絕了！一句話生成，可編輯、下載，辦公效率翻10倍！

秋葉excel 2026-04-17 11:36:13
0 跟貼 0
一國可敵全球，中國數(shù)據(jù)相比其他國家就是bug

小信新鮮事 2026-04-16 01:10:46
0 跟貼 0
黑色的鐵網消失并不是不在，而是視覺錯覺

淺夢看世界 2026-04-16 12:49:09
1 跟貼 1
解放軍護衛(wèi)艦與外艦纏斗20小時細節(jié)披露

上觀新聞 2026-04-18 12:26:59
10301 跟貼 10301
跨國搬家8次后，我發(fā)現(xiàn)"適應力"是個偽概念

時光慢郵啊 2026-04-18 08:19:52
0 跟貼 0
獨家專訪元戎啟行周光：一場關于信任、偏見與未來定義的對話

汽車公社 2026-04-17 20:32:29
0 跟貼 0
大學點名用豆包，又陰我一次，一定要看到結尾

飛龍搞笑 2026-04-17 15:02:06
1 跟貼 1
長安汽車獲得發(fā)明專利授權：“車輛的多模態(tài)融合感知方法、裝置、車輛及存儲介質”

證券之星 2026-04-18 03:27:39
0 跟貼 0
B站爆了！Hermes首度直播回應「抄襲」，MiniMax提前殺入Harness賽點

新智元 2026-04-18 18:17:20
2 跟貼 2
豆包，這把真成專家了

無敵小虎牙 2026-04-15 05:16:02
0 跟貼 0
深度長文：跨越千年的追問，我們的世界是真實的嗎？

宇宙時空 2026-04-18 09:49:22
0 跟貼 0
根據(jù)真實事件改編，話題敏感尺度驚人，至今沒在內地上映

小冰冰2024 2026-04-18 15:56:54
31 跟貼 31
上海更新城鄉(xiāng)建設用地基準地價，住宅用地差異化調整

新浪財經 2026-04-16 19:01:54
5 跟貼 5
豆包是世界上最好用的AI【商業(yè)B面&牛頓】

牛頓頓頓 2026-04-15 18:35:44
5 跟貼 5
豆包水印怎么去除（免費去除方法，超簡單）百靈鳥去水印小程序

百靈鳥去水印 2026-04-16 14:46:22
2 跟貼 2
包教包會的豆包隱藏用法！

老實人廖同學 2026-04-18 02:43:50
0 跟貼 0
怎樣無水印保存豆包生成的視頻？

小汪說運營 2026-04-17 00:01:25
0 跟貼 0
止痙·無礙健康童行 | 芍麻止痙顆粒真實世界研究二期啟動會：共筑兒童抽動障礙診療新范式

新浪財經 2026-04-17 22:40:00
0 跟貼 0
3409億！全球最高估值AI編程工具誕生，黃仁勛投了

智東西 2026-04-18 14:36:09
0 跟貼 0
上百皮筋遇高溫，悉數(shù)燙斷成碎段，視覺解壓超過癮

蛋蛋說笑 2026-04-17 16:22:44
3 跟貼 3
特斯拉六座版Model Y最快下周登陸印度

界面新聞 2026-04-17 21:32:18
0 跟貼 0
教你如何一個人用AI做仙俠短劇

AK007設計師 2026-04-16 20:39:58
0 跟貼 0

地質專家在洞穴中，發(fā)現(xiàn)2臺發(fā)電機，專家說發(fā)電機已經工作了80年

賽博禪心

拜AI古佛，修賽博禪心

389文章數(shù) 50關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

手機

家居

數(shù)碼

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數(shù)碼

房產 / 家居

豆包 2.0 模型發(fā)布，全信息整理（全網最完整，另附 79 頁 Model Card）

傳Meta下月擬裁8000 大舉清退人力為AI騰位

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

時隔25年重返英超！沒有人再嘲笑他了

劉德華回應潘宏彬去世，拒談喪禮細節(jié)

"影子萬科"2.0：管理層如何吸血萬物云？

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

耗資600億，貴陽人的“上海外灘”，現(xiàn)在去看，荒得嚇人

榮耀600系列參數(shù)、外觀全曝光

法式線條 時光靜淌

首款雷電5認證四盤位M.2固態(tài)硬盤盒，OWC發(fā)布Express 4M2 Ultra

豆包 2.0 模型發(fā)布，全信息整理（全網最完整，另附 79 頁 Model Card）

伊朗革命衛(wèi)隊向油輪開火伊朗最高領袖發(fā)聲

伊朗革命衛(wèi)隊向油輪開火伊朗最高領袖發(fā)聲

時隔25年重返英超！沒有人再嘲笑他了

劉德華回應潘宏彬去世，拒談喪禮細節(jié)

"影子萬科"2.0：管理層如何吸血萬物云？

奇瑞威麟R08 PRO正式上市售價14.48萬元起

耗資600億，貴陽人的“上海外灘”，現(xiàn)在去看，荒得嚇人

榮耀600系列參數(shù)、外觀全曝光

法式線條時光靜淌

首款雷電5認證四盤位M.2固態(tài)硬盤盒，OWC發(fā)布Express 4M2 Ultra