国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

豆包 2.0 模型發(fā)布,全信息整理(全網(wǎng)最完整,另附 79 頁 Model Card)

0
分享至

今天 Seed2.0 全系列正式發(fā)布
Seed2.0,也就是豆包大模型2.0(Doubao-Seed-2.0)

包括 Pro、Lite、Mini 三款通用 Agent 模型加一個 Code 模型,圍繞 Agent 使用和大規(guī)模生產(chǎn),做了系統(tǒng)性優(yōu)化

先看數(shù)據(jù)(本文里所有表格,都是我做的,好不好看?。。。?/p>


Seed2.0 核心評測數(shù)據(jù)總覽|vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次過完核心部份:

多模態(tài),數(shù)學(xué)與視覺推理 19 項(xiàng)基準(zhǔn) 12 項(xiàng)第一,視覺感知、文檔理解、長上下文大部分基準(zhǔn) SOTA,EgoTempo 超過人類分?jǐn)?shù)

LLM 科學(xué)能力,HealthBench 第一,SuperGPQA 超 GPT-5.2,整體與 Gemini 3 Pro、GPT-5.2 相當(dāng);在深度研究上也取得了不俗的成績

代碼,有明顯進(jìn)步,部分高難基準(zhǔn)與國際領(lǐng)先模型仍有差距

已上線,豆包 App 選「專家」模式 / TRAE 選「Doubao-Seed-2.0-Code」,全系列 API 已上線火山引擎,價格較同級 GPT 和 Claude 便宜一個數(shù)量級


Model Card 也有,同時發(fā)布的還有一份 79 頁的 Model Card,公眾號后臺回復(fù)「Seed2.0」,獲取這份 Model Card


先說定價

Seed2.0 全系列的這四款模型,API 已上線火山引擎。以下為分段計(jì)費(fèi)中 ≤32k 輸入的價格,單位元/百萬 tokens,這里我也做了個對比圖:


價格對比(人民幣計(jì)價)

Pro(doubao-seed-2-0-pro-260215)旗艦全能,面向復(fù)雜推理與長鏈路 Agent 任務(wù)
輸入 3.2 / 輸出 16 / 緩存命中 0.64

Lite(doubao-seed-2-0-lite-260215)均衡型,綜合能力超 Seed1.8,兼顧質(zhì)量與速度
輸入 0.6 / 輸出 3.6 / 緩存命中 0.12

Mini(doubao-seed-2-0-mini-260215)低時延高并發(fā),256k 上下文,4 檔思考長度
輸入 0.2 / 輸出 2 / 緩存命中 0.04

Code(doubao-seed-2-0-code-preview-260215)編程加強(qiáng)版,適配 Claude Code 等 IDE 工具鏈
輸入 3.2 / 輸出 16 / 緩存命中 0.64

四款模型均支持文字、圖片、視頻輸入,文字輸出

token 定價,比海外模型低了約一個數(shù)量級。Agent 跑一次 workflow 消耗的 token 是人類對話的幾十倍

在現(xiàn)實(shí)世界的復(fù)雜任務(wù)中,大規(guī)模推理與長鏈路生成將消耗大量 token,這個成本變量會越來越重


火山引擎模型詳情頁:https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的優(yōu)化

Seed 團(tuán)隊(duì)分析了通用模型在 MaaS 服務(wù)中的真實(shí)調(diào)用情況


MaaS 調(diào)用場景分布

Seed 通用模型 MaaS 服務(wù)在中國大陸的調(diào)用場景分布,數(shù)據(jù)來自「火山方舟協(xié)作獎勵計(jì)劃」

最高比例的需求是處理混雜圖表、文檔等非結(jié)構(gòu)化信息的知識內(nèi)容。企業(yè)端的典型模式:先讓模型做「讀得多、想得多」的任務(wù),再進(jìn)入復(fù)雜且專業(yè)的流程型工作

基于這個真實(shí)需求,Seed2.0 重點(diǎn)優(yōu)化三個方向:

  • ?更穩(wěn)健的視覺與多模態(tài)理解:復(fù)雜文檔、表格、圖形、視頻內(nèi)容的解析能力顯著提升

  • ?更可靠的復(fù)雜指令執(zhí)行:多約束、多步驟、長鏈路任務(wù)的理解與執(zhí)行能力強(qiáng)化

  • ?更靈活的推理選擇:Pro、Lite、Mini 三檔加 Code 模型,覆蓋不同場景

除了生產(chǎn)級需求,Seed2.0 還在推高模型智能上限。目前已經(jīng)能從解決奧林匹克競賽類問題邁向支持研究級推理,比如嘗試探索埃爾德什級別的數(shù)學(xué)問題,也可以完成部分科學(xué)相關(guān)任務(wù)的編程工作

能解埃爾德什問題和能幫你整理一堆掃描版合同,是兩種能力
Seed2.0 兩個都在做

多模態(tài)理解:大部分基準(zhǔn) SOTA 數(shù)學(xué)與視覺推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數(shù)學(xué)推理基準(zhǔn)上達(dá)到業(yè)界最優(yōu)水平。LogicVista、VisuLogic 等視覺解謎與邏輯推理基準(zhǔn)上,較 Seed1.8 顯著提升


數(shù)學(xué)與視覺推理評測數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開技術(shù)報告

視覺感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基準(zhǔn)中取得業(yè)界最高分。面對不同類型的視覺輸入時仍能保持準(zhǔn)確且可信的感知和判斷能力


視覺感知與通用 VQA 評測數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開技術(shù)報告

文檔理解與長上下文

模型面對的,往往是復(fù)雜版式混排的原始材料。相比 Seed1.8,處理非結(jié)構(gòu)化信息的能力顯著強(qiáng)化,ChartQAPro 與 OmniDocBench 1.5 達(dá)到頂尖水準(zhǔn)

長上下文方面,DUDE、MMLongBench、MMLongBench-Doc 均取得業(yè)界最佳分?jǐn)?shù)


文檔理解與長上下文評測數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開技術(shù)報告

視頻理解

時間序列與運(yùn)動感知方面,TVBench、TempCompass、MotionBench 等關(guān)鍵測評處于領(lǐng)先位置

EgoTempo 超過人類分?jǐn)?shù)(人類 63.2,Seed2.0 Pro 71.8),對「變化、動作、節(jié)奏」的捕捉更為穩(wěn)定

長視頻場景中,Seed2.0 在大部分評測上超越了其他頂尖模型,可以高效準(zhǔn)確地處理小時級別的長視頻。視頻工具 VideoCut 進(jìn)一步提高了長視頻處理的時長范圍和推理精度

流式實(shí)時視頻方面同樣表現(xiàn)優(yōu)異,能完成實(shí)時視頻流分析、環(huán)境感知、主動糾錯與情感陪伴,可應(yīng)用于健身、穿搭等場景


視頻理解評測數(shù)據(jù)

標(biāo)注 * 的數(shù)據(jù)引自公開技術(shù)報告

LLM 與 Agent:真實(shí)長程任務(wù)執(zhí)行能力提升

Seed 團(tuán)隊(duì)觀察到一個典型失衡:模型已經(jīng)可以順利解決競賽難題,但放在真實(shí)世界中,依然很難端到端地完成實(shí)際任務(wù),比如一次性構(gòu)建一個設(shè)計(jì)精良、功能完整的小程序

原因來自兩點(diǎn)。真實(shí)世界任務(wù)跨越更長時間尺度、包含多個階段,現(xiàn)有 LLM Agent 難以自主構(gòu)建高效工作流。真實(shí)世界知識具有很強(qiáng)的領(lǐng)域壁壘且呈長尾分布,各行業(yè)的經(jīng)驗(yàn)不在訓(xùn)練語料的高頻區(qū)

長尾領(lǐng)域知識

Seed2.0 通過系統(tǒng)性加強(qiáng)長尾領(lǐng)域知識來應(yīng)對

SuperGPQA 超過 GPT-5.2,HealthBench 第一名,科學(xué)領(lǐng)域整體成績與 Gemini 3 Pro 和 GPT-5.2 相當(dāng)。FrontierSci 等 STEM 基準(zhǔn)表現(xiàn)突出,部分場景得分超過 Gemini 3 Pro


LLM 科學(xué)能力評測數(shù)據(jù) 指令遵循

Seed2.0 保持較強(qiáng)的一致性與可控性,為 Agent 模型在長鏈路、多步驟任務(wù)中嚴(yán)格按約束條件執(zhí)行奠定了基礎(chǔ)


指令遵循評測數(shù)據(jù) 深度研究

Seed2.0 在長鏈路任務(wù)中表現(xiàn)突出,尤其擅長連續(xù)完成「找資料、做歸納、寫結(jié)論」這類連續(xù)工作流

三項(xiàng)深度研究評測,Pro 和 Lite 都取得了不俗的成績


深度研究評測數(shù)據(jù) 真實(shí)世界任務(wù)

在具備直接經(jīng)濟(jì)價值的現(xiàn)實(shí)任務(wù)評測中,Seed2.0 在客服問答、信息抽取、意圖識別、中小學(xué)階段問題解答等高頻場景上表現(xiàn)穩(wěn)定。GDPVal-Diamond、XPert Bench 等復(fù)雜專業(yè)任務(wù)基準(zhǔn)上同樣取得有競爭力的結(jié)果


真實(shí)世界任務(wù)評測數(shù)據(jù) 科學(xué)發(fā)現(xiàn)

FrontierSci-research 等前沿科研基準(zhǔn)上表現(xiàn)強(qiáng)勁,AInstein Bench 領(lǐng)先,體現(xiàn)出在科學(xué)發(fā)現(xiàn)場景中較強(qiáng)的假設(shè)驅(qū)動式推理能力


科學(xué)發(fā)現(xiàn)評測數(shù)據(jù) 從研究想法到實(shí)驗(yàn)方案

Seed2.0 還能把「研究想法」推進(jìn)到「形成可落地的實(shí)驗(yàn)方案」

以高爾基體蛋白分析為例,模型把基因工程、小鼠模型構(gòu)建、亞細(xì)胞分離與多組學(xué)分析串成一條完整流程,細(xì)化到關(guān)鍵環(huán)節(jié)怎么做、用什么做對照排除污染、用哪些指標(biāo)評估純度

相關(guān)領(lǐng)域?qū)<业姆答仯悍桨冈诳鐚W(xué)科的實(shí)驗(yàn)細(xì)節(jié)與步驟化表達(dá)上超出預(yù)期,能產(chǎn)出結(jié)構(gòu)清晰、科學(xué)上相對可靠、具有可執(zhí)行性的實(shí)驗(yàn)草案


高爾基體蛋白分析實(shí)驗(yàn)方案示例 代碼:有進(jìn)步,有差距

端到端整體代碼生成、上下文學(xué)習(xí)方面取得了明顯進(jìn)步


Vibe Coding 及上下文評測數(shù)據(jù)

部分高難基準(zhǔn)上,與國際領(lǐng)先模型相比仍有提升空間

最后

除了火山 API 之外,Seed2.0 Pro 和 Code 還已分別上線:

  • ? 豆包 App:選擇「專家」模式,開啟對話

  • ? TRAE:在「內(nèi)置模型」中選擇「Doubao-Seed-2.0-Code」

以及,火山的這個模型,也已上線方舟 Coding Plan,且首月低至 8.91 元

新春限時特惠 ?? 二月特別補(bǔ)貼

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美以軍事行動引發(fā)伊朗“最猛烈”回?fù)?中東危局40小時一文速覽

美以軍事行動引發(fā)伊朗“最猛烈”回?fù)?中東危局40小時一文速覽

極目新聞
2026-03-02 06:57:53
韓星Rosé被曝為維持7年金發(fā),堅(jiān)持每兩周漂染一次

韓星Rosé被曝為維持7年金發(fā),堅(jiān)持每兩周漂染一次

韓小娛
2026-03-02 08:28:31
“不想干可以退圈!”陳昊宇劇宣一直低頭疊紙惹爭議,評論區(qū)淪陷

“不想干可以退圈!”陳昊宇劇宣一直低頭疊紙惹爭議,評論區(qū)淪陷

秋楓凋零
2026-03-03 07:41:48
一只勵志的小黑豬:為了活命,拼命幫主人干活,最終獲得免死金牌

一只勵志的小黑豬:為了活命,拼命幫主人干活,最終獲得免死金牌

貍貓之一的動物圈
2026-02-24 09:00:11
為什么科學(xué)家說:如果宇宙中只有人類,比找到外星人更可怕?

為什么科學(xué)家說:如果宇宙中只有人類,比找到外星人更可怕?

觀察宇宙
2026-03-01 20:46:19
就在今晚!3月3日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

就在今晚!3月3日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀天下
2026-03-03 10:40:27
53歲許榕真:住上海中心,與日本籍老公分房睡,14歲兒子長得像爹

53歲許榕真:住上海中心,與日本籍老公分房睡,14歲兒子長得像爹

白面書誏
2026-03-02 17:22:23
你在體制內(nèi)捅過的最大簍子是啥? 網(wǎng)友:人怎么能捅這么大的簍子

你在體制內(nèi)捅過的最大簍子是啥? 網(wǎng)友:人怎么能捅這么大的簍子

帶你感受人間冷暖
2026-02-13 10:06:39
美軍遭遇開戰(zhàn)以來最大損失!拼命找背鍋俠,造謠中國對伊提供導(dǎo)彈

美軍遭遇開戰(zhàn)以來最大損失!拼命找背鍋俠,造謠中國對伊提供導(dǎo)彈

軍軍記錄生活
2026-03-03 11:44:16
緊急提醒!沈陽雪勢加大!

緊急提醒!沈陽雪勢加大!

新浪財(cái)經(jīng)
2026-03-03 12:20:06
王勵勤拒絕回應(yīng)樊振東落選!大V怒斥國乒:教練組故意不讓他去

王勵勤拒絕回應(yīng)樊振東落選!大V怒斥國乒:教練組故意不讓他去

卿子書
2026-03-03 09:13:00
果然我們這些散修,比不上有家族傳承的!網(wǎng)友:肥水不流外人田

果然我們這些散修,比不上有家族傳承的!網(wǎng)友:肥水不流外人田

另子維愛讀史
2026-03-02 20:35:39
CBA三球星落選原因各異:得罪主帥、觸碰紅線與意外

CBA三球星落選原因各異:得罪主帥、觸碰紅線與意外

阿斚田侃故事
2026-03-03 11:10:07
燒高香了!網(wǎng)傳珠海一工廠漲工資,一線崗位一個月能多拿近1000元

燒高香了!網(wǎng)傳珠海一工廠漲工資,一線崗位一個月能多拿近1000元

火山詩話
2026-03-03 08:48:42
哈梅內(nèi)伊開會時遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國家

哈梅內(nèi)伊開會時遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國家

每日經(jīng)濟(jì)新聞
2026-03-01 12:09:04
山東姑娘獲 127 票高票當(dāng)選聯(lián)合國法官,這才是真正的中國驕傲!

山東姑娘獲 127 票高票當(dāng)選聯(lián)合國法官,這才是真正的中國驕傲!

眼界看視野
2026-03-02 19:22:50
“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

流史歲月
2026-01-26 10:58:30
為什么中國專家總是“誤判”美國戰(zhàn)爭行為?

為什么中國專家總是“誤判”美國戰(zhàn)爭行為?

雪中風(fēng)車
2026-03-03 12:30:27
國人淚目!9旬院士平靜宣布,中國導(dǎo)彈再無任何盲區(qū)!

國人淚目!9旬院士平靜宣布,中國導(dǎo)彈再無任何盲區(qū)!

Thurman在昆明
2026-03-02 20:38:49
CBA廣東VS新疆,崔永熙徐杰有望合體,杜鋒率豪華陣容沖開門紅

CBA廣東VS新疆,崔永熙徐杰有望合體,杜鋒率豪華陣容沖開門紅

二哥聊球
2026-03-02 14:37:54
2026-03-03 13:23:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
309文章數(shù) 45關(guān)注度
往期回顧 全部

科技要聞

手機(jī)AI在MWC上卷出了新高度

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

財(cái)經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

房產(chǎn)
教育
家居
時尚
手機(jī)

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫?,又有書包大盤殺出!

教育要聞

娃娃秧歌扭起來 非遺傳承潤童心

家居要聞

萬物互聯(lián) 享科技福祉

普通人穿衣真的很簡單!單品選對、搭配合理,大方舒適又得體

手機(jī)要聞

一加15T新機(jī)正面形象公開,采用1.xx mm物理極窄四等邊設(shè)計(jì)

無障礙瀏覽 進(jìn)入關(guān)懷版