国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中科院軟件所開源首個本地通用幻燈片智能體,9B參數(shù)打平GPT-5

0
分享至



天下苦 PPT 久矣。

體驗過市面上各種 AI 生成 PPT 工具的人,往往都會遇到同樣的痛點:排版崩壞、內(nèi)容空洞、經(jīng)不起推敲。 為什么會這樣?因為目前的通用大語言模型(LLM)寫 PPT,本質上是在對話框里 “盲寫” 代碼或文本。它們既沒有真正的 “手” 去查閱權威文獻,也沒有真正的 “眼睛” 去審視自己排版出來的最終效果。

近日,中國科學院軟件研究所中文信息處理實驗室開源了第二代 PPTAgent --DeepPresenter。這是業(yè)界首次將幻燈片智能體模型與完整的智能體沙箱環(huán)境一同開源,更能支持在單張 3090/MAC 上一鍵部署。它徹底重構了 AI 制作 PPT 的邏輯,讓智能體不僅能 “深度探索”,還能 “親眼所見”。



  • GitHub 鏈接: https://github.com/icip-cas/PPTAgent
  • HuggingFace鏈接: https://huggingface.co/collections/ICIP/deeppresenter
  • 論文鏈接: https://arxiv.org/abs/2602.22839

核心破局點:給智能體裝上 “眼睛” 與 “手”

DeepPresenter 放棄了傳統(tǒng)的 “語言模型直接生成” 路徑,而是將智能體置入了一個全功能的 Docker 沙箱環(huán)境(Shared Agent Environment)中,直接切中目前 AI 辦公的兩大痛點:

痛點一:內(nèi)容全是 “車轱轆話” 和幻覺?

解決:構建強大的智能體環(huán)境,賦予其研究和閱讀的 “手”。

在 DeepPresenter 中,智能體手握 20+ 種專業(yè)工具。它不僅能通過 MinerU 深度解析復雜的 PDF 文獻,還能實時連接 arXiv 和 Google Scholar 進行有據(jù)可查的深度調研(DeepResearch),甚至可以直接運行 Python 代碼來繪制數(shù)據(jù)圖表,確保 PPT 內(nèi)容的專業(yè)度與數(shù)據(jù)準確性。



痛點二:排版錯亂、文字擋圖?

解決:環(huán)境感知反思機制(Environment-Grounded Reflection),給它加上 “眼睛”。

以往的模型不知道自己生成的排版長什么樣。而 DeepPresenter 形成了一套 “寫→看→改” 的視覺閉環(huán)。Presenter 智能體每寫完一頁代碼,都會調用沙箱內(nèi)的瀏覽器將其渲染成真實圖片,然后 “親眼” 檢查這張截圖。標題被擋住了?對比度不夠?它會像人類設計師一樣立即進行自適應調整并回爐重造,直到視覺效果完美。



案例演示

只需一行極其簡單的指令,即可體驗這種全新的 Agentic 工作流:

接收指令后,DeepPresenter 會立即啟動:Researcher在自動檢索相關的相關資料和高清圖片;隨后交棒給Presenter,根據(jù)呈現(xiàn)主題設計相稱的風格,最終輸出一份內(nèi)容扎實、樣式精美的幻燈片。



幫我做一個小米 SU7 的 PPT



制作一份4:3幻燈片,以美國自由漫畫師視角分享創(chuàng)作《超級戰(zhàn)隊》與《假面騎士》同人作品的實用技巧,涵蓋理解原作、發(fā)展風格、捕捉角色、編寫故事及建立粉絲社群



幫我做一份關于羅賓漢(Robin Hood)的介紹 PPT,包含歷史背景、傳奇故事和文化影響。

更重要的是,所有生成內(nèi)容均為 .pptx 可編輯格式,支持自由修改與二次創(chuàng)作,徹底擺脫類似 nanobanana 那樣 “生成后無法編輯” 的困擾,讓 PPT 創(chuàng)作真正可控、高效、靈活。



核心技術:如何煉成 “最強 PPT 智能體”?

DeepPresenter 之所以能以 9B 參數(shù)實現(xiàn) “下克上”,核心在于其創(chuàng)新的訓練流水線(Pipeline):



1.數(shù)據(jù)構建:團隊基于 PersonaHub 與 arXiv 等多源數(shù)據(jù)集構建了高多樣性的任務數(shù)據(jù)。通過在指令中顯式定義頁數(shù)限制、長寬比及語言策略等細粒度約束條件,確保模型在訓練階段即建立了對復雜用戶意圖的深度語義表征。

2.外在驗證引導:為了打破智能體 “自我感覺良好” 的驗證偏差(Self-verification Bias),團隊引入了獨立評審機制。在訓練數(shù)據(jù)合成階段,由獨立模型作為 “獨立評估者” 指出生成產(chǎn)物中的排版或邏輯缺陷,引導智能體產(chǎn)生高質量的執(zhí)行軌跡

3.多級軌跡過濾:團隊從 1,152 個任務中篩選出 802 條頂級質量的智能體軌跡進行 SFT 訓練。這些軌跡涵蓋了中英雙語、多種寬高比及復雜的指令約束。

性能實測:消費級顯卡下的極限表現(xiàn)

為了全面驗證 DeepPresenter 的實際效果,作者在預留的 128 個任務上使用 PPTEval 進行了系統(tǒng)評測,并與三種主流幻燈片生成方案進行了對比。



在此基礎上,作者進一步分析了不同模型設置下的成本 — 性能表現(xiàn),從 “效果” 和 “成本” 兩個維度進行綜合評估。



結果表明:DeepPresenter-9B 取得了 4.19 的高分,表現(xiàn)與閉源模型 GPT-5(4.22)幾乎持平,并且 DeepPresenter 顯著優(yōu)于其他的幻燈片生成方案。

更值得關注的是,在成本 — 性能曲線中,DeepPresenter-9B 位于前沿的 “突變點” 位置,意味著在性能與價格之間達到了極具競爭力的平衡。

換句話說,它用GPT-5 幾十分之一的算力成本,實現(xiàn)了同等級別的智能表現(xiàn)。這也意味著 —— 在消費級顯卡上,我們就能夠運行一個媲美頂級閉源模型的 PPT 智能體。

目前,DeepPresenter 項目已完全開源,歡迎開發(fā)者共同構建 Presentation Agent 的未來。

作者介紹:

本開源項目以及論文作者均來自中國科學院軟件研究所中文信息處理實驗室孫樂研究員、韓先培研究員團隊,主要作者包括鄭昊、莫國釗、陳軒昂、陸垚杰及林鴻宇。實驗室的主要研究領域包括大模型和大模型驅動智能體的知識機制、知識能力增強及應用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2005年,韓國把“漢城”改為首爾,全世界為何只要求中國改稱呼?

2005年,韓國把“漢城”改為首爾,全世界為何只要求中國改稱呼?

咸説歷史
2026-03-19 07:06:34
5次逼宮換隊!毫無忠誠為何被哄搶?生涯17年帶隊全進季后賽太強

5次逼宮換隊!毫無忠誠為何被哄搶?生涯17年帶隊全進季后賽太強

你的籃球頻道
2026-03-29 11:08:18
17分14助5板!把球給哈登,雙塔效果能加倍,阿特金森賽后明牌了

17分14助5板!把球給哈登,雙塔效果能加倍,阿特金森賽后明牌了

巴叔GO聊體育
2026-03-29 10:58:14
美國警告賴清德當局:大陸決定動手那一刻,“臺獨”只剩一個結局

美國警告賴清德當局:大陸決定動手那一刻,“臺獨”只剩一個結局

走過海棠
2026-03-29 10:09:43
央視主持人集體大哭,朱迅流淚康輝掩面痛哭,真相是什么?

央視主持人集體大哭,朱迅流淚康輝掩面痛哭,真相是什么?

落雪聽梅a
2026-03-28 09:14:37
今年有桃花旺運,更有金運加持,生活越過越有勁頭的三個生肖

今年有桃花旺運,更有金運加持,生活越過越有勁頭的三個生肖

毅談生肖
2026-03-29 10:49:42
一周竟然7次,41歲男子心源性猝死,妻子:勸了很多次,就是不聽

一周竟然7次,41歲男子心源性猝死,妻子:勸了很多次,就是不聽

健康之光
2026-03-28 13:35:08
復出在即,尼科·威廉姆斯的世界杯前景如何?

復出在即,尼科·威廉姆斯的世界杯前景如何?

樂道足球
2026-03-29 11:51:03
哈耶克:為何錯誤思潮總是卷土重來?

哈耶克:為何錯誤思潮總是卷土重來?

游子三月三
2026-03-22 18:24:32
黃健翔怒斥U23國足:踢友誼賽都蹲坑防守 中國足球跌到亞洲第幾流

黃健翔怒斥U23國足:踢友誼賽都蹲坑防守 中國足球跌到亞洲第幾流

念洲
2026-03-29 08:00:27
U23國足逼平朝鮮隊,賽后黃健翔發(fā)文暗諷董路

U23國足逼平朝鮮隊,賽后黃健翔發(fā)文暗諷董路

姜大叔侃球
2026-03-29 10:32:40
這下不吹了,俄烏兩軍連續(xù)大戰(zhàn),打破一個又一個“無敵”武器神話

這下不吹了,俄烏兩軍連續(xù)大戰(zhàn),打破一個又一個“無敵”武器神話

策略述
2025-11-12 18:42:46
18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

娛你同歡
2026-03-17 16:08:28
臺退役上校呼吁:只要大陸答應2個條件,臺灣隨時都可以和平統(tǒng)一

臺退役上校呼吁:只要大陸答應2個條件,臺灣隨時都可以和平統(tǒng)一

夢史
2026-03-27 01:05:45
史上最尷尬的爆???官媒下場,慶功宴取消

史上最尷尬的爆???官媒下場,慶功宴取消

動物奇奇怪怪
2026-03-28 16:59:10
重磅!2年7500萬,哈登與騎士續(xù)約協(xié)議曝光,更炸裂的還在后面…

重磅!2年7500萬,哈登與騎士續(xù)約協(xié)議曝光,更炸裂的還在后面…

煙潯渺渺
2026-03-28 17:03:40
2012年,用U型鎖砸日系車并重傷車主的蔡洋早已出獄,如今怎樣了

2012年,用U型鎖砸日系車并重傷車主的蔡洋早已出獄,如今怎樣了

談史論天地
2026-03-25 09:57:09
石油大漲,全世界最難受的可能不是美國,也不是歐洲

石油大漲,全世界最難受的可能不是美國,也不是歐洲

流蘇晚晴
2026-03-28 14:13:36
唏噓!前曼聯(lián)巨星徹底隕落,30 歲竟落得這般下場

唏噓!前曼聯(lián)巨星徹底隕落,30 歲竟落得這般下場

瀾歸序
2026-03-29 03:30:49
張愛玲:人生最大的悲哀不是選錯伴侶,也不是沒掙到錢,而是人到中年才發(fā)現(xiàn),從未真正為自己活過

張愛玲:人生最大的悲哀不是選錯伴侶,也不是沒掙到錢,而是人到中年才發(fā)現(xiàn),從未真正為自己活過

四行書
2026-03-27 12:33:32
2026-03-29 12:24:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12620文章數(shù) 142598關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

體育要聞

全球第二大車企,也救不了這支德甲隊?

娛樂要聞

張凌赫事件持續(xù)升級!官方點名怒批

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

家居
房產(chǎn)
藝術
健康
數(shù)碼

家居要聞

曲線華爾茲 現(xiàn)代簡約

房產(chǎn)要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

藝術要聞

2025江南如畫——中國油畫作品展 | 入選作品選刊(二)

干細胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

LG電競顯示器預約!1080P 144Hz僅649/799元

無障礙瀏覽 進入關懷版