国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

豆包語音 2.0:數(shù)學(xué)公式也能讀

0
分享至

放個(gè)演示

公式能讀對(duì),非常牛逼

這是字節(jié)新出的「豆包語音 2.0

今天發(fā)布,這里訪問:

https://console.volcengine.com/speech/new/


我參與了這模型的內(nèi)測(cè),今天模型發(fā)布,來講講這玩意兒的不同之處:


  • 對(duì)話式合成
  • 復(fù)雜公式朗讀
  • 聲音復(fù)刻升級(jí)

對(duì)話式合成

先比較下這兩段

這個(gè)是 豆包語音2.0,可以設(shè)置情景

[用哽咽但努力忍住、帶著笑意的語氣]謝謝你們……真的……我以為……我以為沒人記得我生日了……我今天一整天都在想,可能大家都忙吧,忘了也正?!易约憾伎焱恕Y(jié)果你們……你們居然……還準(zhǔn)備了這么多……蛋糕也買了,禮物也有……你們這群壞蛋……我剛才還在那兒自怨自艾呢……覺得自己特別可憐……現(xiàn)在搞得我像個(gè)傻子一樣……眼淚都止不住了……真的……謝謝你們……有你們真好……

作為對(duì)比,這是 GPT-4o 的 tts,默認(rèn)音色:

是不是感情豐富了?這就是「對(duì)話式合成」

給到上下文、指令和背景設(shè)定,AI 便會(huì)以更合適的口吻播出來

這里有三種方式:括號(hào)指令、語音指令和增加上文

方式1:括號(hào)指令

類似 prompt,你可以在句子前加指令,比如[生氣的說],AI 并不會(huì)讀括號(hào)里的內(nèi)容,而是會(huì)使用對(duì)應(yīng)的口吻


出來的效果是這樣:

(我用了小姑娘的音色,奶兇奶兇)

再來一個(gè)

[興奮溢于言表]臥槽!過了過了!我他媽真的過了!剛看到offer郵件,我還以為系統(tǒng)出bug了,刷了好幾遍確認(rèn)不是做夢(mèng)!你知道嗎,這公司我面了三輪,每輪都覺得自己要掛,尤其最后那輪技術(shù)面,我有好幾個(gè)問題都沒答上來……結(jié)果他們還是要我了!而且薪資比我預(yù)期的還高五千!我現(xiàn)在坐在星巴克,手機(jī)都快被我刷壞了,就一直盯著那封郵件看……兄弟,我終于他媽要翻身了!

這中間的笑聲穿插,有些吞掉一半的字,絕了!要是不說,恐怕真沒人能察覺

通過這種方式,你可以控制每句話的場(chǎng)景

方式2:語音指令

類似 system prompt,你也可以通過對(duì)整段內(nèi)容進(jìn)行控制,比如情緒、方言、語速、語調(diào)等


舉幾個(gè)例子

吵架

指令: <你得跟我互懟!就是跟我用吵架的語氣對(duì)話>

合成文本: 那你另請(qǐng)高明啊,你找我干嘛!我告訴你,你也不是什么好東西!

曖昧/悄悄話

指令: <用asmr的語氣來試試撩撩我>

合成文本: 你知道嗎,我真的很喜歡你的聲音。你說話的時(shí)候,聲音特別溫柔,特別好聽,每次聽到你的聲音,我都覺得心里暖暖的,特別舒服。


方式3:增加上文

當(dāng)然了,你也可以直接添加上文,讓音色更連貫


然后,你就有了這個(gè)(沒克隆音色)

做個(gè)比較:有上下文 vs 無上下文

無引用是這樣:

北京…因?yàn)槲襾?,這是第二次,上一次是在一…八年還是什么時(shí)候來過一次但是時(shí)間很短也沒有時(shí)間去,真正的去游歷,所以北京對(duì)我來說…只是…還存在一種想象之中啊,嗯沒有太多的,直觀的體驗(yàn)。

有引用是這樣,引用上文: <你怎么評(píng)價(jià)北京這個(gè)城市?>

合成文本: 北京…因?yàn)槲襾?,這是第二次,上一次是在一…八年還是什么時(shí)候來過一次但是時(shí)間很短也沒有時(shí)間去,真正的去游歷,所以北京對(duì)我來說…只是…還存在一種想象之中啊,嗯沒有太多的,直觀的體驗(yàn)。

在這個(gè) case 中,AI 理解了問詢的語境,呈現(xiàn)出思考和停頓的感覺

這里再多點(diǎn)例子

引用上文:

<是… 是你嗎?怎么看著… 好像沒怎么變???>

合成文本: 你頭發(fā)長(zhǎng)了… 以前總說留不長(zhǎng),十年了… 你還好嗎?

這三種方式,可以單獨(dú)用,也可以組合用

甚至再組合點(diǎn)別點(diǎn)工具

來完成個(gè)青頭潛鴨的繪本

說到這,突然想起一個(gè)事,算作冷知識(shí)

ChatGPT 之所以會(huì)火,很大程度上是【AI 理解了上下文】

其實(shí)吧,早在 2020 年,GPT-3 就有了

當(dāng)時(shí)叫「達(dá)芬奇-003」,只有少量開發(fā)者在用

到了 2022 年 ChatGPT 發(fā)布,大火出圈

這兩者技術(shù)上差別不大,核心區(qū)別是什么?

3.5 給了 AI 以人格,給了他上下文,并進(jìn)行了特別的后訓(xùn)練

于是, AI 不再以「句子填空」為任務(wù),轉(zhuǎn)而開始回答問題了

從接口的角度,GPT-3 的的時(shí)候,邏輯是這樣

人給到半句話,AI 接著向后補(bǔ)全:

輸入: 天空為什么是藍(lán)色的?因?yàn)?輸出(其實(shí)是補(bǔ)全): 瑞利散射導(dǎo)致短波長(zhǎng)的藍(lán)光更容易被散射...

而 ChatGPT 呢?是這樣:

System(預(yù)設(shè)): 你是一個(gè) helpful assistant User(用戶的輸入): 天空為什么是藍(lán)色的 Assistant(AI 的輸出): 這是個(gè)好問題!天空看起來是藍(lán)色的...

多了什么?

多了 role(角色)的概念

System、User、Assistant 這些 role 告訴 AI:

  • 你是誰(助手、老師、朋友)
  • 你該怎么說話(友好、專業(yè)、幽默)
  • 你在什么場(chǎng)景下(課堂、聊天、工作)

正是這些東西 讓 AI 從"補(bǔ)全工具"變成了"對(duì)話伙伴"

豆包語音 2.0 做的事情,本質(zhì)上是一樣的 給 TTS 加上了"人格"

復(fù)雜公式朗讀

回到最開始的那個(gè) Case,令人咋舌的公式朗讀

再教學(xué)內(nèi)容里,會(huì)涉及大量復(fù)雜符號(hào)

比如這樣的:∑、?、∫

講道理...這個(gè) ∫ 咋讀啊

(好像都是直接說:從xx到xx的積分)

還有數(shù)學(xué)語義理解

比如 x2 要讀「x 的平方」,不能讀「x2」

這些東西,市面上的模型,普遍都得寄

豆包語音 2.0 則做了專項(xiàng)優(yōu)化

小學(xué)到高中全學(xué)科的復(fù)雜公式

準(zhǔn)確率能到 90%

這倆都是豆包讀的,說實(shí)話,挺狠的

不過這個(gè)功能目前只能通過 api 來調(diào)用,網(wǎng)頁(yè)上還得再等等

5 秒復(fù)刻音色

豆包語音 2.0 也支持你來自定義音色

https://console.volcengine.com/speech/new/experience/clone

比如讓豆包學(xué)我說話,有兩種做法:

1. 上傳一段我的語音

2. 直接錄制,對(duì)著「貝加爾湖」的文案讀一遍


支持中、英、日、西、葡等多語種

回望

這個(gè) 2.0 的模型,今天就能體驗(yàn)了

入口:https://console.volcengine.com/speech/new/


回望一年前,那時(shí)候還叫 Seed-TTS 剛發(fā)論文

我也在第一時(shí)間做了報(bào)道

那個(gè)時(shí)候,豆包語音 1.0 搞定了「說得像」


  • 超自然(堪比真人)
  • 多情緒(喜怒哀樂)
  • 多場(chǎng)景(26 個(gè)精品音色)

而今天上線的 豆包語音 2.0,則搞定了「說得對(duì)」,變得可以理解場(chǎng)景

1.0到2.0,從說得像,到說得對(duì)。一晃一年半了,頗多感慨

最后說兩句

這個(gè)語音模型,是字節(jié)在武漢的發(fā)布會(huì)放出來的

除了這個(gè)語音模型外,字節(jié)這次還更新了別的,比如:豆包 1.6 系列、圖像生成 Seedream 4.0、視頻生成 Seedance 1.0、編程模型等

大致如下,我畫了個(gè)一圖流


聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
牛群也沒想到,折騰半生家產(chǎn)盡失,如今美國(guó)畢業(yè)的兒子成晚年依靠

牛群也沒想到,折騰半生家產(chǎn)盡失,如今美國(guó)畢業(yè)的兒子成晚年依靠

寒士之言本尊
2025-12-19 20:26:51
宣告奇跡出現(xiàn)剛2個(gè)月,蔡磊再破天花板,讓整個(gè)科研界“沉默”了

宣告奇跡出現(xiàn)剛2個(gè)月,蔡磊再破天花板,讓整個(gè)科研界“沉默”了

大眼妹妹
2025-11-27 20:17:22
火箭119-96大勝湖人,一戰(zhàn)讓人看清以下三位球員!

火箭119-96大勝湖人,一戰(zhàn)讓人看清以下三位球員!

君子一劍似水流年
2025-12-26 11:59:54
特朗普還沒啟程訪華,中國(guó)突然公布黃金庫(kù)存,美國(guó)霸權(quán)地位已不保

特朗普還沒啟程訪華,中國(guó)突然公布黃金庫(kù)存,美國(guó)霸權(quán)地位已不保

花花娛界
2025-12-25 20:36:30
與王金平和解后,鄭麗文再次猛攻江啟臣,嘲諷柯志恩“擺架子”

與王金平和解后,鄭麗文再次猛攻江啟臣,嘲諷柯志恩“擺架子”

放開他讓wo來
2025-12-26 11:54:05
男演員被限制高消費(fèi),“涉案金額1118萬”登熱搜,本人發(fā)文回應(yīng)

男演員被限制高消費(fèi),“涉案金額1118萬”登熱搜,本人發(fā)文回應(yīng)

紅星新聞
2025-12-25 20:41:16
愛潑斯坦案涂黑文件被輕松解密!美司法部:新發(fā)現(xiàn)逾百萬份或與愛潑斯坦案相關(guān)文件

愛潑斯坦案涂黑文件被輕松解密!美司法部:新發(fā)現(xiàn)逾百萬份或與愛潑斯坦案相關(guān)文件

每日經(jīng)濟(jì)新聞
2025-12-26 07:10:06
劫富濟(jì)貧?火箭6連客2勝4負(fù) 輸西部倒數(shù)前三 贏球?qū)κ质呛司蚪?>
    </a>
        <h3>
      <a href=Emily說個(gè)球
2025-12-26 12:32:44
山東青島公益人王順利不幸去世,享年61歲,一年前駕車時(shí)突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

山東青島公益人王順利不幸去世,享年61歲,一年前駕車時(shí)突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

極目新聞
2025-12-26 12:27:50
每秒移動(dòng)0.2米,慢到極致的樹懶,為什么沒有被天敵滅絕?

每秒移動(dòng)0.2米,慢到極致的樹懶,為什么沒有被天敵滅絕?

半解智士
2025-12-25 20:06:45
誰最坑?本賽季至今14位5000萬先生得分情況

誰最坑?本賽季至今14位5000萬先生得分情況

大眼瞄世界
2025-12-25 20:58:37
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽
2025-12-23 18:33:38
年齡越大越要吃肉?研究發(fā)現(xiàn):多吃肉的老人或更長(zhǎng)壽!吃什么肉好

年齡越大越要吃肉?研究發(fā)現(xiàn):多吃肉的老人或更長(zhǎng)壽!吃什么肉好

39健康網(wǎng)
2025-12-02 20:21:45
剛買完40萬的車,鄰居發(fā)消息:給你五分鐘過來,送我到隔壁省旅游

剛買完40萬的車,鄰居發(fā)消息:給你五分鐘過來,送我到隔壁省旅游

船長(zhǎng)與船1
2025-12-25 12:05:48
勝獨(dú)行俠勇士迎最佳局面!6配角被盤活,不和格林一起上陣舒服!

勝獨(dú)行俠勇士迎最佳局面!6配角被盤活,不和格林一起上陣舒服!

細(xì)話籃球
2025-12-26 11:13:29
中國(guó)旅游團(tuán),消失在歐洲

中國(guó)旅游團(tuán),消失在歐洲

旅界Pro
2025-12-25 08:33:19
全軍覆沒!網(wǎng)貸公司盯上印度市場(chǎng),結(jié)果反被三哥收割得體無完膚!

全軍覆沒!網(wǎng)貸公司盯上印度市場(chǎng),結(jié)果反被三哥收割得體無完膚!

青青子衿
2025-12-26 04:42:30
普京:盡管困難重重,俄羅斯仍在前進(jìn)

普京:盡管困難重重,俄羅斯仍在前進(jìn)

看看新聞Knews
2025-12-25 12:53:05
李小璐寫真生圖高清

李小璐寫真生圖高清

翩翩明星
2025-11-14 09:39:36
徐湖平家掛兩幅“湖平如鏡”:一個(gè)是陳立夫?qū)懙模粋€(gè)是范增寫的

徐湖平家掛兩幅“湖平如鏡”:一個(gè)是陳立夫?qū)懙?,一個(gè)是范增寫的

漢史趣聞
2025-12-25 10:41:03
2025-12-26 13:23:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
224文章數(shù) 12關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

實(shí)探北京某寶馬汽車門店:試駕已停 店內(nèi)僅留2名銷售

頭條要聞

實(shí)探北京某寶馬汽車門店:試駕已停 店內(nèi)僅留2名銷售

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天深夜道歉,只字未提五月天阿信

財(cái)經(jīng)要聞

資管江湖的人事“寒冬”

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

本地
教育
藝術(shù)
時(shí)尚
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

教育要聞

北航保研率怎么樣?這一專業(yè)竟然成最大黑馬,普通專業(yè)排名第一!

藝術(shù)要聞

William Dyce:19世紀(jì)蘇格蘭重要的畫家

微胖女孩冬天怎么穿衣?看看這27套冬季穿搭LOOK,保暖又顯瘦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版