国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

460億的AI語音獨角獸,將“歸0”?

0
分享至


音頻AI領域的當紅炸子雞ElevenLabs完成了一輪由紅杉資本(Sequoia)和ICONIQ領投的融資,估值飆升至66億美元(約合人民幣462億元)。在短短九個月內,這個數字翻了一番。據悉,公司年度經常性收入(ARR)已突破2億美元,并在2025年底沖擊3億美元大關。

從《堡壘之夜》里的達斯·維達(Darth Vader)到不知疲倦的客服機器人,ElevenLabs的技術正無處不在。它正與OpenAI展開激烈巷戰(zhàn),力圖成為人工智能時代的默認語音基礎設施。

然而,就在這個高光時刻,其聯(lián)合創(chuàng)始人兼CEO馬蒂·斯坦尼斯?jié)煞蛩够∕ati Staniszewski)卻拋出了一個近乎“自殺式”的論斷。

馬蒂直言:“音頻模型將在未來幾年內商品化(Commoditized)。即便現在還有差異,但長期來看,這種技術壁壘會越來越低,甚至消失。”

所謂“商品化”,意味著核心技術將變得像自來水或電力一樣,雖然不可或缺,但極度廉價且隨處可得,不再具備溢價能力。

一家靠構建模型起家、估值數十億的獨角獸,為何宣稱自己的護城河即將枯竭?從違背極客審美的土味滑塊,到賠錢也要發(fā)的銷售傭金,這些看似離經叛道的決策背后,隱藏著怎樣的生存智慧?當技術紅利被抹平,ElevenLabs 究竟靠什么活下去?

今天這篇文章,希望對你有所啟發(fā)~

01

那個毀掉電影的波蘭男人

ElevenLabs的創(chuàng)業(yè)故事,始于波蘭的一間客廳。但在這之前,馬蒂和他的高中死黨皮奧特(Piotr)其實已經是一對“屢敗屢戰(zhàn)”的搭檔。

這對相識15年的好友并非那種一擊即中的天才。在很多個周末的黑客馬拉松里,他們曾試圖開發(fā)過“加密貨幣風險分析器”,也做過根據用戶情緒實時調整的“電影推薦算法”,但這些項目最終都無疾而終。

直到2021年底,當時,皮奧特正準備和女友看一部電影。因為女友不懂英語,他們打開了波蘭語配音版。

在那一刻,一種深受東歐文化熏陶的“痛苦”被重新喚醒了。在波蘭,無論電影里的角色是男是女、是老是少、是哭是笑,所有的配音通常都由同一個男人完成——一種被稱為“Lector”的單調畫外音。沒有情感,沒有起伏,所有的戲劇張力在那個平淡的聲音中灰飛煙滅。

“這是一個可怕的體驗,但它竟然持續(xù)到了今天,”馬蒂回憶道。

這種由于語言隔閡帶來的體驗降級,是英語世界的原住民難以感同身受的。在美國,人們理所當然地享受著豐富的情感表達和多樣的口音。但在非英語世界,聲音的魅力往往在翻譯中流失殆盡。

這種“局外人”的憤怒,成為了ElevenLabs的起點。馬蒂和皮奧特,一個在Palantir處理數據,一個在谷歌做工程,他們敏銳地意識到:Transformer和擴散模型(Diffusion Models)雖然在文本和圖像領域大放異彩,但在音頻領域卻是一片荒原。當時的音頻研究被邊緣化,缺乏關注。

他們決定做一個顛覆者:不僅要讓機器說話,更要讓它理解上下文的情感潛臺詞。

“如果是一句‘多么美好的一天’,”馬蒂解釋道,“在書中正常的描寫里,它是愉悅的;但如果是主角倒霉時的自嘲,它就必須是充滿諷刺的。”

這種對“語境”和“情感”的極致追求,讓ElevenLabs的第一代模型就與當時市面上機械的TTS(文本轉語音)拉開了代差。他們沒有像傳統(tǒng)廠商那樣去硬編碼聲音的性別或年齡,而是讓模型自己去“解碼”聲音的特征。

正是這種源自波蘭的“切膚之痛”,注定了ElevenLabs從第一天起就不是一家為了技術而技術的公司,而是一家為了消除人類交流隔閡而生的產品公司。

02

垂直AI公司,

不被大廠碾壓的生存之道

在ChatGPT橫空出世后,一個陰影籠罩在所有垂直AI公司頭頂:在這個巨頭林立的斗獸場,當OpenAI、谷歌發(fā)布多模態(tài)模型時,你們會不會瞬間淪為被碾壓的“路邊尸體(Roadkill)”?

這是一個極其殘酷的問題。畢竟,OpenAI隨后發(fā)布的語音模式和谷歌的Veo系列都展示了驚人的統(tǒng)治力。馬蒂的回答揭示了ElevenLabs獨特的生存哲學:極度專注,管理上極度務實?!爱斆總€人都在追逐通用大模型時,我們選擇在音頻這個被低估的領域深耕,”馬蒂在紅杉資本的播客中說道。

1. “三個月紅線”與土味滑塊

ElevenLabs內部曾發(fā)生過一場典型的“理想主義 vs 實用主義”的戰(zhàn)爭。

在早期,用戶強烈呼吁在產品界面加一個能調節(jié)語速的“滑塊”功能。但創(chuàng)始團隊和科研人員覺得這太“土”了,像是上一代老舊軟件的產物。他們堅持認為,真正的AI應該像人類一樣,根據文本的情緒自動決定語速的快慢(例如悲傷時慢,興奮時快),而不是靠人工調節(jié)。于是,科研團隊花了整整9個月試圖攻克這個難題。

結果并不理想,模型始終無法完美預測所有用戶的語速需求,用戶依然在抱怨。

最終,馬蒂定下了一條鐵律:如果科研部門在3個月內解決不了一個問題,那就讓產品部門用“笨辦法”解決。于是,那個“土味”的滑塊被加了上去,問題瞬間解決,用戶滿意度飆升。

“我們不能為了追求技術的完美而無視用戶的痛點,”馬蒂反思道。這種實用主義導向,讓ElevenLabs在迭代速度上始終壓過對手一頭。

2. 數據壁壘與分布式人才

除了產品策略,ElevenLabs在數據上也筑起了高墻。文本數據隨處可見,但高質量、帶有情感標注的音頻數據不僅稀缺,而且處理難度極大。

ElevenLabs不僅是在練模型,更是在構建數據工廠。他們雇傭配音教練,建立專門的標注團隊,去教AI理解什么是“悲傷中的顫抖”,什么是“憤怒后的壓抑”。這種對數據的“精耕細作”,是通用大模型廠商難以在細分領域復制的。

3、打破硅谷中心論,實行全員遠程辦公

馬蒂認為全球真正懂音頻AI的頂級研究員可能只有50到100人。為了捕獲這些稀缺的大腦,ElevenLabs打破了硅谷中心論,實行全員遠程辦公。

“如果你想雇傭最優(yōu)秀的人,你就不能把自己鎖在舊金山的方圓十英里內?!边@種分布式的架構,讓他們吸納了大量歐洲頂尖人才,這種國際化基因在處理多語言配音時,比美國本土團隊更具敏感度。

4. 賠錢也要發(fā)的銷售傭金

在商業(yè)化層面,馬蒂同樣展現出了驚人的戰(zhàn)略定力。

面對大廠拋來的橄欖枝,比如僅僅是把模型授權給對方做展示,ElevenLabs的銷售團隊往往能拿到豐厚的合同。但馬蒂意識到,這種缺乏深度的合作會把公司變成單純的“底層供應商”,甚至導致核心技術參數外泄,長期來看是戰(zhàn)略自殺。

因此,公司高層會經?!皵赖簟边@些短期利潤豐厚的單子。但為了不打擊銷售團隊的積極性,ElevenLabs制定了一個“反常識”的規(guī)定:即使一個銷售單子為了公司戰(zhàn)略被高層否決了,該銷售人員依然能拿到這筆單子的全額傭金。

這完全顛覆了“成單才有錢”的銷售鐵律。寧愿公司賠錢,也要引導團隊關注長期的戰(zhàn)略價值,而非眼前的現金流。正是這種極度清醒的頂層設計,讓ElevenLabs在巨頭的夾縫中守住了自己的生態(tài)位。

03

自下而上,

完成C端到B端的轉型

ElevenLabs的崛起路徑,是一條典型的“C端創(chuàng)作者包圍企業(yè)級”的路線。

在企業(yè)級銷售團隊尚未組建之前,ElevenLabs就通過一系列病毒式傳播事件引爆了網絡。

ElevenLabs非常擅長制造“?!薄?/p>

  • 第一個會笑的AI:在ElevenLabs之前,所有的TTS(文本轉語音)都是一本正經的“播音腔”。當ElevenLabs發(fā)布了第一個能發(fā)出逼真笑聲的模型時,互聯(lián)網沸騰了。大量用戶涌入平臺,只為測試AI怎么笑,這不僅帶來了流量,更確立了其“懂情感”的品牌心智。

  • 哈利·波特的時尚秀:隨后,那個讓《哈利·波特》角色穿上Balenciaga(巴黎世家)走秀的視頻席卷全網。那是ElevenLabs技術實力的第一次大規(guī)模路演。

  • 醉酒唱歌的意外:早期甚至有用戶試圖用僅支持朗讀的模型去生成歌曲(當時模型并不支持唱歌),結果生成出了像“醉漢唱歌”一樣的滑稽效果。這個Bug反而變成了一個梗,進一步助推了品牌的病毒式擴散。

緊接著,知名播主萊克斯·弗里德曼(Lex Fridman)采訪莫迪總理的視頻被AI翻譯成了流利的英語和印地語,讓全世界看到了跨語言交流的未來。

隨著用戶量的激增,ElevenLabs順勢推出了Voice Marketplace,允許用戶克隆并出租自己的聲音。這不僅是一個功能,更開啟了一種全新的資產流動模式。馬蒂透露,截至目前,ElevenLabs已經向共享聲音的創(chuàng)作者支付了超過1000萬美元的分成。

在這個市場上,發(fā)生過許多有趣的現象。比如有一個深沉的西班牙男聲,在西班牙本土反響平平。但當它被英語用戶發(fā)現并用來生成英語內容時,因為其獨特的拉丁磁性音色,瞬間成為了全球Top 3的爆款聲音。

這證明了聲音是一種可以跨越文化、被重新定義的抽象資產。ElevenLabs不僅在賣技術,更是在運營一個全球化的聲音交易所。

ElevenLabs“自下而上”的策略成功了。企業(yè)最初對AI語音持懷疑態(tài)度,但看到個人創(chuàng)作者利用該技術制造了大量病毒式傳播的內容,驗證了技術的質量和潛力。這些C端的熱度反過來教育了B端客戶,降低了企業(yè)的決策門檻。

ElevenLabs的客戶結構從2024年的90%個人開發(fā)者轉變?yōu)閭€人與企業(yè)五五開(50/50)。在短短一年多時間內,成功完成了向企業(yè)級市場(B端)的轉型。

在《堡壘之夜》(Fortnite)中,數百萬玩家第一次體驗到了與達斯·維達(Darth Vader)進行實時語音互動的震撼。這標志著ElevenLabs已經攻克了實時語音互動中最難的三個關卡:質量、延遲和穩(wěn)定性。

為了服務好這些差異巨大的客戶,ElevenLabs重塑了組織架構。他們設立了“快慢雙軌制”:既有像微型初創(chuàng)公司一樣運作、需要在6個月內證明產品市場契合度(PMF)的創(chuàng)新小組,也有負責高可靠性、長期服務企業(yè)客戶的穩(wěn)健團隊。

04

賣生態(tài),做音頻屆的蘋果

回到文章開頭那個驚人的論斷——為什么馬蒂認為模型最終會變得“一文不值”?

因為他看透了科技發(fā)展的規(guī)律。長期來看,基礎模型的差異會縮小,純粹靠模型性能帶來的紅利會消失。為了不被時代的洪流淹沒,ElevenLabs必須進化。

馬蒂的策略是:做音頻屆的蘋果——上演“產品+AI”的魔法。他不僅賣模型,更賣工作流,賣應用,賣生態(tài)。

這個戰(zhàn)略認知的覺醒,源于早期的一個真實用戶故事。

在ElevenLabs剛發(fā)布那個只能輸入推特長度文本的小框時,馬蒂發(fā)現有一位有聲書作者竟然不僅沒有嫌棄,反而笨拙地將一整本書拆分成幾百段,進行了300次“復制-粘貼-下載-拼接”的操作,只為制作一本完整的有聲書。

“那一刻我們意識到,光有模型是不夠的,”馬蒂回憶道,“用戶需要的不僅僅是生成聲音,他們需要的是糾正發(fā)音、分配角色、編輯時間軸的一整套工作流。”

這次頓悟讓ElevenLabs徹底轉向。他們不再僅僅是一家模型公司,而是一個“創(chuàng)意AI代理平臺”。

1. 技術取舍:級聯(lián)(Cascading)與雙工(Duplex)的博弈

在從C端轉向企業(yè)級市場(如客服、醫(yī)療、教育)時,ElevenLabs面臨著一個艱難的技術抉擇。

目前的技術架構主要有兩種:

  • 級聯(lián)模型(Cascading):這是目前的行業(yè)主流。流程是:語音轉文字 -> LLM思考 -> 文字轉語音。優(yōu)點是極其穩(wěn)定、可控、不易犯錯;缺點是延遲高,且會丟失嘆息、停頓等非語言情感。

  • 原生雙工模型(Duplex):像GPT-4o的語音模式一樣,音頻進、音頻出。優(yōu)點是極快、情感豐富;缺點是容易產生幻覺,不可控。

對于企業(yè)客戶(比如醫(yī)療公司Hippocratic)來說,護士機器人說錯藥名是絕對不可接受的。因此,馬蒂非常務實地選擇了在現階段主推“級聯(lián)模型”,盡管它聽起來沒那么酷。

“企業(yè)要的是不犯錯,而不是有感情,”馬蒂坦言。ElevenLabs正在研發(fā)下一代原生全能模型(Omni-model),試圖在2026年解決這個問題,但在當下,他們選擇了穩(wěn)健。

2. 解決“下水道工程”

這種“做重”的策略也體現在了集成上。馬蒂指出,企業(yè)落地的最大痛點往往不是AI本身(RAG或大模型),而是如何接通老式的SIP Trunking(電話線路),如何連上Twilio,如何打通Salesforce。

通過解決這些傳統(tǒng)IT的“下水道工程”,ElevenLabs在企業(yè)核心業(yè)務流中扎下了根。如今,他們不僅服務于《堡壘之夜》,還與Chess.com合作,讓你在下棋時能聽到世界冠軍馬格努斯·卡爾森(Magnus Carlsen)的聲音在耳邊指導;與《時代》周刊合作,讓讀者可以直接“對話”年度人物文章。

這直接體現在了其客戶結構的復雜性上。以醫(yī)療公司Hippocratic為例,他們利用ElevenLabs的堆棧構建了完整的護士代理——自動給患者打電話、安排預約、甚至提醒用藥。這不僅僅是調用API,這是深度嵌入了企業(yè)的生命線。

05

聲音作為終極界面的未來

拿到66億估值后,ElevenLabs的野心宏大得近乎科幻:他想推倒語言的“巴別塔”,并讓AI通過聲音的圖靈測試。

首先是打破語言障礙。馬蒂設想在未來5到10年內,人們可以通過耳機或眼鏡,實現實時的、保留原聲特色的跨語言對話?!跋胂笠幌?,你用中文說話,對方聽到的是地道的英語,但那依然是你的聲音?!?/strong>

其次是“Omni-model”(全能模型)的構建。ElevenLabs正在研發(fā)一種端到端的原生音頻模型,直接理解音頻輸入并生成輸出。馬蒂自信地表示:“我們希望在2026年初,通過對話式AI的圖靈測試?!?/p>

但隨著能力的提升,責任也隨之而來。面對“AI生成內容將超過人類內容”的未來,以及深偽(Deepfake)詐騙的風險,ElevenLabs構建了一套“三層防御體系”:設備級身份驗證: 通過設備簽名確認電話是否來自本人,如同生物指紋;水印與白名單: 合法的AI代理必須帶有數字水印,表明身份;默認懷疑: 在上述兩層之外,系統(tǒng)應默認內容為AI生成。

這種務實的安全策略,比單純的呼吁監(jiān)管更具建設性。

馬蒂描繪了一個由聲音驅動的未來。

在這個未來里,教育將被重塑。每個孩子都可以擁有一位蘇格拉底式的AI導師,它不僅博學,還能像理查德·費曼(Richard Feynman)那樣幽默風趣地講解物理——ElevenLabs已經拿到了費曼家人的授權,復活了這位物理頑童的聲音。

在這個未來里,技術將隱入幕后。我們不再需要低頭戳屏幕,而是回歸人類最原始、最高效的交流方式——對話。

2025盛景半年回顧


人生只有四千周,而企業(yè)生存期更短,跨越10年經營期的企業(yè)少之又少,企業(yè)要想有質量地活下去,活得更好更久,“極簡增長”就是看透并掌控事物本質的那個關鍵點。

選對了路,路就不會遠。盛景推出《極簡增長 立竿見影》在線課程,期望能夠幫助更多的企業(yè)走上增長道路。未來有多近,在于我們已經走了多遠。未來有多遠,在于我們與誰同行。期待與你同行、共勉。

歡迎大家點擊底部【閱讀原文】觀看《極簡增長 立竿見影》的在線視頻課程,了解如何用極致簡單的增長方法論,實現快速增長。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俄外交部:美國威脅對伊朗發(fā)動軍事打擊“絕不可接受”

俄外交部:美國威脅對伊朗發(fā)動軍事打擊“絕不可接受”

新華社
2026-01-14 00:10:04
13號收評:市場全天震蕩調整!所有人都注意,大盤后市開始這樣看

13號收評:市場全天震蕩調整!所有人都注意,大盤后市開始這樣看

春江財富
2026-01-13 15:25:25
亞洲杯0-2,韓國遭中亞勁旅掀翻,無緣頭名,淘汰賽首輪或PK中國男足

亞洲杯0-2,韓國遭中亞勁旅掀翻,無緣頭名,淘汰賽首輪或PK中國男足

側身凌空斬
2026-01-13 21:24:43
國乒全新教練組薪資曝光,馬琳總收入突破千萬,莎頭主管教練推測

國乒全新教練組薪資曝光,馬琳總收入突破千萬,莎頭主管教練推測

體壇白話
2026-01-13 11:09:18
承認了,威斯布魯克帶領國王隊大勝湖人隊后承認,很享受打老東家

承認了,威斯布魯克帶領國王隊大勝湖人隊后承認,很享受打老東家

好火子
2026-01-14 01:06:26
據說:市面上90%的烤鴨都是用這種做的?你還吃嗎?

據說:市面上90%的烤鴨都是用這種做的?你還吃嗎?

今朝牛馬
2026-01-08 18:32:41
2026年慢病報銷巨變!6種病免辦卡直接省一半錢,大多數還不知情

2026年慢病報銷巨變!6種病免辦卡直接省一半錢,大多數還不知情

復轉這些年
2026-01-11 23:32:18
伊朗抗議轉向精準化 鎮(zhèn)壓官員家門被標記遭定點打擊

伊朗抗議轉向精準化 鎮(zhèn)壓官員家門被標記遭定點打擊

老馬拉車莫少裝
2026-01-12 19:01:56
兩岸喜訊!大陸沒想到,沒等正式收臺,臺當局先送來2份“大禮”

兩岸喜訊!大陸沒想到,沒等正式收臺,臺當局先送來2份“大禮”

趣生活
2026-01-10 22:29:06
離譜!大學教授抄襲50年前的博士論文!網友:哈?50年前的論文到了今天還有創(chuàng)新性?

離譜!大學教授抄襲50年前的博士論文!網友:哈?50年前的論文到了今天還有創(chuàng)新性?

超級數學建模
2026-01-13 22:30:02
耿耿于懷!頂薪沒了,4年2.29億變3年1.2億,特雷楊啊,老鷹高招

耿耿于懷!頂薪沒了,4年2.29億變3年1.2億,特雷楊啊,老鷹高招

球童無忌
2026-01-13 16:24:52
女子因肺栓塞不幸走了!醫(yī)生:天冷寧愿躺一天,也別干這5事!

女子因肺栓塞不幸走了!醫(yī)生:天冷寧愿躺一天,也別干這5事!

健康之光
2026-01-13 10:54:55
北京雙殺送江蘇9連?。航苈?8分周琦7+8 龐崢麟21+7

北京雙殺送江蘇9連?。航苈?8分周琦7+8 龐崢麟21+7

醉臥浮生
2026-01-13 21:29:35
U23亞洲杯開罰單!泰國2名主力禁賽,無緣對陣國足,還被罰款7000

U23亞洲杯開罰單!泰國2名主力禁賽,無緣對陣國足,還被罰款7000

小火箭愛體育
2026-01-13 11:21:24
伊朗已經認慫了!美國總統(tǒng)特朗普表示,伊朗呼吁展開核計劃談判

伊朗已經認慫了!美國總統(tǒng)特朗普表示,伊朗呼吁展開核計劃談判

止戈軍是我
2026-01-12 11:12:41
他身高1米6卻娶了中國首席舞蹈家譚元元

他身高1米6卻娶了中國首席舞蹈家譚元元

豐譚筆錄
2026-01-13 07:30:10
美國務院:美國公民立即離開伊朗!特朗普:對伊朗貿易伙伴征收25%關稅!伊朗外長稱大量證據顯示美以參與近期騷亂

美國務院:美國公民立即離開伊朗!特朗普:對伊朗貿易伙伴征收25%關稅!伊朗外長稱大量證據顯示美以參與近期騷亂

每日經濟新聞
2026-01-13 09:00:12
深夜利空,商業(yè)航天龍業(yè)績暴降58%,16個龍頭陷入虧損,別踩雷了

深夜利空,商業(yè)航天龍業(yè)績暴降58%,16個龍頭陷入虧損,別踩雷了

風風順
2026-01-14 03:15:03
新年第一炮,埃爾多安大手一揮,中國人去他們國家連簽證都不要了

新年第一炮,埃爾多安大手一揮,中國人去他們國家連簽證都不要了

百態(tài)人間
2026-01-12 16:26:42
3-2!國乒男單連贏兩場:袁勵岑惡戰(zhàn)五局逆轉對手,收獲新年首勝

3-2!國乒男單連贏兩場:袁勵岑惡戰(zhàn)五局逆轉對手,收獲新年首勝

郝小小看體育
2026-01-14 00:03:29
2026-01-14 04:16:49
盛景產業(yè)互聯(lián)網觀察 incentive-icons
盛景產業(yè)互聯(lián)網觀察
閱讀最精粹的商業(yè)信息。
2052文章數 5356關注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

特朗普:已取消所有與伊朗官員的會談

頭條要聞

特朗普:已取消所有與伊朗官員的會談

體育要聞

他帶出國乒世界冠軍,退休后為愛徒返場

娛樂要聞

蔡卓妍承認新戀情,與男友林俊賢感情穩(wěn)定

財經要聞

"天量存款"將到期 資金會否搬入股市?

汽車要聞

限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

本地
房產
旅游
數碼
公開課

本地新聞

云游內蒙|到巴彥淖爾去,赴一場塞上江南的邀約

房產要聞

又一新校開建!??谶@一片區(qū),迎來教育重磅升級!

旅游要聞

順義區(qū)將硬核打造“工業(yè)時尚游”

數碼要聞

PC硬件全線漲價?這幾款RTX 50系游戲本竟敢“逆勢”維持原價

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版