国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2億多人開始和AI打電話,他們在聊什么?

0
分享至

前段時間我在即刻上吐槽了一件事,就是一連數(shù)次,有好幾個人拿著和豆包聊天的結(jié)果給我當建議...有我50多歲的丈母娘,有和我對接的某視頻平臺的運營。

emmm...我好像也沒問你們啊。

似乎,大家使用豆包的意愿和接納程度比我想象得高多了。

然后我查了下,根據(jù)QuestMobile的數(shù)據(jù),2025年12月豆包的月活躍用戶達到了2.27億,是第二名DeepSeek的將近兩倍。經(jīng)過今年春節(jié)的一波增長,現(xiàn)在的數(shù)字只會更高。


講道理,這數(shù)據(jù)實在有點超出我慣常的認知了,雖然大家都懂字節(jié)做增長是強項。

然后我特意去了解了下大家平時都是怎么用豆包的,大多數(shù)是拿來問問題、寫寫東西,用完就走。但也有個越來越有趣的變化:越來越多人開始和豆包「打電話」。

語音交互,終于等到了它的時代

說到和AI語音對話,我總會想起一個人——羅永浩。

2018年,老羅在鳥巢開了一場萬人發(fā)布會,發(fā)布了一個叫TNT的產(chǎn)品。核心理念是:未來的電腦交互應該是語音+觸控,不再需要鍵盤和鼠標。

發(fā)布會現(xiàn)場翻車了。語音識別磕磕絆絆,老羅急得滿頭大汗,臺下的笑聲從善意變成了尷尬。后來他自己回憶說:當年的語音沒有AI加持,準確率雖然能到百分之九十幾,但現(xiàn)場那個環(huán)境確實搞砸了。

TNT被當成了笑話,當年科技圈最大的樂子之一。但老羅說的那個方向,錯了嗎?

快進到2026年,你會發(fā)現(xiàn)一件有意思的事:老羅8年前暢想的東西,正在以另一種形式變成現(xiàn)實。

第一個信號是vibe coding?,F(xiàn)在用AI寫代碼的開發(fā)者越來越多,其中相當一部分人開始用語音來下指令。道理很簡單:說話速度是打字的3-4倍,對著Cursor說「把這個按鈕改成藍色」比打字快多了。我自己也是,用AI寫代碼這兩年,越來越覺得很多指令用嘴說比打字自然。

第二個信號是Typeless這類語音輸入產(chǎn)品火了。一個語音輸入法,年度會員要1000多塊人民幣,居然還賣得不錯。更有意思的是,很多vibe coder覺得貴,干脆自己用AI做了一個語音輸入工具——用AI做的工具,來給AI輸入指令,套娃了屬于是。

第三個信號,就是豆包的2億多用戶。

這三件事其實都在說同一件事:語音交互不是未來,就是現(xiàn)在正在發(fā)生的事。 只不過它沒有發(fā)生在老羅想象的桌面電腦上,它發(fā)生在手機上,發(fā)生在人和AI的對話里。

但語音交互有一個老問題一直沒解決好。

為什么之前和AI打電話總覺得「不對勁」

你大概試過和AI語音對話吧。不管是Siri還是之前版本的豆包,體驗都有一個共同的別扭感:你和AI之間,其實是在「輪流發(fā)言」,不是在「對話」。

你說一句,等一兩秒,AI回一句。你還沒說完,AI就搶話了。你在嘈雜的地方說話,AI把旁邊大爺?shù)膹V場舞指令當成了你的問題。

為什么會這樣?其實是技術(shù)架構(gòu)決定的。之前的AI語音基本都是一條流水線:先把你說的話轉(zhuǎn)成文字(語音識別),再讓大模型理解文字生成回復(語言模型),最后把回復轉(zhuǎn)成語音播出來(語音合成)。三個環(huán)節(jié)排隊走,每一步都有延遲,加起來就是那個尷尬的空白。就像你發(fā)微信等回復,只不過這個「正在輸入…」變成了你們面對面干瞪眼。

但更別扭的地方在于,這條流水線是單向的。AI在說話的時候,它聽不到你。你說話的時候,AI也沒在聽。跟打電話完全不是一回事。你以為你倆在聊天,其實你倆在輪流發(fā)語音。

打電話的時候,你和對方是同時在聽、同時在說的。你說到一半停頓了,對方知道你在想,會等你。你說完了,對方馬上接話。背景很吵,對方也能分辨出哪個是你的聲音。

這個能力叫全雙工。人類打電話天生就是全雙工的,但AI語音對話一直做不到。

直到最近豆包的這次升級。

豆包語音通話的這次升級到底改了什么

豆包這次把語音通話的底層模型換成了端到端的全雙工模型。

翻譯成人話:以前是「你說完→它轉(zhuǎn)文字→它想→它轉(zhuǎn)語音→它說」,現(xiàn)在是「你說→它直接說」。中間少了好幾道工序,就像從轉(zhuǎn)三次公交變成了打直達車。這帶來了三個直觀的變化:

第一,它能一邊說一邊聽了。 你打斷它,它馬上停。你嗯嗯啊啊表示在想,它知道你沒說完,會等你。就這一點,體驗差距就非常大。

第二,抗干擾能力明顯變強。 旁邊有人說話、有音樂、有環(huán)境噪音,它不會被誤觸發(fā),也不會把別人的話當成你的指令。

第三,延遲降低了。 在需要快速接話的場景(比如玩成語接龍),它的反應速度明顯快了。

聽起來都是技術(shù)參數(shù)。但你真正用起來的時候,感受是很直接的:和豆包打電話,第一次開始像在打電話了。

我決定拿一整天來測一下,到底有多「像」。

帶著豆包去逛AIFUT

4月8號,卡茲克辦的AIFUT大會在北京亦莊開幕,就是之前Faker和TheShy打表演賽的那個電競館。34個AI展位,主論壇1000張票秒光,展區(qū)免費開放,從早8點到晚9點。

我決定做一個實驗:這一整天的出行,在不同環(huán)境里和豆包打電話,看看全雙工在真實場景下到底表現(xiàn)怎么樣。


不過在出發(fā)之前,我做了一件事:先在對話里把AIFUT的活動信息喂給了豆包。 展會時間、地點、簽到規(guī)則、展位分布,全部告訴它。這一步后來證明非常關鍵。

場景一:網(wǎng)約車上

坐上車,我撥通了豆包的語音通話。

「我一會要去參加那個AIFUT的展會,我有什么需要注意的嗎?」

因為之前已經(jīng)喂過信息,豆包馬上就給了很具體的建議:提前在小程序完成簽到能領5個FUT幣、今天氣溫10到20度建議帶件外套、場館里不能吃螺螄粉臭豆腐這些重味食物。

挺順的。然后我追問:「哎我有什么東西是必須帶著才行的嗎?入場有啥要求不?」

它說身份證原件必帶,簽到領FUT幣和主論壇入場都需要。

我一下慌了:「我靠我好像忘帶身份證了,這怎么辦?」

我當時是真慌了。但它倒是比我淡定,分情況回答:如果只是逛免費展區(qū)不用身份證直接進場就行,如果買了主論壇門票可以試試微信或支付寶的電子身份證,在卡包或證件夾里能找到,現(xiàn)場工作人員一般會認可。

坐在旁邊的司機師傅看了我一眼,大概在想這人為什么對著手機自言自語還急得不行。

這段對話最讓我意外的不是它回答得對不對,而是聊天的感覺。 因為提前喂了上下文,整個對話省去了大量解釋背景的時間。我不需要說「AIFUT是一個AI展會,在北京亦莊,有34個展位」——它都知道。這讓語音對話的效率提高了一個量級。

還有幾個細節(jié)讓我覺得這個對話確實不一樣。

它在回答簽到規(guī)則的時候,我突然想起來一個事,直接插了一句「等等」。它幾乎是瞬間就停了,沒有像以前那樣把剩下的話說完才停。等我說完補充的問題,它接著往下講,銜接得很自然。

另一個細節(jié)是節(jié)奏。我問「忘帶身份證怎么辦」的時候,其實后面猶豫了一下才補了一句「這怎么辦」。中間大概停了兩三秒。如果是之前的AI語音,這兩三秒的空白它大概率就開始回答了,因為它以為你說完了。但豆包沒有,它等到我真正說完了才接話。該等的時候等,該接的時候秒接。 這個節(jié)奏感確實挺像在和人聊天。

網(wǎng)約車里有一點路噪和導航播報聲,完全沒影響到對話。

場景二:主論壇辯論賽進行中

下午三點多,主論壇正在進行一場辯論賽,題目是「教別人用AI是可以教會的嗎」。臺上AJ、卡爾的AI沃茨、葬AI、Max For AI幾個AI博主吵得不可開交,賽博禪心主持,駱軼航當評委。電競館的音響系統(tǒng)本來就是給英雄聯(lián)盟比賽設計的,臺上的聲音在整個場館里回蕩,跟看世界賽團戰(zhàn)差不多。

我就坐在觀眾席上。

這時候我掏出手機撥通了豆包。但我不太好意思大聲說話——周圍都是在聽辯論的觀眾。所以我壓低聲音,問了一個很日常的問題:「我們現(xiàn)在打車回國貿(mào)的話,大概需要多久?」

這個問題其實不簡單。首先,臺上辯論聲遠比我的聲音大。 這不是「有點背景噪音」的程度,而是臺上好幾個人在激烈對話、音響全開的那種環(huán)境,我的聲音在里面幾乎可以忽略不計。其次,要回答這個問題,豆包不僅要聽清我說了什么,還需要知道我現(xiàn)在在哪(亦莊的電競館),再結(jié)合當前時間點來預估路程。

但它回答了,而且接話速度很快。我說完最后一個字,大概不到一秒它就開始回復了。不僅聽懂了我的問題,還給出了從亦莊到國貿(mào)的打車時間預估。整個過程中,它沒有一次被臺上幾個人的辯論聲打斷,也沒有把辯手的話混進我的問題里。

你想想這個場景:一個幾百人的電競館,臺上四五個人在激烈辯論,音響全開,而你在觀眾席上小聲問了一句「打車回國貿(mào)要多久」,AI居然能只聽到你,還給出了靠譜的回答。

半年前的AI語音助手在這個環(huán)境里,大概率兩種結(jié)果:要么直接聽不清你在說什么,要么把臺上辯手的話當成你的指令來回復。

但這次豆包在電競館里的表現(xiàn),確實讓我對全雙工有了更直觀的理解。它真正做到了在一堆人聲里只聽你一個人的聲音。 這個能力聽起來簡單,但你親身體驗過在那種噪音里它還能準確回答你,感受是完全不同的。

一個讓語音對話好用10倍的小技巧

測完這兩個場景,我還發(fā)現(xiàn)一個挺實際的事:語音對話好不好用,不只取決于模型,還取決于你怎么用它。

之前我試過直接冷啟動和豆包打電話,聊幾句就覺得沒什么意思。感覺像跟一個什么都不知道的陌生人尬聊,你說什么它都得從頭理解,對話很淺。

但這次我在出發(fā)前花了兩分鐘,把AIFUT的活動信息喂給了它。結(jié)果整個出行過程中的對話質(zhì)量完全不同:我說「展會」它知道我說的是哪個展會,我問「簽到」它知道FUT幣的規(guī)則,我說「忘帶身份證」它能給出針對這個展會的具體建議。

這個發(fā)現(xiàn)其實很實際:如果你要在某個場景下持續(xù)用語音對話,先花1-2分鐘把背景信息喂給它。 出差前告訴它你的行程、會議前告訴它議題、出門前告訴它今天的安排。有了上下文的語音對話和沒有上下文的,完全是兩種體驗。

全雙工解決的是「對話像不像打電話」的問題,但上下文解決的是「對話有沒有用」的問題。兩個加在一起,才是語音對話真正好用的狀態(tài)。

和ChatGPT語音比起來怎么樣

說到AI語音對話,繞不開ChatGPT的Advanced Voice Mode。

ChatGPT的語音模式也是端到端模型,也支持打斷和情感表達,不少評測都說它是目前「最像真人的AI語音」。

但在國內(nèi)用的話,豆包確實有幾個實際的優(yōu)勢:

中文能力。 這不是客氣話。AI語音對話對語言的要求遠高于文字聊天——你要處理口音、方言、語氣詞、說話習慣。豆包能聽懂18種方言,能用粵語、東北話、四川話輸出。ChatGPT做英文沒問題,做中文還是差一截。

在果殼的一次測評中,有一個很有意思的數(shù)據(jù):讓測試者判斷「這是不是AI在說話」,ChatGPT有30%的對話被認為「一聽就是AI」,豆包這個比例不到2%。

免費。 ChatGPT的Advanced Voice Mode需要Plus訂閱,$20/月,而且有每日使用限制。豆包的語音通話功能是免費的。

可用性。 這個不展開說了,你懂的。能直接用和需要折騰才能用,這本身就是一道篩選。

不過公平地說,ChatGPT的語音在英文場景下的表現(xiàn)確實非常好,情感表達和幽默感都很自然。兩個產(chǎn)品各有擅長的領域。

我的判斷

回到開頭的問題:2億多人和AI打電話,他們在聊什么?

我覺得答案可能不在于「聊什么」。更有意思的問題是「什么時候聊」。

人和AI的交互,文字聊天覆蓋的是你坐在電腦前、拿著手機、眼睛盯著屏幕的時間。但你回憶一下自己的一天:通勤、走路、排隊、等人、發(fā)呆——這些時間加起來可能有好幾個小時,過去AI根本觸達不到。

語音通話打開的就是這塊時間。

而全雙工解決的是一個更底層的問題:讓這種交互不再別扭。 之前的AI語音像是在用對講機,按一下說一句,松開等回復。全雙工之后,才真正像打電話。

在AIFUT逛了一整天,我印象最深的倒不是哪個展臺的產(chǎn)品有多厲害。而是在網(wǎng)約車上和豆包聊展會攻略,我停頓了兩三秒它耐心等著沒插嘴;在電競館辯論賽最激烈的時候我小聲問了句打車要多久,它一秒接話還答對了。

這些不是什么「黑科技」,這就是一個正常打電話應該有的體驗。只不過電話那頭不是人,是AI。

老羅2018年說語音交互是未來。他說對了。只不過這個未來的樣子,是2億多人拿起手機,和一個叫豆包的AI打了個電話。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
虛驚一場?曼城中場真核傷情并無大礙 但周中聯(lián)賽將無緣出場

虛驚一場?曼城中場真核傷情并無大礙 但周中聯(lián)賽將無緣出場

雪狼侃體育
2026-04-20 22:50:52
國民黨內(nèi)訌,前高層沖闖黨部斥責鄭麗文:你不配當主席,是個卒子

國民黨內(nèi)訌,前高層沖闖黨部斥責鄭麗文:你不配當主席,是個卒子

面包夾知識
2025-12-31 23:04:14
論武功高低,羅成在瓦崗排第五位,單雄信排名墊底,誰是第一?

論武功高低,羅成在瓦崗排第五位,單雄信排名墊底,誰是第一?

飯小妹說歷史
2026-04-19 09:04:31
山西偷情女子已社死,丈夫扒出賬號,不止一次出軌,酒店也受牽連

山西偷情女子已社死,丈夫扒出賬號,不止一次出軌,酒店也受牽連

劉哥談體育
2026-04-20 19:01:24
特朗普宣布:用100%關稅封殺中國汽車!中美爭端升級,黑天鵝出現(xiàn)

特朗普宣布:用100%關稅封殺中國汽車!中美爭端升級,黑天鵝出現(xiàn)

厲羽萱
2026-04-20 22:00:18
打7000萬美元給送盒飯給老人的機構(gòu),然后一聲不吭! 離開貝佐斯后,她一直在各種悄悄送錢....

打7000萬美元給送盒飯給老人的機構(gòu),然后一聲不吭! 離開貝佐斯后,她一直在各種悄悄送錢....

英國那些事兒
2026-04-19 23:07:22
21歲女子懷孕閃婚生活7天后想離婚! 女方:生理性厭惡,不想過了

21歲女子懷孕閃婚生活7天后想離婚! 女方:生理性厭惡,不想過了

半島晨報
2026-04-18 13:40:48
預告:上海市政府明日將舉行新聞發(fā)布會 介紹上海推進知識產(chǎn)權(quán)強市建設、加快新質(zhì)生產(chǎn)力發(fā)展等有關情況

預告:上海市政府明日將舉行新聞發(fā)布會 介紹上海推進知識產(chǎn)權(quán)強市建設、加快新質(zhì)生產(chǎn)力發(fā)展等有關情況

財聯(lián)社
2026-04-20 16:02:04
原來他是王治郅兒子,身高超2米,在成都上大學,如今已放棄籃球

原來他是王治郅兒子,身高超2米,在成都上大學,如今已放棄籃球

閱微札記
2026-04-19 14:41:49
黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

情感大頭說說
2026-04-19 22:17:29
美國突然公布這一最嚴法案,中方堅決反對!底氣背后別忘了她!

美國突然公布這一最嚴法案,中方堅決反對!底氣背后別忘了她!

溫讀史
2026-04-20 22:40:42
特朗普致函中方提條件,10國聯(lián)合聲明伊朗局勢或?qū)⒊霈F(xiàn)轉(zhuǎn)機

特朗普致函中方提條件,10國聯(lián)合聲明伊朗局勢或?qū)⒊霈F(xiàn)轉(zhuǎn)機

狡黠之狐
2026-04-20 21:57:48
5月1日起,醫(yī)療回扣要“涼涼”

5月1日起,醫(yī)療回扣要“涼涼”

中國新聞周刊
2026-04-20 13:21:25
突發(fā)!日本發(fā)生7.5級地震,海嘯已到達,最新情況曝光

突發(fā)!日本發(fā)生7.5級地震,海嘯已到達,最新情況曝光

西昆侖Bruce
2026-04-20 17:35:29
深大一口氣停招26個專業(yè),這些“坑”你還在踩嗎?

深大一口氣停招26個專業(yè),這些“坑”你還在踩嗎?

牛鍋巴小釩
2026-04-17 13:18:03
“毒包子”養(yǎng)廢了多少孩子,很多家長還在喂,看完文章停下來吧

“毒包子”養(yǎng)廢了多少孩子,很多家長還在喂,看完文章停下來吧

枕邊聊育兒
2026-04-20 08:46:22
葉君朋友:死因初步推斷為胃出血導致窒息,病發(fā)時他獨自在工作室

葉君朋友:死因初步推斷為胃出血導致窒息,病發(fā)時他獨自在工作室

南方都市報
2026-04-20 18:09:13
解氣?。?!來而不往非禮也!中國海軍今天出手了!

解氣?。?!來而不往非禮也!中國海軍今天出手了!

樂趣紀史
2026-04-20 08:03:19
被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

夜深愛雜談
2025-12-02 20:51:10
張澤群退休曬證,全網(wǎng)追問一句扎心:兒子找到了嗎?

張澤群退休曬證,全網(wǎng)追問一句扎心:兒子找到了嗎?

吃貨的分享
2026-04-20 09:48:48
2026-04-20 23:39:00
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
188文章數(shù) 111關注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

數(shù)碼
旅游
本地
房產(chǎn)
公開課

數(shù)碼要聞

粉綠半透明!微軟發(fā)布《地平線6》限定手柄耳機

旅游要聞

以“Fun”為名,深圳布吉將發(fā)布全域旅游品牌IP

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

房產(chǎn)要聞

大規(guī)模商改??!??谖骱0?,這波項目要贏麻了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版