国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌掀語音Agent新紀(jì)元!開口就是生產(chǎn)力,Siri的最強(qiáng)外掛來了?

0
分享至


智東西
作者|江宇
編輯|冰倩

智東西3月27日消息,昨日凌晨,谷歌正式推出其最高質(zhì)量的音頻和語音模型——實時語音模型Gemini 3.1 Flash Live,并在Gemini App、Search Live以及Google AI Studio中同步開放,其中后者以預(yù)覽版本向開發(fā)者提供。

這一版本的核心在實時語音Agent能力升級:語音已可直接驅(qū)動應(yīng)用開發(fā)(vibe coding),Gemini App的實時多模態(tài)對話能力同步增強(qiáng),在多項評測中超過GPT-Realtime-1.5、Qwen3 Omni 30B A3B Instruct、GPT-4o Audio preview等模型。

模型一出,就被外網(wǎng)網(wǎng)友稱作Siri“救星”。就在昨日,外媒曝2026蘋果WWDC將主打AI并將推新版Siri,蘋果已獲谷歌完整Gemini模型直連權(quán)限,將通過蒸餾自研輕量化端側(cè)AI部署iPhone。


這款模型面向?qū)崟r語音交互,對連續(xù)對話進(jìn)行了整體優(yōu)化,包括響應(yīng)延遲、上下文記憶、多語言處理及工具調(diào)用等關(guān)鍵能力。

Gemini Live中的上下文窗口已提升至此前的2倍,Search Live支持在200多個國家和地區(qū)進(jìn)行多語言實時交互,整體能力面向連續(xù)對話和復(fù)雜任務(wù)場景

從公開測試結(jié)果來看,這一版本在語音Agent關(guān)鍵能力上提升顯著。在ComplexFuncBench audio測試中,Gemini 3.1 Flash Live的函數(shù)調(diào)用準(zhǔn)確率達(dá)到90.8%,相比Gemini 2.5 Flash Native Audio去年12月版本的71.5%,以及2025年9月版本的66.0%,都有明顯提高。


在Scale發(fā)布的Audio MultiChallenge音頻輸出榜單中,該模型得分36.1%,高于GPT-Realtime-1.5的34.7%、Qwen3 Omni 30B A3B Instruct的24.3%、GPT-4o Audio preview的23.2%等模型。


與此同時,這一版本重點優(yōu)化了實時對話體驗。模型在語音識別中對語調(diào)、語速和停頓的處理更細(xì);在嘈雜環(huán)境下,對背景噪音的過濾能力增強(qiáng),可以更穩(wěn)定識別用戶指令并執(zhí)行任務(wù);在復(fù)雜指令場景中,對系統(tǒng)約束的遵循能力也有所提升。

已有獲得更新的用戶開始嘗試新玩法,有人直接用語音指令讓模型生成簡短演唱片段,這類能力已經(jīng)可以在對話中被觸發(fā)。

其API價格也已公布:文本輸入每百萬token約0.5美元、輸出約4.5美元,音頻輸入約3美元、輸出約12美元,支持多模態(tài)輸入調(diào)用。


模型一經(jīng)發(fā)布,社區(qū)已經(jīng)出現(xiàn)初步反饋。有網(wǎng)友評價稱,這是一次“強(qiáng)勢更新”,并指出更快的語音響應(yīng)是一種“用戶體驗層面的關(guān)鍵突破”,如果延遲和多輪對話中的連續(xù)性能在更長時間的使用中保持穩(wěn)定,語音交互的采用速度可能會明顯提升。

不過,也有用戶仍然保持謹(jǐn)慎。一位開發(fā)者直言,自己此前已經(jīng)放棄使用語音模型,因為其回復(fù)質(zhì)量明顯不如文本,并反問這一情況是否真的發(fā)生了改變。


智東西也對這一功能進(jìn)行了初步體驗。其中文語音表現(xiàn)仍偏機(jī)械,多輪對話過程中存在中斷情況,暫未能完整體驗其連續(xù)交互能力。當(dāng)前該版本正分批推送,iOS和安卓用戶已開始陸續(xù)收到更新。

一、開口就是改代碼:UI、交互、風(fēng)格一段話全部重做

在這次發(fā)布中,谷歌首先展示的是語音驅(qū)動應(yīng)用開發(fā)(vibe coding)這一類場景,開發(fā)者可以在Google AI Studio里一邊說話一邊做應(yīng)用,讓開發(fā)過程跟上腦暴的節(jié)奏。


▲Live Vibe Coder頁面,用戶可上手實操

用戶可以用語音連續(xù)調(diào)整界面。對話一開始,用戶直接提出修改:“把麥克風(fēng)做大一點”,界面隨即發(fā)生變化;緊接著補(bǔ)一句“背景加點黃色波點”,頁面背景立刻更新。

隨后用戶繼續(xù)疊加需求,例如加入“鼠標(biāo)懸停時的反饋效果”、讓背景圖案持續(xù)滾動,這些改動都在同一段對話中逐步完成。

用戶一邊說,界面一邊變化。中途用戶又臨時調(diào)整方向,說“干脆整體做成波普風(fēng)”,模型就在已有基礎(chǔ)上繼續(xù)重做視覺風(fēng)格,整個過程接近和設(shè)計師一對一的實時溝通。


二、設(shè)計協(xié)作、跨語對話、角色扮演,三類場景同時落地

除了應(yīng)用開發(fā),谷歌還給出了三類實際使用的場景,包括界面設(shè)計協(xié)作、跨語言陪伴交流,以及游戲中的角色互動。

設(shè)計工具Stitch的案例中,語音也可直接參與到界面編輯流程。用戶先讓界面跳到“練習(xí)模式”,再切到“歌曲庫”,隨后開始具體挑問題:“這些虛線和方形邊框看著有點硬,能不能讓數(shù)字更貼合圓形?”界面隨即往更簡潔的方向調(diào)整。緊接著又換一套思路:“試一個偏棕色、木質(zhì)一點的配色”,新的視覺版本便直接生成出來。

面向老年用戶AI硬件設(shè)備Ato的交互案例中,重點放在多語言對話的連續(xù)性,對話內(nèi)容圍繞日常問候和陪伴展開。用戶先用英語聊天,再插入一個條件:“我要跟奶奶說話,但她只會西班牙語”,模型在同一段對話里切換語言繼續(xù)交流,對話內(nèi)容并不會因為語言變化而中斷。

對話中一旦出現(xiàn)真實場景的插入信息,比如提到“剛從醫(yī)院出來有點累”,模型會順著語境回應(yīng),給出一段連續(xù)的交流。

在RPG游戲《Wit’s End》的案例中,語音被用來驅(qū)動角色本身。玩家提問時,模型會用帶有設(shè)定的語氣回應(yīng),例如圍繞“你有沒有實體形態(tài)”“你的能力來自哪里”等問題展開,對話始終保持在角色語境里?;卮鸩粫鲈O(shè)定,會沿著同一世界觀繼續(xù)展開,語氣和表達(dá)方式也保持一致。


結(jié)語:谷歌做“全棧語音Agent”,國內(nèi)玩家一邊抓用戶,一邊補(bǔ)能力

從這次發(fā)布來看,谷歌正在把語音能力做成一套更完整的通用能力體系。無論是編程場景中的vibe coding,還是AI硬件交互、移動端Gemini App入口,多個形態(tài)都在同時推進(jìn),覆蓋范圍擴(kuò)展到不同使用場景。

在產(chǎn)品形態(tài)上,Gemini App與國內(nèi)的豆包等產(chǎn)品已有明顯相似之處,都是以對話為核心入口,承接搜索、工具調(diào)用和多輪交互。但在實際體驗上,兩者并不相同。豆包在中文表達(dá)、語氣風(fēng)格以及互動感上更為主動,調(diào)侃式表達(dá)更容易形成用戶黏性,也已經(jīng)在國內(nèi)積累了一定用戶規(guī)模。

相比之下,谷歌當(dāng)前的重心仍放在能力拓展上,尤其是在語音驅(qū)動開發(fā)這一類場景中,vibe coding所體現(xiàn)的連續(xù)修改能力和實時交互節(jié)奏,已經(jīng)領(lǐng)先于現(xiàn)有產(chǎn)品形態(tài)。

與此同時,國內(nèi)在語音模型能力上的進(jìn)展也在加快。階躍星辰Step-Audio R1.1在Artificial Analysis語音推理榜單中拿下第一,以96.4%準(zhǔn)確率超過Grok、Gemini、GPT-Realtime等模型,成為當(dāng)前語音推理方向的代表性成果之一。

一邊是谷歌不斷拉高能力上限,嘗試覆蓋更多場景;另一邊是國內(nèi)玩家在用戶規(guī)模與模型能力兩端同時推進(jìn),語音Agent的競爭態(tài)勢,正愈演愈烈。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國民黨三人罕見支持,不簡單

關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國民黨三人罕見支持,不簡單

DS北風(fēng)
2026-04-10 17:16:33
曝愛爾眼科醫(yī)院院長猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

曝愛爾眼科醫(yī)院院長猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

180視角
2026-04-10 14:27:07
阿夫迪亞35+5開拓者擊沉快船升至第8,楊瀚森再登場小卡24+8+5

阿夫迪亞35+5開拓者擊沉快船升至第8,楊瀚森再登場小卡24+8+5

湖人崛起
2026-04-11 12:31:08
閉門會談 1 小時,鄭麗文邀咱們訪臺。大陸一句話,定調(diào)兩岸統(tǒng)一

閉門會談 1 小時,鄭麗文邀咱們訪臺。大陸一句話,定調(diào)兩岸統(tǒng)一

眼界看視野
2026-04-11 11:29:37
為這場和談,巴基斯坦押上國運!萬人封城不給以色列任何可乘之機(jī)

為這場和談,巴基斯坦押上國運!萬人封城不給以色列任何可乘之機(jī)

青青子衿
2026-04-11 02:19:32
壯麗歸航!阿爾忒彌斯2號宇航員平安回家,人類重返月球時代正式開啟

壯麗歸航!阿爾忒彌斯2號宇航員平安回家,人類重返月球時代正式開啟

大洛杉磯LA
2026-04-11 08:41:21
演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

韓小娛
2026-04-11 11:46:56
不用ETC了!5月1日高速新規(guī)落地,手機(jī)綁車牌全國暢行更省錢

不用ETC了!5月1日高速新規(guī)落地,手機(jī)綁車牌全國暢行更省錢

復(fù)轉(zhuǎn)這些年
2026-04-09 11:35:16
“危山”之下 丨400余名村民“裂縫”求生

“危山”之下 丨400余名村民“裂縫”求生

大象新聞
2026-04-11 10:28:07
鄭麗文大陸第4天:北京頂格接待,中南海保鏢護(hù)送,更多細(xì)節(jié)曝光

鄭麗文大陸第4天:北京頂格接待,中南海保鏢護(hù)送,更多細(xì)節(jié)曝光

影像溫度
2026-04-11 09:20:22
時隔35年!廣東東莞樟木頭上網(wǎng)絡(luò)平臺熱搜,真相令人震驚

時隔35年!廣東東莞樟木頭上網(wǎng)絡(luò)平臺熱搜,真相令人震驚

南方健哥
2026-04-10 23:13:49
美軍士兵居然有中國國籍,到中國前接通知注銷戶口怒了

美軍士兵居然有中國國籍,到中國前接通知注銷戶口怒了

俠客棧
2026-04-10 13:44:31
普京和澤連斯基宣布:俄烏停火32小時!澤連斯基:愿意與普京會面,但不是在莫斯科

普京和澤連斯基宣布:俄烏停火32小時!澤連斯基:愿意與普京會面,但不是在莫斯科

每日經(jīng)濟(jì)新聞
2026-04-10 17:29:03
全紅嬋微博自動回復(fù)“罵我,我會反彈回去的”!網(wǎng)友:她曾多無助

全紅嬋微博自動回復(fù)“罵我,我會反彈回去的”!網(wǎng)友:她曾多無助

火山詩話
2026-04-11 11:06:38
辱罵全紅嬋的徐某究竟是誰?一個普通愛好者 竟能拉業(yè)內(nèi)人士進(jìn)群

辱罵全紅嬋的徐某究竟是誰?一個普通愛好者 竟能拉業(yè)內(nèi)人士進(jìn)群

念洲
2026-04-11 09:39:26
趙子琪直播怒懟浪姐:淘汰遭侮辱,直言咖位不夠,上不了花少

趙子琪直播怒懟浪姐:淘汰遭侮辱,直言咖位不夠,上不了花少

離離言幾許
2026-04-11 09:44:35
又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰嗎?

又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰嗎?

小蘿卜絲
2026-04-10 18:37:25
以色列,終成人類公敵!

以色列,終成人類公敵!

燕梳樓頻道
2026-04-10 15:02:39
全紅嬋報警:辱罵她的記者全家移民跑路,隊友群里瘋狂背刺!太慘

全紅嬋報警:辱罵她的記者全家移民跑路,隊友群里瘋狂背刺!太慘

番外行
2026-04-09 09:25:53
以色列襲擊黎巴嫩被譴責(zé),內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

以色列襲擊黎巴嫩被譴責(zé),內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

揚子晚報
2026-04-11 11:33:21
2026-04-11 13:43:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11555文章數(shù) 117026關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

貴州400余名村民被困在"危山"之下:雨季來了只能等死

頭條要聞

貴州400余名村民被困在"危山"之下:雨季來了只能等死

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經(jīng)要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

親子
藝術(shù)
健康
公開課
軍事航空

親子要聞

碳板跑鞋又貴,又有害健康,但為什么小孩哥都這么喜歡?

藝術(shù)要聞

17位當(dāng)代青年畫家油畫欣賞

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進(jìn)入關(guān)懷版