国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

這家中國企業(yè)用實時互動技術叩開 OpenAI 大門

0
分享至

前幾天,在AI產品經理大會上,聲網對話式AI產品的負責人姚光華,被很多人圍住了。

原因是他在大會上分享了聲網去年與OpenAI合作推出全球首個Realtime API背后的故事,大家都很好奇OpenAI為啥會選聲網。

我研究了一下,原來OpenAI很早就公布了3家語音API合作者:Agora、LiveKit、Twilio。

其中,Agora是聲網在美國的兄弟公司,也是OpenAI長期深度的合作伙伴。


據(jù)說當時OpenAI找過不少候選方。有技術更強的實驗室,也有規(guī)模大的云廠商。但它們都有明顯短板。

實驗室技術行,可沒什么商業(yè)化落地經驗,扛不住真實場景的高并發(fā)。

云廠商的RTE服務大多是“附帶業(yè)務”,沒把這當核心方向發(fā)力。

聲網的優(yōu)勢剛好在這里。

成立于2014年的聲網,已經在RTE領域深耕11年,早就在真實場景里受過考驗。

比如之前幫新東方扛過百萬師生同時上網課的流量峰值,還幫重慶120做過急救視頻會診的穩(wěn)定支撐。

這種“能扛高并發(fā)、經得住實戰(zhàn)”的穩(wěn)定性,正是OpenAI最需要的。只是交互的對象從人與人之間變成了人與 AI。

01. OpenAI Realtime API 與聲網的結合

OpenAI 自從推出 GPT-4o 之后,一直在推動模型語音交互能力。

GPT-4o 不僅支持文本,新增了音頻和視覺的推理能力,能更快響應音頻輸入,這讓實時語音交互進入到真實可用階段。

在 2024 年 10 月發(fā)布的 Realtime API 中,OpenAI 選擇了 Agora 作為其中一個集成伙伴,這標志著 OpenAI 正試圖把其語言模型的實時語音交互能力推向更廣泛的開發(fā)者生態(tài)。

通過 Agora 的 Conversational AI SDK,開發(fā)者可以在自己的應用里快速構建基于 OpenAI Realtime API 的實時語音交互產品。


解釋一下到底聲網和OpenAI合作了個啥~有幾個重要設計方向值得關注:

首先一個,是真實實時需求。

開發(fā)實時語音對話應用,不能把網絡延遲和語音處理疊加成可預期的抖動。

Agora 提供的底層實時網絡,沒有用普通 HTTP 或 WebSocket 去做請求,是有一套專門針對實時音視頻設計過的協(xié)議和網絡路由,能把延遲和丟包控制在更低水平。

再一個,是全鏈路優(yōu)化。

為了提高真實環(huán)境下的語音交互質量,Agora 的 SDK 里加入了對環(huán)境噪聲抑制和 AI 回聲消除的支持。

這是典型的工程優(yōu)化需求:用戶在街上、辦公室、家庭不同噪音環(huán)境下交互,需要快速把干擾降到可用水平,這樣模型才能接收到清晰輸入,反應才不會出現(xiàn)誤識別。

最后還得有高可擴展性。

這套 SDK 并不鎖定某個模型或一個服務商,開發(fā)者可以根據(jù)具體業(yè)務需求,將 OpenAI Realtime API 作為其中一個模塊接入使用。

通過標準化的調用方式,不同業(yè)務可以復用一套實時通信和語音處理能力。

這一整套解決方案的目標是減少開發(fā)者在實時語音對話這件事上的“自定義環(huán)節(jié)”,讓產品團隊能把更多精力投入在業(yè)務邏輯和產品體驗上,不需要再因為處理底層協(xié)議、丟包重傳、環(huán)境噪音等細節(jié)問題焦頭爛額。


02. 不止OpenAI:國內AI公司也在用聲網

在當下國內的AI產業(yè)中,既有摩爾線程、DeepSeek、MiniMax這樣的明星企業(yè),也有很多像聲網這樣在背后默默提供AI底層技術支撐的企業(yè),搭建起AI產業(yè)的基建,他們也同樣值得敬佩。

想搞懂聲網在AI領域的核心競爭力,看國內合作案例就很直觀。

最近MiniMax在沖刺國內大模型第一股,其實聲網去年就和它合作了。

倆家一起發(fā)布了國內首個Realtime API,2024年10月在RTE 2024實時互聯(lián)網大會上首次亮相。

這個API就是為了提升端到端實時多模態(tài)處理能力,讓延時更低,語音對話更自然。

還有像智譜、商湯等大模型公司,以及國內知名的AI應用/硬件,例如星野、豆神AI、芙崽Fuzozo等,也都在用聲網的對話式AI技術,構建極致的人機交互體驗。


現(xiàn)在AI陪伴、AI伴侶式應用越來越火了,而聲網的底層技術支撐,成了很多AI伴侶機器人規(guī)模化應用的關鍵基礎設施。

像聲網為Fuzozo芙崽提供對話式 AI 引擎,通過低延遲、高穩(wěn)定的實時互動技術實現(xiàn)自然流暢的情感交互。

更早之前,MiniMax、星野、智譜清言,在打造多媒體互動平臺、語音交互體驗的時候,背后的技術支持也是聲網。

可以說,聲網為很先鋒的這批AI公司的核心體驗,提供了很深入、很細致的技術支持。

好比聲網對話式 AI 引擎提供的智能打斷處理技術賦予了智能體、機器人靈活的對話能力,能夠根據(jù)用戶的表達實時調整,極大地提升了交互的適應性與流暢度,告別機械式應答。

硬件、機器人公司的需求,也在聲網的技術服務射程范圍內。

機器人技術初創(chuàng)公司Carbon Origins,就已在通過 Agora的技術以及 OpenAI RealtimeAPI,實現(xiàn)重型設備的無接觸操作,提升操作人員的工作效率。

再比如在兒童智能手表場景里,屏幕本身很小,語音交互成為核心的輸入與反饋方式。

實時語音對話不僅要求聽得清,還需要語義理解準確,這對于設備端的處理能力和網絡調度提出了要求。

聲網在 IoT 端配合大模型能力,構建了一套低延遲語音識別、降噪處理、云端實時推理和混合多模態(tài)輸入的方案,幫助設備廠商在終端產品上實現(xiàn)更自然的語音體驗。

客服、娛樂等場景,也是聲網積累多年的優(yōu)勢領域。

而近年和AI深度結合后,實時互動、場景拓展,帶來了更真正的效果提升。


人和人之間的實時互動和人和 AI 之間的實時對話從本質上有區(qū)別,但考驗底層通信穩(wěn)定性的需求是一致的。

不同的是,前者是數(shù)據(jù)傳輸可靠性要求高,后者在此基礎上還需要對接模型推理和語音識別、合成等模塊。


現(xiàn)在很多人在談 AI 語音時只盯著模型和算法,但對實時性的要求是層層疊加的工程挑戰(zhàn)。聲網的價值正在于它把這些工程難題,做成了對開發(fā)者可復用的能力。

任何產業(yè)的崛起從不是單點的勝利,而是生態(tài)的共榮。當越來越多的中國企業(yè)通過創(chuàng)新在世界的舞臺上閃耀,我們才能在全球AI的浪潮中勇立潮頭。

03. 從實時音視頻到對話式交互:聲網的技術積累

聲網從最早做實時音視頻切入市場。過去十年,它積累了全球實時互動的基礎設施能力,規(guī)模和影響力已經非常明顯。

在教育、遠程辦公、娛樂直播、社交互動等領域,實時互動技術是基礎設施級別的能力。

這種技術看上去很靠底層,但實際上涉及非常多復雜工程問題。

不同國家、不同運營商的網絡環(huán)境差異很大,移動網絡的丟包、抖動、本地終端性能的不同,都對實時通信提出了極高要求。聲網在這部分積累的經驗,成為它進入 AI 實時互動的最大基礎。

到 2025 年10月,聲網的年度服務時長已經突破1 萬億分鐘級別,這說明有大量應用在背后持續(xù)使用它的實時能力。


一個技術在實驗室能跑,跟在全球真實網絡條件下跑是完全不同的兩個世界。

一個跑一兩百次請求成功,很容易;要在數(shù)千個物理節(jié)點和數(shù)百萬用戶并發(fā)訪問下保持穩(wěn)定,需要的設計和工程迭代完全不是一丁點功夫。

這也是為什么 OpenAI 在全球范圍內尋找能夠支持 Realtime API 的合作伙伴時,會最終把 Agora 納入清單的一部分原因。


Agora 的實時網絡覆蓋范圍廣,存在多年的運營經驗、本地網絡調度優(yōu)化能力,已被全球眾多開發(fā)者在實際商業(yè)場景中驗證過。

在網絡層、音頻處理和實時路由上,聲網有一套完整的解決方案,能縮短端到端的延遲,提升語音識別準確率和穩(wěn)定性。

對企業(yè)和開發(fā)者的吸引力在于,不僅能讓開發(fā)者更快交付產品,還在實際復雜使用場景下表現(xiàn)更可靠。


有幾個我非常喜歡的功能,也是聲網的技術亮點,在實現(xiàn)人和AI 智能體的自然交互表現(xiàn)很突出:

  • 自動問候:確保實時感知會話狀態(tài),并提供自然、友好的初始交互體驗。

  • 混合模態(tài)交互:支持在單個交互會話內,實現(xiàn)語音與文本輸入的無縫切換。

  • 靈活的話輪檢測選項:為開發(fā)者提供對對話流程和話輪轉換行為的精細化控制。

  • 無中斷輸入:通過選擇性注意力鎖定技術,可過濾環(huán)境噪音與干擾語音,確保交互過程不中斷。

這套方案不僅能簡化Realtime API的應用流程,還能為多模態(tài) AI 智能體解鎖全新功能與應用場景。

將 OpenAI的實時語言模型與聲網的全球實時網絡基礎設施(SD-RTN)及定制化開發(fā)者工具包相結合后,開發(fā)者既能縮短產品上市時間、簡化應用開發(fā)流程,又能交付更優(yōu)質的實時對話式 AI 體驗。

04. 技術提供者與生態(tài)構建者的角色

今天的 AI 技術發(fā)展已經進入一個新的階段,從單一模型能力向產品生態(tài)擴展推進。

開發(fā)者關注的不只是模型本身,還關注用戶是什么時間、在什么場景、以什么形式和模型互動。

聲網所處的位置,恰恰是核心基礎設施。

它長期積累的實時網絡能力、弱網適配、跨平臺支持、SDK 開發(fā)套件等,讓大規(guī)模實時互動成為可能。

不只是與 OpenAI 合作,現(xiàn)在,聲網支撐的實時互動覆蓋超過 200 多個國家和地區(qū),月服務分鐘數(shù)已經達到了700億。

IDC 的市場數(shù)據(jù)還表明,在中國實時音視頻市場,聲網的份額持續(xù)保持著領先。

這種基礎設施級別的能力,不會因為模型更新而消失,它會隨著 AI 越來越多落地行業(yè)而變得更重要。

也許在2026年,隨著AI應用/硬件的規(guī)?;涞?/strong>,AI行業(yè)的聚光燈,將真正打在聲網這樣的「幕后英雄」身上。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
人到中年最大的劫是什么?網友:突然的清醒,讓人無所適從

人到中年最大的劫是什么?網友:突然的清醒,讓人無所適從

夜深愛雜談
2026-02-18 21:07:38
對手太強了!iPhone 17 Pro 已經跌出性能排行前十

對手太強了!iPhone 17 Pro 已經跌出性能排行前十

XCiOS俱樂部
2026-04-08 14:57:36
浙江隊為何要內部重罰米特里策?球迷直言不理解,已公開聲援球員

浙江隊為何要內部重罰米特里策?球迷直言不理解,已公開聲援球員

懂個球
2026-04-09 23:43:59
講個恐怖的事:廣州樓市,近一半都是外地客

講個恐怖的事:廣州樓市,近一半都是外地客

廣州PLUS
2026-04-09 20:02:41
百萬年薪不要了!券商女首席突然辭職去學佛

百萬年薪不要了!券商女首席突然辭職去學佛

毯叔盤錢
2026-03-07 09:22:05
福建長汀車輛墜河事件,家人透露更多細節(jié),女司機經常開車

福建長汀車輛墜河事件,家人透露更多細節(jié),女司機經常開車

魔都姐姐雜談
2026-04-09 06:39:48
4月起!有這3類病的,快去社區(qū)領證,一年少花幾千藥費!

4月起!有這3類病的,快去社區(qū)領證,一年少花幾千藥費!

三農老歷
2026-04-09 03:18:29
1950 年川農婦報案,劈柴丈夫竟是失蹤國軍中將王凌云

1950 年川農婦報案,劈柴丈夫竟是失蹤國軍中將王凌云

嘮叨說歷史
2026-01-21 16:28:08
中國做到了!西方終于改口承認:中的實力已無需再向世界多做證明

中國做到了!西方終于改口承認:中的實力已無需再向世界多做證明

陌上桃花開的
2026-04-06 12:50:46
帶女兒去祭拜去世的丈夫,她指著遺像說:爸爸昨晚還在書房加班呢

帶女兒去祭拜去世的丈夫,她指著遺像說:爸爸昨晚還在書房加班呢

紙鳶奇譚
2026-04-09 16:59:34
萬沒想到!清明后掉價“最猛”的5種商品,豬肉竟然還在其中

萬沒想到!清明后掉價“最猛”的5種商品,豬肉竟然還在其中

神牛
2026-04-09 15:31:52
老山戰(zhàn)役敵人有多頑強?越戰(zhàn)老兵回憶:很多越軍尸體都是戰(zhàn)斗姿勢

老山戰(zhàn)役敵人有多頑強?越戰(zhàn)老兵回憶:很多越軍尸體都是戰(zhàn)斗姿勢

興趣知識
2026-03-25 12:34:08
評論|如何看待樊振東“自愿放棄”背后的輿論喧嘩

評論|如何看待樊振東“自愿放棄”背后的輿論喧嘩

澎湃新聞
2026-04-09 10:02:27
國家一旦禁了游戲,整個社會立馬亂套

國家一旦禁了游戲,整個社會立馬亂套

街機時代
2026-04-08 10:00:03
今春最時髦的混搭方式:“裙子+運動鞋”,時髦優(yōu)雅又高級,好美

今春最時髦的混搭方式:“裙子+運動鞋”,時髦優(yōu)雅又高級,好美

時尚穿搭生活館
2026-04-09 11:24:32
左宗棠60歲抬棺西征,見孩童在井邊玩泥巴,他下令:把這口井填了

左宗棠60歲抬棺西征,見孩童在井邊玩泥巴,他下令:把這口井填了

不易一字
2025-11-18 14:27:05
美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

別讓往昔的悲傷和對未來的恐懼
2026-04-09 00:05:19
集體跑路!伊朗狂攬400億,法國帶頭交錢,美國慘遭全球孤立!

集體跑路!伊朗狂攬400億,法國帶頭交錢,美國慘遭全球孤立!

觸摸史跡
2026-04-09 02:21:13
那些科學無法解釋的玄妙事,藏著最深的溫情!

那些科學無法解釋的玄妙事,藏著最深的溫情!

夜深愛雜談
2026-02-16 22:38:32
楊瀚森DNP!文班缺席馬刺6人上雙滅開拓者 ??怂?5分阿夫29+6+6

楊瀚森DNP!文班缺席馬刺6人上雙滅開拓者 ??怂?5分阿夫29+6+6

醉臥浮生
2026-04-09 11:59:25
2026-04-10 03:27:00
AI異類 incentive-icons
AI異類
從硅谷到中關村,AI信息與測評
148文章數(shù) 6關注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

以色列總理:同意與黎巴嫩直接談判

頭條要聞

以色列總理:同意與黎巴嫩直接談判

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場上

娛樂要聞

金莎官宣結婚 與老公孫丞瀟相差18歲

財經要聞

?;鹩謶伊?,最糟糕的情況要來了?

汽車要聞

文飛掌舵,給神行者帶來了什么?

態(tài)度原創(chuàng)

藝術
教育
時尚
親子
公開課

藝術要聞

戰(zhàn)亂中趕工?阿聯(lián)酋首個賭場度假村?,明年建成!

教育要聞

一年英碩是父母給你另一張地圖的體驗卡!

越來越流行的松弛感穿搭,照著穿就很好看

親子要聞

五個月的寶寶必須學溫伯格的宇宙學才不哭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版