国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【GET2025】與愛為舞王琳:愛與AI幫助每個人成為更好的自己

0
分享至


與愛為舞聯(lián)合創(chuàng)始人王琳 在GET2025教育科技大會上演講

11月17日至18日,芥末堆在北京舉辦以“教育有AI,學(xué)習(xí)無界”為主題的GET2025教育科技大會。與愛為舞聯(lián)合創(chuàng)始人王琳就《從單向輸出,到萬人互動—“愛學(xué)”的AI落地實踐》進行了主題分享。這是與愛為舞成立兩年多以來,第一次在GET大會上正式亮相,因此這次分享也吸引了業(yè)內(nèi)很多從業(yè)者和媒體的關(guān)注。王琳通過拆解一個好的AI老師所需要的必要條件,對與愛為舞的產(chǎn)品以及大模型、數(shù)字人、語音等技術(shù)進展做了介紹,同時也分享了在AI應(yīng)用的創(chuàng)業(yè)過程中的一些底層思考。

以下為演講實錄,經(jīng)編輯:

大家好,今天我分享的主題叫從單向輸出到萬人互動:愛學(xué)的AI落地實踐。

首先給大家介紹一下公司的情況,與愛為舞是一個剛成立兩年多的新公司。從公司成立第一天開始,就有很多朋友去問我們?yōu)槭裁唇信c愛為舞。這里最主要有兩層含義:

第一,教育的本質(zhì)是愛,而公司在剛成立的最早期,定下的價值觀,就是愛自己,愛伙伴,愛世界。

第二,愛是AI的諧音,我們希望AI能夠協(xié)助教育,同時也希望我們是一個人文跟科技結(jié)合的公司。公司在2023年5月份成立,現(xiàn)在已經(jīng)在北京和上海有研發(fā)中心,我們希望通過AI技術(shù)探索出一些教育的新范式,這就是我們公司成立的背景。



我們成立的初心是希望人人都有一個適合自己的AI老師。這個AI老師能夠去了解每一個學(xué)生的興趣,根據(jù)每一個學(xué)生的優(yōu)點和不足因材施教,可以24小時在線、即時響應(yīng)。此外,我們希望AI老師能夠讓千家萬戶更多孩子用到,他的成本比現(xiàn)在一對一的成本降低一個數(shù)量級甚至更多。最后我們希望這個老師不僅傳授知識,更重要的是全方位的幫助學(xué)生,做到終身陪伴。這就是我們創(chuàng)業(yè)的初心。



這個初心在我們創(chuàng)業(yè)第一天就建立了,過去的兩年多時間,我們一直在為這個初心努力。接下來給大家介紹一下,與愛為舞所推出的產(chǎn)品。

如何創(chuàng)造一個好的AI老師

首先我們來思考一下,一個好老師,需要哪些能力:



第一,好老師首先需要有專業(yè)的教學(xué)能力。他能夠掌握名師講法,把知識點清晰的講出來,同時可以針對學(xué)生的問題做出合理回復(fù),并實現(xiàn)個性化教學(xué),針對不同的學(xué)生有不同的講解方法。因此我們做了自己的大模型。

第二,好老師需要有非常親切的、有真人感的形象。因此,我們組建了數(shù)字人團隊,研發(fā)實時交互的數(shù)字人,可以精準復(fù)刻名師形象,做到低延時互動。

第三,好老師需要有表現(xiàn)力的聲音。他能夠識別學(xué)生的說話,并指導(dǎo)學(xué)生成長,我們也做了語音識別模型和語音合成模型。

第四,我們希望產(chǎn)品可以走進千家萬戶。因此在AI工程上做了大量優(yōu)化,可以支持幾萬人同時在線并發(fā),做到低延時。

接下來給大家看一個真實的初中課程的場景。



簡單總結(jié)一下,這個場景有四個特點,第一,有專業(yè)的名師講法,不能照本宣科講題目,而是有豐富的講課經(jīng)驗和技巧;第二,可以在關(guān)鍵點上和學(xué)生互動,引導(dǎo)學(xué)生問出關(guān)鍵問題,檢測到學(xué)生是不是回答對關(guān)鍵問題,學(xué)生自己答對才有效果;第三,要能夠接住學(xué)生各種各樣個性化問題,并能做好承接;第四,老師無論從形象到聲音,到說話的口頭禪,都是比較像真人的。

為什么我們要做這么一個AI教學(xué)產(chǎn)品,為什么要這么設(shè)計互動?最主要思考是我們認為,在教學(xué)場景中,高質(zhì)量的一對一互動,是能夠很好的拉回學(xué)生的注意力,只有拉回學(xué)生注意力,完成互動,才可以讓學(xué)生得到學(xué)習(xí)效果的提升。



我們可以看到這幾張圖中,傳統(tǒng)的在線大班課程里,老師和學(xué)生的互動是比較少的。而在我們場景中,一個小時老師會和學(xué)生有40多次互動,過程中老師會知道學(xué)生關(guān)鍵點掌握沒有,同時也通過一步一步引導(dǎo),讓學(xué)生把正確答案說出來。這是提升我們教學(xué)效果非常關(guān)鍵的一點。

從數(shù)據(jù)中可以看到,當(dāng)老師第一次問學(xué)生問題的時候,有59%的學(xué)生可以答對,當(dāng)他一步一步引導(dǎo),跟學(xué)生多輪交流后,最終可以達到83%的準確率。這24%的準確率的提升,就是AI一對一的互動帶來的。除了準確率,我們的有效聽課率也得到了相應(yīng)提升。

為了實現(xiàn)AI老師,我們在技術(shù)上出了非常多的工作,也有一些突破。首先,為了讓AI老師有很好的教學(xué)效果,我們自研了講課Agent,它可以讓AI老師完整的引導(dǎo)學(xué)生完成一節(jié)課的復(fù)雜講解。無論學(xué)生順著你回答,還是不順著你回答,都能夠保證一兩個小時課程完整講下來,這是非常關(guān)鍵的。我們還實現(xiàn)了多個維度個性化,包括內(nèi)容、交互方式和講法的個性化,最終,希望每個學(xué)生都有不一樣的體驗。

除了在算法上的優(yōu)化,還有一個非常重要的工作,就是在AI工程上,公司投入非常多。我們未來需要給幾萬、幾十萬甚至更多人提供服務(wù),每個人都是面對一個獨立的AI老師,這個和大班課場景不一樣,每一個人要實時跟AI老師做語音、視頻、和大模型的互動,如果延時、成本不做優(yōu)化是不可接受的。我們在過去半年中,把單位學(xué)生的成本下降了一個數(shù)量級,也通過多個手段的端到端優(yōu)化,大幅降低了學(xué)生延時。

自研數(shù)字人技術(shù)

有了大模型,AI老師就有了智慧的大腦,接下來我們希望AI老師能夠有一個親切的形象,因此我們在數(shù)字人技術(shù)上投入非常多。為什么我們需要在數(shù)字人場景做很多自研模型?



因為在教育場景中,對數(shù)字人是有非常高的要求,最主要有兩點:第一,我們要做實時互動的數(shù)字人。數(shù)字人的技術(shù)在做實時互動和離線生產(chǎn)視頻兩個場景的挑戰(zhàn)是不一樣的,即使是在實時互動里面,教育場景對實時性也要求非常高。例如我們在看一些直播的數(shù)字人,晚幾秒鐘回復(fù)也沒有什么,但是教育場景數(shù)字人必須秒級回復(fù),如果數(shù)字人不及時回復(fù),體驗是非常差的。第二,教學(xué)場景下對老師的口型、面部、肢體動作的一致性要求非常高。一旦沒有做好一致性,對學(xué)生體驗就有很大影響。因此,我們在以下幾個維度進行了數(shù)字人研發(fā)。

第一是口型和面部同步,視頻中下面一排是真實美國新聞的播音視頻,上面是兩張照片,我們通過新聞的音頻驅(qū)動照片,使之實時生成數(shù)字人。

有了口型和面部控制之后,我們還希望數(shù)字人有更好的表現(xiàn)力,可以加上肢體動作。在部分場景,我們需要老師拍攝素材,第一批拍攝完之后,隔了幾個月或者半年,我們又希望能夠加入一些新的動作,這個時候就會出現(xiàn)比較大的問題。

第一是老師可能不太方便拍攝,第二是老師在幾個月后或者半年后,即使想拍攝,他的形象和狀態(tài),跟幾個月前也不一樣,同一個人即使一周后和一周前的拍攝狀態(tài)都不一樣,這種情況就無法生成一模一樣的數(shù)字人。因此我們創(chuàng)新性的做了跨ID的動作生成,用第三方來做動作,通過骨骼重定向的方向來驅(qū)使原來的數(shù)字人,就可以給原來的數(shù)字人加一些新的動作。有了肢體動作之后,我們下一步希望做到360度沉浸的數(shù)字人,希望在未來課堂上的老師,真的能夠走出三分屏,走到學(xué)生面前,實現(xiàn)一個沉浸式的互動。



今年我們也把一些核心的技術(shù)進行了公開發(fā)表,在全球AI頂會IJCAI上發(fā)表語音驅(qū)動的數(shù)字人論文,同時在今年的9月1日跟央視合作,把左權(quán)將軍照片復(fù)原,并做出一個敬禮的動作。

教育場景的語音技術(shù)

我們在語音技術(shù)上也做了一些深入的工作,大家可能會問,語音的技術(shù)在過去一段時間已經(jīng)發(fā)展的非常好,業(yè)界也有非常多頂尖的語音提供商,什么我們要在語音上花費這么大精力?因為在教學(xué)過程中語音跟業(yè)務(wù)場景是非常緊密結(jié)合的,具體有幾個原因:

第一,我們的學(xué)生有很多低齡的,隨時可能說出兩三個字,這對語音識別的挑戰(zhàn)是非常大的。比如我現(xiàn)在在講話,我的講話是連貫的,有很多上下文,語音識別會很好理解。但是如果隨時隨地出來兩三個字,甚至有一些咬舌音等單音素的發(fā)音,對語音識別挑戰(zhàn)是非常大的。

第二,學(xué)生上課場景,可能有噪音,或者多人聲音的干擾。在剛開始快速啟動的時候,我們使用了第三方的語音識別技術(shù),但隨著我們用戶量增大,我們發(fā)現(xiàn)語音識別準確率有一些瓶頸,第三方技術(shù)有20%的錯誤率。

這意味著什么呢?當(dāng)學(xué)生說100個句子,有20句是錯誤的,這是不可接受的。因此我們把多模態(tài)理解引入到ASR模型中,同時加入了強化學(xué)習(xí),讓模型可以持續(xù)做自我進化。最終我們在真實場景中,把語音識別的準確率,從80%多提升到95%,這樣學(xué)生會得到比較好的體驗。



我們在語音降噪和聲紋分離上也做了一些工作。真實的上課中,很多學(xué)生有背景噪音,在做識別的時候容易出現(xiàn)問題,如果我們用開源的降噪的技術(shù),容易在降噪的同時把原來的聲音做變形或者掩蓋,特別是對孩子的聲音影響較大,略微的聲音變化就會造成識別錯誤。所以我們自研了降噪的模型,可以做到在降噪的同時把童聲精準還原。

除語音識別之外,我們在語音合成上,自研了基于多Token融合的TTS大模型,基于上萬小時的語音數(shù)據(jù)做重新預(yù)訓(xùn)練,而且除了建模語意相關(guān)的信息,還能夠建模非常細粒度聲學(xué)信息,包括老師的停頓、呼吸等,這樣可以去盡可能提升模型的表現(xiàn)力,同時,我們還實現(xiàn)了多情感表達,讓老師在不同場景下有不同的情感表現(xiàn),實現(xiàn)教學(xué)的個性化。最后,我們也在算法和工程上也做了很多聯(lián)合的優(yōu)化。



為什么我們要在語音合成上做這么多細節(jié),一個很重要的原因是,當(dāng)我們?nèi)巳ヂ爭资?、一兩分鐘的說話時,可能聽不出來聲音的好壞,或者都差不多。但是學(xué)生需要面對一個老師,他要聽一兩個小時,未來要聽幾十、上百個小時,老師的表現(xiàn)力、抑揚頓挫對講課非常關(guān)鍵,否則學(xué)生很容易感覺到疲憊。

以上就是我們在大模型、語音、數(shù)字人方面的一些進展,有了這些工作之后,我們還想問自己一個問題,我們的AI老師,到底能不能給學(xué)生帶來真實的價值,能不能教會學(xué)生,我們也跟蹤了上課的學(xué)生,記錄了這些學(xué)生的變化。一開始這些學(xué)生不會自然拼讀,經(jīng)過一段時間學(xué)習(xí)之后,他們可以直接拼讀一些高級的詞匯,有了很大的進步。

這給了我們非常大的激勵,以及去持續(xù)優(yōu)化的動力。未來希望我們的產(chǎn)品,能夠是一個終身陪伴的AI產(chǎn)品。在幼兒語音啟蒙、青少年思維提升、成年職場以及老年反詐上,希望能夠陪伴全年齡段的人終身學(xué)習(xí)進步。

AI應(yīng)用創(chuàng)業(yè)思考

以上我們的產(chǎn)品跟技術(shù)的介紹。今天也跟大家分享一下我們公司在過去兩年多,在創(chuàng)業(yè)過程中有一些簡單的沉淀和思考。



剛才我講了很多的技術(shù),我自己負責(zé)技術(shù)研發(fā)。在技術(shù)上核心是兩個點:

第一,我們不要去在一些非常通用的技術(shù)上跟大廠比拼,或者跟大廠卷一些通用指標。我們更應(yīng)該做好業(yè)務(wù)問題的定義,要做與業(yè)務(wù)結(jié)合最好的技術(shù)。我們要持續(xù)的思考,在什么點上你的業(yè)務(wù)需要突破,在什么能力上,你必須要自研技術(shù),在什么能力上你是可以用第三方的。

在大模型方面,有很多創(chuàng)業(yè)公司,有公司用開源大模型可以用得很好,有的公司做自研大模型也很好。我們?nèi)绻鲎匝心P鸵肭宄槭裁匆?,它能提升什么點,同時要做好全面測評,你都不能測評一個指標,你也很難優(yōu)化它。

我們也建議重視AI工程,未來工程和算法需要聯(lián)合一塊優(yōu)化,我們有很多工作都是工程和算法聯(lián)合優(yōu)化的。

另外,我們可以讓產(chǎn)品盡早上線,這樣可以收集到用戶的真實反饋,通過數(shù)據(jù)驅(qū)動的方式去優(yōu)化,并盡早開始構(gòu)建數(shù)據(jù)飛輪。

第二,我們要堅定的相信技術(shù)的發(fā)展,提前為技術(shù)的成熟做準備。剛才主持人也說,20年前有一本書《奇點臨近》講了一個觀點,就是技術(shù)的發(fā)展是指數(shù)級的,早期的技術(shù)發(fā)展非常緩慢,一旦突破奇點的時候,技術(shù)會快速發(fā)展。人類二十世紀一百年的技術(shù)成就超過了之前2000年所有技術(shù)的成就,而這些成就在二十一世紀只需要25年的時間。所以我們往往以為要很多年才會成熟的技術(shù),會經(jīng)常大幅度超出我們預(yù)期更早的實現(xiàn),我們要相信很多技術(shù)快于想象,并站在這個假設(shè)上,來做很多業(yè)務(wù)決策。



關(guān)于組織,我們的公司非常重視企業(yè)文化和人才密度,我自己也花了大量精力吸引行業(yè)里面頂尖的人才。一個公司的發(fā)展,當(dāng)你不確定他的業(yè)務(wù)怎么樣的時候,你只需要看一點,看這個公司是否有源源不斷的優(yōu)秀人才能夠流入,這一點非常關(guān)鍵,在過去幾個時代一直被驗證。比如在PC互聯(lián)網(wǎng)時代, 2005-2013年全球很多優(yōu)秀人才去了百度,那個時候百度一度成為中國最大的互聯(lián)網(wǎng)公司;之后移動互聯(lián)網(wǎng)時代,大量的優(yōu)秀人才去騰訊,去阿里,他們也一度成為中國最大的互聯(lián)網(wǎng)公司。之后大量人才去字節(jié),它也成長為最優(yōu)秀的公司之一?,F(xiàn)在在美國硅谷,大量人才去OpenAI、Anthropic等全球最頂尖的AI公司,他們的發(fā)展也非??臁?strong>我們要用組織的確定性來對抗未來創(chuàng)業(yè)的不確定性,創(chuàng)業(yè)會面臨很多困難,這個時候有一個優(yōu)秀的組織,可以保證在很多事情上做得更好。

同時,我們做事也要首先考慮AI能不能做,把硅基生命當(dāng)成組織的必要成員,把人機協(xié)同作為工作的基本范式,很多事情需要AI和人一塊來做。我們需要組織里面的每個人都要能夠站在未來看現(xiàn)在,否則的話,不換腦子就換人。



最后,我覺得這一屆GET大會有非常好的主題:教育有AI,這也非常契合的是我們公司的使命,愛與AI幫助每個人成為更好的自己。我們希望通過大模型技術(shù),用一個智慧的大腦來實現(xiàn)因材施教;通過數(shù)字人技術(shù),用一個親切的指導(dǎo)提升學(xué)生的自信;通過語音的技術(shù),用一個溫暖的聲音激勵學(xué)生成長;通過工程的技術(shù),用一套的堅固系統(tǒng)為學(xué)生保駕護航。

我們的產(chǎn)品過去幾個月上線以來,收到了大家很多的反饋、建議以及批評,在這里非常感謝大家,我們會不高估短期收益,不低估長期積累,繼續(xù)樂觀而堅定走下去,也希望和大家一塊加油,謝謝大家!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
一位兩袖清風(fēng)的領(lǐng)袖,是如何用二十年搞垮一個發(fā)達國家

一位兩袖清風(fēng)的領(lǐng)袖,是如何用二十年搞垮一個發(fā)達國家

馬探解說體育
2025-12-25 16:23:47
羽球決出2席4強!國羽小將1輪游,衛(wèi)冕冠軍反敗為勝,石宇奇登場

羽球決出2席4強!國羽小將1輪游,衛(wèi)冕冠軍反敗為勝,石宇奇登場

劉姚堯的文字城堡
2025-12-26 21:43:48
冷冷冷!東莞還要冷到什么時候?!

冷冷冷!東莞還要冷到什么時候?!

東莞紀實
2025-12-26 17:30:35
50歲中年阿姨穿衣風(fēng)格,會不會太保守

50歲中年阿姨穿衣風(fēng)格,會不會太保守

深海的秘密
2025-12-17 07:41:34
12月26日俄烏:俄羅斯批評美國軟弱,堅持索要“整個頓巴斯”

12月26日俄烏:俄羅斯批評美國軟弱,堅持索要“整個頓巴斯”

山河路口
2025-12-26 17:50:49
球員身價2025排行榜!18歲亞馬爾登頂,皇馬10人躋身前100

球員身價2025排行榜!18歲亞馬爾登頂,皇馬10人躋身前100

奧拜爾
2025-12-26 21:35:25
斯諾克賽程:決出4強,排名賽新王PK退役選手,2大世界冠軍會師?

斯諾克賽程:決出4強,排名賽新王PK退役選手,2大世界冠軍會師?

劉姚堯的文字城堡
2025-12-26 06:47:54
中國的船和油,美國全都要!24小時內(nèi),中委兩國在安理會火力全開

中國的船和油,美國全都要!24小時內(nèi),中委兩國在安理會火力全開

天氣觀察站
2025-12-27 00:49:48
人老了有5個特征,說明你命好得不得了!占上一個都能偷著樂!

人老了有5個特征,說明你命好得不得了!占上一個都能偷著樂!

淡淡稻花香s
2025-12-26 18:34:02
“玻璃全部被砸碎,和女兒躲在門后不敢發(fā)聲!”上海一夫妻多次持斧子逐戶砍門,持續(xù)近十年!均患精神疾病

“玻璃全部被砸碎,和女兒躲在門后不敢發(fā)聲!”上海一夫妻多次持斧子逐戶砍門,持續(xù)近十年!均患精神疾病

大風(fēng)新聞
2025-12-26 10:39:02
韋瑟斯龐28分青島終結(jié)山西4連勝 王睿澤19分迪亞洛22+4+4

韋瑟斯龐28分青島終結(jié)山西4連勝 王睿澤19分迪亞洛22+4+4

醉臥浮生
2025-12-26 21:33:19
79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長得像父親“翻版”

79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長得像父親“翻版”

小熊侃史
2025-12-20 10:56:45
清倉3.4億,陳小群砸盤它了!

清倉3.4億,陳小群砸盤它了!

風(fēng)風(fēng)順
2025-12-27 00:00:03
中國人壽保險(集團)公司原黨委書記、總裁楊超被開除黨籍

中國人壽保險(集團)公司原黨委書記、總裁楊超被開除黨籍

新京報
2025-12-26 17:03:47
別大意!長期戴口罩,這7種不適正在悄悄傷害你

別大意!長期戴口罩,這7種不適正在悄悄傷害你

孟大夫之家1
2025-12-25 11:57:04
A股:財政部、發(fā)改委重磅發(fā)聲!市場突然突然跳水,調(diào)整開始了?

A股:財政部、發(fā)改委重磅發(fā)聲!市場突然突然跳水,調(diào)整開始了?

深析古今
2025-12-26 12:00:54
我國超2億人有頸動脈斑塊!研究證實:斑塊可以消退!有4點建議

我國超2億人有頸動脈斑塊!研究證實:斑塊可以消退!有4點建議

展望云霄
2025-12-23 21:03:05
翁同龢后人寧把183件珍貴文物捐給美國博物館

翁同龢后人寧把183件珍貴文物捐給美國博物館

難得君
2025-12-26 07:56:50
地產(chǎn)老板,集體隱身香港

地產(chǎn)老板,集體隱身香港

鴻樓夢plus
2025-12-26 10:34:20
絕不回頭!洪都拉斯女總統(tǒng)霸氣放話:明年準時交權(quán),不給美國擦鞋

絕不回頭!洪都拉斯女總統(tǒng)霸氣放話:明年準時交權(quán),不給美國擦鞋

知法而形
2025-12-26 09:35:18
2025-12-27 04:23:00
芥末堆看教育 incentive-icons
芥末堆看教育
面向教育行業(yè)的專業(yè)新媒體
28234文章數(shù) 78205關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

旅游
親子
房產(chǎn)
公開課
軍事航空

旅游要聞

桂林冬日必沖!紅杉映水如油畫,免費打卡還出片

親子要聞

為什么買好衣服給孩子是個大坑?你絕對想不到!

房產(chǎn)要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進入關(guān)懷版