国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

小米語音首席科學(xué)家:AI發(fā)展的本質(zhì)像生物進(jìn)化,不開源要慢1000倍

0
分享至

  • 編輯部 整理自 MEET2026
    量子位 | 公眾號(hào) QbitAI

從生物進(jìn)化的漫長歷程到AI技術(shù)的瘋狂迭代,兩者遵循著驚人相似的底層邏輯。

在探尋下一代AI架構(gòu)的關(guān)鍵時(shí)刻,著名的“Kaldi之父”、小米集團(tuán)首席語音科學(xué)家、IEEE FellowDaniel Povey提出:

  • 就像生物進(jìn)化一樣, AI“配方”的設(shè)計(jì)本質(zhì)上就是一個(gè)不斷試錯(cuò)的過程,而進(jìn)化的速度,取決于“復(fù)制”一個(gè)新想法所需的時(shí)間。

在本次量子位MEET2026智能未來大會(huì)上,他也將開源視為AI進(jìn)化的核心加速器——

若沒有開源,行業(yè)的進(jìn)化速度恐怕要慢上一千倍;正是因?yàn)橛辛碎_源,技術(shù)才能像生物適應(yīng)新環(huán)境一樣,經(jīng)歷“長期停滯+瞬間爆發(fā)”的非線性躍遷。



至于如何在未來的競爭中生存,在他看來,大公司最明智的策略是“兩條腿走路”——

一邊利用Transformer賦能當(dāng)下的產(chǎn)品,一邊保留資源探索未知,賭中下一個(gè)顛覆世界的機(jī)會(huì)。

為了完整體現(xiàn)Daniel Povey的思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)演講內(nèi)容進(jìn)行了翻譯和編輯整理,希望能給你帶來更多啟發(fā)。

MEET2026智能未來大會(huì)是由量子位主辦的行業(yè)峰會(huì),近30位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。

核心觀點(diǎn)梳理
  • AI的演進(jìn)和自然界生物的進(jìn)化過程非常相似,通過嘗試不同的技術(shù)變體,然后篩選出在目標(biāo)任務(wù)上表現(xiàn)更優(yōu)的方案;
  • 類比生物進(jìn)化中的“間斷平衡”,AI的發(fā)展并非連續(xù),而是“長期停滯+突然躍遷”,停滯期也不會(huì)永遠(yuǎn)持續(xù);
  • 開源對(duì)進(jìn)化速度至關(guān)重要,如果每家公司都閉源,那么研究速度可能會(huì)降低為原來的千分之一;
  • 不要押注單一任務(wù)或單一路線,在進(jìn)化過程中找到AI“通才”與“專才”的平衡,保留多種不同模型架構(gòu)的存續(xù),從而增加發(fā)掘?qū)嵱眯录夹g(shù)的機(jī)會(huì);
  • 大公司雙管齊下是有意義的,一方面使用當(dāng)前業(yè)界領(lǐng)先的技術(shù)方案,另一方面進(jìn)行探索性研究,以尋找下一個(gè)重大突破。



以下為Daniel Povey演講原文中譯本

像生物進(jìn)化一樣快速試錯(cuò)

大家好,今天我想和大家分享一些關(guān)于“進(jìn)化”和“AI”的思考,以及我們?nèi)绾螐纳镅莼屑橙£P(guān)于AI未來的啟示。我將主要從科研和模型本身的角度解讀這個(gè)問題。

人們?cè)O(shè)計(jì)AI“配方”的過程,本質(zhì)上主要還是一個(gè)不斷試錯(cuò)的過程。

當(dāng)人們有了新的理解,就會(huì)發(fā)表許多富含公式的論文,但其中99%的內(nèi)容都沒什么真正可操作的價(jià)值,最后能落地的通常只是“配方”本身。

所以設(shè)計(jì)AI“配方”的基本流程就是嘗試不同變體,然后篩選出有效的進(jìn)行發(fā)布,別人再照著做。



這其實(shí)和生物進(jìn)化非常相似。

在生物進(jìn)化中,進(jìn)化過程也會(huì)和外部環(huán)境相互影響,例如地球上的進(jìn)化會(huì)受到太陽輻射變化、大氣成分變化的影響,而生命本身也會(huì)反過來影響這些環(huán)境因素,比如改變大氣成分。

AI的進(jìn)化也是如此,可能會(huì)受到硬件、數(shù)據(jù)等資源的限制;同時(shí),AI也會(huì)通過商業(yè)效應(yīng)、群體行為效應(yīng)反作用于這些外部條件。

在歷史上,生物進(jìn)化甚至曾經(jīng)多次“破壞”自身的生存環(huán)境,例如“大氧化事件”(Great Oxygenation Event),不過最終生命又從中恢復(fù)了過來。

(注:大氧化事件是指約26億年前,大氣中的游離氧含量突然增加的事件,其具體原因不明。該事件使地球上礦物的成分發(fā)生了變化,也使得日后動(dòng)物的出現(xiàn)成為了可能。)



生物學(xué)中“世代間隔”(Generation time)類比到AI,就是復(fù)制一個(gè)新想法所需的時(shí)間,通常這個(gè)時(shí)間會(huì)持續(xù)數(shù)個(gè)月。

因?yàn)楫?dāng)你有了新的發(fā)現(xiàn),往往要先寫論文,而且一般是寫完才對(duì)外公開,有些期刊甚至規(guī)定發(fā)表前不能先上傳arXiv之類的預(yù)印本。

過去這樣的周期可能需要大概兩年,但現(xiàn)在可能縮短到了六個(gè)月

現(xiàn)在,有了PyTorch這樣的工具,人們可以近乎完美地復(fù)現(xiàn)他人發(fā)布的“配方”。

當(dāng)然,有時(shí)人們可能只給出了描述(而沒有代碼),這會(huì)使得復(fù)現(xiàn)過程稍慢一些,但整體上,代際周期的長短決定了進(jìn)化的快慢。

就像世代間隔漫長的大型生物,往往進(jìn)化緩慢;而那些能夠快速繁衍的小型生物,進(jìn)化速度則要快得多。



去不同領(lǐng)域?qū)ふ褹I突破口

在自然界的進(jìn)化中,往往存在一種“停停走走”的節(jié)奏,很長一段時(shí)間里幾乎沒有什么動(dòng)靜,隨后突然發(fā)生劇變。

對(duì)于自然界的物種來說,這種變化通常是由遷移到新環(huán)境所導(dǎo)致的;但偶爾,它也源于生命“解鎖”了某種新事物,比如光合作用演化出來時(shí),整個(gè)進(jìn)化的節(jié)奏便迅速發(fā)生了改變。

我從事AI領(lǐng)域大概有30年了,特別是在語音領(lǐng)域,也經(jīng)歷過長時(shí)間沒有太大進(jìn)展的階段,當(dāng)時(shí)我們甚至以為“這就是終點(diǎn)”。

當(dāng)年我們做高斯混合模型、判別式訓(xùn)練時(shí),以為語音識(shí)別的最終形態(tài)就是那樣了,沒人能想象未來的改變。所以也許十年后,也會(huì)出現(xiàn)今天誰都無法想象的全新模型。

AI的發(fā)展中,不同任務(wù)之間的相互作用非常重要,比如視覺領(lǐng)域的新方法,后來可能會(huì)用于語音、語言等任務(wù)。



最近一個(gè)典型例子就是Transformers,它最初是專門為語言模型設(shè)計(jì)的,后來卻在各種任務(wù)中大放異彩。

在進(jìn)化中也是如此,海豚絕無可能僅在海洋里就進(jìn)化成型,因?yàn)樗切┖粑諝獾臋C(jī)能,原本是為了適應(yīng)陸地生活才演化出來的。但當(dāng)它重返海洋后,卻成了最成功的頂級(jí)捕食者。

這說明,有時(shí)候你確實(shí)需要暫時(shí)去做一些截然不同的事情,最終才能在原本的目標(biāo)上取得成功

如果不開源,AI得慢上一千倍

當(dāng)然,拿生物進(jìn)化做類比也有局限性。畢竟我們可以主動(dòng)去理解事物,可以利用數(shù)學(xué)推導(dǎo),或者改進(jìn)可視化和調(diào)試工具,從而加速技術(shù)的發(fā)展。



此外,提速也非常關(guān)鍵。實(shí)驗(yàn)跑得越快,進(jìn)化的迭代就越快,這對(duì)研究價(jià)值巨大。

而在這一點(diǎn)上,開源起到了至關(guān)重要的作用。

如果每家公司都得自己從頭重復(fù)造輪子,研究速度恐怕要慢上一千倍。

我們可以設(shè)想一個(gè)平行世界,如果大公司決定不開源PyTorch,我也沒有開源Kaldi項(xiàng)目,那AI研發(fā)的局面會(huì)很不相同。

不過,不開源在某些行業(yè)確實(shí)是常態(tài),尤其是涉及實(shí)體工程的領(lǐng)域,因?yàn)殚_發(fā)一款工具往往極其昂貴,可能要砸出數(shù)百萬美元,所以沒人會(huì)把他們的模型開源出來。

其實(shí),2012年我之所以離開工業(yè)界,就是因?yàn)檫@個(gè)問題。當(dāng)時(shí)的大公司普遍對(duì)開源都不怎么感冒,所以我轉(zhuǎn)去學(xué)術(shù)界待了一段時(shí)間。

但如今很多公司都開始擁抱開源了,像小米就非常支持我的工作,也支持開源,所以我又回到了工業(yè)界。

尋找Transformer之后的下一個(gè)顛覆者

回到關(guān)于進(jìn)化的比喻,我剛才吐槽過論文中的那些數(shù)學(xué)理論往往不夠具體,沒法落地。那么,我們到底能從中能學(xué)到什么實(shí)實(shí)在在的東西呢?

有一點(diǎn)很關(guān)鍵,那就是我們需要在各種不同的任務(wù)上不斷探索新思路。

因?yàn)樵谶M(jìn)化這件事上,很難預(yù)判哪種生物最終會(huì)勝出。就像嚙齒類動(dòng)物,起初可能只是為了吃竹子種子這種極具體的目的而進(jìn)化的。

但結(jié)果誰曾想,這反而讓它們演化出了一種極強(qiáng)的“通才”式生存能力,最終遍布全球、無所不能。

可在當(dāng)時(shí),誰能想到吃竹子種子這事兒能帶來這么大的突破呢?這種事真的太難預(yù)測(cè)了。

所以說,關(guān)鍵就在于要多嘗試不同的任務(wù),因?yàn)槲覀優(yōu)榱送黄颇硞€(gè)任務(wù)特有限制研發(fā)出的解決方案,可能最后會(huì)被證明具有極高的通用價(jià)值。



我們需要關(guān)注進(jìn)化過程中“通才”與“專才”之間的權(quán)衡,我并非要分出孰優(yōu)孰劣,但是從長遠(yuǎn)來看,不同的進(jìn)化策略能夠適應(yīng)不同的環(huán)境——

如果環(huán)境長期穩(wěn)定,自然界往往會(huì)涌現(xiàn)出大量像熊貓這樣的“專才”,它們雖然只吃一種食物,卻能做到極致適應(yīng);

可一旦環(huán)境變得動(dòng)蕩多變,像老鼠這種適應(yīng)力極強(qiáng)的“通才”往往更具生存優(yōu)勢(shì)。

所以,這兩種生存策略很可能是缺一不可的。

對(duì)于AI而言,我們應(yīng)該讓模型在多個(gè)不同的生態(tài)位里同時(shí)演進(jìn),這就像自然界在不同環(huán)境中進(jìn)行的進(jìn)化一樣。畢竟,每個(gè)物種通常都有其最適應(yīng)的特定生存空間。

如果我們能同時(shí)保留多種不同的技術(shù)路線,說不定其中某一條在經(jīng)過進(jìn)一步打磨后,就能帶來巨大的回報(bào)。但這事兒很難提前預(yù)判,沒人知道眼下哪個(gè)模型會(huì)在未來稱王。

出于同樣的理由,我們也應(yīng)該維持模型架構(gòu)的多樣性。這就像大自然保留了豐富多樣的物種一樣,因?yàn)槲覀兏緹o法確定,到底哪一種架構(gòu)會(huì)孕育出下一輪的重大突破。

在我看來,大多數(shù)大型機(jī)構(gòu)采取兩頭并重的策略是比較明智的——既要沿用像Transformer等當(dāng)前最頂尖的成熟模型,同時(shí)也得投入一些資源去做探索性研究,去尋找下一個(gè)技術(shù)突破口。

在我看來,Transformer這種技術(shù)領(lǐng)域的競爭現(xiàn)狀,就像是“搶椅子”——只要音樂還在響,你就得跟著一直跳。

畢竟在Transformer和LLM依然稱霸的當(dāng)下,任何一家公司都絕無可能把身家性命都押在別的路線上。

但大家心里也都清楚,音樂遲早有停下來的那一天。

所以,小米在LLM上的研究主線很明確,那就是利用SOTA級(jí)別的AI和大模型技術(shù),去全方位賦能我們的“人車家全生態(tài)”。

我個(gè)人其實(shí)并沒有深度參與這些工作,因?yàn)槲液蛨F(tuán)隊(duì)主要負(fù)責(zé)的是探索性研究。我們嘗試了大量不同的方向,就是希望能找到能產(chǎn)生巨大影響的成果,但這事的成功率向來極低。

回首我的整個(gè)研究生涯,嘗試過的點(diǎn)子恐怕得有上萬個(gè)?,F(xiàn)在回頭看,其中有一兩個(gè)如果當(dāng)時(shí)我能推廣得再好一點(diǎn),說不定真能成為顛覆性的技術(shù)。

比如,早在大家連BatchNorm都還沒開始用的時(shí)候,我們組其實(shí)就已經(jīng)設(shè)計(jì)出了一種類似于LayerNorm的歸一化模塊。

但我也不想像Jürgen Schmidhuber那樣說“我在所有人之前發(fā)明了一切”。

(注:Jurgen Schmidhuber是著名計(jì)算機(jī)科學(xué)家、LSTM之父,喜歡在AI領(lǐng)域出現(xiàn)新成果時(shí)發(fā)表文章或評(píng)論,列舉自己上世紀(jì)的論文,表示“這個(gè)東西我?guī)资昵熬桶l(fā)明過了”。)

因?yàn)樽鳛橐幻芯咳藛T,有責(zé)任去判斷哪些是有價(jià)值的想法,并對(duì)其進(jìn)行妥善推廣。如果你沒做到,那就得承認(rèn)是自己的失誤。

言歸正傳,我的團(tuán)隊(duì)目前正在研發(fā)一種針對(duì)語音的新模型架構(gòu),叫Zapformer,是一個(gè)通用聲音基座。

相較于我們?nèi)ツ晖瞥龅腪ipformer而言,Zapformer實(shí)現(xiàn)了三大跨越:

  • 從“人聲”到“萬聲”的跨越:從專注于人聲建模,到成為能同時(shí)理解人聲、環(huán)境音等多元信息的通用聲音基座;
  • 從優(yōu)化結(jié)構(gòu)到創(chuàng)新理論的跨越:通過引入梯度流(Gradient Flow)理論指導(dǎo)模型設(shè)計(jì),在已屬業(yè)界標(biāo)桿的Zipformer基礎(chǔ)上,將語音識(shí)別精度再次顯著提升10%-15%;
  • 從專用優(yōu)化到通用健壯的跨越:為適應(yīng)海量數(shù)據(jù)訓(xùn)練移除了Dropout層,增強(qiáng)了大數(shù)據(jù)擬合能力,同時(shí)將優(yōu)化器升級(jí)為TransformAdam,在保持極速收斂的同時(shí),大幅提升了訓(xùn)練的通用性與穩(wěn)定性。

我不想把話說太滿,說它就是“下一個(gè)大熱門”,但它確實(shí)包含了不少有意思的想法。

當(dāng)然,我們希望能押中下一個(gè)“大殺器”,但這事兒誰也沒法打包票。

所有這些成果全都是開源的,因?yàn)槲沂情_源的堅(jiān)定信徒。除了我的項(xiàng)目,小米還有很多其他的開源項(xiàng)目。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
周大福,明天漲價(jià)!一條金手鏈要多收9000元

周大福,明天漲價(jià)!一條金手鏈要多收9000元

每日經(jīng)濟(jì)新聞
2025-12-18 21:00:07
中亞首個(gè)變色龍出現(xiàn),哈總統(tǒng)率先抵日,峰會(huì)還沒開,已簽14項(xiàng)協(xié)議

中亞首個(gè)變色龍出現(xiàn),哈總統(tǒng)率先抵日,峰會(huì)還沒開,已簽14項(xiàng)協(xié)議

井普椿的獨(dú)白
2025-12-19 15:24:49
臺(tái)民眾如何反制民進(jìn)黨?侯漢廷:討厭賴清德,2026票投“安安連線”

臺(tái)民眾如何反制民進(jìn)黨?侯漢廷:討厭賴清德,2026票投“安安連線”

海峽導(dǎo)報(bào)社
2025-12-19 09:12:05
1986年陳永貴病逝后,追悼會(huì)規(guī)格引起爭議,鄧小平一句話最終定調(diào)

1986年陳永貴病逝后,追悼會(huì)規(guī)格引起爭議,鄧小平一句話最終定調(diào)

寄史言志
2025-12-19 15:28:23
柬泰不打了?泰國開出3大?;饤l件,足夠讓洪森父子“顏面掃地”

柬泰不打了?泰國開出3大?;饤l件,足夠讓洪森父子“顏面掃地”

博覽歷史
2025-12-18 18:20:32
1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)?!陳賡:這是給鬼子修的墳!

1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)?!陳賡:這是給鬼子修的墳!

史海孤雁
2025-12-17 16:50:15
海南封關(guān)次日實(shí)探三亞免稅店:蘭蔻等護(hù)膚品牌有免稅臨期產(chǎn)品5折銷售,此前甚至有口紅打1折

海南封關(guān)次日實(shí)探三亞免稅店:蘭蔻等護(hù)膚品牌有免稅臨期產(chǎn)品5折銷售,此前甚至有口紅打1折

極目新聞
2025-12-19 13:22:22
警示!上海一三甲醫(yī)院發(fā)生一起甲等醫(yī)療事故,醫(yī)院賠償70多萬

警示!上海一三甲醫(yī)院發(fā)生一起甲等醫(yī)療事故,醫(yī)院賠償70多萬

梅斯醫(yī)學(xué)
2025-12-19 07:54:40
突發(fā)!曝李湘前夫李厚霖被刑拘,哥哥妹妹也被牽連,欠債10多億

突發(fā)!曝李湘前夫李厚霖被刑拘,哥哥妹妹也被牽連,欠債10多億

裕豐娛間說
2025-12-18 17:01:13
明朝的一首詞,抵得過千萬首唐詩宋詞,因?yàn)檫@首詞全篇都是名句

明朝的一首詞,抵得過千萬首唐詩宋詞,因?yàn)檫@首詞全篇都是名句

長風(fēng)文史
2025-12-18 15:00:28
錢再多有什么用,64歲郎平如今的現(xiàn)狀,給所有運(yùn)動(dòng)員們提了個(gè)醒

錢再多有什么用,64歲郎平如今的現(xiàn)狀,給所有運(yùn)動(dòng)員們提了個(gè)醒

削桐作琴
2025-12-10 16:53:18
12月19日俄烏最新:圖斯克拋出一枚重磅炸彈

12月19日俄烏最新:圖斯克拋出一枚重磅炸彈

西樓飲月
2025-12-19 18:05:05
600多元天津飛北京,中轉(zhuǎn)30多個(gè)小時(shí)“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

600多元天津飛北京,中轉(zhuǎn)30多個(gè)小時(shí)“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

極目新聞
2025-12-19 07:21:26
火箭輸球后,杜蘭特提出要求,烏度卡同時(shí)也下令了,申京很坦誠

火箭輸球后,杜蘭特提出要求,烏度卡同時(shí)也下令了,申京很坦誠

體壇大辣椒
2025-12-19 14:55:50
顯身材不浮夸,白背心配藍(lán)瑜伽褲,不同身材都能穿得好看

顯身材不浮夸,白背心配藍(lán)瑜伽褲,不同身材都能穿得好看

小喬古裝漢服
2025-12-19 19:17:46
固態(tài)電池出現(xiàn)變數(shù),安全測(cè)試全軍覆沒?

固態(tài)電池出現(xiàn)變數(shù),安全測(cè)試全軍覆沒?

環(huán)球零碳
2025-12-17 21:22:14
演員王傳君發(fā)文宣布退出電視劇拍攝

演員王傳君發(fā)文宣布退出電視劇拍攝

民間平哥
2025-12-19 15:41:22
針對(duì)臺(tái)灣問題,攤牌了!美國國防部今天表態(tài)了!

針對(duì)臺(tái)灣問題,攤牌了!美國國防部今天表態(tài)了!

安安說
2025-12-19 09:59:44
事情嚴(yán)重了!中國取消美國的訂單!

事情嚴(yán)重了!中國取消美國的訂單!

扶蘇聊歷史
2025-12-19 09:41:29
19號(hào)收評(píng):日本加息25個(gè)基點(diǎn)!所有人都注意,大盤下周開始這樣看

19號(hào)收評(píng):日本加息25個(gè)基點(diǎn)!所有人都注意,大盤下周開始這樣看

春江財(cái)富
2025-12-19 15:16:01
2025-12-19 20:51:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11883文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來

頭條要聞

美方"國防授權(quán)法案"塞入涉臺(tái)錯(cuò)誤內(nèi)容 國臺(tái)辦回應(yīng)

頭條要聞

美方"國防授權(quán)法案"塞入涉臺(tái)錯(cuò)誤內(nèi)容 國臺(tái)辦回應(yīng)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

旅游
時(shí)尚
教育
手機(jī)
公開課

旅游要聞

爽居暢游!貴州到廣州發(fā)布“小車小團(tuán)”高端服務(wù)產(chǎn)品

今日熱點(diǎn):曾艷芬提醒絲芭傳媒有聊天記錄;邊伯賢惡評(píng)者被罰款……

教育要聞

華南理工倡議:校內(nèi)錯(cuò)峰出行、錯(cuò)峰用餐,禮讓考研學(xué)子

手機(jī)要聞

華為Mate 80首銷數(shù)據(jù)出爐:約為前代的115%,基礎(chǔ)版占比75%

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版