国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

他們?cè)?993年就提出了Scaling Law

0
分享至

明敏 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

原來(lái),Scaling Law在32年前就被提出了!

不是2020年的OpenAI、不是2017年的百度,而是1993年的貝爾實(shí)驗(yàn)室。



在一篇名為《Learning Curves: Asymptotic Values and Rate of Convergence》的文章里提出一種預(yù)測(cè)方法:

訓(xùn)練誤差和測(cè)試誤差隨訓(xùn)練規(guī)模增加,都會(huì)收斂到同一個(gè)漸近誤差值,這種收斂符合冪律形式。

通過(guò)這種方法,研究人員可以預(yù)測(cè)模型在更大數(shù)據(jù)集上的表現(xiàn)。



這和現(xiàn)在大家常提的Scaling Law幾乎一致:

在合理的范圍內(nèi),通過(guò)簡(jiǎn)單地增加模型參數(shù)量(N)、訓(xùn)練數(shù)據(jù)量(D)和計(jì)算量(FLOPS,C),可以以一種可預(yù)測(cè)的、平滑的方式顯著提升模型性能。

而1993年的這篇論文來(lái)頭也不小,作者一共5位,其中包含了支持向量機(jī)的提出者Vladimir Vapnik和Corinna Cortes。



為省算力提出預(yù)測(cè)曲線

這篇論文的研究初衷是為了節(jié)省訓(xùn)練分類器(classifiers)的計(jì)算資源(果然啥時(shí)候都缺算力)。

當(dāng)時(shí)的機(jī)器學(xué)習(xí)算法能實(shí)現(xiàn)將輸入數(shù)據(jù)分配到某個(gè)類別里,比如輸入一張手寫(xiě)數(shù)字的像素點(diǎn),判斷它是不是某一個(gè)數(shù)組。

為了讓分類器更可靠,往往需要使用大規(guī)模數(shù)據(jù)庫(kù)訓(xùn)練。但是研究人員并不確定分類器是否適合給定任務(wù),因此開(kāi)發(fā)高效的預(yù)測(cè)程序非常有必要。

這項(xiàng)研究就是提出了一種預(yù)測(cè)方法,先在中等規(guī)模的數(shù)據(jù)集上訓(xùn)練,然后通過(guò)提出的學(xué)習(xí)曲線建模外推,預(yù)測(cè)其在大數(shù)據(jù)集上的表現(xiàn)。這樣就不用對(duì)分類器進(jìn)行完整訓(xùn)練,從而節(jié)省計(jì)算資源。

它首先在幾個(gè)中等規(guī)模訓(xùn)練集上分別計(jì)算測(cè)試誤差、訓(xùn)練誤差,然后他們發(fā)現(xiàn),隨著訓(xùn)練集的規(guī)模變大,訓(xùn)練誤差和測(cè)試誤差都會(huì)收斂到一個(gè)相同的漸近值a,這個(gè)指數(shù)a在0.5-1之間。



  • a:漸近誤差(最終無(wú)法消除的誤差,比如任務(wù)不可實(shí)現(xiàn)性導(dǎo)致的殘余錯(cuò)誤)。
  • b,c:幅度參數(shù)。
  • α:收斂速率指數(shù)(通常在 0.5~1 之間)

然后變換為對(duì)數(shù)線性關(guān)系,在對(duì)數(shù)坐標(biāo)下得到兩條直線。



通過(guò)擬合這兩條直線能得到a,b,α。

將估計(jì)出的冪律曲線外推到更大的訓(xùn)練集規(guī)模上(比如60000),預(yù)測(cè)分類器在完整數(shù)據(jù)上的誤差。

實(shí)驗(yàn)結(jié)果表明,在線性分類器(布爾分類任務(wù))中預(yù)測(cè)非常準(zhǔn)確。



在多層神經(jīng)網(wǎng)絡(luò)(如LeNet)中,即便在任務(wù)不可實(shí)現(xiàn)(non-realizable)的情況下,外推結(jié)果也能很好地預(yù)測(cè)大規(guī)模訓(xùn)練的最終表現(xiàn)。

比如僅用12000樣本訓(xùn)練,就能預(yù)測(cè)新CNN在60000樣本上會(huì)優(yōu)于舊CNN。



此外作者還發(fā)現(xiàn),任務(wù)越困難,漸近誤差越高,收斂速率越小,即學(xué)習(xí)越慢。



這個(gè)理論放在當(dāng)時(shí)可以用來(lái)淘汰差的模型,將有限的計(jì)算資源放在更值得訓(xùn)練的模型上。

作者也是支持向量機(jī)提出者

最后不得不提一下這篇研究的幾位作者。

首先來(lái)看Vladimir Vapnik,他因在統(tǒng)計(jì)學(xué)習(xí)理論和支持向量機(jī)方面的貢獻(xiàn)而聞名。



他于1958年在烏茲別克國(guó)立大學(xué)獲得數(shù)學(xué)碩士學(xué)位,并于1964年在莫斯科控制科學(xué)研究所獲得統(tǒng)計(jì)學(xué)博士學(xué)位。1961年至1990年期間,他一直在該研究所工作,并擔(dān)任計(jì)算機(jī)科學(xué)研究部門(mén)的負(fù)責(zé)人。

Vapnik與Alexey Chervonenkis在1960年至1990年間共同開(kāi)發(fā)了Vapnik-Chervonenkis理論(也稱為VC理論)。該理論是計(jì)算學(xué)習(xí)理論的一種形式,旨在從統(tǒng)計(jì)學(xué)角度解釋學(xué)習(xí)過(guò)程。

它是統(tǒng)計(jì)學(xué)習(xí)理論的基石,為學(xué)習(xí)算法的泛化條件提供了理論基礎(chǔ),并量化了模型的復(fù)雜性(通過(guò)VC維)。VC理論在無(wú)需定義任何先驗(yàn)分布的情況下,為機(jī)器學(xué)習(xí)提供了一種更通用的方法,與貝葉斯理論形成了對(duì)比。

同時(shí)Vapnik也是支持向量機(jī)(SVM)的主要發(fā)明者。這是一種監(jiān)督學(xué)習(xí)模型,用于數(shù)據(jù)分類和回歸分析。1964年,Vapnik和Chervonenkis首次提出了原始的SVM算法。

1990年代,Vapnik加入貝爾實(shí)驗(yàn)室開(kāi)始進(jìn)行機(jī)器學(xué)習(xí)方面的深入研究。在1992年他和Bernhard Boser、Isabelle Guyon提出了通過(guò)應(yīng)用“核技巧”(kernel trick)來(lái)創(chuàng)建非線性分類器的方法,極大地?cái)U(kuò)展了SVM的應(yīng)用范圍,使其能夠處理非線性可分問(wèn)題。

1995年Vapnik和Corinna Cortes提出了軟邊距的非線性SVM并將其應(yīng)用于手寫(xiě)字符識(shí)別問(wèn)題,因?yàn)樾阅鼙憩F(xiàn)出色,這篇論文引發(fā)廣泛關(guān)注,也成為機(jī)器學(xué)習(xí)發(fā)展中的一塊重要基石。



他撰寫(xiě)的《統(tǒng)計(jì)學(xué)理論的本質(zhì)》也是機(jī)器學(xué)習(xí)領(lǐng)域的必讀著作之一。

以及他2014年還給Facebook當(dāng)過(guò)顧問(wèn)。



另一位重要作者是Corinna Cortes。她現(xiàn)在是Google Research紐約分部的副總裁,負(fù)責(zé)廣泛的理論和應(yīng)用大規(guī)模機(jī)器學(xué)習(xí)問(wèn)題研究。

她于1989年在哥本哈根大學(xué)尼爾斯·玻爾研究所獲得物理學(xué)碩士學(xué)位。隨后,她于1993年在羅切斯特大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。

在加入Google之前,Cortes在貝爾實(shí)驗(yàn)室工作了十多年。

2022年她被任命為ACM Fellow,以表彰她對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的貢獻(xiàn)。



其余幾位作者分別是:L. D. Jackel、Sara A. Solla和John S. Denker

其中John S. Denker還和LeCun在手寫(xiě)識(shí)別上合作過(guò)多篇論文,也都是機(jī)器學(xué)習(xí)經(jīng)典大作了。





而他本人也相當(dāng)全能,涉獵領(lǐng)域包括機(jī)器學(xué)習(xí)、系統(tǒng)安全、好萊塢特效、電子游戲和視頻游戲等,完成了很多開(kāi)創(chuàng)性工作。還曾在加州理工學(xué)院創(chuàng)建并教授“微處理器設(shè)計(jì)”課程(硅谷之所以成為硅谷,和當(dāng)時(shí)美國(guó)高校中開(kāi)始推行芯片設(shè)計(jì)課程有很大關(guān)系)。

甚至,他還是一個(gè)飛行員,是FFA的航空安全顧問(wèn),并寫(xiě)了一本對(duì)飛行原理解釋透徹的行業(yè)教科書(shū)。

Denker還曾于1986-87年擔(dān)任加州大學(xué)圣巴巴拉分校理論物理研究所的訪問(wèn)教授。 他以幽默感和“原型瘋狂科學(xué)家”的形象而聞名,他的一些事跡甚至在一些電影中有所體現(xiàn)。



One More Thing

值得一提的是,卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)都誕生于貝爾實(shí)驗(yàn)室。它們之間過(guò)一段“分庭抗禮”的時(shí)期。

在深度學(xué)習(xí)興起之前,CNN因?yàn)椤昂诤小币约靶枰笠?guī)模訓(xùn)練,一些研究者對(duì)其持有保留態(tài)度;相比之下支持向量機(jī)的理論清晰、易于收斂到全局最優(yōu)解。到底誰(shuí)是正確路線?一時(shí)爭(zhēng)論不休。

1995年,Vapnik還和當(dāng)時(shí)的上司Larry Jackel以一頓豪華晚餐打賭,到2000年時(shí),人們能不能解釋清楚大型神經(jīng)網(wǎng)絡(luò)為什么在大規(guī)模訓(xùn)練中表現(xiàn)很好?

Vapnik覺(jué)得不能。2000年他贏了;隨后他們又賭,再過(guò)5年結(jié)果如何?這一次Vapnik錯(cuò)了:

在2005年任何頭腦清醒的人都不會(huì)再用和1995年時(shí)完全相同的模型了。

這場(chǎng)賭局,LeCun是見(jiàn)證人。



論文地址:
https://proceedings.neurips.cc/paper/1993/file/1aa48fc4880bb0c9b8a3bf979d3b917e-Paper.pdf


[1]https://x.com/gdb/status/1962594235263427045
[2]https://yorko.github.io/2022/vapnik-jackel-bet/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
杜蘭特空砍32+6+8+2封蓋,阿德巴約打爆申京,熱火終結(jié)火箭3連勝

杜蘭特空砍32+6+8+2封蓋,阿德巴約打爆申京,熱火終結(jié)火箭3連勝

釘釘陌上花開(kāi)
2026-03-01 07:08:50
NBA分析師將火箭隊(duì)杜蘭特,與35次格萊美獎(jiǎng)得主碧昂絲相提并論

NBA分析師將火箭隊(duì)杜蘭特,與35次格萊美獎(jiǎng)得主碧昂絲相提并論

好火子
2026-03-01 05:19:48
哈梅內(nèi)伊的生死,是一個(gè)悖論

哈梅內(nèi)伊的生死,是一個(gè)悖論

劉遠(yuǎn)舉
2026-02-28 23:09:07
伊朗最高領(lǐng)袖哈梅內(nèi)伊將很快發(fā)表講話

伊朗最高領(lǐng)袖哈梅內(nèi)伊將很快發(fā)表講話

齊魯壹點(diǎn)
2026-02-28 23:51:35
59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

琴聲飛揚(yáng)
2026-02-12 11:51:25
谷愛(ài)凌到北京了,母親谷燕雙眼無(wú)神疲憊不堪,在機(jī)場(chǎng)就是老太太!

谷愛(ài)凌到北京了,母親谷燕雙眼無(wú)神疲憊不堪,在機(jī)場(chǎng)就是老太太!

小娛樂(lè)悠悠
2026-02-28 11:52:08
國(guó)際刑事法院檢察官:杜特爾特是菲律賓禁毒戰(zhàn)“最應(yīng)負(fù)責(zé)的人”

國(guó)際刑事法院檢察官:杜特爾特是菲律賓禁毒戰(zhàn)“最應(yīng)負(fù)責(zé)的人”

仙氣美少女
2026-02-28 18:54:56
69歲不丹大王母才貌雙全,肚子不爭(zhēng)氣輸給三妹,連帶兒女被邊緣化

69歲不丹大王母才貌雙全,肚子不爭(zhēng)氣輸給三妹,連帶兒女被邊緣化

窺史
2026-02-27 17:46:15
吳宜澤:我本有機(jī)會(huì)取得5-4領(lǐng)先,但打球不夠穩(wěn)健讓我付出了代價(jià)

吳宜澤:我本有機(jī)會(huì)取得5-4領(lǐng)先,但打球不夠穩(wěn)健讓我付出了代價(jià)

世界體壇觀察家
2026-03-01 06:13:36
小菲透露箖玥動(dòng)態(tài),沒(méi)回北京上學(xué)!姥姥和姥爺在帶!蘭姐感恩親家

小菲透露箖玥動(dòng)態(tài),沒(méi)回北京上學(xué)!姥姥和姥爺在帶!蘭姐感恩親家

80后房車生活
2026-02-27 19:58:04
外媒:初步報(bào)告稱伊朗革命衛(wèi)隊(duì)損失慘重,多名革命衛(wèi)隊(duì)成員死傷

外媒:初步報(bào)告稱伊朗革命衛(wèi)隊(duì)損失慘重,多名革命衛(wèi)隊(duì)成員死傷

中國(guó)網(wǎng)
2026-02-28 16:09:08
中國(guó)駐符拉迪沃斯托克總領(lǐng)館:18-65歲在俄長(zhǎng)期居留男性 須同意在俄軍事單位等至少服役1年

中國(guó)駐符拉迪沃斯托克總領(lǐng)館:18-65歲在俄長(zhǎng)期居留男性 須同意在俄軍事單位等至少服役1年

閃電新聞
2026-02-26 12:56:09
騎士輸活塞太冤?四次錯(cuò)漏判三次吃虧 本有望不打加時(shí)拿下勝利

騎士輸活塞太冤?四次錯(cuò)漏判三次吃虧 本有望不打加時(shí)拿下勝利

羅說(shuō)NBA
2026-03-01 06:48:44
央視主持沙桐:離婚后妻子嘲諷二人多年沒(méi)性生活,前妻直言別扯淡

央視主持沙桐:離婚后妻子嘲諷二人多年沒(méi)性生活,前妻直言別扯淡

冷紫葉
2026-02-25 15:28:41
張洪福母親感謝恒大足校:樹(shù)高千尺不忘根,人行千里莫忘本

張洪福母親感謝恒大足校:樹(shù)高千尺不忘根,人行千里莫忘本

懂球帝
2026-02-28 10:47:21
WTT新加坡大滿貫:1日賽程有變動(dòng),孫穎莎,王曼昱,王曼昱責(zé)任

WTT新加坡大滿貫:1日賽程有變動(dòng),孫穎莎,王曼昱,王曼昱責(zé)任

郝小小看體育
2026-03-01 04:49:24
伊朗爆發(fā)抗議游行 高層被斬首削弱控制,伊朗民眾走上街頭

伊朗爆發(fā)抗議游行 高層被斬首削弱控制,伊朗民眾走上街頭

火星人的想法
2025-12-31 06:00:03
湖人悔青了!曾看不上的交易目標(biāo)爆砍42分,場(chǎng)均21+打出身價(jià)

湖人悔青了!曾看不上的交易目標(biāo)爆砍42分,場(chǎng)均21+打出身價(jià)

夜白侃球
2026-02-28 17:47:31
最慘烈戰(zhàn)斗打響!伊朗4個(gè)小時(shí)內(nèi)10波導(dǎo)彈突襲,美以空襲闖下大禍

最慘烈戰(zhàn)斗打響!伊朗4個(gè)小時(shí)內(nèi)10波導(dǎo)彈突襲,美以空襲闖下大禍

董董歷史燴
2026-03-01 02:21:49
阿聯(lián)酋攔截伊朗導(dǎo)彈1人死亡

阿聯(lián)酋攔截伊朗導(dǎo)彈1人死亡

財(cái)聯(lián)社
2026-02-28 18:00:11
2026-03-01 08:03:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12211文章數(shù) 176398關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

特朗普:對(duì)伊朗的不間斷打擊將持續(xù)一周甚至更長(zhǎng)時(shí)間

頭條要聞

特朗普:對(duì)伊朗的不間斷打擊將持續(xù)一周甚至更長(zhǎng)時(shí)間

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂(lè)要聞

周杰倫兒子正面照曝光,與父親好像

財(cái)經(jīng)要聞

沖突爆發(fā) 市場(chǎng)變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

親子
家居
藝術(shù)
公開(kāi)課
軍事航空

親子要聞

逆天,在醫(yī)院上班懷孕都要提前申請(qǐng)了!

家居要聞

素色肌理 品意式格調(diào)

藝術(shù)要聞

驚艷!這位天使般的女子與油畫(huà)讓人心動(dòng)不已!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國(guó)以色列聯(lián)合襲擊伊朗 實(shí)時(shí)戰(zhàn)況

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版