国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實錘了:GPU越多,論文接收率越高、引用越多

0
分享至



機器之心報道

機器之心編輯部

在過去三年里,AI 領域取得了顯著進步,這一飛躍主要得益于基礎模型的發(fā)展。這些模型在大規(guī)模多模態(tài)數(shù)據(jù)上進行訓練,并在公開發(fā)布后取得了巨大成功。

然而,基礎模型的研究需要大量的數(shù)據(jù)、算力和人力資源。這一問題引發(fā)了廣泛關注與討論,更大的資源獲取是否會直接帶來更有影響力的研究成果,例如更多的論文發(fā)表或更高的引用量。

這一問題的答案對于資源分配策略、研究方向的優(yōu)先級設定,以及如何保障基礎模型研究的公平與可持續(xù)參與,都具有重要意義。

然而,由于缺乏統(tǒng)一的資源披露標準,研究成本往往難以量化。在缺乏全面公開的情況下,研究經費最直觀的衡量方式,通常是購買或租用硬件(如計算集群或芯片)的具體成本。當然,研究還包括軟件、云存儲服務以及專業(yè)平臺等其他開支。

在這些資源中,GPU 是一個尤其關鍵的指標,因為它是一種供應量有限、受嚴格控制的資源。

在本文中,來自 MIT、劍橋等機構的研究者研究了硬件資源與 AI/ML 領域頂級會議論文發(fā)表之間的關系。他們重點考察了兩種計算能力指標:GPU 數(shù)量和 TFLOPs(每秒浮點運算次數(shù)),并將這些數(shù)據(jù)與 2022 至 2024 年間共 34,828 篇錄用論文進行關聯(lián)分析。

本文共識別出 5,889 篇基礎模型相關論文,并發(fā)現(xiàn) GPU 獲取能力越強,其在八個頂級會議中的論文接收率和引用量也越高。

此外,本文還對 312 篇論文的 229 位作者進行了問卷調查后發(fā)現(xiàn):

  • 大多數(shù)基礎模型論文由學術界研究者撰寫(共 4,851 篇),而產業(yè)界研究者的論文數(shù)量相對較少(1,425 篇);
  • 大多數(shù)論文使用的是開源模型(如 LLaMA),其次是閉源模型(如 GPT);
  • GPU 使用信息在論文中很少被披露,這表明當前亟需制定統(tǒng)一的計算資源報告規(guī)范,以提升研究的透明度與可復現(xiàn)性。



  • 論文標題:THE ROLE OF COMPUTING RESOURCES IN PUBLISHING FOUNDATION MODEL RESEARCH
  • 論文地址:https://arxiv.org/pdf/2510.13621

計算資源識別方法

研究者收集了2022 年至 2024 年間、八個頂級機器學習會議上被接收的論文(2025 年 3 月之前已可獲取),包括 NeurIPS、ICLR、ICML、COLM、EMNLP、ACL、NAACL、EACL。

采用的方法是:在論文標題或摘要中搜索關鍵詞來識別與基礎模型(FM)相關的論文。最終在總計 34828 篇論文中,挑選出了5889 篇與 FM 相關的已接收論文。此外收集了同期被拒稿或撤稿的 ICLR 與 FM 相關的論文,共計 613 篇,用于對比分析。

在完成論文標題和摘要的整理后,研究者使用 GPT-4o mini 將每篇論文分為三個類別,即領域(Domain)、階段(Phase)和方法(Method)。這些類別的定義見下表 1。



更進一步地,研究者通過系統(tǒng) API 從全部 5889 篇已接收論文中收集結構化信息,包括文章 ID、標題、作者信息(姓名、人數(shù)及所屬機構)、發(fā)表信息(年份、會議、接收或拒稿狀態(tài)、論文鏈接、評審意見和摘要)。對于系統(tǒng) API 中缺失的信息,研究者使用 GPT-4o mini 處理論文 PDF,以提取資深作者的所屬機構、GPU 使用情況、數(shù)據(jù)集描述以及資助信息。

在調研中,118 所機構的研究者參與了本次調查,包括了 267 名學術界一作和 36 名產業(yè)界一作,最終共有 229 位 FM 論文的一作(包括 312 篇論文)提供有效反饋。當論文中未記錄計算資源使用情況時,參與者需在調查中自行報告相關信息

圖 1 (B) 展示了不同年份和會議中有效 GPU 類型的比例,以及各會議作者和審稿人檢查清單中是否包含報告計算資源使用情況的相關指南。圖 1 (C) 展示了由 GPT-4o 自動抓取的數(shù)據(jù)與論文作者自報數(shù)據(jù)在 GPU 使用量與 FP 16 計算性能(TFLOPS 16)上的差異。



為確保提取的 GPU 信息準確性,兩位 FM 研究者在盲評條件下獨立檢查了 312 篇論文,并與 GPT-4o mini 的提取結果進行對比。研究者交叉比對了 GPT-4o mini 提取的信息、人工標注結果以及論文一作自報的 GPU 數(shù)據(jù)。

結果顯示:在被調查的 312 篇論文中,288 篇自報了 GPU 數(shù)量,292 篇自報了 GPU 類型,281 篇自報了 GPU 使用時長;另有 24 篇使用了非 GPU 計算資源(如 TPU、NPU 或 CPU)。

不過,兩位 FM 研究者發(fā)現(xiàn)僅有 172 篇論文中包含 GPU 數(shù)量信息,141 篇包含 GPU 類型信息,249 篇包含 GPU 時長信息。GPT-4o mini 僅從 116 篇論文中成功提取到 GPU 數(shù)量,與作者報告相比存在 59.7% 的缺失率。GPU 類型與 GPU 時長的缺失率也較高,分別為 48.3% 和 88.6%。

結果

基礎模型研究呈爆炸式增長

從 2022 年到 2024 年,基礎模型的研究在廣度和深度上都經歷了顯著增長。

一個直觀的體現(xiàn)是,在八個頂級 AI 會議中,基礎模型相關論文的占比迅速攀升

  • 2022 年: 2.07%
  • 2023 年: 10.29%
  • 2024 年:飆升至 34.64%(圖 A)



尤其在NLP 領域,這一趨勢更為明顯。在 COLM、EMNLP 和 ACL 等專業(yè)會議上,基礎模型論文的比例甚至超過了 ICLR、ICML 和 NeurIPS 等綜合性機器學習會議。

從研究方向來看,與推理相關的論文增長最快。從研究類型來看,算法和實證研究的增長速度超過了數(shù)據(jù)集、基準測試和工具包等類別(圖 B)。



有趣的是,盡管論文數(shù)量激增,但單個項目使用的 GPU 數(shù)量保持相對穩(wěn)定。無論是已發(fā)表的論文還是待發(fā)表的研究,大多數(shù)項目使用的 GPU 數(shù)量集中在 1 到 8 個,其中 1 到 4 個 GPU 的配置最為常見,占據(jù)了約一半的比例(圖 C)。不過,考慮到目前 GPU 的采購周期越來越長,這一趨勢未來是否會變化,值得我們持續(xù)關注。



工業(yè)界與學術界共同引領研究浪潮

基礎模型的研究延續(xù)了計算機科學領域產學研緊密結合的傳統(tǒng)。

數(shù)據(jù)顯示,學術界貢獻了更多的論文總量,但頂尖的工業(yè)界實驗室在單一機構產出上表現(xiàn)突出。具體來看:

  • 學術界: 611 個機構共發(fā)表了 4851 篇論文。
  • 工業(yè)界: 163 個機構共發(fā)表了 1425 篇論文。

其中,谷歌和微軟是論文產出最多的兩個單一實體,緊隨其后的是清華大學、Meta 和斯坦福大學。



值得注意的是,兩大陣營的研究效率相當。工業(yè)界研究者人均發(fā)表 8.72 篇論文,學術界人均發(fā)表 7.93 篇。這表明,基礎模型的研究高度集中在少數(shù)能提供強大算力支持的頂級學術和工業(yè)機構中。如果獲取大規(guī)模算力的門檻持續(xù)提高,這種集中化趨勢可能會進一步加劇。

從國家層面看,美國和中國在基礎模型研究產出方面處于領先地位(圖 B),這可能與兩國在高等教育和人工智能領域的長期投入有關。



開源模型成為研究的主流選擇

在眾多模型中,以LLaMA 系列為代表的開源權重模型是研究中使用最頻繁的(圖 C)。



這一現(xiàn)象至關重要。雖然像 GPT 系列這樣的專有閉源模型因其卓越的性能和便捷的 API 接口,在研究中仍占有一席之地,但開源模型憑借其高度的靈活性和可訪問性贏得了研究社區(qū)的青睞。研究人員可以基于開源模型進行微調、領域適配和深入的基準測試,而這些操作在閉源模型上通常難以實現(xiàn)。

GPU 使用情況:NVIDIA A100 成為核心算力

在具體的 GPU 類型上,NVIDIA A100 是基礎模型研究中使用最廣泛的核心,并且排名前十的 GPU 均來自 NVIDIA 家族(圖 3D)。

進一步分析發(fā)現(xiàn),算力資源的使用并非均勻分布:

  • 研究階段: 專注于預訓練的研究,其 GPU 使用數(shù)量顯著高于側重于后訓練或推理的研究(p<0.001)。
  • 其他維度: 在不同機構、應用領域或研究方法之間,GPU 的使用量沒有表現(xiàn)出統(tǒng)計學上的顯著差異。例如,安全相關研究的 GPU 使用量中位數(shù)較低,而工具包開發(fā)研究的使用量較高,但這些差異并不顯著(圖 D)。



從論文的研究重點來看:

  • 47.4% 關注算法開發(fā)。
  • 86.4% 集中在 NLP 領域,僅有 5.7% 涉及 CV。
  • 48.7% 的論文研究推理過程,遠超預訓練(13.3%)。

政府是基礎模型研究的最大資助方

通過分析論文中披露的資金信息,發(fā)現(xiàn)政府是基礎模型研究最主要的資助來源(圖 4)。在提供了資助信息的論文中:

  • 85.5%(848 篇)獲得了政府資助。
  • 29.3%(291 篇)獲得了企業(yè)資助。
  • 10.3%(102 篇)獲得了基金會資助(圖 4A)。

有趣的是,一個國家的人均 GDP 與其資助的論文數(shù)量之間沒有必然聯(lián)系(圖 4B)。這表明,機構的支持力度和相關政策,比單純的國家經濟實力更能影響基礎模型的研究產出。(注:僅有 15.3% 的論文披露了詳細的資助信息。)



研究產出與影響力:算力比 GPU 數(shù)量更關鍵

一個典型的基礎模型研究項目是怎樣的?數(shù)據(jù)顯示,一篇被接收的論文,通常有 5 名作者,使用 4 個 GPU,項目平均持續(xù)約 5 個月。

進一步探究了計算資源與研究成果(論文數(shù)量和引用量)之間的關系,發(fā)現(xiàn)了更深層的規(guī)律:

對于產出(論文數(shù)量): 單純的 GPU 數(shù)量與論文產出不成正比。然而,以 TFLOPs(每秒萬億次浮點運算)衡量的總計算能力,與論文產出呈現(xiàn)出更強的正相關性,尤其是在工業(yè)界(圖 4C)。這說明,決定研究產出效率的,是高質量的計算基礎設施,而不僅僅是 GPU 的堆砌。

對于影響力(引用次數(shù)): 同樣,TFLOPs 比 GPU 數(shù)量更能預測一篇論文的引用潛力(圖 4D)。擁有更強算力支持的機構,其研究成果往往能獲得更多引用

盡管如此,算力并非決定性因素。許多高引用論文同樣來自計算資源相對有限的機構,證明了研究影響力是由多種因素共同決定的。

論文接收與否:資源多少并非決定性因素

更多的 GPU 或更強的算力,能提高論文被接收的概率嗎?

研究者對 ICLR 會議 2022-2024 年的數(shù)據(jù)進行了分析。結果發(fā)現(xiàn),平均而言,被拒稿的論文確實比被接收的論文使用了略少的 GPU、略低的 TFLOPs和規(guī)模略小的作者團隊。

但是,兩者在資源使用上的分布情況非常相似,差距微乎其微。這與頂級會議的審稿指南相符,即審稿人更應關注研究的新穎性、清晰度和貢獻,而非其使用的資源多寡。(注:由于只有 ICLR 公開了被拒稿論文的數(shù)據(jù),這個結論的普適性還有待更多數(shù)據(jù)驗證。)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

流蘇晚晴
2026-01-27 18:18:22
2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產生費用

2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產生費用

看看新聞Knews
2026-03-01 18:15:18
美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

削桐作琴
2026-03-01 14:27:41
詹皇轟24+5迎里程碑!湖人24分勝國王,威少14+5遭東契奇小里嘲笑

詹皇轟24+5迎里程碑!湖人24分勝國王,威少14+5遭東契奇小里嘲笑

你的籃球頻道
2026-03-02 12:53:02
航母無損成焦點!特朗普改口,伊朗擊中法塔赫-2了嗎?

航母無損成焦點!特朗普改口,伊朗擊中法塔赫-2了嗎?

起喜電影
2026-03-02 12:09:40
凌晨5點半火光沖天!昆明一老舊小區(qū)柴房突發(fā)火情,多輛消防車緊急出動

凌晨5點半火光沖天!昆明一老舊小區(qū)柴房突發(fā)火情,多輛消防車緊急出動

8099999街頭巷尾
2026-03-01 13:27:21
偉大的9-5!名將打破3年冠軍荒,鎖定2站紅包賽,追平趙心童成就

偉大的9-5!名將打破3年冠軍荒,鎖定2站紅包賽,追平趙心童成就

劉姚堯的文字城堡
2026-03-02 06:40:19
為了巴結英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

為了巴結英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

流史歲月
2026-02-26 16:45:04
洗草莓時,有人放食鹽,有人放面粉,果農:都不對,教你正確做法

洗草莓時,有人放食鹽,有人放面粉,果農:都不對,教你正確做法

阿龍美食記
2026-02-28 10:49:43
電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

社會醬
2026-03-01 20:43:29
“吸血”親爹、寵妾滅妻,侄女再曝大瓜,楊議徹底活成全網(wǎng)笑話!

“吸血”親爹、寵妾滅妻,侄女再曝大瓜,楊議徹底活成全網(wǎng)笑話!

手工制作阿殲
2026-03-02 00:53:35
3月2日A股猛料:美伊沖突烈度超預期!美國林肯號航母被襲!

3月2日A股猛料:美伊沖突烈度超預期!美國林肯號航母被襲!

有范又有料
2026-03-02 10:28:29
什么調料最易致癌?是蠔油嗎?提醒:這3種調料做飯時盡量少放

什么調料最易致癌?是蠔油嗎?提醒:這3種調料做飯時盡量少放

冷眼看世界728
2026-03-02 10:00:13
伊朗用血淚換來的教訓:一旦中美開戰(zhàn),中國必須首先鎖定這一點

伊朗用血淚換來的教訓:一旦中美開戰(zhàn),中國必須首先鎖定這一點

冷峻視角下的世界
2026-02-20 07:45:35
江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

古怪奇談錄
2025-06-28 13:49:02
第九波打擊!伊朗襲擊美軍航母,美英油輪被炸,特朗普急了

第九波打擊!伊朗襲擊美軍航母,美英油輪被炸,特朗普急了

全球熱點大揭秘
2026-03-02 13:38:50
男子因鉀過低不幸離世!醫(yī)生提醒:平時寧愿少吃點肉,要多吃幾物

男子因鉀過低不幸離世!醫(yī)生提醒:平時寧愿少吃點肉,要多吃幾物

神奇故事
2025-11-27 22:13:57
大量食用油被檢測出致癌物!自查廚房是否有這3種油,可別再吃了

大量食用油被檢測出致癌物!自查廚房是否有這3種油,可別再吃了

讀懂世界歷史
2026-03-01 18:09:06
成都無縫鋼管廠的那些事兒

成都無縫鋼管廠的那些事兒

寶哥精彩賽事
2026-03-02 00:58:40
賀希寧曬合影慶祝男籃勝利,胡明軒評論:樂邦詹士先生

賀希寧曬合影慶祝男籃勝利,胡明軒評論:樂邦詹士先生

懂球帝
2026-03-02 10:09:20
2026-03-02 15:16:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12388文章數(shù) 142574關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

體育要聞

卡里克主場5連勝!隊史第2人通過最大考驗

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預售11.28萬起 狐全新阿爾法S5標配寧德時代

態(tài)度原創(chuàng)

親子
時尚
房產
教育
數(shù)碼

親子要聞

小時候“不合群”的孩子,長大后更有出息?3個優(yōu)勢普通人比不了

從每天只睡4小時到8小時:一個失眠者的自救指南

房產要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

教育要聞

【張捷雜談】對涉考舞弊處罰過輕與幕后潛規(guī)則

數(shù)碼要聞

聯(lián)想公布ThinkBook Modular AI PC Concept模塊化雙屏概念機

無障礙瀏覽 進入關懷版