国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

NHB | 計(jì)算建模或遭遇統(tǒng)計(jì)危機(jī)!近八成研究的模型選擇功效不足

0
分享至

PsyBrain 腦心前沿 | 公眾號(hào) PSY-Brain_Frontier

一鍵關(guān)注,點(diǎn)亮星標(biāo) ??

不錯(cuò)過每日前沿資訊

認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息

Title:Addressing low statistical power in computational modelling studies in psychology and neuroscience

發(fā)表時(shí)間:2025.11.17

Journal:Nature Human Behaviour

影響因子:16.0

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

計(jì)算建模(Computational Modelling)已成為認(rèn)知神經(jīng)科學(xué)、心理學(xué)和腦科學(xué)領(lǐng)域揭示行為與神經(jīng)數(shù)據(jù)背后隱藏機(jī)制的核心工具。通過構(gòu)建復(fù)雜的數(shù)學(xué)模型來模擬認(rèn)知過程,研究人員得以檢驗(yàn)關(guān)于人類心智功能和其障礙的理論假設(shè)。在這一研究范式中,貝葉斯模型選擇(Bayesian Model Selection, BMS) 扮演著關(guān)鍵的推斷角色,用于評(píng)估一組競(jìng)爭(zhēng)性理論模型中,哪一個(gè)能以最優(yōu)方式解釋觀察到的數(shù)據(jù)。BMS因其強(qiáng)大的推斷能力,被廣泛視為替代經(jīng)典零假設(shè)檢驗(yàn)的有力工具。


注:圖片由AI生成

然而,盡管計(jì)算建模的影響力日益增長(zhǎng),該領(lǐng)域卻面臨一個(gè)被長(zhǎng)期低估的系統(tǒng)性挑戰(zhàn):模型選擇的統(tǒng)計(jì)功效 (Statistical Power) 不足。低功效不僅會(huì)大大降低檢測(cè)真實(shí)效應(yīng)(Type II 錯(cuò)誤)的概率,更嚴(yán)重的是,當(dāng)?shù)凸πУ难芯康贸觥帮@著”結(jié)果時(shí),其發(fā)現(xiàn)的真實(shí)效應(yīng)很可能被夸大(即“贏者詛咒”效應(yīng)或 Type I 錯(cuò)誤增加)。這一危機(jī)的根源在于研究人員普遍未能充分認(rèn)識(shí)到,確定足夠的樣本量 (N)并非唯一的考量因素,模型選擇的功效還受到候選模型空間的大小 (K)的嚴(yán)峻約束。

本研究通過建立新的功效分析框架,首次系統(tǒng)性地量化了這一關(guān)鍵制約:當(dāng)模型空間擴(kuò)大時(shí),即納入更多的競(jìng)爭(zhēng)性解釋模型時(shí),即使存在一個(gè)真實(shí)的最佳模型,其相對(duì)于次佳模型的相對(duì)優(yōu)勢(shì)(Effect Size)也會(huì)自然減小。這意味著,隨著競(jìng)爭(zhēng)性模型的增多,研究必須投入遠(yuǎn)超傳統(tǒng)預(yù)期的更大樣本量才能可靠地區(qū)分它們。這種關(guān)系類似于在一個(gè)選擇有限(K 小)的國(guó)家和另一個(gè)擁有幾十種美食(K 大)的國(guó)家中確定“最愛”:后者需要大得多的樣本量才能做出自信的判斷。因此,計(jì)算建模領(lǐng)域迫切需要一種方法論上的反思與校準(zhǔn),以確保推斷的可靠性。


研究核心總結(jié)

本研究基于一項(xiàng)針對(duì)隨機(jī)效應(yīng)貝葉斯模型選擇(Random Effects Bayesian Model Selection,RE-BMS)開發(fā)的通用功效分析框架 ,揭示了當(dāng)前領(lǐng)域中普遍存在的統(tǒng)計(jì)缺陷,并提出了規(guī)范化的解決方案。

  1. 統(tǒng)計(jì)功效的定量法則與領(lǐng)域現(xiàn)狀警示

該框架通過模擬分析清晰地證實(shí)并量化了模型選擇統(tǒng)計(jì)功效的“雙重依賴”:統(tǒng)計(jì)功效與樣本量 (N) 呈正相關(guān)關(guān)系,但與候選模型空間大小 (K) 呈顯著的負(fù)相關(guān)關(guān)系。這一定量關(guān)系要求研究人員在設(shè)計(jì)實(shí)驗(yàn)時(shí),必須同時(shí)考慮 N 和 K 的平衡。

遺憾的是,利用此框架對(duì)發(fā)表在頂尖期刊(包括《自然-人類行為》、《自然》和《科學(xué)》)的52項(xiàng)人類計(jì)算建模研究進(jìn)行的文獻(xiàn)回顧顯示,領(lǐng)域內(nèi)的功效不足問題非常普遍且系統(tǒng)性。分析結(jié)果表明,在模型選擇環(huán)節(jié),高達(dá)79%(52項(xiàng)研究中的41項(xiàng)) 的研究統(tǒng)計(jì)功效低于公認(rèn)的80%標(biāo)準(zhǔn)。這一驚人的數(shù)字表明,即使是發(fā)表在最高平臺(tái)上的前沿研究,也普遍低估了區(qū)分復(fù)雜競(jìng)爭(zhēng)模型所需的樣本規(guī)模,面臨模型誤選的高風(fēng)險(xiǎn)。


Fig. 1 | Power as a function of sample size and size of model space.

  1. 嚴(yán)厲批判:固定效應(yīng)模型選擇的統(tǒng)計(jì)災(zāi)難

文獻(xiàn)回顧同時(shí)發(fā)現(xiàn),該領(lǐng)域仍有相當(dāng)一部分研究(46%)依賴于固定效應(yīng)模型選擇(Fixed Effects Model Selection,FEMS) 。FEMS的基本假設(shè)是群體中的所有個(gè)體都遵循同一個(gè)單一模型 ,這忽略了人類群體中固有的、有意義的個(gè)體間異質(zhì)性(Between-Subject Variability),在現(xiàn)代神經(jīng)科學(xué)和心理學(xué)中被認(rèn)為是不可信的 。

更令人擔(dān)憂的是,F(xiàn)EMS在實(shí)踐中存在災(zāi)難性的統(tǒng)計(jì)問題,這些問題使其推斷結(jié)果極不可靠:

  1. 極高假陽性率: 在零假設(shè)情景(即模型之間無真實(shí)差異)下,F(xiàn)EMS在 97% 的模擬中錯(cuò)誤地宣布了一個(gè)獲勝模型 。這意味著使用FEMS,研究者幾乎總會(huì)“發(fā)現(xiàn)”一個(gè)贏家,即使這個(gè)發(fā)現(xiàn)完全是隨機(jī)噪聲的產(chǎn)物,嚴(yán)重?fù)p害了推斷的特異性 。

  2. 對(duì)異常值的極端敏感性: FEMS通過簡(jiǎn)單地累加所有個(gè)體的對(duì)數(shù)證據(jù),使其對(duì)單個(gè)極端異常值具有不成比例的敏感性 。模擬分析顯示,在50個(gè)受試者中,僅一個(gè)極端異常值(強(qiáng)烈支持模型 1)就足以在77%的模擬中推翻真實(shí)模型(Model 2)的推斷結(jié)果 。這種對(duì)少數(shù)個(gè)體數(shù)據(jù)點(diǎn)的過度依賴,使FEMS的發(fā)現(xiàn)容易受到“贏者詛咒”的影響,夸大復(fù)雜模型的優(yōu)勢(shì) 。

鑒于這些無法彌補(bǔ)的統(tǒng)計(jì)缺陷,研究強(qiáng)烈建議該領(lǐng)域必須摒棄FEMS,轉(zhuǎn)向統(tǒng)計(jì)假設(shè)更現(xiàn)實(shí)、對(duì)異常值敏感性更低的隨機(jī)效應(yīng)模型選擇(RE-BMS)。


Fig. 2 | Narrative review of the literature.

  1. 規(guī)范化推斷與實(shí)踐方向

RE-BMS 允許量化群體中的模型異質(zhì)性,并使用超越概率(exceedance probability, XP) 作為關(guān)鍵指標(biāo),它量化了某一模型比所有其他模型更有可能的置信度。

本研究的一個(gè)重要方法論貢獻(xiàn)是,針對(duì)RE-BMS推斷缺乏統(tǒng)一閾值的問題,該功效框架首次通過零假設(shè)模擬,校準(zhǔn)了一個(gè)嚴(yán)格的決策閾值,從而將Type I錯(cuò)誤率控制在5%,與經(jīng)典假設(shè)檢驗(yàn)對(duì)標(biāo)。這為超越概率提供了原則性的顯著性標(biāo)準(zhǔn),提高了該指標(biāo)的規(guī)范性。


Fig. 3 | Fixed effects model selection is highly sensitive to modest outliers.

研究總結(jié)呼吁,研究人員在設(shè)計(jì)計(jì)算建模研究時(shí),應(yīng)主動(dòng)利用新的功效分析框架,平衡樣本量 N 和模型空間 K。在樣本獲取受限時(shí),縮小模型空間至最相關(guān)的理論競(jìng)爭(zhēng)者,是提高統(tǒng)計(jì)功效、確保研究結(jié)果可復(fù)現(xiàn)性和可靠性的關(guān)鍵策略。

前沿交流|歡迎加入認(rèn)知神經(jīng)科學(xué)前沿交流群!


Abstract

Computational modelling is a powerful tool for uncovering hidden processes in observed data, yet it faces underappreciated challenges. Among these, determining appropriate sample sizes for computational studies remains a critical but overlooked issue, particularly for model selection analyses. Here we introduce a power analysis framework for Bayesian model selection, a method widely used to choose the best model among alternatives. Our framework reveals that while power increases with sample size, it decreases as more models are considered. Using this framework, we empirically demonstrate that psychology and human neuroscience studies often suffer from low statistical power in model selection. A total of 41 of 52 studies reviewed had less than 80% probability of correctly identifying the true model. The field also heavily relies on fixed effects model selection, which we demonstrate has serious statistical issues, including high false positive rates and pronounced sensitivity to outliers.


核心圖表、方法細(xì)節(jié)、統(tǒng)計(jì)結(jié)果與討論見原文及其拓展數(shù)據(jù)。

分享人:飯哥

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2:4慘敗王楚欽!30歲林高遠(yuǎn)狀態(tài)崩盤,退役呼聲再起

2:4慘敗王楚欽!30歲林高遠(yuǎn)狀態(tài)崩盤,退役呼聲再起

阿晞體育
2025-12-27 09:54:07
巴黎毛賊腸子都悔青,費(fèi)大勁搬空京東,結(jié)果偷回去一堆電子板磚!

巴黎毛賊腸子都悔青,費(fèi)大勁搬空京東,結(jié)果偷回去一堆電子板磚!

扶蘇聊歷史
2025-12-27 09:44:45
您有洗屁股的習(xí)慣嗎?提醒:天天洗肛門的人,能收獲4個(gè)驚人好處

您有洗屁股的習(xí)慣嗎?提醒:天天洗肛門的人,能收獲4個(gè)驚人好處

39健康網(wǎng)
2025-12-13 20:50:34
賺翻了!南博事件相關(guān)短劇火速上線,網(wǎng)友:這作者現(xiàn)在瑟瑟發(fā)抖…

賺翻了!南博事件相關(guān)短劇火速上線,網(wǎng)友:這作者現(xiàn)在瑟瑟發(fā)抖…

火山詩(shī)話
2025-12-26 15:25:14
俄官方民調(diào):普京信任度破80%

俄官方民調(diào):普京信任度破80%

桂系007
2025-12-26 16:10:41
43歲金莎的婚房火了,裝飾高級(jí),一點(diǎn)俗氣都沒,網(wǎng)友:一定要幸福

43歲金莎的婚房火了,裝飾高級(jí),一點(diǎn)俗氣都沒,網(wǎng)友:一定要幸福

觀察鑒娛
2025-12-26 09:29:28
為什么現(xiàn)在的公職人員都不收禮了?

為什么現(xiàn)在的公職人員都不收禮了?

細(xì)說職場(chǎng)
2025-12-26 14:42:08
日本!徹底攤牌了!

日本!徹底攤牌了!

大嘴說天下
2025-12-26 23:40:02
格局高下立判!前央視主持劉芳菲登門向龐叔令道歉,龐叔令家裝修曝光,網(wǎng)友直呼沒想到

格局高下立判!前央視主持劉芳菲登門向龐叔令道歉,龐叔令家裝修曝光,網(wǎng)友直呼沒想到

別人都叫我阿螫
2025-12-27 06:51:17
關(guān)于在烏克蘭的傷亡,做一道簡(jiǎn)單計(jì)算題:參戰(zhàn)的90萬俄軍去哪兒了

關(guān)于在烏克蘭的傷亡,做一道簡(jiǎn)單計(jì)算題:參戰(zhàn)的90萬俄軍去哪兒了

鷹眼Defence
2025-12-26 18:03:30
這么踢還能轉(zhuǎn)會(huì)?齊爾克澤7次對(duì)抗僅1成功,80分鐘反擊勻速跑

這么踢還能轉(zhuǎn)會(huì)?齊爾克澤7次對(duì)抗僅1成功,80分鐘反擊勻速跑

懂球帝
2025-12-27 08:20:07
第一批免簽去俄羅斯的中產(chǎn)傻眼了

第一批免簽去俄羅斯的中產(chǎn)傻眼了

風(fēng)向觀察
2025-12-16 18:26:08
美國(guó)經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日?qǐng)?bào)》

美國(guó)經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日?qǐng)?bào)》

那些看得見的老照片
2025-12-17 17:13:44
歐文:現(xiàn)在不會(huì)和希勒有任何交流,他當(dāng)年對(duì)我的批評(píng)是個(gè)錯(cuò)誤

歐文:現(xiàn)在不會(huì)和希勒有任何交流,他當(dāng)年對(duì)我的批評(píng)是個(gè)錯(cuò)誤

懂球帝
2025-12-27 04:25:05
《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無愧

《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無愧

白面書誏
2025-12-26 16:04:00
一臨時(shí)工結(jié)交總參少將,空降廣西當(dāng)副市長(zhǎng),頗得民心,后來怎樣了

一臨時(shí)工結(jié)交總參少將,空降廣西當(dāng)副市長(zhǎng),頗得民心,后來怎樣了

老黃有話
2024-11-04 08:00:14
《老舅》10位美女顏值排名,姚安娜第9,王佳佳第4,第1實(shí)至名歸

《老舅》10位美女顏值排名,姚安娜第9,王佳佳第4,第1實(shí)至名歸

觀察鑒娛
2025-12-27 10:06:16
迪麗熱巴“天使蹲”火出圈,顏值驚艷全網(wǎng),醫(yī)生:無基礎(chǔ)者慎入

迪麗熱巴“天使蹲”火出圈,顏值驚艷全網(wǎng),醫(yī)生:無基礎(chǔ)者慎入

悠悠說世界
2025-12-21 08:34:39
2026車市大逃殺:補(bǔ)貼花完,透支的惡果終于來了!

2026車市大逃殺:補(bǔ)貼花完,透支的惡果終于來了!

音樂時(shí)光的娛樂
2025-12-26 00:47:00
55歲鐘麗緹中年發(fā)福太多!胖到180斤 胸大腚圓 滿身肥肉穿吊帶

55歲鐘麗緹中年發(fā)福太多!胖到180斤 胸大腚圓 滿身肥肉穿吊帶

廣西阿妹香香
2025-12-20 15:58:58
2025-12-27 11:07:00
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動(dòng)態(tài),聚焦認(rèn)知與神經(jīng)新研究
79文章數(shù) 6關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質(zhì)保期

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質(zhì)保期

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

保時(shí)捷經(jīng)銷商連夜閉店,維權(quán)車主寒風(fēng)中瑟瑟發(fā)抖

態(tài)度原創(chuàng)

親子
本地
游戲
數(shù)碼
公開課

親子要聞

時(shí)隔五年我又寫了一本育兒書,破解養(yǎng)育困境

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

PS前CEO:平臺(tái)獨(dú)占仍在發(fā)力 專注能將性能推向極致

數(shù)碼要聞

網(wǎng)友反饋RTX 5090顯卡圣誕夜起火,接口燒至“面目全非”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版