国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

貝葉斯推斷與頻率學(xué)派推斷在生物模型中的比較:準(zhǔn)確性、不確定性與可識(shí)別性的對(duì)比分析

0
分享至

貝葉斯推斷與頻率學(xué)派推斷在生物模型中的比較:準(zhǔn)確性、不確定性與可識(shí)別性的對(duì)比分析

https://arxiv.org/pdf/2511.15839

Comparing Bayesian and Frequentist Inference in Biological Models: A Comparative Analysis of Accuracy, Uncertainty, and Identifiability



摘 要
數(shù)學(xué)模型在生態(tài)學(xué)和流行病學(xué)中的推斷與預(yù)測(cè)中發(fā)揮著重要作用,但結(jié)果依賴于所采用的估計(jì)框架。本文在三個(gè)生物模型和四個(gè)數(shù)據(jù)集上比較了貝葉斯方法與頻率學(xué)派方法:洛特卡–沃爾泰拉(Lotka–Volterra)捕食者–獵物動(dòng)力學(xué)模型(哈德遜灣數(shù)據(jù))、廣義邏輯模型(肺損傷數(shù)據(jù)和2022年美國(guó)猴痘疫情數(shù)據(jù)),以及SEIUR流行病模型(西班牙的COVID-19疫情數(shù)據(jù))。為確保公平比較,兩種方法均采用正態(tài)誤差結(jié)構(gòu)。我們首先評(píng)估了結(jié)構(gòu)可識(shí)別性(structural identifiability),以確定哪些參數(shù)理論上可從數(shù)據(jù)中恢復(fù)。隨后,我們使用四個(gè)指標(biāo)評(píng)估了實(shí)際可識(shí)別性(practical identifiability)和預(yù)測(cè)性能:平均絕對(duì)誤差(MAE)、均方誤差(MSE)、95%預(yù)測(cè)區(qū)間(PI)覆蓋率,以及加權(quán)區(qū)間評(píng)分(WIS)。對(duì)于同時(shí)擁有獵物和捕食者數(shù)據(jù)的Lotka–Volterra模型,我們分析了三種觀測(cè)情景:僅觀測(cè)獵物、僅觀測(cè)捕食者,以及兩者同時(shí)觀測(cè)。頻率學(xué)派工作流通過(guò)MATLAB中的QuantDiffForecast(QDF)實(shí)現(xiàn),該方法利用非線性最小二乘法擬合常微分方程(ODE)模型,并通過(guò)參數(shù)化自助法(parametric bootstrap)量化不確定性。貝葉斯工作流則通過(guò)BayesianFitForecast(BFF)實(shí)現(xiàn),該方法利用Stan平臺(tái)進(jìn)行哈密頓蒙特卡洛(Hamiltonian Monte Carlo)采樣,生成后驗(yàn)分布,并提供諸如Gelman–Rubin ?R統(tǒng)計(jì)量等診斷指標(biāo)。結(jié)果表明,在數(shù)據(jù)豐富、觀測(cè)充分的情境下(例如肺損傷和猴痘的廣義邏輯模型,或Lotka–Volterra模型中同時(shí)觀測(cè)到兩個(gè)物種時(shí)),頻率學(xué)派推斷表現(xiàn)最佳;相比之下,當(dāng)潛變量不確定性高、數(shù)據(jù)稀疏或部分觀測(cè)時(shí)(如西班牙COVID-19的SEIUR模型),貝葉斯推斷更具優(yōu)勢(shì)。結(jié)構(gòu)可識(shí)別性分析進(jìn)一步闡明了這些模式:完全可觀測(cè)性可提升兩種框架的性能,而觀測(cè)受限則無(wú)論采用何種方法都會(huì)限制參數(shù)的可恢復(fù)性。本比較分析為根據(jù)數(shù)據(jù)豐富度、可觀測(cè)性以及不確定性量化需求選擇合適的推斷框架提供了實(shí)用指導(dǎo)。

1 引言

基于常微分方程(ODE)的數(shù)學(xué)模型是理解和預(yù)測(cè)生態(tài)學(xué)與流行病學(xué)動(dòng)態(tài)的重要工具[1, 2, 3]。在過(guò)去十年中,基于模型的預(yù)測(cè)在應(yīng)對(duì)重大公共衛(wèi)生危機(jī)中發(fā)揮了關(guān)鍵作用。在COVID-19大流行期間,預(yù)測(cè)結(jié)果指導(dǎo)了資源分配和社會(huì)隔離政策的制定[4, 5, 6, 7, 8, 9, 3]。美國(guó)疾控中心(CDC)的FluSight挑戰(zhàn)賽利用模型優(yōu)化流感疫苗分發(fā)和公共衛(wèi)生信息傳播[10, 11, 12]。在西非和剛果民主共和國(guó)(DRC)的埃博拉疫情中,模型用于預(yù)測(cè)傳播模式并評(píng)估干預(yù)措施的有效性[13, 14, 15, 16, 17, 18]。最近,針對(duì)猴痘(mpox)的預(yù)測(cè)模型被用于預(yù)測(cè)其傳播趨勢(shì)并評(píng)估防控措施[19, 20, 21, 22]。在生態(tài)學(xué)領(lǐng)域,捕食者–獵物模型有助于預(yù)測(cè)種群動(dòng)態(tài)并為保護(hù)策略提供依據(jù)[23]。這些應(yīng)用表明,可靠的預(yù)測(cè)依賴于準(zhǔn)確的參數(shù)估計(jì)[24, 25, 26]。

然而,從數(shù)據(jù)中恢復(fù)有意義參數(shù)的能力關(guān)鍵取決于可識(shí)別性(identifiability)——即模型參數(shù)是否能從現(xiàn)有觀測(cè)數(shù)據(jù)中唯一確定[27, 28, 29]。當(dāng)數(shù)據(jù)稀疏、模型過(guò)度參數(shù)化或參數(shù)間存在強(qiáng)相關(guān)性時(shí),可識(shí)別性可能失效,從而導(dǎo)致誤導(dǎo)性的推斷和不可靠的預(yù)測(cè)。近期研究表明,諸如疫苗接種行為、免疫持續(xù)時(shí)間以及數(shù)據(jù)完整性等因素,既塑造了疫情的發(fā)展軌跡,也影響了參數(shù)估計(jì)的可靠性[30]。理解可識(shí)別性如何與估計(jì)框架相互作用,對(duì)于確?;谀P偷念A(yù)測(cè)具有可解釋性和可重復(fù)性至關(guān)重要。結(jié)構(gòu)可識(shí)別性(structural identifiability)或?qū)嶋H可識(shí)別性(practical identifiability)的限制,即使在模型和數(shù)據(jù)完全相同的情況下,也可能導(dǎo)致兩種推斷框架產(chǎn)生不同的結(jié)果。

目前,該領(lǐng)域主要采用兩種估計(jì)范式:貝葉斯方法與頻率學(xué)派方法。頻率學(xué)派方法通常通過(guò)優(yōu)化似然函數(shù)或最小化目標(biāo)函數(shù)(如觀測(cè)值與預(yù)測(cè)值之間平方差之和)來(lái)校準(zhǔn)ODE模型[31, 32, 33, 34]。這些方法使用梯度下降或Levenberg-Marquardt等算法,假設(shè)測(cè)量誤差服從特定分布(如高斯分布或泊松分布),并通過(guò)自助法(bootstrapping)技術(shù)量化不確定性[35, 36, 37, 38, 39, 40, 41, 42]。當(dāng)數(shù)據(jù)豐富且質(zhì)量較高時(shí),頻率學(xué)派方法計(jì)算效率高,通常表現(xiàn)良好[43, 25]。QuantDiffForecast(QDF)工具箱實(shí)現(xiàn)了這一工作流,用于擬合模型并生成帶有不確定性量化的預(yù)測(cè)[44]。

相比之下,貝葉斯方法應(yīng)用貝葉斯定理,將參數(shù)的先驗(yàn)分布與觀測(cè)數(shù)據(jù)的似然函數(shù)相結(jié)合,生成后驗(yàn)分布,從而顯式地納入不確定性[45, 46, 47, 48, 49, 50, 51, 52]。這類方法通常使用馬爾可夫鏈蒙特卡洛(MCMC)算法近似后驗(yàn)分布,提供全面的參數(shù)不確定性度量和可信區(qū)間[53, 54, 55, 56, 57, 58]。貝葉斯方法能更好地探索復(fù)雜的參數(shù)空間,避免陷入局部最優(yōu),并有效處理不完整或噪聲較大的數(shù)據(jù)[59, 60, 61]。Stan等工具促進(jìn)了貝葉斯估計(jì)與預(yù)測(cè),支持嚴(yán)格的不確定性量化和模型驗(yàn)證[62, 63, 64, 26, 65, 66]。BayesianFitForecast(BFF)工具箱實(shí)現(xiàn)了該工作流,并包含Gelman–Rubin ?R統(tǒng)計(jì)量等診斷指標(biāo)。

盡管兩種范式已被廣泛使用,但以往的比較研究常常在模型、似然函數(shù)或預(yù)處理步驟上存在差異,使得難以將觀察到的性能差異歸因于估計(jì)框架本身[67]。為填補(bǔ)這一空白,我們?cè)跇?biāo)準(zhǔn)化條件下對(duì)貝葉斯與頻率學(xué)派推斷進(jìn)行受控比較:使用相同的模型、相同的正態(tài)誤差結(jié)構(gòu),以及統(tǒng)一的數(shù)據(jù)預(yù)處理流程。我們分析了三個(gè)系統(tǒng)和四個(gè)數(shù)據(jù)集,代表了不同復(fù)雜度和可觀測(cè)性水平:洛特卡–沃爾泰拉(Lotka–Volterra, LV)捕食者–獵物模型(哈德遜灣猞猁–野兔數(shù)據(jù))、用于肺損傷和2022年美國(guó)猴痘暴發(fā)的廣義邏輯模型(GLM),以及用于西班牙第一波COVID-19疫情的SEIUR流行病模型[23, 68, 69, 70]。對(duì)于LV模型,我們分析了三種觀測(cè)情景(僅獵物、僅捕食者、兩者同時(shí)觀測(cè)),以評(píng)估部分可觀測(cè)性對(duì)參數(shù)恢復(fù)的影響。

我們整合了結(jié)構(gòu)可識(shí)別性分析,以確定哪些參數(shù)理論上可從數(shù)據(jù)中恢復(fù),從而將數(shù)據(jù)本身的固有限制與算法限制區(qū)分開來(lái)[71, 72, 73]。隨后,我們使用四個(gè)指標(biāo)評(píng)估實(shí)際可識(shí)別性與預(yù)測(cè)性能:平均絕對(duì)誤差(MAE)、均方誤差(MSE)、95%預(yù)測(cè)區(qū)間(PI)覆蓋率,以及加權(quán)區(qū)間評(píng)分(WIS)[74, 75, 76, 25, 26, 77]。

本研究的目標(biāo)是:(i) 比較貝葉斯與頻率學(xué)派推斷在預(yù)測(cè)精度上的差異;(ii) 評(píng)估不確定性校準(zhǔn)效果與診斷性能;(iii) 將觀測(cè)到的性能差異與結(jié)構(gòu)可識(shí)別性及實(shí)際可識(shí)別性在完全觀測(cè)與部分觀測(cè)條件下的表現(xiàn)聯(lián)系起來(lái)。這為根據(jù)數(shù)據(jù)豐富度、可觀測(cè)性以及不確定性量化需求選擇合適范式提供了實(shí)用指導(dǎo)[26, 25]。

本文其余部分組織如下:第2節(jié)描述本研究分析的四個(gè)數(shù)據(jù)集,包括哈德遜灣猞猁–野兔數(shù)據(jù)、肺損傷暴發(fā)數(shù)據(jù)、猴痘疫情數(shù)據(jù)以及西班牙的COVID-19數(shù)據(jù)。第3節(jié)介紹所采用的三個(gè)數(shù)學(xué)模型:Lotka–Volterra捕食者–獵物模型、廣義邏輯模型和SEIUR流行病模型。第4節(jié)詳述貝葉斯與頻率學(xué)派的推斷方法,包括似然設(shè)定、先驗(yàn)分布、不確定性量化流程和性能評(píng)估指標(biāo)。第5節(jié)對(duì)所有模型在不同觀測(cè)情景下進(jìn)行結(jié)構(gòu)可識(shí)別性分析,確立參數(shù)恢復(fù)的理論邊界。第6節(jié)報(bào)告實(shí)證結(jié)果,包括參數(shù)估計(jì)、性能指標(biāo)以及所有模型和數(shù)據(jù)集的收斂診斷。第7節(jié)討論部分綜合研究發(fā)現(xiàn),闡釋結(jié)構(gòu)可識(shí)別性在解釋性能差異中的作用,并為方法選擇提供實(shí)踐建議。第8節(jié)結(jié)論部分總結(jié)主要貢獻(xiàn)及其對(duì)生物建模實(shí)踐的意義。

2 數(shù) 據(jù)



2.1 哈德遜灣猞猁–野兔數(shù)據(jù)
哈德遜灣猞猁–野兔數(shù)據(jù)集包含1900年至1920年間加拿大猞猁(Lynx canadensis)和雪鞋兔(Lepus americanus)的年度種群數(shù)量記錄,這些數(shù)據(jù)源自哈德遜灣公司(Hudson’s Bay Company)的毛皮回收記錄[78, 79]。這些記錄被用作種群豐度的代理指標(biāo),毛皮數(shù)量反映了相對(duì)種群規(guī)模。該數(shù)據(jù)集包含N = 21個(gè)年度觀測(cè)值,分別對(duì)應(yīng)獵物(野兔)和捕食者(猞猁)的種群數(shù)量。由于該數(shù)據(jù)集在多個(gè)種群周期內(nèi)同時(shí)提供了兩個(gè)相互作用物種的觀測(cè)數(shù)據(jù),因此特別適用于評(píng)估捕食者–獵物動(dòng)態(tài)中的參數(shù)可識(shí)別性。該數(shù)據(jù)集已被廣泛用作生態(tài)模型和參數(shù)估計(jì)方法的基準(zhǔn)測(cè)試數(shù)據(jù)。原始數(shù)據(jù)未進(jìn)行任何平滑、插值或填補(bǔ)處理。

2.2 肺損傷數(shù)據(jù)(EVALI)
該數(shù)據(jù)集包含2019年美國(guó)報(bào)告的電子煙或 vaping 產(chǎn)品使用相關(guān)肺損傷(EVALI)的周新增病例數(shù)[80, 81, 82]。此次疫情于2019年6月中旬首次被發(fā)現(xiàn),病例數(shù)在夏季和秋季迅速上升,并于2019年11月前開始下降。我們分析了從2019年6月中旬至11月初約N ≈ 21周的數(shù)據(jù),這些數(shù)據(jù)來(lái)自美國(guó)疾病控制與預(yù)防中心(CDC)《發(fā)病率與死亡率周報(bào)》(MMWR)監(jiān)測(cè)系統(tǒng)。病例定義遵循CDC對(duì)確診和疑似EVALI病例的標(biāo)準(zhǔn)。數(shù)據(jù)按流行病學(xué)周(MMWR周)匯總,除官方CDC報(bào)告中已包含的回填修正外,未進(jìn)行額外的回填校正。該數(shù)據(jù)集代表了一次持續(xù)時(shí)間較短、具有明確峰值的疫情暴發(fā),適合用于在清晰界定的流行病動(dòng)態(tài)下測(cè)試現(xiàn)象學(xué)增長(zhǎng)模型。

2.3 猴痘數(shù)據(jù)(美國(guó),2022年)
我們分析了2022–2023年猴痘疫情暴發(fā)期間美國(guó)每周報(bào)告的新增確診或疑似猴痘病例數(shù),數(shù)據(jù)來(lái)源見[83, 84]。此次疫情始于2022年5月,于2022年8月達(dá)到高峰,隨后在2023年初逐步下降。數(shù)據(jù)由CDC國(guó)家監(jiān)測(cè)報(bào)告按MMWR周匯總而成。病例定義遵循CDC指南:確診病例指經(jīng)實(shí)驗(yàn)室確認(rèn)為正痘病毒且樣本分型為猴痘病毒的病例;疑似病例指與確診病例有流行病學(xué)關(guān)聯(lián)但未經(jīng)實(shí)驗(yàn)室確認(rèn)的病例。所分析的時(shí)間窗口對(duì)應(yīng)于CDC監(jiān)測(cè)儀表板中公開報(bào)告的時(shí)期(具體訪問(wèn)日期參見參考文獻(xiàn))。該數(shù)據(jù)集代表了一種在強(qiáng)化監(jiān)測(cè)和公共衛(wèi)生響應(yīng)下出現(xiàn)的新發(fā)傳染病疫情,可用于評(píng)估模型在快速演變的流行病情境中的表現(xiàn)。

2.4 COVID-19數(shù)據(jù)(西班牙,第一波疫情)
該數(shù)據(jù)集包含2020年2月至5月西班牙第一波疫情暴發(fā)期間每日?qǐng)?bào)告的實(shí)驗(yàn)室確診COVID-19新增病例數(shù)[85, 86]。數(shù)據(jù)由西班牙衛(wèi)生部(Ministerio de Sanidad)官方報(bào)告匯編而成,由于疫情早期響應(yīng)階段數(shù)據(jù)可得性的限制,病例日期基于報(bào)告日期而非癥狀 onset 日期。西班牙第一波疫情呈現(xiàn)快速指數(shù)增長(zhǎng),于2020年3月底達(dá)到峰值,隨后因?qū)嵤﹪?yán)格的非藥物干預(yù)措施(包括全國(guó)封鎖)而下降。為避免后期疫情中因監(jiān)測(cè)方案變更、干預(yù)政策調(diào)整及新變異株出現(xiàn)所帶來(lái)的復(fù)雜性,我們將分析限定在第一波疫情期內(nèi)。官方數(shù)據(jù)發(fā)布中明確標(biāo)注的已知報(bào)告異常(reporting artifacts)已被排除。該數(shù)據(jù)集代表了一次大規(guī)模疫情,存在顯著的漏報(bào)問(wèn)題以及潛伏狀態(tài)(暴露者和未報(bào)告的感染者),因此非常適合用于在部分可觀測(cè)性和模型復(fù)雜性條件下評(píng)估不同推斷方法的性能。

2.5 預(yù)處理總結(jié)

所有數(shù)據(jù)集均采用標(biāo)準(zhǔn)化流程進(jìn)行處理,以確保不同推斷方法之間的可比性。預(yù)處理步驟如下:

時(shí)間聚合:哈德遜灣猞猁–野兔數(shù)據(jù)按原始發(fā)表形式使用,未進(jìn)行任何聚合。肺損傷和猴痘數(shù)據(jù)按周(CDC MMWR流行病學(xué)周)進(jìn)行聚合,與官方監(jiān)測(cè)報(bào)告一致。西班牙的COVID-19數(shù)據(jù)則按西班牙衛(wèi)生部發(fā)布的每日數(shù)據(jù)進(jìn)行分析。

數(shù)據(jù)類型:哈德遜灣數(shù)據(jù)集代表種群豐度(毛皮數(shù)量),而所有流行病數(shù)據(jù)集(肺損傷、猴痘、COVID-19)均表示每個(gè)報(bào)告周期內(nèi)的新增病例數(shù)。對(duì)于廣義邏輯模型(GLM),通過(guò)累加新增病例數(shù)得到累計(jì)病例數(shù);模型預(yù)測(cè)通過(guò)累計(jì)病例對(duì)時(shí)間的導(dǎo)數(shù)與新增病例數(shù)據(jù)進(jìn)行比較。

缺失值:用于模型擬合的最終時(shí)間窗口內(nèi)不存在缺失值,未進(jìn)行任何插補(bǔ)處理。

平滑處理:在參數(shù)估計(jì)或預(yù)測(cè)中未對(duì)數(shù)據(jù)應(yīng)用任何平滑處理。圖示中可能出于可視化目的疊加了平滑曲線,但這些平滑曲線未用于模型擬合。

時(shí)間窗口:校準(zhǔn)與預(yù)測(cè)所用的時(shí)間窗口根據(jù)疫情階段和數(shù)據(jù)可得性選定。各數(shù)據(jù)集的具體時(shí)間窗口在結(jié)果部分予以說(shuō)明。

數(shù)據(jù)質(zhì)量控制:對(duì)于COVID-19數(shù)據(jù),明確在西班牙衛(wèi)生部官方發(fā)布中標(biāo)注的已知報(bào)告異常(如數(shù)據(jù)修正或延遲上報(bào))已被排除。其他所有數(shù)據(jù)集均直接采用官方監(jiān)測(cè)報(bào)告中的原始發(fā)布數(shù)據(jù),未進(jìn)行額外修正。

3 模 型

本研究采用了三種隔室型生物與流行病學(xué)模型,以全面評(píng)估兩種推斷方法(貝葉斯與頻率學(xué)派)在參數(shù)可識(shí)別性方面的表現(xiàn):(i) LV模型,用于描述捕食者–獵物相互作用及種群反饋機(jī)制;(ii) 廣義邏輯模型(Generalized Logistic Model, GLM),通過(guò)非線性病例動(dòng)態(tài)刻畫靈活的疫情增長(zhǎng)模式;(iii) SEIUR模型,顯式追蹤易感者(Susceptible)、潛伏者(Exposed)、感染者(包括已報(bào)告和未報(bào)告的 Infectious)以及康復(fù)者(Recovered)人群,以同時(shí)考慮觀測(cè)到的和隱藏的傳播過(guò)程。這些模型的選擇旨在體現(xiàn)模型復(fù)雜度與數(shù)據(jù)可觀測(cè)性的遞進(jìn)關(guān)系:從完全可觀測(cè)的生態(tài)系統(tǒng)(LV),到結(jié)構(gòu)簡(jiǎn)潔的單方程疫情模型(GLM),再到具有部分可觀測(cè)性的多隔室潛變量模型(SEIUR)。這一遞進(jìn)結(jié)構(gòu)使得我們能夠系統(tǒng)地比較貝葉斯與頻率學(xué)派推斷方法在模型結(jié)構(gòu)復(fù)雜性和潛變量不確定性逐步增加條件下的性能表現(xiàn)。

LV模型:LV方程(Lotka, 1925;Volterra, 1926, 1927)由一對(duì)一階常微分方程(ODE)組成,用于描述兩個(gè)相互作用物種的種群動(dòng)態(tài):一個(gè)捕食者和一個(gè)獵物。令 x 表示時(shí)刻 t 的獵物種群數(shù)量, y 表示捕食者種群數(shù)量。Volterra 將這兩個(gè)種群的時(shí)間動(dòng)態(tài)建模如下:





該模型代表了一種更為真實(shí)的流行病過(guò)程,同時(shí)包含可觀測(cè)狀態(tài)和隱藏狀態(tài),因此非常適合用于檢驗(yàn)貝葉斯方法與頻率學(xué)派方法在處理潛變量、參數(shù)耦合以及部分可識(shí)別性問(wèn)題時(shí)的表現(xiàn)。


4 方法


4.1 貝葉斯推斷

貝葉斯推斷將先驗(yàn)知識(shí)與觀測(cè)數(shù)據(jù)相結(jié)合,以獲得模型參數(shù)的后驗(yàn)分布[89]。當(dāng)存在先驗(yàn)信息,或數(shù)據(jù)稀疏、含噪或部分可觀測(cè)時(shí),這一概率框架尤為有效,因?yàn)樗ㄟ^(guò)后驗(yàn)分布提供全面的不確定性量化[51, 49]。

4.1.1 貝葉斯定理

根據(jù)貝葉斯定理,給定數(shù)據(jù)的參數(shù)后驗(yàn)分布正比于先驗(yàn)分布與似然函數(shù)的乘積:


其中, p ( θ )
是先驗(yàn)分布,用于編碼在觀測(cè)數(shù)據(jù)之前關(guān)于參數(shù)的已有知識(shí); p ( Y ∣ θ ) 是似然函數(shù),表示在給定參數(shù)值下觀測(cè)到數(shù)據(jù)的概率; p ( θ ∣ Y )
是在結(jié)合觀測(cè)數(shù)據(jù)后得到的參數(shù)后驗(yàn)分布。

4.1.2 似然函數(shù)

我們假設(shè)觀測(cè)誤差獨(dú)立同分布(i.i.d.),服從方差恒定的正態(tài)分布。對(duì)于同時(shí)觀測(cè)到獵物和捕食者種群數(shù)量的LV模型,其似然函數(shù)為:



后驗(yàn)摘要以中位數(shù)及95%可信區(qū)間(CrIs)報(bào)告,這些區(qū)間代表后驗(yàn)分布的中心95%部分。在預(yù)測(cè)時(shí),我們從后驗(yàn)分布中抽取參數(shù)值,針對(duì)每個(gè)樣本求解常微分方程(ODE),并匯總所得預(yù)測(cè)分布,最終以中位數(shù)和95%預(yù)測(cè)區(qū)間(PIs)呈現(xiàn)結(jié)果。

4.1.5 計(jì)算實(shí)現(xiàn)

貝葉斯推斷通過(guò) BayesianFitForecast(BFF)工具箱[26]進(jìn)行,該工具箱是一個(gè)專為擬合和預(yù)測(cè)基于常微分方程(ODE)的流行病模型而設(shè)計(jì)的R語(yǔ)言軟件包。BFF工具箱提供了一套自動(dòng)化工作流:根據(jù)用戶指定的模型結(jié)構(gòu)、先驗(yàn)分布和數(shù)據(jù)輸入自動(dòng)生成Stan代碼,無(wú)需用戶直接編寫Stan程序。工具箱輸出包括參數(shù)的后驗(yàn)分布、收斂診斷指標(biāo)(如 R ^ R^、有效樣本量ESS)、軌跡圖、后驗(yàn)密度圖,以及帶有不確定性量化的預(yù)測(cè)結(jié)果。模型擬合與預(yù)測(cè)精度的性能指標(biāo)(包括平均絕對(duì)誤差(MAE)、均方誤差(MSE)、加權(quán)區(qū)間評(píng)分(WIS)和95%預(yù)測(cè)區(qū)間覆蓋率)均自動(dòng)計(jì)算。

4.2 頻率學(xué)派推斷

頻率學(xué)派估計(jì)將模型參數(shù)視為固定但未知的量,僅基于觀測(cè)數(shù)據(jù)、不引入先驗(yàn)信息,通過(guò)優(yōu)化目標(biāo)函數(shù)來(lái)估計(jì)參數(shù)[92, 93]。其不確定性量化通過(guò)自助法(bootstrap)重采樣程序?qū)崿F(xiàn)。

4.2.1 參數(shù)估計(jì)

在假設(shè)觀測(cè)誤差服從方差恒定的正態(tài)分布(與貝葉斯方法保持一致)的前提下,參數(shù)估計(jì)通過(guò)最小化觀測(cè)數(shù)據(jù)與模型預(yù)測(cè)值之間的殘差平方和獲得。這對(duì)應(yīng)于非線性最小二乘(Nonlinear Least Squares, NLS)估計(jì):


4.2.2 通過(guò)參數(shù)化自助法進(jìn)行不確定性量化
為量化參數(shù)不確定性并構(gòu)建置信區(qū)間,我們采用參數(shù)化自助法(parametric bootstrap)[92, 94]。該方法通過(guò)從擬合模型中生成合成數(shù)據(jù)集,并對(duì)每個(gè)合成數(shù)據(jù)集重新估計(jì)參數(shù)。自助法所得參數(shù)估計(jì)值的分布用于刻畫抽樣變異性。具體步驟如下:



4.2.3 計(jì)算實(shí)現(xiàn)
頻率學(xué)派推斷通過(guò) QuantDiffForecast(QDF)MATLAB 工具箱實(shí)現(xiàn)[25],該工具箱為常微分方程(ODE)模型提供了完整的參數(shù)估計(jì)、不確定性量化和預(yù)測(cè)框架。QDF 工具箱支持多種優(yōu)化算法、靈活的誤差結(jié)構(gòu)(正態(tài)、泊松、負(fù)二項(xiàng)分布)、用戶自定義的 ODE 系統(tǒng),以及基于自助法的自動(dòng)化不確定性量化。工具箱輸出包括帶置信區(qū)間的參數(shù)估計(jì)值、擬合的模型軌跡、預(yù)測(cè)分布以及性能指標(biāo)(MAE、MSE、WIS、95% PI 覆蓋率)。

4.3 性能評(píng)估指標(biāo)


4.3.1 平均絕對(duì)誤差(MAE)

MAE 衡量模型預(yù)測(cè)值與觀測(cè)數(shù)據(jù)之間的平均絕對(duì)偏差:


MAE 在原始數(shù)據(jù)尺度上直接衡量預(yù)測(cè)準(zhǔn)確性。MAE 值越低,表示點(diǎn)預(yù)測(cè)性能越好。與 MSE 相比,MAE 對(duì)異常值的敏感性較低。

4.3.2 均方誤差(MSE)
MSE 衡量模型預(yù)測(cè)值與觀測(cè)數(shù)據(jù)之間的平均平方偏差:


由于平方運(yùn)算,MSE 對(duì)較大誤差的懲罰比 MAE 更重,因此對(duì)異常值更為敏感。MSE 值越低,表示擬合效果越好。有時(shí)會(huì)報(bào)告 MSE 的平方根(即均方根誤差,RMSE),以將該指標(biāo)恢復(fù)到原始數(shù)據(jù)的尺度。

4.3.3 95% 預(yù)測(cè)區(qū)間的覆蓋率
95% 預(yù)測(cè)區(qū)間(PI)覆蓋率用于量化落在 95% 預(yù)測(cè)區(qū)間內(nèi)的觀測(cè)數(shù)據(jù)點(diǎn)所占的比例,從而衡量不確定性校準(zhǔn)的程度:



4.3.4 加權(quán)區(qū)間評(píng)分(WIS)
WIS 是一種合適的評(píng)分規(guī)則,通過(guò)結(jié)合“銳度”(即區(qū)間寬度)和“校準(zhǔn)性”(對(duì)落在區(qū)間外觀測(cè)值的懲罰)來(lái)評(píng)估整個(gè)預(yù)測(cè)分布的質(zhì)量[77, 96]。在置信水平 α α 下,單個(gè)預(yù)測(cè)區(qū)間的區(qū)間評(píng)分(IS)定義為:


4.3.5 指標(biāo)解釋
MAE、MSE 和 WIS 的值越低,表明模型性能越好。對(duì)于 95% 預(yù)測(cè)區(qū)間覆蓋率,其值越接近 95%,說(shuō)明不確定性估計(jì)的校準(zhǔn)效果越好。綜合來(lái)看,這些指標(biāo)全面評(píng)估了點(diǎn)預(yù)測(cè)的準(zhǔn)確性(MAE、MSE)、分布預(yù)測(cè)的質(zhì)量(WIS)以及不確定性校準(zhǔn)程度(95% PI 覆蓋率)。我們分別報(bào)告校準(zhǔn)期(樣本內(nèi)擬合)和預(yù)測(cè)期(樣本外預(yù)測(cè))的這些指標(biāo),以區(qū)分模型擬合能力與預(yù)測(cè)性能。

5 結(jié)構(gòu)可識(shí)別性
結(jié)構(gòu)可識(shí)別性(Structural Identifiability, SI)分析用于判斷在給定模型結(jié)構(gòu)和觀測(cè)方案的前提下,模型參數(shù)原則上是否能從理想、無(wú)噪聲的系統(tǒng)輸出觀測(cè)中被唯一恢復(fù)[97, 27, 72]。若一個(gè)參數(shù)的值可通過(guò)模型方程所定義的輸入–輸出關(guān)系及可觀測(cè)變量集合被唯一確定,則該參數(shù)是結(jié)構(gòu)可識(shí)別的;反之,若多個(gè)不同的參數(shù)值產(chǎn)生完全相同的模型輸出,則該參數(shù)是結(jié)構(gòu)不可識(shí)別的——無(wú)論數(shù)據(jù)質(zhì)量或數(shù)量如何,都無(wú)法唯一恢復(fù)其真實(shí)值。

結(jié)構(gòu)可識(shí)別性是有意義參數(shù)估計(jì)的前提:如果一個(gè)參數(shù)在結(jié)構(gòu)上不可識(shí)別,那么無(wú)論擁有多少數(shù)據(jù)或采用多么復(fù)雜的推斷方法,都無(wú)法恢復(fù)其真實(shí)值[28, 98]。在隔室模型中,當(dāng)僅有部分狀態(tài)變量被觀測(cè)時(shí),SI 分析尤為重要,因?yàn)椴糠挚捎^測(cè)性常常導(dǎo)致可識(shí)別性缺陷[73]。理解在不同觀測(cè)情景下哪些參數(shù)是可識(shí)別的,有助于指導(dǎo)實(shí)驗(yàn)設(shè)計(jì)、為貝葉斯推斷中的先驗(yàn)設(shè)定提供依據(jù),并幫助解釋參數(shù)估計(jì)結(jié)果。

5.1 方法
我們使用 StructuralIdentifiability.jl [72] 進(jìn)行符號(hào)化的結(jié)構(gòu)可識(shí)別性分析。這是一個(gè)基于 Julia 語(yǔ)言的軟件包,采用微分代數(shù)方法來(lái)判定 ODE 模型中參數(shù)的可識(shí)別性。針對(duì)每個(gè)模型,我們分析了兩種情景:(1) 初始條件(ICs)已知,即假設(shè)所有狀態(tài)變量的初始值精確已知;(2) 初始條件未知,即將初始條件視為需額外估計(jì)的未知參數(shù)。區(qū)分初始條件是否已知至關(guān)重要,因?yàn)榭勺R(shí)別性結(jié)論會(huì)因是否需要從數(shù)據(jù)中推斷初始條件而顯著不同[71]。

對(duì)于 Lotka–Volterra(LV)模型,我們考察了三種觀測(cè)方案,以評(píng)估部分可觀測(cè)性對(duì)可識(shí)別性的影響:

  • LV-1(獵物和捕食者均被觀測(cè)):同時(shí)觀測(cè)獵物種群 x ( t ) 和捕食者種群 y ( t ) 。


5.2 結(jié)果

表2 總結(jié)了所有模型在不同觀測(cè)方案和初始條件假設(shè)下的結(jié)構(gòu)可識(shí)別性結(jié)果。


5.3 解釋

Lotka–Volterra 模型:當(dāng)捕食者與獵物的時(shí)間序列均被觀測(cè)(LV-1)時(shí),所有模型參數(shù)(α, β, γ, δ)在結(jié)構(gòu)上均可識(shí)別,無(wú)論初始條件是否已知。兩個(gè)物種的耦合動(dòng)力學(xué)提供了足夠的信息,可唯一確定所有相互作用參數(shù)。

在部分觀測(cè)情況下,若初始條件未知,則會(huì)出現(xiàn)可識(shí)別性損失。當(dāng)僅觀測(cè)捕食者(LV-2)時(shí),獵物由消耗產(chǎn)生的增長(zhǎng)參數(shù) δ 以及獵物種群軌跡 x(t) 變得不可識(shí)別。這是因?yàn)橛^測(cè)到的捕食者動(dòng)力學(xué)僅能約束乘積項(xiàng) δx(t),而無(wú)法單獨(dú)區(qū)分 δ 和 x(t),從而導(dǎo)致結(jié)構(gòu)性非唯一性。類似地,當(dāng)僅觀測(cè)獵物(LV-3)時(shí),捕食率 β 和捕食者種群 y(t) 不可識(shí)別,因?yàn)楂C物動(dòng)力學(xué)僅能約束乘積項(xiàng) βy(t)。

重要的是,當(dāng)初始條件已知時(shí),即使在部分觀測(cè)情景下(LV-2 和 LV-3),所有參數(shù)均可識(shí)別。對(duì)初始獵物和捕食者種群數(shù)量的了解打破了系統(tǒng)對(duì)稱性,使所有參數(shù)得以唯一恢復(fù)。這凸顯了在生態(tài)野外研究中準(zhǔn)確估計(jì)初始條件的價(jià)值。

廣義邏輯模型:對(duì)于 GLM,觀測(cè)累計(jì)病例數(shù) C(t) 和新增病例數(shù) dC/dt 可在初始條件已知或未知的情況下,確保所有參數(shù)(r, p, K)完全結(jié)構(gòu)可識(shí)別。GLM 的單方程結(jié)構(gòu)結(jié)合對(duì)狀態(tài)變量及其導(dǎo)數(shù)的直接觀測(cè),保證了所有增長(zhǎng)參數(shù)均可被唯一確定。這種穩(wěn)健的可識(shí)別性使得 GLM 在完整病例軌跡可觀測(cè)時(shí),成為現(xiàn)象學(xué)疫情建模的可靠選擇。

SEIUR 模型:SEIUR 模型因其多隔室結(jié)構(gòu)和部分可觀測(cè)性而面臨顯著的可識(shí)別性挑戰(zhàn)。即使所有隔室(S, E, I, U, R, C)理論上均可觀測(cè),當(dāng)初始條件未知時(shí),僅有累計(jì)報(bào)告病例數(shù) C、潛伏期速率 κ 和康復(fù)率 γ? 在結(jié)構(gòu)上可識(shí)別。其余狀態(tài)變量(S, E, I, U, R)及關(guān)鍵參數(shù)——包括總?cè)丝谝?guī)模 N 和報(bào)告比例 ρ——在結(jié)構(gòu)上均不可識(shí)別。

這種可識(shí)別性缺陷源于觀測(cè)到的發(fā)病率數(shù)據(jù)(每日新增報(bào)告病例數(shù))依賴于乘積項(xiàng) κρE(t),而非 κ、ρ 和 E(t) 各自獨(dú)立影響。多個(gè)不同的報(bào)告比例 ρ、暴露人群 E(t) 和總?cè)丝?N 的組合可能產(chǎn)生相同的觀測(cè)病例數(shù)。未觀測(cè)的未報(bào)告感染隔室 U(t) 進(jìn)一步加劇了可識(shí)別性問(wèn)題,因?yàn)閳?bào)告與未報(bào)告感染之間的劃分并未被數(shù)據(jù)直接約束。

當(dāng)初始條件已知時(shí),所有 SEIUR 參數(shù)均可識(shí)別。這強(qiáng)調(diào)了在存在漏報(bào)現(xiàn)象的流行病模型中,準(zhǔn)確估計(jì)初始易感人群和暴露人群(例如,通過(guò)血清流行病學(xué)調(diào)查或接觸者追蹤數(shù)據(jù))對(duì)于實(shí)現(xiàn)可靠的參數(shù)推斷至關(guān)重要。

5.4 對(duì)推斷的啟示結(jié)構(gòu)可識(shí)別性分析為解讀結(jié)果部分所呈現(xiàn)的經(jīng)驗(yàn)參數(shù)估計(jì)和預(yù)測(cè)結(jié)果提供了關(guān)鍵背景。對(duì)于 LV 模型,我們預(yù)期當(dāng)兩個(gè)物種均被觀測(cè)時(shí)(LV-1),貝葉斯和頻率學(xué)派方法均能成功恢復(fù)所有參數(shù);但在部分觀測(cè)情景下(LV-2、LV-3),由于結(jié)構(gòu)可識(shí)別性受損,參數(shù)估計(jì)可能不可靠或表現(xiàn)出高度不確定性。

對(duì)于應(yīng)用于肺損傷和猴痘數(shù)據(jù)的廣義邏輯模型(GLM),其穩(wěn)健的結(jié)構(gòu)可識(shí)別性表明,只要數(shù)據(jù)質(zhì)量足夠,兩種推斷方法都應(yīng)能產(chǎn)生約束良好的參數(shù)估計(jì)和可靠的預(yù)測(cè)。

對(duì)于應(yīng)用于西班牙 COVID-19 數(shù)據(jù)的 SEIUR 模型,有限的結(jié)構(gòu)可識(shí)別性表明,僅憑病例發(fā)病率數(shù)據(jù)無(wú)法唯一確定多個(gè)模型參數(shù)。我們預(yù)期報(bào)告比例 ρ ρ、總?cè)丝谝?guī)模 N N 以及潛伏隔室的參數(shù)估計(jì)將表現(xiàn)出顯著的不確定性,甚至非唯一性。在此情境下,貝葉斯推斷可能具有優(yōu)勢(shì):通過(guò)引入先驗(yàn)信息對(duì)原本病態(tài)(ill-posed)的反問(wèn)題進(jìn)行正則化;而頻率學(xué)派方法在缺乏額外約束或補(bǔ)充數(shù)據(jù)源的情況下可能難以有效應(yīng)對(duì)。

這些預(yù)測(cè)將在結(jié)果部分通過(guò)實(shí)證進(jìn)行檢驗(yàn),我們將系統(tǒng)比較不同模型和觀測(cè)情景下的參數(shù)估計(jì)準(zhǔn)確性、不確定性量化效果以及預(yù)測(cè)性能。

模型、應(yīng)用領(lǐng)域、數(shù)據(jù)來(lái)源與觀測(cè)情景匯總如表3所示,本研究中所使用的模型、應(yīng)用領(lǐng)域、數(shù)據(jù)來(lái)源及觀測(cè)情景匯總?cè)缦隆?/p>


6 結(jié)果

本節(jié)呈現(xiàn)了本研究中所有模型與數(shù)據(jù)集的參數(shù)估計(jì)結(jié)果、性能指標(biāo)及收斂診斷。我們按模型組織結(jié)果,每個(gè)子章節(jié)包含貝葉斯(BFF)和頻率學(xué)派(QDF)推斷方法下的參數(shù)估計(jì)、預(yù)測(cè)表現(xiàn)及不確定性量化。結(jié)構(gòu)可識(shí)別性分析(第5節(jié))為解讀這些實(shí)證結(jié)果提供了理論背景。

6.1 Lotka–Volterra 模型

我們將LV模型擬合于哈德遜灣猞猁–野兔數(shù)據(jù),共考察三種觀測(cè)情景:(1) 同時(shí)觀測(cè)獵物與捕食者(LV-1);(2) 僅觀測(cè)捕食者(LV-2);(3) 僅觀測(cè)獵物(LV-3)。這些情景使我們能夠結(jié)合第5節(jié)所展示的結(jié)構(gòu)可識(shí)別性結(jié)果,評(píng)估部分可觀測(cè)性如何影響參數(shù)恢復(fù)與預(yù)測(cè)性能。為增強(qiáng)分析深度,我們分別考察這三個(gè)獨(dú)立情景:首先呈現(xiàn)同時(shí)擬合獵物與捕食者數(shù)據(jù)的結(jié)果;其次聚焦僅用捕食者數(shù)據(jù)擬合模型的情形;最后提供僅使用獵物數(shù)據(jù)進(jìn)行擬合的結(jié)果。

6.1.1 獵物與捕食者均被觀測(cè)

本節(jié)重點(diǎn)展示同時(shí)擬合獵物與捕食者數(shù)據(jù)的結(jié)果。

圖5顯示,BFF方法在捕捉數(shù)據(jù)動(dòng)態(tài)方面更為有效。特別是,在應(yīng)用BFF時(shí),獵物種群的不確定性范圍更合理,覆蓋了所有觀測(cè)數(shù)據(jù)點(diǎn)。此外,該方法在捕捉捕食者種群峰值方面表現(xiàn)出色,尤其對(duì)捕食者種群的第一個(gè)峰值實(shí)現(xiàn)了近乎完美的擬合。


表4顯示,盡管兩種方法均同時(shí)使用了兩組數(shù)據(jù),但其參數(shù)估計(jì)值存在顯著差異。特別是,參數(shù) β 在BFF中的估計(jì)值遠(yuǎn)低于QDF,甚至趨近于零。此外,參數(shù) δ 是唯一一個(gè)在兩種方法中估計(jì)值大致相同的參數(shù)。


表5證實(shí)了BFF的表現(xiàn)明顯優(yōu)于QDF這一結(jié)論。



圖5展示了在同時(shí)假設(shè)獵物與捕食者數(shù)據(jù)的前提下,將哈德遜灣數(shù)據(jù)集擬合至LV模型的結(jié)果。第一行顯示使用BFF方法獲得的結(jié)果,第二行顯示QDF方法的結(jié)果。第一列代表捕食者種群,第二列對(duì)應(yīng)獵物種群。

在接下來(lái)的章節(jié)中,我們將比較兩種不同擬合方法(BFF 和 QDF)的性能。由于我們?cè)趦H擬合數(shù)據(jù)集中的單一成分(捕食者或獵物)時(shí)分別應(yīng)用這兩種方法,因此我們預(yù)期會(huì)生成兩張圖,每張圖分別展示一種方法的擬合結(jié)果。

6.1.2 僅使用捕食者數(shù)據(jù)

下文將呈現(xiàn)僅考慮捕食者數(shù)據(jù)時(shí),將哈德遜灣數(shù)據(jù)集擬合至LV模型的結(jié)果。


下圖6展示了在僅假設(shè)捕食者數(shù)據(jù)的條件下,將哈德遜灣數(shù)據(jù)集擬合到Lotka–Volterra模型的結(jié)果。第一列顯示使用BFF方法獲得的結(jié)果,第二列顯示QDF方法的結(jié)果。


結(jié)果表明,QDF 在僅使用捕食者數(shù)據(jù)時(shí)擬合效果更好,比 BFF 更有效地捕捉了種群的關(guān)鍵趨勢(shì)。

6.1.3 僅使用獵物數(shù)據(jù)

下文將呈現(xiàn)僅考慮獵物種群時(shí),將哈德遜灣數(shù)據(jù)集擬合至 LV 模型的結(jié)果。


下圖7展示了在僅使用獵物數(shù)據(jù)的假設(shè)下,將哈德遜灣數(shù)據(jù)集擬合到Lotka–Volterra模型的結(jié)果。第一列顯示僅使用獵物數(shù)據(jù)時(shí)BFF方法所得結(jié)果,第二列顯示僅使用獵物數(shù)據(jù)時(shí)QDF方法所得結(jié)果。


這些結(jié)果表明,QDF 在獵物種群動(dòng)態(tài)建模方面更為穩(wěn)健和準(zhǔn)確,在誤差指標(biāo)和參數(shù)估計(jì)方面均優(yōu)于 BFF。

6.1.4 不同觀測(cè)情景下(僅獵物、僅捕食者、獵物與捕食者)LV 捕食者–獵物模型參數(shù)估計(jì)(α, β, δ, γ)的比較分析

下圖8展示了對(duì) LV 捕食者–獵物模型參數(shù)(α, β, δ, γ)估計(jì)值的比較分析。估計(jì)結(jié)果涵蓋三種觀測(cè)情景:僅獵物、僅捕食者以及獵物與捕食者同時(shí)觀測(cè)。圖中每個(gè)點(diǎn)表示參數(shù)估計(jì)的均值,水平線段表示相應(yīng)的不確定性區(qū)間。為更清晰地展示小量級(jí)參數(shù)范圍內(nèi)的變化,橫軸采用對(duì)數(shù)尺度。該比較突顯了數(shù)據(jù)可得性如何影響參數(shù)的可識(shí)別性,以及不同預(yù)測(cè)方法之間估計(jì)結(jié)果的一致性。


6.1.5 LV模型中僅捕食者數(shù)據(jù)與捕食者–獵物聯(lián)合數(shù)據(jù)在MAE、MSE、WIS和95% PI等性能指標(biāo)上的比較

下圖9評(píng)估了BFF與QDF框架在兩種數(shù)據(jù)可用情景下的預(yù)測(cè)性能:(1) 僅觀測(cè)到捕食者數(shù)據(jù);(2) 同時(shí)獲得捕食者與獵物數(shù)據(jù)。預(yù)測(cè)準(zhǔn)確性通過(guò)四個(gè)指標(biāo)進(jìn)行評(píng)估:平均絕對(duì)誤差(MAE)、均方誤差(MSE)、加權(quán)區(qū)間評(píng)分(WIS)和95%預(yù)測(cè)區(qū)間(95% PI)。在所有指標(biāo)上,使用完整的捕食者–獵物聯(lián)合數(shù)據(jù)相比僅依賴捕食者數(shù)據(jù)均顯著提升了模型性能,凸顯了在動(dòng)態(tài)生態(tài)系統(tǒng)中聯(lián)合觀測(cè)的價(jià)值。


6.1.6 LV模型中僅獵物數(shù)據(jù)與捕食者–獵物聯(lián)合數(shù)據(jù)在MAE、MSE、WIS和95% PI等性能指標(biāo)上的比較

下圖10評(píng)估了BFF與QDF框架在兩種數(shù)據(jù)可用情景下的預(yù)測(cè)性能:(1) 僅觀測(cè)到獵物數(shù)據(jù);(2) 同時(shí)獲得捕食者與獵物數(shù)據(jù)。預(yù)測(cè)準(zhǔn)確性通過(guò)四個(gè)指標(biāo)進(jìn)行評(píng)估:平均絕對(duì)誤差(MAE)、均方誤差(MSE)、加權(quán)區(qū)間評(píng)分(WIS)和95%預(yù)測(cè)區(qū)間(95% PI)。在所有指標(biāo)上,使用完整的捕食者–獵物聯(lián)合數(shù)據(jù)相比僅依賴獵物數(shù)據(jù)均顯著提升了模型性能,再次凸顯了在動(dòng)態(tài)生態(tài)系統(tǒng)中聯(lián)合觀測(cè)的重要性。


6.1.7 不同數(shù)據(jù)情景下LV模型參數(shù)(α, β, δ, γ)的后驗(yàn)直方圖
LV模型參數(shù)(α, β, δ, γ)的后驗(yàn)直方圖如圖S1–S6所示。這些圖比較了在BFF和QDF方法下,捕食者–獵物聯(lián)合觀測(cè)、僅捕食者觀測(cè)以及僅獵物觀測(cè)三種情景的結(jié)果。每幅直方圖均以均值、中位數(shù)和95%置信區(qū)間(CI)概括參數(shù)不確定性,從而揭示不同數(shù)據(jù)情景下參數(shù)的可識(shí)別性與估計(jì)精度。

具體而言,圖S1–S3展示BFF方法的結(jié)果,而圖S4–S6呈現(xiàn)QDF方法的估計(jì)結(jié)果。綜合來(lái)看,這些圖突顯了兩種方法在參數(shù)估計(jì)上的差異,同時(shí)也驗(yàn)證了模型能夠恢復(fù)具有生物學(xué)意義的參數(shù)值。窄而尖銳的直方圖(例如圖S1中 α ≈ 0.4 ± 0.04)表明參數(shù)具有強(qiáng)可識(shí)別性且后驗(yàn)不確定性較低;而寬或平坦的直方圖(例如圖S2中僅捕食者情景下的 β 或 γ)則反映出弱可識(shí)別性——這些參數(shù)可在較大范圍內(nèi)變化,同時(shí)仍能擬合觀測(cè)數(shù)據(jù)。

對(duì)比BFF與QDF的對(duì)應(yīng)圖版可見,兩種方法均能恢復(fù)生物學(xué)上合理的參數(shù)值,但在數(shù)據(jù)覆蓋更充分的情景下,QDF傾向于產(chǎn)生略窄的不確定性區(qū)間。

6.1.8 使用正態(tài)分布作為誤差結(jié)構(gòu)時(shí)LV模型參數(shù)的比較(BFF方法)


6.1.9 使用正態(tài)分布作為誤差結(jié)構(gòu)時(shí)LV模型參數(shù)的比較(QDF方法)


6.2 肺損傷的廣義邏輯模型(GLM)
本節(jié)總結(jié)了將廣義邏輯模型(GLM)擬合到肺損傷時(shí)間序列的結(jié)果。我們比較了模型擬合效果、參數(shù)估計(jì)、預(yù)測(cè)精度(MAE、MSE、WIS)以及95%預(yù)測(cè)區(qū)間的覆蓋率。圖11顯示,兩種方法均能很好地捕捉受影響人群的上升與下降趨勢(shì),并在峰值和下降階段與觀測(cè)數(shù)據(jù)高度吻合。在拐點(diǎn)附近,預(yù)測(cè)區(qū)間較窄,且兩種方法之間的差異很小。



6.2.1 使用肺損傷數(shù)據(jù)對(duì)GLM模型參數(shù)估計(jì)的比較
圖12展示了兩種方法在參數(shù) r 、 p 和 K 上的估計(jì)結(jié)果對(duì)比,顯示出相似的點(diǎn)估計(jì)值和略有差異的不確定性區(qū)間寬度。圖中每個(gè)點(diǎn)代表后驗(yàn)均值,水平線表示95%預(yù)測(cè)區(qū)間(PI)。該比較突顯了不同方法在參數(shù)估計(jì)上的一致性,同時(shí)也揭示了其在不確定性范圍上的細(xì)微差別。


6.2.2 使用肺損傷數(shù)據(jù)對(duì)GLM模型的MAE、MSE、WIS和95% PI性能指標(biāo)比較
圖13展示了MAE、MSE、WIS和預(yù)測(cè)區(qū)間(PI)的對(duì)比結(jié)果。結(jié)果顯示,QDF在各項(xiàng)誤差指標(biāo)上 consistently(始終)取得更低的誤差值,同時(shí)保持與BFF相當(dāng)?shù)腜I覆蓋率,表明其預(yù)測(cè)更為準(zhǔn)確且可靠。


6.2.3 不同數(shù)據(jù)情景下GLM參數(shù)(r, K, p)的后驗(yàn)直方圖
GLM參數(shù)(r, K, p)的后驗(yàn)(或抽樣)直方圖如圖S7–S8所示。每組圖匯總了BFF和QDF方法下各參數(shù)的不確定性,并報(bào)告了每個(gè)參數(shù)的均值、中位數(shù)和95%置信區(qū)間(CI)。這些圖版共同支持對(duì)兩種估計(jì)框架在不同數(shù)據(jù)情景下如何探索參數(shù)空間(r, K, p)進(jìn)行并排比較。BFF和QDF均得到了集中的后驗(yàn)分布,例如 p ≈ 1.0 ± 0.02,表明這些參數(shù)具有良好的可識(shí)別性。

6.2.4 使用正態(tài)誤差結(jié)構(gòu)時(shí)GLM參數(shù)設(shè)定的比較(BFF方法)


6.2.5 使用正態(tài)誤差結(jié)構(gòu)時(shí)GLM參數(shù)設(shè)定的比較(QDF方法)


6.3 美國(guó)猴痘疫情的廣義邏輯模型(GLM)
本節(jié)展示將廣義邏輯模型(GLM)擬合于2022年美國(guó)猴痘疫情的結(jié)果。

圖14展示了GLM對(duì)美國(guó)猴痘發(fā)病率的擬合情況:頻率學(xué)派方法(QDF)和貝葉斯方法(BFF)均能捕捉到疫情的快速上升與下降趨勢(shì)。第一列顯示使用QDF方法得到的結(jié)果,第二列顯示BFF方法的結(jié)果。


表21比較了MAE、MSE、WIS和95% PI;QDF在誤差指標(biāo)上更低,同時(shí)保持了相當(dāng)?shù)母采w率。


6.3.1 使用猴痘數(shù)據(jù)對(duì)GLM模型參數(shù)估計(jì)的比較
圖15比較了兩種方法在參數(shù) r r、 p p 和 k k 上的估計(jì)結(jié)果,顯示出高度一致的點(diǎn)估計(jì)值以及略有差異的不確定性區(qū)間寬度。圖中每個(gè)點(diǎn)代表后驗(yàn)均值,水平線表示95%預(yù)測(cè)區(qū)間(PI)。該比較突顯了不同方法在參數(shù)估計(jì)上的一致性,同時(shí)也揭示了其在不確定性范圍上的細(xì)微差別。


6.3.2 使用猴痘數(shù)據(jù)對(duì)GLM模型的MAE、MSE、WIS和95% PI性能指標(biāo)比較
圖16展示了誤差與覆蓋率指標(biāo)。兩種方法在全部四項(xiàng)評(píng)估指標(biāo)(MAE、MSE、WIS和95% PI)上表現(xiàn)相似。MAE值幾乎完全相同,表明點(diǎn)預(yù)測(cè)精度相當(dāng);QDF的MSE略低,說(shuō)明其對(duì)較大誤差的處理略優(yōu);WIS值非常接近,反映出兩者預(yù)測(cè)區(qū)間的質(zhì)量相近。兩種方法的95%預(yù)測(cè)區(qū)間覆蓋率也幾乎一致,表明其不確定性量化具有同等良好的校準(zhǔn)性??傮w而言,在GLM模型應(yīng)用于猴痘數(shù)據(jù)時(shí),兩種方法表現(xiàn)相當(dāng)。


6.3.3 猴痘數(shù)據(jù)下GLM參數(shù)(r, K, p)的后驗(yàn)直方圖
針對(duì)猴痘發(fā)病率數(shù)據(jù),GLM參數(shù)(r, K, p)的后驗(yàn)直方圖(BFF)和抽樣直方圖(QDF)如圖S9–S10所示。每個(gè)圖版均以均值、中位數(shù)和95%置信區(qū)間(CI)概括參數(shù)不確定性,便于在同一數(shù)據(jù)集上對(duì)BFF與QDF進(jìn)行并排比較。



6.4 西班牙第一波COVID-19疫情的SEIUR模型

本節(jié)展示了將西班牙第一波COVID-19疫情數(shù)據(jù)擬合至隔室型SEIUR模型(易感者–暴露者–感染者–康復(fù)者模型)所得到的參數(shù)估計(jì)、性能指標(biāo)及收斂性分析結(jié)果。

圖17展示了兩種框架對(duì)西班牙第一波疫情的SEIUR擬合結(jié)果;兩者均能較好地追蹤發(fā)病率的上升與下降趨勢(shì)。





6.4.3 SEIUR參數(shù)(β?, β?, q?, ρ, κ, γ?, N)的后驗(yàn)直方圖

圖S11–S12展示了在BFF和QDF方法下SEIUR參數(shù)的分布情況。每個(gè)圖版均以均值、中位數(shù)和95%置信區(qū)間(CI)概括不確定性,便于進(jìn)行方法間的對(duì)比。

圖S11(BFF):多個(gè)參數(shù)的后驗(yàn)分布相對(duì)寬泛,表明僅憑觀測(cè)數(shù)據(jù)無(wú)法完全識(shí)別這些參數(shù),存在部分可識(shí)別性。圖中標(biāo)注的示例包括:β? 中位數(shù)為2.18(95% CI [1.60, 3.09]);β? 中位數(shù)為1.69([1.14, 2.48]);q 中位數(shù)為0.88([0.64, 1.41]);ρ 中位數(shù)為0.60([0.28, 0.92]);κ 中位數(shù)為2.39([1.23, 3.73]);γ 中位數(shù)為1.78([1.22, 2.59])。這些較寬的區(qū)間突顯了參數(shù)之間的耦合關(guān)系以及觀測(cè)輸出所包含的信息有限。

圖S12(QDF):多個(gè)參數(shù)的分布更為集中(x軸支持范圍更窄,呈單峰形態(tài)),與QDF方法下更緊致的點(diǎn)估計(jì)結(jié)果一致。建議將本圖與圖S11結(jié)合使用,以對(duì)比BFF不確定性區(qū)間最寬的位置。BFF直方圖在多個(gè)參數(shù)上相對(duì)較寬,反映出部分可識(shí)別性;而QDF直方圖則顯示出更尖銳的集中趨勢(shì),表明其估計(jì)更為穩(wěn)定。這一對(duì)比凸顯了補(bǔ)充數(shù)據(jù)或重新參數(shù)化可能改善模型可識(shí)別性的潛力。


7 討論

本研究對(duì)貝葉斯與頻率學(xué)派推斷方法在生態(tài)、臨床和流行病系統(tǒng)中的比較分析揭示了一個(gè)清晰的實(shí)踐性區(qū)分:貝葉斯方法(BFF)在不確定性量化和診斷透明度方面表現(xiàn)更優(yōu),而頻率學(xué)派方法(QDF)通常在點(diǎn)預(yù)測(cè)誤差指標(biāo)上更低,且計(jì)算效率更高。兩種框架的相對(duì)性能高度依賴于數(shù)據(jù)的豐富程度、模型的復(fù)雜性以及結(jié)構(gòu)可識(shí)別性的程度。我們的研究結(jié)果表明,沒(méi)有任何一種方法在所有情況下都占絕對(duì)優(yōu)勢(shì);相反,最優(yōu)選擇取決于具體建模問(wèn)題的特性。

7.1 模型特異性表現(xiàn)

Lotka–Volterra 模型:在 LV 模型中,三種觀測(cè)情景下的表現(xiàn)差異顯著。當(dāng)同時(shí)觀測(cè)獵物與捕食者種群(LV-1)時(shí),兩種方法均成功恢復(fù)了參數(shù)值:QDF 在捕食者動(dòng)態(tài)上的點(diǎn)誤差略低(MAE 2.87 vs. 4.95)(表5),而 BFF 在獵物預(yù)測(cè)區(qū)間覆蓋率上達(dá)到完美(100% vs. 90.48%)(表5)。在僅觀測(cè)獵物的情景下(LV-3),QDF 給出了更銳利的點(diǎn)預(yù)測(cè),將 MAE 從 4.60(BFF)降至 3.30,MSE 從 27.34 降至 15.83,WIS 從 2.80 降至 2.10(表11)。然而,BFF 仍保持更優(yōu)的校準(zhǔn)性能,其預(yù)測(cè)區(qū)間覆蓋率為 100%,而 QDF 為 90.48%。收斂診斷確認(rèn) BFF 的 MCMC 采樣穩(wěn)定,所有 LV 參數(shù)的 (表6),表明即使在部分可觀測(cè)條件下,后驗(yàn)推斷依然可靠。

結(jié)構(gòu)可識(shí)別性分析(第5節(jié))解釋了上述模式:當(dāng)兩個(gè)物種均被觀測(cè)時(shí),參數(shù)可被唯一恢復(fù);而在部分觀測(cè)下,若初始條件未知,則會(huì)出現(xiàn)可識(shí)別性缺陷,這是任何推斷框架都無(wú)法克服的。實(shí)證結(jié)果與 SI 預(yù)測(cè)一致,表明無(wú)論采用何種統(tǒng)計(jì)方法,可觀測(cè)性從根本上限制了推斷質(zhì)量。

廣義邏輯模型(肺損傷與猴痘):在應(yīng)用于肺損傷和猴痘疫情的 GLM 中,QDF 在點(diǎn)預(yù)測(cè)準(zhǔn)確性上始終優(yōu)于 BFF,同時(shí)保持相當(dāng)甚至更優(yōu)的不確定性校準(zhǔn)。在猴痘疫情中,QDF 的 MAE 更低(9.45 vs. 11.74)、MSE 更小(150.47 vs. 399.43)、WIS 更優(yōu)(5.8 vs. 7.18),且預(yù)測(cè)區(qū)間覆蓋率達(dá)到完美(100% vs. 97.8%)(表21)。BFF 展現(xiàn)出優(yōu)異的收斂性(表17 和 表22),所有參數(shù)(r, p, K)的后驗(yàn)均被充分采樣,盡管其性能指標(biāo)略遜一籌。肺損傷的結(jié)果也呈現(xiàn)相同的定性模式:QDF 點(diǎn)誤差更低,同時(shí)保持良好校準(zhǔn)的預(yù)測(cè)區(qū)間。

GLM 的強(qiáng)結(jié)構(gòu)可識(shí)別性(第5節(jié))解釋了為何兩種方法都能成功恢復(fù)參數(shù)。其單方程結(jié)構(gòu)結(jié)合對(duì)新增病例的直接觀測(cè),確保了所有參數(shù)(r, p, K)在初始條件已知或未知的情況下均可被唯一識(shí)別。在此類高度可識(shí)別的情境中,QDF 的計(jì)算效率和優(yōu)化導(dǎo)向使其在點(diǎn)估計(jì)上具有優(yōu)勢(shì),而 BFF 的概率框架雖帶來(lái)額外計(jì)算成本,卻未在預(yù)測(cè)準(zhǔn)確性上帶來(lái)顯著提升。

SEIUR 模型(西班牙 COVID-19):與 GLM 結(jié)果相反,在 SEIUR 模型中,BFF 在所有指標(biāo)上均優(yōu)于 QDF:MAE(294.57 vs. 352.30)、MSE(210,754 vs. 311,054)、WIS(211.30 vs. 250.46)以及預(yù)測(cè)區(qū)間覆蓋率(94% vs. 92%)(表26)。這種性能優(yōu)勢(shì)的逆轉(zhuǎn)反映了該模型更高的復(fù)雜性、存在潛變量隔室,以及 SEIUR 框架有限的結(jié)構(gòu)可識(shí)別性。SI 分析(第5節(jié))表明,當(dāng)僅觀測(cè)到報(bào)告的新增病例時(shí),若初始條件未知,大多數(shù)參數(shù)和狀態(tài)變量(S, E, I, U, R, N, ρ)在結(jié)構(gòu)上不可識(shí)別,僅有累計(jì)病例數(shù) C、潛伏期速率 κ 和康復(fù)率 γ? 可被識(shí)別。

在此具有挑戰(zhàn)性的設(shè)定下,貝葉斯推斷得益于先驗(yàn)正則化,有效約束了原本病態(tài)(ill-posed)的反問(wèn)題。后驗(yàn)分布融合了數(shù)據(jù)似然與先驗(yàn)信息,使得即使在根本性可識(shí)別性受限的情況下,也能實(shí)現(xiàn)更穩(wěn)定的參數(shù)估計(jì)和預(yù)測(cè)生成。相比之下,頻率學(xué)派的優(yōu)化方法在高維且約束不足的參數(shù)空間中難以有效運(yùn)作,導(dǎo)致點(diǎn)估計(jì)可靠性較低,預(yù)測(cè)區(qū)間更寬。

7.2 結(jié)構(gòu)可識(shí)別性的作用結(jié)構(gòu)可識(shí)別性(SI)分析為理解為何不同模型和觀測(cè)情景下的推斷性能存在差異提供了關(guān)鍵洞見。對(duì)于 LV 模型,全局可識(shí)別性要求同時(shí)觀測(cè)獵物與捕食者;部分觀測(cè)會(huì)導(dǎo)致參數(shù)非唯一性,這是 BFF 和 QDF 均無(wú)法解決的問(wèn)題(表2)。對(duì)于 GLM,其在所有觀測(cè)方案下均具有強(qiáng)可識(shí)別性,從而確保兩種框架都能實(shí)現(xiàn)可靠的推斷。而對(duì)于 SEIUR 模型,嚴(yán)重的可識(shí)別性缺陷限制了參數(shù)恢復(fù)能力,無(wú)論采用何種推斷方法——盡管貝葉斯先驗(yàn)?zāi)茉谝欢ǔ潭壬咸峁┱齽t化優(yōu)勢(shì)。

這些發(fā)現(xiàn)強(qiáng)調(diào):結(jié)構(gòu)可識(shí)別性設(shè)定了從數(shù)據(jù)中所能獲知信息的根本極限。無(wú)論統(tǒng)計(jì)框架多么先進(jìn),都無(wú)法唯一恢復(fù)結(jié)構(gòu)上不可識(shí)別的參數(shù)。因此,在開展實(shí)證建模之前,應(yīng)首先進(jìn)行 SI 分析,以明確數(shù)據(jù)能夠回答哪些問(wèn)題、不能回答哪些問(wèn)題。

7.3 實(shí)踐啟示

我們的研究結(jié)果為在貝葉斯與頻率學(xué)派推斷框架之間做出選擇提供了實(shí)用指導(dǎo):

在以下情況下使用頻率學(xué)派方法(QDF):(1) 數(shù)據(jù)豐富且質(zhì)量高;(2) 模型在結(jié)構(gòu)上可識(shí)別;(3) 計(jì)算速度至關(guān)重要;(4) 主要目標(biāo)是最小化點(diǎn)預(yù)測(cè)誤差;(5) 模型復(fù)雜度為低至中等。GLM 的應(yīng)用(如肺損傷和猴痘)正是這些條件的典型體現(xiàn)。

在以下情況下使用貝葉斯方法(BFF):(1) 數(shù)據(jù)稀疏、含噪或部分觀測(cè);(2) 模型包含潛變量或未觀測(cè)隔室;(3) 結(jié)構(gòu)可識(shí)別性受限;(4) 全面的不確定性量化至關(guān)重要;(5) 可獲得先驗(yàn)信息以約束推斷;(6) 需要通過(guò)收斂診斷(如)確保推斷可靠性。SEIUR 模型在西班牙 COVID-19 數(shù)據(jù)中的應(yīng)用即為此類情境的代表。

可同時(shí)提升兩種方法性能的策略包括:(1) 擴(kuò)大觀測(cè)覆蓋范圍(例如同時(shí)測(cè)量獵物與捕食者,而非僅一個(gè)物種);(2) 獲取準(zhǔn)確的初始條件估計(jì);(3) 引入輔助數(shù)據(jù)源以打破參數(shù)非唯一性;(4) 采用基于 SI 分析的實(shí)驗(yàn)設(shè)計(jì),確保所關(guān)注的參數(shù)是可識(shí)別的。


7.4 局限性與未來(lái)方向

本研究通過(guò)標(biāo)準(zhǔn)化模型結(jié)構(gòu)、觀測(cè)方案和誤差分布,以隔離推斷框架本身的影響。盡管這一設(shè)計(jì)有助于進(jìn)行清晰的比較,但仍存在若干局限性需加以考慮。首先,我們?yōu)閮煞N方法均假設(shè)了正態(tài)誤差結(jié)構(gòu);若采用其他分布(例如針對(duì)計(jì)數(shù)數(shù)據(jù)的負(fù)二項(xiàng)分布),可能會(huì)改變方法間的相對(duì)性能。其次,我們對(duì)每個(gè)模型進(jìn)行了獨(dú)立分析;若采用分層或多層級(jí)結(jié)構(gòu),可能更有利于貝葉斯推斷。第三,我們的結(jié)構(gòu)可識(shí)別性(SI)分析基于理想、無(wú)噪聲的數(shù)據(jù);在真實(shí)噪聲水平下的實(shí)際可識(shí)別性值得進(jìn)一步研究。

未來(lái)研究可探索混合推斷策略,將基于優(yōu)化方法的計(jì)算效率與貝葉斯抽樣的不確定性量化優(yōu)勢(shì)相結(jié)合?;?SI 分析的實(shí)驗(yàn)設(shè)計(jì)可在數(shù)據(jù)收集前確定最優(yōu)的測(cè)量策略。引入機(jī)器學(xué)習(xí)方法,如神經(jīng)常微分方程(Neural ODEs)[99]或物理信息神經(jīng)網(wǎng)絡(luò)(physics-informed neural networks),可能帶來(lái)互補(bǔ)優(yōu)勢(shì)。將本比較擴(kuò)展至空間顯式模型、基于智能體的模擬以及隨機(jī)流行病模型,將進(jìn)一步拓寬這些發(fā)現(xiàn)的適用范圍。

8 結(jié)論

基于常微分方程(ODE)的數(shù)學(xué)模型是理解和預(yù)測(cè)生態(tài)與流行病系統(tǒng)動(dòng)態(tài)的重要工具。模型推斷的可靠性對(duì)于準(zhǔn)確的參數(shù)估計(jì)和合理的可識(shí)別性評(píng)估至關(guān)重要。本研究系統(tǒng)比較了貝葉斯與頻率學(xué)派推斷框架在三個(gè)生物模型——LV 捕食者–獵物動(dòng)力學(xué)、廣義邏輯模型(GLM)和 SEIUR 流行病模型——上的表現(xiàn),并應(yīng)用于四個(gè)涵蓋生態(tài)與流行病領(lǐng)域的實(shí)際數(shù)據(jù)集。

我們的分析表明,貝葉斯方法與頻率學(xué)派方法并無(wú)絕對(duì)優(yōu)劣之分;最優(yōu)框架取決于數(shù)據(jù)特征、模型結(jié)構(gòu)以及結(jié)構(gòu)可識(shí)別性的程度。當(dāng)數(shù)據(jù)豐富、模型可識(shí)別性良好且優(yōu)先考慮計(jì)算效率時(shí),頻率學(xué)派方法(通過(guò) QDF 實(shí)現(xiàn))表現(xiàn)優(yōu)異,這在肺損傷和猴痘疫情的 GLM 應(yīng)用中體現(xiàn)為更優(yōu)的點(diǎn)預(yù)測(cè)精度。而當(dāng)數(shù)據(jù)稀疏或含噪、模型包含潛變量隔室、且全面的不確定性量化至關(guān)重要時(shí),貝葉斯方法(通過(guò) BFF 實(shí)現(xiàn))更具優(yōu)勢(shì),這在西班牙 COVID-19 疫情的 SEIUR 模型中得到了驗(yàn)證。

結(jié)構(gòu)可識(shí)別性分析被證明是實(shí)現(xiàn)有意義推斷的關(guān)鍵前提。我們利用 StructuralIdentifiability.jl 進(jìn)行的符號(hào)化可識(shí)別性分析表明,可觀測(cè)性從根本上限制了參數(shù)恢復(fù)能力:在 LV 模型中,同時(shí)觀測(cè)捕食者與獵物種群可實(shí)現(xiàn)全部參數(shù)的識(shí)別;而部分觀測(cè)則導(dǎo)致可識(shí)別性缺陷,即使借助統(tǒng)計(jì)方法也無(wú)法克服,除非初始條件已知。同樣,SEIUR 模型在僅觀測(cè)報(bào)告病例時(shí)的有限可識(shí)別性,解釋了為何兩種方法均面臨參數(shù)不確定性問(wèn)題,盡管貝葉斯先驗(yàn)提供了一定的正則化優(yōu)勢(shì)。

將結(jié)構(gòu)可識(shí)別性分析與實(shí)證推斷相結(jié)合,可形成一套有原則的生物建模工作流:第一,開展 SI 分析,確定在計(jì)劃觀測(cè)條件下哪些參數(shù)理論上可被恢復(fù);第二,根據(jù)數(shù)據(jù)特征選擇匹配的推斷框架——當(dāng)可識(shí)別性強(qiáng)且數(shù)據(jù)豐富時(shí)使用頻率學(xué)派方法,當(dāng)可識(shí)別性弱或數(shù)據(jù)有限時(shí)使用貝葉斯方法;第三,在 SI 約束的背景下解讀實(shí)證結(jié)果,認(rèn)識(shí)到?jīng)]有任何統(tǒng)計(jì)方法能唯一恢復(fù)結(jié)構(gòu)上不可識(shí)別的參數(shù)。

對(duì)于需要在推斷框架間做出選擇的實(shí)踐者,我們建議:(1) 當(dāng)最小化點(diǎn)預(yù)測(cè)誤差和計(jì)算成本是首要目標(biāo)、數(shù)據(jù)質(zhì)量高且模型結(jié)構(gòu)可識(shí)別時(shí),使用頻率學(xué)派方法;(2) 當(dāng)不確定性量化至關(guān)重要、可獲得先驗(yàn)信息、模型包含未觀測(cè)狀態(tài)或可識(shí)別性受限時(shí),使用貝葉斯方法;(3) 通過(guò)提升觀測(cè)覆蓋度、獲取準(zhǔn)確的初始條件估計(jì)、以及采用基于 SI 的實(shí)驗(yàn)設(shè)計(jì),來(lái)同時(shí)改進(jìn)兩種方法的性能。

本比較研究深化了我們對(duì)統(tǒng)計(jì)推斷框架在生物建模情境中表現(xiàn)的理解,并為方法選擇提供了實(shí)用指導(dǎo)。通過(guò)將推斷方法與問(wèn)題特性相匹配,并以可識(shí)別性理論為基礎(chǔ)進(jìn)行結(jié)果解讀,建模者能夠獲得可靠、可復(fù)現(xiàn)且科學(xué)上可辯護(hù)的結(jié)果,從而有效支持生態(tài)管理與公共衛(wèi)生決策。

原文鏈接: https://arxiv.org/pdf/2511.15839=28.78

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
退休夫婦花10萬(wàn)“郵輪養(yǎng)老”:船上住15年,包吃包打掃,環(huán)游世界4圈,比房租便宜得多!

退休夫婦花10萬(wàn)“郵輪養(yǎng)老”:船上住15年,包吃包打掃,環(huán)游世界4圈,比房租便宜得多!

背包旅行
2026-01-23 10:33:42
趙薇胃癌傳聞?wù)嫦啻蟀?,再迎壞消息連累李湘

趙薇胃癌傳聞?wù)嫦啻蟀?,再迎壞消息連累李湘

觀察者海風(fēng)
2026-01-26 20:24:53
詹姆斯今年至今末節(jié)得分還是聯(lián)盟第一!公牛球迷為他倒戈!

詹姆斯今年至今末節(jié)得分還是聯(lián)盟第一!公牛球迷為他倒戈!

氧氣是個(gè)地鐵
2026-01-27 14:30:05
日本!暴跌開始了!

日本!暴跌開始了!

大嘴說(shuō)天下
2026-01-26 20:16:55
愛火:一場(chǎng)非關(guān)消耗的持久燃燒

愛火:一場(chǎng)非關(guān)消耗的持久燃燒

疾跑的小蝸牛
2026-01-27 22:57:37
李瑋峰指出,王鈺棟面對(duì)日本后衛(wèi)對(duì)抗成功率低,對(duì)歐洲后衛(wèi)更不行

李瑋峰指出,王鈺棟面對(duì)日本后衛(wèi)對(duì)抗成功率低,對(duì)歐洲后衛(wèi)更不行

足球分析員
2026-01-27 11:05:03
不管你信不信,男性過(guò)了61歲后,基本都有這7個(gè)現(xiàn)狀,要坦然接受

不管你信不信,男性過(guò)了61歲后,基本都有這7個(gè)現(xiàn)狀,要坦然接受

健康之光
2026-01-11 12:40:02
終于來(lái)了!芬蘭總理落地北京說(shuō)了兩句話,特朗普怕啥來(lái)啥

終于來(lái)了!芬蘭總理落地北京說(shuō)了兩句話,特朗普怕啥來(lái)啥

黑翼天使
2026-01-28 04:02:55
數(shù)據(jù)驚人!汽油消耗量暴跌得嚇人,未來(lái)油價(jià)會(huì)大幅降嗎?

數(shù)據(jù)驚人!汽油消耗量暴跌得嚇人,未來(lái)油價(jià)會(huì)大幅降嗎?

超喜歡我的狗子
2026-01-25 16:42:57
“8大癥狀說(shuō)明你已經(jīng)老了”,你占了幾項(xiàng)?我全占了!!

“8大癥狀說(shuō)明你已經(jīng)老了”,你占了幾項(xiàng)?我全占了!!

社評(píng)
2026-01-02 12:24:58
煥新Model Y亮相,你會(huì)考慮購(gòu)買嗎

煥新Model Y亮相,你會(huì)考慮購(gòu)買嗎

沙雕小琳琳
2026-01-28 01:59:15
銀價(jià)一個(gè)月內(nèi)狂飆50%,白銀基金緊急停牌,有銀飾商家宣布閉店

銀價(jià)一個(gè)月內(nèi)狂飆50%,白銀基金緊急停牌,有銀飾商家宣布閉店

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-01-27 14:41:30
媒體人:重慶銅梁龍足球俱樂(lè)部的外援中衛(wèi)薩達(dá)烏斯卡斯即將離隊(duì)

媒體人:重慶銅梁龍足球俱樂(lè)部的外援中衛(wèi)薩達(dá)烏斯卡斯即將離隊(duì)

格斗聯(lián)盟
2026-01-27 20:11:05
舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

舒淇在節(jié)目里第一次承認(rèn),她和馮德倫為了要孩子已經(jīng)折騰了九年。

歲月有情1314
2025-11-29 15:40:25
馬斯克預(yù)測(cè)世界大戰(zhàn)時(shí)間,大戰(zhàn)最可能爆發(fā)在兩地區(qū)

馬斯克預(yù)測(cè)世界大戰(zhàn)時(shí)間,大戰(zhàn)最可能爆發(fā)在兩地區(qū)

妙知
2025-12-29 00:08:32
印度報(bào)告尼帕病毒疫情:護(hù)士A參加婚禮誤飲蝙蝠污染的新鮮椰棗汁,疑傳染共同上夜班的同事B

印度報(bào)告尼帕病毒疫情:護(hù)士A參加婚禮誤飲蝙蝠污染的新鮮椰棗汁,疑傳染共同上夜班的同事B

縱相新聞
2026-01-27 16:17:01
千萬(wàn)別姐弟戀,很累!

千萬(wàn)別姐弟戀,很累!

果粉之家
2026-01-06 11:26:21
真的累了?瓜帥暫時(shí)沒(méi)能擺脫“四大皆空”問(wèn)題,曼城穩(wěn)定打折扣

真的累了?瓜帥暫時(shí)沒(méi)能擺脫“四大皆空”問(wèn)題,曼城穩(wěn)定打折扣

里芃芃體育
2026-01-28 03:00:03
美籍華人14小時(shí)飛越萬(wàn)里來(lái)武漢求醫(yī) 中國(guó)醫(yī)生高效救治及時(shí)挽救患者視力

美籍華人14小時(shí)飛越萬(wàn)里來(lái)武漢求醫(yī) 中國(guó)醫(yī)生高效救治及時(shí)挽救患者視力

極目新聞
2026-01-27 09:59:07
山西某村口一起交通事故!致人當(dāng)場(chǎng)死亡!

山西某村口一起交通事故!致人當(dāng)場(chǎng)死亡!

秀容通
2026-01-27 19:22:28
2026-01-28 05:07:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1182文章數(shù) 18關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會(huì)講話透露了哪些關(guān)鍵信息

頭條要聞

美報(bào)告稱中國(guó)是其19世紀(jì)以來(lái)面對(duì)過(guò)的最強(qiáng)大國(guó)家

頭條要聞

美報(bào)告稱中國(guó)是其19世紀(jì)以來(lái)面對(duì)過(guò)的最強(qiáng)大國(guó)家

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對(duì)手現(xiàn)學(xué)?

娛樂(lè)要聞

張雨綺風(fēng)波持續(xù)發(fā)酵,曝多個(gè)商務(wù)被取消

財(cái)經(jīng)要聞

多地對(duì)壟斷行業(yè)"近親繁殖"出手了

汽車要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗(yàn)車下線

態(tài)度原創(chuàng)

家居
本地
手機(jī)
藝術(shù)
公開課

家居要聞

現(xiàn)代古典 中性又顯韻味

本地新聞

云游中國(guó)|撥開云霧,巫山每幀都是航拍大片

手機(jī)要聞

蘋果連發(fā)4版系統(tǒng):從iPhone 5s到iOS 26,果粉福音來(lái)了!

藝術(shù)要聞

震撼!19世紀(jì)油畫巨匠的作品美得不可思議!

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版