国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

無先驗貝葉斯再構(gòu)想:可能性推理模型的概率近似

0
分享至

無先驗貝葉斯再構(gòu)想:可能性推理模型的概率近似

No-prior Bayes reIMagined: probabilistic approximations of possibilistic inferential models

https://www.arxiv.org/pdf/2503.19748


摘要
當(dāng)缺乏先驗信息時,概率推斷的常用策略是通過貝葉斯定理將“默認(rèn)先驗”與似然函數(shù)結(jié)合。客觀貝葉斯、(廣義)Fiducial 推斷等方法均屬于此類。這種構(gòu)造雖自然,但所得后驗分布通常僅能提供有限的、近似有效的不確定性量化。本文提出一種重新構(gòu)想的方法,可生成具有更強可靠性性質(zhì)的后驗分布。該方法首先構(gòu)建一個推理模型(IM),其數(shù)學(xué)形式為數(shù)據(jù)驅(qū)動的可能性測度,并具備精確有效的不確定性量化能力;隨后,返回該可能性測度的一個所謂“內(nèi)概率近似”(inner probabilistic approximation)。此內(nèi)概率近似繼承了原 IM 的諸多優(yōu)良性質(zhì),包括具有精確覆蓋概率的可信集和漸近效率。在具有群不變結(jié)構(gòu)的模型中,該近似結(jié)果與熟悉的貝葉斯/Fiducial 解一致。文中還提出了一種用于計算該概率近似的蒙特卡洛方法,并附有數(shù)值示例。

關(guān)鍵詞與短語:置信分布;信度集;Fiducial 推斷;p 值;可能性理論;相對似然;有效性。

1 引言
科學(xué)通過將當(dāng)前已知(無論多么模糊或不完整)表述為先驗信念,并借助規(guī)范性程序在新數(shù)據(jù)出現(xiàn)時更新這些信念而進步——這一范式自然且深植于每一位學(xué)習(xí)過概率與統(tǒng)計的人心中。盡管其頗具吸引力,但實施該范式面臨諸多挑戰(zhàn),其中尤為突出的是:真實先驗信息往往不可得,因而任何特定的先驗信念表述都缺乏充分依據(jù)。Brad Efron 在 2016 年芝加哥聯(lián)合統(tǒng)計會議上的報告中指出:“科學(xué)家喜歡研究新問題”,這意味著常常缺乏歷史或經(jīng)驗來構(gòu)建有意義的先驗分布。出于類似原因,Efron(2013)更正式地指出:“……在缺乏先驗信息的情況下使用貝葉斯定理,是統(tǒng)計推斷中最重要且尚未解決的問題! 本文旨在為此“最重要且尚未解決的問題”提供新的見解、理論與方法論。

Fisher(1933, 1935a,b)提出的 Fiducial 論證是上述問題的首個解決方案,被 Savage(1961)稱為“試圖不打破貝葉斯之蛋而做出貝葉斯煎蛋卷的大膽嘗試”;Zabell(1992)與 Dawid(2024)對此有精彩綜述。學(xué)界共識認(rèn)為 Fisher 的方案失敗了,但即便其“最大失誤”(Efron 1998)也產(chǎn)生了深遠(yuǎn)影響,催生了置信限(Neyman 1941)、非精確概率(Dempster 1966)等基礎(chǔ)性進展,以及廣義 Fiducial 推斷(Hannig 等 2016;Murph 等 2024)、置信分布(Cox 2006;Schweder 和 Hjort 2016;Thornton 和 Xie 2020;Xie 和 Singh 2013)和客觀/無信息貝葉斯(Berger 2006;Berger 等 2024;Jeffreys 1946)等新方案。為簡化術(shù)語,下文將所有這些方法統(tǒng)稱為“無先驗貝葉斯解”。

在無先驗情境下采用類貝葉斯的概率推斷面臨一個難題:后驗概率本身的解釋問題。當(dāng)存在真實先驗信息時,貝葉斯后驗概率是給定觀測數(shù)據(jù)下對先驗信念的唯一一致更新。但若無先驗信念可更新,而代之以默認(rèn)先驗,則上述“更新”解釋便不復(fù)存在,相應(yīng)后驗分布是否具有意義亦不明確。正如 Fraser(2014)所言:“[貝葉斯公式] 無法從假設(shè)性概率中創(chuàng)造出真實概率”;更尖銳地,F(xiàn)raser(2011b)指出:“任何嚴(yán)肅的數(shù)學(xué)家都會質(zhì)疑,你如何能在缺失一個前提的情況下,通過編造一個成分就認(rèn)為[定理]的結(jié)論依然成立!

幸運的是,信念形成所需的推斷效力并不要求先驗信念的一致更新。但要論證這一點,首先需明確定義何為“具有信念形成推斷效力的框架”,其次需證明所提框架滿足該要求。對我而言,唯一可行的路徑是證明后驗概率具有可靠性,即:后驗對關(guān)于未知量的錯誤(或正確)斷言賦予高(或低)概率的情形是可證明的罕見事件。這種要求的優(yōu)勢在于,其信念形成推斷效力源自 Fisher 的歸納邏輯:例如,若“對真斷言賦予低概率”是罕見事件,而在當(dāng)前應(yīng)用中某斷言被賦予低概率,則可安全推斷該斷言為假,因為罕見事件實際上不會發(fā)生。無先驗貝葉斯解常具備某種形式的可靠性,但“錯誤置信定理”(Balch 等 2019;Martin 2019)指出,它們均不具備上述強可靠性性質(zhì)。既然無先驗貝葉斯解無法提供可靠的信念賦值,就有必要超越現(xiàn)有方法。

推理模型(IMs)(如 Martin 2025b;Martin 與 Liu 2013, 2015)是前述概率方法的替代方案,其輸出為依賴數(shù)據(jù)的可能性測度,可對未知參數(shù)提供可證明可靠的不確定性量化。第 2 節(jié)將詳述可能性測度及具體 IM 構(gòu)造。關(guān)鍵在于,我所提議的從概率到可能性的不確定性量化范式轉(zhuǎn)換,有助于實現(xiàn)強可靠性,并由此自然導(dǎo)出常規(guī)頻率學(xué)派的錯誤率控制,同時保留完全條件化的類貝葉斯推理。

盡管可能性 IM 相較于概率性無先驗貝葉斯解具有優(yōu)勢,但我并不幻想統(tǒng)計學(xué)家會在短期內(nèi)放棄概率主義而轉(zhuǎn)向可能性主義。但這并不意味著 IM 必須等到遙遠(yuǎn)未來才能發(fā)揮作用。本文提出的“再構(gòu)想”(reIMagined)方法,始于一個可證明可靠、基于似然的可能性 IM,繼而提取并返回其“內(nèi)概率近似”,作為新穎的無先驗貝葉斯解。如下文所示,該內(nèi)概率近似繼承了原始可能性 IM 的部分(但非全部)強可靠性性質(zhì):特別地,其針對全參數(shù)的最高后驗密度可信集即為置信集。

提出此新方法的動機在于:僅靠構(gòu)造默認(rèn)先驗并檢驗對應(yīng)后驗分布是否可靠,所能達(dá)成的目標(biāo)終究有限。本文建議優(yōu)先考慮可靠性性質(zhì),并直接構(gòu)造具備這些理想性質(zhì)的數(shù)據(jù)依賴概率。

本文其余部分安排如下:第 2 節(jié)介紹可能性理論與 IM 的背景知識;第 3 節(jié)刻畫 IM 的信度集(credal set),并據(jù)此定義相應(yīng)的內(nèi)概率近似;第 4 節(jié)探討該內(nèi)概率近似的多種性質(zhì),包括在不變模型中與經(jīng)典無先驗貝葉斯解的一致性,以及一個建立其漸近效率的 Bernstein–von Mises 定理版本;第 5 節(jié)提出一種(近似)計算 IM 內(nèi)概率近似的策略;第 6 節(jié)針對技術(shù)上具挑戰(zhàn)性且實際相關(guān)的 Behrens–Fisher 問題,給出一種新的、有效且有效的解法;第 7 節(jié)為結(jié)論性評述;附錄包含若干額外技術(shù)細(xì)節(jié)與示例。

2 背景

2.1 可能性理論

可能性測度(例如,Dubois 與 Prade 1988)是最簡單的不精確概率模型之一,與模糊集理論(例如,Zadeh 1978)和 Dempster–Shafer 理論(例如,Shafer 1976, 1987)密切相關(guān)。統(tǒng)計學(xué)中的應(yīng)用見 Dubois (2006) 和 Dubois 與 Den?ux (2010);另見第 2.2 節(jié)。

概率論與可能性理論之間的數(shù)學(xué)差異可簡要概括如下:優(yōu)化之于可能性理論,正如積分之于概率論。也就是說,定義在空間 Z 上的可能性測度 Π 由一個函數(shù) π: Z → [0,1] 決定,且滿足 sup_{z∈Z} π(z) = 1。該函數(shù)稱為“可能性輪廓”(possibilitycontour),而“上確界等于1”的性質(zhì)是類似于概率密度“積分等于1”這一熟知性質(zhì)的歸一化條件。于是,可能性測度通過對其輪廓進行優(yōu)化來確定,即對任意 A ? Z,Π(A) = sup{z∈A} π(z),正如概率測度通過對其密度進行積分來確定。

這種不同的演算方式具有若干 推論。對于本文 的發(fā)展尤為關(guān)鍵的是, 上述“上確界等于 1”的歸一化條件 確保了 Π 是一個 一致的上概率(例如 ,De Cooman 1 997;De Co oman 與 Aeyels 1999 ),這符合 Walley (1 991) 等人的精神。此外 ,這意味著 Π 確定了一個非空 的(閉且凸的 )概率集合,它支配 著這些概率:




2.2 可能性推理模型(Possibilistic IMs)

推理模型(IM)是一種從數(shù)據(jù)、模型等映射到關(guān)于相關(guān)未知量的不精確概率性不確定性量化的方法。該方法及視角的關(guān)鍵在于,IM 的不確定性量化必須是可靠的——作為數(shù)據(jù)的一個函數(shù),其可靠性將在下文進一步說明。正是這種對可靠性的堅持,意味著 IM 的輸出必須采取不精確概率的形式。早期的 IM 發(fā)展基于隨機集構(gòu)建,并使用信度函數(shù)術(shù)語進行描述。近期的發(fā)展則直接運用可能性理論工具和推理方法于 IM 的構(gòu)建與解釋中,我將這些稱為“可能性推理模型”;更多細(xì)節(jié)請參見 Martin (2025b)。本文聚焦于后一類 IM。

考慮一個模型 {Pθ : θ ∈ Θ},它由支持在樣本空間 X 上的概率分布組成,參數(shù)空間為 Θ。假設(shè)可觀測數(shù)據(jù) X,取值于 X,是從分布 Pθ 中抽取的樣本,其中 Θ ∈ Θ 是未知/不確定的“真實值”。關(guān)于 Θ 的先驗信息假定為空,但參見 Martin (2022b) 了解推廣情況。該模型與觀測數(shù)據(jù) X = x 共同確定了一個相對似然函數(shù)


其中 pθ 是 Pθ 的密度函數(shù)。我將始終假設(shè),對于幾乎所有 x,分母是有限的。

相對似然本身定義了一個可能性輪廓(possibility contour),即一個非負(fù)函數(shù),滿足對幾乎所有 x,有 supθ R(x, θ) = 1,該函數(shù)可用于數(shù)據(jù)驅(qū)動的關(guān)于 Θ 的不確定性量化。這一方法已在文獻(xiàn)中被廣泛研究(例如,Denceux 2006, 2014;Shafer 1982;Wasserman 1990a),并具有若干理想性質(zhì)。然而,它所缺乏的是一個形式化的校準(zhǔn)性質(zhì),該性質(zhì)可證明分配給關(guān)于 Θ 的假設(shè)的“可能性”具有形成信念的推斷權(quán)重。

幸運的是,這種以可靠性為導(dǎo)向的校準(zhǔn)很容易實現(xiàn),方法是對相對似然進行“驗證”(Martin 2022a,b)。也就是說,基于似然的可能性推理模型(possibilistic IM)構(gòu)造過程,是通過對相對似然應(yīng)用一種概率到可能性的變換版本,從而得到輪廓函數(shù):



換言之,一個有效的 IM 會以不超過 α 的速率(作為數(shù)據(jù) Z 的函數(shù))將可能性 ≤ α 分配給真實假設(shè)。這賦予了 IM 其“推斷權(quán)重”——式 (6) 意味著當(dāng) H 為真時,Πx(H) 不應(yīng)太小,因此若 Πx(H) 很小,人們傾向于懷疑假設(shè) H 的真實性,而這種傾向的強度由 Πx(H) 的大小決定。當(dāng)然,這一點可以轉(zhuǎn)化為一個具有頻率學(xué)派誤差率保證的形式化檢驗程序:根據(jù)式 (6),檢驗“若 Πx(H) ≤ α 則拒絕 H”在水平 α 上控制第一類錯誤概率。第三,上述性質(zhì)確保了可能性推理模型(possibilistic IM)不會產(chǎn)生虛假置信度(Balch 等人,2019;Martin,2019),這與其他無先驗貝葉斯解法不同。關(guān)于 IM 的更多見解見補充材料附錄 A;另請參見 Martin (2025b)。

IM 的輸出是一個一致的不精確概率,因此,它關(guān)聯(lián)著一個(非空的)可信集 C(Πx),如式 (1) 所示。C(Πx) 的成員(我將其記為 Qx)無需對應(yīng)任何先驗下的貝葉斯后驗分布。幸運的是,可以對 C(Πx) 的成員給出一種解釋,而這正是我在第 3 節(jié)發(fā)展中所依賴的關(guān)鍵。

我將以三個關(guān)于 IM 范圍與貢獻(xiàn)的技術(shù)性評注結(jié)束本背景部分。首先,讀者無疑會認(rèn)出式 (2) 中的輪廓函數(shù) πx(θ) 是一個 p 值函數(shù),對應(yīng)于似然比統(tǒng)計量。除了稱為 p 值函數(shù)外,該函數(shù)在文獻(xiàn)中還以許多其他名稱出現(xiàn),例如偏好函數(shù)(Spj?tvoll 1983)、顯著性函數(shù)(Fraser 1991)和置信曲線(Birnbaum 1961;Blaker 和 Spj?tvoll 2000;Schweder 和 Hjort 2002, 2016;Xie 和 Singh 2013)。區(qū)分 IM 與這些文獻(xiàn)的一個關(guān)鍵點在于,IM 接納固有的不精確性并利用相關(guān)不精確概率結(jié)果。也就是說,IM 確定了一種連貫且完全條件化的、用于推斷的不精確概率不確定性量化方法,并且更多內(nèi)容見 (Martin 2025b)。即使沿著這些思路發(fā)展的更偏向貝葉斯的方法(例如,Cortinovis 和 Caron 2024;Grünwald 2023;Pereira 和 Stern 2022)也未能充分利用不精確概率所能提供的優(yōu)勢。

其次,結(jié)合上一段的宏觀評估,有人可能會將 IM 與其他不精確概率解法進行比較,比如 Walley (1991) 提出的方法。一個關(guān)鍵觀察是,當(dāng)關(guān)于 Θ 的先驗信息為空(如本文所假設(shè)),Walley 的廣義貝葉斯后驗同樣為空,即未實現(xiàn)任何學(xué)習(xí)。由于貝葉斯推理在這種情況下并不完全令人滿意,因此需要像上文回顧的新思想,才能實現(xiàn)既有效又可靠的推斷。

最后,鑒于上述與 p 值的聯(lián)系,應(yīng)當(dāng)明確的是,除相對似然之外的其他排序方法也可用于構(gòu)造過程。我在此聚焦于相對似然的原因有兩點:首先,在完整參數(shù) Θ 是關(guān)注對象的情況下,這是一種有原則的選擇(Martin 2022b,第 4 節(jié));其次,本文的重點在于與貝葉斯推斷的聯(lián)系,而這種聯(lián)系的建立必然直接依賴于模型的似然函數(shù)。但在某些情況下,用其他方法替代相對似然是明智的,例如當(dāng)存在干擾參數(shù)時,如第 6 節(jié)所述。

3 內(nèi)部概率近似

3.1 直觀理解

第 2.1 節(jié)討論了用可能性測度逼近給定概率分布的問題,其核心工具是概率到可能性的變換。本節(jié)的目標(biāo)是逆轉(zhuǎn)這一過程:用合適的概率分布來逼近可能性推理模型(possibilistic IM)。在給出一般性描述之前,我將通過一個簡單例子提供一些直觀理解,其中所有計算均可顯式完成。

設(shè) X ~ PΘ = N(Θ, 1)。給定 X = x,標(biāo)準(zhǔn)的無先驗貝葉斯解法(對應(yīng)平坦的 Jeffreys 先驗)返回 Qx = N(x, 1) 作為 Θ 的后驗分布。如果我的用概率分布逼近可能性推理模型的方案在這一簡單情形下不能得出標(biāo)準(zhǔn)的無先驗貝葉斯解法,則該方案顯然無效。對于 IM 構(gòu)造,相對似然為 R(x, θ) = exp{-(x - θ)2/2},輪廓函數(shù)為


也就是說,通過概率到可能性變換所獲得的 Qx 的外部可能性近似,恰好就是可能性推理模型 Πx。這是一種“外部”近似,因為粗略而言,它是所有 ≤-支配 Qx 的可能性測度中“最不精確”的一個。那么,很自然地可以反過來表述這種關(guān)系:稱 Qx 是 Πx 的“內(nèi)部概率近似”,即在被 Πx ≤-支配的概率分布中,Qx 是“最分散”的一個。這些細(xì)節(jié)將在下文第 3.2 節(jié)中進一步明確。

作為預(yù)覽,至少有兩種等價的方法可以從可能性中提取概率:一種基于對尾部概率進行界定,另一種基于水平集匹配。這里我將聚焦于后一種方法,其形式化定義見第 3.2 節(jié)。由于 πx(θ) 最自然地被解釋為給定 x 時 Θ = θ 的“似然性”,并且由于后驗密度也(非正式地)以相同方式解釋,因此可以合理認(rèn)為 Qx 的密度 qx 與 πx 具有相同的水平集。類似于切片抽樣法(例如,Neal 2003),概率 Qx 由以下兩步確定:

  • 首先抽取一個水平集;
  • 然后在選定的水平集上抽取一個點。

在當(dāng)前情形下,水平集是置信區(qū)間 Cα(x) = {θ : πx(θ) > α},其索引 α ∈ [0,1]。于是,抽取水平集等價于從 [0,1] 上的一個分布中抽取水平本身,記為 A。如果 Qx 表示上述兩階段抽樣方案下 Θ 的分布,則 Θ ∈ Cα(x) 當(dāng)且僅當(dāng) A > α。那么,支配關(guān)系 Qx ≤ Πx 意味著




3.2 特征刻畫

本節(jié)的目標(biāo)是將上述所發(fā)展的直觀認(rèn)識形式化并加以推廣。首先從一個關(guān)于一般可能性測度的可信集(credal set)的著名刻畫出發(fā)(例如,Couso 等人,2001;Destercke 與 Dubois,2014),將其應(yīng)用于當(dāng)前情形,該刻畫表明:











第二步的表述雖然簡單,但實際操作起來較為復(fù)雜。我將在第 5 節(jié)中討論如何至少近似地解決這一計算挑戰(zhàn)。

3.3 說明







4 性質(zhì) 4.1 在群不變模型中與貝葉斯一致





也就是說,對于不變模型,標(biāo)準(zhǔn)的無先驗貝葉斯解是可能性 IM 的內(nèi)部概率近似。這證實了我之前在第 3.3 節(jié)伽馬示例中的說法:貝葉斯后驗是一個內(nèi)部概率近似。這也為我這里提出的無先驗貝葉斯解提供了一個通用的概念驗證:至少在群是唯一的情況下,對應(yīng)的貝葉斯解是合理且廣泛使用的,因此我所提出的方法必然也是合理的。


作為一個示例,假設(shè)觀測值對應(yīng)于相對于參考方向的平面上的單位圓上的點,或者僅僅是角度。涉及此類數(shù)據(jù)的實際應(yīng)用包括風(fēng)向和動物運動研究;詳見 Mardia 和 Jupp (2000)。更一般地,方向測量可以表示為超球面上的點。這在天文學(xué)中很常見,例如,行星或恒星的位置可以用天球上的點來描述。




接下來是著名的 Bernstein-von Mises 定理在可能性 IM 上的版本,該定理確立了其漸近正態(tài)性和效率。也就是說,當(dāng) n 很大時,可能性 IM 的輪廓近似于一個高斯可能性輪廓,其協(xié)方差矩陣符合克拉美- Rao 下界。這表明對于提出的內(nèi)部概率近似,存在傳統(tǒng)的 Bernstein - von Mises 定理,因此它與任何其他合理的無先驗貝葉斯解漸近一致。此外,IM 輸出的這種近高斯形式為計算內(nèi)部概率近似提供了有價值的見解和簡化;詳見第 5 節(jié)。

首要任務(wù)是定義高斯可能性。








4.3 邊際化風(fēng)險,或缺乏風(fēng)險

除了那些幾乎不可能的罕見情況(即存在真實的先驗分布),可靠的統(tǒng)計推斷本質(zhì)上是不精確的——那些熟悉的控制錯誤率的檢驗和置信區(qū)間程序都具有不精確的概率特征(Martin 2021a)。關(guān)鍵是,沒有單一的概率分布能夠可靠地量化統(tǒng)計模型中未知參數(shù)的不確定性。因此,堅持要求不確定性量化必須是概率性的存在風(fēng)險:

[Xie 和 Singh (2013)] 因此建議我們忽略對置信集或等效物的限制,并釋放置信度以允許生成參數(shù)分布。當(dāng)然,分布更容易思考,與 Fisher 的原始提案大致一致,并且更符合貝葉斯方法的自由性,但它們確實忽視了固有的風(fēng)險……(Fraser 2013)


需要強調(diào)的是,任何概率不確定性量化都無法完全避免所有風(fēng)險,包括我提出的內(nèi)部概率近似。因此,本節(jié)的目標(biāo)僅僅是理解如何使用這些近似進行邊際化,以及識別哪些邊際推斷是安全的。為了完全避免所有這些風(fēng)險,必須以某種方式打破對熟悉概率不確定性量化的依賴:Gr"unwald (2018) 建議明確限制概率推斷僅用于安全的推斷,而我建議從概率放寬到可能性,以便所有推斷都安全(Martin 2025b)。












5 計算

直到最近,計算 IM 輪廓的策略還僅限于一些簡單但效率低下的方法。通常的做法是通過以下方式近似:





由于(16)中的包含方向,所提出的內(nèi)部概率近似實現(xiàn)是保守的。因此,理論上內(nèi)部概率近似所享有的相關(guān)屬性至少應(yīng)被上述實際建議近似地享有;詳見第 6 節(jié)。

6 示例:Behrens–Fisher 問題
為簡潔起見,此處僅給出一個關(guān)于內(nèi)部概率近似的詳細(xì)示例,另外兩個示例見附錄 G。


迄今為止,最廣泛使用的 Behrens-Fisher 問題解決方案是對 Welch (1938, 1947) 提出的自由度近似的基本 Student-t 樞紐量的修正;這在 R 的 t.test 函數(shù)中得以實現(xiàn)。其他標(biāo)準(zhǔn)方法包括 Hsu (1938) 和 Scheffé (1970) 提出的簡單但保守的解決方案,以及 Jeffreys (1940) 基于 Θ 的右 Haar 先驗提出的貝葉斯解決方案,這在數(shù)學(xué)上等同于 Fisher 的信條解決方案。具有諷刺意味的是,Jeffreys 提出的解決方案與基于 Jeffreys 先驗的貝葉斯解決方案在構(gòu)建和性能上有所不同。

為了設(shè)定場景,先考慮對完整參數(shù) Θ 的推斷。該模型具有大量結(jié)構(gòu),因此基于相對似然的可能性 IM 構(gòu)建用于 Θ 的推斷在概念和計算上都很直接。由于模型的底層仿射群不變性,根據(jù)定理 3,對應(yīng)于 Θ 的內(nèi)部概率近似正是基于右 Haar 先驗的 Θ 的貝葉斯后驗分布,這也是 Fisher 的信條分布。由于從 Θ 到 Φ 的映射是線性的,根據(jù)定理 6,Jeffreys 和 Fisher 分別提出的貝葉斯和信條解決方案對應(yīng)于從 IM 的內(nèi)部概率近似導(dǎo)出的 Φ 的邊際分布;此外,這些也是基于擴展原理的邊際 IM 的內(nèi)部概率近似。

我在此提出的新方法首先采用一種不同的——通常也更高效的——IM邊緣化策略,該策略基于對剖面相對似然(profile relative likelihood)進行“驗證”(validifying)。這一思想最早由 Martin(2023b)提出,其中的例5已展示了其在 Behrens–Fisher 問題中的應(yīng)用。粗略而言,這種基于剖面似然的邊緣 IM 構(gòu)造方法與前述基于擴展(extension-based)的構(gòu)造方法之間的區(qū)別在于邊緣化操作的執(zhí)行時機:前者首先在相對似然中消除干擾參數(shù),然后直接為感興趣的參數(shù) Φ 構(gòu)建 IM 輪廓函數(shù);而后者則先為完整參數(shù) Θ 構(gòu)建 IM 輪廓函數(shù),再對其邊緣化以得到關(guān)于 Φ 的結(jié)果。Martin 與 Williams(2025)最近證實,至少在漸近意義上,基于剖面似然的邊緣 IM 構(gòu)造比基于擴展的構(gòu)造更為高效。

我在此的提議是,從這個基于剖面似然的邊緣可能性推理模型(marginal possibilistic IM)中提取出關(guān)于 Φ 的內(nèi)部概率近似(inner probabilistic approximation)。這不需要對第5節(jié)所述的計算方法做任何修改,而且該邊緣 IM 的精確有效性意味著,例如,基于此“后驗”所構(gòu)建的關(guān)于 Φ 的可信區(qū)間就是精確的置信區(qū)間。

唯一的難點在于,相對剖面似然沒有閉式表達(dá)式,且其分布依賴于一個干擾參數(shù);這正是 Behrens–Fisher 問題具有挑戰(zhàn)性的根本原因。這使得內(nèi)部概率近似的計算成本相較于其他示例更高(參見附錄 G),但正如我在下文所展示的,這種額外的計算開銷換來了效率上的顯著提升。



Behrens–Fisher 問題最常被引用的實際數(shù)據(jù)示例,是 Lehmann (1975, 第 83 頁) 中關(guān)于通過兩條不同路線通勤上班所需時間的例子。相關(guān)的匯總統(tǒng)計量——樣本量、樣本均值和樣本標(biāo)準(zhǔn)差——如下:n? = 5,θ??? = 7.580,θ??? = 2.237;n? = 11,θ??? = 6.136,θ??? = 0.073。兩個標(biāo)準(zhǔn)差 θ??? 和 θ??? 之間存在巨大差異,這使得假設(shè)兩組方差相等的合理性難以成立。圖 8 展示了來自邊緣 IM 的內(nèi)部概率近似的 Φ 樣本直方圖,并疊加了(核密度估計的)右 Haar 先驗貝葉斯解與 Jeffreys 先驗貝葉斯解的密度函數(shù);前者還與 Fisher 的置信分布一致。關(guān)鍵在于,這三個分布彼此相似,其中新的內(nèi)部概率近似和右 Haar 先驗后驗分布比 Jeffreys 先驗后驗分布略顯分散。

為進一步比較,我進行了一個小規(guī)模的模擬研究。我重點關(guān)注一個相當(dāng)不平衡的情形——n? = 3 且 n? = 20——以確保性能差異清晰可見。其他模擬設(shè)置均為標(biāo)準(zhǔn)設(shè)定:Θ?? = 2,Θ?? = 0,Θ??2 = 1,Θ??2 = 2。在此設(shè)定下,我生成了 10,000 個樣本,表 1 列出了各種 90% 置信區(qū)間關(guān)于 Φ 的覆蓋概率和期望長度。值得注意的是,只有邊緣可能性推理模型的內(nèi)部概率近似能夠近乎精確地達(dá)到目標(biāo)覆蓋概率,而且正如所期望的那樣,它比基于右 Haar 先驗的、雖有效但保守的貝葉斯/置信解更高效。

7 結(jié)論

本文提供了一種關(guān)于無先驗貝葉斯推斷的新視角,該視角與貝葉斯推斷有一定聯(lián)系,但本質(zhì)上并非貝葉斯方法。我的方法始于一個推理模型(IM)框架,該框架用于數(shù)據(jù)驅(qū)動的不確定性量化,并優(yōu)先考慮可靠性,堅持對其數(shù)據(jù)依賴的信念度進行校準(zhǔn)。正是這種校準(zhǔn)要求使得 IM 與概率性貝葉斯推斷不相容,也正因如此,IM 的輸出是可能性性的,即采用可能性測度的數(shù)學(xué)形式。然而,如果人們希望獲得概率性的不確定性量化,則 IM 可通過其可能性輸出的“內(nèi)部概率近似”來滿足這一需求。除了實現(xiàn)精確的概率匹配外,所提出的方案在存在整體共識的群等變問題中與現(xiàn)有的無先驗貝葉斯解法一致,并且根據(jù)著名的 Bernstein–von Mises 定理的一個版本,它在漸近意義上也是高效的。此外,根本無需選擇先驗分布:對于給定的模型和數(shù)據(jù),可能性推理模型本身就是確定的,因此只需從中提取一個合適的內(nèi)部概率近似即可。

定理1中對 IM 可信集內(nèi)容的刻畫提示了一種策略,可通過蒙特卡洛方法評估(至少近似地)內(nèi)部概率近似。我在 Martin (2025a) 中對此進行了深入探討,但主要是在可能性推理模型的背景下。在此文中,我將相同的策略應(yīng)用于我所提出的重新構(gòu)想的無先驗貝葉斯推斷,并表明這為技術(shù)上具有挑戰(zhàn)性且實際重要的 Behrens–Fisher 問題提供了一種新穎且廣泛可靠的解決方案。本方法并未專門針對 Behrens–Fisher 問題量身定制,因此我完全預(yù)期它在許多其他重要應(yīng)用中也能取得同樣良好的表現(xiàn)。當(dāng)然,我所提出方案的計算效率仍有改進空間,因此我歡迎精通計算的讀者沿此方向做出進一步推進。

本文的重點一直放在無先驗解法上,但在某些情況下,不完整或部分先驗信息是可用的,包括結(jié)構(gòu)假設(shè)(如稀疏性)較為常見的高維問題。貝葉斯解法無法處理不完整的先驗信息——必須為未知參數(shù) Θ 的每個方面指定一個先驗分布(即使可能是模糊的)。最近已開發(fā)出真正的部分先驗可能性推理模型(例如,Martin 2022b),一個有趣的想法是將本文在無先驗情形下提出的內(nèi)部概率近似方法,同樣應(yīng)用于上述文獻(xiàn)中的部分先驗情形。正如本文所述,這些內(nèi)部概率近似將繼承部分先驗 IM 所滿足的一些固有可靠性性質(zhì),但具體細(xì)節(jié)尚待研究。

原文鏈接: https://www.arxiv.org/pdf/2503.19748

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
廣州32歲猝死程序員公司發(fā)內(nèi)部郵件,稱其未按要求做體檢,妻子:每年都有體檢,公司不承認(rèn)三甲醫(yī)院體檢報告

廣州32歲猝死程序員公司發(fā)內(nèi)部郵件,稱其未按要求做體檢,妻子:每年都有體檢,公司不承認(rèn)三甲醫(yī)院體檢報告

大風(fēng)新聞
2026-01-27 20:52:03
給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

與車同樂
2025-12-04 10:05:02
深圳重挖 110 米垃圾山,把歐美看呆了:中國已經(jīng)陷入“垃圾荒”了

深圳重挖 110 米垃圾山,把歐美看呆了:中國已經(jīng)陷入“垃圾荒”了

小李子體育
2026-01-27 16:01:14
26歲天才股神坦言:尾盤30分鐘就能買到次日必漲的股票,從不例外

26歲天才股神坦言:尾盤30分鐘就能買到次日必漲的股票,從不例外

股經(jīng)縱橫談
2026-01-27 18:22:52
過年別亂買東西!這5種年貨,全是“科技與狠活”,很多人不知道

過年別亂買東西!這5種年貨,全是“科技與狠活”,很多人不知道

Home范
2026-01-27 14:07:55
運價直逼5毛錢/公里,網(wǎng)約車司機發(fā)出靈魂拷問:這么低的價格究竟誰在跑?

運價直逼5毛錢/公里,網(wǎng)約車司機發(fā)出靈魂拷問:這么低的價格究竟誰在跑?

網(wǎng)約車觀察室
2026-01-26 10:17:32
1997年回歸前夜,香港十幾萬黑幫連夜“大逃亡”,他們最后都去哪了?

1997年回歸前夜,香港十幾萬黑幫連夜“大逃亡”,他們最后都去哪了?

老杉說歷史
2026-01-13 19:14:13
不到48小時,特朗普身體傳噩耗,34國軍方高官集合,對英緊急改口

不到48小時,特朗普身體傳噩耗,34國軍方高官集合,對英緊急改口

夕陽渡史人
2026-01-27 14:35:01
做完手術(shù)人就廢了,這5種手術(shù)不需要做,別讓無知害了自己

做完手術(shù)人就廢了,這5種手術(shù)不需要做,別讓無知害了自己

華庭講美食
2026-01-19 14:27:13
烏外長:澤連斯基愿與普京會面 以解決領(lǐng)土等敏感問題

烏外長:澤連斯基愿與普京會面 以解決領(lǐng)土等敏感問題

財聯(lián)社
2026-01-28 02:36:58
郭艾倫沒想到,辭職遼寧男籃的楊鳴,原來早已給自己準(zhǔn)備好了后路

郭艾倫沒想到,辭職遼寧男籃的楊鳴,原來早已給自己準(zhǔn)備好了后路

行舟問茶
2026-01-28 03:16:53
頂流巨星:已退圈,寧肯做農(nóng)民

頂流巨星:已退圈,寧肯做農(nóng)民

視覺志
2026-01-27 10:34:11
胖改不到一年!北京知名超市突然停業(yè)了!

胖改不到一年!北京知名超市突然停業(yè)了!

大北京早知道
2026-01-27 14:13:08
李平康:賀一然加盟泰山基本差不多了,玄智健基本不可能了

李平康:賀一然加盟泰山基本差不多了,玄智健基本不可能了

懂球帝
2026-01-27 22:34:52
專家:銀價短期或跌回90美元之下

專家:銀價短期或跌回90美元之下

財聯(lián)社
2026-01-27 16:22:25
中國駐日大校王慶簡:定時以開窗為號,竟向日本傳遞了 20 年機密

中國駐日大校王慶簡:定時以開窗為號,竟向日本傳遞了 20 年機密

z千年歷史老號
2026-01-23 12:16:03
中美艦艇發(fā)生激烈對峙!外軍突然沖向解放軍,結(jié)果下一刻掉頭跑了

中美艦艇發(fā)生激烈對峙!外軍突然沖向解放軍,結(jié)果下一刻掉頭跑了

杰絲聊古今
2026-01-28 03:38:29
單親媽媽打兩份工賺的錢,被兒子偷轉(zhuǎn)1萬給爸爸,評論區(qū)直接炸鍋

單親媽媽打兩份工賺的錢,被兒子偷轉(zhuǎn)1萬給爸爸,評論區(qū)直接炸鍋

和平聲浪
2026-01-27 14:30:21
1月27日,人社部召開了發(fā)布會,有3個社保養(yǎng)老金好消息,挺重要的

1月27日,人社部召開了發(fā)布會,有3個社保養(yǎng)老金好消息,挺重要的

墨蘭史書
2026-01-27 17:25:03
主場龍客場蟲?火箭隊竟然成為了全聯(lián)盟的第一魔鬼主場!

主場龍客場蟲?火箭隊竟然成為了全聯(lián)盟的第一魔鬼主場!

田先生籃球
2026-01-27 12:39:54
2026-01-28 04:15:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1182文章數(shù) 18關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會講話透露了哪些關(guān)鍵信息

頭條要聞

美報告稱中國是其19世紀(jì)以來面對過的最強大國家

頭條要聞

美報告稱中國是其19世紀(jì)以來面對過的最強大國家

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對手現(xiàn)學(xué)?

娛樂要聞

張雨綺風(fēng)波持續(xù)發(fā)酵,曝多個商務(wù)被取消

財經(jīng)要聞

多地對壟斷行業(yè)"近親繁殖"出手了

汽車要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

態(tài)度原創(chuàng)

親子
藝術(shù)
旅游
教育
軍事航空

親子要聞

雙職工家庭,孩子上幼兒園后,無老人幫忙,夫妻倆能獨立帶娃嗎?

藝術(shù)要聞

震撼!19世紀(jì)油畫巨匠的作品美得不可思議!

旅游要聞

紅燈籠映北海:皇家園林里的年味,藏著中國人的精神原鄉(xiāng)!

教育要聞

對話陳妤頡:閃閃發(fā)光的賽道,追逐夢想

軍事要聞

美海軍"林肯"號航母打擊群抵達(dá)中東地區(qū)

無障礙瀏覽 進入關(guān)懷版