国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

因果潛在因子模型中的雙重穩(wěn)健推斷

0
分享至

Doubly Robust Inference in Causal Latent Factor Models

因果潛在因子模型中的雙重穩(wěn)健推斷

https://arxiv.org/pdf/2402.11652



摘要

本文介紹了一種在存在未觀測混雜因素情形下估計平均處理效應的新估計量,適用于現(xiàn)代數(shù)據(jù)豐富環(huán)境,該環(huán)境具有大量觀測單元與結果變量。所提出的估計量具有雙重穩(wěn)健性,融合了結果填補(outcome imputation)、逆概率加權(inverse probability weighting)以及一種用于矩陣補全(matrix completion)的新型交叉擬合(cross-fitting)程序。我們推導了有限樣本與漸近性質的理論保證,并證明該新估計量的誤差以參數(shù)速率收斂至均值為零的高斯分布。模擬結果驗證了本文所分析估計量的形式性質的實際相關性。

  1. 引言

本文提出了一種在存在未觀測混雜因素情形下、針對現(xiàn)代數(shù)據(jù)豐富環(huán)境的平均處理效應估計新框架。我們將現(xiàn)代數(shù)據(jù)豐富環(huán)境定義為在大量觀測單元上收集了廣泛結果測量值的環(huán)境。我們對數(shù)據(jù)豐富環(huán)境的關注源于數(shù)字平臺(例如互聯(lián)網(wǎng)零售商、社交媒體公司和共享出行公司)、電子病歷系統(tǒng)、物聯(lián)網(wǎng)設備以及其他實時數(shù)字化數(shù)據(jù)系統(tǒng)的興起,這些系統(tǒng)以前所未有的廣度與細粒度收集經(jīng)濟與社會行為數(shù)據(jù)。

以互聯(lián)網(wǎng)零售商為例。該平臺不僅收集眾多客戶在眾多產(chǎn)品或產(chǎn)品類別上的購買信息,還記錄瀏覽次數(shù)、曝光量、轉化率、參與度指標、導航路徑、配送選擇、支付方式、退貨記錄、用戶評價等數(shù)據(jù)。盡管某些變量(如地理位置、設備或瀏覽器類型)可被安全地視為相對于平臺處理行為(如廣告投放、折扣發(fā)放、網(wǎng)頁設計等)預先確定的變量,但大多數(shù)變量均為受處理干預、潛在客戶偏好及未觀測產(chǎn)品特征共同影響的結果變量。我們利用現(xiàn)代數(shù)據(jù)豐富環(huán)境中大量結果測量值的可得性,在存在未觀測混雜因素的情況下估計平均處理效應。核心識別思想在于:若高維結果向量的每個元素均受同一低維未觀測混雜因素向量的影響,則有可能消除混雜因素的影響并識別出處理效應。

處理效應估計主要有兩種方法:基于結果的方法(outcome-based methods)與基于分配的方法(assignment-based methods)。仍以互聯(lián)網(wǎng)零售平臺為例,客戶與不同產(chǎn)品類別發(fā)生交互,平臺針對每個消費者-類別配對決定是否提供折扣,并記錄消費者是否在該類別中購買了產(chǎn)品?;诮Y果的方法通過填補每個消費者-產(chǎn)品類別配對缺失的潛在結果進行操作:該過程包括預測接受折扣的消費者若未獲得折扣是否會購買(即無折扣下的潛在結果),反之亦然,預測未獲折扣的消費者若獲得折扣是否會購買(即有折扣下的潛在結果)。相比之下,基于分配的方法則估計消費者在各產(chǎn)品類別中獲得折扣的概率,并通過對觀測結果進行與缺失概率成反比的加權來調(diào)整缺失的潛在結果。

大量文獻探討了基于結果的方法,尤其在所有混雜因素均被觀測的設定下(參見如Cochran, 1968;Rosenbaum與Rubin, 1983;Angrist, 1998;Abadie與Imbens, 2006等眾多研究)。在存在未觀測混雜因素情形下進行潛在結果填補則構成更為復雜的挑戰(zhàn)。在此背景下,常用框架包括合成控制法及其變體(參見如Abadie與Gardeazabal, 2003;Abadie等, 2010;Cattaneo等, 2021;Arkhangelsky等, 2021)。另一種相關但不同的方法是潛在因子框架(latent factor framework)(Bai與Ng, 2002;Bai, 2009;Xiong與Pelger, 2023),其中高維結果向量的每個元素均受同一低維未觀測混雜因素向量影響。矩陣補全方法(參見如Chatterjee, 2015;Athey等, 2021;Bai與Ng, 2021;Dwivedi等, 2022a;Agarwal等, 2023a)在推薦系統(tǒng)與面板數(shù)據(jù)模型中得到廣泛應用,與潛在因子模型密切相關。類似地,現(xiàn)有的基于分配的平均處理效應估計程序通常依賴于無未測量混雜假設(參見如Robins等, 2000;Hirano等, 2003;Wooldridge, 2007)、共同趨勢限制(Abadie, 2005)或工具變量的可得性(Abadie, 2003;Sloczynski等, 2024)。

本文提出了一種在存在未觀測混雜因素情形下的平均處理效應雙重穩(wěn)健估計量(參見Robins等, 1994;Bang與Robins, 2005;Chernozhukov等, 2018)。該估計量在潛在因子框架下同時利用結果過程與處理分配機制的信息,將結果填補與逆概率加權相結合,并引入一種用于矩陣補全的新型交叉擬合方法。我們證明,相較于其他基于結果或基于分配的估計量,所提出的雙重穩(wěn)健估計量具有更優(yōu)的有限樣本保證。此外,在矩陣補全誤差率可被證明有效的條件下,無論所用矩陣補全算法的其他性質如何,該雙重穩(wěn)健估計量均漸近無偏、近似服從高斯分布,并以參數(shù)速率收斂。

據(jù)我們所知,本文是首篇同時利用分配過程與結果過程中的潛在結構,以獲得存在未觀測混雜因素時平均處理效應雙重穩(wěn)健估計量的研究。Arkhangelsky與Imbens(2022)在縱向數(shù)據(jù)下研究了雙重穩(wěn)健識別,其假設是對處理分配隨時間變化的某一函數(shù)(例如個體暴露于處理的次數(shù)比例)進行條件化足以消除混雜。Athey等(2021)、Bai與Ng(2021)、Dwivedi等(2022a)、Agarwal等(2023a)以及Xiong與Pelger(2023)提出了應用矩陣補全技術填補潛在結果的估計量。盡管這些研究利用了結果過程中的低秩限制,但并未探究處理分配過程中可能存在類似潛在結構的可能性。本文對此問題進行了探討,并證明納入分配機制結構知識可帶來實質性收益。



  1. 設定






  1. 估計

在本節(jié)中,我們提出一種利用處理分配矩陣A和觀測結果矩陣Y來估計的程序,其中


本節(jié)所提出的估計量將矩陣補全作為關鍵子程序加以利用。我們以矩陣補全方法的簡要概述開啟本節(jié)。



3.2. 關鍵構建模塊






3.3. 雙重穩(wěn)健(DR)估計量


4. 主要結果



4.1. 假設
關于數(shù)據(jù)生成過程的要求。我們對數(shù)據(jù)的生成方式作出兩項假設。首先,我們對分配概率施加一個正值性條件。






公式(14)要求,在每個單元的兩個分區(qū)內(nèi),對于每次測量,估計的潛在結果均值和估計的分配概率與分配概率中的誤差聯(lián)合獨立。類似地,公式(15)要求,在每個單元的兩個分區(qū)內(nèi),對于每次測量,估計的分配概率與分配概率和潛在結果中的噪聲聯(lián)合獨立。像公式(14)和公式(15)這樣的條件在雙穩(wěn)健估計文獻中是常見的。Chernozhukov等人(2018)采用交叉擬合裝置,在沒有未測量混雜因素的背景下,強制執(zhí)行類似于假設4的條件。第5節(jié)為矩陣估計提供了一種新穎的交叉擬合流程,在該流程下,假設4對任何MC算法都成立(在對噪聲變量的額外假設下)。






4.3.漸近保證





該模型中滯后處理效應的存在使得為整個處理序列定義因果估計量變得至關重要。附錄I描述了如何將所提出的雙穩(wěn)健估計擴展到處理序列,并推導了定理1的推廣形式。


5. 帶有交叉擬合的矩陣補全


5.1. 交叉擬合-MC:一種用于矩陣補全的元交叉擬合算法







許多MC算法旨在對隨機缺失模式下的矩陣進行去噪和缺失值插補;研究最常見的缺失模式是每個條目有相同的缺失概率,且獨立于其他所有因素。相比之下,交叉擬合-MC生成的模式中,一個區(qū)塊內(nèi)的所有條目都是確定性缺失的,如圖3(b)所示。最近關于矩陣補全方法與因果推斷模型之間相互作用的研究——特別是在合成控制框架內(nèi)——已經(jīng)貢獻了允許塊狀缺失的矩陣補全算法(參見,例如,Athey等人,2021;Agarwal等人,2021;Bai和Ng,2021;Agarwal等人,2023b;Arkhangelsky等人,2021;Agarwal等人,2023a;Dwivedi等人,2022a,b)。然而,將這些方法已知的理論保證應用于本文的設定存在挑戰(zhàn),原因在于:(i) 使用了交叉擬合——這創(chuàng)建了所有觀測都缺失的區(qū)塊——以及 (ii) 在完全缺失的區(qū)塊之外,仍然可能存在具有異質缺失概率的缺失觀測。在下一節(jié)中,我們將展示如何修改為塊狀缺失模式設計的MC算法,使其能夠應用于我們的帶有交叉擬合和折疊外異質缺失概率的設定。為具體起見,我們采用Bai和Ng(2021)的Tall-Wide矩陣補全算法進行說明。


5.2. 交叉擬合-SVD算法

交叉擬合-SVD是一個端到端的MC算法,通過將交叉擬合-MC元算法與Bai和Ng(2021)的Tall-Wide算法(我們稱之為TW)實例化而獲得。為完整起見,我們在第5.2.1節(jié)詳細描述TW算法,然后在第5.2.2節(jié)中使用它來描述交叉擬合-SVD。








原文鏈接:https://arxiv.org/pdf/2402.11652

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
600581,將被*ST!明天停牌!

600581,將被*ST!明天停牌!

證券時報e公司
2026-03-29 22:05:39
網(wǎng)約車司機花1200元把車改成“頭等艙”,收到6000元打賞

網(wǎng)約車司機花1200元把車改成“頭等艙”,收到6000元打賞

用車指南
2026-03-29 10:01:32
中央定調(diào),公務員退休3選1,提前退、正常退、滿30年退怎么選?

中央定調(diào),公務員退休3選1,提前退、正常退、滿30年退怎么選?

浪子阿邴聊體育
2026-03-29 16:00:34
回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風韻猶存

回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風韻猶存

素衣讀史
2026-03-25 21:05:22
莫讓老將寒心:35歲的武磊“寶刀未老”,卻不會再入選國足了

莫讓老將寒心:35歲的武磊“寶刀未老”,卻不會再入選國足了

里芃芃體育
2026-03-29 21:47:38
錢天一王昶參加好友婚禮,穿新中式情侶裝,王昶兜里裝了很多紅包

錢天一王昶參加好友婚禮,穿新中式情侶裝,王昶兜里裝了很多紅包

樂悠悠娛樂
2026-03-29 10:37:13
X熱議:女性喜歡的臉 vs 男性喜歡的臉

X熱議:女性喜歡的臉 vs 男性喜歡的臉

東京新青年
2026-03-28 11:02:30
五星級酒店帶人不登記可以嗎?網(wǎng)友:又是上網(wǎng)漲見識的一天!

五星級酒店帶人不登記可以嗎?網(wǎng)友:又是上網(wǎng)漲見識的一天!

深度報
2026-02-22 22:52:56
養(yǎng)生|大便后你用幾張紙?用紙量判斷你的身體情況

養(yǎng)生|大便后你用幾張紙?用紙量判斷你的身體情況

A活著
2026-03-24 19:25:23
林青霞親口爆料:當年我全裸給他看,他卻嚇得扭頭就跑!

林青霞親口爆料:當年我全裸給他看,他卻嚇得扭頭就跑!

達文西看世界
2026-03-04 15:07:30
火光沖天!以色列稱一工業(yè)區(qū)因伊朗導彈襲擊起火

火光沖天!以色列稱一工業(yè)區(qū)因伊朗導彈襲擊起火

看看新聞Knews
2026-03-29 23:42:04
清算終于開始了!一個要求,震動東京:中國要求日本限期內(nèi)歸還

清算終于開始了!一個要求,震動東京:中國要求日本限期內(nèi)歸還

壹知眠羊
2026-01-28 22:03:28
痤瘡新藥上市,無抗復方外用藥可實現(xiàn)最快一周內(nèi)見效

痤瘡新藥上市,無抗復方外用藥可實現(xiàn)最快一周內(nèi)見效

南方都市報
2026-03-28 21:54:11
不服就干!比利時打響反華第一槍,通告全球,斷的就是中方退路

不服就干!比利時打響反華第一槍,通告全球,斷的就是中方退路

云舟史策
2026-03-29 07:14:39
1983年,莊則棟給萬里副總理寫信提出兩點要求,萬里很快作出批示

1983年,莊則棟給萬里副總理寫信提出兩點要求,萬里很快作出批示

今明文史
2026-03-29 08:50:06
劉大錘直播曝白敬亭宋軼分手內(nèi)幕:別墅里的小板車,搬不動的愛情

劉大錘直播曝白敬亭宋軼分手內(nèi)幕:別墅里的小板車,搬不動的愛情

完善法
2026-03-12 11:41:14
香港新規(guī):拒絕解鎖手機判1年,3類人群最危險

香港新規(guī):拒絕解鎖手機判1年,3類人群最危險

全棧遛狗員
2026-03-28 11:45:59
張雪峰去世僅三天,女兒再也忍不住了:爸爸曾偷偷睡在會議桌上

張雪峰去世僅三天,女兒再也忍不住了:爸爸曾偷偷睡在會議桌上

潮鹿逐夢
2026-03-27 20:16:27
張雪峰40天閃婚真相曝光,細節(jié)驚人牽涉第三人

張雪峰40天閃婚真相曝光,細節(jié)驚人牽涉第三人

無處遁形
2026-03-29 04:31:18
意外!U19國足核心一戰(zhàn)成名被譽為中國姆巴佩,如今只能踢中冠

意外!U19國足核心一戰(zhàn)成名被譽為中國姆巴佩,如今只能踢中冠

懂個球
2026-03-29 23:46:55
2026-03-30 02:16:49
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1313文章數(shù) 18關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現(xiàn)!李榮浩喊話單依純侵權

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

旅游
手機
本地
時尚
家居

旅游要聞

2026上海旅游產(chǎn)業(yè)博覽會開幕,一城三館聯(lián)動書寫文商旅體展消費新篇章

手機要聞

驍龍8 Elite Gen6系列規(guī)格大揭秘:LPDDR6、Adreno 850,都來了!

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

來到1980的周也,好毛利蘭

家居要聞

曲線華爾茲 現(xiàn)代簡約

無障礙瀏覽 進入關懷版