SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)_第1頁
SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)_第2頁
SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)_第3頁
SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)_第4頁
SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

SPSS詳細(xì)操作:1:n傾向性評分匹配(PSM)在上一篇文章中,我們向大家介紹了如何給SPSS安裝插件,拓展出1:n傾向性評分匹配的功能。詳見:滿滿干貨!給SPSS插上1:n傾向性評分匹配(PSM)的翅膀在今天的內(nèi)容中,我們就繼續(xù)給大家介紹一下,如何使用SPSS進(jìn)行簡單的幾步操作,就能輕松搞定高大上的1:n傾向性評分匹配。一、問題與數(shù)據(jù)假設(shè)某位心內(nèi)科醫(yī)生在門診連續(xù)收集了170名就診患者,其中冠心?。–HD)患者24名,146名對照,并記錄了他們的性別、年齡、BMI、LDL-C等信息,擬探討LDL-C水平與冠心病的關(guān)系(此處不對該研究的設(shè)計方法進(jìn)行評價)。數(shù)據(jù)格式如下:注意:這里有2點大坑需要大家值得關(guān)注:(1)所有的變量名須是英文名稱,不要使用中文,否則會導(dǎo)致后面回歸模型建模失敗;(2)所有變量不能有缺失值,包括擬進(jìn)行匹配和不進(jìn)行匹配的全部變量,都不允許出現(xiàn)缺失值。首先該醫(yī)生對數(shù)據(jù)進(jìn)行了初步分析,將病例組和對照組之間的各個因素進(jìn)行比較,結(jié)果發(fā)現(xiàn)兩組各因素間差異均有統(tǒng)計學(xué)顯著性。但為了保證兩組人群之間各混雜因素能夠均衡可比,該醫(yī)生擬采用1:n傾向性評分匹配的方法來對兩組人群進(jìn)行匹配。表1.傾向性評分匹配前兩組間各個因素的比較結(jié)果二、SPSSPSMatching拓展功能操作1.選擇analyze→PSMatching2.在PropensityScoreMatching對話框中(1)將分組變量CHD選入BinaryTreatmentIndicator中,其中1代表病例組,0代表對照組,且變量類型必須定義為尺度變量。(2)將用于計算傾向性評分的協(xié)變量age、BMI、gender選入Covariates,將與處理因素?zé)o關(guān)的協(xié)變量選入AdditionalCovariates。注意:一般根據(jù)結(jié)局變量與混雜變量構(gòu)建二分類logistic回歸模型,進(jìn)行逐步回歸,將進(jìn)入模型的變量選入Covariates,剔除的變量選入AdditionalCovariates。(3)設(shè)定Caliper值,為0~1之間,該值設(shè)置越大,越接近于1,就越容易找到匹配的對象,但結(jié)果就越容易出現(xiàn)不平衡;該值設(shè)置越小越接近于0,匹配就越嚴(yán)格,但是符合匹配要求的患者就少了,最終導(dǎo)致研究的統(tǒng)計效能降低,很有可能找不到匹配的對象。本例中暫且設(shè)置為0.1,也就是說如果一個病例組研究對象患有冠心病的概率為0.8,那么與之匹配的對照組研究對象患有冠心病的概率須在0.7-0.9之間。3.點擊PlotandOutput選項在Plots下勾選Histogramofstandardizeddifferences、Dotplotofstandardizedmeandifferences、Lineplotofindividualdifferences,分別繪制SD分布直方圖、單變量SD散點圖、標(biāo)準(zhǔn)化差異變化線圖。在OutputDatasets下勾選Paireddatasetby“matched_id”,在Include下選擇Matchedcases,并在BalanceStatistics下選擇Detailed–byExactMatchingvariables。4.點擊NearestNeighbor選項在MatchRatio下選擇Match1:many,并設(shè)定匹配數(shù)量n,一般n不超過4,否則容易出現(xiàn)過度匹配的現(xiàn)象。本例中以設(shè)定1:2為例進(jìn)行匹配。Matchingorder下拉框選擇Random。5.點擊OK完成操作。三、結(jié)果解讀1.樣本匹配結(jié)果結(jié)果顯示,SPSS生成了一個新的已完成匹配的數(shù)據(jù)文件,其中包含病例組21人,對照組39人,我們發(fā)現(xiàn)兩組人群約為1:2,但并非是絕對的1:2匹配,這是因為有些病例未能同時找到有效匹配的對照人群。2.匹配后的均衡性度量在輸出結(jié)果“RelativemultivariateimbalanceL1”中,L1measure統(tǒng)計量理論上介于0~1之間,匹配前和匹配后相比,L1measure統(tǒng)計量越小,提示匹配效果越好。在本例研究中,匹配后的L1measure統(tǒng)計量為0.643,遠(yuǎn)小于匹配前的0.808,提示匹配良好。3.顯示匹配后不均衡的變量在輸出結(jié)果“Summaryofunbalancedcovariates”中,若|d|>0.25,則提示變量存在不均衡性。在本例研究中,結(jié)果顯示沒有變量|d|>0.25,提示匹配后所有匹配的變量都達(dá)到了平衡。4.匹配后均衡性比較對于匹配后的協(xié)變量均衡性比較應(yīng)該遵守兩個原則:①評價方法應(yīng)該是針對樣本而不是總體

仔細(xì)想想,傾向性評分匹配實際上是從一個隨機(jī)獲得的有代表性樣本中再“挑”出一部分進(jìn)行分析,這時候再去通過“挑出來樣本”去推斷最開始的總體,顯然已經(jīng)不合適啦。②評價指標(biāo)應(yīng)該與樣本量大小無關(guān)

為啥呢?想想看看,我們前面提到的匹配比例可以從1:1設(shè)定到1:4(事實上可以任意無限大設(shè)置,但是考慮匹配效率,推薦不要超過1:4),如果某個評價指標(biāo)和樣本量有關(guān),那極有可能會遇到不同樣本量下完全不一樣的比較結(jié)果。綜上,你腦海里第一反應(yīng)的t檢驗或者卡方檢驗在這里已經(jīng)不合適了。當(dāng)然,還有其他常見的可用于協(xié)變量均衡性比較的指標(biāo),比如說C統(tǒng)計量等,也是存在很多缺點的(想要進(jìn)一步了解這方面的內(nèi)容,推薦大家一篇綜述[1])。有小伙伴要問啦,這個方法也不行,那個也不行,到底用啥方法評價均衡性?別急,方法還是有的。在傾向性評分匹配后的均衡性比較中,推薦大家使用標(biāo)準(zhǔn)差異(Standardizeddifference)。一般而言,標(biāo)準(zhǔn)差異絕對值小于10%時,可認(rèn)為組間均衡性較好。具體計算公式如下:再回到本例中,SPSS在結(jié)果中輸出了DetailedBalance表格,展示了各個變量匹配前后的均值、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差異等信息,結(jié)果顯示CHD組和對照組的年齡、BMI的標(biāo)準(zhǔn)差異絕對值分別為12.2%和3.7%。由于性別為分類變量,匹配后根據(jù)上述公式計算其標(biāo)準(zhǔn)差異絕對值為0.83%。按照上面提到的10%的標(biāo)準(zhǔn),性別和BMI匹配后在兩組中均衡性較好,但是年齡就差點兒,這也說明傾向性評分匹配也不是萬能的,如果兩組沒有足夠“重疊的部分”(比如說一個不太恰當(dāng)?shù)睦樱陈∪巳汉腕w檢中心健康人群進(jìn)行匹配,前者年齡一般會比后者大不少,想要保證兩組匹配后年齡均衡可比,自然是難度大大的),匹配的結(jié)果也不會非常理想。以上僅是舉例,重在方法操作。再回過頭來,瞅瞅組間LDL-C水平(表2)。結(jié)果顯示,匹配后的CHD組LDL-C水平高于對照組,組間差異明顯縮小了不少,但是獲得了一個比較“干凈”的效應(yīng),提示LDL-C可能是CHD發(fā)生的一個危險因素。為了進(jìn)一步確定LDL-C水平對CHD發(fā)生風(fēng)險的效應(yīng)大小,可以根據(jù)我們前期推送的教程《SPSS實例教程|1:m匹配病例對照Logistic回歸》,來進(jìn)行更加深入的分析和探討。表2.傾向性評分匹配前后兩組LDL-C比較結(jié)果5.圖形輸出結(jié)果5.1SD分布直方圖若匹配后的標(biāo)準(zhǔn)差異集中在0附近,可以提示匹配達(dá)到了較好的效果。5.2標(biāo)準(zhǔn)化差異變化線圖和單變量SD散點圖這兩個圖的點值與上述DetailedBalance表格中的值是相對應(yīng)的,均展示了匹配前后,各個協(xié)變量標(biāo)準(zhǔn)差異的變化。標(biāo)準(zhǔn)化差異變化線圖顯示,匹配后各個協(xié)變量標(biāo)準(zhǔn)差異均明顯降低,單變量SD散點圖顯示匹配后標(biāo)準(zhǔn)差異基本集中在0附近,提示變量達(dá)到了均衡,匹配效果良好,可以結(jié)合DetailedBalance表格進(jìn)行輔助判斷。我們通過兩期的內(nèi)容向大家詳細(xì)介紹了在SPSS中實現(xiàn)1:n傾向性評分匹配的功能,在學(xué)習(xí)統(tǒng)計學(xué)的道路上又get了一項高大上的新技能,如果大家在實操的過程中還遇到什么問題,歡迎在下方留言討論哈!參考文獻(xiàn)1.JClinEpidemiol.2015;68:112-21.更多閱讀1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論