SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)_第1頁
SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)_第2頁
SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)_第3頁
SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)_第4頁
SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

SPSS操作:輕松實現(xiàn)1:1傾向性評分匹配(PSM)談起臨床研究,如何設立一個靠譜的對照,有時候成為整個研究成敗的關(guān)鍵。對照設立的一個非常重要的原則就是可比性,簡單說就是對照組除了研究因素外,其他的因素應該盡可能和試驗組保持一致,這里就不得不提隨機對照試驗。眾所周知,隨機對照試驗中研究對象是否接受干預是隨機的,這就保證了組間其他混雜因素均衡可比。但是有些時候并不能實現(xiàn)隨機化,比如說觀察性研究。這時候傾向性評分匹配(propensityscorematching,PSM)可以有效降低混雜偏倚,并且在整個研究設計階段,得到類似隨機對照研究的效果。與常規(guī)匹配相比,傾向性評分匹配能考慮更多匹配因素,提高研究效率。這么“高大上”的傾向性評分匹配,是不是超級難學?錯矣!今天就帶大家輕松搞定1:1傾向性評分匹配。作為“稀罕”大招,并不是在所有版本的SPSS都可以實現(xiàn)傾向性評分匹配,僅在SPSS22及以上自帶簡易版PSM,對于其他版本或者想要體驗完整版功能,就不得不去安裝相應的軟件(R軟件、SPSSR插件、PSmatching插件。。。超級難安裝!那是需要運氣和耐心的?。?。本次使用SPSS22為大家演示1:1傾向性評分匹配。一、問題與數(shù)據(jù)展開剩余89%某研究小白想搞明白吸煙和高血壓之間的關(guān)系,準備利用某項調(diào)查的資料進一步隨訪研究吸煙和高血壓的關(guān)聯(lián),該項研究包括233名吸煙者,949名不吸煙者。如果全部隨訪,研究小白感覺鴨梨山大,所以打算從中選取部分可比的個體進行隨訪。這兩組人群一些主要特征的分布存在顯著差異(見表1),現(xiàn)準備采用PS最鄰近匹配法選取可比的個體作為隨訪對象。表1.兩組基線情況比較(匹配前)二、SPSS分析方法1.數(shù)據(jù)錄入(1)變量視圖(2)數(shù)據(jù)視圖2.傾向性評分匹配選擇Data→PropensityScoreMatching,就進入傾向性評分匹配的主對話框。將分組變量Smoke放入GroupIndicator中(一般處理組賦值為“1”,對照組賦值為“0”);將需要匹配的變量放入Predictors中;NameforPropensityVariable為傾向性評分設定一個變量名PS;MatchTolerance用來設置傾向性評分匹配標準(學名“卡鉗值”),這里設定為0.02,即吸煙組和不吸煙組按照傾向性評分±0.02進行1:1匹配(當然,卡鉗值設置的越小,吸煙組和不吸煙組匹配后可比性越好,但是凡事有個度,太小的卡鉗值也意味著匹配難度會加大,成功匹配的對子數(shù)會減少,需要綜合考慮~~~);CaseID確定觀測對象的ID;MatchIDVariableName設定一個變量,用來明確對照組中匹配成功的Match_ID;OutputDatasetName這里把匹配的觀測對象單獨輸出一個數(shù)據(jù)集Match。3.Options設置VariableforNumberofEligibleCases設定一個變量,用來明確病例組中某一個觀測對象,在對照組中有多少個觀測對象滿足與其匹配的條件,比如說病例組有一個觀測對象PS=0.611,對照組可能有一個0.610,一個0.612。Sampling默認為不放回抽樣。Giveprioritytoexactmatches優(yōu)先考慮精確匹配,也就說病例組有一個觀測對象PS=0.611,對照組也應該找到一個0.611。Maximizeexecutionperformance執(zhí)行最優(yōu)化操作,即系統(tǒng)會綜合考慮精確匹配和模糊匹配(基于設定的卡鉗值范圍內(nèi)匹配),系統(tǒng)默認勾選。Randomizecaseorderwhendrawingmatches整個匹配過程中,如果對照組有多個滿足匹配條件的觀測對象,那么SPSS會默認隨機將其與病例組觀測對象匹配。但是因為SPSS默認每次操作給對照組的隨機數(shù)字不同,所以如果不特殊設定,每次實際匹配成功的對子是不一樣的,也就說這一次對照組A匹配給病例組B,下一次就可能匹配給病例組C。所以需要自行設置,并且在RandomNumberSeed設定一個隨機數(shù)種子,確保匹配過程可以重復。三、結(jié)果解讀1.匹配結(jié)果表2以吸煙(1=吸煙;0=不吸煙)為因變量,以需要調(diào)整的變量為自變量構(gòu)建logistic回歸模型(表2),求出每個研究對象的PS值。表2.logistic回歸模型表3顯示,精確匹配45對,模糊匹配114對,共計匹配成功159對。表3.匹配結(jié)果表4主要是匹配過程。首先是精確匹配(即PS完全一致),匹配33663次,大約1%匹配成功;其次在精確匹配成功的前提下,進行PS的模糊匹配(PS±0.02,即最開始設定的卡鉗值為0.02),匹配33618次,大約3.3%匹配成功。表4.匹配容許誤差2.匹配后數(shù)據(jù)庫輸出的數(shù)據(jù)集Match中出現(xiàn)之前設定的幾個新變量:E_case表示對照組中有幾個符合匹配條件的觀測對象(如圖,吸煙組ID=2,有2個對照組觀測對象符合匹配條件);PS是基于logistic回歸模型計算出的傾向性評分;match_id表示匹配成功的ID。3.數(shù)據(jù)庫整理A.篩選匹配成功的對子:選擇Data→SelectCases→Ifconditionissatisfied:設定match_id≥1,篩選出匹配成功的對子→Output中輸出新的數(shù)據(jù)集Analysis。B.確定匹配成功標識:match_id為吸煙組和不吸煙組相互匹配成功的ID,這里將不吸煙組match_id變量轉(zhuǎn)換為ID變量,這時候相同的match_id即為匹配成功的對子。具體操作:將Analysis數(shù)據(jù)集中,不吸煙組match_id替換成ID編號:Transform→ComputeVariable→ifsmoke=0,match_id=ID→OKC.選擇Data→Sortcases→按照匹配標識match_id排序(相同的match_id即為匹配成功的對子)→OK→Save(你的鼠標手一定要點保存?。。。﹥A向性評分匹配就搞定了,再來看看匹配情況。表5顯示,原吸煙組233例,最后共有159例匹配成功(這次我們限定PS≤0.02,但可根據(jù)實際情況選擇合適的限定,增加匹配成功數(shù)?。?,各匹配因素在兩組間都均衡可比。表5.兩組基線情況比較(匹配后)四、總結(jié)和拓展PSM一般分為三種類型:1、PS最鄰近匹配:是PSM最基本的方法,即直接從對照中尋找一個或多個與處理組個體PS值相同或相近的個體作為配比對象。本次我們就采用的是這個方法。2、分層PSM:PS最鄰近匹配盡管可以使協(xié)變量總體趨于平衡,但不能保證每個協(xié)變量分布完全一致??梢愿鶕?jù)某個重要變量(如性別)分層后,分別對每層人群進行PS最鄰近匹配,然后再將配比人群合并,這樣就可以保證該重要變量在組間分布完全一致。3、與馬氏配比結(jié)合的PSM:PSM與馬氏配比結(jié)合后可以增加個別重點變量平衡能力,實現(xiàn)過程比較復

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論