多層統(tǒng)計分析模型_第1頁
多層統(tǒng)計分析模型_第2頁
多層統(tǒng)計分析模型_第3頁
多層統(tǒng)計分析模型_第4頁
多層統(tǒng)計分析模型_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于多層統(tǒng)計分析模型第一張,PPT共六十九頁,創(chuàng)作于2022年6月青蛙與池塘(“Frog-pond theory”)青蛙學(xué)生個體;池塘學(xué)校環(huán)境;學(xué)生的成績好壞不僅受到個體本身的影響,也受到學(xué)校環(huán)境的影響!第二張,PPT共六十九頁,創(chuàng)作于2022年6月多層數(shù)據(jù)低一層(低水平)單位(個體)的數(shù)據(jù)嵌套(nested)于高一層(高水平)的單位(組群)之中。結(jié)局變量,個體解釋變量,場景變量(contextual variables)第三張,PPT共六十九頁,創(chuàng)作于2022年6月組內(nèi)觀察相關(guān)(within-group observation dependence)同一組內(nèi)的個體,較不同組的個體而言,在觀念

2、、行為等很多方面更為接近或相似;即便不是刻意分組,也是如此。組內(nèi)同質(zhì)(within-group homogeneity),組間異質(zhì)(between-group heterogeneity)很小的相關(guān)將導(dǎo)致很大的I類錯誤。第四張,PPT共六十九頁,創(chuàng)作于2022年6月多層數(shù)據(jù)的常見來源復(fù)雜抽樣;多中心臨床試驗;縱向研究(longitudinal studies)與重復(fù)測量(repeated measures);“高低搭配”;Meta分析;第五張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的研究內(nèi)容哪些個體解釋變量會影響結(jié)局變量;哪些場景變量會影響結(jié)局變量;個體解釋變量對結(jié)局變量的影響是否

3、會受到場景變量的影響。第六張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型出現(xiàn)前對多層數(shù)據(jù)進行分析的探索第七張,PPT共六十九頁,創(chuàng)作于2022年6月探索(1)分別估計在個體水平和組群水平分別進行分析;試圖用單一的個體水平模型的分析結(jié)果來推論另一水平的統(tǒng)計結(jié)果。第八張,PPT共六十九頁,創(chuàng)作于2022年6月探索(2)傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項理解多層數(shù)據(jù)中的跨層(cross-level)交互作用。第九張,PPT共六十九頁,創(chuàng)作于2022年6月探索(3)兩步模型(two-stage model)第一步模型,對各組分別進行同一回歸模型估計,獲得一系列的系數(shù);對這些系數(shù)的恒

4、定性進行檢驗;如果不恒定,則進行第二步模型,以組變量為因變量,系數(shù)為自變量進行回歸。第十張,PPT共六十九頁,創(chuàng)作于2022年6月探索(3)兩步模型的問題無論哪一步均使用OLS,并不適用;當(dāng)組群過多,則十分麻煩;某些組內(nèi)樣本量很少時,進行回歸不穩(wěn)定;將每個組群認(rèn)為是不相關(guān)的,忽略了其為從一大樣本中抽取的事實。第十一張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的出現(xiàn)研究的學(xué)者很多;系統(tǒng)的主要為兩;研究的理論沒有根本上的分歧;雙方研究成果的發(fā)布時間基本相同(上世紀(jì)80年代末90年代初);分別有各自分析的成熟的軟件;目前,大家基本上接受兩組人分別獨立開發(fā)出同一模型的結(jié)果。第十二張,PPT共

5、六十九頁,創(chuàng)作于2022年6月S. Raudenbush與A. Bryk模型稱為:hierarchical linear model;軟件為:HLM第十三張,PPT共六十九頁,創(chuàng)作于2022年6月H. Goldstein模型稱為:multilevel models;軟件為:MLwiN(早期版本稱ML3,MLn)第十四張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的名稱multilevel modelshierarchical linear modelrandom-effect modelrandom coefficient modelvarious component modelmix

6、ed-effect modelempirical Bayes model第十五張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的優(yōu)點同時分析組效應(yīng)和個體效應(yīng);不需有獨立性假設(shè);對稀疏(sparse)數(shù)據(jù),即每組樣本很少的數(shù)據(jù),特別有效;特別適合對發(fā)展模型(GM)的分析。第十六張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的局限性(1)模型復(fù)雜,不夠簡約;需較大樣本以保證穩(wěn)定性;組群數(shù)量較少,會出現(xiàn)偏倚;高水平單位并非嚴(yán)格抽樣獲得;某些場景變量通常是各組個體的聚集性測量,而不是總體內(nèi)個體的聚集性測量;第十七張,PPT共六十九頁,創(chuàng)作于2022年6月多層統(tǒng)計模型的局限性(2)研究對象

7、一般具有流動性,即受到群組影響的程度不同,雖可用出入時間進行控制,但此信息一般不可知;依然存在自變量帶有測量誤差的問題,必需借助于結(jié)構(gòu)方程模型(SEM);完全嵌套假設(shè),即每一個低水平單位嵌套、且僅嵌套于一個高水平單位。第十八張,PPT共六十九頁,創(chuàng)作于2022年6月用于多層統(tǒng)計模型的軟件專門軟件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。通用統(tǒng)計學(xué)軟件:SAS;SPSS;stata;S-plus/R等。第十九張,PPT共六十九頁,創(chuàng)作于2022年6月線性多層統(tǒng)計模型基礎(chǔ)知識第二十張,PPT共六十九頁,創(chuàng)作于2022年6月組內(nèi)相關(guān)系數(shù)(Intra-Cl

8、ass Correlation Coefficient, ICC)組間方差占總方差的比例??墒褂脤Α翱漳P汀钡臄M合獲得;值域在0到1之間,越接近1,說明相關(guān)越明顯;對ICC的檢驗是是否選擇多層模型的依據(jù)。第二十一張,PPT共六十九頁,創(chuàng)作于2022年6月兩水平模型的公式表達第二十二張,PPT共六十九頁,創(chuàng)作于2022年6月空模型(又稱截距模型)第二十三張,PPT共六十九頁,創(chuàng)作于2022年6月兩個水平1自變量、一個水平2自變量第二十四張,PPT共六十九頁,創(chuàng)作于2022年6月一般模型第二十五張,PPT共六十九頁,創(chuàng)作于2022年6月SAS中的公式表達第二十六張,PPT共六十九頁,創(chuàng)作于2022

9、年6月模型假設(shè)第二十七張,PPT共六十九頁,創(chuàng)作于2022年6月模型假設(shè)SAS的表達第二十八張,PPT共六十九頁,創(chuàng)作于2022年6月固定和隨機回歸系數(shù)第二十九張,PPT共六十九頁,創(chuàng)作于2022年6月模型估計方法第三十張,PPT共六十九頁,創(chuàng)作于2022年6月最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然法(REML);兩者用于估計的殘差基礎(chǔ)不同,后者的殘差包括所有的隨機變異;REML是SAS的MIXED過程和HLM的默認(rèn)算法;REML通常用于組數(shù)量較少的模型;ML可以用于模型比較,而REML不行;REML估計較優(yōu),而ML較快。第三十一張,PPT共六十九頁,創(chuàng)作于2022年6月

10、最小二乘法(LS)包括迭代廣義最小二乘法(IGLS)和限制性迭代廣義最小二乘法(RIGLS)都以普通最小二乘估計(OLS)為初始值進行迭代;地位及相對關(guān)系大致等同于ML和REML;是MLwiN使用的算法。第三十二張,PPT共六十九頁,創(chuàng)作于2022年6月經(jīng)驗Bayes方法(EB)“收縮估計(shrinkage estimator)”以可靠性權(quán)重確定最后的估計值;對于某些樣本量很小的組,則更多的使用總樣本的信息,進行“借力(borrow strength)”第三十三張,PPT共六十九頁,創(chuàng)作于2022年6月空模型的可靠性權(quán)重第三十四張,PPT共六十九頁,創(chuàng)作于2022年6月對模型擬合的評價SAS

11、給出:-2LL,AIC,AICC,BIC等統(tǒng)計量,其值越小越好;但只在比較模型時有用;模型收斂的速度可以說明擬合的好壞。第三十五張,PPT共六十九頁,創(chuàng)作于2022年6月假設(shè)檢驗全局檢驗:F檢驗;局部檢驗:對方差-協(xié)方差估計使用Wald Z檢驗;對系數(shù)使用t檢驗;單測檢驗,P值需除2;其它可使用LR等。第三十六張,PPT共六十九頁,創(chuàng)作于2022年6月模型比較對于嵌套模型,使用LR檢驗;對于非嵌套模型,使用AIC,AICC和BIC檢驗;無論何種,均需使用ML進行估計。第三十七張,PPT共六十九頁,創(chuàng)作于2022年6月對變異的解釋程度(RB)第三十八張,PPT共六十九頁,創(chuàng)作于2022年6月對變

12、異的解釋程度(SB)第三十九張,PPT共六十九頁,創(chuàng)作于2022年6月示例與SAS實現(xiàn)第四十張,PPT共六十九頁,創(chuàng)作于2022年6月例1:對醫(yī)生滿意度調(diào)查Patid:病人編號;Phys:醫(yī)生編號;Age:病人年齡;Sat:滿意度分?jǐn)?shù);Practice:執(zhí)業(yè)時間;第四十一張,PPT共六十九頁,創(chuàng)作于2022年6月空模型第四十二張,PPT共六十九頁,創(chuàng)作于2022年6月空模型2步迭代完成;所有隨機系數(shù)的檢驗均高于檢驗水準(zhǔn);ICC=0.00292/(0.00292+1.291)=0.23%不用進一步擬合多水平模型第四十三張,PPT共六十九頁,創(chuàng)作于2022年6月例2:SNA角度測量值id:觀察對象

13、編號;occa:每次觀察編號;Age:病人年齡;SNA:角度;agg:場景變量;第四十四張,PPT共六十九頁,創(chuàng)作于2022年6月空模型3步迭代完成;所有隨機系數(shù)的檢驗部分低于檢驗水準(zhǔn);ICC=0.4296/(0.4296+0.5629)=43.28%應(yīng)進一步擬合多水平模型第四十五張,PPT共六十九頁,創(chuàng)作于2022年6月空模型加入場景變量第四十六張,PPT共六十九頁,創(chuàng)作于2022年6月空模型加入場景變量3步迭代完成,隨機截距有意義;所有隨機系數(shù)的檢驗部分低于檢驗水準(zhǔn);該模型-2LL=345.8,空模型-2LL=352.2,則LR2=6.4,p=0.0114;RB=1-0.3330/0.42

14、96=0.2248;第四十七張,PPT共六十九頁,創(chuàng)作于2022年6月加入水平1變量(固定效應(yīng))第四十八張,PPT共六十九頁,創(chuàng)作于2022年6月加入水平1變量(固定效應(yīng))3步迭代完成,隨機截距有意義;所有隨機系數(shù)的檢驗部分低于檢驗水準(zhǔn);該模型-2LL=199.1,前模型-2LL=345.8,則LR2=146.7,p=0.000;第四十九張,PPT共六十九頁,創(chuàng)作于2022年6月檢驗水平1的隨機性第五十張,PPT共六十九頁,創(chuàng)作于2022年6月檢驗水平1的隨機性4步迭代完成,2個隨機系數(shù)均有意義;所有隨機系數(shù)的檢驗部分低于檢驗水準(zhǔn);該模型-2LL=185.6,前模型-2LL=199.1,則LR

15、2=3.5,p=0.1738;第五十一張,PPT共六十九頁,創(chuàng)作于2022年6月跨層交互作用評估第五十二張,PPT共六十九頁,創(chuàng)作于2022年6月跨層交互作用評估5步迭代完成,隨機截距有意義,但交互項沒意義;-2LL等都對前模型有所增加;跨層交互作用不顯著。第五十三張,PPT共六十九頁,創(chuàng)作于2022年6月建模一般步驟運行空模型以獲得ICC,判斷是否進行多層模型擬合;加入水平2解釋變量;加入水平1解釋變量;檢驗水平1隨機斜率;檢驗跨水平交互作用(全模型)。第五十四張,PPT共六十九頁,創(chuàng)作于2022年6月發(fā)展模型第五十五張,PPT共六十九頁,創(chuàng)作于2022年6月傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)

16、測量的方差分析;假設(shè)殘差方差在各時間點上相等;或,假設(shè)任何時點之間的殘差方差的差異相等(即所謂“球面(sphericity)”假設(shè)或稱“環(huán)形(circularity)”假設(shè));要求完整均衡數(shù)據(jù),即等時距,無缺失。第五十六張,PPT共六十九頁,創(chuàng)作于2022年6月發(fā)展模型的優(yōu)點可處理缺失和不完整數(shù)據(jù);可處理不等時距問題;不要求對象內(nèi)獨立即其它的限制性假設(shè);可以容易的加入時間依賴自變量。第五十七張,PPT共六十九頁,創(chuàng)作于2022年6月發(fā)展模型與一般多層模型的區(qū)別第五十八張,PPT共六十九頁,創(chuàng)作于2022年6月SAS程序proc mixed covtest ic;class id timec;m

17、odel y=trt | time / s ddfm=KR notest;random int time / subject=id G type=UN;repeated timec / subject=id R type=AR(1);run;第五十九張,PPT共六十九頁,創(chuàng)作于2022年6月離散型結(jié)局變量的多層統(tǒng)計模型第六十張,PPT共六十九頁,創(chuàng)作于2022年6月廣義線性模型隨機成分(random components):指的是分布,一般為指數(shù)族分布;系統(tǒng)成分(systematic component):即傳統(tǒng)回歸模型形態(tài);鏈接函數(shù)(link function)第六十一張,PPT共六十九頁,

18、創(chuàng)作于2022年6月廣義線性混合效應(yīng)模型對廣義線性模型和多層統(tǒng)計模型的結(jié)合和擴展。第六十二張,PPT共六十九頁,創(chuàng)作于2022年6月廣義線性混合效應(yīng)模型的估計方法線性化法(linearization methods)數(shù)值法積分近似法(integral approximation with numerical methods)第六十三張,PPT共六十九頁,創(chuàng)作于2022年6月線性化法使用泰勒展開式等技術(shù)來近似估計該積分似然函數(shù);不使用原始數(shù)據(jù),而是按原始數(shù)據(jù)產(chǎn)生偽數(shù)據(jù)(pseudo-data)進行估計;SAS中的GLMMIX過程。第六十四張,PPT共六十九頁,創(chuàng)作于2022年6月線性化法的優(yōu)點和局限性模型的聯(lián)合分布難于確定,也可以勝任;可擬合較多隨機效應(yīng);允許不同結(jié)構(gòu)的R矩陣;可以使用REML等;由于使用偽數(shù)據(jù)進行擬合,不能使用LR進行模型比較;SAS提供的隨機效應(yīng)的標(biāo)準(zhǔn)誤有偏,不能用于假設(shè)檢驗。第六十五張,PPT共六十九頁,創(chuàng)作于2022年6月數(shù)值法積分近似法使用原始數(shù)據(jù)估算邊際積分似然函數(shù)的近似值;默認(rèn)的是適應(yīng)性高斯求積法;并可使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論