多層統(tǒng)計(jì)分析模型

上傳人：農(nóng)*** IP屬地：廣東上傳時(shí)間：2022-08-22 格式：PPT 頁(yè)數(shù)：69 大?。?.25MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩64頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于多層統(tǒng)計(jì)分析模型第一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月青蛙與池塘（“Frog-pond theory”）青蛙學(xué)生個(gè)體；池塘學(xué)校環(huán)境；學(xué)生的成績(jī)好壞不僅受到個(gè)體本身的影響，也受到學(xué)校環(huán)境的影響！第二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層數(shù)據(jù)低一層（低水平）單位（個(gè)體）的數(shù)據(jù)嵌套（nested）于高一層（高水平）的單位（組群）之中。結(jié)局變量，個(gè)體解釋變量，場(chǎng)景變量（contextual variables）第三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月組內(nèi)觀察相關(guān)（within-group observation dependence）同一組內(nèi)的個(gè)體，較不同組的個(gè)體而言，在觀念

2、、行為等很多方面更為接近或相似；即便不是刻意分組，也是如此。組內(nèi)同質(zhì)（within-group homogeneity），組間異質(zhì)（between-group heterogeneity）很小的相關(guān)將導(dǎo)致很大的I類錯(cuò)誤。第四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層數(shù)據(jù)的常見來(lái)源復(fù)雜抽樣；多中心臨床試驗(yàn)；縱向研究（longitudinal studies）與重復(fù)測(cè)量（repeated measures）；“高低搭配”；Meta分析；第五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的研究?jī)?nèi)容哪些個(gè)體解釋變量會(huì)影響結(jié)局變量；哪些場(chǎng)景變量會(huì)影響結(jié)局變量；個(gè)體解釋變量對(duì)結(jié)局變量的影響是否

3、會(huì)受到場(chǎng)景變量的影響。第六張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型出現(xiàn)前對(duì)多層數(shù)據(jù)進(jìn)行分析的探索第七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月探索（1）分別估計(jì)在個(gè)體水平和組群水平分別進(jìn)行分析；試圖用單一的個(gè)體水平模型的分析結(jié)果來(lái)推論另一水平的統(tǒng)計(jì)結(jié)果。第八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月探索（2）傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項(xiàng)理解多層數(shù)據(jù)中的跨層（cross-level）交互作用。第九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月探索（3）兩步模型（two-stage model）第一步模型，對(duì)各組分別進(jìn)行同一回歸模型估計(jì)，獲得一系列的系數(shù)；對(duì)這些系數(shù)的恒

4、定性進(jìn)行檢驗(yàn)；如果不恒定，則進(jìn)行第二步模型，以組變量為因變量，系數(shù)為自變量進(jìn)行回歸。第十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月探索（3）兩步模型的問(wèn)題無(wú)論哪一步均使用OLS，并不適用；當(dāng)組群過(guò)多，則十分麻煩；某些組內(nèi)樣本量很少時(shí)，進(jìn)行回歸不穩(wěn)定；將每個(gè)組群認(rèn)為是不相關(guān)的，忽略了其為從一大樣本中抽取的事實(shí)。第十一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的出現(xiàn)研究的學(xué)者很多；系統(tǒng)的主要為兩；研究的理論沒有根本上的分歧；雙方研究成果的發(fā)布時(shí)間基本相同（上世紀(jì)80年代末90年代初）；分別有各自分析的成熟的軟件；目前，大家基本上接受兩組人分別獨(dú)立開發(fā)出同一模型的結(jié)果。第十二張，PPT共

5、六十九頁(yè)，創(chuàng)作于2022年6月S. Raudenbush與A. Bryk模型稱為：hierarchical linear model；軟件為：HLM第十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月H. Goldstein模型稱為：multilevel models；軟件為：MLwiN（早期版本稱ML3，MLn）第十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的名稱multilevel modelshierarchical linear modelrandom-effect modelrandom coefficient modelvarious component modelmix

6、ed-effect modelempirical Bayes model第十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的優(yōu)點(diǎn)同時(shí)分析組效應(yīng)和個(gè)體效應(yīng)；不需有獨(dú)立性假設(shè)；對(duì)稀疏（sparse）數(shù)據(jù)，即每組樣本很少的數(shù)據(jù)，特別有效；特別適合對(duì)發(fā)展模型（GM）的分析。第十六張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的局限性（1）模型復(fù)雜，不夠簡(jiǎn)約；需較大樣本以保證穩(wěn)定性；組群數(shù)量較少，會(huì)出現(xiàn)偏倚；高水平單位并非嚴(yán)格抽樣獲得；某些場(chǎng)景變量通常是各組個(gè)體的聚集性測(cè)量，而不是總體內(nèi)個(gè)體的聚集性測(cè)量；第十七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月多層統(tǒng)計(jì)模型的局限性（2）研究對(duì)象

7、一般具有流動(dòng)性，即受到群組影響的程度不同，雖可用出入時(shí)間進(jìn)行控制，但此信息一般不可知；依然存在自變量帶有測(cè)量誤差的問(wèn)題，必需借助于結(jié)構(gòu)方程模型（SEM）；完全嵌套假設(shè)，即每一個(gè)低水平單位嵌套、且僅嵌套于一個(gè)高水平單位。第十八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月用于多層統(tǒng)計(jì)模型的軟件專門軟件：HLM；MLwiN；SuperMIX；aML；EGRET；LISREL；Mplus等。通用統(tǒng)計(jì)學(xué)軟件：SAS；SPSS；stata；S-plus/R等。第十九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月線性多層統(tǒng)計(jì)模型基礎(chǔ)知識(shí)第二十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月組內(nèi)相關(guān)系數(shù)（Intra-Cl

8、ass Correlation Coefficient, ICC）組間方差占總方差的比例?？墒褂脤?duì)“空模型”的擬合獲得；值域在0到1之間，越接近1，說(shuō)明相關(guān)越明顯；對(duì)ICC的檢驗(yàn)是是否選擇多層模型的依據(jù)。第二十一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月兩水平模型的公式表達(dá)第二十二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型（又稱截距模型）第二十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月兩個(gè)水平1自變量、一個(gè)水平2自變量第二十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月一般模型第二十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月SAS中的公式表達(dá)第二十六張，PPT共六十九頁(yè)，創(chuàng)作于2022

9、年6月模型假設(shè)第二十七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月模型假設(shè)SAS的表達(dá)第二十八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月固定和隨機(jī)回歸系數(shù)第二十九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月模型估計(jì)方法第三十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月最大似然法（ML）包括普通最大似然法（ML）和限制性最大似然法（REML）；兩者用于估計(jì)的殘差基礎(chǔ)不同，后者的殘差包括所有的隨機(jī)變異；REML是SAS的MIXED過(guò)程和HLM的默認(rèn)算法；REML通常用于組數(shù)量較少的模型；ML可以用于模型比較，而REML不行；REML估計(jì)較優(yōu)，而ML較快。第三十一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月

10、最小二乘法（LS）包括迭代廣義最小二乘法（IGLS）和限制性迭代廣義最小二乘法（RIGLS）都以普通最小二乘估計(jì)（OLS）為初始值進(jìn)行迭代；地位及相對(duì)關(guān)系大致等同于ML和REML；是MLwiN使用的算法。第三十二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月經(jīng)驗(yàn)Bayes方法（EB）“收縮估計(jì)（shrinkage estimator）”以可靠性權(quán)重確定最后的估計(jì)值；對(duì)于某些樣本量很小的組，則更多的使用總樣本的信息，進(jìn)行“借力（borrow strength）”第三十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型的可靠性權(quán)重第三十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月對(duì)模型擬合的評(píng)價(jià)SAS

11、給出：-2LL，AIC，AICC，BIC等統(tǒng)計(jì)量，其值越小越好；但只在比較模型時(shí)有用；模型收斂的速度可以說(shuō)明擬合的好壞。第三十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月假設(shè)檢驗(yàn)全局檢驗(yàn)：F檢驗(yàn)；局部檢驗(yàn)：對(duì)方差-協(xié)方差估計(jì)使用Wald Z檢驗(yàn)；對(duì)系數(shù)使用t檢驗(yàn)；單測(cè)檢驗(yàn)，P值需除2；其它可使用LR等。第三十六張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月模型比較對(duì)于嵌套模型，使用LR檢驗(yàn)；對(duì)于非嵌套模型，使用AIC，AICC和BIC檢驗(yàn)；無(wú)論何種，均需使用ML進(jìn)行估計(jì)。第三十七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月對(duì)變異的解釋程度（RB）第三十八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月對(duì)變

12、異的解釋程度（SB）第三十九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月示例與SAS實(shí)現(xiàn)第四十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月例1：對(duì)醫(yī)生滿意度調(diào)查Patid：病人編號(hào)；Phys：醫(yī)生編號(hào)；Age：病人年齡；Sat：滿意度分?jǐn)?shù)；Practice：執(zhí)業(yè)時(shí)間；第四十一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型第四十二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型2步迭代完成；所有隨機(jī)系數(shù)的檢驗(yàn)均高于檢驗(yàn)水準(zhǔn)；ICC=0.00292/（0.00292+1.291）=0.23%不用進(jìn)一步擬合多水平模型第四十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月例2：SNA角度測(cè)量值id：觀察對(duì)象

13、編號(hào)；occa：每次觀察編號(hào)；Age：病人年齡；SNA：角度；agg：場(chǎng)景變量；第四十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型3步迭代完成；所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn)；ICC=0.4296/（0.4296+0.5629）=43.28%應(yīng)進(jìn)一步擬合多水平模型第四十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型加入場(chǎng)景變量第四十六張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月空模型加入場(chǎng)景變量3步迭代完成，隨機(jī)截距有意義；所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn)；該模型-2LL=345.8，空模型-2LL=352.2，則LR2=6.4，p=0.0114；RB=1-0.3330/0.42

14、96=0.2248;第四十七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月加入水平1變量（固定效應(yīng)）第四十八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月加入水平1變量（固定效應(yīng)）3步迭代完成，隨機(jī)截距有意義；所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn)；該模型-2LL=199.1，前模型-2LL=345.8，則LR2=146.7，p=0.000；第四十九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月檢驗(yàn)水平1的隨機(jī)性第五十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月檢驗(yàn)水平1的隨機(jī)性4步迭代完成，2個(gè)隨機(jī)系數(shù)均有意義；所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn)；該模型-2LL=185.6，前模型-2LL=199.1，則LR

15、2=3.5，p=0.1738；第五十一張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月跨層交互作用評(píng)估第五十二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月跨層交互作用評(píng)估5步迭代完成，隨機(jī)截距有意義，但交互項(xiàng)沒意義；-2LL等都對(duì)前模型有所增加；跨層交互作用不顯著。第五十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月建模一般步驟運(yùn)行空模型以獲得ICC，判斷是否進(jìn)行多層模型擬合；加入水平2解釋變量；加入水平1解釋變量；檢驗(yàn)水平1隨機(jī)斜率；檢驗(yàn)跨水平交互作用（全模型）。第五十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月發(fā)展模型第五十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)

16、測(cè)量的方差分析；假設(shè)殘差方差在各時(shí)間點(diǎn)上相等；或，假設(shè)任何時(shí)點(diǎn)之間的殘差方差的差異相等（即所謂“球面（sphericity）”假設(shè)或稱“環(huán)形（circularity）”假設(shè)）；要求完整均衡數(shù)據(jù)，即等時(shí)距，無(wú)缺失。第五十六張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月發(fā)展模型的優(yōu)點(diǎn)可處理缺失和不完整數(shù)據(jù)；可處理不等時(shí)距問(wèn)題；不要求對(duì)象內(nèi)獨(dú)立即其它的限制性假設(shè)；可以容易的加入時(shí)間依賴自變量。第五十七張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月發(fā)展模型與一般多層模型的區(qū)別第五十八張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月SAS程序proc mixed covtest ic;class id timec;m

17、odel y=trt | time / s ddfm=KR notest;random int time / subject=id G type=UN;repeated timec / subject=id R type=AR(1);run;第五十九張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月離散型結(jié)局變量的多層統(tǒng)計(jì)模型第六十張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月廣義線性模型隨機(jī)成分（random components）：指的是分布，一般為指數(shù)族分布；系統(tǒng)成分（systematic component）：即傳統(tǒng)回歸模型形態(tài)；鏈接函數(shù)（link function）第六十一張，PPT共六十九頁(yè)，

18、創(chuàng)作于2022年6月廣義線性混合效應(yīng)模型對(duì)廣義線性模型和多層統(tǒng)計(jì)模型的結(jié)合和擴(kuò)展。第六十二張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月廣義線性混合效應(yīng)模型的估計(jì)方法線性化法（linearization methods）數(shù)值法積分近似法（integral approximation with numerical methods）第六十三張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月線性化法使用泰勒展開式等技術(shù)來(lái)近似估計(jì)該積分似然函數(shù)；不使用原始數(shù)據(jù)，而是按原始數(shù)據(jù)產(chǎn)生偽數(shù)據(jù)（pseudo-data）進(jìn)行估計(jì)；SAS中的GLMMIX過(guò)程。第六十四張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月線性化法的優(yōu)點(diǎn)和局限性模型的聯(lián)合分布難于確定，也可以勝任；可擬合較多隨機(jī)效應(yīng)；允許不同結(jié)構(gòu)的R矩陣；可以使用REML等；由于使用偽數(shù)據(jù)進(jìn)行擬合，不能使用LR進(jìn)行模型比較；SAS提供的隨機(jī)效應(yīng)的標(biāo)準(zhǔn)誤有偏，不能用于假設(shè)檢驗(yàn)。第六十五張，PPT共六十九頁(yè)，創(chuàng)作于2022年6月數(shù)值法積分近似法使用原始數(shù)據(jù)估算邊際積分似然函數(shù)的近似值；默認(rèn)的是適應(yīng)性高斯求積法；并可使

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多層統(tǒng)計(jì)分析模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多層統(tǒng)計(jì)分析模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔