課件-第二講多水平模型_第1頁
課件-第二講多水平模型_第2頁
課件-第二講多水平模型_第3頁
課件-第二講多水平模型_第4頁
課件-第二講多水平模型_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多水平模型*應(yīng)用情境*方法*步驟*STATA作1.應(yīng)用情境宏觀單位的影響不可忽視重復(fù)測量數(shù)據(jù)分析單位與方法學(xué)謬誤多水平數(shù)據(jù)應(yīng)用情境嚴潔多2水平模型諸多稱謂教育學(xué):分層線性模型(hierarchical

linear

models)社會學(xué):多層線性模型(multi-level

linear

models),多水平分析(Multilevel

ysis)生物統(tǒng)計學(xué):混合效應(yīng)模型(mixed-effects

model)和隨機效應(yīng)模型(random-effects

models)計量經(jīng)濟學(xué):隨機系數(shù)回歸模型(random-coefficientregression

models)統(tǒng)計學(xué):協(xié)方差成分模型(covariance

componentsmodels),混合模型(MixedModels)應(yīng)用情境1嚴潔多3水平模型多水平數(shù)據(jù)觀測數(shù)據(jù)在單位上具有嵌套(Nested)關(guān)系同一單位內(nèi)的觀測,具有更大的相似性應(yīng)用情境1嚴潔多4水平模型分析單位與方法論謬誤分析單位的多層次性:個人、班級、學(xué)校、地區(qū)、國家將

層面數(shù)據(jù)計算均值,然后到組層面進行回歸分析?

產(chǎn)生生態(tài)學(xué)謬誤(ecological

fallacy)?宏觀趨勢可能和微觀趨勢相反應(yīng)用情境1嚴潔多5水平模型分析單位與方法論謬誤把組層面數(shù)據(jù)放到 層面進行回歸分析?產(chǎn)生簡化論謬誤(reductionism)?

了 間獨立的假定?

錯誤地把組效應(yīng)歸因于

了在每個組中單獨運行微觀模型?損失信息?樣本量小的組將有偏估計應(yīng)用情境1嚴潔多6水平模型什么時候用多水平模型解釋因變量的因素中包括宏觀變量(組變量)并且,不同組的回歸系數(shù)不同,或者不同組的平均差異也顯著,從而顯示出組變量對因變量有影響應(yīng)用情境嚴潔多7水平模型12.方法組內(nèi)同質(zhì)組間異質(zhì)隨機效應(yīng)和固定效應(yīng)原理與方法模型表達式嚴潔多8水平模型應(yīng)用條件不同層是嵌套關(guān)系(如,學(xué)生是在學(xué)校中的,居民是在區(qū)縣中的)如果使用線性回歸的話,那么要求因變量總體上服從正間隨機態(tài)分布,但不要求各組內(nèi)的方差齊性,以及誤差的相互獨立。水平1的殘差和水平2的殘差無關(guān)聯(lián)組間(例如,不同學(xué)校之間)是有顯著差異的步驟3嚴潔多9水平模型組數(shù)與樣本量的要求組數(shù)和組內(nèi)樣本容量:?一般要求組數(shù)要達到30以上,每組有一定的樣本即好。?

Icc越大要求組越多,而要求的 則越少。如果icc=0.3,需要50個組,如果每組有25個

。(Bryk and

Raudenbush,2007)160個學(xué)校且每個學(xué)校約60個學(xué)生時,數(shù)據(jù)僅可以支持3個隨機系數(shù)加1個隨機截距的估計層2自變量的確定:一個自變量需要10個案例對應(yīng)的經(jīng)驗法則步驟3嚴潔多1水平模型0模型表達式水平1(如:學(xué)生)Yij

0

j

1

j

X

ij水平2(如:學(xué)校)

W

u0

j

00

01

j

0

j1

j

10

1

1W

j

u1

j

eijij---第j個學(xué)校的第i個學(xué)生例:學(xué)生成績不僅受到學(xué)生層面智力水平、勤奮因素的影響,還受到學(xué)校層面學(xué)校質(zhì)量、管理方式、教學(xué)方式的影響。嚴潔多1水平模型1方法2嚴潔多1水平模型2模型表達式水平1:Yij表示第j個學(xué)校的第i學(xué)生因變量的觀測值(如:學(xué)生期末成績)Xij表示第j個學(xué)校第i個學(xué)生自變量的觀測值(如:入學(xué)成績)Wj表示第j個學(xué)校的特征變量(如:學(xué)校的管理風(fēng)格)Β0j和Β1j分別表示第j個學(xué)校學(xué)生入學(xué)成績對期末成績回歸直線的截距和斜率,eij表示第j個學(xué)校第i個學(xué)生的測量誤差。方法2嚴潔多1水平模型3模型表達式水平2:γ00和γ01分別表示學(xué)校特征變量Wj對截距Β0j的回歸直線的截距和斜率U0j表示由第j個學(xué)校的特征變量解釋截距Β0j后的誤差γ10和γ11分別表示學(xué)校特征變量Wj對斜率Β1j的回歸直線的截距和斜率U1j表示由第j個學(xué)校的特征變量解釋斜率Β1j后的誤差方法2模型表達式合并模型:Yij

00

10Xij

01Wj

11XijWj

u0j

u1j

Xij

eij其中:yij表示因變量(如期末成績),xij表示第一水平(學(xué)生)的

變量,Wj表示第二水平(學(xué)校)的變量。方法2嚴潔多1水平模型4分析思路先以第一層級的變量建立回歸方程然后把該方

的截距、斜率作為因變量,使用第二層數(shù)據(jù)中的解釋變量作為自變量,再建立若干新的方程組層面的變量對因變量的作用是通過影響第一層回歸方的截距和斜率來實現(xiàn)的。通過這種處理,可以探索不同層面變量對因變量的影響步驟3嚴潔多1水平模型5隨機回歸系數(shù)與固定回歸系數(shù)固定回歸系數(shù)是一個常數(shù),不隨組的變化而變化隨機回歸系數(shù)則跨組變化混合模型就是指既有固定的也有隨機的回歸系數(shù)不同組內(nèi)的自變量的回歸系數(shù)都相同;這是固定系數(shù)嚴潔多1水平模型6不同組內(nèi)的自變量的回歸系數(shù)不相同;這是隨機系數(shù)方法2組內(nèi)相關(guān)系數(shù)(ICC)如何判斷組間差異顯著?用組內(nèi)相關(guān)系數(shù)(ICC)的值,以及組間差異的假設(shè)檢驗結(jié)果來判斷。?組內(nèi)相關(guān)系數(shù)(Intra-class

correlationcoefficient)等于組間方差與總方差的比?ICC接近于1說明組間差異大于組內(nèi)方差;當組內(nèi)間趨向獨立時,ICC接近于0,多層模型就可以簡化為固定效應(yīng)模型?“組內(nèi)同質(zhì)表明組間異質(zhì)”方法2嚴潔多1水平模型73.步驟解讀變量之間關(guān)系建模注意事項解讀模型整體分析思路步驟應(yīng)用條件嚴潔多1水平模型8分析的步驟1、建立模型:先運行空模型(截距模型)目標是確定是否存在顯著的組內(nèi)相關(guān)將水平2的標識變量(例如:學(xué)校

)納入空模型依據(jù)ICC判斷是否組間異質(zhì)將水平1的解釋變量納入空模型,水平2的解釋變量納入截距方程先將水平1的所有回歸系數(shù)設(shè)置為固定系數(shù),再將水平2的解釋變量放在截距方程,目標是檢驗隨機截距步驟3嚴潔多1水平模型9嚴潔多2水平模型0分析的步驟檢驗跨水平的交互作用將隨機的回歸系數(shù)作為組水平模型的因變量,在組水平上解釋組間差異。建立最終模型經(jīng)過前面的探索之后建立最終模型方法3嚴潔多2水平模型1分析的步驟2、解釋模型運行的結(jié)果?模型擬合度?因變量總變異被解釋的比例?各類假設(shè)檢驗的結(jié)果?各個解釋變量對因變量的作用步驟3嚴潔多2水平模型2解讀輸出結(jié)果:模型擬合對模型擬合的評價方法與logistic回歸、結(jié)構(gòu)方程模型等方法類似?

-2LL,數(shù)據(jù)越小說明擬合度越好?

AIC,BIC,越小越好步驟3嚴潔多2水平模型3解讀輸出結(jié)果:因變量變異的解釋量方差縮減比例分別表示水平1的解釋變量和水平2的解釋變量可解釋因變量的方差比例,類似R2。?

比較模型A,和模型B,那么方差縮減比例等于模型B與模型A的方差之差除以模型A的方差?

不僅有組間方差的縮減比例,也有組內(nèi)方差的縮減比例步驟3Raudenbush

&

Bryk法A:空模型B:分析模型方差消減比例1.組間方差2.9482.3750.194=(1-B1/A1)2.組內(nèi)方差19.55718.8130.038=(1-B2/A2)Snijders

&

Bosker法A:空模型B:分析模型方差消減比例(nij為組內(nèi)平均樣本數(shù))1.組間方差2.9482.3750.176=[1-(B1+B2/nij)/(A1+A2B2/nij)]2.組內(nèi)方差19.55718.8130.058=[1-(B1+B2)/(A1+A2)]解讀輸出結(jié)果:跨層交互項的解讀跨層交互作用說明水平1解釋變量x對因變量y的作用會隨著組水平變量w的值而變化跨層交互作用的系數(shù)表示:宏觀解釋變量對量的作用的調(diào)節(jié)效應(yīng)的大小。例如:“解釋變層面的解釋變量x1對因變量的作用隨著宏觀單位的w1的值而變化,w1的值高的話,那么…”步驟3嚴潔多2水平模型4建模注意事項:因變量的正態(tài)分布如果做分層線性模型:因變量要符合正態(tài)分布非正態(tài)分布可能歪曲變量之間的關(guān)系,并影響顯著性檢驗的結(jié)果事先先做正態(tài)分布的檢驗將因變量標準化,然后做直方圖,或

圖對數(shù)轉(zhuǎn)換可以近似正態(tài)分布步驟3嚴潔多2水平模型51234為什么對中對中的方法對中后的解讀研究的變量應(yīng)有準確的實際意義Xij為0是否有實際意義Wij為0是否有實際意義grand-mean:觀測值減全部樣本均值group-mean:觀測值減組均值對層2變量的對中不像層1變量那么關(guān)鍵,層2使用總平均數(shù)對中可用菜單選擇對HLM中方法STATA需事先gen對中后的變量統(tǒng)計 中如何對中對中步驟3建模注意事項:對中(centering)grand-mean:自變量與總均值的距離每增加一個單位,因變量…group-mean:自變量與組均值的距離每增加一個單位,因變量…嚴潔多2水平模型6建模注意事項:估計方法的選擇步驟3um

likelihood

estimation)um

likelihood兩種估計方法:ML(還是REML(restrictedestimation)二者在估計固定效應(yīng)時完全一樣,區(qū)別在于隨機效應(yīng)。

REML可以得出偏誤更小的隨機效應(yīng)。如果二層單位>30,則基本沒有區(qū)別。REML通常用于組數(shù)較少的模型,組數(shù)少時,REML所產(chǎn)生的層2殘差方差/協(xié)反差的偏倚比ML較?。荒P捅容^時,隨機效應(yīng)不同,固定效應(yīng)相同時,用REML嚴潔多2水平模型7建模注意事項:殘差分析殘差分析用于檢驗?zāi)P图俣ǎ?組內(nèi)誤差互相獨立并且服從殘差均值為0的正態(tài)分布;?隨機效應(yīng)服從殘差均值為0的正態(tài)分布,并且在組間獨立;殘差分布是否以0為均值的正態(tài)分布;用圖或直方圖步驟3嚴潔多2水平模型84.

STATA作使用方法數(shù)據(jù)庫樣式原理各種多水平模型

令嚴潔多2水平模型9STATA中的多水平模型mixed?

Multilevel

mixed-effects

linear

regressionmeglm?

Multilevel

mixed-effects

generalized

linear

modelmelogit?

Multilevel

mixed-effects

logistic

regressionmeprobit?

Multilevel

mixed-effects

probit

regressionAlthough

there

is

no

memlogit

command,

multilevel

mixed-effectsmultinomial

logistic

models

can

be

fit

using

gsem;STATA作4嚴潔多3水平模型0STATA中的多水平模型meoprobit?

Multilevel

mixed-effects

ordered

probit

regressionmeologit?

Multilevel

mixed-effects

ordered

logistic

regressionmepoisson?

Multilevel

mixed-effects

Poisson

regressionmenbreg?

Multilevel

mixed-effects

negativebinomial

regressionmestreg?

Multilevel

mixed-effects

parametric

survival

modelsSTATA作4嚴潔多3水平模型1原始數(shù)據(jù)的格式:?SPSS、ASCII、SAS、STATA數(shù)據(jù)庫格式區(qū)縣水平的自變量區(qū)縣水平標識變量個人水平的因變量個人水平的自變量STATA

作4嚴潔多3水平模型2LR

test

vs.

linear

model:

chibar2(01)

=

362.13Prob

>=

chibar2

=

0.0000psuid:

IdentityRandom-effectsParametersEstimateStd.

Err.[95%

Conf.

Interval]_cons29.02173.212348136.670.000politruCoef.Std.

Err.zP>|z|[95%

Conf.

Interval]28.6055429.43792空模型/*只有因變量的空模型*/use

"N:\hlm.dta",

clearmixed

politru,

remlmixed

politru

||

psuid:,reml

/*只有因變量和組變量的空模型*/estat

icc

/*icc>0.1,適用于多水平模型,反之單水平即可*/Log

likelihood

=

-11207.077 Prob

>

chi2

=

.組間方差,水平2的方差組內(nèi)方差,水平1的方差var(_cons)2.901212.54668542.0053244.197342var(Residual)19.55678.451251918.6920420.46152STATA作4嚴潔多3水平模型3ICC(組內(nèi)相關(guān)系數(shù))此例:二水平模型的icc:三水平模型的icc:.

estat

iccIntraclass

correlationLevelICCStd.

Err.[95%

Conf.

Interval]psuid.1291839.021401.0927043

.1772148組間方差組間方差

組內(nèi)方差icc

0.1292.9

19.62.9icc

STATA作4嚴潔多3水平模型4隨機的截距項mixed

politru

gdppergini

age

gender

edu

sotrust

||

psuid:

,

nologreml/*截距項的隨機效應(yīng),用層2的gdpper

gini變量進行解釋*/該命令等同于hlm

中的Level1:

politru=b0+b1*age

+b2*gender

+b3*edu

+b4*sotrust+eLevel2:

b0=r00+r01*gdpper

+r02*gini+u0STATA作4嚴潔多3水平模型5隨機的截距項輸出結(jié)果STATA作4var(Residual)

18.83443

.4348259LR

test

vs.

linear

model:

chibar2(01)

=

302.4518.00118

19.70625Prob

>=

chibar2

=

0.0000var(_cons)2.536608.49499961.7304053.718423psuid:

IdentityRandom-effectsParametersEstimateStd.

Err.[95%

Conf.

Interval]30.557471.43395421.31

0.00027.746sotrust_cons1.016451.14711456.910.000.7281124 1

30479gdpper-.0000365.000012-3.040.002-.0000601-.000013gini-.0561618.0285994-1.960.050-.1122155-.0001081age.0426284.00596767.140.000.0309322.0543247gender-.2587274.1459598-1.770.076-.5448033.0273486edu-.0738521.0214111-3.450.001-.1158171-.0318871politruCoef.Std.

Err.zP>|z|[95%Conf.Interval]Log

restricted-likelihood

=

-11151.492Wald

chi2(6)Prob

>

chi2==160.590.00001552.587Obs

per

group:min

=avg

=max

=Mixed-effects

REML

regressionNumber

of

obs=3,830Group

variable:

psuidNumber

of

groups=73.

mixed

politru

gdpper

gini

age

gender

edu

sotrust

||

psuid:,nologreml用水平2的屬性解釋水平1的截距項為什么在各組之間有差異組內(nèi)方差,水平1的方差嚴潔多3水平模型6隨機的回歸系數(shù)mixed

politru

gdpper

gini

age

gender

edu

sotrustc.sotrust#c.gdpperc.sotrust#c.welper

||

psuid:

sotrust,

nolog

reml/*sotrust的回歸系數(shù)用層2的gdpper

welper進行解釋,截距項的隨機效應(yīng)用層2的gdpper

gini變量進行解釋,c.表示計算交互項的意思*/該命令等同于Level1:Politru=

b0+b1*age

+b2*gender

+b3*edu

+b4*sotrust+eijLevel2:b0=r00+r01*gdpper

+r02*gini+u0b4=r40+r41*gdpper

+r42*welper+u4STATA作4嚴潔多3水平模型7Random-effects

Parameterspsuid:

IndependentEstimateStd.

Err.[95%

Conf.

Interval]var(sotrust).7196668.3531587.27505871.882945var(_cons)2.690748.54050761.8150423.988956var(Residual)18.62147.434617217.7888319.49309LR

test

vs.

linear

model:

chi2(2)

=

310.52Prob

>

chi2

=

0.0000_cons30.642211.49035620.560.00027.7211733.5gdpper-.0000427.0000131-3.260.001-.0000684-.0000171gini-.0566276.0297831-1.900.057-.1150015.0017463age.0434511.00595617.300.000.0317774.0551248gender-.2597157.1457323-1.780.075-.5453457.0259144edu-.0726673.0214343-3.390.001-.1146778-.0306568sotrust.9108768.28127053.240.001.35959691.462157c.sotrust#c.gdpper.0000251.00001491.680.093-4.16e-06.0000543c.sotrust#c.welper-.0004141.0003308-1.250.211-.0010624.0002341politruCoef.Std.

Err.zP>|z|[95%Conf.Interval]Log restricted-likelihood= -11163.66Wald

chi2(8)Prob

>

chi2==153.430.0000min

=avg

=max

=1552.587Obs

per

group:.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論