分層線性模型_第1頁
分層線性模型_第2頁
分層線性模型_第3頁
分層線性模型_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、分層線性模型 ( hierarchical linear model HLM)的原理及應用一、概念: 分層線性模型( hierarchical linear model HLM )又名多層線性模型(MultilevelLin ear Model MLM、層次線性模型(Hierarch Lin ear Model、多層分析( Multilevel Analysis/Model )。相對于傳統(tǒng)的兩種統(tǒng)計方法:一般 線性模型( general linear model GLM )和廣義線性模型( generalized linear models GLMS,它們又有所不同,HLM中的線性模型指的是線

2、性回歸,不過它 與一般的分層線性回歸( Hierarchical Regression )又是不同的,具體的不同 見下面數(shù)學模型部分。HLM又被通俗的稱為“回歸的回歸”。Wikipedia : “一般線性回歸和多重線性回歸都是發(fā)生在單一層面,HLM相對于更適用于嵌套數(shù)據(jù)( nest data )?!痹诶斫釮LM之前應了解有關回歸分析和嵌套設計(分層設計)的基本知識。、模型:1、假設:由于個體行為不僅受個體自身特征的影響,也受到其所處環(huán)境(群體 /層次)的影響。相對于不同層次的數(shù)據(jù),傳統(tǒng)的線性模型在進行變異分解時,對 群組效應分離不出, 而增大模型的誤差項。 而且不同群體的變異來源也可能分布 不

3、同,可能滿足不了傳統(tǒng)回歸的方差齊性假設。在模型應用方面,不同群體(層次)的數(shù)據(jù),這些生態(tài)謬誤a、個體層面:也不能應用同一模型。鑒于傳統(tǒng)方法的局限性,分層技術則解決了( Ecological Fallacy )。它包含了兩個層面的假設:這個與普通的回歸分析相同,只考慮自變量X對因變量丫的影響。b、群組層面:群組因素 W分別對個體層面中回歸系數(shù)和截距的影響。2、數(shù)學模型:a、個體層面:Yij= B 0j+ B 1jXij+eijb、群組層面:B 0j= 丫 00+ 丫 01Wj+U0jB 1j= 丫 10+ 丫 11Wj+U1j涉及到多個群組層次的時候原理與之類似, 可以把較低級層次的群組, 如不

4、 同的鄉(xiāng)鎮(zhèn)層面與不同的縣市層面, 可以這樣理解, 鄉(xiāng)鎮(zhèn)即是一個個體, 群組即是 不同的縣市。 更多層次的可以這樣理解, 一直是下一層對上一層回歸系數(shù)和截距 的回歸。與普通的“回歸的回歸”不同的是,整個計算過程通過迭代過程完成。3、因變量: 此處數(shù)學模型僅適用于連續(xù)的單因變量。 非連續(xù)因變量、 多因變量、 潛變量 以及非典型的嵌套設計, 多層線性模型也可以進行處理, 但對模型的設定會更復 雜。4、與分層回歸的區(qū)別:a、向前回歸、向后回歸和逐步回歸:向前回歸: 根據(jù)自變量對因變量的貢獻率, 首先選擇一個貢獻率最大的自變 量進入,一次只加入一個進入模型。然后,再選擇另一個最好的加入模型,直至 選擇所

5、有符合標準者全部進入回歸。向后回歸: 將自變量一次納入回歸, 然后根據(jù)標準刪除一個最不顯著者, 再 做一次回歸判斷其余變量的取舍,直至保留者都達到要求。逐步回歸是向前回歸法和向后回歸法的結合。 首先按自變量對因變量的貢獻 率進行排序,按照從大到小的順序選擇進入模型的變量。 每將一個變量加入模型, 就要對模型中的每個變量進行檢驗, 剔除不顯著的變量, 然后再對留在模型中的 變量進行檢驗。直到?jīng)]有變量可以納入,也沒有變量可以剔除為止。向前回歸、 向后回歸和逐步回歸都要按照一定判斷標準執(zhí)行。 即在將自變量加入 或刪除模型時,要進行偏 F 檢驗。b、分層回歸與前三者的區(qū)別與聯(lián)系:在理解分層回歸與以上三

6、者的區(qū)別時,應理解以下三個概念。 總體變異:預測變量X和結果變量丫之間相關的平方,它包括該X和丫之間 的所有關系。共同變異:在每個X互相獨立的理想情況下,共同變異為 0。它指的是X對 丫的影響的重疊部分。獨特變異: 在控制了其他變量以后, 特定 X 對 丫的影響。 它表示了 丫中由特 定X所單獨解釋的變異。假如X之間存在重疊,那么它們共有的變異就會削弱獨 特變異。X的獨特效應指的是去除重疊效應后該 X與丫的偏相關的平方??梢钥?出,X的獨特變異依賴于其他預測變量。在強制回歸(ENTER法)中,所有預測變量的偏決定系數(shù)之和要小于整個模型的 決定系數(shù)(R2)??倹Q定系數(shù)包括偏決定系數(shù)之和與共同變異

7、。 強制回歸(ENTER 法)的局限性在于不能將重疊(共同)變異歸因于模型中的任何一個預測變量, 每個預測變量只能分配到它所解釋的獨特變異, 共同變異則被拋棄了。 此時的偏 相關的平方與回歸系數(shù)是等同的。 分層回歸與以上三種方法則提供了一種可以將 共同變異分配給特定預測變量的方法。共同變異將會分配給優(yōu)先進入模型的變 量。在分層回歸中,將會把重疊(共同)變異分配給第一層模型中的預測變量。 因此,上面三種方法則是針對自變量而言的, 而分層回歸則針對第一層 (優(yōu)先層 的模型)。分層回歸則是由研究者根據(jù)經(jīng)驗和理論思考來將自變量分成不同的組( block ),然后再安排每一組變量進入模型的順序,進入的順

8、序不是根據(jù)貢獻 率,而是根據(jù)相應的理論假設。 而且, 研究者還可以為不同組的自變量選用不同 的納入變量的方法。 從這個意義上說, 它與前面三種回歸方法只是指定變量進入 模型的方式不同。c、分層回歸與分層線性模型:從回歸模型中, 可以看出, 分層回歸更像是分組回歸或者分塊回歸, 而與分 層線性模型中的分層,性質(zhì)是完全不一樣的。三、類型1、群組模型:即以上所介紹的研究背景效應的數(shù)據(jù)處理方式。2、發(fā)展模型:主要用于追蹤研究的模型建構。 不同時間的觀察結果 (第一層) 嵌套于被觀 察個體(第二層) ,研究不同的個體對時間效應的回歸系數(shù)和截距產(chǎn)生了何種影 響。在這個模型中,個體不是第一層,而是時間效應,

9、這是發(fā)展模型與群組模型 在模型建構上的區(qū)別。四、應用評價多層線性模型的適用范圍非常廣, 凡是具有嵌套和分層的數(shù)據(jù)均可使用多層 線性模型進行分析。 此外,多層線性模型還可以用于縱向研究。 采用多層分析的 方法處理重復測量數(shù)據(jù)與時間變量之間的關系。 在多層結構中可以對非平衡測量 數(shù)據(jù)得到參數(shù)的有效估計。 因此用多層分析法處理重復測量的數(shù)據(jù), 不要求所有 的觀測個體有相同的觀測次數(shù)。 在縱向調(diào)查研究中, 由于各種各樣的原因, 被試 個體觀測值部分缺失的情況時有發(fā)生, 因此多層分析法處理缺失數(shù)據(jù)而不影響參 數(shù)估計精度的這一特征, 使得多層分析法處理在處理縱向觀測數(shù)據(jù)時, 比傳統(tǒng)多 元重復測量方法有很大

10、的優(yōu)勢。與傳統(tǒng)的用于處理多元重復測量數(shù)據(jù)的方差分析和回歸分析方法相比, 多層 分析法至少具有以下優(yōu)點:1、多層分析法通過考慮測量水平和個體水平不同的差異,明確表示出個體在水 平 1(不同測量點) 的變化情況, 因而對于數(shù)據(jù)的解釋 (個體隨時間的增長趨勢) 是在個體與重復測量交互作用基礎上的解釋,即不僅包含了不同測量點的差異, 而且包含了個體之間存在的差異。2、多層分析法對數(shù)據(jù)資料較傳統(tǒng)多元重復測量方法有較低的要求,對于重復測 量的次數(shù)和重復測量之間的時間跨度都沒有嚴格的限制。 不同個體可以有不同的 測量次數(shù),測量與測量之間的時間跨度也可以不同。3、多層分析模型可以定義重復觀測變量之間復雜的協(xié)方

11、差結構,并且對所定義 的不同的協(xié)方差結構進行顯著性檢驗。 在多層分析模型中, 通過定義第一水平和 第二水平的隨機變異來解釋個體隨時間的復雜變化情況, 當數(shù)據(jù)滿足傳統(tǒng)多變量 重復測量模型對數(shù)據(jù)的要求和假設時, 層次分析法得到與傳統(tǒng)固定效應多元重復 測量模型相同的參數(shù)估計和假設檢驗結果。 用多層分析模型可以考慮更高一層的 變量,如不同地區(qū)兒童對個體增長的影響。但是多層分析模型也有缺點, 首先用于多層分析模型的參數(shù)估計方法較傳統(tǒng) 估計參數(shù)的方法要復雜得多, 而且不能處理變量之間間接的影響關系和處理復雜 的觀測變量和潛變量之間的關系。五、HLM軟件分析步驟:具體操作步驟可以參看:張雷等 . 多層線性模

12、型應用 . 北京:教育科學出版社, 2005.p42.1、創(chuàng)建HLM可識別的數(shù)據(jù)文件(*ssm/mdm格式)a、創(chuàng)建SSM數(shù)據(jù)文件的原始數(shù)據(jù)準備:HLM支持的原始數(shù)據(jù)格式包括純文本,SPSS SAS STAT等主流統(tǒng)計軟件,如果 不兼容,可以轉換成HLM支持的數(shù)據(jù)格式。一般而言,一層結構一個數(shù)據(jù)文件, 而且這些數(shù)據(jù)文件,需要存在一個同樣的標識變量( ID) ,最好是數(shù)字型的。每 層的數(shù)據(jù)文件均按照這個標識變量排序。b、生成MDM文件(指定數(shù)據(jù)層級及相關信息):選擇你需要建立的模型層數(shù), 以下以兩層為例。 選擇群組嵌套設計還是追蹤測量 設計 =瀏覽指定第一層的文件 =指定標識變量和非標識變量 =

13、指定對缺失數(shù) 據(jù)的處理;瀏覽指定第二層的文件=指定標識變量和非標識變量(HLM的高層 數(shù)據(jù)不允許缺失)。如果是兩層以上的數(shù)據(jù),原理相同,只不過最高層要指定下一層級的標識變量ID 及總標識變量。c、指定要存儲的SSM文件名,生成SSM/MD文件。d、檢查生成SSM是否正確。此過程對于后面的統(tǒng)計分析相當重要,數(shù)據(jù)的正確 性是所有準確進行統(tǒng)計分析的前提。2、建立模型1、指定第一層的因變量和自變量:在HLM左邊的變量列表中選擇因變量, 點擊左鍵“ outcome variable ”選擇 因變量,點擊“ add variable group centered ”選擇自變量。2、指定第二層的變量:在指定

14、第二層的自變量之前, 先建立隨機回歸模型來考察第一層的變量在第 二層上差異是否顯著,然后根據(jù)差異情況來選擇合適的第二層的變量作為自變 量。隨機回歸模型即是指在第二層上不做設定, 按照系統(tǒng)默認的模型來進行分析。 具體結果需要參考方差成分和顯著性的結果, 如果方差成分不顯著, 說明此因素 對因變量的影響在不同的群組之間差異不顯著, 這樣就沒有必要在第二層以該回 歸系數(shù)為因變量來建構相應的二層模型了,在設定模型時把相應 beta 固定即可B 仁丫 10。指定第二層的自變量:“ add variable uncentered ”,沒有第三層時,截距意 義不重要,采用這種方法定義進入方式即可。3、模型修正及結果解釋:HLM 輸出結果由兩部分構成:OLS回歸結果與HLM結果(收縮估計)。OLS 結果與一般回歸結果一致。a、信度估計:兩部分結果的分界線是信度估計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論