結(jié)構(gòu)方程模型案例_第1頁
結(jié)構(gòu)方程模型案例_第2頁
結(jié)構(gòu)方程模型案例_第3頁
結(jié)構(gòu)方程模型案例_第4頁
結(jié)構(gòu)方程模型案例_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、結(jié)構(gòu)方程模型 課件結(jié)構(gòu)方程模型(structural equation modeling,sem) 20世紀(jì)主流統(tǒng)計方法技術(shù):因素分析 回歸分析20世紀(jì)70年代:結(jié)構(gòu)方程模型時代正式來臨結(jié)構(gòu)方程模型是一門基于統(tǒng)計分析技術(shù)的研究方法學(xué),它主要用于解決社會科學(xué)研究中的多變量問題,用來處理復(fù)雜的多變量研究數(shù)據(jù)的探究與分析。在社會科學(xué)及經(jīng)濟、市場、管理等研究領(lǐng)域,有時需處理多個原因、多個結(jié)果的關(guān)系,或者會碰到不可直接觀測的變量(即潛變量),這些都是傳統(tǒng)的統(tǒng)計方法不能很好解決的問題。sem能夠?qū)Τ橄蟮母拍钸M行估計與檢定,而且能夠同時進行潛在變量的估計與復(fù)雜自變量/因變量預(yù)測模型的參數(shù)估計。結(jié)構(gòu)方程模型是

2、一種非常通用的、主要的線形統(tǒng)計建模技術(shù),廣泛應(yīng)用于心理學(xué)、經(jīng)濟學(xué)、社會學(xué)、行為科學(xué)等領(lǐng)域的研究。實際上,它是計量經(jīng)濟學(xué)、計量社會學(xué)與計量心理學(xué)等領(lǐng)域的統(tǒng)計分析方法的綜合。多元回歸、因子分析和通徑分析等方法都只是結(jié)構(gòu)方程模型中的一種特例。結(jié)構(gòu)方程模型是利用聯(lián)立方程組求解,它沒有很嚴(yán)格的假定限制條件,同時允許自變量和因變量存在測量誤差。在許多科學(xué)領(lǐng)域的研究中,有些變量并不能直接測量。實際上,這些變量基本上是人們?yōu)榱死斫夂脱芯磕愁惸康亩⒌募僭O(shè)概念,對于它們并不存在直接測量的操作方法。人們可以找到一些可觀察的變量作為這些潛在變量的“標(biāo)識”,然而這些潛在變量的觀察標(biāo)識總是包含了大量的測量誤差。在統(tǒng)計

3、分析中,即使是對那些可以測量的變量,也總是不斷受到測量誤差問題的侵?jǐn)_。自變量測量誤差的發(fā)生會導(dǎo)致常規(guī)回歸模型參數(shù)估計產(chǎn)生偏差。雖然傳統(tǒng)的因子分析允許對潛在變量設(shè)立多元標(biāo)識,也可處理測量誤差,但是,它不能分析因子之間的關(guān)系。只有結(jié)構(gòu)方程模型即能夠使研究人員在分析中處理測量誤差,又可分析潛在變量之間的結(jié)構(gòu)關(guān)系。簡單而言,與傳統(tǒng)的回歸分析不同,結(jié)構(gòu)方程分析能同時處理多個因變量,并可比較及評價不同的理論模型。與傳統(tǒng)的探索性因子分析不同,在結(jié)構(gòu)方程模型中,我們可以提出一個特定的因子結(jié)構(gòu),并檢驗它是否吻合數(shù)據(jù)。通過結(jié)構(gòu)方程多組分析,我們可以了解不同組別內(nèi)各變量的關(guān)系是否保持不變,各因子的均值是否有顯著差異

4、?!?目前,已經(jīng)有多種軟件可以處理sem,包括:lisrel,amos, eqs, mplus. 結(jié)構(gòu)方程模型包括測量方程(lv和mv之間關(guān)系的方程,外部關(guān)系)和結(jié)構(gòu)方程(lv之間關(guān)系的方程,內(nèi)部關(guān)系),以acsi模型為例,具體形式如下:測量方程 yy+y, xx+x=(1)結(jié)構(gòu)方程 b+ 或 (i-)+ (2)其中,和分別是內(nèi)生lv和外生lv,y和x分別是和的mv,x和y是載荷矩陣,和是路徑系數(shù)矩陣,和是殘差。123123123負(fù)荷量潛在變量觀察變量誤差111 y1111y11221y133結(jié)構(gòu)模式測量模式三種分析方法對比 線性相關(guān)分析:線性相關(guān)分析指出兩個隨機變量之間的統(tǒng)計聯(lián)系。兩個變量地

5、位平等,沒有因變量和自變量之分。因此相關(guān)系數(shù)不能反映單指標(biāo)與總體之間的因果關(guān)系。 線性回歸分析:線性回歸是比線性相關(guān)更復(fù)雜的方法,它在模型中定義了因變量和自變量。但它只能提供變量間的直接效應(yīng)而不能顯示可能存在的間接效應(yīng)。而且會因為共線性的原因,導(dǎo)致出現(xiàn)單項指標(biāo)與總體出現(xiàn)負(fù)相關(guān)等無法解釋的數(shù)據(jù)分析結(jié)果。 結(jié)構(gòu)方程模型分析:結(jié)構(gòu)方程模型是一種建立、估計和檢驗因果關(guān)系模型的方法。模型中既包含有可觀測的顯在變量,也可能包含無法直接觀測的潛在變量。結(jié)構(gòu)方程模型可以替代多重回歸、通徑分析、因子分析、協(xié)方差分析等方法,清晰分析單項指標(biāo)對總體的作用和單項指標(biāo)間的相互關(guān)系。結(jié)構(gòu)方程模型假設(shè)條件 合理的樣本量(j

6、ames stevens的applied multivariate statistics for the social sciences一書中說平均一個自變量大約需要15個case;bentler and chou (1987)說平均一個估計參數(shù)需要5個case就差不多了,但前提是數(shù)據(jù)質(zhì)量非常好;這兩種說法基本上是等價的;而loehlin (1992)在進行蒙特卡羅模擬之后發(fā)現(xiàn)對于包含24個因子的模型,至少需要100個case,當(dāng)然200更好;小樣本量容易導(dǎo)致模型計算時收斂的失敗進而影響到參數(shù)估計;特別要注意的是當(dāng)數(shù)據(jù)質(zhì)量不好比如不服從正態(tài)分布或者受到污染時,更需要大的樣本量) 連續(xù)的正態(tài)內(nèi)生

7、變量(注意一種表面不連續(xù)的特例:underlying continuous;對于內(nèi)生變量的分布,理想情況是聯(lián)合多元正態(tài)分布即jmvn) 模型識別(識別方程)(比較有多少可用的輸入和有多少需估計的參數(shù);模型不可識別會帶來參數(shù)估計的失?。?完整的數(shù)據(jù)或者對不完整數(shù)據(jù)的適當(dāng)處理(對于缺失值的處理,一般的統(tǒng)計軟件給出的刪除方式選項是pairwise和listwise,然而這又是一對普遍矛盾:pairwise式的刪除雖然估計到盡量減少數(shù)據(jù)的損失,但會導(dǎo)致協(xié)方差陣或者相關(guān)系數(shù)陣的階數(shù)n參差不齊從而為模型擬合帶來巨大困難,甚至導(dǎo)致無法得出參數(shù)估計;listwise不會有pairwise的問題,因為凡是遇到c

8、ase中有缺失值那么該case直接被全部刪除,但是又帶來了數(shù)據(jù)信息量利用不足的問題全殺了吧,難免有冤枉的;不殺吧,又難免影響整體局勢) 模型的說明和因果關(guān)系的理論基礎(chǔ)(實際上就是假設(shè)檢驗的邏輯你只能說你的模型不能拒絕,而不能下定論說你的模型可以被接受)結(jié)構(gòu)方程模型的技術(shù)特性:1. sem具有理論先驗性2. sem同時處理測量與分析問題3. sem以協(xié)方差的運用為核心,亦可處理平均數(shù)估計4. sem適用于大樣本的分析一般而言,大于200以上的樣本,才可稱得上是一個中型樣本。5. sem包含了許多不同的統(tǒng)計技術(shù)。6. sem重視多重統(tǒng)計指標(biāo)的運用結(jié)構(gòu)方程模型的實施步驟模型設(shè)定。研究者根據(jù)先前的理論

9、以及已有的知識,通過推論和假設(shè)形成一個關(guān)于一組變量之間相互關(guān)系(常常是因果關(guān)系)的模型。這個模型也可以用路徑表明制定變量之間的因果聯(lián)系。模型識別。模型識別時設(shè)定sem模型時的一個基本考慮。只有建設(shè)的模型具有識別性,才能得到系統(tǒng)各個自由參數(shù)的唯一估計值。其中的基本規(guī)則是,模型的自由參數(shù)不能夠多于觀察數(shù)據(jù)的方差和協(xié)方差總數(shù)。模型估計。sem模型的基本假設(shè)是觀察變量的反差、協(xié)方差矩陣是一套參數(shù)的函數(shù)。把固定參數(shù)之和自由參數(shù)的估計帶入結(jié)構(gòu)方程,推導(dǎo)方差協(xié)方差矩陣,使每一個元素盡可能接近于樣本中觀察變量的方差協(xié)方差矩陣s中的相應(yīng)元素。也就是,使與s之間的差異最小化。在參數(shù)估計的數(shù)學(xué)運算方法中,最常用的是

10、最大似然法(ml)和廣義最小二乘法(gls)。模型評價。在已有的證據(jù)與理論范圍內(nèi),考察提出的模型擬合樣本數(shù)據(jù)的程度。模型的總體擬合程度的測量指標(biāo)主要有檢驗、擬合優(yōu)度指數(shù)(gfi)、校正的擬合優(yōu)度指數(shù)(agfi)、均方根殘差(rmr)等。關(guān)于模型每個參數(shù)估計值的評價可以用“t”值。模型修正。模型修正是為了改進初始模型的適合程度。當(dāng)嘗試性初始模型出現(xiàn)不能擬合觀察數(shù)據(jù)的情況(該模型被數(shù)據(jù)拒絕)時,就需要將模型進行修正,再用同一組觀察數(shù)據(jù)來進行檢驗。探索性分析定義:探索性因子分析法(exploratory factor analysis,efa)是一項用來找出多元觀測變量的本質(zhì)結(jié)構(gòu)、并進行處理降維的技

11、術(shù)。 因而,efa能夠?qū)⒕哂绣e綜復(fù)雜關(guān)系的變量綜合為少數(shù)幾個核心因子。探索性因子分析(efa)致力于找出事物內(nèi)在的本質(zhì)結(jié)構(gòu)。f1e11e22f2f3e33因子負(fù)荷殘差指標(biāo)潛變量探索性分析的適用情況:在缺乏堅實的理論基礎(chǔ)支撐,有關(guān)觀測變量內(nèi)部結(jié)構(gòu),一般用探索性因子分析。先用探索性因子分析產(chǎn)生一個關(guān)于內(nèi)部結(jié)構(gòu)的理論,再在此基礎(chǔ)上用驗證性因子分析。但這必須用分開的數(shù)據(jù)集來做。探索性分析步驟:、辨別、收集觀測變量。按照實際情況收集觀測變量,并對其進行觀測,獲得觀測值。針對總體復(fù)雜性和統(tǒng)計基本原理的保證,通常采用抽樣的方法收集數(shù)據(jù)來達到研究目的。、獲得協(xié)方差陣(或bravais-pearson的相似系

12、數(shù)矩陣)。我們所有的分析都是從原始數(shù)據(jù)的協(xié)方差陣(或相似系數(shù)矩陣)出發(fā)的,這樣使我們分析得到的數(shù)據(jù)具有可比性,所以首先要根據(jù)資料數(shù)據(jù)獲得變量協(xié)方差陣(或相似系數(shù)矩陣)。、確定因子個數(shù)。有時候你有具體的假設(shè),它決定了因子的個數(shù);但更多的時候沒有這樣的假設(shè),你僅僅希望最后的到的模型能用盡可能少的因子解釋盡可能多的方差。如果你有k個變量,你最多只能提取k個因子。通過檢驗數(shù)據(jù)來確定最優(yōu)因子個數(shù)的方法有很多,例如kaiser準(zhǔn)則、scree檢驗。方法的選擇由,具體操作時視情況而定。、提取因子。因子的提取方法也有多種,主要有主成分方法、不加權(quán)最小平方法、極大似然法等,我們可以根據(jù)需要選擇合適的因子提取方法

13、。其中主成分方法一種比較常用的提取因子的方法,它是用變量的線性組合中,能產(chǎn)生最大樣品方差的那些組合(稱主成分)作為公共因子來進行分析的方法。、因子旋轉(zhuǎn)。因子載荷陣的不唯一性,使得可以對因子進行旋轉(zhuǎn)。這一特征,使得因子結(jié)構(gòu)可以朝我們可以合理解釋的方向趨近。我們用一個正交陣右乘已經(jīng)得到的因子載荷陣(由線性代數(shù)可知,一次正交變化對應(yīng)坐標(biāo)系的一次旋轉(zhuǎn)),使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化。旋轉(zhuǎn)的方法也有多種,如正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)等,最常用的是方差最大化正交旋轉(zhuǎn)。、解釋因子結(jié)構(gòu)。最后得到的簡化的因子結(jié)構(gòu)是使每個變量僅在一個公共因子上有較大載荷,而在其余公共因子上的載荷則比較小,至多是中等大小。通過這樣,我們就

14、能知道所研究的這些變量是由哪些潛在因素(也就是公共因子)影響的,其中哪些因素是起主要作用的,而哪些因素的作用較小,甚至可以不用考慮。、因子得分。因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合,由于公共因子能反映原始變量的相關(guān)關(guān)系,用公共因子代表原始變量時,有時更利于描述研究對象的特征,因而往往需要反過來將公共因子表示為變量的線性組合,即因子得分。驗證性因子分析定義:驗證性因子分析是對社會調(diào)查數(shù)據(jù)進行的一種統(tǒng)計分析。它測試一個因子與想對應(yīng)的測度項之間的關(guān)系是否符合研究者所設(shè)計的理論關(guān)系。驗證性因子分析 (confirmatory factor analysis) 的強項在于它允許研究者明確描

15、述一個理論模型中的細(xì)節(jié)。因為測量誤差的存在,研究者需要使用多個測度項。當(dāng)使用多個測度項之后,我們就有測度項的“質(zhì)量”問題,即效度檢驗。而效度檢驗就是要看一個測度項是否與其所設(shè)計的因子有顯著的載荷,并與其不相干的因子沒有顯著的載荷。對測度模型的檢驗就是驗證性測度模型。對測度模型的質(zhì)量檢驗是假設(shè)檢驗之前的必要步驟。而驗證性因子分析(cfa)是用來檢驗已知的特定結(jié)構(gòu)是否按照預(yù)期的方式產(chǎn)生作用。e1e2e3f1123負(fù)荷潛變量觀測變量殘差驗證性因子分析的步驟:、定義因子模型。包括選擇因子個數(shù)和定義因子載荷。因子載荷可以事先定為0或者其它自由變化的常數(shù)?;蛘咴谝欢ǖ募s束條件下變化的數(shù)(比如與另一載荷相等

16、)。這是和探索性因子分析在分析方法上的一個重要差異,我們可以用一個直觀的比喻,也就是說探索性因子分析是在一張白紙上作圖,而驗證性因子分析是在一張有框架的圖上完善和修改。、收集觀測值。定義了因子模型以后,我們就可以根據(jù)研究目的收集觀測值了。這一點與探索性因子分析有一定的相似之處。、獲得相關(guān)系數(shù)矩陣。與探索性因子分析一樣,我們的分析都是在原始數(shù)據(jù)的相關(guān)系數(shù)矩陣基礎(chǔ)上進行的,所以首先就要得到相關(guān)系數(shù)矩陣。實際上方差協(xié)差陣、相似系數(shù)矩陣和相關(guān)陣之間是可以相互轉(zhuǎn)化的。、根據(jù)數(shù)據(jù)擬合模型。我們需要選擇一個方法來估計自由變化的因子載荷。在多元正態(tài)的條件下,最常用的是極大似然估計,也可采用漸進分布自由估計。、

17、評價模型是否恰當(dāng)。這一步可以說是驗證性因子分析的核心。當(dāng)因子模型能夠擬合數(shù)據(jù)時,因子載荷的選擇要使模型暗含的相關(guān)陣與實際觀測陣之間的差異最小。最好的參數(shù)被選擇以后,差異量能被用來作為衡量模型與數(shù)據(jù)一致的程度。最常用的模型適應(yīng)性檢驗是卡方擬合優(yōu)度檢驗。原假設(shè)是模型是適應(yīng)性模型,備擇假設(shè)是存在顯著差異。但是,這個檢驗受樣本量大小影響,包含大樣本的檢驗往往會導(dǎo)致拒絕原假設(shè),盡管因子模型是合適的。其他的統(tǒng)計方法,比如用tucker-lewis指數(shù),比較建議模型和“原模型”的擬合度。這些方法受樣本量大小影響不大。、與其他模型比較。為了得到最優(yōu)模型,我們需要完成這一步。如果你想比較兩個模型,其中一個是另一

18、個的縮略形式,你就能從卡方統(tǒng)計量的值檢查出他們的差別,大約服從卡方分布。幾乎所有獨立因子載荷的檢驗?zāi)苡脕碜鳛槿蜃幽P秃秃喴蜃拥哪P椭g的比較。為以防你不是在檢查全模型和簡模型,你可以比較均方根誤差的近似值 (rmsea),它是模型中每個自由度差異的一個估計值。驗證性分析適用情況驗證性因子分析要處理推論統(tǒng)計量,處理難度要求高。需要具備更大容量的樣本。精確的樣本量要隨著觀測值和模型的因子數(shù)變化而變化,但一個標(biāo)準(zhǔn)模型至少需要200個個體。在進行分析過程中必須選擇與每個因子在很大程度上匹配的變量,而不是可能是潛在變量的“隨機樣本”?;诮Y(jié)構(gòu)方程全模型的大學(xué)生就業(yè)預(yù)期情況分析0 引言隨著我國經(jīng)濟的不斷

19、發(fā)展,我國高校大規(guī)模擴招,越來越多的年輕人獲得了接受教育的機會。從社會發(fā)展的角度來講,大批高素質(zhì)的人才培養(yǎng)是與我國快速發(fā)展的社會經(jīng)濟水平相適應(yīng)的。然而,由此也帶來了兩方面的問題:一是本科生的就業(yè)矛盾日益突出,幾乎每一個大學(xué)生都在切身感受就業(yè)的恐慌;二是人才的競爭加劇,加之市場對于人才的需求多元化,考研或出國深造成為提高我們本科生自身核心競爭力的一種渠道,同時也是規(guī)避就業(yè)難的一種新途徑;那么,在如此就業(yè)形勢嚴(yán)峻、人才競爭加劇的當(dāng)今社會,大學(xué)生們對自己將來的就業(yè)有怎樣的預(yù)期呢?本論文基于遼寧工程技術(shù)大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院2005級統(tǒng)計系本科生于2007年10月至11月期間收集的題目為“大學(xué)生就業(yè)與深造

20、意向調(diào)查”的原始問卷資料,欲從大學(xué)生的就業(yè)預(yù)期角度出發(fā),結(jié)合結(jié)構(gòu)方程模型,分析大學(xué)生預(yù)期就業(yè)手段和預(yù)期就業(yè)地域方面的相關(guān)情況,并期望推廣結(jié)構(gòu)方程模型應(yīng)用于問卷分析的方法。1 問題分析1.1 研究目的本論文在采用量表方式對問卷中的定性變量予以賦值后,欲分析影響大學(xué)生預(yù)期就業(yè)手段和預(yù)期就業(yè)地域的因素,并期望得到各個因素與大學(xué)生預(yù)期就業(yè)手段、預(yù)期就業(yè)地域之間的關(guān)系的度量。需注意:該調(diào)查的調(diào)查對象是遼寧工程技術(shù)大學(xué)全日制在讀本科生。調(diào)查對象僅僅是來自大學(xué)生這個總體的一個群或?qū)?。根?jù)抽樣調(diào)查的相關(guān)理論,遼寧工程技術(shù)大學(xué)在讀本科生并不具有典型代表性,即它作為大學(xué)生總體的一個群被抽出并不具備隨機性和強代表性

21、。因此,本論文從這份調(diào)查數(shù)據(jù)出發(fā),僅僅只是從一個相對小的視角研究大學(xué)生預(yù)期就業(yè)手段、預(yù)期就業(yè)地域方面的情況,結(jié)果不一定適用于大學(xué)生總體。問卷數(shù)據(jù)歸屬于2009年10月這個時點,因此,本論文的分析結(jié)果當(dāng)然是對2009年10月這個時點相關(guān)情況的反映。1.2 研究方法本論文考慮建立結(jié)構(gòu)方程全模型來研究大學(xué)生預(yù)期就業(yè)手段和預(yù)期就業(yè)地域(內(nèi)生潛變量)與其各個因素(外生潛變量)之間的關(guān)系,并量化這種關(guān)系。結(jié)構(gòu)方程模型的優(yōu)勢就在于引入潛變量(不可直接觀測的量),使人們考慮問題的思路躍然紙上,顯得更加系統(tǒng)化。也就是,它以如下的方式考慮問題:x指標(biāo)外生潛變量內(nèi)生潛變量y指標(biāo)外源觀測變量 內(nèi)生觀測變量那么,研究外

22、生潛變量對內(nèi)生潛變量的影響實質(zhì)上就是間接研究x指標(biāo)對y指標(biāo)的影響。只不過,結(jié)構(gòu)方程把由同一個潛變量控制的指標(biāo)劃分為一類,表示這一類指標(biāo)受該潛變量的影響,使得問題的分析更加的系統(tǒng)。值得注意的是,本論文的研究基礎(chǔ)問卷資料來自于第二方的調(diào)查資料,第二方事先并未考慮過用結(jié)構(gòu)方程模型分析問卷。那么,本文運用結(jié)構(gòu)方程模型分析問卷,問卷中的問題就不一定能很好地切合結(jié)構(gòu)方程模型,由此可能引起相當(dāng)?shù)恼`差。這也就決定了我們在確定運用結(jié)構(gòu)方程模型分析問卷時,已有心理準(zhǔn)備面對模型可能出現(xiàn)的整體擬合效果不好等問題,故本文著眼于推廣結(jié)構(gòu)方程模型建模方法在問卷分析中的應(yīng)用。也就是說,欲用結(jié)構(gòu)方程模型分析問卷,應(yīng)該事先根據(jù)相

23、關(guān)理論或經(jīng)驗初步設(shè)定幾個潛變量,然后在問卷中為每一個潛變量設(shè)置若干的題目來測量它。2 問卷數(shù)據(jù)的收集2.1數(shù)據(jù)來源本論文數(shù)據(jù)來自于遼寧工程技術(shù)大學(xué)理學(xué)院2007級統(tǒng)計系本科生于2009年10月至11月期間收集的題目為“大學(xué)生就業(yè)與深造意向調(diào)查”的原始問卷資料。該次調(diào)查的調(diào)查對象為遼寧工程技術(shù)大學(xué)全日制在讀本科生(遼寧工程技術(shù)大學(xué)二級學(xué)院的學(xué)生不包括在內(nèi))。具體說來,本論文僅僅提取在問卷的“甄別問題”部分回答“就業(yè)”的那部分人(共計280人)的相關(guān)信息進行分析。 2.2抽樣方法 該次調(diào)查按學(xué)科類別(文科、理科、工科、其他)和年級(大一、大二、大三、大四)將研究總體分為16個層,由于“其他類”的大

24、一和大四的數(shù)據(jù)難以取得,因此,僅針對其余14個層進行抽樣。根據(jù)抽樣框,在每層中按簡單隨機抽樣抽取20%的班級,同時在抽中的班級中按簡單隨機抽樣抽取30%的學(xué)生。 2.3問卷內(nèi)容及執(zhí)行情況調(diào)查問卷詳見附錄三。該次調(diào)查專門成立調(diào)查組,按照被抽中學(xué)生的花名冊由專人負(fù)責(zé)發(fā)放問卷,共計發(fā)放問卷788份,實際收回問卷758份,提取有效問卷706份。3 問卷數(shù)據(jù)的處理3.1 定性變量的分類及賦值方法3.1 本文變量的設(shè)置表1 指標(biāo)的設(shè)置變量符號變量名取值情況x1生源地x1=1西部; x1=2中部; x1=3東部x2戶口類型x2=0農(nóng)村戶口; x2=1城鎮(zhèn)戶口x3父親受教育程度x3=1初中以下; x3=2初中

25、; x3=3高中或中專x3=4大?;虮究疲粁3=5研究生以上x4母親受教育程度x4=1初中以下; x4=2初中; x4=3高中或中專x4=4大?;虮究?; x4=5研究生以上x5月可支配生活費x5=1 300元以下; x5=2 300500元x5=3 500800元; x5=4 800元以上x6對就業(yè)形勢的看法x6=1很不好; x6=2不好; x6=3一般x6=4較好; x6=5非常好x7所學(xué)專業(yè)前景看法x7=1很不好; x7=2不好; x7=3一般x7=4較好; x7=5非常好x8參加就業(yè)輔導(dǎo)的次數(shù)x8=0參加0次; x8=1參加1次x8=2參加2次; x8=3參加4次以上x9就業(yè)資格證書個數(shù)

26、x9=0、1、2、3x10四、六級考證情況x10=0四、六級都沒過; x10=1過四級; x10=2過六級x11參加社會實踐次數(shù)x11=0從不參加; x11=1參加1、2次x11=2參加3、4次; x11=3參加4次以上y1是否自主創(chuàng)業(yè)y1=0否; y1=1是y2工作地域y2=1農(nóng)村地區(qū); y2=2縣級地區(qū)y2=3地級城市及州市; y2=4省會城市及直轄市表2 潛變量的設(shè)置變量符號變量名變量包括的指標(biāo)外生潛變量1社會經(jīng)濟地位x1、x2、x3、x4、x52對就業(yè)狀況的把握x6、x7、x83自身能力x9、x10、x11內(nèi)生潛變量1預(yù)期就業(yè)手段y12預(yù)期就業(yè)地域y24基于結(jié)構(gòu)方程模型的大學(xué)生預(yù)期就業(yè)

27、手段和就業(yè)區(qū)域情況分析4.1 結(jié)構(gòu)方程模型簡介很多社會、教育、心理等研究中涉及的變量,都不能準(zhǔn)確、直接地測量,比如學(xué)習(xí)動機、家庭社會經(jīng)濟地位等,我們稱這樣的變量為潛變量。潛變量往往只能通過一些外生指標(biāo)去衡量,比如用父母受教育程度、學(xué)生戶口類型、父母收入等外生指標(biāo)來衡量學(xué)生的社會經(jīng)濟地位(潛變量)。傳統(tǒng)的統(tǒng)計分析方法不能妥善處理這些潛變量,而結(jié)構(gòu)方程全模型則能同時處理潛變量及其指標(biāo)。它是一種基于變量的協(xié)方差矩陣來分析多個變量之間關(guān)系的一種統(tǒng)計方法,也稱為協(xié)方差結(jié)構(gòu)分析。并且,它有機地整合了多元統(tǒng)計中的因子分析方法、生物學(xué)中的路徑分析方法以及計量經(jīng)濟學(xué)中的聯(lián)立方程模型。結(jié)構(gòu)方程全模型由測量方程和結(jié)

28、構(gòu)方程組成。若結(jié)構(gòu)方程模型中只包括測量方程,則又稱為驗證性因子模型。關(guān)于測量方程和結(jié)構(gòu)方程的形式,最普遍的情況是設(shè)定為線性模型。測量方程用來描述指標(biāo)與潛變量之間的關(guān)系,用下述模型表示: 結(jié)構(gòu)方程用來描述外生潛變量與內(nèi)生潛變量之間的關(guān)系,用下述模型表示:4.2 模型的基本假定一般假定,每一個指標(biāo)只在其對應(yīng)的潛變量上有不為0的因子負(fù)荷,而在其他潛變量上的因子負(fù)荷為0。內(nèi)生變量之間的路徑(相關(guān)或單方面影響)依據(jù)經(jīng)驗和相關(guān)理論而定。測量誤差項與外生潛變量之間()、測量誤差項與內(nèi)生潛變量之間不相關(guān)();()、()、()不相關(guān)。4.3 結(jié)構(gòu)方程模型路徑圖及形式結(jié)合研究目的,首先我們根據(jù)相關(guān)研究及經(jīng)驗,找出

29、影響大學(xué)生的預(yù)期就業(yè)手段和預(yù)期就業(yè)地域這兩個內(nèi)生潛變量的外生潛變量。然后,對問卷中的相關(guān)指標(biāo)進行初步歸類,建立驗證性因子模型,并進行相關(guān)的參數(shù)估計、不斷修正,最終確定潛變量的結(jié)構(gòu)后,再加入結(jié)構(gòu)方程模型。下圖為擬采用的結(jié)構(gòu)方程全模型的路徑分析圖,欲對各路徑參數(shù)進行估計。x1x2x3x4x5社會經(jīng)濟地位x6x7x8對就業(yè)狀況的把握x9x10x11自身能力預(yù)期就業(yè)手段預(yù)期就業(yè)地域y1y2 12123圖1 擬采用的全模型路徑分析圖圖1的符號說明:正方形或長方形表示指標(biāo);圓或橢圓表示潛變量;單向箭頭表示單向影響;雙箭頭表示相關(guān);單向箭頭指向指標(biāo)表示測量誤差;單向箭頭指向潛變量表示內(nèi)生潛變量未被解釋的部分

30、。注意:確定需要用哪些指標(biāo)衡量潛變量,可以根據(jù)經(jīng)驗分析進行初步歸類,也可以使用多元統(tǒng)計分析中因子分析的方法進行探索。然后,對初步歸類的指標(biāo)建立驗證性因子模型(即只有測量方程),并進行相應(yīng)的參數(shù)估計,比較從屬于同一潛變量的各路徑參數(shù)的大小,進行相應(yīng)的路徑刪減。結(jié)構(gòu)方程全模型是否可識別不僅取決于數(shù)據(jù)質(zhì)量,更取決于模型設(shè)定形式是否正確。模型形式的正確性就表現(xiàn)在潛變量指向指標(biāo)的單向路徑、外生潛變量之間的雙向路徑、內(nèi)生潛變量之間的單向或雙向路徑、外生潛變量指向內(nèi)生潛變量的單向路徑劃定是否正確。每一條路徑對應(yīng)一個待估參數(shù)(主要是模型中的系數(shù)(負(fù)荷)、誤差方差、潛變量之間的相關(guān)系數(shù))。一般的思路是先建立驗證

31、性因子模型,不斷修正(刪減路徑或改變路徑相連方式)、保證指標(biāo)與潛變量之間的從屬關(guān)系成立后,再建立結(jié)構(gòu)方程,不斷修正,漸漸修改為相對理想的模型。在沒有任何理論依據(jù)或經(jīng)驗的前提下,我們要考慮任意兩個外生潛變量之間、任意兩個內(nèi)生潛變量之間的相關(guān)關(guān)系(路徑為雙向),然后根據(jù)模型的參數(shù)估計結(jié)果進行相應(yīng)的路徑增減。由圖1,注意到本文擬采用的模型中,兩個內(nèi)生潛變量和均分別只用一個指標(biāo)和衡量,相當(dāng)于潛變量就是指標(biāo)。原則上,結(jié)構(gòu)方程模型并不允許這樣的情況出現(xiàn),因為單指標(biāo)潛變量的存在會使得模型無法識別。倘若這種情況真的出現(xiàn)了,需在參數(shù)估計時固定負(fù)荷或方差等(詳見附錄四的程序)。本文模型的設(shè)定形式不得不包含單指標(biāo)的

32、潛變量,主要是由于我們基于第二方設(shè)計的問卷進行相關(guān)問題的分析,使得問卷內(nèi)容設(shè)計和模型形式設(shè)定脫節(jié),從而導(dǎo)致有些潛變量找不到一定數(shù)量的、合適的指標(biāo)來測量。對照圖1,模型的形式設(shè)定為:4.4 模型的識別常用判斷模型是否可識別:在結(jié)構(gòu)方程模型中,共有個可觀測變量,記為模型中自由估計的參數(shù)個數(shù),則模型可識別的一個必要條件是: 該模型中共含有35個參數(shù),包括11個負(fù)荷、3個潛變量之間的相關(guān)系數(shù)、11個觀測變量的誤差方差、結(jié)構(gòu)模型的8個未知參數(shù)、2個內(nèi)生潛變量的誤差方差。由于,故該模型可識別。4.5 模型的參數(shù)估計以及參數(shù)的顯著性檢驗1、模型的參數(shù)估計利用結(jié)構(gòu)方程模型軟件amos7.0對模型的未知參數(shù)進行

33、估計,源程序、輸出結(jié)果分別見附錄四和附錄五。結(jié)構(gòu)方程模型參數(shù)估計的基本思想是:求參數(shù)使得模型隱含的協(xié)方差矩陣與樣本協(xié)方差矩陣“差距”最小。對這個矩陣之間“差距”的不同定義方法,產(chǎn)生了不同的模型擬合方法及相應(yīng)的參數(shù)估計。最常用的結(jié)構(gòu)方程模型參數(shù)估計方法是極大似然函數(shù)法(ml),雖然此法需要假定觀測指標(biāo)的分布為正態(tài)或近似正態(tài)分布,但很多研究表明,即使指標(biāo)的分布不為正態(tài)分布,ml方法也能得到合適的估計,尤其在大樣本條件下。也即,ml估計是穩(wěn)健的。2、模型參數(shù)的顯著性檢驗amos7.0的輸出結(jié)果給出了未標(biāo)準(zhǔn)化情況下,各因子負(fù)荷的估計以及與各負(fù)荷相應(yīng)的標(biāo)準(zhǔn)差估計值和統(tǒng)計量值。一般可簡單地取值大于2為顯著

34、,即此時認(rèn)為相應(yīng)的負(fù)荷顯著不為0。若有某幾個因子負(fù)荷不顯著,每次取消一個路徑,重新運行程序后,再進行負(fù)荷的顯著性檢驗,重復(fù)此過程,直到各個負(fù)荷均顯著為止。amos7.0的輸出結(jié)果也給出了標(biāo)準(zhǔn)化情況下參數(shù)的估計結(jié)果。標(biāo)準(zhǔn)化情況下,參數(shù)估計結(jié)果不受各指標(biāo)或因子量綱的影響,便于對變量之間的相互關(guān)系進行分析。本文的模型采用標(biāo)準(zhǔn)化情況下的參數(shù)估計結(jié)果,并且分兩步確立:第一步建立驗證性因子模型,確定潛變量的結(jié)構(gòu);第二步按照圖1的模型(即加入結(jié)構(gòu)方程),運行程序,刪除不顯著的路徑后再次運行程序,共經(jīng)歷兩次路徑刪除后,估計結(jié)果顯示所有的因子負(fù)荷在置信水平下,均已顯著。從而得到本文估計模型的具體形式: 此外,輸

35、出結(jié)果(見附錄五)中沒有包含違背常理的參數(shù)估計值,比如說沒有出現(xiàn)方差小于0、相關(guān)系數(shù)大于1等情況,說明用該模型擬合原始數(shù)據(jù)是合適的。4.6 模型的整體擬合評價根據(jù)結(jié)構(gòu)方程模型中評價模型擬合優(yōu)劣的相關(guān)理論,通常采用以下幾種指標(biāo)來評價模型的擬合效果:相對擬合指數(shù)(cfi):取值于01之間,越接近于1,模型整體擬合越好;近似均方根誤差指數(shù)(rmsea):其值越小越好。一般認(rèn)為,rmsea低于0.1表示好的擬合,低于0.05表示非常好的擬合。調(diào)整后的擬合優(yōu)度指數(shù)(agfi):取值于01之間,越接近1,模型整體擬合越好。 本文模型的擬合優(yōu)劣指標(biāo)匯總?cè)缦拢罕? 模型的擬合指數(shù)指標(biāo)cfirmseaagfi取

36、值0.730.130.76 結(jié)合各個擬合指數(shù)的判斷標(biāo)準(zhǔn),由表1知,模型整體擬合效果一般。前述4.3節(jié)的注意(4)已分析過原因。4.7 模型參數(shù)估計結(jié)果的解釋每一個觀測指標(biāo)對其從屬的潛變量的標(biāo)準(zhǔn)化參數(shù)估計值(即負(fù)荷),有效地反映了該指標(biāo)與相應(yīng)潛變量之間的相關(guān)程度,同時也反映了潛變量對相應(yīng)觀測指標(biāo)的解釋能力。這可以由下圖中各路徑的參數(shù)清晰地表征出來:x1x2x3x4x5社會經(jīng)濟地位x6x7x8對就業(yè)情況的把握x9x10x11自身能力預(yù)期就業(yè)手段預(yù)期就業(yè)地域y1y2-0.1030.4040.7120.7680.810 0.6530.5190.6790.6340.9000.427 0.2340.997 0.983-0.0520.163 0.162 0.1450.2540.123 0.191 0.9390.886 121230.8370.4930.3430.5740.7310.5390.5980.1910.8180.9450.0050.0330.410各個路徑參數(shù)意義誤差項方差圖2 結(jié)果路徑圖對比圖1和圖2,顯然,在參數(shù)估計過程中,一些不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論