版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)學建模講座多元統(tǒng)計分析第一頁,共一百八十六頁,編輯于2023年,星期三第一部分理論分析1.1相關分析1.2路徑分析1.3結構方程模型1.4聚類分析1.5因子分析第二頁,共一百八十六頁,編輯于2023年,星期三相關分析第三頁,共一百八十六頁,編輯于2023年,星期三(一)相關關系(1)函數(shù)關系:(如:銷售額與銷售量;圓面積和圓半徑.)是事物間的一種一一對應的確定性關系.即:當一個變量x取一定值時,另一變量y可以依確定的關系取一個確定的值(2)統(tǒng)計關系:(如:收入和消費;身高的遺傳.)事物間的關系不是確定性的.即:當一個變量x取一定值時,另一變量y的取值可能有幾個.一個變量的值不能由另一個變量唯一確定第四頁,共一百八十六頁,編輯于2023年,星期三概述統(tǒng)計關系的常見類型:線性相關:正線性相關、負線性相關非線性相關統(tǒng)計關系不象函數(shù)關系那樣直接,但卻普遍存在,且有強有弱.如何測度?第五頁,共一百八十六頁,編輯于2023年,星期三概述(二)相關分析的任務研究對象:統(tǒng)計關系相關分析旨在測度變量間線性關系的強弱程度第六頁,共一百八十六頁,編輯于2023年,星期三相關分析(一)目的通過樣本數(shù)據(jù),研究兩變量間線性相關程度的強弱.
(二)基本方法繪制散點圖、計算相關系數(shù)第七頁,共一百八十六頁,編輯于2023年,星期三
繪制散點圖(一)散點圖將數(shù)據(jù)以點的形式繪制在直角平面上.比較直觀,可以用來發(fā)現(xiàn)變量間的關系和可能的趨勢.體現(xiàn)了正相關趨勢第八頁,共一百八十六頁,編輯于2023年,星期三繪制散點圖(二)基本操作步驟(1)菜單選項:graphs->scatter(2)選擇散點圖類型:simple:簡單散點圖(顯示一對變量的散點圖)overlay:重疊散點圖(顯示多對變量的散點圖)(3)選擇x軸和y軸的變量(4)選擇分組變量(setmarkersby):分別以不同顏色點的表示(5)選擇標記變量(labelcaseby):散點圖上可帶有標記變量的值(如:職工號)第九頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(一)相關系數(shù)(1)作用:以精確的相關系數(shù)(r)體現(xiàn)兩個變量間的線性關系程度.r:[-1,+1];r=1:完全正相關;r=-1:完全負相關;r=0:無線性相關;|r|>0.8:強相關;|r|<0.3:弱相關第十頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(一)相關系數(shù)(2)說明:相關系數(shù)只是較好地度量了兩變量間的線性相關程度,不能描述非線性關系.如:x和y的取值為:(-1,-1)(-1,1)(1,-1)(1,1)
r=0但xi2+yi2=2數(shù)據(jù)中存在極端值時不好如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1)r=0.33但總體上表現(xiàn)出:x=y應結合散點圖分析第十一頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(一)相關系數(shù)(3)種類:簡單線性相關系數(shù)(Pearson):針對定距數(shù)據(jù).
(如:身高和體重)第十二頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(一)相關系數(shù)(3)種類:Spearman相關系數(shù):用來度量定序或定類變量間的線性相關關系(如:不同年齡段與不同收入段,職稱和受教育年份)利用秩(數(shù)據(jù)的排序次序).認為:如果x與y相關,則相應的秩Ui、Vi也具有同步性.首先得到兩變量中各數(shù)據(jù)的秩(Ui、Vi),并計算Di2統(tǒng)計量.計算Spearman秩相關系數(shù),與簡單相關系數(shù)形式完全相同.若兩變量存在強正相關性,則Di2應較小,秩序相關系數(shù)較大.若兩變量存在強負相關性,則Di2應較大,秩序相關系數(shù)為負,絕對值較大第十三頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(一)相關系數(shù)(3)種類:Kendall相關系數(shù):度量定序定類變量間的線性相關關系首先計算一致對數(shù)目(U)和非一致對數(shù)目(V)如:對x和y求秩后為:x:24351y:34152x的秩按自然順序排序后:x:12345y:23145一致對:(2,3)(2,4)(2,5)(3,4)(3,5)(1,4)(1,5)(4,5)非一致對:(2,1)(3,1)然后計算Kendall相關系數(shù).若兩變量存在強相關性,則V較小,秩序相關系數(shù)較大;若兩變量存在強負關性,則V較大,秩序相關系數(shù)為負,絕對值較大第十四頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(二)相關系數(shù)檢驗應對兩變量來自的總體是否相關進行統(tǒng)計推斷.原因:抽樣的隨機性、樣本容量小等(1)H0:兩總體零相關(2)構造統(tǒng)計量簡單相關系數(shù)Spearman系數(shù),大樣本下,近似正態(tài)分布kendall系數(shù),大樣本下,近似正態(tài)分布第十五頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(二)相關系數(shù)檢驗(3)計算統(tǒng)計量的值,并得到對應的相伴概率p(4)結論:如果p<=a,則拒絕H0,兩總體存在線性相關;如果p>a,不能拒絕H0.第十六頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(三)基本操作步驟(1)菜單選項:analyze->correlate->bivariate...(2)選擇計算相關系數(shù)的變量到variables框.(3)選擇相關系數(shù)(correlationcoefficients).(4)顯著性檢驗(testofsignificance)tow-tailed:輸出雙尾概率P.one-tailed:輸出單尾概率P第十七頁,共一百八十六頁,編輯于2023年,星期三計算相關系數(shù)(四)其他選項statistics選項:僅當計算簡單相關系數(shù)時,選擇輸出哪些統(tǒng)計量.meansandstandarddeviations:均值、標準差;cross-productdeviationsandcovariances:分別輸出兩變量的離差平方和(sumofsquare分母)、兩變量的差積和(cross-products分子)、協(xié)方差(covariance以上各個數(shù)據(jù)除以n-1)第十八頁,共一百八十六頁,編輯于2023年,星期三偏相關分析(一)偏相關系數(shù)(1)含義: 在控制了其他變量的影響下計算兩變量的相關系數(shù)。虛假相關.研究商品的需求量和價格、消費者收入之間的關系.因為:需求量和價格之間的相關關系包含了消費者收入對商品需求量的影響;收入對價格也產(chǎn)生影響,并通過價格變動傳遞到對商品需求量的影響中。又如:糧食產(chǎn)量與平均氣溫、月降水量、平均日照時間、溫度之間的關系的研究。第十九頁,共一百八十六頁,編輯于2023年,星期三偏相關分析(2)計算方法:第二十頁,共一百八十六頁,編輯于2023年,星期三偏相關分析(二)基本操作步驟(1).菜單選項:analyze->correlate->partial…(2).選擇將參加計算的變量到variable框.(3).選擇控制變量到controllingfor框。(4)option選項:zero-ordercorrelations:輸出簡單相關系數(shù)矩陣第二十一頁,共一百八十六頁,編輯于2023年,星期三路徑分析第二十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1023第十章路徑分析
目錄上頁下頁返回結束
20世紀初,“Pearson原理”占著生物遺傳學(在過去幾乎就是我們現(xiàn)在所稱作的統(tǒng)計學)的統(tǒng)治地位。Pearson原理的一個基本內容就是相關關系是現(xiàn)實生活中最基本的關系,而因果關系僅僅是完全相關的(理論)極限。這種理論認為沒必要尋找變量之間的因果關系,只需計算相關系數(shù)。然而相關分析逐漸暴露出自身的很多局限:一是相關分析僅僅反應變量之間的線性關系;二是相關分析反應變量之間的關系是對稱的,而很多變量之間的關系是非對稱的;三是只有在正態(tài)假設下,相關思想才是有效的。第二十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1024第十章路徑分析
目錄上頁下頁返回結束
在遺傳學中,很多現(xiàn)象具有明顯的因果關系,如父代與子代的基因關系,父代在前,子代在后,二者的關系只能是單向的,而非對稱的。對這種變量結構進行思考,遺傳學家SewallWright于1918-1921年提出路徑分析(pathanalysis),用來分析變量間的因果關系。現(xiàn)代的路徑分析由生物遺傳學家、心理測驗學家、計量經(jīng)濟學家以及社會學家的推進,引入隱變量(latentvariable,又稱unmeasuredvariable,不可觀測變量),并允許變量間具有測量誤差,并且極大似然估計代替了最小二乘法,成為路徑系數(shù)主流的估計方法。第二十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1025第十章路徑分析
目錄上頁下頁返回結束
路徑分析現(xiàn)在成為多元分析的一種重要方法,廣泛應用于遺傳學、社會學、心理學、經(jīng)濟問題和市場調研領域。然而習慣上把基于最小二乘的傳統(tǒng)的路徑分析稱作路徑分析,而把基于極大似然的路徑分析稱作結構方程式模型(StructuralEquationModeling,SEM)。本節(jié)主要介紹傳統(tǒng)的路徑分析,不進行特別說明,本節(jié)所提到的路徑分析均指基于最小二乘的路徑分析,結構方程式模型方在下節(jié)介紹。第二十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1026
目錄上頁下頁返回結束
一、路徑圖路徑分析的主要工具是路徑圖,它采用一條帶箭頭的線(單箭頭表示變量間的因果關系,雙箭頭表示變量間的相關關系)表示變量間預先設定的關系,箭頭表明變量間的關系是線性的,很明顯,箭頭表示著一種因果關系發(fā)生的方向。在路徑圖中,觀測變量一般寫在矩形框內,不可觀測變量一般寫在橢圓框內,對于簡單的路徑模型,可以直接用字母表示變量,繪出路徑圖。第二十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1027
目錄上頁下頁返回結束
圖10-1是一個簡單的路徑路,A是父親智商,B是母親智商,C1、C2是兩個成年子女的智商,是與A,B不相關的另外原因變量。一般來說,父母親的智商之間不存在關系;父母親的智商對子女的智商存在因果關系,用單箭頭表示,子女的之間,存在相關關關系,用雙箭頭表示。箭頭上的字母表示路徑系數(shù),路徑系數(shù)反應原因變量對結果變量的相對影響大小。在路徑分析中一般采用經(jīng)過標準化后的變量,沒有特別說明,均指經(jīng)過標準化后的變量??梢园褕D10-1寫為方程式的形式:(10.1)第二十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1028
目錄上頁下頁返回結束
式(10.1)實際上是普通的多元回歸方程,多元回歸分析是因果關系模型的一種,但它是一種比較簡單的因果關系模型,各個自變量對因變量的作用并列存在,它僅包含一個環(huán)節(jié)的因果結構。路徑分析的優(yōu)勢在于它可以容納多環(huán)節(jié)的因果結構,通過路徑圖把這些因果關系很清楚地表示出來,據(jù)此進行更深層次的分析,如比較各種因素之間的相對重要程度,計算變量與變量之間的直接與間接影響,這在后面會涉及到。圖10-2是有關一種消費性電子產(chǎn)品(如手機)路徑分析的例子(這里省略了路徑系數(shù)),四個變量耐用性、操作的簡單性、通話效果和價格兩兩相關,決定感知價值,同時通過感知價值決定忠誠度。相對于圖10-1,它具有兩層的因果關系。接下來主要以圖10-2為例,說明路徑圖中的一些基本概念。第二十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1029
目錄上頁下頁返回結束
§10.1.1
路徑圖第二十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1030
目錄上頁下頁返回結束
路徑圖上的變量分為兩大類:一類是外生變量(exogenousvariable,又稱獨立變量,源變量),它不受模型中其他變量的影響,如圖10-2中的耐用性、操作的簡單性、通話效果和價格。與此相反,另一類是內生變量(endogenousvariable,又稱因變量或下游變量),在路徑圖上至少有一個箭頭指向它,它被模型中的其它一些變量所決定,如圖10-2中的感知價值由耐用性、操作的簡單性、通話效果和價格四個變量和隨機誤差e5決定,忠誠度取決于四個外生變量、感知價值和隨機誤差e6。此外,我們可以將路徑圖中不影響其它變量的內生變量稱為最終結果變量(ultimateresponsevariable),最終結果變量不一定只有一個。圖10-2中忠誠度是最終結果變量。第三十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1031
目錄上頁下頁返回結束
其他變量(A)對內生變量(B)的影響有兩種情況:若A直接通過單向箭頭對B具有因果影響,稱A對B有直接作用(directeffect);若A對B的作用是間接地通過其他變量(C)起作用,稱A對B有間接作用(indirecteffect),稱C為中間變量(mediatorvariable)。變量間的間接作用常常由多種路徑最終總合而成。圖10-2中,四個外生變量耐用性、操作的簡單性、通話效果和價格既對忠誠度有直接作用,同時通過感知價值對忠誠度具有間接作用。第三十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1032
目錄上頁下頁返回結束
如果模型中包含中間變量,首先從理論角度考慮,這個中間作用是否有理論依據(jù),其次實際工作者會提出這樣的問題:“模型中中間變量的中間影響顯著嗎?”,這些問題涉及到對中間變量的間接作用進行檢驗。Barron,R.M.&KennyD.(1986)提出了檢驗中間變量間接作用是否統(tǒng)計顯著的一種做法。他們利用基于普通最小二乘的多元回歸進行,以圖10-2為例說明這種做法:第一步:用中間變量(感知價值)對外生變量耐用性、操作的簡單性、通話效果和價格四個變量進行回歸;第二步:用內生變量(忠誠度)對第一步中的四個變量進行回歸;第三步:用忠誠度對第一步中的四個變量以及中間變量感知價值進行回歸。第三十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1033
目錄上頁下頁返回結束
Agarwal,S.&Teas,R.K.(1997)的工作表明“如果(a)在第一步的估計中解釋變量統(tǒng)計顯著;(b)在第二步的估計中解釋變量統(tǒng)計顯著;(c)在第三步的估計中中間變量統(tǒng)計顯著,則說明中間變量的間接作用顯著”.假設對圖10-2進行間接作用檢驗,得到表10-1。第三十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1034
目錄上頁下頁返回結束
對每一外生變量,存在三種可能的中間結果:沒有間接作用(nomediation),部分間接作用(partialmediation)和完全間接作用(fullmediation)。如果第一步中外生變量的回歸系數(shù)不是統(tǒng)計顯著或者第三步中(中間變量)感知價值的回歸系數(shù)不顯著,說明該外生變量不存在間接作用;如果某一外生變量(如耐用性、操作的簡單性和通話效果)在第一步和第三步中的回歸系數(shù)都是統(tǒng)計顯著的,說明該外生變量存在部分間接作用;如果某外生變量(價格)的回歸系數(shù)在第一步顯著,而在第三步不顯著,說明該外生變量存在完全的間接作用。第三十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1035
目錄上頁下頁返回結束
廣義的路徑模型有兩種基本類型:遞歸模型和非遞歸模型。兩種模型在分析時有所不同,遞歸模型可以直接通過最小二乘求解,而非遞歸模型的求解比較復雜。盡管本章主要介紹基于最小二乘的路徑分析(即遞歸路徑模型),但同時也要求讀者能夠預先正確判斷一個模型的所屬類型,才能保證應用路徑分析不會出錯。因果關系結構中全部為單向鏈條關系、無反饋作用的模型稱為遞歸模型(recursivemodel)。無反饋作用意味著,各內生變量與其原因變量的誤差項之間或各兩個內生變量的誤差項之間必須相互獨立。與遞歸模型相對的另一類模型稱作非遞歸模型(nonrecursivemodel)。一般來說,非遞歸模型相對來說容易判斷,如果一個模型不包括非遞規(guī)模型的特征,它便是遞歸模型。第三十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1036
目錄上頁下頁返回結束
如果一個路徑模型包括以下四種情況,便是非遞歸模型。情況一:模型中任何兩個變量之間存在直接反饋作用,在路徑圖上表示為雙向因果關系。如圖10-3(a)所示。情況二:某變量存在自身反饋作用,即該變量存在自相關,如圖10-3(b)所示。第三十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1037
目錄上頁下頁返回結束
情況三:變量之間雖然沒有直接反饋,但是存在間接反饋作用,即順著某一變量及隨后變量的路徑方向循序前進,經(jīng)過若干變量后,又能返回這一起始變量,如圖10-3(c)所示。第三十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1038
目錄上頁下頁返回結束
情況四:內生變量的誤差項與其他有關項相關,如結果變量的誤差項與其原因項相關(圖10-3(d)),或者不同變量之間的誤差項之間存在相關(圖10-3(e))。第三十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1039
目錄上頁下頁返回結束
使用最小二乘的估計方法要求路徑模型具有一些假設要求和限制,現(xiàn)在總結如下:
(1)首先要求模型中各變量的函數(shù)關系為線性、可加;否則不能采用回歸方法估計路徑系數(shù)。如果處理變量之間的交互作用,把交互項看作一個單獨的變量,此時它與其它變量的函數(shù)關系同樣滿足線性、可加。
(2)模型中各變量均為等間距測度。盡管路徑分析中通常會使用二分數(shù)據(jù)(dichotomiesdata)或者順序數(shù)據(jù)(ordinaldata),然而不能使用超過一個值的虛擬變量,因為這會違反遞歸性要求。第三十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1040
目錄上頁下頁返回結束
(3)每一內生變量的誤差項不得與其前置變量相關,同時也不得與其它內生變量及其誤差項相關。這是對模型遞歸性的要求。另外,模型不考慮外生變量的相關性,即不對外生變量的相關進行分析。(4)模型中的因果關系必須為單向,不得包括各種形式的反饋作用。這同樣是對模型遞歸性的要求。(5)各變量均為可觀測變量,并且各變量的測量不能存在誤差。這兩個弱點在SEM技術中得到了克服,已經(jīng)發(fā)展了一套成熟的處理隱變量和測量誤差的技術。(6)變量間的多重共線性程度不能太高,否則路徑系數(shù)估計值的誤差將會很大。(7)需要有足夠的樣本量。Kline(1998)建議樣本量的個數(shù)應該是需要估計的參數(shù)個數(shù)的10倍(20倍更加理想)。第四十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1041
目錄上頁下頁返回結束
在上述假設下,采用最小二乘法可以很容易求解各個參數(shù)值,見文獻[3],并且可以單獨對其中一個方程求解。上述假設條件用數(shù)學符號很容易說明,但有些抽象。任何一個(遞歸)路徑模型都可以用結構方程組表示,假設和分別為模型中的內生和外生可觀側變量向量;是的參系數(shù)矩陣,可以證明,若為路徑遞歸模型,則總可以寫為上三角矩陣。是的參系數(shù)矩陣,e為內生變量所對應的誤差項,滿足期望為零,兩兩不相關。則該路徑模型的結構方程組為:和
第四十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1042
目錄上頁下頁返回結束
作為本節(jié)結束,我們需要提醒讀者:一個好的路徑圖并不意味著一定包含有盡可能多的箭頭;相反,統(tǒng)計學上最感興趣的情形是:應該尋找盡可能少的箭頭去聯(lián)結盡可能少的變量,而這時的路徑圖又能對所代表的樣本擬合得好,即所謂模型簡約性(parsimony),在后面有關模型擬合度的檢驗中我們對這段話會有更深的體會。第四十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1043
目錄上頁下頁返回結束
路徑分析技術是從分解相關系數(shù)發(fā)展出來的,因此分解相關系數(shù)在路徑分析中帶有一般性意義,并且是路徑分析中很重要的一部分。通過對原因變量和結果變量的相關系數(shù)的分解,我們可以很清楚地看出造成相關關系的各種原因。有時也涉及到對回歸系數(shù)的分解,我們這里不進行介紹。下面以一例子說明相關系數(shù)的分解過程。圖10-4為一假想的六個變量的路徑圖:A,B,C為三個兩兩相關的外生變量,A,B和殘差項e4共同決定D,B,C,D和殘差項e5決定E,最后,D,E和殘差項e6影響最終結果變量F,共具有三層的因果關系。對應于路徑圖,我們寫出結構方程組:第四十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1044
目錄上頁下頁返回結束
第四十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1045
目錄上頁下頁返回結束
外生變量的相關關系在圖中體現(xiàn),內生變量的誤差項之間獨立,內生變量的誤差項與其前置變量之間獨立。在式(10.3)中,如果路徑系數(shù)p14,p24已知,則D的方差可以從上式計算出的大小。很容易看出,對其它的表達式存在同樣的結果,這里只是提醒讀者,殘差項的路徑系數(shù)由其它路徑系數(shù)決定,并且該內生變量與其誤差項的相關系數(shù)即為誤差項的路徑系數(shù);另外,殘差項的路徑系數(shù)可由多元回歸的決定系數(shù)計算出,它們之間的關系為:
,詳細的證明可參考[8]。第四十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1046
目錄上頁下頁返回結束
下面考慮相關系數(shù)的分解,首先分解A,D之間的相關系數(shù),由于各變量均經(jīng)過標準化處理,所以A,D的相關系數(shù)
等于A,D乘積的期望值。即(變量D用式10.3代替)第四十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1047
目錄上頁下頁返回結束
第四十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1048
目錄上頁下頁返回結束
第四十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1049
目錄上頁下頁返回結束
第四十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1050
目錄上頁下頁返回結束
第五十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1051
目錄上頁下頁返回結束
第五十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1052
目錄上頁下頁返回結束
通過上面對相關系數(shù)的分解,我們可以總結出,相關系數(shù)的分解可能產(chǎn)生四種類型的組成部分:(1)直接作用;(2)間接作用;(3)由于原因變量相關而產(chǎn)生的未析部分;(4)由于共同原因的存在而產(chǎn)生的偽相關部分。路徑系數(shù)分解的結果一般通過報表的形式把各種作用展現(xiàn)出來,第五節(jié)的實例分析會給讀者提供一個報表的形式。然而,如果按照上面的步驟,相關系數(shù)的分解將是非常繁瑣的。Wright提供了從路徑圖直接分解的規(guī)則。Wright認為,對于一個遞歸性的路徑模型,任何兩個變量的相關系數(shù)都可以表示成連接這兩點之間的所有復合路徑之和;而這個復合路徑是按下述三個規(guī)則選取的(Wright規(guī)則):第五十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1053
目錄上頁下頁返回結束
(1)這個復合路徑?jīng)]有閉合環(huán)路;(2)在這個復合路徑中的箭頭取向是不可有“先向前,再向后”,也就是說該路徑鏈上不止兩個箭頭時,要“先向后”盡可能多的次數(shù),“再向前”盡可能少的次數(shù)。(3)對于有多個雙箭頭的鏈,只可以取最遠距離的一個雙箭頭。即一條路徑中不可以包含兩個雙向箭頭。結合Wright規(guī)則,在圖10-5(a)中,若計算D和E的相關系數(shù),路徑DCE是合理的,而路徑DCABCE則不可以(規(guī)則(1));在圖10-5(b)中,若計算B和C的相關系數(shù),路徑BAC是合理的,而路徑BDC則不可以(規(guī)則(2));在圖10-5(c)中,若計算D和F的相關系數(shù),路徑DACF是合理的,而路徑DABCF則不可以(規(guī)則(3))。第五十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1054
目錄上頁下頁返回結束
第五十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1055
目錄上頁下頁返回結束
第五十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1056
目錄上頁下頁返回結束
第五十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1057
目錄上頁下頁返回結束
路徑分析流程圖及SPSS指令分析流程圖進行路徑分析所使用的SPSS指令第五十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1058
目錄上頁下頁返回結束
分析流程圖第五十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1059
目錄上頁下頁返回結束
進行路徑分析所使用的SPSS指令下面以SPSSAmos模塊為例說明路徑分析的實現(xiàn)過程;然而根據(jù)上面的介紹,路徑分析也可以利用回歸分析手工完成。在AmosGraphics模塊中,首先需要選擇數(shù)據(jù)文件,在File菜單下,選擇“DataFiles”給出需要進行分析的文件名。然后繪出路徑分析圖:在Diagram菜單下,選擇“DrawObserved”繪制觀測變量;選擇“DrawUnobserved”繪制不可觀測變量,在路徑分析中是殘差項;選擇“DrawPath”繪制兩變量的因果關系;選擇“DrawCovariance”繪制兩變量的相關關系;然后對繪出的各個變量指定變量名。第五十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1060
目錄上頁下頁返回結束
進行路徑分析所使用的SPSS指令接著要指定殘差項方差為1,選定某個殘差項后,擊右鍵,選擇“ObjectProperties”后,在“Parameteres”下設定方差為1。并在菜單下View/Set下選擇“AnalysisProperties”,在“Estimation”一項中選擇估計方法為“Scale-freeleastsquare”,關閉該窗口。最后就可以點擊Model-Fit菜單下的選項“CalculateEstimates”計算路徑系數(shù)了??梢酝ㄟ^三種方式察看結果:文字法,表格法和圖表法。第六十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1061
目錄上頁下頁返回結束
案例分析從對路徑模型的介紹可以知道,路徑系數(shù)的估計并不復雜,用普通的多元回歸方法就可實現(xiàn)。SPSS軟件是一個可以選擇的軟件,然而路徑分析又不全部是靠軟件實現(xiàn)的,變量相關系數(shù)的分解,對模型的調試和檢驗通過手工就可完成。下面以具體實例說明路徑分析的整個實現(xiàn)過程。第六十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1062
目錄上頁下頁返回結束
模型設定【例10.1】我們采用SPSS10.0自帶的數(shù)據(jù)文件Employeedata進行路徑分析。該數(shù)據(jù)共有474個觀測值,473個有效,標號為434的出生日期缺失,在下面的分析中,不考慮該樣品;該數(shù)據(jù)包含10個變量:標號(id)、性別(gender)、出生日期(bdate,DateofBirth)、受教育水平(educ,EducationalLevel)、工作類別(jobcat,EmploymentCategory)、當前工資(salary,CurrentSalary)、初始工資(salbegin,BeginningSalary)、已經(jīng)工作時間(jobtime,MonthssinceHire)、以前的工作經(jīng)驗(preexp,PreviousExperience)、是否是少數(shù)民族(minority)。性別為屬性變量,用“f”表示女性,“m”表示男性;受教育水平使用受教育的年數(shù)衡量;工作類別分為三類:公務員(“1”),監(jiān)督人(“2”)以及經(jīng)理人員(“3”)。第六十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1063
目錄上頁下頁返回結束
模型設定當前工資和初始工資以實際額為準。已經(jīng)工作的時間和以前的工作經(jīng)驗均以發(fā)生的月份衡量;是否是少數(shù)民族為0,1變量,1表示是少數(shù)民族,0表示非少數(shù)民族。假設數(shù)據(jù)的采集時間為1997,則用1997減出生日期的年份數(shù)作為年齡(age)的衡量指標。例如若某人在1952年出生,則年齡的測度為1997-1952=45。表10-2為樣本相關系數(shù)矩陣。第六十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1064
目錄上頁下頁返回結束
模型設定對標號、性別、民族不進行區(qū)分,關注其余7個變量之間的因果關系。表10-2為這7個變量的樣本相關系數(shù)。根據(jù)時間和邏輯順序,我們得到幾條因果路徑:受教育水平影響初始工資和當前工資,因為大量統(tǒng)計結果表明,個人受教育的水平越高,所獲得工資也越高;同時也認為,一個人受教育水平越高,以前的工作經(jīng)驗越多,他從事的工作類別應該越高;另外,初始工資會影響工作類別,在相關系數(shù)矩陣中,我們已經(jīng)看到二者的相關系數(shù)較大;年齡影響已經(jīng)工作的時間以及以前的工作經(jīng)驗,因為年齡越大,(在本職位)已經(jīng)工作的時間或者以前的工作經(jīng)驗會越長;其次,年齡和受教育水平應該存在負相關,這里不關注二者的因果關系,僅僅簡單假設二者相關。第六十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1065
目錄上頁下頁返回結束
模型設定最后,初始工資、工作類別、已經(jīng)工作的時間以及以前的工作經(jīng)驗都影響當前工資,一般來說,初始工資越高,工作類別越高(按1,2,3的順序),以前工作的經(jīng)驗越多,時間越長,當前的工資越高,這些變量間的均應有正的因果關系。根據(jù)這些邏輯理由,我們假設的路徑模型如圖10-8所示,不妨稱此模型為模型1。很顯然,模型1為遞歸的路徑模型,各外生變量不存在測量誤差,假設各路徑的因果關系均為線性、可加,并進一步假設各內生變量之間不存在相關關系。第六十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1066
目錄上頁下頁返回結束
模型設定第六十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1067
目錄上頁下頁返回結束
路徑系數(shù)估計采用Amos軟件對圖10-8進行估計,輸出結果如圖10-9所示。第六十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1068
目錄上頁下頁返回結束
路徑系數(shù)估計根據(jù)圖10-9,我們發(fā)現(xiàn)年齡對已經(jīng)工作時間的路徑系數(shù)僅為0.003,為0.001,方程擬合效果不好;同時,以前工作經(jīng)驗對當前工資的路徑系數(shù)也很小。考慮刪除上面的兩條路徑以及殘差項e6,并重新估計模型,結果如圖10-10。第六十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/10中國人民大學六西格瑪質量管理研究中心69
目錄上頁下頁返回結束
模型的調試和檢驗假設圖10-9對應的模型是基準模型,圖10-10對應的模型為待檢模型。下面分別計算基準模型和待檢模型的擬合指數(shù)和,對模型進行調試:
第六十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1070
目錄上頁下頁返回結束
模型的調試和檢驗
從而W統(tǒng)計量為:若基準模型正確,W服從自由度為2的分布。這里W的p值為0.1891,統(tǒng)計不顯著。可以認為圖10-10對應的模型正確。第七十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1071
目錄上頁下頁返回結束
路徑系數(shù)分解
表10-3是Amos軟件總效應的分解報表:表10-3路徑系數(shù)的分解報表
原因變量
結果變量總影響直接影響間接影響受教育水平初始工資0.5700.5700.000工作類別0.5300.1290.401當前工資0.6580.1960.462年齡以前工作經(jīng)驗0.8010.8010.000工作類別0.1230.0000.123當前工資0.0220.0000.022已經(jīng)工作時間當前工資0.0840.0840.000以前工作經(jīng)驗工作類別0.1540.1540.000當前工資0.0280.0000.028初始工資工作類別0.7050.7050.000當前工資0.7690.6400.129工作類別當前工資0.1830.1830.000第七十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1072
目錄上頁下頁返回結束
路徑系數(shù)分解
可以看出,受教育水平對當前工資的影響主要是通過工作類別和初始工資傳遞的間接影響,教育水平對初始工資(工作)具有很大的影響作用,但隨后的(直接)影響便較弱(0.196),這與我們的常識相一致,初始工作可能取決于學歷,然而以后主要看工作經(jīng)歷及個人能力了。年齡對當前工資的影響主要通過工作類別和以前工作經(jīng)驗的傳遞完成,它對當前工資的影響為正。其它的分析類似,讀者不妨自己動手分析。
下面再舉一個例子。第七十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1073
目錄上頁下頁返回結束
路徑系數(shù)分解
【例10.2】一家大型的商業(yè)銀行在多個地區(qū)設有分行,其業(yè)務主要是進行基礎設施建設、國家重點項目建設、固定資產(chǎn)投資等項目的貸款。今年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務的發(fā)展帶來較大的壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業(yè)務的有關數(shù)據(jù)做些定量分析,以便找出控制不量貸款的辦法。圖10-11就是該銀行所屬的25家分行2002年的有關業(yè)務數(shù)據(jù)。第七十三頁,共一百八十六頁,編輯于2023年,星期三圖10.11商業(yè)銀行所屬的25家分行2002年的有關業(yè)務數(shù)據(jù)2023/6/1074
目錄上頁下頁返回結束
第七十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1075
目錄上頁下頁返回結束
路徑系數(shù)分解
注:不良貸款(y)、貸款余額(x1)、累計應收貸款(x2)、貸款項目個數(shù)(x3)和固定資產(chǎn)投資額(x4)根據(jù)經(jīng)驗可知,各項貸款余額越高則不良貸款越高,但同時,各項貸款余額也會受其他變量的影響,因此綜合考慮之下,本例應該建立如下的路徑分析模型:第七十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1076
目錄上頁下頁返回結束
路徑系數(shù)分解
下面考慮對該模型加以擬合,由于整個模型是一個遞歸模型,可以在SPSS中使用分別擬合回歸方程的方法來實現(xiàn)對模型中各參數(shù)的估計,首先對各項貸款余額回歸方程進行估計,結果見表10-4和10-5:表10-4第七十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1077
目錄上頁下頁返回結束
路徑系數(shù)分解
表10-5可見,應收貸款、貸款項目、固定資產(chǎn)均對各項貸款余額有影響。應收貸款、貸款項目則各項貸款余額越高。下面對第二個方程進行估計,參數(shù)結果見表10-6和表10-7:第七十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1078
目錄上頁下頁返回結束
路徑系數(shù)分解
表10-6表10-7第七十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1079
目錄上頁下頁返回結束
路徑系數(shù)分解
固定資產(chǎn)和各項貸款對不良貸款有影響,而應收貸款、貸款項目對其影響不顯著。從上面分析可知,如果只是擬合第二個方程,則所得結果其實就是一個簡單的多重回歸方程結果,而且可知自變量間存在共線性。顯然,對于不良貸款而言,使用路徑分析并不會使得模型對最終結果變量預測的更加精確。但通過對自變量間復雜關聯(lián)的刻畫,路徑分析模型可以很精確地估計出每一個自變量究竟是通過那些方式來作用于最終因變量的,從而使得研究者對問題的理解更加深入和全面。通過上面的分析,可以將上述模型加以簡化,去除那些無統(tǒng)計意義的變量后重新加以擬合,分析結果見表10-8和表10-9:第七十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1080
目錄上頁下頁返回結束
路徑系數(shù)分解表10-8表10-9第八十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1081
目錄上頁下頁返回結束
路徑系數(shù)分解可見方程的決定系數(shù)基本未變,自變量均有統(tǒng)計學意義。顯然,化簡后的路徑分析模型對數(shù)據(jù)的解釋程度與前一個模型相比無顯著差別,但更加簡潔。本例所擬合的路徑分析模型可以使用標準化系數(shù)繪制出路徑如圖10-12.圖10-12第八十一頁,共一百八十六頁,編輯于2023年,星期三結構方程模型第八十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1083目錄上頁下頁返回結束結構方程模型結構方程模型SEM(structuralequationmodeling)是近二十年應用統(tǒng)計學領域中發(fā)展最為迅速的一個分支。它是一種實證分析模型,通過尋找變量間內在的結構關系,去驗證某種結構關系或模型的假設是否合理,模型是否正確,并且如果模型存在問題,可以指出如何加以修改。結構方程模型的另一大特點是可以對隱變量(latentvariables)進行分析。多元回歸分析、因子分析和路徑分析等都可看成是結構方程模型的一種特例。現(xiàn)實生活中,有許多變量諸如健康、優(yōu)秀、樂觀、智力、滿意、公正等概念雖然是客觀存在的,但由于人的認識水平或事物本身的抽象性、復雜性等原因,我們是無法直接測量的,我們稱這樣的變量為隱變量。結構方程可以通過一些可觀測變量對這些隱變量的特征及其相互之間的關系進行描述,因此,有時也稱結構方程模型為隱變量分析模型。第八十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1084目錄上頁下頁返回結束結構方程模型結構方程模型的應用始見于20世紀60年代發(fā)表的論文中,1987年Loehlin用路徑分析模型和結構方程模型對隱變量模型作了出色的介紹,兩年之后Bollen提出了處理測量誤差模型的更專門化的統(tǒng)計辦法。到了90年代,結構方程模型得到了廣泛的應用。目前,結構方程模型已發(fā)展成內容非常豐富的一個重要領域,在此,僅介紹結構方程模型一些基本內容,有興趣的讀者可以進一步參閱相關書籍。第八十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/10中國人民大學六西格瑪質量管理研究中心85目錄上頁下頁返回結束結構方程模型的基本思想結構方程模型是反映隱變量和顯變量的一組方程,其目的是通過顯變量的測量推斷隱變量,并對假設模型的正確性進行檢驗。結構方程模型是模型驗證技術。即利用結構方程模型分析的過程實際上是對假定模型的驗證過程。對于某個領域的專業(yè)人員根據(jù)本領域的知識或常識建立的反映結構關系的模型,由于專業(yè)人員的認識水平和各種原因的限制,這一模型未必是客觀現(xiàn)實的反映,有可能存在偏差和主觀性,如何發(fā)現(xiàn)模型的問題,如何根據(jù)分析結果進一步修正模型,這些正是結構方程模型可以處理的問題。第八十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1086目錄上頁下頁返回結束具體來說,結構方程模型分析的過程是:在設定結構模型的基礎上,為證實模型的準確性,首先要判斷這些方程是否可識別模型,對于可識別模型,通過收集顯變量的數(shù)據(jù),利用最大似然估計(maximumlikelihood)或廣義最小二乘估計(generalizedleastsquares)等估計方法對未知參數(shù)進行估計。對于模型的結果,需要對模型與數(shù)據(jù)之間是否擬合進行評價。如果,模型與數(shù)據(jù)擬合得不好,就需要對模型進行修正,重新設定模型,一個擬合較好的模型往往需要反復試驗多次。在進行模型估計之前,研究者需要根據(jù)專業(yè)知識或經(jīng)驗設定假設的初始模型。而結構方程模型的主要用途即為確定該假定模型是否合理。第八十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1087目錄上頁下頁返回結束結構方程模型通常是借助路徑圖將初始模型描述出來,對于復雜的模型尤其如此。這里從與結構方程結合的角度,對上一章的內容簡單回顧一下,并在此基礎上看怎樣得出結構方程模型。路徑圖中的變量可以是不同的類型,按能否被直接測量,路徑圖中的變量可以分為顯變量(manifestvariable)和隱變量(latentvariable)。通常前者是可以直接測量的,在圖中用方框來標識;而后者雖然是客觀存在的,但由于人的認識水平或事物本身的抽象性、復雜性等原因,我們無法直接測量,通常用橢圓形框來標識。
第八十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1088目錄上頁下頁返回結束按照變量之間的關系,又可分為外生變量(exogenousvariable)和內生變量(endogenousvariable),內生變量是由隱變量決定的變量,外生變量是由顯變量決定的變量。變量之間的關系用線條表示,可以是直接作用也可以是間接作用,當二者之間有直接聯(lián)線時,稱為直接作用。如果變量之間沒有直接聯(lián)線則是假設變量之間沒有直接聯(lián)系,但可以通過其他變量發(fā)生聯(lián)系,稱之為間接聯(lián)系。線條既可以加單箭頭,也可以加雙箭頭。單箭頭表示存在因果關系,雙箭頭則表示具有相關關系。
第八十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1089目錄上頁下頁返回結束下面用一個具體的事例來看一下路徑圖,然后在此基礎上寫出結構方程模型。這是Wheatonetal在1977年給出的一個廣為人知的例子。這是一個測度“神精錯亂平穩(wěn)性”的例子,在他給出的數(shù)據(jù)集中使用了Illinois農村地區(qū)932個人的調查數(shù)據(jù),調查了六個變量:y1:1967年的異常程度;y2:1967年的軟弱程度;y3:1971年的異常程度;y4:1971年的軟弱程度;x1:受教育情況(上學年數(shù));x2:當?shù)氐纳鐣?jīng)濟指數(shù)。第八十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/1090目錄上頁下頁返回結束第九十頁,共一百八十六頁,編輯于2023年,星期三2023/6/1091目錄上頁下頁返回結束第九十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/1092目錄上頁下頁返回結束路徑圖實際上提供了一個假設模型,它體現(xiàn)了隱變量與隱變量之間、隱變量與顯變量之間(包括內生隱變量與顯變量和外生隱變量與顯變量之間)可能存在的關系,而且,這種關系的具體程度,可以通過路徑系數(shù)來反映。在這些變量中,顯變量是可以觀測的,而每個隱變量都對應著幾個顯變量,如上圖中的隱變量“社會經(jīng)濟狀況”就對應著兩個顯變量“受教育情況”和“社會經(jīng)濟指數(shù)”。給出路徑圖后,我們就可以對這些假設的結構關系,利用顯變量的數(shù)據(jù),通過建立結構方程模型,進一步檢驗模型假設的合理性并確定模型中的路徑系數(shù)。第九十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/1093目錄上頁下頁返回結束結構方程模型的結構結構方程模型一般由測量方程(MeasurementEquation)和結構方程(StructuralEquation)兩部分構成。測量方程描述潛變量與指標之間的關系;結構方程則反映潛變量之間的關系。指標含有隨機誤差和系統(tǒng)誤差。前者指測量上的不準確性行為,后者反映指標同時測量潛變量以外的特性。隨機誤差和系統(tǒng)誤差統(tǒng)稱為測量誤差,但潛變量則不含這些誤差。第九十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/1094目錄上頁下頁返回結束第九十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/1095目錄上頁下頁返回結束第九十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/1096目錄上頁下頁返回結束第九十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/1097目錄上頁下頁返回結束結構方程模型的優(yōu)點(1)能同時處理多個因變量。結構方程模型可同時考慮并處理多個因變量。而回歸分析中,只能處理一個因變量,如果有多個因變量需要處理,則需要分別計算,這樣在計算一個因變量時,就忽略了其他因變量的存在及影響。第九十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/1098目錄上頁下頁返回結束(2)允許自變量和因變量均包含測量誤差。從測量方程中可看到,很多變量如學業(yè)成績、社會經(jīng)濟地位等潛變量的觀察值不能用單一指標來測量,往往還包含了大量的測量誤差。從結構方程模型的特點看出:結構方程分析允許自變量和因變量均含有測量誤差。而回歸分析只允許因變量存在測量誤差,假定自變量沒有誤差。(3)估計整個模型的擬和程度。在傳統(tǒng)的路徑分析中,我們只估計每條路徑變量間關系得強弱。在結構方程分析中,可以通過結構方程軟件LISREL計算出的多個擬和參數(shù)值,可以判斷不同模型對同一個樣本數(shù)據(jù)的整體擬和程度,從中選取最精確的模型描述樣本數(shù)據(jù)體呈現(xiàn)的特征。第九十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/1099目錄上頁下頁返回結束結構方程模型的構建
由上一節(jié)介紹的結構方程模型的結構模式可以看出,結構方程模型一般由測量方程(MeasurementEquation)和結構方程(StructuralEquation)兩部分構成。要很好完成這兩部分的構造,關鍵是利用結構方程模型中分析變量(包括顯變量和隱變量)的關系,根據(jù)相關領域的專業(yè)知識和研究目的,構建出理論模型,然后用測得的數(shù)據(jù)去驗證這個理論模型的合理性。下面以一經(jīng)典實例來說明模型的建立過程。第九十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/10100目錄上頁下頁返回結束第一百頁,共一百八十六頁,編輯于2023年,星期三2023/6/10101目錄上頁下頁返回結束結構方程模型的構建
(1)結構方程的建立根據(jù)模型的假設條件可以建立反映隱變間關系的路徑圖,見圖11-2。第一百零一頁,共一百八十六頁,編輯于2023年,星期三2023/6/10102目錄上頁下頁返回結束結構方程模型的構建
第一百零二頁,共一百八十六頁,編輯于2023年,星期三2023/6/10103目錄上頁下頁返回結束結構方程模型的構建
(2)測量方程的建立。根據(jù)模型的假設條件可以建立反映顯變量和隱變量關系的路徑圖,如圖11-3、圖11-4、圖11-5所示。第一百零三頁,共一百八十六頁,編輯于2023年,星期三2023/6/10104目錄上頁下頁返回結束結構方程模型的構建
第一百零四頁,共一百八十六頁,編輯于2023年,星期三2023/6/10105目錄上頁下頁返回結束結構方程模型的構建
第一百零五頁,共一百八十六頁,編輯于2023年,星期三2023/6/10106目錄上頁下頁返回結束結構方程模型的構建
至此,測量方程和結構方程都得到了建立,整個結構方程模型也得以建立。當然,初始建立的理論模型有可能不是較理想模型,需要在數(shù)據(jù)的擬合過程中反復修改,直到建立較理想模型。第一百零六頁,共一百八十六頁,編輯于2023年,星期三2023/6/10107目錄上頁下頁返回結束結構方程模型的估計
第一百零七頁,共一百八十六頁,編輯于2023年,星期三2023/6/10108目錄上頁下頁返回結束結構方程模型的估計最常見的估計方法有沒有加權的最小二乘法(ULS)、廣義最小二乘法(GLS)和最大似然估計(ML)。每種計算方法都是要找到參數(shù)估計使得擬合損失函數(shù)達到最小。擬合損失函數(shù)是度量觀測的樣本協(xié)差陣和參數(shù)估計給出的預測協(xié)差陣之間差異程度的函數(shù)。ML方法對于多數(shù)應用問題特別是考慮到統(tǒng)計問題時是首選的方法。GLS通常得出與ML方法類似的結論。ML和GLS這兩種方法在不考慮協(xié)差陣的尺度時是適用的,而且需要顯變量是連續(xù)的和多元正態(tài)的。這是因為變量的偏態(tài)或高峰度會導致很差的估計及其不正確的標準誤和較高的卡方值。ULS方法適用于僅當這些變量是可比較的尺度上被測量時得到的協(xié)差陣,否則ULS方法使用相關陣。若預測的或觀測的協(xié)差陣是奇異的,則不能使用ML和GLS這兩種方法,這時要么去掉線性相關變量,要么用ULS方法。第一百零八頁,共一百八十六頁,編輯于2023年,星期三2023/6/10109目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
目前,國際上一些著名的軟件公司都推出了利用結構方程模型進行統(tǒng)計分析的計算機應用軟件,例如瑞典阿帕薩拉大學(TheUniversityofUppsala,Sweden)的喬瑞斯考格(KarlG.Joreskog)和索爾波姆(DagSorbom)專門為進行結構方程模型分析所編寫的LISREL軟件、以及我們所熟悉的SAS軟件中的CALIS和SPSS的AMOS等等,這樣,我們就可以很方便的運用結構方程模型來解決各領域的問題。根據(jù)我國統(tǒng)計軟件的應用情況,在這里主要對國內比較流行SAS軟件中的CALIS和LISREL軟件進行介紹。第一百零九頁,共一百八十六頁,編輯于2023年,星期三2023/6/10110目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
11.5.1結構方程模型分析流程根據(jù)前面關于結構方程模型分析過程的分析,利用結構方程模型進行分析的結構流程圖如下,這是我們進行計算機實現(xiàn)的基礎:第一百一十頁,共一百八十六頁,編輯于2023年,星期三2023/6/10111目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
從這一流程圖可以看出,在利用結構方程模型進行分析時,首先要對分析的實際問題進行模型設定,這一模型建立的好壞直接影響進一步的分析。要想建立一個好的模型往往需要研究人員對研究對象有比較透徹的了解,弄清指標之間的關系,為了使模型的建立更直觀,并進一步寫出結構方程模型,往往借助路徑圖;接下來,就需要對建立的模型進行模式識別,看建立的模型屬于恰好識別結構模型、識別不足結構模型還是過渡識別結構模型,只有可識別的模型才可以進入下一個環(huán)節(jié);第一百一十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/10112目錄上頁下頁返回結束§11.5結構方程模型的計算機實現(xiàn)
對于可識別模型就可以利用下面將要介紹的有關軟件估計結構方程模型中的有關參數(shù)并給出有關的檢驗參數(shù);利用這些參數(shù),就可以對模型進行評價,根據(jù)有關指標的標準,評價模型是否需要進一步修正;如果模型不需要修正,就可以對模型進行應用。對于需要修正的模型,需要回到模型設定階段,再按上面的過程逐步進行,直到模型不需要修正、可以應用為止。第一百一十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/10113目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
SAS中的CALIS過程簡介SAS/STAT軟件6.06版本以后新增加了線性結構方程組的協(xié)方差過程CALIS(covarianceanalysisoflinearstructuralequation),該過程可以通過協(xié)方差結構分析,來估計參數(shù)并檢驗結構方程的正確性。在SAS的CALIS過程中,又提供了多種模型來建立結構方程模型,如RAM模型、LINEQS模型、LISREL模型等,在此介紹RAM模型,其他模型請參看有關書籍。
第一百一十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/10114目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
1、路徑圖的描述CALIS中的RAM語句可以方便地描述路徑圖,假定有n個顯變量,按它們在SAS數(shù)據(jù)集中的順序用整數(shù)1,2,3,…,n編號。每個箭頭便可由路徑圖中它所連接的兩個變量的編號所確認,RAM語句包括了路徑圖中所有箭頭的說明,說明之間用逗號隔開,每一說明項包括3或4個數(shù)字或可選擇的一個名字,順序如下:第一百一十四頁,共一百八十六頁,編輯于2023年,星期三2023/6/10115目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
(1)箭頭有幾個;(2)箭頭指向的變量的編號,若是雙箭頭則為任意變量的編號;(3)箭頭出發(fā)的變量的編號,若是雙箭頭則取另一變量的編號;(4)箭頭表示的系數(shù)、(協(xié))方差值;(5)若箭頭代表的參數(shù)待估,這寫上名字,這時前一個數(shù)字表示參數(shù)的初始值。若箭頭代表一個常量,可以省略名字;若用名字,第4個數(shù)字可以省略。第一百一十五頁,共一百八十六頁,編輯于2023年,星期三2023/6/10116目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
2、選擇估計方法CALIS提供三種估計方法,可以用選項METHOD=來規(guī)定:ULS沒有加權的最小二乘估計GLS廣義最小二乘估計ML多元正態(tài)分布的最大似然估計
第一百一十六頁,共一百八十六頁,編輯于2023年,星期三2023/6/10117目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
沒有特別規(guī)定時(即缺省時)估計方法使用METHOD=ML,因為ML對于多數(shù)統(tǒng)計問題是首選的方法。例如,對于前面我們已經(jīng)給出的例子,如果選擇廣義最小二乘法作為估計方法時,可使用語句proccaliscovdata=wheatonmethod=glstech=lmedf=931;其中proccalis是調用SAS中的CALIS過程,選項cov要求對協(xié)方差陣進行分析,沒有cov選項時則計算和分析相關陣;而data=wheaton是調用我們分析所用的數(shù)據(jù)庫(注:這是SAS自帶的數(shù)據(jù)庫);選項tech=lm代表的是使用Levenberg-Marquandt或Newton-Raphson的最優(yōu)化方法,這里使用的是后者;選項edf=931指明了自由度的個數(shù),即931個樣本數(shù)據(jù)。
第一百一十七頁,共一百八十六頁,編輯于2023年,星期三2023/6/10118目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
根據(jù)這些規(guī)定,表11-1的語句給出了上例中“神經(jīng)錯亂”數(shù)據(jù)的RAM結構模型(注意表11-1中第五列給出字母與圖11-1中稍有不同)。其中Vnames1F1-F3,2E1-E6D1-D3;給出了隱變量和誤差變量的名字。拿ram語句的第一行來說明路徑圖的描述,即該箭頭為單箭頭,從變量7出發(fā),指向變量1,箭頭表示的系數(shù)值為1。第一百一十八頁,共一百八十六頁,編輯于2023年,星期三2023/6/10119目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
通過運行上面的程序,輸出結果11-1(這里僅給出了檢驗結果,讀者運行時還會看到反映變量關系的其他結果,在此不一一列出),可以通過這一結果對模型的正確性進行判斷。第一百一十九頁,共一百八十六頁,編輯于2023年,星期三2023/6/10120目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
LISREL軟件簡介LISREL(linearstructuralrelations)是專門為進行結構方程分析而編寫的統(tǒng)計分析軟件。與SAS軟件中的CALIS有所不同的是,LISREL的路徑圖可以在輸出結果中直觀給出,并能夠在圖形窗口進行編輯和修改。LISREL能夠在圖形窗口進行編輯和修改路徑圖。用光標點擊命令行的pathdiagram或相應的圖標,即進入圖形窗口。在圖形窗口命令行點擊model,可以選擇顯示不同的圖形。對模板圖形進行修改和變動,可以得到所需的路徑圖。圖形窗口命令行的其他命令的用途分別是:exit退出該窗口,kind調出其他統(tǒng)計結果以便對路徑圖進行修改,options修改統(tǒng)計數(shù)值得小數(shù)位顯示長度,print打印路徑圖,zoom對路徑圖進行放大和縮小,re-estimate是根據(jù)統(tǒng)計分析結果對路徑圖進行修改之后再次運行估計程序。第一百二十頁,共一百八十六頁,編輯于2023年,星期三2023/6/10121目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
首先,需要編寫并運行程序命令。LISREL程序包含一子程序PRELIS,該子程序對結構方程模型數(shù)據(jù)進行預處理。該程序包括多個指令,指示原始數(shù)據(jù)的出處以及變量信息和結果的存入。表11-2以程序的形式簡略的給出了PRELIS的基本指令。第一百二十一頁,共一百八十六頁,編輯于2023年,星期三2023/6/10122目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
原始數(shù)據(jù)經(jīng)過預處理可以得到其協(xié)方差矩陣。根據(jù)協(xié)方差矩陣開始編寫LISREL程序。如表11-3所示。第一百二十二頁,共一百八十六頁,編輯于2023年,星期三2023/6/10123目錄上頁下頁返回結束§11.5結構方程模型的計算機實現(xiàn)
第一百二十三頁,共一百八十六頁,編輯于2023年,星期三2023/6/10124目錄上頁下頁返回結束結構方程模型的計算機實現(xiàn)
LISREL能夠提供結果路徑圖并且能夠在圖形窗口進行編輯和修改路徑圖。用光標點擊命令行的pathdiagram或相應的圖標,即進入圖形窗口。在圖形窗口命令行點擊model,可以選擇
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滬教新版九年級地理上冊階段測試試卷
- 中小學生校外培訓服務合同
- 二零二五年海南制造業(yè)勞動合同標準范本3篇
- 2025年新世紀版七年級數(shù)學下冊月考試卷含答案
- 自動化生產(chǎn)飼料行業(yè)實習報告
- 2025年式樣:地下車位租賃合同2篇
- 個人提供公司2024年度財務咨詢服務合同3篇
- 2025年中圖版五年級語文上冊月考試卷含答案
- 新蘇教版一年級數(shù)學下冊第七單元第2課時《觀察物體(2)》教案
- 2025年新世紀版必修1地理上冊階段測試試卷
- Unity3D游戲開發(fā)PPT完整全套教學課件
- 玻璃安裝應急預案
- 道德與法治中考一輪總復習課件 課時8 走向未來的少年 (九下第三單元)
- 五十音圖+あ行+課件【高效備課精研+知識精講提升】 初中日語人教版第一冊
- 工程影像記錄表
- 責任成本分析模板
- 醫(yī)療安全隱患排查登記表
- 現(xiàn)場制氮作業(yè)方案及技術措施
- JJG(建材) 107-1999 透氣法比表面積儀檢定規(guī)程-(高清現(xiàn)行)
- 員工入職登記表(標準模版)
- 柴油發(fā)電機施工方案33709
評論
0/150
提交評論