版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
結(jié)構(gòu)方程模型之遺漏值鄭中平翁儷禎國立臺灣大學(xué)心理學(xué)系實徵研究經(jīng)常遭遇資料遺漏,本研究即在探討資料遺漏機制為潛在變項組型混合模型時,結(jié)構(gòu)方程模型的最大概似估計,並利用模擬資料為範例比較其與常用遺漏值處理法的差異。潛在變項組型混合模型為組型混合模型的延伸,此模型假設(shè)觀察變項的遺漏組型反映潛在變項之類別,而非外顯類別,且各類別可有相異的結(jié)構(gòu)方程模型。本研究建議以MonteCarloEM算則估計當結(jié)構(gòu)方程模型的資料遺漏機制符合此模式時之參數(shù),並以模擬資料瞭解其與不同遺漏值處理法表現(xiàn)之差異。結(jié)果顯示,本研究建議的方法對因素負載量與潛在類別比率等參數(shù)之估計良好。關(guān)鍵詞:非隨機遺漏、組型混合模型、結(jié)構(gòu)方程模型、最大概似法、潛在變項#通訊作者:翁儷禎臺北市羅斯福路四段一號臺灣大學(xué)心理系(電子郵箱:jweng@.tw)調(diào)查研究需透過收集實徵資料以瞭解研究對象,但有時研究者除了對問題反應(yīng)有興趣外,亦期待能深入探討多個測量變項間的相互關(guān)係,此時「結(jié)構(gòu)方程模型」structuralequationmodels,簡稱SEM乃為適用方法之一。例如,Newcomb與Bentler(1988)在對青少年進行八年長期追蹤調(diào)查後,即利用該方法探討青少年毒品使用對其早期成年生活各方面的影響。結(jié)構(gòu)方程模型包括研究者無法直接觀察到的潛在變項,早期結(jié)構(gòu)方程模型著重於研究連續(xù)潛在變項,現(xiàn)在已有不少研究拓展到潛在類別變項,本研究即在探討潛在類別影響資料遺漏組型時結(jié)構(gòu)方程模型的參數(shù)估計。組型混合模型Little與Rubin(1987)以及Little(1993)嘗試闡釋遺漏資料產(chǎn)生的機制。當觀察變項的各種遺漏組型分別表示不同類的受試者組群,且觀察變項間的關(guān)係可能因不同組群而異時,Little將此遺漏機制稱為組型混合模型(patternmixturemodel)組型混合模型所以得名係因不同的遺漏組型下形成不同分配,整個資料的邊際分配為有限混合模型(finitemixturemodel),因此稱為「組型混合模型」(Little,1993,1995)。以縱貫性的社會調(diào)查為例,該類研究常因受訪者搬家或?qū)φ蚊舾芯茉L而產(chǎn)生資料遺漏,不同遺漏原因可能造成相異的遺漏組型,同時亦反應(yīng)其社經(jīng)背景,進而影響調(diào)查變項的分配,此等資料遺漏機制即屬組型混合模型。許多遺漏值處理方法無法直接處理組型混合模型下之結(jié)構(gòu)方程模型,Hedeker與Gibbons(1997)將多樣本結(jié)構(gòu)方程模型(multi-sampleSEM)處理遺漏值之分析方式視為組型混合模型遺漏情形下的結(jié)構(gòu)方程模型(例如Lee,1986;Muthen,Kaplan&Hollis,1987)組型混合模型假設(shè)遺漏組型反應(yīng)不同的受訪者類別,而不同類別可能有相異的結(jié)構(gòu)方程模型,因此不同遺漏組型者應(yīng)分開處理。多樣本結(jié)構(gòu)方程模型遺漏值處理法即將每個遺漏組型視為一個群體進行分析,因此可處理組型混合模型遺漏情形下的結(jié)構(gòu)方程模型,然以此方法處理組型混合模型時,組型個數(shù)不能太多。組型混合模型乃針對外顯類別變項討論資料遺漏機制,但此等討論對心理學(xué)研究而言可能不夠充足,而需進一步引進潛在類別變項。我們可從兩個角度瞭解為何需將潛在類別引進遺漏機制模型。首先,可以從「理論構(gòu)念」的角度引入潛在變項。心理學(xué)研究常因理論構(gòu)念無法直接測量,而在理論模型中引進潛在變項以表達理論構(gòu)念(如Everitt,1984;Joreskog&Sorbom,1993)例如,在較長的政治議題問卷上,受訪者可區(qū)分為「敏感受訪者」與「疲勞受訪者」兩類,其中「敏感受訪者」的特點是對敏感議題較易有拒答的傾向,而「疲勞受訪者」產(chǎn)生遺漏資料的原因則為因題目增多產(chǎn)生疲勞以致未填答。兩類受訪者的資料遺漏組型可能恰巧相同,但其資料遺漏的原因卻相異。因此,兩類受訪者無需對應(yīng)特定的資料遺漏組型,遺漏組型僅反應(yīng)受訪者隸屬於某類型的可能性。如果一受訪者在敏感題目上遺漏的機率較高,其他題目遺漏的機率較低,則此受訪者為「敏感受訪者」的機率較高。另一方面,若受訪者在各題的遺漏機率隨著題序增加而升高,則其可能為「疲勞受訪者」。此情形中,受訪者類別為潛在類別,反映研究者之理論概念,遺漏組型不用以界定潛在類別,而視作潛在類別的指標變項(indicators)其次,可以從測量誤差的角度引入潛在變項。當外顯變項有測量誤差時,可引進潛在變項,將外顯變項視為潛在變項與測量誤差之和(例如Griliches,1974),遺漏機制模型中的潛在變項同樣也可以從這個角度來討論。以前述「敏感受訪者」與「疲勞受訪者」為例,兩者在問卷各題產(chǎn)生資料遺漏的機率不同,但仍可能產(chǎn)生相同的遺漏組型,例如一個疲勞受訪者填答問卷時,可能恰巧都漏答敏感題目,因此遺漏組型未必完全決定受訪者之類別,而可能有誤差。將受訪者類別視為潛在分類變項,遺漏組型作為潛在分類的指標變項,可以將誤差考慮在內(nèi)。本研究之目的即在組型混合模型遺漏機制中加入潛在類別變項,以表達潛在類別對遺漏組型的影響,稱之為「潛在變項組型混合模型」(latentvariablepatternmixturemodel),並以最大概似法估計此遺漏機制之結(jié)構(gòu)方程模型參數(shù),最後以模擬資料作為範例,初步評估本研究建議方法之表現(xiàn)。潛在變項組型混合模型遺漏機制的討論常引入遺漏指標變項,以指示外顯變項是否遺漏。假設(shè)有p
個外顯變項,每一外顯變項對應(yīng)一遺漏指標變項。令M為px1的遺漏指標變項向量,M之變項皆為二元變項,值0表示資料遺漏,值1表示資料完整,M之數(shù)值即反應(yīng)了外顯變項的遺漏組型。Mj若Y遺漏jY未遺漏
Mj若Y遺漏jY未遺漏
j1,2,(1)潛在變項組型混合模型假設(shè)遺漏組型反映的是受訪者隸屬各潛在類別的機率而非外顯類別,不同潛在類別可有個別的結(jié)構(gòu)方程模型,而外顯變項與遺漏指標變項皆反映潛在類別。因此,外顯連續(xù)變項與潛在類別變項形成有限混合結(jié)構(gòu)方程模型(finitemixturesSEM),而遺漏指標變項M與潛在類別變項則形成潛在類別模型(潛在類別分析,latentclassanalysis)。有限混合結(jié)構(gòu)方程模型有許多種描述法(例如,Jedidi,Jagpal&Desarbo,1997a,b),本研究以Dolan與vanderMaas(1998)之模型描述:TOC\o"1-5"\h\zY|g=v+Aq+s⑵ggggn=a+G(3)ggggg式(2)表示潛在類別為g時外顯連續(xù)變項與潛在變項的關(guān)係,其中YIg為px1的外顯變項向量,V為pX1的截距向量,n為kx1的潛在變項向量,Aggg為pXk的係數(shù)矩陣,s為pX1的殘差向量。式(3)表示潛在類別為g時潛在g變項間的關(guān)係,其中a為kX1的截距向量,B為kXk的係數(shù)矩陣,G為kXggg1的殘差向量。假設(shè)在給定潛在類別下,外顯變項的條件分配為多元常態(tài)分配,則外顯連續(xù)變項分配為多元常態(tài)有限混合分配。潛在變項組型混合模型的遺漏機制在形式上相當於潛在類別模型,遺漏指標變項間的關(guān)係為潛在類別所造成,若固定潛在類別,則遺漏指標變項間彼此獨立,稱為局部獨立(localindependence,McCutcheon,1987)。在此假設(shè)下,當潛在類別為g時,M組型為m的機率為p(M=mIg)=np(M=mIg)=R九(1一九)—mj(4)jjjgjgj=1j=1其中p(M=mIg)與p(M=mIg)分別表示在給定潛在類別為第g類下,Mjj組型恰為m與第j個二元變項恰為m的機率,九為第g個潛在類別在第j題數(shù)jjg值為1(未遺漏)的機率。各潛在類別下都可能觀察到M為m,因此當有n個c潛在類別時,M組型為m的機率為p(M=m)=為冗*p(M=m11)=為冗*O九m;(1一九)】一m;(5)ttjtjtt=1t=1j=1其中冗為第t個潛在類別佔母體比率。假設(shè)潛在類別數(shù)已知(恰為n),待tc估計參數(shù)包括九與兀,前者為pXn的機率矩陣,表示每個潛在類別在每一題c的遺漏機率,而兀則為nX1維向量,表示各潛在類別比率,其元素和為1。c潛在變項組型混合模型下之結(jié)構(gòu)方程模型可以式(2)、(3)與(5)描述。如果僅考慮外顯連續(xù)變項(Y),包括式(2)與(3),則模型為有限混合結(jié)構(gòu)方程模型。若只考慮外顯二元變項(遺漏指標變項M,式(5)),則為潛在類別模型。潛在變項組型混合模型的結(jié)構(gòu)方程模型形式上可以視為包含潛在類別模型與有限混合結(jié)構(gòu)方程模型,相當於分析變項w,w=(y,M')'。在給定潛在類別時,假設(shè)Y與M局部獨立,且Y為多元常態(tài)分配,則概似函數(shù)為(Bartholomew&Knott,1999;Muthen,2001a):TOC\o"1-5"\h\zL=門KC*f(Y)*f(M),(6)i,t1,ti2,tii=1t=1其中f(Y)=(U2兀)-p*(I力I)—.5*exp(-.5(Y-y)'*力-1*(Y-)),titittitf(M)=rfXMj(1—九)1-MjOtijtjtj=1f()表示潛在類別為t時之多元常態(tài)分配機率密度函數(shù),f()是多元二項1,t2,t分配機率函數(shù)。Muthen(2001b)的第二代結(jié)構(gòu)方程模型描述包含潛在連續(xù)變項與潛在類別的模型,其外顯變項則包括連續(xù)變項與類別變項,並考慮連續(xù)的共變項(covariate),潛在變項組型混合模型下之結(jié)構(gòu)方程模型形式上相當於沒有共變項且有遺漏值時的第二代結(jié)構(gòu)方程模型。本研究擬採MCEM算則(MonteCarloEMalgorithm)推導(dǎo)當遺漏機制為潛在變項組型混合模型時結(jié)構(gòu)方程模型之最大概似估計,以LVPM-ML稱之,完整資料之第二代結(jié)構(gòu)方程模型估計(Muthen,2001a,b)可作為MCEM算則的M步驟。潛在變項組型混合模型的估計:MCEM算則MCEM算則為EM算則的變形。EM算則是一個疊代(iterative)程序,每次疊代分成E步驟(expectationstep)與M步驟(maximizationstep)E步驟推導(dǎo)給定觀察外顯變項下遺漏變項之條件機率密度函數(shù),用以計算在目前參數(shù)估計值下對數(shù)概似函數(shù)之期望值。M步驟則根據(jù)E步驟所得資料求參數(shù)之最大概似估計值,相當於完整資料之最大概似估計(Dempster,Laird,&Rubin,1977;McLachlan&Krishnan,1997)。完整資料的最大概似估計多半較容易或已於過去研究中發(fā)展,因此研究者在分析遺漏資料時,若使用EM算則常僅需考慮E步驟即可,故許多遺漏資料的處理都採用EM算則(McLachlan&Krishnan,1997)本研究潛在變項組型混合模型之結(jié)構(gòu)方程模型估計亦採EM類算則,在推導(dǎo)E步驟後,以Muth6n(2001a,b)之第二代結(jié)構(gòu)方程模型作為M步驟,估計相關(guān)參數(shù)。EM算則E步驟期望值之求取有時牽涉多元積分,致使其分析困難或計算耗時,MCEM算則即可加以改善。MCEM算則以MCE步驟(MonteCarloEstep)取代E步驟,特點在於以模擬方法(MonteCarloMethod)計算E步驟中對數(shù)概似函數(shù)期望值之近似值,亦即藉由產(chǎn)生數(shù)個隨機向量,分別以之填補遺漏值,計算對應(yīng)之對數(shù)概似函數(shù)值,平均後作為對數(shù)概似函數(shù)期望值之估計(例如,Wei&Tanner,1990;Ruud,1991)MCEM算則不牽涉期望值,因此常能避免多元積分運算,是對數(shù)概似函數(shù)期望值難以分析計算時極佳之替代方案(McLachlan&Krishnan,1997)本研究建議之MCEM算則,包含如下步驟:1.MCE步驟:僵件分配:求取條件機率密度函數(shù)。針對每筆具遺漏值資料(假設(shè)為第i筆),在給定觀察值,即給定未遺漏變項(Yy)與遺漏指標變項i,obsi,obs(M=m)下,求取遺漏變項(Y)之分佈。固定潛在類別時,Y與Y形iii,misi,misi,obs成多元常態(tài)分配,兩者並與M獨立,因此如進一步給定y,Y仍呈多元常i,obsi,mis態(tài)分配,而M之分配未受影響。橫跨所有類別,給定Y,則Y為有限常態(tài)ii,obsi,mis混合模型,M呈潛在變項類別模型。如再給定M=m,並不直接影響遺漏變項iiiY之分配,而影響潛在類別隸屬變項,遺漏變項仍呈有限常態(tài)混合模型:i,misTOC\o"1-5"\h\zf(YIY=y,M=m)=1LC'*f(YIY)(7)i,misi,obsi,obsiii,tti,misi,obst=1其中c=Ci*ft(Mi),其中細節(jié)請見附錄。i,tncEC*f(M)i,llil=11.2產(chǎn)生隨機向量,求取近似期望值:導(dǎo)出條件機率密度函數(shù)後,本研究建議採複合抽樣法(compositionmethod,又譯合成法,高惠璇,1995)產(chǎn)生隨機向量。複合抽樣法適用在欲抽取之分佈函數(shù)可表示為F(x)=EpF(x)之情ttt=1形,本研究欲抽樣之機率密度函數(shù)為常態(tài)混合分配,即符合複合抽樣法之要求。首先在給定M下計算對應(yīng)之C',產(chǎn)生隨機整數(shù)T,使p(T=t)=p=C'。假設(shè)ii,tti,tT=g,則依據(jù)多元常態(tài)機率密度函數(shù)N(中,口)產(chǎn)生隨機向量。重複前mis|obsmis|obs述步驟R次,則可得R組隨機向量,將其取代遺漏變項後可形成R筆完整資料,再計算該筆資料對數(shù)概似函數(shù)之平均值作為近似期望值。2.M步驟:以Muth6n(2001a,b)之作法估計參數(shù)。範例本研究產(chǎn)生一模擬資料,以初步比較數(shù)種遺漏值處理法於潛在變項組型混合模型下之表現(xiàn)。此範例之目的乃在探討如果資料遺漏機制為潛在變項組型混合模型,則本研究推導(dǎo)之估計的表現(xiàn)是否較其他遺漏值處理法為佳。探討的遺漏值處理法包括列刪除法、平均值插補法、迴歸插補法與本研究建議之LVPM-ML,由於本研究焦點在遺漏資料的處理,故乃假設(shè)外顯連續(xù)變項的結(jié)構(gòu)方程模型設(shè)定正確,即為有限混合結(jié)構(gòu)方程模型。進行有限混合結(jié)構(gòu)方程模型分析時,需以各個觀察值的個別資料進行分析,因此,無法產(chǎn)生完整個別資料之遺漏值處理法皆不適用,此類方法包括對刪除法與全訊息最大概似估計(fullinformationML,Arbuckle,1996;Enders,2001),多樣本結(jié)構(gòu)方程模型遺漏值處理法則因本例遺漏組型過多而不適用。本範例產(chǎn)生完整資料時,設(shè)定樣本數(shù)為1000,並假定有「疲勞受訪者」與「敏感受訪者」兩個潛在類別,各佔全樣本之66.7%與33.3%。兩類受訪者的結(jié)構(gòu)方程模型皆為四變項之斜交二因素模型,各因素之平均數(shù)為0,標準差為1,因素間相關(guān)則為.5,前二變項在第一個因素上有非零負載量,後二變項則在第二因素上有非零負載量,其餘負載量為0。非零之因素負載量與變項平均數(shù)則依潛在類別不同而異,「疲勞受訪者」分別設(shè)定為.8與0,「敏感受訪者」則為.6與2。在產(chǎn)生資料遺漏上,為使遺漏機制符合潛在變項組型混合模型,乃假設(shè)疲勞類別受訪者各題遺漏機率隨題序而增加,分別為.05、.15、.25與.35,敏感類別受訪者對前二題較敏感,因此有較高遺漏機率(.35),對後二題遺漏機率則較低(.05)。此模擬資料產(chǎn)生歷程之參數(shù)數(shù)值整理於表一模型理論值一欄。產(chǎn)生遺漏資料後,即以不同遺漏值處理法分析,並估計結(jié)構(gòu)方程模型之參數(shù),同時亦分析完整資料,作為考量遺漏值處理法優(yōu)劣之參考。分析模型設(shè)為有限混合結(jié)構(gòu)方程模型,受訪者所屬類別未知,僅假設(shè)已知有二個潛在類別。列刪除法、平均值插補法與迴歸插補法是先處理遺漏值,再以最大概似法進行有限混合結(jié)構(gòu)方程模型分析的二階段作法,LVPM-ML則同時處理遺漏值並進行有限混合結(jié)構(gòu)方程模型分析。LVPM-ML之MCEM算則以研究者撰寫之SAS/IML程式控制主要流程,M步驟以Mplus2.02(Muthen&Muthen,2002)進行,MCE步驟則以作者撰寫的讀取Mplus輸出之程式,得到M步驟每次疊代之參數(shù)估計值,再以SAS/IML求取條件機率密度函數(shù)及產(chǎn)生R個隨機向量。由於MCEM算則疊代過程牽涉隨機抽樣因素,估計值會在定值附近波動,因此可以參數(shù)估計穩(wěn)定後,最後數(shù)次估計值之平均作為估計值(例如,Bockenholt&Tsai,2001)本範例之R初始值設(shè)為15,隨疊代次數(shù)每次增加5,上限設(shè)為100。隨著疊代次數(shù)的增加,對數(shù)概似函數(shù)估計值在第16次後,變化不超過對數(shù)概似函數(shù)數(shù)值之千分之一,任兩次疊代求得參數(shù)估計值之RMSD(rootmeansquareddifference)在第19次疊代後則不高於.01,且多在.005以下,參數(shù)估計趨於穩(wěn)定,為使所得之參數(shù)估計值較穩(wěn)定,本範例再疊代50餘次,計疊代75次,以最後25次估計值平均作為LVPM-ML之估計值。各種遺漏值處理法中除列刪除法採410筆完全未遺漏資料分析外,其餘各方法皆處理1000筆資料,各種遺漏值處理法與完整資料之參數(shù)估計值列於表一。四種遺漏值處理法中,因素負載量估計以本研究建議之LVPM-ML最佳,RMSD為.165,優(yōu)於列刪除法與迴歸插補法(RMSD為.227與.243),平均值插補法最差(.523)因素間相關(guān)以LVPM-ML與列刪除法估計最佳(.098與.105),迴歸插補法與平均值插補法最差(.173與.207)。變項的平均數(shù)以列刪除法與LVPM-ML估計最佳(.088與.108),迴歸插補法次之(.323),仍以平均值插補法最差(.406)潛在類別比率估計值以LVPM-ML與列刪除法估計較準(RMSD為.009及.011),其他方法表現(xiàn)不佳。四種遺漏值處理法中,LVPM-ML納入遺漏指標變項,因此可估計不同潛在類別各變項之遺漏比率,由表一可看出遺漏組型如假設(shè)模式,疲勞類別之遺漏比率依題序增加而升高,敏感類別則在前二題有較高遺漏比率,LVPM-ML對各題遺漏機率估計之RMSD為.018。(置表一於此)如以完整資料為標準,各遺漏值處理法在各類參數(shù)估計上的表現(xiàn)與前述類似,唯RMSD較低。因素負載量估計以LVPM-ML最佳(RMSD為.049),列刪除法次之(.106),平均值插補法與迴歸插補法表現(xiàn)較差(RMSD分別為.258與.476)因素間相關(guān)以LVPM-ML與列刪除法估計最佳(.035與.045),迴歸插補法與平均值插補法最差(.079與.118)變項的平均數(shù)以列刪除法與LVPM-ML估計最佳(.078與.086),迴歸插補法及平均值插補法最差(.307與.382)。潛在類別比率估計值以LVPM-ML與列刪除法估計較準(RMSD皆為.002),優(yōu)於迴歸插補法及平均值插補法(.1497與.251)。綜合看來,LVPM-ML表現(xiàn)最佳,除變項平均數(shù)外,對其餘參數(shù)的估計都優(yōu)於其他方法,同時亦提供各類別資料遺漏之訊息。列刪除法表現(xiàn)次之,特別對因素間相關(guān)的估計較準確,平均值插補法與迴歸插補法的表現(xiàn)都相當差。討論結(jié)構(gòu)方程模型分析需要實徵資料以驗證研究者假設(shè)的理論模型,而資料發(fā)生遺漏是其收集過程經(jīng)常會遭遇到的情形。Littl(1993)提出的選擇模型(selectionmodel)與組型混合模型對心理學(xué)研究而言有其不足之處,因為此兩類模型均僅著眼於可觀察變項與資料遺漏間的關(guān)係,資料遺漏也可能與潛在變項有關(guān)。MuthOn等人(1987)將潛在連續(xù)變項加入選擇模型,鄭中平與翁儷禎(2002)則推導(dǎo)此時的最大概似估計。本研究則將潛在類別變項加入組型混合模型,稱之為潛在變項組型混合模型。潛在變項組型混合模型假設(shè)觀察變項的遺漏組型並非受訪者的分類,而是潛在類別的指標變項,此模型為Little組型混合模型擴充至潛在變項層次之延伸。簡言之,潛在變項組型混合模型假設(shè)觀察變項的遺漏組型反映潛在變項之類別,且各類別有其結(jié)構(gòu)方程模型。本研究建議以MCEM算則估計資料遺漏機制為潛在變項組型混合模型時結(jié)構(gòu)方程模型的參數(shù),並以模擬資料為例,比較數(shù)種遺漏值處理法的表現(xiàn)。結(jié)果發(fā)現(xiàn)LVPM-ML最能回復(fù)資料產(chǎn)生歷程的因素負載量,對於不同潛在類別之遺漏機率與潛在類別比率估計亦表現(xiàn)良好,唯因素間相關(guān)估計略差。列刪除法對因素結(jié)構(gòu)的回復(fù)表現(xiàn)次於LVPM-ML,但優(yōu)於平均值插補法與迴歸插補法。本研究建議之LVPM-ML表現(xiàn)優(yōu)良,相較於完整資料,LVPM-ML估計時除利用連續(xù)資料訊息外,遺漏指標亦作為潛在類別指標變項,可能因此使?jié)撛陬悇e比率之估計較準確,進而影響各類別因素負載量之估計。唯本範例假設(shè)之遺漏比率較高,前述結(jié)論是否能運用至一般情形,則宜以設(shè)計完整之模擬研究探究。LVPM-ML有賴兩個假設(shè),首先是資料遺漏組型受潛在類別影響,其次為研究者正確設(shè)定潛在類別個數(shù)。違反任一假設(shè)都可能使估計程序表現(xiàn)不如預(yù)期理想,未來如能發(fā)展檢定假設(shè)是否成立的方法,或瞭解假設(shè)未成立時估計方法之強韌性,均對LVPM-ML的實際運用有所助益。兩個假設(shè)中,判定資料遺漏是否為潛在變項組型混合模型可能最為關(guān)鍵,此乃由於現(xiàn)行大多數(shù)遺漏值處理法皆在選擇模型假設(shè)下進行,判定資料遺漏是否為潛在變項組型混合模型乃為不可忽視的議題。未來如能發(fā)展相關(guān)檢定程序,將更能協(xié)助研究者對資料遺漏機制之判斷,進而選擇適當?shù)倪z漏值處理法。LVPM-ML亦假設(shè)研究者正確設(shè)定遺漏機制模型,尤其是潛在類別的數(shù)目。但多數(shù)實徵研究的旨趣並不在遺漏機制,若研究者對其背後的潛在類別不清楚,則潛在變項組型混合模型分析中,遺漏機制模型設(shè)定正確與否對參數(shù)估計影響的研究便相當重要,未來宜以模擬研究釐清。本研究以潛在變項組型混合模型嘗試探討潛在類別影響資料遺漏組型時結(jié)構(gòu)方程模型之參數(shù)估計,初步研究發(fā)現(xiàn)推導(dǎo)之MCEM算則表現(xiàn)良好。此研究為一初探性研究,有關(guān)該模式假設(shè)與適用性之相關(guān)議題尚待後續(xù)研究進一步探討瞭解。參考文獻高惠璇(編著)(1995)。「統(tǒng)計計算」。北京:北京大學(xué)出版社。鄭中平與翁儷禎(2002年八月)?!笣撛谧冺椷x擇模型下結(jié)構(gòu)方程模型之最大概似估計」。發(fā)表於第四屆調(diào)查研究方法與應(yīng)用學(xué)術(shù)研討會,臺北。Arbuckle,J.L.(1996).Fullinformationestimationinthepresenceofincompletedata.InGA.Marcoulides&R.E.Schumacker(Eds.),Advancedstructuralequationmodeling:Issuesandtechniques(pp.243-277).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Bartholomew,D.J.&Knott,M.(1999).Latentvariablemodelsandfactoranalysis.London:Arnold.Bockenholt,U.,&Tsai,R.C.(2001).Individualdifferencesinpairedcomparisondata.BritishJournalofMathematicalandStatisticalPsychology,54,265-277.Dempster,A.P.,Laird,N.M.,&Rubin,D.B.(1977).MaximumLikelihoodfromincompletedataviatheEMalgorithm.JournaloftheRoyalStatisticalSociety,SeriesB,39,1-38.Dolan,V.C.,&vanderMaas,H.L.J.(1998).Fittingmultivariatenormalfinitemixturessubjecttostructuralequationmodeling.Psychometrika,63,227-253.Enders,C.K.(2001).Aprimeronmaximumlikelihoodalgorithmsavailableforusewithmissingdata,StructuralEquationModeling,8,128-141.Everitt,B.S.(1984).Anintroductiontolatentvariablemodels.NewYork:ChapmanandHall.Griliches,Z.(1974).Errorsinvariablesandotherunobservables.Econometrika,42,971-998.(ReprintedinD.J.Aigner,&A.S.Goldberger(Eds),1977,Latentvariablesinsocio-economicmodels.Amsterdam:North-Holland.)Hedeker,D.,&Gibbons,R.D.(1997).Applicationofrandom-effectpattern-mixturemodelsformissingdatainlongitudinalstudies,PsychologicalMethods,2,64-78.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997a).STEMM:Ageneralfinitemixturestructuralequationmodel.JournalofClassification,14,23-50.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997b).Finite-mixturestructuralequationmodelsforresponse-basedsegmentationandunobservedheterogeneity.MarketingScience,16,39-59.Johnson,N.L.,&Kotz,S.(1972)Distributionsinstatistics:continuousmultivariatedistributions.NewYork:JohnWiley&Sons.Joreskog,K.G.,&Sorbom,D.(1993).LISREL8:StructuralEquationModelingwiththeSIMPLIScommandlanguage.Mooresville,IN:ScientificSoftware,Inc.Lee,S.Y.(1986).Estimationforstructuralequationmodelswithmissingdata.Psychometrika,51,93-99.Little,R.J.A.(1993).Pattern-mixturemodelsformultivariateincompletedata.JournaloftheAmericanStatisticalAssociation,88,125-134.Little,R.J.A.(1994).Aclassofpattern-mixturemodelsfornormalincompletedata.Biometrika,81,471-483.Little,R.J.A.(1995).Modelingthedrop-outmechanisminrepeated-measuresstudies.JournaloftheAmericanStatisticalAssociation,90,1112-1121.Little,R.J.A.,&Rubin,D.B.(1987).Statisticalanalysiswithmissingdata.NewYork:JohnWiley&Sons.McCutcheon,A.L.(1987).Latentclassanalysis.SageUniversityPaperseriesonQuantitativeApplicationsinthesocialScience,seriesno.07-064.NewburyPark,CA:Sage.McLachlan,GJ.,&Krishnan,T.(1997).TheEMalgorithmandextensions.NewYork:JohnWiley&Sons.Muthen,B.(2001a).Latentvariablemixturemodeling.InGA.Marcoulides&R.E.Schumacker(Ed)Newdevelopmentsandtechniquesinstructuralequationmodeling,(pp.1-33).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Muthen,B.(2001b).Second-generationstructuralequationmodelingwithacombinationofcategoricalandcontinuouslatentvariables.InL.M.Collins&A.GSayer(Ed)Newmethodsfortheanalysisofchange,(pp.291-322).Washington,DC:AmericanPsychologicalAssociation.Muthen,B.,Kaplan,D.,&Hollis,M.(1987).Onstructuralequationmodelingwithdatathatarenotmissingcompletelyatrandom.Psychometrika,52,431-462.Muthen,L.,&Muthen,B.(2002).Mplus2.02[Computersoftware].Http://www.StatM.Newcomb,M.D.,&Bentler,P.M.(1988).Consequencesofadolescentdruguse:Impactonthelivesofyoungadults.NewburyPark,CA:Sage.Ruud,P.A.(1991).ExtensionsofestimationmethodsusingtheEMalgorithm.JournalofEconometrics,49,305-341.Wei,G.C.G.,&Tanner,M.A.(1990).AMonteCarloimplementationoftheEMalgorithmandthepoorman'sdataaugmentationalgorithm.JournaloftheAmericanStatisticalAssociation,85,699-704.附錄潛在變項組型混合模型之遺漏變項條件機率密度函數(shù)令Y為第i筆資料的外顯變項向量,維度為pX1,其中Y為Y中遺漏變TOC\o"1-5"\h\zii,misi項向量,Y為未遺漏變項向量,M為Y之遺漏指標變項向量?,F(xiàn)欲在給定i,obsiiMCEM算則M步驟估計之第g個潛在類別Y的平均數(shù)向量X和共變數(shù)矩陣Yg,及隸屬變項C下,求得固定Y=y與M=m時,Y之條件機率密i,gi,obsi,obsiii,mis度函數(shù)f(YIY=y,M=m)。i,misi,obsi,obsii為方便表達,乃引進選取變項並重排的運算w,w為axp矩陣,a為選取變項數(shù)(Finkbeiner,1979)每筆資料的連續(xù)變項可分成二類:遺漏變項與未遺漏變項,w之下標依序標示是否選取遺漏變項與未遺漏變項,0表示不選取該類變項,1表示選取該類變項;例如,w表示不選取遺漏變項,但選取未遺漏變01項。以Y'=[2.5..3為例(.表示遺漏值),(wy)'=[253],對應(yīng)之w如下所i01i01示。01000010000000000100001000000000同樣的,w則相當於先選取遺漏變項,再選取未遺漏變項,(wY)'=[?…21111i53],對應(yīng)之w如下。1111010000100000001000010001000001101000010000000100001000100000000001在給定潛在類別下,Y的機率密度函數(shù)為(A1)i(A1)f(Y,Y)~N(卩g,Sgib)
gi,misi,obsmis,obsmis,obs其中卩gmis,obs=w其中卩gmis,obs=w卩g11Sgmis,obsmis,obswSgw'。1111進一步給定Yi,obsYi,msi之條件機率密度函數(shù)仍為多元常態(tài)分配(Johnson&Kotz,1972&Kotz,1972):f(Ygf(Ygi,mis|Y)~i,obs,Sg)mis|obsmis|obs(A2)其中其中卩gmis|obsS卩gmis|obsSgmis,obsmis,obsobs)+卩gmis-1S-1Sgmis|obsSg-SgSgSgmismis,obsobsobs,misobs=wSgw'0101obs=w卩g01Sg=wSgwobs=wSgw'0101obs=w卩g01Sg=wSgw'mis1010J卩gmis=w卩go10給定Yi,obs,由於局度獨立,M之條件機率函數(shù)及Yiii,mis與M之條件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 宿遷電商倉庫租賃合同范例
- 代理補充協(xié)議合同范例
- 房屋過戶物業(yè)合同范例
- 鄉(xiāng)鎮(zhèn)出租海域房屋合同范例
- vi項目合同范例
- 杯子采購合同范例
- 房子貸款合同范例
- 工程水泥合同范例
- 2024年特定航線油輪租賃合同細則版B版
- 2024年離婚后個人隱私保護與不泄露協(xié)議3篇
- 2025年教師資格考試初級中學(xué)面試信息技術(shù)試題及解答參考
- 工傷調(diào)解簡單協(xié)議書范本(35篇)
- 24秋國家開放大學(xué)《公共政策概論》形考任務(wù)1-4參考答案
- 樂理三級考試題及答案
- 河北省邢臺市2023-2024學(xué)年二年級上學(xué)期語文期中試卷(含答案)2
- 《基礎(chǔ)會計第6版》中高職全套教學(xué)課件
- 肺癌根治術(shù)護理查房
- 中央空調(diào)工程售后服務(wù)的方案
- 2024內(nèi)置直驅(qū)動力刀塔
- 醫(yī)療器械公司組織機構(gòu)圖以及部門設(shè)置和崗位職責(zé)說明
- TTJSFB 002-2024 綠色融資租賃項目評價指南
評論
0/150
提交評論