列聯(lián)表、c2檢驗(yàn)和對數(shù)線性模型_第1頁
列聯(lián)表、c2檢驗(yàn)和對數(shù)線性模型_第2頁
列聯(lián)表、c2檢驗(yàn)和對數(shù)線性模型_第3頁
列聯(lián)表、c2檢驗(yàn)和對數(shù)線性模型_第4頁
列聯(lián)表、c2檢驗(yàn)和對數(shù)線性模型_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、列聯(lián)表、列聯(lián)表、c c2檢驗(yàn)和對數(shù)線性模型檢驗(yàn)和對數(shù)線性模型 三維列聯(lián)表三維列聯(lián)表(關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果(關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果:table7.sav)opinion * income Crosstabulationopinion * income CrosstabulationCount71519414525128252403112301opinionTotal123incomeTotal 觀點(diǎn):贊成(1)觀點(diǎn):不贊成(0) 低收入(1)中等收入(2)高收入(3)低收入(1)中等收入(2)高收入(3)男1201055810女025157279s se ex x * * o op pi

2、in ni io on n C Cr ro os ss st ta ab bu ul la at ti io on nCount184765233558418212301sexTotal01opinionTotal列聯(lián)表列聯(lián)表 前面就是一個(gè)所謂的三維前面就是一個(gè)所謂的三維列聯(lián)表列聯(lián)表(contingency table). 這些變量中這些變量中每個(gè)都有兩個(gè)或更多的可能取每個(gè)都有兩個(gè)或更多的可能取值值。這些取值也稱為。這些取值也稱為水平水平;比如收入有三;比如收入有三個(gè)水平,觀點(diǎn)有兩個(gè)水平,性別有兩個(gè)水個(gè)水平,觀點(diǎn)有兩個(gè)水平,性別有兩個(gè)水平等。平等。該表為該表為322列聯(lián)表列聯(lián)表 在在SPSS數(shù)

3、據(jù)中,表就不和課本印的一樣,數(shù)據(jù)中,表就不和課本印的一樣,收入的收入的“低低”、“中中”、“高高”用代碼用代碼1、2、3代表;性別的代表;性別的“女女”、“男男”用代碼用代碼0、1代表;觀點(diǎn)代表;觀點(diǎn)“贊成贊成”和和“不贊成不贊成”用用1、0代表。有些計(jì)算機(jī)數(shù)據(jù)對于這些代碼的形代表。有些計(jì)算機(jī)數(shù)據(jù)對于這些代碼的形式不限(式不限(可以是數(shù)字,也可以是字符串可以是數(shù)字,也可以是字符串)。)。Table7.sav 數(shù)據(jù)數(shù)據(jù)列聯(lián)表列聯(lián)表 列聯(lián)表的中間各個(gè)變量不同水平的交列聯(lián)表的中間各個(gè)變量不同水平的交匯處,就是這種水平組合出現(xiàn)的頻數(shù)匯處,就是這種水平組合出現(xiàn)的頻數(shù)或或計(jì)數(shù)計(jì)數(shù)(count)。)。 二維

4、的列聯(lián)表又稱為二維的列聯(lián)表又稱為交叉表交叉表(cross table)。)。 列聯(lián)表可以有很多維。維數(shù)多的叫做列聯(lián)表可以有很多維。維數(shù)多的叫做高維列聯(lián)表。高維列聯(lián)表。 注意前面這個(gè)列聯(lián)表的變量都是定性注意前面這個(gè)列聯(lián)表的變量都是定性變量變量;但列聯(lián)表也會(huì)帶有但列聯(lián)表也會(huì)帶有定量變量作為定量變量作為協(xié)變量。協(xié)變量。二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn) 研究列聯(lián)表的一個(gè)主要目研究列聯(lián)表的一個(gè)主要目的是看這些變量是否相關(guān)。的是看這些變量是否相關(guān)。比如比如前面例子中的前面例子中的收入和收入和觀點(diǎn)觀點(diǎn)是否相關(guān)是否相關(guān)。這需要形式上的檢驗(yàn)這需要形式上的檢驗(yàn)二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn) 下面表是把該例的三維

5、表簡化成下面表是把該例的三維表簡化成只有收入只有收入和觀點(diǎn)的二維表和觀點(diǎn)的二維表( (這是這是SPSS自動(dòng)轉(zhuǎn)化自動(dòng)轉(zhuǎn)化的的: :Analyze-Descriptive Statistics-Crosstabs-.).OPINION * INCOME CrosstabulationCount71519414525128252403112301OPINIONTotal123INCOMETotal二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn) 對于上面那樣的二維表。我們檢驗(yàn)的零假設(shè)對于上面那樣的二維表。我們檢驗(yàn)的零假設(shè)和備選假設(shè)為和備選假設(shè)為 H H0 0:觀點(diǎn)和收入這兩個(gè)變量不相關(guān)觀點(diǎn)和收入這兩個(gè)變量不相關(guān);H

6、 H1 1:這兩個(gè)變量相關(guān)。這兩個(gè)變量相關(guān)。 這里的檢驗(yàn)統(tǒng)計(jì)量在零假設(shè)下有(大樣本時(shí))這里的檢驗(yàn)統(tǒng)計(jì)量在零假設(shè)下有(大樣本時(shí))近似的近似的c c2 2分布。分布。 當(dāng)該統(tǒng)計(jì)量很大時(shí)或當(dāng)該統(tǒng)計(jì)量很大時(shí)或p p- -值很小時(shí),就可以拒值很小時(shí),就可以拒絕零假設(shè),認(rèn)為兩個(gè)變量相關(guān)。絕零假設(shè),認(rèn)為兩個(gè)變量相關(guān)。 實(shí)際上有不止一個(gè)實(shí)際上有不止一個(gè)c c2 2檢驗(yàn)統(tǒng)計(jì)量。包括檢驗(yàn)統(tǒng)計(jì)量。包括Pearson c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量和和似然比似然比(likelihood ratio)c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量;它們都有漸近的;它們都有漸近的c c2 2分布。分布。 根據(jù)計(jì)算可以得到(對于這兩個(gè)統(tǒng)計(jì)量均有)根據(jù)

7、計(jì)算可以得到(對于這兩個(gè)統(tǒng)計(jì)量均有)p p- -值小于值小于0.0010.001。因此可以說,收入高低的確。因此可以說,收入高低的確影響觀點(diǎn)。影響觀點(diǎn)。 21niiiiOEQE12lnniiiiOTOEPearson c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量似然比似然比c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量Oi代表第代表第i個(gè)格子的計(jì)數(shù),個(gè)格子的計(jì)數(shù),Ei代表按照零假設(shè)代表按照零假設(shè)(行列無關(guān))(行列無關(guān))對第對第i格子的計(jì)數(shù)的期望值格子的計(jì)數(shù)的期望值二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn) 剛才說,這些剛才說,這些c c2 2統(tǒng)計(jì)量是近似的,那么統(tǒng)計(jì)量是近似的,那么有沒有沒有精確的統(tǒng)計(jì)量呢?有精確的統(tǒng)計(jì)量呢? 當(dāng)然有。這個(gè)檢驗(yàn)稱

8、為當(dāng)然有。這個(gè)檢驗(yàn)稱為FisherFisher精確檢驗(yàn)精確檢驗(yàn);它;它不是不是c c2 2分布,而是分布,而是超幾何分布超幾何分布。 對本問題對本問題, ,計(jì)算計(jì)算FisherFisher統(tǒng)計(jì)量得到的統(tǒng)計(jì)量得到的p p- -值也小值也小于于0.0010.001。 聰明的同學(xué)必然會(huì)問,既然有精確檢驗(yàn)聰明的同學(xué)必然會(huì)問,既然有精確檢驗(yàn)為什為什么么還要用近似的還要用近似的c c2 2檢驗(yàn)?zāi)??檢驗(yàn)?zāi)兀?這是因?yàn)楫?dāng)數(shù)目很大時(shí),超幾何分布計(jì)算相這是因?yàn)楫?dāng)數(shù)目很大時(shí),超幾何分布計(jì)算相當(dāng)緩慢(比近似計(jì)算會(huì)差很多倍的時(shí)間);當(dāng)緩慢(比近似計(jì)算會(huì)差很多倍的時(shí)間);而且在計(jì)算機(jī)速度不快時(shí),根本無法計(jì)算。而且在計(jì)算機(jī)

9、速度不快時(shí),根本無法計(jì)算。因此人們多用大樣本近似的因此人們多用大樣本近似的c c2 2統(tǒng)計(jì)量。而列統(tǒng)計(jì)量。而列聯(lián)表的有關(guān)檢驗(yàn)也和聯(lián)表的有關(guān)檢驗(yàn)也和c c2 2檢驗(yàn)聯(lián)系起來了。檢驗(yàn)聯(lián)系起來了。Fisher精確檢驗(yàn)精確檢驗(yàn)C Ch hi i- -S Sq qu ua ar re e T Te es st ts s10.288b1.001.002.0019.1071.00310.4961.001.002.001.002.001113Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid

10、CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is23.45.b. SPSS: Weight-Describ-crosstab-exacttable7.sav 其中有變量性別其中有變量性別( (sex) )、觀點(diǎn)、觀點(diǎn)( (opinion) )和收入和收入( (income) );每一列相應(yīng)于

11、其代表的變量的每一列相應(yīng)于其代表的變量的水平水平; ;每一行為一種水平的組合每一行為一種水平的組合( (共有共有23212種組合種組合( (12行行),),而每種組合的數(shù)目而每種組合的數(shù)目( (也就是列聯(lián)表中的頻數(shù)也就是列聯(lián)表中的頻數(shù)) )在在number那一列上面,這就是每種組合的權(quán)重那一列上面,這就是每種組合的權(quán)重( (weight),),需要把這個(gè)數(shù)目考慮進(jìn)去需要把這個(gè)數(shù)目考慮進(jìn)去, ,稱為加權(quán)稱為加權(quán)( (weight).).如果不加權(quán),最后結(jié)果按照所有組合只如果不加權(quán),最后結(jié)果按照所有組合只出現(xiàn)一次來算出現(xiàn)一次來算( (也就是說,按照列聯(lián)表每一格的頻也就是說,按照列聯(lián)表每一格的頻數(shù)為

12、數(shù)為1).).由于在后面的選項(xiàng)中沒有加權(quán)的機(jī)會(huì)由于在后面的選項(xiàng)中沒有加權(quán)的機(jī)會(huì), ,因因此在一開始就要加權(quán)此在一開始就要加權(quán). .方法是點(diǎn)擊圖標(biāo)中的小天平方法是點(diǎn)擊圖標(biāo)中的小天平(“(“權(quán)權(quán)”就是天平的意思就是天平的意思),),出現(xiàn)對話框之后點(diǎn)擊出現(xiàn)對話框之后點(diǎn)擊Weight cases,然后把,然后把“number”選入即可。選入即可。二維列聯(lián)表情況二維列聯(lián)表情況加權(quán)之后,按照次序選加權(quán)之后,按照次序選AnalyzeDescriptive StatisticsCrosstabs。在打開的對話框中,把在打開的對話框中,把opinion和和income分別選入分別選入Row(行)和(行)和Col

13、umn(列);至于哪個(gè)放入行或(列);至于哪個(gè)放入行或哪個(gè)放入列是沒有關(guān)系的。哪個(gè)放入列是沒有關(guān)系的。如果要如果要Fisher精確檢驗(yàn)則可以點(diǎn)精確檢驗(yàn)則可以點(diǎn)Exact,另外在,另外在Statistics中選擇中選擇Chi-square,以得到,以得到c c2檢驗(yàn)結(jié)果。檢驗(yàn)結(jié)果。最后點(diǎn)擊最后點(diǎn)擊OK之后,就得到有關(guān)之后,就得到有關(guān)Pearson c c2統(tǒng)計(jì)量、統(tǒng)計(jì)量、似然比似然比c c2統(tǒng)計(jì)量以及統(tǒng)計(jì)量以及Fisher統(tǒng)計(jì)量的輸出了統(tǒng)計(jì)量的輸出了( (這里這里的的Sig就是就是p-值值) )。 加權(quán):加權(quán):Chi-Square Tests20.456a2.000.00021.1902.000

14、.00020.713.00020.290b1.000.000.000.000123Pearson Chi-SquareLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)PointProbability0 cells (.0%) have expected count less than 5. The minimum expected count is 10.33.

15、a. The standardized statistic is -4.504.b. 下面為下面為SPSSSPSS對于對于table7.savstable7.savs數(shù)據(jù)產(chǎn)生的數(shù)據(jù)產(chǎn)生的下面二維列下面二維列聯(lián)表聯(lián)表相關(guān)分析的輸出相關(guān)分析的輸出opinion * income Crosstabulationopinion * income CrosstabulationCount71519414525128252403112301opinionTotal123incomeTotal利用利用crosstabscrosstabs處理處理三維列聯(lián)表三維列聯(lián)表問題的問題的SPSSSPSS選項(xiàng)選項(xiàng)利用利用

16、crosstabscrosstabs處理處理三維三維列聯(lián)表列聯(lián)表問題的輸出問題的輸出income * opinion * sex Crosstabulationincome * opinion * sex CrosstabulationCount22527715229716184765520258101810515233558123incomeTotal123incomeTotalsex0101opinionTotal利用利用crosstabscrosstabs處理處理三維三維列聯(lián)表列聯(lián)表問題的輸出問題的輸出Chi-Square TestsChi-Square Tests12.252a2.00

17、2.00212.9932.002.00312.340.00212.064b1.001.000.000.000658.782c2.012.0129.0582.011.0128.706.0128.624d1.003.005.003.00258Pearson Chi-SquareLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesPearson Chi-SquareLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Va

18、lid Casessex01ValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)PointProbability1 cells (16.7%) have expected count less than 5. The minimum expected count is 4.43.a. The standardized statistic is -3.473.b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5

19、.95.c. The standardized statistic is -2.937.d. 利用利用crosstabscrosstabs處理處理三維三維列聯(lián)表列聯(lián)表問題的輸出問題的輸出123incomeincome0510152025CountCountopinion01sex=0sex=0123incomeincome05101520CountCountopinion01sex=1sex=1高維列聯(lián)表和高維列聯(lián)表和( (多項(xiàng)分布多項(xiàng)分布) )對數(shù)線性模型對數(shù)線性模型 前面例子前面例子原始數(shù)據(jù)是個(gè)三維列聯(lián)表,原始數(shù)據(jù)是個(gè)三維列聯(lián)表,對三維列聯(lián)表的檢驗(yàn)也類似。對三維列聯(lián)表的檢驗(yàn)也類似。但高維列

20、聯(lián)表在計(jì)算機(jī)軟件的選項(xiàng)但高維列聯(lián)表在計(jì)算機(jī)軟件的選項(xiàng)可有所不同,而且可以構(gòu)造一個(gè)所可有所不同,而且可以構(gòu)造一個(gè)所謂謂( (多項(xiàng)分布多項(xiàng)分布) )對數(shù)線性模型對數(shù)線性模型(loglinear model)來進(jìn)行分析。來進(jìn)行分析。利用對數(shù)線性模型的好處是不僅可利用對數(shù)線性模型的好處是不僅可以直接進(jìn)行預(yù)測,而且可以增加以直接進(jìn)行預(yù)測,而且可以增加定定量變量作為模型的一部分。量變量作為模型的一部分。對數(shù)線性模型對數(shù)線性模型 現(xiàn)在簡單直觀地通過二維表介紹一下對數(shù)線性?,F(xiàn)在簡單直觀地通過二維表介紹一下對數(shù)線性模型,假定不同的行代表第一個(gè)變量的不同水平,型,假定不同的行代表第一個(gè)變量的不同水平,而不同的列代

21、表第二個(gè)變量的不同水平。而不同的列代表第二個(gè)變量的不同水平。用用mij代表二維列聯(lián)表第代表二維列聯(lián)表第i行,第行,第j列的頻數(shù)。列的頻數(shù)。人們常假人們常假定這個(gè)頻數(shù)可以用下面的公式來確定:定這個(gè)頻數(shù)可以用下面的公式來確定:ln()ijijm這就是所謂的這就是所謂的多項(xiàng)分布多項(xiàng)分布對數(shù)線性模型。這里對數(shù)線性模型。這里 i i為為行變量的第行變量的第i個(gè)水平對個(gè)水平對ln(mln(mijij) )的影響,而的影響,而 j j為列變?yōu)榱凶兞康牡诹康牡趈個(gè)水平對個(gè)水平對ln(mln(mijij) )的影響,這兩個(gè)影響稱的影響,這兩個(gè)影響稱為為主效應(yīng)(主效應(yīng)(main effect)。( (多項(xiàng)分布多項(xiàng)

22、分布) )對數(shù)線性模型對數(shù)線性模型 這個(gè)模型看上去和回歸模型很象,但由于對于分這個(gè)模型看上去和回歸模型很象,但由于對于分布的假設(shè)不同,不能簡單地用線性回歸的方法來布的假設(shè)不同,不能簡單地用線性回歸的方法來套用套用( (和和LogisticLogistic回歸類似回歸類似) );計(jì)算過程也很不一;計(jì)算過程也很不一樣。當(dāng)然我們把這個(gè)留給計(jì)算機(jī)去操心了。只要樣。當(dāng)然我們把這個(gè)留給計(jì)算機(jī)去操心了。只要利用數(shù)據(jù)來擬合這個(gè)模型就可以得到對于利用數(shù)據(jù)來擬合這個(gè)模型就可以得到對于 i i和和 j j的的“估計(jì)估計(jì)”。 有了估計(jì)的參數(shù),就可以預(yù)測出任何有了估計(jì)的參數(shù),就可以預(yù)測出任何i i,j j水平組水平組合

23、的頻數(shù)合的頻數(shù)m mijij了(通過其對數(shù))。了(通過其對數(shù))。 注意,這里的估計(jì)之所以打引號是因?yàn)橐粋€(gè)變量注意,這里的估計(jì)之所以打引號是因?yàn)橐粋€(gè)變量的各個(gè)水平的影響是相對的的各個(gè)水平的影響是相對的, ,因此因此, ,只有事先固定只有事先固定一個(gè)參數(shù)值一個(gè)參數(shù)值( (比如比如 1 1=0=0),),或者設(shè)定類似于或者設(shè)定類似于SSi i=0=0這這樣的約束,才可能估計(jì)出各個(gè)的值。樣的約束,才可能估計(jì)出各個(gè)的值。沒有約束,沒有約束,則這些參數(shù)是估計(jì)不出來的。則這些參數(shù)是估計(jì)不出來的。 (多項(xiàng)分布)對數(shù)線性模型(多項(xiàng)分布)對數(shù)線性模型 二維列聯(lián)表的更完全的對數(shù)線性模型為二維列聯(lián)表的更完全的對數(shù)線性

24、模型為ln()()ijijijm 這里的這里的( (ijij代表第一個(gè)變量的第代表第一個(gè)變量的第i i個(gè)水平個(gè)水平和第二個(gè)變量的第和第二個(gè)變量的第j j個(gè)水平對個(gè)水平對ln(mln(mijij) )的共同的共同影響影響( (交叉效應(yīng)交叉效應(yīng)) )。即當(dāng)單獨(dú)作用時(shí),每個(gè)。即當(dāng)單獨(dú)作用時(shí),每個(gè)變量的一個(gè)水平對變量的一個(gè)水平對ln(mln(mijij) )的影響只有的影響只有 i i( (或或 j j) )大,但如果這兩個(gè)變量一同影響就不僅大,但如果這兩個(gè)變量一同影響就不僅是是 i i+ + j j,而且還多出一項(xiàng)。,而且還多出一項(xiàng)。 這里的交叉項(xiàng)的諸參數(shù)的大小也是相對的,這里的交叉項(xiàng)的諸參數(shù)的大小

25、也是相對的,也需要也需要約束條件約束條件來得到其來得到其“估計(jì)估計(jì)”;涉及;涉及的變量和水平越多,約束也越多。的變量和水平越多,約束也越多。注意,無論你對模型假定了多少注意,無論你對模型假定了多少種效應(yīng),種效應(yīng),并不見得都有意義并不見得都有意義;有;有些可能是多余的。本來沒有交叉些可能是多余的。本來沒有交叉影響,但如果寫入,也沒有關(guān)系,影響,但如果寫入,也沒有關(guān)系,在分析過程中一般可以知道哪些在分析過程中一般可以知道哪些影響是顯著的,而那些是不顯著影響是顯著的,而那些是不顯著的。的。 兩種兩種對數(shù)線性模型對數(shù)線性模型前面介紹的前面介紹的多項(xiàng)分布對數(shù)線性模型多項(xiàng)分布對數(shù)線性模型假假定所有的可能格

26、子里面的頻數(shù)滿足多定所有的可能格子里面的頻數(shù)滿足多項(xiàng)分布。項(xiàng)分布。另一類為另一類為PoissonPoisson對數(shù)線性模型對數(shù)線性模型. .它假它假定每個(gè)格子里面的頻數(shù)滿足一定每個(gè)格子里面的頻數(shù)滿足一PoissonPoisson分布(后面再介紹)分布(后面再介紹). .統(tǒng)計(jì)軟件的選項(xiàng)中有關(guān)于分布的選項(xiàng)統(tǒng)計(jì)軟件的選項(xiàng)中有關(guān)于分布的選項(xiàng)高維表的檢驗(yàn)統(tǒng)計(jì)量和二維表一樣也高維表的檢驗(yàn)統(tǒng)計(jì)量和二維表一樣也包含了包含了Pearson c c2統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量和似然比c c2統(tǒng)統(tǒng)計(jì)量。計(jì)量。 用用table7.savtable7.sav數(shù)據(jù)擬合對數(shù)線性模型數(shù)據(jù)擬合對數(shù)線性模型 假定(多項(xiàng)分布)對數(shù)線性模

27、型為假定(多項(xiàng)分布)對數(shù)線性模型為 這里這里 i為收入(為收入(i1,2,31,2,3代表收入的低、中、高三代表收入的低、中、高三個(gè)水平),個(gè)水平), j為觀點(diǎn)(為觀點(diǎn)(j1,21,2代表不贊成和贊成兩代表不贊成和贊成兩個(gè)水平),個(gè)水平),g gk為性別(為性別(k1,21,2代表女性和男性兩代表女性和男性兩個(gè)水平)個(gè)水平), , mijk代表三維列聯(lián)表對于三個(gè)變量的第代表三維列聯(lián)表對于三個(gè)變量的第ijk水平組合的出現(xiàn)次數(shù)。水平組合的出現(xiàn)次數(shù)。 而從相應(yīng)的參數(shù)估計(jì)輸出結(jié)果,可以得到對而從相應(yīng)的參數(shù)估計(jì)輸出結(jié)果,可以得到對 i i的的三個(gè)值的估計(jì)為三個(gè)值的估計(jì)為0.5173, 0.2549,0.

28、0000,0.5173, 0.2549,0.0000,對對 j j的的兩個(gè)值的估計(jì)為兩個(gè)值的估計(jì)為-0.6931,0.0000,-0.6931,0.0000,對對g gk k的兩個(gè)值的兩個(gè)值的估計(jì)為的估計(jì)為 0.1139,0.00000.1139,0.0000。( (多項(xiàng)對數(shù)線性模型多項(xiàng)對數(shù)線性模型常數(shù)無意義,輸出的常數(shù)項(xiàng)僅僅是數(shù)學(xué)意義常數(shù)無意義,輸出的常數(shù)項(xiàng)僅僅是數(shù)學(xué)意義) )ln()ijkijkmgSPSS輸出輸出 就這里的三維列聯(lián)表問題,如只考慮各個(gè)就這里的三維列聯(lián)表問題,如只考慮各個(gè)變量單獨(dú)的影響,而不考慮變量組合的綜變量單獨(dú)的影響,而不考慮變量組合的綜合影響,其合影響,其SPSS輸出

29、的輸出的Pearson c c2統(tǒng)計(jì)量統(tǒng)計(jì)量和似然比和似然比c c2統(tǒng)計(jì)量得到的統(tǒng)計(jì)量得到的p-值分別為值分別為0.0029和和0.0011。 Goodness-of-Fit TestsGoodness-of-Fit Testsa,ba,b24.1377.00122.5417.002Likelihood RatioPearson Chi-SquareValuedfSig.Model: Multinomiala. Design: Constant + income + opinion + sexb. Parameter EstimatesParameter Estimatesc,dc,d2.27

30、7a.517.2272.279.023.073.962.255.2391.065.287-.214.7240b.-.693.191-3.624.000-1.068-.3180b.114.181.631.528-.240.4680b.ParameterConstantincome = 1income = 2income = 3opinion = 0opinion = 1sex = 0sex = 1EstimateStd. ErrorZSig.Lower BoundUpper Bound95% Confidence IntervalConstants are not parameters unde

31、r the multinomial assumption. Therefore, theirstandard errors are not calculated.a. This parameter is set to zero because it is redundant.b. Model: Multinomialc. Design: Constant + income + opinion + sexd. SPSS輸出輸出ln()2.277.517.693.114 income=1,opinion=0,sex=0ln()2.277.255.693.114 income=2,opinion=0

32、,sex=0ln()2.2770.693.114 income=3,opinion=0,sex=0ln()2.277.5170.114 income=1,opinion=1ijijijijmmmm,sex=0ln()2.277.2550.114 income=2,opinion=1,sex=0ln()2.27700.114 income=3,opinion=1,sex=0ln()2.277.517.6930 income=1,opinion=0,sex=1ln()2.277.255.6930 income=2,opinion=0,seijijijijmmmmx=1ln()2.2770.6930

33、 income=3,opinion=0,sex=1ln()2.277.51700 income=1,opinion=1,sex=1ln()2.277.25500 income=2,opinion=1,sex=1ln()2.277000 income=3,opinion=1,sex=1ijijijijmmmmSPSS的的實(shí)現(xiàn)實(shí)現(xiàn) 數(shù)據(jù)數(shù)據(jù)table7.sav 假定已經(jīng)加權(quán)假定已經(jīng)加權(quán) (加權(quán)一次并存盤了既可加權(quán)一次并存盤了既可) 這時(shí)的選項(xiàng)為這時(shí)的選項(xiàng)為AnalyzeLoglinearGeneral, 首先選擇格子中頻數(shù)的分布首先選擇格子中頻數(shù)的分布,這里是多項(xiàng)分布這里是多項(xiàng)分布 (其默認(rèn)值其默

34、認(rèn)值是是Poisson對數(shù)線性模型對數(shù)線性模型). 然后把三個(gè)變量然后把三個(gè)變量(sex,opinion,income)選入選入Factors(因子因子); 再選再選Model(模型模型),如果選,如果選Saturated(飽和模型飽和模型),那就是那就是所有交叉效應(yīng)都要放入模型所有交叉效應(yīng)都要放入模型;但如果不想這樣但如果不想這樣,可以選可以選Custom(自定義自定義),在在Building Terms(構(gòu)造模型的項(xiàng)構(gòu)造模型的項(xiàng))選選Main effect(主效應(yīng)主效應(yīng)),再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來(如如果兩個(gè)或三個(gè)一同選入,等于選入交叉效應(yīng)果兩個(gè)或三個(gè)一同選

35、入,等于選入交叉效應(yīng)). 如果想要知道模型參數(shù),在如果想要知道模型參數(shù),在Options中選擇中選擇Estimates。 最后最后Continue-OK即可得出結(jié)果即可得出結(jié)果. 在計(jì)算機(jī)輸出的結(jié)果中可以找到我們感興趣的結(jié)果。在計(jì)算機(jī)輸出的結(jié)果中可以找到我們感興趣的結(jié)果。 如果如果SPSS的的Viewer輸出不完全,可以選中不完全的輸輸出不完全,可以選中不完全的輸出,利用出,利用Edit-Copy Objects來復(fù)制到例如記事本那樣的來復(fù)制到例如記事本那樣的文件中,就可以看到完整輸出了文件中,就可以看到完整輸出了 Poison Poison對數(shù)線性模型對數(shù)線性模型 有的時(shí)候,類似的高維表并不

36、一定滿足多項(xiàng)分布對數(shù)線有的時(shí)候,類似的高維表并不一定滿足多項(xiàng)分布對數(shù)線性模型。下面看一個(gè)例子。這是關(guān)于哮喘病人個(gè)數(shù)和空性模型。下面看一個(gè)例子。這是關(guān)于哮喘病人個(gè)數(shù)和空氣污染程度,年齡和性別的數(shù)據(jù)(氣污染程度,年齡和性別的數(shù)據(jù)(asthma.sav) 后面表格為某地在一段時(shí)間記錄的后面表格為某地在一段時(shí)間記錄的60組在不同空氣污染組在不同空氣污染狀態(tài)的不同年齡及不同性別的人的狀態(tài)的不同年齡及不同性別的人的發(fā)生哮喘的人數(shù)發(fā)生哮喘的人數(shù)。 其中其中性別為定性變量性別為定性變量S(sex, 1代表女性,代表女性,2代表男性代表男性), 空氣污染程度空氣污染程度P也是定性變量也是定性變量(polut,

37、1、2、3分別代表分別代表輕度、中度和嚴(yán)重污染),輕度、中度和嚴(yán)重污染), 年齡年齡A (age)為定量變量為定量變量,為那一組人的平均年齡;,為那一組人的平均年齡; 還有一列還有一列計(jì)數(shù)計(jì)數(shù)C (count)為這一組的哮喘人數(shù)。為這一組的哮喘人數(shù)。 這個(gè)表格和前面的列聯(lián)表的不同點(diǎn)在于每一格的計(jì)數(shù)并這個(gè)表格和前面的列聯(lián)表的不同點(diǎn)在于每一格的計(jì)數(shù)并不簡單是前面三個(gè)變量的組合的數(shù)目不簡單是前面三個(gè)變量的組合的數(shù)目(某個(gè)年齡段,某某個(gè)年齡段,某種性別及某種污染下的人數(shù)種性別及某種污染下的人數(shù)),而是代表了某個(gè)年齡段,而是代表了某個(gè)年齡段,某種性別及某種污染下某種性別及某種污染下發(fā)生哮喘的人數(shù)發(fā)生哮喘

38、的人數(shù)。 Poisson對數(shù)線性模型簡介對數(shù)線性模型簡介在某些固定的條件下在某些固定的條件下, 人們?nèi)藗冋J(rèn)為某些事件出現(xiàn)的次數(shù)認(rèn)為某些事件出現(xiàn)的次數(shù)服從服從Poisson分布分布, 比如在某比如在某一個(gè)時(shí)間段內(nèi)某種疾病的一個(gè)時(shí)間段內(nèi)某種疾病的發(fā)生病數(shù)發(fā)生病數(shù), 顯微鏡下的微生顯微鏡下的微生物數(shù)物數(shù), 血球數(shù)血球數(shù), 門診病人數(shù)門診病人數(shù), 投保數(shù)投保數(shù), 商店的顧客數(shù)商店的顧客數(shù), 公公共汽車到達(dá)數(shù)共汽車到達(dá)數(shù), 接通數(shù)等接通數(shù)等等等. 然而然而, 條件是不斷變化條件是不斷變化的的. 因此因此, 所涉及的所涉及的Poisson分布的參數(shù)也隨著變化分布的參數(shù)也隨著變化.PoissonPoisso

39、n對數(shù)線性模型對數(shù)線性模型 假定哮喘發(fā)生服從假定哮喘發(fā)生服從PoissonPoisson分布;但是由于條件分布;但是由于條件不同,不同,PoissonPoisson分布的參數(shù)分布的參數(shù)l l也應(yīng)該隨著條件的變也應(yīng)該隨著條件的變化而改變。這里的條件就是給出的性別、空氣污化而改變。這里的條件就是給出的性別、空氣污染程度與年齡。當(dāng)然,如何影響以及這些條件影染程度與年齡。當(dāng)然,如何影響以及這些條件影響是否顯著則是我們所關(guān)心的。這個(gè)模型可以寫響是否顯著則是我們所關(guān)心的。這個(gè)模型可以寫成成 這里這里m m為常數(shù)項(xiàng),為常數(shù)項(xiàng), i i為性別為性別(i=1,2i=1,2分別代分別代表女性和男性兩個(gè)水平),表女

40、性和男性兩個(gè)水平), j j為空氣污染為空氣污染程度程度(j=1,2,3j=1,2,3代表低、中高三個(gè)污染水代表低、中高三個(gè)污染水平),平),x x為連續(xù)變量年齡為連續(xù)變量年齡,而而g g為年齡前面為年齡前面的系數(shù)的系數(shù),e eijij為為殘差項(xiàng)殘差項(xiàng)。 ln( )ijijxlmgePoissonPoisson對數(shù)線性模型對數(shù)線性模型 從對于數(shù)據(jù)從對于數(shù)據(jù)(asthma.sav)(asthma.sav)的的PoissonPoisson對數(shù)線性模型對數(shù)線性模型的相應(yīng)的相應(yīng)SPSSSPSS輸出,可以得到對輸出,可以得到對m m的估計(jì)為的估計(jì)為4.98204.9820,對對 i i的兩個(gè)值的的兩個(gè)值

41、的“估計(jì)估計(jì)”為為-0.0608-0.0608、 0.00000.0000,對,對 j j的三個(gè)值的的三個(gè)值的“估計(jì)估計(jì)”為為-0.1484-0.1484,0.12230.1223、0.00000.0000,對對g g的估計(jì)為的估計(jì)為 0.01260.0126。 注意,這里的對主效應(yīng)注意,這里的對主效應(yīng) I I和和 j j的估計(jì)只有相對意義;的估計(jì)只有相對意義;它們在一個(gè)參數(shù)為它們在一個(gè)參數(shù)為0 0的約束條件下得到的。的約束條件下得到的。 從模型看上去,年齡和性別對哮喘影響都不那么重從模型看上去,年齡和性別對哮喘影響都不那么重要。輕度污染顯然比中度污染和嚴(yán)重污染哮喘要好。要。輕度污染顯然比中度

42、污染和嚴(yán)重污染哮喘要好。但是似乎嚴(yán)重污染時(shí)哮喘稍微比中度污染少些但是似乎嚴(yán)重污染時(shí)哮喘稍微比中度污染少些( (差別差別不顯著不顯著) )。 通過更進(jìn)一步的分析(這里不進(jìn)行),可以發(fā)現(xiàn),通過更進(jìn)一步的分析(這里不進(jìn)行),可以發(fā)現(xiàn),中度和嚴(yán)重空氣污染(無論單獨(dú)還是一起)和輕度中度和嚴(yán)重空氣污染(無論單獨(dú)還是一起)和輕度空氣污染比較都顯著增加哮喘人數(shù),而中度及嚴(yán)重空氣污染比較都顯著增加哮喘人數(shù),而中度及嚴(yán)重污染時(shí)的哮喘人數(shù)并沒有顯著區(qū)別。污染時(shí)的哮喘人數(shù)并沒有顯著區(qū)別。Parameter EstimatesParameter Estimatesb,cb,c4.9821.9162.600.0091.2268.738-.013.043-.294.769-.097.071-.148.142-1.048.295-.426.129.122.1081.135.256-.089.3340a.-.061.153-.398.691-.361.2390a.ParameterConstantagepolut = 1.00polut = 2.00polut = 3.00sex = 1.00sex =

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論