統(tǒng)計學(xué)第9章列聯(lián)分析_第1頁
統(tǒng)計學(xué)第9章列聯(lián)分析_第2頁
統(tǒng)計學(xué)第9章列聯(lián)分析_第3頁
統(tǒng)計學(xué)第9章列聯(lián)分析_第4頁
統(tǒng)計學(xué)第9章列聯(lián)分析_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第9章 列聯(lián)分析9.1 分類數(shù)據(jù)與列聯(lián)表例:某集團公司下屬四個分公司。現(xiàn)該集團欲進行一項改革,由于涉及到各分公司的利益,希望對各分公司職工的態(tài)度有所了解。所以從四個分公司中隨機選取420名員工進行調(diào)查,結(jié)果如下表所示:關(guān)于改革方法的調(diào)查結(jié)果一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計100120901104209.1.1 列聯(lián)表的構(gòu)造列聯(lián)表:是由兩個以上的變量進行交叉分類的頻數(shù)分布表。每個單元:反應(yīng)兩方面的信息行:態(tài)度變量 行合計:列:單位變量 列合計: 列聯(lián)表:列聯(lián)表9.1.2 列聯(lián)表的分布1 觀察值的分布一分公司二分公司三分公司四

2、分公司合計百分比贊成該方案68755779279279/420=0.664反對該方案32453331141141/420=0.336合計10012090110420總合計(樣本容量):百分比:2 期望值的分布一分公司二分公司三分公司四分公司合計贊成1000.664=661200.664=80900.664=601100.664=73279反對1000.336=341200.336=40900.336=301100.336=37141合計10012090110420期望值:9.1.3 觀察值與期望值頻數(shù)對比分布表一分公司二分公司三分公司四分公司贊成觀察值期望值6866758057607973反對

3、觀察值期望值32344540333031379.2 擬合優(yōu)度檢驗9.2.1 思路: 如果各分公司員工對改革方案的態(tài)度一致 則各分公司員工贊成或反對該方案的比例應(yīng)該相同 即 其中為第個分公司贊成改革方案的比例那么,對比分布表中相應(yīng)的觀察值與期望值就應(yīng)該非常接近9.2.2 檢驗統(tǒng)計量:設(shè)為觀察值頻數(shù)為期望值頻數(shù)9.2.3 判斷準(zhǔn)則當(dāng)大于某臨界值時,拒絕態(tài)度一致的原假設(shè)右單側(cè)檢驗即時,拒絕原假設(shè)自由度完成上面的例題解: 各分公司員工對這項改革的態(tài)度一致上面等式不全相等 各分公司員工對這項改革的態(tài)度不一致計算表683275455733793166348040603073372-2-55-336-644

4、25259936360.06060.11760.31250.62500.15000.30000.49320.9730=3.0319自由度=3,查表得:由于3.0319<6.251,所以不能拒絕原假設(shè),即認為四個分公司員工對這項改革的態(tài)度是一致的。例:從總體中隨機抽取的樣本,調(diào)查后按不同屬性歸類,得到如下結(jié)果:依據(jù)以往經(jīng)驗,各類別在總體中的比例分別為:請以的顯著性水平檢驗,說明現(xiàn)在的情況與經(jīng)驗數(shù)據(jù)相比是否發(fā)生了顯著變化。解: 沒有發(fā)生顯著變化上面等式不全相等 發(fā)生了顯著變化,自由度=5-1=4由于14>7.779,所以不能接受原假設(shè),即認為現(xiàn)在的情況與經(jīng)驗數(shù)據(jù)相比已經(jīng)發(fā)生了顯著變化。

5、9.3 獨立性檢驗適用:兩個分類變量之間是否存在聯(lián)系例:一種原料來自三個不同的地區(qū),原料質(zhì)量被分為三個不同等級。從這批原料中隨機抽取500件進行檢驗,結(jié)果如下表所示一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計162188150500要求檢驗各個地區(qū)與原料的質(zhì)量之間是否存在依賴關(guān)系解:地區(qū)與原料等級之間是獨立的 (不存在依賴關(guān)系)地區(qū)與原料等級之間是不獨立的 (存在依賴關(guān)系)期望值的計算:以52為例 設(shè)A=樣本來自于甲地區(qū) 則 B=樣本屬于一級原料 則 若地區(qū)與原料等級獨立,則有 即來自于甲地區(qū)又屬于一級品的原料頻數(shù)應(yīng)為一般化:檢驗統(tǒng)計量:代入數(shù)據(jù)

6、得:自由度=4,查表得:由于19.82>9.448,所以拒絕原假設(shè),即認為這些原料的產(chǎn)地與等級之間存在依賴關(guān)系。比較:獨立性檢驗與一致性檢驗抽取樣本的方法不同一致性檢驗:在各類別中分別抽取獨立性檢驗:先抽取,再分類計算期望值的理論不同9.4檢驗的期望值準(zhǔn)則例:下表是某個應(yīng)用檢驗問題的觀察值與期望值情況,請檢驗原假設(shè)是否成立類別A3032B110113C8687D2324E52F54G41合計263263解:擬合的好擬合的不好計算表類別A3032-240.125B110113-390.080C8687-110.011D2324-110.042E52394.5F54110.25G41399合

7、計26326314.008自由度=7-1=6因為14.008>12.592,所以拒絕原假設(shè),認為數(shù)據(jù)擬合的不好。檢驗的期望值準(zhǔn)則如果只有兩個單元,每個單元的期望頻數(shù)必須是5或者5以上;如果有兩個以上單元,若20%的單元期望頻數(shù)小于5,則不能引用檢驗。改進方法:把期望頻數(shù)小于5的單元進行合并。類別A3032-240.125B110113-390.080C8687-110.011D2324-110.042E1477497合計2632637.133自由度=5-1=4因為9.448>7.133,所以不能拒絕原假設(shè),認為數(shù)據(jù)擬合的好。9.5 列聯(lián)表中的相關(guān)測量檢驗結(jié)果不獨立的情況下,兩者的相關(guān)程度如何9.5.1 相關(guān)系數(shù)其中,:列聯(lián)表中的總頻數(shù),樣本容量想法:兩個變量越獨立,則越接近,越接近于0男女贊成24反對36男女贊成010反對50男女贊成50反對010 獨立 完全相關(guān) 完全相關(guān),相互獨立,完全相關(guān)一般情況下,越接近于1,相關(guān)性越強。局限性當(dāng)列聯(lián)表的行或列大于2時,隨著行或列的增加,相關(guān)系數(shù)會隨之增加且沒有上限,對兩個變量相關(guān)程度的測量就不夠清晰了。所以適用于描述列聯(lián)表最常用的一種相關(guān)系數(shù)9.5.2 列聯(lián)相關(guān)系數(shù)相關(guān)系數(shù)說明:,相互獨立相關(guān)系數(shù)的可能最大值依賴于列聯(lián)表的行數(shù)與列數(shù),且隨著行數(shù)或列數(shù)的增大而增大。所以行數(shù)、列數(shù)不相等的列聯(lián)表的相關(guān)系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論