版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第9章分類數(shù)據(jù)分析9.1分類數(shù)據(jù)與卡方統(tǒng)計量9.2擬合優(yōu)度檢查9.3列聯(lián)分析:獨立性檢查9.4列聯(lián)表中有關(guān)測量9.5列聯(lián)分析中應注意問題2023/10/101第1頁9.1分類數(shù)據(jù)與卡方統(tǒng)計量分類數(shù)據(jù):數(shù)據(jù)成果用數(shù)值表達,但不一樣數(shù)值描述是調(diào)查對象不一樣特性。分類數(shù)據(jù)匯總成果體現(xiàn)為頻數(shù)。數(shù)值型數(shù)據(jù)也能夠表達為分類數(shù)據(jù)卡方檢查是對分類數(shù)據(jù)頻數(shù)進行分析統(tǒng)計辦法。
2023/10/102第2頁卡方統(tǒng)計量:測定兩個分類變量之間有關(guān)程度2023/10/103第3頁9.2擬合優(yōu)度檢查(goodnessoffittest)對一種分類變量檢查定義:根據(jù)總體分布情況,計算分類變量中各類別盼望頻數(shù),與觀測頻數(shù)進行對比,判斷盼望頻數(shù)與觀測頻數(shù)是否有顯著差異。目標:對分類變量進行分析例:1923年4月15日,豪華巨輪泰坦尼克號與冰山相撞淹沒。當初船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以α=0.1顯著性水平檢查存活情況與性別是否有關(guān)?2023/10/104第4頁假如存活情況與性別無關(guān),男性與女性幸存百分比應當相等。
海難后幸存百分比為718/2208=0.325
男性應當為1738*0.325=565人
女性應當為470*0.325=153人。觀測值盼望值男374565-1913648164.6女34415319136481238.4解:判斷觀測頻數(shù)與盼望頻數(shù)是否一致H0:觀測頻數(shù)與盼望頻數(shù)一致H1:觀測頻數(shù)與盼望頻數(shù)不一致2023/10/105第5頁自由度df為:分類變量(性別)個數(shù)-1=1c2α=0.12.705決策:回絕H0結(jié)論:存活情況與性別有關(guān)回絕域2023/10/106第6頁例題2一項統(tǒng)計成果聲稱,某市老年人口所占百分比為14.7%,該市老年人口研究會為了檢查該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)覺其中有57人老年人。調(diào)查成果是否支持14.7%見解?2023/10/107第7頁解:H0:觀測頻數(shù)與盼望頻數(shù)一致H1:觀測頻數(shù)與盼望頻數(shù)不一致盼望頻數(shù):400居民中老年人盼望頻數(shù)應當為400*14.7%=59
400居民中非老年人盼望頻數(shù)應當為400-59=341
觀測值盼望值老年人5759-240.0678非老年人343341240.01172023/10/108第8頁自由度為:分類變量類型個數(shù)-1=1c2α=0.055.024回絕域2023/10/109第9頁9.3列聯(lián)分析:獨立性檢查獨立性檢查:對兩個分類變量分析,是否有關(guān)聯(lián)列聯(lián)表:由兩個以上變量進行交叉分類頻數(shù)分布表行變量類別用R表達,Ri
表達第i
個類別列變量類別用C
表達,Cj
表達第j
個類別每種組合觀測頻數(shù)用fij
表達列出了行變量和列變量所有也許組合,因此稱為列聯(lián)表一種
R行C列列聯(lián)表稱為R
C列聯(lián)表2023/10/1010第10頁列聯(lián)表構(gòu)造
(2
列聯(lián)表)列(Cj)行合計RTj=1j=1i=1f11f12f11+f12i=2f21f22f21+f22列合計CTf11+f21f12+f22n列(Cj)行(Ri)一種2
列聯(lián)表2023/10/1011第11頁列聯(lián)表構(gòu)造
(RC列聯(lián)表一般表達)列(cj)行合計RTj=1j=2…i=1f11f12…r1i=2f21f22…r2:::::列合計CTc1c2…n列(Cj)行(Ri)R行C列列聯(lián)表fij
表達第i
行第j
列觀測頻數(shù)2023/10/1012第12頁一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420例:一種集團公司在四個不一樣地域設有分公司,現(xiàn)該集團公司欲進行一項改革,此項改革也許包括到各分公司利益,故采取抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),理解職員對此項改革見解,調(diào)查成果如下表2023/10/1013第13頁邊緣分布行邊緣分布行觀測值合計數(shù)分布例如,贊成改革方案共有279人,反對改革方案141人列邊緣分布列觀測值合計數(shù)分布例如,四個分公司接收調(diào)查人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y
分布,或在變量Y
條件下變量X
分布每個詳細觀測值稱為條件頻數(shù)3個概念:邊緣分布,條件分布和條件頻數(shù)2023/10/1014第14頁一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)2023/10/1015第15頁條件頻數(shù)反應了數(shù)據(jù)分布,但不適合進行對比百分比分布:以相同基數(shù)計算對應百分比行百分比:行每一種觀測頻數(shù)除以對應行合計數(shù)(f0
/RT)列百分比:列每一種觀測頻數(shù)除以對應列合計數(shù)(f0
/CT)總百分比:每一種觀測值除以觀測值總合計數(shù)(f0
/n)百分比分布2023/10/1016第16頁一分公司二分公司三分公司四分公司合計贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比2023/10/1017第17頁問題:檢查改革方案態(tài)度和各公司之間是否存在依賴關(guān)系H0:改革方案態(tài)度和各公司之間是獨立(不存在依賴關(guān)系)H1:改革方案態(tài)度和各公司之間不獨立(存在依賴關(guān)系)一種觀測頻數(shù)f0盼望頻數(shù)fe
,是總頻數(shù)個數(shù)n乘以該觀測頻數(shù)f0
落入第i
行和第j列概率,即2023/10/1018第18頁計算各單元盼望頻數(shù)一分公司二分公司三分公司四分公司RT贊成該方案實際頻數(shù)68755779279盼望頻數(shù)66806073反對該方案實際頻數(shù)32453331141盼望頻數(shù)34403037CT100120901104202023/10/1019第19頁
統(tǒng)計量用于檢查列聯(lián)表中變量之間是否存在顯著性差異,或者用于檢查變量之間是否獨立計算公式為2023/10/1020第20頁實際頻數(shù)(f0)盼望頻數(shù)(fe)f0-fe(f0-fe)2(f0-fe)2fe687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.03192023/10/1021第21頁
獨立性檢查檢查列聯(lián)表中行變量與列變量之間是否獨立檢查步驟為提出假設H0:行變量與列變量獨立H1:行變量與列變量不獨立計算檢查統(tǒng)計量進行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值
2若2
2,回絕H0;若
2<
2,不回絕H02023/10/1022第22頁【例】一種原料來自三個不一樣地域,原料質(zhì)量被提成三個不一樣等級。從這批原料中隨機抽取500件進行檢查,成果如下表。檢查各地域與原料之間是否存在依賴關(guān)系(
0.05)地域一級二級三級合計甲地域526424140乙地域605952171丙地域506574189合計1621881505002023/10/1023第23頁提出假設H0:地域與原料等級之間獨立H1:地域與原料等級之間不獨立計算檢查統(tǒng)計量根據(jù)顯著性水平=0.05和自由度(3-1)(3-1)=4查出對應臨界值
2=9.488。由于2=19.82>
2=9.448,回絕H02023/10/1024第24頁9.4列聯(lián)表中有關(guān)測量
一:
有關(guān)系數(shù)測度22列聯(lián)表中數(shù)據(jù)有關(guān)程度一種量對于22
列聯(lián)表,
系數(shù)值在0~1之間
有關(guān)系數(shù)計算公式為n:總頻數(shù)2023/10/1025第25頁一種簡化22列聯(lián)表原因Y原因X合計RTx1x2y1aba+by2cdc+d合計CTa+cb+dn2023/10/1026第26頁列聯(lián)表中每個單元格盼望頻數(shù)分別為將各盼望頻數(shù)代入
計算公式得2023/10/1027第27頁將
入
有關(guān)系數(shù)計算公式得ad等于bc,
=0,表白變量X與Y
之間獨立若b=0
,c=0,或a=0
,d=0,意味著各觀測頻數(shù)所有落在對角線上,此時|
|=1,表白變量X與Y
之間完全有關(guān)列聯(lián)表中變量位置能夠交換,
符號沒有實際意義,故取絕對值即可2023/10/1028第28頁二:列聯(lián)有關(guān)系數(shù)C測度大于2
2列聯(lián)表中數(shù)據(jù)有關(guān)程度C取值范圍是0
C<1C=0表白列聯(lián)表中兩個變量獨立C數(shù)值大小取決于列聯(lián)表行數(shù)和列數(shù),并隨行數(shù)和列數(shù)增大而增大。2
2列聯(lián)表完全有關(guān)時,c=0.7071;3
3列聯(lián)表完全有關(guān)時,c=0.8165;4
4列聯(lián)表完全有關(guān)時,c=0.87根據(jù)不一樣行和列列聯(lián)表計算列聯(lián)系數(shù)不便于比較2023/10/1029第29頁三:V有關(guān)系數(shù)計算公式為
其中
V取值范圍是0
V
1
V=0表白列聯(lián)表中兩個變量獨立V=1表白列聯(lián)表中兩個變量完全有關(guān)不一樣行和列列聯(lián)表計算列聯(lián)系數(shù)不便于比較當列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時V=
2023/10/1030第30頁四:數(shù)值分析
、C、V比較同一種列聯(lián)表,
、C、V成果會不一樣不一樣列聯(lián)表,
、C、V成果也不一樣在對不一樣列聯(lián)表變量之間有關(guān)程度進行比較時,不一樣列聯(lián)表中行與行、列與列個數(shù)要相同,并且采取同一種系數(shù)2023/10/1031
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 影視制作合同及免責條款
- 網(wǎng)絡安全技術(shù)咨詢與培訓服務合同
- 圖書館圖書采購合同
- 影視行業(yè)演員肖像權(quán)使用免責協(xié)議
- 企業(yè)上市輔導協(xié)議
- 高端定制家具制作安裝協(xié)議
- 基于人工智能的金融服務協(xié)議
- 家具設計定制服務合同
- 綠色物流創(chuàng)新發(fā)展合作協(xié)議
- 特殊行業(yè)危險品運輸車輛管理安全責任協(xié)議
- 2024年鐵嶺衛(wèi)生職業(yè)學院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 電線電纜加工質(zhì)量控制流程
- 山東省淄博市張店區(qū)祥瑞園小學?-2024-2025年第一學期一年級班主任經(jīng)驗分享(著眼于愛 著手于細)【課件】
- 企業(yè)內(nèi)部客供物料管理辦法
- 婦科臨床葡萄胎課件
- 醫(yī)務從業(yè)人員行為規(guī)范培訓
- 中小學校食品安全管理現(xiàn)狀與膳食經(jīng)費優(yōu)化方案
- 藥學技能競賽標準答案與評分細則處方
- 第15屆-17屆全國中學生物理競賽預賽試卷含答案
- 2025屆高考英語 716個閱讀理解高頻詞清單
- 外研版小學英語(三起點)六年級上冊期末測試題及答案(共3套)
評論
0/150
提交評論