版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
優(yōu)選統(tǒng)計學(xué)第六版賈俊平目前一頁\總數(shù)四十七頁\編于十七點第9章列聯(lián)分析9.1分類數(shù)據(jù)與列聯(lián)表9.2擬合優(yōu)度
檢驗9.3獨立性檢驗9.4列聯(lián)表中的相關(guān)測量9.3列聯(lián)分析中應(yīng)注意的問題目前二頁\總數(shù)四十七頁\編于十七點學(xué)習(xí)目標1. 解釋列聯(lián)表進行c2
檢驗擬合優(yōu)度檢驗獨立性檢驗3. 測度列聯(lián)表中的相關(guān)性目前三頁\總數(shù)四十七頁\編于十七點數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析目前四頁\總數(shù)四十七頁\編于十七點分類數(shù)據(jù)分類變量的結(jié)果表現(xiàn)為類別例如:性別(男,女)各類別用符號或數(shù)字代碼來測度使用分類或順序尺度你吸煙嗎?1.是;2.否你贊成還是反對這一改革方案?1.贊成;2.反對對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗?zāi)壳拔屙揬總數(shù)四十七頁\編于十七點9.1
分類數(shù)據(jù)與列聯(lián)表分類數(shù)據(jù)列聯(lián)表的構(gòu)造列聯(lián)表的分布目前六頁\總數(shù)四十七頁\編于十七點列聯(lián)表的構(gòu)造目前七頁\總數(shù)四十七頁\編于十七點列聯(lián)表
(contingencytable)由兩個以上的變量交叉分類的頻數(shù)分布表行變量的類別用r
表示,ri
表示第i
個類別列變量的類別用c
表示,cj
表示第j
個類別每種組合的觀察頻數(shù)用fij
表示表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表一個
r行c
列的列聯(lián)表稱為r
c
列聯(lián)表目前八頁\總數(shù)四十七頁\編于十七點列聯(lián)表的結(jié)構(gòu)
(22列聯(lián)表)列(cj)合計j=1j=1i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)目前九頁\總數(shù)四十七頁\編于十七點列聯(lián)表的結(jié)構(gòu)
(r
c
列聯(lián)表的一般表示)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij
表示第i
行第j
列的觀察頻數(shù)目前十頁\總數(shù)四十七頁\編于十七點列聯(lián)表
(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420【例】一個集團公司在四個不同的地區(qū)設(shè)有分公司,現(xiàn)該集團公司欲進行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調(diào)查結(jié)果如下表目前十一頁\總數(shù)四十七頁\編于十七點列聯(lián)表的分布目前十二頁\總數(shù)四十七頁\編于十七點觀察值的分布邊緣分布行邊緣分布行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數(shù)的分布例如,四個分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y
的分布,或在變量Y
條件下變量X
的分布每個具體的觀察值稱為條件頻數(shù)目前十三頁\總數(shù)四十七頁\編于十七點觀察值的分布
(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)目前十四頁\總數(shù)四十七頁\編于十七點百分比分布
(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比為在相同的基數(shù)上進行比較,可以計算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應(yīng)的行合計數(shù)(fij
/ri)列百分比:列的每一個觀察頻數(shù)除以相應(yīng)的列合計數(shù)(fij
/cj)總百分比:每一個觀察值除以觀察值的總個數(shù)(fij
/n)目前十五頁\總數(shù)四十七頁\編于十七點百分比分布
(圖示)一分公司二分公司三分公司四分公司合計贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比目前十六頁\總數(shù)四十七頁\編于十七點期望頻數(shù)的分布假定行變量和列變量是獨立的一個實際頻數(shù)fij
的期望頻數(shù)eij
,是總頻數(shù)的個數(shù)n乘以該實際頻數(shù)fij
落入第i
行和第j列的概率,即目前十七頁\總數(shù)四十七頁\編于十七點期望頻數(shù)的分布
(例題分析)由于觀察頻數(shù)的總數(shù)為n
,所以f11
的期望頻數(shù)e11應(yīng)為例如,第1行和第1列的實際頻數(shù)為f11
,它落在第1行的概率估計值為該行的頻數(shù)之和r1除以總頻數(shù)的個數(shù)n
,即:r1/n;它落在第1列的概率的估計值為該列的頻數(shù)之和c1除以總頻數(shù)的個數(shù)n
,即:c1/n。根據(jù)概率的乘法公式,該頻數(shù)落在第1行和第1列的概率應(yīng)為目前十八頁\總數(shù)四十七頁\編于十七點期望頻數(shù)的分布
(例題分析)一分公司二分公司三分公司四分公司贊成該方案實際頻數(shù)68755779期望頻數(shù)66806073反對該方案實際頻數(shù)32753331期望頻數(shù)34403037目前十九頁\總數(shù)四十七頁\編于十七點9.2
擬合優(yōu)度檢驗一.統(tǒng)計量擬合優(yōu)度檢驗?zāi)壳岸揬總數(shù)四十七頁\編于十七點統(tǒng)計量目前二十一頁\總數(shù)四十七頁\編于十七點
統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性用于測定兩個分類變量之間的相關(guān)程度
計算公式為目前二十二頁\總數(shù)四十七頁\編于十七點統(tǒng)計量
(例題分析)實際頻數(shù)(fij)期望頻數(shù)(eij)fij-eij(fij-eij)2(fij-eij)2f687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.0319目前二十三頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗?zāi)壳岸捻揬總數(shù)四十七頁\編于十七點品質(zhì)數(shù)據(jù)的假設(shè)檢驗品質(zhì)數(shù)據(jù)比例檢驗獨立性檢驗Z
檢驗一個總體
檢驗Z
檢驗
檢驗兩個以上總體兩個總體目前二十五頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(goodnessoffittest)檢驗多個比例是否相等檢驗的步驟提出假設(shè)H0:1=2=…=j;H1:
1,2,…,j
不全相等
計算檢驗的統(tǒng)計量
進行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值2
若2>2,拒絕H0;若2<2,接受H0目前二十六頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(例題分析)H0:
1=2=3=4
H1:
1234
不全相等
=0.1df=
(2-1)(4-1)=3臨界值(s):統(tǒng)計量:
在
=0.1的水平上不能拒絕H0可以認為四個分公司對改革方案的贊成比例是一致的決策:結(jié)論:206.2153.0319=0.1目前二十七頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(例題分析)
【例】為了提高市場占有率,A公司和B公司同時開展了廣告宣傳。在廣告宣傳戰(zhàn)之前,A公司的市場占有率為45%,B公司的市場占有率為40%,其他公司的市場占有率為15%。為了了解廣告戰(zhàn)之后A、B和其他公司的市場占有率是否發(fā)生變化,隨機抽取了200名消費者,其中102人表示準備購買A公司產(chǎn)品,82人表示準備購買B公司產(chǎn)品,另外16人表示準備購買其他公司產(chǎn)品。檢驗廣告戰(zhàn)前后各公司的市場占有率是否發(fā)生了變化(0.05)目前二十八頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(例題分析)H0:
1=0.452=0.43=0.15
H1:原假設(shè)中至少有一個不成立
=0.1df=
(2-1)(3-1)=2臨界值(s):統(tǒng)計量:
在
=0.05的水平上拒絕H0可以認為廣告后各公司產(chǎn)品市場占有率發(fā)生顯著變化決策:結(jié)論:208.185.99=0.05目前二十九頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(例題分析—用P值檢驗)第1步:將觀察值輸入一列,將期望值輸入一列第2步:選擇“函數(shù)”選項第3步:在函數(shù)分類中選“統(tǒng)計”,在函數(shù)名中選“CHITEST”,點擊“確定”第4步:在對話框“Actual_range”輸入觀察數(shù)據(jù)區(qū)域在對話框“Expected_range”輸入期望數(shù)據(jù)區(qū)域得到P值為0.016711,所以拒絕原假設(shè)
用Excel計算p值目前三十頁\總數(shù)四十七頁\編于十七點9.3獨立性檢驗?zāi)壳叭豁揬總數(shù)四十七頁\編于十七點獨立性檢驗
(testofindependence)檢驗列聯(lián)表中的行變量與列變量之間是否獨立檢驗的步驟為提出假設(shè)H0:行變量與列變量獨立H1:行變量與列變量不獨立計算檢驗的統(tǒng)計量進行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值2若22,拒絕H0;若2<2,接受H0目前三十二頁\總數(shù)四十七頁\編于十七點獨立性檢驗
(例題分析)【例】一種原料來自三個不同的地區(qū),原料質(zhì)量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,結(jié)果如下表。檢驗各地區(qū)與原料之間是否存在依賴關(guān)系(0.05)地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計162188150500目前三十三頁\總數(shù)四十七頁\編于十七點獨立性檢驗
(例題分析)提出假設(shè)H0:地區(qū)與原料等級之間獨立H1:地區(qū)與原料等級之間不獨立計算檢驗的統(tǒng)計量根據(jù)顯著性水平=0.05和自由度(3-1)(3-1)=4查出相應(yīng)的臨界值2=9.488。由于2=19.82>2=9.448,拒絕H0目前三十四頁\總數(shù)四十七頁\編于十七點擬合優(yōu)度檢驗
(例題分析)H0:地區(qū)與原料等級之間獨立H1:地區(qū)與原料等級之間不獨立
=0.05df=
(3-1)(3-1)=4臨界值(s):統(tǒng)計量:
在
=0.05的水平上拒絕H0地區(qū)和原料等級之間存在依賴關(guān)系決策:結(jié)論:2019.829.488=0.05目前三十五頁\總數(shù)四十七頁\編于十七點9.4列聯(lián)表中的相關(guān)測量一.
相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)
V
相關(guān)系數(shù)目前三十六頁\總數(shù)四十七頁\編于十七點列聯(lián)表中的相關(guān)測量品質(zhì)相關(guān)對品質(zhì)數(shù)據(jù)(分類和順序數(shù)據(jù))之間相關(guān)程度的測度列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)列聯(lián)表相關(guān)測量的統(tǒng)計量主要有相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)V
相關(guān)系數(shù)目前三十七頁\總數(shù)四十七頁\編于十七點
相關(guān)系數(shù)
(correlationcoefficient)測度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對于22列聯(lián)表,
系數(shù)的值在0~1之間
相關(guān)系數(shù)計算公式為目前三十八頁\總數(shù)四十七頁\編于十七點
相關(guān)系數(shù)
(原理分析)一個簡化的22列聯(lián)表因素Y因素X合計x1x2y1aba+by2cdc+d合計a+cb+dn目前三十九頁\總數(shù)四十七頁\編于十七點
相關(guān)系數(shù)
(原理分析)列聯(lián)表中每個單元格的期望頻數(shù)分別為將各期望頻數(shù)代入的計算公式得目前四十頁\總數(shù)四十七頁\編于十七點
相關(guān)系數(shù)
(原理分析)將入
相關(guān)系數(shù)的計算公式得ad等于bc,=0,表明變量X與Y
之間獨立若b=0
,c=0,或a=0
,d=0,意味著各觀察頻數(shù)全部落在對角線上,此時||=1,表明變量X與Y
之間完全相關(guān)列聯(lián)表中變量的位置可以互換,的符號沒有實際意義,故取絕對值即可目前四十一頁\總數(shù)四十七頁\編于十七點列聯(lián)相關(guān)系數(shù)
(coefficientofcontingency)用于測度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計算公式為C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個變量獨立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較目前四十二頁\總數(shù)四十七頁\編于十七點V相關(guān)系數(shù)
(Vcorrelationcoefficient)計算公式為
V的取值范圍是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沈陽理工大學(xué)《大學(xué)生心理健康》2021-2022學(xué)年第一學(xué)期期末試卷
- 哈工大建筑工程法規(guī)與合同試題
- 食品安全與營養(yǎng)健康科普大賽
- 2024酒店會議服務(wù)合同
- 專題11.分析人物形象-2023年四升五語文暑期閱讀專項提升(統(tǒng)編版)
- 2024【外架工操作證】正規(guī)的外架工程班組勞務(wù)包干合同
- 2024家庭保姆雇傭合同新
- 規(guī)劃課題申報范例:大學(xué)生畢業(yè)實習(xí)課程化管理的體制機制建構(gòu)(附可修改技術(shù)路線圖)
- 規(guī)劃課題申報范例:“雙減”背景下小學(xué)數(shù)學(xué)教學(xué)提質(zhì)增效策略研究(附可修改技術(shù)路線圖)
- 深圳大學(xué)《中國民俗文化》2022-2023學(xué)年第一學(xué)期期末試卷
- 2025屆江蘇省蘇州市第一中學(xué)物理高三第一學(xué)期期末學(xué)業(yè)水平測試模擬試題含解析
- 企業(yè)財務(wù)管理數(shù)字化轉(zhuǎn)型實施方案
- 第九課+發(fā)展中國特色社會主義文化+課件高中政治統(tǒng)編必修四哲學(xué)與文化
- 牙用漂白凝膠市場環(huán)境與對策分析
- 2024年山東省濟南市中考英語試題卷(含答案)
- 人教版七年級道德與法治上冊 期中復(fù)習(xí)知識梳理
- 3.1 農(nóng)業(yè)區(qū)位因素及其變化 課件 高一地理人教版(2019)必修第二冊
- 建筑施工企業(yè)(安全管理)安全生產(chǎn)管理人員安全生產(chǎn)考試參考題及答案
- 鍋爐應(yīng)急預(yù)案演練方案
- 《11~20各數(shù)的認識》(教案)-2024-2025學(xué)年一年級上冊數(shù)學(xué)人教版
- 關(guān)于高技能人才培養(yǎng)問題的思考高技能人才培養(yǎng)方案
評論
0/150
提交評論