卡方檢驗(yàn)與非參數(shù)檢驗(yàn)_第1頁(yè)
卡方檢驗(yàn)與非參數(shù)檢驗(yàn)_第2頁(yè)
卡方檢驗(yàn)與非參數(shù)檢驗(yàn)_第3頁(yè)
卡方檢驗(yàn)與非參數(shù)檢驗(yàn)_第4頁(yè)
卡方檢驗(yàn)與非參數(shù)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、卡方檢驗(yàn)和非參數(shù)檢驗(yàn)卡方檢驗(yàn)和非參數(shù)檢驗(yàn)u在總體分布形式已知條件下未知參數(shù)檢在總體分布形式已知條件下未知參數(shù)檢驗(yàn)問題。但實(shí)際問題中總體的分布形式驗(yàn)問題。但實(shí)際問題中總體的分布形式往往是未知的,雖然根據(jù)中心極限定理往往是未知的,雖然根據(jù)中心極限定理可以有相當(dāng)?shù)陌盐照J(rèn)為大多數(shù)經(jīng)濟(jì)變量可以有相當(dāng)?shù)陌盐照J(rèn)為大多數(shù)經(jīng)濟(jì)變量服從或近似服從正態(tài)分布,但有時(shí)為了服從或近似服從正態(tài)分布,但有時(shí)為了使所做的統(tǒng)計(jì)推斷更具說服力,就需要使所做的統(tǒng)計(jì)推斷更具說服力,就需要對(duì)總體的分布形式進(jìn)行檢驗(yàn)。對(duì)總體的分布形式進(jìn)行檢驗(yàn)。 1 本章主要內(nèi)容本章主要內(nèi)容:u(1)總體分布的卡方()總體分布的卡方( )檢驗(yàn);)檢驗(yàn);u(2

2、)兩個(gè)比例差異的卡方()檢驗(yàn)(獨(dú)立樣本);)兩個(gè)比例差異的卡方()檢驗(yàn)(獨(dú)立樣本);u(3)兩個(gè)以上比例差異的卡方()檢驗(yàn)(獨(dú)立樣本);)兩個(gè)以上比例差異的卡方()檢驗(yàn)(獨(dú)立樣本);u(4)獨(dú)立性的卡方()檢驗(yàn);)獨(dú)立性的卡方()檢驗(yàn);u(5)兩個(gè)比例差異的)兩個(gè)比例差異的McNEMAR檢驗(yàn)(相關(guān)樣本);檢驗(yàn)(相關(guān)樣本);u(6)兩個(gè)獨(dú)立總體的非參數(shù)檢驗(yàn)()兩個(gè)獨(dú)立總體的非參數(shù)檢驗(yàn)(Wilcoxon秩和檢驗(yàn));秩和檢驗(yàn));u(7)單因素方差分析的非參數(shù)檢驗(yàn)()單因素方差分析的非參數(shù)檢驗(yàn)(Kruskal-Wallis秩秩檢驗(yàn))檢驗(yàn))22222u檢驗(yàn)的基本原理檢驗(yàn)的基本原理u(1)設(shè)設(shè)x1,x2,

3、xn為總體為總體X的一組樣本觀察值,的一組樣本觀察值,F(xiàn)(x)為某一已知分布的分布函數(shù),為某一已知分布的分布函數(shù), 1, 2, r是的是的r個(gè)待定參數(shù),分別是個(gè)待定參數(shù),分別是r個(gè)參數(shù)的點(diǎn)估計(jì),個(gè)參數(shù)的點(diǎn)估計(jì),以分別代替以分別代替 1, 2,., r ,作原假設(shè),作原假設(shè) H0:總體:總體X的分布函數(shù)為的分布函數(shù)為F(x) u(2) 將將F(x)的定義域劃分為的定義域劃分為k個(gè)互不相交的區(qū)個(gè)互不相交的區(qū)間間 (ai , ai+1 ,i =1,2, k;記;記fi為樣本為樣本觀 察 值觀 察 值 x 1 , x 2 , , x n 落 在 第 個(gè) 區(qū) 間落 在 第 個(gè) 區(qū) 間(ai ,ai+1

4、內(nèi)的頻數(shù),并記內(nèi)的頻數(shù),并記 Pi=Pai X ai+1= F(ai+1)-F(ai ) 32.1總體分布的總體分布的 檢驗(yàn)檢驗(yàn)u為以為以F(x)為分布函數(shù)的隨機(jī)變量在區(qū)間為分布函數(shù)的隨機(jī)變量在區(qū)間 (ai ,ai+1 上取值的概率,上取值的概率,i =1,2, k。則當(dāng)則當(dāng)H0為真時(shí),由貝努里定理,當(dāng)為真時(shí),由貝努里定理,當(dāng)n充分大時(shí),充分大時(shí),n次獨(dú)立重復(fù)試驗(yàn)結(jié)果的實(shí)際頻率次獨(dú)立重復(fù)試驗(yàn)結(jié)果的實(shí)際頻率 與其概率與其概率Pi之間的差異并不顯著,于是顯然可以用統(tǒng)計(jì)之間的差異并不顯著,于是顯然可以用統(tǒng)計(jì)量來刻畫它們間總的差異的大小。其中量來刻畫它們間總的差異的大小。其中nPi為為理論頻數(shù)。當(dāng)理論

5、頻數(shù)。當(dāng)H0為真時(shí),下式的值就應(yīng)當(dāng)較為真時(shí),下式的值就應(yīng)當(dāng)較小小 4nfi221()kiiiifnPnPu(3) 可以證明,當(dāng)可以證明,當(dāng)n充分大時(shí)充分大時(shí)(n 50),若,若H0為真,則統(tǒng)計(jì)量為真,則統(tǒng)計(jì)量u近似服從近似服從(k -r -1)分布。其中分布。其中r為分布為分布F(x)中待定參數(shù)的個(gè)數(shù)中待定參數(shù)的個(gè)數(shù) u于是在給定顯著性水平于是在給定顯著性水平 下,若下,若u就拒絕就拒絕H0,說明總體,說明總體X的真實(shí)分布函數(shù)與的真實(shí)分布函數(shù)與F(x)間存在顯著差異;否則接受間存在顯著差異;否則接受H0,即可以認(rèn)為,即可以認(rèn)為兩者在水平兩者在水平 下并無顯著差異。下并無顯著差異。5221()k

6、iiiifnPnP22(1)k r 某廠有一臺(tái)經(jīng)常需要維修的設(shè)備,該設(shè)備中有一個(gè)易損某廠有一臺(tái)經(jīng)常需要維修的設(shè)備,該設(shè)備中有一個(gè)易損壞的重負(fù)荷軸承,設(shè)備故障的主要原因是軸承損壞。為了壞的重負(fù)荷軸承,設(shè)備故障的主要原因是軸承損壞。為了制定該設(shè)備的維修計(jì)劃和維修預(yù)算,需要了解該軸承的壽制定該設(shè)備的維修計(jì)劃和維修預(yù)算,需要了解該軸承的壽命分布。表命分布。表10.1給出了給出了100個(gè)軸承壽命的觀察數(shù)據(jù),問:個(gè)軸承壽命的觀察數(shù)據(jù),問:該軸承壽命是否服從正態(tài)分布?該軸承壽命是否服從正態(tài)分布?6107 155 105 148 49 143 120 115 142 87 103 141 118 168 12

7、3 105 80 107 172 122 89 69 97 135 92 31 68 88 95 146 99 121 104 63 12 57 120 139 107 156 167 136 173 136 179 129 88 75 144 105 192 149 128 111 127 91 103 145 113 114 123 136 8 190 181 121 158 83 223 93 72 120 130 103 144 89 113 60 76 176 94 190 139 140 151 145 142 118 185 140 59 118 212 117 52 128 1

8、68 174 155 116 解:由表中數(shù)據(jù),用解:由表中數(shù)據(jù),用Excel可求得可求得 =120.95, S2=40.582 ,故可作原假設(shè),故可作原假設(shè) H0:X N (120,402) 將實(shí)軸劃分為如下將實(shí)軸劃分為如下7個(gè)互不相交的區(qū)間。用個(gè)互不相交的區(qū)間。用Excel的的FREQUENCY函數(shù)計(jì)算數(shù)據(jù)落在各區(qū)間內(nèi)的頻函數(shù)計(jì)算數(shù)據(jù)落在各區(qū)間內(nèi)的頻數(shù),用數(shù),用NORMDIST函數(shù)求出各理論頻數(shù)函數(shù)求出各理論頻數(shù)nPi ,統(tǒng)計(jì)量的計(jì)算如表所示。統(tǒng)計(jì)量的計(jì)算如表所示。7x區(qū) 間 fi nPi iiinPnPf2)( (- , 70 11 10.56 0.0183 (70, 90 10 12.1

9、0 0.3645 (90, 110 18 17.47 0.0161 (110, 130 21 19.74 0.0804 (130, 150 19 17.47 0.1340 (150, 170 10 12.10 0.3645 (170, +) 11 10.56 0.0183 合計(jì) 100 100 0.9961 8u取顯著性水平取顯著性水平 = 0.25 (由于原假設(shè)由于原假設(shè)H0是我們希望得到的結(jié)果,為使檢驗(yàn)結(jié)論更是我們希望得到的結(jié)果,為使檢驗(yàn)結(jié)論更具說服力,控制的重點(diǎn)應(yīng)是與原假設(shè)具說服力,控制的重點(diǎn)應(yīng)是與原假設(shè)H0不不真而接受真而接受H0的概率,故的概率,故 應(yīng)取的稍大些應(yīng)取的稍大些)。本例中

10、本例中k = 7,r = 2,k r -1 = 4。u故在水平故在水平 = 0.25下接受原假設(shè)下接受原假設(shè)H0,即,即可認(rèn)為該軸承的使用壽命服從可認(rèn)為該軸承的使用壽命服從N (120,402)分布。分布。9220.250.9961(4)5.385.2 比例差異的比例差異的 檢驗(yàn)(獨(dú)立樣本)檢驗(yàn)(獨(dú)立樣本) u10.2.1 兩個(gè)比例差異的檢驗(yàn)兩個(gè)比例差異的檢驗(yàn) u前面,我們研究了兩個(gè)比例的前面,我們研究了兩個(gè)比例的Z檢驗(yàn)。這部分從不同角檢驗(yàn)。這部分從不同角度檢驗(yàn)數(shù)據(jù)。假設(shè)檢驗(yàn)過程使用近似卡方()分布的度檢驗(yàn)數(shù)據(jù)。假設(shè)檢驗(yàn)過程使用近似卡方()分布的檢驗(yàn)數(shù)據(jù)。檢驗(yàn)數(shù)據(jù)。u如果想要比較兩個(gè)獨(dú)立樣本組

11、的分類變量,可以做兩如果想要比較兩個(gè)獨(dú)立樣本組的分類變量,可以做兩維的列聯(lián)表,顯示每組的第維的列聯(lián)表,顯示每組的第1類(正向類,如類(正向類,如“成功成功”,“是是”等)和第等)和第2類(反向類,如類(反向類,如“失敗失敗”,“否否”等)等)出現(xiàn)的頻數(shù),如表所示出現(xiàn)的頻數(shù),如表所示 22102u為了檢驗(yàn)組一樣本有關(guān)類為了檢驗(yàn)組一樣本有關(guān)類1的比例是否等于第二組樣本的比例是否等于第二組樣本有關(guān)類有關(guān)類1的比例,即假設(shè)檢驗(yàn)為:的比例,即假設(shè)檢驗(yàn)為:u原假設(shè)為兩比例之間無顯著差異:原假設(shè)為兩比例之間無顯著差異: u備擇假設(shè)為兩比例之間有差異:備擇假設(shè)為兩比例之間有差異: u使用卡方(使用卡方( )檢

12、驗(yàn)的基本思路為:)檢驗(yàn)的基本思路為:u(1).確定統(tǒng)計(jì)量為確定統(tǒng)計(jì)量為 (10.2.1) u其中其中 為列聯(lián)表中特定單元的觀測(cè)頻數(shù),為列聯(lián)表中特定單元的觀測(cè)頻數(shù), 為列聯(lián)表中為列聯(lián)表中特定單元的期望頻數(shù),因此這里的統(tǒng)計(jì)量特定單元的期望頻數(shù),因此這里的統(tǒng)計(jì)量 是觀測(cè)頻數(shù)是觀測(cè)頻數(shù)和期望頻數(shù)差的平方除以每單元的期望頻數(shù),并對(duì)表中和期望頻數(shù)差的平方除以每單元的期望頻數(shù),并對(duì)表中的所有單元格取和求得;的所有單元格取和求得;211012:Hpp112:Hpp22()oeefff表 格 中 所 有 元ofef22u(2)可以證明上述統(tǒng)計(jì)量)可以證明上述統(tǒng)計(jì)量 近似服從自由度為近似服從自由度為1的的 分布,

13、因此在顯著性水平下,決策規(guī)則為:分布,因此在顯著性水平下,決策規(guī)則為:u如果如果 ,拒絕,拒絕 u否則,接受否則,接受 。0H122222(1)0H為了計(jì)算任意單元期望頻數(shù)ef, 必須知道如果原假設(shè)為真, 兩項(xiàng)比例1p和2p是相同的。但要計(jì)算的每組樣本比例有可能不同。每組的樣本比例都可以作為參數(shù)1p和2p的估計(jì)值。 將兩個(gè)獨(dú)立比例參數(shù)估計(jì)組合起來的統(tǒng)計(jì)量比各自獨(dú)立的比例參數(shù)估計(jì)提供更多的信息。用p表示兩組組合樣本屬于表 10.3 中類 1 比例的估計(jì)值,則1p就是兩組組合樣本中屬于類 2 比例的估計(jì)值。使用表 10.3 中的符號(hào),p的定義如式(10.2.2)所示。 1212xxXpnnn13這

14、樣,為了計(jì)算屬于類 1(即列聯(lián)表中第一行)的期望頻數(shù)ef,用p乘以組一(或組二)的樣本容量1n(或2n)即可得到;類似的,為了計(jì)算屬于類 2(即列聯(lián)表中第二行)的期望頻數(shù)ef,用1p乘以組一(或組二)的樣本容量1n(或2n)即可得到,如表 10.4 所示。 行變量 列變量 組一 組二 類 1(正向) 1pn 2pn 類 2(反向) 1(1)pn 2(1)pn 應(yīng)用案例應(yīng)用案例 u 有兩家酒店,為了確定服務(wù)質(zhì)量,要求有兩家酒店,為了確定服務(wù)質(zhì)量,要求顧客離開時(shí)做滿意度調(diào)查,顧客可能會(huì)再顧客離開時(shí)做滿意度調(diào)查,顧客可能會(huì)再次入住;根據(jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如表次入?。桓鶕?jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如表10

15、.5所示。問在顯著性水平的情況下,顧所示。問在顯著性水平的情況下,顧客會(huì)回到酒店一和酒店二的比例是否相同客會(huì)回到酒店一和酒店二的比例是否相同。 14酒店 是否再次入住 酒店一 酒店二 總計(jì) 類 1(是) 163 154 317 類 2(否) 64 108 172 總計(jì) 227 262 489 解:(1)設(shè)1p和2p分別為顧客會(huì)回到酒店一和酒店二的比例。 原假設(shè)為顧客回到兩酒店的比例之間無顯著差異:012:Hpp 備擇假設(shè)為兩比例之間有差異:112:Hpp; (2)由表 10.5,利用公式,計(jì)算得到 1212163 1540.6483227262xxpnn; (3)根據(jù)表 10.4,計(jì)算各個(gè)單元

16、的期望頻數(shù)ef,如表 10.6 所示 15(3)根據(jù)表 10.4,計(jì)算各個(gè)單元的期望頻數(shù)ef,如表 10.6 所示 表 10.6 酒店滿意度的 22 列聯(lián)表的期望頻數(shù)ef 列變量 是否再次入住 酒店一 酒店二 類 1(是) 1p n0.6483 227147.16 20.6483 262169.84p n 類 2(否) 1(1)0.3517 22779.84pn 2(1)0.3517 26292.16pn 16(4)根據(jù)公式,計(jì)算2,計(jì)算過程如表 10.7 所示。得到計(jì)算結(jié)果29.05。 表 10.7 酒店顧客滿意度調(diào)查的2檢驗(yàn)計(jì)算 0f ef (0f-ef) 20eff eefff/20 1

17、63 147.16 15.84 250.91 1.71 154 169.84 -15.84 250.91 1.48 64 79.84 -15.84 250.91 3.14 108 92.16 15.84 250.91 2.72 9.05 (5) 查附錄 3 的2分布表, 由于0.05, 自由度為 1, 查得20.05(1)3.841。 171810.2.2 兩個(gè)以上比例差異的檢驗(yàn)兩個(gè)以上比例差異的檢驗(yàn) 假設(shè)有c組獨(dú)立樣本,對(duì)兩類指標(biāo)(類 1 和類 2)有不同的頻數(shù),形成c個(gè)對(duì)于類 1 指標(biāo)的獨(dú)立比例12,cppp。 如此, 可以構(gòu)建具有兩行c列的列聯(lián)表 (如表 10.8) 。 表 10.8 2

18、c 列聯(lián)表 列變量 行變量 組一 組二 組c 總計(jì) 類 1(正向) 1x 2x cx 12, ()cXxxx 類 2(反向) 11nx 22nx ccnx nX 總計(jì) 1n 2n cn 12, ()cnnnn 為了檢驗(yàn)c項(xiàng)比例有沒有區(qū)別的假設(shè),假設(shè)檢驗(yàn)需要解決的是: 原假設(shè)為: cpppH.:210 備擇假設(shè)為: :1H不是所有的ip都相同(1,2,ic) u統(tǒng)計(jì)量是觀測(cè)頻數(shù)和期望頻數(shù)差的平方除以每統(tǒng)計(jì)量是觀測(cè)頻數(shù)和期望頻數(shù)差的平方除以每單元的期望頻數(shù),并對(duì)表中的單元的期望頻數(shù),并對(duì)表中的2c個(gè)所有單元個(gè)所有單元格取和求得格取和求得 因此統(tǒng)計(jì)量因此統(tǒng)計(jì)量 的自由度為的自由度為 192(1)c因

19、此在顯著性水平下,兩個(gè)以上源自獨(dú)立樣本的比例差異假設(shè)檢驗(yàn)的決策規(guī)則為: 如果22(1)c,拒絕cpppH.:210 否則,接受0H。 類似兩個(gè)比例差異的假設(shè)檢驗(yàn),為了計(jì)算式(10.2.1)中的期望頻數(shù)ef, 引入p作為組合 c 項(xiàng)獨(dú)立檢驗(yàn)為一個(gè)總比例檢驗(yàn)的統(tǒng)計(jì)量,如式(10.2.4)。 nXnnnxxxpcc2121 (10.2.4) 20表 10.9 2c 列聯(lián)表中ef的計(jì)算 行變量 列變量 組一 組二 組c 類 1(正向) 1p n 2p n cp n 類 2(反向) 1(1) pn 2(1)pn (1)cpn 應(yīng)用案例應(yīng)用案例 u如果有四家酒店,根據(jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如果有四家酒店,根

20、據(jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如表如表10.10所示。問在顯著性水平的情況下,所示。問在顯著性水平的情況下,顧客會(huì)回到這四家酒店的比例是否相同。顧客會(huì)回到這四家酒店的比例是否相同。21表 10.10 酒店滿意度的 24 列聯(lián)表 酒店 是否再次入住 酒店一 酒店二 酒店三 酒店四 總計(jì) 類 1(是) 173 164 186 199 722 類 2(否) 66 108 71 33 278 總計(jì) 239 272 257 232 1000 解:(1)設(shè)1p,2p,3p和4p分別為顧客會(huì)回到酒店一、酒店二、酒店三和酒店四的比例。 原假設(shè)為顧客回到四家酒店的比例之間無顯著差異:01234:Hpppp;備擇假設(shè)為不

21、是四個(gè)比例都相等。 (2)由表 10.10,利用公式(10.2.4),計(jì)算得到 12341234173 1641861990.722239272257232xxxxpnnnn; (3)根據(jù)表 10.9,計(jì)算各個(gè)單元的期望頻數(shù)ef,如表 10.11 所示 22表 10.11 酒店滿意度的 24 列聯(lián)表的期望頻數(shù)ef 列變量 是否再次入住 酒店一 酒店二 酒店三 酒店四 類 1(是) 172.56 196.38 185.55 167.50 類 2(否) 66.44 75.62 71.45 64.50 表 10.12 酒店顧客滿意度調(diào)查的2檢驗(yàn)計(jì)算 0f ef (0f-ef) 20eff eefff

22、/20 173 172.56 0.44 0.19 0.00 164 196.38 -32.38 1048.72 5.34 186 185.55 0.45 0.20 0.00 199 167.50 31.5 992.25 5.92 66 66.44 -0.44 0.19 0.00 108 75.62 32.38 1048.72 13.87 71 71.45 -0.45 0.20 0.00 33 64.50 -31.5 992.25 15.38 40.52 23(5) 查附錄 3 的2分布表, 由于0.05, 自由度為 3, 查得20.05(3)7.815。由于220.0540.52(3)7.81

23、5,因此,拒絕原假設(shè)0H,可以認(rèn)為顧客會(huì)回到四家酒店的比例不是都相同的 獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)對(duì)于獨(dú)立性檢驗(yàn),要檢驗(yàn)的原假設(shè)和備擇假設(shè)分別是: 0H:兩類變量獨(dú)立(即它們間沒有聯(lián)系) 1H:兩類變量不獨(dú)立(即它們間有聯(lián)系) 再次使用公式(10.2.1)計(jì)算統(tǒng)計(jì)量2。則類似的,在顯著性水平下,檢驗(yàn)的決策規(guī)則為: 拒絕0H,如果)1)(1(2rc2 否則,不拒絕0H 24獨(dú)立性的2檢驗(yàn)與比例2檢驗(yàn)相似。檢驗(yàn)變量和決策規(guī)則相同,但假設(shè)和結(jié)論不同。在比例檢驗(yàn)中,有一個(gè)因子有兩個(gè)或兩個(gè)水平以上(組別,即列聯(lián)表中的列)。這些水平之間是相互獨(dú)立的。每一水平下有兩類結(jié)果(類別,即列聯(lián)表中的行),例如成功和失敗。

24、目的是比較和計(jì)算不同水平下成功比例間的差異。然而,在獨(dú)立檢驗(yàn)中,存在兩個(gè)因子,每個(gè)因子有兩個(gè)或兩個(gè)以上的水平(即列聯(lián)表中的行數(shù)和列數(shù)可能分別有兩個(gè)或兩個(gè)以上)。選擇一個(gè)樣本,在列聯(lián)表單元中記錄兩類變量不同水平間組合的個(gè)數(shù)。 u假設(shè)在上面例子中的酒店顧客滿意度的調(diào)查中,假設(shè)在上面例子中的酒店顧客滿意度的調(diào)查中,向表明不會(huì)再次入住酒店的顧客問第二個(gè)問題。向表明不會(huì)再次入住酒店的顧客問第二個(gè)問題。即不會(huì)再次入住的原因是什么,包括價(jià)格、位即不會(huì)再次入住的原因是什么,包括價(jià)格、位置、客房服務(wù)和其他等。調(diào)查結(jié)果的列聯(lián)表如置、客房服務(wù)和其他等。調(diào)查結(jié)果的列聯(lián)表如表表10.14所示。試問在顯著性水平的情況下,

25、所示。試問在顯著性水平的情況下,不會(huì)再次入住理由與酒店之間是否有聯(lián)系?不會(huì)再次入住理由與酒店之間是否有聯(lián)系?25表 10.14 不會(huì)再次入住酒店理由的列聯(lián)表 酒店 不再入住理由 酒店一 酒店二 酒店三 酒店四 總計(jì) 價(jià)格 23 20 40 10 93 位置 35 55 5 10 105 客房服務(wù) 6 11 20 6 43 其他 2 22 6 7 37 總計(jì) 66 108 71 33 278 解:在上述44列聯(lián)表中,每個(gè)單元的觀測(cè)頻數(shù)表示顧客不會(huì)再次入住酒店的聯(lián)合記錄。檢驗(yàn)所要完成的任務(wù)是分析這些不再入住理由與酒店之間是否獨(dú)立。因此,分析步驟如下: (1) 原假設(shè)與備擇假設(shè)分別是: 0H:不會(huì)再

26、次入住理由和酒店間沒有聯(lián)系 1H:不會(huì)再次入住理由和酒店間有聯(lián)系 26(1) 根據(jù)公式(10.2.1)計(jì)算統(tǒng)計(jì)量2,這里公式中0f即為表 10.14 中特定單元的觀測(cè)頻數(shù);ef為如果獨(dú)立假設(shè)為真,特定單元的期望頻數(shù)。為了計(jì)算ef,根據(jù)獨(dú)立事件概率的乘法法則,引入公式(10.2.6) n nnn 列總計(jì)行總計(jì)列總計(jì)行總計(jì)樣本容量列 因 子 概 率行 因 子 概 率PPfe (10.2.6) 表 10.15 不會(huì)再次入住酒店理由的期望頻數(shù)ef 酒店 不再入住理由 酒店一 酒店二 酒店三 酒店四 總計(jì) 價(jià)格 22.08 36.13 23.75 11.04 93 位置 24.93 40.79 26.8

27、2 12.46 105 客房服務(wù) 10.21 16.71 10.98 5.10 43 其他 8.78 14.37 9.45 4.39 37 總計(jì) 66 108 71 33 278 27通過計(jì)算得統(tǒng)計(jì)量07.692 (1) 顯著性水平0.05,自由度=(4 1)(4 1)9,查附錄 3 得到919.16) 9 (205. 0,由于919.16) 9 (07.69205. 02,因此拒絕原假設(shè),即認(rèn)為不會(huì)再次入住的理由與酒店之間是不獨(dú)立的,存在很大的相關(guān)性, 結(jié)果也可以通過 Excel 表求得的 P值說明 (如圖 10.3 所示) ,P值等于112.31 10遠(yuǎn)遠(yuǎn)小于0.05。 2810.3 兩個(gè)

28、相關(guān)樣本比例差異檢驗(yàn)兩個(gè)相關(guān)樣本比例差異檢驗(yàn) 上述幾節(jié)用2檢驗(yàn)來檢驗(yàn)比例差異時(shí)都要求獨(dú)立性條件。 然而, 有時(shí)檢驗(yàn)比例間差異的數(shù)據(jù)來自重復(fù)度量或配對(duì)取樣,因此樣本相關(guān)。譬如,當(dāng)希望確定在一段時(shí)期態(tài)度、比例、或行為是否發(fā)生變化時(shí),這樣的情況經(jīng)常發(fā)生。 29下面首先介紹 McNEMAR 檢驗(yàn)的基本思路。假設(shè)從一樣本總體中調(diào)查條件 1 和條件 2 的情況,得到結(jié)果的匯總表如表 10.17 的列聯(lián)表。 表 10.17 McNEMAR 檢驗(yàn)的 22 列聯(lián)表 條件(組)條件(組)2 條件(組)條件(組)1 是是 否否 總計(jì)總計(jì) 是是 A B A+B 否否 C D C+D 總計(jì)總計(jì) A+C B+D n 則樣

29、本比例是 nBAfo1為對(duì)條件 1 反應(yīng)為是的比例; nAfCo2為對(duì)條件 2 反應(yīng)為是的比例; 總體比例為: 1ef:對(duì)條件 1 反應(yīng)為是的總體比例; 2ef:對(duì)條件 2 反應(yīng)為是的總體比例; 30McNEMAR 檢驗(yàn)所要進(jìn)行的檢驗(yàn)任務(wù)是: 原假設(shè)為012:eeHff 備擇假設(shè)是112:eeHff 為此,定義如公式(10.3.1)的統(tǒng)計(jì)量 CBCBZ (10.3.1) 該統(tǒng)計(jì)量近似服從標(biāo)準(zhǔn)正態(tài)分布,因此在特定的顯著性水平下,可以運(yùn)用如下的檢驗(yàn)決策規(guī)則: 如果2/ZZ ,則拒絕原假設(shè)0H 否則,就接受原假設(shè)0H。 31應(yīng)用案例應(yīng)用案例假設(shè)有一 600 人的顧客組被選擇來作酒店入住的市場(chǎng)調(diào)查,顧

30、客被要求在兩競(jìng)爭(zhēng)酒店 S 和 V 之間作選擇。有 282 位成員選擇 S 酒店,318 位成員選擇 V 酒店。在得知 V 酒店實(shí)行市場(chǎng)競(jìng)爭(zhēng)策略后,同樣的 600 人組被詢問選擇,得出以下結(jié)果:在先前選擇 S 酒店的 282 人中,246 人維持原有選擇,36 人改投 V 酒店。在先前選擇V 酒店的 318 人中,306 人維持原有選擇,12 人改投 S 酒店。結(jié)果顯示于表 10.18所示。請(qǐng)問在顯著性水平0.05下,V 酒店實(shí)行市場(chǎng)競(jìng)爭(zhēng)策略前后,兩個(gè)總體比例之間是否有差異。 32表 10.18 酒店的支持率 市場(chǎng)競(jìng)爭(zhēng)后 市場(chǎng)競(jìng)爭(zhēng)前 S 酒店 V 酒店 總計(jì) S 酒店 246 36 282 V

31、酒店 12 306 318 總計(jì) 258 342 600 解:(1)設(shè)12,eeff為 S 酒店實(shí)行市場(chǎng)競(jìng)爭(zhēng)策略前后的兩個(gè)總體比例。為了確定市場(chǎng)競(jìng)爭(zhēng)策略對(duì)總體比例的差異,問題抽象成為兩個(gè)相關(guān)樣本的比例差異檢驗(yàn),其原假設(shè)為012:eeHff,備擇假設(shè)是112:eeHff (1) 確定統(tǒng)計(jì)量36 123.464136 12BCZBC,得到47. 0600362461nBAfo, 43. 060012246Co2nAf (2) 查 附 錄 2 的 標(biāo) 準(zhǔn) 正 態(tài) 分 布 表 , 得 到/20.0251.96ZZ, 由 于0.0253.46411.96ZZ, 因此拒絕原假設(shè), 即認(rèn)為實(shí)行市場(chǎng)競(jìng)爭(zhēng)策略后

32、,選擇兩酒店的比例是顯著不同的。由于12ooff,因此說明實(shí)行市場(chǎng)競(jìng)爭(zhēng)策略后,更多的顧客選擇了 V 酒店,放棄了 S 酒店。 33u如果樣本容量很小,并且無法確定樣本數(shù)據(jù)是如果樣本容量很小,并且無法確定樣本數(shù)據(jù)是否來自正態(tài)分布總體,此時(shí)可以選擇以下兩種否來自正態(tài)分布總體,此時(shí)可以選擇以下兩種方法來分析兩獨(dú)立總體均值間的區(qū)別:方法來分析兩獨(dú)立總體均值間的區(qū)別:u(1)用不依賴于正態(tài)總體假設(shè)的)用不依賴于正態(tài)總體假設(shè)的Wilcoxon秩和檢驗(yàn);秩和檢驗(yàn);u(2)對(duì)于數(shù)據(jù)進(jìn)行正態(tài)轉(zhuǎn)換后使用合并方差)對(duì)于數(shù)據(jù)進(jìn)行正態(tài)轉(zhuǎn)換后使用合并方差的的t檢驗(yàn)。檢驗(yàn)。u本節(jié)介紹用本節(jié)介紹用Wilcoxon秩和檢驗(yàn)來檢

33、驗(yàn)兩組值秩和檢驗(yàn)來檢驗(yàn)兩組值間是否有差別。在合乎這些檢驗(yàn)的條件下,間是否有差別。在合乎這些檢驗(yàn)的條件下,Wilcoxon秩和檢驗(yàn)和合并方差及獨(dú)立方差的秩和檢驗(yàn)和合并方差及獨(dú)立方差的t檢驗(yàn)一樣有效;當(dāng)檢驗(yàn)一樣有效;當(dāng)t檢驗(yàn)假設(shè)不符合時(shí),檢驗(yàn)假設(shè)不符合時(shí),Wilcoxon秩和檢驗(yàn)更有效。秩和檢驗(yàn)更有效。3410.4 兩個(gè)獨(dú)立總體的非參數(shù)分析:兩個(gè)獨(dú)立總體的非參數(shù)分析:Wilcoxon秩和檢驗(yàn)秩和檢驗(yàn)秩 設(shè)X為一總體,將一容量為n的樣本觀察值按從小到大的次序編號(hào)排列成 (1)(2)( )nXXX,稱( ) iX的足標(biāo)i為( ) iX的秩,1,2,in。當(dāng)其中幾個(gè)數(shù)據(jù)相等時(shí),那么這幾個(gè)數(shù)據(jù)的秩取平均值

34、。 35現(xiàn)設(shè)自總體 1,2 分別抽取容量為12,n n的樣本,設(shè)兩樣本獨(dú)立,且設(shè)12nnn。這里總假定12nn,將這12nn個(gè)樣本值放在一起,按自小到大的次序排列,求出每個(gè)樣本值的秩,然后將屬于第 1 個(gè)總體的樣本值的秩相加,設(shè)為1T,稱為第 1 個(gè)樣本的秩和;其余樣本的秩總和記為2T,稱為第 2 樣本的秩和。且滿足公式(10.4.1)。 2) 1(2) 1)(212121nnnnnnTT (10.4.1) 當(dāng)樣本1n和2n都不大于 10 時(shí),使用附表 6 找出檢驗(yàn)數(shù)據(jù)1T的臨界值。對(duì)于雙邊檢驗(yàn), 如果計(jì)算值1T等于或大于上臨界值或1T等于或小于下臨界值, 拒絕原假設(shè)。對(duì)于備擇假設(shè) 211:M

35、MH的單邊檢驗(yàn),如果觀測(cè)值1T等于或小于下臨界值,拒絕原假設(shè)。 對(duì)于備擇假設(shè)211:MMH的單邊檢驗(yàn), 如果觀測(cè)值1T等于或大于上臨界值,拒絕原假設(shè)。 36對(duì)于大樣本,檢驗(yàn)統(tǒng)計(jì)量1T近似服從均值1T,標(biāo)準(zhǔn)差為1T的正態(tài)分布,其中 2111nnT (10.4.2) 121211nnnT (10.4.3) 因此,可以采用 Z 檢驗(yàn),統(tǒng)計(jì)量為: 121212111nnnnnTZ (10.4.4) 應(yīng)用案例應(yīng)用案例為了說明超市物品的銷售情況是否跟物品的擺放位置有關(guān)??紤]如某一物品的擺放位置:正常貨架和過道擺放。假設(shè)共有 20 家配置基本相同的店面,隨機(jī)選擇其中的 10 家作為第 1 組,將物品放置在正

36、常貨架;剩余 10 家作為第 2 組,將物品放置在過道;一周后,記錄該物品的銷售額,表 10.20 所示。如果認(rèn)為總體不服從正態(tài)分布,請(qǐng)用 Wilcoxon 秩和檢驗(yàn)說明在顯著性水平0.05的情況下,兩種擺放位置是否影響銷售額。 表 10.20 兩種不同的銷售位置的每周銷量比較 正常 過道 22 34 52 62 30 40 64 84 56 59 52 71 76 54 67 83 66 90 77 84 37解:(1)由于不能確定哪個(gè)位置的均值高,使用以下原假設(shè)和備擇假設(shè)的雙邊檢驗(yàn): 210:MMH(均值相等) 211:MMH(均值不等) (2)為了進(jìn)行 Wilcoxon 秩和檢驗(yàn),計(jì)算1

37、n=10 正常貨架分布銷售和2n=10 過道銷售的秩。表 10.21 顯示了組合秩。 38表 10.21 組合秩 銷售銷售 正常貨架(正常貨架(1n=10=10) 組合秩組合秩 過道擺放(過道擺放(2n=10=10) 組合秩組合秩 22 1.0 52 5.5 34 3.0 71 14.0 52 5.5 76 15.0 62 10.0 54 7.0 30 2.0 67 13.0 40 4.0 83 17.0 64 11.0 66 12.0 84 18.5 90 20.0 56 8.0 77 16.0 59 9.0 84 18.5 (3) 計(jì)算小樣本秩的總和1T。 在這案例中, 兩樣本容量相等,

38、任一組可計(jì)算1T。選擇正常貨架擺放作為第一樣本, 1T=1+3+5.5+10+2+4+11+18.5+8+9=72 為了對(duì)秩和檢驗(yàn)進(jìn)行檢驗(yàn),計(jì)算2T 2T=5.5+14+15+7+13+17+12+20+16+18.5=138 使用公式(10.4.1)顯示組合秩的總和等于1T+2T: 2121nnTT 72+138=20(21)/2=210 210=210 (4)為了檢驗(yàn)原假設(shè),兩總體均值間沒有區(qū)別,使用附表 6 決定檢驗(yàn)數(shù)據(jù)1T的上下臨界值。表 10.22 是附表 6 的一部分,在 0.05 顯著性水平下,臨界值是 78 和132。決策規(guī)則是 拒絕0H,如果1T78 或1T132; 否則,接

39、受0H 39(5)因?yàn)闄z驗(yàn)統(tǒng)計(jì)量1T=7278,拒絕0H,認(rèn)為兩種擺放的銷售均值間有很大差異。因?yàn)橥ǖ冷N售秩總和較高,因而通道銷售均值較高 4010.5 單因素方差分析的非參數(shù)分析:?jiǎn)我蛩胤讲罘治龅姆菂?shù)分析:Kruskal-Wallis秩檢驗(yàn)秩檢驗(yàn)u如果第如果第9章中單因素方差分析的章中單因素方差分析的F檢驗(yàn)的正態(tài)分檢驗(yàn)的正態(tài)分布假設(shè)條件不符合時(shí),可以使用布假設(shè)條件不符合時(shí),可以使用Kruskal-Wallis秩檢驗(yàn)。秩檢驗(yàn)。Kruskal-Wallis秩檢驗(yàn)是秩檢驗(yàn)是兩獨(dú)立總體兩獨(dú)立總體Wilcoxon秩和檢驗(yàn)的延伸,主要秩和檢驗(yàn)的延伸,主要用于檢驗(yàn)項(xiàng)獨(dú)立總體是否有相等均值。用于檢驗(yàn)項(xiàng)獨(dú)立

40、總體是否有相等均值。Kruskal-Wallis秩檢驗(yàn)和單因素方差分析的秩檢驗(yàn)和單因素方差分析的F檢驗(yàn)一樣有效。檢驗(yàn)一樣有效。41使用Kruskal-Wallis秩檢驗(yàn)來檢驗(yàn)(2)c c項(xiàng)獨(dú)立總體是否有相等均值。 原假設(shè): cMMMH.:210 備擇假設(shè): ),都相等(其中不是所有的c.21j:j1MH 其中,(1,2, )jMjc是第j個(gè)總體的均值。 為了進(jìn)行Kruskal-Wallis 秩檢驗(yàn),首先將各自樣本容量為(1,2, )jn jc的樣本組合形成總樣本容量為n(12cnnnn)的組合樣本,并用它們的復(fù)合秩替代樣本數(shù)據(jù)。組合樣本最小值的秩為 1,最大值的秩為n。如果幾個(gè)樣本數(shù)據(jù)是相等的,那么這幾個(gè)數(shù)據(jù)的秩取平均值。 42

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論