分布檢驗(yàn)和擬合優(yōu)度χ2檢驗(yàn)課件_第1頁(yè)
分布檢驗(yàn)和擬合優(yōu)度χ2檢驗(yàn)課件_第2頁(yè)
分布檢驗(yàn)和擬合優(yōu)度χ2檢驗(yàn)課件_第3頁(yè)
分布檢驗(yàn)和擬合優(yōu)度χ2檢驗(yàn)課件_第4頁(yè)
分布檢驗(yàn)和擬合優(yōu)度χ2檢驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)第八章第八章 分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)第八章 分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)Kolmogorov-Smirnov 單樣本檢驗(yàn)及一些正態(tài)性檢驗(yàn)單樣本檢驗(yàn)及一些正態(tài)性檢驗(yàn)1235Kolmogorov-Smirnov 兩樣本分布檢驗(yàn)兩樣本分布檢驗(yàn)Pearson 2 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)第一節(jié)第一節(jié) KS單樣本分布檢驗(yàn)單樣本分布檢驗(yàn)v一、適用范圍一、適用范圍vKolmogorov-Smirnov檢驗(yàn)常譯為柯爾莫哥洛夫檢驗(yàn)常譯為柯爾莫哥洛夫-斯斯米爾諾夫檢驗(yàn),簡(jiǎn)寫為米爾

2、諾夫檢驗(yàn),簡(jiǎn)寫為K-S檢驗(yàn),亦稱檢驗(yàn),亦稱D檢驗(yàn)法,也檢驗(yàn)法,也是一種擬合優(yōu)度檢驗(yàn)法。是一種擬合優(yōu)度檢驗(yàn)法。K-S單樣本檢驗(yàn)主要用來檢單樣本檢驗(yàn)主要用來檢驗(yàn)一組樣本數(shù)據(jù)的實(shí)際分布是否與某一指定的理論驗(yàn)一組樣本數(shù)據(jù)的實(shí)際分布是否與某一指定的理論分布相符合。分布相符合。v二、基本原理和方法二、基本原理和方法v1、基本原理:、基本原理:v這種檢驗(yàn)主要是將理論分布下的累計(jì)頻數(shù)分布與觀這種檢驗(yàn)主要是將理論分布下的累計(jì)頻數(shù)分布與觀察到的累計(jì)頻數(shù)分布相比較,找出它們間最大的差察到的累計(jì)頻數(shù)分布相比較,找出它們間最大的差異點(diǎn),并參照抽樣分布,定出這樣大的差異是否處異點(diǎn),并參照抽樣分布,定出這樣大的差異是否處于

3、偶然。于偶然。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)2、方法、方法v用用 Fn(x)表示樣本量為表示樣本量為n的隨機(jī)樣本觀察值的的隨機(jī)樣本觀察值的累計(jì)分布函數(shù),且累計(jì)分布函數(shù),且Fn(x) =i/n(i是等于或小于是等于或小于x的所有觀察結(jié)果的數(shù)目,的所有觀察結(jié)果的數(shù)目,i=1,2,n)。)。F(x)表示理論分布的累計(jì)概率分布函數(shù)。表示理論分布的累計(jì)概率分布函數(shù)。K-S單樣本檢驗(yàn)通過樣本的累計(jì)分布函數(shù)單樣本檢驗(yàn)通過樣本的累計(jì)分布函數(shù)Fn(x)和理和理論分布函數(shù)論分布函數(shù)F(x)的比較來做擬合優(yōu)度檢驗(yàn)。檢的比較來做擬合優(yōu)度檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量是驗(yàn)統(tǒng)計(jì)量是F(x)與與Fn(x)間的最大偏差間的

4、最大偏差Dn: v若對(duì)每一個(gè)若對(duì)每一個(gè)x值來說,值來說,F(xiàn)n(x)與與F(x)都十分接近,則表都十分接近,則表明實(shí)際樣本的分布函數(shù)與理論分布函數(shù)的擬合程度很明實(shí)際樣本的分布函數(shù)與理論分布函數(shù)的擬合程度很高。高。)()(maxDxFxFnn分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、檢驗(yàn)步驟三、檢驗(yàn)步驟v1.建立假設(shè)組:建立假設(shè)組:vH0:Fn(x)=F(x)vH1:Fn(x)F(x)v2.計(jì)算樣本累計(jì)頻率與理論分布累計(jì)概率的計(jì)算樣本累計(jì)頻率與理論分布累計(jì)概率的絕對(duì)差,令最大的絕對(duì)差為絕對(duì)差,令最大的絕對(duì)差為Dn;v3.用樣本容量用樣本容量n和顯著水平和顯著水平a在附表在附表11中查出中查

5、出臨界值臨界值Dna;v4.通過通過Dn與與Dna的比較做出判斷,若的比較做出判斷,若DnDna,則認(rèn)為擬合是滿意的。則認(rèn)為擬合是滿意的。)()(maxDxFxFnn分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)四、實(shí)例四、實(shí)例v例例8.1:正態(tài)擬合。:正態(tài)擬合。v某織布廠工人執(zhí)行的生產(chǎn)定額(織機(jī)每小時(shí)生產(chǎn)織某織布廠工人執(zhí)行的生產(chǎn)定額(織機(jī)每小時(shí)生產(chǎn)織物的米物)情況如表物的米物)情況如表8-1,試檢驗(yàn)這些樣本數(shù)據(jù)能,試檢驗(yàn)這些樣本數(shù)據(jù)能否作正態(tài)擬合?否作正態(tài)擬合?v表表8-1 工人執(zhí)行生產(chǎn)定額情況分組表工人執(zhí)行生產(chǎn)定額情況分組表按定額執(zhí)行情況分組工人數(shù)3.753.754.2520204.254

6、.254.753723724.754.755.254984985.255.255.751031035.755.756.257 710001000分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)例例8.1 正態(tài)擬合正態(tài)擬合v解:首先,由于做正態(tài)擬合的均值、標(biāo)準(zhǔn)差解:首先,由于做正態(tài)擬合的均值、標(biāo)準(zhǔn)差未知,因此,先計(jì)算樣本均值和標(biāo)準(zhǔn)差,再未知,因此,先計(jì)算樣本均值和標(biāo)準(zhǔn)差,再做正態(tài)擬合。通過對(duì)樣本資料的計(jì)算得:做正態(tài)擬合。通過對(duì)樣本資料的計(jì)算得: =4.85;s=0.352,分別作為分別作為和和的估計(jì)值,的估計(jì)值,建立假設(shè):建立假設(shè):vH0:樣本數(shù)據(jù)服從均值為:樣本數(shù)據(jù)服從均值為4.85,標(biāo)準(zhǔn)差為,

7、標(biāo)準(zhǔn)差為0.352的正態(tài)分布的正態(tài)分布vH1:樣本數(shù)據(jù)不服從均值為:樣本數(shù)據(jù)不服從均值為4.85,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為0.352的正態(tài)分布的正態(tài)分布v計(jì)算資料列如表計(jì)算資料列如表8-2:x分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)表表8-2v表表8-2 正態(tài)擬合計(jì)算表正態(tài)擬合計(jì)算表X的組限標(biāo) 準(zhǔn) 化標(biāo)準(zhǔn)正態(tài)概率累計(jì)概率 ( 理論概率) 累計(jì)工人數(shù)實(shí) 際 累計(jì) 頻 率(2)-(4)的絕 對(duì)值甲甲乙乙(1)(2)(3)(4)(5)不足不足4.25-1.700.0450.0450.0450.04520200.0200.0200.0250.0254.25-4.75-1.70-0.280.3450.3

8、900.3903923920.3920.3920.0020.0024.75-5.25-0.281.140.4830.4830.8730.8738908900.8900.8900.0170.0175.25-5.751.142.560.1220.1220.9950.9959939930.9930.9930.0020.0025.75-6.252.56-+0.0050.0051.0001.000100010001.0001.0000.0000.000合合 計(jì)計(jì)1.0001.000-分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)例例8.1v根據(jù)表根據(jù)表8-2中第中第(5)列數(shù)據(jù),取最大絕對(duì)差數(shù)列數(shù)據(jù),取

9、最大絕對(duì)差數(shù)1ooo =0.025作為檢驗(yàn)統(tǒng)計(jì)量。若取作為檢驗(yàn)統(tǒng)計(jì)量。若取a=0.05,n=1000,從臨界值表中查得:,從臨界值表中查得:v 。v因?yàn)橐驗(yàn)?ooo0.043,故認(rèn)為樣本數(shù)據(jù)所提供的信息,故認(rèn)為樣本數(shù)據(jù)所提供的信息無(wú)法拒絕無(wú)法拒絕H0,即接受,即接受H0,認(rèn)為可做正態(tài)分布的擬合。,認(rèn)為可做正態(tài)分布的擬合。v檢驗(yàn)法是一種精確分布的方法,不受觀察次檢驗(yàn)法是一種精確分布的方法,不受觀察次數(shù)多少的限制。這個(gè)方法可應(yīng)用于分組或不分組的數(shù)多少的限制。這個(gè)方法可應(yīng)用于分組或不分組的情形。檢驗(yàn)量情形。檢驗(yàn)量Dn也可用于檢驗(yàn)隨機(jī)樣本是否抽自某也可用于檢驗(yàn)隨機(jī)樣本是否抽自某特定的總體的問題。特定的

10、總體的問題。(1000,0.05)1.36D0.0431000分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)第二節(jié)第二節(jié) K-S雙樣本分布檢驗(yàn)雙樣本分布檢驗(yàn)v一、適用范圍一、適用范圍vK-S雙樣本檢驗(yàn)主要用來檢驗(yàn)兩個(gè)獨(dú)立樣本是否來自雙樣本檢驗(yàn)主要用來檢驗(yàn)兩個(gè)獨(dú)立樣本是否來自同一總體(或兩樣本的總體分布是否相同)。其單同一總體(或兩樣本的總體分布是否相同)。其單尾檢驗(yàn)主要用來檢驗(yàn)?zāi)骋粯颖镜目傮w值是否隨機(jī)地尾檢驗(yàn)主要用來檢驗(yàn)?zāi)骋粯颖镜目傮w值是否隨機(jī)地大于(或小于)另一樣本的總體值。大于(或小于)另一樣本的總體值。v二、理論依據(jù)和方法二、理論依據(jù)和方法v1、理論依據(jù):、理論依據(jù):v與與K-S單樣本檢

11、驗(yàn)相似,單樣本檢驗(yàn)相似,K-S雙樣本檢驗(yàn)是通過兩個(gè)雙樣本檢驗(yàn)是通過兩個(gè)樣本的累計(jì)頻數(shù)分布是否相當(dāng)接近來判斷樣本的累計(jì)頻數(shù)分布是否相當(dāng)接近來判斷Ho是否為是否為真。如果兩個(gè)樣本間的累計(jì)概率分布的離差很大,真。如果兩個(gè)樣本間的累計(jì)概率分布的離差很大,這就意味著兩樣本來自不這就意味著兩樣本來自不同的總體,就應(yīng)拒絕同的總體,就應(yīng)拒絕Ho。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)2、方法、方法v如果令如果令S1(x)表示第一個(gè)樣本觀察值)表示第一個(gè)樣本觀察值的累計(jì)概率分布函數(shù),的累計(jì)概率分布函數(shù),S2(x)表示另)表示另一個(gè)樣本觀察值的累計(jì)概率分布函數(shù),一個(gè)樣本觀察值的累計(jì)概率分布函數(shù),那么那么K

12、-S雙樣本的單尾檢驗(yàn)統(tǒng)計(jì)量為:雙樣本的單尾檢驗(yàn)統(tǒng)計(jì)量為: vK-S雙樣本的雙尾檢驗(yàn)統(tǒng)計(jì)量為:雙樣本的雙尾檢驗(yàn)統(tǒng)計(jì)量為: )()(maxD21xSxS)()(max21xSxSD分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、檢驗(yàn)步驟三、檢驗(yàn)步驟v1、雙尾檢驗(yàn)假設(shè):、雙尾檢驗(yàn)假設(shè):H0:S1(x)=S2(x)v H1:S1(x)S2(x)v 單尾檢驗(yàn)假設(shè):?jiǎn)挝矙z驗(yàn)假設(shè):vH0:S1(x)=S2(x)或或H0:S1(x)=S2(x)vH1:S1(x)S2(x) H1:S1(x)S2(x)v 2、把兩組樣本分別排成累計(jì)頻數(shù)分布(對(duì)兩、把兩組樣本分別排成累計(jì)頻數(shù)分布(對(duì)兩個(gè)分布用相同的間隔或分類,并

13、利用盡可能多個(gè)分布用相同的間隔或分類,并利用盡可能多的間隔。的間隔。v3、計(jì)算檢驗(yàn)統(tǒng)計(jì)量、計(jì)算檢驗(yàn)統(tǒng)計(jì)量D值,如是單尾檢驗(yàn),應(yīng)值,如是單尾檢驗(yàn),應(yīng)按按H1的方向計(jì)算的方向計(jì)算D值。值。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、檢驗(yàn)步驟三、檢驗(yàn)步驟v4、顯著性檢驗(yàn):、顯著性檢驗(yàn):v小樣本情況下,及小樣本情況下,及n1= n2=n,n30,用附,用附表表12。對(duì)于單尾檢驗(yàn)和雙尾檢驗(yàn),該表列出。對(duì)于單尾檢驗(yàn)和雙尾檢驗(yàn),該表列出了不同顯著性水平下的臨界值。了不同顯著性水平下的臨界值。v大樣本情況下,大樣本情況下,n1不一定等于不一定等于n2,但都小,但都小于于40的雙尾檢驗(yàn),可用附表的雙尾檢驗(yàn)

14、,可用附表12續(xù)表中的公式續(xù)表中的公式算出算出D的臨界值。的臨界值。v當(dāng)當(dāng) n1和和n2都較大,但又是單尾檢驗(yàn)時(shí),用都較大,但又是單尾檢驗(yàn)時(shí),用算式算式 22212n(2)124n nDnn分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)四、實(shí)例四、實(shí)例v例例8.2(小樣本)檢驗(yàn)兩礦的金屬含量率是否(小樣本)檢驗(yàn)兩礦的金屬含量率是否相同。在甲、乙兩礦坑中各抽取相同。在甲、乙兩礦坑中各抽取10個(gè)礦石樣個(gè)礦石樣本,礦石中含有某種金屬含量率(本,礦石中含有某種金屬含量率(%)的資料)的資料如表如表8-3所示:所示:v表表7-3v解:這是一個(gè)雙樣本的解:這是一個(gè)雙樣本的K-S檢驗(yàn),根據(jù)題意,檢驗(yàn),根據(jù)題

15、意,建立雙側(cè)檢驗(yàn)假設(shè)組:建立雙側(cè)檢驗(yàn)假設(shè)組:v )()(H)()(H10 xFxFxFxF乙甲乙甲:甲礦3.1 1.2 2.9 3.0 0.6 2.8 1.6 1.7 3.2 1.7乙乙礦礦3.8 2.1 3.2 7.2 2.3 3.5 3.0 4.6 3.1 3.2分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)四、實(shí)例四、實(shí)例v1、列等距分組表,計(jì)算各組次數(shù)、列等距分組表,計(jì)算各組次數(shù)f甲甲、f乙乙 ,累計(jì)次,累計(jì)次數(shù)數(shù)F甲甲、F乙乙,累計(jì)頻率,累計(jì)頻率 、 及其差額。計(jì)算及其差額。計(jì)算結(jié)果列如表結(jié)果列如表8-4所示。所示。v表表7-4 例例7.2的計(jì)算表的計(jì)算表v 乙乙nF甲甲nF金屬含量

16、率(%)次數(shù)累計(jì)次數(shù)累計(jì)頻率F甲/10- F乙/10f甲甲f乙乙F甲甲F乙乙F甲甲/10F乙乙/100.00.910101/1001/101.01.940505/1005/102.02.922727/102/105/103.03.93610810/108/102/104.04.90110910/109/101/105.05.90010910/109/101/106.06.90010910/109/101/107.07.901101010/1010/100分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)四、實(shí)例四、實(shí)例v2、確定檢驗(yàn)統(tǒng)計(jì)量:、確定檢驗(yàn)統(tǒng)計(jì)量: v本例本例 D=5/10v3、檢驗(yàn)與判

17、斷。由于、檢驗(yàn)與判斷。由于n1=n2=10,屬小樣本,查附表,屬小樣本,查附表12得臨界值得臨界值0.05=7/10,因?yàn)?,因?yàn)镈=5/10C,故在,故在5%的顯著性水平下拒絕的顯著性水平下拒絕Ho,即,即高分組的學(xué)生智力顯著高于低分組的學(xué)生。高分組的學(xué)生智力顯著高于低分組的學(xué)生。986.1544544454)406. 0(4D42212122nnnn分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)第三節(jié) 卡方卡方(2)擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)v一、什么是卡方(2)擬合優(yōu)度檢驗(yàn)v人們通常關(guān)心隨機(jī)變量的概率分布,如:人們通常關(guān)心隨機(jī)變量的概率分布,如:“隨機(jī)變隨機(jī)變量服從參數(shù)為量服從參數(shù)為n=10

18、和和p=2的二項(xiàng)分布的二項(xiàng)分布”,這樣的命,這樣的命題假設(shè)可以用題假設(shè)可以用“擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)”來檢驗(yàn)。即設(shè)計(jì)一來檢驗(yàn)。即設(shè)計(jì)一個(gè)檢驗(yàn)來比較從假設(shè)的分布中抽取的樣本,看所假個(gè)檢驗(yàn)來比較從假設(shè)的分布中抽取的樣本,看所假設(shè)的分布函數(shù)與樣本數(shù)據(jù)是否設(shè)的分布函數(shù)與樣本數(shù)據(jù)是否“擬合擬合”。v所以,擬合檢驗(yàn)就是檢驗(yàn)抽取樣本的總體分布與某所以,擬合檢驗(yàn)就是檢驗(yàn)抽取樣本的總體分布與某種特定分布的符合程度,也就是檢驗(yàn)觀察值與理論種特定分布的符合程度,也就是檢驗(yàn)觀察值與理論數(shù)之間的緊密程度。以數(shù)之間的緊密程度。以2分布為依據(jù)的這種檢驗(yàn),分布為依據(jù)的這種檢驗(yàn),稱為稱為2擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)分布檢驗(yàn)和擬

19、合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v英國(guó)統(tǒng)計(jì)學(xué)家英國(guó)統(tǒng)計(jì)學(xué)家Pearson(皮爾遜皮爾遜)于于1900年首先年首先提出了卡方統(tǒng)計(jì)量。提出了卡方統(tǒng)計(jì)量。v1 1、數(shù)據(jù):由隨機(jī)變量、數(shù)據(jù):由隨機(jī)變量X X的的N N個(gè)觀測(cè)組成。這個(gè)觀測(cè)組成。這N N個(gè)個(gè)觀測(cè)可劃分為觀測(cè)可劃分為k k類,即類,即把把X的樣本空間的樣本空間S劃分成劃分成k個(gè)互不相交的部分個(gè)互不相交的部分S1,S2,Sk,且,且Si與與Sj相互獨(dú)立。即相互獨(dú)立。即vSiSj=,(ij), v記記Oi為類為類i中的觀測(cè)數(shù),中的觀測(cè)數(shù),i=1,2,k.則則k1issikiN1iO第三節(jié) 卡方卡方(2)擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)

20、度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v2 2、假設(shè)條件、假設(shè)條件 1.1.樣本是隨機(jī)的樣本是隨機(jī)的 2. 2.度量尺度至少是名義的度量尺度至少是名義的 3 3、檢驗(yàn)統(tǒng)計(jì)量、檢驗(yàn)統(tǒng)計(jì)量 在零假設(shè)為真的條件下,令在零假設(shè)為真的條件下,令X X的一個(gè)隨機(jī)觀測(cè)的一個(gè)隨機(jī)觀測(cè)落入類落入類i i的概率為的概率為p pi 。定義。定義E Ei為為H H0為真時(shí)觀測(cè)值落為真時(shí)觀測(cè)值落入類入類i i的期望觀測(cè)數(shù),即的期望觀測(cè)數(shù),即E Ei= =piN, i=1,2,k.給出給出如下卡方檢驗(yàn)統(tǒng)計(jì)量:如下卡方檢驗(yàn)統(tǒng)計(jì)量: N)(1i22n1i22nkiikiiiEOEEO,該式也等價(jià)于第三節(jié) 卡方卡方(2)擬合優(yōu)度檢驗(yàn)擬

21、合優(yōu)度檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)4 4、零分布:由于、零分布:由于 的精確分布難以求得,所的精確分布難以求得,所以我們用自由度為以我們用自由度為k-1的卡方的卡方 分布來近似。分布來近似。5、假設(shè)組:、假設(shè)組: H0: pi =p (i=1,2,k.) H1: pi p (對(duì)某個(gè)(對(duì)某個(gè)i.) 若若 (自由度為自由度為k-1的卡方分布的的卡方分布的1-a分位數(shù)),則拒絕分位數(shù)),則拒絕H0,p-值近似等于值近似等于p(X2(c-1)Q),這個(gè)概率可由附表,這個(gè)概率可由附表10獲得。獲得。21)-k (212n2n第三節(jié) 卡方卡方(2)擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)分布檢驗(yàn)和擬

22、合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、2檢驗(yàn)的具體步驟v1 1. .數(shù)據(jù)分組數(shù)據(jù)分組. .根據(jù)樣本觀測(cè)值的范圍劃分為根據(jù)樣本觀測(cè)值的范圍劃分為組;組;v2.2.求落在各組的頻數(shù)求落在各組的頻數(shù)i和頻率和頻率Yi/ n 。v3.3.求理論概率求理論概率i。當(dāng)。當(dāng)0成立時(shí)成立時(shí),出現(xiàn)在出現(xiàn)在(bi-1,bi )內(nèi)的概率內(nèi)的概率iv4.計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算檢驗(yàn)統(tǒng)計(jì)量2。v5. .求出拒絕域求出拒絕域.根據(jù)給定的顯著性水平根據(jù)給定的顯著性水平和自和自由度由度k-r-1查查2分布表(附表分布表(附表10),可得臨界),可得臨界值值C,統(tǒng)計(jì)量,統(tǒng)計(jì)量2的拒絕域?yàn)榈木芙^域?yàn)?C。v6. .作出判斷作出判斷.若

23、若2C則拒絕則拒絕0,否則接受,否則接受0。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)實(shí)例實(shí)例 單樣本擬合檢驗(yàn)單樣本擬合檢驗(yàn)v一、檢驗(yàn)?zāi)彻潭ū嚷实募僭O(shè)一、檢驗(yàn)?zāi)彻潭ū嚷实募僭O(shè)v例例8.4:據(jù)標(biāo)準(zhǔn)規(guī)定,某批:據(jù)標(biāo)準(zhǔn)規(guī)定,某批工業(yè)產(chǎn)品中不良品的比例工業(yè)產(chǎn)品中不良品的比例為為10%,則可檢驗(yàn)如下假設(shè):,則可檢驗(yàn)如下假設(shè):0:P=0.1;v 1:P0.1。v為此,我們?cè)诋a(chǎn)品批中抽出為此,我們?cè)诋a(chǎn)品批中抽出100個(gè)作為樣本,發(fā)現(xiàn)不個(gè)作為樣本,發(fā)現(xiàn)不合格品數(shù)(合格品數(shù)(Y1)為)為16,則合格品數(shù),則合格品數(shù)Y2=100-16=84。v當(dāng)當(dāng)0成立時(shí),不合格品的期望數(shù)應(yīng)為成立時(shí),不合格品的期望數(shù)應(yīng)為nP

24、1=10個(gè),相個(gè),相應(yīng)地,合格品的期望數(shù)應(yīng)地,合格品的期望數(shù)n(1-P1)=90。則:。則:vk=,自由度為,自由度為k-1=1,顯著水平,顯著水平a0.05,查表,查表10得得臨界值為臨界值為3.841。由于。由于n2a2,所以,所以拒絕拒絕o假設(shè)。假設(shè)。490)9086(10)1016()(22122nkiiiinpnpy分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)二、檢驗(yàn)?zāi)彻潭ū嚷实募僭O(shè)二、檢驗(yàn)?zāi)彻潭ū嚷实募僭O(shè)v例例8.5:檢驗(yàn)隨機(jī)變量在檢驗(yàn)隨機(jī)變量在(,) 區(qū)間是否為均勻分區(qū)間是否為均勻分布。假設(shè)如下:布。假設(shè)如下:v0:在(:在(0,1)區(qū)間為均勻分布(假設(shè)分)區(qū)間為均勻分布(假設(shè)

25、分10類,類,pi=1/10););v1:在(:在(0,1)區(qū)間不是均勻分布)區(qū)間不是均勻分布(pip1/10);v從未知總體中抽取從未知總體中抽取50個(gè)樣本。為了檢驗(yàn),我們可以個(gè)樣本。為了檢驗(yàn),我們可以將(將(0,1)區(qū)間分為)區(qū)間分為10等份,即等份,即00.1,0.10.2,0.91.0。如果。如果o為真,那么任何觀察值為真,那么任何觀察值落入類落入類i的概率為的概率為1/10,任何小區(qū)間的期望觀測(cè)數(shù)為,任何小區(qū)間的期望觀測(cè)數(shù)為(1/10)50=5。實(shí)例實(shí)例 單樣本擬合檢驗(yàn)單樣本擬合檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)例例8.5v實(shí)際實(shí)際50個(gè)樣本落入類個(gè)樣本落入類i的觀察

26、如下:的觀察如下:v區(qū)間區(qū)間 0- -0.1 0.1- -0.2 0.2-0.3 0.3- -0.4 0.4- -0.5 0.5-0.6v觀測(cè)數(shù)觀測(cè)數(shù) 6 4 5 6 7 4v區(qū)間區(qū)間 0.6- -0.7 0.7-0.8 0.8-0.9 0.9- -1.0v觀測(cè)數(shù)觀測(cè)數(shù) 6 5 3 4v檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量v查查2分布表,自由度為,顯著水平分布表,自由度為,顯著水平a=0.05時(shí),時(shí),查得查得a2=16.92,因,因2=2.80a2 ,所以接受,所以接受o假設(shè),即觀察值取自均勻分布。假設(shè),即觀察值取自均勻分布。8 . 25545) 56 ()(2210122)(iiiinnpnpy分布檢驗(yàn)和擬

27、合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、檢驗(yàn)多面體無(wú)偏性的假設(shè)、檢驗(yàn)多面體無(wú)偏性的假設(shè)v例例8.6:以六面體的骰子為例。如果將一顆骰子拋:以六面體的骰子為例。如果將一顆骰子拋擲擲120次,其結(jié)果如表次,其結(jié)果如表8-4-4所示:所示:v表表8-48-4v根據(jù)題意,檢驗(yàn)假設(shè)如下:根據(jù)題意,檢驗(yàn)假設(shè)如下:vo:這顆骰子是無(wú)偏的:這顆骰子是無(wú)偏的(pi=1/6);v1:這顆骰子是有偏的:這顆骰子是有偏的(pi1/6);v如果零假設(shè)為真,各點(diǎn)出現(xiàn)的期望次數(shù)如果零假設(shè)為真,各點(diǎn)出現(xiàn)的期望次數(shù)v nP1=1/6120=20點(diǎn)數(shù)123456合計(jì)觀測(cè)次數(shù)觀測(cè)次數(shù)132816103221120實(shí)例實(shí)例 單樣本擬合

28、檢驗(yàn)單樣本擬合檢驗(yàn)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、檢驗(yàn)多面體無(wú)偏性的假設(shè)三、檢驗(yàn)多面體無(wú)偏性的假設(shè)v例例8.6:v檢驗(yàn)統(tǒng)計(jì)量為:檢驗(yàn)統(tǒng)計(jì)量為:v查查2分布表,自由度分布表,自由度k-1=6-1=5,取,取a=0.05,查得,查得a2=11.07因因20.052,故應(yīng)拒絕,故應(yīng)拒絕o假設(shè),認(rèn)為假設(shè),認(rèn)為這顆骰子是有偏的。這顆骰子是有偏的。7 .1820)2021(20)2013()(226122niiiinpnpy分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)實(shí)例實(shí)例 總體分布擬合檢驗(yàn)總體分布擬合檢驗(yàn)v一、正態(tài)分布擬合一、正態(tài)分布擬合v例例8.7:一家鐘表廠把檢驗(yàn)鐘表的精確度作

29、為質(zhì)量控:一家鐘表廠把檢驗(yàn)鐘表的精確度作為質(zhì)量控制的一部分。該廠將制的一部分。該廠將700只手表效準(zhǔn)后使之走只手表效準(zhǔn)后使之走24小時(shí),小時(shí),然后記下每只表走快或走慢的秒數(shù)然后記下每只表走快或走慢的秒數(shù)( (數(shù)據(jù)見表數(shù)據(jù)見表5- -3)。這些數(shù)據(jù)是否提供了充分的證據(jù),說明觀察值并非這些數(shù)據(jù)是否提供了充分的證據(jù),說明觀察值并非來自正態(tài)總體。來自正態(tài)總體。v解:假設(shè):解:假設(shè):0:樣本數(shù)據(jù)來自正態(tài)總體分布;樣本數(shù)據(jù)來自正態(tài)總體分布;v1:樣本數(shù)據(jù)并非來自正態(tài)總體分布。樣本數(shù)據(jù)并非來自正態(tài)總體分布。v表表8- -3中,中,K=11=11,實(shí)際觀察頻數(shù),實(shí)際觀察頻數(shù)Oi已知,預(yù)期頻數(shù)已知,預(yù)期頻數(shù)Ei

30、則尚需確定。則尚需確定。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)表53 700只手表時(shí)間誤差的頻數(shù)分布2424小時(shí)內(nèi)走快或走慢的秒數(shù)小時(shí)內(nèi)走快或走慢的秒數(shù)表的數(shù)目表的數(shù)目O Oi0 09.999.993838101019.9919.995151202029.9929.996262303039.9939.997474404049.9949.998383505059.9959.999191606069.9969.998181707079.9979.997272808089.9989.996161909099.9999.995252100100109.99109.993535合計(jì)合計(jì)70070

31、0分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)一、正態(tài)分布擬合一、正態(tài)分布擬合v1.1.預(yù)期頻數(shù)預(yù)期頻數(shù)Ei的計(jì)算的計(jì)算v根據(jù)概率分布原理,我們可以通過求正態(tài)分布曲根據(jù)概率分布原理,我們可以通過求正態(tài)分布曲線下的面積來確定理論預(yù)期頻數(shù)。為了計(jì)算正態(tài)線下的面積來確定理論預(yù)期頻數(shù)。為了計(jì)算正態(tài)分布曲線下的面積,利用公式分布曲線下的面積,利用公式Zo=(Xo-u)u)/將將Xo標(biāo)準(zhǔn)化,求標(biāo)準(zhǔn)正態(tài)表上相應(yīng)的面積(即頻率)。標(biāo)準(zhǔn)化,求標(biāo)準(zhǔn)正態(tài)表上相應(yīng)的面積(即頻率)。v因?yàn)榱慵僭O(shè)中并沒指定總體分布的均值因?yàn)榱慵僭O(shè)中并沒指定總體分布的均值(u)(u)和標(biāo)和標(biāo)準(zhǔn)差準(zhǔn)差()()。所以只有將樣本均值。所以只有

32、將樣本均值 =54.71和標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差S=27.61分別作為分別作為u和和的估計(jì)值。的估計(jì)值。v如在區(qū)間如在區(qū)間10-19.99內(nèi)的預(yù)期頻數(shù),可按如下步內(nèi)的預(yù)期頻數(shù),可按如下步驟計(jì)算:驟計(jì)算:分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v1. .預(yù)期頻數(shù)預(yù)期頻數(shù)Ei的計(jì)算的計(jì)算v(1)(1)分別對(duì)分別對(duì)x=10和和x=20標(biāo)準(zhǔn)化:標(biāo)準(zhǔn)化:Z=(=(10-54.71)/27.61=-1.62和和Z=(=(20-54.71) )/27.61=-1.26。其余類推。其余類推。v(2)(2)查標(biāo)準(zhǔn)正態(tài)分布表,介于查標(biāo)準(zhǔn)正態(tài)分布表,介于0和和-1.62之間的面積之間的面積(概率)為(概率)為0.44

33、74,介于,介于0和和-1.26之間的面積為之間的面積為0.3962,所以介于,所以介于-1.62和和-1.26之間的面積等于之間的面積等于0.4474-0.3962=0.0512。其余類推。其余類推。v(3)(3)于是落在于是落在10與與20之間的預(yù)期頻數(shù)為之間的預(yù)期頻數(shù)為0.0512700=35.84。其余類推。其余類推。一、正態(tài)分布擬合一、正態(tài)分布擬合分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v2.2.約束條件約束條件r r的確定的確定v預(yù)期頻數(shù)之和必等于預(yù)期頻數(shù)之和必等于700,即等于樣本容量,即等于樣本容量,這就構(gòu)成一個(gè)約束;這就構(gòu)成一個(gè)約束;v又由于我們必須通過樣本來估計(jì)又由于

34、我們必須通過樣本來估計(jì)u和和,所以,所以對(duì)數(shù)據(jù)還須增加兩個(gè)約束。于是對(duì)數(shù)據(jù)還須增加兩個(gè)約束。于是=3,自由度,自由度k-=11-3=8。v注意:如果注意:如果u和和在零假設(shè)中已被指定,那就不在零假設(shè)中已被指定,那就不必再用樣本數(shù)據(jù)來估計(jì),這時(shí)必再用樣本數(shù)據(jù)來估計(jì),這時(shí)=1。v檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量X2= (Oi-i) )2/i=20.3558,2的臨的臨界值為界值為15.507。由于。由于2的計(jì)算值大于臨界值,所的計(jì)算值大于臨界值,所以否定零假設(shè),樣本數(shù)據(jù)并非來自正態(tài)分布。以否定零假設(shè),樣本數(shù)據(jù)并非來自正態(tài)分布。一、正態(tài)分布擬合一、正態(tài)分布擬合分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)小預(yù)期

35、頻數(shù)小預(yù)期頻數(shù)v在應(yīng)用卡方檢驗(yàn)時(shí),有可能遇到預(yù)期頻數(shù)很小的情在應(yīng)用卡方檢驗(yàn)時(shí),有可能遇到預(yù)期頻數(shù)很小的情形,這時(shí)將隨機(jī)分布取作卡方的近似分布并不完全形,這時(shí)將隨機(jī)分布取作卡方的近似分布并不完全正確。正確。v對(duì)于什么樣的預(yù)期頻數(shù)才算小預(yù)期頻數(shù),學(xué)者們的對(duì)于什么樣的預(yù)期頻數(shù)才算小預(yù)期頻數(shù),學(xué)者們的意見并不一致。較保守的學(xué)者一般要求預(yù)期頻數(shù)至意見并不一致。較保守的學(xué)者一般要求預(yù)期頻數(shù)至少應(yīng)大于等于少應(yīng)大于等于5。而科庫(kù)蘭。而科庫(kù)蘭ochran( (1952,1954) )主張預(yù)期頻數(shù)小于主張預(yù)期頻數(shù)小于1的就算小預(yù)期頻數(shù),很多學(xué)者同的就算小預(yù)期頻數(shù),很多學(xué)者同意這種意見。本教材也采用了這一觀點(diǎn)。意這

36、種意見。本教材也采用了這一觀點(diǎn)。v對(duì)小預(yù)期頻數(shù)的處理一般采用的科克蘭的法則。如對(duì)小預(yù)期頻數(shù)的處理一般采用的科克蘭的法則。如將相鄰類目的頻數(shù)合并(前提是不破壞其分類意將相鄰類目的頻數(shù)合并(前提是不破壞其分類意義),以達(dá)到所要求的最小頻數(shù)。合并后的類數(shù)應(yīng)義),以達(dá)到所要求的最小頻數(shù)。合并后的類數(shù)應(yīng)相應(yīng)地減小。相應(yīng)地減小。分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)二、二項(xiàng)分布擬合二、二項(xiàng)分布擬合v例例8.88.8: 一個(gè)市場(chǎng)分析員想研究食品店的顧客對(duì)待一個(gè)市場(chǎng)分析員想研究食品店的顧客對(duì)待信用卡付款方式的態(tài)度。研究員從信用卡付款方式的態(tài)度。研究員從100家超級(jí)市家超級(jí)市場(chǎng)各抽選了場(chǎng)各抽選了25名經(jīng)

37、常性顧客作為隨機(jī)樣本,并對(duì)名經(jīng)常性顧客作為隨機(jī)樣本,并對(duì)其中每一個(gè)進(jìn)行訪問以確定此人是否喜歡除信用其中每一個(gè)進(jìn)行訪問以確定此人是否喜歡除信用卡付款方式以外的別的某種付款方式。調(diào)查結(jié)果卡付款方式以外的別的某種付款方式。調(diào)查結(jié)果列于表列于表8-5:v解:這個(gè)分析員應(yīng)先提出如下假設(shè):解:這個(gè)分析員應(yīng)先提出如下假設(shè):v 0:在這些容量為:在這些容量為25的樣本中,喜歡另外某的樣本中,喜歡另外某種付款方式的顧客數(shù)服從二項(xiàng)分布;種付款方式的顧客數(shù)服從二項(xiàng)分布;v 1:不服從二項(xiàng)分布。(?。翰环亩?xiàng)分布。(取a=0.05)分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)表5-5 例5.5中的抽樣結(jié)果喜歡另外

38、某一種付款方式的顧客數(shù)商店數(shù)0 04 41 15 52 28 83 310104 414145 515156 612127 716168 810109 96 61010或更多或更多0 0合計(jì)合計(jì)100100二、二項(xiàng)分布擬合二、二項(xiàng)分布擬合分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v首先求得首先求得P的估計(jì)值如下:的估計(jì)值如下:P=4(0)+5(1)+8(2)+6(9)/2500=0.20。v由于二項(xiàng)分布的參數(shù)由于二項(xiàng)分布的參數(shù)P沒有指定,必須通過沒有指定,必須通過樣本數(shù)據(jù)對(duì)它作出估計(jì),因此要損失一個(gè)自樣本數(shù)據(jù)對(duì)它作出估計(jì),因此要損失一個(gè)自由度。由度。v1.1.預(yù)期頻數(shù)預(yù)期頻數(shù)iv通過計(jì)算函

39、數(shù)通過計(jì)算函數(shù)f(x)=C25x(0.2)x(0.8)25-x(其中其中x為某一特定商店中喜歡另外某種付款方式的為某一特定商店中喜歡另外某種付款方式的顧客數(shù)顧客數(shù),x=0,1,2,25)或查的或查的二項(xiàng)分二項(xiàng)分布表布表,可以得到所需的相對(duì)預(yù)期頻數(shù)。,可以得到所需的相對(duì)預(yù)期頻數(shù)。二、二項(xiàng)分布擬合二、二項(xiàng)分布擬合分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)v2.2.自由度的確定自由度的確定v合并后的類目數(shù)合并后的類目數(shù)10,但由于預(yù)期頻數(shù)之和,但由于預(yù)期頻數(shù)之和必須與觀察頻數(shù)之和一致,這個(gè)自由度應(yīng)必須與觀察頻數(shù)之和一致,這個(gè)自由度應(yīng)減去,又由于必須通過樣本數(shù)據(jù)來估減去,又由于必須通過樣本數(shù)據(jù)來估計(jì),自由度再減。于是真正的自由度應(yīng)計(jì),自由度再減。于是真正的自由度應(yīng)為為10-2=8。v檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量=28.1=28.1v顯著性水平顯著性水平a=0.05和自由度和自由度8相對(duì)應(yīng)的相對(duì)應(yīng)的2的臨界值為的臨界值為15.507。因?yàn)?。因?yàn)?的計(jì)算值大于的計(jì)算值大于的臨界值,所以否定零假設(shè),從而得出這的臨界值,所以否定零假設(shè),從而得出這些數(shù)據(jù)并非來自二項(xiàng)分布總體的結(jié)論(些數(shù)據(jù)并非來自二項(xiàng)分布總體的結(jié)論(P0.05)。)。二、二項(xiàng)分布擬合二、二項(xiàng)分布擬合分布檢驗(yàn)和擬合優(yōu)度分布檢驗(yàn)和擬合優(yōu)度2檢驗(yàn)檢驗(yàn)三、泊松分布擬合三、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論