3.7總體分布的檢驗(yàn)_第1頁
3.7總體分布的檢驗(yàn)_第2頁
3.7總體分布的檢驗(yàn)_第3頁
3.7總體分布的檢驗(yàn)_第4頁
3.7總體分布的檢驗(yàn)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、3.7 分布擬合檢驗(yàn)分布擬合檢驗(yàn)一一 分布擬合檢驗(yàn)分布擬合檢驗(yàn) 1 分布假設(shè)分布假設(shè) 2 檢驗(yàn)法基本思想檢驗(yàn)法基本思想二二 擬合檢驗(yàn)法的一般步驟擬合檢驗(yàn)法的一般步驟 222 在前面的課程中,我們已經(jīng)了解了假在前面的課程中,我們已經(jīng)了解了假設(shè)檢驗(yàn)的基本思想,并討論了當(dāng)總體分布設(shè)檢驗(yàn)的基本思想,并討論了當(dāng)總體分布為正態(tài)時(shí),關(guān)于其中未知參數(shù)的假設(shè)檢驗(yàn)為正態(tài)時(shí),關(guān)于其中未知參數(shù)的假設(shè)檢驗(yàn)問題問題 . 然而可能遇到這樣的情形,總體服從何然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對(duì)總體種理論分布并不知道,要求我們直接對(duì)總體分布提出一個(gè)假設(shè)分布提出一個(gè)假設(shè) . 例如,從例如,從150

2、0到到1931年的年的432年間,每年年間,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,椐統(tǒng)爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,椐統(tǒng)計(jì),這計(jì),這432年間共爆發(fā)了年間共爆發(fā)了299次戰(zhàn)爭(zhēng),具體數(shù)據(jù)次戰(zhàn)爭(zhēng),具體數(shù)據(jù)如下如下:戰(zhàn)爭(zhēng)次數(shù)戰(zhàn)爭(zhēng)次數(shù)X01234 22314248154 發(fā)生發(fā)生 X次戰(zhàn)爭(zhēng)的年數(shù)次戰(zhàn)爭(zhēng)的年數(shù) 在概率論中,大家對(duì)泊松分布產(chǎn)生的一在概率論中,大家對(duì)泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù),可以用一個(gè)泊松隨機(jī)變量來近似爭(zhēng)的次數(shù),可以用一個(gè)泊松隨機(jī)變量來近似描述描述 . 也就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)也就是說,我們可以假設(shè)每

3、年爆發(fā)戰(zhàn)爭(zhēng)次數(shù)分布爭(zhēng)次數(shù)分布X近似泊松分布近似泊松分布.上面的數(shù)據(jù)能否證實(shí)上面的數(shù)據(jù)能否證實(shí)X 具有具有泊松分布的假設(shè)是正確的?泊松分布的假設(shè)是正確的?現(xiàn)在的問題是:現(xiàn)在的問題是:又如,某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢又如,某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢查,抽取查,抽取100個(gè)鐘作試驗(yàn),撥準(zhǔn)后隔個(gè)鐘作試驗(yàn),撥準(zhǔn)后隔24小時(shí)小時(shí)以后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)以后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)按秒記錄下來按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?分布?再如,某工廠制造一批骰子,再如,某工廠制造一批骰子,聲稱它是均勻的聲稱它是均勻的.為檢驗(yàn)骰子是否

4、均勻,要把骰子實(shí)地投擲為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與1/6的差距的差距.也就是說,在投擲中,出也就是說,在投擲中,出現(xiàn)現(xiàn)1點(diǎn),點(diǎn),2點(diǎn),點(diǎn),6點(diǎn)的概點(diǎn)的概率都應(yīng)是率都應(yīng)是1/6.得到的數(shù)據(jù)能否說明得到的數(shù)據(jù)能否說明“骰子均勻骰子均勻”的假設(shè)是可信的?的假設(shè)是可信的?問題是:?jiǎn)栴}是:K.皮爾遜皮爾遜這是一項(xiàng)很重要的工作,不少人這是一項(xiàng)很重要的工作,不少人把它視為近代統(tǒng)計(jì)學(xué)的開端把它視為近代統(tǒng)計(jì)學(xué)的開端. 解決這類問題的工具是英國統(tǒng)計(jì)學(xué)家解決這類問題的工具是英國統(tǒng)計(jì)學(xué)家K.皮爾遜在皮爾遜在1900年發(fā)表的一篇文章中引進(jìn)年發(fā)表的一篇文章中

5、引進(jìn)的所謂的所謂 檢驗(yàn)法檢驗(yàn)法.2 一一 分布擬合檢分布擬合檢驗(yàn)驗(yàn) 21 分布假設(shè)分布假設(shè)1201,( ),:( )(3.1):( )nX XXX XF xHXF xHXF x設(shè)樣本來自總體的分布函數(shù)為未知關(guān)于分布的一般假設(shè)是總體 的分布函數(shù)為總體 的分布函數(shù)不為01(1),(3.1):,1,2,(3.2)iiXHXP Xxp iL注若已知 為離散型總體 則相當(dāng)于總體 的分布律為0(2),(3.1):( )(3.3)XHXf x若已知 為連續(xù)型總體 則相當(dāng)于總體 的概率密度為220*2*20:( ,),.,:( ,)nnHXNx sHXN x s 例如其中未知 則分別用其極大似然估計(jì)代替 故實(shí)

6、際上檢驗(yàn)的是02( ),.HF x注若在下的形式已知 但其參數(shù)值未知時(shí)則需用極大似然估計(jì)值代替未知參數(shù) 再作假設(shè)檢驗(yàn)2 檢驗(yàn)法基本思想檢驗(yàn)法基本思想22,:檢驗(yàn)法主要依據(jù)頻率與概率的關(guān)系 建立近似的檢驗(yàn)統(tǒng)計(jì)量以進(jìn)行分布擬合檢驗(yàn) 具體思想是12112(1),., ,1,2,.,.,.kkiijikSAAAAS A Aij i jkAAAS首先將隨機(jī)試驗(yàn)可能結(jié)果的全體 即樣本空間劃分成個(gè)互不相容的事件滿足即為 的一個(gè)劃分0(2),()( ),()1,2,.,iiiiiiHApP AF xApP Aik在為真時(shí) 計(jì)算每個(gè) 的概率 即若中未知參數(shù)用相應(yīng)極大似然估計(jì)值代替則得 的近似概率值1(3),1,

7、2,., ,ikiiinAn iknn統(tǒng)計(jì)在 次試驗(yàn)中 事件 出現(xiàn)的實(shí)際頻數(shù)且有0,.,iiiiiiiippAnpnpnAHnnpn而 或?yàn)?出現(xiàn)的概率或?yàn)?次試驗(yàn)中 出現(xiàn)的理論頻數(shù)。當(dāng)為真時(shí) 與應(yīng)相差無多且隨 的增大差異會(huì)愈來愈小。022221(4):50,(3.4)1,()(1)(3.5)kiiiinHkrnnpkrnpr可以證明 當(dāng)在為真時(shí)統(tǒng)計(jì)量總是近似服從自由度為的分布其中 為被估計(jì)的參數(shù)的個(gè)數(shù)。221,()(3.4),/.kiiiiiiinnpnpnnpnn基于這種想法 皮爾遜使用統(tǒng)計(jì)量來衡量實(shí)際頻數(shù) 與理論頻數(shù)或?qū)嶋H頻率與概率之間差異程度。002200,(3.5)(1)(3.6)(

8、3.6),HHkrHH于是 在為真時(shí) 可由式得到顯著性水平為時(shí)的拒絕域?yàn)槿粲蓸颖居^察值計(jì)算得成立 則拒絕否則接受 皮爾遜定理是在皮爾遜定理是在n無限無限增大時(shí)推導(dǎo)出來增大時(shí)推導(dǎo)出來的,因而在使用時(shí)要注意的,因而在使用時(shí)要注意n要足夠大要足夠大,以及,以及npi 不太小不太小這兩個(gè)條件這兩個(gè)條件. 根據(jù)計(jì)算實(shí)踐,要求根據(jù)計(jì)算實(shí)踐,要求n不小于不小于50,以及,以及npi 都都不小于不小于 5. 否則應(yīng)適當(dāng)合并區(qū)間,使否則應(yīng)適當(dāng)合并區(qū)間,使npi滿滿足這個(gè)要求足這個(gè)要求 .201,:1),:( ),( ),.iiiP XxpXpHXf xXf xH由似合檢驗(yàn)法的基本思想 進(jìn)行分布擬合檢驗(yàn)的一般步驟

9、為利用頻率直方圖提出假設(shè)當(dāng) 是離散型為已知分布律當(dāng) 是連續(xù)型是已知概率密度而可不必寫出 其中未知參數(shù)用極大似然估計(jì)值代替二二 擬合檢驗(yàn)法的一般步驟擬合檢驗(yàn)法的一般步驟21kiinn123),1,2,.,( )4)iiiiaianp inP XxXpf x dxX計(jì)算理論頻數(shù)的值為離散型其中為連續(xù)型編制檢驗(yàn)計(jì)算表121212),.,.,(1,2,., ),niiniix xxXxXnx xxiaainX分組并統(tǒng)計(jì)實(shí)際頻數(shù)樣本值中出現(xiàn)的個(gè)數(shù)為離散型樣本值落入第段的個(gè)數(shù)當(dāng) 為連續(xù)型 檢驗(yàn)計(jì)算表檢驗(yàn)計(jì)算表2).(,),1(,)7) 1()(, 1)6)5022212220 xFXHrkrknpnpnH

10、rkrkiiii的分布函數(shù)不是認(rèn)為拒絕則若的觀察值由樣本值計(jì)算得的拒絕域?yàn)榇_定及自由度由顯著性水平數(shù)個(gè)數(shù)確定分布中被估計(jì)的參 讓我們回到開始的一個(gè)例子,檢驗(yàn)每讓我們回到開始的一個(gè)例子,檢驗(yàn)每年爆發(fā)戰(zhàn)爭(zhēng)次數(shù)分布是否服從泊松分布年爆發(fā)戰(zhàn)爭(zhēng)次數(shù)分布是否服從泊松分布.提出假設(shè)提出假設(shè)H0: X服從參數(shù)為服從參數(shù)為 的泊松分布的泊松分布 按參數(shù)按參數(shù)為為0.69的泊松分布,計(jì)算事件的泊松分布,計(jì)算事件X=i 的的概率概率pi ,=0.69X 將有關(guān)計(jì)算結(jié)果列表如下將有關(guān)計(jì)算結(jié)果列表如下:pi的估計(jì)是的估計(jì)是,i=0,1,2,3,4!69. 069. 0iepii根據(jù)觀察結(jié)果,得參數(shù)根據(jù)觀察結(jié)果,得參數(shù)

11、的極大似然估計(jì)為的極大似然估計(jì)為 因因H0所假設(shè)的理論分布中有一個(gè)未知所假設(shè)的理論分布中有一個(gè)未知參數(shù),故自由度為參數(shù),故自由度為4-1-1=2.x 0 1 2 3 4fi 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 iiinpnpf2)(0.1830.376 0.251 1.623戰(zhàn)爭(zhēng)次數(shù)戰(zhàn)爭(zhēng)次數(shù)實(shí)測(cè)頻數(shù)實(shí)測(cè)頻數(shù)ip ip 14.162.43將將n 5的組予以合并,即將發(fā)生的組予以合并,即將發(fā)生3次及次及4次次戰(zhàn)爭(zhēng)的組歸并為一組戰(zhàn)爭(zhēng)的組歸并為一組.ip 故認(rèn)為每年發(fā)生戰(zhàn)爭(zhēng)的次數(shù)故認(rèn)為每年發(fā)生戰(zhàn)爭(zhēng)的次

12、數(shù)X服從服從參數(shù)為參數(shù)為0.69的泊松分布的泊松分布.按按 =0.05,自由度為,自由度為4-1-1=2查查 分布表得分布表得2 =5.991)2(205. 0 2 =2.435.991,由于統(tǒng)計(jì)量由于統(tǒng)計(jì)量2 的實(shí)測(cè)值的實(shí)測(cè)值未落入否定域未落入否定域.7,.7:例臺(tái)自動(dòng)機(jī)床在相同條件下 獨(dú)立完成相同的工序,在一段時(shí)間內(nèi)統(tǒng)計(jì) 臺(tái)機(jī)床故障數(shù)的資料如下機(jī)床代號(hào) 1 2 3 4 5 6 7故障頻數(shù) 2 10 11 8 13 19 7?).(050機(jī)床本身質(zhì)量有關(guān)試問故障的發(fā)生是否與00:,1,2,.,7,:11):,1,2,.,77iXXHHpPXii解 設(shè)為出現(xiàn)故障的機(jī)床代號(hào) 則的可能取值為欲檢驗(yàn)

13、故障的發(fā)生與機(jī)床本身質(zhì)量無關(guān) 則每臺(tái)機(jī)床出現(xiàn)故障是等可能的 提出相應(yīng)的假設(shè)712),703):/7101,2,.,7iiinnpni故障實(shí)際頻數(shù)由題設(shè)給出故障理論頻數(shù)為檢驗(yàn)計(jì)算表2)4207)16.812.592,.H由計(jì)算表得故應(yīng)拒絕認(rèn)為故障的發(fā)生與機(jī)床無關(guān) 而與機(jī)床本身質(zhì)量有關(guān)。22200.055),06)0.05,170 16(1)(6)12.592rkrHkr 無參數(shù)被估計(jì)顯著性水平自由度的拒絕域?yàn)?).(X:H,X:)(.解服從正態(tài)分布檢驗(yàn)法檢驗(yàn)假設(shè)要求利用歲男孩子的身高表示用歲男孩身高的資料名給出某地下頁下表例05012121202302表3.3.2 某地12歲男孩身高資料(單位:

14、厘米)42. 7,555 .139,),(12:) 12220XNXH用極大似然估計(jì)值代替未知,其中服從正態(tài)分布?xì)q男孩的身高提出假設(shè)2):122.7,160.3.126,130,134,138,142,146,150,1549.(,126),126.140,.154,)分組 數(shù)據(jù)的最小值最大值故取實(shí)數(shù)將實(shí)數(shù)軸分為 個(gè)區(qū)間12120,.,1,2,.,9ix xxn i 統(tǒng)計(jì)數(shù)據(jù)落入各個(gè)區(qū)間的個(gè)數(shù)24):列出檢驗(yàn)計(jì)算表如下1126 139.53)1260.03447.42pP X 計(jì)算2126130130 139.5126 139.50.06997.427.42pPX iAinipipniipnn

15、iiipn/ )pnn(,(126,(130126,(134130,(138134,(142138,(146142,(150146,(154150),(150581022332011650. 03440. 06990. 12940. 19100. 21240. 17750. 11160. 5220.02564.1288.02815.5322.9225.4921.3013.396.263.070. 872-0.028-5.53-0.927.51-1.30-2.39-0.261.930. 18170. 00011. 96590. 03691. 21260. 07930. 42650. 01081.

16、2133120112006.172207)6.1272 12.592,12(139.5, 55)HXN由 計(jì) 算 表 得故 應(yīng) 接 受認(rèn) 為該 地 區(qū) 歲 男 孩 的 身 高 服 從 正 態(tài) 分 布。202220.055),26)0.05,192 16(1)(6)12.592rkrHkr 被估計(jì)的參數(shù)為故顯著性水平自由度的拒絕域?yàn)閚 Step01:打開主菜單 【Analyze(分析)】 【Nonparametric Tests(非參數(shù)檢驗(yàn))】【Legacy Dialogs(舊對(duì)話框)】【Chi-Square(卡方)】 ,彈出【Chi-Square Test(卡方檢驗(yàn))】對(duì)話框 .三、卡方檢驗(yàn)的

17、三、卡方檢驗(yàn)的SPSS19.0操作詳解操作詳解n Step02:選擇檢驗(yàn)變量 在【Chi-Square Test(卡方檢驗(yàn))】對(duì)話框左側(cè)的候選變量中選擇一個(gè)或幾個(gè)變量將其添加至【Test Variable List(檢驗(yàn)變量列表)】列表框中,表示需要進(jìn)行進(jìn)行卡方檢驗(yàn)的變量。Step03:確定檢驗(yàn)范圍 在圖6-1的【Expected Range】復(fù)選欄可以確定檢驗(yàn)值的范圍,對(duì)應(yīng)有兩個(gè)單選項(xiàng)。 Get from data:系統(tǒng)默認(rèn)項(xiàng),即由最小值和最大值所確定的范圍,。 Use specified range:只檢驗(yàn)數(shù)據(jù)中一個(gè)子集的值,用戶可以自行確定范圍。在【Lower】和【Upper】文本框中鍵

18、入檢驗(yàn)范圍的下限和上限。 All categories equal:系統(tǒng)默認(rèn)項(xiàng)。它表示所有組對(duì)應(yīng)的期望值都相同,這意味著你要檢驗(yàn)總體是否服從均勻分布。 Values:指定期望概率值。選定所要檢驗(yàn)的期望分布,并在其右邊的文本框中鍵入相應(yīng)各組所對(duì)應(yīng)的由給定分布所計(jì)算而得到的期望值。其中,Add按鈕,增加剛鍵入的期望值,必須大于0;Remove按鈕,移走錯(cuò)誤值;Change按鈕,替換錯(cuò)誤值。Step04:選擇期望值 在圖6-1的【Expected Values】復(fù)選欄可以指定期望值,對(duì)應(yīng)有兩個(gè)單選項(xiàng)。n Step05:選擇計(jì)算精確概率 單擊Exact按鈕,彈出如圖6-2所示的【Exact Tests

19、(精確檢驗(yàn))】對(duì)話框,該對(duì)話框用于選擇計(jì)算概率P值的方法 . 某公司經(jīng)營多年,形成了一套成熟的企業(yè)文化和管理體系,例如根據(jù)多年的運(yùn)營經(jīng)驗(yàn),經(jīng)理層、監(jiān)察員、辦事員三種職務(wù)類別人員比例大約在15:5:80為宜,這樣運(yùn)行效率最高。目前公司進(jìn)行人事調(diào)整,公司人員結(jié)構(gòu)發(fā)生變動(dòng),有員工擔(dān)心是否人事調(diào)整已經(jīng)導(dǎo)致職務(wù)類型比例的失調(diào)。請(qǐng)利用數(shù)據(jù)來解決該問題。應(yīng)用實(shí)例:Step01:打開對(duì)話框打開或建立數(shù)據(jù)文件6-1.sav,在菜單欄中選擇【Analyze】 【Nonparametric Tests】【Legacy Dialogs】【Chi-Square】命令,彈出【Chi-Square Test】對(duì)話框。其中“jobcat”變量表示職業(yè)類型,其中,“1”表示辦事員,“2”表示監(jiān)察員,“3”表示經(jīng)理。Step02:選擇檢驗(yàn)變量在左側(cè)的候選變量列表框中選擇“jobcat”變量作為檢驗(yàn)變量,將其添加至【Test Variab

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論