




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、II承諾保證書I1引言1研究背景1研究方法及目的12Poisson分布檢驗的步驟和基本理論2檢驗步驟2檢驗的基本原理33關于Poisson分布檢驗的三個案例及實際研究7案例分析7對單位時間到來顧客數(shù)的實際研究13參考文獻18英文摘要19 關于Poisson分布的檢驗肖秋光摘要:Poisson分布是概率論中的一種重要離散分布,在許多實際問題中都有著廣泛應用本文概括了檢驗樣本數(shù)據(jù)是否服從泊松分布的一般方法,主要是對隨機數(shù)據(jù)進行圖像模擬估計和利用假設檢驗原理對給定的臨界值進行估計其中x2檢驗是眾所周知的擬合優(yōu)度檢驗,它能適用于任意的備擇假設.另外,通過三個例子進行說明,最后用該方法對實測數(shù)據(jù)進行了分
2、析和檢驗,并得出了結(jié)論.關鍵詞:Poisson分布假設檢驗獨立變量x2統(tǒng)計量1引言1.1研究背景改革開放三十年來隨著社會的發(fā)展、經(jīng)濟的增長,科學技術日新月異、人民擁有的物質(zhì)日益豐富、感受到的文化也更加多元、社會的各種法規(guī)制度日臻成熟,無論是住房、保險、交通、旅游、高質(zhì)量產(chǎn)品還是教育、飲食等.其結(jié)果是構(gòu)成了大量的隨機數(shù)據(jù),而這些數(shù)據(jù)有沒有什么規(guī)律可循呢?就需要我們對它進行研究.在現(xiàn)實生活中的許多數(shù)據(jù)經(jīng)過人們大量的研究是服從泊松分布的.若通過觀察記錄得到了一組數(shù)據(jù),它是否服從泊松分布,則需要我們對其進行檢驗.泊松分布是1837年由法國數(shù)學家泊松(PoissonS.D.17811840)首次提出的.
3、它是概率論中的一種重要的離散型隨機變量的概率分布,在理論上和實踐中都有廣泛的應用.如110報警臺24小時接到的報警次數(shù)、一定時間內(nèi)發(fā)生的意外事件次數(shù)或災害次數(shù)、布匹上的疵點數(shù)目、放射性物質(zhì)放射出的粒子數(shù)目等.1.2研究方法及目的由于向110報警臺的報警是一次次到來的;自然災害是一次次發(fā)生的;放射性粒子是一個個射出的;進入商場的人是一個個到來的它們都可以看成是一種于隨機時刻到來的“質(zhì)點流”.要對其進行研究,首先,必須收集到有效的數(shù)據(jù).其次,由于得到的樣本數(shù)據(jù)通常是實驗或統(tǒng)計而來,因此它不能完全的反映事物的本質(zhì).我們主要對部分數(shù)據(jù)進行抽取分析,根據(jù)部分數(shù)據(jù)對全體數(shù)據(jù)做出推斷及判斷.因此,研究單位時
4、間內(nèi)產(chǎn)生的諸多隨機變量有助于當事者們對各種新措施、新技術作出更為科學合理的決策.例如,商場每個時段到達的人數(shù)不一,通過調(diào)查可以確定哪個時段是人流的高峰期,可以在這個時段做一些宣傳或促銷產(chǎn)生的效益就會比其他時段高,并有效控制成本,使其用最小的投入換來最大的收益.2Poisson分布檢驗的步驟及基本理論2.1檢驗步驟2.1.1數(shù)據(jù)整理進行Poisson分布的檢驗時,首先要對收集到的數(shù)據(jù)進行整理.假設收集到單位時間的量為x,x,xx,然后把這些量按從小到大順序排列起來,并查123n出其頻數(shù)稍加整理制成表格如下:表1單位時間的量xi012xi頻數(shù)pip0p1p2pi其中滿足:x+x+x=0 xp+1x
5、p+xxp12n01ii用圖像對樣本數(shù)據(jù)進行模擬由于圖形比較直觀,而且樣本數(shù)據(jù)在一定程度上能有效反映總體的分布規(guī)律,故可以用樣本數(shù)據(jù)的圖像模擬通過對比,對該分布進行初步判斷.泊松分布的圖形一般為左偏,但隨九數(shù)值的增大,圖形趨于對稱.Fp值,則拒絕原假設H;0若a0的泊松分布,X,X,X,,X為其樣本.123n考慮檢驗問題:H:九=九;H:九H九,現(xiàn)有0i=1p(x;i)=liei=e-入九刀%x!i=1i1n(x!)ii=101x)ln九i1n(x!)ii=1其中T(x,x,,x)=工x,b(九)=In九12nii=11h(x,x,x)=,c()=en九12nn打(x!)ii=11,Tc12b
6、,T=c,j=1,2ij0,cT+b()+b(-)0en0+(n九)qen0+(n九)c2en0j!c!0c!012-叫+j=c2+1藝加)丿j!nM=)(叫je叫+0j=0j!j=c2+1bcbcen0+-(n九en0+22(n九)c2en0c!0c!012在一般情況下上述方程不易求解,但當九不接近于零而n又不很小時,統(tǒng)計量0X一n九i0U=4的漸進分布為正態(tài)分布N(0,1),則v;nX0P工Xn九u嘰.=10Jo,=1i0b,b,c,c1212對一切實數(shù)u都漸近地成立(這是因為正態(tài)分布具有對稱性)因此,由下式確定:a另(n九)jb(7)(n九)j2j!0c!0八0j!j=011j=c2+1
7、+b2(nX)cc02e一叫)3關于Poisson分布檢驗的三個案例及實際研究案例分析論反腐敗與泊松分布腐敗現(xiàn)象作為當今社會的一種非常態(tài),它的發(fā)生、出現(xiàn)引起了廣大群眾的關注.調(diào)查顯示最近幾年科級腐敗正在加劇,小官受賄成隱患.據(jù)悉,某檢察院工作人員對某經(jīng)濟較落后省的320個底層官員在一年時間內(nèi)的受賄金額調(diào)查紀錄如下表所示.根據(jù)這些數(shù)據(jù)(金額0表示未受賄,金額1表示受賄金額大于0小于等于1,其余類同)檢驗受賄金額是否服從泊送分布.表21年內(nèi)320個官員受賄金額(萬元)統(tǒng)計表金額012345678910合計人數(shù)154770815225169410320來源于參考文獻6用折線圖像模擬數(shù)據(jù)如下:官員受賄
8、頻數(shù)圖系列11234567891011受賄金額圖2從圖形走勢看,為左偏凸值分布,與泊松分布較為相似,可初步判定為泊松分布.在理論上,這里我們需要檢驗的是在一年的時間段內(nèi)受賄官員的受賄金額是否服從泊送分布,所以可以假設H0:一年的時間內(nèi)受賄官員的受賄金額服從泊送分布;H1:一年的時間內(nèi)受賄官員的受賄金額不服從泊送分布x!我們知道泊送分布的概率密度函數(shù)為f(X=x)xZ,式中::是未知參數(shù).如果假設為真時,可以根據(jù)本數(shù)據(jù)估計九.由上表的數(shù)據(jù)可以的到在320個底層官員中,平均每一官員受賄的金額(萬元),即八0 x15+lx47+9x1+10 x0九=3.0320因此,可以用X作為九的估計值,即得到為
9、真時的概率密度函數(shù)f(Xx!根據(jù)該密度函數(shù),就可以計算出在每一個官員的受賄金額為各個類別出現(xiàn)的概率,這些概率值可通過泊送分布表查得.例如,在一年內(nèi)受賄金額為0萬元的官員人數(shù)的概率是/(X=0)=0.498,受賄金額為1萬元的概率是/(X=1)=0.1494等然后用查出的概率分別乘以樣本容量n(n=320),就可以得到各類別期望的頻數(shù)例如,在320個官員中受賄金額為0萬元的期望頻數(shù)是0.0498x320二15.936下表列出了X2統(tǒng)計量的計算過程.表3X2統(tǒng)計量的計算過程受賄金額XI為真時的/(X二x)實際頻數(shù)I期望頻數(shù)e=n-/(X=x)II(ne)2IIeI00.04981515.9360.
10、055010.14944747.8080.013720.22407071.680.039430.22408171.681.211840.16805253.760.057650.10082532.2561.632260.05041616.1281.015970.021696.91280.008142.5920.981290.002710.86410萬元以上0.001200.384合計1.00003203205.0068我們注意到表中,受賄金額為8,9和10萬元次及以上金額的期望頻數(shù)都小于5,所以將這三類歸于受賄金額為7萬元的合并為一類,所以合并之后的類別數(shù)k二8.這時咒2統(tǒng)計量為x2-丈(nie
11、i)2-5.0068ei-1i需要注意的是:根據(jù)Pearson定理,上式的咒2統(tǒng)計量服從自由度為k-r-1的咒2分布,其中k時類別的個數(shù),r是估計的總體參數(shù)的個數(shù)在這里k=&r=1(只估計了一個參數(shù)九),所以自由度為k-r-1二8-1-1二6.于是,當0.05時,查表可得x2(6)二12.592.對于樣本的X2值,因為咒211ni572033835255324082731394527106來源于參考文獻7在上表中的n是觀測到i個粒子的時間間隔數(shù)(最后一項已經(jīng)合并)若要i檢驗觀測的數(shù)據(jù)服從泊松分布這一假設(“0.05),貝V:因為對參數(shù)為九的泊松分布是:P(X=k)=e-X,k=0,1,2k!根
12、據(jù)上表原始數(shù)據(jù)可以算得X最大似然估計X二X二3.870而X二3.870的泊松分布通過計算機計算及查表(泊松分布函數(shù)表)可得下表:表5inipinp.(nnp)2iinpi0570.20954.50.114712030.0807210.50267223830.1562407.41.461435250.2015525.50.000545320.1950508.61.076654080.1509393.50.534362730.0973253.81.452571390.0538140.30.01208450.026067.87.66739270.011229.20.165810100.005311.
13、20.12861160.00225.70.0158總和26081.0000260812.8967因此x2二12.8967,其自由度為12-1-1=10,對0.05查(咒2分布分位數(shù)X2(n)表)得X2(10)二18.307,所以我們接受H,認為觀測數(shù)據(jù)服從泊松分布.p0.050盧瑟福等人經(jīng)過兩年時間綜合多方面因素的分析,在1911年提出原子的核式模型,原子中的正電荷集中在原子中心很小的區(qū)域內(nèi),而且原子的全部質(zhì)量也集中在這個區(qū)域內(nèi).原子核的半徑近似為10,約為原子半徑的千萬分之一.盧瑟福散射實驗確立了原子的核式結(jié)構(gòu),為現(xiàn)代物理的發(fā)展奠定了基石.這充分表明研究泊松分布具有重大意義.對印刷錯誤個數(shù)的
14、檢驗一個檢驗員檢查了一本書的100頁,并仔細記錄各頁中印刷錯誤的個數(shù),其結(jié)果為:表6錯誤個數(shù)/i01234567含/個錯誤的頁數(shù)i36401920210其頻數(shù)模擬如下圖:圖4若要檢驗一頁的印刷錯誤個數(shù)是否服從泊松分布.(取0.05)則:假設H:總體X服從泊松分布;H:總體X不服從泊松分布0136x0+40 x1+19x2+2x3+0 x4+2x5+lx6+0 x7從表中數(shù)據(jù)可得:x=1100當H成立時,九的最大似然估計為九=x=1,檢驗的拒絕域為:0f2X2=EL-nx2(k-r-1)npi由給出的條件可知n二100二p(X=0)=卷=03679,=p(X=1)=0.367912e-1二p(x
15、=2)=-2T=0J8397,13e-1二p(x=3)=-3T=0.0613p=p(X=4)=414e-1-4廠=0.01533,15e-1=p(X=5)=5-=0.00306616e-1p=p(X=6)=0.000511,66!p二p(X7)二1-fp二0.0000237ii=0而對于j3,有np.5,j將其合并得np=8.023,合并后k=4,查x2分布jj=3分位數(shù)x2(n)表可得:X2(4-1-1)=5.991p0.05x2362402+36.7936.79+52-100=1.44418.3978.023由1.44410.046211A203.23411.3826.525220.106
16、34-7.44130.1631611.4172.570240.18751013.1250.744050.17251012.0750.356560.132339.2614.232870.0869S6.083、80.050063.50090.025551.785100.011810.826110.00491(210.3436.52532.1112120.001910.133130.000710.049大于130.00030丿0.021丿合計1707046.5399從表中觀察進入人數(shù)為0,1,8及其以上的期望頻數(shù)都小于5,所以將進入人數(shù)為0,1的與進入2個的合并為一類,進入8個及以上與進入7的合并為
17、一類,那么合并后的類別數(shù)k二6,其X2統(tǒng)計量為:X2仝二=46.5399e1i根據(jù)Pearson定理,X2統(tǒng)計量服從自由度為k-r-1的x2分布,在這里k=6,r=1,所以自由度為4于是,當0.05時,查X2分布表得X2(4)=9.4880.05對于樣本的X2值,有X2X2(4)落在拒絕域內(nèi)所以拒絕H,接受H,即每分0.0501鐘進入書城的人數(shù)不服從泊松分布,與用圖像模擬得到的初步結(jié)論一致.3.4.2當取九二4.7時,有f(X=x)=”4,查泊松分布表計算得下表表9進入人數(shù)xi為真時的f(X二x)i實際頻數(shù)ni期望頻數(shù)(n-e)2e=nif(X二x)iei00.00915j0.637、10.0
18、42711L202.989”10.6618.180920.10054J7.03530.1574611.0182.885440.18491012.9430.669250.17381012.1660.385660.136239.5344.478070.09146、6.39880.053763.75990.028051.960100.01321l0.924I110.00561210.392f13.6643.9386120.002210.154130.000810.056大于130.00030丿0.021,合計1.00007069.98620.5377其余同上,當二0.05時,查咒2分布表得咒2(4)
19、=9.488對于樣本的咒2值,仍然0.05有咒2咒2(4)落在拒絕域內(nèi),結(jié)論也一致.0.05按照眾多學者研究,在一般情況下對于這種隨機變量的檢驗應該服從Poisson分布.在這里為什么得到了相反的結(jié)論?我認為可能有兩點原因:一是所采集到的樣本數(shù)據(jù)可能具有特殊性,不能完全反映總體的分布,若多測幾組數(shù)據(jù)進行檢驗結(jié)果可能會改變;二是我們假設的前提是每個人相互獨立,而實際情況有許多人是有關聯(lián)的,例如一個家庭四個人同時進入、兩個好朋友陪同一個朋友買書等諸多情況,這個因素可能也會對結(jié)果有影響.結(jié)束語:隨著社會的發(fā)展和可研究案例的增多,把自然科學領域的原理用到社會現(xiàn)象的研究、分析上來,對發(fā)現(xiàn)問題解決問題有許
20、多益處.參考文獻:茆詩松等概率論與數(shù)理統(tǒng)計教程M.北京:高等教育出版社,2008.朱洪文應用統(tǒng)計M.北京:高等教育出版社,2006.王榮華等.概率論與數(shù)理統(tǒng)計(習題精選).北京:北京大學出版社,2010.謝民育,吳茗,熊明.多元分布下單邊備擇假設的兩步檢驗.武漢2009徐亮,丁先文等.基于經(jīng)驗似然的部分線性模型的統(tǒng)計診斷.南京,2009 HYPERLINK .en/g/20110401/10129630369.shtml .en/g/20110401/10129630369.shtmlhttp:/ HYPERLINK http:/www.phys www.phys./advlab/nuclear/10.htmPOISSONDISTRIBUTIONONTHEINSPECTIONXIAOQi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專項5 標點(原卷版)
- 河北省石家莊市新樂一中2024-2025學年高一下學期第一次月考生物試題(原卷版+解析版)
- 商品陳列大全
- 2025年初中魯科版(五四學制)八年級上冊第四章第二節(jié)《探究凸透鏡成像規(guī)律》說課稿
- 【國金證券】人形機器人行業(yè)研究:人形機器人從理想走進現(xiàn)實
- 英語護士應聘簡歷
- 2025年廣東省初中學業(yè)水平考試模擬英語試題(原卷版+解析版)
- 《會計信息系統(tǒng)應用》課件 學習情境2 系統(tǒng)管理和基礎設置
- 二零二五年度北京市電子產(chǎn)品寄存與智能監(jiān)控服務協(xié)議
- 二零二五年度辦公空間互換及增值服務合作協(xié)議
- 企業(yè)人力資源管理師知識考試題及答案
- 2025年上半年宜賓江安縣人社局招考易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年山東省高考物理復習方法及備考策略指導(深度課件)
- 2025年安徽工業(yè)職業(yè)技術學院單招職業(yè)技能測試題庫完整版
- 做一個指南針(課件)-二年級科學下冊教科版
- 2025至2030年中國十二烷基磺酸鈉數(shù)據(jù)監(jiān)測研究報告
- 《C#程序設計基礎》課件
- 2024年天翼云認證運維工程師考試復習題庫(含答案)
- 浙江省杭州市2024年中考英語真題(含答案)
- 《陸上風電場工程設計概算編制規(guī)定及費用標準》(NB-T 31011-2019)
- 海康威視槍機攝像機檢測報告
評論
0/150
提交評論