衛(wèi)生統(tǒng)計學(xué):第6章 總體均數(shù)與總體率的估計_第1頁
衛(wèi)生統(tǒng)計學(xué):第6章 總體均數(shù)與總體率的估計_第2頁
衛(wèi)生統(tǒng)計學(xué):第6章 總體均數(shù)與總體率的估計_第3頁
衛(wèi)生統(tǒng)計學(xué):第6章 總體均數(shù)與總體率的估計_第4頁
衛(wèi)生統(tǒng)計學(xué):第6章 總體均數(shù)與總體率的估計_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第6章章 總體均數(shù)與總體率的估計總體均數(shù)與總體率的估計【例例6-1】欲了解某地正常成年男性血欲了解某地正常成年男性血清膽固醇的平均水平,某研究者在該地清膽固醇的平均水平,某研究者在該地隨機抽取正常成年男性隨機抽取正常成年男性120名,得其血名,得其血清膽固醇的清膽固醇的均數(shù)為均數(shù)為3.86mmol/L,標(biāo)準(zhǔn)標(biāo)準(zhǔn)差為差為1.73 mmol/L,據(jù)此認為據(jù)此認為該地正常該地正常成年男性血清膽固醇的平均水平為成年男性血清膽固醇的平均水平為3.86 mmol/L。以樣本均數(shù)以樣本均數(shù)3.86mmol/L來代來代表該地區(qū)正常成年男性血清膽固醇的平表該地區(qū)正常成年男性血清膽固醇的平均水平是否合適,為什么

2、?均水平是否合適,為什么?第一節(jié)第一節(jié) 抽樣誤差與標(biāo)準(zhǔn)誤抽樣誤差與標(biāo)準(zhǔn)誤【例例6-2】假設(shè)已知某地正常成年男性假設(shè)已知某地正常成年男性紅細胞數(shù)的紅細胞數(shù)的均值為均值為5.001012/L,標(biāo),標(biāo)準(zhǔn)差為準(zhǔn)差為0.431012/L?,F(xiàn)從該總體中?,F(xiàn)從該總體中進行隨機抽樣,每次抽取進行隨機抽樣,每次抽取10名正常成名正常成年男子,并測得他們的紅細胞數(shù),抽年男子,并測得他們的紅細胞數(shù),抽取取100份樣本,計算出每份樣本的均份樣本,計算出每份樣本的均數(shù)。數(shù)。每個樣本均數(shù)是否都恰好等于總每個樣本均數(shù)是否都恰好等于總體均數(shù),各樣本均數(shù)是否相等?體均數(shù),各樣本均數(shù)是否相等?均數(shù)的抽樣誤差均數(shù)的抽樣誤差(sam

3、pling error) 抽樣誤差抽樣誤差:由于個體變異的存在,由于個體變異的存在,在抽樣研究在抽樣研究中產(chǎn)生的中產(chǎn)生的樣本統(tǒng)計量和總體參數(shù)樣本統(tǒng)計量和總體參數(shù)之間的差異之間的差異 原因:個體變異抽樣原因:個體變異抽樣 表現(xiàn):表現(xiàn):樣本均數(shù)和總體均數(shù)間樣本均數(shù)和總體均數(shù)間的差別、的差別、樣本均樣本均數(shù)和樣本均數(shù)間數(shù)和樣本均數(shù)間的差別的差別 抽樣誤差是抽樣誤差是不可避免不可避免的,但抽樣誤差有自己的的,但抽樣誤差有自己的規(guī)律規(guī)律樣本均數(shù)的分布和標(biāo)準(zhǔn)誤樣本均數(shù)的分布和標(biāo)準(zhǔn)誤 當(dāng)固定樣本含量當(dāng)固定樣本含量n從同一總體中隨機抽取多個樣從同一總體中隨機抽取多個樣本時,樣本均數(shù)間存在差異,那么這些樣本均數(shù)

4、本時,樣本均數(shù)間存在差異,那么這些樣本均數(shù)的分布是怎樣的呢?的分布是怎樣的呢? 能否用某個指標(biāo)來描述它們之間的變異?能否用某個指標(biāo)來描述它們之間的變異?圖圖6-1 1006-1 100個樣本均數(shù)的頻數(shù)分布圖個樣本均數(shù)的頻數(shù)分布圖 樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standard error) 樣本均數(shù)的樣本均數(shù)的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差稱為稱為均數(shù)的標(biāo)準(zhǔn)誤均數(shù)的標(biāo)準(zhǔn)誤(SEM),用用 表示表示 說明樣本均數(shù)圍繞總體均數(shù)的離散程度,可用說明樣本均數(shù)圍繞總體均數(shù)的離散程度,可用來反映樣本均數(shù)的抽樣誤差大小來反映樣本均數(shù)的抽樣誤差大小xx中心極限定理 從正態(tài)總體從正態(tài)總體 N ( ,

5、2) 中,隨機抽取例數(shù)為中,隨機抽取例數(shù)為 n 的的樣本,樣本,樣本均數(shù)也服從正態(tài)分布樣本均數(shù)也服從正態(tài)分布; 即使從偏態(tài)總體隨機抽樣,當(dāng)即使從偏態(tài)總體隨機抽樣,當(dāng) n 足夠大時足夠大時(n 50),樣本均數(shù)近似正態(tài)分布,樣本均數(shù)近似正態(tài)分布 從均數(shù)為從均數(shù)為 ,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為 的正態(tài)或偏態(tài)總體中,的正態(tài)或偏態(tài)總體中,抽取例數(shù)為抽取例數(shù)為 n 的樣本,的樣本,樣本均數(shù)的總體均數(shù)樣本均數(shù)的總體均數(shù)也為也為 ,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差與原標(biāo)準(zhǔn)差成正比,與樣本與原標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比例數(shù)的平方根成反比22,nxxNxN xn樣本均數(shù)樣本均數(shù)=總體均數(shù)總體均數(shù) 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差=均數(shù)的均

6、數(shù)的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差=均數(shù)的標(biāo)準(zhǔn)均數(shù)的標(biāo)準(zhǔn)誤誤已知:已知:nXnSSX標(biāo)準(zhǔn)誤計算公式標(biāo)準(zhǔn)誤計算公式未知:實際應(yīng)用中,若標(biāo)準(zhǔn)差固定不變,可通過增加樣本含量n來減少抽樣誤差例:例:如某年某市如某年某市120120名名1212歲健康男孩,歲健康男孩,已求得均數(shù)為已求得均數(shù)為143.07143.07cmcm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為5.705.70cmcm,按公式計算,則標(biāo)準(zhǔn)誤為:,按公式計算,則標(biāo)準(zhǔn)誤為:52. 012070. 5XS 意義不同意義不同: 標(biāo)準(zhǔn)差:表示觀測值的變異程度標(biāo)準(zhǔn)差:表示觀測值的變異程度 標(biāo)準(zhǔn)誤:反映抽樣誤差的大小標(biāo)準(zhǔn)誤:反映抽樣誤差的大小 用途不同用途不同: 標(biāo)準(zhǔn)差:確定醫(yī)學(xué)參考值范

7、圍標(biāo)準(zhǔn)差:確定醫(yī)學(xué)參考值范圍 標(biāo)準(zhǔn)誤:用于統(tǒng)計推斷(參數(shù)估計、假設(shè)檢驗)標(biāo)準(zhǔn)誤:用于統(tǒng)計推斷(參數(shù)估計、假設(shè)檢驗) 公式不同公式不同: xssn2()1xxsn標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別第二節(jié)第二節(jié) t t 分布分布 一、一、t t 分布的概念分布的概念 正態(tài)變量正態(tài)變量X采用采用z z( (X)/)/變換,則一般變換,則一般的正態(tài)分布的正態(tài)分布N N (,)(,)即變換為標(biāo)準(zhǔn)正態(tài)分布即變換為標(biāo)準(zhǔn)正態(tài)分布N N (0,1)(0,1)。 又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 N N (, ),(, ),同樣可作正態(tài)變量的同樣可作正態(tài)變量的

8、u u變換變換, ,即即XnXXzXv 實際工作中由于理論的標(biāo)準(zhǔn)誤往往未實際工作中由于理論的標(biāo)準(zhǔn)誤往往未知,知,而用樣本的標(biāo)準(zhǔn)誤作為的估計值,而用樣本的標(biāo)準(zhǔn)誤作為的估計值, 此時就不是此時就不是z z變換而是變換而是t t變換了,即下式:變換了,即下式: nSXSXtXnXXzXt t分布于分布于19081908年由英國統(tǒng)年由英國統(tǒng)計學(xué)家計學(xué)家W.S.GossetW.S.Gosset以以“StudentStudent”筆名發(fā)表,故筆名發(fā)表,故又稱又稱StudentStudent分布。分布。StudentsStudents t t- -distribution)distribution)。 ,1

9、xxxttnss n 分 布 我們常把自由度為我們常把自由度為的的t t分布曲線下雙側(cè)尾部分布曲線下雙側(cè)尾部合計面積或單側(cè)尾部面積為指定值合計面積或單側(cè)尾部面積為指定值時,則橫時,則橫軸上相應(yīng)的軸上相應(yīng)的t t界值記為界值記為t t,。 當(dāng)當(dāng)=20=20, =0.05=0.05時,記為時,記為t t0.05, 200.05, 20; 當(dāng)當(dāng)=22=22, =0.01=0.01時,記為時,記為t t0.01, 220.01, 22。 對于對于t t, , 值,可根據(jù)值,可根據(jù)和和值,查附表值,查附表2 2,t t界值表。界值表。 t分布是分布是t檢驗的理論基礎(chǔ)。檢驗的理論基礎(chǔ)。t值與樣值與樣本均數(shù)

10、和總體均數(shù)之差成正比,與標(biāo)本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比準(zhǔn)誤成反比 。 在在t分布中分布中t值越大,其兩側(cè)或單側(cè)值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重以外的面積所占曲線下總面積的比重就越小就越小 ,說明在抽樣中獲得此,說明在抽樣中獲得此t值值以及更大以及更大t值的機會就越小,這種機值的機會就越小,這種機會的大小是用概率會的大小是用概率P來表示的。來表示的。 t值越大,則值越大,則P值越?。恢翟叫?; 反之,反之,t值越小,值越小,P值越大。值越大。 根據(jù)上述的意義根據(jù)上述的意義 在同一自由度下,在同一自由度下, t t ,則,則P ; 反之,反之,tt,則,則P。-tt

11、0,t 2,t222,t單側(cè):單側(cè): 雙側(cè):雙側(cè): 即即,P tt 22,P ttP tt 221,Pttt 第三節(jié)第三節(jié) 總體均數(shù)的估計總體均數(shù)的估計 參數(shù)估計參數(shù)估計: :用樣本指標(biāo)(統(tǒng)計量)估計總體指用樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù))稱為標(biāo)(參數(shù))稱為參數(shù)估計參數(shù)估計。 估計總體均數(shù)的方法有兩種,即:估計總體均數(shù)的方法有兩種,即: 點值估計點值估計(point estimation point estimation ) 區(qū)間估計區(qū)間估計(interval estimationinterval estimation)。)。一、點值估計一、點值估計 點值估計:點值估計:是直接用樣本均數(shù)

12、作為總體是直接用樣本均數(shù)作為總體均數(shù)的估計值。均數(shù)的估計值。 此法計算簡便,但由于存在抽樣誤差,此法計算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準(zhǔn)確地估計出總體通過樣本均數(shù)不可能準(zhǔn)確地估計出總體均數(shù)大小,也無法確知總體均數(shù)的可靠均數(shù)大小,也無法確知總體均數(shù)的可靠程度程度 。二、區(qū)間估計二、區(qū)間估計 區(qū)間估計區(qū)間估計是按一定的概率(是按一定的概率(1-1-)估計包含總)估計包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(信區(qū)間(confidence intervalconfidence interval,縮寫為,縮寫為CI)。)。1-1-稱為稱為

13、可信度可信度,常取,常取1-1-為為0.950.95和和0.990.99,即,即總體均數(shù)的總體均數(shù)的95%95%可信區(qū)間和可信區(qū)間和99%99%可信區(qū)間。可信區(qū)間。1-1-(如(如9595)可信區(qū)間的)可信區(qū)間的含義是:含義是:總體均數(shù)總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是被包含在該區(qū)間內(nèi)的可能性是1-1-,即(,即(9595),沒有被包含的可能性為),沒有被包含的可能性為,即(,即(5 5)。)。總體均數(shù)可信區(qū)間的計算1. 當(dāng)已知0.05 20.05 20,1()1 0.05( 1.961.96)1 0.05(1.961.96)1 0.05xxxxxzNPzzzxPP xx 在總體中抽樣,樣本均

14、數(shù)的在總體中抽樣,樣本均數(shù)的z z變換變換值有值有95%95%可能性落在可能性落在(-1.96,1.96)(-1.96,1.96)之間之間在總體中抽樣,樣本均數(shù)所計算的區(qū)間在總體中抽樣,樣本均數(shù)所計算的區(qū)間有有95%95%可能包括總體均數(shù)可能包括總體均數(shù) 2.5%2.5%95%x0.025xz0.025xxzx0.025xxz0.025xz22,xxxzxz 2 未知但n足夠大(n50)22,xxxzsxzs2xxzs1.96xxs2,2,xxxtsxts/2,/2,/2,/2,/2,/2,()1()1()1xxxPtttxPttsP xtsxts -t /2, v 0 t /2, v 3 3

15、 未知未知且且n n較小較小( (n n100) 100) 按按t t分布的原理分布的原理 XStX,單側(cè)可信區(qū)間和雙側(cè)可信區(qū)間單側(cè)可信區(qū)間和雙側(cè)可信區(qū)間應(yīng)用條件雙側(cè)雙側(cè)100(1-)%可信區(qū)間上側(cè)100(1-)%可信區(qū)間下側(cè)100(1-)%可信區(qū)間已知未知,n足夠大未知,n較小/2/2,xxxzxz,xxz,xxz/2/2,xxxzsxzs,xxz s,xxz s/2,/2,xxxtsxts,xxts ,xxts 單側(cè)單側(cè)標(biāo)準(zhǔn)正態(tài)法標(biāo)準(zhǔn)正態(tài)法近似正態(tài)法近似正態(tài)法t分布法分布法圖圖6-5 6-5 從從NN(0, 10, 1)中隨機抽樣算得的)中隨機抽樣算得的100100個個9595可信區(qū)間(可

16、信區(qū)間(n n=10=10)可信區(qū)間的含義可信區(qū)間的含義XN(0,1) 置信區(qū)間的確切含義:置信區(qū)間的確切含義:從正態(tài)總體中隨機抽取從正態(tài)總體中隨機抽取100100個樣本,可以計算個樣本,可以計算100100個樣本均數(shù)和標(biāo)準(zhǔn)差,個樣本均數(shù)和標(biāo)準(zhǔn)差,也可以算得也可以算得100100個均數(shù)的可信區(qū)間。當(dāng)個均數(shù)的可信區(qū)間。當(dāng)1-1-=95%=95%時,時,在算得的在算得的100100個可信區(qū)間中,平均約有個可信區(qū)間中,平均約有9595個個可信區(qū)間包含可信區(qū)間包含了總體均數(shù),而另外了總體均數(shù),而另外5 5個不包括個不包括。 由此可見:由此可見:可信區(qū)間的確切含義指的是,如果可信區(qū)間的確切含義指的是,如

17、果能夠進行重復(fù)抽樣試驗,平均有能夠進行重復(fù)抽樣試驗,平均有1-1-(如(如95%95%)的可信區(qū)間包含了總體參數(shù)的可信區(qū)間包含了總體參數(shù) 在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認為該區(qū)間包含了總體參數(shù),根據(jù)區(qū)間,我們就認為該區(qū)間包含了總體參數(shù),根據(jù)小概率事件不太可能在一次試驗中發(fā)生的原理,小概率事件不太可能在一次試驗中發(fā)生的原理,該結(jié)論錯誤的概率小于或者等于該結(jié)論錯誤的概率小于或者等于0.050.05(5%5%)例例 某市某市120120名名1212歲健康男孩身高均數(shù)為歲健康男孩身高均數(shù)為143.07143.07cmcm,標(biāo)準(zhǔn)誤為,標(biāo)準(zhǔn)

18、誤為0.520.52cmcm,試估計該市,試估計該市1212歲康男孩身高均數(shù)歲康男孩身高均數(shù)95%95%和和99%99%的可信區(qū)間。的可信區(qū)間。 95%95%的可信區(qū)間為的可信區(qū)間為 143.07143.071.961.960.520.52,即(,即(142.05142.05,144.09144.09) 99%99%的可信區(qū)間為的可信區(qū)間為 143.07143.072.582.580.520.52, , 即(即(141.73141.73,144.41144.41) 例例6-3中,因中,因n=120 , 試求該地正常成年男性血清膽試求該地正常成年男性血清膽固醇平均水平的固醇平均水平的95可信區(qū)間

19、??尚艆^(qū)間。 1.73/smmol L3.86/xmmol L即(即(3.553.55,4.174.17)mmol/L mmol/L 1.731.963.86 1.963.860.31120 xxs 例例 隨機抽取榨菜隨機抽取榨菜10包,亞硝酸鹽含量包,亞硝酸鹽含量均數(shù)為均數(shù)為17.6mg/kg,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差1.64mg/kg,估計這批榨菜的平均亞硝酸鹽含量是多估計這批榨菜的平均亞硝酸鹽含量是多少?少? 單側(cè)可信區(qū)間!估計單側(cè)可信區(qū)間!估計95%,(僅上限有,(僅上限有意義,不高于某一個數(shù)值)意義,不高于某一個數(shù)值) 上限為上限為 故故95%CI為低于為低于18.55mg/kg,17.6 1

20、.833 1.641018.55/xxtsmg kg 可信區(qū)間的兩個要素可信區(qū)間的兩個要素 可信度(可信度(Confidence):可靠性,即:可靠性,即1-。一般一般取取90%, 95,可人為控制可人為控制 精確性精確性(Precision):區(qū)間的大?。▍^(qū)間的長:區(qū)間的大?。▍^(qū)間的長度),越小越好度),越小越好 必須二者兼顧必須二者兼顧均數(shù)的可信區(qū)間與參考值范圍的區(qū)別區(qū)別點區(qū)別點均數(shù)的可信區(qū)間均數(shù)的可信區(qū)間參考值范圍參考值范圍意義意義按預(yù)先給定的概率,確定的未按預(yù)先給定的概率,確定的未知參數(shù)的可能范圍知參數(shù)的可能范圍“正常人正常人”的解剖、生理、生化、的解剖、生理、生化、某項指標(biāo)的波動范圍

21、某項指標(biāo)的波動范圍計算計算公式公式已知或已知或未知但未知但 n n 較大較大未知:未知:正態(tài)分布:正態(tài)分布:偏態(tài)分布:偏態(tài)分布:P PX X -P P100-100-X X用途用途估計總體均數(shù)估計總體均數(shù)判斷觀察對象的某項指標(biāo)正常與判斷觀察對象的某項指標(biāo)正常與否否2xzs2()xzn2()Sxzn2,()sxtn 第五節(jié)第五節(jié) 總體概率的估計總體概率的估計 率的抽樣誤差:由抽樣引起的樣本率與總體率率的抽樣誤差:由抽樣引起的樣本率與總體率的差異稱為率的抽樣誤差的差異稱為率的抽樣誤差率的抽樣誤差亦用率的標(biāo)準(zhǔn)誤度量,率的抽樣誤差亦用率的標(biāo)準(zhǔn)誤度量,均數(shù)的抽樣誤差用均數(shù)的標(biāo)準(zhǔn)誤度量均數(shù)的抽樣誤差用均數(shù)

22、的標(biāo)準(zhǔn)誤度量,nXnSSX 根據(jù)樣本含量根據(jù)樣本含量n n和樣本頻率和樣本頻率p p的大小,可以采用的大小,可以采用查表法和正態(tài)近似法計算總體概率的置信區(qū)間。查表法和正態(tài)近似法計算總體概率的置信區(qū)間。 1.1.查表法查表法 2.2.正態(tài)近似法正態(tài)近似法 查表法查表法 當(dāng)樣本含量當(dāng)樣本含量n n較?。ㄈ巛^?。ㄈ鏽 n5050),特別是),特別是p p很接很接近近0 0或或100%100%時,可查附表時,可查附表“百分率的可信區(qū)間百分率的可信區(qū)間表表”,求得總體概率的可信區(qū)間。,求得總體概率的可信區(qū)間。 例例 某醫(yī)院對某醫(yī)院對3939名前列腺癌患者實施開放手術(shù)治療,術(shù)名前列腺癌患者實施開放手術(shù)治療

23、,術(shù)后有合并癥者后有合并癥者2 2人,試估計該手術(shù)合并癥發(fā)生概率的人,試估計該手術(shù)合并癥發(fā)生概率的95%95%置信區(qū)間。(置信區(qū)間。(n=39,x=2n=39,x=2) P337 P337 1-171-17 95%: 1-17:1%-17%95%: 1-17:1%-17% 99%: 0-21:0%-21%99%: 0-21:0%-21%1.1.查表法查表法 例例 某醫(yī)生用某藥物治療某醫(yī)生用某藥物治療3131例腦血管梗塞患者,其例腦血管梗塞患者,其中中2525例患者治療有效,試求該藥物治療腦血管梗塞有例患者治療有效,試求該藥物治療腦血管梗塞有效概率的效概率的95%95%置信區(qū)間。置信區(qū)間。(n=

24、31,x=25n=31,x=25) P337P337 P(N-X)= P(31-25)= P(6)= 8-38 P(N-X)= P(31-25)= P(6)= 8-38 (8%-38%)(8%-38%) P(25)=1- P(6)= 1- 8%-38%=62%-92%P(25)=1- P(6)= 1- 8%-38%=62%-92%v例例 某醫(yī)院用某藥治療腦動脈硬化癥某醫(yī)院用某藥治療腦動脈硬化癥2222例,其例,其中顯效者中顯效者1010例。問該藥總顯效率的例。問該藥總顯效率的95%95%可信區(qū)可信區(qū)間為多少?間為多少?v本例本例n n=22, =22, X X=10, =10, 查附表查附表

25、得此兩數(shù)相交處的得此兩數(shù)相交處的數(shù)值為數(shù)值為24246868,即該藥總顯效率的,即該藥總顯效率的95%95%可信區(qū)可信區(qū)間為間為(24%24%,68%68%)。 2.2.正態(tài)近似法正態(tài)近似法 當(dāng)當(dāng)n n足夠大,且樣本頻率足夠大,且樣本頻率p p 和(和(1-1-p p)均不太小)均不太小時,如時,如npnp和和n n(1-(1-p p) )均大于均大于5 5時時,p p 的抽樣分布的抽樣分布接近正態(tài)分布,則總體率的可信區(qū)間:接近正態(tài)分布,則總體率的可信區(qū)間: 例例 用某種儀器檢查已確診的乳腺癌患者用某種儀器檢查已確診的乳腺癌患者200200名,檢出乳腺癌患者名,檢出乳腺癌患者8080例,檢出率

26、為例,檢出率為40%40%。估。估計該儀器乳腺癌總體檢出率的計該儀器乳腺癌總體檢出率的95%95%置信區(qū)間。置信區(qū)間。2.正態(tài)近似法正態(tài)近似法)468. 0 ,332. 0(200)400. 01 (400. 0)1 (96. 1400. 02/2/nppZPSZPP n=800,p=0.25,1-p=0.75, 95%95%的可信區(qū)間為的可信區(qū)間為:25%25%1.961.961.53% 1.53% 即(即(22.00%22.00%,28.00%28.00%) 99%99%的可信區(qū)間為的可信區(qū)間為:25%25%2.582.581.53% 1.53% 即(即(21.05%21.05%,28.9

27、5%28.95%) 例例 檢查居民檢查居民800人糞便中蛔蟲陽性人糞便中蛔蟲陽性200人,陽人,陽性率為性率為25%,試求陽性率的標(biāo)準(zhǔn)誤及,試求陽性率的標(biāo)準(zhǔn)誤及95%,99%的可信區(qū)間。的可信區(qū)間。 例例 某市某市20092009年隨機測量了年隨機測量了9090名名2020歲健康大學(xué)歲健康大學(xué)生的身高,其均數(shù)為生的身高,其均數(shù)為172.2cm172.2cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為4.5cm4.5cm,試估計該市試估計該市20092009年年2020歲健康大學(xué)生平均身高的歲健康大學(xué)生平均身高的95%95%置信區(qū)間。置信區(qū)間。 自學(xué)內(nèi)容:自學(xué)內(nèi)容: 第四節(jié)第四節(jié) 二項分布和二項分布和poisson分布

28、分布 對于n次獨立的試驗 ,如果每次試驗結(jié)果出現(xiàn)且只出現(xiàn)對立事件A與 之一,在每次試驗中出現(xiàn)A的概率是常數(shù)(0 1) ,因而出現(xiàn)對立事件 的概率是1- ,則稱這一串重復(fù)的獨立試驗為n重貝努利試驗,簡稱貝努利試驗(Bernoulli trial)AA 【問題問題6-4】假設(shè)服用某藥物后有假設(shè)服用某藥物后有10%的人出現(xiàn)過的人出現(xiàn)過敏反應(yīng)。若敏反應(yīng)。若3人服藥,出現(xiàn)人服藥,出現(xiàn)0、1、2或或3個人過敏個人過敏的概率分別是多少?的概率分別是多少? 組合(Combination):從n個元素中抽取x個元素組成一組(不考慮其順序)的組合方式個數(shù)記為!()!nnkk nk 233!3 2 132!(32)

29、!2 1 1C 51010!10 9 8 7 62525!(105)!5 4 3 2 1C knnCk 或 2222)(bababa3223333)(babbaaba()? ? ? ?nab 牛頓二項展開式:牛頓二項展開式:001 1122211 10()nnnnnnnnnnnnna bC a bC abC a bC a bC a b1.二項分布的概率函數(shù)二項分布的概率函數(shù) 一般地,在一個n重貝努利試驗中,令X表示事件A發(fā)生的次數(shù),則隨機變量X所有可能的取值為0, 1, 2, , n,且其概率函數(shù)為: 貝努利試驗序列中某一結(jié)果A出現(xiàn)次數(shù)的概率分布稱二項分布(binomial distribut

30、ion), 記為:),(nBX()(1)kkn knP XkC2.二項分布的圖形 4 8 12 16 0 2 4 0 2 4 6 4 8 12 16 X 0.0 0.1 0.2 0.3 0.4 n =20 =0.5 n =5 =0.3 n =10 =0.3 n =30 =0.3 P(X) 當(dāng)=0.5時,分布對稱;當(dāng) 0.5,分布呈偏態(tài);當(dāng)0.5時分布呈負偏態(tài);特別是當(dāng)n值不是很大時,偏離0.5愈遠,分布愈偏 隨著n的增大,二項分布逐漸逼近正態(tài)分布。如 =0.30,n=5和n=10時,圖形呈偏態(tài),當(dāng)n=30時,圖形已接近正態(tài)分布。一般地說,如果n或n(1-)大于5時,??捎谜龖B(tài)近似原理處理二項分

31、布問題3.1 二項分布的性質(zhì) :累積概率(1)二項分布的概率之和等于10(1)11nnXXn XnXC(2)單側(cè)累積概率至多有至多有mm例陽性的概率(下側(cè)累積概率)例陽性的概率(下側(cè)累積概率)mXXnXXnCmXP0)1()(至少有至少有mm例陽性的概率(上側(cè)累積概率)例陽性的概率(上側(cè)累積概率)()1(1)P XmP Xm3.2 二項分布的性質(zhì) :均數(shù)和方差 陽性結(jié)果發(fā)生數(shù)X的總體均數(shù) 總體方差 總體標(biāo)準(zhǔn)差n)1 (2 n)1 (n4. 二項分布的抽樣分布及其性質(zhì) 二項分布的隨機抽樣性質(zhì)仍然被中心極限定理所反映 在n足夠大時,樣本率近似服從正態(tài)分布 樣本率p的均數(shù)等于 樣本率p的標(biāo)準(zhǔn)差(率的

32、標(biāo)準(zhǔn)誤)np)1 ( np)1( 如果總體率如果總體率未知,用樣本率未知,用樣本率p估計估計nppsp)1( 5. 二項分布的應(yīng)用:區(qū)間估計 查表法查表法,適用于n50時; 正態(tài)近似法正態(tài)近似法,適用于n較大,p和1-p均不太小,如np和n(1-p)均大于5時。 此時總體率的1-可信區(qū)間如下/2/2,pppzspzs 例 某醫(yī)院應(yīng)用氨芐青霉素治療呼吸道感染,45例患者中有2例發(fā)生過敏反應(yīng)。試估計過敏反應(yīng)發(fā)生率的95%可信區(qū)間 查附表查附表5 5(百分率的可信區(qū)間表),(百分率的可信區(qū)間表),n n=45=45的行與的行與X X=2=2的列交叉處的數(shù)值為的列交叉處的數(shù)值為1 11515, 即氨芐

33、青霉素過即氨芐青霉素過敏反應(yīng)發(fā)生率的敏反應(yīng)發(fā)生率的95%95%可信區(qū)間為(可信區(qū)間為(1%1%,15%15%) 例 某市疾控中心對該市郊區(qū)200名小學(xué)生進行貧血的檢測,結(jié)果發(fā)現(xiàn)有80名小學(xué)生貧血,檢出率為40.0%。試估計該區(qū)貧血發(fā)生率的95%可信區(qū)間200n 0.40p 20.05 210.400(1 0.400)0.400 1.960.332,0.468200ppppzspzn 【例6-5】已知某地新生兒先天性心臟病的發(fā)病率為9,試計算該地100名新生兒中有3人患先天性心臟病概率。能否用前述二項分布進行計算?是否有更為簡便的計算方法?若用二項分布:3X100n009. 03397100(3

34、)0.009 (1 0.009)PC 【例6-5】已知某地新生兒先天性心臟病的發(fā)病率為9,試計算該地100名新生兒中有3人患先天性心臟病概率。能否用前述二項分布進行計算?是否有更為簡便的計算方法?二、Poisson (泊松)分布 當(dāng)二項分布中n很大,p很小時,二項分布就變?yōu)镻oisson分布,Poisson分布實際上是二項分布的極限分布 法國數(shù)學(xué)家Simeon Denis Poisson (1781-1840) 1837年在關(guān)于判斷的概率之研究一文中提出的描述隨機現(xiàn)象的一種常用分布 Poisson分布也是一種重要的離散型概率分布,用于研究單位時間、單位人群、單位空間內(nèi),某稀有事件發(fā)生次數(shù)的分布

35、 單位體積水中細菌數(shù) 單位體積空氣中粉塵數(shù) 單位時間內(nèi)放射性物質(zhì)放射出的質(zhì)點數(shù) 單位空間中某些昆蟲數(shù) 一定人群中惡性腫瘤或罕見非傳染性疾病患病數(shù)或死亡數(shù) 可以認為滿足以下三個條件的隨機變量服從Poisson分布: 平穩(wěn)性:X的取值與觀察單位的位置無關(guān),只與觀察單位的大小有關(guān) 獨立性:在某個觀察單位上X的取值與前面各觀察單位上X的取值獨立(無關(guān)) 普通性:在充分小的觀察單位上X的取值最多為1Poisson分布的概率:分布的概率:= n為為Poisson分布的總體均數(shù);分布的總體均數(shù);!)(XeXPX X=0,1,2,式中:式中:X為單位時間(或面積、容積等)某事件發(fā)生數(shù);為單位時間(或面積、容積

36、等)某事件發(fā)生數(shù);e為自然對數(shù)的底,為自然對數(shù)的底,e2.71828從式中可知,從式中可知,為為Poisson分布的唯一參數(shù)。分布的唯一參數(shù)。X服從以服從以為參數(shù)的為參數(shù)的Poisson分布,可記為分布,可記為XP()。)。遞推公式:遞推公式: eP)0(1)()1( XXpXP 3X100n009. 030.90.9(3)0.0493!Pe 【例6-5】已知某地新生兒先天性心臟病的發(fā)病率為9,試計算該地100名新生兒中有3人患先天性心臟病概率。能否用前述二項分布進行計算?是否有更為簡便的計算方法?!)(XeXPX =n=100*0.009=0.92. Poisson分布的累計概率 011(0

37、)11P X kP XP XP X kP X kP X kPeP XP X Poisson分布的圖形:分布的圖形:根據(jù)根據(jù),按式,按式 可計算出的所有可能取值時的概率(),可計算出的所有可能取值時的概率(),以其為縱軸,可繪制出以其為縱軸,可繪制出poisson分布概率分布列的圖形,可分布概率分布列的圖形,可見,見,poisson分布圖形形狀完全取決于分布圖形形狀完全取決于的大小。當(dāng)?shù)拇笮?。?dāng)時圖形基本對稱,隨時圖形基本對稱,隨的增大,圖形漸近于正態(tài)分布。的增大,圖形漸近于正態(tài)分布。Poisson分布的特性和應(yīng)用條件:分布的特性和應(yīng)用條件:1. 離散型分布離散型分布 .Poisson分布只有一

38、個參數(shù),即參數(shù)分布只有一個參數(shù),即參數(shù);2. Poisson分布可看成二項分布的特例,其應(yīng)用條件也就是二分布可看成二項分布的特例,其應(yīng)用條件也就是二項分布的應(yīng)用條件。項分布的應(yīng)用條件。 ) , ( N3. 方差等于均數(shù):即方差等于均數(shù):即2= 。為為Poisson分布的重要特征。分布的重要特征。4. Poisson分布在分布在不大時呈左偏態(tài)分布,隨著不大時呈左偏態(tài)分布,隨著的增大而逐漸的增大而逐漸趨于對稱。當(dāng)趨于對稱。當(dāng)20時,可認為近似正態(tài)分布時,可認為近似正態(tài)分布5. Poisson分布的可加性分布的可加性。若若X1, X2, Xk相互獨立,且它們分別服從以相互獨立,且它們分別服從以1,2

39、, k為參數(shù)的為參數(shù)的Poisson分布,則分布,則T=X1+ X2+ +Xk也服從也服從Poisson分布,其參數(shù)為分布,其參數(shù)為1+2+ k。Poisson分布的可加性:分布的可加性:Poisson分布的可加性:分布的可加性:n例如例如:某放射物質(zhì)每某放射物質(zhì)每.s放射粒子數(shù)服從均數(shù)為放射粒子數(shù)服從均數(shù)為.的的poisson分布,現(xiàn)隨機取次觀測結(jié)果進行研究,這次觀測結(jié)分布,現(xiàn)隨機取次觀測結(jié)果進行研究,這次觀測結(jié)果分別為每果分別為每.s反射,及個粒子數(shù),問每反射,及個粒子數(shù),問每.s放射粒放射粒子數(shù)為多少?并指出其服從于均值為多少的子數(shù)為多少?并指出其服從于均值為多少的poisson分布。分

40、布。n本例本例X1=2,X2=3,X3=4,利用利用poisson分布的可加性原理得到分布的可加性原理得到n X1X2X3=2349個個n均值為均值為2.2+2.2+2.2=6.6n每每.s放射粒子數(shù)為個,每放射粒子數(shù)為個,每.s放射粒子數(shù)服從于均值放射粒子數(shù)服從于均值為為.的的poisson分布分布 poisson分布可視為二項分布的特例若某種現(xiàn)象的發(fā)生率甚小,而樣本例數(shù)甚多時,則二項分布逼近poisson分布 poisson分布的正態(tài)近似一般在實際應(yīng)用中,當(dāng)時,poisson分布近似正態(tài)分布,資料可根據(jù)正態(tài)分布原理處理,從而簡化計算 poisson分布的應(yīng)用條件 凡具有貝努利實驗序列個特點

41、且很小n大時,其相應(yīng)的變量一般認為服從poisson分布. 課題延伸課題延伸一、抽樣試驗 從正態(tài)分布總體從正態(tài)分布總體N N(5.00,0.505.00,0.502 2)中,每次隨機)中,每次隨機抽取樣本含量抽取樣本含量n n5 5,并計算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù),并計算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取抽取10001000次,獲得次,獲得10001000份樣本;計算份樣本;計算10001000份樣本的份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對均數(shù)與標(biāo)準(zhǔn)差,并對10001000份樣本的均數(shù)作直方圖。份樣本的均數(shù)作直方圖。 按上述方法再做樣本含量按上述方法再做樣本含量n n1010、樣本含量、樣本含量n n3030的抽樣實驗

42、;比較計算結(jié)果。的抽樣實驗;比較計算結(jié)果。抽樣試驗(n=5)抽樣試驗(n=10)抽樣試驗(n=30)1000份樣本抽樣計算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913nnS3個抽樣實驗結(jié)果圖示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)0501001502002503003504004503.713.924.1

43、24.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均數(shù)頻數(shù)2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn總體均數(shù)可信區(qū)間的計算1. 當(dāng)已知0.05 20.05 20,1()1 0.05( 1.961.96)1 0.05(1.961.96)1 0.05xxxxxzNPzzzxPP xx 在總體中抽樣,樣本均數(shù)的在總體中抽樣,樣本均數(shù)的z z變換變換值有值有95%95%可

44、能性落在可能性落在(-1.96,1.96)(-1.96,1.96)之間之間在總體中抽樣,樣本均數(shù)所計算的區(qū)間在總體中抽樣,樣本均數(shù)所計算的區(qū)間有有95%95%可能包括總體均數(shù)可能包括總體均數(shù)1. 總體均數(shù)可信區(qū)間估計總體均數(shù)可信區(qū)間估計 1)查表法)查表法:X 50,尤其,尤其p0 或或 1時時 例例7.13:將一個面積為:將一個面積為100cm2的培養(yǎng)皿置于某病的培養(yǎng)皿置于某病室中,室中,1小時后取出,培養(yǎng)小時后取出,培養(yǎng)24小時,查得小時,查得8個菌落,個菌落,求該病室平均求該病室平均1小時小時100cm2細菌數(shù)的細菌數(shù)的95%可信區(qū)間??尚艆^(qū)間。 查查附表附表7,x=8 得:得:3.4

45、15.8故該病室平均故該病室平均1小時小時100cm2細菌數(shù)的細菌數(shù)的95%可信區(qū)間可信區(qū)間為(為(3.4, 15.8)例例5.15 對某地居民飲用水進行衛(wèi)生學(xué)檢測中,隨機對某地居民飲用水進行衛(wèi)生學(xué)檢測中,隨機抽查抽查1mL水樣,培養(yǎng)大腸桿菌水樣,培養(yǎng)大腸桿菌2個,試估計該地區(qū)個,試估計該地區(qū)水中每毫升所含大腸桿菌的水中每毫升所含大腸桿菌的95%和和99%可信區(qū)間??尚艆^(qū)間。本例本例 x=2 95%可信區(qū)間得可信區(qū)間得 (0.2,7.2)問題:問題:若求若求該病室平均該病室平均1小時小時50cm2細菌數(shù)的細菌數(shù)的95%可信區(qū)間?可信區(qū)間?將上述的上下限各除以將上述的上下限各除以2即可。即可。 2)正態(tài)近似法)正態(tài)近似法: 當(dāng)當(dāng) X 50 時時例例7.14:用計數(shù)器測得某放射性物質(zhì)半小時內(nèi)發(fā)出的脈沖數(shù):用計數(shù)器測得某放射性物質(zhì)半小時內(nèi)發(fā)出的脈沖數(shù)為為360個。試估計該放射性物質(zhì)每個。試估計該放射性物質(zhì)每30分鐘平均脈沖數(shù)的分鐘平均脈沖數(shù)的95%可信區(qū)間??尚艆^(qū)間。XuX2/ X樣本計數(shù)樣本計數(shù)2 .3978 .32236096. 13602/ XuX

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論