版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2011級(jí)預(yù)防醫(yī)學(xué)專業(yè)
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》沈月平副教授,PhD醫(yī)學(xué)部公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)教研室E-mail:shenyueping@.cmOffice:401-140312015/4/12第五章參數(shù)估計(jì)前言第一節(jié)抽樣誤差第二節(jié)t-分布和二項(xiàng)分布第三節(jié)單個(gè)總體參數(shù)的置信區(qū)間第四節(jié)兩總體之差的置信區(qū)間小結(jié)作業(yè)2計(jì)量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷集中趨勢離散趨勢參數(shù)估計(jì)假設(shè)檢驗(yàn)點(diǎn)估計(jì),區(qū)間估計(jì)兩樣本均數(shù)比較t,u-test多個(gè)樣本均數(shù)比較F-test計(jì)數(shù)資料的統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷集中趨勢離散趨勢參數(shù)估計(jì)假設(shè)檢驗(yàn)絕對數(shù),相對數(shù)率的標(biāo)準(zhǔn)誤點(diǎn)估計(jì),區(qū)間估計(jì)兩樣本率比較χ2-test多個(gè)樣本率比較χ2-test第一節(jié)抽樣誤差抽樣誤差(samplingerror)
:由抽樣造成的統(tǒng)計(jì)量與總體參數(shù)及樣本統(tǒng)計(jì)量之間的差別稱為抽樣誤差。均數(shù)抽樣誤差和率的抽樣誤差是建立在抽樣研究基礎(chǔ)上所發(fā)生的偏差,只能減小,不可避免5一、均數(shù)的抽樣誤差由于隨機(jī)抽樣所引起的樣本均數(shù)與總體均數(shù)之間的差異或樣本均數(shù)之間的差異;如何評(píng)估抽樣誤差?6如何評(píng)估抽樣誤差?抽樣試驗(yàn)(samplingtrial)7抽樣試驗(yàn)?zāi)呈?008年19歲女生身高服從均數(shù)μ=160.5cm,σ=5.2cm的正態(tài)分布;從X~N(160.5,5.22)的正態(tài)總體中隨機(jī)抽樣,樣本含量nj=20,g=100;共抽100次;圖1.2008年某市19歲女生身高均數(shù)
N(160.5,5.22)的抽樣示意μ=160.5cmσ=5.2cmX1,X2,X3…Xj…,
160.19,1.05158.97,1.39160.37,1.47:161.64,1.44100個(gè)新的分布特點(diǎn)10樣本均數(shù)組成一個(gè)新的分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異;樣本均數(shù)的分布很有規(guī)律;100個(gè)樣本均數(shù)的均數(shù)為160.43cm,而原總體均數(shù)為160.5cm()樣本均數(shù)的變異范圍較原變量的變異范圍大大縮??;標(biāo)準(zhǔn)差為1.18(5.2);
中心極限定理若原變量服從正態(tài)分布,則新變量服從正態(tài)分布;若原變量不服從正態(tài)分布,n較大(大于等于30或50),則新變量服從正態(tài)分布;n較小,新變量為非正態(tài)分布;標(biāo)準(zhǔn)誤:估計(jì)抽樣誤差大小的指標(biāo)標(biāo)準(zhǔn)誤(standarderror,SE):樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差;樣本均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM):;樣本均數(shù)的標(biāo)準(zhǔn)誤的估計(jì)值:例2000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白含量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。均數(shù)標(biāo)準(zhǔn)誤的含義反映均數(shù)抽樣誤差大小的一個(gè)指標(biāo);均數(shù)的標(biāo)準(zhǔn)誤與原分布的標(biāo)準(zhǔn)差成
正比,與抽樣樣本量n開根號(hào)成反比;欲減少抽樣誤差,可增加樣本量;利用均數(shù)標(biāo)準(zhǔn)誤可以進(jìn)行總體均數(shù)的置信區(qū)間的估計(jì)和假設(shè)檢驗(yàn)。第二節(jié)t分布t分布的由來t分布的圖形和特征t界值表
標(biāo)準(zhǔn)正態(tài)變換X0,1ut變換0t抽樣實(shí)驗(yàn)
t分布的由來Xt分布圖形的演變
t分布圖形的演變英國統(tǒng)計(jì)學(xué)家Gosset于1908年以筆名“Student”發(fā)表了一篇論文,提出了t分布(distribution)的理論,因此t分布又稱為學(xué)生氏t分布,其分布密度函數(shù)是:其中,為伽瑪函數(shù)符號(hào),它是已知函數(shù);π為圓周率;ν表示自由度。24t分布圖形的特征單峰分布,以0為中心,左右對稱只有一個(gè)參數(shù)ν(自由度n-1),
ν越小,則t值越分散,峰部越矮而尾部翹得越高當(dāng)ν逼近∞時(shí),t分布逼近u分布t分布圖形下面積具有規(guī)律性總面積為1;任意兩區(qū)間的面積都可以用積分的方法求出;當(dāng)單雙側(cè)確定時(shí),自由度ν確定時(shí),尾部面積(α)與橫軸t值之間有一一對應(yīng)的關(guān)系;tα/2,ν表示雙側(cè)尾部面積為α,自由度為ν時(shí)的t界值;tα,ν表示單側(cè)尾部面積為α,自由度為ν時(shí)的t界值;t界值表的特點(diǎn)(p410)表示在單雙側(cè)確定時(shí),自由度ν確定時(shí),t界值越大,外圍面積(P)越?。环粗嗳?;單雙側(cè)確定時(shí),外圍面積(α或P)確定時(shí),自由度ν越大,t界值越小,當(dāng)ν→∞時(shí),t=u;t0.05/2,∞=1.96;t0.01/2,∞=2.58第三節(jié)單個(gè)總體參數(shù)的置信區(qū)間(二)區(qū)間估計(jì)(intervalestimation)按預(yù)先給定的概率(1-α)確定的包含未知總體參數(shù)的可能范圍。(一)點(diǎn)估計(jì):用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值1、σ已知單側(cè):雙側(cè):或正態(tài)分布法2、σ未知,但樣本例數(shù)n足夠大時(shí)(n>50)雙側(cè):單側(cè):或正態(tài)分布法3、σ未知時(shí),n不是很大(最常用)雙側(cè):~單側(cè):或t分布法例5.332置信區(qū)間的含義表示以一定的置信區(qū)間(1-α)估計(jì)總體均數(shù)(參數(shù))可能的波動(dòng)范圍;總體均數(shù)95%CI(confidenceinterval)表示隨機(jī)抽樣100次(n固定),計(jì)算100個(gè)置信區(qū)間,平均有95個(gè)區(qū)間包含總體均數(shù),有5個(gè)不包含;但對一次抽樣來講,只能說是包含或不包含95%CI與99%CI的區(qū)別點(diǎn)估計(jì)與置信區(qū)間的差別正常參考值范圍與置信區(qū)間的差別33第三節(jié)二項(xiàng)分布
(Binomialdistribution)與率的置信區(qū)間Bernoulli試驗(yàn)以A表示所感興趣的事件,A事件發(fā)生稱為“成功”,不出現(xiàn)稱為“失敗”。相應(yīng)的這類試驗(yàn)稱作為“成一敗型”試驗(yàn)或Bernoulli試驗(yàn)。Bernoulli試驗(yàn)滿足條件(1)每次試驗(yàn)結(jié)果只能是兩個(gè)互斥結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變,每次試驗(yàn)結(jié)果A事件發(fā)生的概率為常數(shù)。(3)各次試驗(yàn)獨(dú)立,即每次試驗(yàn)出現(xiàn)事件A的概率與前面各次試驗(yàn)出現(xiàn)的結(jié)果無關(guān)。二項(xiàng)分布的概念n次重復(fù)獨(dú)立試驗(yàn)(Bernoulli試驗(yàn)),當(dāng)每次試驗(yàn)的“陽性概率”保持不變時(shí),出現(xiàn)“陽性”的次數(shù)k=0,1,2…,n的一種概率分布。,k=0,1,2,…n
n為試驗(yàn)例數(shù),k為陽性次數(shù),
π為陽性率,
當(dāng)n和不同時(shí),二項(xiàng)分布的概率是不同的,所以說n和是二項(xiàng)分布的兩個(gè)重要參數(shù)。如果隨機(jī)變量x服從以n和為參數(shù)的二項(xiàng)分布,則記作x~B(n,)。二項(xiàng)分布的概率計(jì)算
恰好有k例陽性數(shù)的概率為最多發(fā)生k例,即xk的累計(jì)概率為最少發(fā)生k例,即xk的累計(jì)概率二項(xiàng)分布概率的遞推公式為二項(xiàng)分布的性質(zhì)
2、二項(xiàng)分布的正態(tài)近似(normalapproximation)
概率論中的中心極限定理證明:當(dāng)n足夠大時(shí),且不接近于0也不接近于1時(shí),且
n和n(1-)≥5,二項(xiàng)分布x~B(n,)近似于正態(tài)分布
N(n,)。樣本率的分布和正態(tài)近似
樣本率的分布和正態(tài)近似例5-?
從陽性率樣本率=0.6的總體中隨機(jī)抽取樣本量為16的樣本,求樣本率p的均數(shù)和標(biāo)準(zhǔn)差。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。同樣樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤,它描述了樣本率抽樣誤差的大小。樣本率的分布和正態(tài)近似樣本率分布的正態(tài)近似當(dāng)樣本量n較大,總體率不接近于0也不接近1時(shí),且n和n(1-)≥5,樣本陽性率也近似服從正態(tài)分布p~N(,)。事實(shí)上,總體率,一般是不知道的,往往用p來估計(jì),用樣本率的標(biāo)準(zhǔn)誤的估計(jì)值來估計(jì)。
利用樣本資料可估計(jì)二項(xiàng)分布總體概率的1-置信區(qū)間,一般取0.05或0.01。對于,且接P近于0或1時(shí),可直接查表得到總體概率的(1-
)置信區(qū)間。例5.5總體率的置信區(qū)間查表法當(dāng)n足夠大,且P和1-P均不太小,如nP和n(1-P)均大于5時(shí),P的抽樣分布逼近正態(tài)分布。此時(shí),可根據(jù)正態(tài)分布的特性計(jì)算總體率的置信區(qū)間。
總體率的置信區(qū)間正態(tài)近似法率的抽樣誤差,即標(biāo)準(zhǔn)誤第四節(jié)泊松分布(PoissonDistribution
)
是一種典型的離散型隨機(jī)變量的分布,主要用于描述事件出現(xiàn)概率很小而樣本含量或試驗(yàn)次數(shù)很大的隨機(jī)變量的概率分布。當(dāng)n->∞,P≤0.05時(shí),這時(shí)二項(xiàng)分布向泊松分布逼近;泊松分布用來分析醫(yī)學(xué)上人群中遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病的發(fā)病或患病人數(shù)的分布;也可用于研究單位時(shí)間、空間、容積內(nèi)某罕見時(shí)間發(fā)生次數(shù)的分布;Poisson分布是二項(xiàng)分布的特例,由于這時(shí)n特別大,p特別小,在數(shù)學(xué)上用二項(xiàng)分布計(jì)算n次重復(fù)獨(dú)立試驗(yàn)(Bernoulli試驗(yàn)),出現(xiàn)“陽性”的次數(shù)X=0,1,2…,n的概率變得十分困難,所以,可以通過Poisson分布近似計(jì)算出現(xiàn)“陽性”次數(shù)X概率值如已知2000年上海市10萬婦女人群中乳腺癌的發(fā)病人數(shù)為40人(=0.0004),計(jì)算某小區(qū)10萬人中剛好出現(xiàn)50人的概率?二項(xiàng)分布的概率公式可推導(dǎo)出泊松分布的概率計(jì)算公式為:
為單位時(shí)間(空間)稀有事件的發(fā)生數(shù)(陽性數(shù))的總體均數(shù).二項(xiàng)分布當(dāng)n很大而很小時(shí)即逼近于參數(shù)λ=n×的泊松分布,記做xP()泊松分布的性質(zhì)
1、泊松分布均數(shù)等于方差:=
2=
2.泊松分布的可加性
泊松分布的正態(tài)近似數(shù)理統(tǒng)計(jì)證明:當(dāng)足夠大時(shí),泊松分布趨向于正態(tài)分布。所以只要相當(dāng)大(如50)即可認(rèn)為泊松分布近似于正態(tài)分布。二項(xiàng)分布的泊松分布近似
例5-14根據(jù)以往經(jīng)驗(yàn)新生兒染色體異常為1%,試分別用二項(xiàng)分布和泊松分布原理求100名新生兒中發(fā)生x例染色體異常的概率第四節(jié)兩總體參數(shù)之差的置信區(qū)間兩總體均數(shù)差的置信區(qū)間例5.7
為研究某種外用中藥搽劑對小鼠瓊脂肉芽腫的抑制作用,某醫(yī)院醫(yī)師選取一級(jí)昆明種雌小鼠21只,隨機(jī)分為實(shí)驗(yàn)組10只和對照組11只,分別測得其實(shí)驗(yàn)前的肉芽腫重見表5.7,試估計(jì)實(shí)驗(yàn)前兩組小鼠的肉芽腫重均數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 3903.6-2024鞋類整鞋試驗(yàn)方法防滑性能
- 客戶答謝會(huì)致辭(15篇)
- 感恩父母演講稿(19篇)
- 堅(jiān)持新發(fā)展說課
- 當(dāng)幸福來敲門觀后感集合15篇
- 初級(jí)會(huì)計(jì)實(shí)務(wù)-初級(jí)會(huì)計(jì)《初級(jí)會(huì)計(jì)實(shí)務(wù)》模擬試卷93
- 智研咨詢發(fā)布-2024年中國智能物聯(lián)網(wǎng)(AIOT)行業(yè)市場競爭格局、行業(yè)政策及需求規(guī)模預(yù)測報(bào)告
- 2025年有機(jī)肥行業(yè)發(fā)展趨勢分析報(bào)告
- 二零二五年度駕駛員勞務(wù)派遣合同協(xié)議書3篇
- 應(yīng)急預(yù)案的知識(shí)普及
- 2023-2024年員工三級(jí)安全培訓(xùn)考試題及參考答案(綜合題)
- 對口升學(xué)語文模擬試卷(6)-江西?。ń馕霭妫?/a>
- 招標(biāo)采購基礎(chǔ)知識(shí)培訓(xùn)
- 五年級(jí)口算題卡每天100題帶答案
- 2025屆新高考英語復(fù)習(xí)閱讀理解說明文解題策略
- 《社區(qū)康復(fù)》課件-第一章 總論
- 上海中考英語考綱詞匯
- 【工商管理專業(yè)畢業(yè)綜合訓(xùn)練報(bào)告2600字(論文)】
- 2024年全國初中數(shù)學(xué)聯(lián)合競賽試題參考答案及評(píng)分標(biāo)準(zhǔn)
- 《幼兒園健康》課件精1
- 22S803 圓形鋼筋混凝土蓄水池
評(píng)論
0/150
提交評(píng)論