山東大學衛(wèi)生統(tǒng)計學課件 第四章 總體均數(shù)的估計和假設檢驗_第1頁
山東大學衛(wèi)生統(tǒng)計學課件 第四章 總體均數(shù)的估計和假設檢驗_第2頁
山東大學衛(wèi)生統(tǒng)計學課件 第四章 總體均數(shù)的估計和假設檢驗_第3頁
山東大學衛(wèi)生統(tǒng)計學課件 第四章 總體均數(shù)的估計和假設檢驗_第4頁
山東大學衛(wèi)生統(tǒng)計學課件 第四章 總體均數(shù)的估計和假設檢驗_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 總體均數(shù)的估計和假設檢驗 學時分配:8學時掌握內容:1t分布的概念和特征2總體均數(shù)的區(qū)間估計3總體率的區(qū)間估計4假設檢驗的基本步驟5假設檢驗的基本原理6常用的數(shù)值型變量假設檢驗的方法熟悉:1、抽樣誤差的概念2、引起抽樣誤差的原因3、均數(shù)、率的標準誤的計算4、標準差和標準誤的區(qū)別了解內容:1假設檢驗中概率P與檢驗水準的關系2抽樣研究的意義3中心極限定理的內容 第一節(jié)抽樣研究與抽樣誤差一抽樣研究(一)抽樣研究的意義前面已經(jīng)講述了總體與樣本兩個統(tǒng)計學術語,人們在醫(yī)學研究中多采用由樣本信息來推論總體特征的方法,這在實際工作中是十分必要的,經(jīng)理論與實踐證明也是行之有效的。目前對某一總體

2、進行研究的最重要、最常用的方法就是抽樣研究。由于研究對象很多是無限總體,要直接研究總體的情況是不可能的。即使對有限總體來說,若包含的觀察單位數(shù)過多,需要耗費大量的人力、物力和時間,而且也不易組織,難以保證工作的質量。有的時候,觀察的實質就是一種破壞性實驗,根本就不允許對總體中的每一個體逐一觀察。如對一批注射藥劑作質量檢查,不可能將所有的藥劑瓶都打開加以檢驗,這顯然是不可能的。抽樣研究作為一種由部分認識整體的觀察方法,從古到今一直被人們自覺或不自覺地應用著,如炒菜時嘗嘗咸淡,就醫(yī)時取幾滴血作化驗等。實踐證明這是行之有效的方法。目前抽樣研究的理論與技術已發(fā)展成熟,只要嚴格按照有關抽樣研究的要求去做

3、,這是完全可行的。所以,在實際工作中人們多采用抽樣研究的方法,其目的就是要用樣本信息來推斷總體特征,這就叫統(tǒng)計推斷(statisticalinference)。(二)抽樣研究和抽樣誤差抽樣研究是指從總體中按照隨機化的原則,抽取一定數(shù)量的個體組成樣本進行研究,從而推斷總體的研究方法。在實際工作中,由于總體中各觀察對象之間存在著個體變異,且隨機抽取的樣本又只是總體中的一部分,因此計算的樣本統(tǒng)計量,不一定恰好等于相應的總體參數(shù)。這種由于個體變異的存在,在抽樣研究中產(chǎn)生的樣本統(tǒng)計量與相應的總體參數(shù)間的差異,稱為抽樣誤差(sampling error),同樣,來自同一總體的若干樣本的統(tǒng)計量之間,也會存在

4、誤差,這種誤差也反映在樣本統(tǒng)計量與總體參數(shù)間的差異。當樣本是來自相應總體的隨機樣本時,抽樣誤差為隨機誤差,其誤差大小可以依據(jù)中心極限定理進行估計。中心極限定理的內容是,以數(shù)值變量資料為例,若從均數(shù)為的正態(tài)總體中以固定n反復多次(比如100次)抽樣時,所得的樣本均數(shù)的分布是正態(tài)分布;即使是從偏態(tài)總體中抽樣,只要足夠大,的分布也近似正態(tài)分布。在抽樣研究中抽樣誤差是不可避免的,根據(jù)資料的性質和指標種類的不同,抽樣誤差有多種,例如:從某地7歲男童中隨機抽取110名,測得平均身高為119.95cm,該樣本均數(shù)不一定等于該地7歲男童身高的總體均數(shù),這種樣本均數(shù)與總體均數(shù)間的差別,稱為均數(shù)的抽樣誤差。某縣為

5、血吸蟲病流行區(qū),從該縣人群中隨機抽取400人,測得的血吸蟲感染人數(shù)為60人,感染率為15%,該樣本率不一定等于該地人群的總體感染率。此為樣本率與總體率之間的差別,稱為率的抽樣誤差。此外,樣本方差和相應的總體方差也存在抽樣誤差,后面介紹的相關系數(shù)和回歸系數(shù)也有抽樣誤差的問題。 二均數(shù)的抽樣誤差在抽樣研究中,若從同一總體中隨機抽取樣本含量相同的若干個樣本,并計算出某種樣本統(tǒng)計量(如樣本均數(shù)),由于生物間的個體變異是客觀存在的,抽樣誤差是不可避免的,這些樣本統(tǒng)計量之間具有離散趨勢。數(shù)理統(tǒng)計研究表明,抽樣誤差具有一定的規(guī)律性,可以用特定的指標來描述。這個指標稱為標準誤(standarderror),標

6、準誤除了反映樣本統(tǒng)計量之間的離散程度外,也反映樣本統(tǒng)計量與相應總體參數(shù)之間的差異,即抽樣誤差大小。本章主要介紹最常用的均數(shù)標準誤以及率的標準誤。(一)均數(shù)標準誤的意義將來自同一總體的若干個樣本均數(shù)看成一組新的觀察值,研究其頻數(shù)分布,包括集中趨勢和離散趨勢,可計算樣本均數(shù)的均數(shù)和標準差。例3.1假定某市16歲女中學生的身高分布服從均數(shù)()為155.4cm,標準差()為5.3cm的正態(tài)分布?,F(xiàn)用電子計算機作抽樣模擬試驗,每次隨機抽出10個觀察值(即樣本含量n=10),共抽取100個樣本,求得100個樣本均數(shù)并編制成頻數(shù)分布表如表4.1。表4.1100個樣本均數(shù)的頻數(shù)分布(=155.4cm,=5.3

7、cm)組段(cm)頻數(shù)1511152615315154191552715616157815851593合計100從表4.1中可以發(fā)現(xiàn),當原始觀察值的分布為正態(tài)分布時,這些樣本均數(shù)的頻數(shù)分布基本服從正態(tài)分布。統(tǒng)計理論證明,若原始觀察值的分布為偏態(tài)分布,當樣本含量n足夠大時,其樣本均數(shù)的分布仍近似服從正態(tài)分布。所以,可以求得樣本均數(shù)的均數(shù)為155.38cm,與總體均數(shù)155.4cm接近。中心極限定理表明,樣本均數(shù)的均數(shù)等于原總體的總體均數(shù)()。同樣,也可以求得樣本均數(shù)的標準差為,為了與描述觀察值離散程度的標準差相區(qū)別,用均數(shù)標準誤來表示樣本均數(shù)的標準差。均數(shù)標準誤反映來自同一總體的樣本均數(shù)的離散程

8、度以及樣本均數(shù)與總體均數(shù)的差異程度,也是說明均數(shù)抽樣誤差大小的指標。均數(shù)標準誤大,說明各樣本均數(shù)的離散程度大,抽樣誤差就大。反之亦然。(二)均數(shù)標準誤的計算數(shù)理統(tǒng)計可以證明,均數(shù)標準誤的計算公式為:(4.1)式中為均數(shù)標準誤的理論值,為總體標準差,n為樣本含量。已知時,可按式(4.1)求得均數(shù)標準誤的理論值。上述例子中=155.4cm,n=10,可得:=計算結果與樣本均數(shù)的標準差1.71cm相近。由于在抽樣研究中常屬未知,通常用一個樣本的標準差(s)來估計,所以,在實際工作中,常用式(4.2)計算均數(shù)標準誤的估計值()(4.2)由式(4.1)或(4.2)可見,當n一定時,均數(shù)標準誤與標準差成正

9、比。標準差越大,均數(shù)標準誤越大,即觀察值的離散程度越高,均數(shù)的抽樣誤差越大。當標準差一定時,均數(shù)標準誤和成反比。樣本含量越大,均數(shù)的抽樣誤差越小。因此,在實際工作中,可通過適當增加樣本含量和減少觀察值的離散程度(如選擇同質性較好的總體)來減少抽樣誤差。(三)均數(shù)標準誤的用途:1衡量樣本均數(shù)的可靠性由于均數(shù)標準誤越小,均數(shù)的抽樣誤差越小,樣本均數(shù)就越可靠。2估計總體均數(shù)的可信區(qū)間。3用于均數(shù)的假設檢驗。  第二節(jié) t分布 一t分布(t-distribution)(一)u分布在前一章中,我們已經(jīng)講述了正態(tài)分布(normal distribution)是數(shù)理統(tǒng)計中的一種重要的理論

10、分布,是許多統(tǒng)計方法的理論基礎。正態(tài)分布有兩個參數(shù),和,決定了正態(tài)分布的位置和形態(tài)。為了應用方便,常將一般的正態(tài)變量X通過u變換轉化成標準正態(tài)變量u,以使原來各種形態(tài)的正態(tài)分布都轉換為=0,=1的標準正態(tài)分布(standard normal distribution),亦稱u分布。根據(jù)中心極限定理,通過上述的抽樣模擬試驗表明,在正態(tài)分布總體中以固定n(本次試驗n=10)抽取若干個樣本時,樣本均數(shù)的分布仍服從正態(tài)分布,即N(,)。所以,對樣本均數(shù)的分布進行u變換,也可變換為標準正態(tài)分布N (0,1)(二)t分布由于在實際工作中,往往是未知的,常用s作為的估計值,為了與u變換區(qū)別,稱為t變換t=,

11、統(tǒng)計量t 值的分布稱為t分布。t分布有如下特征:1以0為中心,左右對稱的單峰分布;2t分布是一簇曲線,其形態(tài)變化與n(確切地說與自由度)大小有關。自由度越小,t分布曲線越低平;自由度越大,t分布曲線越接近標準正態(tài)分布(u分布)曲線,如圖4.1。t=圖4.1自由度為1、5、的t分布對應于每一個自由度,就有一條t分布曲線,每條曲線都有其曲線下統(tǒng)計量t的分布規(guī)律,計算較復雜。因此,統(tǒng)計學家上根據(jù)自由度的大小與t分布曲線下面積的關系,編制了附表2,t界值表,以便于應用。表中的橫標目為自由度,縱標目為概率P,表中數(shù)字表示自由度為某值時,P為某值時,t的界值。因t分布是以0為中心的對稱分布,故附表中只列出

12、正值,如果算出的t值為負值,可以用絕對值查表。t分布曲線下面積為95%或99%的界值不是一個常量,而是隨著自由度大小而變化的,分別用和表示。第三節(jié) 總體均數(shù)的估計 統(tǒng)計推斷包括兩個重要的方面:參數(shù)估計和假設檢驗。假設檢驗在后面的章節(jié)中討論,這里先討論參數(shù)估計。參數(shù)估計就是用樣本指標(稱為統(tǒng)計量,statistic)來估計總體指標(參數(shù),parameter)。參數(shù)估計有兩種方法:(一)點估計(point estimation)如在服從正態(tài)分布的總體中隨機抽取樣本,可以直接用樣本均數(shù)來估計總體均數(shù),樣本標準差來估計總體標準差。該方法雖然簡單易行,但未考慮抽樣誤差,而抽樣誤差在抽樣研究中又

13、是客觀存在的、不可避免的,會隨不同的樣本對總體參數(shù)作出不同的點估計。(二)區(qū)間估計(interval estimation)即按一定的概率(可信度)估計未知的總體參數(shù)可能所在的范圍(或稱可信區(qū)間)的估計方法。區(qū)間估計是在隨機抽取樣本后,考慮抽樣誤差存在的情況下的估計方法,較為準確可靠。統(tǒng)計學上通常用95%(或99%)可信區(qū)間表示總體參數(shù)有95%(或99%)的概率在某一范圍,可根據(jù)資料的條件選用不同的方法。下面以總體均數(shù)的95%可信區(qū)間為例,介紹其計算公式。已知時按正態(tài)分布原理計算,未知時按t分布的原理計算。1已知時由u分布可知,正態(tài)曲線下有95%的u值在±1.96之間,即:P(-1.

14、96u+1.96)=0.95P(-1.96+1.96)=0.95移項后整理得,故總體均數(shù)的95%可信區(qū)間為()(4.5)2未知,但n足夠大(如n>100)時由t分布可知,當自由度越大,t分布越逼近u分布,此時t曲線下有95%的t值在±1.96之間,即:P(-1.96t+1.96)=0.95P(-1.96+1.96)=0.95 P()=0.95故總體均數(shù)的95%可信區(qū)間為(,)(4.6)3未知且n小時某自由度的t曲線下有95%的t值在±之間,即:故總體均數(shù)的95%可信區(qū)間為(,)(4.7)例3.3對某人群隨機抽取20人,用某批號的結核菌素作皮試,平均浸潤直徑為10.9c

15、m,標準差為3.86cm。問這批結核菌素在該人群中使用時,皮試的平均浸潤直徑的95%可信區(qū)間是多少?該例n=20, n較小,按公式(4.7)計算。=20-1=19,查t界值表,得=2.093估計這批結核菌素在該人群中使用,皮試的平均浸潤直徑的95%可信區(qū)間為(10.9-2.093*3.86/,10.9+2.093*3.86/)cm即(9.1,12.7)cm。(三)可信區(qū)間的注意問題1可信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確,估計錯誤的只有5次。5%是小概率事件,實際發(fā)生的可能性很小,當

16、然這種估計方法會有5%犯錯誤的風險。2可信區(qū)間的兩個要素:一是準確度,反映在可信度的大小,即區(qū)間包含總體均數(shù)的概率的大小,愈接近1愈好。二是精密度,反映在區(qū)間的長度,長度愈小愈好。在樣本含量確定的情況下,二者是矛盾的,若只管提高可信度,會把區(qū)間變得很長,故不宜認為99%可信區(qū)間比95%可信區(qū)間好,需要兼顧準確度和精密度,一般來說95%可信區(qū)間更為常用,在可信度確定的情況下,增加樣本含量,可減少區(qū)間長度,提高精密度。(王淑康)第四節(jié) 假設檢驗的基本步驟 一、假設檢驗的基本思想在抽樣研究中,由于樣本所來自的總體其參數(shù)是未知的,只能根據(jù)樣本統(tǒng)計量對其所來自總體的參數(shù)進行估計,如果要比較兩個

17、或幾個總體的參數(shù)是否相同,也只能分別從這些總體中抽取樣本,根據(jù)這些樣本的統(tǒng)計量作出統(tǒng)計推斷,籍此比較總體參數(shù)是否相同。由于存在抽樣誤差,總體參數(shù)與樣本統(tǒng)計量并不恰好相同,因此判斷兩個或多個總體參數(shù)是否相同是一件很困難的事情。如醫(yī)生在某山區(qū)隨機測量了25名健康成年男子的脈搏,平均次數(shù)為74.2次分鐘,標準差為5.2次分鐘,但是根據(jù)醫(yī)學常識,一般男子的平均脈搏次數(shù)為72次分鐘,問該山區(qū)男子脈搏數(shù)與一般男子是否不同?要回答這個看似簡單的問題并非易事。這個問題難以從正面直接回答,可以先假定該山區(qū)所有男子脈搏數(shù)數(shù)值組成一個總體,其總體均數(shù)和標準差均為未知數(shù),不妨分別以、表示。如果我們假設該山區(qū)男子的脈搏

18、數(shù)與一般地區(qū)的男子相同,即屬于同一總體,72,所測量的25名男子的平均脈搏數(shù)(樣本均數(shù))之所以不恰好等于72次分,是由于抽樣誤差所致。如果上述假設成立,則理論上講,樣本均數(shù)很可能在總體均數(shù)(72)的附近,樣本均數(shù)遠離總體均數(shù)的可能性很小。如果將樣本均數(shù)變換為值,則值很可能在0的附近,值遠離0的可能性很小。如果值很小上述假設可能不正確,可拒絕上述假設。假設檢驗包括單側檢驗和雙側檢驗兩種情況,當根據(jù)專業(yè)知識已知兩總體的參數(shù)中甲肯定不會小于乙,或甲肯定不會大于乙時,可考慮用單側檢驗,否則,宜用雙側檢驗。假設檢驗中的如何下檢驗結論(以檢驗為例):1、單側檢驗:如計算統(tǒng)計量為正值拒絕,接受不拒絕如計算統(tǒng)

19、計量為負值拒絕,接受不拒絕2、雙側檢驗:拒絕,接受不拒絕二、假設檢驗的一般步驟假設檢驗一般分為三步:1、建立假設,確定檢驗水準。一般假設檢驗中的檢驗假設(或稱為零假設、無效假設),假設樣本來自同一總體,即其總體參數(shù)相等。往往建立兩個假設,除建立檢驗假設外,還建立備擇假設,作為拒絕檢驗假設時的備選假設,檢驗水準為拒絕檢驗假設是犯第一類錯誤的概率。2、為選擇檢驗方法,并計算統(tǒng)計量。的類型不同、變量的分布類型不同、研究目的不同,都決定著選擇何種檢驗方法。因此需選擇合適的檢驗方法,并計算統(tǒng)計量。3、為根據(jù)統(tǒng)計量確定值,做出統(tǒng)計推斷。根據(jù)計算的統(tǒng)計量,查閱相應的統(tǒng)計表,確定值,以值與檢驗水準比較,若,則

20、拒絕,接受;若,則不拒絕。第五節(jié) 樣本與總體比較的假設檢驗 本章第一節(jié)中,在某山區(qū)隨機測量25名男子的脈搏數(shù)得一樣本均數(shù),而一般男子的脈搏數(shù)為可視為一般地區(qū)男子的總體均數(shù)。假設該山區(qū)男子的脈搏數(shù)與一般地區(qū)相同,即于一般地區(qū)的男子屬于同一總體,并將該樣本均數(shù)轉化為值(式1)(式2)式中為樣本均數(shù);為已知總體的均數(shù);為樣本標準差;為樣本含量。如果樣本含量足夠大時,可將樣本均數(shù)轉化為值(式3)例1以上述資料為例,比較某山區(qū)男子的脈搏數(shù)與一般地區(qū)的男子是否相同。假設檢驗的過程如下:1、建立假設,確定檢驗水準。:該山區(qū)男子脈搏數(shù)與一般地區(qū)男子相等,即:該山區(qū)男子脈搏數(shù)與一般地區(qū)男子不等,即2、

21、選擇檢驗方法計算統(tǒng)計量自由度3、查界值表,確定值,以查界值表得,本例的統(tǒng)計量值為2.115,大于界值,因此,按水準,拒絕,接受,可認為該山區(qū)男子的脈搏數(shù)與一般地區(qū)的男子不同。本例中值的確切值為如果本例用單側檢驗,其與雙側檢驗相同,但有不同,根據(jù)專業(yè)知識知道,山區(qū)男子的脈搏數(shù)不會低于一般地區(qū),因此為:該山區(qū)男子脈搏數(shù)高與一般地區(qū)男子,即,所得的值為:。 第六節(jié) 配對設計(paired design)資料的假設檢驗 配對設計是為了控制某些非處理因素對實驗結果的影響。將那些因素相同或相近的受試對象配成對子,使得同一對子中的受試對象除處理因素不同外,其他因素相同或相近,同一對子中的

22、兩受試對象分別接受不同的處理,其實驗結果的差異可以簡單的認為是“純”處理因素的作用。對于配對資料可以分析其差值。對配對資料的分析,一般用配對檢驗(paired t-test),其檢驗假設為:差值的總體均數(shù)為零。計算統(tǒng)計量的公式為(式4)(式5)式中為差值的均數(shù);為差值的標準差;為對子數(shù)。例1將大白鼠按照同窩、同性別和體重接近的的原則配成8對,每對中兩只大白鼠隨機確定一只進食正常飼料,另一只進食缺乏維生素E飼料,一段時間以后,測量兩組大白鼠的肝中維生素的A的含量如表1,問食物中維生素E的缺乏能否影響大白鼠肝中維生素A的含量?表1兩種飼料喂養(yǎng)大白鼠肝中維生素A的含量對子號(1)正常飼料(2)缺乏維生素E飼料(3)差值(4)(5)13350245011001210000220002400-400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合計65007370000計算得:兩種飼料喂養(yǎng)的大白鼠肝中維生素含量相等,即:兩種飼料喂養(yǎng)的大白鼠肝中維生素含量不等,即查表知,按水準,拒絕,接受,可認為兩組大白鼠肝中維生素A的含量不等,維生素E缺乏飼料組的大白鼠肝中維生素A含量低。 第七節(jié) 兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論