衛(wèi)生統(tǒng)計學(xué)之抽樣誤差和抽樣分布概述(共34頁).ppt_第1頁
衛(wèi)生統(tǒng)計學(xué)之抽樣誤差和抽樣分布概述(共34頁).ppt_第2頁
衛(wèi)生統(tǒng)計學(xué)之抽樣誤差和抽樣分布概述(共34頁).ppt_第3頁
衛(wèi)生統(tǒng)計學(xué)之抽樣誤差和抽樣分布概述(共34頁).ppt_第4頁
衛(wèi)生統(tǒng)計學(xué)之抽樣誤差和抽樣分布概述(共34頁).ppt_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Department of Epidemiology and BiostatisticsSchool of Public Health, Nanjing Medical University衛(wèi)生統(tǒng)計學(xué)抽樣誤差和抽樣分布Sampling Error and Sampling Distribution主要內(nèi)容o抽樣誤差n抽樣誤差的重要性n抽樣誤差的定義n抽樣誤差的規(guī)律性o標準誤n標準誤的定義n標準誤的計算n標準誤的意義n標準誤的作用ot分布nt分布的演化nt分布的圖形nt分布的性質(zhì)oF分布o2分布1.1 抽樣誤差的重要性o既然有誤差,為什么還要抽樣?n無限總體的客觀存在n試驗研究的成本效益問題(c

2、ost effect)抽樣誤差的重要性總體同質(zhì)個體、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機抽樣樣本統(tǒng)計量已知統(tǒng)計推斷風(fēng) 險1.2 抽樣誤差的定義o假如事先知道某地七歲男童的平均身高為119.41cm。為了估計七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取100人,共計抽取了五次。119.41cm= 4.38cm118.21cm=4.45cmXs120.18cm=4.90cmXs117.78cm=3.98cmXs119.87m=5.15cmXs120.81cm=4.33cmXs抽樣誤差的定義o五次抽樣得到了不同的結(jié)果,原因何在?個體變異隨機抽樣不同男童的身高不同每

3、次抽到的人幾乎不同抽樣誤差抽樣誤差的定義【定義】由于個體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計量和總體參數(shù)之間的差異,稱為抽樣誤差(sampling error)。各種參數(shù)都有抽樣誤差,這里我們以均數(shù)為研究對象抽樣誤差的表現(xiàn)抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別iX樣本均數(shù)和樣本均數(shù)間的差別ijXX抽樣誤差o定義。o只要有個體變異和隨機抽樣研究,抽樣誤差就是不可避免的。o抽樣誤差有自己的客觀規(guī)律,統(tǒng)計學(xué)就是撥開抽樣誤差之霧來洞察客觀規(guī)律的利器。1.3 抽樣誤差的規(guī)律性 既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的? Lets Enjoy Our Experiments!中心極限定理

4、(central limit theorem)的表現(xiàn)o從正態(tài)總體中隨機抽樣,其樣本均數(shù)服從正態(tài)分布;o從任意總體中隨機抽樣,當(dāng)樣本含量足夠大時,其樣本均數(shù)的分布逐漸逼近正態(tài)分布;o樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近;o隨著樣本含量的增加,樣本均數(shù)的離散程度越來越小,表現(xiàn)為樣本均數(shù)的分布范圍越來越窄,其高峰越來越尖。2.1 標準誤的定義o樣本統(tǒng)計量(如均數(shù))也服從一定的分布;o與描述觀測值離散趨勢的指標類似,我們使用樣本統(tǒng)計量的標準差來反映抽樣誤差的大小。又稱標準誤(standard error)。222XXXXkk標準誤(standard error)22xn2.2 標準誤的計算o計算公

5、式為其中,為總體標準差,n為抽樣的樣本例數(shù)o在研究工作時,由于總體標準差常常未知,可以利用樣本標準差近似估計XnXssn標準誤的計算【例】根據(jù)7歲男童的身高資料,在已知總體標準差時,標準誤為4.38/10=0.438cm而若以第一次抽樣的樣本標準差來代替總體標準差,則標準誤為4.45/10=0.445cm2.3 標準誤的意義o標準誤的意義n反映了樣本統(tǒng)計量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。n標準誤越大,說明樣本統(tǒng)計量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計量來直接估計總體參數(shù)越不可靠。反之亦然。n標準誤的大小與標準差有關(guān),在例數(shù)n一定時,從標準差大的總體中抽樣,

6、標準誤較大;而當(dāng)總體一定時,樣本例數(shù)越多,標準誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小。2.4 標準誤的作用o標準誤的用途n衡量樣本統(tǒng)計量代表總體參數(shù)的可靠性;n估計總體參數(shù)的可信區(qū)間;n進行假設(shè)檢驗。2.5 標準差和標準誤的聯(lián)系與區(qū)別標準差標準誤對象個體變異抽樣誤差計算方法定義定義性質(zhì)n越大,標準差越穩(wěn)定n越大,標準誤越小用途參考值范圍衡量離散程度可信區(qū)間,假設(shè)檢驗3.1 樣本均數(shù)的抽樣分布規(guī)律o中心極限定理u從均數(shù)為,標準差為的正態(tài)總體中隨機抽樣,樣本均數(shù)服從均數(shù)為,標準差為 的正態(tài)分布。u從均數(shù)為,標準差為的任意總體中隨機抽樣,當(dāng)樣本含量足夠大時,樣本均數(shù)近似服從均數(shù)為,

7、標準差為 的正態(tài)分布。 nn3.2 t分布的演化o根據(jù)中心極限定理的內(nèi)容,當(dāng)樣本含量足夠大時,對從均數(shù)為,標準差為的任意總體中隨機抽樣所得的樣本均數(shù)進行標準化變換,有(0,1)iiXNnt分布的演化o由于總體標準差往往是未知的,此時往往用樣本標準差代替總體標準差,這里,為自由度(degree of freedom,df),取值為n-1o由W.S. Gosset提出Xttsn f(t) =(標準正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3自由度分別為1、5、 時的 t 分布3.3 t分布的圖形由Gosset提出3.4 t分布的性質(zhì)ot分布為一簇單峰分布曲線。ot分布以0為中

8、心,左右對稱。o分布的高峰位置比 u 分布低,尾部高。即相同的尾部面積對應(yīng)的界值,比 u 分布大。例如:P=0.05,u=1.64,而,而自由度為10的 t分布界值,t = 1.812。ot分布與自由度有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時,t分布逐漸逼近標準正態(tài)分布;當(dāng)自由度為無窮大時,t分布就是標準正態(tài)分布。o每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表 。t界值表單側(cè): P(t =t,)= 雙側(cè): P(t =t,)= 即:P(-t,t t,)= 1-例 查t界值表得t值表達式 t 0.05,10=2.228 (雙側(cè)) t 0.05,10=1.812

9、 (單側(cè))-tt04 2分布o設(shè)從正態(tài)分布N(,2)中隨機抽取含量為n的樣本,樣本均數(shù)和標準差分別為 和s,設(shè):o則2值服從自由度為n-1的2分布(2-distribution),是小寫希臘字母,讀作chi??梢?,2分布是方差的抽樣分布。X222) 1(sn 2分布的特征o2分布為一簇單峰正偏態(tài)分布曲線,o自由度為的2分布,其均數(shù)為,方差為2。o1時2分布實際上是標準正態(tài)分布變量之平方。自由度為的2分布實際上是個標準正態(tài)分布變量之平方和??杀硎緸椋?=u12+ u22+ uv2 o每一自由度下的2分布曲線都有其自身分布規(guī)律=4=3=520246810120.00.10.20.30.40.5f(

10、2)=1=2=62分布的作用o方差的抽樣分布研究 o樣本分布與理論分布的擬合優(yōu)度檢驗o率或構(gòu)成比的比較 iiiTTA22)(5 F分布o設(shè)從兩個方差相等的正態(tài)分布N(1,2)和N(2,2)總體中隨機抽取含量分別為n1和n2的樣本,樣本均數(shù)和標準差分別為 、s1和 、 s2。設(shè): o則F值服從自由度為(n1-1,n2-1)的F分布(F-distribution)。 2X1X2221ssF F分布的特征oF分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。o若F服從自由度為(1,2)的F分布,則其倒數(shù)1/F服從自由度為(2,1)的F分布。o自由度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自由度無關(guān)。o第一自由度11時,F(xiàn)分布實際上是t分布之平方;第二自由度2時,F(xiàn)分布實際上等于2分布。o每一對自由度下的F分布曲線下的面積分布規(guī)律。 0123450.00.20.40.60.81.0 012345 0.00.20.40.60.81.01

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論