第三章 抽樣誤差與假設(shè)檢驗_第1頁
第三章 抽樣誤差與假設(shè)檢驗_第2頁
第三章 抽樣誤差與假設(shè)檢驗_第3頁
第三章 抽樣誤差與假設(shè)檢驗_第4頁
第三章 抽樣誤差與假設(shè)檢驗_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

復習1、描述數(shù)值型資料的分布用什么方法?2、如何描述數(shù)值型資料的分布特征?3、描述數(shù)值型資料的集中趨勢和離散趨勢指標有哪些?4、正態(tài)分布的特征1第三章抽樣誤差與假設(shè)檢驗掌握內(nèi)容:1.t分布的概念和特征2.總體均數(shù)的區(qū)間估計3.假設(shè)檢驗的基本步驟4.假設(shè)檢驗的基本原理5.常用的數(shù)值型變量假設(shè)檢驗的方法2熟悉:1、抽樣誤差的概念2、引起抽樣誤差的原因3、均數(shù)的標準誤的計算4、標準差和標準誤的區(qū)別第三章抽樣誤差與假設(shè)檢驗3第一節(jié)抽樣分布與抽樣誤差一.抽樣研究(一)抽樣研究的意義樣本總體4(1)由于研究對象很多是無限總體,要直接研究總體的情況是不可能的。(2)即使對有限總體來說,若包含的觀察單位數(shù)過多,需要耗費大量的人力、物力和時間,而且也不易組織,難以保證工作的質(zhì)量。(3)有的時候,觀察的實質(zhì)就是一種破壞性實驗,根本就不允許對總體中的每一個體逐一觀察。為什么要做抽樣研究?5目前抽樣研究的理論與技術(shù)已發(fā)展成熟,只要嚴格按照有關(guān)抽樣研究的要求去做,這是完全可行的。目的:就是要用樣本信息來推斷總體特征,這就叫統(tǒng)計推斷(statisticalinference)6(二)抽樣研究和抽樣誤差抽樣研究是指從總體中按照隨機化的原則,抽取一定數(shù)量的個體組成樣本進行研究,從而推斷總體的研究方法。在抽樣研究中產(chǎn)生的樣本統(tǒng)計量與相應(yīng)的總體參數(shù)間的差異,稱為抽樣誤差(samplingerror),7

(三)、抽樣誤差的分布

理論上可以證明:若從正態(tài)總體中,反復多次隨機抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標準差為。抽樣分布抽樣分布示意圖8

(三)、抽樣誤差的分布中心極限定理當樣本含量很大的情況下,無論原始測量變量服從什么分布,的抽樣分布均近似正態(tài)。

抽樣分布圖抽樣分布示意圖9二.均數(shù)的抽樣誤差如上所述,數(shù)理統(tǒng)計研究表明,抽樣誤差具有一定的規(guī)律性,可以用特定的指標來描述。這個指標稱為標準誤(standarderror

SE)。標準誤除了反映樣本統(tǒng)計量之間的離散程度外,也反映樣本統(tǒng)計量與相應(yīng)總體參數(shù)之間的差異,即抽樣誤差大小。10意義:反映抽樣誤差的大小。標準誤越小,抽樣誤差越小,用樣本均數(shù)估計總體均數(shù)的可靠性越大。與樣本量的關(guān)系:S一定,n↑,標準誤↓標準誤的計算公式:11例4.1在某地隨機抽查成年男子140人,計算得紅細胞均數(shù)4.77×1012/L,標準差0.38×1012/L,試計算均數(shù)的標準誤。

12均數(shù)標準誤的用途1.衡量樣本均數(shù)的可靠性由于均數(shù)標準誤越小,均數(shù)的抽樣誤差越小,樣本均數(shù)就越可靠,代表性越好。2.估計總體均數(shù)的可信區(qū)間。3.用于均數(shù)的假設(shè)檢驗。

13第二節(jié)t分布一.t分布(t-distribution)(一)Z分布正態(tài)分布(normaldistribution)常將一般的正態(tài)變量X通過變換[

]

轉(zhuǎn)化成標準正態(tài)變量Z,以使原來各種形態(tài)的正態(tài)分布都轉(zhuǎn)換為μ=0,σ=1的標準正態(tài)分布(standardnormal

distribution),亦稱Z分布。14在正態(tài)分布總體中以固定n(如n=10)抽取若干個樣本時,樣本均數(shù)的分布仍服從正態(tài)分布,即。所以,對樣本均數(shù)的分布進行Z變換[

],也可變換為標準正態(tài)分布N

(0,1)。15由于在實際工作中,往往σ是未知的,常用s作為σ的估計值,為了與Z變換區(qū)別,稱為t變換t=,統(tǒng)計量t值的分布稱為t分布。(二)t分布16t分布有如下特征1.以0為中心,左右對稱的單峰分布;2.t分布是一簇曲線,其形態(tài)變化與n(確切地說與自由度ν)大小有關(guān)。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近標準正態(tài)分布(u分布)曲線,如圖4.1。

圖4.1自由度為1、5、∞的t分布17

t分布曲線下的面積與自由度ν有關(guān)系。如t分布曲線下面積為95%或99%的界值不是一個常量,而是隨著自由度大小而變化的,分別用和表示。t分布曲線下面積18第三節(jié)總體均數(shù)的估計統(tǒng)計推斷包括兩個重要的方面:參數(shù)估計和假設(shè)檢驗。參數(shù)估計就是用樣本指標(稱為統(tǒng)計量,statistic)來估計總體指標(參數(shù),parameter)。參數(shù)估計有兩種方法:點估計和區(qū)間估計。19

第三節(jié)總體均數(shù)的估計一、可信區(qū)間的概念(ConfidenceInterval)

區(qū)間估計:指按預先給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。事先給定的概率稱為可信度,通常取。參數(shù)估計點估計:不考慮抽樣誤差,如區(qū)間估計:考慮抽樣誤差201.σ已知或σ未知但n(n>50)足夠大時,由Z分布可知:(1)σ已知:即寫成區(qū)間形式:二、可信區(qū)間的計算

21同理,單側(cè)可信區(qū)間為:或或(2)σ未知,但足夠大:可信區(qū)間為:222.σ未知,且n(n<50)不夠大時,按t分布原理得到均數(shù)的可信區(qū)間為:即:同理,單側(cè)可信區(qū)間為:,23(10.9-2.093*3.86/例

對某人群隨機抽取20人,用某批號的結(jié)核菌素作皮試,平均浸潤直徑為10.9cm,標準差為3.86cm。問這批結(jié)核菌素在該人群中使用時,皮試的平均浸潤直徑的95%可信區(qū)間是多少?該例n=20,n較小,因此,可認為平均浸潤直徑服從t分布。自由度ν=20-1=19,查t

界值表,得=2.093,10.9+2.093*3.86/即(9.1,12.7)cm。)cm24

圖4-2模擬抽樣成年男子紅細胞數(shù)100次的95%可信區(qū)間示意圖

******三可信區(qū)間的注意問題

1.可信區(qū)間的涵義25準確度:反映在可信度的大小,即區(qū)間包含總體均數(shù)的概率的大小,愈接近1愈好。精密度:反映在區(qū)間的長度,長度愈小愈好。三可信區(qū)間的注意問題2.可信區(qū)間的兩個要素:

準確度和精密度。263.均數(shù)的可信區(qū)間與參考值范圍的區(qū)別表均數(shù)的可信區(qū)間與參考值范圍的區(qū)別含義計算公式用途可信區(qū)間按預先給定的概率,確定總體均數(shù)的可能范圍;總體均數(shù)的波動范圍。σ未知,σ已知或n很大,總體均數(shù)的區(qū)間估計參考值范圍正常人的解剖、生理、生化某項指標的波動范圍;個體值的波動范圍。正態(tài)分布,偏態(tài)分布絕大多數(shù)觀察對象某項指標的分布范圍27第四節(jié)、假設(shè)檢驗的基本步驟假設(shè)檢驗(hypothesistest)是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。假設(shè)檢驗亦稱差別有無統(tǒng)計學意義檢驗(significancetest)一、假設(shè)檢驗的基本思想28例:為研究某山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù),如某醫(yī)生在某山區(qū)隨機測量了25名健康成年男子的脈搏,平均次數(shù)為74.2次/分鐘,標準差為6.0次/分鐘,但是根據(jù)醫(yī)學常識,一般男子的平均脈搏次數(shù)為72次/分鐘,問該山區(qū)男子脈搏均數(shù)是否高于一般男子的脈搏均數(shù)?結(jié)果是怎樣呢?一、假設(shè)檢驗的基本思想291)由抽樣誤差所造成;2)該樣本均數(shù)確實與正常成年男性脈搏數(shù)不同。

兩種可能:一、假設(shè)檢驗的基本思想30先對總體的特征建立假設(shè),然后判斷此假設(shè)應(yīng)該被拒絕或不被拒絕。假設(shè)檢驗的基本思想是小概率(P<0.05)反證法思想,是先提出假設(shè)(檢驗假設(shè)H0),再用適當?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如可能性小,則認為假設(shè)不成立,若可能性大,則還不能認為假設(shè)不成立。一、假設(shè)檢驗的基本思想31二、假設(shè)檢驗的基本步驟零假設(shè)、無效假設(shè)(nullhypothesis):假設(shè)樣本來自同一總體,即其總體參數(shù)相等(H0)。備擇假設(shè)(H1)(alternativehypothesis):作為拒絕檢驗假設(shè)時的備選假設(shè);檢驗水準(sizeoftest),又稱顯著性水平(significancelevel)為拒絕檢驗假設(shè)是犯第一類錯誤的概率,是預先設(shè)定的概率值。1、建立假設(shè),確定檢驗水準。32變量的分布類型不同、研究目的不同,都決定著選擇何種檢驗方法。因此需選擇合適的檢驗方法,并計算統(tǒng)計量。二、假設(shè)檢驗的基本步驟2、選擇檢驗方法,并計算統(tǒng)計量33根據(jù)計算的統(tǒng)計量,查閱相應(yīng)的統(tǒng)計表,確定P值,以P值與檢驗水準比較,若,則拒絕,接受;若,則不拒絕。3.根據(jù)統(tǒng)計量確定P值,作出統(tǒng)計推斷二、假設(shè)檢驗的基本步驟34一般來說,推斷的結(jié)論應(yīng)包括統(tǒng)計結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計學結(jié)論只說明有統(tǒng)計學意義(statisticalsignificance)或無統(tǒng)計學意義(nostatisticalsignificance)再回頭看本節(jié)剛開始提出的問題!二、假設(shè)檢驗的基本步驟351.建立檢驗假設(shè),確定檢驗水準。

雙側(cè)

H0:兩地男子脈搏均數(shù)相同。

H1:兩地男子脈搏均數(shù)不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論