數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)_第1頁(yè)
數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)_第2頁(yè)
數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)_第3頁(yè)
數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)_第4頁(yè)
數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)學(xué)抽樣誤差與假設(shè)檢驗(yàn)第1頁(yè)/共38頁(yè)2復(fù)習(xí)1、描述數(shù)值型資料的分布用什么方法?2、如何描述數(shù)值型資料的分布特征?3、描述數(shù)值型資料的集中趨勢(shì)和離散趨勢(shì)指標(biāo)有哪些?4、正態(tài)分布的特征第2頁(yè)/共38頁(yè)3第三章抽樣誤差與假設(shè)檢驗(yàn)掌握內(nèi)容:1.t分布的概念和特征2.總體均數(shù)的區(qū)間估計(jì)3.假設(shè)檢驗(yàn)的基本步驟4.假設(shè)檢驗(yàn)的基本原理5.常用的數(shù)值型變量假設(shè)檢驗(yàn)的方法第3頁(yè)/共38頁(yè)4熟悉:1、抽樣誤差的概念2、引起抽樣誤差的原因3、均數(shù)的標(biāo)準(zhǔn)誤的計(jì)算4、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別第三章抽樣誤差與假設(shè)檢驗(yàn)第4頁(yè)/共38頁(yè)5第一節(jié)抽樣分布與抽樣誤差一.抽樣研究(一)抽樣研究的意義樣本總體第5頁(yè)/共38頁(yè)6(1)由于研究對(duì)象很多是無(wú)限總體,要直接研究總體的情況是不可能的。(2)即使對(duì)有限總體來(lái)說(shuō),若包含的觀察單位數(shù)過(guò)多,需要耗費(fèi)大量的人力、物力和時(shí)間,而且也不易組織,難以保證工作的質(zhì)量。(3)有的時(shí)候,觀察的實(shí)質(zhì)就是一種破壞性實(shí)驗(yàn),根本就不允許對(duì)總體中的每一個(gè)體逐一觀察。為什么要做抽樣研究?第6頁(yè)/共38頁(yè)7目前抽樣研究的理論與技術(shù)已發(fā)展成熟,只要嚴(yán)格按照有關(guān)抽樣研究的要求去做,這是完全可行的。目的:就是要用樣本信息來(lái)推斷總體特征,這就叫統(tǒng)計(jì)推斷(statisticalinference)第7頁(yè)/共38頁(yè)8(二)抽樣研究和抽樣誤差抽樣研究是指從總體中按照隨機(jī)化的原則,抽取一定數(shù)量的個(gè)體組成樣本進(jìn)行研究,從而推斷總體的研究方法。在抽樣研究中產(chǎn)生的樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)間的差異,稱(chēng)為抽樣誤差(samplingerror),第8頁(yè)/共38頁(yè)9

(三)、抽樣誤差的分布

理論上可以證明:若從正態(tài)總體中,反復(fù)多次隨機(jī)抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標(biāo)準(zhǔn)差為。抽樣分布

抽樣分布示意圖第9頁(yè)/共38頁(yè)10

(三)、抽樣誤差的分布中心極限定理當(dāng)樣本含量很大的情況下,無(wú)論原始測(cè)量變量服從什么分布,的抽樣分布均近似正態(tài)。

抽樣分布圖抽樣分布示意圖第10頁(yè)/共38頁(yè)11二.均數(shù)的抽樣誤差如上所述,數(shù)理統(tǒng)計(jì)研究表明,抽樣誤差具有一定的規(guī)律性,可以用特定的指標(biāo)來(lái)描述。這個(gè)指標(biāo)稱(chēng)為標(biāo)準(zhǔn)誤(standarderror

SE)。標(biāo)準(zhǔn)誤除了反映樣本統(tǒng)計(jì)量之間的離散程度外,也反映樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)之間的差異,即抽樣誤差大小。第11頁(yè)/共38頁(yè)12意義:反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。與樣本量的關(guān)系:S一定,n↑,標(biāo)準(zhǔn)誤↓標(biāo)準(zhǔn)誤的計(jì)算公式:第12頁(yè)/共38頁(yè)13

例4.1在某地隨機(jī)抽查成年男子140人,計(jì)算得紅細(xì)胞均數(shù)4.77×1012/L,標(biāo)準(zhǔn)差0.38×1012/L,試計(jì)算均數(shù)的標(biāo)準(zhǔn)誤。

第13頁(yè)/共38頁(yè)14均數(shù)標(biāo)準(zhǔn)誤的用途1.衡量樣本均數(shù)的可靠性由于均數(shù)標(biāo)準(zhǔn)誤越小,均數(shù)的抽樣誤差越小,樣本均數(shù)就越可靠,代表性越好。2.估計(jì)總體均數(shù)的可信區(qū)間。3.用于均數(shù)的假設(shè)檢驗(yàn)。

第14頁(yè)/共38頁(yè)15第二節(jié)t分布一.t分布(t-distribution)(一)Z分布正態(tài)分布(normaldistribution)常將一般的正態(tài)變量X通過(guò)變換[

]

轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)變量Z,以使原來(lái)各種形態(tài)的正態(tài)分布都轉(zhuǎn)換為μ=0,σ=1的標(biāo)準(zhǔn)正態(tài)分布(standardnormal

distribution),亦稱(chēng)Z分布。第15頁(yè)/共38頁(yè)16在正態(tài)分布總體中以固定n(如n=10)抽取若干個(gè)樣本時(shí),樣本均數(shù)的分布仍服從正態(tài)分布,即。所以,對(duì)樣本均數(shù)的分布進(jìn)行Z變換[

],也可變換為標(biāo)準(zhǔn)正態(tài)分布N

(0,1)。第16頁(yè)/共38頁(yè)17由于在實(shí)際工作中,往往σ是未知的,常用s作為σ的估計(jì)值,為了與Z變換區(qū)別,稱(chēng)為t變換t=,統(tǒng)計(jì)量t值的分布稱(chēng)為t分布。(二)t分布第17頁(yè)/共38頁(yè)18t分布有如下特征1.以0為中心,左右對(duì)稱(chēng)的單峰分布;2.t分布是一簇曲線,其形態(tài)變化與n(確切地說(shuō)與自由度ν)大小有關(guān)。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線,如圖4.1。

圖4.1自由度為1、5、∞的t分布第18頁(yè)/共38頁(yè)19

t分布曲線下的面積與自由度ν有關(guān)系。如t分布曲線下面積為95%或99%的界值不是一個(gè)常量,而是隨著自由度大小而變化的,分別用和表示。t分布曲線下面積第19頁(yè)/共38頁(yè)20第三節(jié)總體均數(shù)的估計(jì)統(tǒng)計(jì)推斷包括兩個(gè)重要的方面:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是用樣本指標(biāo)(稱(chēng)為統(tǒng)計(jì)量,statistic)來(lái)估計(jì)總體指標(biāo)(參數(shù),parameter)。參數(shù)估計(jì)有兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。第20頁(yè)/共38頁(yè)21

第三節(jié)總體均數(shù)的估計(jì)一、可信區(qū)間的概念(ConfidenceInterval)

區(qū)間估計(jì):指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間,使它能夠包含未知的總體均數(shù)。事先給定的概率稱(chēng)為可信度,通常取。

參數(shù)估計(jì)點(diǎn)估計(jì):不考慮抽樣誤差,如區(qū)間估計(jì):考慮抽樣誤差第21頁(yè)/共38頁(yè)221.σ已知或σ未知但n(n>50)足夠大時(shí),由Z分布可知:(1)σ已知:即寫(xiě)成區(qū)間形式:二、可信區(qū)間的計(jì)算

第22頁(yè)/共38頁(yè)23同理,單側(cè)可信區(qū)間為:或或(2)σ未知,但足夠大:可信區(qū)間為:第23頁(yè)/共38頁(yè)242.σ未知,且n(n<50)不夠大時(shí),按t分布原理得到均數(shù)的可信區(qū)間為:即:同理,單側(cè)可信區(qū)間為:,第24頁(yè)/共38頁(yè)25(10.9-2.093*3.86/例對(duì)某人群隨機(jī)抽取20人,用某批號(hào)的結(jié)核菌素作皮試,平均浸潤(rùn)直徑為10.9cm,標(biāo)準(zhǔn)差為3.86cm。問(wèn)這批結(jié)核菌素在該人群中使用時(shí),皮試的平均浸潤(rùn)直徑的95%可信區(qū)間是多少?該例n=20,n較小,因此,可認(rèn)為平均浸潤(rùn)直徑服從t分布。自由度ν=20-1=19,查t

界值表,得=2.093,10.9+2.093*3.86/即(9.1,12.7)cm。)cm第25頁(yè)/共38頁(yè)26

圖4-2模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖

******三可信區(qū)間的注意問(wèn)題1.可信區(qū)間的涵義第26頁(yè)/共38頁(yè)27準(zhǔn)確度:反映在可信度的大小,即區(qū)間包含總體均數(shù)的概率的大小,愈接近1愈好。精密度:反映在區(qū)間的長(zhǎng)度,長(zhǎng)度愈小愈好。三可信區(qū)間的注意問(wèn)題2.可信區(qū)間的兩個(gè)要素:

準(zhǔn)確度和精密度。第27頁(yè)/共38頁(yè)283.均數(shù)的可信區(qū)間與參考值范圍的區(qū)別表均數(shù)的可信區(qū)間與參考值范圍的區(qū)別含義計(jì)算公式用途可信區(qū)間按預(yù)先給定的概率,確定總體均數(shù)的可能范圍;總體均數(shù)的波動(dòng)范圍。σ未知,σ已知或n很大,總體均數(shù)的區(qū)間估計(jì)參考值范圍正常人的解剖、生理、生化某項(xiàng)指標(biāo)的波動(dòng)范圍;個(gè)體值的波動(dòng)范圍。正態(tài)分布,偏態(tài)分布絕大多數(shù)觀察對(duì)象某項(xiàng)指標(biāo)的分布范圍第28頁(yè)/共38頁(yè)29第四節(jié)、假設(shè)檢驗(yàn)的基本步驟

假設(shè)檢驗(yàn)(hypothesistest)是用來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。假設(shè)檢驗(yàn)亦稱(chēng)差別有無(wú)統(tǒng)計(jì)學(xué)意義檢驗(yàn)(significancetest)一、假設(shè)檢驗(yàn)的基本思想第29頁(yè)/共38頁(yè)30例:為研究某山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù),如某醫(yī)生在某山區(qū)隨機(jī)測(cè)量了25名健康成年男子的脈搏,平均次數(shù)為74.2次/分鐘,標(biāo)準(zhǔn)差為6.0次/分鐘,但是根據(jù)醫(yī)學(xué)常識(shí),一般男子的平均脈搏次數(shù)為72次/分鐘,問(wèn)該山區(qū)男子脈搏均數(shù)是否高于一般男子的脈搏均數(shù)?結(jié)果是怎樣呢?一、假設(shè)檢驗(yàn)的基本思想第30頁(yè)/共38頁(yè)311)由抽樣誤差所造成;2)該樣本均數(shù)確實(shí)與正常成年男性脈搏數(shù)不同。

兩種可能:一、假設(shè)檢驗(yàn)的基本思想第31頁(yè)/共38頁(yè)32先對(duì)總體的特征建立假設(shè),然后判斷此假設(shè)應(yīng)該被拒絕或不被拒絕。假設(shè)檢驗(yàn)的基本思想是小概率(P<0.05)反證法思想,是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)不成立。一、假設(shè)檢驗(yàn)的基本思想第32頁(yè)/共38頁(yè)33二、假設(shè)檢驗(yàn)的基本步驟

零假設(shè)、無(wú)效假設(shè)(nullhypothesis):假設(shè)樣本來(lái)自同一總體,即其總體參數(shù)相等(H0)。備擇假設(shè)(H1)(alternativehypothesis):作為拒絕檢驗(yàn)假設(shè)時(shí)的備選假設(shè);檢驗(yàn)水準(zhǔn)(sizeoftest),又稱(chēng)顯著性水平(significancelevel)為拒絕檢驗(yàn)假設(shè)是犯第一類(lèi)錯(cuò)誤的概率,是預(yù)先設(shè)定的概率值。1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)。第33頁(yè)/共38頁(yè)34

變量的分布類(lèi)型不同、研究目的不同,都決定著選擇何種檢驗(yàn)方法。因此需選擇合適的檢驗(yàn)方法,并計(jì)算統(tǒng)計(jì)量。二、假設(shè)檢驗(yàn)的基本步驟2、選擇檢驗(yàn)方法,并計(jì)算統(tǒng)計(jì)量第34頁(yè)/共38頁(yè)35

根據(jù)計(jì)算的統(tǒng)計(jì)量,查閱相應(yīng)的統(tǒng)計(jì)表,確定P值,以P值與檢驗(yàn)水準(zhǔn)比較,若,則拒絕,接受;若,則不拒絕。3.根據(jù)統(tǒng)計(jì)量確定P值,作出統(tǒng)計(jì)推斷二、假設(shè)檢驗(yàn)的基本步驟第35頁(yè)/共38頁(yè)36

一般來(lái)說(shuō),推斷的結(jié)論應(yīng)包括統(tǒng)計(jì)結(jié)論和專(zhuān)業(yè)結(jié)論兩部分。統(tǒng)計(jì)學(xué)結(jié)論只說(shuō)明有統(tǒng)計(jì)學(xué)意義(statisticalsignificance)或無(wú)統(tǒng)計(jì)學(xué)意義(nostatisticalsignificance)再回頭看本節(jié)剛開(kāi)始提出的問(wèn)題!二、假設(shè)檢驗(yàn)的基本步驟第36頁(yè)/共38頁(yè)371.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)。

雙側(cè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論