終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗

上傳人：卓*** IP屬地：廣東上傳時間：2024-04-01 格式：PPT 頁數(shù)：76 大小：3.78MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩71頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗統(tǒng)計推斷：參數(shù)估計，假設(shè)檢驗“世上有三種哄人的東西：謊言、該死的謊言、統(tǒng)計數(shù)據(jù)”----英國政治家迪斯雷里?！笆郎嫌腥龢蛹尤诵牡臇|西：宣傳、要命的宣傳、統(tǒng)計數(shù)據(jù)”。第2頁,共76頁，2024年2月25日，星期天均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤第3頁,共76頁，2024年2月25日，星期天均數(shù)的抽樣誤差samplingerrorofmean概念:由于總體中存在個體變異，抽樣研究中所抽取的樣本，只包含總體中一部分個體，因而樣本均數(shù)（或率）往往不等于總體均數(shù)（或率），樣本均數(shù)之間也互不相等，這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。即：第4頁,共76頁，2024年2月25日，星期天12中心極限定理：如果隨機變量的總體均數(shù)及方差有限，當(dāng)樣本容量趨于無窮大時，樣本均數(shù)的分布趨近于均數(shù)為總體均數(shù)，方差為的正態(tài)分布。第5頁,共76頁，2024年2月25日，星期天如何估計？用樣本均數(shù)的標(biāo)準(zhǔn)差來估計，稱標(biāo)準(zhǔn)誤（standarderror)。標(biāo)準(zhǔn)誤越大，均數(shù)的抽樣誤差越大，樣本均數(shù)與總體均數(shù)間的差異越大。計算公式：即：由總體標(biāo)準(zhǔn)差，樣本例數(shù)求得。但通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計值。因此：第6頁,共76頁，2024年2月25日，星期天與標(biāo)準(zhǔn)差的區(qū)別：標(biāo)準(zhǔn)差：表示一般變量值的離散程度；均數(shù)標(biāo)準(zhǔn)誤特別說明樣本均數(shù)這一變量值離散程度的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用:（1）用來衡量抽樣誤差的大小，標(biāo)準(zhǔn)誤越小，樣本均數(shù)與總體均數(shù)越接近，樣本均數(shù)的可信度越高；（2）結(jié)合標(biāo)準(zhǔn)正態(tài)分布與t分布曲線下的面積規(guī)律，估計總體均數(shù)的置信區(qū)間。（3）用于假設(shè)檢驗。第7頁,共76頁，2024年2月25日，星期天假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155.4,5.32)。用計算機做抽樣模擬試驗，每次抽出10個數(shù)字，組成一個樣本，求出樣本均數(shù)、樣本標(biāo)準(zhǔn)差S。再求得此100個樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差（標(biāo)準(zhǔn)誤）。100個樣本均數(shù)構(gòu)成一個新的分布，也是正態(tài)分布（即使原分布為偏態(tài)分布，當(dāng)樣本含量足夠大時，新分布也近似正態(tài)分布）。新分布的集中趨勢用均數(shù)的均數(shù)來表示，離散趨勢用標(biāo)準(zhǔn)誤表示N(,)。各樣本均數(shù)的均數(shù)等于總體均數(shù)。第8頁,共76頁，2024年2月25日，星期天正態(tài)總體中抽樣（樣本量5）正態(tài)總體中抽樣（樣本量10）正態(tài)總體中抽樣（樣本量30）抽樣時樣本量大小決定了樣本均數(shù)分布的形狀，當(dāng)樣本量足夠大時，均數(shù)分布趨向正態(tài)分布。第9頁,共76頁，2024年2月25日，星期天t分布（t-distribution)第10頁,共76頁，2024年2月25日，星期天u分布:u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài),N(0,1)。同理：將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布即：實際工作中，總體標(biāo)準(zhǔn)差往往未知，常用S代替σ

計算標(biāo)準(zhǔn)誤，因此：就變?yōu)椋旱?1頁,共76頁，2024年2月25日，星期天也就是說：正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布正態(tài)變量實現(xiàn)這一轉(zhuǎn)變:第12頁,共76頁，2024年2月25日，星期天均數(shù)的分布也是這樣如果我們采用另一個正態(tài)變量:于是，均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布:第13頁,共76頁，2024年2月25日，星期天但是，條件發(fā)生變化我們通常用代替

然而，隨著樣本量的變化而變化，所以，我們稱之為t-分布，雖然它是正態(tài)分布，但只有當(dāng)樣本量（自由度）無窮大的時候，它才是標(biāo)準(zhǔn)正態(tài)分布，此時，u=t第14頁,共76頁，2024年2月25日，星期天t分布是一簇對稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大），曲線的中間越低，兩邊越高；隨自由度增大，t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時，t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線，都對應(yīng)于相應(yīng)的自由度。第15頁,共76頁，2024年2月25日，星期天t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似：在某一個自由度下，兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(υ),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2(υ)。中部占95%面積的t值范圍：t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍：-t0.01/2(υ)--t0.01/2(υ)。第16頁,共76頁，2024年2月25日，星期天當(dāng)自由度確定時，占一定面積的t界限值，可以查表得出。參考附表6（p436)。例如：查當(dāng)自由度=20，兩側(cè)概率之和為0.05時，對應(yīng)的t值：t0.05/2（20）=2.086，單側(cè)概率為0.05時，對應(yīng)的t值：t0.05（20）=1.725，第17頁,共76頁，2024年2月25日，星期天t分布的主要應(yīng)用：(1)總體均數(shù)置信區(qū)間估計；(2)t檢驗；第18頁,共76頁，2024年2月25日，星期天使用t值表注意：同一自由度下,P越小，t值越大；P值相同時，自由度越大，t越小；當(dāng)自由度無窮大時，t值與u值相等。這也是u分布與t分布的區(qū)別。第19頁,共76頁，2024年2月25日，星期天總體均數(shù)置信區(qū)間的估計第20頁,共76頁，2024年2月25日，星期天參數(shù)估計：點估計（pointestimation):用樣本統(tǒng)計量作為對總體參數(shù)的估計值(μ)。比如均數(shù)的估計。區(qū)間估計(intervalestimation)：根據(jù)選定的置信度估計總體均數(shù)所在的區(qū)間（a<μ<b).a,b為置信限（可信限）。第21頁,共76頁，2024年2月25日，星期天為何要進行區(qū)間估計？點估計是用樣本均數(shù)來估計總體均數(shù)，簡單易行，但未考慮抽樣誤差，而后者又是不可避免的。故常按照一定的概率估計總體均數(shù)在哪個范圍。置信度（confidencelevel):在估計總體均數(shù)的置信區(qū)間時，如果可能估計錯誤的概率為α，那么估計正確的概率為1-α,即為置信度.常用:95%,99%.置信區(qū)間（confidenceinterval,CI)根據(jù)置信度估計得到的區(qū)間，稱為置信區(qū)間。第22頁,共76頁，2024年2月25日，星期天如何進行區(qū)間估計？1、總體標(biāo)準(zhǔn)差已知參照u分布，正態(tài)曲線下95%的u值在+-1.96之間，即：總體均數(shù)的95%置信區(qū)間：99%置信區(qū)間：第23頁,共76頁，2024年2月25日，星期天2、總體標(biāo)準(zhǔn)差未知，樣本例數(shù)(>50)足夠大也可參考u分布進行95%置信區(qū)間：99%置信區(qū)間：第24頁,共76頁，2024年2月25日，星期天3、總體標(biāo)準(zhǔn)差未知，樣本例數(shù)較小按t分布原理，依據(jù)相應(yīng)的自由度，查出該自由度下某個概率相應(yīng)的界值，再按照中部占95%面積的t值范圍：-t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍：-t0.01/2(υ)--t0.01/2(υ)進行估計。因為：所以：95%置信區(qū)間：99%置信區(qū)間：第25頁,共76頁，2024年2月25日，星期天例子：p236課堂練習(xí)95%置信區(qū)間的意義：理論上，用一次抽樣所得的樣本均數(shù)估計總體均數(shù)，犯錯誤的概率為5%.或進行100次抽樣，可算得100個置信區(qū)間，平均有95個置信區(qū)間包括客觀存在的總體均數(shù)，只有5個置信區(qū)間未包括總體均數(shù)。第26頁,共76頁，2024年2月25日，星期天估計置信區(qū)間的注意事項：（1）區(qū)間是以上、下可信限為界的一個范圍。通常用表示置信限，用表示置信區(qū)間（2）置信區(qū)間與正常值范圍的意義、算法不同：95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍，若總體為正態(tài)分布，常用：計算；95%置信區(qū)間是指按照95%置信度估計的總體參數(shù)的可能范圍，按照下式計算。

前者用標(biāo)準(zhǔn)差，后者用標(biāo)準(zhǔn)誤。第27頁,共76頁，2024年2月25日，星期天假設(shè)檢驗的基本思想和步驟第28頁,共76頁，2024年2月25日，星期天假設(shè)檢驗（hypothesistesting)：亦稱顯著性檢驗(significancetest).是統(tǒng)計推斷的另一個方面。

先對總體的參數(shù)或分布作出某種假設(shè)，如假設(shè)總體均數(shù)（或總體率）為一定值，兩總體均數(shù)（或總體率）相等，總體服從正態(tài)分布或兩總體分布相同等。然后，用適當(dāng)方法根據(jù)樣本對總體提供的信息，推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策，采取措施。第29頁,共76頁，2024年2月25日，星期天在實際情況下：由于抽樣誤差，從某總體中隨機抽得的樣本，得到的樣本均數(shù)與該總體的均數(shù)不同；同一總體中兩次抽樣的樣本均數(shù)也不相同。這種差別的原因在于：要么總體均數(shù)不同；要么總體均數(shù)相同，差別僅由抽樣誤差所致。那么，當(dāng)我們遇到這種情況時，如何判斷？可以通過某種方法來判斷差別屬哪種情況，這種方法就是假設(shè)檢驗。第30頁,共76頁，2024年2月25日，星期天假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思想

兩種說法非A即B。要證明B真，只要證明A偽即可。無效假設(shè)Nullhypothesis（H0）

意在推翻的假設(shè)（說法A）。備擇假設(shè)Alternativehypothesis（H1）

意在接受的假設(shè)（說法B）。從無效假設(shè)出發(fā)，找出不支持這一假設(shè)的證據(jù)，從而推翻它。第31頁,共76頁，2024年2月25日，星期天小概率事件

smallprobabilityevent事件A發(fā)生的概率是如此之小，以至于在一次試驗（抽樣）時，我們往往認(rèn)為它（事件A）不會發(fā)生。統(tǒng)計學(xué)中，小概率事件一般是指發(fā)生概率<0.05（檢驗水準(zhǔn)

）的事件。在假設(shè)檢驗中，如果在無效假設(shè)的前提下出現(xiàn)了小概率事件，我們則懷疑無效假設(shè)的真實性。第32頁,共76頁，2024年2月25日，星期天例：兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A，B處理結(jié)果B

效果Effect：

=結(jié)果A-結(jié)果B對于總體

如果

=0，則A處理和B處理之間沒有差別。

如果

0，則A處理和B處理之間有差別。對于樣本

即使

=0，由于存在抽樣變異，往往樣本結(jié)果A–樣本結(jié)果B=

0。問題在于這個差異是否僅僅是由于抽樣變異造成的？第33頁,共76頁，2024年2月25日，星期天進行假設(shè)檢驗的思路無效假設(shè)：樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0：

=0。備擇假設(shè)：樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的，還包含不同處理的效果。即H1：

0。由無效假設(shè)出發(fā)，我們可以計算出得到樣本差異或者更大差異的概率（P值）。如果P值小于檢驗水準(zhǔn)，則認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果，從而推翻它，接受備擇假設(shè)（差異顯著性）。反之,接受無效假設(shè)。第34頁,共76頁，2024年2月25日，星期天檢驗統(tǒng)計量

statisticfortesting在無效假設(shè)的前提下，檢驗統(tǒng)計量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗統(tǒng)計量一般服從某種分布。這樣我們就可以利用這種分布計算出由無效假設(shè)出發(fā)，得到觀察到的差異或更大的差異的概率，從而作出推斷。第35頁,共76頁，2024年2月25日，星期天第36頁,共76頁，2024年2月25日，星期天界值criticalvalue對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值：單側(cè)

0.05±1.645雙側(cè)0.05±1.96相同界值單側(cè)檢驗概率是雙側(cè)檢驗概率的一半第37頁,共76頁，2024年2月25日，星期天例題：兩個血糖均數(shù)不同，其原因可能是由于抽樣誤差；也可能是男性管理人員的總體血糖均數(shù)與一般正常成年男性的均數(shù)不同。假設(shè)檢驗過程：1、建立檢驗假設(shè)和設(shè)定檢驗水準(zhǔn)無效假設(shè)（nullhypothesis)H0,假設(shè)差異是由于抽樣誤差所致，而兩個總體參數(shù)相同。是從反證法的思想提出的。（μ=μ0）第38頁,共76頁，2024年2月25日，星期天備擇假設(shè)（alternativehypothesis),H1.即差別不僅是由抽樣誤差所致，而更是總體參數(shù)不同。H1是和H0相聯(lián)系的，對立的假設(shè)。（μ≠μ0，μ>μ0,μ<μ0）雙側(cè)，單側(cè)檢驗：根據(jù)專業(yè)知識，μ可能大于也可能小于μ0，稱雙側(cè)檢驗；若認(rèn)為μ大于、等于μ0（或相反），為單側(cè)檢驗。若不能確定單側(cè)的情況，應(yīng)采用雙側(cè)檢驗。第39頁,共76頁，2024年2月25日，星期天確定檢驗水準(zhǔn)（sizeofatest),（也叫顯著性水準(zhǔn)significancelevel):用α表示。即：拒絕了實際上成立的H0的概率；一般取0.05，或0.01.本步驟一般寫成：H0:μ=μ0H1:μ≠μ0，(雙側(cè)）或：H1:μ>μ0,（μ<μ0），（單側(cè)）α=0.05第40頁,共76頁，2024年2月25日，星期天2、計算統(tǒng)計量根據(jù)研究設(shè)計類型，資料特征，統(tǒng)計方法的適用條件，選擇和計算統(tǒng)計量。本例：計算統(tǒng)計量t值。第41頁,共76頁，2024年2月25日，星期天3、確定概率P值，作出統(tǒng)計推斷計算統(tǒng)計量后，根據(jù)事先確定的單側(cè)或雙側(cè)檢驗、自由度、檢驗水準(zhǔn)在相應(yīng)的統(tǒng)計用表中查出相應(yīng)的界值。將該界值與所計算的統(tǒng)計量比較，得出相應(yīng)的概率P。對本例t檢驗：小于界值的范圍，P大于α，是不拒絕H0的區(qū)間；大于或等于界值的范圍，P小于α，是拒絕H0的區(qū)間。第42頁,共76頁，2024年2月25日，星期天P值是在由H0所規(guī)定的總體中作隨機抽樣，獲得等于及大于（或等于及小于）現(xiàn)有統(tǒng)計量的概率。第43頁,共76頁，2024年2月25日，星期天若P≤α,統(tǒng)計上認(rèn)為是小概率事件，一次抽樣不可能發(fā)生。而一旦發(fā)生，即認(rèn)為：造成兩個均數(shù)差異的原因是總體不同（試驗因素所致，或相應(yīng)的因素導(dǎo)致等），無效假設(shè)是錯誤的，因此，拒絕H0,接受H1。稱差異有統(tǒng)計學(xué)意義。若P>α,則認(rèn)為是大概率事件，本次的差異僅為抽樣誤差所致，因此，接受H0,拒絕H1,認(rèn)為兩均數(shù)來自同一總體。稱差異無統(tǒng)計學(xué)意義。第44頁,共76頁，2024年2月25日，星期天本例t=0.844,而相應(yīng)的t界值：t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平，不拒絕H0,不能認(rèn)為男性健康管理人員的血糖均數(shù)與一般成年男性的血糖均數(shù)不同。第45頁,共76頁，2024年2月25日，星期天兩均數(shù)比較時常用的判斷標(biāo)準(zhǔn)統(tǒng)計量u:單側(cè)：u<1.645,雙側(cè)：u<1.96,P>0.05,不拒絕H0;單側(cè)：u≥1.645,雙側(cè)：u≥1.96,P≤0.05,拒絕H0;統(tǒng)計量t:單側(cè)；雙側(cè)P>0.05,不拒絕H0;單側(cè)：雙側(cè)P≤0.05,拒絕H0;第46頁,共76頁，2024年2月25日，星期天第一類錯誤與第二類錯誤

typeIerror&typeIIerror

假設(shè)檢驗的判斷，并非百分之百正確，有兩種可能錯誤：假陽性錯誤（falsepositiveerror），稱為第一類錯誤（typeIerror），用α表示，即檢驗水準(zhǔn)（levelofsignificance),

通常取：0.05。即：無效假設(shè)（H0:u=u0）原本是正確的，但被拒絕，誤判為有差別（棄真錯誤）。當(dāng)無效假設(shè)正確時，在100次抽樣中，可以有5次推斷是錯誤的。統(tǒng)計上有意義的界限是允許犯第一類錯誤的界限。第47頁,共76頁，2024年2月25日，星期天假陰性錯誤(falsenegativeerror),稱為第二類錯誤(typeIIerror)。即，無效假設(shè)（H0:u=u0）原本是錯誤的（實際上應(yīng)是H1:u=u1）,但所得統(tǒng)計量t沒有超過t0.05的水平從而接受了無效假設(shè)，錯誤地得出無差別的結(jié)論（取偽錯誤）。用

表示。檢驗效能（poweroftest):1-

當(dāng)兩個總體存在差異時，所使用的統(tǒng)計檢驗?zāi)軌虬l(fā)現(xiàn)這種差異（拒絕H0)的能力。第48頁,共76頁，2024年2月25日，星期天盡管是小概率事件，它還是有可能發(fā)生的。I型錯誤：雖然無效假設(shè)為真，但由于抽到了較大檢驗統(tǒng)計量的樣本，使得P值小于檢驗水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗水準(zhǔn)而定，所以犯錯誤的概率也由檢驗水準(zhǔn)而定。II型錯誤：雖然無效假設(shè)為假，但由于抽到了較小檢驗統(tǒng)計量的樣本，使得P值大于檢驗水準(zhǔn)而導(dǎo)致不被拒絕。第49頁,共76頁，2024年2月25日，星期天選擇統(tǒng)計意義水平，應(yīng)考慮兩類錯誤對所要研究的事物的影響哪一個重要。一般來說，定0.05為有統(tǒng)計學(xué)意義的水平是比較適宜的。兩類錯誤的關(guān)系：在樣本含量固定的條件下，減少I類錯誤，會增大II類錯誤；增大I類錯誤，會減少II類錯誤。其他條件不變，增大樣本含量可使第二類錯誤的概率減小。同時正確的實驗設(shè)計能夠減少抽樣誤差，提高檢驗效能。第50頁,共76頁，2024年2月25日，星期天第51頁,共76頁，2024年2月25日，星期天ta第52頁,共76頁，2024年2月25日，星期天實際差別與統(tǒng)計意義統(tǒng)計意義：抽到這樣大統(tǒng)計量的可能性很小，可以拒絕H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時，即使均數(shù)差別不大，統(tǒng)計學(xué)意義卻顯著。樣本小時，即使均數(shù)差別很大，統(tǒng)計學(xué)意義卻不顯著。第53頁,共76頁，2024年2月25日，星期天理解檢驗統(tǒng)計量觀察到的量可以是一個樣本的均數(shù)、兩個樣本均數(shù)的差、一個樣本的百分構(gòu)成、兩個樣本百分構(gòu)成的差;檢驗統(tǒng)計量所服從的分布不一定是正態(tài)分布。但只要是已知的理論分布，都可以通過該分布求得P值。第54頁,共76頁，2024年2月25日，星期天理解P值P值是指在無效假設(shè)的前提下，得到觀察到的量（或更極端的量）的概率。P值越小說明無效假設(shè)越不可靠。或者說，P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小”，一般的，我們是根據(jù)事先確定的檢驗水準(zhǔn)來判斷的。當(dāng)P<時，我們就可以下諸如“差別有顯著性”的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。第55頁,共76頁，2024年2月25日，星期天當(dāng)P>

時非小概率事件

在無效假設(shè)的前提下，得到觀察到的量（或更極端的量）的可能性還是相當(dāng)大的，我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)不足。具體問題，專業(yè)判斷

P=0.70與P=0.07第56頁,共76頁，2024年2月25日，星期天“差別有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極為顯著”二者之間不存在必然的聯(lián)系?！安顒e顯著”不一定導(dǎo)致“差別有顯著性”，“差別不顯著”倒是有很大可能導(dǎo)致“差別有顯著性”。即使“差別有顯著性”，臨床上也不一定有意義。第57頁,共76頁，2024年2月25日，星期天單側(cè)檢驗還是雙側(cè)檢驗?

One-sidedortwo-sidedtest?雙側(cè)檢驗永遠(yuǎn)是正確的單側(cè)檢驗只有在少數(shù)情況下才是合適的即使要做單側(cè)檢驗，也必須事先確定第58頁,共76頁，2024年2月25日，星期天t檢驗和u檢驗第59頁,共76頁，2024年2月25日，星期天是兩種常見的假設(shè)檢驗的方法，因其統(tǒng)計量為t,u而得名。u檢驗條件：總體標(biāo)準(zhǔn)差已知，資料服從正態(tài)分布情況下（1）樣本均數(shù)與總體均數(shù)比較（2）兩大樣本均數(shù)的比較；t檢驗條件：用于樣本量小、總體標(biāo)準(zhǔn)差未知時（1）樣本與總體均數(shù)比較（2）配對設(shè)計資料比較（3）兩樣本均數(shù)比較（同時要求兩樣本的總體方差相同，服從正態(tài)分布）第60頁,共76頁，2024年2月25日，星期天一、樣本均數(shù)與總體均數(shù)的比較總體均數(shù)：大量觀測得到的穩(wěn)定值或理論值，μ0

比較的目的是推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)是否相同。樣本均數(shù)與總體均數(shù)比較的t檢驗

P240例題14.10

注意步驟、符號寫法

第61頁,共76頁，2024年2月25日，星期天樣本均數(shù)與總體均數(shù)比較的u檢驗例題：若通過以往大規(guī)模調(diào)查，已知某地嬰兒出生體重均數(shù)為3.20kg，標(biāo)準(zhǔn)差0.39kg，今隨機查得25名難產(chǎn)兒平均出生體重為3.42kg，問：出生體重與難產(chǎn)是否有關(guān)？假定難產(chǎn)兒出生體重的標(biāo)準(zhǔn)差與一般兒童相同。第62頁,共76頁，2024年2月25日，星期天解題步驟據(jù)題意：要檢驗的是，難產(chǎn)兒出生體重總體均數(shù)是否等于3.20kg()，0.39看作總體標(biāo)準(zhǔn)差，樣本均數(shù)3.42，樣本含量25。1.建立假設(shè)：H0,假設(shè)難產(chǎn)兒出生體重總體均數(shù)和一般嬰兒出生體重總體均數(shù)相等，即：第63頁,共76頁，2024年2月25日，星期天2.計算合適的統(tǒng)計量：在總體標(biāo)準(zhǔn)差已知，對樣本均數(shù)和總體均數(shù)的差別做統(tǒng)計意義檢驗，可用公式：

u值服從均數(shù)為0，標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。本例：第64頁,共76頁，2024年2月25日，星期天3.從正態(tài)分布表查臨界值：本例：所以：拒絕無效假設(shè)，接受備擇假設(shè)。認(rèn)為難產(chǎn)和出生體重是有關(guān)的?？梢詾?，難產(chǎn)兒的出生體重平均來說是比較大一些。第65頁,共76頁，2024年2月25日，星期天如果本例總體標(biāo)準(zhǔn)差未知，只有從樣本中求得標(biāo)準(zhǔn)差0.42，則應(yīng)該用t檢驗。公式：第66頁,共7

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗

文檔簡介

溫馨提示

最新文檔

評論

終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔