版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
參數(shù)估計(jì)基礎(chǔ)9/9/20231參數(shù)估計(jì)基礎(chǔ)8/3/20231了解總體特征的最好方法是對總體的每一個(gè)體進(jìn)行觀察、試驗(yàn),但這在醫(yī)學(xué)研究實(shí)際中往往不可行。對無限總體不可能對所有個(gè)體逐一觀察.對有限總體限于人力、財(cái)力、物力、時(shí)間或個(gè)體過多等原因,不可能也沒必要對所有個(gè)體逐一研究(如對一批罐頭質(zhì)量檢查)。借助抽樣研究。9/9/20232了解總體特征的最好方法是對總體的每一個(gè)體進(jìn)行觀察、試驗(yàn),但這抽樣研究的目的是用樣本信息推斷總體特征,即用樣本資料計(jì)算的統(tǒng)計(jì)指標(biāo)推斷總體參數(shù)常用的統(tǒng)計(jì)推斷方法有參數(shù)估計(jì)(總體均數(shù)和總體概率的估計(jì))和假設(shè)檢驗(yàn)9/9/20233抽樣研究的目的是用樣本信息推斷總體特征,即用樣本資料計(jì)算的統(tǒng)內(nèi)容復(fù)習(xí)參數(shù)估計(jì)假設(shè)檢驗(yàn)研究總體統(tǒng)計(jì)描述樣本統(tǒng)計(jì)推斷隨機(jī)抽樣統(tǒng)計(jì)表統(tǒng)計(jì)圖統(tǒng)計(jì)指標(biāo)9/9/20234內(nèi)容復(fù)習(xí)參數(shù)估計(jì)研究總體統(tǒng)計(jì)描述樣本統(tǒng)計(jì)推斷隨機(jī)統(tǒng)計(jì)表8/3第五章總體均數(shù)估計(jì)抽樣分布與抽樣誤差t分布總體均數(shù)的估計(jì)案例討論9/9/20235第五章總體均數(shù)估計(jì)抽樣分布與抽樣誤差8/3/20235復(fù)習(xí)一些概念參數(shù)(parameter)與統(tǒng)計(jì)量(statistics)參數(shù)獲取的途徑對總體進(jìn)行研究抽樣研究抽樣誤差(samplingerror)1.抽樣誤差的概念:由個(gè)體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異。(抽樣誤差=總體參數(shù)-樣本統(tǒng)計(jì)量)2.抽樣誤差產(chǎn)生的原因:3.抽樣誤差的特點(diǎn):隨機(jī),不可避免,有規(guī)律可循。4.在大量重復(fù)抽樣的情況下,可以展示其規(guī)律性9/9/20236復(fù)習(xí)一些概念參數(shù)(parameter)與統(tǒng)計(jì)量(statis第一節(jié)抽樣分布與抽樣誤差樣本均數(shù)的抽樣分布與抽樣誤差樣本頻率的抽樣分布與抽樣誤差9/9/20237第一節(jié)抽樣分布與抽樣誤差樣本均數(shù)的抽樣分布與抽樣誤差8/一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布
舉例總體樣本1樣本2樣本3……樣本n……9/9/20238一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布總體樣本1樣本2樣本3…一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布
抽樣模擬實(shí)驗(yàn)假定總體:某年某地13歲女學(xué)生身高值X~N(155.4,5.3)隨機(jī)抽樣:n=30,K=1009/9/20239一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布8/3/20239一、均數(shù)的抽樣誤差μ=155.4σ=5.3………實(shí)驗(yàn)5-1從已知的13歲女生身高總體中隨機(jī)抽樣示意圖9/9/202310一、均數(shù)的抽樣誤差μ=155.4………實(shí)驗(yàn)5-1從已知100個(gè)隨機(jī)樣本的樣本均數(shù)(n=30)
樣本號均數(shù)樣本號均數(shù)1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.2…………45155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.69/9/202311100個(gè)隨機(jī)樣本的樣本均數(shù)(n=30)
樣本號均數(shù)樣本號均數(shù)一、均數(shù)的抽樣誤差表5-2從總體N(155.4,5.32)抽樣得到100個(gè)樣本均數(shù)的頻數(shù)分布組段(cm)頻數(shù)頻率(%)152.6~11.0153.2~44.0153.8~44.0154.4~2222.0155.0~2525.0155.6~2121.0156.2~1717.0156.8~33.0157.4~22.0158.0~158.611.0合計(jì)100100.09/9/202312一、均數(shù)的抽樣誤差表5-2從總體N(155.4,5.32)
將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制直方圖。圖3-2從正態(tài)分布總體N(155.4,5.3)隨機(jī)抽樣所得樣本均數(shù)分布9/9/202313將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣一、均數(shù)的抽樣誤差
1、樣本均數(shù)的抽樣分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的分布規(guī)律:圍繞著總體均數(shù)155.4cm,中間多,兩邊少,左右基本對稱,服從正態(tài)分布;樣本均數(shù)的變異較原變量的變異減小。9/9/202314一、均數(shù)的抽樣誤差1、樣本均數(shù)的抽樣分布特點(diǎn)8/3/202一、均數(shù)的抽樣誤差抽樣誤差概念:由于抽樣造成的樣本統(tǒng)計(jì)量與統(tǒng)計(jì)量以及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異叫作抽樣誤差。抽樣誤差產(chǎn)生的基本條件抽樣研究個(gè)體差異表現(xiàn)形式樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量之間的差異樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異9/9/202315一、均數(shù)的抽樣誤差抽樣誤差8/3/202315一、均數(shù)的抽樣誤差
2、均數(shù)的抽樣誤差(1)概念:由個(gè)體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本均數(shù)與總體均數(shù)間的差異。(均數(shù)的抽樣誤差=總體均數(shù)-樣本均數(shù))(2)表現(xiàn)形式:樣本均數(shù)與總體均數(shù)間存在差異樣本均數(shù)與樣本均數(shù)間存在差異9/9/202316一、均數(shù)的抽樣誤差2、均數(shù)的抽樣誤差8/3/202316
m…….9/9/202317
均數(shù)的抽樣誤差可表現(xiàn)為樣本均數(shù)與總體均數(shù)的差值均數(shù)的抽樣誤差也可表現(xiàn)為多個(gè)樣本均數(shù)間的離散程度
在實(shí)際科研中,上述二者都難以得到。9/9/202318均數(shù)的抽樣誤差可表現(xiàn)為樣本均數(shù)與總體均數(shù)的差值8/3/202
如何度量抽樣誤差的大?。咳绾谓沂境闃臃植嫉囊?guī)律?中心極限定理為我們提供解決辦法:9/9/2023198/3/202319中心極限定理(centrallimittheorem)從均數(shù)為
、標(biāo)準(zhǔn)差為
的總體中獨(dú)立隨機(jī)抽樣,當(dāng)樣本含量n增加時(shí),樣本均數(shù)的分布將趨于正態(tài)分布,此分布的均數(shù)為
,標(biāo)準(zhǔn)差為。X~N~N9/9/202320中心極限定理(centrallimittheorem)X標(biāo)準(zhǔn)誤(standarderror,SE)樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤,用來衡量抽樣誤差的大小。樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。此標(biāo)準(zhǔn)誤與個(gè)體變異
成正比,與樣本含量n的平方根成反比。9/9/202321標(biāo)準(zhǔn)誤(standarderror,SE)8/3/20233、均數(shù)的標(biāo)準(zhǔn)誤(standarderror)(1)概念:將樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤,它是描述均數(shù)抽樣誤差大小的指標(biāo)(2)計(jì)算:
實(shí)際工作中,
往往是未知的,一般可用樣本標(biāo)準(zhǔn)差s代替
:一、均數(shù)的抽樣誤差9/9/2023223、均數(shù)的標(biāo)準(zhǔn)誤(standarderror)一、均數(shù)的3、均數(shù)的標(biāo)準(zhǔn)誤
(standarderror)(3)統(tǒng)計(jì)學(xué)意義均數(shù)的標(biāo)準(zhǔn)誤越大,樣本均數(shù)的分布越分散,樣本均數(shù)離總體均數(shù)就越遠(yuǎn),樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大;抽樣誤差越大,由樣本均數(shù)估計(jì)總體均數(shù)的可靠性越差。反之,亦然。(4)影響抽樣誤差大小的因素
標(biāo)準(zhǔn)差樣本含量n
實(shí)際工作中,可通過適當(dāng)增加樣本含量n來減少均數(shù)的標(biāo)準(zhǔn)誤,從而降低抽樣誤差。9/9/2023233、均數(shù)的標(biāo)準(zhǔn)誤(standarderror)(3)統(tǒng)計(jì)3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示
4、總體分布非正態(tài)分布時(shí),樣本均數(shù)的分布規(guī)律
中心極限定理表明,即使從非正態(tài)總體中隨機(jī)抽樣,只要樣本含量足夠大,樣本均數(shù)的分布也趨于正態(tài)分布.樣本均數(shù)的總體均數(shù)仍等于μ;樣本均數(shù)的標(biāo)準(zhǔn)誤仍滿足均數(shù)標(biāo)準(zhǔn)誤的計(jì)算式;當(dāng)n較小時(shí),樣本均數(shù)的分布是偏態(tài)的;當(dāng)n足夠大(n≥50)樣本均數(shù)的分布近似正態(tài)分布一、均數(shù)的抽樣誤差9/9/2023254、總體分布非正態(tài)分布時(shí),樣本均數(shù)的分布規(guī)律一、均數(shù)的抽樣
非正態(tài)總體樣本均數(shù)的抽樣實(shí)驗(yàn)圖5-1(a)是一個(gè)正偏峰的分布,用電腦從中隨機(jī)抽取樣本含量分別為5,10,30和50的樣本各1000次,計(jì)算樣本均數(shù)并繪制4個(gè)直方圖9/9/202326非正態(tài)總體樣本均數(shù)的抽樣實(shí)驗(yàn)8/3/2023269/9/2023278/3/2023279/9/2023288/3/2023289/9/2023298/3/2023299/9/2023308/3/2023309/9/2023318/3/202331⑴當(dāng)原分布N(155.40,5.3)為正態(tài)分布時(shí),則樣本均數(shù)的分布N(155.38,1.71)也為正態(tài)分布;當(dāng)原分布為偏態(tài)分布時(shí),當(dāng)樣本含量足夠大時(shí),樣本均數(shù)的分布也為近似正態(tài)分布。所以,不論原分布的分布類型如何,樣本均數(shù)的分布均為正態(tài)分布。⑵原分布可以用μ和σ來描述其分布特征;同樣,樣本均數(shù)的分布也可以用樣本均數(shù)的均數(shù)和樣本均數(shù)的標(biāo)準(zhǔn)差表示其分布特征。9/9/202332⑴當(dāng)原分布N(155.40,5.3)為正態(tài)分布時(shí),則樣本將樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤反映樣本抽樣誤差的大小,是說明樣本均數(shù)可靠性的一個(gè)指標(biāo),常用的形式來表示樣本均數(shù)的可靠程度。9/9/202333將樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤反映樣本抽樣誤差的影響抽樣誤差大小的因素有:⑴樣本標(biāo)準(zhǔn)差。S越大,也就越大。⑵樣本含量。n越大,抽樣誤差越小。因此如在一定標(biāo)準(zhǔn)差條件下,加大樣本含量,可減少抽樣誤差,以保證的樣本均數(shù)的代表性和可靠性。9/9/202334影響抽樣誤差大小的因素有:8/3/202334例6-12000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。===2.89g/L9/9/202335例6-12000年某研究者隨機(jī)調(diào)查某地健康成年男子27人樣本頻率的抽樣分布與抽樣誤差在一口袋內(nèi)裝有形狀、重量完全相同的黑球和白球,已知黑球比例為20%(總體概率π=20%),從口袋中每摸一次看清顏色后放回去,攪勻后再摸,重復(fù)摸球35次(n=35),計(jì)算摸到黑球的百分比(樣本頻率p
i)。重復(fù)這樣的實(shí)驗(yàn)100次,每次得到100個(gè)黑球的比例分別為14.4%,19.8%,20.2%,22.5%,······等,將其頻數(shù)分布列于表6-3。9/9/202336樣本頻率的抽樣分布與抽樣誤差在一口袋內(nèi)裝有形狀、黑球比例%樣本頻數(shù)樣本頻率(%)5.0~33.08.0~77.011.0~55.014.0~88.017.0~1616.020.0~2222.022.0~1515.025.0~77.028.0~77.031.0~55.034.0~33.040.0~22.0合計(jì)100100.0
表6-3總體概率為20%時(shí)的隨機(jī)抽樣結(jié)果(ni=35)9/9/202337黑球比例%樣本頻數(shù)樣本頻率(%)5.0~33.0抽樣分布與抽樣誤差頻率的抽樣誤差:這種樣本率樣本頻率與樣本率樣本頻率之間、樣本率樣本頻率與總體率總體概率之間的差異。頻率的標(biāo)準(zhǔn)誤:表示頻率的抽樣誤差的指標(biāo)9/9/202338抽樣分布與抽樣誤差頻率的抽樣誤差:這種樣本率樣本頻率與樣本率樣本頻率的總體均數(shù)參數(shù)為π,
率的標(biāo)準(zhǔn)誤計(jì)算公式(5-3):公式(6-4)
9/9/2023398/3/202339例6-2某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松癥者322人,患病率為41.5%,試估計(jì)該樣本頻率的抽樣誤差。p=41.5%=0.415,n=776=9/9/202340例6-2某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其思考題:什么是抽樣誤差?決定抽樣誤差大小的因素有哪些?抽樣誤差能避免么?抽樣誤差有規(guī)律么?標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差有何區(qū)別與聯(lián)系?9/9/202341思考題:8/3/202341標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差有何區(qū)別與聯(lián)系9/9/202342標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差有何區(qū)別與聯(lián)系8/3/202342第二節(jié)t分布t分布的概念t分布的特征t界值表9/9/202343第二節(jié)t分布t分布的概念8/3/202343一、t分布的概念隨機(jī)變量X~N(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,1)Z變換t分布(ν=n-1)標(biāo)準(zhǔn)正態(tài)分布N(0,1)9/9/202344一、t分布的概念隨機(jī)變量X~N(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0t分布設(shè)從正態(tài)分布N(
,
2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為和s,設(shè):
則t值服從自由度為n-1的t分布(t-distribution)。Gosset于1908年在《生物統(tǒng)計(jì)》雜志上發(fā)表該論文時(shí)用的是筆名“Student”,故t分布又稱Studentt分布。
9/9/202345t分布設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣二、t值與t分布學(xué)習(xí)t分布的意義事實(shí)上,任何一個(gè)樣本統(tǒng)計(jì)量均有其分布的特點(diǎn)和規(guī)律。統(tǒng)計(jì)量的抽樣分布規(guī)律是進(jìn)行統(tǒng)計(jì)推斷的理論基礎(chǔ)。
t分布是十分有用的,它是總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)的理論基礎(chǔ)。9/9/202346二、t值與t分布學(xué)習(xí)t分布的意義8/3/202346
從前述實(shí)驗(yàn)的13歲女學(xué)生身高這個(gè)正態(tài)總體中分別作樣本量為3和50的隨機(jī)抽樣,各抽取1000份樣本,并分別得到1000個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤。對它們分別作t變換,并將t值繪制相應(yīng)的直方圖,可得到t值分布曲線圖9/9/202347從前述實(shí)驗(yàn)的13歲女學(xué)生身高這個(gè)正態(tài)總體中分別作樣本9/9/2023488/3/202348三、t分布的特征t分布的圖形t分布的參數(shù):ν=n-1自由度ν對圖形的影響t分布的極限是標(biāo)準(zhǔn)正態(tài)分布t分布曲線下的尾部面積(概率)-t界值表9/9/202349三、t分布的特征t分布的圖形8/3/202349t分布t值的分布與自由度
有關(guān)(實(shí)際是樣本含量n不同)。t分布的圖形不是一條曲線,而是一簇曲線。υ=∞(標(biāo)準(zhǔn)正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖9/9/202350t分布t值的分布與自由度有關(guān)(實(shí)際是樣本含量n不同)。tt分布的特征
t分布為一簇單峰分布曲線t分布以0為中心,左右對稱t分布只有一個(gè)特征參數(shù),即為自由度(υ)。
t分布與自由度
有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高,;自由度逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。
9/9/202351t分布的特征
t分布為一簇單峰分布曲線8/3/202351
=∞(標(biāo)準(zhǔn)正態(tài)曲線)
=5
=10.10.2-4-3-2-1012340.3圖5.2自由度分別為1、5、∞時(shí)的t分布9/9/202352=∞(標(biāo)準(zhǔn)正態(tài)曲線)=5=10.10.2-4-3t分布曲線下的面積規(guī)律同標(biāo)準(zhǔn)正態(tài)分布一樣,統(tǒng)計(jì)應(yīng)用中最關(guān)心的是t分布曲線下的尾部面積(即概率)與橫軸t值間的關(guān)系。每一自由度下的t分布曲線都有其自身分布規(guī)律9/9/202353t分布曲線下的面積規(guī)律同標(biāo)準(zhǔn)正態(tài)分布一樣,統(tǒng)計(jì)應(yīng)用中最關(guān)心t界值表
(tcriticalvalue)統(tǒng)計(jì)學(xué)家將t分布曲線下的尾部面積(即概率P)與橫軸t值間的關(guān)系編制了不同自由度
下的t界值表(附表2)(467頁)橫標(biāo)目為自由度(υ=n-1)縱標(biāo)目為概率P(即曲線下尾部陰影部分面積)表中的數(shù)字為相應(yīng)的t界值(t≥0)單側(cè)概率(one-tailedprobability)所對應(yīng)的t界值記為tα,ν雙側(cè)概率(two-tailedprobability)所對應(yīng)的t界值記為tα/2,ν9/9/202354t界值表(tcriticalvalue)統(tǒng)計(jì)學(xué)家將t分9/9/2023558/3/202355更一般的表示方法如圖5-4(a)和(b)中陰影部分所示為:單側(cè):P(t
t
,
)=
和P(t
t
,
)=
雙側(cè):P(t
t
/2,
)+P(t
t
/2,
)=
9/9/202356更一般的表示方法如圖5-4(a)和(b)中陰影部分所示為:8t界值表
(tcriticalvalue)不同自由度下的t界值表:附表2
查t0.05,16=1.746(單側(cè))
P(t≥1.746)=0.05或P(t≤-1.746)=0.05查t0.05/2,16=1.746(雙側(cè))
P(t≥1.746)+P(t≤-1.746)=0.05或P(-1.746<t<1.746)=0.95
t分布曲線的兩端尾部面積表示在隨機(jī)抽樣中獲得的等于及大于某|t|值(界值)的概率,即P值。9/9/202357t界值表(tcriticalvalue)不同自由度下的9/9/2023588/3/202358t界值表
(tcriticalvalue)t界值表的特點(diǎn)
同一自由度下,t值越大則P值越小;
P值相同時(shí),υ越大,則t值越小;在相同的t值時(shí),雙側(cè)概率為單側(cè)概率的兩倍即t0.10/2,16=t0.05,16=1.746υ→∞時(shí),t界值為Z界值9/9/202359t界值表(tcriticalvalue)t界值表的特點(diǎn)t界值表
(tcriticalvalue)t界值表的用途已知υ和P(α),可查到相應(yīng)的t界值;已知υ和t界值,可確定單側(cè)或雙側(cè)概率P進(jìn)行總體均數(shù)估計(jì)和均數(shù)的假設(shè)檢驗(yàn)9/9/202360t界值表(tcriticalvalue)t界值表的用途第三節(jié)總體均數(shù)及總體概率的估計(jì)抽樣研究:從總體到樣本實(shí)際工作:由樣本推斷總體統(tǒng)計(jì)推斷(statisticalinference)就是根據(jù)樣本所提供的信息,以一定的概率推斷總體的性質(zhì)。9/9/202361第三節(jié)總體均數(shù)及總體概率的估計(jì)抽樣研究:從總體到樣本8/3第三節(jié)總體均數(shù)估計(jì)參數(shù)估計(jì)(parameterestimation)的概念概念用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)方法點(diǎn)估計(jì)(pointestimation)區(qū)間估計(jì)(intervalestimation)9/9/202362第三節(jié)總體均數(shù)估計(jì)參數(shù)估計(jì)(parameterestim點(diǎn)估計(jì)直接用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值方法簡單,但未考慮抽樣誤差的大小在實(shí)際問題中,總體參數(shù)往往是未知的,但它們是固定的值,并不是隨機(jī)變量值。而樣本統(tǒng)計(jì)量隨樣本的不同而不同,屬隨機(jī)的。
9/9/202363點(diǎn)估計(jì)直接用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值8/3/2023區(qū)間估計(jì)按一定的概率或可信度(1-
),用一個(gè)區(qū)間估計(jì)總體參數(shù)所在范圍,這個(gè)范圍稱作可信度為1-
的可信區(qū)間(confidenceinterval,CI),又稱置信區(qū)間。這種估計(jì)方法稱為區(qū)間估計(jì)。通常用樣本均數(shù)和均數(shù)的標(biāo)準(zhǔn)誤估計(jì)總體均數(shù)的95%(或99%)置信區(qū)間9/9/202364區(qū)間估計(jì)按一定的概率或可信度(1-),用一個(gè)區(qū)間估計(jì)總體
總體均數(shù)置信區(qū)間的計(jì)算需考慮:
(1)總體標(biāo)準(zhǔn)差
是否已知,(2)樣本含量n的大小通常有兩類方法:
(1)t分布法——
未知
(2)正態(tài)近似法——
已知
未知但n足夠大
總體均數(shù)的區(qū)間估計(jì)的計(jì)算:9/9/202365總體均數(shù)置信區(qū)間的計(jì)算需考慮:總體均數(shù)的區(qū)間估計(jì)的計(jì)算:8一、樣本均數(shù)估計(jì)總體均數(shù)總體均數(shù)的置信區(qū)間1.t分布法適用條件:σ未知時(shí),按t分布原理估計(jì)總體均數(shù)的置信區(qū)間。計(jì)算公式:
9/9/202366一、樣本均數(shù)估計(jì)總體均數(shù)總體均數(shù)的置信區(qū)間8/3/20236一、樣本均數(shù)估計(jì)總體均數(shù)總體均數(shù)的置信區(qū)間2、正態(tài)近似法適用條件:σ未知但樣本含量足夠大(n≥100)時(shí),按正態(tài)分布原理估計(jì)總體均數(shù)的置信區(qū)間。計(jì)算公式:9/9/202367一、樣本均數(shù)估計(jì)總體均數(shù)總體均數(shù)的置信區(qū)間8/3/20236例1:為了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機(jī)抽取了1歲嬰兒35人,測得其血紅蛋白均數(shù)為123.7g/L,標(biāo)準(zhǔn)差為11.9g/L。試估計(jì)該地1歲嬰兒的血紅蛋白平均濃度。分析:已知樣本標(biāo)準(zhǔn)差s,樣本例數(shù)n=35,不知到總體的信息,選用t分布法估計(jì)總體均數(shù)的可信區(qū)間。95%的CI公式為:例2:某地抽得正常成人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,試估計(jì)該地正常成人血清膽固醇均數(shù)的95%和99%置信區(qū)間9/9/202368例1:為了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機(jī)抽取了1歲例
隨機(jī)抽取12名口腔癌患者,檢測其發(fā)鋅含量,得均數(shù)為253.05
g/g,標(biāo)準(zhǔn)差為27.18
g/g,求發(fā)鋅含量總體均數(shù)95%的可信區(qū)間。
本例自由度
=12-1=11,經(jīng)查表得t0.05,11=2.201,則即口腔癌患者發(fā)鋅含量總體均數(shù)的95%可信區(qū)間為:193.23~321.87(
g/g)。用該區(qū)間估計(jì)口腔癌患者發(fā)鋅含量總體均數(shù)的可信度為95%。
9/9/202369例隨機(jī)抽取12名口腔癌患者,檢測其發(fā)鋅含量,得均數(shù)為25-tt09/9/202370-tt08/3/202370例
某地120名12歲男孩身高均數(shù)為142.67cm,標(biāo)準(zhǔn)差為0.5477cm,計(jì)算該地12歲男孩身高總體均數(shù)90%的可信區(qū)間。因n=120>100,故可以用標(biāo)準(zhǔn)正態(tài)分布代替t分布,u0.10=1.64
即該地12歲男孩平均身高的90%可信區(qū)間為:141.77~143.57(cm),可認(rèn)為該地12歲男孩平均身高在141.77~143.57(cm)之間。
9/9/202371例某地120名12歲男孩身高均數(shù)為142.67cm,標(biāo)準(zhǔn)9/9/2023728/3/202372三、應(yīng)注意的一些問題
置信區(qū)間和置信限的關(guān)系準(zhǔn)確度與精密度的關(guān)系9/9/202373三、應(yīng)注意的一些問題置信區(qū)間和置信限的關(guān)系8/3/2023正確理解可信區(qū)間的涵義可信區(qū)間一旦形成,它要么包含總體參數(shù),要么不包含總體參數(shù),二者必居其一,無概率可言。所謂95%的可信度是針對可信區(qū)間的構(gòu)建方法而言的。
以均數(shù)的95%可信區(qū)間為例,其涵義是:如果重復(fù)100次抽樣,每100個(gè)樣本所算得的100個(gè)可信區(qū)間,則在此100個(gè)可信區(qū)間內(nèi),理論上有95個(gè)包含總體均數(shù),而有5個(gè)不包含總體均數(shù)。9/9/202374正確理解可信區(qū)間的涵義可信區(qū)間一旦形成,它要么包含總體參數(shù),可信區(qū)間和可信限的關(guān)系可信限:分別指兩個(gè)點(diǎn)值,分別稱為下限值和上限值。可信區(qū)間:是指以上、下可信限為界的一個(gè)范圍。用公式表示可信限;用表示可信區(qū)間。9/9/202375可信區(qū)間和可信限的關(guān)系可信限:分別指兩個(gè)點(diǎn)值,分別稱為下限值置信區(qū)間的解釋
總體均數(shù)的95%置信區(qū)間:如果從總體中重復(fù)抽取100份樣本含量相同的獨(dú)立樣本,每份樣本可分別計(jì)算一個(gè)置信區(qū)間,那么在100個(gè)置信區(qū)間中,大約有95個(gè)置信區(qū)間包括μ(估計(jì)正確),只有5個(gè)置信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。
或者說對于某一個(gè)區(qū)間而言,它包含總體均數(shù)的可能性為95%,而不包含總體均數(shù)的可能性僅為5%。因此在實(shí)際應(yīng)用中,以這種方法估計(jì)總體均數(shù)犯錯(cuò)誤的概率僅為5%。
置信區(qū)間的解釋總體均數(shù)的95%置信區(qū)間:如果圖4.1100個(gè)來自N(0,1)的樣本所估計(jì)的可信區(qū)間示意
9/9/202377圖4.1100個(gè)來自N(0,1)的樣本所估計(jì)的可信區(qū)間可信區(qū)間意義:
雖然不能知道某校全體女大學(xué)生身高均數(shù)的確切數(shù)值,全體女大學(xué)生身高均數(shù)在163.0--164.5cm之間的可能性是95%,在162.7–164.7cm之間的可能性是99%。
換句話說,做出校全體女大學(xué)生身高均數(shù)為163.0--164.5cm的結(jié)論,說對的概率是95%,說錯(cuò)的概率是5%;做出校全體女大學(xué)生身高均數(shù)為162.7–164.7cm的結(jié)論,說對的概率是99%,說錯(cuò)的概率是1%。9/9/202378可信區(qū)間意義: 換句話說,做出校全體女大學(xué)生身高均數(shù)為16可信區(qū)間的兩個(gè)要素準(zhǔn)確度
反映為可信度1-
的大小,即區(qū)間包含總體均數(shù)的概率大小,越接近1越好精密度
反映為區(qū)間的寬度,區(qū)間越窄越好在可信度確定的情況下,增加樣本含量可減小可信區(qū)間的寬度9/9/202379可信區(qū)間的兩個(gè)要素準(zhǔn)確度8/3/202379
95%可信區(qū)間99%可信區(qū)間
公式
區(qū)間范圍窄寬
估計(jì)錯(cuò)誤的概率大(0.05)?。?.01)可信區(qū)間的兩個(gè)要素當(dāng)樣本含量為定值時(shí),上述兩者互相矛盾。9/9/20238095%可求參數(shù)置信區(qū)間保證準(zhǔn)確度先提高精度再處理“準(zhǔn)確度與精密度”關(guān)系的原則在置信度確定的情況下,增加樣本含量可減小區(qū)間寬度。9/9/202381求參數(shù)置信區(qū)間保證準(zhǔn)確度先提高精度再處理“準(zhǔn)確度與可信區(qū)間與參考值范圍的區(qū)別可信區(qū)間用于估計(jì)總體參數(shù),總體參數(shù)只有一個(gè)。參考值范圍用于估計(jì)變量值的分布范圍,變量值可能很多甚至無限。95%的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)村自建房承建與農(nóng)村新能源利用合作合同
- 二零二五年度形婚雙方婚姻關(guān)系協(xié)議及婚后財(cái)產(chǎn)分割與子女撫養(yǎng)安排3篇
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)園區(qū)場地轉(zhuǎn)租合同3篇
- 2025年度高新技術(shù)研發(fā)貸款擔(dān)保協(xié)議3篇
- 2025年度消防安全設(shè)施設(shè)備安裝與驗(yàn)收協(xié)議3篇
- 2025年度內(nèi)墻粉刷施工與室內(nèi)空氣凈化技術(shù)合作合同3篇
- 二零二五年度生豬養(yǎng)殖與農(nóng)產(chǎn)品市場銷售合作合同范本3篇
- 2025年度公司對個(gè)人創(chuàng)業(yè)團(tuán)隊(duì)對賭合同3篇
- 二零二五年度企業(yè)車輛共享平臺使用服務(wù)合同3篇
- 2025年度公司與公司簽訂的體育產(chǎn)業(yè)合作發(fā)展協(xié)議2篇
- 肌骨超聲簡介
- 神經(jīng)外科臨床實(shí)習(xí)教學(xué)計(jì)劃
- 基本光刻工藝流程
- 胸腔閉式引流護(hù)理-2023年中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)
- 高中體育足球教學(xué)教案 全冊
- 藝術(shù)概論P(yáng)PT完整全套教學(xué)課件
- 社團(tuán)啦啦操訓(xùn)練計(jì)劃
- 2023-2024學(xué)年四川省雅安市小學(xué)語文二年級期末評估試題詳細(xì)參考答案解析
- UPS維護(hù)保養(yǎng)檢查表
- 英語人教新目標(biāo)七年級上冊微課PPT
- 2023年安全生產(chǎn)先進(jìn)集體申報(bào)表
評論
0/150
提交評論