第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第1頁(yè)
第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第2頁(yè)
第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第3頁(yè)
第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第4頁(yè)
第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/12一、參數(shù)與統(tǒng)計(jì)量參數(shù):用來(lái)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征,也就是總體指標(biāo)。在實(shí)踐中,由于各種原因常常不能開(kāi)展全面調(diào)查,對(duì)參數(shù)的了解就必須依賴(lài)于統(tǒng)計(jì)推斷的方法。統(tǒng)計(jì)推斷:就是按照隨機(jī)原則從總體中抽取一部分單位進(jìn)行觀察,并依據(jù)所獲得的結(jié)果,對(duì)總體數(shù)量特征做出具有一定可靠程度的估計(jì)或判斷的統(tǒng)計(jì)認(rèn)識(shí)方法。一、參數(shù)與統(tǒng)計(jì)量在社會(huì)經(jīng)濟(jì)領(lǐng)域的抽樣調(diào)查中,一般將總體視作有限總體,將變量視作離散變量來(lái)處理。因此,常用的參數(shù)可定義如下:1.總體均值:設(shè)總體單位數(shù)為N,所研究的總體單位的特征記為變量,變量值分別為,則總體均值的定義式為:

一、參數(shù)與統(tǒng)計(jì)量2.總體方差總體方差的定義式為:

3.總體比例:在社會(huì)經(jīng)濟(jì)活動(dòng)中,常常存在這樣的總體,根據(jù)所有單位是否具有某種特征將其分成兩組。如人口總體按性別分為“男性”和“女性”兩組。一、參數(shù)與統(tǒng)計(jì)量若記總體個(gè)單位中,具有某特征的組的單位數(shù)為,不具有該特征的組的單位數(shù)為,且,令,,

,則總體均值和總體方差的定義式分別為:

此時(shí),總體均值就變?yōu)榭傮w比例。一、參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)量:用來(lái)描述樣本特征的概括性數(shù)字度量,它是樣本的函數(shù),不含有任何未知的總體參數(shù)。樣本統(tǒng)計(jì)量是隨機(jī)變量。常用的統(tǒng)計(jì)量有:1.樣本均值:設(shè)抽取的樣本單位數(shù)為,樣本變量為,其觀察值分別為,則樣本均值定義式為:

一、參數(shù)與統(tǒng)計(jì)量2.樣本方差樣本方差的定義式為:

3.樣本比例:如總體對(duì)應(yīng),若記樣本個(gè)單位中,具有某特征的組的單位數(shù)為,不具有該特征的組的單位數(shù)為,且,令,,則樣本均值和樣本方差一、參數(shù)與統(tǒng)計(jì)量定義式分別為:(當(dāng)較大時(shí))樣本均值就是樣本比例。一、參數(shù)與統(tǒng)計(jì)量主要的總體參數(shù)和樣本統(tǒng)計(jì)量及其代表符號(hào)見(jiàn)下表:二、常用的概率分布在統(tǒng)計(jì)推斷中,常用的幾個(gè)重要分布就是正態(tài)分布、分布、分布和分布。1.正態(tài)分布如果連續(xù)隨機(jī)變量的密度函數(shù)為:則稱(chēng)隨機(jī)變量服從均值為、方差為的正態(tài)分布,記為。

二、常用的概率分布正態(tài)分布的密度函數(shù)圖形是以均值為中心的對(duì)稱(chēng)鐘形曲線(xiàn)。

分別決定著曲線(xiàn)在橫軸上的位置以及曲線(xiàn)的胖瘦形狀。二、常用的概率分布若隨機(jī)變量的均值、方差,則稱(chēng)其為標(biāo)準(zhǔn)正態(tài)隨機(jī)變量,它的分布為標(biāo)準(zhǔn)正態(tài)分布,記為,其概率密度函數(shù)及概率密度函數(shù)的圖形可表示為:二、常用的概率分布任何一個(gè)一般的正態(tài)分布都可以通過(guò)標(biāo)準(zhǔn)化轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。設(shè),則

就是將一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布的轉(zhuǎn)換式。林德貝格–費(fèi)勒中心極限定理:當(dāng)一個(gè)事件受到許多個(gè)隨機(jī)因素的共同影響,如果這些隨機(jī)因素是相互獨(dú)立的,并且,其中任何一個(gè)隨機(jī)因素的影響都很小,小到幾乎可以忽略不計(jì)時(shí),這些隨機(jī)因素的總影響表現(xiàn)為正態(tài)分布形式。二、常用的概率分布2.

分布設(shè)隨機(jī)變量相互獨(dú)立,且,則隨機(jī)變量

服從自由度為的分布,記作,其中為正整數(shù)。二、常用的概率分布

分布的密度函數(shù)的圖形是非對(duì)稱(chēng)曲線(xiàn),隨自由度的增大而逐漸趨于對(duì)稱(chēng)。不同自由度的分布圖如下:二、常用的概率分布3.

分布設(shè)隨機(jī)變量相互獨(dú)立,且,則隨機(jī)變量

服從自由度為的分布(學(xué)生氏分布),記作。

二、常用的概率分布

分布的密度函數(shù)的圖形是對(duì)稱(chēng)曲線(xiàn),隨自由度的增大,分布逐漸趨近于標(biāo)準(zhǔn)正態(tài)分布。

不同自由度的分布圖如下:

二、常用的概率分布4.

分布設(shè)隨機(jī)變量相互獨(dú)立,且,則隨機(jī)變量

服從自由度為和的分布,記作。

二、常用的概率分布二、常用的概率分布分布的密度函數(shù)的圖形是非對(duì)稱(chēng)曲線(xiàn),其形狀取決于兩個(gè)自由度的大小。不同自由度的分布圖如下:

三、抽樣分布抽樣分布就是統(tǒng)計(jì)量的概率分布,具體地說(shuō),就是從總體中抽取樣本時(shí),由所有可能的樣本計(jì)算出的統(tǒng)計(jì)量的值所形成的分布。參數(shù)雖然未知,但是它是確定的。與參數(shù)的特點(diǎn)不同,由于樣本選取的隨機(jī)性,統(tǒng)計(jì)量不是唯一確定的數(shù),是隨機(jī)變量,自然它就可能有一定的概率分布。三、抽樣分布1.樣本均值的分布設(shè)是來(lái)自某個(gè)總體的一個(gè)容量為的簡(jiǎn)單隨機(jī)樣本,為樣本均值。(1)若總體分布為,則的精確分布為,記為三、抽樣分布(2)若總體分布未知或不是正態(tài)分布,但已知總體均值為,總體方差為,則當(dāng)樣本容量較大時(shí),的漸近分布為,記為

三、抽樣分布2.樣本比例的分布若記總體個(gè)單位中,具有某特征的單位數(shù)為,;樣本的n個(gè)單位中具有某種特征的單位數(shù)為

,。當(dāng)樣本容量較大,和都大于5時(shí),的漸近分布為,記為三、抽樣分布3.樣本方差的抽樣分布設(shè)是來(lái)自正態(tài)總體的一個(gè)容量為的簡(jiǎn)單隨機(jī)樣本,和分別為樣本均值與樣本方差,則25/12一、點(diǎn)估計(jì)抽樣估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。點(diǎn)估計(jì):就是將樣本統(tǒng)計(jì)量的具體取值作為未知的總體參數(shù)的估計(jì)值。比如,用樣本均值作為總體均值的估計(jì)值,記作;用樣本比例作為總體比例的估計(jì)值,記作;用樣本方差作為總體方差的估計(jì)值,記作。二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)作為總體參數(shù)估計(jì)量的統(tǒng)計(jì)量可能不止一種,比方說(shuō)對(duì)人口總體平均身高的估計(jì),可以用樣本中人群身高的算術(shù)平均數(shù)作為它的點(diǎn)估計(jì)。到底用哪一種作為估計(jì)量更為合適呢?這就產(chǎn)生了估計(jì)量?jī)?yōu)良與否的判斷問(wèn)題。從理論上講,一個(gè)優(yōu)良的估計(jì)量要求滿(mǎn)足如下幾個(gè)要求:二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)1.無(wú)偏性如果誤差從平均的意義上講等于零,或者說(shuō)樣本所有可能取值的平均值等于總體參數(shù),就稱(chēng)這種估計(jì)為無(wú)偏估計(jì)。容易證明,樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的無(wú)偏估計(jì)量,用式子表示就為:二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)2.有效性在所有無(wú)偏估計(jì)量中,估計(jì)誤差最小的統(tǒng)計(jì)量稱(chēng)為有效估計(jì)量。容易證明,樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的有效估計(jì)量。二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)3.一致性用樣本估計(jì)總體,如果隨著樣本容量的不斷增大,點(diǎn)估計(jì)量的值越來(lái)越接近于被估的總體參數(shù),能滿(mǎn)足這一要求的估計(jì)就稱(chēng)為一致估計(jì)。容易證明,樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的一致估計(jì)量。三、抽樣誤差(一)抽樣誤差的概念凡是抽樣估計(jì)就會(huì)有誤差,誤差或大或小,不可能完全避免。在抽樣調(diào)查中,誤差可分成抽樣誤差和非抽樣誤差兩種。1、抽樣誤差:是指由于抽樣的隨機(jī)性而造成的總體參數(shù)(如、和等)和其估計(jì)量(如統(tǒng)計(jì)量、和等)之間的離差。抽樣誤差是抽樣調(diào)查所獨(dú)有的。三、抽樣誤差2.非抽樣誤差:是指除抽樣誤差之外,由于其它多種原因引起的總體特征的估計(jì)值與總體特征的真實(shí)值之間的差異。如目標(biāo)總體與抽樣總體不一致所帶來(lái)的抽樣框誤差,調(diào)查時(shí)的無(wú)回答誤差,抽樣和估計(jì)過(guò)程中產(chǎn)生的抄錄、計(jì)算等計(jì)量性誤差,等等。在進(jìn)行理論分析時(shí),一般假定非抽樣誤差是不存在的。三、抽樣誤差(二)影響抽樣誤差的因素1.總體變異的程度??傮w變異程度越大,抽樣誤差也越大;反之,總體變異程度越小,抽樣誤差也越小。2.樣本容量的大小。抽樣單位數(shù)越多,抽樣誤差會(huì)越??;反之,抽樣單位數(shù)越少,抽樣誤差會(huì)越大。顯然,當(dāng)總體的全部單位均被抽出時(shí),抽樣誤差就等于零。3.抽樣方式和方法。不同的抽樣方法,其抽樣誤差的大小也不一樣。比如,在相同的條件下,放回抽樣的抽樣誤差要大于不放回抽樣的抽樣誤差。三、抽樣誤差(三)抽樣平均誤差1.抽樣平均誤差的定義抽樣平均誤差一般用平方根形式來(lái)表示,樣本均值和樣本比例的抽樣平均誤差的定義分別為:三、抽樣誤差由于、分別是和的無(wú)偏估計(jì)量,從而,上述式子又可變化為:這說(shuō)明,抽樣平均誤差實(shí)際上就是統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。三、抽樣誤差樣本序號(hào)樣本()樣本均值1(2,2)2169/162(2,4)381/163(2,7)9/29/164(2,8)51/165(4,2)381/166(4,4)425/167(4,7)11/21/168(4,8)69/169(7,2)9/29/1610(7,4)11/21/1611(7,7)749/1612(7,8)15/281/1613(8,2)51/1614(8,4)69/1615(8,7)15/281/1616(8,8)8121/16合計(jì)—8491/2三、抽樣誤差由表中資料可得:樣本均值樣本均值的均值均值的抽樣平均誤差三、抽樣誤差(2)如果采用不放回簡(jiǎn)單隨機(jī)抽樣,則可能的樣本數(shù)目及相應(yīng)的樣本均值的計(jì)算如下表樣本序號(hào)樣本()樣本均值1(2,4)381/162(2,7)9/29/163(2,8)51/164(4,7)11/21/165(4,8)69/166(7,8)15/281/16合計(jì)—63/291/8三、抽樣誤差由此可得:樣本均值的均值均值的抽樣平均誤差三、抽樣誤差2.抽樣平均誤差的數(shù)理推導(dǎo)式(1)放回簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差的計(jì)算式為:(2)不放回簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差的計(jì)算式為:不放回簡(jiǎn)單隨機(jī)抽樣,均值的抽樣平均誤差為:它們與前面按定義式計(jì)算的結(jié)果相同。注:從上述例子還可以看出,在相同條件下,放回抽樣的抽樣平均誤差大于不放回抽樣的平均誤差。三、抽樣誤差3.放回抽樣與不放回抽樣的平均誤差計(jì)算式的比較在簡(jiǎn)單隨機(jī)抽樣中,抽樣平均誤差或的計(jì)算公式可概括為下表三、抽樣誤差

估計(jì)總體均值μ時(shí)估計(jì)總體比例π時(shí)放回抽樣不放回抽樣由此可見(jiàn):(1)在簡(jiǎn)單隨機(jī)抽樣的平均誤差計(jì)算式中,不放回抽樣比放回抽樣多了一個(gè)系數(shù),它被稱(chēng)為有限總體不放回抽樣的修正系數(shù)。(2)由于,這說(shuō)明不放回抽樣的平均誤差小于放回抽樣的平均誤差。(3)可約等于,稱(chēng)為抽樣比。一般地,時(shí),修正系數(shù)可以忽略不計(jì)。三、抽樣誤差(四)抽樣極限誤差抽樣極限誤差是指估計(jì)值同總體真值之間誤差的可能范圍,是抽樣估計(jì)所允許的誤差的上下界限。若未知的點(diǎn)估計(jì)量為,抽樣極限誤差為,則均值的極限誤差為:三、抽樣誤差比例的極限誤差為:極限誤差和平均誤差的關(guān)系為(以統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布為例):上式中,稱(chēng)為臨界值,它是標(biāo)準(zhǔn)正態(tài)分布概率密度曲線(xiàn)下右側(cè)面積為時(shí)的值,可由標(biāo)準(zhǔn)正態(tài)分布表查得,為估計(jì)量的平均誤差。三、抽樣誤差三、抽樣誤差臨界值示意圖四、區(qū)間估計(jì)(一)區(qū)間估計(jì)的定義點(diǎn)估計(jì):點(diǎn)估計(jì)能對(duì)未知的總體參數(shù)給出一個(gè)明確的數(shù)量。但是點(diǎn)估計(jì)僅僅是未知參數(shù)的一個(gè)近似值,不能反映這個(gè)近似值的誤差范圍。區(qū)間估計(jì):是用一個(gè)區(qū)間去估計(jì)總體的未知參數(shù),并要求該區(qū)間與參數(shù)關(guān)聯(lián)的概率達(dá)到一定程度的估計(jì)方法。該區(qū)間包含參數(shù)的概率稱(chēng)為置信水平,得到的帶有一定置信水平的區(qū)間,稱(chēng)為置信區(qū)間。四、區(qū)間估計(jì)若是一個(gè)待估計(jì)的參數(shù),是一個(gè)容量為的樣本,要求的區(qū)間估計(jì),就是設(shè)法找到兩個(gè)統(tǒng)計(jì)量,并且對(duì)任一組樣本觀察值都有,且若一個(gè)區(qū)間估計(jì)滿(mǎn)足上式,則稱(chēng)是的置信水平為的置信區(qū)間,稱(chēng)為置信下限,稱(chēng)為置信上限,稱(chēng)為置信水平,也稱(chēng)為置信度或可靠度。和為兩個(gè)不含未知參數(shù)的統(tǒng)計(jì)量,是隨機(jī)變量,其取值會(huì)隨樣本的變化而變化。48/12置信區(qū)間有兩個(gè)基本要素:即置信水平和精度。置信水平為,精度用置信區(qū)間的長(zhǎng)度來(lái)衡量。一般會(huì)希望兩者都高,即置信水平高,精度高(區(qū)間長(zhǎng)度短)。但這兩個(gè)要素之間是相互矛盾的,如果置信水平增加,區(qū)間長(zhǎng)度就會(huì)增加,精度下降;反之亦然。通常情況下,首先確定置信水平,再努力提高精度。

四、區(qū)間估計(jì)四、區(qū)間估計(jì)在正態(tài)分布情況下,若未知的點(diǎn)估計(jì)量為,抽樣極限誤差為,則置信區(qū)間表達(dá)式為:即四、區(qū)間估計(jì)(二)常用參數(shù)的區(qū)間估計(jì)經(jīng)濟(jì)社會(huì)實(shí)踐中,統(tǒng)計(jì)估計(jì)主要是圍繞著總體均值、總體比例和總體方差這三個(gè)參數(shù)進(jìn)行的。

1.總體均值的區(qū)間估計(jì)(1)當(dāng)總體為正態(tài)分布,方差已知時(shí)??傮w均值的估計(jì)量為:

對(duì)應(yīng)的抽樣平均誤差為:

四、區(qū)間估計(jì)其中,為樣本容量。由前面的公式,可得參數(shù)的置信水平為的置信區(qū)間為:

或簡(jiǎn)寫(xiě)為:抽樣極限誤差為:四、區(qū)間估計(jì)需要說(shuō)明的是,當(dāng)樣本來(lái)自的總體不是正態(tài)分布時(shí),若已知總體均值為,總體方差為,當(dāng)較大時(shí),。此時(shí),參數(shù)的置信水平為的置信區(qū)間為:它與正態(tài)總體參數(shù)的置信水平為的置信區(qū)間表達(dá)式相同。四、區(qū)間估計(jì)(2)總體為正態(tài)分布,方差未知??傮w方差未知,要用樣本方差來(lái)估計(jì)。此時(shí),參數(shù)的置信水平為的置信區(qū)間為:或簡(jiǎn)記為:抽樣極限誤差為:四、區(qū)間估計(jì)例4-5的置信區(qū)間求解也可以由SPSS完成,具體操作如下:(1)在SPSS菜單欄中選擇“分析”→“描述統(tǒng)計(jì)”→“探索”,打開(kāi)探索對(duì)話(huà)框。(2)將“月生活費(fèi)”選入“因變量”框中;(3)在探索對(duì)話(huà)框中點(diǎn)擊“統(tǒng)計(jì)量”按鈕,出現(xiàn)“統(tǒng)計(jì)量”對(duì)話(huà)框;四、區(qū)間估計(jì)(4)在統(tǒng)計(jì)量對(duì)話(huà)框中,勾選“描述性”框,并在“均值的置信區(qū)間”后的空格內(nèi)輸入置信水平“95%”;(5)單擊統(tǒng)計(jì)量對(duì)話(huà)框中的“繼續(xù)”按鈕;(6)單擊探索對(duì)話(huà)框“確定”按鈕,得到輸出結(jié)果如下表。月生活費(fèi)均值標(biāo)準(zhǔn)差置信下限置信下限統(tǒng)計(jì)量699.8500107.0623649.7433749.9567四、區(qū)間估計(jì)特別的,當(dāng)樣本容量較大()時(shí),分布趨近于標(biāo)準(zhǔn)正態(tài)分布,分位數(shù)可由分位數(shù)替代。此時(shí)參數(shù)的置信水平為的置信區(qū)間為:四、區(qū)間估計(jì)2.總體比例的區(qū)間估計(jì)比例是生活中經(jīng)常會(huì)遇到的一個(gè)量,如產(chǎn)品的不合格率、種子的發(fā)芽率等。當(dāng)樣本容量較大,即和都大于等于5時(shí),樣本比例的抽樣分布近似服從正態(tài)分布,可得總體比例的區(qū)間估計(jì)是:抽樣極限誤差為四、區(qū)間估計(jì)3.總體方差的區(qū)間估計(jì)設(shè)是來(lái)自正態(tài)總體的容量為的樣本,由于從而可得,總體方差的置信區(qū)間為:總體標(biāo)準(zhǔn)差的置信區(qū)間為:五、樣本容量的確定根據(jù)前面的論述,參數(shù)估計(jì)中的精度要求與置信水平要求常常是一對(duì)矛盾。以總體方差已知時(shí)總體均值的區(qū)間估計(jì)為例,此時(shí),極限誤差、臨界值與抽樣平均誤差三者間的數(shù)量關(guān)系為。從該式可以看出,當(dāng)抽樣平均誤差保持不變時(shí),極限誤差與臨界值兩者之間呈現(xiàn)同一方向的變化。因此,要提高精度,需以犧牲置信水平為代價(jià);要提高置信水平,又要以犧牲估計(jì)精度為代價(jià)。在不變的情況下,這對(duì)矛盾是不可調(diào)和的。五、樣本容量的確定樣本容量的確定問(wèn)題:通過(guò)增加樣本容量有可能降低樣本均值的平均誤差,從而可以實(shí)現(xiàn)既保證一定的估計(jì)精度,又具有較高的置信水平的目的。這時(shí),就需要考慮在給定的置信水平與極限誤差的前提下,樣本容量究竟取多大合適?從估計(jì)的準(zhǔn)確度方面看,宜從總體中多抽一些單位,但這會(huì)增加調(diào)查的費(fèi)用。因此,在抽樣實(shí)踐中需要根據(jù)精度、可靠度、調(diào)查費(fèi)用和不同抽樣方法等各方面因素去綜合地確定適當(dāng)?shù)臉颖救萘?。五、樣本容量的確定從理論上看,在簡(jiǎn)單隨機(jī)抽樣下,根據(jù)和,經(jīng)簡(jiǎn)單推導(dǎo),就可得樣本容量的計(jì)算式見(jiàn)下表確定樣本容量時(shí),總體方差或是未知的,可以利用以往的歷史資料來(lái)估計(jì),或者通過(guò)小規(guī)模試驗(yàn)資料來(lái)估計(jì)。此外,用上面的公式計(jì)算的結(jié)果如果帶小數(shù),結(jié)果應(yīng)當(dāng)取比這個(gè)數(shù)大的最小整數(shù)作為理論上的樣本容量。估計(jì)總體均值時(shí)估計(jì)總體比例時(shí)五、樣本容量的確定根據(jù)樣本容量的計(jì)算式,可以看出影響樣本容量的因素主要有:(1)總體變異程度。當(dāng)總體變異程度大時(shí),需要從總體中多抽一些樣本單位,否則可以少抽一些。(2)允許誤差的大小。如果要求抽樣估計(jì)的準(zhǔn)確度高,即極限誤差Δ(此時(shí),又常被稱(chēng)為允許誤差)小,就應(yīng)多抽一些總體單位,反之,可以少抽一些。五、樣本容量的確定(3)可靠度的高低。如果要求估計(jì)的可靠度高,則需要多抽一些單位,反之,可以少抽一些。(4)抽樣方式和方法。比如,在相同要求下,放回抽樣應(yīng)比不放回抽樣多抽一些單位等。64/12一、假設(shè)檢驗(yàn)的基本問(wèn)題參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷(一)什么是假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分內(nèi)容,前面敘述的是參數(shù)估計(jì)問(wèn)題,下面討論假設(shè)檢驗(yàn)的問(wèn)題?,F(xiàn)用一例來(lái)說(shuō)明:一、假設(shè)檢驗(yàn)的基本問(wèn)題到底是由什么原因造成?這就需要假設(shè)檢驗(yàn)的方法來(lái)判斷。假設(shè)檢驗(yàn):就是先對(duì)總體參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用樣本信息,以一定的概率來(lái)判斷假設(shè)是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,因此,假設(shè)檢驗(yàn)又被稱(chēng)為顯著性檢驗(yàn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題(二)假設(shè)檢驗(yàn)的步驟1.建立假設(shè)依據(jù)問(wèn)題建立原假設(shè)()和備擇假設(shè)()?;舅悸罚合葘⒋鉀Q的問(wèn)題轉(zhuǎn)化為如下的統(tǒng)計(jì)假設(shè):,這里,被稱(chēng)為原假設(shè)或零假設(shè),通常是設(shè)定總體參數(shù)等于某值,其內(nèi)在性質(zhì)為“否定”,本題原假設(shè)“”表示新工藝下產(chǎn)品質(zhì)量“無(wú)”改進(jìn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題

稱(chēng)為備擇假設(shè)或?qū)α⒓僭O(shè),是希望通過(guò)檢驗(yàn)證明成立的假設(shè),本題備擇假設(shè)“”表示新工藝下產(chǎn)品質(zhì)量有改進(jìn)。和相互對(duì)立,構(gòu)成對(duì)要解決問(wèn)題的完整表達(dá)。在檢驗(yàn)中,如果沒(méi)有充分的證據(jù)證明原假設(shè)是錯(cuò)誤的,就不能輕易推翻原假設(shè),因?yàn)樗鞘鼙Wo(hù)的假設(shè),即不拒絕原假設(shè)。在統(tǒng)計(jì)判斷上,適宜采用拒絕或不拒絕等語(yǔ)匯,一般不宜將“不拒絕”等同于“接受”。一、假設(shè)檢驗(yàn)的基本問(wèn)題2.選擇檢驗(yàn)統(tǒng)計(jì)量選取恰當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本資料計(jì)算出它的實(shí)際取值,據(jù)此判斷原假設(shè)是否能成立。例4-10的具體分析如下:在正常生產(chǎn)情況下,可以認(rèn)定燈泡的壽命屬于正態(tài)分布,資料表明其平均值為1500小時(shí),標(biāo)準(zhǔn)差為200小時(shí)。根據(jù)樣本與總體的關(guān)系,被抽出的燈泡平均壽命也應(yīng)服從正態(tài)分布,其平均值仍為小時(shí),但標(biāo)準(zhǔn)差(即抽樣一、假設(shè)檢驗(yàn)的基本問(wèn)題平均誤差)卻變?yōu)樾r(shí),也就是說(shuō),當(dāng)為真時(shí),服從標(biāo)準(zhǔn)正態(tài)分布。此時(shí),檢驗(yàn)統(tǒng)計(jì)量為:將樣本觀測(cè)值代入上式,得:一、假設(shè)檢驗(yàn)的基本問(wèn)題3.確定拒絕域給定顯著水平,稱(chēng)之為小概率值,它是概率密度曲線(xiàn)尾部的值,據(jù)此查表可得相應(yīng)的臨界值;由此臨界值所劃定的尾部,即拒絕原假設(shè)()的區(qū)間范圍,被稱(chēng)之為拒絕域。對(duì)本例而言,若給定,,,,則有于是,拒絕域?yàn)?,即。一、假設(shè)檢驗(yàn)的基本問(wèn)題4.判斷統(tǒng)計(jì)進(jìn)行判斷的依據(jù)是小概率原理,如果檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域,則拒絕原假設(shè),否則就保留原假設(shè)。由于,落入拒絕域,從而做出拒絕原假設(shè)的判斷,亦即新工藝顯著地提高了產(chǎn)品的質(zhì)量。上述四步是假設(shè)檢驗(yàn)的基本步驟。通過(guò)給定顯著水平,確定臨界值,給出拒絕域,如果檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值落入拒絕域,就拒絕原假設(shè);沒(méi)有落入拒絕域,就不拒絕原假設(shè)。這種判斷方法叫做臨界值法。一、假設(shè)檢驗(yàn)的基本問(wèn)題P值法:P值,就是由樣本觀測(cè)值計(jì)算的拒絕原假設(shè)所犯的錯(cuò)誤的概率,它是對(duì)原假設(shè)可信程度的一個(gè)度量。P值越大,原假設(shè)可信程度越高;P值越小,原假設(shè)可信程度越低。當(dāng)P值時(shí),不拒絕原假設(shè);當(dāng)P值時(shí),拒絕原假設(shè)。P值法和臨界值法的比較:一、假設(shè)檢驗(yàn)的基本問(wèn)題本例中,被抽出的100只燈泡的平均壽命小時(shí),可以計(jì)算一下小時(shí)的概率,它為:P值為,拒絕原假設(shè),它與用臨界值法判斷的結(jié)果一致。一、假設(shè)檢驗(yàn)的基本問(wèn)題概率為0.0062的事件是個(gè)小概率事件。根據(jù)小概率原理:小時(shí)在一次實(shí)驗(yàn)或觀察中可以認(rèn)為基本上不會(huì)發(fā)生。然而,它“居然”發(fā)生了,這是“不合理”的。產(chǎn)生這種“不合理”性的根源在哪里呢?問(wèn)題在于前提原假設(shè)。所以,分析的結(jié)果是原假設(shè)不正確,應(yīng)拒絕原假設(shè),認(rèn)為備擇假設(shè)正確,故應(yīng)當(dāng)是工藝改進(jìn)的結(jié)果,是產(chǎn)品質(zhì)量改善的顯著表現(xiàn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題(三)假設(shè)檢驗(yàn)的三種基本形式為簡(jiǎn)化問(wèn)題起見(jiàn),下述討論均假定樣本來(lái)自正態(tài)總體且總體方差已知。1.左側(cè)檢驗(yàn)比如,假設(shè)某產(chǎn)品生產(chǎn)線(xiàn)正常時(shí),其產(chǎn)品壽命為,最近很多客戶(hù)反應(yīng)產(chǎn)品使用壽命下降,則需檢驗(yàn)如下假設(shè):,其拒絕域?yàn)?,如圖所示:一、假設(shè)檢驗(yàn)的基本問(wèn)題

左側(cè)檢驗(yàn):一、假設(shè)檢驗(yàn)的基本問(wèn)題2.右側(cè)檢驗(yàn)假設(shè)某廠生產(chǎn)的產(chǎn)品使用壽命為小時(shí),廠商宣稱(chēng)采用新工藝后,其產(chǎn)品的使用壽命超過(guò)了小時(shí),則需檢驗(yàn)如下假設(shè):,其拒絕域?yàn)橐?、假設(shè)檢驗(yàn)的基本問(wèn)題3.雙側(cè)檢驗(yàn)假設(shè)按照設(shè)計(jì)標(biāo)準(zhǔn),某廠機(jī)器正常生產(chǎn)時(shí),生產(chǎn)的軸承直徑均值為,若要研究該機(jī)器設(shè)備是否出現(xiàn)了問(wèn)題,此時(shí),生產(chǎn)的軸承直徑均值可能大于也可能小于,則需檢驗(yàn)如下假設(shè):其拒絕域?yàn)榛?,且,如圖所示:一、假設(shè)檢驗(yàn)的基本問(wèn)題

雙側(cè)檢驗(yàn):一、假設(shè)檢驗(yàn)的基本問(wèn)題(四)兩類(lèi)錯(cuò)誤第一類(lèi)型錯(cuò)誤:指原假設(shè)本來(lái)正確卻否定了它,犯這種錯(cuò)誤的概率就是事先確定的小概率水平值。這類(lèi)錯(cuò)誤被稱(chēng)之為“棄真”錯(cuò)誤或第一類(lèi)錯(cuò)誤,用式子表示:第二類(lèi)型錯(cuò)誤:指原假設(shè)本來(lái)不正確卻沒(méi)有拒絕它,犯這種錯(cuò)誤的概率用表示。這類(lèi)錯(cuò)誤稱(chēng)之為“取偽”錯(cuò)誤或第二類(lèi)錯(cuò)誤,用式子表示:一、假設(shè)檢驗(yàn)的基本問(wèn)題兩類(lèi)錯(cuò)誤可表示如下表:在樣本容量固定時(shí),犯兩類(lèi)錯(cuò)誤的概率是相互制約的。如果減小,會(huì)增大;若減小,就會(huì)增大,若要同時(shí)使得犯兩類(lèi)錯(cuò)誤的概率都很小,就必須有足夠大的樣本。通常采用這樣的原則:在控制第一類(lèi)錯(cuò)誤的概率不大于的條件下,使犯第二類(lèi)錯(cuò)誤的概率盡可能地小。做出的判斷事實(shí)為真為假拒絕棄真錯(cuò)誤()正確判斷不拒絕正確判斷取偽錯(cuò)誤()二、幾種常見(jiàn)的假設(shè)檢驗(yàn)(一)總體均值的假設(shè)檢

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論