第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件

上傳人：I*** IP屬地：貴州上傳時(shí)間：2023-07-26 格式：PPTX 頁(yè)數(shù)：90 大小：20MB 積分：25 舉報(bào) 版權(quán)申訴

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第2頁(yè)

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第3頁(yè)

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第4頁(yè)

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件_第5頁(yè)

已閱讀5頁(yè)，還剩85頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/12一、參數(shù)與統(tǒng)計(jì)量參數(shù)：用來(lái)描述總體特征的概括性數(shù)字度量，是研究者想要了解的總體的某種特征，也就是總體指標(biāo)。在實(shí)踐中，由于各種原因常常不能開(kāi)展全面調(diào)查，對(duì)參數(shù)的了解就必須依賴(lài)于統(tǒng)計(jì)推斷的方法。統(tǒng)計(jì)推斷：就是按照隨機(jī)原則從總體中抽取一部分單位進(jìn)行觀察，并依據(jù)所獲得的結(jié)果，對(duì)總體數(shù)量特征做出具有一定可靠程度的估計(jì)或判斷的統(tǒng)計(jì)認(rèn)識(shí)方法。一、參數(shù)與統(tǒng)計(jì)量在社會(huì)經(jīng)濟(jì)領(lǐng)域的抽樣調(diào)查中，一般將總體視作有限總體，將變量視作離散變量來(lái)處理。因此，常用的參數(shù)可定義如下：1.總體均值：設(shè)總體單位數(shù)為N，所研究的總體單位的特征記為變量，變量值分別為，則總體均值的定義式為：

一、參數(shù)與統(tǒng)計(jì)量2.總體方差總體方差的定義式為：

3.總體比例：在社會(huì)經(jīng)濟(jì)活動(dòng)中，常常存在這樣的總體，根據(jù)所有單位是否具有某種特征將其分成兩組。如人口總體按性別分為“男性”和“女性”兩組。一、參數(shù)與統(tǒng)計(jì)量若記總體個(gè)單位中，具有某特征的組的單位數(shù)為，不具有該特征的組的單位數(shù)為，且，令，，

，則總體均值和總體方差的定義式分別為：

此時(shí)，總體均值就變?yōu)榭傮w比例。一、參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)量：用來(lái)描述樣本特征的概括性數(shù)字度量，它是樣本的函數(shù)，不含有任何未知的總體參數(shù)。樣本統(tǒng)計(jì)量是隨機(jī)變量。常用的統(tǒng)計(jì)量有：1.樣本均值：設(shè)抽取的樣本單位數(shù)為，樣本變量為，其觀察值分別為，則樣本均值定義式為：

一、參數(shù)與統(tǒng)計(jì)量2.樣本方差樣本方差的定義式為：

3.樣本比例：如總體對(duì)應(yīng)，若記樣本個(gè)單位中，具有某特征的組的單位數(shù)為，不具有該特征的組的單位數(shù)為，且，令，，則樣本均值和樣本方差一、參數(shù)與統(tǒng)計(jì)量定義式分別為：（當(dāng)較大時(shí)）樣本均值就是樣本比例。一、參數(shù)與統(tǒng)計(jì)量主要的總體參數(shù)和樣本統(tǒng)計(jì)量及其代表符號(hào)見(jiàn)下表：二、常用的概率分布在統(tǒng)計(jì)推斷中，常用的幾個(gè)重要分布就是正態(tài)分布、分布、分布和分布。1.正態(tài)分布如果連續(xù)隨機(jī)變量的密度函數(shù)為：則稱(chēng)隨機(jī)變量服從均值為、方差為的正態(tài)分布，記為。

二、常用的概率分布正態(tài)分布的密度函數(shù)圖形是以均值為中心的對(duì)稱(chēng)鐘形曲線(xiàn)。

和

分別決定著曲線(xiàn)在橫軸上的位置以及曲線(xiàn)的胖瘦形狀。二、常用的概率分布若隨機(jī)變量的均值、方差，則稱(chēng)其為標(biāo)準(zhǔn)正態(tài)隨機(jī)變量，它的分布為標(biāo)準(zhǔn)正態(tài)分布，記為，其概率密度函數(shù)及概率密度函數(shù)的圖形可表示為：二、常用的概率分布任何一個(gè)一般的正態(tài)分布都可以通過(guò)標(biāo)準(zhǔn)化轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。設(shè)，則

就是將一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布的轉(zhuǎn)換式。林德貝格–費(fèi)勒中心極限定理：當(dāng)一個(gè)事件受到許多個(gè)隨機(jī)因素的共同影響，如果這些隨機(jī)因素是相互獨(dú)立的，并且，其中任何一個(gè)隨機(jī)因素的影響都很小，小到幾乎可以忽略不計(jì)時(shí)，這些隨機(jī)因素的總影響表現(xiàn)為正態(tài)分布形式。二、常用的概率分布2.

分布設(shè)隨機(jī)變量相互獨(dú)立，且，則隨機(jī)變量

服從自由度為的分布，記作，其中為正整數(shù)。二、常用的概率分布

分布的密度函數(shù)的圖形是非對(duì)稱(chēng)曲線(xiàn)，隨自由度的增大而逐漸趨于對(duì)稱(chēng)。不同自由度的分布圖如下：二、常用的概率分布3.

分布設(shè)隨機(jī)變量相互獨(dú)立，且，則隨機(jī)變量

服從自由度為的分布（學(xué)生氏分布），記作。

二、常用的概率分布

分布的密度函數(shù)的圖形是對(duì)稱(chēng)曲線(xiàn)，隨自由度的增大，分布逐漸趨近于標(biāo)準(zhǔn)正態(tài)分布。

不同自由度的分布圖如下：

二、常用的概率分布4.

分布設(shè)隨機(jī)變量相互獨(dú)立，且，則隨機(jī)變量

服從自由度為和的分布，記作。

二、常用的概率分布二、常用的概率分布分布的密度函數(shù)的圖形是非對(duì)稱(chēng)曲線(xiàn)，其形狀取決于兩個(gè)自由度的大小。不同自由度的分布圖如下：

三、抽樣分布抽樣分布就是統(tǒng)計(jì)量的概率分布，具體地說(shuō)，就是從總體中抽取樣本時(shí)，由所有可能的樣本計(jì)算出的統(tǒng)計(jì)量的值所形成的分布。參數(shù)雖然未知，但是它是確定的。與參數(shù)的特點(diǎn)不同，由于樣本選取的隨機(jī)性，統(tǒng)計(jì)量不是唯一確定的數(shù)，是隨機(jī)變量，自然它就可能有一定的概率分布。三、抽樣分布1.樣本均值的分布設(shè)是來(lái)自某個(gè)總體的一個(gè)容量為的簡(jiǎn)單隨機(jī)樣本，為樣本均值。（1）若總體分布為，則的精確分布為，記為三、抽樣分布（2）若總體分布未知或不是正態(tài)分布，但已知總體均值為，總體方差為，則當(dāng)樣本容量較大時(shí)，的漸近分布為，記為

三、抽樣分布2.樣本比例的分布若記總體個(gè)單位中，具有某特征的單位數(shù)為，；樣本的n個(gè)單位中具有某種特征的單位數(shù)為

，。當(dāng)樣本容量較大，和都大于5時(shí)，的漸近分布為，記為三、抽樣分布3.樣本方差的抽樣分布設(shè)是來(lái)自正態(tài)總體的一個(gè)容量為的簡(jiǎn)單隨機(jī)樣本，和分別為樣本均值與樣本方差，則25/12一、點(diǎn)估計(jì)抽樣估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。點(diǎn)估計(jì)：就是將樣本統(tǒng)計(jì)量的具體取值作為未知的總體參數(shù)的估計(jì)值。比如，用樣本均值作為總體均值的估計(jì)值，記作；用樣本比例作為總體比例的估計(jì)值，記作；用樣本方差作為總體方差的估計(jì)值，記作。二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)作為總體參數(shù)估計(jì)量的統(tǒng)計(jì)量可能不止一種，比方說(shuō)對(duì)人口總體平均身高的估計(jì)，可以用樣本中人群身高的算術(shù)平均數(shù)作為它的點(diǎn)估計(jì)。到底用哪一種作為估計(jì)量更為合適呢？這就產(chǎn)生了估計(jì)量?jī)?yōu)良與否的判斷問(wèn)題。從理論上講，一個(gè)優(yōu)良的估計(jì)量要求滿(mǎn)足如下幾個(gè)要求：二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)1.無(wú)偏性如果誤差從平均的意義上講等于零，或者說(shuō)樣本所有可能取值的平均值等于總體參數(shù)，就稱(chēng)這種估計(jì)為無(wú)偏估計(jì)。容易證明，樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的無(wú)偏估計(jì)量，用式子表示就為：二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)2.有效性在所有無(wú)偏估計(jì)量中，估計(jì)誤差最小的統(tǒng)計(jì)量稱(chēng)為有效估計(jì)量。容易證明，樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的有效估計(jì)量。二、點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)3.一致性用樣本估計(jì)總體，如果隨著樣本容量的不斷增大，點(diǎn)估計(jì)量的值越來(lái)越接近于被估的總體參數(shù)，能滿(mǎn)足這一要求的估計(jì)就稱(chēng)為一致估計(jì)。容易證明，樣本均值、樣本比例和樣本方差分別是總體均值、總體比例和總體方差的一致估計(jì)量。三、抽樣誤差（一）抽樣誤差的概念凡是抽樣估計(jì)就會(huì)有誤差，誤差或大或小，不可能完全避免。在抽樣調(diào)查中，誤差可分成抽樣誤差和非抽樣誤差兩種。1、抽樣誤差：是指由于抽樣的隨機(jī)性而造成的總體參數(shù)（如、和等）和其估計(jì)量（如統(tǒng)計(jì)量、和等）之間的離差。抽樣誤差是抽樣調(diào)查所獨(dú)有的。三、抽樣誤差2.非抽樣誤差：是指除抽樣誤差之外，由于其它多種原因引起的總體特征的估計(jì)值與總體特征的真實(shí)值之間的差異。如目標(biāo)總體與抽樣總體不一致所帶來(lái)的抽樣框誤差，調(diào)查時(shí)的無(wú)回答誤差，抽樣和估計(jì)過(guò)程中產(chǎn)生的抄錄、計(jì)算等計(jì)量性誤差，等等。在進(jìn)行理論分析時(shí)，一般假定非抽樣誤差是不存在的。三、抽樣誤差（二）影響抽樣誤差的因素1.總體變異的程度?？傮w變異程度越大，抽樣誤差也越大；反之，總體變異程度越小，抽樣誤差也越小。2.樣本容量的大小。抽樣單位數(shù)越多，抽樣誤差會(huì)越??；反之，抽樣單位數(shù)越少，抽樣誤差會(huì)越大。顯然，當(dāng)總體的全部單位均被抽出時(shí)，抽樣誤差就等于零。3.抽樣方式和方法。不同的抽樣方法，其抽樣誤差的大小也不一樣。比如，在相同的條件下，放回抽樣的抽樣誤差要大于不放回抽樣的抽樣誤差。三、抽樣誤差（三）抽樣平均誤差1.抽樣平均誤差的定義抽樣平均誤差一般用平方根形式來(lái)表示，樣本均值和樣本比例的抽樣平均誤差的定義分別為：三、抽樣誤差由于、分別是和的無(wú)偏估計(jì)量，從而，上述式子又可變化為：這說(shuō)明，抽樣平均誤差實(shí)際上就是統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。三、抽樣誤差樣本序號(hào)樣本()樣本均值1(2,2)2169/162(2,4)381/163(2,7)9/29/164(2,8)51/165(4,2)381/166(4,4)425/167(4,7)11/21/168(4,8)69/169(7,2)9/29/1610(7,4)11/21/1611(7,7)749/1612(7,8)15/281/1613(8,2)51/1614(8,4)69/1615(8,7)15/281/1616(8,8)8121/16合計(jì)—8491/2三、抽樣誤差由表中資料可得：樣本均值樣本均值的均值均值的抽樣平均誤差三、抽樣誤差（2）如果采用不放回簡(jiǎn)單隨機(jī)抽樣，則可能的樣本數(shù)目及相應(yīng)的樣本均值的計(jì)算如下表樣本序號(hào)樣本()樣本均值1(2,4)381/162(2,7)9/29/163(2,8)51/164(4,7)11/21/165(4,8)69/166(7,8)15/281/16合計(jì)—63/291/8三、抽樣誤差由此可得：樣本均值的均值均值的抽樣平均誤差三、抽樣誤差2．抽樣平均誤差的數(shù)理推導(dǎo)式（1）放回簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差的計(jì)算式為：（2）不放回簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差的計(jì)算式為：不放回簡(jiǎn)單隨機(jī)抽樣，均值的抽樣平均誤差為：它們與前面按定義式計(jì)算的結(jié)果相同。注：從上述例子還可以看出，在相同條件下，放回抽樣的抽樣平均誤差大于不放回抽樣的平均誤差。三、抽樣誤差3.放回抽樣與不放回抽樣的平均誤差計(jì)算式的比較在簡(jiǎn)單隨機(jī)抽樣中，抽樣平均誤差或的計(jì)算公式可概括為下表三、抽樣誤差

估計(jì)總體均值μ時(shí)估計(jì)總體比例π時(shí)放回抽樣不放回抽樣由此可見(jiàn)：（1）在簡(jiǎn)單隨機(jī)抽樣的平均誤差計(jì)算式中，不放回抽樣比放回抽樣多了一個(gè)系數(shù)，它被稱(chēng)為有限總體不放回抽樣的修正系數(shù)。（2）由于，這說(shuō)明不放回抽樣的平均誤差小于放回抽樣的平均誤差。（3）可約等于，稱(chēng)為抽樣比。一般地，時(shí)，修正系數(shù)可以忽略不計(jì)。三、抽樣誤差（四）抽樣極限誤差抽樣極限誤差是指估計(jì)值同總體真值之間誤差的可能范圍，是抽樣估計(jì)所允許的誤差的上下界限。若未知的點(diǎn)估計(jì)量為，抽樣極限誤差為，則均值的極限誤差為：三、抽樣誤差比例的極限誤差為：極限誤差和平均誤差的關(guān)系為（以統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布為例）：上式中，稱(chēng)為臨界值，它是標(biāo)準(zhǔn)正態(tài)分布概率密度曲線(xiàn)下右側(cè)面積為時(shí)的值，可由標(biāo)準(zhǔn)正態(tài)分布表查得，為估計(jì)量的平均誤差。三、抽樣誤差三、抽樣誤差臨界值示意圖四、區(qū)間估計(jì)（一）區(qū)間估計(jì)的定義點(diǎn)估計(jì)：點(diǎn)估計(jì)能對(duì)未知的總體參數(shù)給出一個(gè)明確的數(shù)量。但是點(diǎn)估計(jì)僅僅是未知參數(shù)的一個(gè)近似值，不能反映這個(gè)近似值的誤差范圍。區(qū)間估計(jì)：是用一個(gè)區(qū)間去估計(jì)總體的未知參數(shù)，并要求該區(qū)間與參數(shù)關(guān)聯(lián)的概率達(dá)到一定程度的估計(jì)方法。該區(qū)間包含參數(shù)的概率稱(chēng)為置信水平，得到的帶有一定置信水平的區(qū)間，稱(chēng)為置信區(qū)間。四、區(qū)間估計(jì)若是一個(gè)待估計(jì)的參數(shù)，是一個(gè)容量為的樣本，要求的區(qū)間估計(jì)，就是設(shè)法找到兩個(gè)統(tǒng)計(jì)量，并且對(duì)任一組樣本觀察值都有，且若一個(gè)區(qū)間估計(jì)滿(mǎn)足上式，則稱(chēng)是的置信水平為的置信區(qū)間，稱(chēng)為置信下限，稱(chēng)為置信上限，稱(chēng)為置信水平，也稱(chēng)為置信度或可靠度。和為兩個(gè)不含未知參數(shù)的統(tǒng)計(jì)量，是隨機(jī)變量，其取值會(huì)隨樣本的變化而變化。48/12置信區(qū)間有兩個(gè)基本要素：即置信水平和精度。置信水平為，精度用置信區(qū)間的長(zhǎng)度來(lái)衡量。一般會(huì)希望兩者都高，即置信水平高，精度高（區(qū)間長(zhǎng)度短）。但這兩個(gè)要素之間是相互矛盾的，如果置信水平增加，區(qū)間長(zhǎng)度就會(huì)增加，精度下降；反之亦然。通常情況下，首先確定置信水平，再努力提高精度。

四、區(qū)間估計(jì)四、區(qū)間估計(jì)在正態(tài)分布情況下，若未知的點(diǎn)估計(jì)量為，抽樣極限誤差為，則置信區(qū)間表達(dá)式為：即四、區(qū)間估計(jì)（二）常用參數(shù)的區(qū)間估計(jì)經(jīng)濟(jì)社會(huì)實(shí)踐中，統(tǒng)計(jì)估計(jì)主要是圍繞著總體均值、總體比例和總體方差這三個(gè)參數(shù)進(jìn)行的。

1.總體均值的區(qū)間估計(jì)（1）當(dāng)總體為正態(tài)分布，方差已知時(shí)?？傮w均值的估計(jì)量為：

對(duì)應(yīng)的抽樣平均誤差為：

四、區(qū)間估計(jì)其中，為樣本容量。由前面的公式，可得參數(shù)的置信水平為的置信區(qū)間為：

或簡(jiǎn)寫(xiě)為：抽樣極限誤差為：四、區(qū)間估計(jì)需要說(shuō)明的是，當(dāng)樣本來(lái)自的總體不是正態(tài)分布時(shí)，若已知總體均值為，總體方差為，當(dāng)較大時(shí)，。此時(shí)，參數(shù)的置信水平為的置信區(qū)間為：它與正態(tài)總體參數(shù)的置信水平為的置信區(qū)間表達(dá)式相同。四、區(qū)間估計(jì)（2）總體為正態(tài)分布，方差未知?？傮w方差未知，要用樣本方差來(lái)估計(jì)。此時(shí)，參數(shù)的置信水平為的置信區(qū)間為：或簡(jiǎn)記為：抽樣極限誤差為：四、區(qū)間估計(jì)例4-5的置信區(qū)間求解也可以由SPSS完成，具體操作如下：（1）在SPSS菜單欄中選擇“分析”→“描述統(tǒng)計(jì)”→“探索”，打開(kāi)探索對(duì)話(huà)框。（2）將“月生活費(fèi)”選入“因變量”框中；（3）在探索對(duì)話(huà)框中點(diǎn)擊“統(tǒng)計(jì)量”按鈕，出現(xiàn)“統(tǒng)計(jì)量”對(duì)話(huà)框；四、區(qū)間估計(jì)（4）在統(tǒng)計(jì)量對(duì)話(huà)框中，勾選“描述性”框，并在“均值的置信區(qū)間”后的空格內(nèi)輸入置信水平“95%”；（5）單擊統(tǒng)計(jì)量對(duì)話(huà)框中的“繼續(xù)”按鈕；（6）單擊探索對(duì)話(huà)框“確定”按鈕，得到輸出結(jié)果如下表。月生活費(fèi)均值標(biāo)準(zhǔn)差置信下限置信下限統(tǒng)計(jì)量699.8500107.0623649.7433749.9567四、區(qū)間估計(jì)特別的，當(dāng)樣本容量較大（）時(shí)，分布趨近于標(biāo)準(zhǔn)正態(tài)分布，分位數(shù)可由分位數(shù)替代。此時(shí)參數(shù)的置信水平為的置信區(qū)間為：四、區(qū)間估計(jì)2.總體比例的區(qū)間估計(jì)比例是生活中經(jīng)常會(huì)遇到的一個(gè)量，如產(chǎn)品的不合格率、種子的發(fā)芽率等。當(dāng)樣本容量較大，即和都大于等于5時(shí)，樣本比例的抽樣分布近似服從正態(tài)分布，可得總體比例的區(qū)間估計(jì)是：抽樣極限誤差為四、區(qū)間估計(jì)3.總體方差的區(qū)間估計(jì)設(shè)是來(lái)自正態(tài)總體的容量為的樣本，由于從而可得，總體方差的置信區(qū)間為：總體標(biāo)準(zhǔn)差的置信區(qū)間為：五、樣本容量的確定根據(jù)前面的論述，參數(shù)估計(jì)中的精度要求與置信水平要求常常是一對(duì)矛盾。以總體方差已知時(shí)總體均值的區(qū)間估計(jì)為例，此時(shí)，極限誤差、臨界值與抽樣平均誤差三者間的數(shù)量關(guān)系為。從該式可以看出，當(dāng)抽樣平均誤差保持不變時(shí)，極限誤差與臨界值兩者之間呈現(xiàn)同一方向的變化。因此，要提高精度，需以犧牲置信水平為代價(jià)；要提高置信水平，又要以犧牲估計(jì)精度為代價(jià)。在不變的情況下，這對(duì)矛盾是不可調(diào)和的。五、樣本容量的確定樣本容量的確定問(wèn)題：通過(guò)增加樣本容量有可能降低樣本均值的平均誤差，從而可以實(shí)現(xiàn)既保證一定的估計(jì)精度，又具有較高的置信水平的目的。這時(shí)，就需要考慮在給定的置信水平與極限誤差的前提下，樣本容量究竟取多大合適？從估計(jì)的準(zhǔn)確度方面看，宜從總體中多抽一些單位，但這會(huì)增加調(diào)查的費(fèi)用。因此，在抽樣實(shí)踐中需要根據(jù)精度、可靠度、調(diào)查費(fèi)用和不同抽樣方法等各方面因素去綜合地確定適當(dāng)?shù)臉颖救萘?。五、樣本容量的確定從理論上看，在簡(jiǎn)單隨機(jī)抽樣下，根據(jù)和，經(jīng)簡(jiǎn)單推導(dǎo)，就可得樣本容量的計(jì)算式見(jiàn)下表確定樣本容量時(shí)，總體方差或是未知的，可以利用以往的歷史資料來(lái)估計(jì)，或者通過(guò)小規(guī)模試驗(yàn)資料來(lái)估計(jì)。此外，用上面的公式計(jì)算的結(jié)果如果帶小數(shù)，結(jié)果應(yīng)當(dāng)取比這個(gè)數(shù)大的最小整數(shù)作為理論上的樣本容量。估計(jì)總體均值時(shí)估計(jì)總體比例時(shí)五、樣本容量的確定根據(jù)樣本容量的計(jì)算式，可以看出影響樣本容量的因素主要有：（1）總體變異程度。當(dāng)總體變異程度大時(shí)，需要從總體中多抽一些樣本單位，否則可以少抽一些。（2）允許誤差的大小。如果要求抽樣估計(jì)的準(zhǔn)確度高，即極限誤差Δ（此時(shí)，又常被稱(chēng)為允許誤差）小，就應(yīng)多抽一些總體單位，反之，可以少抽一些。五、樣本容量的確定（3）可靠度的高低。如果要求估計(jì)的可靠度高，則需要多抽一些單位，反之，可以少抽一些。（4）抽樣方式和方法。比如，在相同要求下，放回抽樣應(yīng)比不放回抽樣多抽一些單位等。64/12一、假設(shè)檢驗(yàn)的基本問(wèn)題參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷（一）什么是假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分內(nèi)容，前面敘述的是參數(shù)估計(jì)問(wèn)題，下面討論假設(shè)檢驗(yàn)的問(wèn)題?，F(xiàn)用一例來(lái)說(shuō)明：一、假設(shè)檢驗(yàn)的基本問(wèn)題到底是由什么原因造成？這就需要假設(shè)檢驗(yàn)的方法來(lái)判斷。假設(shè)檢驗(yàn)：就是先對(duì)總體參數(shù)或總體分布形式做出一個(gè)假設(shè)，然后利用樣本信息，以一定的概率來(lái)判斷假設(shè)是否合理，即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異，因此，假設(shè)檢驗(yàn)又被稱(chēng)為顯著性檢驗(yàn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題（二）假設(shè)檢驗(yàn)的步驟1.建立假設(shè)依據(jù)問(wèn)題建立原假設(shè)（）和備擇假設(shè)（）?；舅悸罚合葘⒋鉀Q的問(wèn)題轉(zhuǎn)化為如下的統(tǒng)計(jì)假設(shè)：，這里，被稱(chēng)為原假設(shè)或零假設(shè)，通常是設(shè)定總體參數(shù)等于某值，其內(nèi)在性質(zhì)為“否定”，本題原假設(shè)“”表示新工藝下產(chǎn)品質(zhì)量“無(wú)”改進(jìn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題

稱(chēng)為備擇假設(shè)或?qū)α⒓僭O(shè)，是希望通過(guò)檢驗(yàn)證明成立的假設(shè)，本題備擇假設(shè)“”表示新工藝下產(chǎn)品質(zhì)量有改進(jìn)。和相互對(duì)立，構(gòu)成對(duì)要解決問(wèn)題的完整表達(dá)。在檢驗(yàn)中，如果沒(méi)有充分的證據(jù)證明原假設(shè)是錯(cuò)誤的，就不能輕易推翻原假設(shè)，因?yàn)樗鞘鼙Ｗo(hù)的假設(shè)，即不拒絕原假設(shè)。在統(tǒng)計(jì)判斷上，適宜采用拒絕或不拒絕等語(yǔ)匯，一般不宜將“不拒絕”等同于“接受”。一、假設(shè)檢驗(yàn)的基本問(wèn)題2.選擇檢驗(yàn)統(tǒng)計(jì)量選取恰當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，并根據(jù)樣本資料計(jì)算出它的實(shí)際取值，據(jù)此判斷原假設(shè)是否能成立。例4-10的具體分析如下：在正常生產(chǎn)情況下，可以認(rèn)定燈泡的壽命屬于正態(tài)分布，資料表明其平均值為1500小時(shí)，標(biāo)準(zhǔn)差為200小時(shí)。根據(jù)樣本與總體的關(guān)系，被抽出的燈泡平均壽命也應(yīng)服從正態(tài)分布，其平均值仍為小時(shí)，但標(biāo)準(zhǔn)差（即抽樣一、假設(shè)檢驗(yàn)的基本問(wèn)題平均誤差）卻變?yōu)樾r(shí)，也就是說(shuō)，當(dāng)為真時(shí)，服從標(biāo)準(zhǔn)正態(tài)分布。此時(shí)，檢驗(yàn)統(tǒng)計(jì)量為：將樣本觀測(cè)值代入上式，得：一、假設(shè)檢驗(yàn)的基本問(wèn)題3.確定拒絕域給定顯著水平，稱(chēng)之為小概率值，它是概率密度曲線(xiàn)尾部的值，據(jù)此查表可得相應(yīng)的臨界值；由此臨界值所劃定的尾部，即拒絕原假設(shè)（）的區(qū)間范圍，被稱(chēng)之為拒絕域。對(duì)本例而言，若給定，，，，則有于是，拒絕域?yàn)?，即。一、假設(shè)檢驗(yàn)的基本問(wèn)題4.判斷統(tǒng)計(jì)進(jìn)行判斷的依據(jù)是小概率原理，如果檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域，則拒絕原假設(shè)，否則就保留原假設(shè)。由于，落入拒絕域，從而做出拒絕原假設(shè)的判斷，亦即新工藝顯著地提高了產(chǎn)品的質(zhì)量。上述四步是假設(shè)檢驗(yàn)的基本步驟。通過(guò)給定顯著水平，確定臨界值，給出拒絕域，如果檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值落入拒絕域，就拒絕原假設(shè)；沒(méi)有落入拒絕域，就不拒絕原假設(shè)。這種判斷方法叫做臨界值法。一、假設(shè)檢驗(yàn)的基本問(wèn)題P值法：P值，就是由樣本觀測(cè)值計(jì)算的拒絕原假設(shè)所犯的錯(cuò)誤的概率，它是對(duì)原假設(shè)可信程度的一個(gè)度量。P值越大，原假設(shè)可信程度越高；P值越小，原假設(shè)可信程度越低。當(dāng)P值時(shí)，不拒絕原假設(shè)；當(dāng)P值時(shí)，拒絕原假設(shè)。P值法和臨界值法的比較：一、假設(shè)檢驗(yàn)的基本問(wèn)題本例中，被抽出的100只燈泡的平均壽命小時(shí)，可以計(jì)算一下小時(shí)的概率，它為：P值為，拒絕原假設(shè)，它與用臨界值法判斷的結(jié)果一致。一、假設(shè)檢驗(yàn)的基本問(wèn)題概率為0.0062的事件是個(gè)小概率事件。根據(jù)小概率原理：小時(shí)在一次實(shí)驗(yàn)或觀察中可以認(rèn)為基本上不會(huì)發(fā)生。然而，它“居然”發(fā)生了，這是“不合理”的。產(chǎn)生這種“不合理”性的根源在哪里呢？問(wèn)題在于前提原假設(shè)。所以，分析的結(jié)果是原假設(shè)不正確，應(yīng)拒絕原假設(shè)，認(rèn)為備擇假設(shè)正確，故應(yīng)當(dāng)是工藝改進(jìn)的結(jié)果，是產(chǎn)品質(zhì)量改善的顯著表現(xiàn)。一、假設(shè)檢驗(yàn)的基本問(wèn)題（三）假設(shè)檢驗(yàn)的三種基本形式為簡(jiǎn)化問(wèn)題起見(jiàn)，下述討論均假定樣本來(lái)自正態(tài)總體且總體方差已知。1.左側(cè)檢驗(yàn)比如，假設(shè)某產(chǎn)品生產(chǎn)線(xiàn)正常時(shí)，其產(chǎn)品壽命為，最近很多客戶(hù)反應(yīng)產(chǎn)品使用壽命下降，則需檢驗(yàn)如下假設(shè)：，其拒絕域?yàn)?，如圖所示：一、假設(shè)檢驗(yàn)的基本問(wèn)題

左側(cè)檢驗(yàn)：一、假設(shè)檢驗(yàn)的基本問(wèn)題2.右側(cè)檢驗(yàn)假設(shè)某廠生產(chǎn)的產(chǎn)品使用壽命為小時(shí)，廠商宣稱(chēng)采用新工藝后，其產(chǎn)品的使用壽命超過(guò)了小時(shí)，則需檢驗(yàn)如下假設(shè)：，其拒絕域?yàn)橐?、假設(shè)檢驗(yàn)的基本問(wèn)題3.雙側(cè)檢驗(yàn)假設(shè)按照設(shè)計(jì)標(biāo)準(zhǔn)，某廠機(jī)器正常生產(chǎn)時(shí)，生產(chǎn)的軸承直徑均值為，若要研究該機(jī)器設(shè)備是否出現(xiàn)了問(wèn)題，此時(shí)，生產(chǎn)的軸承直徑均值可能大于也可能小于，則需檢驗(yàn)如下假設(shè)：其拒絕域?yàn)榛?，且，如圖所示：一、假設(shè)檢驗(yàn)的基本問(wèn)題

雙側(cè)檢驗(yàn)：一、假設(shè)檢驗(yàn)的基本問(wèn)題（四）兩類(lèi)錯(cuò)誤第一類(lèi)型錯(cuò)誤：指原假設(shè)本來(lái)正確卻否定了它，犯這種錯(cuò)誤的概率就是事先確定的小概率水平值。這類(lèi)錯(cuò)誤被稱(chēng)之為“棄真”錯(cuò)誤或第一類(lèi)錯(cuò)誤，用式子表示：第二類(lèi)型錯(cuò)誤：指原假設(shè)本來(lái)不正確卻沒(méi)有拒絕它，犯這種錯(cuò)誤的概率用表示。這類(lèi)錯(cuò)誤稱(chēng)之為“取偽”錯(cuò)誤或第二類(lèi)錯(cuò)誤，用式子表示：一、假設(shè)檢驗(yàn)的基本問(wèn)題兩類(lèi)錯(cuò)誤可表示如下表：在樣本容量固定時(shí)，犯兩類(lèi)錯(cuò)誤的概率是相互制約的。如果減小，會(huì)增大；若減小，就會(huì)增大，若要同時(shí)使得犯兩類(lèi)錯(cuò)誤的概率都很小，就必須有足夠大的樣本。通常采用這樣的原則：在控制第一類(lèi)錯(cuò)誤的概率不大于的條件下，使犯第二類(lèi)錯(cuò)誤的概率盡可能地小。做出的判斷事實(shí)為真為假拒絕棄真錯(cuò)誤（）正確判斷不拒絕正確判斷取偽錯(cuò)誤（）二、幾種常見(jiàn)的假設(shè)檢驗(yàn)（一）總體均值的假設(shè)檢

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第04章-統(tǒng)計(jì)推斷《統(tǒng)計(jì)學(xué)》課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔