




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對產(chǎn)量質(zhì)量進(jìn)行檢測,企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗,并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機抽取了25袋,下表1是對每袋食品重量的檢驗結(jié)果。實踐中的統(tǒng)計第六章總體參數(shù)估計一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主1
根據(jù)表1的數(shù)據(jù),質(zhì)檢科估計出該天生產(chǎn)的食品每袋的平均重量在101.38~109.34克之間,其中,估計的可信程度為95%,估計誤差不超過4克。產(chǎn)品的合格率在96.07%~73.93%之間,其中,估計的可信程度為95%,估計誤差不超過16%。表125袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.010808101.6108.498.4100.5115.6102.2105.093.3第六章總體參數(shù)估計表125袋食品的重量(克)112.5101.0102
質(zhì)檢報告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點意見:一是抽取的樣本大小是否合適?能不能用一個更大的樣本進(jìn)行估計?二是能否將估計的誤差再縮小一點?比如,估計平均重量時,估計誤差不超過3克,估計合格率時誤差不超過10%;三是總體平均重量的方差是多少?因為方差的大小說明了生產(chǎn)過程的穩(wěn)定性,過大或過小的方差都意味著應(yīng)對生產(chǎn)過程進(jìn)行調(diào)整。第六章總體參數(shù)估計質(zhì)檢報告提交后,企業(yè)高層領(lǐng)導(dǎo)3第六章總體參數(shù)估計本章重點1、參數(shù)估計的基本問題;2、單個總體均值和比率的區(qū)間估計;3、小樣本下的總體參數(shù)估計方法;4、樣本容量的確定方法;5、兩個總體均值和比率差異的區(qū)間估計;6、分層、整群和等距抽樣的區(qū)間估計。本章難點1、一般正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布;2、區(qū)間估計的原理;3、兩總體聯(lián)合方差的表達(dá)形式。。第六章總體參數(shù)估計本章重點4第一節(jié)參數(shù)估計的基本問題一、點估計點估計就是用樣本估計量的一個具體觀測值直接作為總體的未知參數(shù)的估計值的方法。如上例中隨機抽取的100頭的平均每頭毛重(95.5kg)可作為10000頭平均每頭毛重的點估計值常用的估計量有:(1)樣本平均數(shù)為總體平均數(shù)的估計量;(2)樣本方差為總體方差的估計量;(3)樣本成數(shù)為總體成數(shù)P
估計量。第一節(jié)參數(shù)估計的基本問題一、點估計5二、點估計的性質(zhì)在對總體特征做出估計時,并非所有估計量都是優(yōu)良的,從而產(chǎn)生了評價估計量是否優(yōu)良的標(biāo)準(zhǔn)。作為優(yōu)良的估計量應(yīng)該符合如下三個標(biāo)準(zhǔn):第六章總體參數(shù)估計二、點估計的性質(zhì)第六章總體參數(shù)估計61、無偏性如果樣本某統(tǒng)計量的數(shù)學(xué)期望值等于其所估計的總體參數(shù)真值,則這個估計統(tǒng)計量就叫做該總體參數(shù)的無偏估計量。如樣本平均數(shù)的數(shù)學(xué)期望是總體平均數(shù),則樣本均值是總體均值的無偏估計量。這里無偏估計量是指沒有系統(tǒng)偏差(非隨機偏差)的平均意義上的量,即如果說一個估計量是無偏性的,并不是保證用于單獨一次估計中沒有隨機性誤差,只是沒有系統(tǒng)性偏差而已。這是一個優(yōu)良估計量的重要條件。若以代表被估計的總體參數(shù),代表的無偏估計量則有:第六章總體參數(shù)估計1、無偏性第六章總體參數(shù)估計72、一致性若估計量隨樣本容量n的增大而越來越接近總體參數(shù)值時,則稱該估計量為被估計參數(shù)的一致性估計量。估計量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個估計量是一致性估計量,那么采用大樣本就更加可靠。當(dāng)然,樣本容量n增大時,估計量的一致性會增強,但調(diào)查所需的人、財、物力也相應(yīng)增加。例如,以樣本平均數(shù)估計總體平均數(shù),符合一致性的要求,即存在如下關(guān)系:式中為任意正數(shù)。第六章總體參數(shù)估計2、一致性第六章總體參數(shù)估計83、有效性有效性是指無偏估計量中方差最小的估計量。無偏估計量只考慮估計值的平均結(jié)果是否等于待估計參數(shù)的真值,而不考慮估計的每個可能值及其次數(shù)分布與待估計參數(shù)真值之間離差大小的離散程度。我們在解決實際問題時,不僅希望估計值是無偏的,更希望這些估計值的離差盡可能地小,即要求比較各無偏估計量中與被估計參數(shù)的離差較小的為有效估計量。如樣本平均數(shù)與中位數(shù)都是總體均值的無偏估計量,但在同樣的樣本容量下,樣本平均數(shù)是有效的估計量。第六章總體參數(shù)估計3、有效性第六章總體參數(shù)估計9點估計的缺點:不能反映估計的誤差和精確程度
因為點估計是基于樣本得到的,是隨機變量,不可能期望它的值與相應(yīng)的總體參數(shù)的真實值相等,也就是說點估計值和總體參數(shù)的真是值之間總會存在一定誤差,并且我們是不知道這個誤差有多大,這樣我們估計的可信度大打折扣。在這一節(jié)中,我們將說明如何利用點估計值對單個總體均值和總體比率進(jìn)行區(qū)間估計,并給出估計的可靠程度和準(zhǔn)確程度。區(qū)間估計:利用樣本統(tǒng)計量和抽樣分布估計總體參數(shù)的可能區(qū)間第六章總體參數(shù)估計點估計的缺點:不能反映估計的誤差和精確程度第六章總體參數(shù)10第二節(jié)單個總體均值和比率的區(qū)間估計一、總體均值的區(qū)間估計:大樣本(n≥30)情形和小樣本(n<30)情形。第二節(jié)單個總體均值和比率的區(qū)間估計一、總體均值的區(qū)間估計:11大樣本的情形【例1】Duotu公司是一家專營體育設(shè)備和附件的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,Duotu公司每月都要隨即的抽取一個顧客樣本進(jìn)行調(diào)查以了解顧客的滿意分?jǐn)?shù)。根據(jù)以往的調(diào)查,滿意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對100名顧客的抽樣顯示,滿意分?jǐn)?shù)的樣本均值為82分,試建立總體滿意分?jǐn)?shù)的區(qū)間。
我們可以將樣本滿意得分的均值(82分)作為該公司所有顧客組成的總體的平均滿意得分的點估計。當(dāng)然你也許會問:“這一估計有多好?這次估計的把握程度有多高?”"有多好"這一問題其實是想知道以樣本均值作為總體均值的點估計時所產(chǎn)生的誤差有多大。大樣本的情形【例1】Duotu公司是一家專營體育設(shè)備和附件的12我們把無偏點估計值與總體參數(shù)之差的絕對值稱為抽樣誤差。當(dāng)我們用樣本均值估計總體均值時,抽樣誤差可以表達(dá)為:如果我們可以利用式6-1將抽樣誤差計算出來,那么就可以將式6-1變形為:
(6-1)
(6-2)
我們把無偏點估計值與總體參數(shù)之差的絕對值稱為抽樣誤差。當(dāng)我們13要進(jìn)行區(qū)間估計,關(guān)鍵是將抽樣誤差E求解。若E已知,則區(qū)間可表示為:此時,可以利用樣本均值的抽樣分布對抽樣誤差的大小進(jìn)行描述。上例中,已知,樣本容量n=100,總體標(biāo)準(zhǔn)差,根據(jù)中心極限定理可知,此時樣本均值服從均值為,標(biāo)準(zhǔn)差為的正態(tài)分布。即:要進(jìn)行區(qū)間估計,關(guān)鍵是將抽樣誤差E求解。若E已知,14抽樣誤差的概率表述我們可以確定樣本均值在總體均值82的周圍波動,波動的幅度即為抽樣誤差。根據(jù)抽樣分布的知識,這個波動幅度即抽樣誤差??梢愿鶕?jù)事先給定的概率加以計算[],為了方便運算,通常我們先將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。由概率論,若,服從標(biāo)準(zhǔn)正態(tài)分布,記為。由標(biāo)準(zhǔn)正態(tài)分布,有以下式子成立
(6-4)抽樣誤差的概率表述我們可以確定樣本均值在總體均值8215
一般稱,為置信度,可靠程度等,反映估計結(jié)果的可信程度。若事先給定一個置信度,則可根據(jù)標(biāo)準(zhǔn)正態(tài)分布找到其對應(yīng)的臨界值。進(jìn)而計算抽樣誤差總體均值的區(qū)間估計(同名257)課件16若,則查標(biāo)準(zhǔn)正態(tài)分布附表3可得,抽樣誤差此時抽樣誤差的意義可表述為:以樣本均值為中心的±3.92的區(qū)間包含總體均值的概率是95%,或者說,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。常用的置信度還有90%,95.45%,99.73%,他們對應(yīng)的臨界值分別為1.645,2和3,可以分別反映各自的估計區(qū)間所對應(yīng)的精確程度和把握程度。
若,17計算區(qū)間估計:在CJW公司的例子中,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。因此,可以構(gòu)建總體均值的區(qū)間為,由于,從一個總體中抽取到的樣本具有隨機性,在一次偶然的抽樣中,根據(jù)樣本均值計算所的區(qū)間并不總是可以包含總體均值,它是與一定的概率相聯(lián)系的。如下圖所示:計算區(qū)間估計:183.923.92圖1根據(jù)選擇的在、、位置的樣本均值建立的區(qū)間3.923.92圖1根據(jù)選擇的在、、19
上圖中,有95%的樣本均值落在陰影部分,這個區(qū)域的樣本均值±3.92的區(qū)間能夠包含總體均值。因此,總體均值的區(qū)間的含義為,我們有95%的把握認(rèn)為,以樣本均值為中心的±3.92的區(qū)間能夠包含總體均值。通常,稱該區(qū)間為置信區(qū)間,其對應(yīng)的置信水平為置信區(qū)間的估計包含兩個部分:點估計和描述估計精確度的正負(fù)值。也將正負(fù)值稱為誤差邊際或極限誤差,反映樣本估計量與總體參數(shù)之間的最大誤差范圍。總結(jié):上圖中,有95%的樣本均值落在陰影部分,這個20計算區(qū)間估計:在大多數(shù)的情況下,總體的標(biāo)準(zhǔn)差都是未知的。根據(jù)抽樣分布定理,在大樣本的情況下,可用樣本的標(biāo)準(zhǔn)差s作為總體標(biāo)準(zhǔn)差的點估計值,仍然采用上述區(qū)間估計的方法進(jìn)行總體參數(shù)的估計。計算區(qū)間估計:21【例2】某市交通部門為了對城市的環(huán)境進(jìn)行監(jiān)測,定期公布該市居民每天小汽車的里程數(shù),抽取36個居民作為一個簡單隨即樣本,得到資料如表6-2所示。試構(gòu)造該市民每天小汽車?yán)锍虜?shù)的總體均值的95%的置信區(qū)間。居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)123456789325040243344454844101112131415161718473136394645393845192021222324252627274354363448233642282930313233343536343934354253284939【例2】某市交通部門為了對城市的環(huán)境進(jìn)行監(jiān)測,定期公22分析:區(qū)間估計包括兩個部分——點估計和誤差邊際,只需分別求出即可到的總體的區(qū)間估計。解:已知(1)樣本的平均里程數(shù)(2)極限誤差(誤差邊際)分析:區(qū)間估計包括兩個部分——點估計和誤差邊際,只需分別求出23樣本標(biāo)準(zhǔn)差極限誤差(3)95%的置信區(qū)間為39.5±2.54即(36.96,42.04)公里。
注意(1)置信系數(shù)一般在抽樣之前確定,根據(jù)樣本所建立的區(qū)間能包含總體參數(shù)的概率為100(1-α)%(2)置信區(qū)間的長度(準(zhǔn)確度)在置信度一定的情況下,與樣本容量的大小呈反方向變動,若要提高估計準(zhǔn)確度,可以擴(kuò)大樣本容量來達(dá)到。樣本標(biāo)準(zhǔn)差24二、總體均值的區(qū)間估計:小樣本的情況
在小樣本的情況下,樣本均值的抽樣分布依賴于總體的抽樣分布。我們討論總體服從正態(tài)分布的情況。t分布的圖形和標(biāo)準(zhǔn)正態(tài)分布的圖形類似,如下圖示:二、總體均值的區(qū)間估計:小樣本的情況250標(biāo)準(zhǔn)正態(tài)分布t分布(自由度為20)t分布(自由度為10)圖6-3標(biāo)準(zhǔn)正態(tài)分布與t分布的比較第六章總體參數(shù)估計0標(biāo)準(zhǔn)正態(tài)分布t分布(自由度為20)t分布(自由度為10)圖26在t分布中,對于給定的置信度,同樣可以通過查表找到其對應(yīng)的臨界值,利用臨界值也可計算區(qū)間估計的極限誤差因此,總體均值的區(qū)間估計在總體標(biāo)準(zhǔn)差未知的小樣本情況下可采用下式進(jìn)行:
假定總體服從正態(tài)分布;第六章總體參數(shù)估計在t分布中,對于給定的置信度,同樣可以通27【例3】謝爾工業(yè)公司擬采用一項計算機輔助程序來培訓(xùn)公司的維修支援掌握及其維修的操作,以減少培訓(xùn)工人所需要的時間。為了評價這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對這種程序所需要的平均時間進(jìn)行估計。以下是利用新方對15名職員進(jìn)行培訓(xùn)的培訓(xùn)天數(shù)資料。根據(jù)上述資料建立置信度為95%的總體均值的區(qū)間估計。(假定培訓(xùn)時間總體服從正態(tài)分布)。職員時間職員時間職員時間152659115424475012583558541360444962146254510461563第六章總體參數(shù)估計【例3】謝爾工業(yè)公司擬采用一項計算機輔助程序來培訓(xùn)公司的維修28解:依題意,總體服從正態(tài)分布,n=15(小樣本),此時總體方差未知??捎米杂啥葹椋╪-1)=14的t分布進(jìn)行總體均值的區(qū)間估計。樣本平均數(shù)樣本標(biāo)準(zhǔn)差極限誤差95%的置信區(qū)間為53.87±3.78即(50.09,57.65)天。第六章總體參數(shù)估計解:依題意,總體服從正態(tài)分布,n=15(小樣本),此時總29三、總體比例的區(qū)間估計對總體比例的區(qū)間估計在原理上與總體均值的區(qū)間估計相同。同樣要利用樣本比例的抽樣分布來進(jìn)行估計。若,則樣本比例近似服從正態(tài)分布。同樣,抽樣誤差類似的,利用抽樣分布(正態(tài)分布)來計算抽樣誤差三、總體比例的區(qū)間估計30上式中,是正待估計的總體參數(shù),其值一般是未知,通常簡單的用替代。即用樣本方差替代總體方差。則,極限誤差的計算公式為:上式中,是正待估計的總體參數(shù),其值一般是未知31【例4】1997年菲瑞卡洛通訊公司對全國范圍內(nèi)的902名女子高爾夫球手進(jìn)行了調(diào)查,以了解美國女子高爾夫球手對自己如何在場上被對待的看法。調(diào)查發(fā)現(xiàn),397名女子高爾夫球手對得到的球座開球次數(shù)感到滿意。試在95%的置信水平下估計總體比例的區(qū)間。分解:解:依題意已知,(1)樣本比例(2)誤差邊際第六章總體參數(shù)估計【例4】1997年菲瑞卡洛通訊公司對全國范圍內(nèi)的902名女子32
(3)95%的置信區(qū)間0.44±0.0324即(0.4076,0.4724)。結(jié)論:在置信水平為95%時,所有女子高爾夫球手中有40.76%到47.24%的人對得到的球座開球數(shù)感到滿意。
(3)95%的置信區(qū)間0.44±0.032433第三節(jié)確定樣本容量極限誤差其計算需要已知若我們選擇了置信度由此,得到計算必要樣本容量的計算公式:第三節(jié)確定樣本容量極限誤差34一、總體均值估計時樣本容量的確定【例5】在以前的一項研究美國租賃汽車花費的研究中發(fā)現(xiàn),租賃一輛中等大小的汽車,其花費范圍為,從加利福尼亞州的奧克蘭市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的標(biāo)準(zhǔn)差為9.65美元。假定進(jìn)行該項研究的組織想進(jìn)行一項新的研究,以估計美國當(dāng)前總體平均日租賃中等大小汽車的支出。在設(shè)計該項新的研究時,項目主管指定對總體平均日租賃支出的估計誤差邊際為2美元,置信水平為95%。解:依題意,可得將以上結(jié)果取下一個整數(shù)(90)即為必要的樣本容量。一、總體均值估計時樣本容量的確定【例5】在以前的一項研究美國35
說明:由于總體標(biāo)準(zhǔn)差在大多數(shù)情況下是未知的,可以有以下方法取得的值。(1)使用有同樣或者類似單元的以前樣本的樣本標(biāo)準(zhǔn)差;(2)抽取一個預(yù)備樣本進(jìn)行試驗性研究。用實驗性樣本的標(biāo)準(zhǔn)差作為的估計值。(3)運用對值的判斷或者“最好的猜測”,例如,通??捎迷撝等嗟?/4作為的近似值。說明:36二、總體比率估計時的樣本容量確定【例6】在例中,該公司想在1997年結(jié)果的基礎(chǔ)上進(jìn)行一項新的調(diào)查,以重新估計女子高爾夫球手的總體中對得到的球座開球此數(shù)感到滿意的人數(shù)所占的比例。調(diào)查主管希望這項新的調(diào)查在誤差邊際為0.025、置信水平為95%的條件下來進(jìn)行,那么,樣本容量應(yīng)該為多大?解:依題意,可得將以上結(jié)果取下一個整數(shù)(1515)即為必要的樣本容量。二、總體比率估計時的樣本容量確定【例6】在例中,該公司想在137在建立總體比例的區(qū)間估計時,確定樣本容量的原理與上節(jié)中使用的為估計總體均值時確定樣本容量的原理相類似。
說明:由于總體比例在大多數(shù)情況下是未知的,可以有以下方法取得的值。(1)使用有同樣或者類似單元的以前樣本的樣本比例;(2)抽取一個預(yù)備樣本進(jìn)行試驗性研究。用實驗性樣本的比例作為的估計值。(3)運用對值的判斷或者“最好的猜測”;(4)如果上面的方法都不適用,采用。在建立總體比例的區(qū)間估計時,確定樣本容量的原理與上節(jié)中使用的38第四節(jié)兩個總體均值和比率差異的區(qū)間估計一、兩個總體均值差異的估計:獨立樣本
的抽樣分布兩個總體均值之差的抽樣分布的形式:如果兩個總體的樣本大小都足夠大,可以以正態(tài)分布來近似。第四節(jié)兩個總體均值和比率差異的區(qū)間估計一、兩個總體均值差異39
的點估計量為:的點估計量為:40[例1]下表是某商店從光顧市中心商店和郊區(qū)商店的顧客中抽取的樣本數(shù)據(jù):
試對兩個不同區(qū)域的顧客年齡之差做出置信水平為95%的區(qū)間估計。解:依據(jù)區(qū)間估計的一般原理以及首先計算點估計的值商店被抽樣的顧客數(shù)樣本平均年齡樣本的標(biāo)準(zhǔn)差市中心商店郊區(qū)商店[例1]下表是某商店從光顧市中心商店和郊區(qū)商店的顧客中抽取的41
接下來計算極限誤差得到總體均值之差的95%的置信區(qū)間為5±4.06即(0.94,9.04)歲接下來計算極限誤差得到總體均值之差的95%的置信區(qū)間為5±42
(三)
當(dāng)某一個樣本容量小于30或兩個樣本容量同時小于30時假設(shè):(1)兩個總體都服從正態(tài)分布;
(2)兩個總體方差相等。此時(三)43
當(dāng)總體方差未知時,我們不再對兩個總體的方差進(jìn)行單獨估計而直接估計將兩個樣本的數(shù)據(jù)結(jié)合起來可以提供一個總體方差的估計
當(dāng)
的點估計為當(dāng)總體方差未知時,我們不再對兩個總體的方差44
小樣本情況下,用t分布來估計兩個總體均值之間的差異,此時自由度為n1+n2-2,[例2]對克利夫蘭國家銀行的兩個支行顧客的獨立隨機樣本的賬戶余額進(jìn)行核查得到下面的結(jié)果:小樣本情況下,用t分布來估計兩個總體均值之45
支行被抽取的賬戶數(shù)樣本平均余額樣本標(biāo)準(zhǔn)差A(yù)B用這些數(shù)據(jù)來建立兩個支行賬戶余額樣本均值差異的置信度是90%的置信區(qū)間。假定兩個支行檢察賬戶余額服從正態(tài)分布,且兩個支行檢察賬戶余額的方差相等。解:首先將兩個樣本的方差合并得到總體方差的合并估計:支行被抽取的賬戶數(shù)樣46則有:標(biāo)準(zhǔn)差的對應(yīng)估計值為
當(dāng)α=0.10時,查t分布表可得。因此,區(qū)間估計為:
即(-21.41,181.41)則有:標(biāo)準(zhǔn)差的對應(yīng)估計值為當(dāng)α=0.10時,47二、兩個總體比率差異的估計兩個總體比例之差的推斷和檢驗分別與兩個總體的均值之差的推斷方法大致相同
適用于來自兩個總體的獨立、隨機樣本。兩個總體比例之差的點估計量:
期望值:
標(biāo)準(zhǔn)差二、兩個總體比率差異的估計兩個總體比例之差的推斷和檢驗分別與48在大樣本的情況下,
以課本例題講解在大樣本的情況下,49第五節(jié)分層、整群和等距抽樣的區(qū)間估計1、解釋抽樣推斷的含義
第五節(jié)分層、整群和等距抽樣的區(qū)間估計1、解釋抽樣推斷的含義50STAT6.5其他抽樣方法下總方差的計算在第六章中學(xué)習(xí)到,除簡單隨機抽樣方法外,在現(xiàn)實中還可運用分層抽樣、整群抽樣、系統(tǒng)抽樣等抽樣方法,每一次抽樣都涉及到對總體參數(shù)的估計過程。通過前面的知識,可知對總體參數(shù)的估計過程中比較關(guān)鍵的因素是計算總體方差。如果已知總體方差,總體參數(shù)區(qū)間估計的過程與前面介紹的方法相同。STAT6.5其他抽樣方法下總方差的計算51STAT6.5.1分層抽樣在簡單隨機抽樣中,我們計算總方差是采用的公式是在分層抽樣中,我們事先將總體按一定的標(biāo)志進(jìn)行分層,所形成的數(shù)據(jù)實際等同于組距式數(shù)列,在組距式數(shù)列中,總方差需要運用方差加法定理來計算。STAT6.5.1分層抽樣52STAT這就是說,如果要計算總方差,則需分別將組間方差和平均組內(nèi)方差先計算出來。在分層抽樣下,是否真的需要由組間方差和平均組內(nèi)方差相加來計算總方差呢?我們來考察一下分層抽樣的實施過程:層間抽樣:在每一層抽取全面調(diào)查層間方差層內(nèi)抽樣:抽取部分樣本單位抽樣調(diào)查層內(nèi)方差我們說抽樣誤差是抽樣調(diào)查這種調(diào)查方式所特有的誤差,因此上述兩部分誤差中只有由于抽樣調(diào)查所形成的層內(nèi)方差才是抽樣誤差的組成部分,而由于全面調(diào)查所形成的層間方差不是抽樣誤差的組成部分。STAT這就是說,如果要計算總方差,則需分別將組間方53STAT因此,STAT因此,54【例7】某廠有甲、乙兩個車間生產(chǎn)保溫瓶,乙車間產(chǎn)量是甲車間的2倍。現(xiàn)按產(chǎn)量比例共抽查了60支,結(jié)果如下。試以95.45%的可靠程度推斷該廠生產(chǎn)的保溫瓶的平均保溫時間的可能范圍?!纠?】某廠有甲、乙兩個車間生產(chǎn)保溫瓶,乙車間產(chǎn)量是甲車間的55【例8】某地一萬住戶,按城鄉(xiāng)比例抽取一千戶,進(jìn)行彩電擁有量調(diào)查,結(jié)果如下。試以95.45%的概率推斷該地彩電擁有戶比率的范圍?!纠?】某地一萬住戶,按城鄉(xiāng)比例抽取一千戶,進(jìn)行彩電擁有量調(diào)56STAT6.5.2整群抽樣與分層抽樣類似,整群抽樣下,總方差的計算仍然需要分解:同樣考察整群抽樣的實施過程:層間抽樣:在部分層中抽取抽樣調(diào)查群間方差層內(nèi)抽樣:抽取全部樣本單位全面調(diào)查群內(nèi)方差類似的,只有群間方差是抽樣誤差的組成部分。
STAT6.5.2整群抽樣57STAT因此,STAT因此,58【例9】某鄉(xiāng)播種某種農(nóng)作物3000畝,分布在60塊地段上,每塊地段50畝。現(xiàn)抽取5塊地,得資料如下?,F(xiàn)要求以95%的概率估計這種農(nóng)作物的平均畝產(chǎn)??傮w:R=60群樣本:r=5群【例9】某鄉(xiāng)播種某種農(nóng)作物3000畝,總體:R=60群59概念總結(jié)回顧1、解釋抽樣推斷的含義
簡單的講,抽樣推斷就是用樣本中的信息來推斷總體的信息。為什么要進(jìn)行抽樣推斷?這是因為對于我們要研究的的問題來說,有的情況下我們掌握著總體的全部數(shù)據(jù),因此總體的信息我們都能夠得到而不需要推斷。但在大部分情況下,我們對總體的全部數(shù)據(jù)是無法獲得或者沒有必要獲得,這時我們就通過抽取總體中的一部分單位進(jìn)行調(diào)查,利用調(diào)查的結(jié)果來推斷總體的數(shù)量特征。概念總結(jié)回顧1、解釋抽樣推斷的含義602、解釋簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣和整群抽樣的含義。
簡單隨機抽樣是指從含有N個元素的總體中,抽取n個元素作為樣本,使得每一個容量為n的樣本有相同的機會(概率)被抽中,這樣的抽樣方式稱為簡單隨機抽樣。
分層抽樣也稱分類是指在抽樣之前先將總體劃分為若干層(類),然后從各個層中抽取一定數(shù)量的元素組成一個樣本。為提高抽樣的效果,在分層或分類時應(yīng)使層內(nèi)各元素差異盡量小,而使層與層之間的差異盡量大。
系統(tǒng)抽樣,也稱等距抽樣或機械抽樣。先將總體總體各元素按某種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個元素,直到抽取n個元素形成一個樣本。
整群抽樣是先將總體劃分成若干群。然后以群作為抽樣單位從中抽取部分群,再對抽中的各個群中所包含的所有元素進(jìn)行觀察。第六章總體參數(shù)估計2、解釋簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣和整群抽樣的含義。第614、什么是重置抽樣和不重置抽樣?5、什么是抽樣分布?
某個樣本統(tǒng)計量的抽樣分布,從理論上講就是在重復(fù)選取容量為n的樣本時,由每一個樣本算出的該統(tǒng)計量數(shù)值的相對頻度分布或概率分布。它是針對樣本估計量的分布。樣本估計量是樣本的一個函數(shù),在統(tǒng)計學(xué)中稱作統(tǒng)計量,因此抽樣分布也是指統(tǒng)計量的分布。以樣本平均數(shù)為例,它是總體平均數(shù)的一個估計量,如果按照相同的樣本容量,相同的抽樣方式,反復(fù)的抽取樣本,每次可以計算一個平均數(shù),所有可能樣本的平均數(shù)所形成的分布,就是樣本平均數(shù)的抽樣分布。第六章總體參數(shù)估計4、什么是重置抽樣和不重置抽樣?第六章總體參數(shù)估計626、樣本統(tǒng)計量的分布與總體分布的關(guān)系是什么?由于現(xiàn)實中我們不可能將所有的樣本都抽出來,因此,統(tǒng)計量的抽樣分布實際上是一種理論分布,但它與總體分布存在著密切的關(guān)系,以均值的抽樣分布為例,其抽樣分布與原有總體的分布有關(guān),如果原有總體是正態(tài)分布,那么,無論樣本容量的大小,樣本方差也服從正態(tài)分布。其分布的數(shù)學(xué)期望為總體均值,方差為總體方差的1/n。如果原有總體的分布不是正態(tài)分布,就要看樣本容量的大小了,當(dāng)n為大樣本時(n≥30),根據(jù)統(tǒng)計上的中心極限定理可知,當(dāng)樣本容量n增大時,不論原來的總體是否服從正態(tài)分布,樣本均值的抽樣分布都將趨于服從正態(tài)分布。其分布的數(shù)學(xué)期望為總體均值,方差為總體方差的1/n。第六章總體參數(shù)估計6、樣本統(tǒng)計量的分布與總體分布的關(guān)系是什么?第六章總體參637、樣本均值抽樣分布的兩個主要特征是什么?它們與總體參數(shù)有什么關(guān)系?樣本均值的期望值和樣本均值的方差是樣本均值抽樣分布的兩個主要特征值。第六章總體參數(shù)估計7、樣本均值抽樣分布的兩個主要特征是什么?它們與總體參數(shù)有什648、簡述評價估計量好壞的標(biāo)準(zhǔn)?
1、無偏性。無偏性是指估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)。
2、有效性。一個無偏的估計量并不意味著它就非常接近被估計的參數(shù),它還必須與總體參數(shù)的離散程度比較小。
3、一致性。一致性是指隨著樣本增大,點估計量的值越來越接近總體的參數(shù)。一個大樣本給出的估計量要比一個小樣本給出的估計量更接近總體的參數(shù)。第六章總體參數(shù)估計8、簡述評價估計量好壞的標(biāo)準(zhǔn)?第六章總體參數(shù)估計65
9、如何理解置信區(qū)間估計的原理?區(qū)間估計是以給出一個估計的范圍來對總體參數(shù)做出估計,并相應(yīng)的給出置信的概率。10、簡述樣本容量與置信水平、總體方差、邊際誤差的關(guān)系。從樣本容量的公式可以看出,樣本容量與置信概率成正比,在其他條件不變的情況下,置信概率越大,所需的樣本容量越大;樣本容量與總體方差成正比,總體的差異越大,所要求的樣本容量越大;樣本容量與邊際誤差的平方成反比,我們可以接受的邊際誤差越大,所需的樣本容量就越小。第六章總體參數(shù)估計9、如何理解置信區(qū)間估計的原理?第六章總體參數(shù)估66習(xí)題1、在抽樣的基本概念中()A全及總體與樣本總體均是惟一的B全及總體與樣本總體均不是惟一的C全及總體是惟一的且樣本總體不是惟一的D全及總體不是惟一的且樣本總體均是惟一的2、在不重置抽樣條件下,每個全及總體單位被選為樣本單位的概率亦均為()A1/NB1/nC1/N-1D1/n-1
CA習(xí)題1、在抽樣的基本概念中()CA673、在不重復(fù)抽樣的安排下,所有樣本的可能個數(shù)為()
AN!/[n!(N-n)!]BNnCN!
Dn!4、在隨機抽樣理論中()A簡單隨機抽樣在抽樣理論中作為其它抽樣組織方法的基礎(chǔ)
B分層隨機抽樣在抽樣理論中作為其它抽樣組織方法的基礎(chǔ)C
整群抽樣在抽樣理論中作為其它抽樣組織方法的基礎(chǔ)
D等距抽樣在抽樣理論中為作為其它抽樣組織方法的基礎(chǔ)AA第六章總體參數(shù)估計3、在不重復(fù)抽樣的安排下,所有樣本的可能個數(shù)為()AA第六章685、只要樣本是隨機抽取的,我們就可以認(rèn)為樣本可以基本上代替總體,這是_____做保證。A大數(shù)定律B中心極限定理C中值定理
D離散特質(zhì)6、大數(shù)定律的數(shù)學(xué)表達(dá)式為()
7、當(dāng)樣本容量n>30,則無論是否已知總體分布狀態(tài),樣本平均數(shù)分布趨于正態(tài)分布,即()A第六章總體參數(shù)估計5、只要樣本是隨機抽取的,我們就可以認(rèn)為樣本可以基本上代替總698、如果已知總體變量服從正態(tài)分布,則樣本平均數(shù)分布與總體分布()
A不同中心且總體分布更集中B同中心且樣本平均數(shù)分布更集中C同中心且總體分布更集中
D不同中心且樣本平均數(shù)更集中B第六章總體參數(shù)估計8、如果已知總體變量服從正態(tài)分布,則樣本平均數(shù)分布與總體分布70計算題1、已知某樹苗培植園內(nèi)的樹莖直徑服從正態(tài)分布,從中隨機的抽取了10株,測得其樹莖直徑的數(shù)據(jù)如下(單位:厘米)10.18.97.611.310.79.49.910.210.511.7
(1)試求該批樹苗直徑的平均值及標(biāo)準(zhǔn)差。
(2)你能否推斷該園內(nèi)樹苗直徑的具體分布是什么?計算題1、已知某樹苗培植園內(nèi)的樹莖直徑服從正態(tài)分布,從中隨機712、某縣欲統(tǒng)計今年小麥產(chǎn)量,調(diào)查了全縣100個村子的小麥產(chǎn)量,測得全縣每個村子小麥產(chǎn)量的平均值為1700(噸)標(biāo)準(zhǔn)差為200(噸)。若從全縣的100個村子中按重復(fù)抽樣的方法隨機抽取10個村子,則由10個村子組成的樣本平均產(chǎn)量的期望值時多少?平均產(chǎn)量的標(biāo)準(zhǔn)差又是多少?若采用的是不重復(fù)抽樣的方法,那么由10個村子組成的樣本平均產(chǎn)量的期望值是多少?平均產(chǎn)量的標(biāo)準(zhǔn)差又是多少?第六章總體參數(shù)估計2、某縣欲統(tǒng)計今年小麥產(chǎn)量,調(diào)查了全縣100個村子的小麥產(chǎn)量723、某地區(qū)工人的平均工資是15元/小時,標(biāo)準(zhǔn)差為4元/小時。若從該地區(qū)抽取50個工廠,問所取樣本的平均工資W的期望值和方差個是多少?平均工資W的抽樣分布是什么?4、一家調(diào)查公司進(jìn)行一項調(diào)查,其目的是為了了解某市電信營業(yè)廳大客戶對該電信服務(wù)的滿意情況。調(diào)查人員隨機訪問了30名去該電信營業(yè)廳辦理業(yè)務(wù)的大客戶,發(fā)現(xiàn)受訪的大客戶中有9名認(rèn)為營業(yè)廳現(xiàn)在的服務(wù)質(zhì)量較兩年前好。試在95%的置信水平下對大客戶中認(rèn)為營業(yè)廳現(xiàn)在的服務(wù)質(zhì)量較兩年前好的比例進(jìn)行區(qū)間估計。第六章總體參數(shù)估計3、某地區(qū)工人的平均工資是15元/小時,標(biāo)準(zhǔn)差為4元/小時。735、為了確定某大學(xué)生佩戴眼鏡的比例,調(diào)查人員欲對該大學(xué)的學(xué)生進(jìn)行抽樣調(diào)查。而根據(jù)以往的調(diào)查結(jié)果表明,該大學(xué)有75%的學(xué)生佩戴眼鏡,則對于邊際誤差E分別為(1)5%;(2)10%;(3)15%時,抽取的樣本量各為多少合適?(∝=0.05)6、為調(diào)查某單位每個家庭每天觀看電視的平均時間是多長,隨機抽取了16戶,得樣本均值為6.75小時,樣本標(biāo)準(zhǔn)差為2.25小時。(1)試對家庭每天平均看電視時間進(jìn)行區(qū)間估計。
(2)若已知該市每個家庭看電視時間的標(biāo)準(zhǔn)差為2.5小時,此時若再進(jìn)行區(qū)間估計,并且將邊際誤差控制在第一問的水平,問此時需調(diào)查多少戶才能滿足要求?(∝=0.05)第六章總體參數(shù)估計5、為了確定某大學(xué)生佩戴眼鏡的比例,調(diào)查人員欲對該大學(xué)的學(xué)生747、據(jù)某市場調(diào)查公司對某市80名隨機受訪的購房者的調(diào)查,得到該購房者中本地人購房比例P的區(qū)間估計,在置信水平為∝=0.10下,其邊際誤差E=0.08。則:
(1)這80名受訪樣本中本地購房者的比例P是多少?(2)若置信水平為∝=0.05,則要保持同樣的精度進(jìn)行區(qū)間估計,需要調(diào)查多少名購房者?第六章總體參數(shù)估計7、據(jù)某市場調(diào)查公司對某市80名隨機受訪的購房者的調(diào)查,得到75
一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對產(chǎn)量質(zhì)量進(jìn)行檢測,企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗,并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機抽取了25袋,下表1是對每袋食品重量的檢驗結(jié)果。實踐中的統(tǒng)計第六章總體參數(shù)估計一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主76
根據(jù)表1的數(shù)據(jù),質(zhì)檢科估計出該天生產(chǎn)的食品每袋的平均重量在101.38~109.34克之間,其中,估計的可信程度為95%,估計誤差不超過4克。產(chǎn)品的合格率在96.07%~73.93%之間,其中,估計的可信程度為95%,估計誤差不超過16%。表125袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.010808101.6108.498.4100.5115.6102.2105.093.3第六章總體參數(shù)估計表125袋食品的重量(克)112.5101.01077
質(zhì)檢報告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點意見:一是抽取的樣本大小是否合適?能不能用一個更大的樣本進(jìn)行估計?二是能否將估計的誤差再縮小一點?比如,估計平均重量時,估計誤差不超過3克,估計合格率時誤差不超過10%;三是總體平均重量的方差是多少?因為方差的大小說明了生產(chǎn)過程的穩(wěn)定性,過大或過小的方差都意味著應(yīng)對生產(chǎn)過程進(jìn)行調(diào)整。第六章總體參數(shù)估計質(zhì)檢報告提交后,企業(yè)高層領(lǐng)導(dǎo)78第六章總體參數(shù)估計本章重點1、參數(shù)估計的基本問題;2、單個總體均值和比率的區(qū)間估計;3、小樣本下的總體參數(shù)估計方法;4、樣本容量的確定方法;5、兩個總體均值和比率差異的區(qū)間估計;6、分層、整群和等距抽樣的區(qū)間估計。本章難點1、一般正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布;2、區(qū)間估計的原理;3、兩總體聯(lián)合方差的表達(dá)形式。。第六章總體參數(shù)估計本章重點79第一節(jié)參數(shù)估計的基本問題一、點估計點估計就是用樣本估計量的一個具體觀測值直接作為總體的未知參數(shù)的估計值的方法。如上例中隨機抽取的100頭的平均每頭毛重(95.5kg)可作為10000頭平均每頭毛重的點估計值常用的估計量有:(1)樣本平均數(shù)為總體平均數(shù)的估計量;(2)樣本方差為總體方差的估計量;(3)樣本成數(shù)為總體成數(shù)P
估計量。第一節(jié)參數(shù)估計的基本問題一、點估計80二、點估計的性質(zhì)在對總體特征做出估計時,并非所有估計量都是優(yōu)良的,從而產(chǎn)生了評價估計量是否優(yōu)良的標(biāo)準(zhǔn)。作為優(yōu)良的估計量應(yīng)該符合如下三個標(biāo)準(zhǔn):第六章總體參數(shù)估計二、點估計的性質(zhì)第六章總體參數(shù)估計811、無偏性如果樣本某統(tǒng)計量的數(shù)學(xué)期望值等于其所估計的總體參數(shù)真值,則這個估計統(tǒng)計量就叫做該總體參數(shù)的無偏估計量。如樣本平均數(shù)的數(shù)學(xué)期望是總體平均數(shù),則樣本均值是總體均值的無偏估計量。這里無偏估計量是指沒有系統(tǒng)偏差(非隨機偏差)的平均意義上的量,即如果說一個估計量是無偏性的,并不是保證用于單獨一次估計中沒有隨機性誤差,只是沒有系統(tǒng)性偏差而已。這是一個優(yōu)良估計量的重要條件。若以代表被估計的總體參數(shù),代表的無偏估計量則有:第六章總體參數(shù)估計1、無偏性第六章總體參數(shù)估計822、一致性若估計量隨樣本容量n的增大而越來越接近總體參數(shù)值時,則稱該估計量為被估計參數(shù)的一致性估計量。估計量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個估計量是一致性估計量,那么采用大樣本就更加可靠。當(dāng)然,樣本容量n增大時,估計量的一致性會增強,但調(diào)查所需的人、財、物力也相應(yīng)增加。例如,以樣本平均數(shù)估計總體平均數(shù),符合一致性的要求,即存在如下關(guān)系:式中為任意正數(shù)。第六章總體參數(shù)估計2、一致性第六章總體參數(shù)估計833、有效性有效性是指無偏估計量中方差最小的估計量。無偏估計量只考慮估計值的平均結(jié)果是否等于待估計參數(shù)的真值,而不考慮估計的每個可能值及其次數(shù)分布與待估計參數(shù)真值之間離差大小的離散程度。我們在解決實際問題時,不僅希望估計值是無偏的,更希望這些估計值的離差盡可能地小,即要求比較各無偏估計量中與被估計參數(shù)的離差較小的為有效估計量。如樣本平均數(shù)與中位數(shù)都是總體均值的無偏估計量,但在同樣的樣本容量下,樣本平均數(shù)是有效的估計量。第六章總體參數(shù)估計3、有效性第六章總體參數(shù)估計84點估計的缺點:不能反映估計的誤差和精確程度
因為點估計是基于樣本得到的,是隨機變量,不可能期望它的值與相應(yīng)的總體參數(shù)的真實值相等,也就是說點估計值和總體參數(shù)的真是值之間總會存在一定誤差,并且我們是不知道這個誤差有多大,這樣我們估計的可信度大打折扣。在這一節(jié)中,我們將說明如何利用點估計值對單個總體均值和總體比率進(jìn)行區(qū)間估計,并給出估計的可靠程度和準(zhǔn)確程度。區(qū)間估計:利用樣本統(tǒng)計量和抽樣分布估計總體參數(shù)的可能區(qū)間第六章總體參數(shù)估計點估計的缺點:不能反映估計的誤差和精確程度第六章總體參數(shù)85第二節(jié)單個總體均值和比率的區(qū)間估計一、總體均值的區(qū)間估計:大樣本(n≥30)情形和小樣本(n<30)情形。第二節(jié)單個總體均值和比率的區(qū)間估計一、總體均值的區(qū)間估計:86大樣本的情形【例1】Duotu公司是一家專營體育設(shè)備和附件的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,Duotu公司每月都要隨即的抽取一個顧客樣本進(jìn)行調(diào)查以了解顧客的滿意分?jǐn)?shù)。根據(jù)以往的調(diào)查,滿意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對100名顧客的抽樣顯示,滿意分?jǐn)?shù)的樣本均值為82分,試建立總體滿意分?jǐn)?shù)的區(qū)間。
我們可以將樣本滿意得分的均值(82分)作為該公司所有顧客組成的總體的平均滿意得分的點估計。當(dāng)然你也許會問:“這一估計有多好?這次估計的把握程度有多高?”"有多好"這一問題其實是想知道以樣本均值作為總體均值的點估計時所產(chǎn)生的誤差有多大。大樣本的情形【例1】Duotu公司是一家專營體育設(shè)備和附件的87我們把無偏點估計值與總體參數(shù)之差的絕對值稱為抽樣誤差。當(dāng)我們用樣本均值估計總體均值時,抽樣誤差可以表達(dá)為:如果我們可以利用式6-1將抽樣誤差計算出來,那么就可以將式6-1變形為:
(6-1)
(6-2)
我們把無偏點估計值與總體參數(shù)之差的絕對值稱為抽樣誤差。當(dāng)我們88要進(jìn)行區(qū)間估計,關(guān)鍵是將抽樣誤差E求解。若E已知,則區(qū)間可表示為:此時,可以利用樣本均值的抽樣分布對抽樣誤差的大小進(jìn)行描述。上例中,已知,樣本容量n=100,總體標(biāo)準(zhǔn)差,根據(jù)中心極限定理可知,此時樣本均值服從均值為,標(biāo)準(zhǔn)差為的正態(tài)分布。即:要進(jìn)行區(qū)間估計,關(guān)鍵是將抽樣誤差E求解。若E已知,89抽樣誤差的概率表述我們可以確定樣本均值在總體均值82的周圍波動,波動的幅度即為抽樣誤差。根據(jù)抽樣分布的知識,這個波動幅度即抽樣誤差??梢愿鶕?jù)事先給定的概率加以計算[],為了方便運算,通常我們先將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。由概率論,若,服從標(biāo)準(zhǔn)正態(tài)分布,記為。由標(biāo)準(zhǔn)正態(tài)分布,有以下式子成立
(6-4)抽樣誤差的概率表述我們可以確定樣本均值在總體均值8290
一般稱,為置信度,可靠程度等,反映估計結(jié)果的可信程度。若事先給定一個置信度,則可根據(jù)標(biāo)準(zhǔn)正態(tài)分布找到其對應(yīng)的臨界值。進(jìn)而計算抽樣誤差總體均值的區(qū)間估計(同名257)課件91若,則查標(biāo)準(zhǔn)正態(tài)分布附表3可得,抽樣誤差此時抽樣誤差的意義可表述為:以樣本均值為中心的±3.92的區(qū)間包含總體均值的概率是95%,或者說,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。常用的置信度還有90%,95.45%,99.73%,他們對應(yīng)的臨界值分別為1.645,2和3,可以分別反映各自的估計區(qū)間所對應(yīng)的精確程度和把握程度。
若,92計算區(qū)間估計:在CJW公司的例子中,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。因此,可以構(gòu)建總體均值的區(qū)間為,由于,從一個總體中抽取到的樣本具有隨機性,在一次偶然的抽樣中,根據(jù)樣本均值計算所的區(qū)間并不總是可以包含總體均值,它是與一定的概率相聯(lián)系的。如下圖所示:計算區(qū)間估計:933.923.92圖1根據(jù)選擇的在、、位置的樣本均值建立的區(qū)間3.923.92圖1根據(jù)選擇的在、、94
上圖中,有95%的樣本均值落在陰影部分,這個區(qū)域的樣本均值±3.92的區(qū)間能夠包含總體均值。因此,總體均值的區(qū)間的含義為,我們有95%的把握認(rèn)為,以樣本均值為中心的±3.92的區(qū)間能夠包含總體均值。通常,稱該區(qū)間為置信區(qū)間,其對應(yīng)的置信水平為置信區(qū)間的估計包含兩個部分:點估計和描述估計精確度的正負(fù)值。也將正負(fù)值稱為誤差邊際或極限誤差,反映樣本估計量與總體參數(shù)之間的最大誤差范圍。總結(jié):上圖中,有95%的樣本均值落在陰影部分,這個95計算區(qū)間估計:在大多數(shù)的情況下,總體的標(biāo)準(zhǔn)差都是未知的。根據(jù)抽樣分布定理,在大樣本的情況下,可用樣本的標(biāo)準(zhǔn)差s作為總體標(biāo)準(zhǔn)差的點估計值,仍然采用上述區(qū)間估計的方法進(jìn)行總體參數(shù)的估計。計算區(qū)間估計:96【例2】某市交通部門為了對城市的環(huán)境進(jìn)行監(jiān)測,定期公布該市居民每天小汽車的里程數(shù),抽取36個居民作為一個簡單隨即樣本,得到資料如表6-2所示。試構(gòu)造該市民每天小汽車?yán)锍虜?shù)的總體均值的95%的置信區(qū)間。居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)居民汽車?yán)锍虜?shù)123456789325040243344454844101112131415161718473136394645393845192021222324252627274354363448233642282930313233343536343934354253284939【例2】某市交通部門為了對城市的環(huán)境進(jìn)行監(jiān)測,定期公97分析:區(qū)間估計包括兩個部分——點估計和誤差邊際,只需分別求出即可到的總體的區(qū)間估計。解:已知(1)樣本的平均里程數(shù)(2)極限誤差(誤差邊際)分析:區(qū)間估計包括兩個部分——點估計和誤差邊際,只需分別求出98樣本標(biāo)準(zhǔn)差極限誤差(3)95%的置信區(qū)間為39.5±2.54即(36.96,42.04)公里。
注意(1)置信系數(shù)一般在抽樣之前確定,根據(jù)樣本所建立的區(qū)間能包含總體參數(shù)的概率為100(1-α)%(2)置信區(qū)間的長度(準(zhǔn)確度)在置信度一定的情況下,與樣本容量的大小呈反方向變動,若要提高估計準(zhǔn)確度,可以擴(kuò)大樣本容量來達(dá)到。樣本標(biāo)準(zhǔn)差99二、總體均值的區(qū)間估計:小樣本的情況
在小樣本的情況下,樣本均值的抽樣分布依賴于總體的抽樣分布。我們討論總體服從正態(tài)分布的情況。t分布的圖形和標(biāo)準(zhǔn)正態(tài)分布的圖形類似,如下圖示:二、總體均值的區(qū)間估計:小樣本的情況1000標(biāo)準(zhǔn)正態(tài)分布t分布(自由度為20)t分布(自由度為10)圖6-3標(biāo)準(zhǔn)正態(tài)分布與t分布的比較第六章總體參數(shù)估計0標(biāo)準(zhǔn)正態(tài)分布t分布(自由度為20)t分布(自由度為10)圖101在t分布中,對于給定的置信度,同樣可以通過查表找到其對應(yīng)的臨界值,利用臨界值也可計算區(qū)間估計的極限誤差因此,總體均值的區(qū)間估計在總體標(biāo)準(zhǔn)差未知的小樣本情況下可采用下式進(jìn)行:
假定總體服從正態(tài)分布;第六章總體參數(shù)估計在t分布中,對于給定的置信度,同樣可以通102【例3】謝爾工業(yè)公司擬采用一項計算機輔助程序來培訓(xùn)公司的維修支援掌握及其維修的操作,以減少培訓(xùn)工人所需要的時間。為了評價這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對這種程序所需要的平均時間進(jìn)行估計。以下是利用新方對15名職員進(jìn)行培訓(xùn)的培訓(xùn)天數(shù)資料。根據(jù)上述資料建立置信度為95%的總體均值的區(qū)間估計。(假定培訓(xùn)時間總體服從正態(tài)分布)。職員時間職員時間職員時間152659115424475012583558541360444962146254510461563第六章總體參數(shù)估計【例3】謝爾工業(yè)公司擬采用一項計算機輔助程序來培訓(xùn)公司的維修103解:依題意,總體服從正態(tài)分布,n=15(小樣本),此時總體方差未知??捎米杂啥葹椋╪-1)=14的t分布進(jìn)行總體均值的區(qū)間估計。樣本平均數(shù)樣本標(biāo)準(zhǔn)差極限誤差95%的置信區(qū)間為53.87±3.78即(50.09,57.65)天。第六章總體參數(shù)估計解:依題意,總體服從正態(tài)分布,n=15(小樣本),此時總104三、總體比例的區(qū)間估計對總體比例的區(qū)間估計在原理上與總體均值的區(qū)間估計相同。同樣要利用樣本比例的抽樣分布來進(jìn)行估計。若,則樣本比例近似服從正態(tài)分布。同樣,抽樣誤差類似的,利用抽樣分布(正態(tài)分布)來計算抽樣誤差三、總體比例的區(qū)間估計105上式中,是正待估計的總體參數(shù),其值一般是未知,通常簡單的用替代。即用樣本方差替代總體方差。則,極限誤差的計算公式為:上式中,是正待估計的總體參數(shù),其值一般是未知106【例4】1997年菲瑞卡洛通訊公司對全國范圍內(nèi)的902名女子高爾夫球手進(jìn)行了調(diào)查,以了解美國女子高爾夫球手對自己如何在場上被對待的看法。調(diào)查發(fā)現(xiàn),397名女子高爾夫球手對得到的球座開球次數(shù)感到滿意。試在95%的置信水平下估計總體比例的區(qū)間。分解:解:依題意已知,(1)樣本比例(2)誤差邊際第六章總體參數(shù)估計【例4】1997年菲瑞卡洛通訊公司對全國范圍內(nèi)的902名女子107
(3)95%的置信區(qū)間0.44±0.0324即(0.4076,0.4724)。結(jié)論:在置信水平為95%時,所有女子高爾夫球手中有40.76%到47.24%的人對得到的球座開球數(shù)感到滿意。
(3)95%的置信區(qū)間0.44±0.0324108第三節(jié)確定樣本容量極限誤差其計算需要已知若我們選擇了置信度由此,得到計算必要樣本容量的計算公式:第三節(jié)確定樣本容量極限誤差109一、總體均值估計時樣本容量的確定【例5】在以前的一項研究美國租賃汽車花費的研究中發(fā)現(xiàn),租賃一輛中等大小的汽車,其花費范圍為,從加利福尼亞州的奧克蘭市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的標(biāo)準(zhǔn)差為9.65美元。假定進(jìn)行該項研究的組織想進(jìn)行一項新的研究,以估計美國當(dāng)前總體平均日租賃中等大小汽車的支出。在設(shè)計該項新的研究時,項目主管指定對總體平均日租賃支出的估計誤差邊際為2美元,置信水平為95%。解:依題意,可得將以上結(jié)果取下一個整數(shù)(90)即為必要的樣本容量。一、總體均值估計時樣本容量的確定【例5】在以前的一項研究美國110
說明:由于總體標(biāo)準(zhǔn)差在大多數(shù)情況下是未知的,可以有以下方法取得的值。(1)使用有同樣或者類似單元的以前樣本的樣本標(biāo)準(zhǔn)差;(2)抽取一個預(yù)備樣本進(jìn)行試驗性研究。用實驗性樣本的標(biāo)準(zhǔn)差作為的估計值。(3)運用對值的判斷或者“最好的猜測”,例如,通??捎迷撝等嗟?/4作為的近似值。說明:111二、總體比率估計時的樣本容量確定【例6】在例中,該公司想在1997年結(jié)果的基礎(chǔ)上進(jìn)行一項新的調(diào)查,以重新估計女子高爾夫球手的總體中對得到的球座開球此數(shù)感到滿意的人數(shù)所占的比例。調(diào)查主管希望這項新的調(diào)查在誤差邊際為0.025、置信水平為95%的條件下來進(jìn)行,那么,樣本容量應(yīng)該為多大?解:依題意,可得將以上結(jié)果取下一個整數(shù)(1515)即為必要的樣本容量。二、總體比率估計時的樣本容量確定【例6】在例中,該公司想在1112在建立總體比例的區(qū)間估計時,確定樣本容量的原理與上節(jié)中使用的為估計總體均值時確定樣本容量的原理相類似。
說明:由于總體比例在大多數(shù)情況下是未知的,可以有以下方法取得的值。(1)使用有同樣或者類似單元的以前樣本的樣本比例;(2)抽取一個預(yù)備樣本進(jìn)行試驗性研究。用實驗性樣本的比例作為的估計值。(3)運用對值的判斷或者“最好的猜測”;(4)如果上面的方法都不適用,采用。在建立總體比例的區(qū)間估計時,確定樣本容量的原理與上節(jié)中使用的113第四節(jié)兩個總體均值和比率差異的區(qū)間估計一、兩個總體均值差異的估計:獨立樣本
的抽樣分布兩個總體均值之差的抽樣分布的形式:如果兩個總體的樣本大小都足夠大,可以以正態(tài)分布來近似。第四節(jié)兩個總體均值和比率差異的區(qū)間估計一、兩個總體均值差異114
的點估計量為:的點估計量為:115[例1]下表是某商店從光顧市中心商店和郊區(qū)商店的顧客中抽取的樣本數(shù)據(jù):
試對兩個不同區(qū)域的顧客年齡之差做出置信水平為95%的區(qū)間估計。解:依據(jù)區(qū)間估計的一般原理以及首先計算點估計的值商店被抽樣的顧客數(shù)樣本平均年齡樣本的標(biāo)準(zhǔn)差市中心商店郊區(qū)商店[例1]下表是某商店從光顧市中心商店和郊區(qū)商店的顧客中抽取的116
接下來計算極限誤差得到總體均值之差的95%的置信區(qū)間為5±4.06即(0.94,9.04)歲接下來計算極限誤差得到總體均值之差的95%的置信區(qū)間為5±117
(三)
當(dāng)某一個樣本容量小于30或兩個樣本容量同時小于30時假設(shè):(1)兩個總體都服從正態(tài)分布;
(2)兩個總體方差相等。此時(三)118
當(dāng)總體方差未知時,我們不再對兩個總體的方差進(jìn)行單獨估計而直接估計將兩個樣本的數(shù)據(jù)結(jié)合起來可以提供一個總體方差的估計
當(dāng)
的點估計為當(dāng)總體方差未知時,我們不再對兩個總體的方差119
小樣本情況下,用t分布來估計兩個總體均值之間的差異,此時自由度為n1+n2-2,[例2]對克利夫蘭國家銀行的兩個支行顧客的獨立隨機樣本的賬戶余額進(jìn)行核查得到下面的結(jié)果:小樣本情況下,用t分布來估計兩個總體均值之120
支行被抽取的賬戶數(shù)樣本平均余額樣本標(biāo)準(zhǔn)差A(yù)B用這些數(shù)據(jù)來建立兩個支行賬戶余額樣本均值差異的置信度是90%的置信區(qū)間。假定兩個支行檢察賬戶余額服從正態(tài)分布,且兩個支行檢察賬戶余額的方差相等。解:首先將兩個樣本的方差合并得到總體方差的合并估計:支行被抽取的賬戶數(shù)樣121則有:標(biāo)準(zhǔn)差的對應(yīng)估計值為
當(dāng)α=0.10時,查t分布表可得。因此,區(qū)間估計為:
即(-21.41,181.41)則有:標(biāo)準(zhǔn)差的對應(yīng)估計值為當(dāng)α=0.10時,122二、兩個總體比率差異的估計兩個總體比例之差的推斷和檢驗分別與兩個總體的均值之差的推斷方法大致相同
適用于來自兩個總體的獨立、隨機樣本。兩個總體比例之差的點估計量:
期望值:
標(biāo)準(zhǔn)差二、兩個總體比率差異的估計兩個總體比例之差的推斷和檢驗分別與123在大樣本的情況下,
以課本例題講解在大樣本的情況下,124第五節(jié)分層、整群和等距抽樣的區(qū)間估計1、解釋抽樣推斷的含義
第五節(jié)分層、整群和等距抽樣的區(qū)間估計1、解釋抽樣推斷的含義125STAT6.5其他抽樣方法下總方差的計算在第六章中學(xué)習(xí)到,除簡單隨機抽樣方法外,在現(xiàn)實中還可運用分層抽樣、整群抽樣、系統(tǒng)抽樣等抽樣方法,每一次抽樣都涉及到對總體參數(shù)的估計過程。通過前面的知識,可知對總體參數(shù)的估計過程中比較關(guān)鍵的因素是計算總體方差。如果已知總體方差,總體參數(shù)區(qū)間估計的過程與前面介紹的方法相同。STAT6.5其他抽樣方法下總方差的計算126STAT6.5.1分層抽樣在簡單隨機抽樣中,我們計算總方差是采用的公式是在分層抽樣中,我們事先將總體按一定的標(biāo)志進(jìn)行分層,所形成的數(shù)據(jù)實際等同于組距式數(shù)列,在組距式數(shù)列中,總方差需要運用方差加法定理來計算。STAT6.5.1分層抽樣127STAT這就是說,如果要計算總方差,則需分別將組間方差和平均組內(nèi)方差先計算出來。在分層抽樣下,是否真的需要由組間方差和平均組內(nèi)方差相加來計算總方差呢?我們來考察一下分層抽樣的實施過程:層間抽樣:在每一層抽取全面調(diào)查層間方差層內(nèi)抽樣:抽取部分樣本單位抽樣調(diào)查層內(nèi)方差我們說抽樣誤差是抽樣調(diào)查這種調(diào)查方式所特有的誤差,因此上述兩部分誤差中只有由于抽樣調(diào)查所形成的層內(nèi)方差才是抽樣誤差的組成部分,而由于全面調(diào)查所形成的層間方差不是抽樣誤差的組成部分。STAT這就是說,如果要計算總方差,則需分別將組間方128STAT因此,STAT因此,129【例7】某廠有甲、乙兩個車間生產(chǎn)保溫瓶,乙車間產(chǎn)量是甲車間的2倍。現(xiàn)按產(chǎn)量比例共抽查了60支,結(jié)果如下。試以95.45%的可靠程度推斷該廠生產(chǎn)的保溫瓶的平均保溫時間的可能范圍。【例7】某廠有甲、乙兩個車間生產(chǎn)保溫瓶,乙車間產(chǎn)量是甲車間的130【例8】某地一萬住戶,按城鄉(xiāng)比例抽取一千戶,進(jìn)行彩電擁有量調(diào)查,結(jié)果如下。試以95.45%的概率推斷該地彩電擁有戶比率的范圍?!纠?】某地一萬住戶,按城鄉(xiāng)比例抽取一千戶,進(jìn)行彩電擁有量調(diào)131STAT6.5.2整群抽樣與分層抽樣類似,整群抽樣下,總方差的計算仍然需要分解:同樣考察整群抽樣的實施過程:層間抽樣:在部分層中抽取抽樣調(diào)查群間方差層內(nèi)抽樣:抽取全部樣本單位全面調(diào)查群內(nèi)方差類似的,只有群間方差是抽樣誤差的組成部分。
STAT6.5.2整群抽樣132STAT因此,STAT因此,133【例9】某鄉(xiāng)播種某種農(nóng)作物3000畝,分布在60塊地段上,每塊地段50畝?,F(xiàn)抽取5塊地,得資料如下?,F(xiàn)要求以95%的概率估計這種農(nóng)作物的平均畝產(chǎn)??傮w:R=60群樣本:r=5群【例9】某鄉(xiāng)播種某種農(nóng)作物3000畝,總體:R=60群134概念總結(jié)回顧1、解釋抽樣推斷的含義
簡單的講,抽樣推斷就是用樣本中的信息來推斷總體的信息。為什么要進(jìn)行抽樣推斷?這是因為對于我們要研究的的問題來說,有的情況下我們掌握著總體的全部數(shù)據(jù),因此總體的信息我們都能夠得到而不需要推斷。但在大部分情況下,我們對總體的全部數(shù)據(jù)是無法獲得或者沒有必要獲得,這時我們就通過抽取總體中的一部分單位進(jìn)行調(diào)查,利用調(diào)查的結(jié)果來推斷總體的數(shù)量特征。概念總結(jié)回顧1、解釋抽樣推斷的含義1352、解釋簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣和整群抽樣的含義。
簡單隨機抽樣是指從含有N個元素的總體中,抽取n個元素作為樣本,使得每一個容量為n的樣本有相同的機會
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財經(jīng)視角下的現(xiàn)代辦公樓宇管理
- 張家口學(xué)院《畫法幾何與機械制圖二》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京中醫(yī)藥大學(xué)翰林學(xué)院《智慧醫(yī)學(xué)數(shù)據(jù)處理與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 曲阜師范大學(xué)《Python語言基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 中國石油大學(xué)(華東)《數(shù)據(jù)庫高級應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 和君職業(yè)學(xué)院《機器學(xué)習(xí)與模式識別C》2023-2024學(xué)年第二學(xué)期期末試卷
- 南昌工程學(xué)院《精神神經(jīng)系統(tǒng)整合課程》2023-2024學(xué)年第二學(xué)期期末試卷
- 電子科技大學(xué)中山學(xué)院《剪輯技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南城市學(xué)院《人文地理學(xué)實踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南理工職業(yè)技術(shù)學(xué)院《資本運營與公司治理》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年度5G基站建設(shè)勞務(wù)合同范本
- (完整版)班主任量化考核細(xì)則
- 2025年中國鐵路鄭州局集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 2025年上半年永春縣農(nóng)文旅發(fā)展集團(tuán)限公司公開招聘若干名工作人員易考易錯模擬試題(共500題)試卷后附參考答案
- 家庭康復(fù)服務(wù)的商業(yè)價值與發(fā)展趨勢
- 2025年?;髽I(yè)安全教育培訓(xùn)計劃
- 《HR的成長之路》課件
- 2025年山東浪潮集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 裝修完成情況報告范文
- 2024-2024年上海市高考英語試題及答案
- 雙線性濾波器與圖像去噪-洞察分析
評論
0/150
提交評論