統(tǒng)計(jì)學(xué)課件:第四章 參數(shù)估計(jì)_第1頁
統(tǒng)計(jì)學(xué)課件:第四章 參數(shù)估計(jì)_第2頁
統(tǒng)計(jì)學(xué)課件:第四章 參數(shù)估計(jì)_第3頁
統(tǒng)計(jì)學(xué)課件:第四章 參數(shù)估計(jì)_第4頁
統(tǒng)計(jì)學(xué)課件:第四章 參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 第四章 參 數(shù) 估 計(jì)參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)第一節(jié):參數(shù)估計(jì)的一般問題第二節(jié):一個(gè)總體參數(shù)的區(qū)間估計(jì)第三節(jié):兩個(gè)總體參數(shù)的區(qū)間估計(jì)第四節(jié):樣本容量的選擇第一節(jié) 參數(shù)估計(jì)的一般問題一、估計(jì)量與估計(jì)值二、判斷估計(jì)量的優(yōu)良性原則三、估計(jì)方法 1.用于估計(jì)總體某一參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本中位數(shù)等例如: 樣本均值就是總體均值的一個(gè)估計(jì)量如果樣本均值 x = 3 ,則 3 就是對總體均值的估計(jì)值 2、理論基礎(chǔ)是抽樣分布 一、估計(jì)量與估計(jì)值二、判斷估計(jì)量優(yōu)良性原則無偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì) 的總體參數(shù)P( X )XCA無偏有偏AB中位數(shù)的

2、抽樣分布均值的抽樣分布XP(X )有效性:一個(gè)方差較小的無偏估計(jì)量稱為一個(gè)更有效的估計(jì)量。如:與其他估計(jì)量相比,樣本均值是一個(gè)更有效的估計(jì)量一致性:隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X )X三、參數(shù)估計(jì)的方法估 計(jì) 方 法點(diǎn) 估 計(jì)區(qū)間估計(jì)估計(jì)方法點(diǎn)估計(jì)1、從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì) 例如: 用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì)2、點(diǎn)估計(jì)沒有給出估計(jì)值接近總體未知參數(shù)程度的信息,很難控制誤差3、點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等思考:點(diǎn)估計(jì)實(shí)際上只有一

3、個(gè)取值,怎樣的估計(jì)會更科學(xué)?引例1 蓋洛普公司就消費(fèi)者對美國產(chǎn)品質(zhì)量的看法,對美國、德國、日本的消費(fèi)者分別進(jìn)行調(diào)查,結(jié)果表明:有55%的美國人相信美國產(chǎn)品的質(zhì)量非常好,而持同樣看法的德國人和日本人的比例分別是26%和17%,美聯(lián)社在報(bào)道這項(xiàng)調(diào)查結(jié)果時(shí)曾提到“抽樣誤差在正、負(fù)三個(gè)百分點(diǎn)之間”,在報(bào)道中,“正、負(fù)三個(gè)百分點(diǎn)”這句話有什么作用?引例2 銷售經(jīng)理想估計(jì)一下明年的出口總值,甲估計(jì)是53萬美元,乙估計(jì)是5056萬美元之間,并可以確切地說“有95%的把握”。哪一個(gè)更可信,為什么? 5056萬美元的范圍是如何計(jì)算的?“有95%的把握”是什么意思?區(qū)間估計(jì)1.根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估

4、計(jì)范圍并給出總體參數(shù)落在這一區(qū)間的可信度例如: 總體均值落在5070之間,置信度為95%樣本統(tǒng)計(jì)量 (點(diǎn)估計(jì))置信區(qū)間置信下限置信上限 區(qū)間估計(jì)就是根據(jù)樣本估計(jì)量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。 分別稱為置信下限和置信上限,通稱為置信限。 為顯著性水平, 則稱為置信度。區(qū)間估計(jì)中幾個(gè)常用的概念置信度、顯著性水平置信區(qū)間、置信限置信度1、置信度(置信系數(shù)):總體未知參數(shù)落在所估計(jì)區(qū)間內(nèi)的可信度(可靠度)2 、置信度用1-表示。置信度越大,估計(jì)區(qū)間內(nèi)所包含總體參數(shù)的可信度越高。(稱為顯著性水平:與總體參數(shù)存在顯著差異的比例) 3 、常用的置信度有 99%, 95%, 90% 95.45%

5、,99.73%(事先給定的)x95.45%的 - 2x +2x99.73%的 - 3x +3x90%的 -1.65 x +1.65x均值的抽樣分布:例如:教材第16題(3)若從該種電池中隨機(jī)抽取25個(gè)電池檢驗(yàn),該樣本電池的平均壽命在200小時(shí)左右多大的范圍內(nèi)概率不小于0.9?(4)若已知該樣本電池的平均壽命為198小時(shí),標(biāo)準(zhǔn)差為30小時(shí),而總體平均壽命未知,那么總體平均壽命在198左右多大的范圍內(nèi)可信度不小于0.9呢?但實(shí)際估計(jì)時(shí),情況恰好相反。 是已知的,而 是未知的,也正是我們想要估計(jì)的。由于 與 的距離是對稱的,如果某個(gè) 落在 的1.65倍標(biāo)準(zhǔn)差的范圍之內(nèi),那么反過來, 也落在以 為中心

6、、兩側(cè)1.65倍標(biāo)準(zhǔn)差的范圍之內(nèi),這意味著,有90%的樣本均值所構(gòu)造的1.65倍標(biāo)準(zhǔn)差的區(qū)間會包括 。理論基礎(chǔ):抽樣分布置信度的圖示x90%的樣本 -1.65 x +1.65x均值的抽樣分布:在電池壽命的例題中,若樣本的平均使用壽命為198,標(biāo)準(zhǔn)差為30,以0.9的置信度建立總體均值的置信區(qū)間會如何?置信度的圖示x90%的樣本 -1.65 x +1.65x均值的抽樣分布:根據(jù)抽樣分布理論得:抽樣分布為正態(tài)分布,按90%的置信度區(qū)間半徑應(yīng)為每一個(gè)可能樣本都可以建立一個(gè)90%置信度的半徑相同的區(qū)間 對置信度的理解 均值的抽樣分布:(1 - ) % 區(qū)間包含了, % 的區(qū)間未包含1 - aa/2a/

7、2 置信度是表示多次抽樣得到的區(qū)間中大概有多少區(qū)間包含總體參數(shù),也可以理解為某個(gè)樣本有多大的概率是這些包含總體參數(shù)的區(qū)間中的一個(gè) 對置信區(qū)間的理解 置信區(qū)間是由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值 我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間與置信限 置信區(qū)間: 與一個(gè)“置信度”相聯(lián)系的估計(jì)值的取值范圍。用 表示置信限:與置信區(qū)間相聯(lián)系的界限,包括上限和下限。思考: 置信區(qū)間與置信度的關(guān)系? 置信度與估計(jì)的精度的關(guān)系?第二節(jié)

8、 一個(gè)總體參數(shù)的估計(jì)大樣本小樣本均 值方 差比 例置 信 區(qū) 間大樣本大樣本【引例】 某食品進(jìn)出口公司向東南亞出口一批花生制品,管理人員從中抽取50包作為樣本,計(jì)算其平均數(shù)為250克。另外,合同規(guī)定總體標(biāo)準(zhǔn)差為6克。 分析: “這個(gè)估計(jì)量的平均誤差是多少?” “總體平均數(shù)可能落入樣本平均數(shù)上、下多大范圍內(nèi)?” “這個(gè)估計(jì)值的可靠程度是多少?” 確定抽樣分布 (2)抽樣平均誤差(3)若用250克這個(gè)估計(jì)值估計(jì)總體平均數(shù),其平均誤差 為0.8487。 (4)總體平均數(shù)在2500.8487克之間的可信度為68.26%??傮w平均數(shù)在25020.8487克之間的可信度為95.45%??傮w平均數(shù)在2503

9、0.8487克之間的可信度為99.73%。解析過程:總結(jié)做區(qū)間估計(jì)的必要條件影響區(qū)間寬度(半徑)的因素1. 總體數(shù)據(jù)的離散程度,用 來測度2. 樣本容量,影響3.置信水平 (1 -),影響 z 的大小68.26%180%1.2890%1.64595%1.9695.45%299%2.5899.73%3總體均值的置信區(qū)間 (大樣本的估計(jì)方法)1.假定條件總體服從正態(tài)分布,且總體方差()已知如果不是正態(tài)分布,但為大樣本 (n 30)使用正態(tài)分布統(tǒng)計(jì)量總體均值 在1- 置信水平下的置信區(qū)間即當(dāng)已知樣本均值:其中抽樣極限誤差為:(一)正態(tài)總體、方差已知 (大、小樣本) 總體均值 在1- 置信水平下的置信

10、區(qū)間為:例題1: 某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取件,測得其平均長度為21.4 mm。已知總體標(biāo)準(zhǔn)差 =0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95。解:已知N(,0.152),x21.4, n=9, 1- = 0.95/2=1.96 總體均值的置信區(qū)間為:結(jié)論: 我們可以95的置信度保證該種零件的平均長度在21.302 - 21.498 mm之間例題2: 某企業(yè)從長期實(shí)踐得知,其產(chǎn)品直徑X是一隨機(jī)變量,服從標(biāo)準(zhǔn)差為0.05的正態(tài)分布。從某日產(chǎn)品中隨機(jī)抽取6個(gè),測得其直徑分別為14.8,15.3, 15.1, 15, 14.7, 15.1 (單位:厘米)

11、。在0.95的置信度下,試求該產(chǎn)品直徑的均值的置信區(qū)間。(二)大樣本(總體分布未知) 1、方差已知 例題3: 某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。試以95的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36)。解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96總體均值區(qū)間為:結(jié)論:我們可以95的置信度保證平均每天參加鍛煉的時(shí)間在24.824 - 27.176 分鐘之間 例題4: 某企業(yè)購進(jìn)一批部件,這批部件的質(zhì)量取決于平均每件的缺陷數(shù)。根據(jù)以往的經(jīng)驗(yàn),平均每件產(chǎn)品的缺陷數(shù)為1,標(biāo)準(zhǔn)差為0.2,如果缺陷

12、數(shù)超過1就應(yīng)該拒收?,F(xiàn)隨機(jī)抽取64件,其平均缺陷數(shù)為1.1,要求以95%的置信系數(shù)構(gòu)造缺陷數(shù)的置信界限,并決定是否拒收。 2、方差未知 分析:大樣本情形下,當(dāng)方差未知時(shí),用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差 例題5: 某藥廠在生產(chǎn)過程中改換了一種新的酵素,測定了36批的產(chǎn)出率與理論產(chǎn)出率的比值: 1.28 1.31 1.48 1.10 0.99 1.25 1.22 1.65 1.40 0.95 1.25 1.32 1.23 1.43 1.24 1.73 1.35 1.31 0.92 1.10 1.05 1.39 1.16 1.19 1.41 0.98 0.82 1.22 0.91 1.26 1.32 1

13、.71 1.29 1.17 1.74 1.51 要求:(1)計(jì)算這一比值95%的置信區(qū)間; (2)得出上述結(jié)論時(shí)作了什么假設(shè); (3)能否以95%的置信水平說明新酵素的產(chǎn)出率提高了。(2)假設(shè)36批的樣本是隨機(jī)的。(3)置信區(qū)間(1.194,1.342)1,說明新酵素的產(chǎn)出率提高了。例題6: 某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用非重復(fù)抽樣 抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標(biāo)準(zhǔn)差為4.5件,試以95.45%的置信度估計(jì)平均產(chǎn)量的抽樣極限誤差和置信區(qū)間。(一)t分布介紹(二)如何用t分布做區(qū)間估計(jì)總體均值的置信區(qū)間(小樣本的估計(jì)方法)t分布 小樣本理論 t

14、分布也稱“學(xué)生分布” 。19081909年,英國統(tǒng)計(jì)學(xué)家戈塞特(Gosset),以筆名(Student)陸續(xù)在生物計(jì)量學(xué)雜志上發(fā)表了三篇文章:“平均數(shù)的概差”、“相關(guān)系數(shù)的概差”、“論非隨機(jī)樣本平均數(shù)的分布”,從而奠定了“小樣本理論”的基礎(chǔ),并使他獲得了崇高的榮譽(yù)。因此t分布也稱“學(xué)生分布”。小樣本理論的先驅(qū)稱其為服從自由度為n-1的t分布t 分布圖形特征 t分布也是對稱分布,形狀比正態(tài)分布更平緩些,當(dāng)n30時(shí)t分布與正態(tài)分布很接近。 t分布特征: (1)t分布平均數(shù)所處的曲線峰頂?shù)陀谡龖B(tài)分布; (2)t分布兩個(gè)尾端的面積按一定比例比正態(tài)分布多起來; (3)如果包含曲線下相同的面積,t分布的界

15、限離開平均數(shù)更遠(yuǎn)些。t00.051.7291t02.093-2.0930.0250.025當(dāng)=0.05,n=20 df=19時(shí),t=1.7291t分布表當(dāng)=0.05,n=20 df=19時(shí),t=1.7291 =0.10, n=15 t=? =0.05, n=10 t=? =0.025,n=10 t=?(二)如何用t分布進(jìn)行區(qū)間估計(jì)正態(tài)總體、方差未知、小樣本( ) 例題1: 某商場從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估計(jì)這批食品的平均每袋重量的區(qū)間范圍及其允許誤差。

16、例題2: 為管理的需要,銀行要測定在業(yè)務(wù)柜臺上每筆業(yè)務(wù)平均所需的時(shí)間。假設(shè)每筆業(yè)務(wù)所需時(shí)間服從正態(tài)分布,現(xiàn)隨機(jī)抽取樣本量為16,測得平均時(shí)間為13分鐘,標(biāo)準(zhǔn)差為5.6分鐘,要求以99%的置信系數(shù)確定置信界限。若置信系數(shù)改為90%,其置信界限有什么區(qū)別? 樣本比例的區(qū)間估計(jì)理論基礎(chǔ):抽樣分布總體比例的置信區(qū)間1.假定條件兩類結(jié)果(交替標(biāo)志或二項(xiàng)總體)大樣本條件下可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量3. 總體比例 的置信區(qū)間為:重復(fù)抽樣:不重復(fù)抽樣:例題1: 某企業(yè)在一項(xiàng)關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了200人組成一個(gè)樣本。在對其進(jìn)行訪問時(shí),有140人說他們離開該企業(yè)是

17、由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。解:已知 n=200 , p0.7 , 1-= 0.95,/2=1.96結(jié)論:我們可以95的置信度保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%76.4%之間 例題2: 某廠對一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗(yàn),采用重復(fù)抽樣抽取樣品200只,樣本優(yōu)質(zhì)品率為85%,試計(jì)算把握程度為90%時(shí)優(yōu)質(zhì)品率的區(qū)間范圍。第四節(jié): 樣本容量的確定滿足條件: 給定的置信度 最大允許誤差一、抽樣極限誤差 抽樣極限誤差也稱允許誤差,是指在一定置信度下抽樣誤差的可能范圍。思考:抽樣極限誤差與估計(jì)精度的關(guān)系其中抽樣極

18、限誤差為:二、樣本容量的確定 所謂必要的抽樣數(shù)目,也就是指為了使抽樣誤差不超過給定的允許范圍至少應(yīng)抽取的樣本單位數(shù)目。根據(jù)均值區(qū)間估計(jì)公式可得樣本容量n為估計(jì)總體均值時(shí)樣本容量的確定 樣本容量n與總體方差2、允許誤差、可靠性系數(shù)Z 之間的關(guān)系為與總體方差成正比與允許誤差成反比與可靠性系數(shù)成正比其中: 例題1: 一家廣告公想估計(jì)某類商店去年所花的平均廣告費(fèi)用有多少。經(jīng)驗(yàn)表明,總體方差約為1800000元。如置信度取95%,并要使估計(jì)處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?解:已知2=1800000,=0.05, Z/2=1.96,=500 應(yīng)抽取的樣本容量為: 例題2: 某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45%的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?不重復(fù)抽樣:估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論