第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)_第1頁
第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)_第2頁
第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)_第3頁
第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)_第4頁
第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第十章 統(tǒng)計(jì)量與參數(shù)估計(jì)10.1 樣本與統(tǒng)計(jì)量 一. 總體與樣本 例1 欲了解一批燈泡的壽命X (小時)的分布情況,只能抽取n 個作破壞性試驗(yàn),根據(jù)試驗(yàn)結(jié)果來推斷X 的分布。 1總體與個體 研究對象的全體稱為總體。例1中,我們關(guān)心的是全體燈泡壽命的分布情況,即壽命X 的所有可能的取值及其概率分布。因此壽命X 是連續(xù)的隨機(jī)變量。一般地把我們關(guān)心的隨機(jī)變量X 稱為總體。組成總體的每個單元稱為個體。例1中,我們關(guān)心的是燈泡的壽命。所以個體也可理解為總體X 的取值。 2簡單隨機(jī)抽樣為了使抽樣具有充分的代表性,所以要求: (1)每個個體被抽到的機(jī)會均等; (2)每次抽取是獨(dú)立的(共抽取n 次)。這樣的抽

2、樣叫做簡單隨機(jī)抽樣。通常的抽樣都是無放回的,當(dāng)總體很大時,可以滿足獨(dú)立性。 3樣本 在總體中抽取n 個個體,稱為總體的一個樣本,記為 ( X1 , X2 , , Xn ) ,其中每次抽樣Xi ( i = 1 , 2 , , n )也都是隨機(jī)變量(解釋),共n 個隨機(jī)變量,加上括號,表示樣本是一個整體。 4樣本的容量 抽取的個體數(shù)n ,稱為樣本的容量。5獨(dú)立同分布 每次抽取的Xi 來自總體,應(yīng)該與總體X有相同的分布(概率密度相同),所以說樣本是一組具有獨(dú)立同分布的隨機(jī)變量。 6樣本觀察值(樣本值) 樣本的測試結(jié)果記為 ( x1 , x2 , , xn ) ,是一組數(shù)據(jù),在容易產(chǎn)生誤會時,大小寫要

3、分清,尤其在作理論分析時,一般都取大寫,作為隨機(jī)變量處理。二統(tǒng)計(jì)量 1三個重要統(tǒng)計(jì)量 (1)樣本均值: (2)樣本方差: (3)樣本標(biāo)準(zhǔn)差(又稱為樣本均方差 ): 其中作為均值可以反映總體X的均值(不是等同),S 2 是數(shù)據(jù)與均值偏離值平方的平均,體現(xiàn)樣本的離散程度,因而可以反映總體X的方差。和s(計(jì)算值)可以利用函數(shù)計(jì)算器的統(tǒng)計(jì)功能快速得到(可安排多媒體課件演示)。 2統(tǒng)計(jì)量的概念統(tǒng)計(jì)量是含有樣本X1 , X2 , , Xn 的一個數(shù)學(xué)表達(dá)式,并且式中不含未知參數(shù),因而可以在得到樣本值后立即算出它的數(shù)值來。在抽樣之前,統(tǒng)計(jì)量的值無法確定,抽樣測試之后,可以觀察到它的取值,因此統(tǒng)計(jì)量是隨機(jī)變量

4、,是由樣本派生出來的隨機(jī)變量。三抽樣分布統(tǒng)計(jì)量既然是隨機(jī)變量,當(dāng)然有它的概率分布,稱為抽樣分布。以下僅給出結(jié)論,結(jié)論都對正態(tài)總體而言。1樣本均值的分布(1)若總體,則(獨(dú)立同分布),于是作為線性函數(shù) (2)特別地,標(biāo)準(zhǔn)化以后,得。 2t 分布當(dāng)總體標(biāo)準(zhǔn)差未知時,U 不再是統(tǒng)計(jì)量,這時可用樣本標(biāo)準(zhǔn)差S 代替,但不再是正態(tài)分布,而是一種新的分布叫做服從于自由度的t 分布。它的密度曲線與正態(tài)曲線相類似 (見圖8)。 3分布 為了將樣本方差S 2和總體相比較、聯(lián)系。構(gòu)造出,叫做服從于自由度為的分布,也是一種新的分布。其密度曲線 (見圖9)在原點(diǎn)右側(cè),這是因?yàn)榻y(tǒng)計(jì)量是不會出現(xiàn)負(fù)值的。 、是繼、后第二輪復(fù)

5、合而成的統(tǒng)計(jì)量,可以更有利于實(shí)際的應(yīng)用。四臨界值1設(shè)UN (0,1) ,有關(guān)U 的概率可查表。如果反過來,已知概率,求使或,倒查表得到的稱為標(biāo)準(zhǔn)正態(tài)分布的右側(cè)臨界值,意為右側(cè)的概率為,又叫分位點(diǎn),記為(見圖10)。若求使,則查表得到的是,稱為雙側(cè)臨界值 (見圖11),意為對稱兩側(cè)的概率之和為,它們的概率意義分別是和。比如,。2t 分布和分布的右側(cè)臨界值記為和。括號內(nèi)的n 是自由度,不要與樣本容量相混淆,如,的概率意義為 (見圖12、13)t 分布表和分布表已直接編為臨界值表,不必“倒查表”。正態(tài)分布和t 分布的左側(cè)臨界值是對稱值 和(左側(cè)概率為),不必另行查表。而分布無對稱性,左側(cè)臨界值是(右

6、側(cè)概率是,左側(cè)概率當(dāng)然是)(見圖14),需另行查表。分布的雙側(cè)臨界值(見圖15)是(左)和(右)。例2 求滿足以下概率式的臨界值并給出對應(yīng)的記號(1),則;(2),則;(3),則;(4),則;(5),則。例3 對于查表得到的和,給出它們的概率意義。解 ,。10.2 點(diǎn)估計(jì)一點(diǎn)估計(jì)的概念總體X 的分布類型往往是已知的,如,但它的參數(shù)不知道,要通過樣本來估計(jì),稱為點(diǎn)估計(jì)。二樣本數(shù)字特征法用樣本的均值、方差來估計(jì)總體的均值、方差是很自然的,即,這里在字母上加一個“帽子”是為了表明這僅僅是估計(jì)值而非準(zhǔn)確值。這樣的估計(jì)方法稱為樣本數(shù)字特征法。 例1 某果園有1000株果樹,在采摘前欲估計(jì)果樹的產(chǎn)量,隨機(jī)

7、抽選了10株,產(chǎn)量(公斤)分別為 :161, 68, 45, 102, 38, 87, 100, 92, 76, 90假設(shè)果樹的產(chǎn)量服從正態(tài)分布,試求果樹產(chǎn)量的均值與標(biāo)準(zhǔn)差的估計(jì)值,并估計(jì)一株果樹產(chǎn)量超過100公斤的概率。解 利用計(jì)算器的統(tǒng)計(jì)功能,可計(jì)算得到產(chǎn)量均值公斤,標(biāo)準(zhǔn)差公斤。于是即一株果樹產(chǎn)量超過100公斤的概率為0.34 。三估計(jì)量及其評選標(biāo)準(zhǔn)用來估計(jì)未知參數(shù)的統(tǒng)計(jì)量(如、)稱為估計(jì)量。一般的提法是:設(shè)是總體X 的未知參數(shù),找一個統(tǒng)計(jì)量(表達(dá)式)來估計(jì),即以的觀測值作為的估計(jì)值,則稱為的估計(jì)量。這里是未知的但客觀存在的固定常數(shù),不是隨機(jī)變量,而是隨樣本值而變動的,是隨機(jī)變量。估計(jì)量不

8、是唯一的,可以通過多種途徑和方法去尋找、構(gòu)造,如矩估計(jì)法、最大似然估計(jì)法等,應(yīng)該制定一套評判標(biāo)準(zhǔn)來評價它們的優(yōu)劣。(1)無偏性設(shè)是的估計(jì)值,若,則稱是的無偏估計(jì)量。其統(tǒng)計(jì)意義是:是隨機(jī)變量,它的波動中心(均值)等于,即經(jīng)過多次抽樣,的觀察值將圍繞著變動,沒有“系統(tǒng)”誤差,當(dāng)然是較好的。和都分別是總體均值,總體方差的無偏估計(jì),其中顯然,而的推導(dǎo)復(fù)雜,S 2 的表達(dá)式中,分母是而不是,正是為了滿足無偏性。(2)有效性對于多個無偏估計(jì)量,方差小的波動小,穩(wěn)定性好。即方差越小越好,設(shè)(都是無偏估計(jì)),若,則稱比有效。是的所有無偏估計(jì)中最有效的。10.3 區(qū)間估計(jì)一置信度與置信區(qū)間 有了點(diǎn)估計(jì),還要進(jìn)一

9、步作誤差估計(jì),數(shù)理統(tǒng)計(jì)中的誤差估計(jì)必然具有概率特征,即要用概率去描述,要與概率相聯(lián)系。設(shè)是未知參數(shù),希望確定一個區(qū)間( a , b ) ,使它包含的把握很大,寫成概率式,即 。取時,把握是0.95%。往往事先取定,稱為置信度。( a , b ) 稱為參數(shù)的置信區(qū)間,稱為置信下限,稱為置信上限。二正態(tài)總體的區(qū)間估計(jì)直接求置信區(qū)間難度較大,實(shí)際求解時,往往從已知的統(tǒng)計(jì)量入手。比如統(tǒng)計(jì)量分布已知,如果總體標(biāo)準(zhǔn)差已知,那么關(guān)于U 的不等式變形可得到關(guān)于的不等式,所以只需求A , B ,使即可。滿足此式的區(qū)間很多,其中“區(qū)間居中”是效果最好的,所謂“區(qū)間居中”是指區(qū)間左側(cè)和右側(cè)的概率相等,都等于。因?yàn)檎?/p>

10、態(tài)分布有對稱性,區(qū)間居中的概率公式是,于是可確定,將不等式變形可得(1)正態(tài)總體方差已知時,均值的置信區(qū)間按上面的公式,置信區(qū)間是注意:已知時,應(yīng)借助于U 統(tǒng)計(jì)量,要查正態(tài)分布表;置信區(qū)間有兩個端點(diǎn),所以要找雙側(cè)臨界值(下標(biāo)帶有) 例2 設(shè)總體,測得n = 4 的樣本觀測值為:12.6,13.4,12.8,13.2,求的0.95置信區(qū)間。解 ,已知,采用U 統(tǒng)計(jì)量,查表得,計(jì)算,所以置信限為,置信區(qū)間為( 12.706 , 13.294 )。 (2)正態(tài)總體方差未知時,均值的置信區(qū)間未知,以S 代替,得到t 統(tǒng)計(jì)量,要查t 分布表;置信區(qū)間公式類似為例3 例2中設(shè), 未知,求的置信區(qū)間(?。?。

11、解 計(jì)算得, 。未知,采用t 統(tǒng)計(jì)量,查表得,所以置信限為置信區(qū)間為( 12.419 , 13.581 )。例3的信息量比例2少(未知),在同樣的置信度下置信區(qū)間比較寬,精度比較小是很自然的。 (3)正態(tài)總體方差及標(biāo)準(zhǔn)差的置信區(qū)間統(tǒng)計(jì)量就是為提取的信息而設(shè)計(jì)的,所以借助于統(tǒng)計(jì)量,由概率式及區(qū)間居中原理??傻?,利用不等式變形,得到的置信區(qū)間是。的置信區(qū)間,只需將端點(diǎn)開平方即可 例4 設(shè)零件長度,抽取n = 16件零件測量,經(jīng)計(jì)算得, S 2 = 0.00507,求零件長度與標(biāo)準(zhǔn)差的置信區(qū)間()。解 未知,求的置信區(qū)間應(yīng)采用統(tǒng)計(jì)量,查表得t0.025(15)=2.1315,置信限為均值的置信區(qū)間為( 12.049 , 12.125 )。求的置信區(qū)間,采用統(tǒng)計(jì)量,查表得,的置信區(qū)間為 開方后即標(biāo)準(zhǔn)差的置信區(qū)間:( 0.0526 , 0.1102 ) 三置信度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論