有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章_第1頁
有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章_第2頁
有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章_第3頁
有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章_第4頁
有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

有限數(shù)據(jù)統(tǒng)計(jì)處理(總體參數(shù)估計(jì))第三章第一頁,共43頁。3.13.2總體的參數(shù)估計(jì)期望值和方差、參數(shù)估計(jì)一般統(tǒng)計(jì)檢驗(yàn)平均值檢驗(yàn)、F檢驗(yàn)、離群值檢驗(yàn)內(nèi)容第二頁,共43頁??傮w、個(gè)體和樣本:總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個(gè)體(Itemunit):組成總體的每個(gè)元素樣本(Sample):從總體中所抽取的部分個(gè)體樣本容量(Samplesize):樣本中所含個(gè)體的數(shù)量第三頁,共43頁。示例:有限數(shù)據(jù)的統(tǒng)計(jì)處理總體樣本甲樣本容量平均值500g乙平行測定3次平行測定4次丙平行測定4次有限數(shù)據(jù)的處理:計(jì)算估計(jì)顯著性檢驗(yàn)沒有系統(tǒng)誤差,=T有系統(tǒng)誤差,T第四頁,共43頁。3.1.1期望值和方差數(shù)據(jù)集中趨勢的表示:對一B物質(zhì)客觀存在量為T的分析對象進(jìn)行分析,得到n個(gè)個(gè)別測定值x1、x2、x3、???xn,平均值A(chǔ)verage有限次測量:測量值向平均值集中無限次測量:測量值向總體平均值

集中——數(shù)據(jù)集中趨勢和分散程度的表示第五頁,共43頁。數(shù)據(jù)分散程度的表示:極差RRange相對極差R偏差Deviation平均偏差Meandeviation相對平均偏差relativemeandeviation標(biāo)準(zhǔn)偏差standarddeviation相對標(biāo)準(zhǔn)偏差(變異系數(shù))Relativestandarddeviation(Coefficientofvariation,CV)第六頁,共43頁??傮w標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)偏差的比較:總體標(biāo)準(zhǔn)偏差標(biāo)準(zhǔn)偏差無限次測量,對總體平均值的離散有限次測量對平均值的離散自由度計(jì)算一組數(shù)據(jù)分散度的獨(dú)立偏差數(shù)自由度的理解:例如,有三個(gè)測量值,求得平均值,也知道x1和x2與平均值的差值,那么,x3與平均值的差值就是確定的了,不是一個(gè)獨(dú)立的變數(shù)。第七頁,共43頁。平均值的標(biāo)準(zhǔn)偏差:平均值的總體標(biāo)準(zhǔn)偏差對有限次測量S(x)的物理意義:在有限次測量中,每個(gè)測量值平均所具有的標(biāo)準(zhǔn)偏差。第八頁,共43頁。對有限次測量:1、增加測量次數(shù)可以提高精密度。2、增加(過多)測量次數(shù)的代價(jià)不一定能從減小誤差得到補(bǔ)償。結(jié)論:測量次數(shù)第九頁,共43頁。期望值和方差在概率論和統(tǒng)計(jì)學(xué)中,期望值(或數(shù)學(xué)期望、或均值,亦簡稱期望,物理學(xué)中稱為期待值)是指在一個(gè)離散性隨機(jī)變量試驗(yàn)中每次可能結(jié)果的概率乘以其結(jié)果的總和。換句話說,期望值是隨機(jī)試驗(yàn)在同樣的機(jī)會下重復(fù)多次的結(jié)果計(jì)算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常識中的“期望”——“期望值”也許與每一個(gè)結(jié)果都不相等。(換句話說,期望值是該變量輸出值的平均數(shù)。期望值并不一定包含于變量的輸出值集合里。)方差(variance)是在概率論和統(tǒng)計(jì)方差衡量隨機(jī)變量或一組數(shù)據(jù)是離散程度的度量。統(tǒng)計(jì)中的方差(樣本方差)是各個(gè)數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù)。在許多實(shí)際問題中,研究方差即偏離程度有著重要意義。第十頁,共43頁。3.1.2參數(shù)估計(jì)矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)在實(shí)際生活中,我們不能通過去測定無限多次去獲得和2但可以利用樣本的統(tǒng)計(jì)量對總體平均值()和方差(2)進(jìn)行估算第十一頁,共43頁。一、點(diǎn)估計(jì)從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)例如:用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì)2.點(diǎn)估計(jì)沒有給出估計(jì)值接近總體未知參數(shù)程度的信息點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等概念要點(diǎn):第十二頁,共43頁。被估計(jì)的總體參數(shù)總體參數(shù)符號表示用于估計(jì)的樣本統(tǒng)計(jì)量一個(gè)總體均值方差兩個(gè)總體均值之差方差比第十三頁,共43頁。估計(jì)量的優(yōu)良性準(zhǔn)則無偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)

P(X)XCA無偏有偏第十四頁,共43頁。AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)

有效性:一個(gè)方差較小的無偏估計(jì)量稱為一個(gè)更有效的估計(jì)量。如,與其他估計(jì)量樣本相比均值是一個(gè)更有效的估計(jì)量。第十五頁,共43頁。充分性:作為估計(jì)參數(shù)用的統(tǒng)計(jì)量已經(jīng)提取了樣本中所有可利用的信息(隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù))。

AB較小的樣本容量較大的樣本容量P(X)X第十六頁,共43頁。問題:在

的某個(gè)范圍

內(nèi)包含的概率有多大?對有限次測量1、概率2、區(qū)間界限,多大區(qū)間置信水平Confidencelevel置信度DegreeofconfidenceProbabilitylevel置信區(qū)間Confidenceinterval置信界限Confidencelimit必然的聯(lián)系這個(gè)問題涉及兩個(gè)方面:二、區(qū)間估計(jì)第十七頁,共43頁??傮w平均值的置信區(qū)間概率區(qū)間大小例:

包含在區(qū)間幾率相對大幾率相對小幾率為100%無意義平均值的置信區(qū)間的問題第十八頁,共43頁。二、區(qū)間估計(jì)在實(shí)際測定分析中,為了評價(jià)測定結(jié)果的可靠性,人們總希望能夠估計(jì)出實(shí)際有限次測定的平均值與真實(shí)值的接近程度,即在測量值附近估計(jì)出真實(shí)值可能存在的范圍以及試樣含量落在此范圍內(nèi)的概率,從而說明分析結(jié)果的可靠程度。由此引出置信區(qū)間與置信概率的問題。置信區(qū)間和置信概率第十九頁,共43頁。置信區(qū)間與置信概率1.根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在50~70之間,置信度為95%樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限概念要點(diǎn):第二十頁,共43頁。置信區(qū)間無限多次測定中才有總體平均值和總體標(biāo)準(zhǔn)偏差,而實(shí)際測定為有限次測定,與未知,只能用有限次測定的平均值及標(biāo)準(zhǔn)偏差S來估計(jì)。用S代替引起的誤差可用校正系數(shù)t來補(bǔ)償。第二十一頁,共43頁。置信區(qū)間和置信概率總體平均值將包括在區(qū)間內(nèi),即包括在X平均值附近的某區(qū)間內(nèi)。因此稱在的區(qū)間為置信區(qū)間。置信區(qū)間:在一定置信度下,以測定結(jié)果x為中心的,包括總體平均值在內(nèi)的可靠性范圍。把測定值在置信區(qū)間內(nèi)出現(xiàn)的概率稱為置信概率(P),也稱為置信度。第二十二頁,共43頁。置信水平:

總體未知參數(shù)落在區(qū)間內(nèi)的概率表示為P=

(1-)%為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的置信水平值有99%,95%,90%相應(yīng)的為為0.01,0.05.0.10第二十三頁,共43頁。置信區(qū)間與置信水平:均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1-aa/2a/2第二十四頁,共43頁。置信區(qū)間與置信概率第二十五頁,共43頁。置信區(qū)間與置信概率t分布表第二十六頁,共43頁。置信區(qū)間和置信概率結(jié)論:(1)根據(jù)平均值x,查t可求出可能存在的范圍即置信區(qū)間。(2)測定次數(shù)越多、精密度越高、S越小,置信區(qū)間就越小,算術(shù)平均值和總體平均值越接近,算術(shù)平均值的可靠性就越大,因此用置信區(qū)間表示分析結(jié)果更合理。(3)t越小,置信區(qū)間越小,校正系數(shù)t與自由度有關(guān),f=n-1,測定次數(shù)越多,t越小,當(dāng)n,t分布曲線為正態(tài)分布曲線。第二十七頁,共43頁。置信區(qū)間和置信概率結(jié)論:(4)t值隨測定次數(shù)的增加而減小,隨置信概率的提高而增大。當(dāng)測定次數(shù)較少時(shí),可適當(dāng)增加測定次數(shù),縮小置信區(qū)間,從而使測定值的平均值與總體平均值更接近。(5)比較兩個(gè)或多個(gè)測定結(jié)果的準(zhǔn)確程度,應(yīng)在同一置信概率下進(jìn)行。第二十八頁,共43頁。(三)總體平均數(shù)的區(qū)間估計(jì)1、大樣本條件下的區(qū)間估計(jì)●(1)、總體標(biāo)準(zhǔn)差σ已知條件下,對總體平均數(shù)的區(qū)間估計(jì)第二十九頁,共43頁?!咐?:某茶葉進(jìn)出口公司,準(zhǔn)備處理一批庫存2年的茶葉,出庫之前要進(jìn)行一次檢驗(yàn)。檢驗(yàn)數(shù)據(jù)如下;樣本容量為64包,樣本平均數(shù)為每包2公斤,入庫記錄表明總體標(biāo)準(zhǔn)差為0.2公斤。經(jīng)理要求在95%的可信度下,估計(jì)一下這批茶葉的平均重量在多大范圍內(nèi)?第三十頁,共43頁。解:答:這批茶葉平均重量在1.951—2.049公斤,其可信程度為95%。第三十一頁,共43頁。(2)、總體標(biāo)準(zhǔn)差σ未知條件下的區(qū)間估計(jì)※總體標(biāo)準(zhǔn)差σ未知條件下,一般用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差σ。第三十二頁,共43頁。案例:某項(xiàng)抽樣調(diào)查中獲得如下資料:N可以視為無限總體,n=81,樣本平均數(shù)為500,樣本標(biāo)準(zhǔn)差為90,求:總體平均數(shù)可信度為90%的置信區(qū)間。解:答:此項(xiàng)調(diào)查中,總體平均數(shù)的可信度為90%的置信區(qū)間是在483.55—516.45之間。第三十三頁,共43頁。2、小樣本條件下的區(qū)間估計(jì)(1)、總體標(biāo)準(zhǔn)差σ已知條件下,對總體平均數(shù)的區(qū)間估計(jì)使用t分布的條件:當(dāng)樣本容量n<30,且總體標(biāo)準(zhǔn)差σ未知時(shí),用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差σ。樣本標(biāo)準(zhǔn)差S

第三十四頁,共43頁。計(jì)算公式:

第三十五頁,共43頁。例1:從大學(xué)一年級學(xué)生中隨機(jī)抽取12名學(xué)生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試評估一下大學(xué)一年級學(xué)生閱讀能力的總體平均分?jǐn)?shù)。要求置信度分別是95%和99%。第三十六頁,共43頁。解:步驟:(1)計(jì)算樣本平均數(shù):(2)計(jì)算樣本標(biāo)準(zhǔn)差:(3)計(jì)算平均誤差:(4)確認(rèn)自由度:df=12-1=11,誤差概率:α=1-0.95=0.05,查表,t=2.201第三十七頁,共43頁。(5)估計(jì)總體平均數(shù)置信區(qū)間:解釋:有95%的把握程度說大學(xué)一年級學(xué)生閱讀能力平均分?jǐn)?shù)在27.311—32.523分之間。當(dāng)α=1-0.99=0.01,查表,t=3.10629.917-3.106×1.184=26.24;29.917+3.106×1.184=33.59。第三十八頁,共43頁。置信區(qū)間和置信概率例:某銨鹽含氮量的測定結(jié)果x=21.30%,S=0.06%,n=4。求置信概率為95%和99%時(shí)平均值的置信區(qū)間?若n=10(假定其它數(shù)據(jù)不變),置信概率為99%時(shí)平均值的置信區(qū)間為多少?

第三十九頁,共43頁。

第四十頁,共43頁。置信區(qū)間和置信概率注意:例題結(jié)果說明(1)置信概率的高低反映測定值的可靠程度。置信概率并非越高越好,因?yàn)镻值增大,t增大,置信區(qū)間增大,測定值的精密度降低,100%置信概率就意味著置信區(qū)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論