版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)理統(tǒng)計(jì)講義精品文檔《數(shù)理統(tǒng)計(jì)》教案收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第一章統(tǒng)計(jì)量及其抽樣分布第一節(jié) 總體與樣本教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的兩個(gè)基本概念 :總體和樣本,以及與這兩個(gè)基本概念相關(guān)的統(tǒng)計(jì)基本思想和樣本分布。教學(xué)重點(diǎn):掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想 .教學(xué)難點(diǎn):掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想 .一、總體與個(gè)體在一個(gè)統(tǒng)計(jì)問題中,我們把研究對(duì)象的全體稱為總體,構(gòu)成總體的每個(gè)成員稱為個(gè)體。對(duì)多數(shù)實(shí)際問題。總體中的個(gè)體是一些實(shí)在的人或物。比如,我們要研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)上,每個(gè)學(xué)生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問題中,我們關(guān)心的只是該校學(xué)生的身高如何,對(duì)其他的特征暫不予以考慮。這樣,每個(gè)學(xué)生(個(gè)體)所具有的數(shù)量指標(biāo)值——身高就是個(gè)體,而將所有身高全體看成總體。這樣一來,若拋開實(shí)際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的機(jī)會(huì)多,有的出現(xiàn)的機(jī)會(huì)少,因此用一個(gè)概率分布去描述和歸納總體是恰當(dāng)?shù)摹倪@個(gè)意義上看,總體就是一個(gè)分布,而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個(gè)意思。例1.考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體={該廠生產(chǎn)的全部合格品與不合格品}={由 0或1組成的一堆數(shù)}。若以p表示這堆數(shù)中 1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:不同的p反映了總體間的差異。例如,兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:我們可以看到,第一個(gè)工廠的產(chǎn)品質(zhì)量?jī)?yōu)于第二個(gè)工廠。實(shí)際中,分布中的不合格品率是未知的,如何對(duì)之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問題。二、樣本為了了解總體的分布,我們從總體中隨機(jī)地抽取n個(gè)個(gè)體,記其指標(biāo)值為x1,x2,?,xn,則x1,x2,?,xn稱為總體的一個(gè)樣本,n稱為樣本容量,或簡(jiǎn)稱樣本量,樣本中的個(gè)體稱為樣品。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫字母X1,X2,?,Xn表示;另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小寫字母x,x,?,x表示是恰當(dāng)?shù)?。?jiǎn)單起見,無12n論是樣本還是其觀測(cè)值,本書中樣本一般均用1,x2,?,xn表示,讀者應(yīng)能從上x下文中加以區(qū)別。例2.啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,,由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640g,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量,得到如下結(jié)果:641635640637642638645643639640這是一個(gè)容量為10的樣本的觀測(cè)值。對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。從總體中抽取樣本時(shí),為使樣本具有代表性,抽樣必須是隨機(jī)抽樣。通??梢杂秒S機(jī)數(shù)表來實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨(dú)立的,即每次的結(jié)果互不影響。在概率論中,在有限總體(只有有限個(gè)個(gè)體的總體)中進(jìn)行有放回抽樣,是獨(dú)立的隨機(jī)抽樣;然而,若為不放回抽樣,則是不獨(dú)立的抽樣。但當(dāng)總體容量N很大但樣本容量 n較小 時(shí),不放回抽樣可以近似地看做放回抽樣,即可近似看做獨(dú)立隨機(jī)抽樣。下面,我們假定抽樣方式總滿足獨(dú)立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對(duì)總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對(duì)抽樣方法提出一些要求,最常用的“簡(jiǎn)單隨機(jī)抽樣”有如下兩個(gè)要求:1)樣本具有隨機(jī)性,即要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。2)樣本要有獨(dú)立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,?,xn相互獨(dú)立。用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,也簡(jiǎn)稱樣本。除非特別指明,本書中的樣本皆為簡(jiǎn)單隨機(jī)樣本。于是,樣本x1,x2,?,xn可以看成是相互獨(dú)立的具有同一分布的隨機(jī)變量,其共同分布即為總體分布。設(shè)總體X具有分布函數(shù)F(x),x1,x2,?,xn為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為:若總體具有密度函數(shù) f(x),則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量,則樣本的(聯(lián)合)概率函數(shù)為顯然,通常說的樣本分布是指多維隨機(jī)變量( x1,x2,?,xn)的聯(lián)合分布。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔例3.為估計(jì)一物件的重量μ,用一架天平重復(fù)測(cè)量n次,得樣本x1,x2,?,xn,由于是獨(dú)立重復(fù)測(cè)量,x1,x2,?,xn是簡(jiǎn)單隨機(jī)樣本。總體的分布即x1的分布(x1,x2,?,xn分布相同)。由于稱量誤差是均值(期望)為零的正態(tài)變量,2所以x1可認(rèn)為服從正態(tài)分布 N(μ,σ)(X1等于物件重量 μ)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。例4.設(shè)某種電燈泡的壽命X服從指數(shù)分布E(λ),其概率密度為:則來自這一總體的簡(jiǎn)單隨機(jī)樣本x1,x2,?,xn的樣本分布密度為例5.考慮電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù)X。求來自這一總體的簡(jiǎn)單隨機(jī)樣本1,x2,?,xn的樣本分布。解由概率論知識(shí),X服從泊松分布P(λ),其概率函數(shù),(其中x是非負(fù)整數(shù){0,1,2,?,k,?}中的一個(gè))。從而,簡(jiǎn)單隨機(jī)樣本x1,x2,?,xn的樣本分布為:收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第二節(jié) 統(tǒng)計(jì)量及其分布教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的基本概念:統(tǒng)計(jì)量,熟練掌握樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的計(jì)算公式,掌握次序統(tǒng)計(jì)量及其抽樣分布。能用 R軟件來計(jì)算這些常用統(tǒng)計(jì)量,能用 R軟件來產(chǎn)生分布的隨機(jī)數(shù)以進(jìn)行隨機(jī)模擬。教學(xué)重點(diǎn):樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的求法;次序統(tǒng)計(jì)量的抽樣分布。教學(xué)難點(diǎn):次序統(tǒng)計(jì)量的抽樣分布。一、統(tǒng)計(jì)量與抽樣分布樣本來自總體,樣本的觀測(cè)值中含有總體各方面的信息,但這些信息較為分散,有時(shí)顯得雜亂無章。為將這些分散在樣本中有關(guān)總體的信息集中起來以反映總體的各種特征,需要對(duì)樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義1.設(shè)x1,x2,?,xn為取自某總體的樣本,若樣本函數(shù)T=T(x1,x2,?,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。按照這一定義,若 x1,x2,?,xn為樣本,則 , 都是統(tǒng)計(jì)量,而當(dāng)2,等均不是統(tǒng)計(jì)量。μ,σ未知時(shí),二、樣本均值及其抽樣分布定義2.設(shè)x1,x2,?,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即。例6.某單位收集到20名青年人某月的娛樂支出費(fèi)用數(shù)據(jù):79848488929394979899100101101102102108110113118125則該月這20名青年的平均娛樂支出為對(duì)于樣本均值 的抽樣分布,我們有下面的定理。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔定理1.設(shè)x1,x2,?,xn是來自某個(gè)總體 X的樣本,為樣本均值。(1)若總體分布為2;N(μ,σ),則的精確分布為2(2)若總體X分布未知(或不是正態(tài)分布),且E(X)=μ,D(X)=σ,則當(dāng)樣本容量n較大時(shí),的漸近分布為,這里的漸近分布是指n較大時(shí)的近似分布。證明(1)由于為獨(dú)立正態(tài)變量線性組合,故仍服從正態(tài)分布。另外,故(2)易知 為獨(dú)立、同分布的隨機(jī)變量之和,且。由中心極限定理,,其中Φ(x)為標(biāo)準(zhǔn)正態(tài)分布。這表明 n較大時(shí)的漸近分布為 。三、樣本方差與樣本標(biāo)準(zhǔn)差定義3.設(shè)x1,x2,?,xn為取自某總體的樣本,則它關(guān)于樣本均值的平均偏差平方和稱為樣本方差,其算術(shù)根 稱為樣本標(biāo)準(zhǔn)差。相對(duì)樣本方差而言,樣本標(biāo)準(zhǔn)差通常更有實(shí)際意義,因?yàn)樗c樣本均值具有相同的度量單位。在上面定義中,n為樣本容量, 稱為偏差平方和,它有3個(gè)不同的表達(dá)式:事實(shí)上,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔,偏差平方和的這 3個(gè)表達(dá)式都可用來計(jì)算樣本方差。例7.在例6中,我們已經(jīng)算得 ,其樣本方差與樣本標(biāo)準(zhǔn)差為,。方法二s=11.5731通常用第二種方法計(jì)算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望,它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。定理2.設(shè)總體X具有二階矩,即2E(x)=μ,D(X)=σ<+∞x1,x2,?,xn為從該總體得到的樣本, 和s2分別是樣本均值和樣本方差,則此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的 。證明 由于1)2)且有:,而,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔于是,兩邊各除以n-1,即得證。值得讀者注意的是:本定理的結(jié)論與總體服從什么分布無關(guān)。四、樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計(jì)量。定義4.設(shè)x1,x2,?,xn是樣本,則統(tǒng)計(jì)量稱為樣本k階原點(diǎn)矩,特別地,樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量稱為樣本k階中心矩。常見的是k=2的場(chǎng)合,此時(shí)稱為二階樣本中心矩。本書中我們將其記為22。n五、極大順序統(tǒng)計(jì)量和極小順序統(tǒng)計(jì)量定義5.設(shè)總體X具有分布函數(shù)F(x),分布密度f(x),x1,x2,?,xn為其樣本,我們分別稱X(1)=min{x1,x2,?xn},x(n)=max{x1,x2,?xn}為極小順序統(tǒng)計(jì)量和極大順序統(tǒng)計(jì)量。定理3.若x(1),x(n)分別為極小、極大順序統(tǒng)計(jì)量,則1)x(1)的分布函數(shù)F1(x)=1-(1-F(x))n,x(1)的分布密度f1(x)=n-(1-F(x))n-1f(x)2)x(n)的分布函數(shù)Fn(x)=[F(x)]n,x(n)的分布密度fn(x)=n[F(x)]n-1f(x)證明先求出x(1)及x(n)的分布函數(shù) F1(x)及Fn(x):,,分別對(duì)F1(x),F(xiàn)n(x)求導(dǎo)即得收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔六、正態(tài)總體的抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三2應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。x2分布(卡方分布)定義6.設(shè)X1,X2,?,Xn獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布2222則x=x1nn的x分布,記為+?x的分布稱為自由度為
N(0,1),2 2x~x(n)。x2(n)分布的密度函數(shù)見圖 1-42222(n)}=當(dāng)隨機(jī)變量x~x(n)時(shí),對(duì)給定的α(0<α<1),稱滿足p{x>xα(n)}是自由度為2n的開方分布的α分位數(shù)。分位數(shù)xα(n)}可以從附表到。例如n=10,α=0.05,那么從附表4中查得x2(10)=18.307p(x)2>x20.05(10)=p{x2>18.307=0.05注:請(qǐng)讀者注意x2~x2(n)時(shí),n是自由度,不是容量。
2α的xα中查2.F分布定義7.設(shè)x1~x2(m),x2~x2(n)X1與X2獨(dú)立,則稱 的分布是自由度為m與n的F分布,記為F~F(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個(gè)只取非負(fù)值的偏態(tài)分布(見圖6-5)。當(dāng)隨機(jī)變量F~F(m,n)時(shí),對(duì)給定的α(0<α<1),稱滿足P{F>Fα}(m,n)=α的數(shù)Fα(m,n)是自由度為m與n的F分布的α分位數(shù)。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔當(dāng)F~F(m,n)時(shí),有下面性質(zhì)(不證),這說明對(duì)小的α,分位為Fα(m,n)可以從附表5中查到,而分位數(shù)F1-α(m,n)則可通過上式得到。例8.若取m=10,則n=5,α=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用()式可得到3.t分布定義8.設(shè)隨機(jī)變量與 X1與X2獨(dú)立且X1~N(0,1),X2~X2(n),則稱 的分布為自由度為 n的t的分布,記為 t~t(n).分布密度函數(shù)的圖像是一個(gè)關(guān)于縱軸對(duì)稱的分布(如下圖),與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。分布與N(0,1)的密度函數(shù)當(dāng)隨機(jī)變量t~t(n)時(shí),稱滿足P{t>tα(n)}=α的tα(n)是自由度為n的t分布的α分位數(shù),分位數(shù)tα(n)可以從附表3中查到,例如當(dāng)n=10,α=0.時(shí)05,從附表3上查得t0.05(10)=1.8125由于t分布的密度函數(shù)關(guān)于 0對(duì)稱,故其分位數(shù)有如下關(guān)系:t1-α(n)=-tα(n)例如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時(shí),(n≥30),t分布可以用N(0,1)近似收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔P(t>-tα)=1-α,p(t>t1-α)=1-α,∴t1-α=-tα4.一些重要結(jié)論來自一般正態(tài)總體的樣本均值和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布,下面我們加以介紹。定理4.設(shè)X1,X2,?Xn是來自正態(tài)總體N(μ,2σ)的樣本,其樣本均值和樣本方差分別為:則有1)與s2相互獨(dú)立;2)特別,若(不證)22212則(不證)本章小結(jié)本章的基本要求:(一)知道總體、樣本、簡(jiǎn)單樣本和統(tǒng)計(jì)量的概念(二)知道統(tǒng)計(jì)量 和s2的下列性質(zhì):收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔2 2E(s)=σ(三)若x的分布函數(shù)為F(x),分布函數(shù)為f(x),則樣本(x1,x2,?xn)的聯(lián)合分布函數(shù)為F(x1)F(x2)?F(xn)樣本(x1,x2,?xn)的聯(lián)合分布密度為fx1)f(x2)?f(xn),樣本(x1,x2,?xn)的概率函數(shù),p(x1,x2,?xn)=pX=x1)p(X=x2)?p(X=xn)因而順序統(tǒng)計(jì)量x(1),?x(n)中X(1)的分布函數(shù)為 1-(1-F(x))nX(n)的分布函數(shù)為[F(x)]n(四)掌握正態(tài)總體的抽樣分布2若X~N(μ,σ)則有(1)2)3)4)若=>當(dāng) 時(shí), 。(五)知道樣本原點(diǎn)矩與樣本中心矩的概念第二章 參數(shù)估計(jì)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔從本章開始我們介紹統(tǒng)計(jì)推斷,所謂統(tǒng)計(jì)推斷就是由樣本推斷總體,統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分,它們是統(tǒng)計(jì)推斷最基本而且是互相有聯(lián)系的兩部分,本章介紹統(tǒng)計(jì)推斷的第一部分參數(shù)估計(jì)。參數(shù)通常指總體分布中的特征值 和 和各種分布中的參數(shù),例如二點(diǎn)分布 B1,P)中的p,泊松分布P()中的,正態(tài)分布N(、)的、等,習(xí)慣用表示參數(shù),通常參數(shù)是未知的。參數(shù)估計(jì)的形式有兩類,設(shè)x1,x2,?,xn是來自總體的樣本。我們用一個(gè)統(tǒng)計(jì)量的取值作為參數(shù)的估計(jì)值,則稱為的點(diǎn)估計(jì)(量),就是參數(shù)的點(diǎn)估計(jì),如果對(duì)參數(shù)的估計(jì)需要對(duì)估計(jì)作出可靠性判斷,就需要對(duì)這一可靠性給出可靠性區(qū)間或置信區(qū)間,叫區(qū)間估計(jì)。下面首先介紹點(diǎn)估計(jì)第一節(jié) 點(diǎn)估計(jì)教學(xué)目的:要求學(xué)生了解參數(shù)點(diǎn)估計(jì)的基本思想,理解參數(shù)點(diǎn)估計(jì)的基本概念,熟練運(yùn)用替換原理、矩法估計(jì)和最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì)。教學(xué)重點(diǎn):矩法估計(jì)、最大似然估計(jì) .教學(xué)難點(diǎn):運(yùn)用矩法估計(jì)、最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì) .直接用來估計(jì)未知參數(shù) 的統(tǒng)計(jì)量 稱為參數(shù) 的點(diǎn)估計(jì)量,簡(jiǎn)稱為點(diǎn)估計(jì),人們可以運(yùn)用各種方法構(gòu)造出很多的估計(jì),本節(jié)介紹兩種最常用的點(diǎn)估計(jì)方法。它們是:矩法和極大似然法。一、替換原理和矩法估計(jì)用下面公式表示 的方法叫矩法例1.對(duì)某型號(hào)的 20輛汽車記錄每 5L汽油的行駛里程(km),觀測(cè)數(shù)據(jù)如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個(gè)容量為20的樣本觀測(cè)值,對(duì)應(yīng)總體是該型號(hào)汽車每5L汽油的行駛里程,其分布形式尚不清楚,可用矩法估計(jì)其均值,方差,本例中經(jīng)計(jì)算有28.695,=0.9185由此給出總體均值,方差的估計(jì)分別為即矩法估計(jì)的統(tǒng)計(jì)思想(替換原理)十分簡(jiǎn)單明確,眾人都能接受,使用場(chǎng)合甚廣。例2.設(shè)總體為指數(shù)分布,其密度函數(shù)為收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔x1,?,xn是樣本,由于 ,亦即 ,故 的矩法估計(jì)為例3.設(shè)x1,?,xn是來自服從區(qū)間(0,)上的均勻分布 的樣本, >0為未知參數(shù)。求 的矩估計(jì) 。解:易知總體 X的均值為由矩法的矩估計(jì)為比如,若樣本值為 0.1,0.7,0.2,1,1.9,1.3,1.8,則的估計(jì)值2×(0.1+0.7+0.2+1+1.9+1.3+1.8)=2例4.在一批產(chǎn)品取樣n件,發(fā)現(xiàn)其中有m件次品,試用此樣本求該批產(chǎn)品的次品率p的矩估計(jì)。解:因?yàn)椤嗬绯闃涌倲?shù) n=100,其中次品m=5.則例5.電話總機(jī)在一分鐘間隔內(nèi)接到呼喚次數(shù)X~P()。觀察一分種接到呼喚次數(shù)共觀察40次,結(jié)果如下接到呼喚次數(shù)012345觀察次數(shù)51012832求未知參數(shù)的矩估計(jì)解:(1)∵X~P()∴EX=由矩法∴(2)計(jì)算(0×5+1×10+2×12+3×8+4×3+5×2)=2∴=2二、極大似然估計(jì)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔為了敘述極大似然原理的直觀想法,先看例 6例6.設(shè)有外表完全相同的兩個(gè)箱子,甲箱中有 99個(gè)白球和1個(gè)黑球,乙箱中有99個(gè)黑球和1個(gè)白球,現(xiàn)隨機(jī)地抽取一箱,并從中隨機(jī)抽取一球,結(jié)果取得白球,問這球是從哪一個(gè)箱子中取出的?解:不管是哪一個(gè)箱子,從箱子中任取一球都有兩個(gè)可能的結(jié)果: A表示取出白球,B表示取出黑球,如果我們?nèi)〕龅氖羌紫?,則 A發(fā)生的概率為 0.99,而如果取出的是乙箱,則A發(fā)生的概率為0.01,現(xiàn)在一次試驗(yàn)中結(jié)果A發(fā)生了,人們的第一印象就是:“此白球(A)最像從甲箱取出的”,或者是說,應(yīng)該認(rèn)為試驗(yàn)條件對(duì)事件A出現(xiàn)有利,從而可以推斷這球是從甲箱中取出的,這個(gè)推斷很符合人們的經(jīng)驗(yàn)事實(shí),這里 “最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端,一般地,我們可以這樣設(shè)想,在兩個(gè)箱子中各有100個(gè)球,甲箱中白球的比例是 P1,乙箱中白球的比例是 P2,已知P1>P2,現(xiàn)隨機(jī)地抽取一個(gè)箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個(gè)箱子中進(jìn)行選擇,由于甲箱中白球的比例高于乙箱,根據(jù)極大似然原理,我們應(yīng)該推斷該球來自甲箱。下面分別給出離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的極大似然估計(jì)求未知參數(shù)的估計(jì)的步驟(一)離散型隨機(jī)變量第一步,從總體 X取出樣本x1,x2,?,xn第二步,構(gòu)造似然函數(shù)L(x1,x2,?,xn,)=P(X=x1)P(X=x2)?P(X=xn)第三步,計(jì)算lnL(x1,x2,?,xn,)并化簡(jiǎn)第四步,當(dāng)=時(shí)lnL(x1,x2,?,xn,)取最大值則?。匠S梅椒ㄊ俏⒎e分求最值的方法。(二)連續(xù)型隨機(jī)變量若X~f(x,),x,?,x第一步從總體X取出樣本x12n第二步構(gòu)造似然函數(shù)L(x1,x2,?,xn,)=f(x1,)f(x2,)?f(xn,)第三步計(jì)算lnL(x,x,?,x,)并化簡(jiǎn)12n第四步當(dāng)=時(shí)lnL(x,x,?,x,)取最大值則?。?2n常用方法是微積分求最值的方法例7.設(shè)總體X~B(1,P)即設(shè)P(A)=,從總體X中抽樣x1,x2,?,xn,問最大似然法求解:當(dāng)X~B(1,P)時(shí),應(yīng)有P(X=1)=P,P(X=0)=1-P第一步 構(gòu)造似然函數(shù)L(x1,x2,?,xn,P)=P(X=x1)P(X=x2)?P(X=xn)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔==第二步 計(jì)算lnL(x1,x2,?,xn,P)并化簡(jiǎn)=(x1+?+xn)lnp+(n-(x1+?+xn)ln(1-p)第三步 求=∴駐點(diǎn)為化簡(jiǎn)為(x1+?+xn)(1-p)=p[n-(x1+?+xn)](x1+?+xn)=np駐點(diǎn)因?yàn)橹挥幸粋€(gè)駐點(diǎn)是最大點(diǎn)取例抽樣n次A發(fā)生m次,則在x1,x2?xn中有m個(gè)1,其余為0,∴例8.(1)設(shè)總體X服從泊松分布p(),求的極大似然估計(jì);(2)設(shè)總體X服從指數(shù)分布E(),求的極大似然估計(jì)解:(1)∵X~P()p(X=k)=從總體X中取樣本x1,x2?xn。駐點(diǎn)解得 的極大似然估計(jì)易知 的矩估計(jì)亦為收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔(2)∵X~E()∴第一步,從中取樣本值 x1,x2?xn,應(yīng)有x1>0,x2>0?xn>0∴似然函數(shù)L(x1,x2?xn)=f(x1)f(x2)?f(xn)=第二步 計(jì)算第三步 求∴駐點(diǎn) 是最大點(diǎn)∴取在例2中用矩法估計(jì)也是同樣結(jié)果 。例9.設(shè) ,即從中取樣x1,x2?xn,試用最大似然法求解:因?yàn)闃颖?x1,x2?xn已經(jīng)取出。所以應(yīng)有0≤x1≤,0≤x2,?0≤xn所以的取值范圍為第一步 構(gòu)造似然函數(shù)∵>0,很明顯,似然函數(shù) 是的單調(diào)減函數(shù),因此當(dāng) 最小時(shí),似然函數(shù) 最大,由條件知的最小值為所以 時(shí) 最大。取這一結(jié)果與用矩法估計(jì)(例 7-3)的結(jié)果 不同。例10.若,從中抽樣x1,x2?xn,試用最大似然估計(jì)法求:,解:X的似然函數(shù)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔將 分別關(guān)于兩個(gè)分量求偏導(dǎo)并令其為 0即得到似然方程組,(1),(2)解此方程組,由(1)可得駐點(diǎn) , 的極大似然估計(jì)為 ,將之代入(2)給出 的極大似然估計(jì)第二節(jié) 點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)教學(xué)目的:要求學(xué)生了解相合性、無偏性、有效性和均方誤差的基本思想,理解相合性、無偏性、有效性和均方誤差的基本概念,熟練掌握相合性、無偏性和有效性的判別方法。教學(xué)重點(diǎn):相合估計(jì)、無偏估計(jì)和有效性。教學(xué)難點(diǎn):如何確定相合估計(jì)、無偏估計(jì)和有效性。我們已經(jīng)看到,點(diǎn)估計(jì)有各種不同的求法,為了在不同的點(diǎn)估計(jì)間進(jìn)行比較選擇,就必須對(duì)各種點(diǎn)估計(jì)的好壞給出評(píng)價(jià)標(biāo)準(zhǔn)。數(shù)理統(tǒng)計(jì)中給出了眾多的估計(jì)量評(píng)價(jià)標(biāo)準(zhǔn),對(duì)同一估計(jì)量使用不同的評(píng)價(jià)標(biāo)準(zhǔn)可能會(huì)得到完全不同的結(jié)論,因此,在評(píng)價(jià)某一個(gè)估計(jì)好壞時(shí)首先要說明是在哪一個(gè)標(biāo)準(zhǔn)下,否則所論好壞毫無意義。但在諸多標(biāo)準(zhǔn)中,有一個(gè)基本標(biāo)準(zhǔn)是所有的估計(jì)都應(yīng)該滿足的,它是衡量一個(gè)估計(jì)是否可行的必要條件,這就是估計(jì)的相合性,我們就從相合性開始介紹。一、相合性我們知道,點(diǎn)估計(jì)是一個(gè)統(tǒng)計(jì)量,因此它是一個(gè)隨機(jī)變量,在樣本量一定的條件下,我們不可能要求完全等同于參數(shù)的真實(shí)取值,但如果我們有足夠的觀測(cè)值,根據(jù)格里紋科定理,隨著樣本量的不斷增大,經(jīng)驗(yàn)分布函數(shù)逼近真實(shí)分布函數(shù),因此完全可以要求估計(jì)量隨著樣本量的不斷增大而逼近參數(shù)真值,這就是相合性,嚴(yán)格定義如下,定義2.設(shè) 為未知參數(shù), 是的一個(gè)估計(jì)量,n是樣本容量,若對(duì)任何一個(gè) ,有收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔則稱 為參數(shù)的相合估計(jì)相合性被認(rèn)為是對(duì)估計(jì)的一個(gè)最基本要求,如果一個(gè)估計(jì)量,在樣本量不斷增大時(shí),它都不能把被估參數(shù)估計(jì)到任意指定的精度,那么這個(gè)估計(jì)是很值得懷疑的,通常,不滿足相合性要求的估計(jì)一般不予考慮,證明估計(jì)的相合性一般可應(yīng)用大數(shù)定律或直接由定義來證。例11.用大數(shù)定律證明 是 的相合估計(jì)證:由切比雪夫大數(shù)定律∴即∴ 是 的相合估計(jì)為了避免用定義判斷相合性的困難,下面介紹一個(gè)判斷相合性很有用的定理:定量:設(shè) 是的估計(jì)量若(1)(2)則 是的相合估計(jì)。例12.證明 是 的相合估計(jì)證:在前面我們已經(jīng)證明1)2)∴ 是 的相合估計(jì)二、無偏性相合性是大樣本下估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn),對(duì)小樣本而言,需要一些其他的評(píng)價(jià)標(biāo)準(zhǔn),無偏性便是一個(gè)常用的評(píng)價(jià)標(biāo)準(zhǔn)。設(shè) 是的一個(gè)估計(jì), 的參數(shù)空間為 ,若對(duì)任意的 ,有則稱 是的無偏估計(jì),否則稱為有偏估計(jì)。例13.對(duì)任一總體而言,樣本均值是總體均值的無偏估計(jì),當(dāng)總體 k階矩存在時(shí),樣本k階原點(diǎn)矩 是總體k階原點(diǎn)矩 的無偏估計(jì),但對(duì) k階中心矩則不一收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔樣,例如,二階樣本中心矩 就不是總體方差 的無偏估計(jì),事實(shí)上,對(duì)此,有如下兩點(diǎn)說明(1)當(dāng)樣本量趨于無究時(shí),有,我們稱為的漸近無偏估計(jì),這表明當(dāng)樣本量較大時(shí),可近似看作的無偏估計(jì)(2)若對(duì) 作如下修正:則 是總體方差的無偏估計(jì),這種簡(jiǎn)章的修正方法在一些場(chǎng)合常被采用, 它比 更常用,這是因?yàn)樵?n≥2時(shí), <,因此用 估計(jì) 有偏小的傾向,特別在小樣本場(chǎng)合要使用 估計(jì) 。無偏性不具有不變性。即若 是的無偏估計(jì),一般而言, g()不是g()的無偏估計(jì),除非 g()是的線性函數(shù),例如, 是 的無偏估計(jì),但 s不是 的無偏估計(jì)例14.證明 是的無偏估計(jì)。其中 是X的樣本證:====∴特別情形 是的無偏估計(jì)例15.證明 是 的無偏估計(jì)證 ∵∴==∴三、有效性參數(shù)的無偏估計(jì)可以有很多,那么如何在無偏估計(jì)中進(jìn)行選擇?直觀的想法是希望該估計(jì)圍繞參數(shù)真值的波動(dòng)越小越好,波動(dòng)的大小可以用方差來衡量,因此人們常用無偏估計(jì)的方差的大小作為度量無偏估計(jì)優(yōu)劣的標(biāo)準(zhǔn),這就是有效性。定義4.設(shè) , 是的兩個(gè)無偏估計(jì),如果對(duì)任意的 有 則稱 比收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔有效例16.設(shè)x1,?xn是取自某總體的樣本,記總體均值為 ,總體方差為 ,則都是 的無偏估計(jì),但 顯然,只要n>1, 比 有效,這表明,用全部數(shù)據(jù)的平均估計(jì)總體均值要比只使用部分?jǐn)?shù)據(jù)更有效。例17.比較 與 誰有效解:(1)∴ 與 都是 的無偏估計(jì)2)==∵∴ 比 有效例18.設(shè) ,從總體中取樣證明 是的無偏估計(jì)和相合估計(jì)解:(1)∴∴是的無偏估計(jì)=是的相合估計(jì)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第三節(jié) 參數(shù)的區(qū)間估計(jì)教學(xué)目的:要求學(xué)生了解置信區(qū)間的基本思想,理解置信區(qū)間的基本概念,掌握求置信區(qū)間的樞軸量法方法,熟練掌握正態(tài)總體參數(shù)置信區(qū)間的計(jì)算公式和大樣本置信區(qū)間。能用R軟件計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)重點(diǎn):置信區(qū)間的思想、概念和樞軸量法方法,計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)難點(diǎn):計(jì)算單個(gè)正態(tài)總體的置信區(qū)間以及兩個(gè)正態(tài)總體下的 置信區(qū)間。用點(diǎn)估計(jì)去估計(jì)總體的參數(shù),即使是無偏且有效的,也會(huì)由于樣本的隨機(jī)性,使得從一個(gè)樣本x1,x2,x3,?,xn算得的估計(jì)值不一定是被估計(jì)的參數(shù)的真實(shí)值,而且估計(jì)值的可靠性并不知道,這是一個(gè)重大的問題,因此,必須解決根據(jù)估計(jì)量的分布,在一定可靠性的程度下指出被估計(jì)的總體參數(shù)的取值范圍,這正是本節(jié)要介紹的參數(shù)的區(qū)間估計(jì)問題。一、置信區(qū)間概念為了引入置信區(qū)間的概念,請(qǐng)看下面的引例。引例 設(shè)某種絕緣子抗扭強(qiáng)度 X服從正態(tài)分布 ,其中 未知, 已知( =45公斤·米),試對(duì)總體均值 作區(qū)間估計(jì)。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔對(duì)于區(qū)間估計(jì),要選擇一個(gè)合適的統(tǒng)計(jì)量,若在該總體取一個(gè)容量為 n的樣本x1,x2,x3,?,xn,樣本均值為 的點(diǎn)估計(jì)即 ,然而我們要給出 的一個(gè)區(qū)間估計(jì),以體現(xiàn)出估計(jì)的誤差,我們知道 。在區(qū)間估計(jì)問題中,要選取一個(gè)合適的估計(jì)函數(shù)。這時(shí),可取 ,它是 的標(biāo)準(zhǔn)化隨機(jī)變量,且具備下面兩個(gè)特點(diǎn):1)u中包含所要估計(jì)的未知參數(shù)(其中已知);2)u的分布為N(0,1),它與未知參數(shù)無關(guān)。因?yàn)閡~N(0,1),因而有,根據(jù)u~N(0,1)的概率密度 的對(duì)稱性(見下圖)可得 。當(dāng)α=0.05時(shí),1-α=0.095, =1.96,將不等式 轉(zhuǎn)化為 ,亦即,因此有。當(dāng)α=0.05時(shí), 。。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔說明未知參數(shù) 包含在區(qū)間中 的概率是95%,這里,不僅給出了 的區(qū)間估計(jì),還給出了這一區(qū)間估計(jì)的置信度(或置信概率)。事實(shí)上,當(dāng)置信度為 1-α?xí)r,區(qū)間估計(jì)為在引例中,若 =160, =40,n=16。則有說明該絕緣子抗扭強(qiáng)度 X的期望 在(140.4,179.6)內(nèi)的可靠度為 0.95。下面,引出置信區(qū)間的概念。定義5.設(shè)為總體的未知參數(shù) 是由樣本 定出的兩個(gè)統(tǒng)計(jì)量,若對(duì)于給定的概率 1-α(0<α<1),有,則隨機(jī)區(qū)間 稱為參數(shù) 的置信度為1-α的置信區(qū)間, 稱為置信下限, 稱為置信上限。置信區(qū)間的意義可作如下解釋: 包含在隨機(jī)區(qū)間 中的概率為100(1-α)%;或者說,隨機(jī)區(qū)間 以100(1-α)%的概率包含 。粗略地說,當(dāng)α=0.05時(shí),在100次的抽樣中,大致有 95次包含在 中,而其余5次可能不在該區(qū)間中。α常取的數(shù)值為 0.05,0.01,此時(shí)置信度 1-α分別為0.95,0.99。置信區(qū)間的長(zhǎng)度可視為區(qū)間估計(jì)的精度,下面分析置信度與精度的關(guān)系。1)當(dāng)置信度1-α增大,又樣本容量n固定時(shí),置信區(qū)間長(zhǎng)度增大,即區(qū)間估計(jì)精度減低;當(dāng)置信度1-α減小,又樣本容量n固定,置信區(qū)間長(zhǎng)度減小,即區(qū)間估計(jì)精度提高。2)設(shè)置信度1-α固定。當(dāng)樣本容量n增大時(shí),置信區(qū)間減?。ㄈ缫?,置信區(qū)間長(zhǎng)度為),區(qū)間估計(jì)精度提高。二、單個(gè)正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體 是最常見的分布,本小節(jié)中我們討論它的兩個(gè)參數(shù)的置信區(qū)間。已知時(shí)的置信區(qū)間收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔設(shè)總體X服從正態(tài)分布,其中已知,而未知,求的置信度1-α的置信區(qū)間。這一問題實(shí)際上已在引例中的討論中解決,得到。所以 的置信度1-α的置信區(qū)間為。當(dāng)α=0.05, =1.96;當(dāng)α=0.01, =2.576。例1.某車間生產(chǎn)滾珠,從長(zhǎng)期實(shí)踐知道,滾珠直徑 X服從正態(tài)分布。從某天產(chǎn)品里隨機(jī)抽取 6個(gè),測(cè)得直徑為(單位:毫米):14.6,15.1,14.9,14.8,15.2,15.1。若總體方差 =0.06,求總體均值 的置信區(qū)間(α=0.05,α=0.01)。解 ,=0.05時(shí),置信度為95%的置信區(qū)間為=0.01時(shí),置信度為99%的置信區(qū)間為。從此例知,在樣本容量n固定時(shí),當(dāng)置信度1-α較大時(shí),置信區(qū)間長(zhǎng)度較大;當(dāng)置信度1-α較小時(shí),置信區(qū)間較小。例2.用天平稱量某物體的質(zhì)量 9次,得平均值為 =15.4(g),已知天平稱量結(jié)果為正態(tài)分布,其標(biāo)準(zhǔn)差為 0.1g,試求該物體質(zhì)量的 0.95置信區(qū)間。解此處1-α=0.95,α=0.05,查表知u0.025=1.96,于是該物體質(zhì)量 的0.95的置信區(qū)間為,從而該物體質(zhì)量的 0.95置信區(qū)間為[15.3347,15.4653]。例3.設(shè)總體為正態(tài)分布 ,為得到 的置信水平為 0.95的置信區(qū)間長(zhǎng)度不超過1.2,樣本容量應(yīng)為多大?解由題設(shè)條件知 的0.95置信區(qū)間為,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔其區(qū)間長(zhǎng)度為 ,它僅依賴于樣本容量 n而與樣本具體取值無關(guān)。現(xiàn)要求 ,即有 ?,F(xiàn)1-α=0.59,故 =1.96,從而。即樣本容量至少為11時(shí)才能使得的置信水平為0.95的置信區(qū)間長(zhǎng)度不超過1.2。未知時(shí)的置信區(qū)間這時(shí)可用t統(tǒng)計(jì)量,因?yàn)?,完全類似于上一小節(jié)由于t(n-1)分布的概率密度 f(x)的對(duì)稱性有(見下圖)解得其中 是 的無偏估計(jì)。例4.假設(shè)輪胎的壽命服從正態(tài)分布。為估計(jì)某種輪胎的平均壽命,現(xiàn)隨機(jī)地抽12只輪胎試用,測(cè)得它們的壽命(單位:萬千米)如下:4.684.854.324.854.615.025.204.604.584.724.384.70試求平均壽命的0.95置信區(qū)間。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔解此處正態(tài)總體標(biāo)準(zhǔn)差未知,可使用 t分布求均值的置信區(qū)間。本例中經(jīng)計(jì)算有 =4.7092,s2=0.0615。取α=0.05,查表知t0.025(11)=2.2010,于是平均壽命的0.95置信區(qū)間為(單位:萬千米)。的置信區(qū)間此時(shí)雖然也可以就 是否已知分兩種情況討論 的置信區(qū)間,但在實(shí)際問題中 未知時(shí) 已知的情況是極為罕見的,所以我們只在 未知的條件下討論 的置信區(qū)間。設(shè)x1,x2,x3,?,xn為來自總體 X的樣本,樣本方差 s2可作為 的點(diǎn)估計(jì)。由,中包含未知參數(shù) ,又它的分布與 無關(guān),以 作為估計(jì)函數(shù),可用于的區(qū)間估計(jì)。由于 分布是偏態(tài)分布,尋找平均長(zhǎng)度最短區(qū)間很難實(shí)現(xiàn),一般都改為尋找等尾置信區(qū)間:把 α平分為兩部分,在 分布兩側(cè)各截面積為 的部分,即采用 的的兩個(gè)分位數(shù)它們滿足 。(見下圖)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔將上式開方即可得標(biāo)準(zhǔn)差 的置信區(qū)間。例5.某廠生產(chǎn)的零件質(zhì)量 X服從正態(tài)分布 。現(xiàn)從該廠生產(chǎn)的零件中抽取9個(gè),測(cè)得其質(zhì)量為(單位: g)45.345.445.145.345.545.745.445.345.6試求總體標(biāo)準(zhǔn)差 的0.95置信區(qū)間。解由數(shù)據(jù)可算得 s2=0.0325,(n-1)s2=8×0.0325=0.26,這里α=0.95,查表知 代入公式可得 的0.95置信區(qū)間為。從而 的0.95置信區(qū)間為[0.1218,0.3454]。以上關(guān)于正態(tài)總體參數(shù)的區(qū)間估計(jì)的討論列表如下表所示。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔本章小結(jié)本章考核要求:(一)點(diǎn)估計(jì)1)知道點(diǎn)估計(jì)的概念2)會(huì)用矩法求總體參數(shù)的矩估計(jì)值,主要依據(jù)是(3)會(huì)用最大似然估計(jì)法求總體參數(shù)的估計(jì)值。基本方法是由樣本 x1,x2,x3,?,xn構(gòu)造一個(gè)似然函數(shù)或似然函數(shù)的對(duì)數(shù)L(x1,x2,x3,?,xn,)=P(X=x1)P(X=x2)?P(X=xn)L(x1,x2,x3,?,xn,)=f(x1)f(x2)?f(xn)然后由lnL(x1,x2,x3,?,xn,)取最大的值時(shí)的 值 為的值,即。 是L的最大值點(diǎn)。(二)點(diǎn)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)(1)若 ,則 是的無偏估計(jì)。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔(2)若 都是 的無偏估計(jì),且 就說 有效。(3)若 。就說是 的相合估計(jì)以上三條標(biāo)準(zhǔn)中主要掌握無偏估計(jì)和有效估計(jì)(三)區(qū)間估計(jì)(1)知道區(qū)間估計(jì)的概念(2)會(huì)求一個(gè)正態(tài)總體 的參數(shù) 的置信區(qū)間。公式見表7-1第三章 假設(shè)檢驗(yàn)本章主要介紹統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想和概念以及參數(shù)的假設(shè)檢驗(yàn)方法。第一節(jié) 假設(shè)檢驗(yàn)的基本思想和概念教學(xué)目的:要求學(xué)生了解假設(shè)檢驗(yàn)的基本思想,理解假設(shè)檢驗(yàn)的基本概念,認(rèn)識(shí)假設(shè)檢驗(yàn)問題,熟悉假設(shè)檢驗(yàn)的基本步驟。教學(xué)重點(diǎn):基本概念,假設(shè)檢驗(yàn)的基本步驟 .教學(xué)難點(diǎn):基本概念的理解.一、統(tǒng)計(jì)假設(shè)的概念為了引入統(tǒng)計(jì)假設(shè)的概念,先請(qǐng)看例 8-1。例1.味精廠用一臺(tái)包裝機(jī)自動(dòng)包裝味精,已知袋裝味精的重量,機(jī)器正常時(shí),其均值 =0.5(0.5,0.015的單位都是公斤)。某日開工后隨機(jī)抽取 9袋袋裝味精,其凈重(公斤)為:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問這臺(tái)包裝機(jī)是否正常?此例隨機(jī)抽樣取得的9袋味精的重量都不正好是0.5公斤,這種實(shí)際重量和標(biāo)準(zhǔn)重量不完全一致的現(xiàn)象,在實(shí)際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因:一是偶然因素的影響,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔二由于偶然因素而發(fā)生的(例如電網(wǎng)電壓的波動(dòng)、金屬部件的不時(shí)伸縮、衡量?jī)x器的誤差而引起的)差異稱為隨機(jī)誤差;由于條件因素(生產(chǎn)設(shè)備的缺陷、機(jī)械部件的過度損耗)而產(chǎn)生的差異稱為條件誤差。若只存在隨機(jī)誤差,我們就沒有理由懷疑標(biāo)準(zhǔn)重量不是0.5公斤;如果我們有十足的理由斷定標(biāo)準(zhǔn)重量已不是0.5公斤,那么造成這種現(xiàn)象的主要原因是條件誤差,即包裝機(jī)工作不正常,那么,怎樣判斷包裝機(jī)工作是否正常呢?我們通過解例 1來找出解假設(shè)檢驗(yàn)問題的思想方法。解已知袋裝味精重 ,假設(shè)現(xiàn)在包裝機(jī)工作正常,即提出如下假設(shè):,這是兩個(gè)對(duì)立的假設(shè),我們的任務(wù)就是要依據(jù)樣本對(duì)這樣的假設(shè)之一作出是否拒絕的判斷。由于樣本均值 是 的一個(gè)很好的估計(jì),故當(dāng) 為真時(shí), 應(yīng)很小。當(dāng) 過分大時(shí),我們就應(yīng)當(dāng)懷疑 不正確而拒絕 。怎樣給出 的具體界限值 呢?當(dāng) 為真時(shí),由于 ,對(duì)于給定的很小的數(shù) 0<α<1,例如取=0.05,考慮,其中 是標(biāo)準(zhǔn)正態(tài)分布上側(cè) 分位數(shù),而事件是一個(gè)小概率事件,小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。我們查附表1得 ,又n=9,=0.015,由樣本算得 ,又由上式得:收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔小概率事件居然發(fā)生了,這與實(shí)際推斷原理相矛盾,于是拒絕 ,而認(rèn)為這臺(tái)包裝機(jī)工作不正常。從上面的例1中,我們看出為了對(duì)總體的某一參數(shù)進(jìn)行檢驗(yàn),通常提出兩個(gè)假設(shè):。然后引入一個(gè)與被檢參數(shù)有關(guān)的服從某種分布的統(tǒng)計(jì)量,根據(jù)事先給出的一概率標(biāo)準(zhǔn)α(叫顯著水平)用反證法進(jìn)行判斷,由于小概率事件一般是不會(huì)發(fā)生的,如果引進(jìn)的樣本是一個(gè)小概率事件,因?yàn)樗拇_出現(xiàn)了,則可認(rèn)為假設(shè)不能接受,否則便接受。(二)假設(shè)檢驗(yàn)的程序根據(jù)以上的討論與分析,可將假設(shè)檢驗(yàn)的基本步驟概括如下:(1)根據(jù)實(shí)際問題提出原假設(shè) 及備擇假設(shè) 。這里要求 與 有且僅有一個(gè)為真。(2)選取合適的統(tǒng)計(jì)量,即要求所選的統(tǒng)計(jì)量與假設(shè) 無關(guān)且服從某種分布,常見的有標(biāo)準(zhǔn)正態(tài)分布 t(n-1)分布, (n-1)分布及F(m,n)公布。3)規(guī)定小概率標(biāo)準(zhǔn)α的大小,也叫顯著水平,通??扇ˇ?0.01,α=0.05或α=0.。14)在顯著水平α下,根據(jù)統(tǒng)計(jì)量的分布將樣本空間劃分為兩部分,其一是接受的叫接受域,另一個(gè)是拒絕 的叫拒絕域,記為 W。5)根據(jù)樣本值計(jì)算統(tǒng)計(jì)量的大小。6)作出判斷:若統(tǒng)計(jì)量的觀測(cè)值落在拒絕域W內(nèi)。則知小概率事件發(fā)生了,拒絕,接受 。若統(tǒng)計(jì)量的觀測(cè)值落在接受域則認(rèn)為小概率事件沒有發(fā)生,可以接受 拒絕 。第二節(jié)總體均值的假設(shè)檢驗(yàn)教學(xué)目的:理解和掌握單個(gè)以及兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)的方法與思想,掌握正態(tài)總體方差檢驗(yàn)的方法,能用 R軟件來完成這些檢驗(yàn)。教學(xué)重點(diǎn):檢驗(yàn)方法的掌握,檢驗(yàn)方法思想的理解。教學(xué)難點(diǎn):檢驗(yàn)方法的掌握。本節(jié)討論的總體均值的假設(shè)檢驗(yàn),多數(shù)是在正態(tài)總體下進(jìn)行的。一、u檢驗(yàn)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔方差已知時(shí),單個(gè)正態(tài)總體均值檢驗(yàn)2. 設(shè)x1,?,xn是從正態(tài)總體 中抽取的一個(gè)樣本, 是已知常數(shù),欲檢驗(yàn)假設(shè):,其中 為已知數(shù),它的程序:1)提出假設(shè)2)引入統(tǒng)計(jì)量3)規(guī)定顯著水平α,查標(biāo)準(zhǔn)正態(tài)分布表求的上側(cè)分位數(shù)為臨界值,寫出相應(yīng)的拒絕域其中常用的有 α=0.1時(shí),=0.05時(shí),=0.01時(shí),(4)根據(jù)樣本值 x1,x2,?,xn計(jì)算統(tǒng)計(jì)量u。(5)判斷:若 u落入拒絕域W內(nèi)時(shí),則拒絕 接受,若u落入接受域內(nèi)時(shí),則接受 ,拒絕。例2.某產(chǎn)品的重量 X~N(12,1)(單位:克),更新設(shè)備后,從新生產(chǎn)的產(chǎn)品中抽樣 100件,測(cè)試樣本均值 (克),如果產(chǎn)品的方差沒有改變,請(qǐng)問更新設(shè)備后,產(chǎn)品的平均重量是否有明顯變化?( α=0.01)解(1)設(shè)2)引入3)根據(jù)α=0.01,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,得的上側(cè)分位數(shù)∴拒絕域?yàn)椋?∞,-2.58),(2.58,+∞)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔4)計(jì)算5)∵u落入拒絕域W中,故拒絕,即有明顯差別。2.方差已知時(shí),兩個(gè)正態(tài)總體值差的檢驗(yàn)設(shè) ,其中 為已知常數(shù)。x1,?,xm和y1,?,yn分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)假設(shè):檢驗(yàn)假設(shè) ,等價(jià)于檢驗(yàn)假設(shè) 。而是 的一個(gè)好估計(jì)量,且當(dāng)為真時(shí),有)于是對(duì)給定的水平 α,查附表1,可得臨界值 ,使()從而得拒絕域,若u∈W,則拒絕;否則接受。由上述討論可知,由服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量作檢驗(yàn)的方法稱為u檢驗(yàn)法。例3.設(shè) 從中各抽樣25件測(cè)得=90, =89。設(shè)X,Y獨(dú)立,請(qǐng)問是否可以認(rèn) 與 基本相同?α=0.05)解(1)(2)引進(jìn)統(tǒng)計(jì)量收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔(3)根據(jù)α=0.05,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表將∴拒絕域W為(-∞,-1.96),(1.96,+ )∞4)計(jì)算5)∵u在接受域內(nèi),∴接受,即與差別不大。二、t檢驗(yàn)方差未知時(shí),單個(gè)正態(tài)總體均值檢驗(yàn)設(shè)x1,?,xm是從正態(tài)總體 中抽取的一個(gè)樣本,其中 未知,欲檢驗(yàn)(1) ,其中 為已知數(shù)。2)構(gòu)造統(tǒng)計(jì)量3)給定顯著水平α,查t(n-1)表求分位數(shù)則拒絕域(4)根據(jù)樣本x1,x2,?,xn計(jì)算(5)若t落在拒絕域 W內(nèi),則拒絕 ,接受 。若t未落在拒絕域內(nèi),則接受 ,拒絕 。例4.車輛廠生產(chǎn)的螺桿直徑 X服從正態(tài)分布 ,現(xiàn)從中抽取 5枝,測(cè)得直徑(單位:毫米)為22.3,21.5,22.0,21.8,21.4。如果未知,試問直徑均值=21是否成立?(α=0.05)解檢驗(yàn)假設(shè)(1) ,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔由樣本觀測(cè)值算得(2) ,3)計(jì)算4)根據(jù)α=0.05,查t(n-1)分布表臨界值 ?!嗑芙^域?yàn)?)∵t=4.87在拒絕域內(nèi)∴否定 ,接受 。即認(rèn)為直徑均值不是 21。方差未知時(shí),兩個(gè)正態(tài)總體均值檢驗(yàn)設(shè) 和 分別是取自 X和Y的樣本且相互獨(dú)立。(1) ( 未知)。欲檢驗(yàn)假設(shè)(2)構(gòu)造統(tǒng)計(jì)量。t即為我們構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量。這時(shí),對(duì)給定的水平 α,查附表3可得臨界值,使,即得拒絕域。例5.在漂白工藝中考察溫度對(duì)針織品斷裂強(qiáng)度的影響,現(xiàn)在 70℃與80℃下分別作8次和6次試驗(yàn),測(cè)得各自的斷裂度 X和Y的觀測(cè)值。經(jīng)計(jì)算得, 。根據(jù)以往的經(jīng)驗(yàn),可認(rèn)為 X收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔和Y均服從正態(tài)分布,且方差相等,在給定 α=0.10時(shí),問70℃與80℃對(duì)斷裂強(qiáng)度的無顯著差異?解 由題設(shè),可假定 ,于是若作統(tǒng)計(jì)假設(shè)為兩個(gè)溫度下的斷裂強(qiáng)度無顯著性差異,即相當(dāng)于作假設(shè)(1) 。2)構(gòu)造統(tǒng)計(jì)量3)α=0.10,查得t(m+n-2)=t(12)表,得臨界值?!嗑芙^域W為(-∞,-1.782)∪(1.782,+∞)(4)計(jì)算(5)因?yàn)閠落在拒絕域W內(nèi),所以拒絕 ,接受 。即認(rèn)為斷裂強(qiáng)度有明顯差別。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第三節(jié) 正態(tài)總體方差的假設(shè)檢驗(yàn)教學(xué)目的:了解指數(shù)分布參數(shù)的假設(shè)檢驗(yàn),比例的檢驗(yàn),大樣本檢驗(yàn),能用 R軟件來完成這些檢驗(yàn),會(huì)解決簡(jiǎn)單的實(shí)際問題。教學(xué)重點(diǎn):對(duì)于檢驗(yàn)方法的理解。教學(xué)難點(diǎn):解決簡(jiǎn)單的實(shí)際問題。在實(shí)際問題中,有關(guān)方差的檢驗(yàn)問題也是常遇到的,如上節(jié)介紹的 u檢驗(yàn)和t檢驗(yàn)中均與方差有密切的聯(lián)系。因此,討論方差的檢驗(yàn)問題尤為重要。一、 檢驗(yàn)設(shè)總體 未知,x1,?,nx為取自X的樣本,欲檢驗(yàn)假設(shè)其中 為已知數(shù)。自然想到,看 的無偏估計(jì)s2有多大,當(dāng)H0為真時(shí),s2應(yīng)在 周圍波動(dòng),如果很大或很小,則應(yīng)否定 H0,因此構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。對(duì)于給定的顯著水平 α,可查 (n-1)表可得分位數(shù)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔∴拒絕域W為 。若統(tǒng)計(jì)量 落在拒絕域W內(nèi),則拒絕 ,接受。若統(tǒng)計(jì)量 落在接受域內(nèi),則接受 ,拒絕 。例6.設(shè)某廠生產(chǎn)銅線的折斷力 ,現(xiàn)從一批產(chǎn)品中抽查 10根測(cè)其折斷力后經(jīng)計(jì)算得樣本均值 =575.2,樣本方差s2=68.16。試問能否認(rèn)為這批銅線折斷2力的方差仍為 8(公斤)(取 α=0.05)?(1) ,2)引進(jìn)統(tǒng)計(jì)量3)根據(jù)α=0.05,查(n-1)=(9)表得臨界值于是得拒絕域(4) 。(5)計(jì)算由于 不在拒絕域W內(nèi),故不拒絕 ,即可認(rèn)為該批銅線折斷力的方差與 82(公斤)無顯著差異。二、F檢驗(yàn)前面介紹的用t檢驗(yàn)法檢驗(yàn)兩個(gè)獨(dú)立正態(tài)總體的均值是否相等時(shí),曾假定它們的方差是相等的。一般說來,兩個(gè)正態(tài)總體方差是未知的,那么,如何來檢驗(yàn)兩獨(dú)立正態(tài)總體方差是否相等呢?為此介紹F檢驗(yàn)法。設(shè)有兩正態(tài)總體 和 分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)統(tǒng)計(jì)假設(shè)。由于 是 的無偏估計(jì), 是 的無偏估計(jì),當(dāng) 為真時(shí),自然想到 和 應(yīng)該差不多,其比值 不會(huì)太大或大小,現(xiàn)在關(guān)鍵在于統(tǒng)計(jì)量 服從什么分布。由§6.3節(jié)定理收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔6-4推論我們知道,當(dāng) 為真時(shí),這樣,取F為檢驗(yàn)統(tǒng)計(jì)量,對(duì)給定的水平 α,查附表5,確定臨界值使。即得拒絕域 。若由樣本觀測(cè)值算得 F值,當(dāng)F∈W時(shí),拒絕 ,即認(rèn)為兩總體方差有顯著差異。否則認(rèn)為與 相容,即兩總體方差無顯著差異。例7.設(shè)甲、乙兩臺(tái)機(jī)床加工同一種軸,從這兩臺(tái)機(jī)床加工的軸中分別抽取若干根,測(cè)得直徑數(shù)據(jù)如下假定各臺(tái)機(jī)床加工軸的直徑X,Y分別服從正態(tài)分布,試比較甲、乙兩臺(tái)機(jī)床加工軸的精度有無顯著差異(取α=0.05)。解 按題意,本題是要檢驗(yàn)兩正態(tài)總體的方差 是否相等,即要檢驗(yàn)統(tǒng)計(jì)假設(shè)1)2)引入統(tǒng)計(jì)量3)根據(jù)α=0.05查F(7,6)表得于是,∴拒絕域W為(0,0.195)∪(5.70,+∞)4)計(jì)算5)∵F不在拒約域W內(nèi),∴接受 ,即方差無明顯差別。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第四節(jié) 單邊檢驗(yàn)實(shí)際問題中,有時(shí)我們只關(guān)心總體的均值是否會(huì)增大,例如,試驗(yàn)新工藝以提高產(chǎn)品的質(zhì)量,如材料的強(qiáng)度、元件的使用壽命等,當(dāng)然,總體的均值越大越好,此時(shí),需要檢驗(yàn)假設(shè)。。其中 是已知常數(shù)。類似地,如果只關(guān)心總體的均值是否變小,就需要檢驗(yàn)假設(shè),下面以單個(gè)正態(tài)總體方差已知情況為例,來討論均值 的單邊檢驗(yàn)的拒絕域。設(shè)總體 為已知。x1,?,xn,是取自X的一個(gè)樣本,給定檢驗(yàn)水平,α考慮單邊假設(shè)問題。,由于是 的無偏估計(jì),故當(dāng) 為真時(shí), 不應(yīng)太大,而當(dāng) u偏大時(shí)應(yīng)拒絕 ,故拒絕域的形式為: ,c待定,由于 ,故可找臨界值 α,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔使當(dāng)成立時(shí),,因此,。由事件 是一個(gè)小概率事件知,事件 更是一個(gè)小概率事件。如果根據(jù)所給的樣本觀測(cè)值, x1,?,xn算出 ,則應(yīng)該否定原假設(shè),即拒絕域?yàn)閃=(uα,+∞)。當(dāng) 時(shí),我們不否認(rèn)原假設(shè)類似地,對(duì)于單邊假設(shè)檢驗(yàn)問題:,仍取 為檢驗(yàn)統(tǒng)計(jì)量,但拒絕域?yàn)閃=(-∞,-uα),即當(dāng)由樣本觀測(cè)值算出 時(shí),則應(yīng)拒絕原假設(shè) 。我們已注意到,上 單邊檢驗(yàn)問題,與單個(gè)正態(tài)總體方差情況的均值 的雙邊檢驗(yàn)述 問題一樣,其所用的檢驗(yàn)統(tǒng)計(jì)量和檢驗(yàn)步驟完全相同,不同的只是拒絕域。我們著重指出:?jiǎn)芜厵z驗(yàn)問題的拒絕域,其不等式的取向,與備擇假設(shè)的不等式取向完全一致。這一特有的性質(zhì)使我們無需特別記憶單邊檢驗(yàn)的拒絕 因此,若遇上本章 §8.2,§8.3中相應(yīng)的單邊檢驗(yàn)問域。 題,則只要作類似的處理就行了,例如:設(shè)總體 ,欲檢驗(yàn)統(tǒng)計(jì)假設(shè)收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔,其中 為已知數(shù)。這時(shí),由雙邊檢驗(yàn)問題中的 檢驗(yàn)知。檢驗(yàn)統(tǒng)計(jì)量可取 。若由樣本觀測(cè)值算出 ,則當(dāng) 時(shí)拒絕 ,即拒絕域?yàn)?,此不等式取向與備擇假設(shè)取向一致。若欲檢驗(yàn)則檢驗(yàn)統(tǒng)計(jì)量仍取 ,拒絕域?yàn)椋?,即W=(0, )類似地,兩個(gè)總體 和 分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)統(tǒng)計(jì)假設(shè)。這時(shí),類似于雙邊檢驗(yàn)問題,檢驗(yàn)統(tǒng)計(jì)量可取 ,拒絕域?yàn)椋?。各種統(tǒng)計(jì)假設(shè)檢驗(yàn)情況(檢驗(yàn)水平為 α)如下表所示。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔例8.用某種農(nóng)藥施入農(nóng)田中防治病蟲害,經(jīng)三個(gè)月后土壤中如有5ppm以上的濃度時(shí),認(rèn)為仍有殘效,現(xiàn)在一大田施藥區(qū)隨機(jī)取10個(gè)土樣進(jìn)行分析,其濃度為:4.8,3.2,2.0,6.0,5.4,7.6,2.1,2.5,3.1,3.5(單位:ppm)。問該農(nóng)藥經(jīng)三個(gè)月是否仍有殘效(土壤殘余農(nóng)藥濃度服從正態(tài)分布α=0.05)?解顯然,我們關(guān)心的只是總體均值 是否小于 ,這時(shí)若用雙邊檢驗(yàn)是不恰當(dāng)有,所以我們應(yīng)該檢驗(yàn) 。這時(shí),檢驗(yàn)統(tǒng)計(jì)量應(yīng)取 ,對(duì)于給定的顯著性水平α=0.05,查t分布表得由樣本算得 T的觀測(cè)值t=-1.45>-1.83,不能拒絕H0,即沒有理由懷疑該農(nóng)藥已無殘效。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔例9.某類鋼板每塊的重量X服從正態(tài)分布,其一項(xiàng)質(zhì)量指標(biāo)是鋼板重量的方差不得超過0.016kg2?,F(xiàn)從某天生產(chǎn)的鋼板中隨機(jī)抽取25塊,得其樣本方差解這是一個(gè)關(guān)于正態(tài)總體方差的單側(cè)檢驗(yàn)問題,原假設(shè) ,備擇假設(shè)為 ,此處n=25。若取α=0.05,則查表知 ,現(xiàn)計(jì)算可得。由此,在顯著水平0.05下,我們拒絕原假設(shè),認(rèn)為該天生產(chǎn)的鋼板重量的方差不符合要求。例10.有一批槍彈,其初速度 ,其中 =950m/s, =10m/s。經(jīng)過較長(zhǎng)時(shí)間儲(chǔ)存后,現(xiàn)取出 9發(fā)槍彈試射,測(cè)其初速度,得樣本值如下(單位:m/s):914,920,910,934,953,945,912,924,940。問這批槍彈在顯著性水平α=0.05下,其初速度是否起了變化(假定 沒有變化)?解由題設(shè),要檢驗(yàn)的假設(shè)為 ,因?yàn)闃審梼?chǔ)存后初速度不可能增加,所以是(左側(cè))單邊檢驗(yàn)問題,由 n=9,易另算出,查表知-uα=-u0.05=-1.65,所以u(píng)=-6.6<-1.65=-uα,故應(yīng)拒絕H0而接受 ,即認(rèn)為這批槍彈經(jīng)過較長(zhǎng)時(shí)間儲(chǔ)存后初速度已經(jīng)變小了。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第五節(jié) 兩類錯(cuò)誤通過上面分析可知,一個(gè)假設(shè)檢驗(yàn)問題,是要先給定一個(gè)原假設(shè) H0與備擇假設(shè)H1,選出一個(gè)合適的檢驗(yàn)統(tǒng)計(jì)量T,由此給出拒絕域W內(nèi)。再根據(jù)在總體抽樣得到的樣本值(x1,x2,?,xn),看它是否落入由檢驗(yàn)統(tǒng)計(jì)量T定出的拒絕域W內(nèi)。當(dāng)(x1,x2,?,xn)∈W時(shí),就拒絕 H0(即接受H1);而當(dāng)(x1,x2,?,xn)∈W時(shí),接受H0。這樣的假設(shè)檢驗(yàn)有可能犯錯(cuò)誤。數(shù)理統(tǒng)計(jì)的任務(wù)本來是用樣本去推斷總體,即從局部去推斷整體,當(dāng)然有可能犯錯(cuò)誤。我們來分析會(huì)犯什么類型的錯(cuò)誤。一類錯(cuò)誤是:在 H0成立的情況下,樣本值落入了 W,因而H0被拒絕,稱這種錯(cuò)誤為第一類錯(cuò)誤,又稱為拒真錯(cuò)誤,一般記犯第一類的概率為 α。另一類錯(cuò)誤是:在 H0不成立的情況下,樣本值未落入拒絕域 W,因而H0被接受,稱這種錯(cuò)誤為第二類錯(cuò)誤,又稱為取偽錯(cuò)誤,并記犯第二類錯(cuò)誤的概率為 。第一類錯(cuò)誤在例 8-1中我們分析過。因?yàn)?,在H0成立條件下,根據(jù)樣本值算得的u滿足“”,即樣本值落入拒絕域W,從而拒絕了H0。由此可見,犯第一類錯(cuò)誤的概率即為α,而α即為顯著性水平。一般地,有,要尋找合適的檢驗(yàn)統(tǒng)計(jì)量 T,使得由它定出的拒絕域 W滿足犯第一類錯(cuò)誤的概率不超過 α,犯第二類錯(cuò)誤的概率為現(xiàn)列表說明兩類錯(cuò)誤,見下表:人們當(dāng)然希望在假設(shè)檢驗(yàn)問題中犯兩類錯(cuò)誤的概率 都盡可能小,然而在樣本容量固定時(shí)是做不到的。人們發(fā)現(xiàn):1)兩類錯(cuò)誤的概率是相互關(guān)聯(lián)的。當(dāng)樣本容量n固定時(shí),一類錯(cuò)誤的概率的減少將導(dǎo)致另一類錯(cuò)誤的概率的增加。2)要同時(shí)降低兩類錯(cuò)誤的概率,需要增大樣本容量n。收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔本章小結(jié)(一)理解假設(shè)檢驗(yàn)的基本思想,知道假設(shè)檢驗(yàn)的步驟。(二)知道兩類錯(cuò)誤(三)掌握單個(gè)正態(tài)總體的均值和方差的檢驗(yàn)方法,并會(huì)簡(jiǎn)單應(yīng)用,這是本章主要重點(diǎn)。(四)兩個(gè)正態(tài)總體 會(huì)檢驗(yàn)(1) ,(2) ,收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除精品文檔第四章 回歸分析教學(xué)目的:理解變量間的兩類關(guān)系,認(rèn)識(shí)一元線性和非線性回歸模型,熟悉回歸系數(shù)的估計(jì)方法,熟練掌握回歸方程的顯著性檢驗(yàn)。能用 R軟件來進(jìn)行回歸分析,會(huì)解決簡(jiǎn)單的實(shí)際問題。教學(xué)重點(diǎn):回歸系數(shù)的估計(jì)方法,回歸方程的顯著性檢驗(yàn) .教學(xué)難點(diǎn):回歸方程的顯著性檢驗(yàn) .在現(xiàn)實(shí)世界中,不少變量之間是存在著一定的關(guān)系的,一般來說,這種關(guān)系大體上可分為兩類,一類是確定性的,即函數(shù)關(guān)系。例如,電路中的電壓 V,電流I,電阻R三者間有關(guān)系 。另一類是非確定性的,這類變量之間雖有一定的關(guān)系卻又并不完全確定,例如人的血壓與年齡有關(guān),煉鋼過程中含碳量與精煉時(shí)間有關(guān),農(nóng)作物產(chǎn)量與施肥量和單位面積的播種量有關(guān)??這些變量之間雖有一定聯(lián)系,但又不能用普通函數(shù)關(guān)系式來表達(dá)。例如對(duì)給定的施肥量和確定的播種量,農(nóng)作物的產(chǎn)量還是不能完全確定的。事實(shí)上,這些變量是隨機(jī)變量或至少其中一個(gè)是隨機(jī)變量。這種非確定性的關(guān)系稱為相關(guān)關(guān)系?;貧w分析是研究相關(guān)關(guān)系的一種數(shù)學(xué)工具,是數(shù)理統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)方法之一,在生產(chǎn)實(shí)踐和科學(xué)研究中有著廣泛的應(yīng)用。本章僅簡(jiǎn)單介紹一元線性回歸分析。第一節(jié) 回歸直線方程的建立為了說明一元線性回歸的數(shù)學(xué)模型,我們先看一個(gè)實(shí)際例子。例1.某種合金的抗拉強(qiáng)度y(kg/mm2)與其中的含碳量x(%)有關(guān),現(xiàn)測(cè)12對(duì)數(shù)據(jù)如表1所示。表1x0.100.110.120.130.140.150.160.170.180.200.210.23y42.043.545.045.545.047.549.053.050.055.055.060.0為了了解其相關(guān)關(guān)系的表達(dá)式,在坐標(biāo)上以(xi,yi),i=1,2,?,12為點(diǎn),畫出散點(diǎn)圖如圖9-1所示,這些點(diǎn)大體上散布在某條直線的周圍,又不完全在一條直線上,從而可認(rèn)為y與x的關(guān)系基本上是線性的,而這些點(diǎn)與直線的偏離是由其他一切隨機(jī)因素的影響造成的。一般說來,含碳量x是一個(gè)可觀測(cè)或可控制的普通變量,而對(duì)任意一個(gè)含碳量x,相應(yīng)的抗拉強(qiáng)度是一個(gè)隨機(jī)變量Y,實(shí)際觀測(cè)值y是Y的一個(gè)可能取值。隨x的變化,Y的觀測(cè)值線性變化的趨勢(shì)可表示為收集于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系管理員刪除xi與yi之間有如下關(guān)系精品文檔。其中表示Y隨x的變化而線性變化的部分,是一切隨機(jī)因素影響的總和,稱為隨機(jī)誤差項(xiàng),它是不可觀測(cè)其值的隨機(jī)變量,在Y的方差時(shí),是一個(gè)E()=0,D()的隨機(jī)變量,在涉及分布時(shí),可進(jìn)一步假定。一般地,將1,x2,?,xn,通過試驗(yàn)得到對(duì)應(yīng)的Yx取一組不同的值,x的值y1,y2,?,yn,這樣就得到 n對(duì)觀測(cè)值(xi,yi),i=1,2,?,n??砂褃的值看成由兩部分疊加而成,一部分是 x的線性函數(shù) ,另一部分系試驗(yàn)過程中其他一切隨機(jī)因素的影響。因此,由上式可認(rèn)為,(i=1,2,?,n),且各相互獨(dú)立。此式就是一元線性回歸的數(shù)學(xué)模型?;貧w分析的基本問題是依據(jù)樣本( xi,yi),i=1,2,?,n解決如下問題:(1)未知參數(shù) 及 的點(diǎn)估計(jì),若 分別為 的估計(jì),由此得。上式是抽述 Y與x之間關(guān)系的經(jīng)驗(yàn)公式。我們稱上式為 Y關(guān)于x的一元線性回歸方程,它就是我們要求的 y與x之間的定量關(guān)系的表達(dá)式,其圖像便是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商丘職業(yè)技術(shù)學(xué)院《女性主義文學(xué)名著精讀》2023-2024學(xué)年第一學(xué)期期末試卷
- 運(yùn)營實(shí)戰(zhàn)產(chǎn)品課程設(shè)計(jì)
- 課程設(shè)計(jì)全套
- 2024生豬養(yǎng)殖與飼料原料采購合同3篇
- 2025屆廣東省東莞市(莞外、松山湖實(shí)驗(yàn))達(dá)標(biāo)名校中考生物押題試卷含解析
- 二零二五年度樓房建筑工程竣工驗(yàn)收合同4篇
- 2025年度教育行業(yè)市場(chǎng)調(diào)研與政策解讀合同4篇
- 2025年冷鏈貨物海運(yùn)出口訂艙及全程溫控合同3篇
- 二零二五年度生態(tài)旅游區(qū)綠植租賃與景觀美化服務(wù)協(xié)議4篇
- 2025年度場(chǎng)監(jiān)督管理局信息化系統(tǒng)運(yùn)維服務(wù)合同4篇
- 通用電子嘉賓禮薄
- GB/T 16407-2006聲學(xué)醫(yī)用體外壓力脈沖碎石機(jī)的聲場(chǎng)特性和測(cè)量
- 簡(jiǎn)潔藍(lán)色科技商業(yè)PPT模板
- 錢素云先進(jìn)事跡學(xué)習(xí)心得體會(huì)
- 道路客運(yùn)車輛安全檢查表
- 宋曉峰辣目洋子小品《來啦老妹兒》劇本臺(tái)詞手稿
- 附錄C(資料性)消防安全評(píng)估記錄表示例
- 噪音檢測(cè)記錄表
- 推薦系統(tǒng)之協(xié)同過濾算法
- 提高筒倉滑模施工混凝土外觀質(zhì)量QC成果PPT
- 小學(xué)期末班級(jí)頒獎(jiǎng)典禮動(dòng)態(tài)課件PPT
評(píng)論
0/150
提交評(píng)論