數(shù)理統(tǒng)計講義演示教學(xué)

上傳人：i*** IP屬地：天津上傳時間：2023-02-04 格式：DOC 頁數(shù)：57 大?。?.40MB 積分：66 舉報 版權(quán)申訴

已閱讀5頁，還剩52頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)理統(tǒng)計講義精品文檔《數(shù)理統(tǒng)計》教案收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第一章統(tǒng)計量及其抽樣分布第一節(jié) 總體與樣本教學(xué)目的：要求學(xué)生理解數(shù)理統(tǒng)計的兩個基本概念 :總體和樣本，以及與這兩個基本概念相關(guān)的統(tǒng)計基本思想和樣本分布。教學(xué)重點:掌握數(shù)理統(tǒng)計的基本概念和基本思想 .教學(xué)難點：掌握數(shù)理統(tǒng)計的基本概念和基本思想 .一、總體與個體在一個統(tǒng)計問題中，我們把研究對象的全體稱為總體，構(gòu)成總體的每個成員稱為個體。對多數(shù)實際問題?？傮w中的個體是一些實在的人或物。比如，我們要研究某大學(xué)的學(xué)生身高情況，則該大學(xué)的全體學(xué)生構(gòu)成問題的總體，而每一個學(xué)生即是一個個體。事實上，每個學(xué)生有許多特征：性別、年齡、身高、體重、民族、籍貫等。而在該問題中，我們關(guān)心的只是該校學(xué)生的身高如何，對其他的特征暫不予以考慮。這樣，每個學(xué)生（個體）所具有的數(shù)量指標(biāo)值——身高就是個體，而將所有身高全體看成總體。這樣一來，若拋開實際背景，總體就是一堆數(shù)，這堆數(shù)中有大有小，有的出現(xiàn)的機(jī)會多，有的出現(xiàn)的機(jī)會少，因此用一個概率分布去描述和歸納總體是恰當(dāng)?shù)摹倪@個意義上看，總體就是一個分布，而其數(shù)量指標(biāo)就是服從這個分布的隨機(jī)變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個意思。例1.考察某廠的產(chǎn)品質(zhì)量，將其產(chǎn)品只分為合格品與不合格品，并以0記合格品，以1記不合格品，則總體＝｛該廠生產(chǎn)的全部合格品與不合格品｝＝｛由 0或1組成的一堆數(shù)｝。若以p表示這堆數(shù)中 1的比例（不合格品率），則該總體可由一個二點分布表示：不同的p反映了總體間的差異。例如，兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為：我們可以看到，第一個工廠的產(chǎn)品質(zhì)量優(yōu)于第二個工廠。實際中，分布中的不合格品率是未知的，如何對之進(jìn)行估計是統(tǒng)計學(xué)要研究的問題。二、樣本為了了解總體的分布，我們從總體中隨機(jī)地抽取n個個體，記其指標(biāo)值為x1，x2，?，xn，則x1，x2，?，xn稱為總體的一個樣本，n稱為樣本容量，或簡稱樣本量，樣本中的個體稱為樣品。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔我們首先指出，樣本具有所謂的二重性：一方面，由于樣本是從總體中隨機(jī)抽取的，抽取前無法預(yù)知它們的數(shù)值，因此，樣本是隨機(jī)變量，用大寫字母X1，X2，?，Xn表示；另一方面，樣本在抽取以后經(jīng)觀測就有確定的觀測值，因此，樣本又是一組數(shù)值。此時用小寫字母x，x，?，x表示是恰當(dāng)?shù)?。簡單起見，無12n論是樣本還是其觀測值，本書中樣本一般均用1，x2，?，xn表示，讀者應(yīng)能從上x下文中加以區(qū)別。例2.啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g，，由于隨機(jī)性，事實上不可能使得所有的啤酒凈含量均為640g,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測定其凈含量，得到如下結(jié)果：641635640637642638645643639640這是一個容量為10的樣本的觀測值。對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。從總體中抽取樣本時，為使樣本具有代表性，抽樣必須是隨機(jī)抽樣。通常可以用隨機(jī)數(shù)表來實現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨立的，即每次的結(jié)果互不影響。在概率論中，在有限總體（只有有限個個體的總體）中進(jìn)行有放回抽樣，是獨立的隨機(jī)抽樣；然而，若為不放回抽樣，則是不獨立的抽樣。但當(dāng)總體容量N很大但樣本容量 n較小時，不放回抽樣可以近似地看做放回抽樣，即可近似看做獨立隨機(jī)抽樣。下面，我們假定抽樣方式總滿足獨立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法，為了能由樣本對總體做出較可靠的推斷，就希望樣本能很好地代表總體。這就需要對抽樣方法提出一些要求，最常用的“簡單隨機(jī)抽樣”有如下兩個要求：1）樣本具有隨機(jī)性，即要求總體中每一個個體都有同等機(jī)會被選入樣本，這便意味著每一樣品xi與總體X有相同的分布。2）樣本要有獨立性，即要求樣本中每一樣品的取值不影響其他樣品的取值，這意味著x1，x2，?，xn相互獨立。用簡單隨機(jī)抽樣方法得到的樣本稱為簡單隨機(jī)樣本，也簡稱樣本。除非特別指明，本書中的樣本皆為簡單隨機(jī)樣本。于是，樣本x1，x2，?，xn可以看成是相互獨立的具有同一分布的隨機(jī)變量，其共同分布即為總體分布。設(shè)總體X具有分布函數(shù)F（x）,x1，x2，?，xn為取自該總體的容量為n的樣本，則樣本聯(lián)合分布函數(shù)為：若總體具有密度函數(shù) f（x），則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量，則樣本的（聯(lián)合）概率函數(shù)為顯然，通常說的樣本分布是指多維隨機(jī)變量（ x1，x2，?，xn）的聯(lián)合分布。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔例3.為估計一物件的重量μ，用一架天平重復(fù)測量n次，得樣本x1，x2，?，xn，由于是獨立重復(fù)測量，x1，x2，?，xn是簡單隨機(jī)樣本?？傮w的分布即x1的分布（x1，x2，?，xn分布相同）。由于稱量誤差是均值（期望）為零的正態(tài)變量，2所以x1可認(rèn)為服從正態(tài)分布 N（μ，σ）（X1等于物件重量 μ）加上稱量誤差，即x1的概率密度為這樣，樣本分布密度為。例4.設(shè)某種電燈泡的壽命X服從指數(shù)分布E（λ），其概率密度為：則來自這一總體的簡單隨機(jī)樣本x1，x2，?，xn的樣本分布密度為例5.考慮電話交換臺一小時內(nèi)的呼喚次數(shù)X。求來自這一總體的簡單隨機(jī)樣本1，x2，?，xn的樣本分布。解由概率論知識，X服從泊松分布P（λ），其概率函數(shù)，（其中x是非負(fù)整數(shù)｛0，1，2，?，k，?｝中的一個）。從而，簡單隨機(jī)樣本x1，x2，?，xn的樣本分布為：收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第二節(jié) 統(tǒng)計量及其分布教學(xué)目的：要求學(xué)生理解數(shù)理統(tǒng)計的基本概念：統(tǒng)計量，熟練掌握樣本均值、樣本方差、樣本原點矩、樣本中心矩等常用統(tǒng)計量的計算公式，掌握次序統(tǒng)計量及其抽樣分布。能用 R軟件來計算這些常用統(tǒng)計量，能用 R軟件來產(chǎn)生分布的隨機(jī)數(shù)以進(jìn)行隨機(jī)模擬。教學(xué)重點：樣本均值、樣本方差、樣本原點矩、樣本中心矩等常用統(tǒng)計量的求法；次序統(tǒng)計量的抽樣分布。教學(xué)難點：次序統(tǒng)計量的抽樣分布。一、統(tǒng)計量與抽樣分布樣本來自總體，樣本的觀測值中含有總體各方面的信息，但這些信息較為分散，有時顯得雜亂無章。為將這些分散在樣本中有關(guān)總體的信息集中起來以反映總體的各種特征，需要對樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù)，不同的函數(shù)反映總體的不同特征。定義1.設(shè)x1，x2，?，xn為取自某總體的樣本，若樣本函數(shù)T＝T（x1，x2，?，xn）中不含有任何未知參數(shù)，則稱T為統(tǒng)計量。統(tǒng)計量的分布稱為抽樣分布。按照這一定義，若 x1，x2，?，xn為樣本，則，都是統(tǒng)計量，而當(dāng)2，等均不是統(tǒng)計量。μ，σ未知時，二、樣本均值及其抽樣分布定義2.設(shè)x1，x2，?，xn為取自某總體的樣本，其算術(shù)平均值稱為樣本均值，一般用表示，即。例6.某單位收集到20名青年人某月的娛樂支出費用數(shù)據(jù)：79848488929394979899100101101102102108110113118125則該月這20名青年的平均娛樂支出為對于樣本均值的抽樣分布，我們有下面的定理。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔定理1.設(shè)x1，x2，?，xn是來自某個總體 X的樣本，為樣本均值。（1）若總體分布為2；N（μ，σ），則的精確分布為2（2）若總體X分布未知（或不是正態(tài)分布），且E（X）=μ，D（X）=σ，則當(dāng)樣本容量n較大時，的漸近分布為，這里的漸近分布是指n較大時的近似分布。證明（1）由于為獨立正態(tài)變量線性組合，故仍服從正態(tài)分布。另外，故（2）易知為獨立、同分布的隨機(jī)變量之和，且。由中心極限定理，，其中Φ（x）為標(biāo)準(zhǔn)正態(tài)分布。這表明 n較大時的漸近分布為。三、樣本方差與樣本標(biāo)準(zhǔn)差定義3.設(shè)x1，x2，?，xn為取自某總體的樣本，則它關(guān)于樣本均值的平均偏差平方和稱為樣本方差，其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對樣本方差而言，樣本標(biāo)準(zhǔn)差通常更有實際意義，因為它與樣本均值具有相同的度量單位。在上面定義中，n為樣本容量，稱為偏差平方和，它有3個不同的表達(dá)式：事實上，收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔，偏差平方和的這 3個表達(dá)式都可用來計算樣本方差。例7.在例6中，我們已經(jīng)算得，其樣本方差與樣本標(biāo)準(zhǔn)差為，。方法二s=11.5731通常用第二種方法計算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望，它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。定理2.設(shè)總體X具有二階矩，即2E（x）=μ,D（X）=σ<+∞x1，x2，?，xn為從該總體得到的樣本，和s2分別是樣本均值和樣本方差，則此定理表明，樣本均值的均值與總體均值相同，而樣本均值的方差是總體方差的。證明由于1）2）且有：，而，收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔于是，兩邊各除以n-1，即得證。值得讀者注意的是：本定理的結(jié)論與總體服從什么分布無關(guān)。四、樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩，這是一類常見的統(tǒng)計量。定義4.設(shè)x1，x2，?，xn是樣本，則統(tǒng)計量稱為樣本k階原點矩，特別地，樣本一階原點矩就是樣本均值。統(tǒng)計量稱為樣本k階中心矩。常見的是k=2的場合，此時稱為二階樣本中心矩。本書中我們將其記為22。n五、極大順序統(tǒng)計量和極小順序統(tǒng)計量定義5.設(shè)總體X具有分布函數(shù)F（x），分布密度f（x）,x1，x2，?，xn為其樣本，我們分別稱X（1）=min{x1,x2,?xn},x（n）=max{x1,x2,?xn}為極小順序統(tǒng)計量和極大順序統(tǒng)計量。定理3.若x(1),x(n)分別為極小、極大順序統(tǒng)計量，則1）x(1)的分布函數(shù)F1(x)=1-(1-F（x))n,x（1）的分布密度f1(x)=n-(1-F(x))n-1f(x)2）x（n）的分布函數(shù)Fn(x)=[F(x)]n,x(n)的分布密度fn(x)=n[F(x)]n-1f(x)證明先求出x（1）及x（n）的分布函數(shù) F1（x）及Fn（x）：，，分別對F1（x），F(xiàn)n（x）求導(dǎo)即得收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔六、正態(tài)總體的抽樣分布有很多統(tǒng)計推斷是基于正態(tài)總體的假設(shè)的，以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三2應(yīng)用。這是因為這三個統(tǒng)計量不僅有明確背景，而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”，它們被稱為統(tǒng)計中的“三大抽樣分布”。x2分布（卡方分布）定義6.設(shè)X1，X2，?，Xn獨立同分布于標(biāo)準(zhǔn)正態(tài)分布2222則x=x1nn的x分布，記為+?x的分布稱為自由度為

N（0，1），2 2x～x（n）。x2（n）分布的密度函數(shù)見圖 1-42222（n）}=當(dāng)隨機(jī)變量x～x（n）時，對給定的α（0<α<1）,稱滿足p{x>xα（n）}是自由度為2n的開方分布的α分位數(shù)。分位數(shù)xα（n）}可以從附表到。例如n=10，α=0.05，那么從附表4中查得x2(10)=18.307p(x)2>x20.05(10)=p{x2>18.307=0.05注：請讀者注意x2～x2（n）時，n是自由度，不是容量。

2α的xα中查2.F分布定義7.設(shè)x1～x2(m)，x2～x2(n)X1與X2獨立，則稱的分布是自由度為m與n的F分布，記為F～F（m，n），其中m稱為分子自由度，n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個只取非負(fù)值的偏態(tài)分布（見圖6-5）。當(dāng)隨機(jī)變量F～F（m，n）時，對給定的α（0<α<1），稱滿足P{F>Fα}（m,n）=α的數(shù)Fα（m,n）是自由度為m與n的F分布的α分位數(shù)。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔當(dāng)F～F（m，n）時，有下面性質(zhì)（不證），這說明對小的α，分位為Fα（m,n）可以從附表5中查到，而分位數(shù)F1-α（m,n）則可通過上式得到。例8.若取m=10,則n=5,α=0.05，那么從附表5上（m=n1,n=n2）查得F0.05（10,5）=4.74利用（）式可得到3.t分布定義8.設(shè)隨機(jī)變量與 X1與X2獨立且X1～N（0，1），X2～X2（n），則稱的分布為自由度為 n的t的分布，記為 t～t（n）.分布密度函數(shù)的圖像是一個關(guān)于縱軸對稱的分布（如下圖），與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似，只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些，尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。分布與N（0,1）的密度函數(shù)當(dāng)隨機(jī)變量t～t（n）時，稱滿足P{t>tα（n）}=α的tα（n）是自由度為n的t分布的α分位數(shù)，分位數(shù)tα（n）可以從附表3中查到，例如當(dāng)n=10,α=0.時05，從附表3上查得t0.05（10）=1.8125由于t分布的密度函數(shù)關(guān)于 0對稱，故其分位數(shù)有如下關(guān)系：t1-α（n）=-tα（n）例如，t0.95（10）=-t0.05（10）=-1.8125當(dāng)n很大時，（n≥30）,t分布可以用N（0，1）近似收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔P（t>-tα）=1-α,p（t>t1-α）=1-α，∴t1-α=-tα4.一些重要結(jié)論來自一般正態(tài)總體的樣本均值和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布，下面我們加以介紹。定理4.設(shè)X1,X2,?Xn是來自正態(tài)總體N（μ,2σ）的樣本，其樣本均值和樣本方差分別為：則有1）與s2相互獨立；2）特別，若（不證）22212則（不證）本章小結(jié)本章的基本要求：（一）知道總體、樣本、簡單樣本和統(tǒng)計量的概念（二）知道統(tǒng)計量和s2的下列性質(zhì)：收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔2 2E（s）=σ（三）若x的分布函數(shù)為F（x），分布函數(shù)為f（x），則樣本（x1,x2,?xn）的聯(lián)合分布函數(shù)為F（x1）F（x2）?F（xn）樣本（x1,x2,?xn）的聯(lián)合分布密度為fx1）f（x2）?f（xn），樣本（x1,x2,?xn）的概率函數(shù)，p（x1,x2,?xn）=pX=x1）p（X=x2）?p（X=xn）因而順序統(tǒng)計量x（1），?x（n）中X（1）的分布函數(shù)為 1-（1-F（x））nX（n）的分布函數(shù)為[F（x）]n（四）掌握正態(tài)總體的抽樣分布2若X～N（μ，σ）則有（1）2）3）4）若=>當(dāng) 時，。（五）知道樣本原點矩與樣本中心矩的概念第二章參數(shù)估計收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔從本章開始我們介紹統(tǒng)計推斷，所謂統(tǒng)計推斷就是由樣本推斷總體，統(tǒng)計推斷包括參數(shù)估計和假設(shè)檢驗兩部分，它們是統(tǒng)計推斷最基本而且是互相有聯(lián)系的兩部分，本章介紹統(tǒng)計推斷的第一部分參數(shù)估計。參數(shù)通常指總體分布中的特征值和和各種分布中的參數(shù)，例如二點分布 B1，P）中的p，泊松分布P（）中的，正態(tài)分布N（、）的、等，習(xí)慣用表示參數(shù)，通常參數(shù)是未知的。參數(shù)估計的形式有兩類，設(shè)x1,x2,?,xn是來自總體的樣本。我們用一個統(tǒng)計量的取值作為參數(shù)的估計值，則稱為的點估計（量），就是參數(shù)的點估計，如果對參數(shù)的估計需要對估計作出可靠性判斷，就需要對這一可靠性給出可靠性區(qū)間或置信區(qū)間，叫區(qū)間估計。下面首先介紹點估計第一節(jié) 點估計教學(xué)目的：要求學(xué)生了解參數(shù)點估計的基本思想，理解參數(shù)點估計的基本概念，熟練運用替換原理、矩法估計和最大似然估計對參數(shù)進(jìn)行估計。教學(xué)重點：矩法估計、最大似然估計 .教學(xué)難點：運用矩法估計、最大似然估計對參數(shù)進(jìn)行估計 .直接用來估計未知參數(shù) 的統(tǒng)計量稱為參數(shù) 的點估計量，簡稱為點估計，人們可以運用各種方法構(gòu)造出很多的估計，本節(jié)介紹兩種最常用的點估計方法。它們是：矩法和極大似然法。一、替換原理和矩法估計用下面公式表示的方法叫矩法例1.對某型號的 20輛汽車記錄每 5L汽油的行駛里程（km），觀測數(shù)據(jù)如下：29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個容量為20的樣本觀測值，對應(yīng)總體是該型號汽車每5L汽油的行駛里程，其分布形式尚不清楚，可用矩法估計其均值，方差，本例中經(jīng)計算有28.695，＝0.9185由此給出總體均值，方差的估計分別為即矩法估計的統(tǒng)計思想（替換原理）十分簡單明確，眾人都能接受，使用場合甚廣。例2.設(shè)總體為指數(shù)分布，其密度函數(shù)為收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔x1,?,xn是樣本，由于，亦即，故的矩法估計為例3.設(shè)x1,?,xn是來自服從區(qū)間（0，）上的均勻分布的樣本，＞0為未知參數(shù)。求的矩估計。解：易知總體 X的均值為由矩法的矩估計為比如，若樣本值為 0.1，0.7，0.2，1，1.9，1.3，1.8，則的估計值2×（0.1+0.7+0.2+1+1.9+1.3+1.8）＝2例4.在一批產(chǎn)品取樣n件，發(fā)現(xiàn)其中有m件次品，試用此樣本求該批產(chǎn)品的次品率p的矩估計。解：因為∴例如抽樣總數(shù) n=100，其中次品m=5.則例5.電話總機(jī)在一分鐘間隔內(nèi)接到呼喚次數(shù)X～P（）。觀察一分種接到呼喚次數(shù)共觀察40次，結(jié)果如下接到呼喚次數(shù)012345觀察次數(shù)51012832求未知參數(shù)的矩估計解：（1）∵X～P（）∴EX=由矩法∴（2）計算（0×5+1×10+2×12+3×8+4×3+5×2）＝2∴＝2二、極大似然估計收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔為了敘述極大似然原理的直觀想法，先看例 6例6.設(shè)有外表完全相同的兩個箱子，甲箱中有 99個白球和1個黑球，乙箱中有99個黑球和1個白球，現(xiàn)隨機(jī)地抽取一箱，并從中隨機(jī)抽取一球，結(jié)果取得白球，問這球是從哪一個箱子中取出的？解：不管是哪一個箱子，從箱子中任取一球都有兩個可能的結(jié)果： A表示取出白球，B表示取出黑球，如果我們?nèi)〕龅氖羌紫?，則 A發(fā)生的概率為 0.99，而如果取出的是乙箱，則A發(fā)生的概率為0.01，現(xiàn)在一次試驗中結(jié)果A發(fā)生了，人們的第一印象就是：“此白球（A）最像從甲箱取出的”，或者是說，應(yīng)該認(rèn)為試驗條件對事件A出現(xiàn)有利，從而可以推斷這球是從甲箱中取出的，這個推斷很符合人們的經(jīng)驗事實，這里 “最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端，一般地，我們可以這樣設(shè)想，在兩個箱子中各有100個球，甲箱中白球的比例是 P1，乙箱中白球的比例是 P2，已知P1＞P2，現(xiàn)隨機(jī)地抽取一個箱子并從中抽取一球，假定取到的是白球，如果我們要在兩個箱子中進(jìn)行選擇，由于甲箱中白球的比例高于乙箱，根據(jù)極大似然原理，我們應(yīng)該推斷該球來自甲箱。下面分別給出離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的極大似然估計求未知參數(shù)的估計的步驟（一）離散型隨機(jī)變量第一步，從總體 X取出樣本x1,x2,?,xn第二步，構(gòu)造似然函數(shù)L（x1,x2,?,xn，）＝P（X＝x1）P（X＝x2）?P（X＝xn）第三步，計算lnL（x1,x2,?,xn，）并化簡第四步，當(dāng)＝時lnL（x1,x2,?,xn，）取最大值則?。匠Ｓ梅椒ㄊ俏⒎e分求最值的方法。（二）連續(xù)型隨機(jī)變量若X～f（x,）,x,?,x第一步從總體X取出樣本x12n第二步構(gòu)造似然函數(shù)L（x1,x2,?,xn，）＝f（x1，）f（x2，）?f（xn，）第三步計算lnL（x,x,?,x，）并化簡12n第四步當(dāng)＝時lnL（x,x,?,x，）取最大值則?。?2n常用方法是微積分求最值的方法例7.設(shè)總體X～B（1，P）即設(shè)P（A）＝，從總體X中抽樣x1,x2,?,xn，問最大似然法求解：當(dāng)X～B（1，P）時，應(yīng)有P（X＝1）＝P，P（X＝0）=1－P第一步構(gòu)造似然函數(shù)L（x1,x2,?,xn，P）＝P（X＝x1）P（X＝x2）?P（X＝xn）收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔＝＝第二步計算lnL（x1,x2,?,xn，P）并化簡＝（x1+?+xn）lnp+（n-（x1+?+xn）ln（1-p）第三步求＝∴駐點為化簡為（x1+?+xn）（1-p）=p[n-（x1+?+xn）]（x1+?+xn）=np駐點因為只有一個駐點是最大點取例抽樣n次A發(fā)生m次，則在x1，x2?xn中有m個1，其余為0，∴例8.（1）設(shè)總體X服從泊松分布p（），求的極大似然估計；（2）設(shè)總體X服從指數(shù)分布E（），求的極大似然估計解：（1）∵X～P（）p（X=k）=從總體X中取樣本x1，x2?xn。駐點解得的極大似然估計易知的矩估計亦為收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔（2）∵X～E（）∴第一步，從中取樣本值 x1，x2?xn，應(yīng)有x1＞0，x2＞0?xn＞0∴似然函數(shù)L（x1，x2?xn）＝f（x1）f（x2）?f（xn）=第二步計算第三步求∴駐點是最大點∴取在例2中用矩法估計也是同樣結(jié)果。例9.設(shè) ，即從中取樣x1，x2?xn，試用最大似然法求解：因為樣本 x1，x2?xn已經(jīng)取出。所以應(yīng)有0≤x1≤,0≤x2,?0≤xn所以的取值范圍為第一步構(gòu)造似然函數(shù)∵＞0，很明顯，似然函數(shù) 是的單調(diào)減函數(shù)，因此當(dāng) 最小時，似然函數(shù) 最大，由條件知的最小值為所以時最大。取這一結(jié)果與用矩法估計（例 7－3）的結(jié)果不同。例10.若,從中抽樣x1，x2?xn，試用最大似然估計法求：，解：X的似然函數(shù)收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔將分別關(guān)于兩個分量求偏導(dǎo)并令其為 0即得到似然方程組，（1），（2）解此方程組，由（1）可得駐點，的極大似然估計為，將之代入（2）給出的極大似然估計第二節(jié) 點估計的評價標(biāo)準(zhǔn)教學(xué)目的：要求學(xué)生了解相合性、無偏性、有效性和均方誤差的基本思想，理解相合性、無偏性、有效性和均方誤差的基本概念，熟練掌握相合性、無偏性和有效性的判別方法。教學(xué)重點：相合估計、無偏估計和有效性。教學(xué)難點：如何確定相合估計、無偏估計和有效性。我們已經(jīng)看到，點估計有各種不同的求法，為了在不同的點估計間進(jìn)行比較選擇，就必須對各種點估計的好壞給出評價標(biāo)準(zhǔn)。數(shù)理統(tǒng)計中給出了眾多的估計量評價標(biāo)準(zhǔn)，對同一估計量使用不同的評價標(biāo)準(zhǔn)可能會得到完全不同的結(jié)論，因此，在評價某一個估計好壞時首先要說明是在哪一個標(biāo)準(zhǔn)下，否則所論好壞毫無意義。但在諸多標(biāo)準(zhǔn)中，有一個基本標(biāo)準(zhǔn)是所有的估計都應(yīng)該滿足的，它是衡量一個估計是否可行的必要條件，這就是估計的相合性，我們就從相合性開始介紹。一、相合性我們知道，點估計是一個統(tǒng)計量，因此它是一個隨機(jī)變量，在樣本量一定的條件下，我們不可能要求完全等同于參數(shù)的真實取值，但如果我們有足夠的觀測值，根據(jù)格里紋科定理，隨著樣本量的不斷增大，經(jīng)驗分布函數(shù)逼近真實分布函數(shù)，因此完全可以要求估計量隨著樣本量的不斷增大而逼近參數(shù)真值，這就是相合性，嚴(yán)格定義如下，定義2.設(shè) 為未知參數(shù)，是的一個估計量，n是樣本容量，若對任何一個，有收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔則稱為參數(shù)的相合估計相合性被認(rèn)為是對估計的一個最基本要求，如果一個估計量，在樣本量不斷增大時，它都不能把被估參數(shù)估計到任意指定的精度，那么這個估計是很值得懷疑的，通常，不滿足相合性要求的估計一般不予考慮，證明估計的相合性一般可應(yīng)用大數(shù)定律或直接由定義來證。例11.用大數(shù)定律證明是的相合估計證：由切比雪夫大數(shù)定律∴即∴ 是的相合估計為了避免用定義判斷相合性的困難，下面介紹一個判斷相合性很有用的定理：定量：設(shè) 是的估計量若（1）（2）則是的相合估計。例12.證明是的相合估計證：在前面我們已經(jīng)證明1）2）∴ 是的相合估計二、無偏性相合性是大樣本下估計量的評價標(biāo)準(zhǔn)，對小樣本而言，需要一些其他的評價標(biāo)準(zhǔn)，無偏性便是一個常用的評價標(biāo)準(zhǔn)。設(shè) 是的一個估計，的參數(shù)空間為，若對任意的，有則稱是的無偏估計，否則稱為有偏估計。例13.對任一總體而言，樣本均值是總體均值的無偏估計，當(dāng)總體 k階矩存在時，樣本k階原點矩是總體k階原點矩的無偏估計，但對 k階中心矩則不一收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔樣，例如，二階樣本中心矩就不是總體方差的無偏估計，事實上，對此，有如下兩點說明（1）當(dāng)樣本量趨于無究時，有，我們稱為的漸近無偏估計，這表明當(dāng)樣本量較大時，可近似看作的無偏估計（2）若對作如下修正：則是總體方差的無偏估計，這種簡章的修正方法在一些場合常被采用，它比更常用，這是因為在 n≥2時， <，因此用估計有偏小的傾向，特別在小樣本場合要使用估計。無偏性不具有不變性。即若是的無偏估計，一般而言， g（）不是g（）的無偏估計，除非 g（）是的線性函數(shù)，例如，是的無偏估計，但 s不是的無偏估計例14.證明是的無偏估計。其中是X的樣本證：＝＝＝＝∴特別情形是的無偏估計例15.證明是的無偏估計證 ∵∴＝＝∴三、有效性參數(shù)的無偏估計可以有很多，那么如何在無偏估計中進(jìn)行選擇？直觀的想法是希望該估計圍繞參數(shù)真值的波動越小越好，波動的大小可以用方差來衡量，因此人們常用無偏估計的方差的大小作為度量無偏估計優(yōu)劣的標(biāo)準(zhǔn)，這就是有效性。定義4.設(shè) ，是的兩個無偏估計，如果對任意的有則稱比收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔有效例16.設(shè)x1,?xn是取自某總體的樣本，記總體均值為，總體方差為，則都是的無偏估計，但顯然，只要n＞1，比有效，這表明，用全部數(shù)據(jù)的平均估計總體均值要比只使用部分?jǐn)?shù)據(jù)更有效。例17.比較與誰有效解：（1）∴ 與都是的無偏估計2）＝＝∵∴ 比有效例18.設(shè) ，從總體中取樣證明是的無偏估計和相合估計解：（1）∴∴是的無偏估計＝是的相合估計收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第三節(jié) 參數(shù)的區(qū)間估計教學(xué)目的：要求學(xué)生了解置信區(qū)間的基本思想，理解置信區(qū)間的基本概念，掌握求置信區(qū)間的樞軸量法方法，熟練掌握正態(tài)總體參數(shù)置信區(qū)間的計算公式和大樣本置信區(qū)間。能用R軟件計算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)重點：置信區(qū)間的思想、概念和樞軸量法方法，計算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)難點：計算單個正態(tài)總體的置信區(qū)間以及兩個正態(tài)總體下的置信區(qū)間。用點估計去估計總體的參數(shù)，即使是無偏且有效的，也會由于樣本的隨機(jī)性，使得從一個樣本x1，x2，x3，?，xn算得的估計值不一定是被估計的參數(shù)的真實值，而且估計值的可靠性并不知道，這是一個重大的問題，因此，必須解決根據(jù)估計量的分布，在一定可靠性的程度下指出被估計的總體參數(shù)的取值范圍，這正是本節(jié)要介紹的參數(shù)的區(qū)間估計問題。一、置信區(qū)間概念為了引入置信區(qū)間的概念，請看下面的引例。引例設(shè)某種絕緣子抗扭強(qiáng)度 X服從正態(tài)分布，其中未知，已知（ =45公斤·米），試對總體均值作區(qū)間估計。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔對于區(qū)間估計，要選擇一個合適的統(tǒng)計量，若在該總體取一個容量為 n的樣本x1，x2，x3，?，xn，樣本均值為的點估計即，然而我們要給出的一個區(qū)間估計，以體現(xiàn)出估計的誤差，我們知道。在區(qū)間估計問題中，要選取一個合適的估計函數(shù)。這時，可取，它是的標(biāo)準(zhǔn)化隨機(jī)變量，且具備下面兩個特點：1）u中包含所要估計的未知參數(shù)（其中已知）；2）u的分布為N（0，1），它與未知參數(shù)無關(guān)。因為u～N（0，1），因而有，根據(jù)u～N（0，1）的概率密度的對稱性（見下圖）可得。當(dāng)α=0.05時，1-α=0.095， =1.96，將不等式轉(zhuǎn)化為，亦即，因此有。當(dāng)α=0.05時，。。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔說明未知參數(shù) 包含在區(qū)間中的概率是95%，這里，不僅給出了的區(qū)間估計，還給出了這一區(qū)間估計的置信度（或置信概率）。事實上，當(dāng)置信度為 1-α?xí)r，區(qū)間估計為在引例中，若 =160， =40，n=16。則有說明該絕緣子抗扭強(qiáng)度 X的期望在（140.4，179.6）內(nèi)的可靠度為 0.95。下面，引出置信區(qū)間的概念。定義5.設(shè)為總體的未知參數(shù) 是由樣本定出的兩個統(tǒng)計量，若對于給定的概率 1-α（0＜α＜1），有，則隨機(jī)區(qū)間稱為參數(shù) 的置信度為1-α的置信區(qū)間，稱為置信下限，稱為置信上限。置信區(qū)間的意義可作如下解釋：包含在隨機(jī)區(qū)間中的概率為100（1-α）%；或者說，隨機(jī)區(qū)間以100（1-α）%的概率包含。粗略地說，當(dāng)α=0.05時，在100次的抽樣中，大致有 95次包含在中，而其余5次可能不在該區(qū)間中。α常取的數(shù)值為 0.05，0.01，此時置信度 1-α分別為0.95，0.99。置信區(qū)間的長度可視為區(qū)間估計的精度，下面分析置信度與精度的關(guān)系。1）當(dāng)置信度1-α增大，又樣本容量n固定時，置信區(qū)間長度增大，即區(qū)間估計精度減低；當(dāng)置信度1-α減小，又樣本容量n固定，置信區(qū)間長度減小，即區(qū)間估計精度提高。2）設(shè)置信度1-α固定。當(dāng)樣本容量n增大時，置信區(qū)間減小（如引例中，置信區(qū)間長度為），區(qū)間估計精度提高。二、單個正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體是最常見的分布，本小節(jié)中我們討論它的兩個參數(shù)的置信區(qū)間。已知時的置信區(qū)間收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔設(shè)總體X服從正態(tài)分布，其中已知，而未知，求的置信度1-α的置信區(qū)間。這一問題實際上已在引例中的討論中解決，得到。所以的置信度1-α的置信區(qū)間為。當(dāng)α=0.05， =1.96；當(dāng)α=0.01， =2.576。例1.某車間生產(chǎn)滾珠，從長期實踐知道，滾珠直徑 X服從正態(tài)分布。從某天產(chǎn)品里隨機(jī)抽取 6個，測得直徑為（單位：毫米）：14.6，15.1，14.9，14.8，15.2，15.1。若總體方差 =0.06，求總體均值的置信區(qū)間（α=0.05，α=0.01）。解，=0.05時，置信度為95%的置信區(qū)間為=0.01時，置信度為99%的置信區(qū)間為。從此例知，在樣本容量n固定時，當(dāng)置信度1-α較大時，置信區(qū)間長度較大；當(dāng)置信度1-α較小時，置信區(qū)間較小。例2.用天平稱量某物體的質(zhì)量 9次，得平均值為 =15.4（g），已知天平稱量結(jié)果為正態(tài)分布，其標(biāo)準(zhǔn)差為 0.1g，試求該物體質(zhì)量的 0.95置信區(qū)間。解此處1-α=0.95，α=0.05，查表知u0.025=1.96,于是該物體質(zhì)量的0.95的置信區(qū)間為，從而該物體質(zhì)量的 0.95置信區(qū)間為[15.3347，15.4653]。例3.設(shè)總體為正態(tài)分布，為得到的置信水平為 0.95的置信區(qū)間長度不超過1.2，樣本容量應(yīng)為多大？解由題設(shè)條件知的0.95置信區(qū)間為，收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔其區(qū)間長度為，它僅依賴于樣本容量 n而與樣本具體取值無關(guān)?，F(xiàn)要求，即有 ?，F(xiàn)1-α=0.59，故 =1.96，從而。即樣本容量至少為11時才能使得的置信水平為0.95的置信區(qū)間長度不超過1.2。未知時的置信區(qū)間這時可用t統(tǒng)計量，因為，完全類似于上一小節(jié)由于t（n-1）分布的概率密度 f（x）的對稱性有（見下圖）解得其中是的無偏估計。例4.假設(shè)輪胎的壽命服從正態(tài)分布。為估計某種輪胎的平均壽命，現(xiàn)隨機(jī)地抽12只輪胎試用，測得它們的壽命（單位：萬千米）如下：4.684.854.324.854.615.025.204.604.584.724.384.70試求平均壽命的0.95置信區(qū)間。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔解此處正態(tài)總體標(biāo)準(zhǔn)差未知，可使用 t分布求均值的置信區(qū)間。本例中經(jīng)計算有 =4.7092，s2=0.0615。取α=0.05，查表知t0.025（11）=2.2010，于是平均壽命的0.95置信區(qū)間為（單位：萬千米）。的置信區(qū)間此時雖然也可以就是否已知分兩種情況討論的置信區(qū)間，但在實際問題中未知時已知的情況是極為罕見的，所以我們只在未知的條件下討論的置信區(qū)間。設(shè)x1，x2，x3，?，xn為來自總體 X的樣本，樣本方差 s2可作為的點估計。由，中包含未知參數(shù) ，又它的分布與無關(guān)，以作為估計函數(shù)，可用于的區(qū)間估計。由于分布是偏態(tài)分布，尋找平均長度最短區(qū)間很難實現(xiàn)，一般都改為尋找等尾置信區(qū)間：把 α平分為兩部分，在分布兩側(cè)各截面積為的部分，即采用的的兩個分位數(shù)它們滿足。（見下圖）收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔將上式開方即可得標(biāo)準(zhǔn)差的置信區(qū)間。例5.某廠生產(chǎn)的零件質(zhì)量 X服從正態(tài)分布 ?，F(xiàn)從該廠生產(chǎn)的零件中抽取9個，測得其質(zhì)量為（單位： g）45.345.445.145.345.545.745.445.345.6試求總體標(biāo)準(zhǔn)差的0.95置信區(qū)間。解由數(shù)據(jù)可算得 s2=0.0325，（n-1）s2=8×0.0325=0.26，這里α=0.95，查表知代入公式可得的0.95置信區(qū)間為。從而的0.95置信區(qū)間為[0.1218，0.3454]。以上關(guān)于正態(tài)總體參數(shù)的區(qū)間估計的討論列表如下表所示。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔本章小結(jié)本章考核要求：（一）點估計1）知道點估計的概念2）會用矩法求總體參數(shù)的矩估計值，主要依據(jù)是（3）會用最大似然估計法求總體參數(shù)的估計值?；痉椒ㄊ怯蓸颖?x1，x2，x3，?，xn構(gòu)造一個似然函數(shù)或似然函數(shù)的對數(shù)L（x1，x2，x3，?，xn，）=P（X=x1）P（X=x2）?P（X=xn）L（x1，x2，x3，?，xn，）=f（x1）f（x2）?f（xn）然后由lnL（x1，x2，x3，?，xn，）取最大的值時的值為的值，即。是L的最大值點。（二）點估計量的評價標(biāo)準(zhǔn)（1）若，則是的無偏估計。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔（2）若都是的無偏估計，且就說有效。（3）若。就說是的相合估計以上三條標(biāo)準(zhǔn)中主要掌握無偏估計和有效估計（三）區(qū)間估計（1）知道區(qū)間估計的概念（2）會求一個正態(tài)總體的參數(shù) 的置信區(qū)間。公式見表7-1第三章假設(shè)檢驗本章主要介紹統(tǒng)計假設(shè)檢驗的基本思想和概念以及參數(shù)的假設(shè)檢驗方法。第一節(jié) 假設(shè)檢驗的基本思想和概念教學(xué)目的：要求學(xué)生了解假設(shè)檢驗的基本思想，理解假設(shè)檢驗的基本概念，認(rèn)識假設(shè)檢驗問題，熟悉假設(shè)檢驗的基本步驟。教學(xué)重點：基本概念，假設(shè)檢驗的基本步驟 .教學(xué)難點：基本概念的理解.一、統(tǒng)計假設(shè)的概念為了引入統(tǒng)計假設(shè)的概念，先請看例 8-1。例1.味精廠用一臺包裝機(jī)自動包裝味精，已知袋裝味精的重量，機(jī)器正常時，其均值 =0.5（0.5，0.015的單位都是公斤）。某日開工后隨機(jī)抽取 9袋袋裝味精，其凈重（公斤）為：0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問這臺包裝機(jī)是否正常？此例隨機(jī)抽樣取得的9袋味精的重量都不正好是0.5公斤，這種實際重量和標(biāo)準(zhǔn)重量不完全一致的現(xiàn)象，在實際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因：一是偶然因素的影響，收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔二由于偶然因素而發(fā)生的（例如電網(wǎng)電壓的波動、金屬部件的不時伸縮、衡量儀器的誤差而引起的）差異稱為隨機(jī)誤差；由于條件因素（生產(chǎn)設(shè)備的缺陷、機(jī)械部件的過度損耗）而產(chǎn)生的差異稱為條件誤差。若只存在隨機(jī)誤差，我們就沒有理由懷疑標(biāo)準(zhǔn)重量不是0.5公斤；如果我們有十足的理由斷定標(biāo)準(zhǔn)重量已不是0.5公斤，那么造成這種現(xiàn)象的主要原因是條件誤差，即包裝機(jī)工作不正常，那么，怎樣判斷包裝機(jī)工作是否正常呢？我們通過解例 1來找出解假設(shè)檢驗問題的思想方法。解已知袋裝味精重，假設(shè)現(xiàn)在包裝機(jī)工作正常，即提出如下假設(shè)：，這是兩個對立的假設(shè)，我們的任務(wù)就是要依據(jù)樣本對這樣的假設(shè)之一作出是否拒絕的判斷。由于樣本均值是的一個很好的估計，故當(dāng) 為真時，應(yīng)很小。當(dāng) 過分大時，我們就應(yīng)當(dāng)懷疑不正確而拒絕。怎樣給出的具體界限值呢？當(dāng) 為真時，由于，對于給定的很小的數(shù) 0<α<1，例如取=0.05，考慮，其中是標(biāo)準(zhǔn)正態(tài)分布上側(cè) 分位數(shù)，而事件是一個小概率事件，小概率事件在一次試驗中幾乎不可能發(fā)生。我們查附表1得 ,又n=9,=0.015，由樣本算得，又由上式得：收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔小概率事件居然發(fā)生了，這與實際推斷原理相矛盾，于是拒絕，而認(rèn)為這臺包裝機(jī)工作不正常。從上面的例1中，我們看出為了對總體的某一參數(shù)進(jìn)行檢驗，通常提出兩個假設(shè)：。然后引入一個與被檢參數(shù)有關(guān)的服從某種分布的統(tǒng)計量，根據(jù)事先給出的一概率標(biāo)準(zhǔn)α（叫顯著水平）用反證法進(jìn)行判斷，由于小概率事件一般是不會發(fā)生的，如果引進(jìn)的樣本是一個小概率事件，因為它的確出現(xiàn)了，則可認(rèn)為假設(shè)不能接受，否則便接受。（二）假設(shè)檢驗的程序根據(jù)以上的討論與分析，可將假設(shè)檢驗的基本步驟概括如下：（1）根據(jù)實際問題提出原假設(shè) 及備擇假設(shè) 。這里要求與有且僅有一個為真。（2）選取合適的統(tǒng)計量，即要求所選的統(tǒng)計量與假設(shè) 無關(guān)且服從某種分布，常見的有標(biāo)準(zhǔn)正態(tài)分布 t（n-1）分布，（n-1）分布及F（m,n）公布。3）規(guī)定小概率標(biāo)準(zhǔn)α的大小，也叫顯著水平，通?？扇ˇ?0.01，α=0.05或α=0.。14）在顯著水平α下，根據(jù)統(tǒng)計量的分布將樣本空間劃分為兩部分，其一是接受的叫接受域，另一個是拒絕的叫拒絕域，記為 W。5）根據(jù)樣本值計算統(tǒng)計量的大小。6）作出判斷：若統(tǒng)計量的觀測值落在拒絕域W內(nèi)。則知小概率事件發(fā)生了，拒絕，接受。若統(tǒng)計量的觀測值落在接受域則認(rèn)為小概率事件沒有發(fā)生，可以接受拒絕。第二節(jié)總體均值的假設(shè)檢驗教學(xué)目的：理解和掌握單個以及兩個正態(tài)總體均值的假設(shè)檢驗的方法與思想，掌握正態(tài)總體方差檢驗的方法，能用 R軟件來完成這些檢驗。教學(xué)重點：檢驗方法的掌握，檢驗方法思想的理解。教學(xué)難點：檢驗方法的掌握。本節(jié)討論的總體均值的假設(shè)檢驗，多數(shù)是在正態(tài)總體下進(jìn)行的。一、u檢驗收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔方差已知時，單個正態(tài)總體均值檢驗2. 設(shè)x1,?,xn是從正態(tài)總體中抽取的一個樣本, 是已知常數(shù),欲檢驗假設(shè)：，其中為已知數(shù)，它的程序：1）提出假設(shè)2）引入統(tǒng)計量3）規(guī)定顯著水平α，查標(biāo)準(zhǔn)正態(tài)分布表求的上側(cè)分位數(shù)為臨界值，寫出相應(yīng)的拒絕域其中常用的有 α=0.1時，=0.05時，=0.01時，（4）根據(jù)樣本值 x1，x2，?，xn計算統(tǒng)計量u。（5）判斷：若 u落入拒絕域W內(nèi)時，則拒絕接受，若u落入接受域內(nèi)時，則接受，拒絕。例2.某產(chǎn)品的重量 X～N（12，1）（單位：克），更新設(shè)備后，從新生產(chǎn)的產(chǎn)品中抽樣 100件，測試樣本均值（克），如果產(chǎn)品的方差沒有改變，請問更新設(shè)備后，產(chǎn)品的平均重量是否有明顯變化？（ α=0.01）解（1）設(shè)2）引入3）根據(jù)α=0.01，查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表，得的上側(cè)分位數(shù)∴拒絕域為（-∞，-2.58）,（2.58，+∞）收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔4）計算5）∵u落入拒絕域W中，故拒絕，即有明顯差別。2.方差已知時，兩個正態(tài)總體值差的檢驗設(shè) ，其中為已知常數(shù)。x1，?，xm和y1，?，yn分別是取自X和Y的樣本且相互獨立。欲檢驗假設(shè)：檢驗假設(shè) ，等價于檢驗假設(shè) 。而是的一個好估計量，且當(dāng)為真時，有）于是對給定的水平 α，查附表1，可得臨界值，使（）從而得拒絕域，若u∈W，則拒絕；否則接受。由上述討論可知，由服從標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量作檢驗的方法稱為u檢驗法。例3.設(shè) 從中各抽樣25件測得=90， =89。設(shè)X，Y獨立，請問是否可以認(rèn) 與基本相同？α=0.05）解（1）（2）引進(jìn)統(tǒng)計量收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔（3）根據(jù)α=0.05，查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表將∴拒絕域W為（-∞，-1.96），（1.96,+ ）∞4）計算5）∵u在接受域內(nèi)，∴接受，即與差別不大。二、t檢驗方差未知時，單個正態(tài)總體均值檢驗設(shè)x1，?，xm是從正態(tài)總體中抽取的一個樣本，其中未知，欲檢驗（1），其中為已知數(shù)。2）構(gòu)造統(tǒng)計量3）給定顯著水平α，查t（n-1）表求分位數(shù)則拒絕域（4）根據(jù)樣本x1，x2，?，xn計算（5）若t落在拒絕域 W內(nèi)，則拒絕，接受。若t未落在拒絕域內(nèi)，則接受，拒絕。例4.車輛廠生產(chǎn)的螺桿直徑 X服從正態(tài)分布，現(xiàn)從中抽取 5枝，測得直徑（單位：毫米）為22.3，21.5，22.0，21.8，21.4。如果未知，試問直徑均值=21是否成立？（α=0.05）解檢驗假設(shè)（1），收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔由樣本觀測值算得（2），3）計算4）根據(jù)α=0.05，查t（n-1）分布表臨界值。∴拒絕域為5）∵t=4.87在拒絕域內(nèi)∴否定，接受。即認(rèn)為直徑均值不是 21。方差未知時，兩個正態(tài)總體均值檢驗設(shè) 和分別是取自 X和Y的樣本且相互獨立。（1）（未知）。欲檢驗假設(shè)（2）構(gòu)造統(tǒng)計量。t即為我們構(gòu)造的檢驗統(tǒng)計量。這時，對給定的水平 α，查附表3可得臨界值，使，即得拒絕域。例5.在漂白工藝中考察溫度對針織品斷裂強(qiáng)度的影響，現(xiàn)在 70℃與80℃下分別作8次和6次試驗，測得各自的斷裂度 X和Y的觀測值。經(jīng)計算得，。根據(jù)以往的經(jīng)驗，可認(rèn)為 X收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔和Y均服從正態(tài)分布，且方差相等，在給定 α=0.10時，問70℃與80℃對斷裂強(qiáng)度的無顯著差異？解由題設(shè)，可假定，于是若作統(tǒng)計假設(shè)為兩個溫度下的斷裂強(qiáng)度無顯著性差異，即相當(dāng)于作假設(shè)（1）。2）構(gòu)造統(tǒng)計量3）α=0.10，查得t（m+n-2）=t（12）表，得臨界值。∴拒絕域W為（-∞，-1.782）∪（1.782，+∞）（4）計算（5）因為t落在拒絕域W內(nèi)，所以拒絕，接受。即認(rèn)為斷裂強(qiáng)度有明顯差別。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第三節(jié) 正態(tài)總體方差的假設(shè)檢驗教學(xué)目的：了解指數(shù)分布參數(shù)的假設(shè)檢驗，比例的檢驗，大樣本檢驗，能用 R軟件來完成這些檢驗，會解決簡單的實際問題。教學(xué)重點：對于檢驗方法的理解。教學(xué)難點：解決簡單的實際問題。在實際問題中，有關(guān)方差的檢驗問題也是常遇到的，如上節(jié)介紹的 u檢驗和t檢驗中均與方差有密切的聯(lián)系。因此，討論方差的檢驗問題尤為重要。一、檢驗設(shè)總體未知，x1，?，nx為取自X的樣本，欲檢驗假設(shè)其中為已知數(shù)。自然想到，看的無偏估計s2有多大，當(dāng)H0為真時，s2應(yīng)在周圍波動，如果很大或很小，則應(yīng)否定 H0，因此構(gòu)造檢驗統(tǒng)計量。對于給定的顯著水平 α，可查（n-1）表可得分位數(shù)收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔∴拒絕域W為。若統(tǒng)計量落在拒絕域W內(nèi)，則拒絕，接受。若統(tǒng)計量落在接受域內(nèi)，則接受，拒絕。例6.設(shè)某廠生產(chǎn)銅線的折斷力，現(xiàn)從一批產(chǎn)品中抽查 10根測其折斷力后經(jīng)計算得樣本均值 =575.2，樣本方差s2=68.16。試問能否認(rèn)為這批銅線折斷2力的方差仍為 8（公斤）（取 α=0.05）？（1），2）引進(jìn)統(tǒng)計量3）根據(jù)α=0.05，查（n-1）=（9）表得臨界值于是得拒絕域（4）。（5）計算由于不在拒絕域W內(nèi)，故不拒絕，即可認(rèn)為該批銅線折斷力的方差與 82（公斤）無顯著差異。二、F檢驗前面介紹的用t檢驗法檢驗兩個獨立正態(tài)總體的均值是否相等時，曾假定它們的方差是相等的。一般說來，兩個正態(tài)總體方差是未知的，那么，如何來檢驗兩獨立正態(tài)總體方差是否相等呢？為此介紹F檢驗法。設(shè)有兩正態(tài)總體和分別是取自X和Y的樣本且相互獨立。欲檢驗統(tǒng)計假設(shè)。由于是的無偏估計，是的無偏估計，當(dāng) 為真時，自然想到和應(yīng)該差不多，其比值不會太大或大小，現(xiàn)在關(guān)鍵在于統(tǒng)計量服從什么分布。由§6.3節(jié)定理收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔6-4推論我們知道，當(dāng) 為真時，這樣，取F為檢驗統(tǒng)計量，對給定的水平 α，查附表5，確定臨界值使。即得拒絕域。若由樣本觀測值算得 F值，當(dāng)F∈W時，拒絕，即認(rèn)為兩總體方差有顯著差異。否則認(rèn)為與相容，即兩總體方差無顯著差異。例7.設(shè)甲、乙兩臺機(jī)床加工同一種軸，從這兩臺機(jī)床加工的軸中分別抽取若干根，測得直徑數(shù)據(jù)如下假定各臺機(jī)床加工軸的直徑X，Y分別服從正態(tài)分布，試比較甲、乙兩臺機(jī)床加工軸的精度有無顯著差異（取α=0.05）。解按題意，本題是要檢驗兩正態(tài)總體的方差是否相等，即要檢驗統(tǒng)計假設(shè)1）2）引入統(tǒng)計量3）根據(jù)α=0.05查F（7，6）表得于是，∴拒絕域W為（0，0.195）∪（5.70，+∞）4）計算5）∵F不在拒約域W內(nèi)，∴接受，即方差無明顯差別。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第四節(jié) 單邊檢驗實際問題中，有時我們只關(guān)心總體的均值是否會增大，例如，試驗新工藝以提高產(chǎn)品的質(zhì)量，如材料的強(qiáng)度、元件的使用壽命等，當(dāng)然，總體的均值越大越好，此時，需要檢驗假設(shè)。。其中是已知常數(shù)。類似地，如果只關(guān)心總體的均值是否變小，就需要檢驗假設(shè)，下面以單個正態(tài)總體方差已知情況為例，來討論均值的單邊檢驗的拒絕域。設(shè)總體為已知。x1，?，xn，是取自X的一個樣本，給定檢驗水平，α考慮單邊假設(shè)問題。，由于是的無偏估計，故當(dāng) 為真時，不應(yīng)太大，而當(dāng) u偏大時應(yīng)拒絕，故拒絕域的形式為：，c待定，由于，故可找臨界值 α，收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔使當(dāng)成立時，，因此，。由事件是一個小概率事件知，事件更是一個小概率事件。如果根據(jù)所給的樣本觀測值， x1，?，xn算出，則應(yīng)該否定原假設(shè)，即拒絕域為W=（uα，+∞）。當(dāng) 時，我們不否認(rèn)原假設(shè)類似地，對于單邊假設(shè)檢驗問題：，仍取為檢驗統(tǒng)計量，但拒絕域為W=（-∞，-uα），即當(dāng)由樣本觀測值算出時，則應(yīng)拒絕原假設(shè) 。我們已注意到，上單邊檢驗問題，與單個正態(tài)總體方差情況的均值的雙邊檢驗述問題一樣，其所用的檢驗統(tǒng)計量和檢驗步驟完全相同，不同的只是拒絕域。我們著重指出：單邊檢驗問題的拒絕域，其不等式的取向，與備擇假設(shè)的不等式取向完全一致。這一特有的性質(zhì)使我們無需特別記憶單邊檢驗的拒絕因此，若遇上本章 §8.2，§8.3中相應(yīng)的單邊檢驗問域。題，則只要作類似的處理就行了，例如：設(shè)總體，欲檢驗統(tǒng)計假設(shè)收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔，其中為已知數(shù)。這時，由雙邊檢驗問題中的檢驗知。檢驗統(tǒng)計量可取。若由樣本觀測值算出，則當(dāng) 時拒絕，即拒絕域為，此不等式取向與備擇假設(shè)取向一致。若欲檢驗則檢驗統(tǒng)計量仍取，拒絕域為：，即W=（0, ）類似地，兩個總體和分別是取自X和Y的樣本且相互獨立。欲檢驗統(tǒng)計假設(shè)。這時，類似于雙邊檢驗問題，檢驗統(tǒng)計量可取，拒絕域為，即。各種統(tǒng)計假設(shè)檢驗情況（檢驗水平為 α）如下表所示。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔例8.用某種農(nóng)藥施入農(nóng)田中防治病蟲害，經(jīng)三個月后土壤中如有5ppm以上的濃度時，認(rèn)為仍有殘效，現(xiàn)在一大田施藥區(qū)隨機(jī)取10個土樣進(jìn)行分析，其濃度為：4.8，3.2，2.0，6.0，5.4，7.6，2.1，2.5，3.1，3.5（單位：ppm）。問該農(nóng)藥經(jīng)三個月是否仍有殘效（土壤殘余農(nóng)藥濃度服從正態(tài)分布α=0.05）？解顯然，我們關(guān)心的只是總體均值是否小于，這時若用雙邊檢驗是不恰當(dāng)有，所以我們應(yīng)該檢驗。這時，檢驗統(tǒng)計量應(yīng)取，對于給定的顯著性水平α=0.05，查t分布表得由樣本算得 T的觀測值t=-1.45＞-1.83，不能拒絕H0，即沒有理由懷疑該農(nóng)藥已無殘效。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔例9.某類鋼板每塊的重量X服從正態(tài)分布，其一項質(zhì)量指標(biāo)是鋼板重量的方差不得超過0.016kg2?，F(xiàn)從某天生產(chǎn)的鋼板中隨機(jī)抽取25塊，得其樣本方差解這是一個關(guān)于正態(tài)總體方差的單側(cè)檢驗問題，原假設(shè) ，備擇假設(shè)為，此處n=25。若取α=0.05，則查表知，現(xiàn)計算可得。由此，在顯著水平0.05下，我們拒絕原假設(shè)，認(rèn)為該天生產(chǎn)的鋼板重量的方差不符合要求。例10.有一批槍彈，其初速度，其中 =950m/s， =10m/s。經(jīng)過較長時間儲存后，現(xiàn)取出 9發(fā)槍彈試射，測其初速度，得樣本值如下（單位：m/s）：914，920，910，934，953，945，912，924，940。問這批槍彈在顯著性水平α=0.05下，其初速度是否起了變化（假定沒有變化）？解由題設(shè)，要檢驗的假設(shè)為，因為槍彈儲存后初速度不可能增加，所以是（左側(cè)）單邊檢驗問題，由 n=9，易另算出，查表知-uα=-u0.05=-1.65，所以u=-6.6＜-1.65=-uα，故應(yīng)拒絕H0而接受，即認(rèn)為這批槍彈經(jīng)過較長時間儲存后初速度已經(jīng)變小了。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第五節(jié) 兩類錯誤通過上面分析可知，一個假設(shè)檢驗問題，是要先給定一個原假設(shè) H0與備擇假設(shè)H1，選出一個合適的檢驗統(tǒng)計量T，由此給出拒絕域W內(nèi)。再根據(jù)在總體抽樣得到的樣本值（x1，x2，?，xn），看它是否落入由檢驗統(tǒng)計量T定出的拒絕域W內(nèi)。當(dāng)（x1，x2，?，xn）∈W時，就拒絕 H0（即接受H1）；而當(dāng)（x1，x2，?，xn）∈W時，接受H0。這樣的假設(shè)檢驗有可能犯錯誤。數(shù)理統(tǒng)計的任務(wù)本來是用樣本去推斷總體，即從局部去推斷整體，當(dāng)然有可能犯錯誤。我們來分析會犯什么類型的錯誤。一類錯誤是：在 H0成立的情況下，樣本值落入了 W，因而H0被拒絕，稱這種錯誤為第一類錯誤，又稱為拒真錯誤，一般記犯第一類的概率為 α。另一類錯誤是：在 H0不成立的情況下，樣本值未落入拒絕域 W，因而H0被接受，稱這種錯誤為第二類錯誤，又稱為取偽錯誤，并記犯第二類錯誤的概率為。第一類錯誤在例 8-1中我們分析過。因為，在H0成立條件下，根據(jù)樣本值算得的u滿足“”，即樣本值落入拒絕域W，從而拒絕了H0。由此可見，犯第一類錯誤的概率即為α，而α即為顯著性水平。一般地，有，要尋找合適的檢驗統(tǒng)計量 T，使得由它定出的拒絕域 W滿足犯第一類錯誤的概率不超過 α，犯第二類錯誤的概率為現(xiàn)列表說明兩類錯誤，見下表：人們當(dāng)然希望在假設(shè)檢驗問題中犯兩類錯誤的概率都盡可能小，然而在樣本容量固定時是做不到的。人們發(fā)現(xiàn)：1）兩類錯誤的概率是相互關(guān)聯(lián)的。當(dāng)樣本容量n固定時，一類錯誤的概率的減少將導(dǎo)致另一類錯誤的概率的增加。2）要同時降低兩類錯誤的概率，需要增大樣本容量n。收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔本章小結(jié)（一）理解假設(shè)檢驗的基本思想，知道假設(shè)檢驗的步驟。（二）知道兩類錯誤（三）掌握單個正態(tài)總體的均值和方差的檢驗方法，并會簡單應(yīng)用，這是本章主要重點。（四）兩個正態(tài)總體會檢驗（1），（2），收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除精品文檔第四章回歸分析教學(xué)目的：理解變量間的兩類關(guān)系，認(rèn)識一元線性和非線性回歸模型，熟悉回歸系數(shù)的估計方法，熟練掌握回歸方程的顯著性檢驗。能用 R軟件來進(jìn)行回歸分析，會解決簡單的實際問題。教學(xué)重點：回歸系數(shù)的估計方法，回歸方程的顯著性檢驗 .教學(xué)難點：回歸方程的顯著性檢驗 .在現(xiàn)實世界中，不少變量之間是存在著一定的關(guān)系的，一般來說，這種關(guān)系大體上可分為兩類，一類是確定性的，即函數(shù)關(guān)系。例如，電路中的電壓 V，電流I，電阻R三者間有關(guān)系。另一類是非確定性的，這類變量之間雖有一定的關(guān)系卻又并不完全確定，例如人的血壓與年齡有關(guān)，煉鋼過程中含碳量與精煉時間有關(guān)，農(nóng)作物產(chǎn)量與施肥量和單位面積的播種量有關(guān)??這些變量之間雖有一定聯(lián)系，但又不能用普通函數(shù)關(guān)系式來表達(dá)。例如對給定的施肥量和確定的播種量，農(nóng)作物的產(chǎn)量還是不能完全確定的。事實上，這些變量是隨機(jī)變量或至少其中一個是隨機(jī)變量。這種非確定性的關(guān)系稱為相關(guān)關(guān)系。回歸分析是研究相關(guān)關(guān)系的一種數(shù)學(xué)工具，是數(shù)理統(tǒng)計學(xué)中最常用的統(tǒng)計方法之一，在生產(chǎn)實踐和科學(xué)研究中有著廣泛的應(yīng)用。本章僅簡單介紹一元線性回歸分析。第一節(jié) 回歸直線方程的建立為了說明一元線性回歸的數(shù)學(xué)模型，我們先看一個實際例子。例1.某種合金的抗拉強(qiáng)度y（kg/mm2）與其中的含碳量x（%）有關(guān)，現(xiàn)測12對數(shù)據(jù)如表1所示。表1x0.100.110.120.130.140.150.160.170.180.200.210.23y42.043.545.045.545.047.549.053.050.055.055.060.0為了了解其相關(guān)關(guān)系的表達(dá)式，在坐標(biāo)上以（xi，yi），i=1，2，?，12為點，畫出散點圖如圖9-1所示，這些點大體上散布在某條直線的周圍，又不完全在一條直線上，從而可認(rèn)為y與x的關(guān)系基本上是線性的，而這些點與直線的偏離是由其他一切隨機(jī)因素的影響造成的。一般說來，含碳量x是一個可觀測或可控制的普通變量，而對任意一個含碳量x，相應(yīng)的抗拉強(qiáng)度是一個隨機(jī)變量Y，實際觀測值y是Y的一個可能取值。隨x的變化，Y的觀測值線性變化的趨勢可表示為收集于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系管理員刪除xi與yi之間有如下關(guān)系精品文檔。其中表示Y隨x的變化而線性變化的部分，是一切隨機(jī)因素影響的總和，稱為隨機(jī)誤差項，它是不可觀測其值的隨機(jī)變量，在Y的方差時，是一個E（）=0，D（）的隨機(jī)變量，在涉及分布時，可進(jìn)一步假定。一般地，將1，x2，?，xn，通過試驗得到對應(yīng)的Yx取一組不同的值，x的值y1，y2，?，yn，這樣就得到 n對觀測值（xi，yi），i=1，2，?，n?？砂褃的值看成由兩部分疊加而成，一部分是 x的線性函數(shù) ，另一部分系試驗過程中其他一切隨機(jī)因素的影響。因此，由上式可認(rèn)為，（i=1，2，?，n），且各相互獨立。此式就是一元線性回歸的數(shù)學(xué)模型。回歸分析的基本問題是依據(jù)樣本（ xi，yi），i=1，2，?，n解決如下問題：（1）未知參數(shù) 及的點估計，若分別為的估計,由此得。上式是抽述 Y與x之間關(guān)系的經(jīng)驗公式。我們稱上式為 Y關(guān)于x的一元線性回歸方程，它就是我們要求的 y與x之間的定量關(guān)系的表達(dá)式，其圖像便是

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)理統(tǒng)計講義演示教學(xué)

文檔簡介

溫馨提示

最新文檔

評論

數(shù)理統(tǒng)計講義演示教學(xué)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔