版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于總體分布樣本分布第1頁,課件共91頁,創(chuàng)作于2023年2月提示如何依據(jù)樣本的信息推斷總體的特征——參數(shù)估計問題樣本總體樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、比例、方差等第2頁,課件共91頁,創(chuàng)作于2023年2月有關(guān)概率概念的回顧通俗地說:概率是衡量某一特定事件的機會或可能性的數(shù)值度量。它可以用來度量如下一些問題中的可能性如果提高產(chǎn)品的價格,則銷售下降的“機會”有多少?某種新的裝配作業(yè)方法會在多大“可能性”上提高生產(chǎn)率?某項工程按期完成的“可能性”有多大?新投資贏利的“機會”有多大?概率在決策過程中起著重要作用,它提供了一種機制來衡量、表達(dá)和分析與未來事件相聯(lián)系的不確定性。第3頁,課件共91頁,創(chuàng)作于2023年2月一些相關(guān)概念隨機實驗至少有兩個或兩個以上的結(jié)果但事先不知道會發(fā)生哪個結(jié)果的過程。隨機事件(簡稱為事件)一個隨機實驗的可能結(jié)果稱為基本事件。所有基本事件的集合稱為總體(樣本空間)??傮w的子集稱為隨機事件。概率的定義(見教材p2)。任何滿足定義中三個條件的函數(shù)P(A)都可以作為一種合適的概率分配方式。常用的概率分配方式有:古典法(拋擲硬幣)、相對頻數(shù)法(產(chǎn)品銷路調(diào)查)和主觀法(體育比賽結(jié)果預(yù)測)。第4頁,課件共91頁,創(chuàng)作于2023年2月5.1總體分布與樣本分布本章的總體(PopulationorUniverse)是指研究對象的全體。并且先研究只有一個特征(指標(biāo)或變量)的總體。這樣表述總體特征的變量可以看成一個一維隨機變量。例如我們在某個研究中關(guān)注廣州市的某區(qū)居民的某年經(jīng)濟收入情況,我們在這個問題中的總體就是廣州市某區(qū)居民的全體,但我們實際上關(guān)注的是該區(qū)居民該年的經(jīng)濟收入這樣一個特征,我們可以用一個變量X來表征我們?nèi)我膺x取的一個該區(qū)居民該年的收入。則X是一個一維隨機變量,而我們研究的總體實際上是這一隨機變量取值的全體。因此,總體也可理解為一個隨機變量取的值全體。第5頁,課件共91頁,創(chuàng)作于2023年2月5.1.1總體與總體分布更準(zhǔn)確地說,一維隨機變量是指反映某總體特征取值,且具有如下特點的變量X:(1)在同一條件下可以無限次重復(fù)取值;(2)取值的結(jié)果可能有多個,但不確定;(3)事先不知道取值結(jié)果(Outcome)。由此可知,隨機變量可以理解為“隨機實驗(隨機地抽取一個個體)”結(jié)果的數(shù)值性描述。第6頁,課件共91頁,創(chuàng)作于2023年2月隨機變量取值的概率分布,就稱為總體分布。一個隨機變量取給定值或?qū)儆谝唤o定值集合的概率所確定的函數(shù)稱為該隨機變量的概率分布。概率分布反映的是隨機變量所有可能取值的概率的分配方式。一旦與所有可能結(jié)果相聯(lián)系的概率被確定,則概率分布完全確定。X
x1
x2…
xn
…P(X)p1
p2…
pn
…無論是理論研究還是解決實際問題,知道一個隨機變量取各種可能值的概率情況(概率分布)都是十分重要的。第7頁,課件共91頁,創(chuàng)作于2023年2月離散隨機變量的概率分布。設(shè)X為取相異值x1,
x2,
…
xn,…的離散隨機變量,則函數(shù)稱為X的概率分布或概率分布函數(shù)(probabilitydistributionfunction,PDF),其中P(X=xi)為離散隨機變量X取xi值的概率。(1)離散隨機變量的概率分布第8頁,課件共91頁,創(chuàng)作于2023年2月(2)連續(xù)隨機變量的概率密度函數(shù)設(shè)X是連續(xù)隨機變量,x是X取的值,若函數(shù)f(x)滿足下列條件:則稱f(x)為X的概率密度函數(shù)(probabilitydensityfunction,PDF),其中P(a<xb)表示X在區(qū)間(a,b]取值的概率。第9頁,課件共91頁,創(chuàng)作于2023年2月有時也稱下式定義的函數(shù)為X的概率分布函數(shù):連續(xù)型隨機變量取給定值的概率為零。f(x)xab第10頁,課件共91頁,創(chuàng)作于2023年2月5.1.2隨機樣本與樣本觀察值從重復(fù)抽樣的角度看“每次從總體中隨機抽取個體”可理解為一個隨機實驗。隨機樣本:表征n次抽取個體的隨機抽樣的一組隨機變量X1,X2,…,Xn.樣本觀察值(樣本數(shù)據(jù)):n次隨機抽樣的結(jié)果:x1,x2,…,xn(稱為隨機變量X1,X2,…,Xn的樣本觀察值)。n稱為樣本容量。注:x1,x2,…,xn也可以看成隨機變量X的n次重復(fù)抽樣的結(jié)果。第11頁,課件共91頁,創(chuàng)作于2023年2月大寫的英文字母:隨機變量小寫的英文字母:隨機變量的觀察值例拋擲一個均勻的骰子,假設(shè)骰子的六個面分別標(biāo)有數(shù)字1,2,3,4,5,6。用X標(biāo)識骰子落地后朝上一面的數(shù)字。則X是離散隨機變量。對該隨機變量進行一次抽樣,其實就是擲該骰子一次。第i次抽樣,就是第i次擲骰子,其結(jié)果的表示:事前事后Xixi易見,Xi其實就是X第12頁,課件共91頁,創(chuàng)作于2023年2月5.1.3樣本分布函數(shù)設(shè)x1,x2,…,xn是隨機變量X的樣本觀察值,將它們按大小順序排列,排序后為x1x2…
xn,ki為小于xi+1的樣本值出現(xiàn)的累積頻次,n仍為樣本容量,則可得到樣本累積頻率分布函數(shù)如下樣本累積頻率分布函數(shù)又簡稱為樣本(累積)分布函數(shù),它是總體(累積)分布函數(shù)的近似,n越大,就越接近總體分布,如圖。第13頁,課件共91頁,創(chuàng)作于2023年2月對于有限總體,其累積概率分布函數(shù)不連續(xù),是階躍式的。樣本的累積分布函數(shù)也是階躍式的。如圖所示。樣本(累積)分布函數(shù)是總體(累積)分布函數(shù)的近似,n越大,就越接近總體分布第14頁,課件共91頁,創(chuàng)作于2023年2月1991年美國一般社會調(diào)查(1991U.S.GeneralSocialSurvey)數(shù)據(jù)中被調(diào)查對象”接受學(xué)校教育的最高年限”的樣本累積分布圖第15頁,課件共91頁,創(chuàng)作于2023年2月5.1.4格利文科(Glivenko)定理(樣本分布與總體分布的關(guān)系)格利文科定理:當(dāng)n趨于無窮大時,F(xiàn)n(x)依概率1(關(guān)于x)均勻地收斂于總體分布F(x).格利文科定理的數(shù)學(xué)表達(dá)如下:格利文科定理是用樣本特征推斷總體特征的依據(jù)。這表明當(dāng)n充分大時,樣本分布Fn(x)是總體分布F(x)的一個良好近似。第16頁,課件共91頁,創(chuàng)作于2023年2月例如,利用格利文科定理可以證明:即樣本均值依概率收斂于總體均值。即樣本方差依概率收斂于總體方差。第17頁,課件共91頁,創(chuàng)作于2023年2月5.1.5隨機樣本的均值函數(shù)對于隨機樣本X1,X2,…,Xn,定義樣本的均值函數(shù)(簡稱為樣本均值)為由于式中Xi是隨機樣本(隨機變量),因此作為隨機樣本函數(shù)的是隨機變量比較樣本數(shù)據(jù)的均值它可以看成是的觀察值第18頁,課件共91頁,創(chuàng)作于2023年2月5.1.6隨機樣本的方差函數(shù)對于隨機樣本X1,X2,…,Xn,定義樣本的方差函數(shù)(簡稱為樣本方差)為由于式中Xi是隨機樣本(隨機變量),因此作為隨機樣本函數(shù)的S2是隨機變量比較樣本數(shù)據(jù)的方差它是S2的觀察值第19頁,課件共91頁,創(chuàng)作于2023年2月5.2統(tǒng)計量與統(tǒng)計量的分布5.2.1統(tǒng)計量的定義統(tǒng)計量是不含未知參數(shù)的、隨機樣本X1,X2,…,Xn的函數(shù)注意統(tǒng)計量是隨機樣本X1,X2,…,Xn的函數(shù),因而也是隨機變量在上面定義的函數(shù)中將每個隨機樣本Xi用其觀察值xi代替,計算的結(jié)果f(x1,x2,…,xn)稱為統(tǒng)計量的值。也可以直接將f(x1,x2,…,xn)看成統(tǒng)計量的觀察值。第20頁,課件共91頁,創(chuàng)作于2023年2月例子例如一項關(guān)于浙江省白領(lǐng)(收入為4000元-10000元)的職員的調(diào)查認(rèn)為有60%白領(lǐng)患失眠癥。樣本1樣本2樣本3如果在這個調(diào)查中樣本容量為100,則
=(樣本中失眠的人數(shù))/(樣本容量)是一個統(tǒng)計量。第21頁,課件共91頁,創(chuàng)作于2023年2月是某一樣本統(tǒng)計量的全部可能取值的概率分布?,F(xiàn)實中不可能抽出所有樣本,因此統(tǒng)計量的抽樣分布實際是一種理論概率分布。統(tǒng)計推斷中,常用的理論概率分布:正態(tài)分布、2分布、t分布和F分布。提供了樣本統(tǒng)計量穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。樣本分布(samplingdistribution)第22頁,課件共91頁,創(chuàng)作于2023年2月5.2.2由標(biāo)準(zhǔn)正態(tài)分布的隨機樣本所引出的幾個重要統(tǒng)計量的分布1.正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布設(shè)X服從均值為μ,方差為σ2正態(tài)分布,即X~N(μ,σ2),則其分布密度函數(shù)為特別地,當(dāng)μ=0,σ2=1
時正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布。第23頁,課件共91頁,創(chuàng)作于2023年2月任何一個正態(tài)分布X~N(μ,σ2),作變換就可化成標(biāo)準(zhǔn)正態(tài)分布,即Z~N(0,1)。正態(tài)分布有許多特點:例如它是對稱的。正態(tài)變量大約有68%的可能性在離均值一個標(biāo)準(zhǔn)差的范圍內(nèi)取值;大約有95%的可能性在離均值1.96倍標(biāo)準(zhǔn)差的范圍內(nèi)取值。幾乎不在離均值3倍標(biāo)準(zhǔn)差以外的地方取值。68%95%99.7%第24頁,課件共91頁,創(chuàng)作于2023年2月例如設(shè)X~N(54,0.852),要計算P(X≤52)。則可以這樣計算:
第25頁,課件共91頁,創(chuàng)作于2023年2月x0.000.010.020.030.040.050.060.070.080.090.00.10.20.30.4
0.50.60.70.80.9
1.01.11.21.31.4
1.51.61.71.81.9
2.02.12.22.32.4
2.52.62.72.82.90.50000.53980.57930.61790.6554
0.69150.72570.75800.78810.8159
0.84130.86430.88490.90320.9192
0.93320.94520.95540.96410.9713
0.97720.98210.98610.98930.9918
0.99380.99530.99650.99740.99810.50400.54380.58320.62170.6591
0.69500.72910.76110.79100.8186
0.84380.86650.88690.90490.9207
0.93450.94630.95640.96480.9719
0.97780.98260.98640.98960.9920
0.99400.99550.99660.99750.99820.50800.54780.58710.62550.6628
0.69850.73240.76420.79390.8212
0.84610.86860.88880.90660.9222
0.93570.94740.95730.96560.9726
0.97830.98300.98680.98980.9922
0.99410.99560.99670.99760.99820.51200.55170.59100.62930.6664
0.70190.73570.76730.79670.8238
0.84850.87080.89070.90820.9236
0.93700.94840.95820.96640.9732
0.97880.98340.98710.99010.9925
0.99430.99570.99680.99770.99830.51600.55570.59480.63310.6700
0.70540.73890.77030.79950.8264
0.85080.87290.89250.90990.9251
0.93820.94950.95910.96710.9738
0.97930.98380.98740.99040.9927
0.99450.99590.99690.99770.99840.51990.55960.59870.63680.6736
0.70880.74220.77340.80230.8289
0.85310.87490.89440.91150.9265
0.93940.95050.95990.96780.9744
0.97980.98420.98780.99060.9929
0.99460.99600.99700.99780.99840.52390.56360.60260.64060.6772
0.71230.74540.77640.80510.8315
0.85540.87700.89620.91310.9278
0.94060.95150.96080.96860.9750
0.98030.98460.98810.99090.9931
0.99480.99610.99710.99790.99850.52790.56750.60640.64430.6808
0.71570.74860.77940.80780.8340
0.85770.87900.89800.91470.9292
0.94180.95250.96160.96930.9756
0.98080.98500.98840.99110.9932
0.99490.99620.99720.99790.99850.53190.57140.61030.64800.6844
0.71900.75170.78230.81060.8365
0.85990.88100.89970.91620.9306
0.94300.95350.96250.97000.9762
0.98120.98540.98870.99130.9934
0.99510.99630.99730.99800.99860.53590.57530.61410.65170.6879
0.72240.75490.78520.81330.8389
0.86210.88300.90150.91770.9319
0.94410.95450.96330.97060.9767
0.98170.98570.98900.99160.9936
0.99520.99640.99740.99810.9986第26頁,課件共91頁,創(chuàng)作于2023年2月2.
2(n)分布的構(gòu)成設(shè)X~N(0,1),X1,X2,…,Xn是X的隨機樣本,則這些隨機樣本的平方和服從自由度為n的
2分布,即
2~
2(n)這是一種常用的分布。例如對服從正態(tài)分布的變量的隨機樣本,其方差函數(shù)S2就滿足:第27頁,課件共91頁,創(chuàng)作于2023年2月2(n)一個非對稱分布,其均值為n,方差為2n,其中n為自由度(df)。第28頁,課件共91頁,創(chuàng)作于2023年2月3.t分布自由度為n的t分布,記為t(n),
是由標(biāo)準(zhǔn)正態(tài)分布N(0,1)和2(n)分布組成,其表達(dá)式為其中X~N(0,1),Y~2(n),且X與Y相互獨立。第29頁,課件共91頁,創(chuàng)作于2023年2月t分布的均值為0,方差為n/(n-2)。并且當(dāng)n充分大時,它就近似于標(biāo)準(zhǔn)正態(tài)分布。第30頁,課件共91頁,創(chuàng)作于2023年2月4.F分布F分布是由兩個2之比組成的:記為F~F(n,m),其中U~2(n),V~2(m).對于F(n,m),n稱為第一自由度(分子自由度),m稱為第二自由度(分母自由度)。第31頁,課件共91頁,創(chuàng)作于2023年2月第32頁,課件共91頁,創(chuàng)作于2023年2月5.2.3由一般正態(tài)分布的隨機樣本所構(gòu)成的若干重要統(tǒng)計量的分布
抽樣分布:樣本統(tǒng)計量所有可能值的概率分布。樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量分布的形狀及接近總體參數(shù)的程度第33頁,課件共91頁,創(chuàng)作于2023年2月樣本統(tǒng)計量:平均數(shù)比率(成數(shù))方差第34頁,課件共91頁,創(chuàng)作于2023年2月設(shè)隨機變量X~N(μ,σ2),X1,X2,…,Xn是X的隨機樣本,則(1)(2)(3)常使用的幾個樣本統(tǒng)計量及其分布第35頁,課件共91頁,創(chuàng)作于2023年2月(4)(5)其中是容量為n1的隨機變量的樣本方差;是容量為n2的隨機變量的樣本方差。第36頁,課件共91頁,創(chuàng)作于2023年2月5.2.4任意分布的隨機樣本均值函數(shù)的均值和方差設(shè)隨機變量X的均值為μ,方差為σ2,而分布形式任意,X1,X2,…,Xn是X的隨機樣本,則(1)(2)也就是任意隨機變量的樣本均值就等于總體均值;樣本方差等于總體方差與樣本容量的商第37頁,課件共91頁,創(chuàng)作于2023年2月5.2.5大樣本均值的分布:中心極限定理設(shè)隨機變量X服從均值為μ,方差為σ2
的分布,X1,X2,…,Xn是X的隨機樣本,則有如下的中心極限定理。中心極限定理(CentralLimitTheorem):當(dāng)n充分大時,近似地有一般地,當(dāng)n30時,就可應(yīng)用中心極限定理了?;蛘呓频赜谢蛘呓频赜械?8頁,課件共91頁,創(chuàng)作于2023年2月樣本容量樣本容量:一個樣本中包含的樣本單位數(shù)。通常用n來表示。大樣本:n≥30小樣本:n<30第39頁,課件共91頁,創(chuàng)作于2023年2月學(xué)生ABCDEFG成績30405060708090按隨機原則抽選出4名學(xué)生,并計算平均分?jǐn)?shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等第40頁,課件共91頁,創(chuàng)作于2023年2月第41頁,課件共91頁,創(chuàng)作于2023年2月則容易得到利用上述結(jié)果與5.2.2的結(jié)果只要能夠證明第42頁,課件共91頁,創(chuàng)作于2023年2月例一汽車蓄電池商聲稱其生產(chǎn)的電池具有均值為54個月、標(biāo)準(zhǔn)差為6個月的壽命分布?,F(xiàn)假設(shè)某消費者團體決定檢驗該廠的說法是否準(zhǔn)確,為此購買了50個該廠的電池進行檢驗。1)假定廠商的聲稱是正確的,試描述這50個電池平均壽命的抽樣分布。2)假定廠商聲稱正確,則50個樣品組成的樣本的平均壽命不超過52個月的壽命的概率是多少?解1)由中心極限定理,樣本均值近似服從正態(tài)分布而并且故第43頁,課件共91頁,創(chuàng)作于2023年2月2)按照上面得到的結(jié)果來計算這50個電池平均壽命不超過52個月的概率這表明這50個電池平均壽命不超過52個月的概率非常小。因此這種情況應(yīng)該不太可能出現(xiàn)。如果出現(xiàn)該情況意味著什么?第44頁,課件共91頁,創(chuàng)作于2023年2月5.3點估計在解決實際問題時,常常需要用樣本來推斷總體分布的某些參數(shù)值,這就是所謂的參數(shù)估計。參數(shù)估計又分為點估計與區(qū)間估計??傮w參數(shù)(parameter)為描述一個總體的數(shù)字,它往往刻畫了總體某一方面的特征??傮w參數(shù)是一個特定值(fixednumber常數(shù)),但在現(xiàn)實中常常無法知道其確切的數(shù)值,例如總體的均值、方差,總體中某一類特定對象占的比例等。第45頁,課件共91頁,創(chuàng)作于2023年2月一般地,估計量(統(tǒng)計量)是指的隨機樣本的一個函數(shù)。所以粗略地講,點估計就是用樣本的某一函數(shù)值,來估計總體分布中的未知參數(shù)。而區(qū)間估計就是(以一定概率)把總體分布的參數(shù)確定在由樣本決定的某個區(qū)間內(nèi)。一個樣本統(tǒng)計量(如樣本均值)是樣本的函數(shù)Population
總體參數(shù)x4x49x103x354x41x4x42909x1005x31x411第46頁,課件共91頁,創(chuàng)作于2023年2月5.3.1點估計的概念設(shè)θ是總體分布中一個需要估計的參數(shù)?,F(xiàn)在從總體中得到一個隨機樣本X1,X2,…,Xn
,我們的目的是通過這一隨機樣本來估計參數(shù)θ
。θ的估計量通常是隨機樣本X1,X2,…,Xn的一個函數(shù),記為簡記為若能夠得到一組樣本觀察值x1,x2,…,xn,則將它們代入上述函數(shù),可以計算出θ的估計值θ的估計值也簡記為。θ的點估計就是求θ的估計值第47頁,課件共91頁,創(chuàng)作于2023年2月5.3.2矩估計法對總體而言,矩是指:——k階原點矩——k階中心矩(中心為μ)對樣本而言——一階原點矩——二階中心矩矩估計法就是用樣本矩來估計相應(yīng)的總體矩。第48頁,課件共91頁,創(chuàng)作于2023年2月例如通常用來估計用來估計并且稱這樣得到的估計量為矩估計量。第49頁,課件共91頁,創(chuàng)作于2023年2月5.3.3極大似然估計法引例設(shè)甲乙兩個盒子外形完全相同,甲盒中裝有90個白球10個黑球,乙盒中裝有90個黑球10個白球。今隨機地抽取一個盒子并從中抽取一球,結(jié)果抽到白球,問這球是從哪個盒子中抽取的?從甲盒中抽取一球是白球的概率p1=9/10從乙盒中抽取一球是白球的概率p2=1/10p1遠(yuǎn)大于p2,因此我們推斷這球是從甲盒中取出。這個推斷我們依據(jù)的是所謂極大似然原理:如果進行一次隨機實驗,結(jié)果是若干個可能后果中的某一個出現(xiàn)了,則可以認(rèn)為實驗的條件有利于該后果的出現(xiàn),即該后果出現(xiàn)的概率最大。第50頁,課件共91頁,創(chuàng)作于2023年2月更一般地,如果用一個參數(shù)θ來表示不同的盒子,即現(xiàn)在隨機抽取一個盒子,然后隨機獨立有放回地抽取5次,每次抽取一個球。如果結(jié)果是黑、白、白、白、黑。問θ等于0還是等于1?對于甲盒,得到這樣結(jié)果的概率對于乙盒,得到這樣結(jié)果的概率由于p1大于p2,因此我們推斷θ=0。也就是,θ是使聯(lián)合概率達(dá)到最大的數(shù)。第51頁,課件共91頁,創(chuàng)作于2023年2月將上述問題抽象化。設(shè)X是一個隨機變量,其概率密度函數(shù)為。又設(shè)X1,X2,…,Xn是X的隨機樣本,則記聯(lián)合密度函數(shù)為稱為θ的極大似然函數(shù)。若得到一組樣本觀察值x1,x2,…,xn
,則代入L后得到一個關(guān)于θ的函數(shù)。如果存在
使函數(shù)L取最大值。則稱該為θ的極大似然估計值。而稱為θ的極大似然估計量。第52頁,課件共91頁,創(chuàng)作于2023年2月5.3.4示例例5.3.1設(shè)隨機變量X服從均值為μ,方差為σ2
的正態(tài)分布,X1,X2,…,Xn是X的隨機樣本,求μ和σ2的極大似然估計量。首先由前面的討論可知極大似然函數(shù)為第53頁,課件共91頁,創(chuàng)作于2023年2月對L取極大值等價于對L的對數(shù)取極大值。因此在L取對數(shù)后,再分別計算關(guān)于μ和σ2的偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為零,解得μ和σ2的估計量分別為σ2的極大似然估計量要小于其矩估計量第54頁,課件共91頁,創(chuàng)作于2023年2月例:英語六級未通過率假設(shè)某財經(jīng)大學(xué)的學(xué)生在畢業(yè)時尚未通過六級的比率為p,現(xiàn)從中隨機抽取100人調(diào)查其檔案,發(fā)現(xiàn)其中有10人六級沒過,試用極大似然法估計總體參數(shù)——未通過六級的比例p。解用X表示任意抽取的一個畢業(yè)生六級通過的情況:X=1,若該生通過了六級0,若該生未通過六級則X~B(1,p).于是對于x=0,1,有P(X=x)=px(1–p)1–x
第55頁,課件共91頁,創(chuàng)作于2023年2月英語六級未通過率<續(xù)>
對于來自于總體X的100個樣本觀測值x1,x2,…,x100,其中恰好有10個取值為1,其他為零。樣本觀察值的聯(lián)合分布密度(似然函數(shù))為兩邊取對數(shù)得對數(shù)似然函數(shù)為:上式關(guān)于p求導(dǎo)數(shù)并令導(dǎo)數(shù)為0,解得:其中q=1–p.注:用矩估計法可得到同樣結(jié)果第56頁,課件共91頁,創(chuàng)作于2023年2月5.4判斷點估計量的優(yōu)劣標(biāo)準(zhǔn)問題:第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計量來估計某個總體參數(shù)?第二,如果有兩個以上的統(tǒng)計量可以用來估計某個總體參數(shù),其估計結(jié)果是否一致?是否一個統(tǒng)計量要優(yōu)于另一個?估計值的優(yōu)良標(biāo)準(zhǔn):無偏性、有效性、一致性第57頁,課件共91頁,創(chuàng)作于2023年2月5.4.1無偏估計量設(shè)為θ的估計量。如果則稱為θ的無偏估計量。第58頁,課件共91頁,創(chuàng)作于2023年2月對于正態(tài)總體,可以證明總體均值的樣本矩估計量(同時也是極大似然估計量)是無偏的??傮w方差的樣本矩估計量S2是無偏的,但是極大似然估計量是有偏的。第59頁,課件共91頁,創(chuàng)作于2023年2月5.4.2最小方差性在一個參數(shù)的眾多估計量中,人們偏好于那些具有較小方差的估計量。因為由它給出的估計值可能與真實值有更小的誤差。
的分布函數(shù)的分布函數(shù)第60頁,課件共91頁,創(chuàng)作于2023年2月若總體參數(shù)為θ
,θ的估計量的方差小于等于其他所有對θ估計量的方差,也就是總是成立,那么稱θ的估計量具有最小方差性。第61頁,課件共91頁,創(chuàng)作于2023年2月5.4.3有效估計量在用估計量來估計總體的某個參數(shù)時,如果(1)估計量無偏的;(2)在的所有估計量中估計量的方差最小。那么,這個估計量就是總體參數(shù)的有效估計量。
第62頁,課件共91頁,創(chuàng)作于2023年2月5.4.4漸近無偏估計量漸近無偏估計量是指滿足如下條件的估計量:其中n為樣本容量。第63頁,課件共91頁,創(chuàng)作于2023年2月5.4.5一致估計量第64頁,課件共91頁,創(chuàng)作于2023年2月一致估計量的另一種等價的定義是:(1)是漸近無偏的;(2)其中(2)中的極限為所謂的漸近方差而普通方差為第65頁,課件共91頁,創(chuàng)作于2023年2月通常判別點估計量優(yōu)劣的準(zhǔn)則小樣本準(zhǔn)則無偏性有效性大樣本準(zhǔn)則一致性第66頁,課件共91頁,創(chuàng)作于2023年2月可以證明下列估計量是具有較好統(tǒng)計性質(zhì)的估計量總體均值的矩估計量總體方差的矩估計量總體方差的極大似然估計量總體比例p的估計量樣本比例第67頁,課件共91頁,創(chuàng)作于2023年2月總體構(gòu)成比例的估計常??赡軙P(guān)注總體中某一類特定對象占的比例p。對于這樣的問題,可以采用如下的方式處理。在總體中任取一個個體,用一個變量X來描述所抽取的對象是否屬于所關(guān)注的對象這一事件,即X=1,若抽得的是所關(guān)注的對象0,若抽得的不是所關(guān)注的對象于是,該總體可以用服從0-1分布的隨機變量X~B(1,p)描述,其中p表示所關(guān)注的對象在總體中占的比例。對于0-1分布B(1,p),其數(shù)學(xué)期望值與方差分別為:p,p(1–p)第68頁,課件共91頁,創(chuàng)作于2023年2月設(shè)X1,X2,…,Xn是來自于總體X的一個隨機樣本,并且在這一樣本中我們所關(guān)注的對象恰好出現(xiàn)了n1次。那么即樣本的均值恰好等于樣本的比例。由此可見,可用樣本比例π來估計總體比例p。此外,由中心極限定理,當(dāng)樣本容量充分大時,樣本的均值函數(shù)近似地服從正態(tài)分布,也就是近似地有:第69頁,課件共91頁,創(chuàng)作于2023年2月點估計的最大好處:給出確定的估計值點估計的最大問題:無法控制誤差及判斷可靠程度在實際應(yīng)用中,我們通常只取一個樣本,因此我們無法知道通過這個樣本對總體參數(shù)的估計是否精確。但樣本容量大的隨機樣本通??偸墙o出更接近總體參數(shù)的估計值。第70頁,課件共91頁,創(chuàng)作于2023年2月5.5區(qū)間估計在用樣本均值估計總體均值時,總有人會問:“這一估計有多好?”這意味著人們不但關(guān)注你給出的估計值是多少,還關(guān)注你給出的估計有多大的誤差和可靠程度。例如一家商店調(diào)查顧客的滿意度,隨機抽取了由100個顧客組成的樣本,然后請這些顧客回答對商店服務(wù)的滿意度得分,最低(最不滿意)0分,最高100分。調(diào)查結(jié)果,這100個顧客給出的滿意度平均分80分。問題“這一估計有多好?”具體來說就是,這是否體現(xiàn)了所有顧客對商店滿意的平均程度,有多大誤差,樣本數(shù)量是否足夠等。第71頁,課件共91頁,創(chuàng)作于2023年2月5.5.1置信區(qū)間若總體分布含一個未知參數(shù)β,如果找出了2個依賴樣本X1,X2,…,Xn的估計量:使得其中0<α<1,則稱隨機區(qū)間為β的(1–α)(或100(1–α)%)的置信區(qū)間;(1–α)(或百分?jǐn)?shù)100(1–α)%)稱為置信度或置信水平;α
稱為顯著性水平,通常取為0.05,0.10或0.01。參數(shù)的區(qū)間估計就是求參數(shù)的置信區(qū)間。第72頁,課件共91頁,創(chuàng)作于2023年2月5.5.2已知總體方差求總體均值的置信區(qū)間
設(shè)總體X服從N(μ,0.09),抽取了4個樣本觀察值x1,x2,x3,x4,求總體均值μ的95%的置信區(qū)間。首先因此注意到N(0,1)是一個對稱分布。給定概率值0.95,現(xiàn)在來確定常數(shù)k,使得2.5%的面積95%的面積k第73頁,課件共91頁,創(chuàng)作于2023年2月利用書末的附表一,可以查得k=z0.025=1.96。于是下面的不等式成立的概率為0.95這等價于將z0.025=1.96代入上式,即得到所需要的置信區(qū)間極限誤差平均誤差記作一般地,已知總體方差時均值置信區(qū)間的表達(dá)式第74頁,課件共91頁,創(chuàng)作于2023年2月計算樣本統(tǒng)計量計算抽樣平均誤差計算抽樣極限誤差確定置信區(qū)間區(qū)間估計步驟(以估計為例):第75頁,課件共91頁,創(chuàng)作于2023年2月由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時間為6.7小時。如果總體標(biāo)準(zhǔn)差為5.8小時,求該周刊訂閱者總體每周平均花費在因特網(wǎng)上時間的95%置信區(qū)間。均值的區(qū)間估計則:該置信區(qū)間為:第76頁,課件共91頁,創(chuàng)作于2023年2月5.5.3未知總體方差求總體均值的置信區(qū)間設(shè),抽取了一組樣本觀察值x1,x2,…xn,求總體均值μ的1-α置信區(qū)間。這里總體的方差σ2是未知的。首先由5.2.4有記是t分布對應(yīng)著顯著性水平α的臨界值。則α/2的面積1-α的面積tc第77頁,課件共91頁,創(chuàng)作于2023年2月從而可得置信區(qū)間為其中常稱為標(biāo)準(zhǔn)誤差(standarderror)。第78頁,課件共91頁,創(chuàng)作于2023年2月均值的區(qū)間估計某證券市場由10只股票組成的一個樣本其市盈率分別為:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育法規(guī)押題練習(xí)試卷B卷附答案
- 2023年航空輔助動力系統(tǒng)資金申請報告
- 三年級數(shù)學(xué)計算題專項練習(xí)匯編及答案集錦
- FOB條件下國際貨物買賣協(xié)議模板
- 2025年人教版高考?xì)v史試題及答案指導(dǎo)
- 2024年度模具采購協(xié)議精簡樣本
- 2024年度礦權(quán)出讓及轉(zhuǎn)讓專項協(xié)議
- 2024年礦泉水采購正式協(xié)議樣本
- 2024年服務(wù)協(xié)議增補協(xié)議樣本
- 2024年醫(yī)療機構(gòu)醫(yī)生勞動協(xié)議模板
- 【加加食品產(chǎn)品成本控制問題及完善措施分析9600字】
- 【《青島海爾公司應(yīng)收賬款狀況調(diào)研分析報告》16000字】
- 服裝行業(yè)競爭對手分析報告
- 2024年心理咨詢師(中科院心理研究所版)考試題庫大全-上(單選題)
- 2024年惠州仲愷城市發(fā)展集團有限公司招聘筆試沖刺題(帶答案解析)
- 《特種設(shè)備事故隱患排查治理體系細(xì)則DB 37T 3079-2017》
- 2024中國移動咪咕公司校園招聘公開引進高層次人才和急需緊缺人才筆試參考題庫(共500題)答案詳解版
- MOOC 英文學(xué)術(shù)寫作實戰(zhàn)-北京大學(xué) 中國大學(xué)慕課答案
- 《新時代“一帶一路”的戰(zhàn)略解讀與機遇》題庫
- 2024年“民用無人機及多旋翼無人機”駕駛員操控員技能與理論知識考試題庫含答案
- 生物信息學(xué)(上海海洋大學(xué))智慧樹知到期末考試答案2024年
評論
0/150
提交評論