概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)課件_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)課件_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)課件_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)課件_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)課件_第5頁(yè)
已閱讀5頁(yè),還剩165頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講基礎(chǔ)知識(shí)復(fù)習(xí)一、概率論基礎(chǔ)知識(shí)二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)1第二講基礎(chǔ)知識(shí)復(fù)習(xí)一、概率論基礎(chǔ)知識(shí)1一、概率論基礎(chǔ)知識(shí)概率隨機(jī)變量概率密度函數(shù)多維隨機(jī)變量隨機(jī)變量的數(shù)字特征一些重要的概率分布2一、概率論基礎(chǔ)知識(shí)概率2概率隨機(jī)試驗(yàn)可以在相同條件下重復(fù)進(jìn)行每次試驗(yàn)的可能結(jié)果不止一個(gè),但事先能明確所有的可能結(jié)果進(jìn)行一次試驗(yàn)之前不能確定會(huì)出現(xiàn)哪一個(gè)結(jié)果實(shí)例一枚硬幣拋擲兩次在北京師范大學(xué)校園里詢問(wèn)任意一個(gè)學(xué)生的年齡3概率隨機(jī)試驗(yàn)3概率樣本空間(samplingspace)/總體(population)某一個(gè)隨機(jī)試驗(yàn)的所有可能結(jié)果組成的集合,記為S樣本點(diǎn)(samplingpoint)樣本空間里的某一元素,即隨機(jī)試驗(yàn)的某一可能結(jié)果實(shí)例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T樣本空間:{HH,HT,TH,TT}樣本點(diǎn):HH,HT,TH,TT4概率樣本空間(samplingspace)/總體(popu概率事件(event)某一隨機(jī)試驗(yàn)的樣本空間的一個(gè)子集實(shí)例:一枚硬幣拋擲兩次事件A:出現(xiàn)兩個(gè)正面事件B:出現(xiàn)一個(gè)正面和一個(gè)反面事件C:出現(xiàn)兩個(gè)反面5概率事件(event)5概率頻率(frequency)在相同條件下,某隨機(jī)試驗(yàn)進(jìn)行了n次,其中事件A發(fā)生了m次,則比值m/n稱為事件A發(fā)生的頻率,記fn(A)實(shí)例:拋擲一枚硬幣,事件A為出現(xiàn)正面n550500204840401200024000fn(A)0.70.540.4840.51810.50690.50160.5005當(dāng)n逐漸增大時(shí),頻率趨向于某一常數(shù),稱為頻率穩(wěn)定性6概率頻率(frequency)n55050020484040概率概率(probability)S是某一隨機(jī)試驗(yàn)的樣本空間,對(duì)于其中的任意一個(gè)事件A賦予一個(gè)實(shí)數(shù)P(A),如果P(A)滿足下列三個(gè)條件,則稱P(A)為事件A的概率。當(dāng)n趨近于無(wú)窮大時(shí),頻率fn(A)無(wú)限接近于概率P(A),從而用概率來(lái)度量事件A在一次試驗(yàn)中發(fā)生的可能性7概率概率(probability)當(dāng)n趨近于無(wú)窮大時(shí),頻概率條件概率(conditionalprobability)設(shè)A、B是兩個(gè)事件,且P(A)>0,稱下式為事件A發(fā)生的條件下事件B發(fā)生的條件概率:實(shí)例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T。事件A為“至少有一次H”,事件B為“兩次都是同一面”。則事件A的概率為3/4,事件A和B同時(shí)發(fā)生的概率為1/4,在A發(fā)生的條件下B發(fā)生的概率為1/38概率條件概率(conditionalprobability隨機(jī)變量隨機(jī)變量(stochastic/randomvariable)一個(gè)變量若它的值是由隨機(jī)試驗(yàn)決定的,稱其為隨機(jī)變量。隨機(jī)變量通常用大寫(xiě)字母X、Y、Z表示,其數(shù)值則用小寫(xiě)字母x、y、z表示離散型隨機(jī)變量(discreterandomvariable)可能取到的值是有限個(gè)的隨機(jī)變量連續(xù)型隨機(jī)變量(continuousrandomvariable)可能取到的值是無(wú)限個(gè)的隨機(jī)變量實(shí)例離散型隨機(jī)變量:扔一次骰子出現(xiàn)的點(diǎn)數(shù);未出生嬰兒的性別連續(xù)型隨機(jī)變量:人的身高;百米跑速度9隨機(jī)變量隨機(jī)變量(stochastic/randomvar概率密度函數(shù)離散型變量的概率密度函數(shù)/概率分布(probabilitydensityfunction/probabilitydistribution)實(shí)例X:投擲兩顆骰子出現(xiàn)的點(diǎn)數(shù)之和X的PDFX23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/3610概率密度函數(shù)離散型變量的概率密度函數(shù)/概率分布X234567概率密度函數(shù)連續(xù)型變量的累積分布函數(shù)(cumulativedistributionfunction)實(shí)例槍靶的半徑為2米,若每槍都能擊中槍靶,且擊中靶上任一同心圓內(nèi)的點(diǎn)的概率與該圓的面積成正比,則彈著點(diǎn)與靶心的距離X是一個(gè)連續(xù)型隨機(jī)變量,其CDF為:F(x)x2111概率密度函數(shù)連續(xù)型變量的累積分布函數(shù)(cumulative概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)實(shí)例在上例中,PDF為:f(x)x1212概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)x12概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)xab13概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)xab多維隨機(jī)變量多維隨機(jī)變量多個(gè)變量的取值由同一個(gè)隨機(jī)試驗(yàn)決定,稱這些變量為多維隨機(jī)變量。以下我們考慮最簡(jiǎn)單的二維隨機(jī)變量,用(X,Y)表示,其數(shù)值用(x,y)表示實(shí)例離散型二維隨機(jī)變量:每一位學(xué)生的性別和民族連續(xù)型二維隨機(jī)變量:每一位學(xué)生的身高和體重14多維隨機(jī)變量多維隨機(jī)變量14多維隨機(jī)變量離散型變量的聯(lián)合概率密度函數(shù)(jointPDF)實(shí)例譬如:既是男生又是滿族的概率為0.08,既是女生又是回族的概率為0民族漢族滿族回族蒙古族性別男0.270.080.160女0.350.1000.0415多維隨機(jī)變量離散型變量的聯(lián)合概率密度函數(shù)(jointPDF多維隨機(jī)變量離散型變量的邊緣概率密度函數(shù)(marginalPDF)實(shí)例X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.0416多維隨機(jī)變量離散型變量的邊緣概率密度函數(shù)(marginal多維隨機(jī)變量離散型變量的條件概率密度函數(shù)(conditionalPDF)表示在Y=y的條件下X=x的概率譬如:f(滿族,女生)=0.10,f(女生)=0.49,f(滿族|女生)=0.10/0.49=0.20f(漢族,男生)=0.27,f(男生)=0.51,f(漢族|男生)=0.27/0.51=0.53X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.0417多維隨機(jī)變量離散型變量的條件概率密度函數(shù)(conditio多維隨機(jī)變量統(tǒng)計(jì)獨(dú)立性(statisticallyindependence)如果兩個(gè)隨機(jī)變量的聯(lián)合PDF等于它們邊緣PDF的乘積,則稱這兩個(gè)變量是相互獨(dú)立的(independent)。兩個(gè)變量獨(dú)立意味著其中一個(gè)變量的結(jié)果不會(huì)影響另一個(gè)。譬如:f(X=H,Y=H)=f(X=H)*f(Y=H)=1/2*1/2=1/4……實(shí)例:拋硬幣X(第一次)正面(H)反面(T)Y(第二次)正面(H)1/41/4反面(T)1/41/418多維隨機(jī)變量統(tǒng)計(jì)獨(dú)立性(statisticallyind多維隨機(jī)變量連續(xù)型變量的聯(lián)合概率密度函數(shù)(jointPDF)連續(xù)型變量的邊緣概率密度函數(shù)(marginalPDF)統(tǒng)計(jì)獨(dú)立性(statisticallyindependence)19多維隨機(jī)變量連續(xù)型變量的聯(lián)合概率密度函數(shù)(jointPD隨機(jī)變量的數(shù)字特征以上討論了隨機(jī)變量的概率密度函數(shù)PDF和累積分布函數(shù)CDF,但在處理實(shí)際問(wèn)題時(shí),往往不需要求出這些函數(shù),而是只需要了解變量的某些特征值。這些特征值包括三類:度量變量分布的集中趨勢(shì)(centraltendency):數(shù)學(xué)期望或均值;中位數(shù);眾數(shù)度量變量分布的離散性(dispersion):方差;標(biāo)準(zhǔn)差度量?jī)蓚€(gè)變量的相關(guān)性(correlation):協(xié)方差;相關(guān)系數(shù)20隨機(jī)變量的數(shù)字特征以上討論了隨機(jī)變量的概率密度函數(shù)PDF和累隨機(jī)變量的數(shù)字特征數(shù)學(xué)期望(expectation)或均值(mean)離散型變量的期望:實(shí)例:扔兩個(gè)骰子的點(diǎn)數(shù)之和x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3621隨機(jī)變量的數(shù)字特征數(shù)學(xué)期望(expectation)或均值(隨機(jī)變量的數(shù)字特征連續(xù)型變量的期望:實(shí)例:22隨機(jī)變量的數(shù)字特征連續(xù)型變量的期望:22隨機(jī)變量的數(shù)字特征期望的性質(zhì):23隨機(jī)變量的數(shù)字特征期望的性質(zhì):23隨機(jī)變量的數(shù)字特征中位數(shù)(median)對(duì)于離散型變量,假設(shè)所有可能取值的個(gè)數(shù)為n,把這些數(shù)從小到大排列。若n為奇數(shù),位于中央位置的那個(gè)數(shù)就是中位數(shù);若n為偶數(shù),位于中央位置的那兩個(gè)數(shù)的平均數(shù)就是中位數(shù)。記為Med(X),中位數(shù)所在的位置為(n+1)/2。對(duì)于連續(xù)型變量,中位數(shù)m滿足下列條件:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3624隨機(jī)變量的數(shù)字特征中位數(shù)(median)x234567891隨機(jī)變量的數(shù)字特征眾數(shù)(mode)眾數(shù)就是隨機(jī)變量的所有可能取值中出現(xiàn)次數(shù)最多的那個(gè)隨機(jī)變量的類型定類變量(nominalvariable):性別;民族定序變量(ordinalvariable):教育水平;收入等級(jí)定距變量(intervalvariable):考試成績(jī);收入水平一般地,不同類型的變量用不同的數(shù)學(xué)特征表示其集中趨勢(shì)。定類變量用眾數(shù);定序變量用中位數(shù);定距變量用均值或中位數(shù)x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3625隨機(jī)變量的數(shù)字特征眾數(shù)(mode)x234567891011隨機(jī)變量的數(shù)字特征方差(variance)方差被定義為隨機(jī)變量對(duì)其均值的期望距離,用于表示隨機(jī)變量與其均值的偏離程度。方差較小說(shuō)明變量的分布比較集中,反之則說(shuō)明變量的分布很分散方差的性質(zhì)26隨機(jī)變量的數(shù)字特征方差(variance)26隨機(jī)變量的數(shù)字特征實(shí)例:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3627隨機(jī)變量的數(shù)字特征實(shí)例:x23456789101112f(x隨機(jī)變量的數(shù)字特征標(biāo)準(zhǔn)差(standarddeviation)方差的量綱與變量的量綱不同,為此引入與變量具有相同量綱的數(shù)字特征——標(biāo)準(zhǔn)差,同樣度量變量的離散程度標(biāo)準(zhǔn)差的性質(zhì):28隨機(jī)變量的數(shù)字特征標(biāo)準(zhǔn)差(standarddeviatio隨機(jī)變量的數(shù)字特征度量變量離散程度的其他常用指標(biāo)還有:極差/全距極差率變異系數(shù)基尼系數(shù)泰爾系數(shù)29隨機(jī)變量的數(shù)字特征度量變量離散程度的其他常用指標(biāo)還有:29隨機(jī)變量的數(shù)字特征協(xié)方差(covariance)協(xié)方差度量?jī)蓚€(gè)隨機(jī)變量的相關(guān)(correlation)程度協(xié)方差大于0表示兩個(gè)變量正相關(guān)(positivelycorrelated),即其中一個(gè)變量隨著另一個(gè)變量的增大而增大協(xié)方差大于0表示兩個(gè)變量負(fù)相關(guān)(negativelycorrelated),即其中一個(gè)變量隨著另一個(gè)變量的增大而減小協(xié)方差等于0表示兩個(gè)變量不相關(guān)(uncorrelated)30隨機(jī)變量的數(shù)字特征協(xié)方差(covariance)30隨機(jī)變量的數(shù)字特征協(xié)方差的性質(zhì):31隨機(jī)變量的數(shù)字特征協(xié)方差的性質(zhì):31隨機(jī)變量的數(shù)字特征相關(guān)系數(shù)(correlationcoefficient)協(xié)方差的大小與度量單位有關(guān),使用不便,因此一般用相關(guān)系數(shù)來(lái)衡量?jī)蓚€(gè)變量的相關(guān)程度32隨機(jī)變量的數(shù)字特征相關(guān)系數(shù)(correlationcoef隨機(jī)變量的數(shù)字特征相關(guān)與獨(dú)立(correlation&independence)相關(guān)是指兩個(gè)隨機(jī)變量之間的線性關(guān)聯(lián)程度,獨(dú)立是指兩個(gè)變量之間的一般關(guān)聯(lián)程度若兩個(gè)變量相互獨(dú)立,其相關(guān)系數(shù)一定為0若兩個(gè)變量的相關(guān)系數(shù)為0,它們不一定獨(dú)立33隨機(jī)變量的數(shù)字特征相關(guān)與獨(dú)立(correlation&i隨機(jī)變量的數(shù)字特征條件期望(conditionalexpectation)如果我們可以用變量X解釋變量Y,那么一旦我們知道X取某個(gè)特定的值x,就能夠計(jì)算出在X=x的條件下Y的期望值,稱為條件期望實(shí)例34隨機(jī)變量的數(shù)字特征條件期望(conditionalexpe一些重要的概率分布正態(tài)分布(normaldistribution)如果一個(gè)隨機(jī)變量的概率密度函數(shù)PDF如下所示,稱這個(gè)變量服從正態(tài)分布35一些重要的概率分布正態(tài)分布(normaldistribut一些重要的概率分布標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)如果一個(gè)服從正態(tài)分布的隨機(jī)變量的均值為0,方差為1,稱這個(gè)變量服從標(biāo)準(zhǔn)正態(tài)分布36一些重要的概率分布標(biāo)準(zhǔn)正態(tài)分布(standardnorma一些重要的概率分布37一些重要的概率分布37一些重要的概率分布標(biāo)準(zhǔn)化隨機(jī)變量(standardizedrandomvariable)38一些重要的概率分布標(biāo)準(zhǔn)化隨機(jī)變量(standardized一些重要的概率分布統(tǒng)計(jì)學(xué)書(shū)籍和計(jì)量經(jīng)濟(jì)學(xué)書(shū)籍一般都附有標(biāo)準(zhǔn)化正態(tài)變量的累積分布函數(shù),可以通過(guò)轉(zhuǎn)換求解正態(tài)變量的概率問(wèn)題39一些重要的概率分布統(tǒng)計(jì)學(xué)書(shū)籍和計(jì)量經(jīng)濟(jì)學(xué)書(shū)籍一般都附有標(biāo)準(zhǔn)化一些重要的概率分布卡方分布n=2n=5n=1040一些重要的概率分布卡方分布n=2n=5n=1040一些重要的概率分布41一些重要的概率分布41一些重要的概率分布t分布(tdistribution)n=120n=5n=2042一些重要的概率分布t分布(tdistribution)一些重要的概率分布43一些重要的概率分布43一些重要的概率分布F分布(Fdistribution)F(2,2)F(10,2)F(50,50)44一些重要的概率分布F分布(Fdistribution)一些重要的概率分布45一些重要的概率分布45二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)總體與樣本參數(shù)估計(jì)點(diǎn)估計(jì)區(qū)間估計(jì)假設(shè)檢驗(yàn)置信區(qū)間法顯著性檢驗(yàn)法46二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)總體與樣本46總體與樣本總體(population)研究對(duì)象的全體,記為X隨機(jī)樣本(randomsample)/樣本(sample)在相同條件下對(duì)總體X進(jìn)行n次重復(fù)的、獨(dú)立的觀測(cè),每次觀測(cè)結(jié)果都是與X具有相同分布的、相互獨(dú)立的隨機(jī)變量,記為X1,

X2,…,Xn,把它們稱為來(lái)自總體的一個(gè)簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱樣本,稱n為樣本容量。當(dāng)觀測(cè)完成后,得到一組觀測(cè)值x1,

x2,…,xn,稱為樣本值我們感興趣的實(shí)際上是總體,但由于不可能或很難得到總體的信息,只能從中抽取一個(gè)樣本,根據(jù)樣本數(shù)據(jù)來(lái)推斷總體的性質(zhì)。這其中包含兩類問(wèn)題:參數(shù)估計(jì)和假設(shè)檢驗(yàn)47總體與樣本總體(population)47參數(shù)估計(jì)參數(shù)(parameters)與總體有關(guān)的數(shù)字特征。如總體均值、總體方差等等。參數(shù)估計(jì)(parameterestimation)根據(jù)樣本的有關(guān)數(shù)值來(lái)估計(jì)總體參數(shù)或總體參數(shù)的范圍點(diǎn)估計(jì)區(qū)間估計(jì)48參數(shù)估計(jì)參數(shù)(parameters)48點(diǎn)估計(jì)點(diǎn)估計(jì)(pointestimation)估計(jì)量是樣本的函數(shù),對(duì)于不同的樣本,參數(shù)估計(jì)值是不同的。點(diǎn)估計(jì)的方法:矩估計(jì)法極大似然法最小二乘法49點(diǎn)估計(jì)點(diǎn)估計(jì)(pointestimation)49點(diǎn)估計(jì)矩(moment)矩估計(jì)法(methodofmoment)用樣本矩作為相應(yīng)總體矩的估計(jì)量,并用樣本矩的連續(xù)函數(shù)作為總體矩連續(xù)函數(shù)的估計(jì)量。通過(guò)這種方法得到的估計(jì)量稱為矩估計(jì)量50點(diǎn)估計(jì)矩(moment)50點(diǎn)估計(jì)矩估計(jì)法:實(shí)例51點(diǎn)估計(jì)矩估計(jì)法:實(shí)例51點(diǎn)估計(jì)極大似然法(methodofmaximumlikelihood)52點(diǎn)估計(jì)極大似然法(methodofmaximumlik點(diǎn)估計(jì)極大似然法:實(shí)例53點(diǎn)估計(jì)極大似然法:實(shí)例53點(diǎn)估計(jì)估計(jì)量的評(píng)選標(biāo)準(zhǔn)估計(jì)量是隨機(jī)變量,會(huì)由于估計(jì)方法的不同而不同,那么,如何判斷一個(gè)估計(jì)量的好壞呢?或者說(shuō)應(yīng)該選擇哪個(gè)估計(jì)量更好呢?有以下幾條標(biāo)準(zhǔn):針對(duì)小樣本的標(biāo)準(zhǔn)無(wú)偏性有效性針對(duì)大樣本的標(biāo)準(zhǔn)一致性漸進(jìn)正態(tài)性54點(diǎn)估計(jì)估計(jì)量的評(píng)選標(biāo)準(zhǔn)54點(diǎn)估計(jì)無(wú)偏性(unbiasedness)實(shí)例55點(diǎn)估計(jì)無(wú)偏性(unbiasedness)555656點(diǎn)估計(jì)有效性(efficiency)注意:一個(gè)無(wú)偏的估計(jì)量可能存在很大方差,而一個(gè)方差很小的估計(jì)量可能是偏離總體均值的,因此有效性綜合考慮了估計(jì)量的集中趨勢(shì)和離散性兩個(gè)特征57點(diǎn)估計(jì)有效性(efficiency)57點(diǎn)估計(jì)實(shí)例:有效性和無(wú)偏性58點(diǎn)估計(jì)實(shí)例:有效性和無(wú)偏性58點(diǎn)估計(jì)線性估計(jì)量(linearestimator)最優(yōu)線性無(wú)偏估計(jì)量(bestlinearunbiasedestimator,BLUE)59點(diǎn)估計(jì)線性估計(jì)量(linearestimator)59點(diǎn)估計(jì)一致性(consistence)60點(diǎn)估計(jì)一致性(consistence)60點(diǎn)估計(jì)概率極限(probabilitylimits)61點(diǎn)估計(jì)概率極限(probabilitylimits)61點(diǎn)估計(jì)一些重要的估計(jì)量:62點(diǎn)估計(jì)一些重要的估計(jì)量:62點(diǎn)估計(jì)實(shí)例:為了解中國(guó)城市失業(yè)率,隨機(jī)抽取了10座城市,得到如下樣本。則我們可以用這10座城市的平均失業(yè)率來(lái)估計(jì)中國(guó)城市的平均失業(yè)率城市(i)12345678910失業(yè)率(xi)5.16.49.24.17.58.32.63.55.87.563點(diǎn)估計(jì)實(shí)例:為了解中國(guó)城市失業(yè)率,隨機(jī)抽取了10座城市,得到點(diǎn)估計(jì)漸進(jìn)正態(tài)性(asymptoticnormality)當(dāng)樣本容量無(wú)限增大時(shí)估計(jì)量趨向于正態(tài)分布中心極限定理(centrallimittheorem,CLT)定理一(獨(dú)立同分布的中心極限定理):當(dāng)樣本容量無(wú)限增大時(shí),任何總體的隨機(jī)樣本的均值趨近于正態(tài)分布。64點(diǎn)估計(jì)漸進(jìn)正態(tài)性(asymptoticnormality)點(diǎn)估計(jì)中心極限定理定理二:李雅普諾夫(Liapunov)定理65點(diǎn)估計(jì)中心極限定理65區(qū)間估計(jì)對(duì)于一個(gè)未知參數(shù),除了估計(jì)其近似值(點(diǎn)估計(jì))外,還希望知道這個(gè)值的精確程度,從而引出區(qū)間估計(jì)(intervalestimation)問(wèn)題置信區(qū)間(confidenceinterval)66區(qū)間估計(jì)對(duì)于一個(gè)未知參數(shù),除了估計(jì)其近似值(點(diǎn)估計(jì))外,還希區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):總體方差已知67區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):總體方差已知67區(qū)間估計(jì)實(shí)例:總體方差已知時(shí)正態(tài)總體均值的區(qū)間估計(jì)68區(qū)間估計(jì)實(shí)例:總體方差已知時(shí)正態(tài)總體均值的區(qū)間估計(jì)68區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):總體方差未知69區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):總體方差未知69區(qū)間估計(jì)標(biāo)準(zhǔn)誤(standarderror)70區(qū)間估計(jì)標(biāo)準(zhǔn)誤(standarderror)70區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):95%置信區(qū)間的簡(jiǎn)單法則71區(qū)間估計(jì)正態(tài)總體均值的區(qū)間估計(jì):95%置信區(qū)間的簡(jiǎn)單法則71區(qū)間估計(jì)非正態(tài)總體均值的區(qū)間估計(jì)72區(qū)間估計(jì)非正態(tài)總體均值的區(qū)間估計(jì)72假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesistesting)在總體的PDF未知或某些參數(shù)未知的情況下,對(duì)總體的分布或參數(shù)提出某些假設(shè),然后根據(jù)樣本對(duì)提出的假設(shè)作出是拒絕還是接受的判斷實(shí)例:Bush和Kerry競(jìng)選總統(tǒng),Bush獲得42%的選票而Kerry獲得58%的選票。Bush懷疑大選中有作弊行為,雇傭一個(gè)咨詢機(jī)構(gòu)隨機(jī)抽取100個(gè)選民調(diào)查其選舉意愿,發(fā)現(xiàn)有53人支持他,47人支持Kerry。由此Bush提出兩個(gè)假設(shè):H0(虛擬假設(shè)/原假設(shè),nullhypothesis):v<=0.42(沒(méi)有作弊)H1(對(duì)立假設(shè)/備擇假設(shè),alternativehypothesis):v>0.42(有作弊)73假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesistesting)73假設(shè)檢驗(yàn)第Ⅰ類錯(cuò)誤(typeⅠerror)拒絕了一個(gè)真實(shí)的虛擬假設(shè)第Ⅱ類錯(cuò)誤(typeⅡerror)沒(méi)有拒絕一個(gè)錯(cuò)誤的虛擬假設(shè)理論上我們希望犯兩類錯(cuò)誤的概率都盡可能小,但事實(shí)上不可能同時(shí)最小化兩類錯(cuò)誤。為此,我們首先考慮減少犯第Ⅰ類錯(cuò)誤的概率,并規(guī)定了一個(gè)可容忍的犯第Ⅰ類錯(cuò)誤的概率(譬如0.05,0.01),稱為顯著性水平(levelofsignificance)。在選定了顯著性水平之后,再考慮把犯第Ⅱ類錯(cuò)誤的概率減到最小。并把不犯第Ⅱ類錯(cuò)誤的概率稱為檢驗(yàn)的功效(powerofthetest)。但一般來(lái)說(shuō)我們不考慮檢驗(yàn)的功效。真實(shí)情況H0真H0假檢驗(yàn)結(jié)果拒絕Ⅰ類錯(cuò)誤無(wú)錯(cuò)不拒絕無(wú)錯(cuò)Ⅱ類錯(cuò)誤74假設(shè)檢驗(yàn)第Ⅰ類錯(cuò)誤(typeⅠerror)真實(shí)情況H0真假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的兩種方法置信區(qū)間法顯著性檢驗(yàn)法假設(shè)檢驗(yàn)的目的不是估計(jì)參數(shù),而是對(duì)有關(guān)參數(shù)的假設(shè)做出檢驗(yàn),拒絕或不拒絕提出的假設(shè)75假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的兩種方法75置信區(qū)間法

76置信區(qū)間法76置信區(qū)間法實(shí)例:77置信區(qū)間法實(shí)例:77顯著性檢驗(yàn)法基本思想78顯著性檢驗(yàn)法基本思想78顯著性檢驗(yàn)法拒絕域(regionofrejection)拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的值域(取值范圍)稱為拒絕域;拒絕域的邊界點(diǎn)稱為臨界值(criticalvalue)1.96-1.9602.5%2.5%2.57-2.570.5%0.5%79顯著性檢驗(yàn)法拒絕域(regionofrejection)顯著性檢驗(yàn)法實(shí)例:80顯著性檢驗(yàn)法實(shí)例:80顯著性檢驗(yàn)法雙尾檢驗(yàn)(two-tailedtest)單尾檢驗(yàn)(one-tailedtest)81顯著性檢驗(yàn)法雙尾檢驗(yàn)(two-tailedtest)81顯著性檢驗(yàn)法正態(tài)總體的均值檢驗(yàn)和方差檢驗(yàn)原假設(shè)H0檢驗(yàn)統(tǒng)計(jì)量H0為真時(shí)統(tǒng)計(jì)量服從的分布對(duì)立假設(shè)H1拒絕域N(0,1)t(n-1)82顯著性檢驗(yàn)法正態(tài)總體的均值檢驗(yàn)和方差檢驗(yàn)原假設(shè)H0檢驗(yàn)統(tǒng)計(jì)量顯著性檢驗(yàn)法非正態(tài)總體的漸進(jìn)檢驗(yàn)83顯著性檢驗(yàn)法非正態(tài)總體的漸進(jìn)檢驗(yàn)83顯著性檢驗(yàn)法p值/精確顯著性水平(pvalueorexactlevelofsignificance)84顯著性檢驗(yàn)法p值/精確顯著性水平(pvalueorex顯著性檢驗(yàn)法統(tǒng)計(jì)顯著性與實(shí)際顯著性(statistical&practicalsignificance)85顯著性檢驗(yàn)法統(tǒng)計(jì)顯著性與實(shí)際顯著性(statistical第二講基礎(chǔ)知識(shí)復(fù)習(xí)一、概率論基礎(chǔ)知識(shí)二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)86第二講基礎(chǔ)知識(shí)復(fù)習(xí)一、概率論基礎(chǔ)知識(shí)1一、概率論基礎(chǔ)知識(shí)概率隨機(jī)變量概率密度函數(shù)多維隨機(jī)變量隨機(jī)變量的數(shù)字特征一些重要的概率分布87一、概率論基礎(chǔ)知識(shí)概率2概率隨機(jī)試驗(yàn)可以在相同條件下重復(fù)進(jìn)行每次試驗(yàn)的可能結(jié)果不止一個(gè),但事先能明確所有的可能結(jié)果進(jìn)行一次試驗(yàn)之前不能確定會(huì)出現(xiàn)哪一個(gè)結(jié)果實(shí)例一枚硬幣拋擲兩次在北京師范大學(xué)校園里詢問(wèn)任意一個(gè)學(xué)生的年齡88概率隨機(jī)試驗(yàn)3概率樣本空間(samplingspace)/總體(population)某一個(gè)隨機(jī)試驗(yàn)的所有可能結(jié)果組成的集合,記為S樣本點(diǎn)(samplingpoint)樣本空間里的某一元素,即隨機(jī)試驗(yàn)的某一可能結(jié)果實(shí)例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T樣本空間:{HH,HT,TH,TT}樣本點(diǎn):HH,HT,TH,TT89概率樣本空間(samplingspace)/總體(popu概率事件(event)某一隨機(jī)試驗(yàn)的樣本空間的一個(gè)子集實(shí)例:一枚硬幣拋擲兩次事件A:出現(xiàn)兩個(gè)正面事件B:出現(xiàn)一個(gè)正面和一個(gè)反面事件C:出現(xiàn)兩個(gè)反面90概率事件(event)5概率頻率(frequency)在相同條件下,某隨機(jī)試驗(yàn)進(jìn)行了n次,其中事件A發(fā)生了m次,則比值m/n稱為事件A發(fā)生的頻率,記fn(A)實(shí)例:拋擲一枚硬幣,事件A為出現(xiàn)正面n550500204840401200024000fn(A)0.70.540.4840.51810.50690.50160.5005當(dāng)n逐漸增大時(shí),頻率趨向于某一常數(shù),稱為頻率穩(wěn)定性91概率頻率(frequency)n55050020484040概率概率(probability)S是某一隨機(jī)試驗(yàn)的樣本空間,對(duì)于其中的任意一個(gè)事件A賦予一個(gè)實(shí)數(shù)P(A),如果P(A)滿足下列三個(gè)條件,則稱P(A)為事件A的概率。當(dāng)n趨近于無(wú)窮大時(shí),頻率fn(A)無(wú)限接近于概率P(A),從而用概率來(lái)度量事件A在一次試驗(yàn)中發(fā)生的可能性92概率概率(probability)當(dāng)n趨近于無(wú)窮大時(shí),頻概率條件概率(conditionalprobability)設(shè)A、B是兩個(gè)事件,且P(A)>0,稱下式為事件A發(fā)生的條件下事件B發(fā)生的條件概率:實(shí)例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T。事件A為“至少有一次H”,事件B為“兩次都是同一面”。則事件A的概率為3/4,事件A和B同時(shí)發(fā)生的概率為1/4,在A發(fā)生的條件下B發(fā)生的概率為1/393概率條件概率(conditionalprobability隨機(jī)變量隨機(jī)變量(stochastic/randomvariable)一個(gè)變量若它的值是由隨機(jī)試驗(yàn)決定的,稱其為隨機(jī)變量。隨機(jī)變量通常用大寫(xiě)字母X、Y、Z表示,其數(shù)值則用小寫(xiě)字母x、y、z表示離散型隨機(jī)變量(discreterandomvariable)可能取到的值是有限個(gè)的隨機(jī)變量連續(xù)型隨機(jī)變量(continuousrandomvariable)可能取到的值是無(wú)限個(gè)的隨機(jī)變量實(shí)例離散型隨機(jī)變量:扔一次骰子出現(xiàn)的點(diǎn)數(shù);未出生嬰兒的性別連續(xù)型隨機(jī)變量:人的身高;百米跑速度94隨機(jī)變量隨機(jī)變量(stochastic/randomvar概率密度函數(shù)離散型變量的概率密度函數(shù)/概率分布(probabilitydensityfunction/probabilitydistribution)實(shí)例X:投擲兩顆骰子出現(xiàn)的點(diǎn)數(shù)之和X的PDFX23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/3695概率密度函數(shù)離散型變量的概率密度函數(shù)/概率分布X234567概率密度函數(shù)連續(xù)型變量的累積分布函數(shù)(cumulativedistributionfunction)實(shí)例槍靶的半徑為2米,若每槍都能擊中槍靶,且擊中靶上任一同心圓內(nèi)的點(diǎn)的概率與該圓的面積成正比,則彈著點(diǎn)與靶心的距離X是一個(gè)連續(xù)型隨機(jī)變量,其CDF為:F(x)x2196概率密度函數(shù)連續(xù)型變量的累積分布函數(shù)(cumulative概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)實(shí)例在上例中,PDF為:f(x)x1297概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)x12概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)xab98概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)xab多維隨機(jī)變量多維隨機(jī)變量多個(gè)變量的取值由同一個(gè)隨機(jī)試驗(yàn)決定,稱這些變量為多維隨機(jī)變量。以下我們考慮最簡(jiǎn)單的二維隨機(jī)變量,用(X,Y)表示,其數(shù)值用(x,y)表示實(shí)例離散型二維隨機(jī)變量:每一位學(xué)生的性別和民族連續(xù)型二維隨機(jī)變量:每一位學(xué)生的身高和體重99多維隨機(jī)變量多維隨機(jī)變量14多維隨機(jī)變量離散型變量的聯(lián)合概率密度函數(shù)(jointPDF)實(shí)例譬如:既是男生又是滿族的概率為0.08,既是女生又是回族的概率為0民族漢族滿族回族蒙古族性別男0.270.080.160女0.350.1000.04100多維隨機(jī)變量離散型變量的聯(lián)合概率密度函數(shù)(jointPDF多維隨機(jī)變量離散型變量的邊緣概率密度函數(shù)(marginalPDF)實(shí)例X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.04101多維隨機(jī)變量離散型變量的邊緣概率密度函數(shù)(marginal多維隨機(jī)變量離散型變量的條件概率密度函數(shù)(conditionalPDF)表示在Y=y的條件下X=x的概率譬如:f(滿族,女生)=0.10,f(女生)=0.49,f(滿族|女生)=0.10/0.49=0.20f(漢族,男生)=0.27,f(男生)=0.51,f(漢族|男生)=0.27/0.51=0.53X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.04102多維隨機(jī)變量離散型變量的條件概率密度函數(shù)(conditio多維隨機(jī)變量統(tǒng)計(jì)獨(dú)立性(statisticallyindependence)如果兩個(gè)隨機(jī)變量的聯(lián)合PDF等于它們邊緣PDF的乘積,則稱這兩個(gè)變量是相互獨(dú)立的(independent)。兩個(gè)變量獨(dú)立意味著其中一個(gè)變量的結(jié)果不會(huì)影響另一個(gè)。譬如:f(X=H,Y=H)=f(X=H)*f(Y=H)=1/2*1/2=1/4……實(shí)例:拋硬幣X(第一次)正面(H)反面(T)Y(第二次)正面(H)1/41/4反面(T)1/41/4103多維隨機(jī)變量統(tǒng)計(jì)獨(dú)立性(statisticallyind多維隨機(jī)變量連續(xù)型變量的聯(lián)合概率密度函數(shù)(jointPDF)連續(xù)型變量的邊緣概率密度函數(shù)(marginalPDF)統(tǒng)計(jì)獨(dú)立性(statisticallyindependence)104多維隨機(jī)變量連續(xù)型變量的聯(lián)合概率密度函數(shù)(jointPD隨機(jī)變量的數(shù)字特征以上討論了隨機(jī)變量的概率密度函數(shù)PDF和累積分布函數(shù)CDF,但在處理實(shí)際問(wèn)題時(shí),往往不需要求出這些函數(shù),而是只需要了解變量的某些特征值。這些特征值包括三類:度量變量分布的集中趨勢(shì)(centraltendency):數(shù)學(xué)期望或均值;中位數(shù);眾數(shù)度量變量分布的離散性(dispersion):方差;標(biāo)準(zhǔn)差度量?jī)蓚€(gè)變量的相關(guān)性(correlation):協(xié)方差;相關(guān)系數(shù)105隨機(jī)變量的數(shù)字特征以上討論了隨機(jī)變量的概率密度函數(shù)PDF和累隨機(jī)變量的數(shù)字特征數(shù)學(xué)期望(expectation)或均值(mean)離散型變量的期望:實(shí)例:扔兩個(gè)骰子的點(diǎn)數(shù)之和x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36106隨機(jī)變量的數(shù)字特征數(shù)學(xué)期望(expectation)或均值(隨機(jī)變量的數(shù)字特征連續(xù)型變量的期望:實(shí)例:107隨機(jī)變量的數(shù)字特征連續(xù)型變量的期望:22隨機(jī)變量的數(shù)字特征期望的性質(zhì):108隨機(jī)變量的數(shù)字特征期望的性質(zhì):23隨機(jī)變量的數(shù)字特征中位數(shù)(median)對(duì)于離散型變量,假設(shè)所有可能取值的個(gè)數(shù)為n,把這些數(shù)從小到大排列。若n為奇數(shù),位于中央位置的那個(gè)數(shù)就是中位數(shù);若n為偶數(shù),位于中央位置的那兩個(gè)數(shù)的平均數(shù)就是中位數(shù)。記為Med(X),中位數(shù)所在的位置為(n+1)/2。對(duì)于連續(xù)型變量,中位數(shù)m滿足下列條件:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36109隨機(jī)變量的數(shù)字特征中位數(shù)(median)x234567891隨機(jī)變量的數(shù)字特征眾數(shù)(mode)眾數(shù)就是隨機(jī)變量的所有可能取值中出現(xiàn)次數(shù)最多的那個(gè)隨機(jī)變量的類型定類變量(nominalvariable):性別;民族定序變量(ordinalvariable):教育水平;收入等級(jí)定距變量(intervalvariable):考試成績(jī);收入水平一般地,不同類型的變量用不同的數(shù)學(xué)特征表示其集中趨勢(shì)。定類變量用眾數(shù);定序變量用中位數(shù);定距變量用均值或中位數(shù)x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36110隨機(jī)變量的數(shù)字特征眾數(shù)(mode)x234567891011隨機(jī)變量的數(shù)字特征方差(variance)方差被定義為隨機(jī)變量對(duì)其均值的期望距離,用于表示隨機(jī)變量與其均值的偏離程度。方差較小說(shuō)明變量的分布比較集中,反之則說(shuō)明變量的分布很分散方差的性質(zhì)111隨機(jī)變量的數(shù)字特征方差(variance)26隨機(jī)變量的數(shù)字特征實(shí)例:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36112隨機(jī)變量的數(shù)字特征實(shí)例:x23456789101112f(x隨機(jī)變量的數(shù)字特征標(biāo)準(zhǔn)差(standarddeviation)方差的量綱與變量的量綱不同,為此引入與變量具有相同量綱的數(shù)字特征——標(biāo)準(zhǔn)差,同樣度量變量的離散程度標(biāo)準(zhǔn)差的性質(zhì):113隨機(jī)變量的數(shù)字特征標(biāo)準(zhǔn)差(standarddeviatio隨機(jī)變量的數(shù)字特征度量變量離散程度的其他常用指標(biāo)還有:極差/全距極差率變異系數(shù)基尼系數(shù)泰爾系數(shù)114隨機(jī)變量的數(shù)字特征度量變量離散程度的其他常用指標(biāo)還有:29隨機(jī)變量的數(shù)字特征協(xié)方差(covariance)協(xié)方差度量?jī)蓚€(gè)隨機(jī)變量的相關(guān)(correlation)程度協(xié)方差大于0表示兩個(gè)變量正相關(guān)(positivelycorrelated),即其中一個(gè)變量隨著另一個(gè)變量的增大而增大協(xié)方差大于0表示兩個(gè)變量負(fù)相關(guān)(negativelycorrelated),即其中一個(gè)變量隨著另一個(gè)變量的增大而減小協(xié)方差等于0表示兩個(gè)變量不相關(guān)(uncorrelated)115隨機(jī)變量的數(shù)字特征協(xié)方差(covariance)30隨機(jī)變量的數(shù)字特征協(xié)方差的性質(zhì):116隨機(jī)變量的數(shù)字特征協(xié)方差的性質(zhì):31隨機(jī)變量的數(shù)字特征相關(guān)系數(shù)(correlationcoefficient)協(xié)方差的大小與度量單位有關(guān),使用不便,因此一般用相關(guān)系數(shù)來(lái)衡量?jī)蓚€(gè)變量的相關(guān)程度117隨機(jī)變量的數(shù)字特征相關(guān)系數(shù)(correlationcoef隨機(jī)變量的數(shù)字特征相關(guān)與獨(dú)立(correlation&independence)相關(guān)是指兩個(gè)隨機(jī)變量之間的線性關(guān)聯(lián)程度,獨(dú)立是指兩個(gè)變量之間的一般關(guān)聯(lián)程度若兩個(gè)變量相互獨(dú)立,其相關(guān)系數(shù)一定為0若兩個(gè)變量的相關(guān)系數(shù)為0,它們不一定獨(dú)立118隨機(jī)變量的數(shù)字特征相關(guān)與獨(dú)立(correlation&i隨機(jī)變量的數(shù)字特征條件期望(conditionalexpectation)如果我們可以用變量X解釋變量Y,那么一旦我們知道X取某個(gè)特定的值x,就能夠計(jì)算出在X=x的條件下Y的期望值,稱為條件期望實(shí)例119隨機(jī)變量的數(shù)字特征條件期望(conditionalexpe一些重要的概率分布正態(tài)分布(normaldistribution)如果一個(gè)隨機(jī)變量的概率密度函數(shù)PDF如下所示,稱這個(gè)變量服從正態(tài)分布120一些重要的概率分布正態(tài)分布(normaldistribut一些重要的概率分布標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)如果一個(gè)服從正態(tài)分布的隨機(jī)變量的均值為0,方差為1,稱這個(gè)變量服從標(biāo)準(zhǔn)正態(tài)分布121一些重要的概率分布標(biāo)準(zhǔn)正態(tài)分布(standardnorma一些重要的概率分布122一些重要的概率分布37一些重要的概率分布標(biāo)準(zhǔn)化隨機(jī)變量(standardizedrandomvariable)123一些重要的概率分布標(biāo)準(zhǔn)化隨機(jī)變量(standardized一些重要的概率分布統(tǒng)計(jì)學(xué)書(shū)籍和計(jì)量經(jīng)濟(jì)學(xué)書(shū)籍一般都附有標(biāo)準(zhǔn)化正態(tài)變量的累積分布函數(shù),可以通過(guò)轉(zhuǎn)換求解正態(tài)變量的概率問(wèn)題124一些重要的概率分布統(tǒng)計(jì)學(xué)書(shū)籍和計(jì)量經(jīng)濟(jì)學(xué)書(shū)籍一般都附有標(biāo)準(zhǔn)化一些重要的概率分布卡方分布n=2n=5n=10125一些重要的概率分布卡方分布n=2n=5n=1040一些重要的概率分布126一些重要的概率分布41一些重要的概率分布t分布(tdistribution)n=120n=5n=20127一些重要的概率分布t分布(tdistribution)一些重要的概率分布128一些重要的概率分布43一些重要的概率分布F分布(Fdistribution)F(2,2)F(10,2)F(50,50)129一些重要的概率分布F分布(Fdistribution)一些重要的概率分布130一些重要的概率分布45二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)總體與樣本參數(shù)估計(jì)點(diǎn)估計(jì)區(qū)間估計(jì)假設(shè)檢驗(yàn)置信區(qū)間法顯著性檢驗(yàn)法131二、數(shù)理統(tǒng)計(jì)基礎(chǔ)知識(shí)總體與樣本46總體與樣本總體(population)研究對(duì)象的全體,記為X隨機(jī)樣本(randomsample)/樣本(sample)在相同條件下對(duì)總體X進(jìn)行n次重復(fù)的、獨(dú)立的觀測(cè),每次觀測(cè)結(jié)果都是與X具有相同分布的、相互獨(dú)立的隨機(jī)變量,記為X1,

X2,…,Xn,把它們稱為來(lái)自總體的一個(gè)簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱樣本,稱n為樣本容量。當(dāng)觀測(cè)完成后,得到一組觀測(cè)值x1,

x2,…,xn,稱為樣本值我們感興趣的實(shí)際上是總體,但由于不可能或很難得到總體的信息,只能從中抽取一個(gè)樣本,根據(jù)樣本數(shù)據(jù)來(lái)推斷總體的性質(zhì)。這其中包含兩類問(wèn)題:參數(shù)估計(jì)和假設(shè)檢驗(yàn)132總體與樣本總體(population)47參數(shù)估計(jì)參數(shù)(parameters)與總體有關(guān)的數(shù)字特征。如總體均值、總體方差等等。參數(shù)估計(jì)(parameterestimation)根據(jù)樣本的有關(guān)數(shù)值來(lái)估計(jì)總體參數(shù)或總體參數(shù)的范圍點(diǎn)估計(jì)區(qū)間估計(jì)133參數(shù)估計(jì)參數(shù)(parameters)48點(diǎn)估計(jì)點(diǎn)估計(jì)(pointestimation)估計(jì)量是樣本的函數(shù),對(duì)于不同的樣本,參數(shù)估計(jì)值是不同的。點(diǎn)估計(jì)的方法:矩估計(jì)法極大似然法最小二乘法134點(diǎn)估計(jì)點(diǎn)估計(jì)(pointestimation)49點(diǎn)估計(jì)矩(moment)矩估計(jì)法(methodofmoment)用樣本矩作為相應(yīng)總體矩的估計(jì)量,并用樣本矩的連續(xù)函數(shù)作為總體矩連續(xù)函數(shù)的估計(jì)量。通過(guò)這種方法得到的估計(jì)量稱為矩估計(jì)量135點(diǎn)估計(jì)矩(moment)50點(diǎn)估計(jì)矩估計(jì)法:實(shí)例136點(diǎn)估計(jì)矩估計(jì)法:實(shí)例51點(diǎn)估計(jì)極大似然法(methodofmaximumlikelihood)137點(diǎn)估計(jì)極大似然法(methodofmaximumlik點(diǎn)估計(jì)極大似然法:實(shí)例138點(diǎn)估計(jì)極大似然法:實(shí)例53點(diǎn)估計(jì)估計(jì)量的評(píng)選標(biāo)準(zhǔn)估計(jì)量是隨機(jī)變量,會(huì)由于估計(jì)方法的不同而不同,那么,如何判斷一個(gè)估計(jì)量的好壞呢?或者說(shuō)應(yīng)該選擇哪個(gè)估計(jì)量更好呢?有以下幾條標(biāo)準(zhǔn):針對(duì)小樣本的標(biāo)準(zhǔn)無(wú)偏性有效性針對(duì)大樣本的標(biāo)準(zhǔn)一致性漸進(jìn)正態(tài)性139點(diǎn)估計(jì)估計(jì)量的評(píng)選標(biāo)準(zhǔn)54點(diǎn)估計(jì)無(wú)偏性(unbiasedness)實(shí)例140點(diǎn)估計(jì)無(wú)偏性(unbiasedness)5514156點(diǎn)估計(jì)有效性(efficiency)注意:一個(gè)無(wú)偏的估計(jì)量可能存在很大方差,而一個(gè)方差很小的估計(jì)量可能是偏離總體均值的,因此有效性綜合考慮了估計(jì)量的集中趨勢(shì)和離散性兩個(gè)特征142點(diǎn)估計(jì)有效性(efficiency)57點(diǎn)估計(jì)實(shí)例:有效性和無(wú)偏性143點(diǎn)估計(jì)實(shí)例:有效性和無(wú)偏性58點(diǎn)估計(jì)線性估計(jì)量(linearestimator)最優(yōu)線性無(wú)偏估計(jì)量(bestlinearunbiasedestimator,BLUE)144點(diǎn)估計(jì)線性估計(jì)量(linearestimator)59點(diǎn)估計(jì)一致性(consistence)145點(diǎn)估計(jì)一致性(consistence)60點(diǎn)估計(jì)概率極限(probabilitylimits)146點(diǎn)估計(jì)概率極限(probabilitylimits)61點(diǎn)估計(jì)一些重要的估計(jì)量:147點(diǎn)估計(jì)一些重要的估計(jì)量:62點(diǎn)估計(jì)實(shí)例:為了解中國(guó)城市失業(yè)率,隨機(jī)抽取了10座城市,得到如下樣本。則我們可以用這10座城市的平均失業(yè)率來(lái)估計(jì)中國(guó)城市的平均失業(yè)率城市(i)12345678910失業(yè)率(xi)5.16.49.24.17.58.32.63.55.87.5148點(diǎn)估計(jì)實(shí)例:為了解中國(guó)城市失業(yè)率,隨機(jī)抽取了10座城市,得到點(diǎn)估計(jì)漸進(jìn)正態(tài)性(asymptoticnormality)當(dāng)樣本容量無(wú)限增大時(shí)估計(jì)量趨向于正態(tài)分布中心極限定理(centrallimittheorem,CLT)定理一(獨(dú)立同分布的中心極限定理):當(dāng)樣本容量無(wú)限增大時(shí),任何總體的隨機(jī)樣本的均值趨近于正態(tài)分布。149點(diǎn)估計(jì)漸進(jìn)正態(tài)性(asymptoticnormality)點(diǎn)估計(jì)中心極限定理定理二:李雅普諾夫(L

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論