計量經(jīng)濟(jì)學(xué) 第2講 基礎(chǔ)知識復(fù)習(xí)_第1頁
計量經(jīng)濟(jì)學(xué) 第2講 基礎(chǔ)知識復(fù)習(xí)_第2頁
計量經(jīng)濟(jì)學(xué) 第2講 基礎(chǔ)知識復(fù)習(xí)_第3頁
計量經(jīng)濟(jì)學(xué) 第2講 基礎(chǔ)知識復(fù)習(xí)_第4頁
計量經(jīng)濟(jì)學(xué) 第2講 基礎(chǔ)知識復(fù)習(xí)_第5頁
已閱讀5頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二講基礎(chǔ)知識復(fù)習(xí)一、概率論基礎(chǔ)知識二、數(shù)理統(tǒng)計基礎(chǔ)知識1一、概率論基礎(chǔ)知識概率隨機變量概率密度函數(shù)多維隨機變量隨機變量的數(shù)字特征一些重要的概率分布2概率隨機試驗可以在相同條件下重復(fù)進(jìn)行每次試驗的可能結(jié)果不止一個,但事先能明確所有的可能結(jié)果進(jìn)行一次試驗之前不能確定會出現(xiàn)哪一個結(jié)果實例一枚硬幣拋擲兩次在北京師范大學(xué)校園里詢問任意一個學(xué)生的年齡3概率樣本空間(samplingspace)/總體(population)某一個隨機試驗的所有可能結(jié)果組成的集合,記為S樣本點(samplingpoint)樣本空間里的某一元素,即隨機試驗的某一可能結(jié)果實例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T樣本空間:{HH,HT,TH,TT}樣本點:HH,HT,TH,TT4概率事件(event)某一隨機試驗的樣本空間的一個子集實例:一枚硬幣拋擲兩次事件A:出現(xiàn)兩個正面事件B:出現(xiàn)一個正面和一個反面事件C:出現(xiàn)兩個反面5概率頻率(frequency)在相同條件下,某隨機試驗進(jìn)行了n次,其中事件A發(fā)生了m次,則比值m/n稱為事件A發(fā)生的頻率,記fn(A)實例:拋擲一枚硬幣,事件A為出現(xiàn)正面n550500204840401200024000fn(A)0.70.540.4840.51810.50690.50160.5005當(dāng)n逐漸增大時,頻率趨向于某一常數(shù),稱為頻率穩(wěn)定性6概率概率(probability)S是某一隨機試驗的樣本空間,對于其中的任意一個事件A賦予一個實數(shù)P(A),如果P(A)滿足下列三個條件,則稱P(A)為事件A的概率。當(dāng)n趨近于無窮大時,頻率fn(A)無限接近于概率P(A),從而用概率來度量事件A在一次試驗中發(fā)生的可能性7概率條件概率(conditionalprobability)設(shè)A、B是兩個事件,且P(A)>0,稱下式為事件A發(fā)生的條件下事件B發(fā)生的條件概率:實例一枚硬幣拋擲兩次,出現(xiàn)正面記為H,出現(xiàn)反面記為T。事件A為“至少有一次H”,事件B為“兩次都是同一面”。則事件A的概率為3/4,事件A和B同時發(fā)生的概率為1/4,在A發(fā)生的條件下B發(fā)生的概率為1/38隨機變量隨機變量(stochastic/randomvariable)一個變量若它的值是由隨機試驗決定的,稱其為隨機變量。隨機變量通常用大寫字母X、Y、Z表示,其數(shù)值則用小寫字母x、y、z表示離散型隨機變量(discreterandomvariable)可能取到的值是有限個的隨機變量連續(xù)型隨機變量(continuousrandomvariable)可能取到的值是無限個的隨機變量實例離散型隨機變量:扔一次骰子出現(xiàn)的點數(shù);未出生嬰兒的性別連續(xù)型隨機變量:人的身高;百米跑速度9概率密度函數(shù)離散型變量的概率密度函數(shù)/概率分布(probabilitydensityfunction/probabilitydistribution)實例X:投擲兩顆骰子出現(xiàn)的點數(shù)之和X的PDFX23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/3610概率密度函數(shù)連續(xù)型變量的累積分布函數(shù)(cumulativedistributionfunction)實例槍靶的半徑為2米,若每槍都能擊中槍靶,且擊中靶上任一同心圓內(nèi)的點的概率與該圓的面積成正比,則彈著點與靶心的距離X是一個連續(xù)型隨機變量,其CDF為:F(x)x2111概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)實例在上例中,PDF為:f(x)x1212概率密度函數(shù)連續(xù)型變量的概率密度函數(shù)(PDF)f(x)xab13多維隨機變量多維隨機變量多個變量的取值由同一個隨機試驗決定,稱這些變量為多維隨機變量。以下我們考慮最簡單的二維隨機變量,用(X,Y)表示,其數(shù)值用(x,y)表示實例離散型二維隨機變量:每一位學(xué)生的性別和民族連續(xù)型二維隨機變量:每一位學(xué)生的身高和體重14多維隨機變量離散型變量的聯(lián)合概率密度函數(shù)(jointPDF)實例譬如:既是男生又是滿族的概率為0.08,既是女生又是回族的概率為0民族漢族滿族回族蒙古族性別男0.270.080.160女0.350.1000.0415多維隨機變量離散型變量的邊緣概率密度函數(shù)(marginalPDF)實例X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.0416多維隨機變量離散型變量的條件概率密度函數(shù)(conditionalPDF)表示在Y=y的條件下X=x的概率譬如:f(滿族,女生)=0.10,f(女生)=0.49,f(滿族|女生)=0.10/0.49=0.20f(漢族,男生)=0.27,f(男生)=0.51,f(漢族|男生)=0.27/0.51=0.53X(民族)邊緣概率漢族滿族回族蒙古族Y(性別)男0.270.080.1600.51女0.350.1000.040.49邊緣概率0.620.180.160.0417多維隨機變量統(tǒng)計獨立性(statisticallyindependence)如果兩個隨機變量的聯(lián)合PDF等于它們邊緣PDF的乘積,則稱這兩個變量是相互獨立的(independent)。兩個變量獨立意味著其中一個變量的結(jié)果不會影響另一個。譬如:f(X=H,Y=H)=f(X=H)*f(Y=H)=1/2*1/2=1/4……實例:拋硬幣X(第一次)正面(H)反面(T)Y(第二次)正面(H)1/41/4反面(T)1/41/418多維隨機變量連續(xù)型變量的聯(lián)合概率密度函數(shù)(jointPDF)連續(xù)型變量的邊緣概率密度函數(shù)(marginalPDF)統(tǒng)計獨立性(statisticallyindependence)19隨機變量的數(shù)字特征以上討論了隨機變量的概率密度函數(shù)PDF和累積分布函數(shù)CDF,但在處理實際問題時,往往不需要求出這些函數(shù),而是只需要了解變量的某些特征值。這些特征值包括三類:度量變量分布的集中趨勢(centraltendency):數(shù)學(xué)期望或均值;中位數(shù);眾數(shù)度量變量分布的離散性(dispersion):方差;標(biāo)準(zhǔn)差度量兩個變量的相關(guān)性(correlation):協(xié)方差;相關(guān)系數(shù)20隨機變量的數(shù)字特征數(shù)學(xué)期望(expectation)或均值(mean)離散型變量的期望:實例:扔兩個骰子的點數(shù)之和x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3621隨機變量的數(shù)字特征連續(xù)型變量的期望:實例:22隨機變量的數(shù)字特征期望的性質(zhì):23隨機變量的數(shù)字特征中位數(shù)(median)對于離散型變量,假設(shè)所有可能取值的個數(shù)為n,把這些數(shù)從小到大排列。若n為奇數(shù),位于中央位置的那個數(shù)就是中位數(shù);若n為偶數(shù),位于中央位置的那兩個數(shù)的平均數(shù)就是中位數(shù)。記為Med(X),中位數(shù)所在的位置為(n+1)/2。對于連續(xù)型變量,中位數(shù)m滿足下列條件:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3624隨機變量的數(shù)字特征眾數(shù)(mode)眾數(shù)就是隨機變量的所有可能取值中出現(xiàn)次數(shù)最多的那個隨機變量的類型定類變量(nominalvariable):性別;民族定序變量(ordinalvariable):教育水平;收入等級定距變量(intervalvariable):考試成績;收入水平一般地,不同類型的變量用不同的數(shù)學(xué)特征表示其集中趨勢。定類變量用眾數(shù);定序變量用中位數(shù);定距變量用均值或中位數(shù)x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3625隨機變量的數(shù)字特征方差(variance)方差被定義為隨機變量對其均值的期望距離,用于表示隨機變量與其均值的偏離程度。方差較小說明變量的分布比較集中,反之則說明變量的分布很分散方差的性質(zhì)26隨機變量的數(shù)字特征實例:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3627隨機變量的數(shù)字特征標(biāo)準(zhǔn)差(standarddeviation)方差的量綱與變量的量綱不同,為此引入與變量具有相同量綱的數(shù)字特征——標(biāo)準(zhǔn)差,同樣度量變量的離散程度標(biāo)準(zhǔn)差的性質(zhì):28隨機變量的數(shù)字特征度量變量離散程度的其他常用指標(biāo)還有:極差/全距極差率變異系數(shù)基尼系數(shù)泰爾系數(shù)29隨機變量的數(shù)字特征協(xié)方差(covariance)協(xié)方差度量兩個隨機變量的相關(guān)(correlation)程度協(xié)方差大于0表示兩個變量正相關(guān)(positivelycorrelated),即其中一個變量隨著另一個變量的增大而增大協(xié)方差大于0表示兩個變量負(fù)相關(guān)(negativelycorrelated),即其中一個變量隨著另一個變量的增大而減小協(xié)方差等于0表示兩個變量不相關(guān)(uncorrelated)30隨機變量的數(shù)字特征協(xié)方差的性質(zhì):31隨機變量的數(shù)字特征相關(guān)系數(shù)(correlationcoefficient)協(xié)方差的大小與度量單位有關(guān),使用不便,因此一般用相關(guān)系數(shù)來衡量兩個變量的相關(guān)程度32隨機變量的數(shù)字特征相關(guān)與獨立(correlation&independence)相關(guān)是指兩個隨機變量之間的線性關(guān)聯(lián)程度,獨立是指兩個變量之間的一般關(guān)聯(lián)程度若兩個變量相互獨立,其相關(guān)系數(shù)一定為0若兩個變量的相關(guān)系數(shù)為0,它們不一定獨立33隨機變量的數(shù)字特征條件期望(conditionalexpectation)如果我們可以用變量X解釋變量Y,那么一旦我們知道X取某個特定的值x,就能夠計算出在X=x的條件下Y的期望值,稱為條件期望實例34一些重要的概率分布正態(tài)分布(normaldistribution)如果一個隨機變量的概率密度函數(shù)PDF如下所示,稱這個變量服從正態(tài)分布35一些重要的概率分布標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)如果一個服從正態(tài)分布的隨機變量的均值為0,方差為1,稱這個變量服從標(biāo)準(zhǔn)正態(tài)分布36一些重要的概率分布37一些重要的概率分布標(biāo)準(zhǔn)化隨機變量(standardizedrandomvariable)38一些重要的概率分布統(tǒng)計學(xué)書籍和計量經(jīng)濟(jì)學(xué)書籍一般都附有標(biāo)準(zhǔn)化正態(tài)變量的累積分布函數(shù),可以通過轉(zhuǎn)換求解正態(tài)變量的概率問題39一些重要的概率分布卡方分布n=2n=5n=1040一些重要的概率分布41一些重要的概率分布

t分布(tdistribution)n=120n=5n=2042一些重要的概率分布43一些重要的概率分布

F分布(Fdistribution)F(2,2)F(10,2)F(50,50)44一些重要的概率分布45二、數(shù)理統(tǒng)計基礎(chǔ)知識總體與樣本參數(shù)估計點估計區(qū)間估計假設(shè)檢驗置信區(qū)間法顯著性檢驗法46總體與樣本總體(population)研究對象的全體,記為X隨機樣本(randomsample)/樣本(sample)在相同條件下對總體X進(jìn)行n次重復(fù)的、獨立的觀測,每次觀測結(jié)果都是與X具有相同分布的、相互獨立的隨機變量,記為X1,

X2,…,Xn

,把它們稱為來自總體的一個簡單隨機樣本,簡稱樣本,稱n為樣本容量。當(dāng)觀測完成后,得到一組觀測值x1,

x2,…,xn

,稱為樣本值我們感興趣的實際上是總體,但由于不可能或很難得到總體的信息,只能從中抽取一個樣本,根據(jù)樣本數(shù)據(jù)來推斷總體的性質(zhì)。這其中包含兩類問題:參數(shù)估計和假設(shè)檢驗47參數(shù)估計參數(shù)(parameters)與總體有關(guān)的數(shù)字特征。如總體均值、總體方差等等。參數(shù)估計(parameterestimation)根據(jù)樣本的有關(guān)數(shù)值來估計總體參數(shù)或總體參數(shù)的范圍點估計區(qū)間估計48點估計點估計(pointestimation)估計量是樣本的函數(shù),對于不同的樣本,參數(shù)估計值是不同的。點估計的方法:矩估計法極大似然法最小二乘法49點估計矩(moment)矩估計法(methodofmoment)用樣本矩作為相應(yīng)總體矩的估計量,并用樣本矩的連續(xù)函數(shù)作為總體矩連續(xù)函數(shù)的估計量。通過這種方法得到的估計量稱為矩估計量50點估計矩估計法:實例51點估計極大似然法(methodofmaximumlikelihood)52點估計極大似然法:實例53點估計估計量的評選標(biāo)準(zhǔn)估計量是隨機變量,會由于估計方法的不同而不同,那么,如何判斷一個估計量的好壞呢?或者說應(yīng)該選擇哪個估計量更好呢?有以下幾條標(biāo)準(zhǔn):針對小樣本的標(biāo)準(zhǔn)無偏性有效性針對大樣本的標(biāo)準(zhǔn)一致性漸進(jìn)正態(tài)性54點估計無偏性(unbiasedness)實例5556點估計有效性(efficiency)注意:一個無偏的估計量可能存在很大方差,而一個方差很小的估計量可能是偏離總體均值的,因此有效性綜合考慮了估計量的集中趨勢和離散性兩個特征57點估計實例:有效性和無偏性58點估計線性估計量(linearestimator)最優(yōu)線性無偏估計量(bestlinearunbiasedestimator,BLUE)59點估計一致性(consistence)60點估計概率極限(probabilitylimits)61點估計一些重要的估計量:62點估計實例:為了解中國城市失業(yè)率,隨機抽取了10座城市,得到如下樣本。則我們可以用這10座城市的平均失業(yè)率來估計中國城市的平均失業(yè)率城市(i)12345678910失業(yè)率(xi)5.16.49.24.17.58.32.63.55.87.563點估計漸進(jìn)正態(tài)性(asymptoticnormality)當(dāng)樣本容量無限增大時估計量趨向于正態(tài)分布中心極限定理(centrallimittheorem,CLT)定理一(獨立同分布的中心極限定理):當(dāng)樣本容量無限增大時,任何總體的隨機樣本的均值趨近于正態(tài)分布。64點估計中心極限定理定理二:李雅普諾夫(Liapunov)定理65區(qū)間估計對于一個未知參數(shù),除了估計其近似值(點估計)外,還希望知道這個值的精確程度,從而引出區(qū)間估計(intervalestimation)問題置信區(qū)間(confidenceinterval)66區(qū)間估計正態(tài)總體均值的區(qū)間估計:總體方差已知67區(qū)間估計實例:總體方差已知時正態(tài)總體均值的區(qū)間估計68區(qū)間估計正態(tài)總體均值的區(qū)間估計:總體方差未知69區(qū)間估計標(biāo)準(zhǔn)誤(standarderror)70區(qū)間估計正態(tài)總體均值的區(qū)間估計:95%置信區(qū)間的簡單法則71區(qū)間估計非正態(tài)總體均值的區(qū)間估計72假設(shè)檢驗假設(shè)檢驗(hypothesistesting)在總體的PDF未知或某些參數(shù)未知的情況下,對總體的分布或參數(shù)提出某些假設(shè),然后根據(jù)樣本對提出的假設(shè)作出是拒絕還是接受的判斷實例:Bush和Kerry競選總統(tǒng),Bush獲得42%的選票而Kerry獲得58%的選票。Bush懷疑大選中有作弊行為,雇傭一個咨詢機構(gòu)隨機抽取100個選民調(diào)查其選舉意愿,發(fā)現(xiàn)有53人支持他,47人支持Kerry。由此Bush提出兩個假設(shè):H0(虛擬假設(shè)/原假設(shè),nullhypothesis):v<=0.42(沒有作弊)H1(對立假設(shè)/備擇假設(shè),alternativehypothesis):v>0.42(有作弊)73假設(shè)檢驗第Ⅰ類錯誤(typeⅠerror)拒絕了一個真實的虛擬假設(shè)第Ⅱ

類錯誤(typeⅡerror)沒有拒絕一個錯誤的虛擬假設(shè)理論上我們

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論