版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1SchoolofFinance,SUIBE高級計量經(jīng)濟學(xué)I第一章概率論、統(tǒng)計學(xué)知識復(fù)習(xí)整個計量經(jīng)濟學(xué)中,有三種類型的統(tǒng)計方法被普遍使用:估計方法、假設(shè)檢驗方法和置信區(qū)間方法。SchoolofFinance,SUIBE3本章大綱隨機變量與概率分布期望值、均值及方差二元隨機變量正態(tài)分布、卡方分布、F分布和學(xué)生t分布隨機抽樣及樣本均值抽樣分布的大樣本逼近總體均值的估計利用數(shù)據(jù)對因果效應(yīng)的均值差進行估計隨機變量的期望1.概率、樣本空間和隨機變量1.1隨機變量與概率分布結(jié)果(outcomes):隨機過程中相互排斥的可能后果被稱為結(jié)果。結(jié)果的概率(Probability):是指這個結(jié)果長期發(fā)生次數(shù)的比率。樣本空間(SampleSpace):所有可能結(jié)果的集合稱為樣本空間。事件(Event):是樣本空間的一個子集,即事件是一個或多個結(jié)果的集合。隨機變量(RandomVariable,r.v.):隨機變量是一個隨機結(jié)果的一系列數(shù)值表示。離散隨機變量(DiscreteRandomVariable)連續(xù)離散隨機變量(ContinuousRandomVariable)只能取離散數(shù)值,如:0,1,2,…如,0,1,2,…可能取值的連續(xù)空間。2.離散型隨機變量的概率分布概率分布(ProbabilityDistribution):變量所有的可能值和每個值發(fā)生的概率的列表。這些概率之和為1。如,用M表示你在寫學(xué)期論文時電腦死機的次數(shù)。事件概率(EventProbability):累積概率分布(CumulativeProbabilityDistribution):是隨機變量小于或等于某個特定值的概率。
累積概率分布也常稱為累積概率分布(CumulativeProbabilityFunction,c.d.f.)。貝努利分布(BernoulliDistribution):貝努利隨機變量(BernoulliRandomVariable)貝努利分布:
設(shè)G是高級計量經(jīng)濟I的最終成績,其中,G=0表示non-pass,G=1表示pass。G的結(jié)果和對應(yīng)的概率為其中,p表示pass的概率。公式(*)中的概率分布就是貝努利分布。3.連續(xù)型隨機變量的概率分布概率累積分布:是連續(xù)型隨機變量小于或等于某個特定值的概率。概率密度函數(shù)(ProbabilityDensityFunction,p.d.f.)例子:一個從家開車到學(xué)校的老師,他的通勤時間可以取某值的一個連續(xù)區(qū)間,由于通勤時間依賴于諸如天氣和交通狀況等隨機因素,自然應(yīng)該是連續(xù)型隨機變量。1.隨機變量的期望1.2隨機變量的期望期望(ExpectedValue):隨機變量Y的期望值是多次重復(fù)試驗或發(fā)生過程中隨機變量Y的長期平均值,表示為E[Y]。
假設(shè)Y為隨機變量。變量Y的期望值也被稱為Y的期望(Expected),或Y的均值(mean),表示為。重要概念一:
期望和均值假設(shè)隨機變量Y取k個可能的值,,其中表示第一個值,表示第二個值,以此類推。Y取的概率為,Y取的概率為,以此類推。用E[Y]表示Y的期望值,它是:其中,算式“”意味著“i取值從1到k時的和”。Y期望值也被稱為Y的均值或Y的期望,通常用表示。貝努利隨機變量的期望值:2.標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差(StandardDeviation或方差(Variance):它們測度一個概率分布的離散程度或分散度。一個隨機變量的方差是Y對其均值的離差平方的期望,表示為var(Y),即一個隨機變量的標(biāo)準(zhǔn)差就是方差的平方根,表示為。重要概念二:方差和標(biāo)準(zhǔn)差假設(shè)隨機變量Y的方差是用表示,計算公式為:
Y的標(biāo)準(zhǔn)差是,即方差的平方根。標(biāo)準(zhǔn)差的單位與Y的單位相同。貝努利方差:因而,貝努利標(biāo)準(zhǔn)差為。3.隨機變量線性函數(shù)的均值和方差例子:考慮一個所得稅方案,在這個方案下,個人的收入以20%的稅率被征收,然后給$2000美元的補助金(免稅的)。請問在這個稅收方案下如何將稅后收入Y和稅前收入X聯(lián)系起來?在這個方案下,稅后收入Y和稅前收入X可以由以下方程聯(lián)系起來:假設(shè)一位女士明年的稅前收入是個均值為、方差為的隨機變量。請問在這個方案下她的稅后收入的均值和方差為多少?在這個方案下,她稅后收入Y的期望值為:稅后收入Y的方差為:Y的標(biāo)準(zhǔn)差為:將以上分析推廣,假設(shè)Y以截距a(代替$2000)和斜率b(代替0.8)依賴于X,因此,Y與X的聯(lián)系:Y的期望、方差和標(biāo)準(zhǔn)差分別為:4.分布形態(tài)的其他測度指標(biāo):均值和標(biāo)準(zhǔn)差測量一個分布的兩個重要指標(biāo):中心水平(均值)和離散程度(標(biāo)準(zhǔn)差)。我們將討論一個分布的另外兩個測量指標(biāo):偏度和峰度。注意:均值、方差、偏度和峰度都是以分布的矩為基礎(chǔ)的。k階矩(kthmoment):其中,X的均值(mean)或期望值,即,
。期望(或均值)也就是隨機變量X的一階矩,它是度量分布的中心位置k階中心矩(kthcenteredmoment):偏度(skewness):S(x)=0,該隨機變量分布對稱;S(x)>0,高峰向左偏移,長尾向右側(cè)延伸稱為正偏態(tài)分布,也稱右偏態(tài)分布;S(x)<0,高峰向右偏移,長尾向左延伸則成為負(fù)偏態(tài)分布,也稱左偏態(tài)分布。峰左移,右偏,正偏峰右移,左偏,負(fù)偏峰度(kurtosis):K(x)-3叫作超額峰度(excesskurtosis)。若超額峰度為正,則分布具有后尾,即稱為尖峰,反之,則稱為低峰。5.ConvergenceAlmostsureconvergenceConvergenceindistributionConvergenceinprobability1.聯(lián)合分布與邊緣分布1.3二元隨機變量
經(jīng)濟學(xué)中很多有趣的問題都涉及兩個或兩個以上的變量。譬如,教育與就業(yè)問題,收入與性別的問題,等等。聯(lián)合分布(JointDistribution):兩個離散隨機變量(比如說X和Y)的聯(lián)合概率分布(JointProbabilityDistribution)是這兩個隨機變量同時去確定的值(比如說x和y)的概率。所有可能的(x,y)組合的概率之和等于1。聯(lián)合概率分布可被寫成函數(shù)的形式,即。邊緣分布概率(MarginalProbabilityDistribution):如果X有k個不同的值,那么Y取特定只y的邊緣概率是:2.條件分布條件分布(ConditionalDistribution):隨機變量Y的分布如果要以另一個隨機變量X取特定的值為條件,則被稱為X條件下Y的條件分布(ConditionalDistributionofYgivenX)。當(dāng)X取值為x時,Y取值為y的條件概率記為條件期望:給定X條件下Y的期望(ConditionalexpectationofYgivenX),又稱給定X條件下Y的條件分布均值(ConditionalmeanofYGivenX),是指如果Y取k個值,那么給定X=x,Y的條件均值是:累期望法則(TheLawofIteratedExpectations):如果X取m個不同的值,那么,換句話說,Y的期望就是給定X時Y的條件期望的期望,即條件方差:以X為條件的Y的方差(VarianceofYConditionalonX)是指給定X條件下Y的條件方差,即,3.獨立性:獨立性:如果一個變量的值不會提供有關(guān)另一個變量的任何信息,那么兩個隨機變量X和Y就是獨立分布的(independentlydistributed)或者說是獨立的(independent)。數(shù)學(xué)表達式:如果給定X條件下Y的條件分布等于Y的邊緣分布,那么X和Y就是獨立的,即,對于所有x和y值,
或者說,
也就是說,兩個獨立隨機變量的聯(lián)合分布是它們的邊緣分布的乘積。4.協(xié)方差和相關(guān)系數(shù):協(xié)方差(Covariance):測量兩個隨機變量共同變化程度的一個指標(biāo)是它們的協(xié)方差。X和Y之間的協(xié)方差就是期望值其中,是X的均值,是Y的均值。協(xié)方差用
或
,或相關(guān)系數(shù)(Correlation):相關(guān)系數(shù)是隨機變量X和Y之間相關(guān)程度的另一個測度。具體地說,X和Y之間的相關(guān)系數(shù)是和Y的協(xié)方差除以它們各自的標(biāo)準(zhǔn)差。相關(guān)系數(shù)是無單位的。如果,那么隨機變量X和Y是不相關(guān)的(uncorrelated)。相關(guān)系數(shù)的值總是在-1和1之間。(相關(guān)系數(shù)的不等式)相關(guān)系數(shù)與條件均值:如果Y的條件均值不依賴于X,那么Y和X是不相關(guān)的,即,如果,那么且
。5.隨機變量和的均值和方差兩個隨機變量X與Y的和的均值等于它們均值的和,即,重要概念:隨機變量和的均值、方差和協(xié)方差
設(shè)X、Y和V為隨機變量,設(shè)和為X的均值和方差,為X和Y的協(xié)方差(其他變量亦如此),并設(shè)a,b和c為常數(shù)。根據(jù)均值、方差以及協(xié)方差的定義,可以得到如下公式1.4正態(tài)分布、卡方分布、分布和學(xué)生t分布
計量經(jīng)濟學(xué)中最常用的概率分布是正態(tài)分布、卡方分布、學(xué)生t分布以及F分布。1.正態(tài)分布(NormalDistribution)一個連續(xù)變量如果服從正態(tài)分布,則具有類似鐘形的概率密度。
正態(tài)分布及其衍生分布是統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中最廣泛使用的分布。
其中,標(biāo)準(zhǔn)正態(tài)分布:正態(tài)分布的特殊形式是均值為0和方差為1。若隨機變量Z服從Normal(0,1),則Z服從標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的pdf記為,即,標(biāo)準(zhǔn)正態(tài)分布的cdf記為,重要概念三:正態(tài)隨機變量概率計算
假設(shè)Y是一個均值為、方差為的正態(tài)分布,即。用Y減去其均值并除以其標(biāo)準(zhǔn)差,對其進行標(biāo)準(zhǔn)化,即,計算。
設(shè)c1和c2代表兩個數(shù),且,又設(shè),。那么,多元正態(tài)分布(Multivariatenormaldistribution):正態(tài)分布可用來描述一組隨機變量的聯(lián)合分布,這種分布被稱為多元正態(tài)分布。如果只考慮兩個變量,那么就稱其為二元正態(tài)分布(Bivariatenormaldistribution)。多元正態(tài)分布具有三個重要性質(zhì):如果X和Y服從協(xié)方差為的二元正態(tài)分布,且a和b為常數(shù),那么aX+bY也服從正態(tài)分布,即:(X、Y為二元正態(tài)分布)
或者說,如果n個隨機變量都服從多元正態(tài)分布,那么這些變量的任何線性組合也都服從正態(tài)分布。如果一組變量都服從正態(tài)分布,那么每個變量的邊緣分布也都是正態(tài)的。如果服從多元正態(tài)分布的變量間的協(xié)方差為0,那么這些變量就是獨立的。分布(可以直接從獨立標(biāo)準(zhǔn)正態(tài)隨機變量推導(dǎo)出來)。令為n個獨立隨機變量,且都服從標(biāo)準(zhǔn)正態(tài)分布。定義一個新隨機變量為的一個平方和:
則,其中n為自由度(df)。2.卡方分布:
在統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中,當(dāng)我們檢驗?zāi)愁惣僭O(shè)是,經(jīng)常會用到卡方分布??ǚ椒植迹–hi-squaredistribution):是m個獨立標(biāo)準(zhǔn)正態(tài)分布的平方和的分布。這個分布依賴于m,m為卡方分布的自由度。例子:令是獨立的標(biāo)準(zhǔn)正態(tài)隨機變量,那么3.學(xué)生t分布學(xué)生t分布(Studenttdistribution),是兩個因素之比的比率分布,其自由度為m。其中,分子是一個標(biāo)準(zhǔn)正態(tài)分布,分母是一個自由度為m的獨立卡方分布的隨機變量除以m之后的平方根。數(shù)學(xué)表達式:比如,設(shè)Z是個標(biāo)準(zhǔn)正態(tài)隨機變量,W是個服從自由度為m的卡方分布的隨機變量,并設(shè)Z和W是獨立分布的,那么,注意:學(xué)生t分布的形狀與正態(tài)分布的鐘形密度曲線相似,但當(dāng)m較小時(20或更小),它的尾巴的概率較大。也就是說,它是個比正態(tài)分布“更肥尾”的鐘形分布。4.F分布:統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中的另一個重要分布。F分布(Fdistribution),一般用表示,它等于兩個隨機變量的比率的分布,其分子是一個自由度為m的卡方分布的隨機變量除以m,其分母是一個自由度為n的獨立的卡方分布的隨機變量除以n。數(shù)學(xué)表達式:比如,W代表一個服從卡方分布的隨機變量,其自由度為m,令V代表一個自由度為n的卡方分布的隨機變量,其中W和V是相互獨立的,那么,即,分子的自由度為m,分母的自由度為n。注意:在統(tǒng)計學(xué)和計量經(jīng)濟學(xué)上分布兩個重要的特例:當(dāng)分母自由度足夠大是,分布逼近分布。在這個特例中,分母隨機變量V是無數(shù)多卡方分布隨機變量的均值,且均值為1。因為一個標(biāo)準(zhǔn)正態(tài)分布隨機變量平方的均值還是1。1.5隨機抽樣幾樣本均值1.隨機抽樣簡單隨機抽樣(SimpleRandomVariable):從總體(Population)中隨機選擇n個個體,并且總體中的每個個體等可能的包含在樣本中。
由于包含在樣本中的個體是隨機選擇的,因此觀測值本身也是隨機的。獨立同分布抽樣獨立同分布(IndependentlyIdenticallyDistribution,i.i.d.):當(dāng)取自一個同一個分布并且是獨立的,則稱它們?yōu)楠毩⑼植蓟騣.i.d.。同分布(IdenticallyDistribution):由于是從同一個總體中隨機抽取的,因此對每個
而言,的邊緣分布都是相同的,那么稱是同分布的。獨立分布(IndependentlyDistribution):
在簡單隨機抽樣下,的值并不能提供關(guān)于的信息,那么稱與
是獨立分布。重要概念四:簡單隨機抽樣和i.i.d.隨機變量
在一個簡單的隨機樣本中,從總體中隨機抽取n個個體,并且每個個體等可能的被抽到。對于第i個被隨機抽到的個體而言,用表示隨機變量Y的。由于每個對象等可能的被抽取,并且對于所有的i而言,的分布是相同的,因此隨機變量
是獨立同分布的(i.i.d.)。也就是說,對于所有而言,的分布是相同的,并且是獨立于,其他結(jié)論以此類推。2.樣本均值的抽樣分布樣本均值:n個觀測值的樣本平均數(shù)的計算公式如下:樣本均值的均值、方差和標(biāo)準(zhǔn)差為1.6抽樣分布的大樣本逼近1.大數(shù)定律與一致性大數(shù)定律(LawofLargeNumber):在一般條件下,當(dāng)n很大是,
將會以非常高的概率接近于。大數(shù)定律有時又被稱為“均值定律”,當(dāng)大量均值相同的隨機變量放在一起取平均數(shù)時,大的數(shù)值平衡了小的數(shù)值,而且它們的樣本均值接近于它們的共同均值。例子:假設(shè)股票上漲為還是不上漲,如果第i個隨機選擇的股票上漲那么令,否則。由于這兒使用的是貝努利分布,因此是獨立同分布的。一致性(consistency):隨著n的增大,一不斷增大的概率接近于,這一性質(zhì)被稱為依概率收斂與(convergenceinProbability),或更精確地稱為一致性(consistency)重要概念五:依概率收斂、一致性和大數(shù)定律
對任意的嘗試c>0,隨著n的增大,如果位于區(qū)域內(nèi)的概率任意地接近于1,那么我們就說樣本均值依概率收斂與(或等價地,與是一致的),記為
大數(shù)定律指出:如果
是獨立同分布的,且
,,那么。2.中心極限定理中心極限定理(CentralLimitTheorem,CLM):在一般條件下,當(dāng)n足夠大時,的分布可充分地逼近正態(tài)分布。問題:n必須多大?
答案是“依情況而定”。正態(tài)近似的質(zhì)量好壞依賴于構(gòu)成均值對基本元素的分布。如果本身服從正態(tài)分布,那么對于所有的n來說,精確地服從正態(tài)分布;相反,如果本身服從一個與正態(tài)分布相差甚遠的分布,那么這種近似可能要求n=30或更大。
例子重要概念六:中心極限定理
假設(shè)是獨立同分布,且,,其中,。當(dāng)時,(其中,)的分布會被標(biāo)準(zhǔn)正態(tài)分布很好地近似替代。1.估計量及其性質(zhì)1.7總體均值的估計重要概念:估計量和估計值估計量(Estimator)是從一個總體中隨機抽取出來的樣本數(shù)據(jù)的函數(shù)。
注意:由于樣本選擇的隨機性,估計量是隨機變量,而估計值是非隨機的數(shù)值。估計值(Estimate)是利用特定樣本數(shù)據(jù)實際計算出來的估計量的數(shù)值。估計量:用樣本平均數(shù)來估計是一種很常用的方法。但它不是唯一的方法。例如,可以簡單地用第一個觀測值來估計。問題:怎樣判定一個估計量“好”于另一個估計量呢?
答案:估計量三個特定的理想性質(zhì):無偏性(缺少偏差)、一致性和有效性。無偏性:估計量的一個理想性質(zhì)就是它的抽樣分布的均值等于,如果這樣,就稱估計量是無偏的。用數(shù)學(xué)表達,假設(shè)表示的某個估計量,如。如果,那么估計量是無偏的。其中,的抽樣分布的均值,否則,是有偏的。一致性:當(dāng)樣本容量很大時,由樣本的隨機變化所引起的值的不確定性很小?;蛘哒f,當(dāng)樣本量增大時,它在真值附近很小區(qū)間內(nèi)的概率接近于1,即是一致的。方差與有效性:假如有兩個備選的估計量,而且它們都是無偏的,那么請問如何在它們之間做出選擇?方差與有效性:選擇抽樣分布最密集的估計量,即,在之間選擇方差最小的那個估計量。如果,的方差比小,那么稱更有效。
設(shè)的估計量,那么:重要概念七:偏差、一致性和有效性的偏差(bias)為;如果,那么的無偏估計量(unbiasedestimator);如果,那么的一致估計量(consistentestimator);如果的另一個估計量,并假設(shè)都是無偏的。如果,那么更有效(efficient)。2.的性質(zhì)問題:單用偏差、一致性和有效性這三個標(biāo)準(zhǔn)進行判斷時,作為的估計量表現(xiàn)如何?偏差和一致性:由于,以及由大數(shù)定律可得,因此,是無偏一致估計量。有效性:需要設(shè)定與相比較的一個或幾個估計量。譬如,,其,并且最佳線性無偏估計(BestlinearUnbiasedEstimator,BLUE)
是的加權(quán)平均計算出來的無偏估計中最有效的估計量,即為BLUE。也就是說,它是所有與呈線性函數(shù)且又是無偏的估計量中最有效(最佳)的估計量。重要概念八:的有效性:是最佳線性無偏估計量假設(shè)的一個估計量,是的加權(quán)平均值,即其中,是非隨機變量。如果是無偏的,那么除非。這樣就是最佳線性無偏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度股東間股權(quán)轉(zhuǎn)讓及回購合同3篇
- 2024版信用保險擔(dān)保人變更協(xié)議書2篇
- 2024年度有聲讀物制作與銷售合作協(xié)議3篇
- 2024年汽車借款及抵押協(xié)議3篇
- 2024版寫字樓院子租賃合同示范文本含物業(yè)管理3篇
- 2024山林林業(yè)扶貧合作合同3篇
- 2024年教育機構(gòu)在線教學(xué)平臺采購及培訓(xùn)服務(wù)合同2篇
- 2024年度商業(yè)項目投資擔(dān)保與風(fēng)險管理服務(wù)合同3篇
- 2024年熱力工程鍋爐安裝合同
- 金屬冶煉安全金屬冶煉安全事故案例與防范考核試卷
- 2024電力安全工器具及小型施工機具預(yù)防性試驗規(guī)程
- 2024年印刷廠管理規(guī)章制度范例(三篇)
- 藥物學(xué)基礎(chǔ)復(fù)習(xí)測試有答案
- ☆問題解決策略:直觀分析 教案 2024-2025學(xué)年北師大版七年級數(shù)學(xué)上冊
- 生物脊椎動物-魚課件 2024-2025學(xué)年人教版生物七年級上冊
- Revision Lesson 2(教案)-2024-2025學(xué)年人教PEP版(2024)英語三年級上冊
- 養(yǎng)老服務(wù)與安全管理作業(yè)指導(dǎo)書
- 福建省公路水運工程試驗檢測費用參考指標(biāo)
- 創(chuàng)新實踐(理論)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 譯林版(2024年新版)七年級上冊英語 Unit 7單元測試卷(含答案)
評論
0/150
提交評論