版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四章:多元回歸分析之推斷§4.1OLS估計量的樣本分布
§4.2單個總體參數(shù)的假設(shè)檢驗:t檢驗
§4.3
置信區(qū)間§4.4參數(shù)線性組合的假設(shè)檢驗§4.5多個線性約束的假設(shè)檢驗§4.6報告回歸結(jié)果第一節(jié)OLS估計量的樣本分布(SamplingDistributionsoftheOLSEstimators)一、樣本分布(SamplingDistribution):復(fù)習(xí)簡單隨機(jī)抽樣(Simplerandomsampling
)是指從總體(population)中隨機(jī)取樣n次,使得總體中的每個元素在樣本(sample)中的出現(xiàn)的可能性相同。如果y1,y2,…,yn
來自于同一分布且相互獨立,則稱這一組隨機(jī)變量獨立同分布(independentlyandidenticallydistributed)(i.i.d.)樣本分布(Samplingdistributions)在統(tǒng)計學(xué)和計量經(jīng)濟(jì)學(xué)發(fā)展中具有核心地位,它是指一個估計量(estimator)在其所有可能取值上的概率分布刻畫樣本分布的兩種方式:“準(zhǔn)確(exact)”
方式和“近似(approximate)”
方式“準(zhǔn)確”方式需要對任何n的取值都得到樣本分布的精確表達(dá)式,這樣的分布被稱為小樣本(有限樣本)的準(zhǔn)確分布例如:如果y服從正態(tài)分布(normallydistributed),且y1,y2,…,yn
獨立同分布,則其均值(average)恰好服從正態(tài)分布“近似”方式對樣本分布進(jìn)行大樣本下的近似,對樣本分布的大樣本近似常稱為漸近分布(asymptoticdistribution)。兩個重要工具:大數(shù)定律(lawoflargenumbers),中心極限定理(centrallimittheorem)只要樣本量足夠大,漸近分布就是對準(zhǔn)確分布的很好的近似。大數(shù)定律:在一般情形下,當(dāng)樣本量(samplesize)充分大時,樣本均值將以很高的概率逼近總體均值。本課中,為了應(yīng)用大數(shù)定律,我們假設(shè)y為獨立同分布(i.i.d)具有有限方差(itsvarianceisfinite)的隨機(jī)取樣。中心極限定理:假設(shè)y1,y2,…,yn
獨立同分布,均值為μ,方差為σy2,其中0<σy2<。則當(dāng)時,的分布可以被標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)近似得任意好。中心極限定理意味著,在一般條件下,如果樣本足夠大,標(biāo)準(zhǔn)化的樣本均值的樣本分布可以由標(biāo)準(zhǔn)正態(tài)分布近似。二、OLS估計量的樣本分布我們已經(jīng)討論了OLS估計量的期望和方差,但是為了進(jìn)行統(tǒng)計推斷(statisticalinference),我們?nèi)韵M罉颖痉植?。OLS估計量的樣本分布依賴于對誤差項分布的假設(shè),下面我們將給出相關(guān)的假設(shè)。假設(shè)MLR.6(正態(tài)性)(Normality)我們已經(jīng)知道當(dāng)高斯——馬爾科夫假設(shè)成立時,OLS是最優(yōu)線性無偏估計(BLUE)。為了進(jìn)行經(jīng)典的假設(shè)檢驗(hypothesistesting),我們要在Gauss-Markov假設(shè)之外增加另一假設(shè)。假設(shè)MLR.6(正態(tài)性):假設(shè)u與x1,x2,…,xk獨立,且u服從均值為0,方差為s2的正態(tài)分布(normallydistribution)。假設(shè)MLR.1~MLR.6被稱為經(jīng)典線性模型假設(shè)(classicallinearmodel
assumptions)簡稱CLM。我們將滿足這六個假設(shè)的模型稱為經(jīng)典線性模型(classicallinearmodel)在經(jīng)典線性模型假設(shè)下,OLS不僅是BLUE,而且是最小方差無偏估計量,即在所有線性(linear)和非線性(nonlinear)的估計量中,OLS估計量均具有最小的方差。MLR.1~MLR.6假定MLR.1(對參數(shù)而言為線性)假定MLR.2(隨機(jī)抽樣性)假定MLR.3(不存在完全共線性)假定MLR.4(零條件均值)假定MLR.5(同方差性假定)Gauss-Markovassumptions對總體(population)的經(jīng)典線性模型假設(shè)做個總結(jié):y|x~Normal(b0+b1x1+…+bkxk,s2)盡管現(xiàn)在我們假設(shè)了正態(tài),但有時候并不是這種情況,如果正態(tài)假設(shè)不成立怎么辦?通過變換,特別是通過取自然對數(shù),往往可以得到接近于正態(tài)的分布。另外,當(dāng)樣本較大時,允許我們放棄正態(tài)假設(shè)(近似方式)..x1x2同方差(homoskedastic)正態(tài)分布——單解釋變量情形E(y|x)=b0+b1xyf(y|x)Normaldistributions定理4.1:正態(tài)樣本分布在CLM假設(shè)下,條件于解釋變量的樣本值,有:因此,有:其中,服從正態(tài)分布,因為它是誤差項的線性組合教材P119可以擴(kuò)展定理4.1:的任意線性組合(linearcombination)服從正態(tài)分布,任意子集服從聯(lián)合正態(tài)分布(jointnormaldistribution)。我們將利用這些事實來進(jìn)行下面的假設(shè)檢驗:第二節(jié)對單個總體參數(shù)的假設(shè)檢驗:t檢驗(HypothesesTestingaboutaSinglePopulationParameter:thet-test
)考慮總體中滿足CLM的模型:我們現(xiàn)在研究如何對一個特定的進(jìn)行假設(shè)檢驗被檢驗的假設(shè)稱為零假設(shè)(nullhypothesis)假設(shè)檢驗利用數(shù)據(jù)將零假設(shè)和另一個假設(shè)也就是替代假設(shè)(alternativehypothesis)進(jìn)行比較替代假設(shè)給出的是在零假設(shè)不成立時的真實情況。我們的目的在于:利用一個隨機(jī)選取的樣本提供給我們的數(shù)據(jù)來決定是否應(yīng)當(dāng)接受零假設(shè)。在假設(shè)檢驗中存在兩種可能的錯誤:第一類錯誤:當(dāng)零假設(shè)為真時拒絕零假設(shè)(去真)第二類錯誤:當(dāng)零假設(shè)為假時未拒絕零假設(shè)(存?zhèn)危┪覀兘⒁恍┘僭O(shè)檢驗的規(guī)則使發(fā)生第一類錯誤的概率非常小一個檢驗的顯著性水平(significancelevel
)是發(fā)生第一類錯誤的概率。通常設(shè)定的顯著性水平為:0.1,0.05,0.01。如果為0.05意味著研究者愿意在5%的檢驗中錯誤地拒絕零假設(shè)。檢驗統(tǒng)計量的臨界值(criticalvalue)是使得零假設(shè)剛好在給定顯著性水平上被拒絕的統(tǒng)計量的值。假設(shè)檢驗中,使得零假設(shè)被拒絕的檢驗統(tǒng)計量的取值范圍稱為拒絕域(rejectionregion),使得零假設(shè)不能被拒絕的檢驗統(tǒng)計量的取值范圍成為接受域(acceptanceregion)。一個檢驗統(tǒng)計量(T)是關(guān)于隨機(jī)樣本的一個函數(shù)。當(dāng)我們用某一特定樣本計算此統(tǒng)計量時,我們得到這個檢驗統(tǒng)計量的一個實現(xiàn)(t)。Ateststatistic(T)issomefunctionoftherandomsample.Whenwecomputethestatisticforaparticularsample,weobtainanoutcomeoftheteststatistic(t).定理4.2:標(biāo)準(zhǔn)化估計量的t分布(tDistributionfortheStandardizedEstimators)在CLM假設(shè)下,有:注意,這是一個t分布,因為我們要用來估計。注意自由度:n-k-1。知道標(biāo)準(zhǔn)化估計量的樣本分布后,便可以進(jìn)行假設(shè)檢驗由零假設(shè)出發(fā),例如,H0:bj=0接受零假設(shè)意味著控制其它解釋變量之后,
xj對y沒有影響。為了進(jìn)行檢驗,我們首先要構(gòu)造的t統(tǒng)計量:然后利用t統(tǒng)計量和拒絕條件來決定是否接受零假設(shè)H0t統(tǒng)計量度量了估計值相對0偏離了多少個估計的標(biāo)準(zhǔn)離差。它的符號與相同。值得注意的是我們檢驗的是關(guān)于總體參數(shù)的假設(shè),而不是關(guān)于來自某一特定樣本的估計值的假設(shè)。t檢驗:單邊替代假設(shè)(tTest:One-SidedAlternatives)除了零假設(shè)外,我們還需要一個替代假設(shè)H1,并設(shè)定相應(yīng)的顯著性水平,其中,H1可以是單邊的或雙邊的:H1:bj
>0和H1:bj<0是單邊的H1:bj
0是雙邊替代假設(shè)如果我們愿意在5%的概率上錯誤地拒絕實際上為真的零假設(shè),則說我們的顯著水平為5%取定顯著性水平a后,找到自由度(degreeoffreedom)為n–k–1的t分布的(1–a)分位數(shù)((1–a)thpercentile)c,即臨界值(criticalvalue)如果H0:bj=0,相應(yīng)的H1:bj>0,當(dāng)時我們拒絕H0,若
,則不能拒絕H0由于t分布是對稱的,如果H0:bj=0,相應(yīng)的H1:bj<0,當(dāng)時我們拒絕H0,若,則不能拒絕H0yi=b0+b1xi1
+…
+bkxik+uiH0:bj=0H1:bj>0c0a(1-a)單邊替代假設(shè)(One-SidedAlternatives)Failtorejectrejectt分布與正態(tài)分布當(dāng)t分布的自由度增大時,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。例子:學(xué)生表現(xiàn)與學(xué)校規(guī)模(meap93.raw)P125問題:較大的班級是否意味著較差的學(xué)生表現(xiàn)? math10:學(xué)生數(shù)學(xué)測驗成績;enroll:學(xué)校規(guī)模totcomp:教師平均年薪;staff:生師比確定被檢驗的假設(shè):H0:βenroll=0,學(xué)校規(guī)模對學(xué)生成績沒有影響H1:βenroll<0,學(xué)校規(guī)模對學(xué)生成績有負(fù)效應(yīng)檢驗結(jié)果:我們所關(guān)注的變量——學(xué)校規(guī)模(enroll)的系數(shù)為負(fù),說明學(xué)校規(guī)模的確對學(xué)生成績存在負(fù)的效應(yīng),規(guī)模越大,學(xué)生的成績就越差。自由度為408-3-1=404,使用標(biāo)準(zhǔn)正態(tài)的臨界值,在5%顯著水平下,臨界值位-1.65,但此處的標(biāo)準(zhǔn)差為t=-0.0002/0.00022=-0.91>-1.65,我們不能拒絕零假設(shè)。如果我們同樣感興趣是否高收入的教師會使學(xué)生表現(xiàn)更好,我們可以檢驗:H0:βtotcomp=0,教師收入高低對學(xué)生成績沒有影響;H1:βtotcomp>0,教師收入越高學(xué)生表現(xiàn)越好計算得到的t統(tǒng)計量為4.6。由于4.6>2.326,故在1%顯著水平下拒絕零假設(shè)。在前面的回歸中,采取了“水平-水平”的模型形式,這使得我們所關(guān)注變量的系數(shù)并不顯著,而且,即便是這一系數(shù)顯著,也很難給出比較合理的解釋,因此我們可以考慮對解釋變量取對數(shù)的形式重新進(jìn)行回歸,這樣log(enroll)的系數(shù)就可以解釋為:學(xué)校里學(xué)生注冊人數(shù)每變化一個百分點會引起學(xué)生成績變化β/100個單位?;貧w結(jié)果如下:
log(enroll)的系數(shù)在10%的顯著性水平下拒絕了零假設(shè),說明在其他條件不變的情況下,學(xué)校里學(xué)生注冊人數(shù)增加一個百分點會引起學(xué)生成績變化減少0.013個百分點(成績的單位就是百分?jǐn)?shù))。雙邊替代假設(shè)
(TheTwo-sidedAlternatives)H1:bj
0為雙邊替代假設(shè)。在此替代假設(shè)下,我們并不規(guī)定xj
對y影響的符號。對于雙邊檢驗,我們根據(jù)a/2計算臨界值。當(dāng)t的絕對值大于臨界值c時,拒絕零假設(shè)。當(dāng)a=0.05時,c是n-k-1自由度的t分布的97.5分位數(shù)。yi=b0+b1Xi1
+…
+bkXik+uiH0:bj=0H1:bj
≠0c0a/2(1-a)-ca/2雙邊替代假設(shè)
(Two-SidedAlternatives)rejectrejectfailtoreject仍以前面的例子的數(shù)據(jù)說明生師比對學(xué)生成績的影響:現(xiàn)在要進(jìn)行檢驗的假設(shè)為:H0:bstaff=0,生師比對學(xué)生表現(xiàn)沒有影響;H1:bstaff≠0,生師比對學(xué)生表現(xiàn)有影響。計算得到的t值為1.2。標(biāo)準(zhǔn)正態(tài)分布的在5%的顯著水平對應(yīng)的臨界值為1.96。由于1.2<1.96,我們不能拒絕零假設(shè)。小結(jié)除非特別指出,我們總認(rèn)為替代假設(shè)是雙邊的如果拒絕了零假設(shè),我們通常說“xj
在a%水平下顯著”(xjisstatisticallysignificantatthea%level)如果不能拒絕零假設(shè),我們通常說“xj
在a%水平下不顯著”(xjisstatisticallyinsignificantatthea%level)其他假設(shè)檢驗
(Testingotherhypotheses)如果我們想對形如H0:bj=aj
的假設(shè)進(jìn)行檢驗,需要更一般的t統(tǒng)計量,此時,恰當(dāng)?shù)膖統(tǒng)計量是:當(dāng)進(jìn)行標(biāo)準(zhǔn)檢驗時,例子:校園犯罪與錄取(campus.raw)P129問題:錄取量提高1%是否會導(dǎo)致校園犯罪增加超過1%?假設(shè)犯罪總數(shù)由下式?jīng)Q定:我們將上面關(guān)系時進(jìn)行變換,可以估計:log(crime)=b0+b1
log(enroll)+u待檢驗的假設(shè)為:H0:b1=1,H1:b1>1.回歸結(jié)果如下:t值=(1.27-1)/0.11=2.45。自由度為95的t分布,1%顯著水平下單邊檢驗的臨界值為2.37<2.45,拒絕零假設(shè)。計算t檢驗的p值
(Computingp-valuesfortTests)表述零假設(shè)和替代假設(shè)(Statethenullandthealternativehypothesis)決定顯著水平,找到臨界值(Decideasignificancelevelandfindtherelatedcriticalvalue)根據(jù)樣本數(shù)據(jù)計算
t統(tǒng)計量(Calculatethetstatisticbasedonthesampledata)比較
t
值與臨界值,決定是否拒絕零假設(shè)(Comparethetstatisticwiththecriticalvaluetodecidewhethertorejectthenull)。經(jīng)典假設(shè)檢驗的步驟:假設(shè)自由度為40,算得
t
值為2.423,對應(yīng)5%和1%的臨界值分別為2.021和2.704。我們是否應(yīng)當(dāng)拒絕零假設(shè)?提前確定顯著水平可能會隱藏關(guān)于假設(shè)檢驗的一些有用信息。另一種想法:如果將算得的t
統(tǒng)計量作為臨界值,那么使得零假設(shè)被拒絕的最小顯著水平是多少?這個水平稱為p值。對于雙邊檢驗,有:p-value=P(|T|>|t|).C0.025C0.025C0.005C0.005C0.01C0.01pα/2pα/2在上面的例子中,下列不等式必然成立:1%<p<5%.p-value=P(|T|>2.423)=2P(T>2.423)=0.02.一些關(guān)于p值的信息
(Usefulinformationaboutp-values)由于這是一個概率,其取值范圍在0,1之間小p值提供了拒絕零假設(shè)的證據(jù),大p值不能提供證據(jù)拒絕零假設(shè)。經(jīng)濟(jì)重要性與統(tǒng)計顯著性
(EconomicSignificanceversusstatisticalsignificance)統(tǒng)計顯著性完全由t
統(tǒng)計量的大小決定經(jīng)濟(jì)上的重要性強(qiáng)調(diào)估計系數(shù)的大小權(quán)衡兩者來判斷解釋變量對被解釋變量的邊際影響第三節(jié)置信區(qū)間(
ConfidenceIntervals)由于隨機(jī)取樣誤差(randomsamplingerror)的存在,我們不可能通過樣本知道b
的準(zhǔn)確值。但是利用來自隨機(jī)樣本的數(shù)據(jù)構(gòu)造一個取值的集合,使得真值在給定概率下屬于這個集合是可能的。這樣的集合稱為置信集(confidenceset),預(yù)先設(shè)定的真值屬于此集合的概率稱為置信水平(confidencelevel置信度),置信集是下限和上限之間所有可能的取值,故置信集為一個區(qū)間,稱為置信區(qū)間(confidenceinterval)。b的置信區(qū)間
(ConfidenceIntervalsforb)通過對上述分析進(jìn)行擴(kuò)展,我們可以利用雙邊檢驗的臨界值來構(gòu)造b的置信區(qū)間。如果服從n-k-1自由度的t
分布,簡單的運算可以得到關(guān)于未知的bj
的置信區(qū)間如果自由度為25,那么對任意bj
,95%的置信區(qū)間為當(dāng)n-k-1>120,t(n-k-1)分布與正態(tài)分布充分接近,可以用標(biāo)準(zhǔn)正態(tài)分布的97.5分位數(shù)來構(gòu)造95%置信區(qū)間構(gòu)造了置信區(qū)間之后,可以進(jìn)行雙尾假設(shè)檢驗零假設(shè)為H0:bj=aj,當(dāng)且僅當(dāng)aj不在95%的置信區(qū)間內(nèi)時,零假設(shè)相對于H1:bj≠aj在5%的顯著水平上被拒絕。例子:研發(fā)支出模型(RD-CHEM.RAW)P137銷售額對數(shù)的系數(shù)為1.084,這意味著保持利潤率不變,銷售額提高1%將伴隨著研發(fā)支出提高1.084%。值得注意的是,自由度為29,在5%的顯著性水平上,t29的97.5%分位數(shù)為2.045,因此,可以算出銷售額對數(shù)的系數(shù)的95%置信區(qū)間為[1.804-2.045*0.060,1.804+2.045*0.060]=[0.961,1.207],顯然,0不在這個置信區(qū)間內(nèi),因此該系數(shù)為零的假設(shè)相對于不為零的假設(shè)在5%的顯著性水平上被拒絕。
(TestingaLinearCombination)在一些情況下,我們需要檢驗一個參數(shù)是否等于另一個參數(shù),而不是檢驗b1是否等于一個常數(shù)。在這種情況下,零假設(shè)為H0:b1=b2應(yīng)用與構(gòu)造t統(tǒng)計量相同的程序:第四節(jié)檢驗關(guān)于參數(shù)線性組合的假設(shè)需要s12帶入上式計算,標(biāo)準(zhǔn)的程序并不報告此值。許多軟件有計算此值的選項,或是可以直接進(jìn)行檢驗,例如在stata中,可以在回歸之后,通過命令testx1=x2得到檢驗的p值例子:大專和本科教育對收入的影響是否相同(twoyear.raw)P139jc:就讀大專的年數(shù);univ:就讀本科的年數(shù)需要進(jìn)行檢驗的假設(shè)為:H0:b1=b2,其他條件不變的情況下,多接受一年大專和多接受一年本科教育對收入的影響相同;
H1:b1<b2,其他條件不變的情況下,多接受一年大專和多接受一年本科教育對收入的影響不相同.要估計的模型為:估計的結(jié)果為:jc和univ的系數(shù)都顯著為正,說明二者都對收入有正向影響,但二者的系數(shù)差異并不大,為了驗證二者的系數(shù)是否相等,即b1是否等于b2,可以構(gòu)造一個新的參數(shù)θ=b1-b2,從而檢驗θ
是否為零。θ=b1-b2,
b1=θ
+b2,因此回歸方程就可以整理為:其中:對模型進(jìn)行改寫之后,估計的結(jié)果為:Jc的系數(shù)θ估計值為-0.0102,t統(tǒng)計量為-1.47,p值為0.142,但因為是單邊假設(shè),因此,p值為0.071,只在10%的水平上顯著,因此我們可以拒絕θ=0的假設(shè),即認(rèn)為??坪捅究平逃龑べY收入的影響不相同,但這以結(jié)果并不特別顯著。如果我們在stata中直接檢驗b1=b2成立與否,結(jié)果不顯著,如右:第五節(jié)對多個線性約束的檢驗:F檢驗(TestingMultipleLinearRestrictions:TheFTest)多線性約束(MultipleLinearRestrictions)目前為止,我們討論了對單個線性約束的假設(shè)檢驗(例如,b1=0或b1=b2),然而,我們也想對我們的參數(shù)作多個檢驗一個典型的例子是檢驗“排除約束”(exclusionrestrictions)——我們想知道是不是一組參數(shù)都等于0檢驗排除約束(TestingExclusionRestrictions)此時,零假設(shè)形如H0:bk-q+1=0,...,bk=0,替代假設(shè)H1:H
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西紅柿熟了課件
- 蘇教版江蘇省徐州市2023-2024學(xué)年下學(xué)期高二年級第三次檢測數(shù)學(xué)試題
- 六年級數(shù)學(xué)上冊《高頻錯題訓(xùn)練》
- 西京學(xué)院《土木工程施工》2021-2022學(xué)年第一學(xué)期期末試卷
- 2024秋期國家開放大學(xué)本科《古代小說戲曲專題》一平臺在線形考(形考任務(wù)4)試題及答案
- 2025屆江西省高三語文試題及答案
- 西京學(xué)院《大數(shù)據(jù)存儲與管理技術(shù)》2022-2023學(xué)年期末試卷
- 西華師范大學(xué)《中國宗教史》2022-2023學(xué)年第一學(xué)期期末試卷
- 圖文《黃昏》課件
- 西華師范大學(xué)《外國歷史要籍研讀》2021-2022學(xué)年第一學(xué)期期末試卷
- 物資編碼體系建設(shè)實施方案
- 市政道路施工簡要流程
- 多頭小直徑水泥土深層攪拌樁防滲墻施工方案1
- 淺析現(xiàn)代漢語中的新詞語現(xiàn)象
- 公司員工工牌規(guī)范和人員進(jìn)出管理規(guī)定
- 英語口語看圖說話訓(xùn)練60667
- 生活飲用水衛(wèi)生監(jiān)督
- 設(shè)備FAT驗收通用細(xì)則
- 小學(xué)六年級語文質(zhì)量分析(課堂PPT)
- 底欄柵壩水力學(xué)計算
- (完整版)機(jī)加工作業(yè)指導(dǎo)書
評論
0/150
提交評論