第五講 統(tǒng)計檢驗及預測_第1頁
第五講 統(tǒng)計檢驗及預測_第2頁
第五講 統(tǒng)計檢驗及預測_第3頁
第五講 統(tǒng)計檢驗及預測_第4頁
第五講 統(tǒng)計檢驗及預測_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

回顧5、參數(shù)估計的最大似然法和矩法4、參數(shù)估計量的概率分布及隨機干擾項方差的估計思考:在5%的顯著性水平下,若通過樣本得到了置信區(qū)間一個,如何解釋?答:給定置信系數(shù)95%,從長遠看,在類似于的固定區(qū)間含有真實值的概率不是1就是0。區(qū)間中,將有95個包含著真實的每100個的值;但這個特殊2.4一元線性回歸模型的統(tǒng)計檢驗

2.5一元線性回歸分析的應用:預測問題一、參數(shù)的區(qū)間估計二、擬合優(yōu)度檢驗

三、變量的顯著性檢驗

一、擬合優(yōu)度檢驗二、變量的顯著性檢驗三、條件均值與個別值的預測

一、擬合優(yōu)度檢驗

擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。

回答樣本回歸直線對樣本觀測點擬合的多么好的度量

度量擬合優(yōu)度的指標:判定系數(shù)(可決系數(shù))R21、總離差平方和的分解

已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線

Y的第i個觀測值可表述為如果Yi=?i即實際觀測值落在樣本回歸“線”上,則擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。

對于所有樣本點,則需考慮這些點與樣本均值離差的平方和(兩邊取平方后求和),可以證明(P34頁結(jié)論):記總離差平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares

)TSS=ESS+RSS

Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此

擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS2、可決系數(shù)R2統(tǒng)計量

稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。

可決系數(shù)的取值范圍:[0,1]。R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。在例2.1.1的收入-消費支出例中,

注:可決系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應進行檢驗,這將在第3章中進行。

擬合優(yōu)度0.9935說明X的變化可以解釋Y的99.35%的變化。關(guān)于可決系數(shù)的說明可決系數(shù)只是說明列入模型的所有解釋變量對被解釋變量的聯(lián)合的影響程度,不說明模型中各解釋變量的單獨的影響程度(在多元中)回歸分析的主要目的如果是經(jīng)濟結(jié)構(gòu)分析,不能只追求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計量。可決系數(shù)高并不一定每個系數(shù)都可信任。如果建模的目的只是為了預測被解釋變量的值,不是為了正確估計回歸系數(shù),一般可考慮有較高的可決系數(shù)。

二、變量的顯著性檢驗

從擬合優(yōu)度中看出,擬合優(yōu)度越高,就說明樣本回歸線對觀測值的擬合就越好,但這只是推測,解釋變量對被解釋變量是否有顯著的線性影響需要我們?nèi)パ芯?,這就是變量的顯著性檢驗。

回歸分析中,主要是針對變量前的參數(shù)真值是否為零來檢驗。

1、假設檢驗

先根據(jù)實際問題的要求提出一個論斷,稱為原假設,然后根據(jù)樣本信息,看能得到什么結(jié)果,如果導致一個不合理的結(jié)果,拒絕原假設。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的。注意這里的“接受和拒絕”

2、變量的顯著性檢驗

如果變量X是顯著的,那么參數(shù)應該顯著的不為0

檢驗步驟:

(1)對總體參數(shù)提出假設H0:1=0,H1:10(2)以原假設H0構(gòu)造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若給定顯著性水平,則雙側(cè)檢驗的臨界值為0t若|t|>t/2(n-2),則拒絕H0,接受H1;(小概率事件發(fā)生)若|t|

t/2(n-2),則接受H0;

對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗:

在上述收入-消費支出例中,首先計算2的估計值

t統(tǒng)計量的計算結(jié)果分別為:

給定顯著性水平=0.05,查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變量;

|t0|>2.306,表明在95%的置信度下,拒絕截距項為零的假設。

92.34019.0670.0?1?11===bbSt20.345.4440.142?0?00-=-==bbSt一個“大”的是與虛擬假設相抵觸的跡象。觀察t分布表,當自由度為20或更大時,計算的t值如果是2.5或3或更大,則我們就不需要再查閱t分布表以評定所估的參數(shù)的顯著性,它必定是要拒絕原假設,即該變量通過了顯著性檢驗。當自由度小于20時,我們要查閱t分布表。注意1:注意2:顯著性水平—犯第一類錯誤的概率——拒絕了真值的假設的概率經(jīng)典假設檢驗方法的痛處—選擇的武斷用精確的顯著性水平P值判斷參數(shù)的顯著性P值是根據(jù)既定的樣本數(shù)據(jù)所計算的統(tǒng)計量與相應自由度下查到的臨界值比較,得到的臨界值和計算的統(tǒng)計量一樣大或者更大的概率——拒絕原假設的最小顯著性水平規(guī)則:時,值越小,越能拒絕原假設。如果數(shù)據(jù)不支持原假設,則在原假設下得到的值將會很“大”,得到這樣一個的值的p值就很“小”。固定在一定的水平上將再回到區(qū)間估計給定顯著性水平整理可以得到的置信度下的置信區(qū)間是通過變量的顯著性檢驗,我們知道

由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。

要縮小置信區(qū)間,需

(1)增大樣本容量n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越小

(2)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標準差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應越小。回歸分析結(jié)果的報告經(jīng)過模型的估計、檢驗,得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范的表述這些數(shù)據(jù),計量經(jīng)濟學通常采用以下規(guī)范化的方式:標準誤差SE估計的t統(tǒng)計量可決系數(shù)和自由度F統(tǒng)計量DW統(tǒng)計量估計的樣本回歸函數(shù)計量經(jīng)濟預測是一種條件預測:模型設定的關(guān)系式不變所估計的參數(shù)不變解釋變量在預測期的取值已作出預測對被解釋變量的預測分為:平均值和個別值預測對被解釋變量的預測又分為點預測和區(qū)間預測預測的類型2.5一元線性回歸分析的應用:預測問題預測值、平均值、個別值的關(guān)系PRFSRF點預測值真實平均值個別值是真實平均值預測值的點估計,也是個別值預測值的點估計??傮w條件均值的區(qū)間估計必須找出與和都有關(guān)的統(tǒng)計量由于存在抽樣波動,預測的值不一定等于真實總體條件均值。基本思想:具體做法:從的分布分析)))(1(,(~?2202F10F?-++ixXXnXNYsbb于是,在1-的置信度下,總體均值的置信區(qū)間為

個別預測值的置信區(qū)間基本思想:是真實平均值的點估計,也是個別值的點估計。由于存在隨機擾動項的影響,Y的條件均值并不等于Y的個別值。為了對Y的個別值做區(qū)間預測,需要尋找與預測值和個別值有關(guān)的統(tǒng)計量,并要明確其概率分布。于是

具體做法:已知殘差項是與預測值和個別值都有關(guān)的變量,并且已知服從正態(tài)分布式中:從而在1-的置信度下,個別值Y0的置信區(qū)間為

被解釋變量點估計與區(qū)間估計的特點Y的總體條件均值的預測值與真實的總體條件均值有誤差,主要是受抽樣波動影響。

Y個別值的預測值與真實個別值的差異,不僅受抽樣波動影響,而且還受隨機擾動項的影響。總體條件均值和個別值的預測區(qū)間都不是常數(shù),是隨XF的變化而變化。預測區(qū)間上下限與樣本容量有關(guān),樣本容量n越大,預測精度越高,反之預測精度越低;當樣本容量n趨近于無窮時,個別值的預測誤差只決定于隨機擾動項的方差。若對于前面的例子,我們得到了總體均值的95%的置信區(qū)間為

給定在重復抽樣中,每100個類似于(533.05,814.62)的區(qū)間將有95個包含著真實的均值。如何解釋?如果我們對每一個X值求類似于(533.05,814.62)的95%的置信區(qū)間,把這些區(qū)間的端點連接起來,我們就得到如圖所展示的一個關(guān)于總體回歸函數(shù)的置信帶。如果我們對每一個X值求類似于(372.03,975.6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論