多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)_第1頁(yè)
多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)_第2頁(yè)
多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)_第3頁(yè)
多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)_第4頁(yè)
多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)第一頁(yè),共三十頁(yè),2022年,8月28日一、擬合優(yōu)度檢驗(yàn)

1、可決系數(shù)與調(diào)整的可決系數(shù)則總離差平方和的分解第二頁(yè),共三十頁(yè),2022年,8月28日由于

=0所以有:

注意:一個(gè)有趣的現(xiàn)象-第三頁(yè),共三十頁(yè),2022年,8月28日

我們有:殘差殘差平方和:

為方便計(jì)算,我們也可以用矩陣形式表示R2而將上述結(jié)果代入R2的公式,得到:這就是決定系數(shù)R2的矩陣形式。第四頁(yè),共三十頁(yè),2022年,8月28日

判定系數(shù)該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。

問(wèn)題:在應(yīng)用過(guò)程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大(Why?)這就給人一個(gè)錯(cuò)覺(jué):要使得模型擬合得好,只要增加解釋變量即可?!?,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無(wú)關(guān),R2需調(diào)整。第五頁(yè),共三十頁(yè),2022年,8月28日

調(diào)整的判定系數(shù)(adjustedcoefficientofdetermination)

在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。第六頁(yè),共三十頁(yè),2022年,8月28日我們有:(1)(2)僅當(dāng)K=0時(shí),等號(hào)成立。即(3)當(dāng)K增大時(shí),二者的差異也隨之增大(4)可能出現(xiàn)負(fù)值。是經(jīng)過(guò)自由度調(diào)整的決定系數(shù),稱為修正決定系數(shù)。第七頁(yè),共三十頁(yè),2022年,8月28日例1

以前面的數(shù)據(jù)為例,Yt=1+2X2t+3X3t+u

t

設(shè)觀測(cè)數(shù)據(jù)為:Y:31835

X2:31524

X3:54646

試求。第八頁(yè),共三十頁(yè),2022年,8月28日解:我們有第九頁(yè),共三十頁(yè),2022年,8月28日第十頁(yè),共三十頁(yè),2022年,8月28日習(xí)題.

設(shè)n=20,k=3,R2=0.70,求。當(dāng)n=10,n=5時(shí),又是多少。

第十一頁(yè),共三十頁(yè),2022年,8月28日

例2.

設(shè)n=20,k=3,R2=0.70,求。解:

下面改變n的值,看一看的值如何變化。我們有若n=10,則=0.55若n=5,則=-0.20

由本例可看出,有可能為負(fù)值。這與R2不同()。第十二頁(yè),共三十頁(yè),2022年,8月28日二、方程的顯著性檢驗(yàn)(F檢驗(yàn))

方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。

1、方程顯著性的F檢驗(yàn)

即檢驗(yàn)?zāi)P蚘i=0+1X1i+2X2i++kXki+ii=1,2,,n中的參數(shù)j是否顯著不為0。

可提出如下原假設(shè)與備擇假設(shè):H0:0=1=2==k=0H1:j不全為0第十三頁(yè),共三十頁(yè),2022年,8月28日F檢驗(yàn)的思想來(lái)自于總離差平方和的分解式:

TSS=ESS+RSS

如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。

因此,可通過(guò)該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。第十四頁(yè),共三十頁(yè),2022年,8月28日

根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量

服從自由度為(k,n-k-1)的F分布

給定顯著性水平,可得到臨界值F(k,n-k-1),由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過(guò)F

F(k,n-k-1)或FF(k,n-k-1)來(lái)拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。第十五頁(yè),共三十頁(yè),2022年,8月28日對(duì)于中國(guó)居民人均消費(fèi)支出的例子:一元模型:F=985.6616(P54)二元模型:F=560.5650(P72)給定顯著性水平=0.05,查分布表,得到臨界值:一元例:F(1,30)=4.17二元例:

F(2,28)=3.34顯然有F

F(k,n-k-1)

即二個(gè)模型的線性關(guān)系在95%的水平下顯著成立。第十六頁(yè),共三十頁(yè),2022年,8月28日

2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論

由可推出:與或R2R2R2R2第十七頁(yè),共三十頁(yè),2022年,8月28日在中國(guó)居民人均收入-消費(fèi)一元模型中,在中國(guó)居民人均收入-消費(fèi)二元模型中,第十八頁(yè),共三十頁(yè),2022年,8月28日三、變量的顯著性檢驗(yàn)(t檢驗(yàn))方程的總體線性關(guān)系顯著每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的

因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的t檢驗(yàn)完成的。第十九頁(yè),共三十頁(yè),2022年,8月28日1、t統(tǒng)計(jì)量

由于以cii表示矩陣(X’X)-1

主對(duì)角線上的第i個(gè)元素,于是參數(shù)估計(jì)量的方差為:

其中2為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替:

第二十頁(yè),共三十頁(yè),2022年,8月28日因此,可構(gòu)造如下t統(tǒng)計(jì)量

第二十一頁(yè),共三十頁(yè),2022年,8月28日

2、t檢驗(yàn)設(shè)計(jì)原假設(shè)與備擇假設(shè):

H1:i0

給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過(guò)|t|

t/2(n-k-1)或|t|t/2(n-k-1)來(lái)拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。

H0:i=0

(i=1,2…k)

第二十二頁(yè),共三十頁(yè),2022年,8月28日例:柯布-道格拉斯生產(chǎn)函數(shù)

用柯布和道格拉斯最初使用的數(shù)據(jù)(美國(guó)1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過(guò)線性變換的模型得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):請(qǐng)檢驗(yàn)“斜率”系數(shù)和的顯著性。第二十三頁(yè),共三十頁(yè),2022年,8月28日解:(1)檢驗(yàn)的顯著性

原假設(shè)H0:

=0

備擇假設(shè)H1:

≠0由回歸結(jié)果,我們有:t=0.23/0.06=3.83用=24-3=21查t表,5%顯著性水平下,tc

=2.08.∵t=3.83tc

=2.08,故拒絕原假設(shè)H0。結(jié)論:顯著異于0。(2)檢驗(yàn)的顯著性原假設(shè)H0:

=0

備擇假設(shè)H1:

≠0由回歸結(jié)果,我們有:t=0.81/0.15=5.4∵t=5.4tc=2.08,故拒絕原假設(shè)H0

。結(jié)論:顯著異于0。第二十四頁(yè),共三十頁(yè),2022年,8月28日注意:一元線性回歸中,t檢驗(yàn)與F檢驗(yàn)一致

一方面,t檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0:1=0進(jìn)行檢驗(yàn);

另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系:

第二十五頁(yè),共三十頁(yè),2022年,8月28日在中國(guó)居民人均收入-消費(fèi)支出二元模型例中,由應(yīng)用軟件計(jì)算出參數(shù)的t值:給定顯著性水平=0.05,查得相應(yīng)臨界值:t0.025(28)=2.048??梢?jiàn),計(jì)算的所有t值都大于該臨界值,所以拒絕原假設(shè)。即:2個(gè)解釋變量都在95%的水平下顯著,都通過(guò)了變量顯著性檢驗(yàn)。第二十六頁(yè),共三十頁(yè),2022年,8月28日四、參數(shù)的置信區(qū)間

參數(shù)的置信區(qū)間用來(lái)考察:在一次抽樣中所估計(jì)的參數(shù)值離參數(shù)的真實(shí)值有多“近”。在變量的顯著性檢驗(yàn)中已經(jīng)知道:容易推出:在(1-)的置信水平下i的置信區(qū)間是

其中,t/2為顯著性水平為、自由度為n-k-1的臨界值。

第二十七頁(yè),共三十頁(yè),2022年,8月28日已知在二元模型例中,樣本容量為22,給定=0.05,計(jì)算得參數(shù)的置信區(qū)間:

且從回歸計(jì)算中已得到:第二十八頁(yè),共三十頁(yè),2022年,8月28日給定=0.05,查表得臨界值:t0.025(19)=2.093計(jì)算得參數(shù)的置信區(qū)間:

0:(44.284,197.116)

1:(0.0937,0.3489)

2:(0.0951,0.8080)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論