




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多元線性回歸模型擬合優(yōu)度假設(shè)檢驗(yàn)第一頁(yè),共三十頁(yè),2022年,8月28日一、擬合優(yōu)度檢驗(yàn)
1、可決系數(shù)與調(diào)整的可決系數(shù)則總離差平方和的分解第二頁(yè),共三十頁(yè),2022年,8月28日由于
=0所以有:
注意:一個(gè)有趣的現(xiàn)象-第三頁(yè),共三十頁(yè),2022年,8月28日
我們有:殘差殘差平方和:
為方便計(jì)算,我們也可以用矩陣形式表示R2而將上述結(jié)果代入R2的公式,得到:這就是決定系數(shù)R2的矩陣形式。第四頁(yè),共三十頁(yè),2022年,8月28日
判定系數(shù)該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。
問(wèn)題:在應(yīng)用過(guò)程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大(Why?)這就給人一個(gè)錯(cuò)覺(jué):要使得模型擬合得好,只要增加解釋變量即可?!?,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無(wú)關(guān),R2需調(diào)整。第五頁(yè),共三十頁(yè),2022年,8月28日
調(diào)整的判定系數(shù)(adjustedcoefficientofdetermination)
在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。第六頁(yè),共三十頁(yè),2022年,8月28日我們有:(1)(2)僅當(dāng)K=0時(shí),等號(hào)成立。即(3)當(dāng)K增大時(shí),二者的差異也隨之增大(4)可能出現(xiàn)負(fù)值。是經(jīng)過(guò)自由度調(diào)整的決定系數(shù),稱為修正決定系數(shù)。第七頁(yè),共三十頁(yè),2022年,8月28日例1
以前面的數(shù)據(jù)為例,Yt=1+2X2t+3X3t+u
t
設(shè)觀測(cè)數(shù)據(jù)為:Y:31835
X2:31524
X3:54646
試求。第八頁(yè),共三十頁(yè),2022年,8月28日解:我們有第九頁(yè),共三十頁(yè),2022年,8月28日第十頁(yè),共三十頁(yè),2022年,8月28日習(xí)題.
設(shè)n=20,k=3,R2=0.70,求。當(dāng)n=10,n=5時(shí),又是多少。
第十一頁(yè),共三十頁(yè),2022年,8月28日
例2.
設(shè)n=20,k=3,R2=0.70,求。解:
下面改變n的值,看一看的值如何變化。我們有若n=10,則=0.55若n=5,則=-0.20
由本例可看出,有可能為負(fù)值。這與R2不同()。第十二頁(yè),共三十頁(yè),2022年,8月28日二、方程的顯著性檢驗(yàn)(F檢驗(yàn))
方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。
1、方程顯著性的F檢驗(yàn)
即檢驗(yàn)?zāi)P蚘i=0+1X1i+2X2i++kXki+ii=1,2,,n中的參數(shù)j是否顯著不為0。
可提出如下原假設(shè)與備擇假設(shè):H0:0=1=2==k=0H1:j不全為0第十三頁(yè),共三十頁(yè),2022年,8月28日F檢驗(yàn)的思想來(lái)自于總離差平方和的分解式:
TSS=ESS+RSS
如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。
因此,可通過(guò)該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。第十四頁(yè),共三十頁(yè),2022年,8月28日
根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量
服從自由度為(k,n-k-1)的F分布
給定顯著性水平,可得到臨界值F(k,n-k-1),由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過(guò)F
F(k,n-k-1)或FF(k,n-k-1)來(lái)拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。第十五頁(yè),共三十頁(yè),2022年,8月28日對(duì)于中國(guó)居民人均消費(fèi)支出的例子:一元模型:F=985.6616(P54)二元模型:F=560.5650(P72)給定顯著性水平=0.05,查分布表,得到臨界值:一元例:F(1,30)=4.17二元例:
F(2,28)=3.34顯然有F
F(k,n-k-1)
即二個(gè)模型的線性關(guān)系在95%的水平下顯著成立。第十六頁(yè),共三十頁(yè),2022年,8月28日
2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論
由可推出:與或R2R2R2R2第十七頁(yè),共三十頁(yè),2022年,8月28日在中國(guó)居民人均收入-消費(fèi)一元模型中,在中國(guó)居民人均收入-消費(fèi)二元模型中,第十八頁(yè),共三十頁(yè),2022年,8月28日三、變量的顯著性檢驗(yàn)(t檢驗(yàn))方程的總體線性關(guān)系顯著每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的
因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的t檢驗(yàn)完成的。第十九頁(yè),共三十頁(yè),2022年,8月28日1、t統(tǒng)計(jì)量
由于以cii表示矩陣(X’X)-1
主對(duì)角線上的第i個(gè)元素,于是參數(shù)估計(jì)量的方差為:
其中2為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替:
第二十頁(yè),共三十頁(yè),2022年,8月28日因此,可構(gòu)造如下t統(tǒng)計(jì)量
第二十一頁(yè),共三十頁(yè),2022年,8月28日
2、t檢驗(yàn)設(shè)計(jì)原假設(shè)與備擇假設(shè):
H1:i0
給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過(guò)|t|
t/2(n-k-1)或|t|t/2(n-k-1)來(lái)拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。
H0:i=0
(i=1,2…k)
第二十二頁(yè),共三十頁(yè),2022年,8月28日例:柯布-道格拉斯生產(chǎn)函數(shù)
用柯布和道格拉斯最初使用的數(shù)據(jù)(美國(guó)1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過(guò)線性變換的模型得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):請(qǐng)檢驗(yàn)“斜率”系數(shù)和的顯著性。第二十三頁(yè),共三十頁(yè),2022年,8月28日解:(1)檢驗(yàn)的顯著性
原假設(shè)H0:
=0
備擇假設(shè)H1:
≠0由回歸結(jié)果,我們有:t=0.23/0.06=3.83用=24-3=21查t表,5%顯著性水平下,tc
=2.08.∵t=3.83tc
=2.08,故拒絕原假設(shè)H0。結(jié)論:顯著異于0。(2)檢驗(yàn)的顯著性原假設(shè)H0:
=0
備擇假設(shè)H1:
≠0由回歸結(jié)果,我們有:t=0.81/0.15=5.4∵t=5.4tc=2.08,故拒絕原假設(shè)H0
。結(jié)論:顯著異于0。第二十四頁(yè),共三十頁(yè),2022年,8月28日注意:一元線性回歸中,t檢驗(yàn)與F檢驗(yàn)一致
一方面,t檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0:1=0進(jìn)行檢驗(yàn);
另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系:
第二十五頁(yè),共三十頁(yè),2022年,8月28日在中國(guó)居民人均收入-消費(fèi)支出二元模型例中,由應(yīng)用軟件計(jì)算出參數(shù)的t值:給定顯著性水平=0.05,查得相應(yīng)臨界值:t0.025(28)=2.048??梢?jiàn),計(jì)算的所有t值都大于該臨界值,所以拒絕原假設(shè)。即:2個(gè)解釋變量都在95%的水平下顯著,都通過(guò)了變量顯著性檢驗(yàn)。第二十六頁(yè),共三十頁(yè),2022年,8月28日四、參數(shù)的置信區(qū)間
參數(shù)的置信區(qū)間用來(lái)考察:在一次抽樣中所估計(jì)的參數(shù)值離參數(shù)的真實(shí)值有多“近”。在變量的顯著性檢驗(yàn)中已經(jīng)知道:容易推出:在(1-)的置信水平下i的置信區(qū)間是
其中,t/2為顯著性水平為、自由度為n-k-1的臨界值。
第二十七頁(yè),共三十頁(yè),2022年,8月28日已知在二元模型例中,樣本容量為22,給定=0.05,計(jì)算得參數(shù)的置信區(qū)間:
且從回歸計(jì)算中已得到:第二十八頁(yè),共三十頁(yè),2022年,8月28日給定=0.05,查表得臨界值:t0.025(19)=2.093計(jì)算得參數(shù)的置信區(qū)間:
0:(44.284,197.116)
1:(0.0937,0.3489)
2:(0.0951,0.8080)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省莆田市某校2024-2025學(xué)年高二上學(xué)期期末考試政治試題(原卷版+解析版)
- 2025年湖北省中考思想品德與法治模擬試卷(附答案)
- 2025年黨章黨紀(jì)黨史黨建知識(shí)競(jìng)賽多項(xiàng)選擇題庫(kù)及答案(共190道題)
- 中學(xué)精神文明建設(shè)工作計(jì)劃
- 宮腔鏡下輸卵管插管通液治療不孕不育效果探討
- 節(jié)日教職工福利(花生油)項(xiàng)目 投標(biāo)方案(技術(shù)方案)
- 鄉(xiāng)村農(nóng)田管理與開發(fā)協(xié)議
- 音樂(lè)制作與發(fā)行全流程指南
- 船舶導(dǎo)航與航行技術(shù)指南
- 環(huán)保設(shè)備可行性研究報(bào)告
- 2025年機(jī)電實(shí)務(wù)考試題型及答案
- 2025年安徽商貿(mào)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及完整答案一套
- 2025年安徽商貿(mào)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)a4版
- 2025年安徽財(cái)貿(mào)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)標(biāo)準(zhǔn)卷
- 2025年2月時(shí)事政治100題及參考答案
- 2025中小學(xué)植樹節(jié)主題班會(huì)
- 瘋狂動(dòng)物城賞析課件
- 2025浙江慈溪市水務(wù)集團(tuán)限公司招聘國(guó)企業(yè)人員19人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 校車司機(jī)和跟車?yán)蠋熍嘤?xùn)
- 鐵道概論知到智慧樹章節(jié)測(cè)試課后答案2024年秋石家莊鐵道大學(xué)
- 北師大版(2024新版)七年級(jí)上冊(cè)數(shù)學(xué)第五章《一元一次方程》單元測(cè)試卷3(含答案解析)
評(píng)論
0/150
提交評(píng)論