版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2.3 2.3 一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度檢驗(yàn)一、擬合優(yōu)度檢驗(yàn) 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 四、方程的顯著性檢驗(yàn)四、方程的顯著性檢驗(yàn)說說 明明 回歸分析回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。體回歸線。 盡管從盡管從統(tǒng)計(jì)性質(zhì)統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在
2、一次抽樣中,估計(jì)值不總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計(jì)值與真值那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行進(jìn)行統(tǒng)計(jì)檢驗(yàn)統(tǒng)計(jì)檢驗(yàn)。 主要包括主要包括擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)、變量的、變量的顯著性檢驗(yàn)顯著性檢驗(yàn)及參數(shù)的及參數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)。 一、擬合優(yōu)度檢驗(yàn)一、擬合優(yōu)度檢驗(yàn) 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)對樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。 度量擬合優(yōu)度的指標(biāo):判定系數(shù)判定系數(shù)(可決系數(shù)可決系數(shù))R2 2 問題問題:采用普通最小二乘估計(jì)方法,已
3、經(jīng)保證了模型最好地?cái)M合了樣本觀測值,為什么還要檢驗(yàn)擬合程度? 1 1、總離差平方和的分解、總離差平方和的分解 已知由一組樣本觀測值(Xi,Yi),i=1,2,n得到如下樣本回歸直線 iiXY10iiiiiiiyeYYYYYYy)()( 如果Yi=i 即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好擬合最好。 可認(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。 對于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:TSS=ESS+RSS22)(YYyTSSii記22)(YYyESSii22)(iiiYYeRSS總體平方和總體平方和(Total Sum of Squares)回歸平方和回歸平
4、方和(Explained Sum of Squares)殘差平方和殘差平方和(Residual Sum of Squares ) Y的觀測值圍繞其均值的總離差的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回歸可分解為兩部分:一部分來自回歸線線(ESS),另一部分則來自隨機(jī)勢力,另一部分則來自隨機(jī)勢力(RSS)。 在給定樣本中,TSS不變, 如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此 擬合優(yōu)度:回歸平方和擬合優(yōu)度:回歸平方和ESS/Y的總離差平方和的總離差平方和TSSTSSRSSTSSESSR1記22、可決系數(shù)、可決系數(shù)R2統(tǒng)計(jì)量
5、統(tǒng)計(jì)量 稱 R2 為(樣本)(樣本)可決系數(shù)可決系數(shù)/判定系數(shù)判定系數(shù)(coefficient of determination)。 可決系數(shù)可決系數(shù)的取值范圍取值范圍:0,1 R2越接近越接近1 1,說明實(shí)際觀測點(diǎn)離樣本線越近,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高擬合優(yōu)度越高。在實(shí)際計(jì)算可決系數(shù)時,在1已經(jīng)估計(jì)出后: 22212iiyxR 在例2.1.1的收入收入-消費(fèi)支出消費(fèi)支出例中, 9766. 045900207425000)777. 0(222212iiyxR 注:可決系數(shù)注:可決系數(shù)是一個非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在
6、第3章中進(jìn)行。 0.67033549550.9935 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 回歸分析回歸分析是要判斷解釋變量解釋變量X是否是被解釋變被解釋變量量Y的一個顯著性的影響因素。 在一元線性模型一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著變量的顯著性檢驗(yàn)。性檢驗(yàn)。 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的學(xué)中的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)。 計(jì)量經(jīng)計(jì)學(xué)中計(jì)量經(jīng)計(jì)學(xué)中,主要是針對變量的參數(shù)真值,主要是針對變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。是否為零來進(jìn)行顯著性檢驗(yàn)的。 1、假設(shè)檢驗(yàn)、假設(shè)檢驗(yàn) 所謂假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)
7、,就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。 假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 判斷結(jié)果合理與否,是基于判斷結(jié)果合理與否,是基于“小概率事件不易小概率事件不易發(fā)生發(fā)生”這一原理的這一原理的 2、變量的顯著性檢驗(yàn)、變量的顯著性檢驗(yàn) ),(2211ixN)2(1112211ntSxti 檢驗(yàn)步驟:檢驗(yàn)步驟: (1)對總體參數(shù)提出假設(shè) H0: 1=0, H1:1
8、0(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值11St (3)給定顯著性水平,查t分布表得臨界值t /2(n-2) (4) 比較,判斷 若 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 對于一元線性回歸方程中的0、1,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn): 在上述收入-消費(fèi)支出例中,首先計(jì)算2的估計(jì)值 134022107425000777. 04590020222221222nxyneiii)2(0022200ntSxnXtii41.98742500010/53650000134022220iixnXS3354955-0.6
9、7022734273444.45t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為: 29.180425. 0777. 0111St048. 141.9817.103000St 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t0|2.306,表明在95%的置信度下,拒絕截距項(xiàng)為零的假設(shè)。 |t1|2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量; -142.40/44.453.200.670/0.01934.92關(guān)于常數(shù)項(xiàng)的顯著性檢驗(yàn)關(guān)于常數(shù)項(xiàng)的顯著性檢驗(yàn) T T檢驗(yàn)同樣可以進(jìn)行。檢驗(yàn)同樣可以進(jìn)行。 一般不以一般不以t t檢驗(yàn)決定常數(shù)項(xiàng)是否保留在模型
10、中,檢驗(yàn)決定常數(shù)項(xiàng)是否保留在模型中,而是從經(jīng)濟(jì)意義方面分析回歸線是否應(yīng)該通過而是從經(jīng)濟(jì)意義方面分析回歸線是否應(yīng)該通過原點(diǎn)。原點(diǎn)。 假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)置信區(qū)間估計(jì)。 1)(P 如果存在這樣一個區(qū)間,稱之為置信區(qū)間置信區(qū)間(con
11、fidence interval); 1-稱為置信系數(shù)置信系數(shù)(置信度置信度)(confidence coefficient), 稱為顯著性水平顯著性水平(level of significance);置信區(qū)間的端點(diǎn)稱為置信限置信限(confidence limit)或臨界值臨界值(critical values)。一元線性模型中一元線性模型中, i (i=0,1)的置信區(qū)間的置信區(qū)間: :在變量的顯著性檢驗(yàn)中已經(jīng)知道: )2(ntstiii 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: P ttt()
12、 221即P tstiii() 221Ptstsiiiii()221于是得到:(1-)的置信度下, i的置信區(qū)間是 (,)iitstsii22在上述收入收入- -消費(fèi)支出消費(fèi)支出例中,如果給定 =0.01,查表得: 355. 3) 8 () 2(005. 02tnt由于042. 01S41.980S于是,1、0的置信區(qū)間分別為: (0.6345,0.9195) (-433.32,226.98) 0.01944.45(0.6056,0.7344) (-6.719,291.52) 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 要縮小置信區(qū)間,需要
13、(1)增大樣本容量)增大樣本容量n。因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時,增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??; (2)提高模型的擬合優(yōu)度。)提高模型的擬合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。 四、方程的顯著性檢驗(yàn)(F檢驗(yàn)) 為什么需要進(jìn)行方程的顯著性檢驗(yàn)?方程的顯著性檢驗(yàn),是指對模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立(即以多大的可能性成立)作出推斷。 1.假設(shè)檢驗(yàn) :根據(jù)樣本所提供的信息,對未知總體分布的某些方面的假設(shè)作出合理的判斷。 (1)假設(shè)檢驗(yàn)的步驟: 第一,根據(jù)實(shí)際問題的要求提
14、出一個論斷,稱為原假設(shè)H0 ; 第二,假定H0 成立,構(gòu)造統(tǒng)計(jì)量,進(jìn)行推斷; 第三,根據(jù)推斷結(jié)果對H0 的真?zhèn)芜M(jìn)行判斷,作出拒絕或接受H0的判斷。 (2)假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)的基本思想:為了檢驗(yàn)原假設(shè)H0成立是否正確,先假定H0 成立,看由此能推出什么結(jié)果。如果推出一個不合理的結(jié)果,則“原假設(shè)H0成立”是錯誤的,拒絕原假設(shè)H0 ;反之,則“原假設(shè)H0成立”是正確的,接受原假設(shè)H0 。 (3)上述上述基本思想的根據(jù)基本思想的根據(jù)是小概率事件原理:“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的?!?2.方程顯著性的方程顯著性的F檢驗(yàn)檢驗(yàn) 對模型 Yi=b0+b1Xi+ui的顯著性檢驗(yàn),是指對模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立,即檢驗(yàn)該模型有關(guān)參數(shù)的總體是否顯著為0,原假設(shè)為: H0 :b1=0 備擇假設(shè)為: H1 :b10 構(gòu)造構(gòu)造F統(tǒng)計(jì)量統(tǒng)計(jì)量: 根據(jù)數(shù)理統(tǒng)計(jì)學(xué)的原理,在H0成立的條件下,可以證明 服從自由度為(1,n-2)的F分布 。 其中1為 的自由度,n-2為 的自由度。)2(122nFeyiiyi2ei2 F檢驗(yàn)的步驟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 冬季施工暖棚搭設(shè)質(zhì)量控制措施
- 2024年湄洲灣職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 概括故事情節(jié)知識講解
- 任務(wù)1:成本會計(jì)基本理論復(fù)習(xí)課程
- 無限極健康食品系列教學(xué)案例
- 2024年浙江工業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測驗(yàn)歷年參考題庫(頻考版)含答案解析
- 警示柱施工方案
- 二零二五版人才公寓分房管理及服務(wù)協(xié)議3篇
- 2024年河北軟件職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年長治淮海醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 蘇北四市(徐州、宿遷、淮安、連云港)2025屆高三第一次調(diào)研考試(一模)語文試卷(含答案)
- 第7課《中華民族一家親》(第一課時)(說課稿)2024-2025學(xué)年統(tǒng)編版道德與法治五年級上冊
- 急診科十大護(hù)理課件
- 食堂經(jīng)營方案(技術(shù)標(biāo))
- 代收實(shí)收資本三方協(xié)議范本
- 人教版八年級英語下冊全冊課件【完整版】
- 乒乓球比賽表格
- 商務(wù)接待表格
- 腸梗阻導(dǎo)管治療
- word小報(bào)模板:優(yōu)美企業(yè)報(bào)刊報(bào)紙排版設(shè)計(jì)
- 漢語教學(xué) 《成功之路+進(jìn)步篇+2》第17課課件
評論
0/150
提交評論