




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第八章相關分析與回歸分析學習目標主要內(nèi)容本章小結(jié)學習目標
理解相關分析與回歸分析的基本的含義,最小二乘法的基本的思想;理解回歸模型中參數(shù)的意義及樣本可決系數(shù)的的意義;掌握回歸模型中的參數(shù)估計、相關系數(shù)檢驗、擬合優(yōu)度檢驗、回歸系數(shù)顯著性檢驗、回歸方程顯著性檢驗的基本方法、回歸模型的估計與預測。主要內(nèi)容:第一節(jié)相關分析第二節(jié)一元線性回歸分析第三節(jié)多元線性回歸分析本章小結(jié)思考題參考書目第一節(jié)相關分析1.1變量之間的兩類關系:變量之間存在著非嚴格、不確定的依存關系。在這種關系中,當一個或幾個相互聯(lián)系的變量取一定的數(shù)值時,可以有另一變量的若干數(shù)值與之對應。相關:函數(shù)關系也稱為確定性關系,是指變量之間存在的嚴格確定的依存關系。在這種關系中,當一個或幾個相互聯(lián)系的變量取一定的數(shù)值時,必有另一個且只有一個變量有確定的值與之對應。函數(shù):1)按相關的密切程度可分為:完全相關、不完全相關、不相關;2)按表現(xiàn)形態(tài)可分為:線性相關、非線性相關;3)按相關的方向可分為:正相關、負相關;4)按研究變量的多少可分為:單相關、復相關、偏向關。1.2相關關系的種類:1.3相關分析與回歸分析:回歸分析是研究某一隨機變量關于另一個(或多個)非隨機變量之間數(shù)量關系變動趨勢的方法。其目的在于根據(jù)已知的非隨機變量來估算和預測隨機變量的總體均值?;貧w分析:相關分析主要研究兩個和兩個以上的隨機變量之間相互依存關系的方向和密切程度的方法。相關分析:相關分析與回歸分析的區(qū)別與聯(lián)系:他們在研究現(xiàn)象之間相互依存的關系時,是相互補充、相互滲透的,在實際應用中,一般定性的相關分析;然后計算相關系數(shù),擬合適當?shù)幕貧w方程,進行顯著性檢驗;最后用回歸方程進行推算和預測。聯(lián)系:1)相關分析研究的變量都是隨機變量,不需要區(qū)別因變量和自變量,并且側(cè)重于研究兩個變量間線性相關的密切程度;2)回歸分析中必須確定因變量與自變量,自變量是確定的一般變量,而因變量是隨機變量,不僅揭示自變量對因變量的影響,還可以利用回歸方程進行預測和控制。區(qū)別:1.4相關關系的測度(1/2):相關圖是研究相關關系的直觀工具,又稱為散點圖。他是將具有相關關系的兩個變量間相對應的變量值,在直角坐標系中用坐標點的形式描繪出來,根據(jù)坐標點的分布狀況來大致判別相關形式、相關方向和相關密切的程度。(例)相關圖:(a)正相關(b)負相關1.4相關關系的測度(2/2):相關系數(shù)是衡量變量之間線性相關密切程度及相關方向的統(tǒng)計分析指標。相關系數(shù):樣本相關系數(shù):總體相關系數(shù):樣本相關系數(shù)分子分母的簡化計算形式:1);2)當時,變量間不存在線性相關關系;3)當時,變量間具有完全線性相關關系,當時,稱完全正相關,當時,稱完全負相關。4)當時,變量間存在負相關關系;當時,變量之間存在正相關關系5)的取值越接近0,變量間線性相關關系越弱,越接近1,變量間線性相關關系越強。相關系數(shù)的性質(zhì):對的統(tǒng)計量檢驗法第一步:提出假設;第二步:計算檢驗統(tǒng)計量第三步:根據(jù)給定的顯著性水平,進行決策。若,拒絕,表明變量間線性相關關系顯,不能拒絕,表明變量間的線性著;若相關關系不顯著;相關系數(shù)的檢驗:
例8-1根據(jù)1996-2012年國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額資料,見書本表8-1,計算國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間的相關系數(shù),并對相關系數(shù)進行顯著性檢驗。
解:1)計算相關系數(shù)
案例分析:2)對樣本相關系數(shù)進行t檢驗計算t統(tǒng)計量:
對給定顯著性水平,查表得,這里,故在0.05的顯著性水平下,檢驗通過,說明國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間的相關關系顯著。第二節(jié)一元線性回歸分析一元線性總體回歸模型:
與是參數(shù)和的最小二乘估計。實際觀測值與之間差值稱為殘差,即:
一元線性回歸方程:2.1一元線性回歸模型A回歸模型的基本形式假設1:隨機誤差項具有零均值,同方差性,即假設2:隨機誤差項之間不存在序列相關關系,即假設3:解釋變量是確定性變量,且與隨機誤差項之間線性無關。假設4:隨機誤差項服從零均值、同方差的正態(tài)分布,即:B一元線性回歸模型的基本假設最小二乘法:就是使殘差平方和達到最小時求得參數(shù)和的估計值與的方法。殘差平方和:Q對分別求一階偏導,并令其為0,得方程組:2.2一元線性回歸模型的估計A參數(shù)和的最小二乘估計求解方程組得的最小二乘估計量例8-2根據(jù)表8-1中給出的我國國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額數(shù)據(jù),建立回歸方程。解:根據(jù)例8-1的計算結(jié)果可知,國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間具有顯著的線性相關關系,由此可建立簡單直線回歸方程:
將表8-1中的有關數(shù)據(jù)代入下式:
案例分析:可得:
所求回歸方程為:
表明固定資產(chǎn)投資額每增加1億元,國內(nèi)生產(chǎn)總值平均增加1.305億元最小二乘估計量與分別是其真值與的無偏估計,且都服從正態(tài)分布。
B最小二乘估計量的性質(zhì)回歸標準差:其簡捷公式:越小表明實際觀測點與所擬合的樣本回歸線的離差程度越小,回歸線能較好的代表總回歸模型。反之,越大表明實際觀測點與所擬合的樣本回歸線的離差程度越大,回歸線的代表性越差。C總體方差的估計
其中:
D回歸系數(shù)的區(qū)間估計從回歸系數(shù)的最小二乘估計量可以看出,對任意給出的n對數(shù)據(jù)(xi,yi),都可以求出,從而可以寫出回歸方程,但這樣給出的方程不一定有意義。在使用回歸方程之前,必須對其進行統(tǒng)計檢驗,以判斷估計的可靠程度。這包括擬合優(yōu)度檢驗、整個回歸方程的顯著性檢驗、回歸系數(shù)的顯著性檢驗等。2.3一元線性回歸模型的檢驗擬合優(yōu)度是指模型對樣本觀測值的擬合程度,即樣本回歸直線與觀測點之間的緊密程度。衡量擬合優(yōu)度的指標通常用樣本可決系數(shù)(又稱作決定系數(shù))。
A/C擬合優(yōu)度檢驗概念:總偏差平方和:回歸平方和:殘差平方和:總偏差平方和分解式:
Y的觀測值圍繞其均值的總偏差平方和可以分解為兩部分,一部分來自于回歸線,另一部分來自隨機因素。因而,可以用回歸平方和占總偏差平方和的比例來判斷回歸線與樣本觀測值的擬合程度,記為。他用公式表示為:
的意義及應用:的取值在0到1之間,其值越接近1,說明回歸方程的擬合程度越高;反之,其值越小,說明回歸方程的擬合效果差。B/C回歸方程的顯著性檢驗(F檢驗)
回歸方程的顯著性檢驗就是對模型中的被解釋變量與解釋變量之間的線性關系在總體上是否顯著成立作出判斷。一元線性回歸模型只有一個解釋變量,要判斷y的均值是否隨x呈線性變化,實際上就是要判斷β1是否為零,通常采用F檢驗。
1.提出假設原假設;備擇假設2.構(gòu)造統(tǒng)計量
在原價設成立的條件下,上述統(tǒng)計量
3.給定顯著性水平,確定拒絕域:,在附表中可直接查找的值。檢驗步驟(F檢驗):4.作出判斷根據(jù)樣本計算出統(tǒng)計量F的數(shù)值,然后與的值進行比較:若,則拒絕原假設,認為回歸方程是顯著的,即x與y之間有顯著的線性關系;若,則接受原假設,認為回歸方程不顯著,即x與y之間沒有顯著的線性關系。C/C回歸系數(shù)的顯著性檢驗(t檢驗)
一元線性回歸模型中,回歸系數(shù)的顯著性檢驗解釋要檢驗解釋變量x對被解釋變量y的影響程度是否顯著,也就是檢驗β1是否顯著,通常使用t檢驗。
需要注意的是,在一元線性回歸中,因為t檢驗與F檢驗提出的假設是一致的,而且,兩個統(tǒng)計量之間具有F=t^2的關系,所以,t檢驗與F檢驗是等價的。
1.提出假設原假設;備擇假設2.構(gòu)造統(tǒng)計量
在原價設成立時,統(tǒng)計量3.給定顯著性水平,確定拒絕域:,在附表中可直接查找的值。檢驗步驟(t檢驗):4.作出判斷根據(jù)樣本計算出統(tǒng)計量t的數(shù)值,然后與的值進行比較:若,則拒絕原假設,認為β1顯著不為0,即變量x與y之間一元線性關系顯著成立;若,則接受原假設,認為回歸方程不顯著。認為β1顯著為0,變量x與y之間一元線性關系不成立。案例分析:P141,例題8-3例8-3對例8-2建立的國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額的回歸方程進行顯著性檢驗。解:1)先進行F檢驗,計算F統(tǒng)計量對于給定的顯著性水平,查表得,由于,拒絕原假設,認為回歸方程是顯著的。2)還可以進行t檢驗,計算t統(tǒng)計量當時,查表得,由于,拒絕原假設,說明顯著不為0,即國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間具有顯著的線性相關關系。2.4一元線性回歸模型的應用——估計與預測
當回歸方程經(jīng)過檢驗是顯著的以后,可以將其用作估計與預測。
估計就是指當x=x0時,尋求y的均值E(y0)=β0+β1x0的點估計與區(qū)間估計,這里E(y0)是常量;
預測問題是指當x=x0時,y0的觀測值在什么范圍內(nèi)。即對于給定的顯著性水平α,找一個區(qū)間(T1,T2),使得P(T1<y0<T2
)=1-α,稱區(qū)間(T1,T2)是y0的概率為1-α的預測區(qū)間。
點估計:區(qū)間估計:A/B)y的均值E(y0)的估計B/B)y0的預測區(qū)間第三節(jié)多元線性回歸分析
一元線性回歸模型反映的是一個因變量和一個自變量之間的線性關系。實際上,社會經(jīng)濟現(xiàn)象的變動是很復雜的,一個因變量的變動往往是由許多自變量的綜合影響造成的。在線性回歸模型中,若一個因變量對應多個自變量,這種模型稱為多元線性回歸模型。
多元回歸模型是一元線性回歸模型的推廣,其參數(shù)估計原理與一元線性回歸模型相同,只是計算更加復雜。
A多元線性回歸模型的一般形式
分別是參數(shù)的最小二乘估計。實際觀測值與之間差值稱為殘差,即:
多元線性回歸方程:3.1多元線性回歸模型假設1:隨機誤差項具有零均值,同方差性,即假設2:隨機誤差項之間不存在序列相關關系,即假設3:解釋變量是確定性變量,相互之間互不相關,且與隨機誤差項之間線性無關,
假設4:隨機誤差項服從零均值、同方差的正態(tài)分布,即:B多元線性回歸模型的基本假設A回歸系數(shù)的最小二乘估計
殘差平方和公式為:Q分別對求一階偏導,并令其為0,得方程組:3.2多元線性回歸模型的參數(shù)估計解矩陣方程得:以上(k+1)個方程組成的方程組稱為正規(guī)方程組,經(jīng)過整理得:用矩陣形式表示如下:這就是參數(shù)的最小二乘估計量。參數(shù)估計量的期望為因而,參數(shù)估計量是的無偏估計參數(shù)估計量的方差-協(xié)方差陣為B最小二乘估計量的性質(zhì)
C總體方差的估計
多元回歸分析中的可決系數(shù)用
表示。
多元回歸分析中用作為擬合優(yōu)度的評價不可靠,必須進行修正。在樣本容量一定的情況下,將殘差平方和與總偏差平方和分別除以各自的自由度,以消除變量個數(shù)對擬合優(yōu)度的影響。修正以后的決定系數(shù)用表示。計算公式為:3.3擬合優(yōu)度檢驗修正后的可絕系數(shù)與未經(jīng)修正的可絕系數(shù)之間有如下關系:一般來說,越接近1,表明擬合程度越高;
越接近0或者小于0,表明擬合程度越差。3.4顯著性檢驗當多元線性回歸模型中的參數(shù)估計出來以后,還要對模型進行顯著性檢驗。一方面,要對模型總體上的線性關系是否顯著進行檢驗;另一方面,還要對每個解釋變量對被解釋變量的影響是否顯著進行檢驗。1.提出假設原假設備擇假設不全為02.構(gòu)造統(tǒng)計量在原假設成立的條件下,上述統(tǒng)計量A/B回歸方程的顯著性檢驗(F檢驗)3.列出回歸模型的方差分析表方差來源平方和自由度均方F檢驗值回歸SSRkSSR/k
殘差
SSEn-k-1SSE/(n-k-1)總和
SSTn-1
4.給定顯著性水平在附表中查找的值,并與方差分析表中統(tǒng)計量的數(shù)值進行比較:
若,拒絕原假設,認為總體回歸方程中各解釋變量與被解釋變量的線性關系是顯著的。若,拒絕原假設,則認為總回歸方程不顯著,所建立的回歸模型沒有意義。1.提出假設原假設;備擇假設
2.構(gòu)造統(tǒng)計量
其中,為回歸標準差B/B系數(shù)的顯著性檢驗(t檢驗)3.給定顯著性水平,查出臨界值4.作出判斷當時,拒絕原假設,可以認為在顯著性水平下,對的影響顯著。當時,接受原假設,認為在顯著性水平下,對的影響不顯著。點估計:區(qū)間估計:區(qū)間估計:3.5多元線性回歸模型的應用——估計與預測(一)偏相關系數(shù)
考慮在對其他變量的影響進行控制的情況下,來考察相關的多個變量中某兩個變量的相關程度,偏相關系數(shù)就是衡量這種相關程度的指標。為簡明起見,先計算三個變量間的相關系數(shù)。三個變量擬合三個回歸方程:3.5偏相關系數(shù)與復相關系數(shù)當?shù)闹狄欢〞r,與的偏相關系數(shù)為:當?shù)闹狄欢〞r,與的偏相關系數(shù)為:當?shù)闹狄欢〞r,與的偏相關系數(shù)為:偏相關系數(shù)的符號與相應的偏回歸系數(shù)相同,其取值范圍在-1到1之間。在實際運用中,可以將以上偏相關系數(shù)的定義推廣到多個變量的場合。復相關系數(shù),是在多元線性回歸分析中衡量因變量與多個自變量之間相關程度的指標。其計算公式如下:(二)復相關系數(shù)案例分析:P149,例題8-4本章介紹了研究現(xiàn)象之間相關關系的兩種基本方法:一是相關分析,二是回歸分析。實際應用中,一般先進行定性的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六一活動做扇子活動方案
- 六一活動小狂歡活動方案
- 六一活動捉泥鰍活動方案
- 六一活動校慶策劃方案
- 六一游戲活動活動方案
- 六一電玩活動方案
- 六一節(jié)活動社區(qū)活動方案
- 六一苗族活動方案
- 六一餛飩活動方案
- 蘭州開業(yè)活動方案
- 肝癌個案護理
- 2025年浙江省寧波市外事服務中心招聘2人歷年高頻重點提升(共500題)附帶答案詳解
- 2025年護理質(zhì)控工作計劃
- 中國艱難梭菌感染診治及預防指南(2024)解讀
- 科創(chuàng)板股票開戶知識測評題庫(附答案)
- 主體驗收施工方發(fā)言稿
- 海南省海口市(2024年-2025年小學六年級語文)統(tǒng)編版小升初真題(下學期)試卷及答案
- 名著閱讀-2025年中考語文專項復習(湖北專用)(原題版)
- 《重性精神疾病管理》課件
- 新教科版科學四年級上冊實驗報告單(2020年適用-共30個試驗)
- 餐飲業(yè)安全生產(chǎn)舉報管理制度
評論
0/150
提交評論