版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1第第8 8章章 相關(guān)分析和回歸分析相關(guān)分析和回歸分析2 相關(guān)分析(相關(guān)分析(掌握掌握) 線性回歸分析(線性回歸分析(掌握掌握) 回歸模型的統(tǒng)計檢驗和預(yù)測(回歸模型的統(tǒng)計檢驗和預(yù)測(掌握掌握) 非線性回歸模型(非線性回歸模型(了解了解) 主要內(nèi)容和學(xué)習(xí)目標主要內(nèi)容和學(xué)習(xí)目標 3 8.1.1 8.1.1 相關(guān)關(guān)系的概念和種類相關(guān)關(guān)系的概念和種類 1.1.相關(guān)關(guān)系的概念相關(guān)關(guān)系的概念 在社會經(jīng)濟發(fā)展變化中,客觀現(xiàn)象總是普遍在社會經(jīng)濟發(fā)展變化中,客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象(變量)之間聯(lián)系和相互依存的,客觀現(xiàn)象(變量)之間的數(shù)量依存關(guān)系可分為兩種類型:確定性關(guān)的數(shù)量依存關(guān)系可分為兩種類
2、型:確定性關(guān)系和系和相關(guān)關(guān)系相關(guān)關(guān)系。 相關(guān)關(guān)系相關(guān)關(guān)系是指現(xiàn)象之間客觀存在的非確定性是指現(xiàn)象之間客觀存在的非確定性的數(shù)量依存關(guān)系。的數(shù)量依存關(guān)系。 8.1 8.1相關(guān)分析相關(guān)分析4如:商品的消費量(如:商品的消費量(y y)與居民收入()與居民收入(x x)之間的關(guān)系)之間的關(guān)系 變量間關(guān)系是變量間關(guān)系是不能用函數(shù)關(guān)系精確表達不能用函數(shù)關(guān)系精確表達的,一個變的,一個變量的取值不能由另一個變量唯一確定。量的取值不能由另一個變量唯一確定。各觀測點分布在直線周圍。各觀測點分布在直線周圍。52. 2. 相關(guān)關(guān)系的種類相關(guān)關(guān)系的種類(1 1)按相關(guān)的方向可以分為)按相關(guān)的方向可以分為正相關(guān)正相關(guān)和和負
3、相關(guān)負相關(guān)。(2 2)按相關(guān)的程度可分為)按相關(guān)的程度可分為完全相關(guān)完全相關(guān)、不完全相關(guān)不完全相關(guān)和和不相關(guān)不相關(guān)。(3 3)按涉及的變量或因素的個數(shù)可以分為)按涉及的變量或因素的個數(shù)可以分為單相關(guān)單相關(guān)與與復(fù)相關(guān)復(fù)相關(guān)。(4 4)按相關(guān)的表現(xiàn)形式可分為)按相關(guān)的表現(xiàn)形式可分為線性相關(guān)線性相關(guān)與與非線性相關(guān)非線性相關(guān)。6相關(guān)關(guān)系的種類的關(guān)系圖相關(guān)關(guān)系的種類的關(guān)系圖78.1.28.1.2 相關(guān)分析的圖表和意義相關(guān)分析的圖表和意義1 1、相關(guān)圖表相關(guān)圖表 相關(guān)表和相關(guān)圖可直觀地表達變量之間相關(guān)表和相關(guān)圖可直觀地表達變量之間的相關(guān)關(guān)系的程度。的相關(guān)關(guān)系的程度。 相關(guān)表相關(guān)表是將具有相關(guān)關(guān)系的原始數(shù)據(jù)
4、是將具有相關(guān)關(guān)系的原始數(shù)據(jù), ,按按某一順序平行排列在一張表上某一順序平行排列在一張表上, ,以觀察它以觀察它們之間的相互關(guān)系。們之間的相互關(guān)系。8表表8-18-1高校人數(shù)和周邊飯店季營業(yè)額高校人數(shù)和周邊飯店季營業(yè)額飯飯店店學(xué)生人學(xué)生人數(shù)(千數(shù)(千人)人)x x季營業(yè)季營業(yè)額(千額(千元)元)y y飯飯店店學(xué)生人學(xué)生人數(shù)(千數(shù)(千人)人)x x季營業(yè)額季營業(yè)額(千元)(千元)y y1 12 258586 616161371372 26 61051057 720201571573 38 888888 820201691694 48 81181189 922221491495 5121211711
5、7101026262022029 相關(guān)圖相關(guān)圖也稱為分布圖或散點圖,它是在平面也稱為分布圖或散點圖,它是在平面直角坐標中把相關(guān)關(guān)系的原始數(shù)據(jù)用點描繪直角坐標中把相關(guān)關(guān)系的原始數(shù)據(jù)用點描繪出來,通常以直角坐標的橫軸代表自變量出來,通常以直角坐標的橫軸代表自變量x,x,縱軸代表因變量縱軸代表因變量y y。相關(guān)圖所反映的變量之。相關(guān)圖所反映的變量之間的相關(guān)關(guān)系的方向和程序比相關(guān)表更為清間的相關(guān)關(guān)系的方向和程序比相關(guān)表更為清晰,也更為直觀。晰,也更為直觀。10圖圖8-18-1學(xué)生人數(shù)和季營業(yè)額相關(guān)圖學(xué)生人數(shù)和季營業(yè)額相關(guān)圖 11122. 2. 相關(guān)分析的意義相關(guān)分析的意義(1 1)相關(guān)分析可以確定變量
6、之間相關(guān)關(guān)系的)相關(guān)分析可以確定變量之間相關(guān)關(guān)系的方向和程度方向和程度(2 2)相關(guān)分析可以衡量回歸估計的精確程度)相關(guān)分析可以衡量回歸估計的精確程度138.1.3 8.1.3 簡單線性相關(guān)簡單線性相關(guān)1. 1. 相關(guān)系數(shù)相關(guān)系數(shù) 相關(guān)系數(shù)相關(guān)系數(shù)是描述相關(guān)的兩個變量之間相關(guān)關(guān)是描述相關(guān)的兩個變量之間相關(guān)關(guān)系密切程度的數(shù)量指標。早在系密切程度的數(shù)量指標。早在18901890年,英國年,英國著名統(tǒng)計學(xué)家著名統(tǒng)計學(xué)家Karl PearsonKarl Pearson便提出了一個測便提出了一個測定兩個變量線性相關(guān)的計算方法,通常稱為定兩個變量線性相關(guān)的計算方法,通常稱為積差相關(guān)系數(shù)或簡單相關(guān)系數(shù)。積差
7、相關(guān)系數(shù)或簡單相關(guān)系數(shù)。14總體相關(guān)系數(shù)總體相關(guān)系數(shù): :XYXY式中:XY是變量是變量X X和和Y Y的協(xié)方差的協(xié)方差X是變量是變量X X的標準差的標準差Y是變量是變量Y Y的標準差的標準差樣本相關(guān)系數(shù)樣本相關(guān)系數(shù):22()()iiiixxyyrxxyy15 計算學(xué)生人數(shù)和季營業(yè)額的相關(guān)系數(shù)計算學(xué)生人數(shù)和季營業(yè)額的相關(guān)系數(shù) 124608119 1401100.9611(2207119 119) (2818011401 1401)1010r 【例8.2】利用表8-1的數(shù)據(jù),計算學(xué)生人數(shù)x(萬人)和季營業(yè)額y(萬元)的相關(guān)系數(shù)。162.2.相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)的性質(zhì) (1 1)(2 2)若)若
8、 ,表示變量,表示變量x x與變量與變量y y為線性正相為線性正相關(guān)關(guān)系;若關(guān)關(guān)系;若 ,表示變量,表示變量x x與變量與變量y y為為線性負相關(guān)關(guān)系。線性負相關(guān)關(guān)系。(3 3)若)若 ,表示兩變量完全線性相關(guān),即變,表示兩變量完全線性相關(guān),即變量量x x與變量與變量y y之間存在確定的函數(shù)關(guān)系。若之間存在確定的函數(shù)關(guān)系。若 ,表示兩變量完全線性正相關(guān);若表示兩變量完全線性正相關(guān);若 ,表示兩變,表示兩變量完全線性負相關(guān)。量完全線性負相關(guān)。(4 4)若)若 ,表示兩變量不存在線性相關(guān)。,表示兩變量不存在線性相關(guān)。| 1r 01r10r | 1r 1r 1r 0r 17(5 5)當)當 時,表示
9、兩變量存在不同程度的時,表示兩變量存在不同程度的線性相關(guān)。線性相關(guān)。 的數(shù)值越接近于的數(shù)值越接近于1 1,表示兩變量之,表示兩變量之間線性相關(guān)程度越高;反之間線性相關(guān)程度越高;反之 的數(shù)值越接近于的數(shù)值越接近于0 0,表示兩變量之間線性相關(guān)程度越低。通常認為:表示兩變量之間線性相關(guān)程度越低。通常認為: 微弱相關(guān);微弱相關(guān); 低度相關(guān)低度相關(guān) 顯著相關(guān);顯著相關(guān); 高度相關(guān)高度相關(guān)(6 6)相關(guān)系數(shù)不受變量值水平和計量單位的影響。)相關(guān)系數(shù)不受變量值水平和計量單位的影響。0 | 1r|r|r0 | 0.3r0.3 | | 0.5r0.5 | 0.8r0.8 | 1r18根據(jù)給定的顯著性水平和自由
10、度根據(jù)給定的顯著性水平和自由度n-2,n-2,查找查找t t分布中的相分布中的相應(yīng)臨界值應(yīng)臨界值 。如果。如果 ,就否定原假設(shè),認為,就否定原假設(shè),認為 r r 在統(tǒng)計上是顯著的,即總體相關(guān)系數(shù)不為零,總體變在統(tǒng)計上是顯著的,即總體相關(guān)系數(shù)不為零,總體變量間存在線性相關(guān)關(guān)系。量間存在線性相關(guān)關(guān)系。3.3.相關(guān)系數(shù)的顯著性檢驗相關(guān)系數(shù)的顯著性檢驗提出假設(shè):提出假設(shè):01:0,:0HH計算計算 t t 檢驗統(tǒng)計量:檢驗統(tǒng)計量: 2t2|tt 22(2)1ntrt nr19 檢驗高校學(xué)生人數(shù)與周邊飯店季營業(yè)額之間的相關(guān)檢驗高校學(xué)生人數(shù)與周邊飯店季營業(yè)額之間的相關(guān)系數(shù)是否顯著,顯著性水平系數(shù)是否顯著,
11、顯著性水平 =0.05=0.05。 第一步:提出假設(shè)第一步:提出假設(shè) 第二步:構(gòu)造并計算檢驗統(tǒng)計量第二步:構(gòu)造并計算檢驗統(tǒng)計量01:0; :0HH221020.958.6111 0.95 0.95ntrr20 第三步:確定臨界值。根據(jù)給定的顯著性水平第三步:確定臨界值。根據(jù)給定的顯著性水平 =0.05=0.05和自由度和自由度10-2=810-2=8,查找,查找t t分布表或利用分布表或利用ExcelExcel計算,得到臨界值。計算,得到臨界值。 第四步:決策。由于第四步:決策。由于 所以拒絕原假設(shè),說明高校學(xué)生人數(shù)與周邊飯店季所以拒絕原假設(shè),說明高校學(xué)生人數(shù)與周邊飯店季營業(yè)額之間存在著顯著的
12、正線性相關(guān)關(guān)系。營業(yè)額之間存在著顯著的正線性相關(guān)關(guān)系。0.025(8)(0.05,8)2.31tTINV0.025| | 8.61(8)2.31tt21 8.2.1 8.2.1 回歸分析回歸分析 回歸分析回歸分析是根據(jù)已知變量估計未知變量是根據(jù)已知變量估計未知變量的一種統(tǒng)計方法,它是以對未知變量的一種統(tǒng)計方法,它是以對未知變量( (因因變量變量) )同其他變量同其他變量( (自變量自變量) )相互關(guān)系的觀相互關(guān)系的觀察為基礎(chǔ),在某種精確度下,預(yù)測未知變察為基礎(chǔ),在某種精確度下,預(yù)測未知變量的數(shù)值。量的數(shù)值。 8.2 8.2 線性回歸分析線性回歸分析22回歸分析的內(nèi)容和步驟回歸分析的內(nèi)容和步驟:
13、 選擇適當?shù)幕貧w模型。選擇適當?shù)幕貧w模型。 進行參數(shù)估計。進行參數(shù)估計。 進行模型的檢驗。進行模型的檢驗。 進行預(yù)測。即根據(jù)回歸方程進行適當?shù)慕?jīng)進行預(yù)測。即根據(jù)回歸方程進行適當?shù)慕?jīng)濟預(yù)測,這是回歸分析的最終目的。濟預(yù)測,這是回歸分析的最終目的。231. 1. 總體回歸方程與樣本回歸方程總體回歸方程與樣本回歸方程 例:研究家庭消費支出與家庭收入之例:研究家庭消費支出與家庭收入之間的關(guān)系,一個總體由間的關(guān)系,一個總體由5050戶家庭組成,戶家庭組成,并按人均月收入水平劃分成組內(nèi)收入并按人均月收入水平劃分成組內(nèi)收入水平大致相同的水平大致相同的1010個組。個組。24圖圖8-4 8-4 不同收入水平的
14、家庭消費支出散點分布圖不同收入水平的家庭消費支出散點分布圖總體回歸線PRL隨機試驗所有可能結(jié)果的集合稱為總體或樣本空間第一節(jié) 古典回歸模型 由圖中看出總體回歸直線是線性的,用函數(shù)的形式來由圖中看出總體回歸直線是線性的,用函數(shù)的形式來表示:表示: (1)(1) 這是直線的數(shù)學(xué)表達式,在式這是直線的數(shù)學(xué)表達式,在式(1)(1)中,中, E(YE(YXi)Xi)表示給定表示給定X X值相應(yīng)的值相應(yīng)的( (或條件的或條件的) ) Y Y的均值,的均值,稱為稱為或條件均值下標或條件均值下標i i代表第代表第i i個子總體。個子總體。如,如,x=2x=2時,時,y y的條件均值為的條件均值為 即收入水平為
15、即收入水平為20002000元的元的4 4個家庭的平均消費支出為個家庭的平均消費支出為15001500元。元。01( |)iiE Y XX11111.101.401.701.801.55555第一節(jié) 古典回歸模型注意注意: E E( (Y YX Xi i) )是是X Xi i的函數(shù)的函數(shù)( (在此例中是線性函數(shù)在此例中是線性函數(shù)) )。這意味。這意味著著Y Y依賴于依賴于X Xi i,一般稱之為,一般稱之為?;貧w可簡單?;貧w可簡單地定義為在給定地定義為在給定X X值的條件下值的條件下Y Y值分布的均值。換句話值分布的均值。換句話說,總體回歸直線經(jīng)過說,總體回歸直線經(jīng)過Y Y的條件期望值。式的條
16、件期望值。式(1)(1)是總體是總體回歸函數(shù)回歸函數(shù)(Population Regression Function, PRF)(Population Regression Function, PRF)的數(shù)學(xué)形式。在本例中,總體回歸函數(shù)是線性函數(shù)。的數(shù)學(xué)形式。在本例中,總體回歸函數(shù)是線性函數(shù)。第一節(jié) 古典回歸模型 為參數(shù)為參數(shù)( (parameters) ),也稱,也稱回歸系數(shù)回歸系數(shù)( (regression coefficients) )。 又稱為截距又稱為截距( (intercept) ),是當,是當X X為為0 0時時Y Y的均值的均值 又稱為斜率又稱為斜率( (slope) ),斜率度
17、量了,斜率度量了X X 每變動一每變動一單位,單位,Y Y 的均值的變化率。的均值的變化率。 例,如果斜率例,如果斜率 為為0.5,那么,當收入,那么,當收入x x每增加每增加1 1單位(千元),單位(千元),Y Y 的的( (期望期望) )均值將增加均值將增加0.50.5個單位個單位(千元);即,平均而言,消費支出將增加(千元);即,平均而言,消費支出將增加0.50.5千元。千元。 0101,1第一節(jié) 古典回歸模型模型的隨機設(shè)定模型的隨機設(shè)定 從圖中可看出單個家庭的消費支出與平均消費支出從圖中可看出單個家庭的消費支出與平均消費支出之間存在著一定的離差,即之間存在著一定的離差,即 (2)(2)
18、 其中,其中, 表示隨機誤差項表示隨機誤差項(stochastic, random (stochastic, random error term)error term)或簡稱為誤差項。或簡稱為誤差項。01iiiYXi29表表8-4 8-4 從表從表8-38-3的總體中抽取一個隨機樣本的總體中抽取一個隨機樣本 XYXY10.7763.2021.1074.0031.7084.3041.6594.5052.50106.0030圖圖8-5 8-5 總體回歸線與樣本回歸線總體回歸線與樣本回歸線第一節(jié) 古典回歸模型 得到一條很好地得到一條很好地“擬合擬合”了樣本數(shù)據(jù)了樣本數(shù)據(jù)的直線,稱之為的直線,稱之為(
19、sample (sample regression lines, SRL)regression lines, SRL)。 可能從可能從K K個不同的樣本中得到個不同的樣本中得到K K條不同條不同的樣本回歸直線,所有的這些樣本回的樣本回歸直線,所有的這些樣本回歸線不可能都相同。每一條直線也最歸線不可能都相同。每一條直線也最多是對真實總體回歸線的多是對真實總體回歸線的近似近似。第一節(jié) 古典回歸模型 用樣本回歸函數(shù)用樣本回歸函數(shù)(sample regression (sample regression function,S R F)function,S R F)來表示樣本回歸線。來表示樣本回歸線。
20、(3)(3) 表示總體條件均值,表示總體條件均值, E(Y|Xi)E(Y|Xi)的估計量;的估計量; 表示表示 的估計量;的估計量; 表示表示 的估計量;的估計量;001iiYXiY110第一節(jié) 古典回歸模型 建立隨機的樣本回歸函數(shù):建立隨機的樣本回歸函數(shù): (4) 其中其中eiei為殘差項為殘差項(residual term)(residual term),或簡稱,或簡稱為殘差為殘差(residual)(residual)。01iiiYXe第一節(jié) 古典回歸模型 回歸分析的主要目的是根據(jù)樣本回歸函數(shù)回歸分析的主要目的是根據(jù)樣本回歸函數(shù)來估計總體回歸函數(shù),來估計總體回歸函數(shù),01iiiYXe01
21、iiiYX352. 2. 相關(guān)分析與回歸分析的聯(lián)系與區(qū)別相關(guān)分析與回歸分析的聯(lián)系與區(qū)別(1 1)相關(guān)分析與回歸分析的)相關(guān)分析與回歸分析的聯(lián)系聯(lián)系 相關(guān)分析和回歸分析具有共同的研究對象相關(guān)分析和回歸分析具有共同的研究對象 相關(guān)分析和回歸分析需要相互補充相關(guān)分析和回歸分析需要相互補充 相關(guān)分析是回歸分析的前提相關(guān)分析是回歸分析的前提 回歸分析是相關(guān)分析的拓展回歸分析是相關(guān)分析的拓展36(2 2)相關(guān)分析與回歸分析的)相關(guān)分析與回歸分析的區(qū)別區(qū)別 變量的地位不同變量的地位不同 變量的性質(zhì)不同變量的性質(zhì)不同 研究的目的不同研究的目的不同 研究的方法不同研究的方法不同 所起的作用不同所起的作用不同37
22、8.2.2 8.2.2 一元線性回歸模型一元線性回歸模型1. 1. 回歸模型的基本假定回歸模型的基本假定 回歸模型回歸模型是描述因變量如何依賴自變量和隨是描述因變量如何依賴自變量和隨機誤差項的方程。一元線性回歸模型只涉及機誤差項的方程。一元線性回歸模型只涉及一個自變量,可表述為:一個自變量,可表述為:01yx第一節(jié) 古典回歸模型隨機誤差項是服從正態(tài)分布的實隨機變量。隨機誤差項是服從正態(tài)分布的實隨機變量。零均值假定。即,零均值假定。即,同方差假定,即對于自變量同方差假定,即對于自變量 所有觀察值,隨機誤差項所有觀察值,隨機誤差項 的方差的方差 都相同。都相同。非自相關(guān)假定,即與自變量不同觀察值對
23、應(yīng)非自相關(guān)假定,即與自變量不同觀察值對應(yīng)的隨機誤差項之間是互不相關(guān)、互不影響的的隨機誤差項之間是互不相關(guān)、互不影響的自變量變量與隨機誤差項不相關(guān)假定。自變量變量與隨機誤差項不相關(guān)假定。無多重共線性假定。無多重共線性假定?;貧w模型的基本假定回歸模型的基本假定( )0E12,kx xx22. 2. 最小二乘估計最小二乘估計(OLS)(OLS) 殘差是殘差是Y Yi i的真實值與估計值之差,即的真實值與估計值之差,即 普通最小二乘法普通最小二乘法(ordinary least squares, OLS )(ordinary least squares, OLS ),即選擇參數(shù)即選擇參數(shù) 和和 ,使得
24、全部觀察值的殘差平方,使得全部觀察值的殘差平方和最小。和最小。 用數(shù)學(xué)形式表示為:用數(shù)學(xué)形式表示為: 最小二乘原理就是所選樣本回歸函數(shù)使得所有最小二乘原理就是所選樣本回歸函數(shù)使得所有Y Y的估的估計值與真實值差的平方和最小。計值與真實值差的平方和最小。iiiiieYYYY實際的估計的22201min:()()iiiiieY YYX01 求解聯(lián)立方程求解聯(lián)立方程 解得解得 0100112()( 1)02()()0iiiiiQyxQyxx12201()iiiiiinx yxynxxyx41參數(shù)估計誤差和置信區(qū)間參數(shù)估計誤差和置信區(qū)間(1)(1)估計誤差估計誤差: :估計值和真值的偏差估計值和真值的
25、偏差。 的估計誤差為:的估計誤差為: 的估計誤差為:的估計誤差為:0122122( )(x)(2)(x)iiieSxnx2202()()()(2)(x)iiiexSn nx42(2)(2)置信區(qū)間置信區(qū)間 對于給定的置信度對于給定的置信度1-1- , 參數(shù)的置信區(qū)間為參數(shù)的置信區(qū)間為: :即以即以100(1-100(1- )%)%的概率回歸系數(shù)屬于該區(qū)間內(nèi)。的概率回歸系數(shù)屬于該區(qū)間內(nèi)。 同理,同理, 參數(shù)的置信區(qū)間為參數(shù)的置信區(qū)間為1121121(2) (),(2) ()tnStnS020020(2) (),(2) ()tnStnS0438.2.3 8.2.3 多元線性回歸模型多元線性回歸模型
26、1. 1. 多元線性回歸模型的參數(shù)估計多元線性回歸模型的參數(shù)估計 利用最小二乘法估計模型的參數(shù)利用最小二乘法估計模型的參數(shù)01 122 1,2,iiikkiiyxxxin22201 122() ()miniiiiiikkieyyyxxx44 參數(shù)估計值應(yīng)該是下列方程組的解:參數(shù)估計值應(yīng)該是下列方程組的解:01 122001 1221101 1222()( 1)02()()0()()0iiikkiiiikkiiiiikkikikQyxxxQyxxxxQyxxxx45 定義矩陣: 方程組可以用矩陣表示成: 參數(shù)的最小二乘估計為121nnyyYy112111222212(1)1 1 1 kknnkn
27、nkxxxxxxXxxx0 11(1) 1kkB ()X YX X B1()BX XX Y462. 2. 參數(shù)的估計誤差和置信區(qū)間參數(shù)的估計誤差和置信區(qū)間 參數(shù)估計值的標準差為參數(shù)估計值的標準差為 為矩陣為矩陣 對角線上的第對角線上的第i i個元素個元素 對于給定的置信度對于給定的置信度1-1- ,參數(shù)的,參數(shù)的100(1-100(1- )%)%置置信區(qū)間為:信區(qū)間為:22()1iiiiiieSccnk22(1) (),(1) ()iiiitnkStnkSiic1()CX X473. 3. 多元回歸模型中的相關(guān)分析多元回歸模型中的相關(guān)分析 多元回歸分析中,由于變量總數(shù)不止兩個,多元回歸分析中,
28、由于變量總數(shù)不止兩個,因變量與多個自變量的組合產(chǎn)生一定的依存因變量與多個自變量的組合產(chǎn)生一定的依存關(guān)系;同時任何兩個變量之間的相關(guān)關(guān)系都關(guān)系;同時任何兩個變量之間的相關(guān)關(guān)系都可能受到其余變量的影響。為此需要對已建可能受到其余變量的影響。為此需要對已建立的多元回歸模型進行相關(guān)分析,包括立的多元回歸模型進行相關(guān)分析,包括復(fù)相復(fù)相關(guān)關(guān)和和偏相關(guān)偏相關(guān)。48(1)(1)復(fù)相關(guān)復(fù)相關(guān)在多變量情況下,復(fù)相關(guān)系數(shù)是用來測定因變量在多變量情況下,復(fù)相關(guān)系數(shù)是用來測定因變量 與一組自變量與一組自變量 之間相關(guān)程度的指標。其計之間相關(guān)程度的指標。其計算公式為:算公式為:12,mx xxy22,122()1()ii
29、ymiyyrRyy復(fù)相關(guān)系數(shù)的值域在復(fù)相關(guān)系數(shù)的值域在0 0到到1 1之間,它的值為之間,它的值為1 1,表明,表明 與與 之間存在嚴密的線性關(guān)系;它的值為之間存在嚴密的線性關(guān)系;它的值為0 0,則表明則表明 與與 之間不存在任何線性相關(guān)關(guān)之間不存在任何線性相關(guān)關(guān)系;它的取值在系;它的取值在0 0和和1 1之間時,表明變量之間存在一定的之間時,表明變量之間存在一定的線性相關(guān)關(guān)系。線性相關(guān)關(guān)系。y12,mxxx y12,mxxx 49(2)(2)偏相關(guān)偏相關(guān) 在多變量情況下,偏相關(guān)系數(shù)是用來測定當其他變在多變量情況下,偏相關(guān)系數(shù)是用來測定當其他變量保持不變的情況下,任意兩個變量之間相關(guān)程度的指量
30、保持不變的情況下,任意兩個變量之間相關(guān)程度的指標。它主要考察兩個變量之間的凈相關(guān)關(guān)系,從而反映標。它主要考察兩個變量之間的凈相關(guān)關(guān)系,從而反映現(xiàn)象之間的真實聯(lián)系。以兩個自變量的情形為例現(xiàn)象之間的真實聯(lián)系。以兩個自變量的情形為例: 12121222212(1)(1)yyyyrrrrrr21122122112(1)(1)yyyyrrrrrrx1和和y偏相關(guān)系數(shù):偏相關(guān)系數(shù): x2和和y偏相關(guān)系數(shù):偏相關(guān)系數(shù):50 回歸分析回歸分析是要通過樣本所估計的參數(shù)來代替總體是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù)。的真實參數(shù)。 在一次抽樣中,參數(shù)的估計值與真值的差異有多在一次抽樣中,參數(shù)的估計值與真值的
31、差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。主要包括主要包括擬合優(yōu)度檢驗擬合優(yōu)度檢驗、模型的、模型的顯著性檢驗顯著性檢驗和變和變量的量的顯著性檢驗顯著性檢驗,以及,以及預(yù)測預(yù)測。 8.3 8.3 回歸模型的統(tǒng)計檢驗和預(yù)測回歸模型的統(tǒng)計檢驗和預(yù)測 518.3.1 8.3.1 模型的擬合優(yōu)度檢驗?zāi)P偷臄M合優(yōu)度檢驗 對樣本回歸直線與樣本觀測值之對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。間擬合程度的檢驗。:判定系數(shù)判定系數(shù)(可決系數(shù)可決系數(shù))R R2 2問題:問題:采用普通最小二乘估計方法,已經(jīng)保證了采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合
32、了樣本觀測值,為什么還要檢驗?zāi)P妥詈玫財M合了樣本觀測值,為什么還要檢驗擬合程度?擬合程度?52 如果如果Y Yi i= =i i 即實際觀測值落在樣本回歸即實際觀測值落在樣本回歸“線線”上,則上,則擬合擬合最好最好??烧J為??烧J為, ,“離差離差”全部來自回歸線,而與全部來自回歸線,而與“殘差殘差”無無關(guān)。關(guān)。 53 對于所有樣本點,則需考慮這些點與樣本均值離對于所有樣本點,則需考慮這些點與樣本均值離差的平方和差的平方和, ,可以證明可以證明:記22)(YYyTSSii總體平方和總體平方和22()iiRSSyYY回歸平方和回歸平方和22()iiiESSeYY殘差平方和殘差平方和54TSS=RS
33、S+ESS Y的觀測值圍繞其均值的總離差總離差(total variation)可分解為兩部分:一部分來自回歸一部分來自回歸線線(RSS),另一部分則來自隨機勢力,另一部分則來自隨機勢力(ESS)。在給定樣本中,在給定樣本中,TSS不變,不變,如果實際觀測點離樣本回歸線越近,則如果實際觀測點離樣本回歸線越近,則RSS在在TSS中占的比重越大,因此中占的比重越大,因此 擬合優(yōu)度擬合優(yōu)度:回歸平方和:回歸平方和RSS/YRSS/Y的總離差的總離差TSSTSS5521R S SE S SRT S ST S S可決系數(shù)可決系數(shù)R R2 2統(tǒng)計量統(tǒng)計量 稱稱 R R2 2 為(樣本)為(樣本)可決系數(shù)可
34、決系數(shù)或或判定系數(shù)判定系數(shù) 可決系數(shù)可決系數(shù)的取值范圍:的取值范圍:00,11 R R2 2越接近越接近1 1,說明實際觀測點離樣本線,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。越近,擬合優(yōu)度越高。568.3.2 8.3.2 模型的顯著性檢驗?zāi)P偷娘@著性檢驗 模型的模型的顯著性檢驗顯著性檢驗,就是檢驗?zāi)P蛯傮w的近似程度,就是檢驗?zāi)P蛯傮w的近似程度,即檢驗因變量即檢驗因變量y y和模型中所以自變量的線性關(guān)系是否和模型中所以自變量的線性關(guān)系是否顯著。通常構(gòu)造顯著。通常構(gòu)造F F統(tǒng)計量進行檢驗,稱為統(tǒng)計量進行檢驗,稱為F F檢驗。檢驗。 對多元線性回歸模型對多元線性回歸模型01 122 1,2,
35、iiikkiiyxxxin57基本步驟如下:基本步驟如下: 1 1、提出假設(shè)、提出假設(shè)2 2、計算檢驗統(tǒng)計量:、計算檢驗統(tǒng)計量:3 3、對給定的顯著水平、對給定的顯著水平 確定臨界值確定臨界值4 4、得出檢驗結(jié)論:、得出檢驗結(jié)論:如果如果 ,則否定原假設(shè),表明回歸,則否定原假設(shè),表明回歸模型是顯著的;反之,就不能否定原假設(shè)。模型是顯著的;反之,就不能否定原假設(shè)。012112:0; :,0kkHH 至少有一個不等于/( ,1)/(1)SSR kFF k nkSSEnk( ,1)FFk nk( ,1)F k nk588.3.3 8.3.3 解釋變量的顯著性檢驗解釋變量的顯著性檢驗 變量的顯著性檢驗
36、變量的顯著性檢驗是判斷解釋變量是判斷解釋變量X X是否對被解釋是否對被解釋變量變量Y Y具有顯著的線性性影響,具有顯著的線性性影響,主要是針對變量的主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。參數(shù)真值是否為零來進行顯著性檢驗的。 多元線性回歸模型,多元線性回歸模型, 檢驗?zāi)硞€自變量檢驗?zāi)硞€自變量 x x 對對y y是否有顯著影響,進行解釋是否有顯著影響,進行解釋變量的顯著性檢驗。變量的顯著性檢驗。01 122 1,2,iiikkiiyxxxin59 檢驗步驟:檢驗步驟: 1 1、對總體參數(shù)提出假設(shè)、對總體參數(shù)提出假設(shè) 4 4、 比較,判斷比較,判斷 若若|t|t|t t /2/2(n-(n-k-1-k-1) ),則拒絕,則拒絕H H0 0 ,接受,接受H H1 1 ;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024藝術(shù)學(xué)校教室租賃與藝術(shù)展覽合作合同3篇
- 二零二五年度風(fēng)力發(fā)電設(shè)備安裝與運營合同3篇
- 2025年度貓咪品種引進與銷售代理合同4篇
- 二零二四年光伏發(fā)電項目爆破鉆孔合同
- 南昌市2025年度新建住宅買賣合同
- 二零二五版環(huán)保設(shè)施建設(shè)與運營合同3篇
- 2025年度餐飲企業(yè)知識產(chǎn)權(quán)保護合同18篇
- 年度超高純氣體的純化設(shè)備戰(zhàn)略市場規(guī)劃報告
- 2025版智能交通信號系統(tǒng)零星維修施工合同4篇
- 二零二五年度車輛抵押擔保信托合同范本3篇
- 稱量與天平培訓(xùn)試題及答案
- 超全的超濾與納濾概述、基本理論和應(yīng)用
- 2020年醫(yī)師定期考核試題與答案(公衛(wèi)專業(yè))
- 2022年中國育齡女性生殖健康研究報告
- 各種靜脈置管固定方法
- 消防報審驗收程序及表格
- 教育金規(guī)劃ppt課件
- 呼吸機波形分析及臨床應(yīng)用
- 常用緊固件選用指南
- 私人借款協(xié)議書新編整理版示范文本
- 自薦書(彩色封面)
評論
0/150
提交評論