第七章相關(guān)與回歸分析_第1頁
第七章相關(guān)與回歸分析_第2頁
第七章相關(guān)與回歸分析_第3頁
第七章相關(guān)與回歸分析_第4頁
第七章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、l 第一章第一章 總論總論l 第二章第二章 統(tǒng)計調(diào)查與統(tǒng)計整理統(tǒng)計調(diào)查與統(tǒng)計整理l 第三章綜合指標第三章綜合指標l 第四章參數(shù)估計第四章參數(shù)估計l 第五章假設(shè)檢驗第五章假設(shè)檢驗l 第六章第六章 方差分析方差分析l 第七章第七章 相關(guān)與回歸相關(guān)與回歸l 第八章第八章 時間序列時間序列l(wèi) 第九章第九章 指數(shù)指數(shù)統(tǒng)計分析統(tǒng)計分析第七章第七章 相關(guān)與回歸分析 【主要內(nèi)容主要內(nèi)容】l一、相關(guān)和回歸分析的基本概念l二、一元線性回歸分析l三、多元線性回歸分析l四、非線性回歸分析1、什么是相關(guān)?2、什么是相關(guān)分析?3、相關(guān)分析主要解決什么問題?第一節(jié)第一節(jié) 相關(guān)分析的意義和任務(wù)相關(guān)分析的意義和任務(wù) 一、相關(guān)關(guān)

2、系的概念一、相關(guān)關(guān)系的概念( (注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別) ) ( (一一) ) 函數(shù)關(guān)系函數(shù)關(guān)系 它它反映著現(xiàn)象之間存在著嚴格的依存關(guān)系,反映著現(xiàn)象之間存在著嚴格的依存關(guān)系,也就是具有確定性的對應(yīng)關(guān)系,這種關(guān)系可用一也就是具有確定性的對應(yīng)關(guān)系,這種關(guān)系可用一個數(shù)學(xué)表達式反映出來。個數(shù)學(xué)表達式反映出來。第一節(jié)第一節(jié) 相關(guān)分析的意義和任務(wù)相關(guān)分析的意義和任務(wù) 一、相關(guān)關(guān)系的概念一、相關(guān)關(guān)系的概念( (注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別) ) 例例如某種商品的銷售額和銷售量之間,由于價格因素,所以如某種商品的銷售額和銷售量之間,由于價格因素,所

3、以兩者可表現(xiàn)為嚴格的依存關(guān)系。兩者可表現(xiàn)為嚴格的依存關(guān)系。銷售額銷售額=銷售量銷售量價格價格例:圓的面積與半徑的關(guān)系;計件工資總額與零件數(shù)量;看書例:圓的面積與半徑的關(guān)系;計件工資總額與零件數(shù)量;看書時間和學(xué)習(xí)成績。時間和學(xué)習(xí)成績。出租汽車費用與行駛里程:出租汽車費用與行駛里程: 總費用總費用=行駛里程行駛里程 每公里單價每公里單價( (二二) ) 相關(guān)關(guān)系相關(guān)關(guān)系 它它反映著現(xiàn)象之間的數(shù)量上不嚴格的依存關(guān)系,反映著現(xiàn)象之間的數(shù)量上不嚴格的依存關(guān)系,也就是說兩者之間不具有確定性的對應(yīng)關(guān)系,這種關(guān)也就是說兩者之間不具有確定性的對應(yīng)關(guān)系,這種關(guān)系有二個明顯特點:系有二個明顯特點:1.1.現(xiàn)現(xiàn)象之間

4、確實存在數(shù)量上的依存關(guān)系,即某一社象之間確實存在數(shù)量上的依存關(guān)系,即某一社會經(jīng)濟現(xiàn)象變化要引起另一社會經(jīng)濟現(xiàn)象的變化;會經(jīng)濟現(xiàn)象變化要引起另一社會經(jīng)濟現(xiàn)象的變化;2.2.現(xiàn)現(xiàn)象之間的這種依存關(guān)系是不嚴格的,即無法用象之間的這種依存關(guān)系是不嚴格的,即無法用數(shù)學(xué)公式表示。數(shù)學(xué)公式表示。家庭收入與恩格爾系數(shù):家庭收入與恩格爾系數(shù): 家庭收入高,則恩格爾系數(shù)低。家庭收入高,則恩格爾系數(shù)低。相關(guān)關(guān)系相關(guān)關(guān)系商品價格和商品銷售量之間,存在著一商品價格和商品銷售量之間,存在著一定的依存關(guān)系,即商品價格發(fā)生變動,商品定的依存關(guān)系,即商品價格發(fā)生變動,商品的銷售量也會隨之發(fā)生變動。的銷售量也會隨之發(fā)生變動。 在

5、在具有相互依存關(guān)系的兩個變量中,作為具有相互依存關(guān)系的兩個變量中,作為根據(jù)的變量稱自變量,一般用根據(jù)的變量稱自變量,一般用X X表示;發(fā)生對表示;發(fā)生對應(yīng)變化的變量稱因變量,一般用應(yīng)變化的變量稱因變量,一般用y y表示。表示。例例二、相關(guān)關(guān)系的種類二、相關(guān)關(guān)系的種類 1.1.按按相關(guān)關(guān)系涉及的因素多少來分,可分為:相關(guān)關(guān)系涉及的因素多少來分,可分為: 單相關(guān)和復(fù)相關(guān)。單相關(guān)和復(fù)相關(guān)。 在實際工作中,如存在多個自變量,可抓住在實際工作中,如存在多個自變量,可抓住其中主要的自變量,研究其相關(guān)關(guān)系,而保持另其中主要的自變量,研究其相關(guān)關(guān)系,而保持另一些因素不變,這時復(fù)相關(guān)可轉(zhuǎn)化為一些因素不變,這時復(fù)

6、相關(guān)可轉(zhuǎn)化為偏相關(guān)偏相關(guān)。二因素之間的相關(guān)關(guān)系稱二因素之間的相關(guān)關(guān)系稱單相關(guān)單相關(guān),即只涉,即只涉及一個自變量和一個因變量。及一個自變量和一個因變量。三個或三個以上因素的相關(guān)關(guān)系稱三個或三個以上因素的相關(guān)關(guān)系稱復(fù)相關(guān)復(fù)相關(guān),或多元相關(guān),即涉及二個或二個以上的自變量和或多元相關(guān),即涉及二個或二個以上的自變量和因變量。因變量。2.2.按按相關(guān)關(guān)系的性質(zhì)來分,可分為相關(guān)關(guān)系的性質(zhì)來分,可分為: : 正相關(guān)和負相關(guān)正相關(guān)和負相關(guān)正相關(guān)正相關(guān)是指兩相關(guān)現(xiàn)象變化的方向是一致的。是指兩相關(guān)現(xiàn)象變化的方向是一致的。負相關(guān)負相關(guān)是指兩相關(guān)現(xiàn)象變化的方向是相反的。是指兩相關(guān)現(xiàn)象變化的方向是相反的。3. 3. 按按

7、相關(guān)關(guān)系的形式來分,可分為:相關(guān)關(guān)系的形式來分,可分為: 直線相關(guān)和曲線相關(guān)直線相關(guān)和曲線相關(guān) 直線相關(guān)直線相關(guān)是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量X X的數(shù)值發(fā)生變動時,因變量的數(shù)值發(fā)生變動時,因變量y y隨之發(fā)生近似于固定比隨之發(fā)生近似于固定比例的變動,在相關(guān)圖上的散點近似地表現(xiàn)為直線形式,例的變動,在相關(guān)圖上的散點近似地表現(xiàn)為直線形式,因此稱其為直線相關(guān)關(guān)系。因此稱其為直線相關(guān)關(guān)系。 曲線相關(guān)曲線相關(guān)是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量X X的數(shù)值發(fā)生變動時,因變量的數(shù)值發(fā)生變動時,因變量y y也隨之發(fā)生變動,但這也隨之發(fā)生變動,但這種變動

8、在數(shù)值上不成固定比例,在相關(guān)圖上的散點可種變動在數(shù)值上不成固定比例,在相關(guān)圖上的散點可表現(xiàn)為拋物線、指數(shù)曲線、雙曲線等形式,因此稱其表現(xiàn)為拋物線、指數(shù)曲線、雙曲線等形式,因此稱其為曲線相關(guān)關(guān)系。為曲線相關(guān)關(guān)系。4.4. 按按相關(guān)程度分,可分為:相關(guān)程度分,可分為: 完全相關(guān)、不完全相關(guān)和不相關(guān)完全相關(guān)、不完全相關(guān)和不相關(guān) 完全相關(guān)完全相關(guān)就是相關(guān)現(xiàn)象之間的關(guān)系是完全確定就是相關(guān)現(xiàn)象之間的關(guān)系是完全確定的關(guān)系,因而完全相關(guān)關(guān)系就是函數(shù)關(guān)系。的關(guān)系,因而完全相關(guān)關(guān)系就是函數(shù)關(guān)系。 不相關(guān)不相關(guān)是指兩現(xiàn)象之間在數(shù)量上的變化上各自是指兩現(xiàn)象之間在數(shù)量上的變化上各自獨立,互不影響。獨立,互不影響。 不完

9、全相關(guān)不完全相關(guān)就是介于完全相關(guān)和不相關(guān)之間的就是介于完全相關(guān)和不相關(guān)之間的一種相關(guān)關(guān)系。相關(guān)分析的對象主要是不完全相關(guān)一種相關(guān)關(guān)系。相關(guān)分析的對象主要是不完全相關(guān)關(guān)系。關(guān)系。三、相關(guān)分析的任務(wù)和內(nèi)容三、相關(guān)分析的任務(wù)和內(nèi)容 相關(guān)分析的主要任務(wù),概括起來是兩個方面:相關(guān)分析的主要任務(wù),概括起來是兩個方面:一方面一方面,研究現(xiàn)象之間關(guān)系的密切程度,即相,研究現(xiàn)象之間關(guān)系的密切程度,即相關(guān)分析;關(guān)分析;另一方面另一方面,研究自變量與因變量之間的變動關(guān),研究自變量與因變量之間的變動關(guān)系,即回歸分析。系,即回歸分析。相關(guān)分析的主要內(nèi)容包括以下五個方面:相關(guān)分析的主要內(nèi)容包括以下五個方面:1. 1. 判

10、判斷社會經(jīng)濟現(xiàn)象之間是否存在相互依存斷社會經(jīng)濟現(xiàn)象之間是否存在相互依存的關(guān)系,是直線相關(guān),還是曲線相關(guān),這的關(guān)系,是直線相關(guān),還是曲線相關(guān),這是相關(guān)分析的出發(fā)點;是相關(guān)分析的出發(fā)點;2. 2. 確確定相關(guān)關(guān)系的密切程度;定相關(guān)關(guān)系的密切程度;3. 3. 測測定兩個變量之間的一般關(guān)系值;定兩個變量之間的一般關(guān)系值;4. 4. 測測定因變量估計值和實際值之間的差異,定因變量估計值和實際值之間的差異,用以反映因變量估計值的可靠程度;用以反映因變量估計值的可靠程度;5. 5. 相相關(guān)系數(shù)的顯著性檢驗。關(guān)系數(shù)的顯著性檢驗。四、相關(guān)分析和回歸分析四、相關(guān)分析和回歸分析 研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法:

11、研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法:相關(guān)分析相關(guān)分析,用一個指標來表明現(xiàn)象間相互依存,用一個指標來表明現(xiàn)象間相互依存關(guān)系的密切程度關(guān)系的密切程度回歸分析回歸分析,就是根據(jù)相關(guān)關(guān)系的具體形態(tài),選,就是根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型,來近似地表達變量間的平均擇一個合適的數(shù)學(xué)模型,來近似地表達變量間的平均變化變化相關(guān)分析和回歸分析的區(qū)別相關(guān)分析和回歸分析的區(qū)別l 1 兩者在關(guān)心變量性質(zhì)上的不同。 在回歸分析中,必須將變量分為自變量和因變量,以便建立回歸方程;也必須將變量分為確定性變量和隨機變量,以便研究隨機變量的分布以及對其進行統(tǒng)計推斷。區(qū)分變量的性質(zhì)是回歸分析的前提條件,是回歸分析

12、中首先要解決的一個問題。 2 2 兩者的任務(wù)和目的不同。兩者的任務(wù)和目的不同。 回歸分析是根據(jù)現(xiàn)象之間關(guān)系的特點,運回歸分析是根據(jù)現(xiàn)象之間關(guān)系的特點,運用一定的辦法,建立最適合于變量之間關(guān)系的用一定的辦法,建立最適合于變量之間關(guān)系的回歸方程,而且隨著變量的變換,回歸方程也回歸方程,而且隨著變量的變換,回歸方程也會隨之改變,回歸方程是用來反映變量之間數(shù)會隨之改變,回歸方程是用來反映變量之間數(shù)量的平均變動關(guān)系,進而對因變量進行估算或量的平均變動關(guān)系,進而對因變量進行估算或預(yù)測。預(yù)測。 相關(guān)分析是通過計算相關(guān)指標,用來反映相關(guān)分析是通過計算相關(guān)指標,用來反映回歸方程所表明變量之間依存關(guān)系的密切程度,

13、回歸方程所表明變量之間依存關(guān)系的密切程度,是不能進行估算和預(yù)測的。是不能進行估算和預(yù)測的。 3 3 兩者的使用范圍不同。兩者的使用范圍不同。 回歸分析只限于研究數(shù)量標志之間或指標之間的回歸分析只限于研究數(shù)量標志之間或指標之間的數(shù)量關(guān)系,對于品質(zhì)標志之間和等級之間的關(guān)系在沒數(shù)量關(guān)系,對于品質(zhì)標志之間和等級之間的關(guān)系在沒有數(shù)量化之前是無法研究的。有數(shù)量化之前是無法研究的。 相關(guān)分析研究范圍比回歸分析研究的范圍要廣泛相關(guān)分析研究范圍比回歸分析研究的范圍要廣泛得多。從研究的范圍來看,可以說,凡是能夠進行回得多。從研究的范圍來看,可以說,凡是能夠進行回歸分析的,都能夠也必須進行相關(guān)分析,而能夠進行歸分析

14、的,都能夠也必須進行相關(guān)分析,而能夠進行相關(guān)分析的,卻不一定能夠或不都需要進行回歸分析,相關(guān)分析的,卻不一定能夠或不都需要進行回歸分析,回歸分析總需要相關(guān)分析的幫助,而相關(guān)分析卻不一回歸分析總需要相關(guān)分析的幫助,而相關(guān)分析卻不一定需要回歸分析的幫助,相關(guān)分析具有獨立性。定需要回歸分析的幫助,相關(guān)分析具有獨立性。 相關(guān)分析和回歸分析的聯(lián)系第二節(jié)第二節(jié) 簡單線性相關(guān)分析簡單線性相關(guān)分析 一、相關(guān)表和相關(guān)圖一、相關(guān)表和相關(guān)圖相關(guān)圖,也稱散布圖相關(guān)圖,也稱散布圖( (或散點圖或散點圖) )。 簡簡單單相相關(guān)關(guān)表表 根根據(jù)據(jù)總總體體單單位位的的原原始始資資料料匯匯編編的的相相關(guān)關(guān)表表分分組組相相關(guān)關(guān)表表

15、 將將原原始始資資料料進進行行分分組組而而編編制制的的相相關(guān)關(guān)表表單單變變量量分分組組表表 按按自自變變量量分分組組 雙雙變變量量分分組組表表 按按自自變變量量和和因因變變量量均均分分組組相相關(guān)關(guān)表表的的種種類類定性分析定性分析定量分析定量分析相關(guān)表和相關(guān)圖的作用:相關(guān)表和相關(guān)圖的作用:相關(guān)表的編制相關(guān)表的編制1 1、編制相關(guān)表前首先要通過實際調(diào)查取得一系、編制相關(guān)表前首先要通過實際調(diào)查取得一系列成對的標志值資料作為相關(guān)分析的原始數(shù)據(jù)。列成對的標志值資料作為相關(guān)分析的原始數(shù)據(jù)。2 2、相關(guān)表的分類:、相關(guān)表的分類:l 簡單相關(guān)表簡單相關(guān)表是資料未經(jīng)分組的相關(guān)表,它是把是資料未經(jīng)分組的相關(guān)表,它

16、是把因素標志值按照從小到大的順序并配合結(jié)果標因素標志值按照從小到大的順序并配合結(jié)果標志值一一對應(yīng)而平行排列起來的統(tǒng)計表。志值一一對應(yīng)而平行排列起來的統(tǒng)計表。l 分組相關(guān)表分組相關(guān)表是在簡單相關(guān)表的基礎(chǔ)上,將原始是在簡單相關(guān)表的基礎(chǔ)上,將原始數(shù)據(jù)進行分組而編成的統(tǒng)計表。數(shù)據(jù)進行分組而編成的統(tǒng)計表。、單變量分組相關(guān)表單變量分組相關(guān)表自變量分組并計算次數(shù),而對應(yīng)的因變量不分組,自變量分組并計算次數(shù),而對應(yīng)的因變量不分組,只計算其平均值。只計算其平均值。單變量分組相關(guān)表的特點:使冗長的資料簡化,單變量分組相關(guān)表的特點:使冗長的資料簡化,能夠更清晰地反映出兩變量之間相關(guān)關(guān)系。能夠更清晰地反映出兩變量之間

17、相關(guān)關(guān)系。、雙變量分組相關(guān)表:雙變量分組相關(guān)表:自變量和因變量都進行分組而制成的相關(guān)表,這自變量和因變量都進行分組而制成的相關(guān)表,這種表形似棋盤,故又稱棋盤式相關(guān)表。種表形似棋盤,故又稱棋盤式相關(guān)表。相關(guān)圖的編制相關(guān)圖的編制1 1、相關(guān)圖:相關(guān)圖:利用直角坐標系第一象限,把自變利用直角坐標系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量置于橫軸上,因變量置于縱軸上,而將兩變量相對應(yīng)的變量值用坐標點形式描繪出來,用量相對應(yīng)的變量值用坐標點形式描繪出來,用以表明相關(guān)點分布狀況的圖形。以表明相關(guān)點分布狀況的圖形。2 2、相關(guān)圖被形象地稱為、相關(guān)圖被形象地稱為相關(guān)散點圖相關(guān)散點圖3 3、因

18、素標志分了組,結(jié)果標志表現(xiàn)為組平均數(shù),、因素標志分了組,結(jié)果標志表現(xiàn)為組平均數(shù),所繪制的相關(guān)圖就是一條折線,這種折線又叫所繪制的相關(guān)圖就是一條折線,這種折線又叫相關(guān)曲線。相關(guān)曲線。正正 相相 關(guān)關(guān)負負 相相 關(guān)關(guān)曲線相關(guān)曲線相關(guān)不不 相相 關(guān)關(guān)xyxyxyxy又稱又稱,用直角坐標系的,用直角坐標系的x軸代表自變量,軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標點的形式描繪出來,用以表明相關(guān)值用坐標點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。點分布狀況的圖形。 某市1996年 2003年的工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額的資料,說明簡單相

19、關(guān)表和相關(guān)圖的編制方法。 從表可看出,隨著工資性現(xiàn)金支出的增加,城鎮(zhèn)儲蓄存款余額有明顯的增長趨勢。所以,資料表明(如圖)有明顯的直線相關(guān)趨勢。序號年份工資性現(xiàn)金支出(萬元)x城鎮(zhèn)儲蓄存款余額(萬元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510例例1 1簡單相關(guān)表簡單相關(guān)表企業(yè)按銷售額分組(萬元)流通費用率(%)4以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.

20、6032 366.5866.577.588.599.51004812162024283236銷售額(萬元)流通費用率(%)例例2 2分組相關(guān)表分組相關(guān)表二、相關(guān)系數(shù)二、相關(guān)系數(shù) 相相關(guān)系數(shù)是在直線相關(guān)條件下,表明兩關(guān)系數(shù)是在直線相關(guān)條件下,表明兩個現(xiàn)象之間相關(guān)關(guān)系的方向和密切程度的綜個現(xiàn)象之間相關(guān)關(guān)系的方向和密切程度的綜合性指標。一般用符號合性指標。一般用符號r r表示。表示。r r的測定方法:的測定方法:2222221 ()()11 () ()()() ()()1.xyxyxyxyrxxyynxxyynnxxyyrxxyy 積積差差法法:仍以上例1資料計算:序號年份x(萬元)y(萬元)119

21、96 500120-310-155 96100 240254805021997 540140-270-135 72900 182253645031998 620150-190-125 36100 156252375041999 730200 -80 -75 6400 5625 600052000 900280 90 5 8100 25 45062001 970350 160 75 25600 562512000720021050450 240175 57600 3062542000820031170510 360235129600 5522584600合計6480 2200-432400155

22、000 253300yyxx2yy 2xxyy xx經(jīng)過計算,表明該市工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額之間存在著高度正相關(guān)。98. 0155000432400253300)()()()(27582200 ),(8108648022yyxxyyxxrnyynxx萬元萬元r rr rr rr r0.30.3時時,沒沒有有關(guān)關(guān)系系;0.30.3 0.50.5時時,稱稱低低度度相相關(guān)關(guān);0.50.5 0.80.8時時,稱稱顯顯著著相相關(guān)關(guān)( (或或中中度度相相關(guān)關(guān)) );0.80.8時時,稱稱高高度度相相關(guān)關(guān);一一般般標標準準如如下下:對對r r的解釋如下:的解釋如下:( (即即r r的特點的特點)

23、)(1) (1) r r取正值或負值決定于分子協(xié)方差;取正值或負值決定于分子協(xié)方差;(2) (2) r r的絕對值,在的絕對值,在0 0與與1 1之間;之間;(3) (3) r r的絕對值大小,可說明現(xiàn)象之間相關(guān)關(guān)系的緊的絕對值大小,可說明現(xiàn)象之間相關(guān)關(guān)系的緊密程度。密程度。積差法公式進一步化簡如下:積差法公式進一步化簡如下: 22222222222222222222 xxxxxxxxxxnnxxxxxnnnyyyynxyxxyyxynxyxynrxyxynn 同同理理:Q Q2.2.簡捷法簡捷法 22222222 xyxynrxyxynnnxyxynxxnyy 2222)(1)(11ynyx

24、nxyxnxyr資料計算如下: 98. 0111418592026400220076000086480568120082200648020353008 222222)(1)(11 ynyxnxyxnxyr序號年份x(萬元)y(萬元)x2y2xy11996 500120 250000 14400 6000021997 540140 291600 19600 7500031998 620150 384400 22500 9300041999 730200 532900 4000014600052000 900280 810000 7840025200062001 970350 9409001225

25、0033950072002105045011025002025004725008200311705101368900260100596700合計6480 22005681200760000 20353003.3.從單變量分組表計算相關(guān)系數(shù)從單變量分組表計算相關(guān)系數(shù) 22()()()() , xxyy frxxfyyfxfyfxyff 積積差差法法:其其中中: 2222fxyfxfyfrfx fxffy fyf 簡簡捷捷法法:三、簡單線性相關(guān)分析的特點三、簡單線性相關(guān)分析的特點 通過對通過對r r的計算方法的討論,可看出二個明顯特點:的計算方法的討論,可看出二個明顯特點:2. 2. 相相關(guān)關(guān)系中

26、只能計算出一個相關(guān)系數(shù)關(guān)關(guān)系中只能計算出一個相關(guān)系數(shù)r r。1. 1. 相相關(guān)關(guān)系中,兩個變量不必定出哪個是自變量,哪關(guān)關(guān)系中,兩個變量不必定出哪個是自變量,哪個是因變量,因此,相關(guān)的兩個變量都是隨機變量;個是因變量,因此,相關(guān)的兩個變量都是隨機變量;3、相關(guān)系數(shù)與判定系數(shù)在在的條件下,用以反的條件下,用以反映映兩變量兩變量 間間 密切程度密切程度的統(tǒng)計指標,用的統(tǒng)計指標,用r表示表示2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxy r r2 2 越接近于越接近于1 1,表明,表明x x與與y y之間的相關(guān)性越強;之間的相關(guān)性越強; r r2 2 越接近于越接近于

27、0 0,表明兩個變量之間幾乎沒有,表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系直線相關(guān)關(guān)系. .相關(guān)系數(shù)與判定系數(shù)是相關(guān)系數(shù)的平方,用是相關(guān)系數(shù)的平方,用 r r2 2 表示;用表示;用來衡量回歸方程對來衡量回歸方程對y y的解釋程度。的解釋程度。102 r判定系數(shù)取值范圍:判定系數(shù)取值范圍:第三節(jié)第三節(jié) 回歸分析回歸分析 一、回歸分析的概念和種類一、回歸分析的概念和種類二、一元線性回歸分析二、一元線性回歸分析三、多元線性回歸分析三、多元線性回歸分析四、非線性回歸分析四、非線性回歸分析一、回歸分析的概念和種類一、回歸分析的概念和種類什么是回歸?什么是回歸?什么是回歸分析?什么是回歸分析?回歸分析的種類

28、回歸分析的種類 1、回歸分析按變量的多少可分為:簡單回歸 復(fù)回歸2、回歸分析按回歸的形式可分為: 線性回歸: 一元線性回歸 多元線性回歸 非線性回歸(一)標準的一元線性回歸模型(二)一元線性回歸模型的估計(三)一元線性回歸模型的擬合優(yōu)度(四)一元線性回歸模型的檢驗 (五)一元線性回歸模型預(yù)測 二、 一元線性回歸分析一元線性回歸分析 (一)標準的一元線性回歸模型l 1、 回歸函數(shù)l 總體回歸函數(shù) t01tut u t是隨機誤差項,又稱隨機干擾項,它是一個特殊的隨機變量,反映未列入方程式的其他各種因素對的影響。l 樣本回歸函數(shù): ,. n t稱為殘差,在概念上,t與總體誤差項ut相互對應(yīng);是樣本的

29、容量。teXY10(t)01tXYtY 。 。 。ut 樣本回歸函數(shù)與總體回歸函數(shù)區(qū)別樣本回歸函數(shù)與總體回歸函數(shù)區(qū)別l總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。每抽取一組樣本,便可以擬合一條樣本回歸線。l總體回歸函數(shù)中的總體回歸函數(shù)中的 1 1和和 2 2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的中的 是隨機變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變是隨機變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動。動。l總體回歸函數(shù)中的總體

30、回歸函數(shù)中的u ut t是是t t與未知的總體回歸線之間的縱向距離,它是不與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數(shù)中的可直接觀測的。而樣本回歸函數(shù)中的t t是是t t與樣本回歸線之間的縱向與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計算出距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計算出t t的具體的具體數(shù)值。數(shù)值。10和誤差項的標準假定誤差項的標準假定l假定假定: 誤差項的期望值為零誤差項的期望值為零: : (u ut t) 。l假定假定:誤差項的方差為常數(shù):誤差項的方差為常數(shù): Var(u: Var(ut t) ) 。l假定假定:

31、誤差項之間不存在序列相關(guān)誤差項之間不存在序列相關(guān), ,協(xié)方差為零協(xié)方差為零: : Cov(u Cov(ut tu us s) ) ( ( ) ) 。l假定假定:自變量是給定變量,與誤差項線性無關(guān)。:自變量是給定變量,與誤差項線性無關(guān)。l假定假定:隨機誤差項服從正態(tài)分布。:隨機誤差項服從正態(tài)分布。 滿足以上標準假定的一元線性回歸模型,稱為標準的一元線滿足以上標準假定的一元線性回歸模型,稱為標準的一元線性回歸模型。性回歸模型。2(二)一元線性回歸模型的估計)(YEX截距截距斜率斜率一元線性回歸方程的可能形態(tài)一元線性回歸方程的可能形態(tài) 1為正為正 1為負為負 1為為0 xy10 XYEY21 以樣本

32、統(tǒng)計量估計總體參數(shù)以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))斜率(回歸系數(shù))截距截距截距截距 表示在沒有自變量表示在沒有自變量x的影響時,其它各種因素的影響時,其它各種因素對因變量對因變量y的平均影響;的平均影響;回歸系數(shù)回歸系數(shù) 表明自變量表明自變量x每變每變動一個單位,因變量動一個單位,因變量y平均變動平均變動 個單位。個單位。xy10估計的一元估計的一元線性回歸方程線性回歸方程011估計值的特性: min) (02yyyy最小最小平方法平方法利用殘差平方和為最小來估計回歸系數(shù)利用殘差平方和為最小來估計回歸系數(shù)的一種方法,又稱最小二乘法。的一種方法,又稱最小二乘法。組整理后,得到正規(guī)方程應(yīng)滿

33、足下列方程組極值的原理根據(jù)微積分中求求極值問題求解過程實際上是一個的最小二乘估計。,就稱為依照上式求出(滿足下式即為所謂最小二乘法 0)xx(-y2Q0)x(-y2Q:,)x-ymin)x(-yQ:,n1iii10i1n1ii10i0101010n1i2i10i,n1i2i10i1010n1i2ixxn1iiixyxxxy110n1iii1n1i2i0n1iin1ii1n1ii)x-(xL, )y-)(yx-(xLLLx-yyxxxyxn其中,解正規(guī)方程組得l根據(jù)整理方程簡化可得:XYnXnYXXnYXnttttttttYX110221 )(nxnyxxnyxxyn 10221能源消耗量工業(yè)總

34、產(chǎn)值(十萬噸)x(億元)y35352424383825254040242442422828494932325252313154543737595940406262414164644040656547476868505069694949717151517272484876765858916916625625nxnyxnxyxnxyynyxnxyxnxyr 10221222211)(1)(119520. 09757. 09757. 0625261751691655086166259163788716)(26175,55086,37887,625,916,162222222222 ryynxxnyx

35、xynryxxyyxn解:已知結(jié)論:結(jié)論:工業(yè)總產(chǎn)值與能源消耗量之間存工業(yè)總產(chǎn)值與能源消耗量之間存在高度的正相關(guān)關(guān)系,能源消耗量在高度的正相關(guān)關(guān)系,能源消耗量x的變的變化能夠解釋工業(yè)總產(chǎn)值化能夠解釋工業(yè)總產(chǎn)值y變化的變化的95.2。,55086,37887,625,916,162xxyyxn由計算表知xy105142. 6169167961. 0166257961. 091655086166259163788716212222 xyxxnyxxynxy7961.05142.6(三)一元線性回歸模型的擬合優(yōu)度 l擬合優(yōu)度,是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。l 1、可決系數(shù)l 用于度量

36、回歸直線的擬合程度,可決系數(shù)是建立在對總離差平方和進行分解的基礎(chǔ)上的。l 2、估計標準誤(從另一個側(cè)面反映回歸線的擬合程度)l 用來測度各實際觀測點在直線周圍的散布狀況,也稱估計量的標準差或標準誤差yy yytyytyy2)(yySSTt2) (yySSEt2) (yySSR誤差平方和誤差平方和回歸回歸平方和平方和總離差平總離差平方和方和 222)()(yyntSSTyy2222)()()( xxnyxxyntSSRyy2102)()(xyyySSEtt總離差平方和總離差平方和回歸平方和回歸平方和殘差平方和殘差平方和222)() (11yyyySSTSSESSTSSRr可決系數(shù)可決系數(shù)可決系數(shù)

37、的性質(zhì):(1)可決系數(shù)具有非負性。(2)可決系數(shù)的取值范圍為(0,1)(3)可決系數(shù)是樣本觀測值的函數(shù),是一個統(tǒng)計量??蓻Q系數(shù)與相關(guān)系數(shù)的關(guān)系)()()(222222yynxxnyxxynr2222)()(yynxxnyxxynr21)(rr的符號可決系數(shù)與相關(guān)系數(shù)的區(qū)別無方向性,無方向性,則有方向,則有方向,其方向與樣本回歸系數(shù)其方向與樣本回歸系數(shù) b 相同;相同;說明變量值的總離差平方和中可說明變量值的總離差平方和中可以用回歸線來解釋的比例,以用回歸線來解釋的比例,只說明只說明兩變量間關(guān)聯(lián)程度及方向;兩變量間關(guān)聯(lián)程度及方向;有夸大變量間相關(guān)程度的傾向,有夸大變量間相關(guān)程度的傾向,因而因而是

38、更好的度量值。是更好的度量值??傮w方差的估計222 netS0 te0ttXe該式中,分母是自由度,其中是樣該式中,分母是自由度,其中是樣本觀測值的個數(shù),是一元線性回歸本觀測值的個數(shù),是一元線性回歸方程中回歸系數(shù)的個數(shù)。在一元線性方程中回歸系數(shù)的個數(shù)。在一元線性回歸模型中,殘差回歸模型中,殘差t t必須滿足必須滿足: :因而失去了兩個自由度,所以其自由度為因而失去了兩個自由度,所以其自由度為。 2 2 的正平方根又稱做的正平方根又稱做回歸估計標準誤差回歸估計標準誤差可利用它做可利用它做區(qū)間估計區(qū)間估計。總體方差的估計回歸估計標準誤差回歸估計標準誤差 ( S ) 是因變量各實際值與其估計值之間的

39、是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實平均差異程度,表明其估計值對各實際值代表性的強弱;其值越小,回歸際值代表性的強弱;其值越小,回歸方程的代表性越強,用回歸方程估計方程的代表性越強,用回歸方程估計或預(yù)測的結(jié)果越準確。或預(yù)測的結(jié)果越準確??傮w方差的估計22) (1022nxyyynyyS回歸估計標準誤差的簡化計算:回歸估計標準誤差的簡化計算:回歸估計標準誤差的計算:億元,且知解:已知457.227961.0,5142.626175,37887,625,16102y212nxyyySyxyyn(四)一元線性回歸模型的檢驗 l 線性關(guān)系的檢驗 對整個回歸方程的顯著性檢驗,通常采用在方差分析基礎(chǔ)上的 F 檢驗。l 回歸系數(shù)的檢驗l 對各回歸系數(shù)的顯著性檢驗,通常采用 t 檢驗;l 在一元線性回歸模型中,由于只有一個解釋變量,對回歸系數(shù)的 t 檢驗與對整個方程的F檢驗是等價的。l 回歸系數(shù)的顯著性檢驗,就是根據(jù)樣本估計的結(jié)果對總體回歸系數(shù)的有關(guān)假設(shè)進行檢驗。 )2(1111n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論