第七章相關(guān)與回歸分析_第1頁
第七章相關(guān)與回歸分析_第2頁
第七章相關(guān)與回歸分析_第3頁
第七章相關(guān)與回歸分析_第4頁
第七章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩84頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)第一章總論第二章統(tǒng)計調(diào)查與統(tǒng)計整理第三章綜合指標(biāo)第四章參數(shù)估計第五章假設(shè)檢驗第六章方差分析第七章相關(guān)與回歸第八章時間序列第九章指數(shù)統(tǒng)計分析第七章相關(guān)與回歸分析

【主要內(nèi)容】一、相關(guān)和回歸分析的基本概念二、一元線性回歸分析三、多元線性回歸分析四、非線性回歸分析1、什么是相關(guān)?

2、什么是相關(guān)分析?

3、相關(guān)分析主要解決什么問題?

第一節(jié)相關(guān)分析的意義和任務(wù)

一、相關(guān)關(guān)系的概念(注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別)

(一)函數(shù)關(guān)系

它反映著現(xiàn)象之間存在著嚴(yán)格的依存關(guān)系,也就是具有確定性的對應(yīng)關(guān)系,這種關(guān)系可用一個數(shù)學(xué)表達(dá)式反映出來。第一節(jié)相關(guān)分析的意義和任務(wù)

一、相關(guān)關(guān)系的概念(注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別)

例如某種商品的銷售額和銷售量之間,由于價格因素,所以兩者可表現(xiàn)為嚴(yán)格的依存關(guān)系。銷售額=銷售量×價格例:圓的面積與半徑的關(guān)系;計件工資總額與零件數(shù)量;看書時間和學(xué)習(xí)成績。出租汽車費用與行駛里程:總費用=行駛里程每公里單價函數(shù)關(guān)系確定性關(guān)系(二)相關(guān)關(guān)系

它反映著現(xiàn)象之間的數(shù)量上不嚴(yán)格的依存關(guān)系,也就是說兩者之間不具有確定性的對應(yīng)關(guān)系,這種關(guān)系有二個明顯特點:1.現(xiàn)象之間確實存在數(shù)量上的依存關(guān)系,即某一社會經(jīng)濟(jì)現(xiàn)象變化要引起另一社會經(jīng)濟(jì)現(xiàn)象的變化;2.現(xiàn)象之間的這種依存關(guān)系是不嚴(yán)格的,即無法用數(shù)學(xué)公式表示。家庭收入與恩格爾系數(shù):家庭收入高,則恩格爾系數(shù)低。相關(guān)關(guān)系非確定性關(guān)系商品價格和商品銷售量之間,存在著一定的依存關(guān)系,即商品價格發(fā)生變動,商品的銷售量也會隨之發(fā)生變動。

在具有相互依存關(guān)系的兩個變量中,作為根據(jù)的變量稱自變量,一般用X表示;發(fā)生對應(yīng)變化的變量稱因變量,一般用y表示。例二、相關(guān)關(guān)系的種類

1.按相關(guān)關(guān)系涉及的因素多少來分,可分為:

單相關(guān)和復(fù)相關(guān)。

在實際工作中,如存在多個自變量,可抓住其中主要的自變量,研究其相關(guān)關(guān)系,而保持另一些因素不變,這時復(fù)相關(guān)可轉(zhuǎn)化為偏相關(guān)。二因素之間的相關(guān)關(guān)系稱單相關(guān),即只涉及一個自變量和一個因變量。三個或三個以上因素的相關(guān)關(guān)系稱復(fù)相關(guān),或多元相關(guān),即涉及二個或二個以上的自變量和因變量。2.按相關(guān)關(guān)系的性質(zhì)來分,可分為:

正相關(guān)和負(fù)相關(guān)正相關(guān)是指兩相關(guān)現(xiàn)象變化的方向是一致的。

負(fù)相關(guān)是指兩相關(guān)現(xiàn)象變化的方向是相反的。3.按相關(guān)關(guān)系的形式來分,可分為:

直線相關(guān)和曲線相關(guān)

直線相關(guān)是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量X的數(shù)值發(fā)生變動時,因變量y隨之發(fā)生近似于固定比例的變動,在相關(guān)圖上的散點近似地表現(xiàn)為直線形式,因此稱其為直線相關(guān)關(guān)系。

曲線相關(guān)是指兩個相關(guān)現(xiàn)象之間,當(dāng)自變量X的數(shù)值發(fā)生變動時,因變量y也隨之發(fā)生變動,但這種變動在數(shù)值上不成固定比例,在相關(guān)圖上的散點可表現(xiàn)為拋物線、指數(shù)曲線、雙曲線等形式,因此稱其為曲線相關(guān)關(guān)系。4.

按相關(guān)程度分,可分為:

完全相關(guān)、不完全相關(guān)和不相關(guān)

完全相關(guān)就是相關(guān)現(xiàn)象之間的關(guān)系是完全確定的關(guān)系,因而完全相關(guān)關(guān)系就是函數(shù)關(guān)系。

不相關(guān)是指兩現(xiàn)象之間在數(shù)量上的變化上各自獨立,互不影響。

不完全相關(guān)就是介于完全相關(guān)和不相關(guān)之間的一種相關(guān)關(guān)系。相關(guān)分析的對象主要是不完全相關(guān)關(guān)系。三、相關(guān)分析的任務(wù)和內(nèi)容

相關(guān)分析的主要任務(wù),概括起來是兩個方面:一方面,研究現(xiàn)象之間關(guān)系的密切程度,即相關(guān)分析;另一方面,研究自變量與因變量之間的變動關(guān)系,即回歸分析。相關(guān)分析的主要內(nèi)容包括以下五個方面:1.判斷社會經(jīng)濟(jì)現(xiàn)象之間是否存在相互依存的關(guān)系,是直線相關(guān),還是曲線相關(guān),這是相關(guān)分析的出發(fā)點;2.確定相關(guān)關(guān)系的密切程度;3.測定兩個變量之間的一般關(guān)系值;4.測定因變量估計值和實際值之間的差異,用以反映因變量估計值的可靠程度;5.相關(guān)系數(shù)的顯著性檢驗。四、相關(guān)分析和回歸分析

研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法:相關(guān)分析,用一個指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度回歸分析,就是根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型,來近似地表達(dá)變量間的平均變化關(guān)系。相關(guān)分析和回歸分析的區(qū)別

1兩者在關(guān)心變量性質(zhì)上的不同。在回歸分析中,必須將變量分為自變量和因變量,以便建立回歸方程;也必須將變量分為確定性變量和隨機(jī)變量,以便研究隨機(jī)變量的分布以及對其進(jìn)行統(tǒng)計推斷。區(qū)分變量的性質(zhì)是回歸分析的前提條件,是回歸分析中首先要解決的一個問題。

相關(guān)分析中兩變量是對等的,都是隨機(jī)變量,不區(qū)分自變量和因變量.

2兩者的任務(wù)和目的不同。回歸分析是根據(jù)現(xiàn)象之間關(guān)系的特點,運用一定的辦法,建立最適合于變量之間關(guān)系的回歸方程,而且隨著變量的變換,回歸方程也會隨之改變,回歸方程是用來反映變量之間數(shù)量的平均變動關(guān)系,進(jìn)而對因變量進(jìn)行估算或預(yù)測。相關(guān)分析是通過計算相關(guān)指標(biāo),用來反映回歸方程所表明變量之間依存關(guān)系的密切程度,是不能進(jìn)行估算和預(yù)測的。

3兩者的使用范圍不同。回歸分析只限于研究數(shù)量標(biāo)志之間或指標(biāo)之間的數(shù)量關(guān)系,對于品質(zhì)標(biāo)志之間和等級之間的關(guān)系在沒有數(shù)量化之前是無法研究的。相關(guān)分析研究范圍比回歸分析研究的范圍要廣泛得多。從研究的范圍來看,可以說,凡是能夠進(jìn)行回歸分析的,都能夠也必須進(jìn)行相關(guān)分析,而能夠進(jìn)行相關(guān)分析的,卻不一定能夠或不都需要進(jìn)行回歸分析,回歸分析總需要相關(guān)分析的幫助,而相關(guān)分析卻不一定需要回歸分析的幫助,相關(guān)分析具有獨立性。相關(guān)分析和回歸分析的聯(lián)系

相關(guān)分析需要回歸分析來表明現(xiàn)象數(shù)量關(guān)系的具體形式,而回歸分析是建立在相關(guān)分析的基礎(chǔ)上,需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的程度,只有當(dāng)變量之間存在高度相關(guān)時,回歸分析才有意義。第二節(jié)簡單線性相關(guān)分析

一、相關(guān)表和相關(guān)圖相關(guān)圖,也稱散布圖(或散點圖)。相關(guān)表的種類定性分析依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。相關(guān)表和相關(guān)圖的作用:相關(guān)關(guān)系的測定相關(guān)表的編制1、編制相關(guān)表前首先要通過實際調(diào)查取得一系列成對的標(biāo)志值資料作為相關(guān)分析的原始數(shù)據(jù)。2、相關(guān)表的分類:簡單相關(guān)表是資料未經(jīng)分組的相關(guān)表,它是把因素標(biāo)志值按照從小到大的順序并配合結(jié)果標(biāo)志值一一對應(yīng)而平行排列起來的統(tǒng)計表。分組相關(guān)表是在簡單相關(guān)表的基礎(chǔ)上,將原始數(shù)據(jù)進(jìn)行分組而編成的統(tǒng)計表。①、單變量分組相關(guān)表自變量分組并計算次數(shù),而對應(yīng)的因變量不分組,只計算其平均值。單變量分組相關(guān)表的特點:使冗長的資料簡化,能夠更清晰地反映出兩變量之間相關(guān)關(guān)系。②、雙變量分組相關(guān)表:自變量和因變量都進(jìn)行分組而制成的相關(guān)表,這種表形似棋盤,故又稱棋盤式相關(guān)表。相關(guān)圖的編制1、相關(guān)圖:利用直角坐標(biāo)系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對應(yīng)的變量值用坐標(biāo)點形式描繪出來,用以表明相關(guān)點分布狀況的圖形。2、相關(guān)圖被形象地稱為相關(guān)散點圖3、因素標(biāo)志分了組,結(jié)果標(biāo)志表現(xiàn)為組平均數(shù),所繪制的相關(guān)圖就是一條折線,這種折線又叫相關(guān)曲線。正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散點圖,用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。相關(guān)圖某市1996年—2003年的工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額的資料,說明簡單相關(guān)表和相關(guān)圖的編制方法。從表可看出,隨著工資性現(xiàn)金支出的增加,城鎮(zhèn)儲蓄存款余額有明顯的增長趨勢。所以,資料表明(如圖)有明顯的直線相關(guān)趨勢。序號年份工資性

現(xiàn)金支出(萬元)x城鎮(zhèn)儲蓄存款余額(萬元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510例1簡單相關(guān)表企業(yè)按銷售額分組(萬元)流通費用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2分組相關(guān)表二、相關(guān)系數(shù)

相關(guān)系數(shù)是在直線相關(guān)條件下,表明兩個現(xiàn)象之間相關(guān)關(guān)系的方向和密切程度的綜合性指標(biāo)。一般用符號r表示。r的測定方法:仍以上例1資料計算:序號年份x(萬元)y(萬元)11996500120-310-15596100240254805021997540140-270-13572900182253645031998620150-190-12536100156252375041999730200-80-75640056256000520009002809058100254506200197035016075256005625120007200210504502401755760030625420008200311705103602351296005522584600合計64802200--432400155000253300經(jīng)過計算,表明該市工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額之間存在著高度正相關(guān)。對r的解釋如下:(即r的特點)(1)r取正值或負(fù)值決定于分子協(xié)方差;(2)r的絕對值,在0與1之間;(3)r的絕對值大小,可說明現(xiàn)象之間相關(guān)關(guān)系的緊密程度。積差法公式進(jìn)一步化簡如下:2.簡捷法

資料計算如下:序號年份x(萬元)y(萬元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合計64802200568120076000020353003.從單變量分組表計算相關(guān)系數(shù)

三、簡單線性相關(guān)分析的特點

通過對r的計算方法的討論,可看出二個明顯特點:2.相關(guān)關(guān)系中只能計算出一個相關(guān)系數(shù)r。1.相關(guān)關(guān)系中,兩個變量不必定出哪個是自變量,哪個是因變量,因此,相關(guān)的兩個變量都是隨機(jī)變量;3、相關(guān)系數(shù)與判定系數(shù)在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計指標(biāo),用r表示相關(guān)系數(shù)

r2

越接近于1,表明x與y之間的相關(guān)性越強;r2

越接近于0,表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系.相關(guān)系數(shù)與判定系數(shù)是相關(guān)系數(shù)的平方,用r2表示;用來衡量回歸方程對y的解釋程度。判定系數(shù)取值范圍:判定系數(shù)第三節(jié)回歸分析

一、回歸分析的概念和種類二、一元線性回歸分析三、多元線性回歸分析四、非線性回歸分析一、回歸分析的概念和種類什么是回歸?什么是回歸分析?回歸分析的種類

1、回歸分析按變量的多少可分為:簡單回歸復(fù)回歸2、回歸分析按回歸的形式可分為:線性回歸:一元線性回歸多元線性回歸非線性回歸

(一)標(biāo)準(zhǔn)的一元線性回歸模型(二)一元線性回歸模型的估計(三)一元線性回歸模型的擬合優(yōu)度(四)一元線性回歸模型的檢驗(五)一元線性回歸模型預(yù)測二、一元線性回歸分析

(一)標(biāo)準(zhǔn)的一元線性回歸模型1、回歸函數(shù)總體回歸函數(shù)

Yt=β0+β1Xt+ut

ut是隨機(jī)誤差項,又稱隨機(jī)干擾項,它是一個特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對Y的影響。樣本回歸函數(shù):

t=1,2,...n

et稱為殘差,在概念上,et與總體誤差項ut相互對應(yīng);n是樣本的容量。E(Yt)=β0+β1XtXYtY。。。。。ut

樣本回歸函數(shù)與總體回歸函數(shù)區(qū)別總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。總體回歸函數(shù)中的β1和β2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動??傮w回歸函數(shù)中的ut是Yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數(shù)中的et是Yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計算出et的具體數(shù)值。誤差項的標(biāo)準(zhǔn)假定假定1:誤差項的期望值為零:E(ut)=0。假定2:誤差項的方差為常數(shù):Var(ut)=。假定3:誤差項之間不存在序列相關(guān),協(xié)方差為零:

Cov(utus)=0(t≠s)。假定4:自變量是給定變量,與誤差項線性無關(guān)。假定5:隨機(jī)誤差項服從正態(tài)分布。滿足以上標(biāo)準(zhǔn)假定的一元線性回歸模型,稱為標(biāo)準(zhǔn)的一元線性回歸模型。(二)一元線性回歸模型的估計一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)

1為正

1為負(fù)

1為0總體一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))截距截距表示在沒有自變量x的影響時,其它各種因素對因變量y的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論