統(tǒng)計學教學課件:8、第七章 相關分析_第1頁
統(tǒng)計學教學課件:8、第七章 相關分析_第2頁
統(tǒng)計學教學課件:8、第七章 相關分析_第3頁
統(tǒng)計學教學課件:8、第七章 相關分析_第4頁
統(tǒng)計學教學課件:8、第七章 相關分析_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統(tǒng)計學 第七章 相關分析 2005 第七章第七章 相關分析相關分析統(tǒng)計學 第七章 相關分析 2005 本本 章章 要要 求求1、相關關系的含義及相關的種類,相關系數的計算方法;2、回歸分析的含義及其與相關關系分析的區(qū)別,一元線性回歸方程參數的求解及估計,估計標準誤差的計算。1、相關關系與函數關系的區(qū)別;2、相關分析的主要內容;3、相關系數、回歸系數、估計標準誤差相互之間的關系。1、相關圖的繪制、相關表的編制; 2、多元線性回歸、曲線回歸等有關方程參數的求解。統(tǒng)計學 第七章 相關分析 2005 統(tǒng)計學 第七章 相關分析 2005 現(xiàn)象之間的關系表現(xiàn)為:現(xiàn)象之間的關系表現(xiàn)為:1、函數關系:、函數關

2、系:反映現(xiàn)象之間存在著一種確定性、反映現(xiàn)象之間存在著一種確定性、嚴格的依存關系,可用數學表達式準確表示出來。嚴格的依存關系,可用數學表達式準確表示出來。2、相關關系:、相關關系:反映現(xiàn)象之間確實存在一定的數量依反映現(xiàn)象之間確實存在一定的數量依存關系,但不是固定的。存關系,但不是固定的。1)現(xiàn)象之間客觀存在數量上的依存關系。)現(xiàn)象之間客觀存在數量上的依存關系。2)這種依存關系不是確定的,而是圍繞所有標志值)這種依存關系不是確定的,而是圍繞所有標志值 的平均數上下波動。的平均數上下波動。從某種角度說,函數關系是相關關系的一個特例。從某種角度說,函數關系是相關關系的一個特例。要理解相關關系的概念應把

3、握以下兩點:要理解相關關系的概念應把握以下兩點:統(tǒng)計學 第七章 相關分析 2005 因素多少因素多少單相關:兩個因素單相關:兩個因素復相關:三個以上因素復相關:三個以上因素相關形態(tài)相關形態(tài)直線相關(線性相關)直線相關(線性相關)近似表現(xiàn)為一條直線近似表現(xiàn)為一條直線正相關:同向變化正相關:同向變化負相關:反向變化負相關:反向變化相關程度相關程度完全相關:實質就是確定性的函數關系完全相關:實質就是確定性的函數關系不完全相關:這便是要研究的相關分析。不完全相關:這便是要研究的相關分析。無相關:因素之間完全沒有關系。無相關:因素之間完全沒有關系。一般是平均意一般是平均意義上的義上的曲線相關:近似表現(xiàn)為

4、一條曲線。曲線相關:近似表現(xiàn)為一條曲線。圖示圖示統(tǒng)計學 第七章 相關分析 2005 相關分析是為了消除偶然影響,以找出現(xiàn)象之間的依存關相關分析是為了消除偶然影響,以找出現(xiàn)象之間的依存關系和程度以及變動規(guī)律。主要內容如下:系和程度以及變動規(guī)律。主要內容如下:相關關系分析:相關關系分析:研究變量之間關系的密切研究變量之間關系的密切 程度。程度?;貧w分析:回歸分析:研究變量之間的變動關系,采用數學方程式表達。研究變量之間的變動關系,采用數學方程式表達。1 1、確定現(xiàn)象之間的相關性以及其、確定現(xiàn)象之間的相關性以及其 相關關系的表現(xiàn)形式;相關關系的表現(xiàn)形式;2 2、確定相關關系的密切程度;、確定相關關系

5、的密切程度;3 3、選擇適當的數學模型;、選擇適當的數學模型;4 4、測定估計值的可靠程度。、測定估計值的可靠程度。5 5、檢驗相關關系的顯著性。、檢驗相關關系的顯著性。相關關系分析相關關系分析回歸分析回歸分析統(tǒng)計學 第七章 相關分析 2005 兩種相關分析方法:定性分析(圖表法)和定量分析兩種相關分析方法:定性分析(圖表法)和定量分析(相關系數)。定性分析一般只適用于兩個變量。(相關系數)。定性分析一般只適用于兩個變量。1、相關圖、相關圖(散點圖、散布圖)(散點圖、散布圖)支出支出收入收入散散 點點 圖圖統(tǒng)計學 第七章 相關分析 2005 2、相關表、相關表簡單相關表:未分組表示兩個變量關系

6、的表簡單相關表:未分組表示兩個變量關系的表單變量分組表:只根據一個變量進行分組的單變量分組表:只根據一個變量進行分組的 分組相關表。分組相關表。雙邊量分組表:對兩個變量都進行分組的雙邊量分組表:對兩個變量都進行分組的 分組相關表。分組相關表。統(tǒng)計學 第七章 相關分析 2005 相關系數是用來定量說明現(xiàn)象之間關系的密切程度的。相關系數是用來定量說明現(xiàn)象之間關系的密切程度的。nyyxxxy)(21、定義公式、定義公式y(tǒng)xxyr2其中:其中:為協(xié)方差,用來表示變量關聯(lián)程度的絕對指標。顯然為協(xié)方差,用來表示變量關聯(lián)程度的絕對指標。顯然它受標志大小的影響。它受標志大小的影響。2xy為兩變量的標準差。、y

7、xnxxx2)(nyyy2)(統(tǒng)計學 第七章 相關分析 2005 yyxxxyyxyxxyLLLyyxxyyxxnyyxxr222)()()()(2、積差法、積差法可見,相關系數是用無量綱的系數形式來表示變量之可見,相關系數是用無量綱的系數形式來表示變量之間的相關程度的。間的相關程度的。例例上述計算過程要使用兩個數列的平均值,并且以每個變量上述計算過程要使用兩個數列的平均值,并且以每個變量值分別與平均值離差,計算比較繁鎖。值分別與平均值離差,計算比較繁鎖。統(tǒng)計學 第七章 相關分析 2005 3、簡捷計算方法(三個簡捷公式)、簡捷計算方法(三個簡捷公式)22222222)()()(1)(11 y

8、ynxxnyxxynynyxnxyxnxyr例例 yxnxyyyxxLxy1)(222)(1)(xnxxxLxx222)(1)(ynyyyLyy證明證明 同理可得:同理可得:統(tǒng)計學 第七章 相關分析 2005 已知平均值和標準差時,可采用:已知平均值和標準差時,可采用:nyynxxnxyxyyxxyyyxxyxxyryx22222222,其中:2222ynyxnxyxnxyr已知平均值時,可采用:已知平均值時,可采用:統(tǒng)計學 第七章 相關分析 2005 4、相關系數的特點和相關程度的判斷標準、相關系數的特點和相關程度的判斷標準特點:特點:111)1 (rr,即相關系數取值范圍表示負相關;表示正

9、相關,00)2(rr時,不存在線性相關。當相關程度越低,越接近時,為函數關系;當,則相關程度越高,越接近0011)3(rrrr判斷標準:一般地判斷標準:一般地,高度相關顯著相關低度相關微弱相關8 .0,8 .05 .0,5 .03 .0, 3 .0rrrr統(tǒng)計學 第七章 相關分析 2005 一、概述一、概述1、回歸分析的概念、回歸分析的概念對具有相關關系的變量之間的數量變化的對具有相關關系的變量之間的數量變化的一般關系一般關系進進行測定,確定一個相關的行測定,確定一個相關的數學表達式數學表達式,以進行估計或,以進行估計或預測的統(tǒng)計方法。預測的統(tǒng)計方法。2、與相關分析的比較、與相關分析的比較相關

10、分析相關分析回歸分析回歸分析1)兩變量是對等的兩變量是對等的1)兩變量是不對等的兩變量是不對等的2)兩變量都是隨機變量兩變量都是隨機變量2)自變量是給定值,因變量自變量是給定值,因變量是隨機變量是隨機變量3)兩變量互換不影響其兩變量互換不影響其相關系數,即相關系相關系數,即相關系數只有一個結果數只有一個結果3)在互為因果關系下,須建立兩個回在互為因果關系下,須建立兩個回歸方程,即一個方程只能作一種推算,歸方程,即一個方程只能作一種推算,只能由自變量推因變量只能由自變量推因變量統(tǒng)計學 第七章 相關分析 2005 3、分類、分類直線回歸(線性回歸)直線回歸(線性回歸)曲線回歸(非線性回歸)曲線回歸

11、(非線性回歸)簡單直線回歸簡單直線回歸(一元線性回歸)(一元線性回歸)多元線性回歸多元線性回歸統(tǒng)計學 第七章 相關分析 2005 二、簡單直線回歸(一元線性回歸)二、簡單直線回歸(一元線性回歸)1、確定自變量、確定自變量x和因變量和因變量y 一般根據問題的性質、相關理論和常識確定。如果不能一般根據問題的性質、相關理論和常識確定。如果不能確定,或者兩個變量互為根據,則存在確定,或者兩個變量互為根據,則存在x為自變量,為自變量,y為因為因變量(變量(y倚倚x)的回歸方程和)的回歸方程和y為自變量,為自變量,x為因變量(為因變量(x倚倚y)的回歸方程。的回歸方程。2、建立一元線性回歸模型、建立一元線

12、性回歸模型)(yxdycxxybxaycc倚)倚這里采用第一個模型。這里采用第一個模型。a稱為截距,稱為截距,b稱為斜率。稱為斜率。a為起始值,為起始值,b的經濟含義是自變量變動一個單位的經濟含義是自變量變動一個單位時,因變量平均變動時,因變量平均變動b個單位。個單位。統(tǒng)計學 第七章 相關分析 2005 3、計算參數、計算參數a和和b的方法的方法 參數參數a和和b,是根據實際的觀測值(已知)計算出來,是根據實際的觀測值(已知)計算出來的。就是在模型中,的。就是在模型中,x和和y是已知的,是已知的,a和和b是未知的。是未知的。一般采用最小平方法(最小二乘法)計算。一般采用最小平方法(最小二乘法)

13、計算。推導如下:推導如下:根據最小平方法原理,參數要使得理論值與實際值根據最小平方法原理,參數要使得理論值與實際值的離差平方和最小。的離差平方和最小。min)(2cyyQ假設函數假設函數Q是連續(xù)可微,最小值的必要條件是一階是連續(xù)可微,最小值的必要條件是一階偏導數等于偏導數等于0,即:,即:0aQ0bQ統(tǒng)計學 第七章 相關分析 2005 0)1)(2bxayaQ0 )(2xbxaybQ移項等到二元一次方程:移項等到二元一次方程:xbnay2xbxaxy將將bxayc代入函數代入函數Q,分別求一階偏導得:,分別求一階偏導得:統(tǒng)計學 第七章 相關分析 2005 解之得解之得xbyaLLxxnyxxy

14、nbxxxy22)(這樣就得到了直線回歸方程:這樣就得到了直線回歸方程:例例1cy2cy1y2yxyo統(tǒng)計學 第七章 相關分析 2005 模型:模型:nncxxxy22110同樣采用最小平方法求解。同樣采用最小平方法求解。一般先將曲線用代換法線性化,再按照最小平方法進一般先將曲線用代換法線性化,再按照最小平方法進行處理。行處理。統(tǒng)計學 第七章 相關分析 2005 回歸直線或曲線是一種平均線。用來代表變量之回歸直線或曲線是一種平均線。用來代表變量之間關系的一般水平。根據回歸線推測的因變量顯然與間關系的一般水平。根據回歸線推測的因變量顯然與實際值有差異。這種差異大小說明推算的準確性以及實際值有差異

15、。這種差異大小說明推算的準確性以及回歸線代表性的大小?;貧w線代表性的大小。 估計標準誤差估計標準誤差就是用來說明回歸方程推算結果的就是用來說明回歸方程推算結果的準確性或代表性高低的統(tǒng)計分析指標準確性或代表性高低的統(tǒng)計分析指標。yx回歸線回歸線一般的平一般的平均數均數yx統(tǒng)計學 第七章 相關分析 2005 )1)(2)(22nxxSnyySxcyx對比估計值(理論值)實際值估計標準誤差cyxyyS簡化公式:簡化公式:22nxybyaySyx例例統(tǒng)計學 第七章 相關分析 2005 222yyxySr2y1rSyx或或相關系數與估計標準誤差表現(xiàn)為相反的關系。相關系數與估計標準誤差表現(xiàn)為相反的關系。1

16、、 越大,越大, 越小。極端時,越小。極端時, , 此時,實際值與理論值完全相等,完全相關。此時,實際值與理論值完全相等,完全相關。ryxS1r0yxSr2、 越小,越小, 越大。極端時,越大。極端時, , 圖上表現(xiàn)為回歸線與圖上表現(xiàn)為回歸線與 數列的平均線重合,不相關。數列的平均線重合,不相關。yxS0ryyxSy證明證明統(tǒng)計學 第七章 相關分析 2005 統(tǒng)計學 第七章 相關分析 2005 完全正相關完全正相關xyo完全負相關完全負相關xyoxyo不完全正相關不完全正相關xyo曲線相關曲線相關xyo不完全負相關不完全負相關xyo 無相關無相關返回返回統(tǒng)計學 第七章 相關分析 2005 yx

17、nxynyxnyxnyxxyyxnyxxyxyyxyxyxxyyyxxLxy1()(返回返回統(tǒng)計學 第七章 相關分析 2005 例例1某城市居民收入支出調查,某城市居民收入支出調查,要求:計算產量和生產要求:計算產量和生產 費用的相關系數。費用的相關系數。xy2)(yy 2)(xx )(yyxx0.40960.01960.00360.02560.31360.772452028.163.360.364.1620.1656.2萬元)公斤)(64.452.23(24451220yx193657636676129623.2合合 計計12205.22804.82704.72504.52204200生產費

18、用生產費用(萬元)(萬元)產量產量(公斤)(公斤)統(tǒng)計學 第七章 相關分析 2005 9514.0772.045202.56)()()(22yyxxyyxxr積差法:積差法:返回返回統(tǒng)計學 第七章 相關分析 2005 簡捷法:簡捷法:xy2x2yxy302200108.4257171620.2522.0923.0427.044000048400625007290078400800990117512961456生產費用生產費用(萬元)(萬元)合合 計計12205.24.84.74.54270280250220200產量產量(公斤)(公斤)23.2統(tǒng)計學 第七章 相關分析 2005 9514.08

19、6.3226002812.2342.1085122030220052.23122057175)()(222222yynxxnyxxynr返回返回統(tǒng)計學 第七章 相關分析 2005 例例2 根據例根據例1中的資料,配合生產費用倚產量的直線回歸中的資料,配合生產費用倚產量的直線回歸方程,說明斜率的經濟含義,并預測當產量為方程,說明斜率的經濟含義,并預測當產量為300公公斤時的生產費用。斤時的生產費用。產量產量(公斤)(公斤)生產費用生產費用(萬元)(萬元)20042204.52504.72704.82805.2合合 計計122023.2xy2x2yxy302200108.4257171620.25

20、22.0923.0427.044000048400625007290078400800990117512961456統(tǒng)計學 第七章 相關分析 2005 0124.022600281122030220052.23122057175)(222xxnyxxynb6144.1512200124.052 .23xbya統(tǒng)計學 第七章 相關分析 2005 xyc0124. 06144. 1這樣得出生產費用倚產量的直線回歸方程:這樣得出生產費用倚產量的直線回歸方程:b(斜率)的經濟含義表示產量增加一公斤,(斜率)的經濟含義表示產量增加一公斤,生產費用平均增加生產費用平均增加0.0124萬元。萬元。當產量增加

21、到當產量增加到300公斤時,則可以預測生產費公斤時,則可以預測生產費用為:用為:萬元)(33. 53000124. 06144. 1cy返回返回統(tǒng)計學 第七章 相關分析 2005 例3計算例計算例2回歸直線的估計標準誤差回歸直線的估計標準誤差產量產量(公斤)(公斤)生產費用生產費用(萬元)(萬元)20042204.52504.72704.82805.2 122023.2108.42 5717xycy2yxy2)(cyy 0.073235xyc0124. 06144. 1根據回歸方程根據回歸方程 計算計算出每個產量對應的生產費用的理論值出每個產量對應的生產費用的理論值23.21620.2522.

22、0923.0427.041456129611759908000.0089110.0248380.0002070.0263740.0129055.08644.96244.71444.34244.0944統(tǒng)計學 第七章 相關分析 2005 萬元)(16. 025073235. 02)(2nyyScyx簡化公式:簡化公式:萬元)(16. 02557170124. 02 .236144. 142.10822nxybyaySyx返回返回統(tǒng)計學 第七章 相關分析 2005 統(tǒng)計學 第七章 相關分析 2005 收入收入(元)(元)支出支出(元)(元)500300800500100060012007001500900合合 計計50003000 xy2x2yxy5580000 200000033400001、某收入與支出的調查結果如下:某收入與支出的調查結果如下:1)計算相關系數,并判斷相關程度和相關方向;)計算相關系數,并判斷相關程度和相關方向;2)配合值線回歸方程,并說明回歸系數(斜率)的經濟含義;)配合值線回歸方程,并說明回歸系數(斜率)的經濟含義;3)計算估計標準誤差;)計算估計標準誤差;4)估計收入為)估計收入為2000元時的支出。元時的支出。22500001440000100000064000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論