第11章 相關與回歸分析法_第1頁
第11章 相關與回歸分析法_第2頁
第11章 相關與回歸分析法_第3頁
第11章 相關與回歸分析法_第4頁
第11章 相關與回歸分析法_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計實用技術主編:胡寶珅(黑龍江農(nóng)業(yè)經(jīng)濟職業(yè)學院)TL-mail:hbs570214@163.com配套:《統(tǒng)計實用技術實訓》第十一章相關與回歸分析【學習目標】通過本章學習應當理解現(xiàn)象及之間存在的相關關系;掌握簡單線性相關分析、一元線性回歸分析的理論與方法;把握相關系數(shù)與回歸系數(shù)的聯(lián)系與區(qū)別;能夠依據(jù)實際資料具體運用簡單線性相關與一元線性回歸方法進行分析和預測?!景咐龑搿坑涗?029例眼晶狀混濁度與患者的年齡如表11-1所示。表11-1晶狀體混濁程度與年齡的關系(眼數(shù))晶狀體混濁程度年齡(歲)20-2930-3940以上合計+215131148494++67101128296+++4463132239合計3262954081029上述資料表明眼晶狀體混濁度與年齡之間存在著一定的關系。用怎樣的統(tǒng)計方法研究兩者之間的關系是本章要研究的問題。第一節(jié)相關與回歸分析概述一、函數(shù)關系與相關關系(一)函數(shù)關系。是指現(xiàn)象之間在數(shù)量上存在的嚴格的對應關系。(二)相關關系。是指現(xiàn)象之間在數(shù)量上存在的非確定性的依存關系。請思考:請指出一下各項哪些屬于函數(shù)關系。(1)物體的體積隨著溫度的升高而膨脹,隨著壓力的加大而收縮。(2)家庭收入增多,其消費支出也有增長的趨勢。(3)物價上漲,商品的需求量下降。(4)農(nóng)作物的收獲量和雨量、氣溫、施肥量有著密切的關系(5)圓的半徑越大,其面積也越大。二、相關分析法與回歸分析法對相關現(xiàn)象進行分析的方法,可分為相關分析和回歸分析兩種方法。(一)相關分析法。就是對相關現(xiàn)象進行相關性質和相關密切程度分析的方法。如分析產(chǎn)量與利潤之間是否有關系、關系是否密切等。(二)回歸分析法。就是對相關現(xiàn)象之間的規(guī)律性進行分析的方法。確切地說,回歸分析法就是通過對相關現(xiàn)象的實際觀察值,采用數(shù)學方法回歸為直線或曲線形式的方程,以反映現(xiàn)象之間的數(shù)量關系及變化規(guī)律的一種分析方法。三、相關分析與回歸分析的關系(一)相關關系是回歸分析的前提。只有現(xiàn)象之間具有較為密切的相關關系,才有進行回歸分析的必要,用回歸分析所獲得的結論才有實際意義。(二)相關關系決定回歸分析現(xiàn)象之間的相關關系是很復雜的,它們以不同的方向、不同的程度、不同的形式等相互作用,表現(xiàn)出不同的類型和形態(tài)。但無論現(xiàn)象的相關類型呈現(xiàn)為何種狀態(tài),它對回歸分析都是起決定作用的因素。(三)回歸分析是相關分析的繼續(xù)和深入。1.相關的類型決定回歸的類型。直線相關示意圖曲線相關示意圖2.相關的性質決定回歸系數(shù)。經(jīng)濟現(xiàn)象之間的關系,按其性質不同可分為正相關和負相關。在直線相關的情況下,正相關時回歸系數(shù)為正,負相關時回歸系數(shù)為負。即在回歸方程Y=a+bx中,b為回歸系數(shù)。正相關時,b>0;負相關時,b<0。3.現(xiàn)象相關的密切程度決定回歸預測的準確程度。按現(xiàn)象相關的密切程度可分為完全相關、不完全相關和不相關。其中完全相關即函數(shù)關系,不完全相關即前面說的“相關關系”,不相關即現(xiàn)象之間沒有關系。BACK第二節(jié)相關分析常用方法對現(xiàn)象進行相關分析的常用方法有相關表分析法、相關圖分析法和相關系數(shù)分析法。一、相關表分析法對兩種現(xiàn)象作相關分析時,將一系列的成對觀察值排列在統(tǒng)計表中,就形成了相關表。某作物耕作深度與單產(chǎn)相關表按耕作深度分組〔cm〕單產(chǎn)〔t/hm2〕810121416186.010.812.0從相關表中可以看出,耕作深度與單產(chǎn)之間存在著正相關的關系。二、相關圖分析法相關圖又稱散點圖或散布圖,它是利用直角坐標,將變量值用相對應的坐標點描繪出來,從坐標點的分布狀況觀察變量之間的相互關系的圖形。耕作深度與單產(chǎn)的關系可繪成相關圖三、相關系數(shù)分析法相關系數(shù),是判斷兩種現(xiàn)象在直線相關條件下相關密切程度的統(tǒng)計分析指標。(一)相關系數(shù)的計算公式r=r表示相關系數(shù),-1<r<1;x表示自變量,y表示因變量。(二)相關關系密切程度的判斷。0.3以下0.3-0.50.5-0.80.8-1相關程度不相關低度相關顯著相關高度相關(三)相關系數(shù)的計算。一般通過編制“相關系數(shù)計算表”來輔助計算。案例下面表中的觀察資料計算10個企業(yè)生產(chǎn)性固定資產(chǎn)價值與工業(yè)增加值之間的相關系數(shù)。

相關系數(shù)計算表單位:百萬元序號固定資產(chǎn)價值X工業(yè)增加值YX2Y2XY1234567891034566889101214162528303236424547916253636646481100144196256625748900102412961764202522094264125168180256288378450564合計71315575110792515r==0.973計算結果表明生產(chǎn)性固定資產(chǎn)價值和工業(yè)增加值之間存在高度的正相關關系。通過以上的計算與分析過程,我們看到,統(tǒng)計所研究現(xiàn)象之間的相關關系,應該是真實的、客觀存在的聯(lián)系關系,而不是主觀臆造,或形式上的偶然巧合。請思考:如果將上例中的自變量和因變量互換位置,重新計算相關系數(shù),你能得出什么結論?第三節(jié)回歸分析與回歸預測一、靜態(tài)直線回歸及預測只有當兩種現(xiàn)象之間呈現(xiàn)為直線相關時,才能運用直線回歸法進行直線回歸。直線回歸,也叫線性回歸。它又有靜態(tài)回歸和動態(tài)回歸之分。靜態(tài)直線回歸,即沒有時間變量的線性回歸。靜態(tài)直線回歸法的一般程序為:(一)確定自變量和因變量。自變量一般用x來表示,因變量一般用y來表示。(二)整理資料。至少應有五對以上的資料,否則保證不了回歸的質量,也必然影響預測。(三)判斷相關性質及密切程度。主要看是直線相關還是曲線相關,以及相關的密切程度如何。(四)確定回歸模型。直線相關時只能選擇直線回歸模型,曲線相關時就只能選擇曲線回歸模型。(五)求參數(shù)a、b。其方法是利用“最小二乘法”對下式求極小值:S=Σ(y-)2=Σ[y-(a+bx)]2=Σ(y-a-bx)2解得a、b的通用公式

(六)確定直線回歸方程。將a、b值代入y=a+bx中即可。如上例當a=3.6和b=3.93時,直線回歸方程為:=3.6+3.93x(七)直線回歸預測。二、動態(tài)直線回歸及預測動態(tài)直線回歸法的一般程序為:(一)確定自變量和因變量。自變量一般用x來表示,因變量一般用y來表示。但作為動態(tài)回歸,x只能是表示時間的變量。(二)整理資料。至少應有五個時期以上的資料,否則就保證不了回歸的質量,也必然影響預測(三)判斷相關關系及密切程度。這里的相關關系是指某種經(jīng)濟現(xiàn)象與時間因素之間的相關關系,即看隨著時間的變化該種現(xiàn)象是否有上升或下降的趨勢??捎孟嚓P圖的方法進行判斷。(四)確定回歸模型。直線相關時只能選擇直線回歸模型,曲線相關時就只能選擇曲線回歸模型。(五)求參數(shù)a、b。其方法仍是利用a、b的通用公式進行計算。(六)確定回歸方程。(七)進行預測。年份利稅額(萬元)yxx2xy①②③④⑤199819992000200120022003200420052006851802302402602852953304001234567891491625364964818536069096013001710206026403600Σ23054528513410案例某企業(yè)1998~2006年的利稅額如表代入公式得:b=(9*13410-45*2305)/(9*285-452)=31.42a=(2305-31.42×45)/9=99.01=99.01+31.42x(x=1時為1998年)對2007年進行預測。即當x=10時的回歸值=99.01+31.42x=99.01+31.42×10=413.21

(萬元)它表明根據(jù)近年來的發(fā)展規(guī)律可以預測出該企業(yè)2007年利稅額應在413.21萬元左右。這里需要注意的是:預測的時期不可往后推得太遠,否則其預測值是不可靠的。第四節(jié)計算工具在相關與回歸中的運用一、計算器的運用用計算器計算相關系數(shù)r、回歸系數(shù)a、b和預測值y0,應是計算工具中的首選。案例以表上題為例,其操作過程為:1.MODE3

1即進入回歸狀態(tài)和線性回歸狀態(tài)。2.SHIFTScl=即清空存儲器。3.錄入資料(注意x值在前,y值在后):1SHIFT;85DT

2SHIFT;180DT

3SHIFT;230DT

4SHIFT;240DT

5SHIFT;260DT

6SHIFT;285DT7SHIFT;295DT8SHIFT;330DT9SHIFT;400DT

4.取值:取相關系數(shù)r的值:SHIFTr=

(即得r=0.9579)取直線回歸的截距a的值:SHIFTA=

(即得a=99.01)取直線回歸的斜率b的值:SHIFTB=

(即得b=31.42)取由x預測y的值:10SHIFT

(即當x=10時,預測值=413.21)二、Excel計算相關系數(shù)使用的函數(shù)名稱:CORREL(一)輸入形式。其輸入形式:=CORREL(array1,array2)↙即r=CORREL(X值的范圍,Y值的范圍)↙其中:array1為第一個變量X的觀察值(或數(shù)組),array2為第二個變量Y的觀察值(或數(shù)組)。例如:某項試驗中有關X與Y的試驗數(shù)據(jù)見圖12-5中的數(shù)據(jù)。若用輸入形式計算相關系數(shù),則輸入:=CORREL(A2:A11,B2:B11)↙回車后其結果為:0.976464(見上圖中的單元格B12;注意:用輸入形式計算時,沒有上圖中的對話框)。當相關系數(shù)為0.976464時,按表12-2的標準進行判斷,X與Y的關系應為“高度相關”。(二)導入形式。仍如圖12-5中的資料,要求計算其相關系數(shù)。則操作過程如下:先確定存放相關系數(shù)的位置(如放在B12的位置;為了過后也能知道B12的數(shù)字是相關系數(shù),可在A12中輸入“相關系數(shù):”作為其提示);導入函數(shù);點確定后會出現(xiàn)一個函數(shù)參數(shù)對話框;先在Array1后導入X的數(shù)據(jù)(A2至A11);再在Array2后導入Y的數(shù)據(jù)(B2至B11);再點確定即可。此時,B12的位置會出現(xiàn)0.976464,即相關系數(shù)為0.976464。三、Excel在回歸分析中的應用直線回歸,即數(shù)學模型為y=a+bx的回歸。其中a、b為待定參數(shù)。(一)求截距a。使用的函數(shù)名稱為:INTERCEPT1、輸入形式。輸入形式為:=INTERCEPT(known-y,s,known-x,s)↙即a=INTERCEPT(y值的范圍,x值的范圍)2、導入形式。仍如下圖中的資料,若對其求a,則操作過程如下:先確定存放回歸截距的位置(如放在B13的位置;導入函數(shù);點確定后會出現(xiàn)一個函數(shù)參數(shù)對話框(見下圖);先在known-y,s導入Y的數(shù)據(jù)(B2至B11);再在known-x,s后導入X的數(shù)據(jù)(A2至A11);再點確定即可。此時,B13的位置會出現(xiàn)82.5656,即回歸截距為82.5656。(二)求斜率b。使用的函數(shù)名稱:SLOPE1、輸入形式。其輸入形式為:=SLOPE(known-y,s,known-x,s)↙即b=SLOPE(y值的范圍,x值的范圍)如:對于圖中的資料,其輸入形式為:=SLOPE(B2:B11,A2:A11)↙回車后,其取值應為:1.355348,如圖中的單元格B14。它表明,對于該資料來說,其直線回歸的斜率為1.35

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論