第7章相關與線性回歸-正式課件_第1頁
第7章相關與線性回歸-正式課件_第2頁
第7章相關與線性回歸-正式課件_第3頁
第7章相關與線性回歸-正式課件_第4頁
第7章相關與線性回歸-正式課件_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第第7章章 相關與線性回歸分析相關與線性回歸分析 一一元線性相關和回歸分析元線性相關和回歸分析在科學研究和生產實踐中,經常要進行兩類變量間關系的分析,例如仔畜的初生重與斷奶重、飼料的營養(yǎng)濃度與畜禽增重速度的關系。相關與回歸分析相關與回歸分析用于相關和線性回歸分析的SAS過程主要有三個: CORR過程僅用于相關分析, REG和GLM過程主要進行回歸分折,REG過程在進行回歸分析的同時,還可通過相應的選項計算出變量間的相關系數。第第1節(jié)節(jié) 相關與線性回歸分析相關與線性回歸分析 簡介簡介第第2節(jié)節(jié) 相關分析相關分析 一、相關分析的概念(correlation analysis)研究變量間的相關性質及

2、其密切程度。變量間的關系是平行的或相互制約、不分主次的。例如個體某一階段的體高與體重的關系等。第第2節(jié)節(jié) 相關分析相關分析在兩個變量中,當一個變量的數值增大或減少時,另一個變量也會相應地隨之增大或減少,且這種增大或減少在一定范圍內呈現(xiàn)一定的比例,則表示兩個變量間存在著線性相關的關系。兩個線性相關變量之間的相關性質和密切程度,通常用相關系數r(correlation coefficient)的正負及其大小來衡量。若:-1 r0 負相關 r=0 零相關(不相關) 0 r 1 正相關 線性相關線性相關分析的主要工作就是計算出變量間的相關系分析的主要工作就是計算出變量間的相關系數并對其顯著性進行檢驗數

3、并對其顯著性進行檢驗。 二、用于相關分析的SAS過程CORR過程過程1、 CORR過程的調用格式 PROC CORR 選項;選項; VAR 變量名表;變量名表; WITH 變量名表;變量名表; PARTIAL 變量名表變量名表;當進行普通相關分析時,只有PROC CORR語句是必須的,當進行偏相關分析時,PARTIAL語句也是必須的。其他語句都是可選擇性的。第第2節(jié)節(jié) 相關分析相關分析2、語句、語句說明說明PROC CORR語句 該語句用于調用CORR過程進行相關分析,其常用的選項主要包括:PEARSON 計算通常的Pearson相關系數,即直線相關系數,缺省時系統(tǒng)會默認計算出該相關系數。Sp

4、earman 計算Spearman等級相關系數(或秩相關系數)。NOSIMPLE 取消打印每個變量的描述性統(tǒng)計量(如平均數、標準差等)。如果該項缺省,則會打印出每個分析變量的基本統(tǒng)計量。 第第2節(jié)節(jié) 相關分析相關分析(2)VAR語句用于指明所要分析的變量,如果缺省,則系統(tǒng)默認對其他語句中沒有提及的所有數值型變量進行分析。(3)WITH語句用于設定放在左邊的變量,與VAR語句配合使用,此時VAR語句的變量間和WITH語句的變量間相關系數不給出,只輸出VAR變量和WITH變量間的相關系數。如果該語句缺省,系統(tǒng)會計算VAR語句中的所有變量之間的兩兩相關系數。 3、結果結果輸出輸出CORR過程在執(zhí)行后

5、,其輸出的結果包括簡單統(tǒng)計量、相關系數及顯著性檢驗。 第第2節(jié)節(jié) 相關分析相關分析 4、實例應用分析、實例應用分析【例7.1】某地方病研究所調查了8名正常兒童的尿肌酐含量(mmol/24h)如表7-1,試分析尿肌酐含量與年齡之間的相關關系。第第2節(jié)節(jié) 相關分析相關分析編號12345678年齡131195810127尿肌酐含量3.543.013.092.482.563.363.182.65本例年齡與尿肌酐含量假定為雙變量正態(tài)分布,可通過計算線性相關系數表示該兩變量間的相關關系。程序程序7-1DATA EX7_1;INPUT X Y ;CARDS;13 3.54 11 3.01 9 3.09 6

6、2.48 8 2.56 10 3.36 12 3.18 7 2.65;PROC CORR;VAR X Y;RUN第第2節(jié)節(jié) 相關分析相關分析本例r=0.88177, p=0.0038,p0.05,說明兩變量間存在正相關關系。第第3節(jié)節(jié) 回歸分析回歸分析一、回歸分析概念(一、回歸分析概念(regression analysis)回歸分析是通過建立回歸方程來揭示變量間的回歸關系,并據此從自變量的變化去估測因變量的變化?;貧w分析中變量有自變量和因變量之分,一般將獨立變化的變量叫做自變量(independent variable),依賴自變量變化的變量稱為因變量或依變量(dependent varia

7、ble)。如家畜的生長速度受營養(yǎng)和飼養(yǎng)管理水平等因素的影響。二、回歸分析種類二、回歸分析種類(根據所涉及自變量數目的多少)一元回歸或直線回歸(linear regression):只研究兩個變量間。多元回歸(multiple regression):涉及到多個自變量的回歸。三、回歸分析涉及以下幾方面內容:三、回歸分析涉及以下幾方面內容:1、估計估計。估計與方程有關的未知參數,并檢驗對于這些參數所做的統(tǒng)計假設,建立相應的回歸模型2、預報預報。用所得的回歸方程對自變量的一組值估計因變量的值(點/區(qū)間估計)3、自變量選擇自變量選擇。從可能對因變量Y有影響的一組自變量中,挑選出對Y有影響的變量,剔除影

8、響不大的變量,或按某一標準,建立最優(yōu)的回歸方程4、模型診斷模型診斷。檢查數據、回歸方程、統(tǒng)計推斷方法中可能存在的問題,建立較合理的、穩(wěn)健的模型.第第3節(jié)節(jié) 回歸分析回歸分析四、建立回歸方程的應用:四、建立回歸方程的應用:1、描述描述。描述某種現(xiàn)象與其影響因素的數量依存關系。例如,某疾病發(fā)病率與氣溫、濕度的關系。2、預測預測。把預報因子(自變量)代入回歸方程對預報量(因變量)及其波動范圍進行估計。3、控制控制?;貧w方程逆運算,即要求因變量在一定范圍內波動,可以通過調控自變量的取值來實現(xiàn)。五、線性回歸分析的五、線性回歸分析的SAS過程過程可采用REG和GLM兩個過程來完成。REG過程進行一元或多元

9、回歸以及可線性化的非線性回歸分析,通過適當的選項還可計算出變量間的簡單相關系數,即采用REG過程可同時完成線性相關和回歸分析。第第3節(jié)節(jié) 回歸分析回歸分析1、REG過程的調用格式過程的調用格式 PROC REG 選項;選項; MODEL 因變量因變量= 自變量選項;自變量選項; BY 變量; WEIGHT 變量; PRINT 選項; PLOT y 軸變量*x軸變量=符號; 上述語句中,PROC REG和MODEL語句是必須的,其他語句是可選擇性的。第第3節(jié)節(jié) 回歸分析回歸分析2、語句說明、語句說明lPROC REG語句語句 PROC REG 選項;選項;指明調用REG過程作回歸分析。其常用的選

10、項主要有: 數據集選項 DATA=SAS數據集:指定分析數據集,如果缺省,則對最新創(chuàng)建的數據集進行分析;OUTEST=SAS數據集,要求將參數估計和選擇的統(tǒng)計量輸出到SAS數據集中等。 結果輸出選項(CORR/SIMPLE) CORR:對在MODEL和VAR語句中列出的所有變量計算簡單r,并輸出相關系數矩陣;SIMPLE:對用REG過程進行分析的每個變量輸出所有觀測的總和、均值、標準差和平方和等簡單統(tǒng)計量。第第3節(jié)節(jié) 回歸分析回歸分析lMODEL語句語句(1)功用:)功用:定義所用的回歸分析數學模型。在MODEL語句中出現(xiàn)的變量必須是用于分析的數據集中的數值型變量。如想考慮模型中X1的二次項,

11、不能在MODEL語句中使用XI*X1,而必須用DATA步驟產生一個新變量(如XISQUARE=X1*XI),然后再在MODEL語句中使用這個新變量。(2)MODEL語句常用的選項主要有:語句常用的選項主要有:SELECTION=模型選擇方法 用于規(guī)定選擇模型的方法,包括(共9種方法):NONE(全回歸模型) STEPWISE(逐步回歸) FORWARD(逐個選入)BACKWARD(逐個剔除) MAXR(最大R2增量法) MINR(最小R2增量法)RSQUARE(所有可能的R2) CP(總平方誤差法) ADJRSQ(調整的R2法)其中在畜牧試驗數據分析中,以前4種方法最為常用。該選項缺省時,模型

12、選擇方法為NONE。第第3節(jié)節(jié) 回歸分析回歸分析INCLUDE=n 指定列在MODEL語句中的前n個自變量必須包含在模型中,篩選變量的方法僅對MODEL語句中的其他變量進行。當使用SELECTION=NONE選項時,該選項無效。NOINT 取消通常包含在模型中的常數項(即截距)。SLENTRY(LSE)=概率值 對FORWARD和STEPWISE方法規(guī)定變量選入回歸模型里的顯著性水平。對FORWARD方法,其缺省值為0.05,而對STEPWISE方法則為0.15。第第3節(jié)節(jié) 回歸分析回歸分析第第3節(jié)節(jié) 回歸分析回歸分析SLSTAY(或SLS)=概率值 對BACKWARD和STEPWISE方法規(guī)

13、定變量保留在模型里的顯著水平。對BACKWARD方法而言,其缺省值為0.10,而STEPWISE方法則為0.15。結果輸出選項STB為標準偏回歸系數(即直接通徑系數);CLM和CLI分別為條件總體平均數的置信區(qū)間和觀察值的預測區(qū)間;P為預測值;R為離回歸誤差分析;ALL為所有輸出項。lBY語句語句 指定分類變量,以便得到由BY變量定義的幾個觀測組的獨立分析。當出現(xiàn)BY語句時,過程要求輸入數據事先已按BY變量進行了排序。lWEIGHT語句語句 指定加權系數變量。lPRINT語句語句 打印分析結果。lPLOT語句語句 用于畫散點圖。3、 結果輸出結果輸出 REG過程輸出的結果包括方差分析過程及相關

14、的統(tǒng)計量,參數的估計值及其有關統(tǒng)計量以及其他選擇性的結果輸出內容。在進行多元回歸分析時,如果設定了模型選擇方法,則會輸出模型選擇的具體過程。第第3節(jié)節(jié) 回歸分析回歸分析4、線性回歸的應用實例、線性回歸的應用實例例7.2 利用例7.1的數據資料,運用SAS進行直線回歸分析。第第3節(jié)節(jié) 回歸分析回歸分析程序程序7.2DATA EX7_2;INPUT X Y ;CARDS;13 3.54 11 3.01 9 3.09 6 2.48 8 2.56 10 3.36 12 3.18 7 2.65;PROC REG;MODEL Y=X/STB P CLI CLM;RUN;REG過程必須用MODEL語句表明回

15、歸模型,”Y=X”是表明直線回歸;”=“前是因變量,其后面是自變量;STP、P、 CLI和CLM為選項第第3節(jié)節(jié) 回歸分析回歸分析第一部分第一部分第一部分為方差分析的結果,本例F=20.97,P=0.0038,P0.05,回歸顯著,說明模型是有意義的第第3節(jié)節(jié) 回歸分析回歸分析第二部分第二部分第三部分第三部分第三部分:參數估計的結果。1、常數項Intercept估計值為1.66167,標準誤=0.29700;t=5.59,P=0.00140.05,表示常數項與0的差別有統(tǒng)計意義。2、變量X的回歸系數(回歸方程中的b)為=0.13917,t=4.58,p=0.00380.05,表示回歸顯著,即兩變量間存在回歸關系?;貧w方程為:Y =0.13917X+1.66167第二部分:描述性的統(tǒng)計量,Root MSE=誤差均方的平方根(剩余標準差;Dependent Mean=因變量的均數;Coeff Var=因變量的變異系數;R-Square=決定系數Adj R-Sq=矯正決定系數。第第3節(jié)節(jié) 回歸分析回歸分析因變量的因變量的原始值原始值CLI選項結果選項結果=預測值均預測值均數數95%置信置信區(qū)間區(qū)間CLM選項結選項結果預測值果預測值95%置信區(qū)置信區(qū)間間第四部分第四部分殘差殘差本章實習作業(yè)2、10頭育

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論