SPSS使用方法相關(guān)和回歸分析_第1頁(yè)
SPSS使用方法相關(guān)和回歸分析_第2頁(yè)
SPSS使用方法相關(guān)和回歸分析_第3頁(yè)
SPSS使用方法相關(guān)和回歸分析_第4頁(yè)
SPSS使用方法相關(guān)和回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩84頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS統(tǒng)計(jì)分析教程第四章 相關(guān)和回歸分析一 散點(diǎn)圖、擬合回歸線二 相關(guān)分析(Correlate)三 多元線性回歸分析(Regression)四 曲線回歸一 散點(diǎn)圖-Scatter 表現(xiàn)兩個(gè)變量或多個(gè)變量之間有無(wú)相關(guān)關(guān)系的統(tǒng)計(jì)圖; 在SPSS中有四種散點(diǎn)圖:(1)簡(jiǎn)單散點(diǎn)圖:用于表示兩個(gè)變量之間的關(guān)系;(2)散點(diǎn)矩陣:用于表示多個(gè)變量之間兩兩關(guān)系;(3)重疊散點(diǎn)圖:用于表示多個(gè)自變量與一個(gè)應(yīng)變量或一個(gè)自變量與多個(gè)應(yīng)變量之間的關(guān)系;(4)三維散點(diǎn)圖:表示三個(gè)變量之間綜合關(guān)系;1 簡(jiǎn)單散點(diǎn)圖-SampleGraph-Scatter-Sample-Difine-選擇 y Axis和 x Axis2

2、散點(diǎn)圖矩陣-MatrixGraph-Scatter-Matrix-在主對(duì)話框Matrix Variables選入對(duì)個(gè)變量得到矩陣圖,矩陣的組成元素是一個(gè)一個(gè)的散點(diǎn)圖;圖中:每個(gè)變量是所在橫行的兩個(gè)圖的縱坐標(biāo);是所在縱列的兩個(gè)圖的橫坐標(biāo),對(duì)角線處是空白;P245瘦肉量對(duì)眼肌面積、腿肉量、腰肉量散點(diǎn)矩陣圖3 重疊散點(diǎn)圖-Overlay重疊散點(diǎn)圖:用于表示多個(gè)自變量與一個(gè)應(yīng)變量或一個(gè)自變量與對(duì)個(gè)應(yīng)變量之間的關(guān)系;1)如果變量不是一個(gè)數(shù)量級(jí),需要轉(zhuǎn)換Transform-Compute-Target Variable欄選入要轉(zhuǎn)換數(shù)量級(jí)的變量-Numeric Expression框里鍵入放大倍數(shù)2)Gra

3、ph-Scatter-Overlay-define-3)Y-X Pairs欄定義散點(diǎn)所代表的成對(duì)的變量4 擬合回歸線 (1) 在編輯窗口選擇Chart-Option,或者雙擊繪圖區(qū)域的空白處,展開Options對(duì)話框(2) 在Fit line欄定義擬合散點(diǎn)趨勢(shì)線的方式:選display for each pair-Fit option(3) 選擇回歸線擬合方式1)Linear regression:擬合線性回歸線,即根據(jù)最小二乘法確定線性回歸方程直線,也是系統(tǒng)默認(rèn)項(xiàng)。2)Quardratic regression:擬合二次方曲線,根據(jù)最小二乘法,用二次方回歸曲線對(duì)散點(diǎn)圖中的數(shù)據(jù)點(diǎn)作最佳擬合。3

4、)Cubic regression:擬合三次方曲線,根據(jù)最小二乘法,用三次方回歸曲線對(duì)散點(diǎn)圖中的數(shù)據(jù)進(jìn)行最佳擬合。5 三維散點(diǎn)圖-3D三維散點(diǎn)圖:表示三個(gè)變量之間綜合關(guān)系;即在三個(gè)變量確定的三維空間中研究變量之間的關(guān)系; 在對(duì)話框中依次將變量定義為x、y、z軸即得;可以更清晰和直觀的對(duì)應(yīng)變量與自變量的關(guān)系進(jìn)行觀察,結(jié)合旋轉(zhuǎn)功能發(fā)現(xiàn)二維空間中可能無(wú)法看到的信息,如曲線關(guān)系、異常值等。 三維旋轉(zhuǎn) 在Output窗口中Format菜單-3-D rotation-展開對(duì)話框- 有6個(gè)小按鈕即為設(shè)置圖形旋轉(zhuǎn)方向,可以把圖形作各個(gè)方向旋轉(zhuǎn),以便發(fā)現(xiàn)變量變化趨勢(shì)及異常值二 相關(guān)分析(一)相關(guān)分析的功用和應(yīng)用

5、:研究和處理變量之間相關(guān)關(guān)系的數(shù)理統(tǒng)計(jì)方法Bivariate過(guò)程:用于進(jìn)行兩個(gè)/多個(gè)變量間的參數(shù)/非參數(shù)相關(guān)分析,如果是多個(gè)變量,給出兩兩相關(guān)分析結(jié)果。Partial過(guò)程:進(jìn)行偏相關(guān)分析,如果兩個(gè)變量的取值均受到其他變量的影響,就可以利用偏相關(guān)分析對(duì)其他變量進(jìn)行控制,輸出控制其他變量影響后的相關(guān)系數(shù)。(二)兩個(gè)變量相關(guān)分析過(guò)程:1 建立數(shù)據(jù)文件:定義因變量和自變量2 作散點(diǎn)圖:初步判斷兩個(gè)變量間是否存在線性相關(guān)趨勢(shì),是否為直線趨勢(shì),以及數(shù)據(jù)中是否存在異常點(diǎn)。3 Analyze-CorrelateBivariate-打開雙變量相關(guān)分析主對(duì)話框確定雙變量(x,y);如果選入了多個(gè),則結(jié)果會(huì)以相關(guān)矩

6、陣的形式給出兩兩直線相關(guān)分析結(jié)果。二相關(guān)分析圖1.數(shù)據(jù)文件二相關(guān)分析圖2.AnalyzeCorrelate-Bivariate3 主對(duì)話框中的選擇項(xiàng)(1)Correlation Coefficients 復(fù)選框:用于選擇需要計(jì)算的相關(guān)分析指標(biāo):Pearson:計(jì)算Pearson相關(guān)系數(shù)(r)進(jìn)行積距相關(guān)分析,即參數(shù)相關(guān)分析。Kendall(等級(jí)相關(guān)):計(jì)算等級(jí)相關(guān)系數(shù)spearman(秩相關(guān)):計(jì)算spearman相關(guān)系數(shù),即是最常用的非參數(shù)相關(guān)分析(2)顯著性檢驗(yàn)類型選擇項(xiàng): two-tailedone-tailed4 options 對(duì)話框中的選擇項(xiàng):用于選擇需要計(jì)算的描述統(tǒng)計(jì)量和統(tǒng)計(jì)分析

7、(1)描述統(tǒng)計(jì)量選擇項(xiàng):選擇輸出每個(gè)變量的均值、標(biāo)準(zhǔn)差等(2)缺失值處理方法選擇項(xiàng)二 相關(guān)分析圖3.確定variable; option對(duì)話框選項(xiàng)5結(jié)果顯示: (1)行列變量的相關(guān)系數(shù)矩陣及其顯著性標(biāo)記(*) (2)相關(guān)系數(shù)為0的假設(shè)成立的概率 (3)觀測(cè)量數(shù)目三 多元線性回歸分析SPSS的Regression菜單中:1 線性回歸:包括簡(jiǎn)單線性回歸和多元線性回歸,由Linear過(guò)程實(shí)現(xiàn)。2 非線性回歸:包括曲線回歸過(guò)程(Curve Estimation)和非線性回歸過(guò)程(Nonlinear Regression)(一)多元線性回歸的數(shù)學(xué)模型i = 1, 2, , n0: 常數(shù)項(xiàng)j: 偏回歸系數(shù)

8、(j = 1, 2, , p) 當(dāng)其他自變量保持不變時(shí),自變量 xj 每 改變1個(gè)單位所造成的 y 的變化量ei : 隨機(jī)誤差 各個(gè)ei彼此獨(dú)立 回歸參數(shù) (二)多元線性回歸方程設(shè)Y對(duì)X1 、X2 Xm的m元線性回歸方程: b0, b1, b2, ,bp 是0, 1, 2, ,p的最小二乘估計(jì)值,它們滿足(三)線性回歸模型的適用條件1 線性趨勢(shì):自變量與應(yīng)變量的關(guān)系是線性的,如果不是,則不能采用線性回歸來(lái)分析,可以通過(guò)散點(diǎn)圖來(lái)加以判斷。2 獨(dú)立性:應(yīng)變量的取值相互獨(dú)立,反映在模型中即是誤差間相互獨(dú)立,不存在自相關(guān),否則應(yīng)采取自回歸模型來(lái)分析。3 正態(tài)性:對(duì)于自變量的任何組合,應(yīng)變量Y均服從正態(tài)

9、分布,反應(yīng)在模型中即誤差服從正態(tài)分布。4 方差齊性:就自變量的任何一個(gè)線性組合,應(yīng)變量Y的方差均相等,實(shí)質(zhì)是要求誤差的方差齊。(四)多元回歸分析常用指標(biāo)1 偏回歸系數(shù):模型中的b,它反應(yīng)的是相應(yīng)的某個(gè)自變量上升一個(gè)單位時(shí),應(yīng)變量取值的變動(dòng)情況,即自變量對(duì)應(yīng)變量的影響程度。2 標(biāo)準(zhǔn)化偏回歸系數(shù):用表示,由于自變量間的變異程度和均數(shù)有時(shí)相差非常大,直接用偏回歸系數(shù)無(wú)法比較各自變量的影響程度大小,為此將各自變量進(jìn)行標(biāo)準(zhǔn)正態(tài)變換后再進(jìn)行分析,即得到標(biāo)準(zhǔn)偏回歸系數(shù),它的大小可以直接用來(lái)比較各自變量對(duì)應(yīng)變量的影響程度。3 決定系數(shù):即R2,它反應(yīng)應(yīng)變量y的全部變異中能夠通過(guò)回歸關(guān)系被自變量解釋的比例。(五

10、)回歸分析內(nèi)容和步驟1 作散點(diǎn)圖:觀察變量間的變化趨勢(shì)(線性、曲線及異常值考察);如果是多個(gè)變量,則作散點(diǎn)矩陣圖、重疊散點(diǎn)圖和三維散點(diǎn)圖。2 考察數(shù)據(jù)的分布,進(jìn)行必要的預(yù)處理。即分析變量的正態(tài)性、方差齊性等問(wèn)題,并確定是否可以直接進(jìn)行回歸分析。如果進(jìn)行了變量變換,則應(yīng)重新繪制散點(diǎn)圖,以確保線性趨勢(shì)在變換后仍然存在。(五)回歸分析內(nèi)容和步驟3 進(jìn)行直線回歸分析:包括變量的初篩、變量選擇方法的確定等。4 殘差分析:(1)殘差間是否獨(dú)立:采用Durbin-Watson殘差序列相關(guān)性檢驗(yàn)進(jìn)行分析。(2)殘差分布是否為正態(tài):可采用殘差列表及一些相關(guān)指標(biāo)來(lái)分析,但是最重要和直觀的方法為圖示法。直方圖在P-

11、P圖中,如果數(shù)據(jù)呈正態(tài)分布,則圖中數(shù)據(jù)點(diǎn)應(yīng)和理論直線(對(duì)角線)基本重合。(六)線性回歸分析操作方法和結(jié)果操作方法1 Analyze-Regression-Linear過(guò)程:2 在主對(duì)話框確定:(1)Dependent:用于選入回歸分析應(yīng)變量;(2)Independent:用于選入回歸分析的自變量,它們進(jìn)入模型的方法可以使用Block按鈕進(jìn)行不同定義。圖1.analyze-regressionlinear線性回歸主對(duì)話框,確定因變量(dependent)、自變量(independent)(六)線性回歸分析操作方法和結(jié)果(3) Block按鈕組:由Previous和Next兩個(gè)按鈕組成,用于將自變

12、量選入模型;注:在多元回歸分析中自變量的選入方式有強(qiáng)行、前進(jìn)、后退、逐步等方法。(4)Method下拉列表:用于選擇對(duì)自變量的選入方法。在SPSS中,Independent(自變量)進(jìn)入模型的方法選擇:1 Enter(強(qiáng)行進(jìn)入法):后選變量全部被納入模型,不作任何篩選。2 Stepwise (逐步法):分別計(jì)算各個(gè)變量對(duì)y的影響,按由大到小挑選影響最大的先進(jìn)入方程;重新計(jì)算各自變量的影響,并考察已在方程中的變量是否會(huì)因?yàn)樾伦兞康囊攵辉儆薪y(tǒng)計(jì)意義,如果變量低于入選標(biāo)準(zhǔn),則考慮剔除,直到方程內(nèi)沒(méi)有變量可被剔除,方程外沒(méi)有變量可被引入。3 Remove(強(qiáng)制剔除法,只出不入)4 Backward

13、(向后法,只出不入)5Forward(向前法,只進(jìn)不出)(六)線性回歸分析操作方法和結(jié)果3 Statistics對(duì)話框:用于選擇所需要的描述統(tǒng)計(jì)量。(1)Regression Coefficients復(fù)選框組:定義回歸系數(shù)的輸出情況,選中Estimates可以輸出回歸系數(shù)B及其標(biāo)準(zhǔn)誤,t值和P值;標(biāo)準(zhǔn)偏回歸系數(shù)Beta等;(2)Residuals復(fù)選框組:用于選擇輸出殘差診斷的信息,可選Durbin-Watson殘差序列相關(guān)性檢驗(yàn)。(3)Model fit:模型擬合過(guò)程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗(yàn):復(fù)相關(guān)系數(shù)R、決定系數(shù)R2和調(diào)整的R2 、標(biāo)準(zhǔn)誤及方差分析表。三.回歸分

14、析圖2.statistics對(duì)話框(六)線性回歸分析操作方法和結(jié)果4 Plots子對(duì)話框:(1)Scatter組:用于選擇需要繪制的回歸分析診斷或預(yù)測(cè)圖,左側(cè)給出繪圖時(shí)可用的中間變量列表。(2)Standardized Residual Plots復(fù)選框:繪制標(biāo)準(zhǔn)化殘差圖,可供選擇的有直方圖和正態(tài)P-P圖。三.回歸分析圖3.plot對(duì)話框確定橫縱坐標(biāo)(六)線性回歸分析操作方法和結(jié)果5 Option子對(duì)話框:設(shè)置回歸分析一些選項(xiàng)。Stepping Method Criteria單選按鈕組:設(shè)置納入和排除標(biāo)準(zhǔn),可按P值或F值來(lái)設(shè)置。分析結(jié)果表2 Model summary :模型摘要,顯示所擬合模

15、型的擬合優(yōu)度情況,內(nèi)容有相關(guān)系數(shù)、決定系數(shù)、校正的決定系數(shù),結(jié)果與同一資料的相關(guān)分析結(jié)果相同。表3 回歸關(guān)系方差分析表(ANOVA):表明回歸模型是否有意義。表1 Variables Entered/Removed:顯示擬合過(guò)程中變量進(jìn)入/退出模型的情況記錄,即進(jìn)入的變量名和進(jìn)入/退出方法。表4 回歸系數(shù)檢驗(yàn)表(Coefficients):給出常數(shù)a(Constant)、未標(biāo)準(zhǔn)化系數(shù)(Unstandardized Coefficients)和標(biāo)準(zhǔn)化即偏回歸系數(shù)(standardized Coefficients)的顯著性t檢驗(yàn)結(jié)果表5 殘差分析表:使用Statistics子對(duì)話框中的R esi

16、duals復(fù)選框組,在Model Summary表中給出Durbin-Watson統(tǒng)計(jì)量,該統(tǒng)計(jì)量取值在0-4之間,如果殘差間相互獨(dú)立(沒(méi)有相關(guān)性),則取值在2附近。預(yù)測(cè)值、殘差、標(biāo)化預(yù)測(cè)值、標(biāo)化殘差的描述統(tǒng)計(jì)量6圖:殘差分布圖,利用Plot子對(duì)話框的功能作出。(1)殘差直方圖:是否呈正態(tài),是否有極端值。(2)殘差正態(tài)PP圖:如果散點(diǎn)成直線變化趨勢(shì),表示殘差分布為正態(tài)。多元線性回歸分析實(shí)例多元線性回歸實(shí)例結(jié)果輸出表1:列出模型篩選過(guò)程,引入了3個(gè)變量,模型1用進(jìn)入法引入眼肌面積;模型2、3分別用逐步法引進(jìn)了腿肉量和腰肉量,引入標(biāo)準(zhǔn)是概率小于等于0.05,移出標(biāo)準(zhǔn)是概率大于等于0.1表2是3個(gè)模

17、型改變情況,從調(diào)整的R2 可見,從上到下隨著新變量的引入,模型中回歸關(guān)系引起的變異的比例越來(lái)越大。表3表4三個(gè)變量均用逐步法引入顯示沒(méi)有被引入模型的各個(gè)變量的檢驗(yàn)結(jié)果四曲線回歸-Curve Estimation 曲線回歸分析(Curvilinear regression analysis): 通過(guò)兩個(gè)相關(guān)變量x與y的實(shí)際觀測(cè)數(shù)據(jù)建立曲線回歸方程,以揭示x與y間的曲線聯(lián)系的形式。 例如:細(xì)菌繁殖速率與溫度關(guān)系;畜禽在生長(zhǎng)發(fā)育過(guò)程中各種生理指標(biāo)(體重)與年齡的關(guān)系;乳牛的泌乳量與泌乳天數(shù)的關(guān)系;確定變量x與y之間的曲線關(guān)系類型的途徑:(1)根據(jù)生物科學(xué)的有關(guān)專業(yè)知識(shí),或根據(jù)已知的理論規(guī)律和實(shí)踐經(jīng)驗(yàn)。 如:細(xì)菌數(shù)量的增長(zhǎng)、藥物與動(dòng)物死亡率之間的關(guān)系為S形曲線。(2)不能從專業(yè)知識(shí)判斷,利用散點(diǎn)圖,根據(jù)散點(diǎn)的趨勢(shì)來(lái)判斷曲線類型,觀察實(shí)測(cè)點(diǎn)的分布趨勢(shì)與哪類已知的函數(shù)曲線最接近,然后再選用該函數(shù)的關(guān)系式來(lái)擬合實(shí)測(cè)點(diǎn)。例(p196)在肉用四川白鵝的補(bǔ)飼飼料配方研究中,得到如下結(jié)果。試對(duì)體重與日齡進(jìn)行回歸分析。日齡(x)07142128425670體重(y)105214335560790129020102950操作過(guò)程1 Graphs-scatter

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論