直線相關與回歸_第1頁
直線相關與回歸_第2頁
直線相關與回歸_第3頁
直線相關與回歸_第4頁
直線相關與回歸_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

直線相關與回歸第1頁,共57頁,2023年,2月20日,星期一

一、直線相關【目的】

掌握直線相關的作用、應用前提掌握線性相關SPSS操作方法正確解釋線性相關的輸出結果第2頁,共57頁,2023年,2月20日,星期一【原理】直線相關是分析兩個不分主次的變量間的線性相關關系,適用于雙變量正態(tài)分布的資料。相關并不表示一個變量的改變是另一個變量變化的原因,也有可能同時受另一個因素的影響。相關分析的任務是對相關關系給出定量的描述。通常用Pearson相關系數(shù)來定量地描述線性相關的程度。第3頁,共57頁,2023年,2月20日,星期一相關種類相關不相關第4頁,共57頁,2023年,2月20日,星期一相關系數(shù)沒有量綱,且-1r1。當r>0,且H0(ρ=0)被拒絕時,認為兩變量之間呈正相關關系;當r<0,且H0(ρ=0)被拒絕時,認為兩變量之間呈負相關關系;當r值接近于零,且H0(ρ=0)被接受時,認為兩變量之間不呈直線關系,但不能排除兩變量之間可能存在某種曲線關系。第5頁,共57頁,2023年,2月20日,星期一線性相關的注意事項person相關系數(shù)的計算要求兩個變量都服從正態(tài)分布,并且在作相關分析時,一般先作散點圖,考慮是否有可能直線相關。相關系數(shù)需要做假設檢驗。如果變量X和Y不服從雙變量正態(tài)分布,或均為多分類有序資料,可以用Spearman秩相關相關關系不一定是因果關系,可能僅是表面上的伴隨關系,或兩個變量同時受另一因素的影響,如小孩的身高和小樹的樹高同時受時間的影響,在校兒童的鞋的大小和閱讀技能同時受年齡的影響。第6頁,共57頁,2023年,2月20日,星期一【操作步驟】路徑:Analyze—>Correlate—>Bivariate…—>將分析變量選入Variables中,

—>在CorrelationCoefficients中選擇Pearson—>在TestofSignificance中選擇Two-tailed(雙側檢驗)—>OK。第7頁,共57頁,2023年,2月20日,星期一例8-1.某地10名一年級女大學生的胸圍(cm)與肺活量(L)數(shù)據見下表,試分析兩個變量有無線性相關關系?表8-1某地10名一年級女大學生的胸圍(cm)與肺活量(L)第8頁,共57頁,2023年,2月20日,星期一【操作步驟】1.建立SPSS數(shù)據文件,如圖8-1所示圖8-1數(shù)據庫文件第9頁,共57頁,2023年,2月20日,星期一2.繪制散點圖,直觀判斷兩個變量之間有無線性關系

Graphs—>Scatter/Dot…—>SimpleScatter—>Define,將胸圍選入XAxis中,將肺活量選入YAxis中—>Titles…—>在Title的Line1中輸入散點圖的標題—>Continue—>OK。第10頁,共57頁,2023年,2月20日,星期一圖8-210名女大學生胸圍與肺活量散點圖結果解釋:從圖中可以看出,胸圍和肺活量似乎沒有線性關系,但是具體結論要通過以下步驟的分析才能得到。第11頁,共57頁,2023年,2月20日,星期一3.對兩變量進行正態(tài)性判斷

analyze—>descriptivestatistics—>explore—>“胸圍”、“肺活量”導入dependentlist—>plots選項—>選中Normalityplotswithtests—>continue—>ok圖8-3變量正態(tài)性檢驗結果結果分析,兩變量均符合正態(tài)分布。第12頁,共57頁,2023年,2月20日,星期一4.線性相關分析

Analyze—>Correlate—>Bivariate…—>將“胸圍”、“肺活量”選入Variables中—>在CorrelationCoefficients中選擇Pearson—>在TestofSignificance中選擇Two-tailed(雙側檢驗)—>選擇Flagsignificantcorrelations—>OK。第13頁,共57頁,2023年,2月20日,星期一變量X和Y不服從雙變量正態(tài)分布,或均為多分類有序資料,可以用Spearman秩相關第14頁,共57頁,2023年,2月20日,星期一主要輸出結果:圖8-6correlations結果胸圍與肺活量之間的相關系數(shù)為0.504,P=0.138,無統(tǒng)計學意義,那么我們可以認為女大學生胸圍與肺活量之間不存在線性相關性。第15頁,共57頁,2023年,2月20日,星期一

Spearman秩相關補充例題

某醫(yī)生收集12例急性腦梗死(AMI)病人,記錄了患者在搶救期間的總膽固醇,用愛丁堡-斯堪的納維亞神經病學卒中SNSS量表評分標準評定患者的神經功能缺損程度,試分析總膽固醇與神經功能評分是否相關。第16頁,共57頁,2023年,2月20日,星期一量表評分X總膽固醇Y104.04446.21154.83195.23144.71124.44154.38113.73996.00114.38124.00114.36表12例AMI患者的量表評分與膽固醇測量值第17頁,共57頁,2023年,2月20日,星期一建立數(shù)據庫設立兩個變量X和Y,X代表量表評分,Y代表總膽固醇正態(tài)性檢驗Spearman秩相關第18頁,共57頁,2023年,2月20日,星期一建立數(shù)據庫第19頁,共57頁,2023年,2月20日,星期一正態(tài)性檢驗P=0.000<0.05,差異有統(tǒng)計學意義結果分析,兩變量均不符合正態(tài)分布。第20頁,共57頁,2023年,2月20日,星期一Spearman秩相關第21頁,共57頁,2023年,2月20日,星期一rs=0.851,P=0.000<0.05,差異有統(tǒng)計學意義結果第22頁,共57頁,2023年,2月20日,星期一

二、直線回歸【目的】

掌握簡單線性回歸的作用、應用前提掌握簡單線性回歸SPSS操作方法正確解釋簡單線性回歸的輸出結果第23頁,共57頁,2023年,2月20日,星期一【原理】

簡單線性回歸是分析兩個連續(xù)型變量之間依存變化的數(shù)量關系的統(tǒng)計方法。線性回歸中兩變量的地位是不同的,其中一個作為自變量,亦稱為解釋變量,X用表示,另一個為因變量,Y用表示。如果自變量與因變量間關系有線性趨勢,可以用某個適合的線性回歸方程來描述的總體均數(shù)依賴于的數(shù)值變化。假設總體回歸方程如下:

第24頁,共57頁,2023年,2月20日,星期一a是截距;b為回歸系數(shù),即直線的斜率

用樣本數(shù)據建立的有關依存變化的線性表達式稱為樣本回歸方程:第25頁,共57頁,2023年,2月20日,星期一

回歸參數(shù)的估計,通常用回歸參數(shù)估計的最小二乘原則。即用一定的數(shù)學方法確定a與b的適宜值,能使n個數(shù)據點的殘差平方和達到最小值,則稱這一對a與b為回歸方程的最小二乘估計,使回歸殘差平方和最小的原則稱為最小二乘原則。第26頁,共57頁,2023年,2月20日,星期一簡單線性回歸只有將兩個內在有聯(lián)系的變量放在一起進行回歸分析才有意義做回歸分析時,如果兩個有內在聯(lián)系的變量之間存在的是一種依存因果關系,那么應該以因的變量為X,以果的變量為Y。如果變量之間并無因果關系,則應以易于測定、較為穩(wěn)定或變異較小者為X進行回歸分析時,應先繪制散點圖第27頁,共57頁,2023年,2月20日,星期一線性回歸分析的前提條件線性(linear)反應變量Y與自變量X呈線性變化趨勢獨立(independent)任意兩個觀察值相互獨立,一個個體的取值不受其他個體的影響給定X時,Y正態(tài)分布(normal)給定X取值時,Y的取值服從正態(tài)分布等方差(equalvariance)指對應于不同的X值,Y值的總體變異相同第28頁,共57頁,2023年,2月20日,星期一建立回歸方程后,須對回歸系數(shù)進行假設檢驗。使用回歸方程進行估計與預測時,一般只適用于原來的觀測范圍,即自變量的取值范圍,不能隨意將范圍擴大。在線性回歸分析時,要注意遠離群體的極端值對回歸效果的影響。第29頁,共57頁,2023年,2月20日,星期一【操作步驟】路徑:Analyze—>Regression—>Linear,彈出LinearRegression主對話框,自變量選入Independent框因變量選入Dependent框—>單擊Statistics,打開Statistics對話框—>選擇Descriptives、Estimates、Modelfit—>Continue—>OK.第30頁,共57頁,2023年,2月20日,星期一例8-2.某地方病研究所調查8名正常兒童的尿肌酐含量(mmol/24h),估計尿肌酐含量(y)對其年齡(x)的回歸方程表8-28名正常兒童的年齡與尿肌酐含量第31頁,共57頁,2023年,2月20日,星期一【操作步驟】1.建立SPSS數(shù)據文件第32頁,共57頁,2023年,2月20日,星期一2.繪制散點圖,判斷兩變量之間有無線性趨勢

Graphs—>Scatter/Dot…—>SimpleScatter—>Define,將年齡選入XAxis中,將尿肌酐含量選入YAxis中—>OK第33頁,共57頁,2023年,2月20日,星期一圖8-108名正常兒童年齡與尿肌酐含量散點圖第34頁,共57頁,2023年,2月20日,星期一3.對因變量進行正態(tài)性判斷

analyze—>descriptivestatistics—>explore—>“尿肌酐含量”導入dependentlist—>plots選項—>選中Normalityplotswithtests—>continue—>ok圖8-11因變量正態(tài)性檢驗結果結果解釋:Z=0.94,P=0.612>0.05,無統(tǒng)計學意義,認為正常兒童的尿肌酐含量符合正態(tài)分布第35頁,共57頁,2023年,2月20日,星期一4.模型擬合Analyze—>Regression—>Linear—>在LinearRegression對話框中將年齡選入Independent(s)中,將尿肌酐含量選入Dependent中—>在Method中選擇Enter—>

第36頁,共57頁,2023年,2月20日,星期一

單擊Statistics,打開子對話框—>在RegressionCoefficients中選擇Estimates選擇Modelfit—>Continue—>OK。第37頁,共57頁,2023年,2月20日,星期一主要輸出結果

圖8-14擬合過程中變量進入/退出模型的情況線性回歸中只有一個自變量,并且采取強行進入的方法第38頁,共57頁,2023年,2月20日,星期一圖8-15模型的擬合優(yōu)度情況模型中相關系數(shù)R=0.882,決定系數(shù)為0.778,校正決定系數(shù)為0.740第39頁,共57頁,2023年,2月20日,星期一圖8-16整個模型的檢驗結果所擬合的回歸模型F值為20.968,P為0.004,因此擬合模型是有意義的(直線回歸中,模型中只有一個自變量,對模型的檢驗就等價于對回歸系數(shù)的檢驗)第40頁,共57頁,2023年,2月20日,星期一圖8-17常數(shù)項和系數(shù)的檢驗結果常數(shù)項和系數(shù)的檢驗結果,均有意義;回歸系數(shù)t檢驗所得P值與整個模型檢驗結果相等,未標化回歸系數(shù)為0.139,常數(shù)項為1.622第41頁,共57頁,2023年,2月20日,星期一結果解釋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論