第六次課多元線性回歸spss_第1頁
第六次課多元線性回歸spss_第2頁
第六次課多元線性回歸spss_第3頁
第六次課多元線性回歸spss_第4頁
第六次課多元線性回歸spss_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、多元線性回歸分析 SPSS2022/8/22方法:是簡單直線回歸的推廣,研究一個應(yīng)變量與多個自變量之間的數(shù)量依存關(guān)系。 。資料:應(yīng)變量(Y)為定量指標(biāo);自變量(xi)全部或大部分為定量指標(biāo),若有少量定性或等級指標(biāo)需作轉(zhuǎn)換。2022/8/23多元線性回歸模型的應(yīng)用條件:1.線性趨勢(linear):自變量與因變量的關(guān)系是線性的,即Y與Xi間具有線性關(guān)系2.獨立性(independence):應(yīng)變量Y的取值相互獨立,Cov(ei,ej)= 03.正態(tài)性(normality):對任意一組自變量取值,因變量Y服從正態(tài)分布,eiN(0,2),4.方差齊性(homogeneity):對任意一組自變量取值,

2、因變量y的方差相同,Var(ei)=2 后兩個條件等價于:殘差服從均數(shù)為0、方差為2的正態(tài)分布 這些條件縮寫為LINE,是線性回歸方程的核心。2022/8/24表2 27名糖尿病人的血糖及有關(guān)變量的測量結(jié)果 例題1 :有學(xué)者認(rèn)為糖尿病人的血糖變化可能受胰島素、糖化血紅蛋白、血清總膽固醇、甘油三脂等多種生化指標(biāo)的影響,現(xiàn)測量了27名糖尿病人的相關(guān)指標(biāo),資料如下表所示,請對此作分析。2022/8/25方程的求解過程復(fù)雜,可借助于SPSS等統(tǒng)計軟件來完成SPSS:分析回歸線性因變量:Y 自變量:x1-x42022/8/26SPSS的操作界面2022/8/27SPSS結(jié)果2022/8/28模型適用條件

3、的檢驗用張文彤SPSS高級篇中的數(shù)據(jù)reg為例一、線性趨勢(1)散點圖矩陣(2)未標(biāo)準(zhǔn)化殘差與該自變量(x1、x2)的散點圖2022/8/29模型適用條件的檢驗二、各觀測間相互獨立:即任兩個觀測殘差的協(xié)方差為0,可利用殘差圖提供直觀的信息,對于殘差間是否相互獨立可通過線性回歸中統(tǒng)計量按鈕中提供的Durbin-Watson檢驗進行判斷2022/8/210模型適用條件的檢驗2022/8/211模型適用條件的檢驗三、殘差ei服從正態(tài)分布可以通過繪制標(biāo)準(zhǔn)化殘差的直方圖、PP圖(正態(tài)概率圖)和莖葉圖進行。2022/8/212模型適用條件的檢驗2022/8/213模型適用條件的檢驗2022/8/214模型

4、適用條件的檢驗2022/8/215模型適用條件的檢驗2022/8/216模型適用條件的檢驗方差齊性:即殘差的大小不隨所有變量取值水平的改變而改變,上面的plot子對話框提供兩繪制反應(yīng)變量與各種殘差的殘差圖,以標(biāo)準(zhǔn)化殘差為Y軸,已標(biāo)準(zhǔn)化預(yù)測值為X軸二、逐步選擇法 1. 前進法(forward selection):回歸方程中的自變量從無到有、從少到多逐個引入回歸方程。此法已基本淘汰。2. 后退法(backward elimination):先將全部自變量選入方程,然后逐步剔除無統(tǒng)計學(xué)意義的自變量。3. 逐步回歸法(stepwise regression):是在前述兩種方法的基礎(chǔ)上,進行雙向篩選的

5、一種方法。該方法本質(zhì)上是前進法。 它們的共同特點是每一步只引入或剔除一個自變量。決定其取舍則基于對偏回歸平方和的F 檢驗。2022/8/2181.前進法 (forward selection)自變量從無到有、從少到多 Y對每一個自變量作直線回歸,對回歸平方和最大的自變量作F 檢驗,有意義(P?。﹦t引入。在此基礎(chǔ)上,計算其它自變量的偏回歸平方和,選取偏回歸平方和最大者作F 檢驗,。 局限性:即后續(xù)變量的引入可能會使先進入方程的自變量變得不重要。2022/8/2192.后退法(backward elimination) 先將全部自變量放入方程,然后逐步剔除 偏回歸平方和最小的變量,作F 檢驗及相應(yīng)

6、的P值,決定它是否剔除(P大) 。建立新的回歸方程。重復(fù)上述過程。 局限性:自變量高度相關(guān)時,可能得不出正確的結(jié)果。2022/8/2203.逐步回歸法(stepwise regression)雙向篩選 ;引入有意義的變量(前進法),剔除無意義變量(后退法)“先剔除后選入”原則2022/8/221逐步回歸法是進行雙向篩選的一種方法。自變量回歸平方和最大的Xi首先進入方程,在Xi進入方程的基礎(chǔ)上計算其余m-1個自變量分別進入回歸方程時的偏回歸平方和,其中最大者記為SSj,對Xj進行基于偏回歸平方和的F檢驗,若有意義則進入方程,并重新對Xi進行檢驗。若Xi退化為無意義,則剔除Xi,同時再對Xj進行檢

7、驗。若Xj依然有意義則繼續(xù)選擇下一個偏回歸平方和最大者并進行檢驗。重復(fù)此過程,直到既沒有自變量需要引入方程,也沒有自變量從方程中剔除為止,從而得到一個局部最優(yōu)的回歸方程。2022/8/222逐步回歸法每引入或剔除一個自變量后都要重新對已進入方程中的自變量進行檢驗,直到方程外沒有有意義的自變量可引入、方程內(nèi)也沒有無意義的自變量可剔除為止。2022/8/223逐步回歸法“先剔除后選入”原則入出引入變量的檢驗水準(zhǔn)要小于或等于剔除變量的檢驗水準(zhǔn)。 小樣本檢驗水準(zhǔn)a定為0.10或0.15,大樣本把a定為0.05。 a值越小表示選取自變量的標(biāo)準(zhǔn)越嚴(yán)。2022/8/224逐步回歸法實例(令入0.10,出0.

8、15) 2022/8/225多元線性回歸的應(yīng)用及其注意事項一、多元線性回歸的應(yīng)用1.影響因素分析:控制混雜因素年齡(X1)飲食習(xí)慣(X2)吸煙狀況(X3)工作緊張度(X4)家族史(X5) 高血壓(Y)2022/8/2262.估計與預(yù)測: 預(yù)測:由自變量值推出因變量Y的值、容許區(qū)間和總體均數(shù)的可信區(qū)間。新生兒體重(Y)=b0+b1胎兒孕齡(X1)+ b2 胎兒頭徑(X2)+ b3胎兒胸徑(X3)+ b4胎兒腹徑(X4)心臟表面積(Y)=b0+b1心臟橫徑(X1)+ b2心臟縱徑(X2)+ b3心臟寬徑(X3)2022/8/2273.統(tǒng)計控制:利用回歸方程進行逆估計,確定Y后控制X。采用射頻治療儀

9、治療腦腫瘤:腦皮質(zhì)毀損半徑(Y) =b0+b1射頻溫度(X1)+ b2照射時間(X2)2022/8/228二、多元線性回歸應(yīng)用的注意事項1.指標(biāo)的數(shù)量化 應(yīng)變量Y為連續(xù)變量自變量X可為連續(xù)、有序分類或無序分類變量 (1)連續(xù)變量:X (2)有序分類變量: 1 輕 X= 2 中 3 重(3)無序分類變量:化為n1個啞變量2022/8/229 在用某些統(tǒng)計方法(如回歸分析)時,象治療方式和疾病的嚴(yán)重程度等多分類變量或有序變量是無法進行統(tǒng)計的。為了能將這類變量進行分析(如回歸分析),必須進行數(shù)量化處理,啞變量就是把定性資料(如多分類變量和等級變量)數(shù)量化后轉(zhuǎn)化為定量資料的一種方法。因為如果將分類指標(biāo)

10、直接量化,這時的數(shù)值是沒有意義的:不能這樣做,因為各類間你不能說誰大誰小,所以不能直接量化。啞變量的引入,擴大了統(tǒng)計分析方法(如回歸分析)的應(yīng)用范圍,但是在建立回歸方程時一定要把它們作為一個整體來考慮是否引入方程。 何為啞變量 ?2022/8/2301, 0, 0 表示 I 組0, 1, 0 表示II組0, 0, 1 表示III組0, 0, 0 表示組x1x2x3作為基準(zhǔn) 多分類變量定量化一般采用啞變量(dummy,又稱指示變量)表示(即0-1法):2022/8/231當(dāng)自變量為分類變量時的賦值方法自變量為二分類變量時自變量為多分類變量時:假定有k類,則k-1個取值為0或1的啞變量(dummy

11、 variables)完整地標(biāo)記出這些類別。X=0 男1 女無序分類變量2022/8/232無序多分類自變量的啞變量化原資料姓名性別年齡療法1150中西2120西3018中4070中5135中西6029西啞變量化 序號性別年齡X1X2115001212010301800407000513501602910西、中西、中三種療法2022/8/233數(shù)據(jù)格式回歸方程 建立回歸方程 b1 :相當(dāng)A 型相對于O 型的差別b2 :相當(dāng)B 型相對于O 型的差別b3 :相當(dāng)AB 型相對于O 型的差別2022/8/234 (3)等級 定量。 一般是將等級從弱到強轉(zhuǎn)換為 或 )如文化程度分為小學(xué)、中學(xué)、大學(xué)、大學(xué)以上四個等級。Y為經(jīng)濟收入。解釋:b(b1)反映X(X1) 增加1個單位, 增加b個單位(如:500元)。表示中學(xué)文化較小學(xué)收入多500,大學(xué)較中學(xué)多500,余類推。2022/8/235b1,b2,b3分別反映中學(xué)、大學(xué)、大學(xué)以上相對于小學(xué)文化程度者經(jīng)濟收入差別的大小也可將K個等級轉(zhuǎn)換為K-1個(0,1)變量2022/8/2362.樣本含量 n至少是X個數(shù)m的510倍3.關(guān)于逐步回歸 對逐步回歸得到的結(jié)果不要盲目的信任,結(jié)合專業(yè)知識。所謂的“最優(yōu)”回歸方程并不一定是最好的,沒有選入方程的變量也未必沒有統(tǒng)計學(xué)意義。 是否考慮交互作用主要靠專業(yè)知識。為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論