多重線(xiàn)性回歸_第1頁(yè)
多重線(xiàn)性回歸_第2頁(yè)
多重線(xiàn)性回歸_第3頁(yè)
多重線(xiàn)性回歸_第4頁(yè)
多重線(xiàn)性回歸_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)用多元統(tǒng)計(jì)分析 遼寧省第十八屆教育教學(xué)信息遼寧省第十八屆教育教學(xué)信息 化大獎(jiǎng)賽參賽作品化大獎(jiǎng)賽參賽作品 第八講 多重線(xiàn)性回歸 多重線(xiàn)性回歸 v多重線(xiàn)性回歸是簡(jiǎn)單線(xiàn)性回歸(直線(xiàn)回歸)的直 接推廣,其包含一個(gè)因變量和二個(gè)或二個(gè)以上的 自變量。 v簡(jiǎn)單線(xiàn)性回歸是研究一個(gè)因變量(Y)和一個(gè)自 變量(X)之間數(shù)量上相互依存的線(xiàn)性關(guān)系。而 多重線(xiàn)性回歸是研究一個(gè)因變量(Y)和多個(gè)自 變量(Xi)之間數(shù)量上相互依存的線(xiàn)性關(guān)系。 v簡(jiǎn)單線(xiàn)性回歸的大部分內(nèi)容可用于多重回歸,因 其基本概念是一樣的。 多重線(xiàn)性回歸的主要用途 (1)建立一個(gè)可反映應(yīng)變量與自變量關(guān)系的多重回 歸方程; (2)利用多重回歸方程,用已知

2、的自變量值去估計(jì) 未知應(yīng)變量; (3)分析一個(gè)應(yīng)變量與多個(gè)自變量的相關(guān)關(guān)系; (4)可以進(jìn)行自變量的篩選。 人的人的體重體重與身高、胸圍與身高、胸圍 血壓值血壓值與與年齡、性別、勞動(dòng)強(qiáng)度、飲食年齡、性別、勞動(dòng)強(qiáng)度、飲食 習(xí)慣、吸煙狀況、家族史習(xí)慣、吸煙狀況、家族史 糖尿病人的糖尿病人的血糖血糖與與胰島素、糖化血紅蛋胰島素、糖化血紅蛋 白、血清總膽固醇、甘油三脂白、血清總膽固醇、甘油三脂 射頻治療儀定向治療腦腫瘤過(guò)程中,腦射頻治療儀定向治療腦腫瘤過(guò)程中,腦 皮質(zhì)的皮質(zhì)的毀損半徑毀損半徑與與輻射的溫度、照射的時(shí)間輻射的溫度、照射的時(shí)間 多個(gè)變量間關(guān)系舉例多個(gè)變量間關(guān)系舉例 多重線(xiàn)性回歸 回歸模型和

3、偏回歸系數(shù)的檢驗(yàn)回歸模型和偏回歸系數(shù)的檢驗(yàn) 標(biāo)準(zhǔn)化偏回歸系數(shù)和決定系數(shù)標(biāo)準(zhǔn)化偏回歸系數(shù)和決定系數(shù) 回歸分析中的若干問(wèn)題回歸分析中的若干問(wèn)題 多重線(xiàn)性回歸模型多重線(xiàn)性回歸模型 回歸模型過(guò)程中自變量的篩選回歸模型過(guò)程中自變量的篩選 多重線(xiàn)性回歸多重線(xiàn)性回歸的的應(yīng)用應(yīng)用 一、多重線(xiàn)性回歸模型 eXXXY mm 22110 。也也稱(chēng)稱(chēng) 影影響響后后的的隨隨機(jī)機(jī)誤誤差差,個(gè)個(gè)自自變變量量對(duì)對(duì)是是除除去去變變量量。 的的平平均均改改變變量量每每改改變變一一個(gè)個(gè)單單位位引引起起因因件件下下, 不不變變的的條條,表表示示其其它它自自變變量量固固定定稱(chēng)稱(chēng)為為 ,又又稱(chēng)稱(chēng)為為截截距距;為為式式中中 殘差 偏回歸系

4、數(shù) 常數(shù)項(xiàng) Yme YX mi i i ), 2 , 1( 0 多重線(xiàn)性回歸分析 mm XbXbXbbY 22110 目的目的:利用樣本數(shù)據(jù)建立多重線(xiàn)性回歸方程利用樣本數(shù)據(jù)建立多重線(xiàn)性回歸方程 估估計(jì)計(jì)值值。 的的,是是為為樣樣本本, 的的估估計(jì)計(jì)值值,為為的的估估計(jì)計(jì)值值;為為式式中中 ii mib bYY 偏回歸系數(shù) 常數(shù)項(xiàng) ), 2 , 1( 00 二、回歸模型和偏回歸系數(shù)的假設(shè)檢驗(yàn) 1.回歸模型的假設(shè)檢驗(yàn):回歸模型的假設(shè)檢驗(yàn): H0:1 11 1m m H1: 1 1,2 2,m m不全等于不全等于0 0.05 建立回歸方程后,須分析應(yīng)變量建立回歸方程后,須分析應(yīng)變量Y與這與這m 個(gè)自

5、變量之間是否確有線(xiàn)性回歸關(guān)系,可用個(gè)自變量之間是否確有線(xiàn)性回歸關(guān)系,可用 方差分析。方差分析。 檢驗(yàn)統(tǒng)計(jì)量為:檢驗(yàn)統(tǒng)計(jì)量為: 1 )1/( / mndfmdf mnSS mSS MS MS F 剩?;鼗?剩剩 回回 剩剩 回回 , 當(dāng)當(dāng)P0.9,變量間存在共線(xiàn)性;,變量間存在共線(xiàn)性; (2)方差膨脹因子)方差膨脹因子VIF,VIF越大,共線(xiàn)性越嚴(yán)重越大,共線(xiàn)性越嚴(yán)重 。 六、多重回歸分析的應(yīng)用 (1)描述變量間的數(shù)量依存關(guān)系 (2)影響因素分析,控制混雜因素 (3)估計(jì)與預(yù)測(cè) (4)為進(jìn)一步學(xué)習(xí)其他多元統(tǒng)計(jì)分析方法提供 基礎(chǔ) 例例8-1 研究表明,注射烏頭堿可以導(dǎo)致心率失常,且研究表明,注射烏

6、頭堿可以導(dǎo)致心率失常,且 心率失常發(fā)生的時(shí)間可能與注射速度有關(guān),而預(yù)先給予常心率失常發(fā)生的時(shí)間可能與注射速度有關(guān),而預(yù)先給予常 咯啉可以延緩心率失常發(fā)生的時(shí)間,且作用大小與用藥劑咯啉可以延緩心率失常發(fā)生的時(shí)間,且作用大小與用藥劑 量有關(guān),為探討這兩種藥物對(duì)心率失常的影響,用大白鼠量有關(guān),為探討這兩種藥物對(duì)心率失常的影響,用大白鼠 做受試對(duì)象,觀察指標(biāo)為注射烏頭堿開(kāi)始至心率失常發(fā)生做受試對(duì)象,觀察指標(biāo)為注射烏頭堿開(kāi)始至心率失常發(fā)生 的時(shí)間??紤]到大百鼠的體重也可能與心率失常發(fā)生的時(shí)的時(shí)間??紤]到大百鼠的體重也可能與心率失常發(fā)生的時(shí) 間有關(guān),實(shí)驗(yàn)收集資料如表。分析烏頭堿不同注射速度(間有關(guān),實(shí)驗(yàn)收

7、集資料如表。分析烏頭堿不同注射速度( X1)、??┻牟煌瑒┝浚ǎ⒊?┻牟煌瑒┝浚╔2)、大鼠體重()、大鼠體重(X3)3個(gè)自變個(gè)自變 量與應(yīng)變量延緩心率失常發(fā)生時(shí)間(量與應(yīng)變量延緩心率失常發(fā)生時(shí)間(Y)的關(guān)系。)的關(guān)系。 實(shí)例8-1 編號(hào)X1X2X3Y 14.880.0823019.1 25.60.0726015.7 37.10.0125214.9 44.90.0722919.0 52.60.1122020.9 66.60.1124717.5 75.20.0723319.2 85.50.1122221.8 94.70.0320620.5 106.80.0124414.5 115.40.0

8、222218.6 122.90.2122623.2 134.00.0123416.8 143.10.1121222.7 153.10.1021221.9 1.建立數(shù)據(jù)文件 在SPSS數(shù)據(jù)編輯窗,建立數(shù)據(jù)文件Li8-1.sav。 自變量:“x1”, “x2”, “x3” ; 應(yīng)變量:“Y”, 2. spss操作過(guò)程 從菜單選擇 AnalyzeRegression Linear(線(xiàn)性回歸) 指定 Dependent:Y Independent(自變量):X1、X2、X3 在Method(方法)框:選擇Stepwise(逐步 回歸) 擊Statistic按鈕:選擇Confidence interva

9、ls (置信區(qū)間)、 擊Plots(圖形)按鈕: 指定 Y軸:SRESID(學(xué)生化殘差) X軸:DEPENDNT(應(yīng)變量) 選?。篐istonram(直方圖)、Normal probability piot(正態(tài)P-P圖) 模型概述 復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù) R=0.986 決定系數(shù)決定系數(shù) R2=0.972 校正決定系數(shù)校正決定系數(shù) Rc2=0.968 方差分析表 F=209.539P=0.000 線(xiàn)性回歸模型有統(tǒng)計(jì)學(xué)意義線(xiàn)性回歸模型有統(tǒng)計(jì)學(xué)意義 回歸系數(shù)表 564. 0 1 b b0=45.110 b2=28.844 b3=-0.123 標(biāo)準(zhǔn)回歸系數(shù)標(biāo)準(zhǔn)回歸系數(shù) 682. 0 564. 0 3

10、 2 b b 建立二元線(xiàn)性回歸方程 32 123. 0844.28110.45 XXY 32 682. 0564. 0bb 說(shuō)明對(duì)延緩心率失常時(shí)間影響的作用大說(shuō)明對(duì)延緩心率失常時(shí)間影響的作用大 鼠體重大于??┝謩┝?。鼠體重大于常咯林劑量。 殘差直方圖 殘差分布?xì)埐罘植?比較均勻比較均勻 ,近似正,近似正 態(tài)分布態(tài)分布 殘差P-P圖 例例8-2 有學(xué)者認(rèn)為血清中低密度脂蛋白增高和高密有學(xué)者認(rèn)為血清中低密度脂蛋白增高和高密 度脂蛋白降低是引起動(dòng)脈硬化的一個(gè)重要原因。現(xiàn)測(cè)得度脂蛋白降低是引起動(dòng)脈硬化的一個(gè)重要原因?,F(xiàn)測(cè)得 30名懷疑患有動(dòng)脈硬化的就診患者的載脂蛋白名懷疑患有動(dòng)脈硬化的就診患者的載脂蛋

11、白A、載脂蛋、載脂蛋 白白B、載脂蛋白、載脂蛋白E、載脂蛋白、載脂蛋白C、低密度脂蛋白中的膽固、低密度脂蛋白中的膽固 醇、高密度脂蛋白中的膽固醇含量,資料見(jiàn)表醇、高密度脂蛋白中的膽固醇含量,資料見(jiàn)表8-2。分別。分別 建立低、高密度脂蛋白中的膽固醇含量對(duì)載脂蛋白建立低、高密度脂蛋白中的膽固醇含量對(duì)載脂蛋白A、載、載 脂蛋白脂蛋白B、載脂蛋白、載脂蛋白E、載脂蛋白、載脂蛋白C的線(xiàn)性回歸方程的線(xiàn)性回歸方程。 實(shí)例8-2 模型概述 復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù) R=0.773 決定系數(shù)決定系數(shù) R2=0.538 校正決定系數(shù)校正決定系數(shù) Rc2=0.503 方差分析表 F=17.702P=0.000 線(xiàn)性回歸模型有統(tǒng)計(jì)學(xué)意義線(xiàn)性回歸模型有統(tǒng)計(jì)學(xué)意義 回歸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論