多元逐步等回歸分析_第1頁
多元逐步等回歸分析_第2頁
多元逐步等回歸分析_第3頁
多元逐步等回歸分析_第4頁
多元逐步等回歸分析_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多元逐步等回歸分析第一頁,共七十四頁,2022年,8月28日回歸分析內(nèi)容一元線性步驟:1.觀察散點圖,2.判斷是什么關(guān)系,3.回歸,4.判斷系數(shù);5。顯著性檢查(注意H0),6.失擬合檢驗(注意需要的條件)一元非線性y=a+blnx,如何判斷那個好?帶虛擬變量多元線性多元非線性和逐步回歸Logistic回歸2第二頁,共七十四頁,2022年,8月28日

逐步回歸分析多元線性回歸建立的回歸方程包含了所有的自變量,但在實際問題中,可能有這樣的情況:參加回歸方程的P個自變量中,有些自變量單獨看對因變量Y有作用(相關(guān)程度密切),但P個自變量又可能是相互影響的,在作回歸時,它們對因變量所起的作用有可能被其他自變量代替,而使得這些自變量在回歸方程中變得無足輕重。這時把這些自變量留在回歸方程中,不但增加計算上的麻煩,而且不能保證有好的回歸效果。為了克服這些缺點,提出了多元逐步回歸。3第三頁,共七十四頁,2022年,8月28日

多元逐步回歸要求回歸方程中包含所有對因變量作用顯著的自變量,而不包含作用不顯著的自變量,從而建立最優(yōu)回歸方程。

4第四頁,共七十四頁,2022年,8月28日1、強行進入法(Enter):

預先選定的自變量全部進入回歸模型,這是系統(tǒng)默認方式。

2、消去法(Remove):

根據(jù)設(shè)定的條件剔除部分自變量。

逐步篩選變量的方法:5第五頁,共七十四頁,2022年,8月28日3、向前引入法(Forward):

自變量由少到多一個一個引入回歸方程,將與因變量的相關(guān)系數(shù)最大的第一個自變量選入方程并進行檢驗,如果F值>Fa

,拒絕H0

;將其余的變量中與因變量的相關(guān)系數(shù)最大的第二個自變量選入方程,當F值>Fa

,拒絕H0

;如此下去,不斷引入新的自變量,直到不能拒絕H0,再沒有變量被引入為止。6第六頁,共七十四頁,2022年,8月28日4、向后剔除法(Backward):

自變量由多到少一個一個從回歸方程中剔除,首先,對預先選定自變量全部進行回歸,然后把對因變量影響不顯著的自變量從方程中剔除并進行檢驗,如果F值<Fa

,接受H0,一個一個剔除對因變量不顯著的自變量,直到再不能剔除為止。

7第七頁,共七十四頁,2022年,8月28日5、逐步引入—剔除法(Stepwise):

向前引入法與向后剔除法的結(jié)合。8第八頁,共七十四頁,2022年,8月28日逐步回歸的主要用途:

建立一個自變量個數(shù)較少的多元線性回歸方程,可用于描述某些自變量與某一醫(yī)學現(xiàn)象間的數(shù)量關(guān)系,以及進行疾病的預測預報,輔助診斷等。9第九頁,共七十四頁,2022年,8月28日2、進行因素篩選,有助于從大量因素中篩選出對某一醫(yī)學現(xiàn)象作用顯著的因素和因素組,因此在病因分析和療效分析中有著廣泛的應(yīng)用。10第十頁,共七十四頁,2022年,8月28日

非線性回歸模型按變量個數(shù)也可以分為一元非線性回歸模型和多元非線性回歸模型;曲線的形式也因?qū)嶋H情況不同而有多種形式,如指數(shù)曲線、雙曲線、S形曲線等。

非線性回歸模型11第十一頁,共七十四頁,2022年,8月28日非線性回歸模型的形式

非線性回歸模型12第十二頁,共七十四頁,2022年,8月28日非線性回歸模型13第十三頁,共七十四頁,2022年,8月28日

根據(jù)非線性回歸模型線性化的不同性質(zhì),上述模型一般可以分成三種類型:

第一類:直接換元型

這類非線性回歸模型通過簡單的變量換元可直接化為線性回歸模型,如式(1)、式(2)、式(3)、式(4)。

第二類:間接代換型

這類非線性回歸模型經(jīng)常通過對數(shù)變形代換間接地化為線性回歸模型,如:式(5)、式(6)。

第三類:非線性型

這類非線性回歸模型屬于不可線性化的非線性回歸模型,如式(7)和式(8)。非線性回歸模型

非線性回歸模型的分類14第十四頁,共七十四頁,2022年,8月28日

直接換元法15第十五頁,共七十四頁,2022年,8月28日

對于式(5)、式(6)和式(7)所示的非線性回歸模型,因變量與待估計參數(shù)之間的關(guān)系也是非線性的。因此不能通過直接換元化為線性模型。對此類模型,通??赏ㄟ^對回歸方程兩邊取對數(shù)將其化為可以直接換元的形式。這種先取對數(shù)再進行變量代換的方法稱為間接換元法。

間接換元法16第十六頁,共七十四頁,2022年,8月28日

間接換元法17第十七頁,共七十四頁,2022年,8月28日本章小節(jié)線性回歸模型的一般形式為

18第十八頁,共七十四頁,2022年,8月28日本章小節(jié)19第十九頁,共七十四頁,2022年,8月28日Logistic回歸

第二十頁,共七十四頁,2022年,8月28日回歸分析的分類多個因變量(y1,y2,…yk)路徑分析結(jié)構(gòu)方程模型分析一個因變量y連續(xù)型因變量(y)---線性回歸分析分類型因變量(y)---Logistic回歸分析時間序列因變量(t)---時間序列分析生存時間因變量(t)---生存風險回歸分析21第二十一頁,共七十四頁,2022年,8月28日研究因變量為二分類或多分類觀察結(jié)果與影響因素(自變量)之間關(guān)系的一種多變量分析方法,屬概率型非線性回歸。logistic回歸:本講解從病因?qū)W位例子開始,不僅適用于病因?qū)W分析,也可用于其他方面的研究,研究某個二分類(或無序及有序多分類)目標變量與有關(guān)因素的關(guān)系在流行病學研究中,常需要分析疾病與各種危險因素間的定量關(guān)系,同時為了能真實反映暴露因素與觀察結(jié)果間的關(guān)系,需要控制混雜因素的影響。logistic回歸22第二十二頁,共七十四頁,2022年,8月28日

(1)Mantel-Haenszel分層分析:適用于樣本量大、分析因素較少的情況。當分層較多時,由于要求各格子中例數(shù)不能太少,所需樣本較大,往往難以做到;當混雜因素較多時,分層數(shù)也呈幾何倍數(shù)增長,這將導致部分層中某個格子的頻數(shù)為零,無法利用其信息。(2)線性回歸分析:由于因變量是分類變量,不能滿足其正態(tài)性要求;有些自變量對因變量的影響并非線性。

logistic回歸23第二十三頁,共七十四頁,2022年,8月28日一、二分類logistic回歸:

因變量為兩分類變量的資料分為:

1:非條件logistic回歸(1)隊列研究資料(2)非配比病例-對照研究

2:條件logistic回歸進行分析。此回歸多用于配對或配比資料。二、多分類資料logistic回歸:因變量為多項分類的資料,可用多項分類logistic回歸模型或有序分類logistic回歸模型進行分析。

logistic回歸的分類24第二十四頁,共七十四頁,2022年,8月28日也稱前瞻性研究、隨訪研究等。是一種由因及果的研究,在研究開始時,根據(jù)以往有無暴露經(jīng)歷,將研究人群分為暴露人群和非暴露人群,在一定時期內(nèi),隨訪觀察和比較兩組人群的發(fā)病率或死亡率。如果兩組人群發(fā)病率或死亡率差別有統(tǒng)計學意義,則認為暴露和疾病間存在聯(lián)系。隊列研究(cohortstudy)25第二十五頁,共七十四頁,2022年,8月28日隊列研究驗證的暴露因素在研究開始前已存在,研究者知道每個研究對象的暴露情況。研究人群+-++--調(diào)查方向:追蹤收集資料比較疾病人數(shù)暴露abcda/(a+b)c/(c+d)隊列研究原理示意圖隊列研究(cohortstudy)26第二十六頁,共七十四頁,2022年,8月28日RR(相對危險度relativerisk):表示暴露組與非暴露組發(fā)病率(或死亡率)的比值。也稱為危險比(riskratio)。反映了暴露與疾病發(fā)生的關(guān)聯(lián)強度。RR表明暴露組發(fā)病或死亡的危險是非暴露組的多少倍。隊列研究(cohortstudy)27第二十七頁,共七十四頁,2022年,8月28日一種由果及因的回顧性研究,先按疾病狀態(tài)確定調(diào)查對象,分為病例(case)和對照(control)兩組,然后利用已有的記錄、或采用詢問、填寫調(diào)查表等方式,了解其發(fā)病前的暴露情況,并進行比較,推測疾病與暴露間的關(guān)系。病例對照研究28第二十八頁,共七十四頁,2022年,8月28日+-病例+-對照調(diào)查方向:收集回顧性資料abcda/(a+b)c/(c+d)比較人數(shù)暴露疾病病例對照原理示意圖病例對照研究29第二十九頁,共七十四頁,2022年,8月28日病例對照研究(不考)30第三十頁,共七十四頁,2022年,8月28日

相對危險度RR的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。但病例對照研究不能計算發(fā)病率,只能計算比值比OR值。

OR與RR的含義是相同的,也是指暴露組的疾病危險性為非暴露組的多少倍。當疾病發(fā)病率小于5%時,OR是RR的極好近似值。OR>1,說明該因素是疾病的危險性增加,為危險因素;OR<1,說明該因素是疾病的危險性減小,為保護因素;病例對照研究31第三十一頁,共七十四頁,2022年,8月28日病例對照研究的三種類型(一)病例與對照不匹配---非條件logistic回歸在設(shè)計所規(guī)定的病例和對照人群中,分別抽取一定量的研究對象,一般對照應(yīng)等于或多于病例數(shù),此外無其他任何限制。32第三十二頁,共七十四頁,2022年,8月28日病例對照研究的三中類型(二)病例與對照匹配---條件logistic回歸匹配或稱配比(matching),即要求對照在某些因素或特征上與病例保持一致,目的是對兩組比較時排除混雜因素的干擾。匹配分為成組匹配和個體匹配。1、成組匹配(categorymatching):匹配的因素所占的比例,在對照組和在病例組一致。如病例組中男女各半,65歲以上者占1/3,則對照組也是如此。2、個體匹配(individualmatching):以病例和對照的個體為單位進行匹配叫個體匹配。1:1匹配又叫配對(pairmatching),1:2,┅,1:m匹配時稱為匹配。匹配的特征必須是已知的混雜因子,或者有充分的理由懷疑其為混雜因子,否則不應(yīng)匹配。33第三十三頁,共七十四頁,2022年,8月28日(三)巢式病例對照研究也稱為隊列內(nèi)的病例對照研究,是將隊列研究和病例對照研究相結(jié)合的方法。病例對照研究的三中類型34第三十四頁,共七十四頁,2022年,8月28日logistic回歸35第三十五頁,共七十四頁,2022年,8月28日36第三十六頁,共七十四頁,2022年,8月28日37第三十七頁,共七十四頁,2022年,8月28日38第三十八頁,共七十四頁,2022年,8月28日39第三十九頁,共七十四頁,2022年,8月28日40第四十頁,共七十四頁,2022年,8月28日二、logistic回歸模型的參數(shù)估計

41第四十一頁,共七十四頁,2022年,8月28日42第四十二頁,共七十四頁,2022年,8月28日43第四十三頁,共七十四頁,2022年,8月28日例15-1

44第四十四頁,共七十四頁,2022年,8月28日在logistic過程步中加“descending”選項的目的是使SAS過程按陽性率(y=1)擬合模型,得到陽性病例對應(yīng)于陰性病例的優(yōu)勢比。觀察例數(shù)45第四十五頁,共七十四頁,2022年,8月28日OR值OR的95%CI對偏回歸系數(shù)的假設(shè)檢驗46第四十六頁,共七十四頁,2022年,8月28日47第四十七頁,共七十四頁,2022年,8月28日三、logistic回歸模型的假設(shè)檢驗

48第四十八頁,共七十四頁,2022年,8月28日49第四十九頁,共七十四頁,2022年,8月28日概率p值均小于0.05,說明方程有意義。對所擬合模型的假設(shè)檢驗:50第五十頁,共七十四頁,2022年,8月28日四、變量篩選

51第五十一頁,共七十四頁,2022年,8月28日

某工作者在探討腎細胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除術(shù)患者的腎癌標本資料,現(xiàn)從中抽取26例。試用logistic回歸分析篩選出于癌細胞轉(zhuǎn)移有關(guān)的危險因素(變量選入和剔除水平均為0.10)。

例子

52第五十二頁,共七十四頁,2022年,8月28日用逐步回歸法擬合模型,變量選入和剔除水平均為0.10指定選項“des”是為了按照y=1(有轉(zhuǎn)移)的概率擬合模型。如果不加此選擇項,則軟件會按照y=0(無轉(zhuǎn)移)的概率擬合模型,此時,應(yīng)變量的排序水平發(fā)生顛倒,且所有參數(shù)估計的符號相反,OR值為原來的倒數(shù)。53第五十三頁,共七十四頁,2022年,8月28日54第五十四頁,共七十四頁,2022年,8月28日logistic逐步回歸分析篩選出兩個有統(tǒng)計學意義的變量為x2和x4,回歸系數(shù)分別為2.4134和2.0963,比數(shù)比分別為11.172和8.136。結(jié)果中還給出了標準化偏回歸系數(shù),腎癌細胞核組織學分級(x4)在引起癌細胞轉(zhuǎn)移中的危險性大于腎細胞癌血管內(nèi)皮生長因子(x2)。55第五十五頁,共七十四頁,2022年,8月28日條件logistic回歸

56第五十六頁,共七十四頁,2022年,8月28日57第五十七頁,共七十四頁,2022年,8月28日58第五十八頁,共七十四頁,2022年,8月28日59第五十九頁,共七十四頁,2022年,8月28日60第六十頁,共七十四頁,2022年,8月28日條件logistic回歸應(yīng)用實例61第六十一頁,共七十四頁,2022年,8月28日研究肥胖(x1,肥胖為1,不肥胖為0)、口服避孕藥雌激素(x2,用藥為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論