檢驗方程總體和各自變量的統(tǒng)計學意義市公開課金獎市賽課一等獎課件_第1頁
檢驗方程總體和各自變量的統(tǒng)計學意義市公開課金獎市賽課一等獎課件_第2頁
檢驗方程總體和各自變量的統(tǒng)計學意義市公開課金獎市賽課一等獎課件_第3頁
檢驗方程總體和各自變量的統(tǒng)計學意義市公開課金獎市賽課一等獎課件_第4頁
檢驗方程總體和各自變量的統(tǒng)計學意義市公開課金獎市賽課一等獎課件_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第1頁我們要討論是SPSS建立方程檢驗方程總體和各自變量統(tǒng)計學意義自變量篩選Case剔除(強影響點)共線性診療第2頁多元統(tǒng)計方法線性回歸Logistic 回歸注:完全能夠用于單原因分析,從這一點也能夠看出統(tǒng)計學方法是相通。SPSS無法進行條件Logistic回歸 ,就像sas沒有專門針對配對資料語句一樣,任何統(tǒng)計軟件都有不足。建立方程計算量很大,普通需軟件完成。前人手工計算這兩種回歸(借助科學計算器),精神可嘉80 年代,一個Logistic回歸即使用計算機,計算時間也以天計。第3頁調整或控制多變量控制或調整法就是同時統(tǒng)計可能有影響原因,把他們與可能危險原因一起作分析單原因分析有統(tǒng)計學意義,多

2、原因分析沒有意義解釋,舉例第4頁In univariate analysis, the family histories of SAH and ICH were positively associated with each of the subtypes of stroke. whereas after adjustment for potential risk factors, family history of ICH no longer showed a significant association with haematoma.單原因分析有意義,多原因沒有意義解釋第5頁Family

3、 history of intracerebral haematoma was not an independent risk factor for haematoma, but it might be a good predictor, which indirectly influences the pathogenesis of intracerebral haematoma via certain hereditary components such as hypertension, and even lifestyle factors such as alcohol consumpti

4、on. 第6頁Is family history an independent risk factor for stroke? J Neurol Neurosurg Psychiatry. 1997 Jan;62(1):66-70.第7頁多元線性回歸(簡單步驟)指標多,難以了解。在計算自動化時代,這是回歸難點,我們不懂怎樣判斷我們模型好壞第8頁回歸實際應用在影響原因分析中 一個是探索模式,在回歸模型中探索全部可能自變量與應變量關系 一個是控制模式,即控制混雜原因影響后者對回歸模型要求要小多,不出現異常情況,可僅對模型擬合稍作考慮。第9頁SPSS菜單analyze-regression-line

5、ar第10頁變量數量化(1)自變量為連續(xù)型變量 :必要時作變換(2)自變量為有序變量:依次賦值,如療效好中差,可分別賦值3、2、1(3)自變量為二分類:如令男1,女0(4)自變量為名義分類:需要采取啞變量(dummy variables)進行編碼 第11頁名義分類變量啞變量化 假如職業(yè)分類為工、農、商、學、兵5類,則可定義比分類數少1個,即4個啞變量。編碼方法以下:亞變量的設置,我們會在Logistic回歸模型中討論第12頁數據格式第13頁回歸一些定義應變量(dependent variable)自變量( independent variable)偏回歸系數 pertial regressio

6、n coefficient常數項b0決定系數 determination coefficient,R square共線性 collinearity:自變量間存在著線性關系yi=b0+b1x1i+b2x2i+bnxni第14頁回歸方程建立就是求解b0和bi過程矩陣各種計算(求解線性方程)SPSS實現: analyze-regression-linear將回歸方程中全部自變量作為一個整體來檢驗他們于應變量之間是否含有線性關系,P0.05,說明所擬合方程含有統(tǒng)計學意義,但并不說明模型擬合好壞各自變量假設檢驗與評價,檢驗各自變量和應變量是否有線性關系,P(可放寬)說明有線性關系,一樣t值不說明線性關系

7、強弱,這么,一個回歸方程就建立了,回歸方程建立就是如此easy。第15頁線性與擬合優(yōu)度有線性關系擬合優(yōu)度不一定很好上述F和t檢驗有統(tǒng)計學意義,只是說明 自變量與y有線性關系,但未能表示“關系有多大”舉例:上述方程R2很小,但因為樣本量大,F值很大R2意義:能夠由BMI,age和膳食口味解釋SBP4.3改變我認為,原因分析能夠只考慮線性關系有沒有。尤其是在控制模式中。第16頁自變量選擇全局擇優(yōu)法: 求出全部可能回歸模型(共有2m1個)對應準則值;按R2,Cp準則,AIC準則等統(tǒng)計量選擇最優(yōu)模型。求出全部可能回歸模型(共有2m1個)對應準則值;按上述準則選擇最優(yōu)模型缺點:假如自變量個數為4,則全部

8、回歸有241 15個;當自變量數個數為10時,全部可能回歸為 2101 1023個;當自變量數個數為50時,全部可能回歸為25011015個。第17頁全局擇優(yōu)法決定系數(R2)和校正決定系數(R2c),能夠用來評價回歸方程優(yōu)劣。【 R2伴隨自變量個數增加而增加,所以需要校正】 校正決定系數(R2c)越大,方程越優(yōu)。Cp選擇法:選擇Cp最靠近p或p1方程(不一樣學者解釋不一樣)。 Cp無法用Spss直接計算,可能需要手工。其中p為方程中自變量個數,m為自變量總個數第18頁Cp準則計算公式第19頁AIC準則計算公式第20頁自變量選擇逐步選擇法逐步選擇法: (一)前進法(forward) (二)后退

9、法(backward) (三)逐步回歸法(stepwise)小樣本檢驗水準a定為0.10或0.15,大樣本把值定為0.05。值越小表示選取自變量標準越嚴。 注意,引入變量檢驗水準要小于或等于剔除變量檢驗水準。第21頁自變量到底怎樣選擇兩種方法結合手工選擇,逐步選擇法選擇后手工增減變量看校正決定系數(R2c)等方程擬合優(yōu)劣指標好壞放寬或限制進入方程標準,尤其是在逐步回歸時候硬性進入方程最感興趣研究變量第22頁統(tǒng)計“最優(yōu)”與專業(yè)“最優(yōu)”不一樣準則、方法得出“最優(yōu)”方程不一樣;不一樣引入、剔除標準取得“最優(yōu)”方程不一樣;方程還受數據正確性、共線性影響第23頁強影響點,統(tǒng)計選擇變量統(tǒng)計第24頁強影響點

10、,統(tǒng)計選擇從理論上講,每一個樣本點對回歸模型影響應該是同等,實際并非如此。有些樣本點(統(tǒng)計)對回歸模型影響很大。對由過失或錯誤造成點應刪去沒有錯誤強影響點可能和自變量與應變量相關相關,不可輕易刪除。第25頁判斷強影響點指標SPSS軟件中指標analyze-regression-linear-saveSave中選項均進入數據庫,而不出現在output中各種殘差越大,單一統(tǒng)計對方程影響越大第26頁判斷強影響點指標(2)距1越遠,越是強影響點其余指標絕對值越大越是強影響點第27頁多重共線性 自變量間存在著線性關系,使一個或幾個自變量能夠由另外自變量線性表示時,稱為該變量與另外自變量間存在有共線性(c

11、ollinearity)。輕易出現:回歸系數符號與由專業(yè)知識不符變量主要性與專業(yè)不符整個方程決定系數R2高,但各自變量對應回歸系數均不顯著。第28頁多重共線性診療SPSS中指標允許度:越近似于0,共線性越強特征根:越近似于0,共線性越強條件指數:越大,共線性越強第29頁Spss實現與結果analyze-regression-linear-statistics第30頁實例以BMI為應變量,SBP,DBP和年紀為自變量進行回歸。結果如圖極端例子:以SBP為應變量,BMI和復制BMI為自變量,結果為其中之一無法進入方程從第四個特征根看,特征根小,條件指數大,從變量方差百分比來看,SBP和DBP在其中

12、貢獻最大,能夠說二者有近似共線性不過二者共線性對方程影響并不大第31頁允許度越近于0共線性越大,等于0,完全共線復制BMI根本無法進入方程后面討論交互作用時候我們還要提到共線性第32頁一、應用影響原因分析,控制混雜原因預測:由自變量值推出應變量Y值控制:指定應變量Y值查看自變量改變量影響原因分析,控制混雜原因在醫(yī)學研究中最為長用,個人認為對模型擬合要求較低,尤其在控制混雜控制模式中后兩種用途對模型要求嚴格第33頁二、應用條件第34頁回歸系數符號反常與主要變量選不進方程原因分析有主要影響原因未包含在內一些變量個體間差異很大樣本內突出點上數據誤差大變量改變范圍較小樣本數太少上述各項在用最小二乘法求

13、解方程過程中對殘差等主要中間指標影響大,造成最小二乘法失效。第35頁線性回歸注意事項應變量為連續(xù)變量,自變量可認為連續(xù)變量、分類變量或有序變量樣本含量:一般要求樣本量n最少是方程中自變量個數m5-10倍逐步回歸不是萬能,一個good of fit好模型建立需要多方面考證。多重共線性:自變量存在較強線性關系檢驗兩變量間有沒有交互作用,普遍做法是在方程中加入它們乘積項再做檢驗。但共線性問題會所以而突出,舉例共線性很大SPSS菜單在處理回歸中選項較少,但完全能夠滿足普通模型擬合。其syntax模式應該有更多項選擇項,但鑒于介紹這方面內容書籍文件較少。如確實需要嚴格模型擬合,SAS可能是更加好選擇第3

14、6頁回歸發(fā)展加權回歸有重復測量回歸分析:對每一個回歸變量xy有屢次重復測量值。嶺回歸分析:改進最小二乘方,用于自變量相關性大,或一些變量改變范圍太小??捎胹as實現。第37頁Logistic回歸實際上屬于判別分析,因擁有很差判別效率而不慣用。適合用于流行病學資料原因分析試驗室中藥品劑量-反應關系臨床試驗評價疾病預后原因分析第38頁二、 Logistic回歸模型Logistic回歸分類 二分類 多分類 其中二分較為慣用 條件Logistic回歸 非條件Logistic回歸 二者針正確資料類型不一樣,后者者針對 成組研究,前者針對配對或配伍研究。第39頁26例冠心病病人和28例對照者進行病例對照研

15、究(變量賦值表) 自變量為連續(xù)變量,最好變?yōu)榈燃壔蛴嫈蒂Y料有統(tǒng)計學家持反對意見認為損失信息第40頁26例冠心病病人和28例對照者進行病例對照研究(數據格式) 第41頁Logistic回歸方程建立建立方程就是求解b0,b1bp第42頁Logistic回歸中常數項(b0)表示,在不接觸任何潛在危險保護原因條件下,效應指標發(fā)生與不發(fā)生事件概率之比對數值。Logistic回歸中回歸系數( bi )表示,某一原因改變一個單位時,效應指標發(fā)生與不發(fā)生事件概率之比對數改變值,即OR或RR對數值。參數意義第43頁回歸系數意義單純從數學上講,與多元線性回歸分析中回歸系數解釋并無不一樣,亦即bi表示xi改變一個單

16、位時, logit P平均改變量。第44頁多原因Logistic回歸分析時,對回歸系數解釋都是指在其它全部自變量固定情況下優(yōu)勢比。存在原因間交互作用時, Logistic回歸系數解釋變得更為復雜,應尤其小心。調整與控制第45頁流行病學中一些基本概念:相對危險度(relative risk): RR=P1/P2比數Odds=P/(1-P)比數比OR=P/(1-P)/P/(1-P)在患病率較小情況下,ORRR第46頁依據Wald檢驗可知,Logistic回歸系數bi服從u分布。所以其可信區(qū)間為進而,優(yōu)勢比e(bi)可信區(qū)間為第47頁參數預計似然函數計算方法最大似然法迭代法初始值迭代次數人為精度可能

17、不收斂總體來說,解比較穩(wěn)定。第48頁SPSS實現analyze-regression-binary logistic第49頁analyze-regression-binary logistic-option模型擬合優(yōu)度指標,2值越小,P值越大表明模型越好迭代過程,能夠監(jiān)察方程計算過程參數預計相關矩陣,每步各協(xié)變量零級相關系數(簡單相關系數)均小(,說明 Logistic方程總體有意義,借用線性 解釋來說將回歸方程中全部自變量作為一個整體來檢驗他們于應變量之間是否含有線性關系,P0.05,說明所擬合方程含有統(tǒng)計學意義,但并不說明模型擬合好壞:真正模型擬合普通要把其提升到0.20或0.10而非0.05。第52頁結果3模型擬合優(yōu)度指標,2值越小,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論