




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第1頁我們要討論是SPSS建立方程檢驗(yàn)方程總體和各自變量統(tǒng)計(jì)學(xué)意義自變量篩選Case剔除(強(qiáng)影響點(diǎn))共線性診療第2頁多元統(tǒng)計(jì)方法線性回歸Logistic 回歸注:完全能夠用于單原因分析,從這一點(diǎn)也能夠看出統(tǒng)計(jì)學(xué)方法是相通。SPSS無法進(jìn)行條件Logistic回歸 ,就像sas沒有專門針對(duì)配對(duì)資料語句一樣,任何統(tǒng)計(jì)軟件都有不足。建立方程計(jì)算量很大,普通需軟件完成。前人手工計(jì)算這兩種回歸(借助科學(xué)計(jì)算器),精神可嘉80 年代,一個(gè)Logistic回歸即使用計(jì)算機(jī),計(jì)算時(shí)間也以天計(jì)。第3頁調(diào)整或控制多變量控制或調(diào)整法就是同時(shí)統(tǒng)計(jì)可能有影響原因,把他們與可能危險(xiǎn)原因一起作分析單原因分析有統(tǒng)計(jì)學(xué)意義,多
2、原因分析沒有意義解釋,舉例第4頁In univariate analysis, the family histories of SAH and ICH were positively associated with each of the subtypes of stroke. whereas after adjustment for potential risk factors, family history of ICH no longer showed a significant association with haematoma.單原因分析有意義,多原因沒有意義解釋第5頁Family
3、 history of intracerebral haematoma was not an independent risk factor for haematoma, but it might be a good predictor, which indirectly influences the pathogenesis of intracerebral haematoma via certain hereditary components such as hypertension, and even lifestyle factors such as alcohol consumpti
4、on. 第6頁Is family history an independent risk factor for stroke? J Neurol Neurosurg Psychiatry. 1997 Jan;62(1):66-70.第7頁多元線性回歸(簡單步驟)指標(biāo)多,難以了解。在計(jì)算自動(dòng)化時(shí)代,這是回歸難點(diǎn),我們不懂怎樣判斷我們模型好壞第8頁回歸實(shí)際應(yīng)用在影響原因分析中 一個(gè)是探索模式,在回歸模型中探索全部可能自變量與應(yīng)變量關(guān)系 一個(gè)是控制模式,即控制混雜原因影響后者對(duì)回歸模型要求要小多,不出現(xiàn)異常情況,可僅對(duì)模型擬合稍作考慮。第9頁SPSS菜單analyze-regression-line
5、ar第10頁變量數(shù)量化(1)自變量為連續(xù)型變量 :必要時(shí)作變換(2)自變量為有序變量:依次賦值,如療效好中差,可分別賦值3、2、1(3)自變量為二分類:如令男1,女0(4)自變量為名義分類:需要采取啞變量(dummy variables)進(jìn)行編碼 第11頁名義分類變量啞變量化 假如職業(yè)分類為工、農(nóng)、商、學(xué)、兵5類,則可定義比分類數(shù)少1個(gè),即4個(gè)啞變量。編碼方法以下:亞變量的設(shè)置,我們會(huì)在Logistic回歸模型中討論第12頁數(shù)據(jù)格式第13頁回歸一些定義應(yīng)變量(dependent variable)自變量( independent variable)偏回歸系數(shù) pertial regressio
6、n coefficient常數(shù)項(xiàng)b0決定系數(shù) determination coefficient,R square共線性 collinearity:自變量間存在著線性關(guān)系yi=b0+b1x1i+b2x2i+bnxni第14頁回歸方程建立就是求解b0和bi過程矩陣各種計(jì)算(求解線性方程)SPSS實(shí)現(xiàn): analyze-regression-linear將回歸方程中全部自變量作為一個(gè)整體來檢驗(yàn)他們于應(yīng)變量之間是否含有線性關(guān)系,P0.05,說明所擬合方程含有統(tǒng)計(jì)學(xué)意義,但并不說明模型擬合好壞各自變量假設(shè)檢驗(yàn)與評(píng)價(jià),檢驗(yàn)各自變量和應(yīng)變量是否有線性關(guān)系,P(可放寬)說明有線性關(guān)系,一樣t值不說明線性關(guān)系
7、強(qiáng)弱,這么,一個(gè)回歸方程就建立了,回歸方程建立就是如此easy。第15頁線性與擬合優(yōu)度有線性關(guān)系擬合優(yōu)度不一定很好上述F和t檢驗(yàn)有統(tǒng)計(jì)學(xué)意義,只是說明 自變量與y有線性關(guān)系,但未能表示“關(guān)系有多大”舉例:上述方程R2很小,但因?yàn)闃颖玖看?,F(xiàn)值很大R2意義:能夠由BMI,age和膳食口味解釋SBP4.3改變我認(rèn)為,原因分析能夠只考慮線性關(guān)系有沒有。尤其是在控制模式中。第16頁自變量選擇全局擇優(yōu)法: 求出全部可能回歸模型(共有2m1個(gè))對(duì)應(yīng)準(zhǔn)則值;按R2,Cp準(zhǔn)則,AIC準(zhǔn)則等統(tǒng)計(jì)量選擇最優(yōu)模型。求出全部可能回歸模型(共有2m1個(gè))對(duì)應(yīng)準(zhǔn)則值;按上述準(zhǔn)則選擇最優(yōu)模型缺點(diǎn):假如自變量個(gè)數(shù)為4,則全部
8、回歸有241 15個(gè);當(dāng)自變量數(shù)個(gè)數(shù)為10時(shí),全部可能回歸為 2101 1023個(gè);當(dāng)自變量數(shù)個(gè)數(shù)為50時(shí),全部可能回歸為25011015個(gè)。第17頁全局擇優(yōu)法決定系數(shù)(R2)和校正決定系數(shù)(R2c),能夠用來評(píng)價(jià)回歸方程優(yōu)劣?!?R2伴隨自變量個(gè)數(shù)增加而增加,所以需要校正】 校正決定系數(shù)(R2c)越大,方程越優(yōu)。Cp選擇法:選擇Cp最靠近p或p1方程(不一樣學(xué)者解釋不一樣)。 Cp無法用Spss直接計(jì)算,可能需要手工。其中p為方程中自變量個(gè)數(shù),m為自變量總個(gè)數(shù)第18頁Cp準(zhǔn)則計(jì)算公式第19頁AIC準(zhǔn)則計(jì)算公式第20頁自變量選擇逐步選擇法逐步選擇法: (一)前進(jìn)法(forward) (二)后退
9、法(backward) (三)逐步回歸法(stepwise)小樣本檢驗(yàn)水準(zhǔn)a定為0.10或0.15,大樣本把值定為0.05。值越小表示選取自變量標(biāo)準(zhǔn)越嚴(yán)。 注意,引入變量檢驗(yàn)水準(zhǔn)要小于或等于剔除變量檢驗(yàn)水準(zhǔn)。第21頁自變量到底怎樣選擇兩種方法結(jié)合手工選擇,逐步選擇法選擇后手工增減變量看校正決定系數(shù)(R2c)等方程擬合優(yōu)劣指標(biāo)好壞放寬或限制進(jìn)入方程標(biāo)準(zhǔn),尤其是在逐步回歸時(shí)候硬性進(jìn)入方程最感興趣研究變量第22頁統(tǒng)計(jì)“最優(yōu)”與專業(yè)“最優(yōu)”不一樣準(zhǔn)則、方法得出“最優(yōu)”方程不一樣;不一樣引入、剔除標(biāo)準(zhǔn)取得“最優(yōu)”方程不一樣;方程還受數(shù)據(jù)正確性、共線性影響第23頁強(qiáng)影響點(diǎn),統(tǒng)計(jì)選擇變量統(tǒng)計(jì)第24頁強(qiáng)影響點(diǎn)
10、,統(tǒng)計(jì)選擇從理論上講,每一個(gè)樣本點(diǎn)對(duì)回歸模型影響應(yīng)該是同等,實(shí)際并非如此。有些樣本點(diǎn)(統(tǒng)計(jì))對(duì)回歸模型影響很大。對(duì)由過失或錯(cuò)誤造成點(diǎn)應(yīng)刪去沒有錯(cuò)誤強(qiáng)影響點(diǎn)可能和自變量與應(yīng)變量相關(guān)相關(guān),不可輕易刪除。第25頁判斷強(qiáng)影響點(diǎn)指標(biāo)SPSS軟件中指標(biāo)analyze-regression-linear-saveSave中選項(xiàng)均進(jìn)入數(shù)據(jù)庫,而不出現(xiàn)在output中各種殘差越大,單一統(tǒng)計(jì)對(duì)方程影響越大第26頁判斷強(qiáng)影響點(diǎn)指標(biāo)(2)距1越遠(yuǎn),越是強(qiáng)影響點(diǎn)其余指標(biāo)絕對(duì)值越大越是強(qiáng)影響點(diǎn)第27頁多重共線性 自變量間存在著線性關(guān)系,使一個(gè)或幾個(gè)自變量能夠由另外自變量線性表示時(shí),稱為該變量與另外自變量間存在有共線性(c
11、ollinearity)。輕易出現(xiàn):回歸系數(shù)符號(hào)與由專業(yè)知識(shí)不符變量主要性與專業(yè)不符整個(gè)方程決定系數(shù)R2高,但各自變量對(duì)應(yīng)回歸系數(shù)均不顯著。第28頁多重共線性診療SPSS中指標(biāo)允許度:越近似于0,共線性越強(qiáng)特征根:越近似于0,共線性越強(qiáng)條件指數(shù):越大,共線性越強(qiáng)第29頁Spss實(shí)現(xiàn)與結(jié)果analyze-regression-linear-statistics第30頁實(shí)例以BMI為應(yīng)變量,SBP,DBP和年紀(jì)為自變量進(jìn)行回歸。結(jié)果如圖極端例子:以SBP為應(yīng)變量,BMI和復(fù)制BMI為自變量,結(jié)果為其中之一無法進(jìn)入方程從第四個(gè)特征根看,特征根小,條件指數(shù)大,從變量方差百分比來看,SBP和DBP在其中
12、貢獻(xiàn)最大,能夠說二者有近似共線性不過二者共線性對(duì)方程影響并不大第31頁允許度越近于0共線性越大,等于0,完全共線復(fù)制BMI根本無法進(jìn)入方程后面討論交互作用時(shí)候我們還要提到共線性第32頁一、應(yīng)用影響原因分析,控制混雜原因預(yù)測:由自變量值推出應(yīng)變量Y值控制:指定應(yīng)變量Y值查看自變量改變量影響原因分析,控制混雜原因在醫(yī)學(xué)研究中最為長用,個(gè)人認(rèn)為對(duì)模型擬合要求較低,尤其在控制混雜控制模式中后兩種用途對(duì)模型要求嚴(yán)格第33頁二、應(yīng)用條件第34頁回歸系數(shù)符號(hào)反常與主要變量選不進(jìn)方程原因分析有主要影響原因未包含在內(nèi)一些變量個(gè)體間差異很大樣本內(nèi)突出點(diǎn)上數(shù)據(jù)誤差大變量改變范圍較小樣本數(shù)太少上述各項(xiàng)在用最小二乘法求
13、解方程過程中對(duì)殘差等主要中間指標(biāo)影響大,造成最小二乘法失效。第35頁線性回歸注意事項(xiàng)應(yīng)變量為連續(xù)變量,自變量可認(rèn)為連續(xù)變量、分類變量或有序變量樣本含量:一般要求樣本量n最少是方程中自變量個(gè)數(shù)m5-10倍逐步回歸不是萬能,一個(gè)good of fit好模型建立需要多方面考證。多重共線性:自變量存在較強(qiáng)線性關(guān)系檢驗(yàn)兩變量間有沒有交互作用,普遍做法是在方程中加入它們乘積項(xiàng)再做檢驗(yàn)。但共線性問題會(huì)所以而突出,舉例共線性很大SPSS菜單在處理回歸中選項(xiàng)較少,但完全能夠滿足普通模型擬合。其syntax模式應(yīng)該有更多項(xiàng)選擇項(xiàng),但鑒于介紹這方面內(nèi)容書籍文件較少。如確實(shí)需要嚴(yán)格模型擬合,SAS可能是更加好選擇第3
14、6頁回歸發(fā)展加權(quán)回歸有重復(fù)測量回歸分析:對(duì)每一個(gè)回歸變量xy有屢次重復(fù)測量值。嶺回歸分析:改進(jìn)最小二乘方,用于自變量相關(guān)性大,或一些變量改變范圍太小??捎胹as實(shí)現(xiàn)。第37頁Logistic回歸實(shí)際上屬于判別分析,因擁有很差判別效率而不慣用。適合用于流行病學(xué)資料原因分析試驗(yàn)室中藥品劑量-反應(yīng)關(guān)系臨床試驗(yàn)評(píng)價(jià)疾病預(yù)后原因分析第38頁二、 Logistic回歸模型Logistic回歸分類 二分類 多分類 其中二分較為慣用 條件Logistic回歸 非條件Logistic回歸 二者針正確資料類型不一樣,后者者針對(duì) 成組研究,前者針對(duì)配對(duì)或配伍研究。第39頁26例冠心病病人和28例對(duì)照者進(jìn)行病例對(duì)照研
15、究(變量賦值表) 自變量為連續(xù)變量,最好變?yōu)榈燃?jí)或計(jì)數(shù)資料有統(tǒng)計(jì)學(xué)家持反對(duì)意見認(rèn)為損失信息第40頁26例冠心病病人和28例對(duì)照者進(jìn)行病例對(duì)照研究(數(shù)據(jù)格式) 第41頁Logistic回歸方程建立建立方程就是求解b0,b1bp第42頁Logistic回歸中常數(shù)項(xiàng)(b0)表示,在不接觸任何潛在危險(xiǎn)保護(hù)原因條件下,效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件概率之比對(duì)數(shù)值。Logistic回歸中回歸系數(shù)( bi )表示,某一原因改變一個(gè)單位時(shí),效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件概率之比對(duì)數(shù)改變值,即OR或RR對(duì)數(shù)值。參數(shù)意義第43頁回歸系數(shù)意義單純從數(shù)學(xué)上講,與多元線性回歸分析中回歸系數(shù)解釋并無不一樣,亦即bi表示xi改變一個(gè)單
16、位時(shí), logit P平均改變量。第44頁多原因Logistic回歸分析時(shí),對(duì)回歸系數(shù)解釋都是指在其它全部自變量固定情況下優(yōu)勢比。存在原因間交互作用時(shí), Logistic回歸系數(shù)解釋變得更為復(fù)雜,應(yīng)尤其小心。調(diào)整與控制第45頁流行病學(xué)中一些基本概念:相對(duì)危險(xiǎn)度(relative risk): RR=P1/P2比數(shù)Odds=P/(1-P)比數(shù)比OR=P/(1-P)/P/(1-P)在患病率較小情況下,ORRR第46頁依據(jù)Wald檢驗(yàn)可知,Logistic回歸系數(shù)bi服從u分布。所以其可信區(qū)間為進(jìn)而,優(yōu)勢比e(bi)可信區(qū)間為第47頁參數(shù)預(yù)計(jì)似然函數(shù)計(jì)算方法最大似然法迭代法初始值迭代次數(shù)人為精度可能
17、不收斂總體來說,解比較穩(wěn)定。第48頁SPSS實(shí)現(xiàn)analyze-regression-binary logistic第49頁analyze-regression-binary logistic-option模型擬合優(yōu)度指標(biāo),2值越小,P值越大表明模型越好迭代過程,能夠監(jiān)察方程計(jì)算過程參數(shù)預(yù)計(jì)相關(guān)矩陣,每步各協(xié)變量零級(jí)相關(guān)系數(shù)(簡單相關(guān)系數(shù))均?。?說明 Logistic方程總體有意義,借用線性 解釋來說將回歸方程中全部自變量作為一個(gè)整體來檢驗(yàn)他們于應(yīng)變量之間是否含有線性關(guān)系,P0.05,說明所擬合方程含有統(tǒng)計(jì)學(xué)意義,但并不說明模型擬合好壞:真正模型擬合普通要把其提升到0.20或0.10而非0.05。第52頁結(jié)果3模型擬合優(yōu)度指標(biāo),2值越小,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 交通運(yùn)輸行業(yè)人才培養(yǎng)現(xiàn)狀與2025年人才需求結(jié)構(gòu)分析報(bào)告
- 交通運(yùn)輸行業(yè)安全管理體系在交通安全信息化建設(shè)中的應(yīng)用實(shí)踐報(bào)告2025
- 初中信息技術(shù)課件設(shè)計(jì)
- 健康小屋展廳設(shè)計(jì)
- 人工智能與金融合規(guī)2025年智能投顧平臺(tái)風(fēng)險(xiǎn)控制體系評(píng)估報(bào)告
- 初中信息技術(shù)課件新版
- 中班健康教育活動(dòng)設(shè)計(jì)
- 初中信息技術(shù)課件制作
- 初中信息技術(shù)課件人教版
- 大班健康團(tuán)結(jié)友愛
- 【MOOC】心理學(xué)與生活-南京大學(xué) 中國大學(xué)慕課MOOC答案
- 檢查檢驗(yàn)管理制度
- 護(hù)理實(shí)習(xí)生供應(yīng)室
- 陰道壁膨出的臨床護(hù)理
- 語文-40首必背古詩詞(易錯(cuò)字標(biāo)注+挖空訓(xùn)練+情境式默寫)(學(xué)生版+教師版)
- 叉車教學(xué)課件教學(xué)課件
- 貴陽出租車駕駛員從業(yè)資格證(區(qū)域)考試總題庫(含答案)
- 游樂場游樂園安全生產(chǎn)責(zé)任制
- ISO∕IEC 27014-2020 信息安全、網(wǎng)絡(luò)安全與隱私保護(hù)-信息安全治理(中文版-雷澤佳譯2024)
- 安徒生童話《樅樹》
- 房產(chǎn)測量規(guī)范
評(píng)論
0/150
提交評(píng)論