版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
〔一〕把握內(nèi)容
第十一章多元線(xiàn)性回歸與logistic一、教學(xué)大綱要求多元線(xiàn)性回歸分析的概念:多元線(xiàn)性回歸、偏回歸系數(shù)、殘差。多元線(xiàn)性回歸的分析步驟:多元線(xiàn)性回歸中偏回歸系數(shù)及常數(shù)項(xiàng)的求法、多元線(xiàn)性回歸的應(yīng)用。P值下結(jié)論。logistic回歸模型構(gòu)造:模型構(gòu)造、發(fā)病概率比數(shù)、比數(shù)比。5.logistic回歸參數(shù)估量方法。6.logistic回歸篩選自變量:似然比檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式;篩選自變量的方法?!捕成鑳?nèi)容常用統(tǒng)計(jì)軟件〔SPSS及SAS〕多元線(xiàn)性回歸分析方法:數(shù)據(jù)預(yù)備、操作步驟與結(jié)果輸出?!踩沉私鈨?nèi)容標(biāo)準(zhǔn)化偏回歸系數(shù)的解釋意義。二、教學(xué)內(nèi)容精要(一)多元線(xiàn)性回歸分析的概念將直線(xiàn)回歸分析方法加以推廣,用回歸方程定量地刻畫(huà)一個(gè)應(yīng)變Y與多個(gè)自變量X間的線(xiàn)形依存關(guān)系,稱(chēng)為多元線(xiàn)形回歸multiplelinearregressio,簡(jiǎn)稱(chēng)多元回歸multiple regressio〕bX0 1 1 2 2 k k式中Y?為各自變量取某定值條件下應(yīng)變量均數(shù)的估量值,X,X ,…,X 為自變量,k為自變量個(gè)數(shù),b為回歸方1 2 k 0程常數(shù)項(xiàng),也稱(chēng)為截距,其意義同直線(xiàn)回歸,bb1 2
,…,bk
稱(chēng)為偏回歸系數(shù)partialregressioncoefficien,b 表示j
以外的自變量固定條件下,Xj
每轉(zhuǎn)變一個(gè)單位后Y的平均轉(zhuǎn)變量。j(二)多元線(xiàn)性回歸的分析步驟Y?是與一組自變量X,X ,…,X 相對(duì)應(yīng)的變量Y的平均估量值。1 2 k多元回歸方程中的回歸系數(shù)bb1 2
,…,bk
可用最小二乘法求得,也就是求出能使估量值Y?和實(shí)際觀看值Y的殘差平方和e2i
(YY?2為最小值的一組回歸系數(shù)bb1 2
,…,bk
值。依據(jù)以上要求,用數(shù)學(xué)方法可以得出求回歸系數(shù)bb1
,…,bk
的以下正規(guī)方程組normalequatio:bl
bl
bl l111
212
k1k 1ybl121
bl222
bl lk2k 2ybl1k1
bl
bl lkkk ky式中l(wèi)
(X
X)(X X)XX
(X)(X)i jij
i i j
i j nl (Xiy
X)(YY)XY(i i
X)( Y)in常數(shù)項(xiàng)b0
可用下式求出:
b YbX0 1
bX2
bXk k〔三〕多元線(xiàn)性回歸分析中的假設(shè)檢驗(yàn)在算得各回歸系數(shù)并建立回歸方程后,還應(yīng)對(duì)此多元回歸方程作假設(shè)檢驗(yàn),推斷自變XX1 2
,…,Xk
是否與Y真有線(xiàn)性依存關(guān)系,也就是檢驗(yàn)無(wú)效假設(shè)H0。檢驗(yàn)時(shí)常用統(tǒng)計(jì)量F
〔0 1
3
0〕,備選假設(shè)H1
為各
0j式中nk為自變量的個(gè)數(shù)。
MSF 回歸MS誤差
l (nk1)l k回歸誤差l k回歸式中 l回歸
bl1y
bl
blkkyl l誤差
l回歸l 總
2lyy(四)logistic回歸模型構(gòu)造設(shè)X,X, ,X 為一組自變量,Y為應(yīng)變量。當(dāng)Y是陽(yáng)性反響時(shí),記為Y=1;當(dāng)Y是陰性反響時(shí),記為Y=0。1 2 kP表示發(fā)生陽(yáng)性反響的概率;用Q表示發(fā)生陰性反響的概率,明顯PQ=1。Logistic回歸模型為:1P e0X12X2kXk1同時(shí)可以寫(xiě)成:
1e0X12X11Q11
kXk11e01
XX1 2
kXk式中
(jk)是與爭(zhēng)論因素X
有關(guān)的參數(shù),稱(chēng)為偏回歸系數(shù)。0 j
大事發(fā)生的概率P與x之間呈曲線(xiàn)關(guān)系,當(dāng)x在
之間變化時(shí),P或Q在〔0,1〕之間變化。假設(shè)有n例觀看對(duì)象第i名觀看對(duì)象在自變量X ,Xi1
, ,Xi2
作用下的應(yīng)變量為Yi
Yi
=Yi
相應(yīng)地用P表示其發(fā)生陽(yáng)性反響的概率;用Q表示其發(fā)生陰性反響的概率,仍舊有PQ
=1P和Q
的計(jì)算如下:i i1 e01
Xi12
Xi2
kXik
i i i i0Pi 1e0Q
X 1 i1 1
Xi2
kXik1i 1e01
Xi12
Xi2
kXik這樣,第i個(gè)觀看對(duì)象的發(fā)病概率比數(shù)〔odds〕為PQi i
,第l個(gè)觀看對(duì)象的發(fā)病概率比數(shù)為PQl l
,而這兩個(gè)觀ORoddsrati。比照數(shù)比取自然對(duì)數(shù)得到關(guān)系式:ln
(X
X )(X
X )(X
X )PQi iPQPQi iPQ
2 i2
k ik lkl l 等式左邊是比數(shù)比的自然對(duì)數(shù),等式右邊的X Xij lj
j
Xi
的不同暴露水平Xij
與X 之差。lj 的流行病學(xué)意義是在其它自變量固定不變的狀況下Xj
的暴露水平每轉(zhuǎn)變一個(gè)測(cè)量單位時(shí)所引起的比數(shù)比的j自然對(duì)數(shù)轉(zhuǎn)變量。或者說(shuō),在其他自變量固定不變的狀況下,當(dāng)自變量X
的水平每增加一個(gè)測(cè)量單位時(shí)所引起的比數(shù)j比為增加前的ej倍。同多元線(xiàn)性回歸一樣,在比較暴露因素對(duì)反響變量相對(duì)奉獻(xiàn)的大小時(shí),由于各自變量的取值單位不同,也不能用偏回歸系數(shù)的大小作比較,而須用標(biāo)準(zhǔn)化偏回歸系數(shù)來(lái)做比較。標(biāo)準(zhǔn)化偏回歸系數(shù)值的大小,直接反映了其相應(yīng)的暴露因素對(duì)應(yīng)變量的相對(duì)奉獻(xiàn)的大小。標(biāo)準(zhǔn)化偏回歸系數(shù)的計(jì)算,可利用有關(guān)統(tǒng)計(jì)軟件在計(jì)算機(jī)上解決。〔五〕logistic回歸參數(shù)估量由于logistic回歸是一種概率模型,通常用最大似然估量法〔maximumlikelihoodestimate〕求解模型中參數(shù) 的j估量值bj
(jk)。YXX1
, ,X2
作用下的陽(yáng)性大事〔或疾病〕發(fā)生的指示變量。其賦值為:1,第iY i 0,第i第i個(gè)觀看對(duì)象對(duì)似然函數(shù)的奉獻(xiàn)量為:li
PYiii
Q1Yii當(dāng)各大事是獨(dú)立發(fā)生時(shí),則n個(gè)觀看對(duì)象所構(gòu)成的似然函數(shù)L是每個(gè)觀看對(duì)象的似然函數(shù)奉獻(xiàn)量的乘積,即Lnl
PYQ1Y式中∏為i1到n的連乘積。
i ii i ii1 i1依最大似然估量法的原理,使得L到達(dá)最大時(shí)的參數(shù)值即為所求的參數(shù)估量值,計(jì)算時(shí)通常是將該似然函數(shù)取自然對(duì)數(shù)〔稱(chēng)為對(duì)數(shù)似然函數(shù)〕后,用Newton—Raphson迭代算法求解參數(shù)估量值b〔六〕logistic回歸篩選自變量
(j2,,k)。j在logistic回歸中篩選自變量的方法有似然比檢〔likelihoodratiotes計(jì)分檢(score testWald檢test)三種。其中似然比檢驗(yàn)較為常用, 用Λ 2lnL”L2(lnL”lnL)式中l(wèi)nL為方程中包含m(mk)L”為在方程中包含原m個(gè)自變量的基礎(chǔ)上再參加1X
后的似然函數(shù)值Hj
Λ聽(tīng)從自由度為12
2(1)時(shí),則在水平上拒絕無(wú)效假設(shè),即認(rèn)為X應(yīng)參加。逆向進(jìn)展即可剔除自變量?!惨弧硢雾?xiàng)選擇題
Xj三、典型試題分析
j多元線(xiàn)性回歸分析中,反映回歸平方和在應(yīng)變Y的總離均差平方和中所占比重的統(tǒng)計(jì)量是〔 。復(fù)相關(guān)系數(shù)偏相關(guān)系數(shù)偏回歸系數(shù)確定系數(shù)答案:D[評(píng)析] 此題考點(diǎn):多元線(xiàn)性回歸中的幾個(gè)概念的理解。多元線(xiàn)性回歸中的偏回歸系數(shù)〔multiplelinearregression〕表示在其它自變量固定不變的狀況下自變量X 每轉(zhuǎn)變j一個(gè)單位時(shí),單獨(dú)引起應(yīng)變量Y的平均轉(zhuǎn)變量。確定系數(shù)〔coefficientofdetermination〕表示回歸平方和SS
占總離均差平方和SS
R2。即R2總
SS SS回歸
回歸R〔multiplecorrelationcoefficient〕,p0R≤1。Logistic回歸分析適用于應(yīng)變量為〔 。A.分類(lèi)值的資料 B.連續(xù)型的計(jì)量資料C.正態(tài)分布資料 D.一般資料答案:A[評(píng)析]此題考點(diǎn):logistic回歸的概念。logistic料,特別適用于應(yīng)變量為二項(xiàng)分類(lèi)的情形。模型中的自變量可以是定性離散值,也可以是計(jì)量觀測(cè)值?!捕秤?jì)算題依據(jù)表11-2數(shù)據(jù),分別用SPSS統(tǒng)計(jì)軟件、SAS統(tǒng)計(jì)軟件寫(xiě)出多元線(xiàn)性回歸的統(tǒng)計(jì)分析步驟及其簡(jiǎn)要結(jié)果。表11-1 某學(xué)校20名一年級(jí)女大學(xué)生肺活量及有關(guān)變量測(cè)量結(jié)果編號(hào) 體重X/kg 胸圍X /cm 肩寬X/cm 肺活量Y/L1 2 3150.873.236.32.96249.084.134.53.13342.878.331.01.91455.077.131.02.63545.381.730.02.86645.374.832.01.91751.473.736.52.98853.879.437.03.28949.072.630.12.521053.979.537.13.271148.883.833.93.101252.688.438.03.281342.778.230.91.921452.588.338.13.271555.177.231.12.641645.281.630.22.851751.478.336.53.161848.772.530.02.511951.378.236.43.152045.875.032.51.94答案:SPSEXAP1sa4列20StatisticRegressionLinear...Dependent:YIndependent(s):X,X,X1 2 3Method:Enter結(jié)果:ModelVariablesEntered ModelVariablesEntered VariablesRemovedMethod1XXX.Enter3〔肩寬〕,2〔胸圍〕,1〔體重〕Allrequestedvariablesentered.DependentVariable:Y〔肺活量〕ModelRRModelRRSquareAdjustedRSquare.662Std.ErroroftheEstimate1.846.715.2893a Predictors:(Constant),X3,X2,X1ANOVAModelSumofSquaresdfMeanSquareFSig.1 Regression3.36731.12213.413.000Residual1.339168.368E-02Total4.70619a Predictors:(Constant),b DependentVariable:Y
X ,X ,X3 2 1ModelUnstandardizedModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)XXX321-4.6761.321-3.541.0036.036E-02.021.4742.899.0103.508E-02.015.3332.272.0375.010E-02.029.3071.735.102a DependentVariable:YSAS:
數(shù)據(jù)步 過(guò)程步DATA EXAP11—2;INPUTx1x2x3y@@; PROCREG;CARDS; MODELy=x1x2x3;50.873.236.32.96?45.875.032.51.94; RUN;結(jié)果:
AnalysisofVarianceSourceDFSumofSquaresMeanSquareFValuePr>FModel33.367321.1224413.410.0001Error161.338930.08368CorrectedTotal194.70626ParameterEstimatesParameterStandardVariableDFEstimateErrortValuePr>|t|Intercept1-4.675531.32051-3.540.0027X110.060360.020822.900.0105X210.035080.015442.270.0372X310.050100.028881.730.1020[評(píng)析] 此題考點(diǎn):統(tǒng)計(jì)軟件關(guān)于多元線(xiàn)性回歸的分析方法及主要輸出結(jié)果。依據(jù)SPSS或SAS的輸出結(jié)果,可進(jìn)展以下分析:檢驗(yàn)H: 0的方差分析表。F=13.413,P=0.0001,拒絕H,肺活量至少與一個(gè)自變量存在線(xiàn)0 1 2 3 0性關(guān)系。估量偏回歸系數(shù)b,b,bY
4.680.06X0.04X 0.05X,R2=0.715,R2=0.662。1 2 3
1 2 3 a偏回歸系數(shù)檢驗(yàn),見(jiàn)表11-2。表11-2 偏回歸系數(shù)估量值及其檢驗(yàn)偏回歸系數(shù)估量值偏回歸系數(shù)估量值SEtPb-4.6751.321-3.540.00b0.0600.0212.900.01b0.0350.0152.270.04b0.0500.0291.730.10123〔一〕單項(xiàng)選擇題
四、習(xí)題可用來(lái)進(jìn)展多元線(xiàn)性回歸方程的協(xié)作適度檢驗(yàn)是:2檢驗(yàn) B.F檢驗(yàn) C.U檢驗(yàn) D.Ridit檢驗(yàn)在多元回歸中,假設(shè)對(duì)某個(gè)自變量的值都增加一個(gè)常數(shù),則相應(yīng)的偏回歸系數(shù):不變 B.增加一樣的常數(shù) C.削減一樣的常數(shù) D.增加但數(shù)值不定在多元回歸中,假設(shè)對(duì)某個(gè)自變量的值都乘以一個(gè)一樣的常數(shù)k,則:該偏回歸系數(shù)不變?cè)撈貧w系數(shù)變?yōu)樵瓉?lái)的1/k倍全部偏回歸系數(shù)均發(fā)生轉(zhuǎn)變?cè)撈貧w系數(shù)轉(zhuǎn)變,但數(shù)值不定作多元回歸分析時(shí),假設(shè)降低進(jìn)入的F界值,則進(jìn)入方程的變量一般會(huì):增多 B.削減 C.不變 D.可增多也可削減〔二〕名詞解釋1.多元線(xiàn)性回歸 2.偏回歸系數(shù) 3.復(fù)相關(guān)系數(shù) 4.確定系數(shù)5.比數(shù) 6.比數(shù)比〔三〕logistic回歸模型中,偏回歸系數(shù)的解釋意義是什么?i〔四〕某學(xué)者爭(zhēng)論在某種養(yǎng)分缺乏狀態(tài)下兒童的體重〔Y,k〕與身高〔X,c、年齡〔X ,歲〕的關(guān)系獲得了1 212名觀看對(duì)象的觀測(cè)資料,計(jì)算得到如下根本數(shù)據(jù):XYX 1611,X2219631,X ,X2976,Y341,Y29883,XXY1XY46439,
1 2 2 1 23079。1 2請(qǐng)寫(xiě)出求解Y
b bX bX二元線(xiàn)性回歸方程的正規(guī)方程組。0 1 1 2 2設(shè)方程組的解為b0
2.114,b1
0.135,b2
0.923,請(qǐng)寫(xiě)出回歸方程。完成以下方差分析表。 表11-3 12名兒童體重與身高、年齡回歸分析方差分析表變異來(lái)源 v SS MS F回歸殘差總和〔一〕 單項(xiàng)選擇題
五、習(xí)題答案要點(diǎn)1.B 2.A 3.B 4.A〔二〕名詞解釋用回歸方程定量地刻畫(huà)一個(gè)應(yīng)變量Y與多個(gè)自變量X間的線(xiàn)性依存關(guān)系,稱(chēng)為多元線(xiàn)性回歸〔multiplelinearregressio,簡(jiǎn)稱(chēng)多元回歸multiple regressio。多元線(xiàn)性回歸的根本形式為:bbXbX bX b,b0 1 1 2 2 k k 1 2
,…,bk
稱(chēng)為偏回歸系數(shù)〔partialregressioncoefficien,bj
X
以外的自變量固定條件下,Xj
每轉(zhuǎn)變一個(gè)單位后Y的平均轉(zhuǎn)變量。j復(fù)相關(guān)系
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版供水用不銹鋼水箱購(gòu)銷(xiāo)合同2篇
- 機(jī)械課程設(shè)計(jì)干啥的啊
- 智能核儀器基礎(chǔ)課程設(shè)計(jì)
- 稅收法制教育課程設(shè)計(jì)
- 編曲音樂(lè)創(chuàng)作課程設(shè)計(jì)
- 羽毛球上課課程設(shè)計(jì)
- 機(jī)械設(shè)計(jì)課程設(shè)計(jì)記錄
- 聯(lián)接軸課程設(shè)計(jì)
- 網(wǎng)站前段課課程設(shè)計(jì)
- 自動(dòng)掃地機(jī)課程設(shè)計(jì)
- 二線(xiàn)干部工作總結(jié)
- 土石方挖運(yùn)工程承包合同范本
- 山東省濟(jì)南市七年級(jí)上學(xué)期期末英語(yǔ)試卷(附答案)
- 心身疾病的心理與康復(fù)治療
- 2024年02月四川省省直機(jī)關(guān)2024年度公開(kāi)遴選和公開(kāi)選調(diào)公務(wù)員筆試參考題庫(kù)附帶答案詳解
- 2024安吉桃花源萌寵露營(yíng)節(jié)活動(dòng)方案
- 壯醫(yī)藥水蛭療法
- 2024年高考語(yǔ)文備考之語(yǔ)用新題“語(yǔ)境+語(yǔ)義”專(zhuān)練
- 生產(chǎn)計(jì)劃實(shí)施考核管理辦法
- 200句搞定中考英語(yǔ)詞匯
- 2024年型材切割機(jī)市場(chǎng)需求分析報(bào)告
評(píng)論
0/150
提交評(píng)論