第十七章多因素回歸分析簡介_第1頁
第十七章多因素回歸分析簡介_第2頁
第十七章多因素回歸分析簡介_第3頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第十七章多因素回歸分析的Stata 實現(xiàn)本章使用的 Stata命令:多因素回歸逐步回歸Logistic 回歸生存時間數(shù)據(jù)設(shè)定Cox 回歸regressdepvar indepvarsstepwise , options : commandlogistic depvar indepvars weightstset timevar weight , failure(failvar=numlist) stcox varlist例 17-4 某研究者為了研究某種避孕藥對人體血糖的影響,分別在正在使用這種避孕藥的人群、 6 個月前曾經(jīng)使用過這種避孕藥的人群、從未使用過避孕藥的人群中各隨機抽取 6 人。考

2、慮到血糖可能與年齡有關(guān),所以該研究者不僅測定了這 18 位對象的血糖,而且也記錄了這 18 位對象的年齡,具體資料見表 174。請根據(jù)研究問題作統(tǒng)計分析。表 1 7-4 三種避孕藥使用情況下的年齡(X ,歲)與血糖水平 (Y,mg)現(xiàn)服藥者曾服藥者從未服藥者XYXYXY201202412628135211222613032137231242713234138231262913135137241252913435139241273013637144本研究的問題是比較三種用藥情況下的血糖平均水平是否不同,因此首先考慮以下總體均數(shù)的情況。解: Stata數(shù)據(jù)如下:xyg1g2201200121122

3、012312401231260124125012412701241261026130102713210291311029134103013610281350032137003413800351370035139003714400Stata命令如下:reg y x g1 g2結(jié)果:Source|SSdfMSNumber ofobs =18-+-F(3,14)=83.88Model|717.6845573239.228186Prob F=0.0000Residual|39.9265537142.85189669R-squared=0.9473-+-AdjR-squared=0.9360Total|

4、757.6111111744.5653595RootMSE=1.6888-y|Coef.Std.Err.tP|t|95% Conf.Interval-+-x|1.067797.17951275.950.000.68278011.452813g1|-.42655371.452834-0.290.773-3.5425722.689465g2|-2.5875712.202234-1.170.260-7.3108932.135752_cons|102.56216.05306716.940.00089.57961115.5447-g1 代表曾服藥者和未服藥者的比較, p=0.773,說明曾服藥者和未服藥

5、者血糖平均水平?jīng)]有差別。 g2 代表現(xiàn)服藥者和未服藥者的比較, p=0.260,說明現(xiàn)服藥者和未服藥者血糖平均水平?jīng)]有差別。接著比較曾服藥者和現(xiàn)服藥者:testg1= g2結(jié)果:( 1)g1 - g2 = 0F( 1,14) =2.66Prob F =0.1252P=0.1252,曾服藥者和現(xiàn)服藥者血糖平均水平?jīng)]有差別。例 17-5 為了研究影響肥胖者瘦素( Leptin)的主要危險因素,某研究者調(diào)查了某醫(yī)院肥胖門診的 500 名肥胖就診者的瘦素、年齡、體重指數(shù)、總膽固醇、甘油三酯、是否患糖尿病、是否患高血壓、飲食、運動、服藥情況等,并用逐步線性回歸模型分析影響瘦素的主要因素。為了簡化問題,僅

6、取自變量為年齡( X1,歲)、體重指數(shù)(X2,kg/m2)、總膽固醇 (X3,mmol/L) 、是否患糖尿?。?X4,患糖尿病為 1,不患糖尿病為 0)和是否患高血壓( X5,患高血壓為 1,不患高血壓為 0),應變量為瘦素(Y,ng/ml)。為了說明的方便,這里僅從 500名肥胖就診者中隨機取30 例,具體數(shù)據(jù)如表17-11 所示,試用逐步線性回歸分析尋找主要的影響因素。表 17-11 例 17-5 的數(shù)據(jù)X1X2X3X4X5 YX1X2X3X4X5 YX1X2X3X4X5 Y6331.014.10010.43929.06.8018.56029.513.0019.14327.78.5106.

7、56631.115.30010.45828.814.2109.45127.611.8119.34329.57.3008.23428.15.5115.35730.712.91011.16329.715.5008.43228.94.5005.14927.98.8007.14928.910.1006.56027.912.4119.73829.56.2016.74428.78.6008.95530.712.81110.35728.511.6018.63928.36.8005.65230.79.91110.33426.85.3003.05430.511.3019.45126.910.9009.14429

8、.39.0006.95329.111.2007.13025.84.9113.86229.514.71011.45428.312.8008.16030.312.91111.8Stata數(shù)據(jù)如下:X1X2X3X4X5Y633114.10010.44327.78.5106.55127.611.8119.35730.712.91011.14927.98.8007.13829.56.2016.75728.511.6018.63426.85.30034429.39006.96229.514.71011.439296.8018.56631.115.30010.44329.57.3008.26329.715.

9、5008.44928.910.1006.54428.78.6008.93928.36.8005.65430.511.3019.45329.111.2007.15428.312.8008.16029.513019.15828.814.2109.43428.15.5115.33228.94.5005.16027.912.4119.75530.712.81110.35230.79.91110.35126.910.9009.13025.84.9113.86030.312.91111.8Stata命令:stepwise,pr(0.15): reg y x1 x2 x3 x4 x5結(jié)果:beginwith

10、fullmodelp =0.7123= 0.1500removingx3p =0.3424= 0.1500removingx5Source|SSdfMSNumber ofobs =30-+-F(3,26)=35.37Model|114.195479338.0651597Prob F=0.0000Residual|27.9845204261.07632771R-squared=0.8032-+-AdjR-squared=0.7805Total|142.179999294.9027586RootMSE=1.0375-y|Coef.Std.Err.tP|t|95% Conf.Interval-+-x

11、1|.1348869.02308935.840.000.0874261.1823477x2|.5445848.17951913.030.005.175578.9135916x4|1.044741.39815862.620.014.22631431.863168_cons|-14.678884.653129-3.150.004-24.24352-5.114233-最后的回歸方程為?14.6790.135X10.545X21.045X4Y可以認為年齡 X1,體重指數(shù) X2 和患糖尿病 X4 是影響瘦素的主要因素,年齡X1 增大 1 歲,估計瘦素平均升高0.135 ng/ml;體重指數(shù)增大 1 個單

12、位,估計瘦素平均升高 0.545 ng/ml;患糖尿病患者的瘦素比非糖尿病患者平均升高 1.045 ng/ml,這些自變量均有統(tǒng)計學意義。例 17-6 為了研究蕁麻疹史( 1 為有, 0 為無)及性別( 1 為男, 0 為女)是否對慢性氣管炎( 1 為病例, 0 為對照)有影響,某病例對照研究的研究結(jié)果見表 17-13 所示,試用 logistic 回歸進行統(tǒng)計分析。表 17-13 慢性氣管炎的影響因素蕁麻疹史 X1性別 X2慢性氣管炎 Y頻數(shù) f000990019001015301113810011101201101511130Stata 數(shù)據(jù)為:x1x2yf0009900190010153

13、01113810011101201101511130Stata命令為:logistic y x1 x2 weight=f結(jié)果為:Logistic regressionNumber of obs=556LR chi2(2)=8.91Prob chi2=0.0116Log likelihood= -380.93403Pseudo R2=0.0116-y |Odds RatioStd. Err.zP|z|95%Conf.Interval-+-x1|2.125665.54948482.920.0041.2807343.528016x2|1.005203.17577220.030.976.7135278

14、1.41611-說明性別不是慢性氣管炎的危險因素,而蕁麻疹史是慢性氣管炎的危險因素, OR=2.125。例 17-7 某研究者對經(jīng)某醫(yī)院手術(shù)治療的 30 例癌癥患者進行了為期 5 年的臨床隨訪觀察,收集了每一患者的性別( X1=1 為男性, X1=0 為女性)、年齡( X2,歲)、從癌癥確診日期到手術(shù)日期的等候時間( X3,月)、從癌癥確診到研究結(jié)束的時間(即生存時間 t,月),采用變量 Y 指示研究結(jié)束時每一手術(shù)患者的生存情況( Y=1 為死亡, Y=0 為截尾)。具體數(shù)據(jù)見表 17-16 所示。試分析性別、年齡、手術(shù)等待時間是否為死亡的危險因素。表 17-1630 例癌癥患者手術(shù)后生存時間

15、分析No t Y XXXNotY XXXNotY XXX12312312316106623113110581021161156827106721124110539221911589381063161344005682322115410411106610145411526242911607515106515155910489253511557612105910168116619264411556715106212171011651827451151881810649181511622228560155592010588191211641629581150610261056720141155153

16、06001573Stata數(shù)據(jù)為:NotYX1X2X31610662327106721381063164111066105151065156121059107151062128181064992010588102610567113110581012411053913440056814541152615591048916811661917101165181815116222191211641620141155152116115682219115892322115410242911607253511557264411556274511518285601555295811506306001573Stata命令為:stsett,failure( y=1)stcoxx1 x2 x3結(jié)果:Coxregression-BreslowmethodfortiesNo.ofsubjects=30Number of obs=30No.offailures=27Timeatrisk=810LR chi2(3)=39.31Loglikelihood=-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論