論文知識回歸分析_第1頁
論文知識回歸分析_第2頁
論文知識回歸分析_第3頁
論文知識回歸分析_第4頁
論文知識回歸分析_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS如何進(jìn)行線性回歸分析操作瀏覽:3113更新:2014-03-1310:11本節(jié)內(nèi)容主要介紹如何確定并建立線性回歸方程。包括只有一個(gè)自變量的一元線性回歸和和含有多個(gè)自變量的多元線性回歸。為了確保所建立的回歸方程符合線性標(biāo)準(zhǔn),在進(jìn)行回歸分析之前,我們往往需要對因變量與自變量進(jìn)行線性檢驗(yàn)。也就是類似于相關(guān)分析一章中講過的借助于散點(diǎn)圖對變量間的關(guān)系進(jìn)行粗略的線性檢驗(yàn),這里不再重復(fù)。另外,通過散點(diǎn)圖還可以發(fā)現(xiàn)數(shù)據(jù)中的奇異值,對散點(diǎn)圖中表示的可能的奇異值需要認(rèn)真檢查這一數(shù)據(jù)的合理性。一、一元線性回歸分析用SPSS進(jìn)行回歸分析,實(shí)例操作如下:1.單擊主菜單Analyze/Regression/Linear...,進(jìn)入設(shè)置對話框如圖7-9所示。從左邊變量表列中把因變量y選入到因變量(Dependent)框中,把自變量x選入到自變量(Independent)框中。在方法即Method—項(xiàng)上請注意保持系統(tǒng)默認(rèn)的選項(xiàng)Enter,選擇該項(xiàng)表示要求系統(tǒng)在建立回歸方程時(shí)把所選中的全部自變量都保留在方程中。所以該方法可命名為強(qiáng)制進(jìn)入法(在多元回歸分析中再具體介紹這一選項(xiàng)的應(yīng)用)。具體如下圖所示:2.請單擊Statistics...按鈕可以選擇需要輸出的一些統(tǒng)計(jì)量。如RegressionCoefficients(回歸系數(shù))中的Estimates,可以輸出回歸系數(shù)及相關(guān)統(tǒng)計(jì)量,包括回歸系數(shù)B、標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)BETA、T值及顯著性水平等。Modelfit項(xiàng)可輸出相關(guān)系數(shù)R,測定系數(shù)R2,調(diào)整系數(shù)、估計(jì)標(biāo)準(zhǔn)誤及方差分析表。上述兩項(xiàng)為默認(rèn)選項(xiàng),請注意保持選中。設(shè)置如圖7-10所示。設(shè)置完成后點(diǎn)擊Continue返回主對話框。回歸方程建立后,除了需要對方程的顯著性進(jìn)行檢驗(yàn)外,還需要檢驗(yàn)所建立的方程是否違反回歸分析的假定,為此需進(jìn)行多項(xiàng)殘差分析。由于此部分內(nèi)容較復(fù)雜而且理論性較強(qiáng),所以不在此詳細(xì)介紹,讀者如有興趣,可參閱有關(guān)資料。用戶在進(jìn)行回歸分析時(shí),還可以選擇是否輸出方程常數(shù)。單擊Options...按鈕,打開它的對話框,可以看到中間有一項(xiàng)Includeconstantinequation可選項(xiàng)。選中該項(xiàng)可輸出對常數(shù)的檢驗(yàn)。在Options對話框中,還可以定義處理缺失值的方法和設(shè)置多元逐步回歸中變量進(jìn)入和排除方程的準(zhǔn)則,這里我們采用系統(tǒng)的默認(rèn)設(shè)置/如圖7-11所示。設(shè)置完成后點(diǎn)擊Continue返回主對話框。在主對話框點(diǎn)擊OK得到程序運(yùn)行結(jié)果。如題。我選擇的是線性回歸,得出了一堆表格和圖標(biāo)。我做的是生物學(xué)方面的統(tǒng)計(jì)。我的目標(biāo)是得出模擬方程,再根據(jù)已有的自變量來計(jì)算因變量。我是SPSS新手,而且我對逐步回歸也不了解。但由于工作原因,必須得到模擬方程。請高手告訴我我的這個(gè)統(tǒng)計(jì)符不符合線性關(guān)系,如果符合,怎么寫模擬方程,謝謝!以下是部分截圖分享到:2013-11-1619:52提問者米納x1,x2...x5是5個(gè)自變量,1個(gè)y因變量。系數(shù)a圖中是將x1與y建立一個(gè)線性回歸模型,常量為1.956E-6,sig.也即P值=1>0.05,無統(tǒng)計(jì)學(xué)意義,x1的斜率為-0.504,P=0.000v0.05,具有顯著意義,常量和斜率看非標(biāo)準(zhǔn)化系數(shù),得方程為y=-0.504x1+1.956E-6,這其實(shí)是個(gè)一元線性回歸方程;然后逐漸的加入x2,x3,x4,x5進(jìn)行二元線性回歸,三元線性回歸等。一旦有一個(gè)變量,如x3的P值〉0.05也就說明這個(gè)變量對模型的建立無統(tǒng)計(jì)學(xué)意義,在多元線性回歸中也就可以無情的剔除掉。而由系數(shù)a圖可知,x1,x2,x3,x4,x5的斜率P值都是0.000<0.05,也就是說都有意義,5個(gè)變量一個(gè)也不能剔除,全保留,也即要5個(gè)變量都有的模型6了。由模型匯總圖也可知,模型1到6的調(diào)整R方是越來越大的,也即擬合的越來越好了。那么最終的線性方程就看模型6啦,常量0.002,x1斜率-0.860,x2斜率-0.713...后面看不到了。也即y=0.002-0.860x1-0.713x2…常量P值=0.974>0.05無顯著性意義,說明擬合的線過原點(diǎn),也即常量值應(yīng)為0,但是否能改為0這個(gè)我也不確定,但0或0.002差別不會(huì)太大的。追問厲害,一看就是高手。不好意思,系數(shù)那個(gè)表里缺一塊,我現(xiàn)在補(bǔ)上,再把另外幾個(gè)表補(bǔ)上還有點(diǎn)問題想請指教。1.你說的那個(gè)常量為1.965E-6,這個(gè)E是什么意思?2?自變量一共有6個(gè),從x1到x6,可能是我那個(gè)表缺一塊的原因吧,抱歉了。系數(shù)表缺的部分:其它表能否將最終的模擬方程式寫出來,不勝感激!回答1.965E-6是指1.965乘10的-6次方。已排除的變量表對應(yīng)系數(shù)a表,模型1對應(yīng)模型1,也即前一個(gè)表是進(jìn)入,相對的后一個(gè)就排除。模型1進(jìn)入了x1,排除的x2,x3,x4,x5,x6中的x2的P值<0.05還不能排除,還要進(jìn)入分析,模型2,3等依次類推,一個(gè)也排除不掉。全部進(jìn)入回歸方程。另,如果兩變量間存在共線性的話,是不能都進(jìn)入回歸方程的。判斷依據(jù)為膨脹因子VIFV10,倒數(shù)即容差〉0.1,已排除變量圖上可知各變量間不存在共線性,都不用排除。常量P值〉0.05可以去掉,各變量的斜率選用模型6的標(biāo)準(zhǔn)系數(shù)。因而最終回歸方程為:y=-0.860x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130x6回歸分析是處理兩個(gè)及兩個(gè)以上變量間線性依存關(guān)系的統(tǒng)計(jì)方法。在醫(yī)學(xué)領(lǐng)域中,此類問題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等。回歸分析就是用于說明這種依存變化的數(shù)學(xué)關(guān)系。第一節(jié)Linear過程主要功能調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。實(shí)例操作[例8.1]某醫(yī)師測得10名3歲兒童的身高(cm)、體重<kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。兒童編號體表面積(Y)身高(X)1體重(X)212345675.3825.2995.3585.2925.6026.0145.83088.087.688.589.087.789.588.811.011.812.012.313.113.714.486.10290.414.996.07590.615.2106.41191.216.0數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始數(shù)據(jù),結(jié)果如圖8.1所示。圖8.1原始數(shù)據(jù)的輸入統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Linear...項(xiàng),彈出LinearRegression對話框(如圖8.2示)。從對話框左側(cè)的變量列表中選y點(diǎn)擊A鈕使之進(jìn)入Dependent框,選xl、x2,點(diǎn)擊A鈕使之進(jìn)入Indepentdent(s)框;在Method處下拉菜單,共有5個(gè)選項(xiàng):Enter(全部入選法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法)。本例選用Enter法。點(diǎn)擊OK鈕即完成分析。用戶還可點(diǎn)擊Statistics...鈕選擇是否作變量的描述性統(tǒng)計(jì)、回歸方程應(yīng)變量的可信區(qū)間估計(jì)等分析;點(diǎn)擊Plots.??鈕選擇是否作變量分布圖(本例要求對標(biāo)準(zhǔn)化Y預(yù)測值作變量分布圖);點(diǎn)擊Save...鈕選擇對回歸分析的有關(guān)結(jié)果是否作保存(本例要求對根據(jù)所確定的回歸方程求得的未校正Y預(yù)測值和標(biāo)準(zhǔn)化Y預(yù)測值作保存);點(diǎn)擊Options...鈕選擇變量入選與剔除的a、B值和缺失值的處理方法。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

2..X1MultipleR.94964RSquare.90181AdjustedRSquare.87376StandardError.14335AnalysisofVarianceDFSumofSquaresMeanSquareRegression21.32104.66052Residual7.14384.02055F=32.14499SignifF=.0003-VariablesintheEquation-VariableBSEBBetaTSigTXI.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.017776-.475.6495EndBlockNumber1Allrequestedvariablesentered.結(jié)果顯示,本例以XI、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程?;貧w方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181,經(jīng)方差分析,F(xiàn)=34.14499,P=0.0003,回歸方程有效?;貧w方程為Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回歸方程計(jì)算Y預(yù)測值和標(biāo)準(zhǔn)化Y預(yù)測值(所謂標(biāo)準(zhǔn)化Y預(yù)測值是指將根據(jù)回歸方程求得的Y預(yù)測值轉(zhuǎn)化成按均數(shù)為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布的Y值)并將計(jì)算結(jié)果保存入原數(shù)據(jù)庫。系統(tǒng)將原始的X1、X2值代入方程求Y值預(yù)測值(即庫中pre_1欄)和標(biāo)準(zhǔn)化Y預(yù)測值(即庫中zpr_1欄),詳見圖8.3。圖8.3計(jì)算結(jié)果的保存本例還要求對標(biāo)準(zhǔn)化Y預(yù)測值作變量分布圖,系統(tǒng)將繪制的統(tǒng)計(jì)圖送向ChartCarousel窗口,雙擊該窗口可見下圖顯示結(jié)果。圖8.4對標(biāo)準(zhǔn)化Y預(yù)測值所作的正態(tài)分布圖第二節(jié)CurveEstimation過程主要功能調(diào)用此過程可完成下列有關(guān)曲線擬合的功能:1、Linear:擬合直線方程(實(shí)際上與Linear過程的二元直線回歸相同,即Y=b0+b1X);2、Quadratic:擬合二次方程(Y=b0+b1X+b2X2);3、Compound:擬合復(fù)合曲線模型(Y=b0Xb1X);4、Growth:擬合等比級數(shù)曲線模型(Y=e(b0+b1X));5、Logarithmic:擬合對數(shù)方程(Y=b0+b1lnX)6、Cubic:擬合三次方程(Y=b0+b1X+b2X2+b3X3);7、S:擬合S形曲線(Y=e(b0+b1/X));8、Exponential:擬合指數(shù)方程(Y=b0eb1X);9、Inverse:數(shù)據(jù)按Y=b0+b1/X進(jìn)行變換;10、Power:擬合乘幕曲線模型(Y=b0Xb1);11、Logistic:擬合Logistic曲線模型(Y=1/(1/u+b0Xb1X)。實(shí)例操作[例8.2]某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(%)Y的資料如下,試擬合對數(shù)曲線。年齡(歲)錫克試驗(yàn)陰性率(%)657.176.090.993.096.795.696.2數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗(yàn)陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的CurveEstimation...項(xiàng),彈出CurveEstimation對話框(如圖8.5示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊A鈕使之進(jìn)入Dependent框,選x,點(diǎn)擊A鈕使之進(jìn)入Indepentdent(s)框;在Model框內(nèi)選擇所需的曲線模型,本例選擇Logarithmic模型(即對數(shù)曲線);選Plotmodels項(xiàng)要求繪制曲線擬合圖;點(diǎn)擊Save...鈕,彈出CurveEstimation:Save對話框,選擇Predictedvalue項(xiàng),要求在原始數(shù)據(jù)庫中保存根據(jù)對數(shù)方程求出的Y預(yù)測值,點(diǎn)擊Continue鈕返回CurveEstimation對話框,再點(diǎn)擊OK鈕即可。8.2.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)在以X為自變量、Y為應(yīng)變量,采用對數(shù)曲線擬合方法建立的方程,決定系數(shù)R2=0.913(接近于1),作擬合優(yōu)度檢驗(yàn),方差分析表明:F=52.32,P=0.001,擬合度很好,對數(shù)方程為:Y=61.3259+20.6704lnX。本例要求繪制曲線擬合圖,結(jié)果如圖8.6所示。圖8.6對數(shù)曲線擬合情形根據(jù)方程Y=61.3259+20.6704lnX,將原始數(shù)據(jù)X值代入,求得Y預(yù)測值(變量名為fit_l)存入數(shù)據(jù)庫中,參見圖8.7。圖8.7計(jì)算結(jié)果的保存第三節(jié)Logistic過程主要功能調(diào)用此過程可完成Logistic回歸的運(yùn)算。所謂Logistic回歸,是指應(yīng)變量為二級計(jì)分或二類評定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評定)的概率跟病人自身生理狀況和所患疾病的嚴(yán)重程度有關(guān);對某種疾病的易感性的概率(患病、不患病二類評定)與個(gè)體性別、年齡、免疫水平等有關(guān)。此類問題的解決均可借助邏輯回歸來完成。特別指出,本節(jié)介紹的Logistic過程,應(yīng)與日常所說的Logistic曲線模型(即S或倒S形曲線)相區(qū)別。用戶如果要擬合Logistic曲線模型,可調(diào)用本章第二節(jié)CurveEstimation過程,系統(tǒng)提供11種曲線模型,其中含有Logistic曲線模型(參見上節(jié))。在一般的多元回歸中,若以P(概率)為應(yīng)變量,則方程為P=bO+b1X1+b2X2+…+bkXk,但用該方程計(jì)算時(shí),常會(huì)出現(xiàn)P〉1或P〈0的不合理情形。為此,對P作對數(shù)單位轉(zhuǎn)換,即logitP=ln(P/1-P),于是,可得到Logistic回歸方程為:

ebO+blXl+b2X2+…+bkXk1+eb°+blXl+b2X2+…+bkXk8.3.2實(shí)例操作[例8.3]某醫(yī)師研究男性胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請通過Logistic回歸統(tǒng)計(jì)方法對主要影響因素進(jìn)行分析。無5911有6.04無6422無9.16無3611有&48無4231有5.36無4842有4.65無5012有12.848.3.2.1數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無輸入N),年齡為XI,手術(shù)創(chuàng)傷程度為X2,營養(yǎng)狀態(tài)為X3,術(shù)前預(yù)防性抗菌為X4(字符變量,有輸入Y、無輸入N),白細(xì)胞數(shù)為X5,癌腫病理分度為X6。按要求輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Logistic...項(xiàng),彈出LogisticRegression對話框(如圖8.8示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊A鈕使之進(jìn)入Dependent框,選xl、x2、x3、x4、x5和x6,點(diǎn)擊A鈕使之進(jìn)入Covariates框;點(diǎn)擊Method處的下拉按鈕,系統(tǒng)提供7種方法:1、Enter:所有自變量強(qiáng)制進(jìn)入回歸方程;2、Forward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;3、Forward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;4、Forward:Wald:作Wald概率統(tǒng)計(jì)法,向前逐步選擇自變量;5、Backward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;6、Backward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;7、Backward:Wald:作Wald概率統(tǒng)計(jì)法,向后逐步選擇自變量。本例選用Forward:Conditional法,以便選擇有主要作用的影響因素;點(diǎn)擊Options...鈕,彈出LogisticRegression:Options對話框,在Display框中選取Atlaststep項(xiàng),要求只顯示最終計(jì)算結(jié)果,點(diǎn)擊Continue鈕返回LogisticRegression對話框,再點(diǎn)擊OK鈕即可。8.3.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

系統(tǒng)先對字符變量進(jìn)行重新賦值,對于應(yīng)變量Y,回答是(Y)的賦值為0,回答否(X)的賦值為1;對于應(yīng)變量X4,回答是(Y)的賦值為-1,回答否(X)的賦值為1。

EndBlockNumber1PIN=.0500Limitsreached.EndBlockNumber1PIN=.0500Limitsreached.FinalEquationforBlock1Estimationterminatedatiterationnumber12becauseLogLikelihooddecreasedbylessthan.01percent.-2LogLikelihood3.819GoodnessofFit3.000Overall93.33%Overall93.33%canceChi-SquaredfSignifiModelChi-Square15.2762.0005Improvement6.7661.0093ClassificationTableforYPredictedynPercentCorrectyInObserved++——+yy14I1I80.00%+——+——+nnI0I10I100.00%+——+——+VariablesintheEquation結(jié)果表明,第一步自變量X3入選,方程分類能力達(dá)80.00%;第二步自變量X6入選,方程分類能力達(dá)93.33%(參見結(jié)果中的分類分析表);方程有效性經(jīng)x2檢驗(yàn),x2=15.276,P=0.0005。Logistic回歸的分類概率方程為:e123.4053-30.5171X3-10.2797X6P=——————————————1+e123.4053-30.5171X3-10.2797X6根據(jù)該方程,若一胃癌患者營養(yǎng)狀態(tài)評分(X3)為3,癌腫病理分度(X6)為9,則其P=4.5X10-2廷0,這意味著術(shù)后將發(fā)生院內(nèi)感染;另一胃癌患者營養(yǎng)狀態(tài)評分(X3)為1,癌腫病理分度(X6)為4,則其P=0.98105~l,這意味著術(shù)后將不會(huì)發(fā)生院內(nèi)感染。第四節(jié)Probit過程主要功能調(diào)用此過程可完成劑量-效應(yīng)關(guān)系的分析。通過概率單位使劑量-效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值。實(shí)例操作[例8.4]研究抗瘧藥環(huán)氯胍對小白鼠的毒性,試驗(yàn)結(jié)果如下表所示。試計(jì)算環(huán)氯胍的半數(shù)致死劑量。數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:劑量為DOSE、試驗(yàn)動(dòng)物數(shù)為OBSERVE、死亡動(dòng)物數(shù)為DEATH。然后輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Probit...項(xiàng),彈出ProbitAnalysis對話框(如圖8.9示)。從對話框左側(cè)的變量列表中選death,點(diǎn)擊A鈕使之進(jìn)入ResponseFrequency框;選observe,點(diǎn)擊A鈕使之進(jìn)入TotalObserved框;選dose,點(diǎn)擊A鈕使之進(jìn)入Covariate(s)框,并下拉Transform菜單,選Logbase10項(xiàng)(即要求對劑量進(jìn)行以10為底的對數(shù)轉(zhuǎn)換)。系統(tǒng)在Model欄中提供兩種模型,一是概率單位模型(Probit),另一是比數(shù)比自然對數(shù)模型(Logit)。本例選用概率單位模型。點(diǎn)擊Options...鈕,彈出ProbitAnalysis:Options對話框,在NaturalResponseRate欄選Calculatefromdata項(xiàng),要求計(jì)算各劑量組的實(shí)際反應(yīng)率。之后點(diǎn)擊Continue鈕返回ProbitAnalysis對話框,再點(diǎn)擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):系統(tǒng)首先顯示,共有7組原始數(shù)據(jù)采概率單位模型進(jìn)行分析?;貧w方程的各參數(shù)在經(jīng)過14次疊代運(yùn)算后確定,即PROBIT=5.95215-4.66313X。該方程擬合優(yōu)度X2檢驗(yàn)結(jié)果,X2=0.833,P=0.934,擬合良好。

MODELInformationONLYNormalSigmoidisrequested.NaturalResponseratetobeestimatedCONTROLgroupisnotprovided.Parameterestimatesconvergedafter14iterations.Optimalsolutionfound.ParameterEstimates(PROBITmodel:(PROBIT(p))=Intercept+BX):ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.39832ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.398322.481802.48180InterceptStandardInterceptStandardErrorIntercept/S.E.ErrorIntercept/S.E.-2.12017-4.663132.19942-2.12017-4.663132.19942EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4P=.934接著,系統(tǒng)顯示劑量對數(shù)值(DOSE)、實(shí)際觀察例數(shù)(NumberofSubjects)、試驗(yàn)動(dòng)物反應(yīng)數(shù)(ObservedResponses)、預(yù)期反應(yīng)數(shù)(ExpectedResponses)、殘差(Residual)和效應(yīng)的概率(Prob)。之后,顯示各效應(yīng)概率水平的劑量值及其95%可信區(qū)間值,按本例要求,環(huán)氯胍的半數(shù)致死劑量(即Prob=0.50時(shí))為6.07347,其95%可信區(qū)間為1.86305—7.54282。

.427.48745.7038.012.011.688.312.30757.6012.02.01.682.318.14016.485.0.0.171-.171.03413ConfidenceLimitsforEffectiveDOSE95%ConfidenceLimitsProbDOSELowerUpper.012.46942.027524.27407.022.74406.045344.54351.032.93394.062234.72430.043.08539.078954.86574.053.21433.095804.98445.063.32832.112945.08821.073.43158.130475.18134.083.52676.148455.26651.093.61561.166945.34550.103.69937.185975.41954.154.06733.290605.74092.204.38570.413956.01572.254.67862.560216.26792

.304.95831.734366.51010.355.23239.942616.75084.405.506461.192866.99754.455.785281.495297.25814.506.073471.863057.54282.556.376002.312997.86673.606.698862.865878.25522.657.049743.544388.75565.707.439434.363949.46545.757.884165.3068810.59748.80&410756.2906912.60617.859.069107.2151416.40564.909.97116&0941224.20725.9110.202168.2776026.73478.9210.459198.4689229.82525.9310.74928&6717733.68627.9411.082788.8912838.64769.9511.475809.1351145.27000.9611.955389.4157254.59759.9712.572529.7559068.85554.9813.4425010.2057793.92908.9914.9375110.92195153.73112最后,系統(tǒng)輸出以劑量對數(shù)值為自變量X、以概率單位為應(yīng)變量Y的回歸直線散點(diǎn)圖,從圖中各點(diǎn)的分布狀態(tài)亦可看出,回歸直線的擬合程度是很好的。圖8.10劑量-效應(yīng)關(guān)系回歸直線散點(diǎn)圖第五節(jié)Nonlinear過程主要功能調(diào)用此過程可完成非線性回歸的運(yùn)算。所謂非線性回歸,即為曲線型的回歸分析一些曲線模型我們已在本章第二節(jié)中述及。但在醫(yī)學(xué)研究中經(jīng),還經(jīng)常會(huì)遇到除本章第二節(jié)中述及的曲線模型,對此,SPSS提供Nonlinear過程讓用戶根據(jù)實(shí)際需要,建立各種曲線模型以用于研究變量間的相互關(guān)系。在醫(yī)學(xué)中,如細(xì)菌繁殖與培養(yǎng)時(shí)間關(guān)系的研究即可借助Nonlinear過程完成。下面一些曲線模型是在論文中較常見的,提供給用戶應(yīng)用時(shí)作參考:模型名稱模型表達(dá)式Asympt.Regression1Y=bl+b2Xexp(b3x)Asympt.Regression2Y=bl-(b2X(b3x))DensityY=(bl+b2XX)(-l/b3)

DensityGaussexp(-b2XXGaussexp(-b2XX2))Gompertzexp(-b3XX))Johnson-SchumacherLogModifiedLog-LogisticMetcherlichLawofDim.Ret.Y=MichaelisMentenMorgan-Mercer-FlorinPeal-ReedXX+b4XX2+b5XX3)))RatioofCubicsXX3)/(b5XX3)RatioofQuadraticsRichardsX))(1/b4))VerhulstVonBertalanffyXX))(1/(1-b4))WeibullXb4)YieldDensityY=b1Xexp(-b2XY=b1Xexp(-b2/(X+b3))Y=(b1+b3XX)b2Y=b1-ln(1+b2Xexp(-b3XX))b1+b2Xexp(-b3XX)Y=b1XX/(X+b2)Y=(b1Xb2+b3XXb4)/(b2+Xb4)=b1/(1+b2Xexp(-(b3Y=(b1+b2XX+b3XX2+b4Y=(b1+b2XX+b3XX2)/(b4XX2)Y=b1/((1+b3Xexp(-b2XY=b1/(1+b3Xexp(-b2XX))Y=(b1(1-b4)-b2Xexp(-b3=b1-b2Xexp(-b3XY=(b1+b2XX+b3XX2)(-1)8.5.2實(shí)例操作[例8.5]選取某地某年壽命表中40-80歲各年齡組的尚存人數(shù)資料如下表請就該資料試擬合Gompertz曲線(Y=blXb2?3x))。

年齡組(歲)年齡簡化值(X)尚存人數(shù)(Y)404550556065707580012345678812777925876532728506756859911508003932528074數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:年齡簡化值為X,尚存人數(shù)為Y。輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Nonlinear...項(xiàng),彈出NonlinearRegression對話框(如圖8.11示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊鈕使之進(jìn)入Dependent框。由于SPSS系統(tǒng)尚無法智能地自動(dòng)擬合用戶所需的曲線,故一方面要求用戶估計(jì)方程中常數(shù)項(xiàng)和各系數(shù)項(xiàng)進(jìn)行疊代運(yùn)算的起始值,另一方面要求用戶列出方程模型。對此,可首先點(diǎn)擊NonlinearRegression對話框的Parameters...鈕,彈出NonlinearRegression:Parameters對話框(圖8.12),在Name處定義系數(shù)名,在StartValue處輸入起始值(這項(xiàng)工作是十分重要的,否則系統(tǒng)可能無法運(yùn)算,甚至?xí)虔B代次數(shù)過大導(dǎo)致SPSS系統(tǒng)的崩潰),本例定義bl=8500、b2=l、b3=1.5,每定義一個(gè)系數(shù),即點(diǎn)擊Add鈕加以確定;若在后面的運(yùn)算中出錯(cuò),則還可修改系數(shù)項(xiàng)的起始值,修改后點(diǎn)擊Change鈕加以確定;然后點(diǎn)擊Continue鈕返回NonlinearRegression對話框。在ModelExpression處寫出曲線方程表達(dá)式,用戶可借助系統(tǒng)提供的數(shù)碼盤和函數(shù)列表寫出方程。本例要求計(jì)算根據(jù)回歸方程求出的預(yù)測值,可點(diǎn)擊Save鈕,在NonlinearRegression:SaveNewVariables對話框中選Predictedvalue項(xiàng)。最后點(diǎn)擊OK鈕即可。8.12系數(shù)項(xiàng)定義對話框結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

SSB1B2B31283271934638500.000001.000000001.500000001.11433343480080175.3427.7392405511.5000000021433343480080175.3427.7392405511.500000002.13.8505E+11194572.013.006502086-.216290772.2800135019.683185.8046.8429947971.198524303800135019.683185.8046.8429947971.198524303.11285737878881201.83221.015792671.429277913.2550558275.185774.2528.8504931971.214331274550558275.185774.2528.8504931971.214331274.1205793117.690637.3496.8594292121.252769325205793117.690637.3496.8594292121.252769325.149937888.6592251.6832.9059927001.33942536649937888.6592251.6832.9059927001.339425366.1438492814.383503.5809.9664210431.463656026.214165723.6591420.4568.9091126941.36083115714165723.6591420.4568.9091126941.360831157.18227661.24889440.0706.9234633151.3889894088227661.24889440.0706.9234633151.38898940&117416856.8685916.5498.9482999861.45005498&24600297.86688467.6768.9302963971.4079772494600297.86688467.6768.9302963971.407977249.12761649.68586538.9357.9437367071.44419408102761649.68586538.9357.9437367071.4441940810.1644830.076585633.9620.9497149171.4689666011644830.076585633.9620.9497149171.4689666011.1475140.368485680.9561.9493255671.4689804412475140.368485680.9561.9493255671.4689804412.1475135.426585679.2273.9493387131.46903683131.46903683475135.426585679.2273.94933871313.1475135.426285679.2477.9493385901.46903640Runstoppedafter30modelevaluationsand13derivativeevaluations.IterationshavebeenstoppedbecausetherelativereductionbetweensuccessiveresidualsumsofsquaresisatmostSSCON=1.000E—08NonlinearRegressionSummaryStatisticsDependentVariableYSourceSquareDFSumofSquaresMeanRegression09.2337121583327.6123738611Residual9.237716475135.426247918UncorrectedTotal937122058463.0(CorrectedTotal)82823635793.56Rsquared=1—ResidualSS/CorrectedSS=.99983Asymptotic95%AsymptoticConfidenceIntervalParameterEstimateStd.

經(jīng)30次疊代運(yùn)算后,相鄰兩次的方程剩余均方差值不大于規(guī)定的1X10-8,滿足要求;回歸方程的決定系數(shù)R2=0.99983,Gompertz曲線方程為:Y=85679.247671X0.94933859(1.469036403X)本例要求計(jì)算預(yù)測值,系統(tǒng)將結(jié)果存入原始數(shù)據(jù)庫中(圖8.13),系統(tǒng)以pred_作為預(yù)測值的變量名。由結(jié)果可見,預(yù)測值與實(shí)際值十分接近。圖8.13原始數(shù)據(jù)及其預(yù)測值多元回歸分析在大多數(shù)的實(shí)際問題中,影響因變量的因素不是一個(gè)而是多個(gè),我們稱這類回問題為多元回歸分析。可以建立變量y與各自變量xj(j=1,2,3,...,n)之間的多元線性回歸模型:其中:b0是回歸常數(shù);bk(k=1,2,3,…,n)是回歸參數(shù);e是隨機(jī)誤差。多元回歸在病蟲預(yù)報(bào)中的應(yīng)用實(shí)例:某地區(qū)病蟲測報(bào)站用相關(guān)系數(shù)法選取了以下4個(gè)預(yù)報(bào)因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計(jì)落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報(bào)一代粘蟲幼蟲發(fā)生量y(頭/m2)。分級別數(shù)值列成表2-1。預(yù)報(bào)量y:每平方米幼蟲0~10頭為1級,11~20頭為2級,21~40頭為3級,40頭以上為4級。預(yù)報(bào)因子:x1誘蛾量0~300頭為I級,301~600頭為2級,601~1000頭為3級,1000頭以上為4級;x2卵量0~150塊為1級,151~300塊為2級,301~550塊為3級,550塊以上為4級;x3降水量0~10毫米為1級,10.1~13.2毫米為2級,13.3~17.0毫米為3級,17.0毫米以上為4級;x4雨日0~2天為級,3~4天為2級,5天為3級,6天或6天以上為4級。表2-1X1x2x3x4y年蛾量級別卵量級別降水量級別雨日級別幼蟲密度級別19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171

197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112數(shù)據(jù)保存在“DATA6-5SAV〃文件中。1)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建''年份〃、''蛾量〃、“卵量〃、“降水量〃、“雨日〃和''幼蟲密度〃變量,并輸入數(shù)據(jù)。再創(chuàng)建蛾量、卵量、降水量、雨日和幼蟲密度的分級變量'x1〃、“x2”、“x3〃、“x4”和“y〃,它們對應(yīng)的分級數(shù)可以在SPSS數(shù)據(jù)編輯窗口中通過計(jì)算產(chǎn)生。編輯后的數(shù)據(jù)顯示如圖2-1。圖2-1或者打開已存在的數(shù)據(jù)文件“DATA6-5.SAV〃。2)啟動(dòng)線性回歸過程單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項(xiàng),將打開如圖2-2所示的線性回歸過程窗口。圖2-2線性回歸對話窗口設(shè)置分析變量設(shè)置因變量:用鼠標(biāo)選中左邊變量列表中的''幼蟲密度[y]〃變量,然后點(diǎn)擊“Dependent”欄左邊的向右拉按鈕,該變量就移至『'Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“蛾量[x1]〃、“卵量[x2]〃、“降水量[x3]〃、“雨日[x4]〃變量,選移到“Independent(S)"自變量顯示欄里。設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標(biāo)簽變量:選擇“年份〃為標(biāo)簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置?;貧w方式本例子中的4個(gè)預(yù)報(bào)因子變量是經(jīng)過相關(guān)系數(shù)法選取出來的,在回歸分析時(shí)不做篩選。因此在'Method〃框中選中“Enter〃選項(xiàng),建立全回歸模型。5)設(shè)置輸出統(tǒng)計(jì)量單擊“Statistics〃按鈕,將打開如圖2-3所示的對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項(xiàng)的意義分別為圖2-3“Statistics"對話框①“RegressionCoefficients”回歸系數(shù)選項(xiàng):“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量“Confideneeinterval"回歸系數(shù)的95%置信區(qū)間“Covariancematrix”回歸系數(shù)的方差-協(xié)方差矩陣本例子選擇“Estimates〃輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量。②“Residuals”殘差選項(xiàng):“Durbin-Watson"Durbin-Watson檢驗(yàn)“CasewisediagnoStic”輸出滿足選擇條件的觀測量的相關(guān)信息。選擇該項(xiàng),下面兩項(xiàng)處于可選狀態(tài):“Outliersoutsidestandarddeviations"選擇標(biāo)準(zhǔn)化殘差的絕對值大于輸入值的觀測量;“Allcases〃選擇所有觀測量本例子都不選。③其它輸入選項(xiàng)“Modelfit〃輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、估計(jì)標(biāo)準(zhǔn)誤、ANOVA表。“Rsquaredchange”輸出由于加入和剔除變量而引起的復(fù)相關(guān)系數(shù)平方的變化?!癉escriptives”輸出變量矩陣、標(biāo)準(zhǔn)差和相關(guān)系數(shù)單側(cè)顯著水平矩陣。“Partandpartialcorrelation”相關(guān)系數(shù)和偏相關(guān)系數(shù)“Collinearitydiagnosties"顯示單個(gè)變量和共線性分析的公差。本例子選擇“Modelfit〃項(xiàng)。6)繪圖選項(xiàng)在主對話框單擊“Plots〃按鈕,將打開如圖2-4所示的對話框窗口。該對話框用于設(shè)置要繪制的圖形的參數(shù)。圖中的“X〃和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。圖2-4“Plots”繪圖對話框窗口左上框中各項(xiàng)的意義分別為:“DEPENDNT”因變量?!癦PRED〃標(biāo)準(zhǔn)化預(yù)測值?!癦RESID〃標(biāo)準(zhǔn)化殘差?!癉RESID〃刪除殘差?!癆DJPRED〃調(diào)節(jié)預(yù)測值?!癝RESID”學(xué)生氏化殘差?!癝DRESID”學(xué)生氏化刪除殘差。“StandardizedResidualPlots”設(shè)置各變量的標(biāo)準(zhǔn)化殘差圖形輸出。其中共包含兩個(gè)選項(xiàng):“Histogram”用直方圖顯示標(biāo)準(zhǔn)化殘差?!癗ormalprobabilityplots”比較標(biāo)準(zhǔn)化殘差與正態(tài)殘差的分布示意圖。“Produceallpartialplot”偏殘差圖。對每一個(gè)自變量生成其殘差對因變量殘差的散點(diǎn)圖。本例子不作繪圖,不選擇。7)保存分析數(shù)據(jù)的選項(xiàng)在主對話框里單擊“Save!”鈕,將打開如圖2-5所示的對話框。圖2-5“Save”對話框①“PredictedValudS”測值欄選項(xiàng):Unstandardized非標(biāo)準(zhǔn)化預(yù)測值。就會(huì)在當(dāng)前數(shù)據(jù)文件中新添加一個(gè)以字符“PRE_”開頭命名的變量,存放根據(jù)回歸模型擬合的預(yù)測值。Standardized標(biāo)準(zhǔn)化預(yù)測值A(chǔ)djusted調(diào)整后預(yù)測值S.E.ofmeanpredictions預(yù)測值的標(biāo)準(zhǔn)誤。本例選中“Unstandardize非標(biāo)準(zhǔn)化預(yù)測值。②“Distance距?離欄選項(xiàng):Mahalanobis:距離。Cook's”:Cc距離。Leveragevalues:杠桿值。③“PredictionInterva預(yù)測區(qū)間選項(xiàng):Mean:區(qū)間的中心位置。Individual:觀測量上限和下限的預(yù)測區(qū)間。在當(dāng)前數(shù)據(jù)文件中新添加一個(gè)以字符“LICI_”頭命名的變量,存放預(yù)測區(qū)間下限值;以字符“UICI_”開頭命名的變量,存放預(yù)測區(qū)間上限值。ConfidenceInterval:置信度。本例不選?!癝avetoNewFile”保存為新文件:選中"Coefficientstatistics”項(xiàng)將回歸系數(shù)保存到指定的文件中。本例不選。“ExportmodelinformationtoXMLfile”導(dǎo)出統(tǒng)計(jì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論