逐步回歸解析總結(jié)計(jì)劃實(shí)例_第1頁
逐步回歸解析總結(jié)計(jì)劃實(shí)例_第2頁
逐步回歸解析總結(jié)計(jì)劃實(shí)例_第3頁
逐步回歸解析總結(jié)計(jì)劃實(shí)例_第4頁
逐步回歸解析總結(jié)計(jì)劃實(shí)例_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

精選文檔精選文檔PAGE17精選文檔v1.0可編寫可更正

逐漸回歸剖析

在自變量很多時(shí),此中有的要素可能對應(yīng)變量的影響不是很大,并且x之間可能不完

全互相獨(dú)立的,可能有各樣互作關(guān)系。在這類狀況下可用逐漸回歸剖析,進(jìn)行x因子的篩

選,這樣建立的多元回歸模型展望見效會(huì)更較好。

逐漸回歸剖析,第一要建立因變量y與自變量x之間的總回歸方程,再對總的方程及

每—個(gè)自變量進(jìn)行假設(shè)檢驗(yàn)。當(dāng)總的方程不明顯時(shí),表示該多元回歸方程線性關(guān)系不能夠立;

而當(dāng)某—個(gè)自變量對y影響不明顯時(shí),應(yīng)該把它剔除,重新建立不包括該因子的多元回歸

方程。精選出有明顯影響的因子作為自變量,并建立“最優(yōu)”回歸方程。

回歸方程包括的自變量越多,回歸平方和越大,節(jié)余的平方和越小,節(jié)余均方也隨之

較小,展望值的偏差也愈小,模擬的見效愈好。但是方程中的變量過多,預(yù)告工作量就會(huì)

越大,此中有些相關(guān)性不明顯的預(yù)告因子會(huì)影響展望的見效。所以在多元回歸模型中,選擇

適合的變量數(shù)量特別重要。

逐漸回歸在病蟲預(yù)告中的應(yīng)用實(shí)例:

以陜西省長武地區(qū)1984~1995年的煙蚜傳毒病情資料、相關(guān)蟲情平易象資料為例(數(shù)

據(jù)見),建立蚜傳病毒病情指數(shù)的逐漸回歸模型,說明逐漸回歸剖析的詳盡步驟。影響蚜傳

病毒病情指數(shù)的蟲情因子平易象因子一共有21個(gè),經(jīng)過逐漸回歸,從中選出對病情指數(shù)影

響明顯的因子,從而建立相應(yīng)的模型。對1984~1995年的病情指數(shù)進(jìn)行回檢,此后對

1996~1998年的病情進(jìn)行預(yù)告,再檢驗(yàn)預(yù)告的見效。

變量說明以下:

x11:5月份均溫

y:歷年病情指數(shù)

1v1.0可編寫可更正

x1:前年冬天油菜越冬時(shí)的蚜量

x2:前年冬天極端氣溫

x3:5月份最高氣溫

x4:5月份最低氣溫

x5:3~5月份降水量

x6:4~6月份降水量

x7:3~5月份均溫

x8:4~6月份均溫

x9:4月份降水量

x10:4月份均溫

1)準(zhǔn)備剖析數(shù)據(jù)

(頭/株)x12:5月份降水量

x13:6月份均溫

x14:6月份降水量

x15:第一次蚜遷巔峰期百株煙草

有翅蚜量

x16:5月份油菜百株蚜量

x17:7月份降水量

x18:8月份降水量

x19:7月份均溫

x20:8月份均溫

x21:元月均溫

在SPSS數(shù)據(jù)編寫窗口中,用“File→Open→Data”命令,打開“”數(shù)據(jù)文件。數(shù)據(jù)工作區(qū)以以以以下圖3-1顯示。

2v1.0可編寫可更正

圖3-1

2)啟動(dòng)線性回歸過程

單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項(xiàng),將打開如圖3-2

所示的線性回歸過程窗口。

圖3-2線性回歸對話窗口

3v1.0可編寫可更正

設(shè)置剖析變量

設(shè)置因變量:將左側(cè)變量列表中的“y”變量,選入到“Dependent”因變量顯示欄里。

設(shè)置自變量:將左側(cè)變量列表中的“x1”~“x21”變量,所有選移到

“Independent(S)”自變量欄里。

設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。

選擇標(biāo)簽變量:選擇“年份”為標(biāo)簽變量。

選擇加權(quán)變量:本例子沒有加權(quán)變量,所以不作任何設(shè)置。

4)回歸方式

在“Method”剖析方法框中選中“Stepwise”逐漸剖析方法。該方法是依據(jù)

“Options”選擇對話框中明顯性檢驗(yàn)(F)的設(shè)置,在方程中進(jìn)入或剔除單個(gè)變量,直到所

建立的方程中不再含有可加入或可剔除的變量為止。設(shè)置后的對話窗口如圖3-3。

4v1.0可編寫可更正

圖3-3

設(shè)置變量檢驗(yàn)水平

在圖6-15主對話框里單擊“Options”按鈕,將打開如圖3-4所示的對話框。

圖3-4

5v1.0可編寫可更正

“SteppingMethodCriteria”框里的設(shè)置用于逐漸回歸剖析的選擇標(biāo)準(zhǔn)。

此中“UseprobabilityofF”選項(xiàng),供給設(shè)置明顯性F檢驗(yàn)的概率。假如一個(gè)變量

的F檢驗(yàn)概率小于或等于進(jìn)入“Entry”欄里設(shè)置的值,那么這個(gè)變量將被選入回歸方程中;當(dāng)回歸方程中變量的F值檢驗(yàn)概率大于剔除“Removal”欄里設(shè)置的值,則該變量將從回歸

方程中被剔除。所以可知,設(shè)置F檢驗(yàn)概率時(shí),應(yīng)使進(jìn)入值小于剔除值。

“UesFvalue”選項(xiàng),供給設(shè)置明顯性F檢驗(yàn)的分布值。假如一個(gè)變量的F值大于

所設(shè)置的進(jìn)入值(Entry),那么這個(gè)變量將被選入回歸方程中;當(dāng)回歸方程中變量的F值

小于設(shè)置的剔除值(Removal),則該變量將從回歸方程中被剔除。同時(shí),設(shè)置F分布值時(shí),

應(yīng)該使進(jìn)入值大于剔除值。

本例子使用明顯性F檢驗(yàn)的概率,在進(jìn)入“Entry”欄里設(shè)置為“”,在剔除

“Removal”欄里設(shè)置為“”(剔除的概率值應(yīng)比進(jìn)入的值大),如圖6-17所示。

圖6-17窗口中的其他設(shè)置參照一元回歸設(shè)置。

6)設(shè)置輸出統(tǒng)計(jì)量

在主對話圖3-2窗口中,單擊“Statistics”按鈕,將打開如圖6-18所示的對話框。

該對話框用于設(shè)置相關(guān)參數(shù)。此中各項(xiàng)的意義分別為:

6v1.0可編寫可更正

圖3-5“Statistics”對話框

“RegressionCoefficients”回歸系數(shù)選項(xiàng):“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量。

“Confidenceinterval”回歸系數(shù)的95%置信區(qū)間。

“Covariancematrix”回歸系數(shù)的方差-協(xié)方差矩陣。

本例子選擇“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量。

②“Residuals”殘差選項(xiàng):

“Durbin-Watson”Durbin-Watson檢驗(yàn)。

“Casewisediagnostic”輸出滿足選擇條件的觀察量的相關(guān)信息。選擇該項(xiàng),下邊兩項(xiàng)處于可選狀態(tài):

“Outliersoutsidestandarddeviations”選擇標(biāo)準(zhǔn)化殘差

的絕對值大于輸入值的觀察量;

“Allcases”選擇所有觀察量。

7v1.0可編寫可更正

本例子都不選。

③其他輸當(dāng)選項(xiàng)

“Modelfit”輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、預(yù)計(jì)標(biāo)準(zhǔn)誤、ANOVA表。

“Rsquaredchange”輸出因?yàn)榧尤牒吞蕹兞慷鸬膹?fù)相關(guān)系數(shù)平方

的變化。

“Descriptives”輸出變量矩陣、標(biāo)準(zhǔn)差和相關(guān)系數(shù)單側(cè)明顯性水平矩

陣。

“Partandpartialcorrelation”相關(guān)系數(shù)和偏相關(guān)系數(shù)。

“Collinearitydiagnostics”顯示單個(gè)變量和共線性剖析的公差。本例子選擇“Modelfit”項(xiàng)。

7)繪圖選項(xiàng)

在主對話框單擊“Plots”按鈕,將打開如圖3-6所示的對話框窗口。該對話框用于設(shè)

置要繪制的圖形的參數(shù)。圖中的“X”和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。

8v1.0可編寫可更正

圖3-6“Plots”繪圖對話框窗口

左上框中各項(xiàng)的意義分別為:

“DEPENDNT”因變量?!癦PRED”標(biāo)準(zhǔn)化展望值。“ZRESID”標(biāo)準(zhǔn)化殘差。“DRESID”刪除殘差。

“ADJPRED”調(diào)理展望值?!癝RESID”學(xué)生氏化殘差。

“SDRESID”學(xué)生氏化刪除殘差。

“StandardizedResidualPlots”設(shè)置各變量的標(biāo)準(zhǔn)化殘差圖形輸出。此中共包括兩個(gè)選項(xiàng):

“Histogram”用直方圖顯示標(biāo)準(zhǔn)化殘差。

“Normalprobabilityplots”比較標(biāo)準(zhǔn)化殘差與正態(tài)殘差的分布示

企圖。

“Produceallpartialplot”偏殘差圖。對每一個(gè)自變量生成其殘差對因變量殘差的散點(diǎn)圖。

本例子不作繪圖,不選擇。

保存剖析數(shù)據(jù)的選項(xiàng)

在主對話框里單擊“Save”按鈕,將打開如圖3-7所示的對話框。

9v1.0可編寫可更正

圖3-7“Save”對話框

①“PredictedValues”展望值欄選項(xiàng):

Unstandardized非標(biāo)準(zhǔn)化展望值。就會(huì)在當(dāng)前數(shù)據(jù)文件中新增加一個(gè)以字符

“PRE”開頭命名的變量,存放依據(jù)回

歸模型擬合的展望值。

Standardized標(biāo)準(zhǔn)化展望值。

Adjusted調(diào)整后展望值。

.ofmeanpredictions展望值的標(biāo)準(zhǔn)誤。

本例選中“Unstandardized”非標(biāo)準(zhǔn)化展望值。

②“Distances”距離欄選項(xiàng):

10v1.0可編寫可更正

Mahalanobis:距離。

Cook’s”:Cook距離。

Leveragevalues:杠桿值。

③“PredictionIntervals”展望區(qū)間選項(xiàng):

Mean:區(qū)間的中心地點(diǎn)。

Individual:觀察量上限和下限的展望區(qū)間。在當(dāng)前數(shù)據(jù)文件中新添

加一個(gè)以字符“LICI_”開頭命名的變量,存放

展望區(qū)間下限值;以字符“UICI_”開

頭命名的變量,存放展望區(qū)間上限值。

ConfidenceInterval:置信度。

本例不選。

④“SavetoNewFile”保存為新文件:

選中“Coefficientstatistics”項(xiàng)將回歸系數(shù)保存到指定的文件中。本例不選。

⑤“ExportmodelinformationtoXMLfile”導(dǎo)出統(tǒng)計(jì)過程中的回歸模型信息到

指定文件。本例不選。

⑥“Residuals”保存殘差選項(xiàng):

“Unstandardized”非標(biāo)準(zhǔn)化殘差。

“Standardized”標(biāo)準(zhǔn)化殘差。“Studentized”學(xué)生氏化殘差。11v1.0可編寫可更正

“Deleted”刪除殘差。

“Studentizeddeleted”學(xué)生氏化刪除殘差。

本例不選。

⑦“InfluenceStatistics”統(tǒng)計(jì)量的影響。

“DfBeta(s)”刪除一個(gè)特定的觀察值所引起的回歸系數(shù)的變化。

“StandardizedDfBeta(s)”標(biāo)準(zhǔn)化的DfBeta值。

“DiFit”刪除一個(gè)特定的觀察值所引起的展望值的變化。

“StandardizedDiFit”標(biāo)準(zhǔn)化的DiFit值。

“Covarianceratio”刪除一個(gè)觀察值后的協(xié)方差矩隈的行列式和帶有所有觀察值的協(xié)方差矩陣的行列式的比率。

本例子不保存任何剖析變量,不選擇。

9)提交執(zhí)行

在主對話框里單擊“OK”,提交執(zhí)行,結(jié)果將顯示在輸出窗口中。主要結(jié)果見表6-10

至表6-13。

結(jié)果剖析

主要結(jié)果:

12v1.0可編寫可更正

表6-10是逐漸回歸每一步進(jìn)入或剔除回歸模型中的變量狀況。

表6-11是逐漸回歸每一步的回歸模型的統(tǒng)計(jì)量:R是相關(guān)系數(shù);RSquare相關(guān)系數(shù)

的平方,又稱判斷系數(shù),判斷線性回歸的擬合程度:用來說明用自變量解說因變量變異的程

度(所占比率);AdjustedRSquare調(diào)整后的判斷系數(shù);Std.ErroroftheEstimate估

計(jì)標(biāo)準(zhǔn)偏差。

13v1.0可編寫可更正

表6-12是逐漸回歸每一步的回歸模型的方差剖析,F(xiàn)值為,明顯性概率是,表示回歸

極明顯。

14v1.0可編寫可更正

表6-13是逐漸回歸每一步的回歸方程系數(shù)表。剖析:

建立回歸模型:

依據(jù)多元回歸模型:

從6-13中看出,過程一共運(yùn)轉(zhuǎn)了四步,最后一步以就是表中的第4步的計(jì)算結(jié)果得知:

21個(gè)變量中只進(jìn)入了4個(gè)變量x15、x4、x7和x5。

把表6-13中“非標(biāo)準(zhǔn)化回歸系數(shù)”欄目中的“B”列數(shù)據(jù)代入多元回歸模型獲得預(yù)告

方程:

展望值的標(biāo)準(zhǔn)差可用節(jié)余標(biāo)準(zhǔn)差預(yù)計(jì):

回歸方程的明顯性檢驗(yàn):

從表6-12方差剖析表第4模型中得知:F統(tǒng)計(jì)量為,系統(tǒng)自動(dòng)檢驗(yàn)的明顯性水平為(非

常?。?。

F,4,7)值為。所以回歸方程相關(guān)特別特別明顯。

由回歸方程式能夠看出,在陜西長武煙草蚜傳病毒病8月份的病情指數(shù)(y)與x4(5月x(第一次蚜遷巔峰期百株煙草有翅蚜量)呈明顯正相關(guān),而與x5(3~5月份份最低氣溫)、15降水量)和x7(3~5月份均溫)呈明顯負(fù)相關(guān)。

經(jīng)過大田檢查結(jié)果表示,煙草蚜傳病毒病發(fā)生與蚜蟲的遷飛有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論