




已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
應用數(shù)理統(tǒng)計多元線性回歸分析(第一次作業(yè))學院:機械工程及自動化學院姓名: 學號: 2014年12月逐步回歸法在AMHS物流仿真結果中的應用摘要:本文針對自動化物料搬運系統(tǒng) (Automatic Material Handling System, AMHS)的仿真結果,根據(jù)逐步回歸法,使用軟件IBM SPSS Statistics 20,對仿真數(shù)據(jù)進行分析處理,得到多元線性回歸方程,建立了工件年產量箱數(shù)與EMS數(shù)量、周轉箱交換周期以及AGC物料交換服務水平之間的數(shù)學模型,并對影響年產量箱數(shù)的顯著性因素進行了分析,介紹了基本假設檢驗的情況。關鍵詞:逐步回歸;殘差;SPSS;AMHS;物流仿真目 錄1、引言12、逐步回歸法原理43、模型建立53.1 確定自變量和因變量53.2 分析數(shù)據(jù)準備63.3 逐步回歸分析74、結果輸出及分析84.1 輸入移去的變量84.2 模型匯總94.3 方差分析94.4 回歸系數(shù)104.5 已排除的變量114.6 殘差統(tǒng)計量114.7 殘差分布直方圖和觀測量累計概率P-P圖125、異常情況說明135.1 異方差檢驗135.2 殘差的獨立性檢驗145.3 多重共線性檢驗156、結論15參考文獻171、 引言回歸被用于研究可以測量的變量之間的關系,線性回歸則被用于研究一類特殊的關系,即可用直線或多維的直線描述的關系。這一技術被用于幾乎所有的研究領域,包括社會科學、物理、生物、科技、經濟和人文科學。逐步回歸是在剔除自變量間相互作用、相互影響的前提下,計算各個自變量x與因變量y之間的相關性,并在此基礎上建立對因變量y有最大影響的變量子集的回歸方程。SPSS(Statistical Package for the Social Science社會科學統(tǒng)計軟件包)是世界著名的統(tǒng)計軟件之一,目前SPSS公司已將它的英文名稱更改為Statistical Product and Service Solution,意為“統(tǒng)計產品與服務解決方案”。SPSS軟件不僅具有包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等在內的基本統(tǒng)計功能,而且用它處理正交試驗設計中的數(shù)據(jù)程序簡單,分析結果明了?;谝陨蟽?yōu)點,SPSS已經廣泛應用于自然科學、社會科學中,其中涉及的領域包括工程技術、應用數(shù)學、經濟學、商業(yè)、金融等等。本文研究內容主要來源于“慶安集團基于物聯(lián)網(wǎng)技術的航空柔性精益制造系統(tǒng)”,在慶安集團新建的320廠房建立自動化物料搬運系統(tǒng)(AMHS),使用生產仿真軟件EM-Plant對該系統(tǒng)建模并仿真,設計實驗因子及各水平如表11,則共有3*4*6=72組實驗結果,如表所示。為方便描述,將各因子定義為:X1表示AGC物料交換服務水平,X2表示周轉箱交換周期,X3表示EMS數(shù)量,Y表示因變量年產量箱數(shù)。本文目的就是建立年產量箱數(shù)與AGC物料交換服務水平、周轉箱交換周期和EMS數(shù)量之間的關系。表11 三因子多水平實驗方案因子水平AGC物料交換服務水平123周轉箱交換周期/小時2468EMS數(shù)量24681012表12 實驗結果AGC物料交換服務水平周轉箱交換周期/小時EMS數(shù)量年產量箱數(shù)12220274124433261266759412882302121086856121285946142195831443788114645426148458561410453381412451611621900316430465166301971683003216102999716123032718217836184227931862265118823008181022736181223020222202132244509622650852AGC物料交換服務水平周轉箱交換周期/小時EMS數(shù)量年產量箱數(shù)2285129022105161622125114824219940244394782464449324844681241044232241244424262189192643019726630151268303322610298862612299742821832028422882286225862882262128102280128122303132220240324341673263401732834125321034256321234106AGC物料交換服務水平周轉箱交換周期/小時EMS數(shù)量年產量箱數(shù)3421974534435499346355303483576434103541634123613836218777364302163662992836830342361030205361230166382183893842262838622804388224553810224483812227632、 逐步回歸法原理回歸分析是研究因變量和自變量之間變動比例關系的一種方法,最終結果一般是建立某種經驗性的回歸方程?;貧w分析因變量的多少有一元回歸和多元回歸之分,本文中的回歸模型因有3個因變量故為多元回歸。在實際研究中,影響因變量Y的因素有很多,而這些因素之間可能存在多重共線性,特別是在各個解釋變量之間有高度的相互依賴性,如溫度和雨量、雨量與雨日之間的關系密切,這就給回歸系數(shù)的估計帶來不合理的解釋。為了得到一個可靠的回歸模型,需要一種方法能有效地從眾多影響Y的因素中挑選出對Y貢獻大的變量,在它們和Y的觀測數(shù)據(jù)基礎上建立“最優(yōu)”的回歸方程。逐步回歸分析法就是一種自動地從大量可供選擇的變量中選擇那些對建立回歸方程比較重要的變量的方法,它是在多元線性回歸基礎上派生出來的一種算法技巧。逐步回歸分析法在篩選變量方面較為理想,故目前多采用該方法來組建回歸模型。該方法也是從一個自變量開始,視自變量對Y作用的顯著程度,從大到小地依次逐個引入回歸方程。但當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉。引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步。對于每一步都要進行F值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。這個過程反復進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。本文運用IBM SPSS Statistics 20軟件的有關功能模塊根據(jù)上述原理精選出一些配合較好和方差貢獻大的自變量,組建回歸方程。當F =F =0時,則所有的變量全部被引入,逐步回歸分析結果就和一般的多元線性回歸分析結果相同。當F取值比較大時,理論和實踐都表明,在相同的F水平上,用逐步回歸篩選出的顯著變量個數(shù)往往比先引入全部變量后再剔除的辦法要少一些。為了從挑選因子中篩選出盡可能多的因子建立回歸預測模型,本系統(tǒng)可以自己給出F 臨界值,計算機默認的F為0.05,F(xiàn)為0.1,如果入選的自變量因子數(shù)目不多,可通過人為降低F臨界值的水平而篩選出更多的因子。如此時入選的因子太多,可人為提高F臨界值的水平而篩選出有代表性因子來組建回歸預測模型。如最后建立的回歸預測模型的復相關系數(shù)不大,回歸模型的擬合精度不太高,可根據(jù)這些入選因子來組建多元非線性回歸預測模型。3、 模型建立3.1 確定自變量和因變量根據(jù)表1-1可知,本文目標是確定年產量箱數(shù)與AGC物料交換服務水平、周轉箱交換周期和EMS數(shù)量之間的關系,其中AGC物料交換服務水平分為水平1、水平2和水平3,分別表示自動交換、人工交換(積極)和人工交換(消極),周轉箱交換周期分為2、4、6和8小時,EMS數(shù)量有2、4、6、8、10和12輛。3.2 分析數(shù)據(jù)準備打開SPSS軟件,在變量視圖中定義變量:自變量X1、X2和X3分別表示AGC物料交換服務水平、周轉箱交換周期和EMS數(shù)量,因變量Y表示年產量箱數(shù),如圖31所示。圖31 定義變量將表12中的仿真結果輸入到SPSS的數(shù)據(jù)視圖中,如圖32所示。圖32 仿真數(shù)據(jù)輸入3.3 逐步回歸分析單擊SPSS工具欄中的分析,選擇回歸線性,如圖33所示,打開如圖34所示的線性回歸對話框。圖33 線性回歸分析圖34 線性回歸對話框在該對話框中選擇相應的自變量和因變量,方法中選擇逐步,在繪制中選中直方圖、正態(tài)概率圖和產生所有部分圖。圖35 繪制單擊繼續(xù)后回到線性回歸對話框,再單擊確定進行回歸計算。4、 結果輸出及分析逐步回歸分析得到的結果為6張表和2幅圖,分別為變量引入/剔除方式信息表、模型匯總表、方差分析表、模型回歸系數(shù)表、被剔除的變量信息表、殘差統(tǒng)計表、殘差分布直方圖和觀測量累計概率P-P圖。4.1 輸入移去的變量表41 輸入移去的變量a模型輸入的變量移去的變量方法1周轉箱交換周期.步進(準則: F-to-enter 的概率 = .100)。2EMS數(shù)量.步進(準則: F-to-enter 的概率 = .100)。3AGC服務水平.步進(準則: F-to-enter 的概率 = .100)。a. 因變量:年產量箱數(shù)表41顯示變量的引入和剔除,以及引入或剔除的標準。系統(tǒng)在進行逐步回歸過程中產生了3個模型,模型1是按照F檢驗的標準概率值,先將與Y(年產量箱數(shù))最密切的自變量X2(周轉箱交換周期)引入模型,建立Y與X2之間的一元線性回歸模型,然后再把X3(EMS數(shù)量)引入模型,建立了Y與X2,X3之間的二元線性模型,最后把X1(AGC服務水平)引入模型,建立了它們與Y之間的三元線性模型。4.2 模型匯總表42 模型匯總d模型RR 方調整 R 方標準估計的誤差Durbin-Watson1.632a.399.39011757.832152.727b.529.51510486.436253.776c.602.5849710.99811.845a. 預測變量: (常量),周轉箱交換周期。b. 預測變量: (常量),周轉箱交換周期, EMS數(shù)量。c. 預測變量: (常量),周轉箱交換周期,EMS數(shù)量, AGC服務水平。d. 因變量: 年產量箱數(shù)表42中顯示了各模型的擬合情況,回歸模型概述表中給出了各模型的相關系數(shù)R,用來對生成的模型進行評估,R值越接近于1說明估計的模型對觀測值的擬合越好。從表中可以看出,從模型1到模型3,隨著預測變量的增多,相關系數(shù)(0.3900.5150.584)不斷增大,說明模型3是比較好的擬合模型。4.3 方差分析表43 Anovaa模型平方和df均方FSig.1回歸6421384062.02516421384062.02546.449.000b殘差9677263179.85070138246616.855總計16098647241.875712回歸8511038424.12124255519212.06138.699.000c殘差7587608817.75469109965345.185總計16098647241.875713回歸9686010304.45533228670101.48534.237.000d殘差6412636937.4206894303484.374總計16098647241.87571a. 因變量: 年產量箱數(shù)b. 預測變量: (常量),周轉箱交換周期。c. 預測變量: (常量),周轉箱交換周期,EMS數(shù)量。d. 預測變量: (常量),周轉箱交換周期,EMS數(shù)量,AGC服務水平。表43顯示各模型的方差分析結果,對模型1:F等于46.449,顯著性概率Sig. 0.001;對模型2:F等于38.699,顯著性概率Sig. 0.001;對模型3:F等于34.237,顯著性概率Sig. 0.001,可以認為Y(年產量箱數(shù))與X2(周轉箱交換周期)、X3(EMS數(shù)量)和X1(AGC物料服務水平)存在高度顯著的線性關系。4.4 回歸系數(shù)表44 系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B 的 95.0% 置信區(qū)間共線性統(tǒng)計量B標準誤差試用版下限上限容差VIF1(常量)54823.9173394.19416.152.00048054.41161593.423周轉箱交換周期-4223.408619.692-.632-6.815.000-5459.345-2987.4711.0001.0002(常量)43783.2423946.95111.093.00035909.28951657.194周轉箱交換周期-4223.408552.684-.632-7.642.000-5325.982-3120.8341.0001.000EMS數(shù)量1577.239361.816.3604.359.000855.4352299.0431.0001.0003(常量)53678.4084606.33111.653.00044486.61862870.198周轉箱交換周期-4223.408511.815-.632-8.252.000-5244.718-3202.0981.0001.000EMS數(shù)量1577.239335.061.3604.707.000908.6352245.8441.0001.000AGC服務水平-4947.5831401.662-.270-3.530.001-7744.556-2150.6111.0001.000a. 因變量: 年產量箱數(shù)表44中顯示各模型的偏回歸系數(shù),標準化偏回歸系數(shù)及其對應的檢驗值。根據(jù)表中數(shù)據(jù)非標準化系數(shù)B的數(shù)值可知,逐步回歸過程中先后建立的三個模型分別是:模型1:Y = 54823.917-4223.408X2模型2:Y = 43783.242-4223.408X2+1577.239X3模型3:Y = 53678.408-4223.408X2+1577.239X3-4947.583X1t值表示對回歸系數(shù)的顯著性檢驗,其概率值Sig小于0.05時才可以認為有意義,即自變量對因變量有顯著性影響。在模型中,系數(shù)均小于0.05,可認為回歸是顯著的。模型 3中各因子95%的知置信區(qū)間為:常亮44486.618,62870.198,周轉箱交換周期-5244.718,-3202.098,EMS數(shù)量908.635,2245.844,AGC服務水平-7744.556,-2150.611。4.5 已排除的變量表45 已排除的變量a模型Beta IntSig.偏相關共線性統(tǒng)計量容差1AGC服務水平-.270b-3.088.003-.3481.000EMS數(shù)量.360b4.359.000.4651.0002AGC服務水平-.270c-3.530.001-.3941.000a. 因變量: 年產量箱數(shù)b. 模型中的預測變量: (常量),周轉箱交換周期。c. 模型中的預測變量: (常量),周轉箱交換周期,EMS數(shù)量。表45中顯示逐步回歸過程所建立的三個模型中剔除掉的變量信息,包括各變量的Beta值、t統(tǒng)計量值、雙尾顯著性概率、偏相關系數(shù)以及多重共線性統(tǒng)計(Collinearity Statistics)的容差。對模型來說,它的偏回歸系數(shù)的P值都大于0.05,接受原假設,即不能把這些變量加入方程中。模型1中排除了變量X1和X3,表明Y只與X2有顯著的線性關系;模型2中排除了變量X1,表明Y只與X2和X3有顯著的線性關系。4.6 殘差統(tǒng)計量表46 殘差統(tǒng)計量a極小值極大值均值標準偏差N預測值8202.870159210.878933706.875011680.0120072殘差-23164.4863330799.59961.000009503.6219572標準預測值-2.1842.184.0001.00072標準殘差-2.3852.372.000.97972a. 因變量: 年產量箱數(shù)表46顯示了預測值、殘差、標準預測值和標準殘差的最小值、最大值,均值,標準差以及樣本容量。根據(jù)概率的3原則,標準化殘差的最大值為2.3723,說明樣本中的數(shù)據(jù)中沒有奇異數(shù)據(jù)。4.7 殘差分布直方圖和觀測量累計概率P-P圖圖41 殘差分布直方圖圖42 觀測的累積概率圖回歸分析中,總假定殘差服從正態(tài)分布,這兩張圖就是根據(jù)樣本數(shù)據(jù)的計算結果顯示殘差分布的實際狀況,然后對殘差分布是否服從正態(tài)分布的假設做出檢驗。從回歸殘差的直方圖(圖41)與附于圖上的正態(tài)分布兩線相比較,可以明顯看出殘差分布與正態(tài)分布比較吻合。圖42為觀測量累計概率P-P圖,也是用來比較殘差分布與正態(tài)分布差異的圖形。圖中縱坐標為期望的累計概率分布,橫坐標為觀測量累計概率分布。圖中的斜線對應著一個均值為0的正態(tài)分布。如果圖中的散點密切地分布在這條斜線附近,說明隨機變量殘差服從正態(tài)分布,從而表明樣本確實是來自于正態(tài)總體。如果離這條直線太遠,應該懷疑隨機變量的正確性。從圖42的散點分布狀況來看,72個散點大致散布于斜線附近,因此可以認為殘差分布基本上是正態(tài)的。5、 異常情況說明5.1 異方差檢驗在回歸模型的基本假設中,假定隨機誤差具有相同的方差,但在建立實際經濟問題的回歸模型時,經常存在與此假設相違背的情況,這時就會出現(xiàn)回歸模型中的異方差性。當一個方程存在異方差性時,如果仍用普通最小二乘法估計參數(shù),將會引起嚴重的后果,特別是最小二乘估計量不再具有最小方差的優(yōu)良性,即最小二乘估計的有效性被破壞了。異方差性的檢驗方法目前有十多種,但沒有一種是公認最優(yōu)的方法。常用的是殘差圖分析法,等級相關系數(shù)法以及Glejser法。本文使用殘差圖分析法,在SPSS中選中標準殘差值為Y,標準預測值為X,如圖51,繪制出的殘差圖如圖52所示。圖51 繪制殘差圖圖52 殘差圖從上圖中可以看出,隨著預計值的增大,殘差變化幅度也隨之增大,由此判定存在異方差現(xiàn)象,需要使用非線性的方法擬合。5.2 殘差的獨立性檢驗殘差的獨立性檢驗也稱為序列相關性檢驗。如果隨機誤差不獨立,那么對回歸模型的任何顧忌與假設所做出的結論是不可靠的。殘差獨立性檢驗是通過Durbin-Watson檢驗來完成的。Durbin-Watson檢驗的參數(shù)用D表示。D的取值范圍是0D10時,就說明自變量之間有嚴重的多重共線性,且這種多重共線性可能會過度的影響最小二乘法估計值。本文中計算出的VIF值列于表44中,可見各系數(shù)的VIF均等于1,說明自變量之間不存在多重共線性。6、 結論由上面的分析可知,模型3滿足多元線形回歸的假設條件,這樣可以分析結果得到回歸方程。在考察的對Y(年產量箱數(shù))影響的3個因素中,分析結果為:AGC物料交換服務水平、周轉箱交換周期和EMS數(shù)量都有顯著性影響并進入回歸方程:Y = 53678.408-4223.408X2+1577.239X3-4947.583X1從上述分析的結果來看,我們不難理解,X1表示的AGC物料交換服務水平越高(X1數(shù)值上越小),機床加工工件的時間間隔就會縮短,機床的利用率上升,從而使得產量提高,所以年產量箱數(shù)與AGC物料交換服務水平成正比,表現(xiàn)為與X1數(shù)值成反比,因此回歸方程中X1的系數(shù)為負數(shù)。周轉箱交換周期表示一箱工件進出機床所使用的時間,交換周期越長,表明這箱工件占用機床的時間(包括準備時間和加工時間)越長,那么物料周轉的就慢,年產量箱數(shù)也就會越低,因此年產量箱數(shù)與周轉箱交換周期成反比,因此回歸方程中X2的系數(shù)為負數(shù)。EMS負責將物料運輸至對接緩沖,再由AGC將物料運往機床進行加工,很顯然,EMS數(shù)量越多,運送的物料也就越多,設備利用率會相應上升,產出增多,但是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 營養(yǎng)師筆記 不同人群的生理特點之幼兒青少年老年人的生理特點
- 由于對高速電機要進行流體場和溫度場的分析
- 企業(yè)培訓師考試課件
- 優(yōu)化物流系統(tǒng)的設計
- 英語KET考試全真模擬卷含答案
- 高效叉車維修與專業(yè)團隊服務承包合同
- 跨省車輛掛靠運營管理服務協(xié)議
- 智能化商品房物業(yè)管理合同
- 車輛物流運輸保險合同
- 景區(qū)設計合同方案
- (高清版)DB510100∕T 082-2012 成都市商務寫字樓等級劃分
- 股東內部持股協(xié)議書
- 礦山企業(yè)管理規(guī)章制度匯編
- 2025-2030中國電力設備檢測行業(yè)市場深度調研及發(fā)展前景與投融資戰(zhàn)略規(guī)劃研究報告
- 2024年陜西農業(yè)發(fā)展集團有限公司招聘筆試真題
- 2025年酒店職位測試題及答案
- 2025年煤礦頂板的考試題及答案
- 爆破作業(yè)風險評估職責
- 軟件研發(fā)行業(yè)安全生產培訓
- 《供應鏈管理法律風險》課件
- 三升四數(shù)學暑假思維訓練題答案
評論
0/150
提交評論