運用偏相關分析和主成分回歸分析法_第1頁
運用偏相關分析和主成分回歸分析法_第2頁
運用偏相關分析和主成分回歸分析法_第3頁
運用偏相關分析和主成分回歸分析法_第4頁
運用偏相關分析和主成分回歸分析法_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

SAS軟件的在煤礦事故分析上的應用――運用偏相關分析和主成分回歸分析法摘要:為了研究我國煤礦各類事故之間的相互關系,收集引起煤礦各類事故的原因,運用sas軟件的部分功能對我國煤礦事故數據進行了統計分析,其中運用偏相關分析和主成分回歸分析法,分析分類事故死亡人數對總死亡人數的影響。根據主成分分析法推導出了一個回歸方程,用偏相關分析和主成分回歸分析的方法可以估算下一年份總死亡人數的參考值,從而重點做好各方面工作以最大減少事故發(fā)生。關鍵詞:煤礦;事故類型;偏相關系數;主成分分析;回歸分析Abstract:InordertostudytherelationshipbetweenthevarioustypesofcoalmineaccidentsinChina,collectingcausedbycoalmineaccidentsofvariouskinds,somefunctionsusingsassoftwaretoChina'scoalmineaccidentdataforstatisticalanalysis,includingtheuseofpartialcorrelationanalysisandprincipalcomponentregressionanalysismethod,analysisclassifiedthedeathtollofthetotalnumberofdeaths.Derivearegressionequationbasedonprincipalcomponentanalysis,thereferencevalueofthepartialcorrelationanalysisandprincipalcomponentregressionanalysistoestimatethetotaldeathtollofthenextyear,tofocusondoingallaspectsofworktothemaximumtoreducetheaccidentoccurred.Keywords:coalmine;typesofaccidents;partialcorrelationcoefficient;principalcomponentanalysis;regressionanalysis1引言煤炭工業(yè)作為我國的基礎產業(yè),在現在及未來的國民經濟發(fā)展中都起著舉足輕重的作用。從目前我國能源現狀、經濟發(fā)展水平和世界能源格局來看,相當長的時期內以煤為主的能源消費結構難以改變。但是近年來煤礦事故頻發(fā),煤礦事故已成為我國工礦企業(yè)中死亡人數最多的一類事故,給國家和人民群眾的生命財產造成了巨大損失。因此,對煤礦事故進行統計分析,找出最主要的事故類型,研究各類事故之間的相互關系,由此提出有效的預防措施是非常必要的。為此,筆者運用主成分分析法和因子分析對搜集到的我國煤礦事故數據進行統計分析,主要分析了煤礦事故的主要類型以及各事故類型對事故發(fā)生的貢獻率,以為制定相應的預防措施提供依據。

1.1數據來源通過數據收集1990-2010,我國煤礦各類事故死亡人數統計如下表。表11990-2010煤礦事故死亡人數(單位:人)事故類型年份 頂板瓦斯機電運輸放炮水害火災總數1990262318231628131714771536222199125131756185597141430505672199224471865190487101408455543199322132231204570128354885788199421303012156602144521106667119952013325618657412456863678419961923335617849210542778655919971789380019646181450626839199818233212124433745075262251999174631231113646246833590720001614312278330523514055872001147622037949570432844839200224222014133532645091855859200324211865128570925517557022004245120139960599357915715200520131319785781025095846572006189610868951778417264109200715401012864538725572350520081236986784686526368316420091102856764827624556289320109867856945785246452673注:通過以上搜集的數據,選取我國煤礦事故死亡人數最多的 7種事故類型作為評價指標,分別表示為:X1頂板、X2瓦斯、X3機電、X4運輸、X5放炮、X6水害、X7火災、Y總數。1.2程序運行

datasasuser.shuju;inputyx1-x7;cards;2623182316281317147715391825131756185597141430507572447186519048710140845906221322312045701283548828521303012156602144521106304201332561865741245686325619233356178492105427782331789380019646181450622411823321212443374507521981746312311136462468332101614312278330523514023114762203794957043284175242220141335326450918582024211865128570925517549524512013996059935791554201313197857810250958262189610868951778417263821540101286453872557224112369867846865263682011102856764827624556198986785694578524645203%變量之間的相關系數proccorrdata=sasuser.shujuoutput=w;varyx1-x7;run;%標注化數據procstandarddata=sasuser.shujum=0std=1out=stshuju;run;procprintdata=stshuju;run;%方差擴大因子和條件數procregdata=shuju;modely=x1-x7/vifcollinoint;run;%主成分回歸procprincompdata=stshujuout=cprefix=z;varx1-x7;run;procregdata=c;modely=z1-z4;run;□DpgljaKr"^1H『□DpgljaKr"^1H『gs-s-z:塗逕一? ???t#nQ?分別表示為:X1頂板、分別表示為:X1頂板、X2瓦斯、X3機電、X4運輸、X5放炮、X6水害、X7火災、Y總數。2偏相關分析和主成分回歸分析2.1偏相關分析Pearson相關系數,N=當用:Rho=0眄,Prat>]r|xlxSx4x5x6x7y1』訓皿O.S36010.S27410.S39720.608^50.632440*45^60.773440.3030Q.00730.001S0.00490.00210.0885<.0C01xl0.236011.000000.53011-0.162070.039270.5S6S10.02235-0.164830.30300.01190.429C0.66580.00740.82340.47520.627410.58811LOOOOO0.370090.610B10.4&7040,21921Q.40G210.00230.01190.09870.00830.03730.3397OJEU0.63372-00.370091.000000.843550.34C100*5冊冊O.G8OB7o.coia0.42360.0987<.00010.12430.0052O.OC50x40.589950.089270.810G1O.?4S6E1.DOODO0.903090.33153a.446ce(M⑷Q朋說0.UU3?SQQ10.15170.14214.0427x50.632440.5GG310.457040,346100.30309\ooooo0.257199.2G1S20.C0210.00740.03730.1243o.ien0.24170.2516x60.4524&0.022960.82340.219210.588960.331530.267191.000000.492S10.03950.38970.00520J4210.24170.0234x70J7044'0.164830.405210.580670.446030.261920,482811.00000<,DQD10.47520.06940.005S0.0+270.251G0.Q234偏相關分析用以計算描述在其他變量控制下,兩變量之間的線性關系的偏相關系數,即每年各類事故死亡人數對總死亡人數的直接影響程度,也就是說在除去其他因素的影響后,每年中每一類事故對總死亡人數的凈影響。運用 sas統計軟件分別計算出偏相關系數。7種事故類型作為評價指標,7種事故類型作為評價指標,事故死亡總人數與X1頂板、X2瓦斯、X3機電、X4運輸、X5放炮、X6水害、X7火災的關系分別是:Ry,234567=0.23601,P=0.3030>0.01,可見控制X2瓦斯、X3機電、X4運輸、X5放炮、X6水害、X7火災時,總的死亡人數Y與X1頂板的偏相關系數不顯著。Ry,134567=0.6274, P=0.0023<0.01,可見控制X1頂板、X3機電、X4運輸、X5放炮、X6水害、X7火災時,總的死亡人數Y與X2瓦斯的偏相關系數顯著。Ry,124567=0.63972, P=0.0018<0.01,可見控制X1頂板、X2瓦斯、X4運輸、X5放炮、X6水害、X7火災,總的死亡人數Y與X3機電的偏相關系數顯著。Ry,123567=0.58985, P=0.0049<0.001,可見控制X1頂板、X2瓦斯、X3機電、X5放炮、X6水害、X7火災時,總的死亡人數Y與X4運輸的偏相關系數很顯著。Ry,123467=0.63244, P=0.0021<0.001,可見控制X1頂板、X2瓦斯、X3機電、X4運輸、X6水害、X7火災時,總的死亡人數Y與X5放炮的偏相關系數很顯著。Ry,123457=0.45246, P=0.0395>0.01,可見控制X1頂板、X2瓦斯、X3機電、X4運輸、X5放炮、X7火災時,總的死亡人數Y與X6水害的偏相關系數顯著。Ry,123456=0.77844, P<0.0001,可見控制X1頂板、X2瓦斯、X3機電、X4運輸、X5放炮、X6水害時,總的死亡人數Y與X7火災的偏相關系數很顯著。2.2主成分回歸分析Eig.envaIu&softheCorrelationE1cenva1ueDiffertncePrcparlionCumulalive13.1339701.543024950.^6580.465321.71S308750J177C42E0.24650.711430.900544510.2拙1鈾4?0.11440.6257斗0.584411030.079767530.00060.S06450.464C435I0.3BI7230S0.0B920.975Ag0.12S9Z0410.075082920.01780.993270.04783608d.oose1.0000Eisenvectors=1z22924252?xl0.1244900.7078550J1044&-.0130730.26BB74O.B030B20.203734x20.4025950.340119-.9499210.4021680.299018-.5789500J32025x30.470751-J014C21-.383355-.09034S0,0631251.719612x40.460120-.106071-.518812-.2838370.0811400.281302-.5S44610.3333S00.4154S80.320245.-.253100-.65801S-.274S18-.195032逑0.354300*.1962630.579341-.1302420.551924-.133679-.207682x70.890443-.2B37540J742700.725589-.3096820.959020-.024906主成分回歸分析是將原來的多個變量綜合成彼此互補相關的綜合指標(即主成分)的一種統計方法,可以達到數據化簡,揭示變量不僅保留了原始數據的絕大部分信息,而且彼此之間不相關,對綜合變量進行分析,可以抓住主要的因素,剔除一些重疊的信息使問題得到最佳綜合簡化。利用SAS軟件計算出7各變量之間的相關系矩陣,發(fā)現變量之間的相關性比較明顯,為

此對7個變量的原始標準化數據進行主成分分析。有輸出的結果可知,相關矩陣的前 4個特征根分別為■1=3.261, ■2=1.718,■3=0.801, ■4=0.564。前四個主成分的累計貢獻率高達90.64%,所以選取四個主成分來代替原來的七個變量,這四個主成分可以解釋原來的 90.64%的信息。主成分個數的確定,根據累計方差貢獻率大于或等于 85%的原則選取。用 Z1,Z2,乙,Z4表示這四個主成分,則:Z1=0.124490x1*+

0.402595x2*+0.470751x3*+0.460120x4*+0.333360x5*+0.354300x6*+0.390443x7*Z2=0.707856x「+0.340119x2*-0.302147x3*-0.106071x4*+0.415488x5*-0.196263x6*-0.263754x7*Z3=0.110449x1-0.349321x2*-0.101462x3*-0.518812x4*+0.320245x5*+0.673341x6*+0.174270x7*Z4=-0.013073x1*+0.402166x2*-0.333355x3*-0.283337x4*-0.259100x5*-0.130242x6*0.72583X7*其中X*(i=1,2,3,4,5 ,6,7)是X的標準化指標.即(Xj—X)2/Si,其中X是X的均值,S[[9]何曉群,劉文卿?應用回歸分析 [M]?北京:中國人名大學出版社。 2001.是X是X的標準差。2.3回歸分析P魚「訕帖terEstiniatestValue:Intercept1-e.69E9E-1721tValue:Intercept1-e.69E9E-172110.469010.0833310.9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論