SAS整理下之相關(guān)分析和回歸分析_第1頁
SAS整理下之相關(guān)分析和回歸分析_第2頁
SAS整理下之相關(guān)分析和回歸分析_第3頁
SAS整理下之相關(guān)分析和回歸分析_第4頁
SAS整理下之相關(guān)分析和回歸分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

平寶寶傾情奉獻(xiàn)希望大家平寶寶傾情奉獻(xiàn)希望大家SAS順利!!平寶寶傾情奉獻(xiàn)希望大家平寶寶傾情奉獻(xiàn)希望大家SAS順利!!七.相關(guān)分析用INSIGHT模塊作相關(guān)分析先說一下建立數(shù)據(jù)集,找到題中的某句話的意思是,“為了弄清楚。。形成的原因,或者是為了分析。。的影響因素。”找到這句話就成功一半了,將這個(gè)。。元素就寫到Y(jié)的列下,其他的元素就設(shè)成X1X2。。這樣,有幾個(gè)元素就幾列,但是Y只有一列,而X就看題中給得了??!1.制作散點(diǎn)圖首先制作變量之間的散點(diǎn)圖,以便判斷變量之間的相關(guān)性。步驟如下:1)在INSIGHT模塊中,打開數(shù)據(jù)集;2)選擇菜單“Analyze(分析)"—“ScatterPlot(YX)(散點(diǎn)圖)”;3)在打開的“ScatterPlot(YX)〃對話框中選定Y變量:Y;選定X變量:x「x2x2、x3、x44)單擊“OK〃按鈕,得到變量的分析結(jié)果。從各散點(diǎn)的分布情況看,初步有一個(gè)跟每個(gè)元素的線性關(guān)系密切或不密切就行了。相關(guān)系數(shù)計(jì)算1)在INSIGHT模塊中,打開數(shù)據(jù)集;2)選擇菜單“Analyze(分析)"—“Multivariate(YX)(多變量)";3)在打開的“Multivariate(YX)〃對話框中選定Y變量:Y;選定X變量:x2x2、x3、x44)單擊“OK〃按鈕,得到分析結(jié)果。UmvaiLatcStatisticsVarialDle1234YXXX5555522222JtlnljiiujnMaxljnwnUmvaiLatcStatisticsVarialDle1234YXXX5555522222JtlnljiiujnMaxljnwn0.200012.500014.8000368.2000o-eooo27-10001-000034.00002.20001&3.AOOOfrteanStdDev""§;"72S6^?6093120,2S3080,3465乩7OS0&334S15.OSOOS.563158?汨80丨甜?"25結(jié)果顯示各變量的統(tǒng)計(jì)量和相關(guān)(系數(shù))矩陣,從相關(guān)矩陣中可以看出,相關(guān)系數(shù)高的就關(guān)系密切,相關(guān)系數(shù)低的就關(guān)系不密切。5)為了檢驗(yàn)各總體變量的相關(guān)系數(shù)是否為零,選擇菜單:“Tables〃一''CORRp-values〃,得到相關(guān)系數(shù)為零的原假設(shè)的p值,如圖所示。p-valuesoftheCorrelations::sik2=!k3ixlVTf<?0001i<?00011!<.0001i0.0079基于這些P值,拒絕原假設(shè),即Y因素與其他幾個(gè)變量之間均存在著顯著的正相關(guān)關(guān)系;若P值>0?05,則無法拒絕原假設(shè)。3.置信橢圓繼續(xù)上述步驟6)選擇菜單:“Curves"—''ScatterPlotContEllipse"—''Prediction:95%”,得到Y(jié)與其他幾個(gè)變量的散點(diǎn)圖及預(yù)測值的置信橢圓變量Y和xi間散點(diǎn)圖上的這個(gè)橢圓被拉得很長,表明變量Y和xi之間有很強(qiáng)的相關(guān)性。用“分析家”作相關(guān)分析1)在“分析家”中打開數(shù)據(jù)集Mylib.jyzk;2)選擇主菜單"Statistics"—''Descriptive(描述性統(tǒng)計(jì))”—"Correlations(相關(guān))”,打開"Correlations"對話框

CancelResetSai^eOplionsCnTrelial1oris:」CancelResetSai^eOplionsCnTrelial1oris:」y暮kOptionsFldisSaveDala|Titles"315覽]e-s都扔進(jìn)這一個(gè)里面了。。3)單擊plots,打開Correlations:Plots。選中Scatterplots(散點(diǎn)圖)和Addconfideneeellipses(添加置信橢圓).4)兩次OK2.結(jié)果分析Pear&enCorrelationCoefflciciLts^HPear&enCorrelationCoefflciciLts^H=20>|r1underHO:Rh^=O/A池xSk5xSy/looooo\0.11271clTSdiaa79+550.34LZ+CL450200.63749單槎而職年蓉業(yè)額(萬元/平方米〕'1i0;0705匕黑們C00010-1+0?0Q4E40.OO0BXI比*127111,000000,75098-a12891d66^2^0,4241^4TT430謁時(shí)機(jī)葩車泥望【萬輛0.oToa\0.0001a58B10.0014:0.062S<.aOai①7904Rh760^?1.00000a27Z77CL594110;2794SOu58310曰人法■(萬人)<,000110.000L0,24460.00570.2328G0001①旳磁4.1289L0.272771.CJO加。"0.CL920,4257&0.14:392居民年轉(zhuǎn)費(fèi)額(萬元)<.00011E5@8L0.24460.63S5aosi20.5*500.34124Id.S64240.594117111921.000000.O415B0.64274襯侖場環(huán)境満竜度0-1409foTOOLi0.DOSTa&38SCL朋甬0?0022x510?45020/0.424rL90.279430.42579CL0+LS6L0000DO.2^311対焉疑去施詢童崖JCh06230.2328a06120.86190-3017?6tpTeaTo/0.774300.98310a143920.642740,243111.0D000浙盞場藺足豐畐程.度滿竜度<.GOCH<.0001a64S00.D02202017v0.0001的就是高度相關(guān)的,較大的就是低度相關(guān)的,之間的就是中度相關(guān)。3.置信橢圓在分析家窗口的項(xiàng)目管理器中依次雙擊“ScatterPlots”下的“Confideneeellipse:YxX1”~“Confideneeellipse:YxX6”項(xiàng),得到各變量與單位面積營業(yè)額的散點(diǎn)圖平寶寶傾情奉獻(xiàn)希望大家平寶寶傾情奉獻(xiàn)希望大家SAS順利?。∑綄殞殐A情奉獻(xiàn)希望大家平寶寶傾情奉獻(xiàn)希望大家SAS順利!!置信橢圓較扁長,相關(guān)關(guān)系強(qiáng);置信橢圓接近于圓,相關(guān)關(guān)系小。1.用INSIGHT模塊作回歸分析一元線性回歸數(shù)據(jù)集的建立與相關(guān)分析的數(shù)據(jù)集建立相同,大家可以看上面的內(nèi)容?。。?)分析1)在INSIGHT模塊中打開數(shù)據(jù)集。選擇菜單"Analyze〃-''Fit(YX)〃,打開"Fit(YX)〃對話框;2)在"Fit(YX)〃對話框中,將Y設(shè)為響應(yīng)變量,將X]設(shè)為自變量;3)單擊"OK〃按鈕,得到分析結(jié)果。(2)分析結(jié)果第一張表提供關(guān)于擬合模型的一般信息,Y=%表示這個(gè)分析是以Y為響應(yīng)變量,X]為自變量的線性模型;第二張表給出回歸方程:第三張表是帶有回歸直線的散點(diǎn)圖,給出了回歸的圖形表示圖的下面是參數(shù)回歸擬合表。其中判定系數(shù)R-Square(R2)為模型平方和占總平方和的比例,反映了回歸方程能夠解釋的信息占總信息的比例第四張表提供擬合的匯總度量:MeanofResponse(響應(yīng)變量的均值)是變量Y的平均值,RootMSE(均方殘差平方根)是對各觀測點(diǎn)在直線周圍分散程度的一個(gè)度量值,為隨機(jī)誤差£的標(biāo)準(zhǔn)差(也是實(shí)測值Y的標(biāo)準(zhǔn)差)的無偏估計(jì)?!陓Siiniary£|SiiniaryMeanofResponse3.7;RootMSEL9'第五張方差分析表(圖4-16)包含對回歸方程的顯著檢驗(yàn)對一元線性回歸,第六張III型檢驗(yàn)表提供與方差分析表一樣的檢驗(yàn)第七張參數(shù)估計(jì)表給出了回歸直線截距和斜率的估計(jì)值及其顯著性檢驗(yàn)等內(nèi)容在這個(gè)例子里,截距的P值>=0.05,表示模型還有改進(jìn)的余地,可以考慮擬合截距為0的回歸直線。斜率的t檢驗(yàn)p值<0.0001,表明自變量貸款余額對因變量不良貸款有顯著的線性關(guān)系(2)回歸診斷在顯示窗的底部有一個(gè)殘差R_Y和預(yù)測值P_Y的散點(diǎn)圖,這個(gè)圖可以幫助驗(yàn)證模型的假定。從圖中看出,數(shù)據(jù)點(diǎn)隨機(jī)地散布在零線附近,表明模型中誤差等方差、獨(dú)立性的假設(shè)沒有問題;若沒有隨機(jī)散步,則模型中方差獨(dú)立性等假設(shè)可能有問題。為了檢驗(yàn)誤差為正態(tài)分布的假定,回到數(shù)據(jù)窗口??梢钥吹綒埐頡_Y和預(yù)測值P_Y已加到數(shù)據(jù)集之中,可以用Distribution(Y)來驗(yàn)正殘差的正態(tài)性。選擇菜單“Analyze(分析)"—“Distribution(Y)(分布)”,打開“Distribution(Y)〃對話框。在數(shù)據(jù)表BLDK的變量列表中,選擇R_Y,然后單擊“Y”按鈕,R_Y被選為分析變量;單擊“0K〃按鈕;選擇菜單“Curves”一“TestforDistribution”;在打開的“TestforDistribution”對話框中單擊“OK”按鈕即可。這一部分就是前面的正態(tài)性檢驗(yàn),大家可以看前面的內(nèi)容?。≡诜治鼋Y(jié)果的TestforDistribution(分布檢驗(yàn))表中看到,若p值大于0.05,不能拒絕原假設(shè),表明可以接受誤差正態(tài)性的假定;若p值小于0.05,則不能接受誤差正態(tài)性。利用回歸方程進(jìn)行估計(jì)和預(yù)測

回到數(shù)據(jù)窗口,點(diǎn)擊數(shù)據(jù)表的底部,增加一個(gè)新行;在第一個(gè)空行中,在X1列填入100,并按Enter鍵自動(dòng)計(jì)算出Y的預(yù)測值并將結(jié)果顯示在P_Y列之中,這樣可以得到任意多個(gè)預(yù)測值。擬合不含常數(shù)項(xiàng)的回歸要擬合常數(shù)項(xiàng)為零的回歸模型,只需在上述步驟中的“Fit(YX)〃對話框中取消"Intercept”復(fù)選項(xiàng)BLDKBLDK單擊“0K〃按鈕后,得到的回歸模型記得要做正態(tài)性檢驗(yàn)哦??!多元線性回歸分析步驟在INSIGHT模塊中打開數(shù)據(jù)集。選擇菜單“AnalyzeJ“Fit(YX)(擬合)”,打開“Fit(YX)〃對話框;在“Fit(YX)〃對話框中,選擇變量Y,單擊“Y〃按鈕,將Y設(shè)為響應(yīng)變量;選擇變量X]、x2、x3、x4,單擊“X”按鈕,將X]、x2、x3、x4設(shè)為自變量;還是那句話哦,多的就放到大的框子里面,而少的就放到小的框子里面??!3)單擊“OK〃按鈕,得到分析結(jié)果。在顯示的結(jié)果中可以看到,多元回歸分析的輸出類似于一元線性回歸的輸出,同樣分為七張表:第一張表提供關(guān)于擬合模型的一般信息;第二張表給出模型方程(即回歸方程)以下幾張表與一元基本相同,就不贅述了。。(2)剔除自變量首先考慮剔除變量x3,對此只需在剛才已打開的擬合窗的任一處選中變量x3,如圖所示,再在主菜單中選擇“Edit”一“Delete〃所有的結(jié)果就會(huì)修改為不含、的擬合結(jié)果?!?T工rTI-TzI:■SourceD?Sum.ofSquaresNciinSquare?31aIrr)?2.1146.5936■t6.593614.匸0.COLC1_L.1677_L.16773.5HH.1J.09690.0969C.Or0.-1-1.86B2■1.Hr.-?r.b-0.Cri7CParaneierEGtinatesVariabLeL'J<EstijLai:eStcHrr^rtStat?>HIiToLeranceVarInflationIntem^ept1-1.02L60.7824-1.31丨0.206401:110.nC.?1043.止0?100.13765.330B10.14800.07881.S80-0749:Cl52911.B3991U.l.JtJUU.i'l'0.S6290.2603J.d1-0.0292C.?151-1.咲0.0B700.35962.7312若剔除某些變量后擬合的結(jié)果比不擬合更好,就可以舍掉某一些自變量!!用“分析家”作回歸分析(1)分析步驟選擇主菜單“Statistics(統(tǒng)計(jì))"^“Regression(回歸)”f“Linear(線性)”,打開“LinearRegression(線性回歸)”對話框,Y進(jìn)dependent,X1進(jìn)另一個(gè)??!在顯示的輸出結(jié)果中,p值v.OOOIva=0.05,所以模型的作用是顯著的。參數(shù)估計(jì)部分列舉了回歸方程中兩個(gè)參數(shù)的值以及有關(guān)的顯著性檢驗(yàn)的結(jié)果。

SourceW?d?lErrorCorrectedTotalDFSubc?fSquaresKean.SourceW?d?lErrorCorrectedTotalDFSubc?fSquaresKean.SquareFValuePr>F18-041ElQ.(H16129,9日gW01.184?8ZTB90.268221912.8695&TheREGFToceciureDependentVariable:y單橙面稅年?duì)I業(yè)叡.(萬元/平方米;)AnalysisofVaiianceRootISEDeperudentMeanCotff?arVariableLabelParaieterEstimatesStsndardDFPyraneterEstiijiteErrort7ilufiFr>|t|10LM431'^^336621.9=70.M4O10.40ns一—073815.48C00010.51.790R-Square0.624^2.39500AdjR-SqQ604021.62405擬合的回歸方程為:y=0.66431+0.40418x2(2)制作散點(diǎn)圖在上述操作打開的“LinearRegression”對話框中,單擊“Plots”按鈕。在打開的“LinearRegression:Plots”對話框中,選擇“Predicted”選項(xiàng)卡,選中“Plotobservedvsindependent”復(fù)選框。單擊“OK”按鈕,得到分析結(jié)果,包含響應(yīng)變量Y與解釋變量x2的散點(diǎn)圖擬合不含常數(shù)項(xiàng)的回歸在“LinearRegression”對話框中單擊“Model”按鈕,在打開的“LinearRegression:Model”對話框中選中“Donotincludeanintercept”復(fù)選框在顯示的輸出結(jié)果中,p值v.0001va=0.05,所以模型的作用是顯著的。2.多元線性回歸(1)分析步驟1)選擇主菜單“Statistics”f“Regression”f“Linear”,打開“LinearRegression(線性回歸)”對話框平時(shí)不都是y=x么,所以這時(shí)候也是Y進(jìn)左邊框子,X進(jìn)右面框子??!p值v0.0001v0.05=a顯示的分析結(jié)果表明模型的作用是顯著的(2)逐步回歸''分析家”中選擇變量的方法很多,在上述步驟的“LinearRegression”對話框中,單擊“Model”按鈕,打開“LinearRegression:Model”對話框。在“Method〃選項(xiàng)卡中包含多種變量的選擇方法,選擇其中一種,例如選擇"Backwardelimination(逐步剔除法)”繼續(xù)剔除進(jìn)入回歸的變量中最不顯著的自變量x6,…,直到所有的參數(shù)顯著不為0使用REG過程作回歸分析(我最喜歡的編程)REG過程的語法格式REG過程的基本用法為:-PROCREGDATA二<輸入數(shù)據(jù)集〉[<選項(xiàng)列表〉];VAR<變量列表〉;MODEL<因變量〉=<自變量表〉/<選項(xiàng)〉;PRINT<選項(xiàng)列表〉;PLOT<y變量名*x變量名〉[=<符號>][/<選項(xiàng)列表>];-RUN;說明:MODEL語句用以指定所要擬合的回歸模型,其后的選項(xiàng)與REG語句的選項(xiàng)類似。PLOT語句用以對兩個(gè)變量繪制散點(diǎn)圖,表達(dá)式中位置在前(在乘號“*”之前)的變量作為散點(diǎn)圖的y軸,位置在后的變量作為散點(diǎn)圖的x軸。等號后的符號為散點(diǎn)圖中表示點(diǎn)的圖形符號,此項(xiàng)內(nèi)容可省略,SAS會(huì)用默認(rèn)方式顯示圖形,但如需指定,符號要用單引號括起來。對于同一個(gè)模型可以指定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論