SAS講義散布圖折線圖和層次圖_第1頁
SAS講義散布圖折線圖和層次圖_第2頁
SAS講義散布圖折線圖和層次圖_第3頁
SAS講義散布圖折線圖和層次圖_第4頁
SAS講義散布圖折線圖和層次圖_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二十課 散布圖、折線圖和層次圖SAS系統(tǒng)中繪制散布圖、折線圖和層次圖,使用PROC PLOT過程和PROC GPLOT過程。PROC PLOT過程是用來畫易生成的低分辯率的圖形,輸出在OUTPUT窗口。而PROC GPLOT過程是用來生成定制的、高分辨率的圖形,輸出在GRAPH窗口,并且還可以對輸出的圖形進(jìn)行編輯修改。一. PROC PLOT過程使用PLOT過程可以在兩個(gè)不同的坐標(biāo)系中對兩個(gè)變量作散布圖、折線圖、半對數(shù)圖和層次圖。用于數(shù)據(jù)處理中,直觀地了解數(shù)據(jù)的變化趨勢和數(shù)據(jù)間的相互關(guān)系等。它的一般形式為:Proc Plot DATA=數(shù)據(jù)集 ;Plot 縱坐標(biāo)變量Y*橫坐標(biāo)變量X;Run

2、; 1 PROC PLOT語句PROC PLOT語句中的選項(xiàng)列表主要分成三類:有關(guān)圖形的坐標(biāo)軸選項(xiàng)、有關(guān)外觀的選項(xiàng)和有關(guān)圖形大小的選項(xiàng)。其中圖形大小的兩個(gè)選項(xiàng)較為常用:l VPCT=百分比列表規(guī)定產(chǎn)生圖形在垂直方向占一頁的百分比。例如VPCT=33表示這張輸出圖占一頁的33%,即占一頁的1/3,所以一頁可以縱向打印3張圖。VPCT=50 25 25表示每一頁在縱向打印3張圖,第一張占全頁的一半,第二和第三張各占1/4頁。VPCT=200表示要求輸出圖占2頁的長度。l HPCT=百分比列表規(guī)定產(chǎn)生圖形在水平方向占一頁的百分比。2 PLOT語句PLOT語句里首先要規(guī)定數(shù)據(jù)集中的哪兩個(gè)變量作為圖形中

3、的垂直變量和水平變量,以及在圖形中用于畫點(diǎn)的作圖字符。PLOT語句的幾種使用格式如下:plot y*x ;plot y*x =+;plot y*x=符號變量 ;plot y*x $ 標(biāo)記變量 =+;plot y*x=+ b*a=* /overlay ;第一條語句作圖符號用缺省形式,依此用英文大寫字母A、B、CZ作為作圖符號。當(dāng)觀測的條數(shù)較多時(shí),低分辯率圖不可能畫出所有觀測的點(diǎn),所以當(dāng)圖中的某一點(diǎn)表示有一條觀測的點(diǎn)時(shí),用作圖符號A;當(dāng)圖中的某一點(diǎn)表示有二條觀測的點(diǎn)時(shí),用作圖符號B;以此類推。例如,輸出圖中有一個(gè)Z符號,表示在這點(diǎn)上共有26條觀測的點(diǎn)或更多點(diǎn)。對于PROC GPLOT過程默認(rèn)的作圖

4、符號為加號(+)。第二條語句用等號(=)規(guī)定一個(gè)字符作為作圖符號。此例中每個(gè)散點(diǎn)用加號(+)表示。第三條語句用等號(=)規(guī)定一個(gè)變量的值作為作圖符號,變量可以是字符變量,也可以是數(shù)值變量。此時(shí),每個(gè)散點(diǎn)的作圖符號用數(shù)據(jù)集中同一條觀測的這個(gè)符號變量的值表示。例如,假定為=SEX變量,則作圖符號為SEX變量的值F或M。第四條語句用符號($)規(guī)定一個(gè)變量的值用于標(biāo)記圖中的散點(diǎn)。此例中每個(gè)散點(diǎn)不僅用加號(+)表示,而且還標(biāo)出了圖中每一個(gè)散點(diǎn)在數(shù)據(jù)集的同一條觀測中這個(gè)標(biāo)記變量的值。第五條語句規(guī)定在同一張圖上重疊兩個(gè)圖,當(dāng)然可以重疊更多的圖。OVERLAY選項(xiàng)要求定義在PLOT語句中的幾個(gè)圖打印在一張圖上

5、。例如,我們有一個(gè)上證指數(shù)周線數(shù)據(jù)集INDEXSH,包含日期變量DATE、成交量變量VOLUME、開盤價(jià)變量OPEN、最高價(jià)變量HIGH、最低價(jià)變量LOW、收盤價(jià)變量CLOSE和漲跌百分比CHANGE,用PROC PLOT過程定制一個(gè)指數(shù)對交易周的最高和最低價(jià)的重疊散點(diǎn)圖。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc Plot Data=Study.IndexSh Vpct=50 Hpct=70 Formchar=|-|- ;Where date01feb91 d ;Plot high*date=+ low*date $low =- /overlay ;

6、Run ;程序的運(yùn)行結(jié)果顯示在OUTPUT窗口中,見圖201所示(為顯示清晰起見,窗口的大小和顯示內(nèi)容的位置移動(dòng)過)。圖201 用PLOT過程定制重疊散點(diǎn)圖3 PLOT語句中的選項(xiàng)PLOT語句除了上述的重疊作圖選項(xiàng)OVERLAY外,還有幾類重要的選項(xiàng)如下:(1). 關(guān)于坐標(biāo)軸刻度的任選項(xiàng)用VAXIS(或HAXIS)=標(biāo)記值列表,定義沿垂直(或水平)坐標(biāo)軸相等間隔的刻度標(biāo)記值??梢杂肂Y n的方式規(guī)定刻度的增量。這些值可以是均勻上升或下降,也可以不是,既可以是數(shù)字值,也可以日期時(shí)間值。幾種可能的選項(xiàng)格式如下:haxis=0 to 100 by 5haxis=01jan20d to 31dec20

7、d by 7vaxis=1 10 100 100 1000haxis=by 10其它還有VEXPAND(或HEXPAND)、VREVERSE(或HREVERSE)、VZERO(或HZERO)等有關(guān)坐標(biāo)軸刻度選項(xiàng)。(2). 關(guān)于參考線的任選項(xiàng)如果要求在散布圖的垂直或水平軸的指定數(shù)值上畫出垂直或水平線作為參考線,可以使用如下選項(xiàng):verf=100 400 1000 (三條水平參考線)href=01mar20d 01oct20d (兩條垂直參考線)還可以用VERFCHAR或HREFCHAR=字符定義參考線的畫線符號。(3). 關(guān)于圖形輪廓的任選項(xiàng)BOX選項(xiàng)可以畫出邊框圍住整個(gè)圖形,而不僅僅是畫出底部

8、和左邊框。VPOS或HPOS=軸長度,規(guī)定水平或垂直軸上打印輸出的數(shù)目。(4). 關(guān)于作等值線(層次圖)的任選項(xiàng)當(dāng)要求散點(diǎn)(x,y)的作圖符號能根據(jù)z(通常z=f(x,y))值的大小規(guī)定不同的層次強(qiáng)度字符時(shí),也就是相同z值的點(diǎn)用相同的作圖符號,不同z值的點(diǎn)用不同的作圖符號,但最多只能把z值分成10個(gè)層次的不同值。我們可以使用如下選項(xiàng):plot x*y=z /contour=3 s1=A s2=+ s3=* ;plot x*y=z /contour=3語句說明:=z指定按Z變量的內(nèi)容確定散點(diǎn)作圖符號,選項(xiàng)contour=3規(guī)定三個(gè)層次強(qiáng)度,s1=A s2=+ s3=*按上升順序給出層次強(qiáng)度的作圖

9、符號。用戶自己可以不定義S1、S2、S3的層次強(qiáng)度的作圖符號,而使用缺省值。下面我們舉例說明PLOT語句中選項(xiàng)的使用。例如,繪制上證指數(shù)周線數(shù)據(jù)集INDEXSH的散點(diǎn)圖時(shí),根據(jù)股票技術(shù)分析的需要,要畫支撐和阻力線,以及趨勢變異的時(shí)間和周期,這對以后的各種分析都很重要。我們可以通過調(diào)整縱橫坐標(biāo)軸的刻度和增加水平和垂直參考線來實(shí)現(xiàn)。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc plot Data=Study.IndexSh Vpct=50 Hpct=80 Formchar=|-|- ;plot close*date=+ /haxis=21dec90d to

10、01jan93d by 98 vaxis=100 200 400 800 1600href=16aug91d 30apr92d 20nov92dvref=96 135 400 1429 ;title1 Shanghai StockIndex ;title2 21dec90-01jan93 ;Run ;程序的運(yùn)行結(jié)果顯示在OUTPUT窗口中,見圖202所示。圖202 用PLOT過程定制重疊散點(diǎn)圖輸出解釋:對上證指數(shù)從1990年12月21日開市到1993年1月1日的交易數(shù)據(jù)進(jìn)行分析,主要經(jīng)歷三種市場狀況:第一種市場狀況是從1990年12月21日到1991年7月底8月初,在96點(diǎn)至135點(diǎn)之間盤整筑

11、底,歷經(jīng)大約3134周,形成W底;第二種市場狀況是從1991年8月中旬有效突破阻力線135,形成穩(wěn)步盤升單邊市,至1992年4月24日歷經(jīng)大約2831周;第三種市場狀況是從1992年4月30日至1992年11月20,在400點(diǎn)一線開始飆升沖頂1429,最后回落原地400點(diǎn),歷經(jīng)大約29周。從上面的分析我們可以看到,水平和垂直參考線提供了一種看得見的暗示。技術(shù)分析的目的就是找到購買資產(chǎn)的適宜點(diǎn),盡可能地識別一種趨勢結(jié)束且另一種趨勢開始的點(diǎn),然后可作出適宜的交易。二. 生成高分辨率圖形雖然PROC PLOT過程生成的散布圖對基本數(shù)據(jù)分析是有用的,但是為了更詳細(xì)的分析和表達(dá)目的也可用PROC GPL

12、OT過程來生成高分辨率圖形。1 GOPITONS語句通常,當(dāng)在使用PROC GPLOT和PROC GCHART等能生成高分辨率圖形的過程時(shí),要用到系統(tǒng)的一些特定特征,因此,要求指定圖形設(shè)備和計(jì)算機(jī)系統(tǒng)的一些另外可能的選擇。用下列GOPITONS語句能規(guī)定一個(gè)圖形設(shè)備以運(yùn)行SAS/GRAPH軟件。 Goptions device=圖形設(shè)備 ;例如,如果我們要指定圖形輸出設(shè)備為Windows環(huán)境下的黑白打印機(jī):Goptions device=winprtm ;例如,如果我們要指定圖形輸出設(shè)備為Windows環(huán)境下的彩色打印機(jī):Goptions device=winprtc ;另外,我們還可以通過選

13、擇菜單命令Globals/Options/Global options或Globals/Graph/File/Print/SAS Graph Driver來設(shè)定圖形輸出設(shè)備。2 PROC GPLOT過程生成高分辨率圖形的PROC GPLOT過程的一般使用格式如下:Porc Gplot DATA=數(shù)據(jù)集 ;Plot 縱坐標(biāo)變量Y*橫坐標(biāo)變量X;Symboln ;Axisn ;Run ;使用PROC GPLOT過程和PROC PLOT過程的區(qū)別,對于PROC GPLOT語句,PROC PLOT語句中的VPCT和HPCT等選項(xiàng)不可使用。兩者的PLOT語句使用方法基本相同。最主要的區(qū)別是,在PROC

14、GPLOT過程中,可使用SYMBOLn語句和AXISn語句。3 用SYMBOLn語句定義線和符號SYMBOLn語句的主要作用:可以定義數(shù)據(jù)點(diǎn)的符號,可以定義數(shù)據(jù)點(diǎn)之間的連接方式,可以定義數(shù)據(jù)點(diǎn)和線的顏色。SYMBOLn語句的n取值范圍從1到99,缺省值是1,n代表Y*X兩個(gè)變量形成數(shù)據(jù)連線的系列數(shù)。一些主要選項(xiàng)如下:l V=數(shù)據(jù)點(diǎn)圖形符號數(shù)據(jù)點(diǎn)的符號有NONE(沒有)、PLUS(缺省值加號)、STAR(星號)、SQUAR(小方塊)、DIAMOND(小菱形)、TRANGLE(三角形)、CIRCLE(小圓圈)。l I=數(shù)據(jù)點(diǎn)間連接方式常用的連接有NONE(沒有)、JOIN(直線)、SPLINE(平

15、滑)、NEEDLE(從數(shù)據(jù)點(diǎn)到橫坐標(biāo)畫垂直線)、HILOC(最高、最低、收盤價(jià))、RL(直線回歸線)、BOX25(盒形線)。l W=連線的線寬例如w=5。l H=圖形符號的高度例如h=2.5。l L=定義連線的類型例如l=2。l C=定義顏色例如c=red。l FONT=定義一種字體例如font=swissb。SYMBOLn語句所定義的各種選現(xiàn),由于數(shù)量眾多,用戶一般很難記憶,我們上面所列出的僅僅是一小部分。通??梢栽诿钶斎肟蛑邪l(fā)布SYMBOL命令,調(diào)出SYMBOL窗口,在選項(xiàng)參數(shù)的橫線上鍵入?后,在參數(shù)對話框中選擇參數(shù)。共有14項(xiàng)參數(shù)選現(xiàn),每項(xiàng)中還有許多參數(shù)值。一個(gè)SYMBOLn語句一旦被

16、定義就一直保持有效,直到重新定義或者退出SAS系統(tǒng)。執(zhí)行一個(gè)不帶任何選項(xiàng)的SYMBOLn語句將取消SYMBOLn的全部定義,并不影響其它的SYMBOL語句。如果想要取消所有的SYMBOL語句定義,提交下面的語句:goptions reset=symbol ;4 用AXISn語句定義坐標(biāo)軸在PROC GPLOT中,可以通過PLOT語句的選項(xiàng)、LABEL語句和FORMAT語句來修飾坐標(biāo)軸。PLOT語句的選項(xiàng)允許控制坐標(biāo)軸的刻度、文本和顏色。但使用AXISn語句的選項(xiàng)可以更集中、更方便地控制和管理坐標(biāo)軸。常見的使用格式如下:Proc Gplot DATA=數(shù)據(jù)集 ;Plot Y*X / vaxis=

17、axis1 haxis=axis2 ;Symboln ;axis1 label=(Price) order=(100 to 1500 by 200 ) offset=(20,10) ;axis2 label=(Date) order=(21dec90d to 01jan93d by 98 ) ;Run ;AXISn語句的LABEL選項(xiàng)規(guī)定該軸的標(biāo)簽,ORDER選項(xiàng)規(guī)定該軸的取值范圍,OFFSET選項(xiàng)規(guī)定從該軸的原點(diǎn)開始的第一個(gè)主刻度空間大小,及從該軸最末端到最后一個(gè)刻度的空間大小。例如語句中的OFFSET=(20,10),當(dāng)單位是PCT時(shí),表示第一個(gè)主刻度空間為圖形輸出區(qū)域的20%,最后一個(gè)刻

18、度的空間為圖形輸出區(qū)域的10%。有時(shí)需要給圖形加第二根縱軸,用來表示在同一時(shí)間期間上的另一個(gè)變量。兩個(gè)變量不用同一縱坐標(biāo)軸的原因,常常是兩個(gè)變量的值的相差太大,如果兩個(gè)變量的值顯示在同一縱軸上,在圖形上就會(huì)很難分辨值較小那個(gè)變量的值的變化。定義第二根縱軸(右軸)的方法如下:Porc Gplot DATA=數(shù)據(jù)集 ;Plot Y1*X / vaxis=axis1 haxis=axis2 ;Plot2 Y2*X / vaxis=axis3 ;Symboln ;axis1 ;axis2 ;axis3 ;Run ;用第二條PLOT2語句定義了第二根縱軸AXIS3。例如,我們要在同一圖形上繪制上證指數(shù)的

19、最高-最低-收盤價(jià)和交易量的圖形。由于價(jià)格和交易量的取值范圍不同且相差懸殊,交易量用左邊的縱軸來度量,價(jià)格采用右邊的縱軸來度量。要生成最高-最低-收盤價(jià)圖,原來INDEXSH數(shù)據(jù)集中的數(shù)據(jù)排列格式不符合要求,需要用數(shù)據(jù)步修改INDEXSH為INDEXSH2,將一條觀測中最高HIGH、最低LOW、收盤價(jià)CLOSE三個(gè)數(shù)據(jù),轉(zhuǎn)換成三條觀測中VALUE變量的數(shù)據(jù),且三條觀測的日期DATE不變。程序如下:Libname study d:sasdatamydir ;data study.indexsh2;set study.indexsh;value=high; output;value=low; ou

20、tput;value=close; output;Run ;Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Proc gplot data=study.indexsh2;plot volume*date /vaxis=axis1 hvxis=axis2;plot2 value*date /vaxis=axis3 vref=0;symbol1 i=needle;symbol2 i=hiloc;axis1 label=(Volume) order=( 0 t

21、o 700000 by 100000) offset=(0,50) ;axis2 label=(Date) order=(21dec90d to 01jan93d by 98) ;axis3 label=(Price) order=(0 to 1500 by 100) offset=(25,0) ;title Shanghai StockIndex;Run ;程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見圖203所示。圖203 用GPLOT過程定制的價(jià)格和成交量圖在用PROC GPLOT過程繪制高分辨率的前,首先把繪圖的數(shù)據(jù)轉(zhuǎn)換和處理成能符合I=HOLOC連接方式的數(shù)據(jù)格式,另外為了確保在生成圖形時(shí)

22、,各種符號定義準(zhǔn)確,一般先使用GOPTIONS語句,清除先前定義各種符號(RESET=GLOBAL),然后再定義將在圖中使用的全局符號體系。三. 散布圖散布圖又稱散點(diǎn)圖或相關(guān)圖。它是以散點(diǎn)的分布反映變量之間相關(guān)情況的統(tǒng)計(jì)圖。根據(jù)圖中的各點(diǎn)分布和密集程度,大致可以判斷變量之間協(xié)變關(guān)系的類型。在回歸模型中,常用散布圖來描述變量之間的相關(guān)關(guān)系,橫軸上自變量的改變將引起縱軸上因變量的改變,回歸模型中參數(shù)的計(jì)算。是通過使因變量的理論值與實(shí)際值之間偏差的平方和達(dá)到最小而得到的。為了便于理解散布圖在回歸模型中的應(yīng)用,我們先用已知的線性方程來虛擬構(gòu)造一組樣本數(shù)據(jù),畫出散布圖,從圖中各散點(diǎn)形成的趨勢看,是否符合

23、線性關(guān)系,然后決定用線性回歸模型求回歸方程,作為對總體回歸直線的近似,必須進(jìn)行統(tǒng)計(jì)檢驗(yàn)才能確定這種近似是否恰當(dāng),最后我們可以得到確認(rèn)的總體回歸方程,再比較我們已知的方程,應(yīng)該發(fā)現(xiàn)非常接近。例如,新創(chuàng)建的數(shù)據(jù)集LINE,是我們用身高(HEIGH)=體重(WEIGHT)+100這樣一個(gè)簡單直線方程來生成的模擬數(shù)據(jù)集。數(shù)據(jù)集中有一組高度HEIGH和體重WEIGHT的觀測值。假設(shè)我們需要繪制回歸直線及置信帶等??梢韵犬嫵龈叨葘w重的散布圖進(jìn)行觀察和分析,然后利用回歸過程建立高度(因變量)和體重(自變量)的線性方程式后,進(jìn)一步可畫出高度預(yù)測值對體重的散布圖進(jìn)行比較和分析。程序如下:Libname stu

24、dy d:sasdatamydir;data study.line ;do n=1 to 200 by 1;weight=40+60*ranuni(1) ;height=1*weight+100+5*normal(1) ;output ;end ;Proc reg data=study.line;model height=weight; output out=study.linereg p=predict ;proc gplot data=study.linereg ;plot height*weight predict*weight / overlay;symbol1 v=dot c=red

25、 i=none;symbol2 v=none c=blue i=spline;Run ;程序說明:數(shù)據(jù)步DATA自動(dòng)生成200條觀測,SAS系統(tǒng)提供了兩個(gè)均勻分布的隨機(jī)函數(shù)RANUNI()和UNIFORM()產(chǎn)生01之間的隨機(jī)數(shù),用隨機(jī)函數(shù)構(gòu)成的40+60*ranuni(1)表達(dá)式,將使WEIGHT變量的取值范圍為40100公斤之間的隨機(jī)值。SAS系統(tǒng)還提供了兩個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)函數(shù)NORMAL()和RANNOR(),產(chǎn)生均值為0標(biāo)準(zhǔn)差為1標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù)。隨機(jī)數(shù)表達(dá)式1*weight+100+5*normal(1) 是經(jīng)過線性變換產(chǎn)生的均值為1*weight+100,標(biāo)準(zhǔn)差為5的隨機(jī)數(shù),對于

26、正態(tài)分布將有95%的數(shù)據(jù)落在均值附近的兩個(gè)標(biāo)準(zhǔn)差之內(nèi),例如,對于weight=50來說,身高的均值為50+100=150,因此將有95%可能HEIGHT變量的取值范圍為140160厘米。PROC REG回歸過程,首先建立輸入為WEIGHT輸出為HEIGHT的回歸模型,并用OUTPUT語句創(chuàng)建包含身高預(yù)測值的輸出數(shù)據(jù)集,定義輸出數(shù)據(jù)集名為Study.LineReg,定義存放預(yù)測值的變量名為PREDICT。最后用PROC GPLOT過程把實(shí)際高度對重量及預(yù)測高度對重量兩張散布圖重疊放在一張圖上,通常兩張圖應(yīng)該用不同的作圖字符來表示散點(diǎn),實(shí)際高度對重量用無任何連線的小圓點(diǎn)表示,預(yù)測高度對重量用平滑曲

27、線連接散點(diǎn)。高分辨率的輸出圖形顯示在GRAPH窗口,在OUTPUT窗口還顯示輸出PROC REG過程的統(tǒng)計(jì)報(bào)告,如下所示:Model: MODEL1Dependent Variable: HEIGHT Analysis of Variance Sum of Mean Source DF Squares Square F Value ProbF Model 1 58792.37183 58792.37183 2524.881 0.0001 Error 198 4610.47060 23.28521 C Total 199 63402.84243 Root MSE 4.82547 R-square

28、 0.9273 Dep Mean 170.67056 Adj R-sq 0.9269 C.V. 2.82736 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T|INTERCEP 1 97.812209 1.48957643 65.664 0.0001WEIGHT 1 1.033179 0.02056151 50.248 0.0001從回歸分析報(bào)告中我們看出,對樣本回歸直線與觀測值之間的擬合程度的檢驗(yàn)(也稱擬合優(yōu)度檢驗(yàn))用判定系數(shù)R2檢驗(yàn),R2的取值范圍

29、01,越接近1,擬合程度越好;反之越差。本例中R2為0.9273,調(diào)整后的R2也為0.9269,非常接近于1。還有參數(shù)顯著性檢驗(yàn)(T檢驗(yàn))和回歸總體線性的顯著性檢驗(yàn)(F檢驗(yàn))都顯示高度顯著。我們可以確認(rèn)回歸模型的估計(jì)式為:HEIGHT=1.033179*WEIGHT+97.812209SAS系統(tǒng)的許多圖形過程都帶有統(tǒng)計(jì)計(jì)算,許多統(tǒng)計(jì)分析過程都帶有圖形輸出。PROC GPLOT畫圖過程就帶有回歸模型的預(yù)測值和置信帶計(jì)算,并用曲線連接。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swis

30、sb colors=(back) ;proc gplot data=study.line ;plot height*weight height*weight /vaxis=axis1 haxis=axis2 overlay;symbol1 i=none v=dot cv=black h=1.5 ;symbol2 i=rlcli95 ci=black cv=black co=black w=2.5 L=1;axis1 label=(Height) order=(130 to 210 by 10) ;axis2 label=(Weight) order=(40 to 100 by 10) ;tit

31、le Linear Regression;Run ;程序說明:對樣本數(shù)據(jù)集STUDY.LINE不先調(diào)用統(tǒng)計(jì)計(jì)算過程求回歸預(yù)測值,而是直接繪制實(shí)際身高對體重的兩張重疊散點(diǎn)圖。然后對第二張圖的連接方式I選項(xiàng)確定為RLCLI95,分成三部分含義:RL表示作直線回歸,還可用表示作2次回歸RQ和RQ0(消除截距,強(qiáng)制線經(jīng)過原點(diǎn))代替,或表示作3次回歸的RC、RC0代替;CLI表示作單個(gè)預(yù)測值的置信帶,可用CLM代替,表示作均數(shù)的置信帶;95表示置信度為95%,另有兩個(gè)可用值為90和99。有關(guān)散布圖中I選項(xiàng)的回歸參數(shù)取值,可在SYMBOL窗口的TYPE參數(shù)選項(xiàng)橫線上鍵入?后,再選擇User regress

32、 analysis子菜單來查看或選定。CI表示回歸線的顏色,CO表示置信帶的顏色,CV表示散點(diǎn)的顏色,W表示連接線的寬度,L表示連接線的類型。程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見圖214所示。圖中大約有5%的數(shù)據(jù)點(diǎn)落在兩條虛線構(gòu)成的置信帶之外。圖204 一元線性回歸和95%置信限四. 折線圖折線圖又稱曲線圖,是用線段的升降來說明現(xiàn)象變動(dòng)情況的一種統(tǒng)計(jì)圖,它主要用于表現(xiàn)在時(shí)間上的變化趨勢、現(xiàn)象的分配情況和兩個(gè)現(xiàn)象之間的依存關(guān)系等。折線圖常應(yīng)用于時(shí)間序列模型中,把有關(guān)時(shí)間序列的數(shù)據(jù)繪制成圖形。廣義上說,模型可劃分為回歸模型與時(shí)間序列模型。從數(shù)學(xué)角度看,時(shí)間序列數(shù)據(jù)的建模是構(gòu)造一個(gè)包含時(shí)間序列本

33、身、推薦函數(shù)的殘差以及可選擇的其它時(shí)間序列的函數(shù)。我們所觀測到時(shí)間序列的值是時(shí)間序列過程的實(shí)現(xiàn)。用描述方法判定時(shí)間序列數(shù)據(jù)的趨勢后,技術(shù)分析人員往往要對該序列建立模型并預(yù)測它們的將來值。用時(shí)間序列的數(shù)據(jù)建立模型時(shí),可以去掉序列的確定分量,也可以對確定部分建立一個(gè)明確的模型。利用時(shí)間序列的其它組成部分建模后,把確定部分也加進(jìn)去形成最終模型。例如,股票價(jià)格趨向于沿看得見可識別的趨勢移動(dòng),技術(shù)分析想盡可能地識別趨勢并在趨勢反轉(zhuǎn)點(diǎn)改變投資。然而,由于隨機(jī)波動(dòng)遮掩了反轉(zhuǎn)點(diǎn)或使反轉(zhuǎn)點(diǎn)錯(cuò)誤地出現(xiàn),因此技術(shù)分析必須借助于估計(jì)序列成分(包括趨勢周期計(jì)算、季節(jié)和交易日方式的循環(huán)和非規(guī)則成分的循環(huán))或計(jì)算序列的移動(dòng)

34、平均來估計(jì)序列的趨勢。直接使用一些股票市場的時(shí)間序列數(shù)據(jù)繪制折線圖,全部趨勢可能難以直觀識別。如果移去非趨勢成分會(huì)使趨勢更容易顯現(xiàn)??梢允褂肧AS/ETS軟件中PROC X11過程來估計(jì)和調(diào)節(jié)序列成分。作為對使用PROC X11過程去估計(jì)趨勢成分的一種補(bǔ)充,可以采用平滑時(shí)間序列的數(shù)據(jù)的方法,以便移去隨機(jī)波動(dòng)從而揭示數(shù)據(jù)中的趨勢。一般地,通過計(jì)算數(shù)據(jù)的移動(dòng)平均可實(shí)現(xiàn)數(shù)據(jù)的平滑。移動(dòng)平均有很多種類,主要有簡單移動(dòng)平均、加權(quán)移動(dòng)平均和指數(shù)加權(quán)移動(dòng)平均,最優(yōu)長度依賴于使用的時(shí)間結(jié)構(gòu)。理解了數(shù)據(jù)中有關(guān)趨勢的知識,將有助于買、賣和持有股票的決定及交易的時(shí)機(jī)。下面,我們首先對上證指數(shù)INDEXSH數(shù)據(jù)集計(jì)算

35、簡單的、加權(quán)的和指數(shù)加權(quán)的移動(dòng)平均線。然后繪制原始序列和移動(dòng)平均的圖形。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname Study “d:sasdatamydir”;Data study.indexma ;Set study.indexsh ; Ma10=(close+lag(close)+lag2(close) +lag3(close) +lag4(close) +lag5(close)+lag6(close)+lag7(cl

36、ose) +lag8(close) +lag9(close)/10; Wma10=(10*close+9*lag(close)+8*lag2(close)+7*lag3(close)+6*lag4(close) +5*lag5(close)+4*lag6(close)+3*lag7(close)+2*lag8(close)+lag9(close)/55 ; W1=0.3 ; retain ewma1 ; If _n_=1 then ewma1=close ; else ewma1=w1*close+(1-w1)*ewma1 ; W2=0.75 ; retain ewma2 ; If _n_2

37、then ewma2=ewma1 ; else ewma2=w2*ewma1+(1-w2)*ewma2 ;Proc gplot data=study.indexma ;plot close*date ma10*date /vaxis=axis1 haxis=axis2 overlay ;symbol1 i=join v=none L=1 h=2.5 ;symbol2 i=join v=none L=1 h=2.5 w=2;axis1 label=(Price) logbase=10 order=(100 200 400 800 1600 3200);axis2 label=(Date) ;ti

38、tle Shanghai StockIndex;Title2 Close and MoveAverage;Run ;程序說明:DATA數(shù)據(jù)步創(chuàng)建了一個(gè)名為INDEXMA數(shù)據(jù)集,共生成了四種移動(dòng)平均線,使用滯后函數(shù)LAGn()生成了收盤價(jià)CLOSE的十日簡單移動(dòng)平均線MA10和十日加權(quán)移動(dòng)平均線WMA10;用平滑因子W1生成一次指數(shù)加權(quán)移動(dòng)平均EWMA1,用平滑因子W2生成二次指數(shù)加權(quán)移動(dòng)平均EWMA2,平滑因子值較大,則對最近的序列值給出較大的權(quán)數(shù),作為一個(gè)一般原則,較小的平滑因子適于緩緩改變的趨勢序列,而較大的平滑因子適于快速改變的易變序列。IFTHENELSE語句作用是將初始化處理和后面的

39、正常處理分開來。RETAIN語句作用是從DATA步這次到下次重復(fù)時(shí),保留變量EWMA1和EWMA2的值。調(diào)用PROC GPLOT過程繪制了收盤價(jià)和十日簡單移動(dòng)平均的圖形,其中對縱軸(Price)定義的AXIS1語句中加上了LOGBASE=10(或PI或e)的選項(xiàng),就表示該軸是以10為底的對數(shù)軸。程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見圖215所示圖215 對時(shí)間序列的數(shù)據(jù)用移動(dòng)平均估計(jì)趨勢除了用DATA數(shù)據(jù)步直接計(jì)算移動(dòng)平均外,我們還可以用SAS/ETS軟件的EXPAND過程來生成時(shí)間序列數(shù)據(jù)的簡單、加權(quán)和中心移動(dòng)平均,用SAS/QC軟件的MACONTROL過程生成一致加權(quán)和指數(shù)加權(quán)的移動(dòng)平均控制圖表。 五. 層次圖PROC PLOT過程還能繪制層次圖,又稱等值線圖或輪廓圖。在地理學(xué)研究中用來繪制等高線,在經(jīng)濟(jì)學(xué)研究中常用來畫等值的利潤曲線。例如線性規(guī)劃中的產(chǎn)品混合問題,經(jīng)濟(jì)學(xué)的一個(gè)核心問題是在有限的資源情況下,如何合理的分配資源,使效益最大化。假設(shè)我們要生產(chǎn)兩種產(chǎn)品X和Y,但受到時(shí)間T、空間S、能力C三種資源約束的,在已知兩個(gè)產(chǎn)品的單位利潤為f1(x)和f2(y)情況下,各生產(chǎn)產(chǎn)品X和Y多少數(shù)量,才能使利潤Z最大化。即:時(shí)間資源約

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論