




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二十課 散布圖、折線圖和層次圖SAS系統(tǒng)中繪制散布圖、折線圖和層次圖,使用PROC PLOT過(guò)程和PROC GPLOT過(guò)程。PROC PLOT過(guò)程是用來(lái)畫(huà)易生成的低分辯率的圖形,輸出在OUTPUT窗口。而PROC GPLOT過(guò)程是用來(lái)生成定制的、高分辨率的圖形,輸出在GRAPH窗口,并且還可以對(duì)輸出的圖形進(jìn)行編輯修改。一. PROC PLOT過(guò)程使用PLOT過(guò)程可以在兩個(gè)不同的坐標(biāo)系中對(duì)兩個(gè)變量作散布圖、折線圖、半對(duì)數(shù)圖和層次圖。用于數(shù)據(jù)處理中,直觀地了解數(shù)據(jù)的變化趨勢(shì)和數(shù)據(jù)間的相互關(guān)系等。它的一般形式為:Proc Plot DATA=數(shù)據(jù)集 ;Plot 縱坐標(biāo)變量Y*橫坐標(biāo)變量X;Run
2、; 1 PROC PLOT語(yǔ)句PROC PLOT語(yǔ)句中的選項(xiàng)列表主要分成三類(lèi):有關(guān)圖形的坐標(biāo)軸選項(xiàng)、有關(guān)外觀的選項(xiàng)和有關(guān)圖形大小的選項(xiàng)。其中圖形大小的兩個(gè)選項(xiàng)較為常用:l VPCT=百分比列表規(guī)定產(chǎn)生圖形在垂直方向占一頁(yè)的百分比。例如VPCT=33表示這張輸出圖占一頁(yè)的33%,即占一頁(yè)的1/3,所以一頁(yè)可以縱向打印3張圖。VPCT=50 25 25表示每一頁(yè)在縱向打印3張圖,第一張占全頁(yè)的一半,第二和第三張各占1/4頁(yè)。VPCT=200表示要求輸出圖占2頁(yè)的長(zhǎng)度。l HPCT=百分比列表規(guī)定產(chǎn)生圖形在水平方向占一頁(yè)的百分比。2 PLOT語(yǔ)句PLOT語(yǔ)句里首先要規(guī)定數(shù)據(jù)集中的哪兩個(gè)變量作為圖形中
3、的垂直變量和水平變量,以及在圖形中用于畫(huà)點(diǎn)的作圖字符。PLOT語(yǔ)句的幾種使用格式如下:plot y*x ;plot y*x =+;plot y*x=符號(hào)變量 ;plot y*x $ 標(biāo)記變量 =+;plot y*x=+ b*a=* /overlay ;第一條語(yǔ)句作圖符號(hào)用缺省形式,依此用英文大寫(xiě)字母A、B、CZ作為作圖符號(hào)。當(dāng)觀測(cè)的條數(shù)較多時(shí),低分辯率圖不可能畫(huà)出所有觀測(cè)的點(diǎn),所以當(dāng)圖中的某一點(diǎn)表示有一條觀測(cè)的點(diǎn)時(shí),用作圖符號(hào)A;當(dāng)圖中的某一點(diǎn)表示有二條觀測(cè)的點(diǎn)時(shí),用作圖符號(hào)B;以此類(lèi)推。例如,輸出圖中有一個(gè)Z符號(hào),表示在這點(diǎn)上共有26條觀測(cè)的點(diǎn)或更多點(diǎn)。對(duì)于PROC GPLOT過(guò)程默認(rèn)的作圖
4、符號(hào)為加號(hào)(+)。第二條語(yǔ)句用等號(hào)(=)規(guī)定一個(gè)字符作為作圖符號(hào)。此例中每個(gè)散點(diǎn)用加號(hào)(+)表示。第三條語(yǔ)句用等號(hào)(=)規(guī)定一個(gè)變量的值作為作圖符號(hào),變量可以是字符變量,也可以是數(shù)值變量。此時(shí),每個(gè)散點(diǎn)的作圖符號(hào)用數(shù)據(jù)集中同一條觀測(cè)的這個(gè)符號(hào)變量的值表示。例如,假定為=SEX變量,則作圖符號(hào)為SEX變量的值F或M。第四條語(yǔ)句用符號(hào)($)規(guī)定一個(gè)變量的值用于標(biāo)記圖中的散點(diǎn)。此例中每個(gè)散點(diǎn)不僅用加號(hào)(+)表示,而且還標(biāo)出了圖中每一個(gè)散點(diǎn)在數(shù)據(jù)集的同一條觀測(cè)中這個(gè)標(biāo)記變量的值。第五條語(yǔ)句規(guī)定在同一張圖上重疊兩個(gè)圖,當(dāng)然可以重疊更多的圖。OVERLAY選項(xiàng)要求定義在PLOT語(yǔ)句中的幾個(gè)圖打印在一張圖上
5、。例如,我們有一個(gè)上證指數(shù)周線數(shù)據(jù)集INDEXSH,包含日期變量DATE、成交量變量VOLUME、開(kāi)盤(pán)價(jià)變量OPEN、最高價(jià)變量HIGH、最低價(jià)變量LOW、收盤(pán)價(jià)變量CLOSE和漲跌百分比CHANGE,用PROC PLOT過(guò)程定制一個(gè)指數(shù)對(duì)交易周的最高和最低價(jià)的重疊散點(diǎn)圖。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc Plot Data=Study.IndexSh Vpct=50 Hpct=70 Formchar=|-|- ;Where date01feb91 d ;Plot high*date=+ low*date $low =- /overlay ;
6、Run ;程序的運(yùn)行結(jié)果顯示在OUTPUT窗口中,見(jiàn)圖201所示(為顯示清晰起見(jiàn),窗口的大小和顯示內(nèi)容的位置移動(dòng)過(guò))。圖201 用PLOT過(guò)程定制重疊散點(diǎn)圖3 PLOT語(yǔ)句中的選項(xiàng)PLOT語(yǔ)句除了上述的重疊作圖選項(xiàng)OVERLAY外,還有幾類(lèi)重要的選項(xiàng)如下:(1). 關(guān)于坐標(biāo)軸刻度的任選項(xiàng)用VAXIS(或HAXIS)=標(biāo)記值列表,定義沿垂直(或水平)坐標(biāo)軸相等間隔的刻度標(biāo)記值。可以用BY n的方式規(guī)定刻度的增量。這些值可以是均勻上升或下降,也可以不是,既可以是數(shù)字值,也可以日期時(shí)間值。幾種可能的選項(xiàng)格式如下:haxis=0 to 100 by 5haxis=01jan20d to 31dec20
7、d by 7vaxis=1 10 100 100 1000haxis=by 10其它還有VEXPAND(或HEXPAND)、VREVERSE(或HREVERSE)、VZERO(或HZERO)等有關(guān)坐標(biāo)軸刻度選項(xiàng)。(2). 關(guān)于參考線的任選項(xiàng)如果要求在散布圖的垂直或水平軸的指定數(shù)值上畫(huà)出垂直或水平線作為參考線,可以使用如下選項(xiàng):verf=100 400 1000 (三條水平參考線)href=01mar20d 01oct20d (兩條垂直參考線)還可以用VERFCHAR或HREFCHAR=字符定義參考線的畫(huà)線符號(hào)。(3). 關(guān)于圖形輪廓的任選項(xiàng)BOX選項(xiàng)可以畫(huà)出邊框圍住整個(gè)圖形,而不僅僅是畫(huà)出底部
8、和左邊框。VPOS或HPOS=軸長(zhǎng)度,規(guī)定水平或垂直軸上打印輸出的數(shù)目。(4). 關(guān)于作等值線(層次圖)的任選項(xiàng)當(dāng)要求散點(diǎn)(x,y)的作圖符號(hào)能根據(jù)z(通常z=f(x,y))值的大小規(guī)定不同的層次強(qiáng)度字符時(shí),也就是相同z值的點(diǎn)用相同的作圖符號(hào),不同z值的點(diǎn)用不同的作圖符號(hào),但最多只能把z值分成10個(gè)層次的不同值。我們可以使用如下選項(xiàng):plot x*y=z /contour=3 s1=A s2=+ s3=* ;plot x*y=z /contour=3語(yǔ)句說(shuō)明:=z指定按Z變量的內(nèi)容確定散點(diǎn)作圖符號(hào),選項(xiàng)contour=3規(guī)定三個(gè)層次強(qiáng)度,s1=A s2=+ s3=*按上升順序給出層次強(qiáng)度的作圖
9、符號(hào)。用戶自己可以不定義S1、S2、S3的層次強(qiáng)度的作圖符號(hào),而使用缺省值。下面我們舉例說(shuō)明PLOT語(yǔ)句中選項(xiàng)的使用。例如,繪制上證指數(shù)周線數(shù)據(jù)集INDEXSH的散點(diǎn)圖時(shí),根據(jù)股票技術(shù)分析的需要,要畫(huà)支撐和阻力線,以及趨勢(shì)變異的時(shí)間和周期,這對(duì)以后的各種分析都很重要。我們可以通過(guò)調(diào)整縱橫坐標(biāo)軸的刻度和增加水平和垂直參考線來(lái)實(shí)現(xiàn)。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc plot Data=Study.IndexSh Vpct=50 Hpct=80 Formchar=|-|- ;plot close*date=+ /haxis=21dec90d to
10、01jan93d by 98 vaxis=100 200 400 800 1600href=16aug91d 30apr92d 20nov92dvref=96 135 400 1429 ;title1 Shanghai StockIndex ;title2 21dec90-01jan93 ;Run ;程序的運(yùn)行結(jié)果顯示在OUTPUT窗口中,見(jiàn)圖202所示。圖202 用PLOT過(guò)程定制重疊散點(diǎn)圖輸出解釋?zhuān)簩?duì)上證指數(shù)從1990年12月21日開(kāi)市到1993年1月1日的交易數(shù)據(jù)進(jìn)行分析,主要經(jīng)歷三種市場(chǎng)狀況:第一種市場(chǎng)狀況是從1990年12月21日到1991年7月底8月初,在96點(diǎn)至135點(diǎn)之間盤(pán)整筑
11、底,歷經(jīng)大約3134周,形成W底;第二種市場(chǎng)狀況是從1991年8月中旬有效突破阻力線135,形成穩(wěn)步盤(pán)升單邊市,至1992年4月24日歷經(jīng)大約2831周;第三種市場(chǎng)狀況是從1992年4月30日至1992年11月20,在400點(diǎn)一線開(kāi)始飆升沖頂1429,最后回落原地400點(diǎn),歷經(jīng)大約29周。從上面的分析我們可以看到,水平和垂直參考線提供了一種看得見(jiàn)的暗示。技術(shù)分析的目的就是找到購(gòu)買(mǎi)資產(chǎn)的適宜點(diǎn),盡可能地識(shí)別一種趨勢(shì)結(jié)束且另一種趨勢(shì)開(kāi)始的點(diǎn),然后可作出適宜的交易。二. 生成高分辨率圖形雖然PROC PLOT過(guò)程生成的散布圖對(duì)基本數(shù)據(jù)分析是有用的,但是為了更詳細(xì)的分析和表達(dá)目的也可用PROC GPL
12、OT過(guò)程來(lái)生成高分辨率圖形。1 GOPITONS語(yǔ)句通常,當(dāng)在使用PROC GPLOT和PROC GCHART等能生成高分辨率圖形的過(guò)程時(shí),要用到系統(tǒng)的一些特定特征,因此,要求指定圖形設(shè)備和計(jì)算機(jī)系統(tǒng)的一些另外可能的選擇。用下列GOPITONS語(yǔ)句能規(guī)定一個(gè)圖形設(shè)備以運(yùn)行SAS/GRAPH軟件。 Goptions device=圖形設(shè)備 ;例如,如果我們要指定圖形輸出設(shè)備為Windows環(huán)境下的黑白打印機(jī):Goptions device=winprtm ;例如,如果我們要指定圖形輸出設(shè)備為Windows環(huán)境下的彩色打印機(jī):Goptions device=winprtc ;另外,我們還可以通過(guò)選
13、擇菜單命令Globals/Options/Global options或Globals/Graph/File/Print/SAS Graph Driver來(lái)設(shè)定圖形輸出設(shè)備。2 PROC GPLOT過(guò)程生成高分辨率圖形的PROC GPLOT過(guò)程的一般使用格式如下:Porc Gplot DATA=數(shù)據(jù)集 ;Plot 縱坐標(biāo)變量Y*橫坐標(biāo)變量X;Symboln ;Axisn ;Run ;使用PROC GPLOT過(guò)程和PROC PLOT過(guò)程的區(qū)別,對(duì)于PROC GPLOT語(yǔ)句,PROC PLOT語(yǔ)句中的VPCT和HPCT等選項(xiàng)不可使用。兩者的PLOT語(yǔ)句使用方法基本相同。最主要的區(qū)別是,在PROC
14、GPLOT過(guò)程中,可使用SYMBOLn語(yǔ)句和AXISn語(yǔ)句。3 用SYMBOLn語(yǔ)句定義線和符號(hào)SYMBOLn語(yǔ)句的主要作用:可以定義數(shù)據(jù)點(diǎn)的符號(hào),可以定義數(shù)據(jù)點(diǎn)之間的連接方式,可以定義數(shù)據(jù)點(diǎn)和線的顏色。SYMBOLn語(yǔ)句的n取值范圍從1到99,缺省值是1,n代表Y*X兩個(gè)變量形成數(shù)據(jù)連線的系列數(shù)。一些主要選項(xiàng)如下:l V=數(shù)據(jù)點(diǎn)圖形符號(hào)數(shù)據(jù)點(diǎn)的符號(hào)有NONE(沒(méi)有)、PLUS(缺省值加號(hào))、STAR(星號(hào))、SQUAR(小方塊)、DIAMOND(小菱形)、TRANGLE(三角形)、CIRCLE(小圓圈)。l I=數(shù)據(jù)點(diǎn)間連接方式常用的連接有NONE(沒(méi)有)、JOIN(直線)、SPLINE(平
15、滑)、NEEDLE(從數(shù)據(jù)點(diǎn)到橫坐標(biāo)畫(huà)垂直線)、HILOC(最高、最低、收盤(pán)價(jià))、RL(直線回歸線)、BOX25(盒形線)。l W=連線的線寬例如w=5。l H=圖形符號(hào)的高度例如h=2.5。l L=定義連線的類(lèi)型例如l=2。l C=定義顏色例如c=red。l FONT=定義一種字體例如font=swissb。SYMBOLn語(yǔ)句所定義的各種選現(xiàn),由于數(shù)量眾多,用戶一般很難記憶,我們上面所列出的僅僅是一小部分。通??梢栽诿钶斎肟蛑邪l(fā)布SYMBOL命令,調(diào)出SYMBOL窗口,在選項(xiàng)參數(shù)的橫線上鍵入?后,在參數(shù)對(duì)話框中選擇參數(shù)。共有14項(xiàng)參數(shù)選現(xiàn),每項(xiàng)中還有許多參數(shù)值。一個(gè)SYMBOLn語(yǔ)句一旦被
16、定義就一直保持有效,直到重新定義或者退出SAS系統(tǒng)。執(zhí)行一個(gè)不帶任何選項(xiàng)的SYMBOLn語(yǔ)句將取消SYMBOLn的全部定義,并不影響其它的SYMBOL語(yǔ)句。如果想要取消所有的SYMBOL語(yǔ)句定義,提交下面的語(yǔ)句:goptions reset=symbol ;4 用AXISn語(yǔ)句定義坐標(biāo)軸在PROC GPLOT中,可以通過(guò)PLOT語(yǔ)句的選項(xiàng)、LABEL語(yǔ)句和FORMAT語(yǔ)句來(lái)修飾坐標(biāo)軸。PLOT語(yǔ)句的選項(xiàng)允許控制坐標(biāo)軸的刻度、文本和顏色。但使用AXISn語(yǔ)句的選項(xiàng)可以更集中、更方便地控制和管理坐標(biāo)軸。常見(jiàn)的使用格式如下:Proc Gplot DATA=數(shù)據(jù)集 ;Plot Y*X / vaxis=
17、axis1 haxis=axis2 ;Symboln ;axis1 label=(Price) order=(100 to 1500 by 200 ) offset=(20,10) ;axis2 label=(Date) order=(21dec90d to 01jan93d by 98 ) ;Run ;AXISn語(yǔ)句的LABEL選項(xiàng)規(guī)定該軸的標(biāo)簽,ORDER選項(xiàng)規(guī)定該軸的取值范圍,OFFSET選項(xiàng)規(guī)定從該軸的原點(diǎn)開(kāi)始的第一個(gè)主刻度空間大小,及從該軸最末端到最后一個(gè)刻度的空間大小。例如語(yǔ)句中的OFFSET=(20,10),當(dāng)單位是PCT時(shí),表示第一個(gè)主刻度空間為圖形輸出區(qū)域的20%,最后一個(gè)刻
18、度的空間為圖形輸出區(qū)域的10%。有時(shí)需要給圖形加第二根縱軸,用來(lái)表示在同一時(shí)間期間上的另一個(gè)變量。兩個(gè)變量不用同一縱坐標(biāo)軸的原因,常常是兩個(gè)變量的值的相差太大,如果兩個(gè)變量的值顯示在同一縱軸上,在圖形上就會(huì)很難分辨值較小那個(gè)變量的值的變化。定義第二根縱軸(右軸)的方法如下:Porc Gplot DATA=數(shù)據(jù)集 ;Plot Y1*X / vaxis=axis1 haxis=axis2 ;Plot2 Y2*X / vaxis=axis3 ;Symboln ;axis1 ;axis2 ;axis3 ;Run ;用第二條PLOT2語(yǔ)句定義了第二根縱軸AXIS3。例如,我們要在同一圖形上繪制上證指數(shù)的
19、最高-最低-收盤(pán)價(jià)和交易量的圖形。由于價(jià)格和交易量的取值范圍不同且相差懸殊,交易量用左邊的縱軸來(lái)度量,價(jià)格采用右邊的縱軸來(lái)度量。要生成最高-最低-收盤(pán)價(jià)圖,原來(lái)INDEXSH數(shù)據(jù)集中的數(shù)據(jù)排列格式不符合要求,需要用數(shù)據(jù)步修改INDEXSH為INDEXSH2,將一條觀測(cè)中最高HIGH、最低LOW、收盤(pán)價(jià)CLOSE三個(gè)數(shù)據(jù),轉(zhuǎn)換成三條觀測(cè)中VALUE變量的數(shù)據(jù),且三條觀測(cè)的日期DATE不變。程序如下:Libname study d:sasdatamydir ;data study.indexsh2;set study.indexsh;value=high; output;value=low; ou
20、tput;value=close; output;Run ;Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Proc gplot data=study.indexsh2;plot volume*date /vaxis=axis1 hvxis=axis2;plot2 value*date /vaxis=axis3 vref=0;symbol1 i=needle;symbol2 i=hiloc;axis1 label=(Volume) order=( 0 t
21、o 700000 by 100000) offset=(0,50) ;axis2 label=(Date) order=(21dec90d to 01jan93d by 98) ;axis3 label=(Price) order=(0 to 1500 by 100) offset=(25,0) ;title Shanghai StockIndex;Run ;程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見(jiàn)圖203所示。圖203 用GPLOT過(guò)程定制的價(jià)格和成交量圖在用PROC GPLOT過(guò)程繪制高分辨率的前,首先把繪圖的數(shù)據(jù)轉(zhuǎn)換和處理成能符合I=HOLOC連接方式的數(shù)據(jù)格式,另外為了確保在生成圖形時(shí)
22、,各種符號(hào)定義準(zhǔn)確,一般先使用GOPTIONS語(yǔ)句,清除先前定義各種符號(hào)(RESET=GLOBAL),然后再定義將在圖中使用的全局符號(hào)體系。三. 散布圖散布圖又稱(chēng)散點(diǎn)圖或相關(guān)圖。它是以散點(diǎn)的分布反映變量之間相關(guān)情況的統(tǒng)計(jì)圖。根據(jù)圖中的各點(diǎn)分布和密集程度,大致可以判斷變量之間協(xié)變關(guān)系的類(lèi)型。在回歸模型中,常用散布圖來(lái)描述變量之間的相關(guān)關(guān)系,橫軸上自變量的改變將引起縱軸上因變量的改變,回歸模型中參數(shù)的計(jì)算。是通過(guò)使因變量的理論值與實(shí)際值之間偏差的平方和達(dá)到最小而得到的。為了便于理解散布圖在回歸模型中的應(yīng)用,我們先用已知的線性方程來(lái)虛擬構(gòu)造一組樣本數(shù)據(jù),畫(huà)出散布圖,從圖中各散點(diǎn)形成的趨勢(shì)看,是否符合
23、線性關(guān)系,然后決定用線性回歸模型求回歸方程,作為對(duì)總體回歸直線的近似,必須進(jìn)行統(tǒng)計(jì)檢驗(yàn)才能確定這種近似是否恰當(dāng),最后我們可以得到確認(rèn)的總體回歸方程,再比較我們已知的方程,應(yīng)該發(fā)現(xiàn)非常接近。例如,新創(chuàng)建的數(shù)據(jù)集LINE,是我們用身高(HEIGH)=體重(WEIGHT)+100這樣一個(gè)簡(jiǎn)單直線方程來(lái)生成的模擬數(shù)據(jù)集。數(shù)據(jù)集中有一組高度HEIGH和體重WEIGHT的觀測(cè)值。假設(shè)我們需要繪制回歸直線及置信帶等??梢韵犬?huà)出高度對(duì)體重的散布圖進(jìn)行觀察和分析,然后利用回歸過(guò)程建立高度(因變量)和體重(自變量)的線性方程式后,進(jìn)一步可畫(huà)出高度預(yù)測(cè)值對(duì)體重的散布圖進(jìn)行比較和分析。程序如下:Libname stu
24、dy d:sasdatamydir;data study.line ;do n=1 to 200 by 1;weight=40+60*ranuni(1) ;height=1*weight+100+5*normal(1) ;output ;end ;Proc reg data=study.line;model height=weight; output out=study.linereg p=predict ;proc gplot data=study.linereg ;plot height*weight predict*weight / overlay;symbol1 v=dot c=red
25、 i=none;symbol2 v=none c=blue i=spline;Run ;程序說(shuō)明:數(shù)據(jù)步DATA自動(dòng)生成200條觀測(cè),SAS系統(tǒng)提供了兩個(gè)均勻分布的隨機(jī)函數(shù)RANUNI()和UNIFORM()產(chǎn)生01之間的隨機(jī)數(shù),用隨機(jī)函數(shù)構(gòu)成的40+60*ranuni(1)表達(dá)式,將使WEIGHT變量的取值范圍為40100公斤之間的隨機(jī)值。SAS系統(tǒng)還提供了兩個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)函數(shù)NORMAL()和RANNOR(),產(chǎn)生均值為0標(biāo)準(zhǔn)差為1標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù)。隨機(jī)數(shù)表達(dá)式1*weight+100+5*normal(1) 是經(jīng)過(guò)線性變換產(chǎn)生的均值為1*weight+100,標(biāo)準(zhǔn)差為5的隨機(jī)數(shù),對(duì)于
26、正態(tài)分布將有95%的數(shù)據(jù)落在均值附近的兩個(gè)標(biāo)準(zhǔn)差之內(nèi),例如,對(duì)于weight=50來(lái)說(shuō),身高的均值為50+100=150,因此將有95%可能HEIGHT變量的取值范圍為140160厘米。PROC REG回歸過(guò)程,首先建立輸入為WEIGHT輸出為HEIGHT的回歸模型,并用OUTPUT語(yǔ)句創(chuàng)建包含身高預(yù)測(cè)值的輸出數(shù)據(jù)集,定義輸出數(shù)據(jù)集名為Study.LineReg,定義存放預(yù)測(cè)值的變量名為PREDICT。最后用PROC GPLOT過(guò)程把實(shí)際高度對(duì)重量及預(yù)測(cè)高度對(duì)重量?jī)蓮埳⒉紙D重疊放在一張圖上,通常兩張圖應(yīng)該用不同的作圖字符來(lái)表示散點(diǎn),實(shí)際高度對(duì)重量用無(wú)任何連線的小圓點(diǎn)表示,預(yù)測(cè)高度對(duì)重量用平滑曲
27、線連接散點(diǎn)。高分辨率的輸出圖形顯示在GRAPH窗口,在OUTPUT窗口還顯示輸出PROC REG過(guò)程的統(tǒng)計(jì)報(bào)告,如下所示:Model: MODEL1Dependent Variable: HEIGHT Analysis of Variance Sum of Mean Source DF Squares Square F Value ProbF Model 1 58792.37183 58792.37183 2524.881 0.0001 Error 198 4610.47060 23.28521 C Total 199 63402.84243 Root MSE 4.82547 R-square
28、 0.9273 Dep Mean 170.67056 Adj R-sq 0.9269 C.V. 2.82736 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T|INTERCEP 1 97.812209 1.48957643 65.664 0.0001WEIGHT 1 1.033179 0.02056151 50.248 0.0001從回歸分析報(bào)告中我們看出,對(duì)樣本回歸直線與觀測(cè)值之間的擬合程度的檢驗(yàn)(也稱(chēng)擬合優(yōu)度檢驗(yàn))用判定系數(shù)R2檢驗(yàn),R2的取值范圍
29、01,越接近1,擬合程度越好;反之越差。本例中R2為0.9273,調(diào)整后的R2也為0.9269,非常接近于1。還有參數(shù)顯著性檢驗(yàn)(T檢驗(yàn))和回歸總體線性的顯著性檢驗(yàn)(F檢驗(yàn))都顯示高度顯著。我們可以確認(rèn)回歸模型的估計(jì)式為:HEIGHT=1.033179*WEIGHT+97.812209SAS系統(tǒng)的許多圖形過(guò)程都帶有統(tǒng)計(jì)計(jì)算,許多統(tǒng)計(jì)分析過(guò)程都帶有圖形輸出。PROC GPLOT畫(huà)圖過(guò)程就帶有回歸模型的預(yù)測(cè)值和置信帶計(jì)算,并用曲線連接。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swis
30、sb colors=(back) ;proc gplot data=study.line ;plot height*weight height*weight /vaxis=axis1 haxis=axis2 overlay;symbol1 i=none v=dot cv=black h=1.5 ;symbol2 i=rlcli95 ci=black cv=black co=black w=2.5 L=1;axis1 label=(Height) order=(130 to 210 by 10) ;axis2 label=(Weight) order=(40 to 100 by 10) ;tit
31、le Linear Regression;Run ;程序說(shuō)明:對(duì)樣本數(shù)據(jù)集STUDY.LINE不先調(diào)用統(tǒng)計(jì)計(jì)算過(guò)程求回歸預(yù)測(cè)值,而是直接繪制實(shí)際身高對(duì)體重的兩張重疊散點(diǎn)圖。然后對(duì)第二張圖的連接方式I選項(xiàng)確定為RLCLI95,分成三部分含義:RL表示作直線回歸,還可用表示作2次回歸RQ和RQ0(消除截距,強(qiáng)制線經(jīng)過(guò)原點(diǎn))代替,或表示作3次回歸的RC、RC0代替;CLI表示作單個(gè)預(yù)測(cè)值的置信帶,可用CLM代替,表示作均數(shù)的置信帶;95表示置信度為95%,另有兩個(gè)可用值為90和99。有關(guān)散布圖中I選項(xiàng)的回歸參數(shù)取值,可在SYMBOL窗口的TYPE參數(shù)選項(xiàng)橫線上鍵入?后,再選擇User regress
32、 analysis子菜單來(lái)查看或選定。CI表示回歸線的顏色,CO表示置信帶的顏色,CV表示散點(diǎn)的顏色,W表示連接線的寬度,L表示連接線的類(lèi)型。程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見(jiàn)圖214所示。圖中大約有5%的數(shù)據(jù)點(diǎn)落在兩條虛線構(gòu)成的置信帶之外。圖204 一元線性回歸和95%置信限四. 折線圖折線圖又稱(chēng)曲線圖,是用線段的升降來(lái)說(shuō)明現(xiàn)象變動(dòng)情況的一種統(tǒng)計(jì)圖,它主要用于表現(xiàn)在時(shí)間上的變化趨勢(shì)、現(xiàn)象的分配情況和兩個(gè)現(xiàn)象之間的依存關(guān)系等。折線圖常應(yīng)用于時(shí)間序列模型中,把有關(guān)時(shí)間序列的數(shù)據(jù)繪制成圖形。廣義上說(shuō),模型可劃分為回歸模型與時(shí)間序列模型。從數(shù)學(xué)角度看,時(shí)間序列數(shù)據(jù)的建模是構(gòu)造一個(gè)包含時(shí)間序列本
33、身、推薦函數(shù)的殘差以及可選擇的其它時(shí)間序列的函數(shù)。我們所觀測(cè)到時(shí)間序列的值是時(shí)間序列過(guò)程的實(shí)現(xiàn)。用描述方法判定時(shí)間序列數(shù)據(jù)的趨勢(shì)后,技術(shù)分析人員往往要對(duì)該序列建立模型并預(yù)測(cè)它們的將來(lái)值。用時(shí)間序列的數(shù)據(jù)建立模型時(shí),可以去掉序列的確定分量,也可以對(duì)確定部分建立一個(gè)明確的模型。利用時(shí)間序列的其它組成部分建模后,把確定部分也加進(jìn)去形成最終模型。例如,股票價(jià)格趨向于沿看得見(jiàn)可識(shí)別的趨勢(shì)移動(dòng),技術(shù)分析想盡可能地識(shí)別趨勢(shì)并在趨勢(shì)反轉(zhuǎn)點(diǎn)改變投資。然而,由于隨機(jī)波動(dòng)遮掩了反轉(zhuǎn)點(diǎn)或使反轉(zhuǎn)點(diǎn)錯(cuò)誤地出現(xiàn),因此技術(shù)分析必須借助于估計(jì)序列成分(包括趨勢(shì)周期計(jì)算、季節(jié)和交易日方式的循環(huán)和非規(guī)則成分的循環(huán))或計(jì)算序列的移動(dòng)
34、平均來(lái)估計(jì)序列的趨勢(shì)。直接使用一些股票市場(chǎng)的時(shí)間序列數(shù)據(jù)繪制折線圖,全部趨勢(shì)可能難以直觀識(shí)別。如果移去非趨勢(shì)成分會(huì)使趨勢(shì)更容易顯現(xiàn)??梢允褂肧AS/ETS軟件中PROC X11過(guò)程來(lái)估計(jì)和調(diào)節(jié)序列成分。作為對(duì)使用PROC X11過(guò)程去估計(jì)趨勢(shì)成分的一種補(bǔ)充,可以采用平滑時(shí)間序列的數(shù)據(jù)的方法,以便移去隨機(jī)波動(dòng)從而揭示數(shù)據(jù)中的趨勢(shì)。一般地,通過(guò)計(jì)算數(shù)據(jù)的移動(dòng)平均可實(shí)現(xiàn)數(shù)據(jù)的平滑。移動(dòng)平均有很多種類(lèi),主要有簡(jiǎn)單移動(dòng)平均、加權(quán)移動(dòng)平均和指數(shù)加權(quán)移動(dòng)平均,最優(yōu)長(zhǎng)度依賴(lài)于使用的時(shí)間結(jié)構(gòu)。理解了數(shù)據(jù)中有關(guān)趨勢(shì)的知識(shí),將有助于買(mǎi)、賣(mài)和持有股票的決定及交易的時(shí)機(jī)。下面,我們首先對(duì)上證指數(shù)INDEXSH數(shù)據(jù)集計(jì)算
35、簡(jiǎn)單的、加權(quán)的和指數(shù)加權(quán)的移動(dòng)平均線。然后繪制原始序列和移動(dòng)平均的圖形。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname Study “d:sasdatamydir”;Data study.indexma ;Set study.indexsh ; Ma10=(close+lag(close)+lag2(close) +lag3(close) +lag4(close) +lag5(close)+lag6(close)+lag7(cl
36、ose) +lag8(close) +lag9(close)/10; Wma10=(10*close+9*lag(close)+8*lag2(close)+7*lag3(close)+6*lag4(close) +5*lag5(close)+4*lag6(close)+3*lag7(close)+2*lag8(close)+lag9(close)/55 ; W1=0.3 ; retain ewma1 ; If _n_=1 then ewma1=close ; else ewma1=w1*close+(1-w1)*ewma1 ; W2=0.75 ; retain ewma2 ; If _n_2
37、then ewma2=ewma1 ; else ewma2=w2*ewma1+(1-w2)*ewma2 ;Proc gplot data=study.indexma ;plot close*date ma10*date /vaxis=axis1 haxis=axis2 overlay ;symbol1 i=join v=none L=1 h=2.5 ;symbol2 i=join v=none L=1 h=2.5 w=2;axis1 label=(Price) logbase=10 order=(100 200 400 800 1600 3200);axis2 label=(Date) ;ti
38、tle Shanghai StockIndex;Title2 Close and MoveAverage;Run ;程序說(shuō)明:DATA數(shù)據(jù)步創(chuàng)建了一個(gè)名為INDEXMA數(shù)據(jù)集,共生成了四種移動(dòng)平均線,使用滯后函數(shù)LAGn()生成了收盤(pán)價(jià)CLOSE的十日簡(jiǎn)單移動(dòng)平均線MA10和十日加權(quán)移動(dòng)平均線WMA10;用平滑因子W1生成一次指數(shù)加權(quán)移動(dòng)平均EWMA1,用平滑因子W2生成二次指數(shù)加權(quán)移動(dòng)平均EWMA2,平滑因子值較大,則對(duì)最近的序列值給出較大的權(quán)數(shù),作為一個(gè)一般原則,較小的平滑因子適于緩緩改變的趨勢(shì)序列,而較大的平滑因子適于快速改變的易變序列。IFTHENELSE語(yǔ)句作用是將初始化處理和后面的
39、正常處理分開(kāi)來(lái)。RETAIN語(yǔ)句作用是從DATA步這次到下次重復(fù)時(shí),保留變量EWMA1和EWMA2的值。調(diào)用PROC GPLOT過(guò)程繪制了收盤(pán)價(jià)和十日簡(jiǎn)單移動(dòng)平均的圖形,其中對(duì)縱軸(Price)定義的AXIS1語(yǔ)句中加上了LOGBASE=10(或PI或e)的選項(xiàng),就表示該軸是以10為底的對(duì)數(shù)軸。程序的運(yùn)行結(jié)果顯示在GRAPH窗口中,見(jiàn)圖215所示圖215 對(duì)時(shí)間序列的數(shù)據(jù)用移動(dòng)平均估計(jì)趨勢(shì)除了用DATA數(shù)據(jù)步直接計(jì)算移動(dòng)平均外,我們還可以用SAS/ETS軟件的EXPAND過(guò)程來(lái)生成時(shí)間序列數(shù)據(jù)的簡(jiǎn)單、加權(quán)和中心移動(dòng)平均,用SAS/QC軟件的MACONTROL過(guò)程生成一致加權(quán)和指數(shù)加權(quán)的移動(dòng)平均控制圖表。 五. 層次圖PROC PLOT過(guò)程還能繪制層次圖,又稱(chēng)等值線圖或輪廓圖。在地理學(xué)研究中用來(lái)繪制等高線,在經(jīng)濟(jì)學(xué)研究中常用來(lái)畫(huà)等值的利潤(rùn)曲線。例如線性規(guī)劃中的產(chǎn)品混合問(wèn)題,經(jīng)濟(jì)學(xué)的一個(gè)核心問(wèn)題是在有限的資源情況下,如何合理的分配資源,使效益最大化。假設(shè)我們要生產(chǎn)兩種產(chǎn)品X和Y,但受到時(shí)間T、空間S、能力C三種資源約束的,在已知兩個(gè)產(chǎn)品的單位利潤(rùn)為f1(x)和f2(y)情況下,各生產(chǎn)產(chǎn)品X和Y多少數(shù)量,才能使利潤(rùn)Z最大化。即:時(shí)間資源約
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年陜西省交通規(guī)劃設(shè)計(jì)研究院有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年陜西大荔縣城鎮(zhèn)開(kāi)發(fā)投資有限責(zé)任公司招聘筆試參考題庫(kù)含答案解析
- 廣東湛江公開(kāi)招聘社區(qū)工作者考試高頻題庫(kù)帶答案2025年
- 2024年江蘇鎮(zhèn)江事業(yè)單位招聘考試真題答案解析
- 2025年福建泉州市豐澤國(guó)有投資集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025行政人事上半年工作總結(jié)(4篇)
- 市場(chǎng)租賃合同(26篇)
- 2025銷(xiāo)售簡(jiǎn)短個(gè)人工作總結(jié)(8篇)
- 人教版八年級(jí)歷史與社會(huì)上冊(cè)1.1.1古代埃及教學(xué)設(shè)計(jì)
- 2025年幼兒園小班工作計(jì)劃范文(15篇)
- 慢性阻塞性肺疾?。–OPD)課件
- DB12 596.1-2015 道路交通智能管理系統(tǒng)設(shè)施設(shè)置規(guī)范 第1部分:設(shè)施設(shè)置要求
- 安踏組織架構(gòu)分析
- DZ∕T 0221-2006 崩塌、滑坡、泥石流監(jiān)測(cè)規(guī)范(正式版)
- 大眾速騰2009年型電路圖
- 乙炔氣柜施工方案
- 兒童故事小壁虎借尾巴ppt課件
- 《春日》PPT課件
- 屋頂分布式光伏發(fā)電項(xiàng)目資金申請(qǐng)報(bào)告寫(xiě)作模板
- 公路路基土建工程項(xiàng)目拌合站建設(shè)方案詳細(xì)
- 中考講座化學(xué)中考失分分析及教學(xué)對(duì)策ppt課件
評(píng)論
0/150
提交評(píng)論