Sas條形圖、圓餅圖和星形圖[1]重點講義_第1頁
Sas條形圖、圓餅圖和星形圖[1]重點講義_第2頁
Sas條形圖、圓餅圖和星形圖[1]重點講義_第3頁
Sas條形圖、圓餅圖和星形圖[1]重點講義_第4頁
Sas條形圖、圓餅圖和星形圖[1]重點講義_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二十一課 條形圖、圓餅圖和星形圖與PLOT過程和GPLOT過程的關(guān)系一樣,PROC CHART過程是用來畫易生成的低分辨率的圖形,輸出在OUTPUT窗口。而PROC GCHART過程是用來生成訂制的、高分辨率的圖形,輸出在GRAPH窗口。在這里我們將只介紹GCHART過程。使用GCHART圖表可以形象地表示變量的取值大小和兩個以上變量之間的關(guān)系??梢岳L制垂直和水平的條形圖、塊形圖、圓餅圖、星形圖等。一、 PROC GCHART過程的功能和語句說明GCHART過程不僅能把輸入數(shù)據(jù)集中的變量值以各種圖形的方式顯示出來,而且能把輸入數(shù)據(jù)集中的一個或多個變量按分組進行各種統(tǒng)計計算,然后再把統(tǒng)計結(jié)果以

2、圖形的方式顯示出來。也就是說,GCHART過程具有統(tǒng)計和顯示圖表的兩大功能。1. PROC GCHART過程的一般格式GCHART過程一般由下列語句控制:Proc Gchart DATA=數(shù)據(jù)集 ;VBAR 變量列表 </<通用選項列表><VBAR專用選項列表>>HBAR 變量列表 </<通用選項列表><HBAR專用選項列表>>BLOCK 變量列表 </<通用選項列表><BLOCK專用選項列表>>PIE 變量列表 </<通用選項列表><PIE專用選項列表>&

3、gt;STAR 變量列表 </<通用選項列表><STAR專用選項列表>>By 變量列表 ;Run ;在PROC GCHART語句后面可以跟隨著任何多個圖形要求的語句,如上面的VBAR、BLOCK等語句。也就是一個GCHART過程能夠?qū)σ粋€指定的數(shù)據(jù)集畫出任意多個各種不同的圖形。每一個圖形要求語句需要指定一個圖形變量或多個圖形變量用于將它們的值畫圖。由于每個圖形要求語句的選項眾多,將它們的選項分成兩部分:通用選項列表和專用選項列表。所謂通用選項列表是指這些選項可以用在每個圖形要求語句中,而專用選項列表是指這些選項只有本語句可使用。在使用PROC GCHART過

4、程時,常常選用BY語句。BY語句指定一個變量或多個變量后,將按指定的變量進行分組處理,然后按每一個被BY語句指定的變量分組生成分開的圖形。我們以VBAR圖形要求語句為例來說明各個圖形要求語句的基本使用情況。VBAB語句用來列出用戶想要畫的垂直條形圖的那些變量。每個圖形變量對應(yīng)一張垂直條形圖。每張圖表占一頁。垂直條形圖的縱坐標(biāo)軸用來表示頻數(shù)、累計頻數(shù)、百分?jǐn)?shù)、累計百分?jǐn)?shù)、總和或平均值。在每個條形圖的橫坐標(biāo)軸上都標(biāo)有該圖形變量的各個對應(yīng)值。如果圖形變量是字符變量或離散的數(shù)值變量,那么在對應(yīng)的橫坐標(biāo)上將標(biāo)記真實值;如果圖形變量是連續(xù)變量,那么在對應(yīng)的橫坐標(biāo)上將標(biāo)記變量值的區(qū)間中點。除此之外,在PRO

5、C GCHART過程中還可以使用AXISn、LEGENDn、PATTERNn、TITLEn、FOOTNOTEn、NOTE、DONUD語句。2. PROC GCHART過程的三要素由PROC GCHART過程產(chǎn)生圖形要決定以下三個要素:(1) 選擇圖形的表示方法下面的幾種圖形至少要選一種:l VBAR語句繪制垂直條形圖或垂直直方圖。l HBAR語句繪制水平條形圖或水平直方圖。l BLOCK語句繪制塊形圖。l PIE語句繪制圓餅圖。l STAR語句繪制星形圖。通過對上面不同語句的選擇,確定圖形的表示方法。在每種圖形中,由圖表變量確定的值畫出對應(yīng)大小的條圖或線段。(2) 選擇變量的統(tǒng)計量在選定了圖形

6、以后,可以在語句后面的選項中,通過TYPE選項來選擇對變量的不同統(tǒng)計量,TYPE的缺省值是FREQ,然后將統(tǒng)計量以條形或線段表示。統(tǒng)計量的類型有:l TYPE=FREQ統(tǒng)計圖形變量的各個給定值或間隔的頻數(shù)。l TYPE=CFREQ統(tǒng)計圖形變量各個給定值或落入給定區(qū)間的累計頻數(shù)。l TYPE=PCT統(tǒng)計圖形變量各個給定值或落入給定區(qū)間的觀測數(shù)的百分比。l TYPE=CPCT統(tǒng)計圖形變量各個給定值或落入給定區(qū)間觀測數(shù)的累計百分比。l TYPE=SUM統(tǒng)計圖形變量所有值的總和。l TYPE=MEAN統(tǒng)計圖形變量所有值的平均值。例如:VBAR X / TYPE=MEAN 語句,是指對輸入數(shù)據(jù)集中的X變

7、量求平均值,然后將平均值用垂直條形圖顯示。(3) 選擇分組特性可以使用圖形選擇語句后面的一些選項,來控制在語句中指定的圖形變量的分組,下面的選項可控制如何進行分組:l DISCRETE把一個數(shù)字變量當(dāng)成離散變量,而不是連續(xù)變量。把每一個數(shù)字值作為圖形的一個分開的條形或線段。如果省略該選項,過程則假定變量都是連續(xù)的。如果沒有規(guī)定選項MIDPOINTS=或LEVELS=,過程自動選擇圖表的間隔。l GROUP=變量用于對指定變量進行并排分組。l SUBGROUP=變量列表將條形或線段按照指定變量的值分成段。l MIDPOINTS=數(shù)值列表規(guī)定連續(xù)型圖形變量按數(shù)字列表中的中心點數(shù)字次序進行排列。缺省

8、值為,如果圖形變量是數(shù)字型,過程將自動計算各個中心點值;如果圖形變量是字符型,或是數(shù)字型但選擇了DISCRETE選項(即離散型數(shù)字變量),過程為每個圖形變量的不同值產(chǎn)生一個中心點值。l LEVELS=數(shù)字指定數(shù)字型圖形變量的條形或線段個數(shù)。l SUMVAR=變量指定用于計算總和或均數(shù)的變量。3. 通用和專用選項列表通用選項列表中的選項是用于VBAR、HBAR、BLOCK、PIE和STAR語句的共同選項,主要是一些我們剛在上面已介紹的分組特性選項和變量統(tǒng)計量TYPE選項。專用選項列表中的選項是各個不同的圖形語句自己的特有選項。主要的選項見下表:選項應(yīng)用語句功能說明AXIS=<最小值>

9、最大值VBAR、HBAR定義坐標(biāo)軸的最小值和最大值GSPACE=間隔數(shù)定義條形組間的間隔空間數(shù)大小ASC/DESCVBAR、HBAR、PIE每組內(nèi)按升序/降序顯示條形及有關(guān)統(tǒng)計量G100VBAR、HBAR、BLOCK強迫每個組的條圖和統(tǒng)計量加到100%BLOCKMAXBLOCK定義圖中最高塊的統(tǒng)計量值A(chǔ)NGLE=角度數(shù)字PIE、STAR定義開始逆時針旋轉(zhuǎn)的角度FILL=SOLID或X每一區(qū)域用純色或交叉線填充CFILL=顏色定義圖中所有文本的顏色NOLEGEND除了STAR不輸出SUBGROUP變量的圖例NOHEADINGBLOCK、PIE、STAR不輸出在圖表頂部的抬頭行二、 條形圖條形圖是

10、利用相同寬度條形的長短或高低表現(xiàn)各相互對立的統(tǒng)計數(shù)據(jù)大小或變動的統(tǒng)計圖。條形圖可分成水平條形圖(又稱帶形圖)和垂直條形圖(又稱柱形圖),分別用HBAR和VBAR語句實現(xiàn)。無論水平條形圖還是垂直條形圖,都有三種類型的圖式:l 簡單條形圖是以若干平行且等寬的距行表現(xiàn)數(shù)量對比關(guān)系的一種圖形,各條之間有間隙。簡單條形圖也稱為單式條形圖。圖形語句的特點是無GROUP和SUBGROUP選項。l 分組條形圖是指由每兩條或以上條組成一組的條形圖,組與組之間有大間隔,每組內(nèi)條形之間無間隙或小間隙。分組條形圖也稱復(fù)式條形圖。圖形語句的特點是使用GROUP選項。l 分段條形圖是以條形的全長代表某個變量的整體,條形內(nèi)

11、部的各分段長短代表各組部分在整體中所占比例的統(tǒng)計圖,每一段之間沒有間隙并用不同線條或顏色表示,各條之間有間隙。由于每個條圖由若干段組成,因此分段條形圖又可稱作分量條形圖。圖形語句的特點是使用SUBGROUP選項。下面我們通過舉例來說明各種條形圖的使用。1. 簡單條形圖例如,我們想統(tǒng)計計算上證指數(shù)從1月到12月每月的平均漲跌情況。設(shè)定從INDEXSH數(shù)據(jù)集中選擇1991年1月1日到1999年12月31日的觀測數(shù)據(jù)作為統(tǒng)計計算對象。由于INDEXSH數(shù)據(jù)集包含的是周線數(shù)據(jù),而不是日線數(shù)據(jù),因此,這些統(tǒng)計計算結(jié)果會有誤差。為了能進行相應(yīng)地統(tǒng)計計算和繪制出對應(yīng)的條形圖,必須對INDEXSH數(shù)據(jù)集先進行

12、一些處理。由于SAS的日期值在計算機內(nèi)部存儲的是數(shù)字值,我們用MONTH()函數(shù)從日期值DATE中取出月份數(shù)字存放到MONTH變量中,轉(zhuǎn)換形成一個新的數(shù)據(jù)集INDEXSH2,新增的這個MONTH變量取值為112月。然后調(diào)用PROC GCHART圖表過程確定MONTH為圖形變量,周漲跌CHANGE_為統(tǒng)計變量,統(tǒng)計類型為求平均值,這樣將對所有相同月份的CHANGE%值求平均,并用條形長短表示。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Lib

13、name study "d:sasdatamydir" ;Data study.indexsh2 ;set study.indexsh ;where '31dec1990'd<date<'01jan2000'd ;month=month(date) ;Proc format ;Value m_day 1='Jan' 2='Feb' 3='Mar' 4='Apr' 5='May' 6='Jun'7='Jul' 8='

14、;Aug' 9='Sep' 10='Oct' 11='Nov' 12='Dec' ;Proc gchart data=study.indexsh2 ;vbar month /discretesumvar=change_type=mean ;format month m_day. ;title 'Shanghai StockIndex' ;title2 'Increase by an average of percent a month' ;title3 '1991.01.01-199

15、9.12.31' ;Run ;程序說明:DATA數(shù)據(jù)步由INDEXSH數(shù)據(jù)集轉(zhuǎn)換形成INDEXSH2數(shù)據(jù)集,新增MONTH變量的值等于同一觀測中的DATE變量中的月份值,數(shù)據(jù)集INDEXSH2去掉了原數(shù)據(jù)集中不完整月份的觀測,即去掉一些頭尾觀測。PROC FORMAT格式化過程自定義了格式M_DAY,能將112個數(shù)字輸出為對應(yīng)的月份英文縮寫。PROC GCHART過程確定對新數(shù)據(jù)集INDEXSH2繪制垂直條形圖,圖形變量為MONTH,由于MONTH是數(shù)字變量,故要選用DISCRETE選項,確定它為數(shù)字型離散變量。SUMVAR=CHANGE_選項確定數(shù)據(jù)集中的CHANGE_變量為計算統(tǒng)計

16、量,TYPE=MEAN選項確定統(tǒng)計類型為求平均值,即對相同MONTH值的CHANGE_變量值求平均。程序的運行結(jié)果顯示在GRAPH窗口中,如圖21.1所示。圖21.1 上證指數(shù)月漲跌百分比簡單條形圖從條形圖顯示的統(tǒng)計結(jié)果中,我們可清楚地看出,上半年的機會遠(yuǎn)遠(yuǎn)大于下半年,總體投資策略應(yīng)該下半年休息,年末建倉,上半年持股待漲到五、六月清倉。其中五月份是全年上漲最大的月份,七月份下跌風(fēng)險較大,八月份反彈機會較大。2. 分組條形圖例如,我們有一個學(xué)生成績數(shù)據(jù)集CLASS,記錄每個學(xué)生三門課程的成績?,F(xiàn)在想要按每個學(xué)生分組,用條形的高低表示各自三門課程的成績。通常對數(shù)據(jù)集中數(shù)據(jù)進行繪圖前,先要檢查數(shù)據(jù)集

17、的數(shù)據(jù)庫結(jié)構(gòu)是否符合圖形過程的要求,否則,就不能繪制出符合人們要求的圖形,需要將數(shù)據(jù)集進行適當(dāng)?shù)剞D(zhuǎn)換。事實上,數(shù)據(jù)集CLASS的數(shù)據(jù)庫結(jié)構(gòu)不滿足數(shù)據(jù)庫設(shè)計的1NF(第一范式),也同樣不滿足PROC GCHART過程對制作此圖的要求。我們用DATA數(shù)據(jù)步生成一個新的數(shù)據(jù)集GCLASS,用以消除重復(fù)項TEST1、TEST2、TEST3,統(tǒng)一用變量TEST取代,而用COURSE變量存放不同的課程名稱。為了便于理解和比較,新數(shù)據(jù)集中我們沒有去掉TEST1、TEST2、TEST3變量。用PROC GCHART過程對新數(shù)據(jù)集GCLASS繪制分組條形時,指定的圖形變量是COURSE,將顯示COURSE變量中

18、各個不同值的條形;分組變量指定為NAME,將顯示NAME變量中各個不同值的分組;統(tǒng)計變量指定為TEST,統(tǒng)計類型缺省為求和,將對同一分組值中同一圖形變量值的各TEST值求和,本例數(shù)據(jù)中,每次求和TEST變量的記錄都只有一條記錄。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname study "d:sasdatamydir"Data study.Gclass ;Set study.class;COURSE='

19、;DBS' ; TEST=TEST1 ; OUTPUT ;COURSE='MIS' ; TEST=TEST2 ; OUTPUT ;COURSE='DSS' ; TEST=TEST3 ; OUTPUT ;Proc print data=study.Gclass;Title 'Study.Gclass data set'Proc gchart data=study.Gclass;Vbar COURSE / group=NAMEsumvar=TEST axis=60 to 100 by 10autoref ;Title 'Vbar co

20、urse /Group=name'Run ;程序說明:DATA數(shù)據(jù)步創(chuàng)建GCLASS數(shù)據(jù)集,將原來CLASS數(shù)據(jù)集的一條記錄變成三條記錄,用COURSE變量存放三門課程的名稱DBS、MIS、DSS,用TEST變量存放成績。新數(shù)據(jù)集GCLASS,用PROC PRINT打印過程輸出,如圖21.2所示。PROC GCHART過程中圖形語句的AXIS選項,由于語句是VBAR垂直條形圖,所以它是指縱軸上的刻度。AUTOREF選項,是指自動畫參考線,通過每一個主刻度線畫出相應(yīng)一條垂直于刻度坐標(biāo)軸的參考線。程序的運行結(jié)果顯示在GRAPH窗口中,如圖21.3所示。圖21.2 符合分組條形圖的GCLAS

21、S數(shù)據(jù)集圖21.3 用PROC GCHART過程繪制的分組條形圖3. 分段條形圖例如,如果我們想要比較每個學(xué)生的考試總分和平均分,還要比較構(gòu)成總分的各科成績的大小,最恰當(dāng)?shù)姆椒ň褪鞘褂梅侄螚l形圖來表示。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname study "d:sasdatamydir"Proc gchart data=study.Gclass;Hbar NAME /Subgroup=COURSEsum

22、var=TESTsummeanascendingref=180 270 ;Title 'Hbar NAME /Subgroup=COURSE' ;Run ;程序的運行結(jié)果顯示在GRAPH窗口中,如圖21.4所示。圖21.4 用PROC GCHART過程繪制的分段條形圖程序說明:PROC GCHART過程指定輸入數(shù)據(jù)集為GCLASS,HBAR圖形語句指定畫水平條形圖。圖形變量指定為NAME,分段變量指定為COURSE,統(tǒng)計變量指定為TEST。SUM和MEAN選項指定對相同NAME值的TEST統(tǒng)計變量求和和求平均值。ASCENDING選項要求圖形變量NAME值按升序排列。REF=1

23、80 270選項將在橫坐標(biāo)軸180和270處畫出兩條垂直參考線。要特別注意SUM、MEAN選項與TYPE=SUM或MEAN選項的區(qū)別,前者指對如WANGWU學(xué)生三門課程DBS、MIS、DSS的統(tǒng)計量求和、求平均,后者指對如WANGWU學(xué)生幾次DBS考試成績求和、求平均。三、 塊形圖塊形圖與分組條形圖和分段條形圖有點類似,最主要的區(qū)別僅在于塊形圖以三維立體方式顯示條形。例如,我們將上面繪制分段條形圖的過程進行一些修改,主要用BLOCK語句代替HBAR語句,圖形變量、組變量和統(tǒng)計變量不變,分段選項SUBGROUP=改為分組選項GROUP=。程序如下:Goptions reset=global gu

24、nit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname study "d:sasdatamydir"Proc gchart data=study.Gclass;Block NAME / group=COURSEsumvar=TEST ;Run ;程序的運行結(jié)果顯示在GRAPH窗口中,如圖21.5所示。圖21.5 用PROC GCHART過程繪制的塊形圖四、 圓餅圖圓餅圖是以圓的整體面積代表被研究現(xiàn)象的總體,按各構(gòu)成部分占總體比重的大小把原面積分割成若干扇形,用以表示現(xiàn)象的部

25、分對總體的比例關(guān)系的統(tǒng)計圖。現(xiàn)象的總體在SAS系統(tǒng)中被指定為某一研究變量,即PROC GCHART過程中,用PIE語句指定的圖形變量,所要統(tǒng)計的變量由選項SUMVAR=變量來指定。例如,我們要統(tǒng)計每個學(xué)生的平均分并對他們的成績進行比較,查看哪個學(xué)生的考試成績最好,哪個學(xué)生的考試成績最差,所占比例是多少。最簡單的方法是繪制圓餅圖。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname study "d:sasdatamydir&

26、quot;Proc gchart data=study.Gclass;Pie name /sumvar=testtype=meanslice=arrowpercent=insidevalue=arrowexplode='Wangwu' 'zhaoliu'angle=90ctext=blackcfill=black;Title 'Statistic Records of Students 'Run ;程序說明:想要繪制理想的圓餅圖,需要設(shè)置許多重要的選項。PROC GCHART過程的PIE語句,首先要指定圖形變量為NAME,統(tǒng)計變量為TEST,統(tǒng)計

27、類型為求平均值MEAN。其他的一些選項主要用于修飾圖形,常用的有:l SLICE=ARROW每一塊扇形對應(yīng)的NAME值標(biāo)簽方式,=ARROW表示用一條線指向扇形,=INSIDE表示標(biāo)簽在扇形內(nèi)部,=NONE表示沒有標(biāo)簽,=OUTSIDE表示標(biāo)簽在扇形外部。l PERCENT=INSIDE每一塊扇形相應(yīng)百分比數(shù)的標(biāo)簽方式,同樣有四種值,=ARROW,=INSIDE,=NONE,=OUTSIDE。l VALUE=ARROW每一塊扇形統(tǒng)計值的標(biāo)簽方式,也同樣有四種值,=ARROW,=INSIDE,=NONE,=OUTSIDE。l EXPLODE=Wangwu zhaoliu 把在列表中列出的NAME

28、變量值所對應(yīng)的扇形分離出去,可以從視覺上起到強調(diào)這一塊扇形的目的。請注意列表中字符串要與變量NAME中值的大小寫完全匹配。l ANGLE=90指定第一塊扇形的起始的角度,缺省值為0。l CTEXT=BLACK設(shè)置圖中所有文字為黑色,還可以是其他顏色。l CFILL=BLACK設(shè)置圖中所有文本為黑色,還可以是其他顏色。l COUTLINE=BLACK設(shè)置扇形的輪廓線為黑色,還可以是其他顏色。l FILL=SOLID或X設(shè)置各個扇形用顏色區(qū)別或用交叉線區(qū)別。如果無此選項,則扇形內(nèi)為空白。程序的運行結(jié)果顯示在GRAPH窗口中,如圖21.6所示。圖21.6 用PROC GCHART過程繪制的圓餅圖五、

29、 星形圖星形圖是把觀測總體用一個360度角表示,每一構(gòu)成部分等分360度角,且每一構(gòu)成部分的統(tǒng)計量大小用一條與角中心點相連的線段長短表示,然后將各線段的頂點依次連接起來。星形圖適用于周期性數(shù)據(jù),如一年的月份或者一天的小時,也適用于成分組成數(shù)據(jù),如描述某食品的維生素組成和大小。例如,我們要統(tǒng)計上證指數(shù)九年中1月份成交量平均值、2月份成交量平均值12月份的成交量平均值,并用星形圖表示。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname Study "d:sasdatamydir" ;Proc format ;value m_day 1='Jan

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論