版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第3章 SAS的描述統(tǒng)計功能3.3 統(tǒng)計圖形3.3.1 定量變量的圖形表示3.3.2 分類變量的圖形表示3.3.1 定量變量的圖形表示1、直方圖(histogram)2、盒形圖3、散點圖(Scatter Plot)4、線圖(Line Plot)直方圖直方圖是根據(jù)變量的取值來顯示其頻數(shù)分布情況的圖形。它的橫軸代表數(shù)據(jù)分組,縱軸可用頻數(shù)或百分比(頻率)表示。直方圖對于數(shù)值型變量,常用直方圖來展示變量取值的分布。將變量取值的范圍分成若干區(qū)間(一般是等間距的),在等間距區(qū)間的情況下,每個區(qū)間的長度稱為組距??疾鞌?shù)據(jù)落入每一個區(qū)間的頻數(shù)或頻率,在每一個區(qū)間上畫矩形,它的寬度是組距,高度可以是頻數(shù)、頻率或
2、密度(頻率/組距)。組距對直方圖的形態(tài)有很大的影響,組距太小,每組的頻數(shù)較少,由于隨機性的影響,鄰近區(qū)間上的頻數(shù)可能很大;組距太大,直方圖所反映概率密度的形態(tài)就會過于粗略。一個合適的分組是希望直方圖的形態(tài)能接近總體的概率密度,SAS軟件會根據(jù)樣本容量在樣本取值范圍內(nèi)自動地確定一個分組方式,另外也提供設定分組的方法。盒形圖盒形圖由一個盒子和兩根線構(gòu)成。盒子的中間線代表數(shù)據(jù)的中位數(shù),數(shù)據(jù)中有一半大于中位數(shù)(在其之上),另一半小于中位數(shù)(在其之下)。封閉盒子的上下兩橫線(邊)分別為上、下四分位數(shù)(點)。因此盒子上下邊線內(nèi)包含了位于分布中間的50%的數(shù)據(jù)。盒子的長度就是分布的四分位間距。其作用類似于標
3、準差,可以反映數(shù)據(jù)分布的分散程度。從盒子邊線向外畫了兩條線叫做觸須線,最長可以延伸到四分位間距的1.5倍,但是如果已經(jīng)到了數(shù)據(jù)的最小值或最大值處就不再延伸。如果有些數(shù)據(jù)值超出了觸須線的范圍,則這些數(shù)據(jù)用觸須線以外的點來畫出,一般認為這樣的店是可能的異常點,在進一步進行數(shù)據(jù)分析時可以考慮是否需要剔除它。從盒形圖上可以大體看出數(shù)據(jù)集中在什么范圍,上下兩側(cè)是否對稱。如果盒子的下半部比上半部長,而且下觸須線比上觸須線長,說明數(shù)據(jù)分布為左偏;否則數(shù)據(jù)分布為右偏。散點圖散點圖是由坐標軸上的一系列散點構(gòu)成的圖形,通常用來表示兩個變量之間的關系。當坐標軸中的散點多的能夠連成線的時候,便成為了線圖。線圖一個變量
4、作為分析變量,即線圖中線所代表的含義;另一個變量往往是定性變量或時間變量,作為分類變量或參照變量,用以考察分析變量的變動狀況。此外,借助線圖也可以同時考察多個變量的變動狀況,并從中找出數(shù)據(jù)之間的關系。3.3.2 分類變量的圖形表示1、條形圖(Bar Chart)2、餅圖(Pie Chart)3、馬賽克圖(Mosaic Plot)條形圖條形圖是描述已匯總為頻數(shù)、相對頻數(shù)或百分比頻數(shù)分布的定性數(shù)據(jù)的圖形。餅圖餅圖是一種描述定性數(shù)據(jù)的相對頻數(shù)和百分比頻數(shù)分布的圖形,通常以圓餅或橢圓餅的形式出現(xiàn)。餅圖餅圖的整個圓即代表一個總體的全部數(shù)據(jù),圓中的一個扇形表示總體的一個類別,其面積大小由相應部分占總體的比
5、例決定,且各部分比例的總和必為100%。在統(tǒng)計分析中,他主要用來研究結(jié)構(gòu)性問題,如股權(quán)結(jié)構(gòu)、投資結(jié)構(gòu)等。3.4 在SAS中繪制統(tǒng)計圖形3.4.1 用Insight繪制統(tǒng)計圖形3.4.2 用“分析家”繪制統(tǒng)計圖形3.4.3 編程繪制統(tǒng)計圖形3.4.1 用Insight繪制統(tǒng)計圖形1、繪制直方圖和條形圖【例3-19】 根據(jù)表3-1學生體檢數(shù)據(jù),以體重為分析變量繪制直方圖?!纠?-20】根據(jù)表3-1學生體檢數(shù)據(jù),以年齡為分析變量生成條形圖。3、繪制散點圖【例3-22】根據(jù)表3-1學生體檢數(shù)據(jù),繪制身高與年齡的散點圖。4、繪制線圖【例3-23】根據(jù)表3-1學生體檢數(shù)據(jù),繪制體重隨身高變化的線圖。3.4
6、.2 用“分析家”繪制統(tǒng)計圖形1、繪制直方圖【例3-24】根據(jù)表3-1學生體檢數(shù)據(jù),繪制身高分布直方圖。2、繪制條形圖分析家繪制條形圖分為水平條形圖和垂直條形圖。其操作步驟與繪制直方圖相同。3、繪制散點圖(線圖)【例3-25】根據(jù)表3-1學生體檢數(shù)據(jù),以身高為橫軸、體重為縱軸,分別繪制散點圖和線圖。4、繪制餅圖【例3-26】根據(jù)表3-1學生體檢數(shù)據(jù),按身高分類繪制餅圖。3.4.3 編程繪制統(tǒng)計圖形1、GChart過程2、GPlot過程計算中心圖形參數(shù)語句Goptions 圖形選項設置圖形輸出的參數(shù),如goptions ftext=SWISS ctext=BLACK htext=1 cells;
7、 Symbol 圖形選項常對GPLOT過程輸出的圖形進行參數(shù)設置Goptions語句一般格式GOPTIONS 選擇項;選項Cback=顏色 圖形的背景色Colors=(顏色列表) 規(guī)定圖形的默認顏色順序Cell|nocell 進行或不進行單元調(diào)整Cpattern=顏色 規(guī)定pattern語句的默認顏色值CSYMBOL=顏色 規(guī)定symbol語句的默認顏色值Ctext=顏色 ftext=字形 htext=高度 規(guī)定文本顏色、字形和高度Ctitle=顏色 ftitle=字形 htitle=高度 規(guī)定所有title和footnote的默認顏色、字形和高度GChart過程語法格式PROC GCHART
8、 DATA=;/;RUN;gchart可以繪制方塊圖、條形圖、餅圖、環(huán)形圖等,不同的圖形關鍵字表示繪制不同圖形。變量名:指定需要繪制圖形的分析變量。選項列表:根據(jù)不同的圖形關鍵字有不同的選項。常用的選項有:type=統(tǒng)計量關鍵字,常用的統(tǒng)計量關鍵字有Freq(頻數(shù))、mean(均值)、sum(總和)、percent(頻數(shù)百分比),默認為頻數(shù)。group=變量:指定分組變量。subgroup=變量:按分組變量的值分段。midpoints=值列表:指定條形圖每個矩形中點。levels=值:指定條形圖中矩形的個數(shù)。patternid=midpoint|group|subgroup,規(guī)定連續(xù)性圖形的圖
9、案按數(shù)字列表中的中心點值|并排分組值|重疊分組值的次序呈現(xiàn)GChart過程gchart過程可以使用的圖形關鍵字及其圖形類型圖形關鍵字圖形類型圖形關鍵字圖形類型block方塊圖pie餅圖hbar水平條形圖pie3d三維餅圖hbar3d三維水平條形圖donut環(huán)形圖vbar垂直條形圖star星型圖vbar3d三維垂直條形圖GChart過程-繪制條形圖【例3-27】根據(jù)表3-1學生體檢數(shù)據(jù),以身高為分析變量繪制頻數(shù)條形圖。proc gchart data=mylib.class;vbar height;run;在繪制條形圖時,亦可自定義每個矩形塊的中點值。例如:proc gchart data=my
10、lib.class;vbar height/midpoints=50 55 60 65 70;run;GChart過程-繪制條形圖【例3-28】根據(jù)表3-1學生體檢數(shù)據(jù),按性別分組,繪制身高的頻數(shù)條形圖。proc gchart data=mylib.class;vbar height/group=sex; run;也可以使用subgroup選項設置分組。proc gchart data=mylib.class;vbar height/subgroup=sex;run;GChart過程-繪制餅圖【例3-29】根據(jù)表3-1學生體檢數(shù)據(jù),以繪制身高的頻數(shù)百分比餅圖。proc gchart data=
11、mylib.class;pie height/type=percent;run;GChart過程-繪制方塊圖【例3-30】根據(jù)表3-1學生體檢數(shù)據(jù),按性別分組,繪制體重的頻數(shù)方塊圖。proc gchart data=mylib.class;block weight/group=sex;run;【例】下表為兩個不同地區(qū)居民家庭收入和支出情況的抽樣調(diào)查(單位:元),試繪制收入情況的頻數(shù)條形圖。數(shù)據(jù)集Mylib.sryzc中,4個變量名分別為:ID、R_ID、Income和Outgo,相應的標簽名為家庭編號、地區(qū)編號、家庭總收入和家庭總支出。家庭編號地區(qū)編號家庭總收入家庭總支出家庭編號地區(qū)編號家庭總
12、收入家庭總支出12179415501622200206022171613651712730223631341027301812496145542176515301911760104052218419002012820236662205020502122250196672246021842213170240081197611702321200125091285024962421776135010142752760252198017941122010127526124552550121223618102721080138013133052820282198612001412400197629133
13、6923051522250197030215301316goptions colors=(red green blue pink orange brown);proc gchart data=mylib.sryzc;vbar income/patternid=midpoint;run;proc gchart data=mylib.sryzc;vbar income/group=r_id patternid=group;run;效果有何不同?運行結(jié)果GPlot過程語法格式PROC GPLOT DATA=;PLOT *=/;SYMBOL ;RUN;gplot過程可繪制散點圖和連線圖等包含兩個變量的
14、圖形。每個點對應一個觀測,由橫坐標和縱坐標定位,構(gòu)成一幅平面散點圖或連線圖。主要表示:一個變量隨另一個變量的變化;變量之間的關系;數(shù)據(jù)值的分布。GPlot過程PLOT選項1用來設置圖形的整體特性,例如坐標軸的值、顏色,外框顏色、填充色等選項含義說明FRAME|NOFRAME圖形加/不加邊框默認為加邊框CFRAME=圖形背景色默認為白色AUTOHREF(AUTOVREF)在水平(垂直)軸的每個主刻度處加入垂直(水平)參考線NOAXIS取消坐標軸及相關的圖形元素CAXIS=設置坐標軸顏色CTEXT=設置與軸相關的文字顏色HAXIS=設置水平軸主刻度值VAXIS=設置垂直軸主刻度值OVERLAY多個
15、圖形繪在一張圖中LEGEND顯示圖例GPlot過程SYMBOL語句選項2點或連線的相關參數(shù)選項含義取值V=設置點使用的符號plus,x,star,square,diamond,triangle,hash,paw,point,dot,circleCV=設置點的顏色black,red,green,blue,cyan,magenta,gray,pink,orange,brown,yellowH=設置點的大小單位取值:cell,cm,pct,pt,inPOINTLABEL在點附近標明Y軸值I=設置連線方式none,join,spline,needleCI=設置連線顏色C=設置點和線的顏色L=n為線的序
16、號0-無連線,1-實線,2-虛線W=n表示線寬度GPlot過程由于symbol語句為全局語句,即如果未設置symbol選項,將以最后一次設置的選項作為本次的參數(shù)。若要恢復初始設置,可執(zhí)行以下語句:goptions reset=symbol;GPlot過程-繪制簡單散點圖【例3-31】根據(jù)表3-1學生體檢數(shù)據(jù),以身高為橫軸,體重為縱軸繪制散點圖。proc gplot data=mylib.class;plot weight*height;run;GPlot過程-繪制分組散點圖【例3-32】根據(jù)表3-1學生體檢數(shù)據(jù),按性別分組繪制體重隨身高變化的散點圖。proc gplot data=mylib.
17、class;plot weight*height=sex;symbol1 cv=black v=x;symbol2 cv=blue v=dot;run;GPlot過程-繪制多散點圖【例3-33】根據(jù)表3-1學生體檢數(shù)據(jù),以年齡為橫軸,以身高和體重為縱軸,在一張圖中繪制散點圖。proc gplot data=mylib.class;plot (weight height)*age/overlay legend;symbol1 cv=black v=x;symbol2 cv=blue v=plus;run;GPlot過程-繪制連線圖【例3-34】根據(jù)表3-1學生體檢數(shù)據(jù),以身高為橫軸,體重為縱軸繪制連線圖。在繪制連線圖時,為避免圖形混亂,最好先按橫軸變量升序排序。proc sort data=mylib.class;by height;proc gplot data=mylib.class;plot weight*height;symbol v=dot i=join;run;GPlot過程-繪制縱軸不同的連線圖【例3-35】根據(jù)表3-1學生體檢數(shù)據(jù),以年齡為橫軸,以身高和體重為縱軸,在一幅圖中繪制兩個縱軸各異的連線圖。proc sort data=mylib.class;by age;proc gplot data=mylib.class;plot weight*age=1/o
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度Logo設計及品牌形象重塑合同
- 家具供應合同范本
- 2024簡單的農(nóng)村土地轉(zhuǎn)讓合同
- 二手房交易合同-范本
- 2024上市公司合同管理辦法
- 標準店面租賃合同書樣本
- 2024內(nèi)粉墻刷白合同
- 2024年借款延期合同范本
- 2024墻紙采購合同
- 2024小區(qū)綠化種植合同
- 實驗室ISO17025認證推進計劃表
- 1.春夏秋冬 教案(兩課時)+說課稿+練習(含答案)+素材
- GB 31652-2021 食品安全國家標準 即食鮮切果蔬加工衛(wèi)生規(guī)范
- DBJ41∕T 188-2017 城市軌道交通工程安全監(jiān)測技術(shù)規(guī)程
- 新企業(yè)會計準則2022年(原文+指南+說明)企業(yè)會計準則指南2022
- 29 名著閱讀 《西游記》 2022暑假小升初銜接精品導學導練(原卷版+解析版)
- 顱內(nèi)壓增高的臨床表現(xiàn)PPT課件
- 接待與會務工作禮儀培訓及規(guī)范-PPT課件
- 九年級思想品德課試卷講評課PPT精選文檔課件
- 教練技術(shù)一階段講義(共59頁)
- 《保險學》01
評論
0/150
提交評論