版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、描述性統(tǒng)計過程Means過程Freq過程Tabulate過程univariate過程plot過程chart過程rank過程1統(tǒng)計關鍵鍵字名稱所代表的統(tǒng)計量名稱所代表的統(tǒng)計量n單元格頻數(shù)pctn頻數(shù)百分比,須指定相應的分母項nmiss缺失數(shù)據(jù)個數(shù)pctsum某變量(數(shù)值型)合計占指定合計值的百分比mean均數(shù)css離差平方和min最小值tderr均值的標準誤max最大值cv變異系數(shù)sum合計t用來檢測均值是否為零的單側t值std標準差prt上述t值的統(tǒng)計顯著程度range全距,即最大值與最小值之差var方差uss每一變量原始數(shù)據(jù)的平方和(未校正平方和) sumwgt加權值的總和2Means過程程
2、proc means選項列表表;by變量表(分組變變量);class變量表(分組變變量);freq變量(數(shù)數(shù)值變量量,用以以表示相相應記錄錄出現(xiàn)的的頻數(shù))weight變量(數(shù)數(shù)值變量量,用以以表示相相應記錄錄的權重重系數(shù))var變量表(待分析析的數(shù)值值變量);id變量表(待分析析的數(shù)值值變量);output;run;means過程的一一般格式式31.proc means 452.Output語句Output語句的選選擇項包包括:out= sas數(shù)據(jù)集指指定輸出出數(shù)據(jù)集集名。統(tǒng)計關鍵鍵字=輸出變量量名字指指定定新數(shù)據(jù)據(jù)集中的的統(tǒng)計項項,并給給這些統(tǒng)統(tǒng)計項的的變量命命名。等等號右邊邊各變量量名代表
3、表var語句中對對應變量量的相應應統(tǒng)計量量。例如:Proc means;varx1x2;outputout=statsmean=ma mbstd=sa;Run;其中ma代表x1的均值,mb代表x2的均值,sa代表x1的標準差差,x2的標準差差不輸出出。6例7-2-1利用means過程按班班級class進行單變變量統(tǒng)計計。Score1數(shù)據(jù)集中中含有學學生成績績的永久久數(shù)據(jù)集集。注意意by語句與class語句的不不同。下下面是Score1中的數(shù)據(jù)據(jù):7*ex7-2-1;libname ep D:sasdataSASLX;PROCmeansdata=ep.score1maxdec=3;vart1-t
4、3;classclas;titlestatisticswith aclassvariable;run;輸出中最多顯示3位小數(shù)8*ex7-2-1;Procsortdata=ep.score1;byclas;run;PROCmeansmaxdec=3;byclas;vart1-t3;Titlestatisticswith by variable;run;9使用class語句數(shù)據(jù)據(jù)集不需需要sort過程排序序;使用用by語句數(shù)據(jù)據(jù)集事先先要進行行排序。而且兩兩個語句句使得輸輸出格式式也有些些不同。請仔細細體會他他們的差差別。10例7-2-2略;例7-2-3在某一年年級中,測得15名男生的的身高,數(shù)據(jù)
5、存存于文件件“e:sasdtfit1.txt”中,求出出身高的的平均值值、標準準差、變變異系數(shù)數(shù)和95%的置信區(qū)區(qū)間。*ex7-2-3;DATASTUDENT;INFILEE:SASDTFIT1.TXT;LENGTHNAME$10;INPUTNUM$NAME SEX$ HW;PROCMEANSDATA=STUDENTNMEAN STDCVLCML UCML;VARH;RUN;11Freq過程進行統(tǒng)計計分析首首先應該該對我們們手頭上上的數(shù)據(jù)據(jù)特征有有一個比比較明確確的了解解,比如如數(shù)據(jù)的的頻率分分布或者者其他對對數(shù)據(jù)的的描述的的統(tǒng)計量量,這有有助于我我們對數(shù)數(shù)據(jù)的特特征,可可能的分分布有一一個比
6、較較全面的的了解,用于幫幫助我們們決定進進一步的的研究方方法和方方向.我們將介介紹如何何用編程程和INSIGHT模塊進行行描述性性數(shù)據(jù)分分析.12例7-3-1對學生生成績進進行分段段統(tǒng)計分分析。Score2.txt為含學生生成績的的數(shù)據(jù)文文件,把把學生的的平均成成績分成成A(大于等等于80)、B(大于等等于60,小于80)、C(小于60)三等,由FREQ過程產(chǎn)生生每一分分數(shù)段的的學生人人數(shù)和占占總數(shù)的的百分數(shù)數(shù)。libname ep e:saslx;datab;/*讀入入數(shù)據(jù)*/infilee:sasdtscore2.txt;inputnum$t1-t3;v=MEAN(OFt1-t3);run
7、;PROCFORMAT;/*產(chǎn)生成成績等級級的格式式*/VALUEvfmt LOW-60=C60-80=B80-HIGH=A;run;PROCFREQdata=b;/*對成成績各等等級頻數(shù)數(shù)分析*/FORMATvvfmt.;TABLESv;run;1314PROC FREQDATA=數(shù)據(jù)集名名;TABLES變量;RUN;PROC FREQDATA=數(shù)據(jù)集名名;TABLES變量*變量變變量*變量. ./nocolnorownocumnofreqnopercentmissinglistout=數(shù)據(jù)集outpct;WETGHT變量名;BY變量名;RUN;一般是分分類變量量freq過程的一一般格式式1
8、5FREQ(頻數(shù))過程-定義輸出出格式的的FORMAT過程procformat;(用于Fitness數(shù)據(jù)集)valueoxyfmt32.5-37.5=32.5-37.737.5-42.5=37.5-42.542.5-47.5=42.5-47.547.5-52.5=47.5-52.552.5-57.5=52.5-57.557.5-62.5=57.5-62.5;run;當37.5直方圖/條形圖”272829303132(抽取)33(輸出)3435分析員應應用及變變量的取取值分布布用分析員應應用進行行頻數(shù)統(tǒng)統(tǒng)計并作作分布圖圖1.選菜單欄欄目的統(tǒng)計(Statistics)=統(tǒng)計描述述(Descript
9、ive)=頻數(shù)統(tǒng)計(Frequency Counts)=彈出頻數(shù)數(shù)統(tǒng)計窗窗口;2.在彈出的的頻數(shù)統(tǒng)統(tǒng)計窗口口中選分析變量量-產(chǎn)生頻數(shù)數(shù)表;3.在頻數(shù)統(tǒng)統(tǒng)計窗口口下方選選plots紐;4.在彈出菜菜單的條條形圖(Bar charts)框中點擊在Horizontal前方的方方框上,使之打勾勾;5.OK=OK.則顯示結結果.6.擊在屏幕幕左邊的的Code上顯示完完成分析析的SAS程序.3637Tabulate過程程proc tabulate選項列表表;by變量名稱稱(分組組變量);class變量名稱稱(分組組變量);freq變量名稱稱(數(shù)值值變量,用以表表示相應應記錄出出現(xiàn)的頻頻數(shù))weight變量
10、名稱稱(數(shù)值值變量,用以表表示相應應記錄的的權重系系數(shù))table,var變量名稱稱(待分分析的數(shù)數(shù)值變量量,統(tǒng)計計量列入入相應的的表單元元格);run;38tabulate過程中table語句用來來實現(xiàn)具具體的表表格繪制制過程,其后是是作為表表格三個個維度的的分組變變量,表表示三個個維度的的變量間間以逗號號分隔,三個維維度分別別是頁(page)、橫軸軸(side)和縱軸軸(top)。三個個維度不不必全部部指定,如果只只指定一一個維度度(如本本例),SAS將其當作作縱軸處處理;如如果指定定兩個,SAS將其作為為橫軸和和縱軸處處理,前前面的變變量為橫橫軸,后后面的變變量為縱縱軸;若若指定三三個維
11、度度,在最最前的變變量為頁頁,中間間的為橫橫軸,最最后的為為縱軸。39同一維度度可以是是一個變變量,也也可以是是多個變變量的排排列組合合,多個個變量的的排列組組合形式式如下:(1)并列:變量間間以空格格相間隔隔,如“a b”的表格形形式如下下:a1a2a3b1b2b3(2)交叉:變量間間以星號號(*)相連接接,如“a*b”的表格形形式如下下:a1a2a3b1b2b3b1b2b3b1b2b3(3)混合形形式:變變量間以以空格或或星號分分隔,必必要時加加圓括號號,如“a*(b c)”的表格形形式如下下:a1a2b1b2c1c2b1b2c1c240另外,和和變量一一同在table語句中出出現(xiàn)的還還有
12、一些些表示特特定統(tǒng)計計量的SAS關鍵詞,可以控控制相應應統(tǒng)計量量在表格格中的顯顯示。Tabulate過程可以以計算的的統(tǒng)計量量及其在在table語句中的的名稱如如下表。名稱所代表的統(tǒng)計量名稱所代表的統(tǒng)計量n單元格頻數(shù)pctn頻數(shù)百分比,須指定相應的分母項nmiss單元格上有遺漏數(shù)據(jù)的記錄個數(shù)pctsum某變量(數(shù)值型)合計占指定合計值的百分比mean均數(shù)css校正的總平方和min最小值tderr均值的標準誤max最大值cv變異系數(shù)sum合計t用來檢測均值是否為零的單側t值std標準差prt上述t值的統(tǒng)計顯著程度range全距,即最大值與最小值之差var方差uss未校正的總平方和sumwgt加權
13、值的總和41Summary過程Proc Summary與Proc Means有相同的的功能與與用法.后者缺省省為print,將結果輸輸出到OUTPUT窗;前者缺省省為noprint,不輸出結結果到OUTPUT窗.PROC SummaryDATA=數(shù)據(jù)集名名maxdec=位數(shù)fw=域寬print輸出統(tǒng)計計量名列列;VAR變量名列列;CLASS變量名列列;BY變量名列列;ID變量名;OUTPUTOUT=數(shù)據(jù)集名名記入數(shù)據(jù)據(jù)集統(tǒng)計計量名列列;RUN;42在proc means或proc summary中,可用多個個output語句,它有三種種方式規(guī)規(guī)定輸出出數(shù)據(jù)集集中的統(tǒng)統(tǒng)計量:statistic-
14、keyword=僅適用于于一個統(tǒng)統(tǒng)計量多多個變量量;statistic-keyword=name-list;statistic-keyword(variable-list)=name-list;可指定僅僅對某些些變量計計算這一一統(tǒng)計量量.缺省情形形是在輸輸出數(shù)據(jù)據(jù)集中由由變量_stat_來注明統(tǒng)計量名名.43例:設輸入數(shù)數(shù)據(jù)集有有變量X1,X5,以下給出出OUTPUT語句及選選項OUT=生成輸出出數(shù)據(jù)集集包含統(tǒng)統(tǒng)計量和和名字:(1)output out=b1mean=;/*輸出數(shù)據(jù)據(jù)集1中包含含5個變變量的均均值,變變量名為為X1,.,X5*/(2)output out=b2mean=m1m2
15、var(x3)=;/*輸出數(shù)據(jù)據(jù)集2中包含含變量X1,X2的均值,變量名名為m1,m2;以及x3的方差,變量名字字仍為X3*/(3)outputout=b3 mean(x3x4)=m3 m4 std(x5)=s5;/*輸出數(shù)據(jù)據(jù)集3中包含含變量X3和X4的均值,存放均均值的變變量名為為m3和m4,變量X5的標準差差存放在在S5中*/44(4)output out=b4mean=max(x1)=sum(x3)=/autoname;/*輸出數(shù)據(jù)據(jù)集4中包含:5個變量量的均值值,變量量名為x1_Mean,.,x5_Mean;變量X1的最大值,變量名為為x1_Max;變量X的總和,變量名為為x3_Su
16、m.*/(5)當使用Class語句時,與由OUTPUT語句生成成的數(shù)據(jù)據(jù)集內容容有關的的選項和和語句:PROC的選項nway;WAYS語句和TYPES語句.(見Bstat33.sas)45univariate過程proc univariate選項列表表;by變量名稱稱(分組組變量);class變量名稱稱(分組組變量);freq變量名稱稱(數(shù)值值變量,用以表表示相應應記錄出出現(xiàn)的頻頻數(shù))weight變量名稱稱(數(shù)值值變量,用以表表示相應應記錄的的權重系系數(shù))histogram變量名稱稱/選項列表表output var變量名稱稱(待分分析的數(shù)數(shù)值變量量);run;univariate過程和以以上兩
17、個個過程的的格式非非常相似似,相同同的語句句和選項項其含義義也相同同,所不不同的是是某些統(tǒng)統(tǒng)計量只只能在univariate過程中計計算(如如眾數(shù)),以及及univariate過程中所所具有的的繪圖功功能。histogram語句即用用來指示示SAS對其后所所指定的的變量繪繪制直方方圖,其其后的選選項用來來指示SAS添加不同同類型的的擬合圖圖形(如如正態(tài)分分布的分分布密度度曲線)。46UNIVARIATE過程除了了可以完完成與MEANS過程相同同的基本本統(tǒng)計量量外,還還可以計計算變量量的極端端值、分分位數(shù),生成頻頻率表,并支持持對數(shù)據(jù)據(jù)進行正正態(tài)性檢檢驗。UNIVARIATE與MEANS過程不同
18、同的功能能包括:描述變量量極端值值的情況況。計算分位位數(shù),如如中位數(shù)數(shù),1/4和3/4分位數(shù)。生成若干干個描述述變量分分布的圖圖。生成頻率率表。對數(shù)據(jù)進進行正態(tài)態(tài)性檢驗驗。4748RPOCUNIVARIATEDATA=數(shù)據(jù)集名名noprintmu0=值plotnormal;VAR變量名列列;BY變量名列列;ID變量名;OUTPUTOUT=數(shù)據(jù)集名名 關鍵鍵名=變量名.PCTLPTS=p1,p2,.PCTLPRE=前綴詞;.RUN;用戶另指指定要求求計算的p1%,p2%分位數(shù).49procunivariatedata=fitness;varruntimeoxygen;idage;run;proc
19、univariatedata=fitnessnoprint;varruntime ;outputout=percentsp10=op10p90=op90median=medianq1=q1q3=q3pctlpts=2080pctlpre=pqrange=iqrangerange=range;procprintdata=percents;run;50procsortdata=sasuser.fitnessout=sorted;bygroup;run;procunivariatedata=sorted;varweight;bygroup;run;procunivariatedata=sasuser
20、.fitnessplotnormal;varweight;run;51直方圖和和分布的的擬合檢檢驗UNIVARIATE過程-變量分布布的圖形形描述PROCUNIVARIATEDATA=數(shù)據(jù)集名名noprint ;VAR變量名列列;HISTOGRAM變量名列列/midpoints=中點列normal(mu=均值sigma=標準差圖圖象象選項)exp(theta=閾值圖圖象選選項)lognormal(theta=閾值圖圖象選選項) ;INSET統(tǒng)計量關關鍵名= 顯示名格格式;QQPLOT變量名列列/square. .;PROBPLOT變量名列列/. .;BY變量名列列;ID變量名;RUN ;52P
21、直方圖和和分布的的擬合檢檢驗UNIVARITE過程-例例子procunivariatedata=sasuser.fitness;varoxygen;idage;run;procunivariatedata=sasuser.fitness;varoxygen;histogram;procunivariatedata=sasuser.fitnessnoprint;histogramoxygen;titleHistogram;run;(Bstat41.sas)53procunivariatedata=sasuser.fitnessnoprint;histogramoxygen/midpoints=3
22、2to60by4normal(L=2color=orangew=4);insetnmean(4.1)std(4.2);run;procunivariatedata=sasuser.fitnessnoprint;histogramoxygen/midpoints=32to60by4normal(L=1w=2)lognormal(L=2w=3theta=30)exponential(L=8w=4theta=30);run;quit;54直方圖和和分布的的擬合檢檢驗練習題1.打開FITNESS數(shù)據(jù)集,并用菜菜單系統(tǒng)統(tǒng)或編程程方法完完成以下下分析計計算:計算變量量OXYGEN和RUNTIME的均值、方
23、差、標準差差、偏度度和峰度度;指定定GROUP為BY變量后,分別計計算三組組數(shù)據(jù)的的以上幾幾個描述述統(tǒng)計量量;(2)在OXYGEN的直方圖圖中如何何擬合一一條正態(tài)態(tài)分布曲曲線?這條正態(tài)態(tài)曲線的的均值和和方差是是多少?怎樣改變變擬合曲曲線的均均值和方方差?55直方圖和和分布的的擬合檢檢驗練習題(3)對變量OXYGEN繪制經(jīng)驗驗分布函函數(shù)曲線線和QQ圖,并檢檢驗該變變量的分分布是否否為正態(tài)態(tài)分布(=0.05和=0.15)?(4)變量RUNTIME的標準差差和極差差是什么么?這些值說說明什么么?(5)繪制分類類變量GROUP(測量水平平指定為為Nom)的條形圖圖,并問問屬于組組2的頻數(shù)有有多少?56
24、直方圖和和分布的的擬合檢檢驗練習題.打開CLASS數(shù)據(jù)集,可類似似完成題題1中的練習習.這里分類類變量為為SEX或AGE,數(shù)值變量量為WEIGHT和HEIGHT.另要求:(1)計算AGE的頻數(shù)分分布表,并要求輸輸出按年年齡由大大到小的的頻數(shù)表表;(2)繪制AGE的條形圖圖,并要求生生成水平平條形圖圖.3.打開SASUSER.GPA數(shù)據(jù)集,該數(shù)據(jù)集集收集了了224名學生的的資料,考察的變變量有7個,包括:GPA中學生的的平均等等級;HSM高中數(shù)學學平均等等級;57直方圖和和分布的的擬合檢檢驗練習題HSE高中英語語平均等等級;HSS高中科學學平均等等級;STAMSTA測驗數(shù)學學部分的的得分;SAT
25、VSTA測驗口語語部分的的得分;SEX學生的性性別.試完成以以下分析析計算:(1)作各變量量的直方方圖,查查看其分分布情況況并簡答答;(2)研究GPA分數(shù)的分分布.說明極端端值情況況.(3)畫出GPA的盒形圖圖,并說說明如何何解釋.通過直方方圖、盒盒形圖、各統(tǒng)計計量、分分布檢驗驗結果簡簡述GPA分布的特特點.58Gplot/ plot過過程proc gplot選項列表表;bubble散點圖表表達式bubble2散點圖表表達式plot散點圖表表達式plot2散點圖表表達式run;從gplot過程的一一般格式式中我們們就可看看出,此此過程只只能繪制制兩種類類型的圖圖形,bubble語句指示示SAS
26、繪制泡狀狀散點圖圖,plot語句指示示SAS繪制點狀狀散點圖圖。bubble2語句和plot2語句指示示SAS在同一區(qū)區(qū)域內(bubble2和bubble在同一區(qū)區(qū)域,plot2和plot在同一區(qū)區(qū)域)繪繪制第二二個圖形形,兩者者的橫坐坐標相同同(同一一變量),縱坐坐標分別別位于左左右兩側側(可以以是同一一變量,也可以以是兩個個不同的的變量)。59proc gchart選項列表表;圖形關鍵鍵詞變變量名稱稱/選項列表表run;gchart過程的一一般格式式gchart過程可以以使用的的圖形關關鍵字及及其所繪繪制的圖圖形類型型圖形關鍵字繪制的圖形類型圖形關鍵字繪制的圖形類型block方塊圖pie圓
27、圖hbar水平的條形圖pie3d三維圓圖hbar3d水平的三維條形圖donut環(huán)形圖vbar豎立的條形圖star星形圖vbar3d豎立的三維條形圖60圖形關鍵鍵字后的的變量名名用以指指定進行行圖形描描述時的的分組變變量,可可以是數(shù)數(shù)值型的的(此時時以各組組的組中中值為分分組的標標志),也可以以是字符符型的。其后的的選項比比較重要要的有:(1)type=統(tǒng)計量關關鍵字,表示以以圖形對對變量(sumvar所指定的的變量)的哪一一種統(tǒng)計計量進行行描述,比如頻頻數(shù)(freq)、均數(shù)數(shù)(mean)、總計計(sum)、頻數(shù)數(shù)百分比比(pctn)等;(2)subgroup=變量名(分組變變量),指定要要進行
28、分分組(各各組段內內再分組組)的變變量;(3)sumvar=變量名(數(shù)值變變量),指定要要進行統(tǒng)統(tǒng)計計算算的變量量,也就就是“type=統(tǒng)計量關關鍵字”選項中中統(tǒng)計量量的計算算所依據(jù)據(jù)的變量量。61proc gplot選項列表表;bubble散點圖表表達式bubble2散點圖表表達式plot散點圖表表達式plot2散點圖表表達式run;gplot過程的一一般格式式從gplot過程的一一般格式式中我們們就可看看出,此此過程只只能繪制制兩種類類型的圖圖形,bubble語句指示示SAS繪制泡狀狀散點圖圖,plot語句指示示SAS繪制點狀狀散點圖圖。bubble2語句和plot2語句指示示SAS在同一
29、區(qū)區(qū)域內(bubble2和bubble在同一區(qū)區(qū)域,plot2和plot在同一區(qū)區(qū)域)繪繪制第二二個圖形形,兩者者的橫坐坐標相同同(同一一變量),縱坐坐標分別別位于左左右兩側側(可以以是同一一變量,也可以以是兩個個不同的的變量)。62散點圖表表達式的的一般形形式為:(1)bubble和bubble2語句:縱縱坐標變變量名*橫坐標標變量名名=泡尺寸變變量名(變量值值以泡的的大小表表示),三者均均應為數(shù)數(shù)值變量量;(2)plot和plot2語句:縱縱坐標變變量名*橫坐標標變量名名,此處等等號及其其后的部部分可以以省略,此時SAS以默認的的散點類類型繪制制散點圖圖;若等等號后為為n(n為正整數(shù)數(shù),是
30、散散點類型型的編號號),SAS則以指定定的編號號對應的的散點類類型繪制制散點圖圖;若等等號后為為分類變變量名(可為字字符型或或數(shù)值型型,為數(shù)數(shù)值型時時作為離離散型變變量處理理,每一一個值將將被當作作一個類類別),此變量量的具體體值(或或與每個個具體值值對應的的圖形)將被作作為散點點用來繪繪制散點點圖。chart過程和plot過程的一一般格式式及各選選項使用用方法分分別與gchart過程和gplot過程是基基本相同同的,不不同之處處僅在于于后兩者者中涉及及到有關關三維和和圖形元元素(顏顏色等)的語句句和選項項在前兩兩者中是是無效的的。例如如vbar3d語句在chart過程中無無效,bubble語
31、句在plot過程中無無效。其其余的語語句和選選項使用用方法完完全相同同,所以以在掌握握了gchart過程和gplot過程后,chart過程和plot過程你會會不學自自通。631.GCHART過程(1)語法格式式GCHART過程用于于繪制直直方圖、餅形圖圖(扇形形圖)、三維直直方圖等等表示變變量分布布的圖形形。其語語法格式式為:PROC GCHARTDATA =;/RUN;64GCHART過程可以以使用的的圖形關關鍵字及及其所繪繪制的圖圖形類型型見表2-5。圖形關鍵鍵字后的的變量名名用以指指定進行行圖形描描述時的的分組變變量,可可以是數(shù)數(shù)值型的的(此時時以各組組的組中中值為分分組的標標志),也可
32、以以是字符符型的。圖形關鍵字繪制的圖形類型圖形關鍵字繪制的圖形類型block方塊圖pie餅形圖hbar水平的條形圖pie3d三維餅形圖hbar3d水平的三維條形圖donut環(huán)形圖vbar豎立的條形圖star星形圖vbar3d豎立的三維條形圖65選項比較較重要的的有:TYPE =統(tǒng)計量關關鍵字,表示以以圖形對對變量(SUMVAR所指定的的變量)的哪一一種統(tǒng)計計量進行行描述,比如頻頻數(shù)(FREQ)、均數(shù)數(shù)(MEAN)、總計計(SUM)、頻數(shù)數(shù)百分比比(PCTN)等;SUBGROUP=變量名(分組變變量),指定要要進行分分組(各各組段內內再分組組)的變變量;SUMVAR=變量名(數(shù)值變變量),指定要
33、要進行統(tǒng)統(tǒng)計計算算的變量量,也就就是“TYPE =統(tǒng)計量關關鍵字”選項中中統(tǒng)計量量的計算算所依據(jù)據(jù)的變量量。66(2)畫條形圖圖(直方方圖)使用VBAR關鍵字可可以畫條條形圖。例如,畫出數(shù)數(shù)據(jù)集Mylib.sryzc中Income變量的條條形圖的的代碼如如下:proc gchartdata =mylib.sryzc;vbarIncome;run;結果如圖圖所示。67其中繪圖圖用的變變量用VBAR語句給出出,如果果把VBAR改成HBAR則條形方方向變?yōu)闉闄M向。用GCHART繪制的條條形圖和和在INSIGHT中繪制的的直方圖圖有所不不同,它它在橫軸軸標的是是區(qū)間的的中點值值,而在在INSIGHT中
34、橫軸標標的是區(qū)區(qū)間的端端點值。可以指定定分組的的變量,例如在在每個區(qū)區(qū)段內再再分段,可以用用如下代代碼:proc gchartdata= mylib.sryzc;vbarIncome/subgroup= R_Id;run;結果如圖圖所示。68(3)畫三維條條形圖使用BLOCK關鍵字可可以畫三三維條形形圖。例例如,畫畫出數(shù)據(jù)據(jù)集mylib.sryzc中Income變量的三三維條形形圖的代代碼如下下:proc gchartdata= mylib.sryzc;blockIncome/ group =R_Id;run;結果如圖圖所示。69(4)畫餅形圖圖使用PIE關鍵字可可以畫餅餅形圖,PIE3D關鍵
35、字可可以畫三三維餅形形圖。例例如,畫畫出數(shù)據(jù)據(jù)集mylib.sryzc中Income變量的三三維餅形形圖的代代碼如下下:proc gchartdata= mylib.sryzc;PIE3DIncome;run;結果如圖圖所示。702.使用GPLOT過程繪制制散點圖圖和連線線圖通常用散散點圖和和連線圖圖可以表表示: 一個個變量隨隨另一個個變量的的變化; 變量量之間的的關系; 數(shù)據(jù)據(jù)值的分分布。(1)GPLOT過程的一一般格式式PROC GPLOT DATA=;PLOT * = /;SYMBOLn;RUN;常用的選選項見表表2-6。71表2-6PLOT語句的選選項選項意義說明FRAM | NOFR
36、AM在圖形四周加入或不加入邊框缺省為加入CFRAM = 顏色邊框內的顏色缺省為白色AUTOHREF(AUTOVEREF)在水平(垂直)軸的每個主刻度處加入水平(垂直)參考線NOAXIS取消坐標軸及相關的圖形元素CAXIS = 顏色設定軸的顏色CTEXT = 顏色設定與軸相關字符的顏色HAXIS = 值列舉設定水平軸主刻度的值VAXIS = 值列舉設定垂直軸主刻度的值72SYMBOL語句用來來控制表表示點的的符號和和點間的的連線。其中n是不同SYMBOL語句的序序號,可可以是1-99,缺省為為1。選項見見表2-7。表2-7SYMBOL語句的選選項選項意義取值V = 符號表示點使用的符號plus,
37、 x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circleC = 顏色表示點的符號及連線的顏色black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellowCV =顏色專指點的符號的顏色H = n指名符號的大小單位有:cell, cm, pct, pt, inPOINTLABEL在點的附近表明Y軸變量的值i = 連線方式指明連線的方式none, join, spline, needleCI = 顏色專指連線的顏色L = nn為
38、線型的序號0 空白線,1 - 實線,2 虛線 W = nn表示線的寬度73(2)散點圖繪制家庭庭總收入入對家庭庭總支出出的散點點圖,代代碼如下下:proc gplotdata =mylib.sryzc;plotIncome*outgo;run;結果顯示示了一個個GRAPHICS窗口,繪繪出了以以Income為縱軸、以Outgo為橫軸的的散點圖圖(見圖圖)。74可以在圖圖中按第第三個變變量分組組畫出散散點圖(如圖2-48右),代代碼如下下:proc gplotdata =mylib.sryzc;plotIncome*outgo=r_id;symbol1color=blackv= star;sym
39、bol2color=bluev =dot;run;75(3)連線圖為了繪制制連線,只要在在SYMBOL語句中指指定i =join。例如繪繪制家庭庭總收入入對家庭庭編號的的連線圖圖(圖2-49左),代代碼如下下:proc gplotdata =mylib.sryzc;plotIncome*id;symboli=join v=star;run;76也可以分分地區(qū)繪繪制家庭庭總收入入對家庭庭編號的的連線圖圖(圖2-49右),代代碼如下下:proc gplotdata =mylib.sryzc;plotIncome*id=r_id;symbol1color=blacki=joinv= star;sym
40、bol2color=blue i=joinv =dot;run;77圖形的調調整與輸輸出在圖形中中也可以以用TITLE語句和FOOTNOTE語句給圖圖形加標標題和腳腳注。還可以在在圖形的的標題、標簽中中使用TrueType字型的漢漢字,例例如:goptionsftext=宋體 htitle=4 cells htext=3cells;procgplotdata=sasuser.class;title試驗SAS圖形的漢漢字功能能;symboli=nonev=square;plot weight*height;labelweight=體重 height=身高;run;輸出結果果見圖。其中GOPTIO
41、NS中的FTEXT選項指定定圖形中中文本的的字體。78為了把GRAPH繪制的圖圖形保存存為兼容容的圖形形文件,只要在在顯示某某一頁圖圖形輸出出時,選選“File-Export”菜單,在在出現(xiàn)的的輸入文文件名的的窗口選選擇適當當?shù)奈募愋?,如BMP、WMF、JPEG、PS,等等。要打印GRAPH生成的圖圖形,只只要選“File-Print”。這樣用用Windows的打印驅驅動程序序與SAS/GRAPH的圖形驅驅動配合合來打印印。另外外,SAS/GRAPH模塊還提提供了許許多種打打印機的的獨立的的驅動程程序,可可以不依依賴于Windows的打印驅驅動,具具體請參參考有關關資料或或幫助。79例下表
42、為長長沙市某某大學160名正常成成年女子子1999年體檢資資料中的的血清甘甘油三酯酯的測量量結果(mmol/L),請對對其進行行統(tǒng)計描描述。0.910.881.410.961.481.460.911.101.261.680.680.831.771.231.041.080.621.101.330.730.521.011.711.370.511.011.111.090.961.371.200.611.170.711.160.800.731.660.961.370.951.300.761.390.941.251.601.541.341.561.540.851.540.960.
43、821.501.141.701.301.591.071.171.321.441.120.700.681.520.761.601.271.431.271.090.750.640.971.201.341.191.080.661.421.460.591.221.321.671.201.331.311.020.830.901.090.961.100.851.061.670.780.910.891.081.270.851.241.580.711.461.520.911.471.011.201.301.051.450.651.041.241.301.111.
44、650.870.820.761.300.631.140.831.241.481.150.991.491.021.170.990.611.330.790.951.051.641.400.721.0680按要求我我們來計計算該指指標的均均數(shù)、中中位數(shù)、標準差差和若干干個重要要的百分分位數(shù)以以及四分分位數(shù),并以直直方圖來來表現(xiàn)此此資料的的分布特特征。先將數(shù)據(jù)據(jù)轉換成成SAS數(shù)據(jù)集的的格式,編程時時直接引引用就可可以了。我們先來來計算所所要的描描述性統(tǒng)統(tǒng)計量。計量資料料的描述述性統(tǒng)計計功能通通常用Summary過程、Means過程和univariate過程來實實現(xiàn)。tabula
45、te過程也可可以實現(xiàn)現(xiàn)描述性性統(tǒng)計功功能,但但它和以以上三個個過程來來比就顯顯得復雜雜了一些些,其實實tabulate過程的過過人之處處在于對對含有較較多分類類變量的的資料的的匯總性性分析,以后大大家用到到的時候候會慢慢慢體會到到這一點點。這里我們們分別以以三個過過程來完完成對該該例題的的描述性性統(tǒng)計分分析將上表中中的數(shù)據(jù)據(jù)以文本本文件的的形式錄錄入,文文件名為為case2_1,存入目錄錄“D:SAS_Teach”下。81(1)以means過程進行行分析libname aD:SAS_Teach;data a.case2_1;infileD:SAS_Teachdata2_1.txt;inputx
46、;run;proc means nmeanmedianp1p5p95 p99q1q3maxmin;varx;run;82默認情況況下,Means過程會給給出頻數(shù)數(shù)、均數(shù)數(shù)、標準準差、最最大值和和最小值值等,若若默認情情況滿足足需要,則Proc Means后的所有有選項(代表所所要求計計算的統(tǒng)統(tǒng)計量)皆可省省略,否否則需一一一寫出出,如以以上程序序。83(2)以summary過程進行行分析libname aD:SAS_Teach;data a.case2_1;infileD:SAS_Teachdata2_1.txt;inputx;run;proc summary;varx;outputout=temp1 mean=mmedian=mdp1=pt1 p5=pt5p95=pt95p99=pt99q1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度地質勘探現(xiàn)場錄像記錄合同4篇
- 2025年度智能辦公系統(tǒng)開發(fā)與IT技術支持服務協(xié)議3篇
- 二零二五年度知識產(chǎn)權背景下的股權轉讓合同3篇
- 專業(yè)?;愤\輸委托合同書版B版
- 二零二五年度綠色家居裝修綠植租賃與室內裝飾服務協(xié)議4篇
- 2024西藏自治區(qū)建設工程施工合同范本
- 2024碎石原料供應鏈優(yōu)化與升級合同
- 2023-2024學年高中信息技術選修2(浙教版2019)-網(wǎng)絡基礎-說課稿-2.2-網(wǎng)絡體系結構與TCPIP協(xié)議
- 2025年度智能家居產(chǎn)品貼牌代工及銷售合同4篇
- 二零二五年度毛紗產(chǎn)業(yè)創(chuàng)新發(fā)展基金投資合同4篇
- 市政道路工程交通疏解施工方案
- 2024年部編版初中七年級上冊歷史:部分練習題含答案
- 拆遷評估機構選定方案
- 床旁超聲監(jiān)測胃殘余量
- 上海市松江區(qū)市級名校2025屆數(shù)學高一上期末達標檢測試題含解析
- 綜合實踐活動教案三上
- 《新能源汽車電氣設備構造與維修》項目三 新能源汽車照明與信號系統(tǒng)檢修
- 2024年新課標《義務教育數(shù)學課程標準》測試題(附含答案)
- 醫(yī)院培訓課件:《靜脈中等長度導管臨床應用專家共識》
- 中國國際大學生創(chuàng)新大賽與“挑戰(zhàn)杯”大學生創(chuàng)業(yè)計劃競賽(第十一章)大學生創(chuàng)新創(chuàng)業(yè)教程
- 鋼管豎向承載力表
評論
0/150
提交評論