第四講的描述統(tǒng)計(jì)_第1頁(yè)
第四講的描述統(tǒng)計(jì)_第2頁(yè)
第四講的描述統(tǒng)計(jì)_第3頁(yè)
第四講的描述統(tǒng)計(jì)_第4頁(yè)
第四講的描述統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講的描述統(tǒng)計(jì)第1頁(yè),共43頁(yè),2023年,2月20日,星期二1、MEANS過(guò)程(均值過(guò)程)Procmeans<選項(xiàng)><輸出統(tǒng)計(jì)量關(guān)鍵字列表>;<Var分析變量名列

;><Class分類變量名列

;><Freq頻數(shù)變量

;><by分類變量名列;

><Outputout=數(shù)據(jù)集名<輸出統(tǒng)計(jì)量列表>;>Run;Procmeans主語(yǔ)句選項(xiàng):1.DATA=SAS數(shù)據(jù)集:指出SAS數(shù)據(jù)集的名稱,若省略,則使用最近產(chǎn)生的數(shù)據(jù)集。2.MAXDEC=數(shù)字指定該過(guò)程輸出結(jié)果中小數(shù)部分的最大位數(shù)(0到8).默認(rèn)是2。3.FW=域?qū)?/p>

給出該過(guò)程用來(lái)打印每個(gè)統(tǒng)計(jì)量的字符長(zhǎng)。默認(rèn)是12。4.

ALPHA=置信水平為1-.默認(rèn)為=0.05.Means過(guò)程默認(rèn)輸出統(tǒng)計(jì)量只有五個(gè):

N,Mean,Std,Min,Max

(1)語(yǔ)法格式第2頁(yè),共43頁(yè),2023年,2月20日,星期二(2).應(yīng)用舉例例1:某單位對(duì)100名健康的女大學(xué)生測(cè)定了血清總蛋白含量(g/L),試做單變量描述性統(tǒng)計(jì)分析。dataaa;inputx@@;cards;74.378.8……70.4;procmeans;procmeansnminmaxmeanstdstderrcvmaxdec=2;第3頁(yè),共43頁(yè),2023年,2月20日,星期二

MEANS過(guò)程分析變量:xN均值標(biāo)準(zhǔn)偏差最小值最大值10073.66000003.940081564.300000084.3000000procmeans;默認(rèn)的5個(gè)統(tǒng)計(jì)量其SAS輸出結(jié)果與說(shuō)明第4頁(yè),共43頁(yè),2023年,2月20日,星期二procmeansnminmaxmeanstdstderrcv

maxdec=2;輸出結(jié)果:MEANS過(guò)程分析變量:xN最小值最大值均值標(biāo)準(zhǔn)偏差標(biāo)準(zhǔn)誤差偏差系數(shù)10064.3084.3073.663.940.395.35第5頁(yè),共43頁(yè),2023年,2月20日,星期二

例2.下表為兩個(gè)不同地區(qū)居民家庭收入和支出情況的抽樣調(diào)查(單位:元),試分別統(tǒng)計(jì)收入和支出情況。

將下表中數(shù)據(jù)輸入成Excel文件sryzc.xls。4個(gè)變量名分別為:ID、R_ID、Income和Outgo,該四個(gè)變量分別表示“家庭編號(hào)”、“地區(qū)編號(hào)”、“家庭總收入”和“家庭總支出”。首先將其導(dǎo)入為SAS數(shù)據(jù)文件mylib.sryzc。第6頁(yè),共43頁(yè),2023年,2月20日,星期二IDR_IDIncomeOutgoIDR_IDIncomeOutgo121794155016222002060221716136517127302236313410273018124961455421765153019117601040522184190020128202366622050205021222501966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316第7頁(yè),共43頁(yè),2023年,2月20日,星期二

對(duì)數(shù)據(jù)集mylib.sryzc中的Income變量計(jì)算簡(jiǎn)單統(tǒng)計(jì)量,用如下MEANS過(guò)程即可:proc

means

data=mylib.sryzc;

var

Income;

run;SAS運(yùn)行結(jié)果:第8頁(yè),共43頁(yè),2023年,2月20日,星期二

在PROCMEANS語(yǔ)句中使用統(tǒng)計(jì)量關(guān)鍵字列表。輸出數(shù)據(jù)集mylib.sryzc中收入(Income)的觀測(cè)個(gè)數(shù)、均值、中位數(shù)、第一百分位數(shù)、第五百分位數(shù)、第九十五百分位數(shù)、第九十九百分位數(shù)、第一四分位數(shù)、第三四分位數(shù)、最大值、最小值。proc

means

data=mylib.sryzc

nmeanmedianp1p5p95p99q1q3maxmin

var

Income;run;

運(yùn)行結(jié)果第9頁(yè),共43頁(yè),2023年,2月20日,星期二

可以計(jì)算的描述性統(tǒng)計(jì)量關(guān)鍵字及其含義見(jiàn)下表。關(guān)鍵字所代表的含義關(guān)鍵字所代表的含義n有效數(shù)據(jù)記錄數(shù)skewness偏度nmiss缺失數(shù)據(jù)記錄數(shù)kurtosis峰度mean均值t分布位置假設(shè)檢驗(yàn)之t統(tǒng)計(jì)量std標(biāo)準(zhǔn)差probt上述t統(tǒng)計(jì)量對(duì)應(yīng)的概率值stderr標(biāo)準(zhǔn)誤q1第一四分位數(shù)var方差q3第三四分位數(shù)median中位數(shù)qrange四分位數(shù)間距mode眾數(shù)p1第一百分位數(shù)cv變異系數(shù)p5第五百分位數(shù)max最大值p10第十百分位數(shù)min最小值p90第九十百分位數(shù)sum總計(jì)p95第九十五百分位數(shù)sumwgt加權(quán)值總計(jì)p99第九十九百分位數(shù)css校正平方和CLM置信限uss未校正平方和LCLM置信下限r(nóng)ange極差UCLM置信上限第10頁(yè),共43頁(yè),2023年,2月20日,星期二(3)使用CLASS語(yǔ)句或BY語(yǔ)句Class分類變量名列

;by分類變量名列;兩個(gè)語(yǔ)句的區(qū)別是:●使用BY語(yǔ)句時(shí)要求數(shù)據(jù)集須按BY變量排序,使用CLASS語(yǔ)句無(wú)此要求?!袷褂肂Y語(yǔ)句時(shí)輸出按BY變量的每個(gè)值分別提供一個(gè)表,使用CLASS語(yǔ)句則將所有結(jié)果排列在一個(gè)表之中。第11頁(yè),共43頁(yè),2023年,2月20日,星期二

例3.1)使用BY語(yǔ)句,將上例中的數(shù)據(jù)按地區(qū)(R_Id)分組計(jì)算統(tǒng)計(jì)量:Proc

sort

data=mylib.sryzc;

by

R_Id;run;proc

means

data=mylib.sryzc

nmeanmedianp1p5p95p99q1q3maxmin;

var

Income;

by

R_Id;run;

第12頁(yè),共43頁(yè),2023年,2月20日,星期二R_ID=1TheMEANSProcedureAnalysisVariable:INCOMEIncomeNMeanMedian1stPctl5thPtcl95thPctl99thPctl142803.712775.001760.001760.004275.004275.00LowerUpperQuartileQuartileMaximumMinimum2400.003305.004275.001760.00R_ID=2

AnalysisVariable:INCOMEIncomeNMeanMedian1stPctl5thPtcl95thPctl99thPctl161889.441983.001080.001080.002460.002460.00LowerUpperQuartileQuartileMaximumMinimum1740.502192.002460.001080.00使用BY語(yǔ)句分區(qū)域輸出統(tǒng)計(jì)量:第13頁(yè),共43頁(yè),2023年,2月20日,星期二

2)使用CLASS語(yǔ)句,按地區(qū)(R_Id)分組計(jì)算統(tǒng)計(jì)量:proc

means

data=mylib.sryzc

nmeanmedianp1p5p95p99q1q3maxmin;

var

Income;

CLASS

R_Id;run;

第14頁(yè),共43頁(yè),2023年,2月20日,星期二使用CLASS語(yǔ)句輸出結(jié)果:TheMEANSProcedure

AnalysisVariable:INCOMEIncomeR_ID

ObsNMeanMedian1stPctl5thPtcl95thPctl

1

14142803.712775.001760.001760.004275.00

2

16161889.441983.001080.001080.002460.00

LowerUpperR_ID

Obs99thPctlQuartileQuartileMaximumMinimum

1

144275.002400.003305.004275.001760.00

2162460.001740.502192.002460.001080.00第15頁(yè),共43頁(yè),2023年,2月20日,星期二(4)使用Output語(yǔ)句(輸出語(yǔ)句)Outputout=數(shù)據(jù)集名<輸出統(tǒng)計(jì)量列表>;輸出統(tǒng)計(jì)量列表形式:1)

統(tǒng)計(jì)量關(guān)鍵字=;新數(shù)據(jù)集中統(tǒng)計(jì)量用原變量名2)

統(tǒng)計(jì)量關(guān)鍵字=新名字列表3)

統(tǒng)計(jì)量關(guān)鍵字(變量列表)=新名字列表Procmeansdata=mylib.bclassnoprint;varheightweight;outputout=result2mean=;Run;Procprintdata=result2;run;例4(1)把數(shù)據(jù)集mylib.bclass中變量height和weight的均值輸出到新數(shù)據(jù)集result2.第16頁(yè),共43頁(yè),2023年,2月20日,星期二

(2)把變量height和weight的均值(新名分別取為hmean和wmean)

和標(biāo)準(zhǔn)差(新名字分別取為hstd和wstd)輸出到新數(shù)據(jù)集result3.Procmeansdata=mylib.bclassnoprint;varheightweight;outputout=result3mean=hmean

wmeanstd=hstd

wstd;Run;Procprintdata=result3;run;Output<選項(xiàng)><輸出統(tǒng)計(jì)量列表>;輸出統(tǒng)計(jì)量列表形式:1)

統(tǒng)計(jì)量關(guān)鍵字=;新數(shù)據(jù)集中統(tǒng)計(jì)量用原變量名2)

統(tǒng)計(jì)量關(guān)鍵字=新名字列表3)

統(tǒng)計(jì)量關(guān)鍵字(變量列表)=新名字列表第17頁(yè),共43頁(yè),2023年,2月20日,星期二(3)把變量height的均值、變量height和weight的標(biāo)準(zhǔn)差(新名字

分別取為hstd和wstd)和變量weight的方差(新名字取為wvar)輸出到新數(shù)據(jù)集result4.Procmeansdata=mylib.bclassnoprint;varheightweight

;outputout=result4mean(height)=std=hstd

wstdvar(weight)=wvar;Run;Procprintdata=result4;run;Output<選項(xiàng)><輸出統(tǒng)計(jì)量列表>;輸出統(tǒng)計(jì)量列表形式:1)

統(tǒng)計(jì)量關(guān)鍵字=;新數(shù)據(jù)集中統(tǒng)計(jì)量用原變量名2)

統(tǒng)計(jì)量關(guān)鍵字=新名字列表3)

統(tǒng)計(jì)量關(guān)鍵字(變量列表)=新名字列表第18頁(yè),共43頁(yè),2023年,2月20日,星期二2.UNIVARIATE過(guò)程(單變量過(guò)程)

UNIVARIATE過(guò)程和MEANS過(guò)程的格式非常相似,相同的語(yǔ)句和選項(xiàng)其含義也相同,所不同的是某些統(tǒng)計(jì)量只能在UNIVARIATE過(guò)程中計(jì)算(如眾數(shù)),而且UNIVARIATE過(guò)程中具有繪圖功能;MEANS過(guò)程默認(rèn)輸出統(tǒng)計(jì)量只有五個(gè);

UNIVARIATE過(guò)程默認(rèn)輸出統(tǒng)計(jì)量不只一頁(yè)。第19頁(yè),共43頁(yè),2023年,2月20日,星期二UNIVARIATE過(guò)程一般格式:Procunivariate<選項(xiàng)>;Var變量名列;/*分析所列變量*/

<by變量名;>

<class變量名;>

<Id

變量名;>

<Outputout=數(shù)據(jù)集名<輸出統(tǒng)計(jì)量列表>;>

<histogram變量名</<選項(xiàng)>;

>Run;

Procunivariate主語(yǔ)句中可使用的選項(xiàng):Data=

數(shù)據(jù)集名若省略,用最近建立的SAS數(shù)據(jù)集。Freq

:生成包括變量值、頻數(shù)、百分?jǐn)?shù)和累計(jì)頻數(shù)的頻率表Normal

:計(jì)算關(guān)于輸入數(shù)據(jù)服從正態(tài)分布假設(shè)的檢驗(yàn)統(tǒng)計(jì)量及P-值。Plot

:

生成一個(gè)莖葉圖(或水平直方圖),箱線圖和正態(tài)概率圖。Noprint:

在Output窗口不輸出計(jì)算結(jié)果。Mu0=數(shù)值

若省略,檢驗(yàn)的均值為0。第20頁(yè),共43頁(yè),2023年,2月20日,星期二例5:對(duì)數(shù)據(jù)集bclass中變量HEIGHT和

WEIGHT計(jì)算常用描述性統(tǒng)計(jì)量Proc

univariate

data=mylib.bclass;

Var

height

weight

;Run;使極值部分顯示更直接.對(duì)最大和最小的幾個(gè)紀(jì)錄不僅顯示它們的觀測(cè)序號(hào),還顯示相應(yīng)的Id變量值(如姓名),使我們從輸出結(jié)果就知道誰(shuí)最高,誰(shuí)最矮等等.利用Id語(yǔ)句的例子:Procunivariatedata=mylib.bclass;Varheight

weight

Idname;Run;Id語(yǔ)句:Id識(shí)別變量名;第21頁(yè),共43頁(yè),2023年,2月20日,星期二利用Id語(yǔ)句前、后輸出(部分):

Variable:HEIGHT(身高(厘米))

ExtremeObservationsLowestHighest

ValueObsValueObs125316712127271672013525167211373016914142617222

Variable:HEIGHT(身高(厘米))

ExtremeObservationsLowestHighest

ValueNAMEObsValueNAMEObs125ROBERT3167EDWARD12127LILLIE27167PHILLIP20135JANE25167KIRK21137SUSAN30169JEFFERY14142MICHAEL6172LAWRENCE22第22頁(yè),共43頁(yè),2023年,2月20日,星期二不用畫(huà)圖語(yǔ)句時(shí)Univariate過(guò)程輸出一般包括五個(gè)部分:第一部分是矩統(tǒng)計(jì)量;第二部分為基本的位置和分散程度統(tǒng)計(jì)量,位置統(tǒng)計(jì)量包括均值、中位數(shù)、眾數(shù),分散程度統(tǒng)計(jì)量包括標(biāo)準(zhǔn)差、方差、極差、四分位間距;第三部分為關(guān)于均值等于零的三種檢驗(yàn)的結(jié)果,包括t檢驗(yàn)、符號(hào)檢驗(yàn)和符號(hào)秩檢驗(yàn);第四部分為各個(gè)重要的分位數(shù);第五部分是觀測(cè)數(shù)據(jù)的五個(gè)最低值和五個(gè)最高值。第23頁(yè),共43頁(yè),2023年,2月20日,星期二Histogram語(yǔ)句(畫(huà)直方圖語(yǔ)句),其一般格式:histogram變量名</<選項(xiàng)>>;選項(xiàng):Midpoints=中點(diǎn)列Vscale=percent|count|proportion

直方圖高度。默認(rèn)是percent。Cfill=顏色

涂上直方圖或擬合曲線下方的顏色Nocurvel

隱藏不同曲線含義的圖例第24頁(yè),共43頁(yè),2023年,2月20日,星期二Procunivariatedata=mylib.sryzc

plot;Varincome

;histogramincome/cfill=red

;

Run;

例6計(jì)算家庭總收入的描述統(tǒng)計(jì)量,并繪制其直方圖、盒形圖及正態(tài)概率圖。Univariate過(guò)程輸出的直方圖繪制盒形圖及正態(tài)概率圖選項(xiàng)畫(huà)直方圖語(yǔ)句第25頁(yè),共43頁(yè),2023年,2月20日,星期二莖葉圖

莖葉圖又稱“枝葉圖”,它的思路是將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。莖葉圖是一個(gè)與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息。將莖葉圖莖和葉逆時(shí)針?lè)较蛐D(zhuǎn)9O度,實(shí)際上就是一個(gè)直方圖,可以從中統(tǒng)計(jì)出次數(shù),計(jì)算出各數(shù)據(jù)段的頻率或百分比。從而可以看出分布是否與正態(tài)分布或單峰偏態(tài)分布逼近。第26頁(yè),共43頁(yè),2023年,2月20日,星期二莖葉圖的優(yōu)缺點(diǎn)

1、用莖葉圖表示數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。

2、莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個(gè)以上的數(shù)據(jù)雖然能夠記錄,但是沒(méi)有表示兩個(gè)記錄那么直觀、清晰。第27頁(yè),共43頁(yè),2023年,2月20日,星期二莖葉圖的案例分析

莖葉圖是將統(tǒng)計(jì)分組和次數(shù)分配一次完成,是探索性數(shù)據(jù)分析中對(duì)數(shù)據(jù)的初步形象描繪。其圖形直觀且保留原始信息,均值、中位數(shù)和眾數(shù)均可依原始數(shù)據(jù)準(zhǔn)確方便地算出?,F(xiàn)以某班一次考試成績(jī)?yōu)槔榻B莖葉圖的作法。第28頁(yè),共43頁(yè),2023年,2月20日,星期二第29頁(yè),共43頁(yè),2023年,2月20日,星期二第30頁(yè),共43頁(yè),2023年,2月20日,星期二作圖過(guò)程

先作“莖”后填“葉”,將分組標(biāo)志(組距)視為莖,按數(shù)的大小從上到下(也可從下到上)排列。將每一個(gè)觀察值視為一個(gè)樹(shù)葉,每一個(gè)樹(shù)葉按照樹(shù)莖之要求長(zhǎng)在應(yīng)長(zhǎng)的樹(shù)莖上。對(duì)于百分制的考試分?jǐn)?shù),先將高位數(shù)字按順序排成一列,后將每個(gè)分?jǐn)?shù)的個(gè)位數(shù)為葉長(zhǎng)在相應(yīng)的莖上,最后將每莖上的葉按從小到大的排列。若人數(shù)較多,樹(shù)葉較長(zhǎng),可將高位數(shù)重復(fù)兩次,個(gè)位數(shù)分為0~5一枝,5~9一枝。為了便于分析,可將1/4、3/4分位數(shù)及中位數(shù)用符號(hào)標(biāo)出。

第31頁(yè),共43頁(yè),2023年,2月20日,星期二利用莖葉圖對(duì)考試成績(jī)進(jìn)行評(píng)估

1)將莖葉圖莖和葉逆時(shí)針?lè)较蛐D(zhuǎn)9O度,實(shí)際上就是一個(gè)班級(jí)成績(jī)帶有數(shù)字的直方圖,可以從中統(tǒng)計(jì)出次數(shù),計(jì)算出各分?jǐn)?shù)段的頻率或百分比,從它可以看出班級(jí)成績(jī)的分布是否與正態(tài)分布或單峰偏態(tài)分布逼近。2)若莖葉圖成績(jī)表扁而寬,說(shuō)明該班整體成績(jī)較集中,成績(jī)差異不大;如果莖葉圖長(zhǎng)而窄,說(shuō)明該班成績(jī)較分散,標(biāo)準(zhǔn)差較大,高分低分差距大。這可使教師或校管理部門對(duì)學(xué)生成績(jī)有所了解。第32頁(yè),共43頁(yè),2023年,2月20日,星期二2.盒形圖盒形圖(boxplot,又稱箱圖、箱線圖、盒子圖)是用更為簡(jiǎn)潔的方法表現(xiàn)數(shù)據(jù)在數(shù)軸上的分布及其特點(diǎn)的圖形。左圖是根據(jù)居民家庭的收入情況所繪的盒形圖;右圖是分地區(qū)居民家庭的收入情況所繪的盒形圖。

第33頁(yè),共43頁(yè),2023年,2月20日,星期二

盒子的中間橫線是數(shù)據(jù)的中位數(shù),封閉盒子的上下兩橫線分別為上,下四分位數(shù)。盒子的長(zhǎng)度就是分布的四分位間距,其作用類似于標(biāo)準(zhǔn)差,可以反映數(shù)據(jù)分布的分散程度。從盒子邊線向外畫(huà)的兩條線叫做觸須線,最長(zhǎng)可以延伸到四分位間距的1.5倍,但是如果已經(jīng)到了數(shù)據(jù)的最小值或最大值處就不再延伸了。如果有些數(shù)據(jù)值超出了觸須線的范圍,則這些數(shù)據(jù)用觸須線以外的點(diǎn)來(lái)畫(huà)出,一般認(rèn)為這樣的點(diǎn)可能是異常點(diǎn),在進(jìn)一步進(jìn)行數(shù)據(jù)分析時(shí)可以考慮是否需要剔除它。第34頁(yè),共43頁(yè),2023年,2月20日,星期二

StemLeaf#Boxplot43103323444|25557886++20000022222411*--+--*15788886++1122|++++MultiplyStem.Leafby10**+3NormalProbabilityPlot4250+*+|++++++++|*+*+*+*2750+++++***|+*****+****|**+*******1250+*++*+++++++++++++++-2-10+1+2UNIVARIATE過(guò)程輸出的莖葉圖、盒形圖、正態(tài)概率圖正態(tài)概率圖中“*”代表觀測(cè)值“+”代表參考直線。當(dāng)觀測(cè)數(shù)據(jù)來(lái)自正態(tài)分布時(shí),“*”應(yīng)與“+”較為接近或重合。本例中,兩者較接近,數(shù)據(jù)可能來(lái)自正態(tài)分布??蛇M(jìn)一步利用檢驗(yàn)統(tǒng)計(jì)量進(jìn)行正態(tài)性檢驗(yàn)。第35頁(yè),共43頁(yè),2023年,2月20日,星期二FREQ過(guò)程(頻數(shù)過(guò)程.可輸出頻數(shù)表)procfreq

<選項(xiàng)>;

<by變量名;

>

<tables

變量名列

</選項(xiàng)>>;

<其他SAS語(yǔ)句;>run;

1)Data=

數(shù)據(jù)集名若省略,用最近建立的SAS數(shù)據(jù)集。

2)Order=Freq|Data|Internal|Formatted

規(guī)定變量水平的記錄次序(排列次序)。

Order=

Freq表示按頻數(shù)降序排列,因此最大頻數(shù)的水平第一個(gè)出現(xiàn);

Order=Data表示按輸入數(shù)據(jù)集中值的出現(xiàn)次序排列;

Order=Internal表示按變量的值排序;

Order=Formatted表示按變量格式化值的次序。默認(rèn)項(xiàng)。

procfreq

主語(yǔ)句中可使用的選項(xiàng):3)

Page

要求Freq過(guò)程每頁(yè)只輸出一張表。第36頁(yè),共43頁(yè),2023年,2月20日,星期二Tables

語(yǔ)句tables

變量名列

</選項(xiàng)>

;變量名列:列出要輸出頻數(shù)表的變量名,變量名之間要留空格.

在PROCFREQ

的一次執(zhí)行中可以包括任意多個(gè)tables語(yǔ)句。如果沒(méi)有tables語(yǔ)句,F(xiàn)REQ過(guò)程對(duì)數(shù)據(jù)集中每個(gè)變量都生成一個(gè)單向頻數(shù)表(如圖1中兩個(gè)變量的表分別為單向頻數(shù)表)。

第37頁(yè),共43頁(yè),2023年,2月20日,星期二tables

變量名列

</選項(xiàng)>;

在tables語(yǔ)句的斜杠/后面能使用的選項(xiàng)有:

NOCUM—不輸出單向頻數(shù)表和列表格式下的累計(jì)頻數(shù)和累計(jì)百分?jǐn)?shù);

第38頁(yè),共43頁(yè),2023年,2月20日,星期二Procfreqdata=sryzc

;tables

R_IdIncome;Run;輸出變量R_Id(地區(qū)編號(hào))和Income(家庭總收入)的單向頻數(shù)表:由地區(qū)編號(hào)R_ID的頻數(shù)表知,用1表示的地區(qū)樣本容量為14,用2表示的地區(qū)樣本容量為16,加起來(lái)30,即抽樣調(diào)查的家庭為30家。由家庭總收入INCOME的頻數(shù)表知,因?yàn)椴皇欠诸愖兞?,是區(qū)間形變量,所以此頻數(shù)表意義不大。圖1第39頁(yè),共43頁(yè),2023年,2月20日,星期二例7輸出bclass中體重的頻數(shù)表Procfreqdata=bclass;

tablesweight;Run;

對(duì)連續(xù)型變量(如weight),不同觀測(cè)的變量值一般不同。因

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論