某學(xué)院SAS基礎(chǔ)與金融計(jì)算_第1頁
某學(xué)院SAS基礎(chǔ)與金融計(jì)算_第2頁
某學(xué)院SAS基礎(chǔ)與金融計(jì)算_第3頁
某學(xué)院SAS基礎(chǔ)與金融計(jì)算_第4頁
某學(xué)院SAS基礎(chǔ)與金融計(jì)算_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SAS基礎(chǔ)與金融計(jì)算游家興廈門大學(xué)經(jīng)濟(jì)學(xué)院計(jì)統(tǒng)系1本節(jié)講授內(nèi)容p

SAS圖表過程n

Proc

chart

過程n

Proc

gchart

過程2統(tǒng)計(jì)圖p

對統(tǒng)計(jì)資料圖形化處理就形成統(tǒng)計(jì)圖,運(yùn)用統(tǒng)計(jì)圖形能直觀地描述統(tǒng)計(jì)分布的特征和變量之間的關(guān)系。p

統(tǒng)計(jì)圖有多種表現(xiàn)形式:n

1、直方圖n

2、餅圖n

3、折線圖n

4、曲線圖3回顧Proc

univariate

data=

student

plot;var

height

;Run;獲得三個(gè)圖:1、莖葉圖2、箱線圖3、正態(tài)概率圖4統(tǒng)計(jì)分組的相關(guān)概念n

根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)志或幾個(gè)標(biāo)志把被研究的總體劃分為若干個(gè)不同性質(zhì)的組,稱為統(tǒng)計(jì)分組。n

分組的性質(zhì)來看:兼有分和合雙重含義。5統(tǒng)計(jì)分組的步驟1.

確定數(shù)據(jù)的全距(R):R=x

-mxax

min(即最大變量值與最小變量值之差)2.

確定組限、組距和組數(shù)(1)組限分為上限和下限,上限是各組的最大變量值,下限是各組的最小變量值。(2)各組上限與下限之差稱為該組的組距。(3)組數(shù)是指某個(gè)變量數(shù)列劃分為多少個(gè)組。說明:組數(shù)的多少與組距的大小成反比關(guān)系,組距越大,則可分的組就越少。6分組,應(yīng)注意如下兩個(gè)問題:n

首先,分組時(shí)各組數(shù)量界限的確定必須能反映事物質(zhì)的差別——體現(xiàn)量變到質(zhì)變的轉(zhuǎn)化。n

其次,應(yīng)根據(jù)被研究的現(xiàn)象總體的數(shù)量特征,采用適當(dāng)?shù)姆纸M形式,確定相宜的組距、組限——主要解決分多少組的問題。7組數(shù)的確定:與組距大小成反比n

以下是美國學(xué)者斯特杰斯經(jīng)驗(yàn)公式:

n=1+3.322lgN(n:組數(shù);N:總體單位數(shù))

d=R/n=(Xmax-Xmin)/n(n為組數(shù),d為組距,R為全距)8根據(jù)上述公式,可以得出如下的組數(shù)參考標(biāo)準(zhǔn):分組組數(shù)參考表N

15-24

25-44

45-89

90-179

180-359n

56789p

上述數(shù)據(jù)僅供參考,不能生搬硬套,實(shí)際分組時(shí)要依所研究資料的性質(zhì)而定。9SAS制圖過程p

SAS統(tǒng)計(jì)制圖過程均可以實(shí)現(xiàn)對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。p

前兩個(gè)和后兩個(gè)只有一個(gè)字母“g”(代表graph)的差別,其實(shí)它們之間(只差一個(gè)字母g的過程之間)的統(tǒng)計(jì)描述功能是相同的,區(qū)別僅在于繪制出的圖形的復(fù)雜和美觀程度。10p

此外,還有一些較為復(fù)雜的制圖命令,如運(yùn)用G3D過程繪制曲面圖,運(yùn)用GCONTOUR過程繪制曲面對應(yīng)的等高線圖。p

例如,我們想繪制一個(gè)二維正態(tài)分布曲面的圖形,假設(shè)(X,Y)服從聯(lián)合正態(tài)分布,其均值都是0,方差分別為1和a,相關(guān)系數(shù)為r。11chart(或plot)與gchart(或gplot)p

chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實(shí)際上這兩個(gè)過程繪制的圖形并不能稱之為圖形,因?yàn)樗鼪]有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。p

而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項(xiàng)來控制圖形的各方面的性質(zhì)和特征。12Chart(或gchart)與plot(或gplot)p

chart和gchart過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等;p

plot和gplot過程通常用一個(gè)記錄中的兩個(gè)變量值表示點(diǎn)的坐標(biāo)來繪制圖形,如散點(diǎn)圖和線圖等。13gchart過程的一般格式p

Proc

gchart

選項(xiàng)列表;圖形關(guān)鍵詞

變量名稱/選項(xiàng)列表;Run

;p

此過程格式簡單,復(fù)雜的地方在于圖形關(guān)鍵字(每個(gè)圖形關(guān)鍵字對應(yīng)一種圖形類型)所引導(dǎo)的語句,它是控制圖形類型及圖形要素的地方,涉及到眾多的關(guān)鍵字和選項(xiàng)。14p

gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型見下表:15p

圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時(shí)的分組變量,可以是數(shù)值型的(此時(shí)以各組的組中值為分組的標(biāo)志),也可以是字符型的。p

選項(xiàng)列表中比較重要的有:p

(1)type=統(tǒng)計(jì)量關(guān)鍵字,表示圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計(jì)量進(jìn)行描述,比如頻數(shù)(freq)、均數(shù)(mean)、總計(jì)(sum)、頻數(shù)百分比(percentage)等;16p

(2)subgroup=變量名(分組變量),指定要進(jìn)行分組(各組內(nèi)再分組)的變量;p

(3)sumvar=變量名(數(shù)值變量),指定要進(jìn)行統(tǒng)計(jì)計(jì)算的變量,也就是“type=統(tǒng)計(jì)量關(guān)鍵字”選項(xiàng)中統(tǒng)計(jì)量的計(jì)算所依據(jù)的變量。17下表為長沙市某大學(xué)160名正常成年女子2006年體檢資料中的血清甘油三酯的測量結(jié)果(mmol/L)試以直方圖來表示上述資料的分布特征。18例1:單變量數(shù)據(jù)雙尾符,它表示為了執(zhí)行下一個(gè)input語句,保持指針在這個(gè)輸入的記錄行上。p

第一步:建立數(shù)據(jù)集;p

data

test;input

x

@@;cards;比較有加雙尾符和沒加雙尾符的區(qū)別。0.91

0.88

1.41

0.96

1.48

1.46

0.91

1.101.26

1.69

1.14

1.24

0.98

0.68

0.83

1.77……………1.49

1.02

1.17

0.99

0.61

1.33

0.79

0.951.05

1.65

1.20

1.24

0.84

1.40

0.72

1.06;Run;19p

第二步,進(jìn)行初步的統(tǒng)計(jì)分析,確定分組的個(gè)數(shù)。n

Proc

univariate

data=test;var

x;Run;20The

MEANS

ProcedureAnalysis

Variable

:

xNMeanStd

Dev

Minimum

Maximum1601.1312

0.29450.51001.7700p

所有160個(gè)觀測值中,最大的為1.77,最小的為0.51,如果以0.1為組距,將所有觀測值歸入13個(gè)組。p

如果根據(jù)前面的斯特杰斯經(jīng)驗(yàn)公式,則應(yīng)將所有觀測值歸入8組。21p

第三步,畫圖。n

proc

gchart

data=test;vbar

x/type=freq

levels=13

inside=freqspace=0

width=6;run;Vbar語句表示我們要做的是豎立的條形圖,其后跟的是作圖所要依據(jù)的分類變量,這里我們以變量x來做直方圖。斜杠后的內(nèi)容是對所做條形圖進(jìn)行控制的選項(xiàng),本段程序所涉及的各選項(xiàng)的含義和功能見下表。22各選項(xiàng)的含義和功能23Proc

gchart

data=test;vbar

x/type=freq

levels=13

sumvar=x

inside=freqspace=0

width=6;Run;24Proc

gchart

data=test;vbar

x/type=freq

levels=8

sumvar=x

inside=freqspace=0

width=6;Run;25Proc

gchart

data=test;vbar

x/type=freq

levels=13

sumvar=x

inside=meanspace=0

width=6;Run;26Proc

gchart

data=test;vbar

x/type=freq

levels=13

sumvar=x

inside=meanspace=5

width=6;Run;27Proc

gchart

data=test;vbar

x/type=freq

levels=13

sumvar=x

inside=meanspace=0

width=9;Run

;28p

比較Proc

gchart與Proc

chart;p

比較vbar和hbar;n

Vbar用來列出用戶想要畫的垂直條形圖的那些變量,每個(gè)圖表變量對應(yīng)一張垂直條形圖;n

Hbar對列出的每個(gè)圖變量生成水平的條形圖。p

比較直方圖與餅圖。29Proc

gchart

data=test;hbar

x/type=freq

levels=13;Run;30Proc

gchart

data=test;pie

x/type=freqlevels=13;Run

;31Proc

gchartdata=test;piex/type=meansumvar=xlevels=13;Run

;32Proc

gchartdata=test;piex/type=meansumvar=xlevels=5;Run

;33例2:分組數(shù)據(jù)下表是財(cái)政系問卷設(shè)計(jì)資料匯總34第一步,建立數(shù)據(jù)集;p

Data

score;input

subject

$

sex

$

num1

num2;Cards;………;Run;p

Data

score;set

score;label

subject='專業(yè)'

sex='性別'

num1=

'人數(shù)'

num2='題量';Run;35Group

語句Proc

gchart;vbar

subject/group=sex

sumvar=num2type=mean

;run;Num2表示題量。上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進(jìn)一步分三組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。36Proc

gchart;vbar

subject/group=sex

type=freq

;run;Num2表示題量。上述語句意思是:先按性別分組,接著在每組中按專業(yè)進(jìn)一步分組,最后再將每組包含的單位數(shù)列示出來。37Proc

gchart;vbar

sex/group=subject

sumvar=num2type=mean

;run;Num2表示題量。上述語句意思是:先按專業(yè)分三組,接著在每組中按性別分別分兩組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。38By

語句P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論