版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
SAS基礎(chǔ)與金融計(jì)算游家興廈門大學(xué)經(jīng)濟(jì)學(xué)院計(jì)統(tǒng)系1本節(jié)講授內(nèi)容p
SAS圖表過程n
Proc
chart
過程n
Proc
gchart
過程2統(tǒng)計(jì)圖p
對統(tǒng)計(jì)資料圖形化處理就形成統(tǒng)計(jì)圖,運(yùn)用統(tǒng)計(jì)圖形能直觀地描述統(tǒng)計(jì)分布的特征和變量之間的關(guān)系。p
統(tǒng)計(jì)圖有多種表現(xiàn)形式:n
1、直方圖n
2、餅圖n
3、折線圖n
4、曲線圖3回顧Proc
univariate
data=
student
plot;var
height
;Run;獲得三個(gè)圖:1、莖葉圖2、箱線圖3、正態(tài)概率圖4統(tǒng)計(jì)分組的相關(guān)概念n
根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)志或幾個(gè)標(biāo)志把被研究的總體劃分為若干個(gè)不同性質(zhì)的組,稱為統(tǒng)計(jì)分組。n
分組的性質(zhì)來看:兼有分和合雙重含義。5統(tǒng)計(jì)分組的步驟1.
確定數(shù)據(jù)的全距(R):R=x
-mxax
min(即最大變量值與最小變量值之差)2.
確定組限、組距和組數(shù)(1)組限分為上限和下限,上限是各組的最大變量值,下限是各組的最小變量值。(2)各組上限與下限之差稱為該組的組距。(3)組數(shù)是指某個(gè)變量數(shù)列劃分為多少個(gè)組。說明:組數(shù)的多少與組距的大小成反比關(guān)系,組距越大,則可分的組就越少。6分組,應(yīng)注意如下兩個(gè)問題:n
首先,分組時(shí)各組數(shù)量界限的確定必須能反映事物質(zhì)的差別——體現(xiàn)量變到質(zhì)變的轉(zhuǎn)化。n
其次,應(yīng)根據(jù)被研究的現(xiàn)象總體的數(shù)量特征,采用適當(dāng)?shù)姆纸M形式,確定相宜的組距、組限——主要解決分多少組的問題。7組數(shù)的確定:與組距大小成反比n
以下是美國學(xué)者斯特杰斯經(jīng)驗(yàn)公式:
n=1+3.322lgN(n:組數(shù);N:總體單位數(shù))
d=R/n=(Xmax-Xmin)/n(n為組數(shù),d為組距,R為全距)8根據(jù)上述公式,可以得出如下的組數(shù)參考標(biāo)準(zhǔn):分組組數(shù)參考表N
15-24
25-44
45-89
90-179
180-359n
56789p
上述數(shù)據(jù)僅供參考,不能生搬硬套,實(shí)際分組時(shí)要依所研究資料的性質(zhì)而定。9SAS制圖過程p
SAS統(tǒng)計(jì)制圖過程均可以實(shí)現(xiàn)對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。p
前兩個(gè)和后兩個(gè)只有一個(gè)字母“g”(代表graph)的差別,其實(shí)它們之間(只差一個(gè)字母g的過程之間)的統(tǒng)計(jì)描述功能是相同的,區(qū)別僅在于繪制出的圖形的復(fù)雜和美觀程度。10p
此外,還有一些較為復(fù)雜的制圖命令,如運(yùn)用G3D過程繪制曲面圖,運(yùn)用GCONTOUR過程繪制曲面對應(yīng)的等高線圖。p
例如,我們想繪制一個(gè)二維正態(tài)分布曲面的圖形,假設(shè)(X,Y)服從聯(lián)合正態(tài)分布,其均值都是0,方差分別為1和a,相關(guān)系數(shù)為r。11chart(或plot)與gchart(或gplot)p
chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實(shí)際上這兩個(gè)過程繪制的圖形并不能稱之為圖形,因?yàn)樗鼪]有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。p
而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項(xiàng)來控制圖形的各方面的性質(zhì)和特征。12Chart(或gchart)與plot(或gplot)p
chart和gchart過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等;p
plot和gplot過程通常用一個(gè)記錄中的兩個(gè)變量值表示點(diǎn)的坐標(biāo)來繪制圖形,如散點(diǎn)圖和線圖等。13gchart過程的一般格式p
Proc
gchart
選項(xiàng)列表;圖形關(guān)鍵詞
變量名稱/選項(xiàng)列表;Run
;p
此過程格式簡單,復(fù)雜的地方在于圖形關(guān)鍵字(每個(gè)圖形關(guān)鍵字對應(yīng)一種圖形類型)所引導(dǎo)的語句,它是控制圖形類型及圖形要素的地方,涉及到眾多的關(guān)鍵字和選項(xiàng)。14p
gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型見下表:15p
圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時(shí)的分組變量,可以是數(shù)值型的(此時(shí)以各組的組中值為分組的標(biāo)志),也可以是字符型的。p
選項(xiàng)列表中比較重要的有:p
(1)type=統(tǒng)計(jì)量關(guān)鍵字,表示圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計(jì)量進(jìn)行描述,比如頻數(shù)(freq)、均數(shù)(mean)、總計(jì)(sum)、頻數(shù)百分比(percentage)等;16p
(2)subgroup=變量名(分組變量),指定要進(jìn)行分組(各組內(nèi)再分組)的變量;p
(3)sumvar=變量名(數(shù)值變量),指定要進(jìn)行統(tǒng)計(jì)計(jì)算的變量,也就是“type=統(tǒng)計(jì)量關(guān)鍵字”選項(xiàng)中統(tǒng)計(jì)量的計(jì)算所依據(jù)的變量。17下表為長沙市某大學(xué)160名正常成年女子2006年體檢資料中的血清甘油三酯的測量結(jié)果(mmol/L)試以直方圖來表示上述資料的分布特征。18例1:單變量數(shù)據(jù)雙尾符,它表示為了執(zhí)行下一個(gè)input語句,保持指針在這個(gè)輸入的記錄行上。p
第一步:建立數(shù)據(jù)集;p
data
test;input
x
@@;cards;比較有加雙尾符和沒加雙尾符的區(qū)別。0.91
0.88
1.41
0.96
1.48
1.46
0.91
1.101.26
1.69
1.14
1.24
0.98
0.68
0.83
1.77……………1.49
1.02
1.17
0.99
0.61
1.33
0.79
0.951.05
1.65
1.20
1.24
0.84
1.40
0.72
1.06;Run;19p
第二步,進(jìn)行初步的統(tǒng)計(jì)分析,確定分組的個(gè)數(shù)。n
Proc
univariate
data=test;var
x;Run;20The
MEANS
ProcedureAnalysis
Variable
:
xNMeanStd
Dev
Minimum
Maximum1601.1312
0.29450.51001.7700p
所有160個(gè)觀測值中,最大的為1.77,最小的為0.51,如果以0.1為組距,將所有觀測值歸入13個(gè)組。p
如果根據(jù)前面的斯特杰斯經(jīng)驗(yàn)公式,則應(yīng)將所有觀測值歸入8組。21p
第三步,畫圖。n
proc
gchart
data=test;vbar
x/type=freq
levels=13
inside=freqspace=0
width=6;run;Vbar語句表示我們要做的是豎立的條形圖,其后跟的是作圖所要依據(jù)的分類變量,這里我們以變量x來做直方圖。斜杠后的內(nèi)容是對所做條形圖進(jìn)行控制的選項(xiàng),本段程序所涉及的各選項(xiàng)的含義和功能見下表。22各選項(xiàng)的含義和功能23Proc
gchart
data=test;vbar
x/type=freq
levels=13
sumvar=x
inside=freqspace=0
width=6;Run;24Proc
gchart
data=test;vbar
x/type=freq
levels=8
sumvar=x
inside=freqspace=0
width=6;Run;25Proc
gchart
data=test;vbar
x/type=freq
levels=13
sumvar=x
inside=meanspace=0
width=6;Run;26Proc
gchart
data=test;vbar
x/type=freq
levels=13
sumvar=x
inside=meanspace=5
width=6;Run;27Proc
gchart
data=test;vbar
x/type=freq
levels=13
sumvar=x
inside=meanspace=0
width=9;Run
;28p
比較Proc
gchart與Proc
chart;p
比較vbar和hbar;n
Vbar用來列出用戶想要畫的垂直條形圖的那些變量,每個(gè)圖表變量對應(yīng)一張垂直條形圖;n
Hbar對列出的每個(gè)圖變量生成水平的條形圖。p
比較直方圖與餅圖。29Proc
gchart
data=test;hbar
x/type=freq
levels=13;Run;30Proc
gchart
data=test;pie
x/type=freqlevels=13;Run
;31Proc
gchartdata=test;piex/type=meansumvar=xlevels=13;Run
;32Proc
gchartdata=test;piex/type=meansumvar=xlevels=5;Run
;33例2:分組數(shù)據(jù)下表是財(cái)政系問卷設(shè)計(jì)資料匯總34第一步,建立數(shù)據(jù)集;p
Data
score;input
subject
$
sex
$
num1
num2;Cards;………;Run;p
Data
score;set
score;label
subject='專業(yè)'
sex='性別'
num1=
'人數(shù)'
num2='題量';Run;35Group
語句Proc
gchart;vbar
subject/group=sex
sumvar=num2type=mean
;run;Num2表示題量。上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進(jìn)一步分三組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。36Proc
gchart;vbar
subject/group=sex
type=freq
;run;Num2表示題量。上述語句意思是:先按性別分組,接著在每組中按專業(yè)進(jìn)一步分組,最后再將每組包含的單位數(shù)列示出來。37Proc
gchart;vbar
sex/group=subject
sumvar=num2type=mean
;run;Num2表示題量。上述語句意思是:先按專業(yè)分三組,接著在每組中按性別分別分兩組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。38By
語句P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年商用供暖設(shè)備維修協(xié)議
- 高速公路瀝青混凝土銑刨技術(shù)方案
- 實(shí)驗(yàn)小學(xué)孔子主題班會(huì)活動(dòng)方案
- 2024年勞動(dòng)合同:高級管理人員雇傭與績效考核細(xì)則
- 2024年地球深空探測土石方工程承包合同
- 2024年商標(biāo)許可使用合同:商標(biāo)權(quán)利人與許可使用人之間的商標(biāo)使用協(xié)議
- 森林火災(zāi)應(yīng)急演練方案
- 2024年叉車物流自動(dòng)化改造項(xiàng)目合同
- 2024年公司設(shè)立及執(zhí)照代辦協(xié)議
- 2024年基于云計(jì)算服務(wù)共享協(xié)議的合同標(biāo)的解析
- 江蘇省泰興市2024-2025學(xué)年高三上學(xué)期期中考試語文試題(含答案)
- 家長會(huì)教學(xué)課件
- 律師事務(wù)所律師事務(wù)所風(fēng)險(xiǎn)管理手冊
- 廣東省郵政公司招聘2024年應(yīng)屆高校畢業(yè)生(152人)高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 安徽省亳州市黌學(xué)英才中學(xué)2024-2025學(xué)年七年級上學(xué)期期中生物學(xué)試題(含答案)
- 四川省綿陽市高中2022級第一次診斷性考試數(shù)學(xué)試題(解析版)
- DB11∕T 353-2014 城市道路清掃保潔質(zhì)量與作業(yè)要求
- 期中綜合檢測(1-4單元)(試題)- 2024-2025學(xué)年二年級上冊數(shù)學(xué)人教版
- 2024年代步車使用協(xié)議書模板
- 2024-2030年全球及中國IT服務(wù)管理(ITSM)軟件行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 滬粵版初中物理八上八年級上學(xué)期物理期中試卷(解析版)
評論
0/150
提交評論