實(shí)習(xí)二定量資料的統(tǒng)計(jì)描述1_第1頁(yè)
實(shí)習(xí)二定量資料的統(tǒng)計(jì)描述1_第2頁(yè)
實(shí)習(xí)二定量資料的統(tǒng)計(jì)描述1_第3頁(yè)
實(shí)習(xí)二定量資料的統(tǒng)計(jì)描述1_第4頁(yè)
實(shí)習(xí)二定量資料的統(tǒng)計(jì)描述1_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、定量資料的統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述 SAS中的中的univariate過(guò)程、過(guò)程、means過(guò)過(guò)程、程、summary過(guò)程過(guò)程tabulate過(guò)程可用于過(guò)程可用于定量資料的統(tǒng)計(jì)描述。定量資料的統(tǒng)計(jì)描述。 相同點(diǎn)相同點(diǎn) 不同點(diǎn)不同點(diǎn)一、一、UNIVARIATE過(guò)程基本格式過(guò)程基本格式 proc univariate 選項(xiàng)選項(xiàng); by 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); class 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); freq 變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù))變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)) weight 變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄的

2、權(quán)重系數(shù))變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄的權(quán)重系數(shù)) histogram 變量名稱(chēng)變量名稱(chēng)/繪圖選項(xiàng)繪圖選項(xiàng) output var 變量名稱(chēng)(待分析的數(shù)值變量);變量名稱(chēng)(待分析的數(shù)值變量); run;選擇項(xiàng)選擇項(xiàng)DATA= 指定要分析的數(shù)據(jù)集名指定要分析的數(shù)據(jù)集名NOPRINT 禁止統(tǒng)計(jì)結(jié)果在禁止統(tǒng)計(jì)結(jié)果在OUTPUT視窗中輸出視窗中輸出 NORMAL 對(duì)變量進(jìn)行正態(tài)性檢驗(yàn)對(duì)變量進(jìn)行正態(tài)性檢驗(yàn)PLOT 生成統(tǒng)計(jì)圖生成統(tǒng)計(jì)圖 注:在注:在proc語(yǔ)句中的選項(xiàng)直接跟在語(yǔ)句中的選項(xiàng)直接跟在proc名名后,以空格分隔,中間不加后,以空格分隔,中間不加“/” ,其他命令語(yǔ),其他命令語(yǔ)句的選項(xiàng)需以

3、句的選項(xiàng)需以“/” 分隔。分隔。二、二、MEANS過(guò)程過(guò)程的基本格式的基本格式 proc means 選項(xiàng)列表;選項(xiàng)列表; by 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); class 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); freq 變量名稱(chēng)(數(shù)值變量)變量名稱(chēng)(數(shù)值變量) weight 變量名稱(chēng)(數(shù)值變量)變量名稱(chēng)(數(shù)值變量) var 變量名稱(chēng)(待分析的數(shù)值變量);變量名稱(chēng)(待分析的數(shù)值變量); run;選擇項(xiàng)選擇項(xiàng)data= 指定要分析的數(shù)據(jù)集名指定要分析的數(shù)據(jù)集名maxdec= 指定輸出結(jié)果的小數(shù)位數(shù)指定輸出結(jié)果的小數(shù)位數(shù),默認(rèn)為默認(rèn)為7位位noprint 禁止統(tǒng)計(jì)結(jié)果在禁止統(tǒng)

4、計(jì)結(jié)果在output窗輸出窗輸出alpha= 設(shè)定計(jì)算可信區(qū)間的設(shè)定計(jì)算可信區(qū)間的水平,默認(rèn)為水平,默認(rèn)為0.05 當(dāng)無(wú)選擇項(xiàng)時(shí),當(dāng)無(wú)選擇項(xiàng)時(shí),MEANS過(guò)程默認(rèn)為每個(gè)變過(guò)程默認(rèn)為每個(gè)變量輸出五個(gè)統(tǒng)計(jì)值:量輸出五個(gè)統(tǒng)計(jì)值:N、MIN、MAX、MEAN、STD。 OUTPUT 關(guān)鍵字關(guān)鍵字= /*將分析結(jié)果輸出到將分析結(jié)果輸出到SAS 數(shù)據(jù)集數(shù)據(jù)集*/OUT= 數(shù)據(jù)集名數(shù)據(jù)集名 /*指定指定SAS數(shù)據(jù)集名稱(chēng)數(shù)據(jù)集名稱(chēng)*/關(guān)鍵字關(guān)鍵字= /*指定要輸出的統(tǒng)計(jì)量指定要輸出的統(tǒng)計(jì)量*/ 可輸出的有可輸出的有N, MEAN, STD, MIN,MAX,RANGE, SUM, VAR,USS(平方和平方和

5、), CSS(離均差平離均差平方和方和),CV,STDERR, T, PRT, SKEWNESS, KURTOSIS, LCLM,UCLM(同時(shí)指定輸出為雙側(cè);同時(shí)指定輸出為雙側(cè);如只選一個(gè),輸出單側(cè)可信區(qū)間)。如只選一個(gè),輸出單側(cè)可信區(qū)間)。 可以重新對(duì)統(tǒng)計(jì)量命名,也可用原名:可以重新對(duì)統(tǒng)計(jì)量命名,也可用原名: 格式格式 n=n mean=mean prt=p三、三、SUMMARY過(guò)程的基本格式過(guò)程的基本格式 proc summary 選項(xiàng)列表;選項(xiàng)列表; by 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); class 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); freq 變量名稱(chēng)(數(shù)值變

6、量)變量名稱(chēng)(數(shù)值變量) weight 變量名稱(chēng)(數(shù)值變量)變量名稱(chēng)(數(shù)值變量) output var 變量名稱(chēng)(待分析的數(shù)值變量);變量名稱(chēng)(待分析的數(shù)值變量); run;四、四、TABULATE過(guò)程的基本格式過(guò)程的基本格式 proc tabulate 選項(xiàng)列表;選項(xiàng)列表; by 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); class 變量名稱(chēng)(分組變量);變量名稱(chēng)(分組變量); freq 變量名稱(chēng)(數(shù)值變量)變量名稱(chēng)(數(shù)值變量) weight 變量名稱(chēng)(數(shù)值變量)變量名稱(chēng)(數(shù)值變量) table , var 變量名稱(chēng)(待分析的數(shù)值變量,統(tǒng)計(jì)量列入變量名稱(chēng)(待分析的數(shù)值變量,統(tǒng)計(jì)量列入相應(yīng)

7、的表單元格);相應(yīng)的表單元格); run; VAR語(yǔ)句語(yǔ)句 如果只想分析某一個(gè)或幾個(gè)特如果只想分析某一個(gè)或幾個(gè)特定的變量,則可用定的變量,則可用VAR語(yǔ)句指定它們。例如只語(yǔ)句指定它們。例如只想顯示變量想顯示變量x的列表,則的列表,則PRINT過(guò)程如下:過(guò)程如下: proc print ; var x; run; 如果想顯示如果想顯示x和和y兩個(gè)變量,則將兩個(gè)變量,則將VAR語(yǔ)句語(yǔ)句改為如下形式即可:改為如下形式即可: var x y; Where語(yǔ)句語(yǔ)句 如果你想處理的不是整個(gè)數(shù)據(jù)如果你想處理的不是整個(gè)數(shù)據(jù)集而只是其中符合某種條件的子集,可以應(yīng)用集而只是其中符合某種條件的子集,可以應(yīng)用WHER

8、E語(yǔ)句,如上例中我們只想顯示大于語(yǔ)句,如上例中我們只想顯示大于50的的x變量的值,則在變量的值,則在PRINT過(guò)程中加入過(guò)程中加入where語(yǔ)句如語(yǔ)句如下:下: where x50; 如果條件變?yōu)槿绻麠l件變?yōu)閤、y兩個(gè)變量的值都要大于兩個(gè)變量的值都要大于50,則則where語(yǔ)句改為:語(yǔ)句改為:where x50 and y50; By語(yǔ)句語(yǔ)句 如果你需要分組處理數(shù)據(jù),例如要按如果你需要分組處理數(shù)據(jù),例如要按性別分組輸出統(tǒng)計(jì)結(jié)果,可以采用性別分組輸出統(tǒng)計(jì)結(jié)果,可以采用by語(yǔ)句。如上例語(yǔ)句。如上例我們想按不同的我們想按不同的y值輸出值輸出x值,則加入值,則加入by語(yǔ)句如下:語(yǔ)句如下: by y;

9、使用使用BY語(yǔ)句要求數(shù)據(jù)集已經(jīng)按語(yǔ)句要求數(shù)據(jù)集已經(jīng)按BY語(yǔ)句中指定語(yǔ)句中指定的變量排序。如果沒(méi)有排序,則程序無(wú)法正確運(yùn)行。的變量排序。如果沒(méi)有排序,則程序無(wú)法正確運(yùn)行??梢杂每梢杂肧ORT過(guò)程來(lái)排序,語(yǔ)法結(jié)構(gòu)如下:過(guò)程來(lái)排序,語(yǔ)法結(jié)構(gòu)如下: PROC SORT DATA=數(shù)據(jù)集名;數(shù)據(jù)集名; BY 變量名列;變量名列; RUN; 相同點(diǎn):相同點(diǎn):他們均可計(jì)算出均數(shù)、標(biāo)準(zhǔn)差、他們均可計(jì)算出均數(shù)、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤、總和、加權(quán)值的總和、最大方差、標(biāo)準(zhǔn)誤、總和、加權(quán)值的總和、最大值、最小值、全距、校正的和未校正的離差值、最小值、全距、校正的和未校正的離差平方和、變異系數(shù)、樣本分布位置的平方和、變異

10、系數(shù)、樣本分布位置的t檢驗(yàn)統(tǒng)檢驗(yàn)統(tǒng)計(jì)量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個(gè)數(shù)等,均可應(yīng)計(jì)量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個(gè)數(shù)等,均可應(yīng)用用by語(yǔ)句將樣本分割為若干個(gè)更小的樣本,語(yǔ)句將樣本分割為若干個(gè)更小的樣本,以便分別進(jìn)行分析。以便分別進(jìn)行分析。不同點(diǎn):不同點(diǎn): means、summary、univariate過(guò)程可以計(jì)算樣過(guò)程可以計(jì)算樣本的偏度(本的偏度(skewness)和峰度(和峰度(kurtosis),),而而tabulate過(guò)程不計(jì)算;過(guò)程不計(jì)算; univariate過(guò)程可以計(jì)算出樣本的眾數(shù)(過(guò)程可以計(jì)算出樣本的眾數(shù)(mode); summary過(guò)程執(zhí)行后不會(huì)自動(dòng)給出分析的結(jié)果,過(guò)程執(zhí)行后不會(huì)自動(dòng)給出分析

11、的結(jié)果,須引用須引用output語(yǔ)句和語(yǔ)句和print過(guò)程來(lái)顯示分析結(jié)果;過(guò)程來(lái)顯示分析結(jié)果; univariate過(guò)程具有統(tǒng)計(jì)制圖的功能。過(guò)程具有統(tǒng)計(jì)制圖的功能。ndata ex2;ninput x f;ny=log(x);ncards;n1 12 2.5 14 10 18 40 22 160 12 640 6n;nproc means;nvar y;nfreq f;noutput out=ex2g mean=;ndata ex2a;nset ex2g;ng=exp(y);nproc print data=ex2a;nvar g;nrun;P20例2-3ndata hu1;ninput x;

12、ncards;n119.3 121.2 116.6 126.4 120.0 115.5 119.9 116.5 121.6 116.9 122.1 123.4n119.2 117.3 114.4 119.9 118.7 123.2 119.8 122.3 122.6 127.6 110.4 115.9n129.4 115.2 115.9 113.0 126.3 125.3 114.6 122.4 125.7 124.0 130.4 118.9n122.1 118.6 117.2 116.7 121.3 115.6 120.5 125.2 122.2 112.8 117.3 125.3n116.

13、7 132.2 119.3 116.4 118.2 121.7 118.6 115.2 118.0 109.7 120.5 110.3 n117.2 113.7 120.0 117.0 121.3 112.9 110.2 116.1 118.5 120.0 120.7 121.4n119.6 114.2 121.7 123.6 120.6 112.7 119.8 123.4 122.3 113.2 120.1 124.3n120.5 127.8 123.7 125.9 108.9 119.7 114.3 127.8 120.3 114.5 130.6 120.8n120.5 114.6 119.1 114.5 121.9n;nproc means maxdec=2 mean std min max;nvar x;nrun;P20例2-3ndata hu1;ninput x;ncards;n119.3 121.2 116.6 126.4 120.0 115.5 119.9 116.5 121.6 116.9 122.1 123.4n;nproc univariate ;noutput out=ab n=n mean=xbar median=m;nvar x;nhistogram x;nproc print

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論