版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第4章定量數(shù)據(jù)描述性統(tǒng)計分析主要內(nèi)容描述性統(tǒng)計分析指標MEANS/UNIVARIATE過程常見統(tǒng)計圖GPLOT/GCHART過程描述性統(tǒng)計分析指標(1)基本統(tǒng)計分析指標基本概念:總體:研究對象的全體。樣本:從總體中抽取的個體。隨機抽樣:從總體中抽取樣本,且每個樣本被抽到的機會均等。MEAN(均值):計算公式為
(n為樣本量N)。MODE(眾數(shù)):樣本中出現(xiàn)次數(shù)最多的數(shù)據(jù)。MEDIAN(中位數(shù)):指將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的數(shù)據(jù)。若總數(shù)為奇數(shù),取中間值;若總數(shù)為偶數(shù),取中間兩個值的平均值。PX(分位數(shù)):它將全部觀察值分成兩個部分,其中有X%個觀察值小于PX,(100-X)%個觀察值大于PX。MAX(最大值):樣本中的最大觀察值。描述性統(tǒng)計分析指標MIN(最小值):樣本中的最小觀察值。SUM(和):樣本觀察值的總和。RANGE(極差):最大與最小觀測值之差。STDDEV(標準差):計算公式為
(n為樣本量)。VAR(方差):為標準差的平方,用來衡量相對于均值的分散性和變異性。數(shù)據(jù)的集中程度高則方差小,反之則大。STDERR(標準誤):計算公式為CV(變異系數(shù)):計算公式為USS(加權平方和):計算公式為其中
代表權重描述性統(tǒng)計分析指標CSS(加權離差平方和):計算公式為SKEWNESS(偏度系數(shù)):計算公式為
主要衡量數(shù)據(jù)的對稱性,若其值大于0則表示位于均值右邊數(shù)據(jù)較分散,若小于0則表示均值左邊數(shù)據(jù)較分散。KURTOSIS(峰度系數(shù)):計算公式為
峰值反映分布的尖銳度或平坦度,正峰值表示相對尖銳的分布,負峰值表示相對平坦的分布。PROB>|T|:在總體均值是0的假設條件下,學生T統(tǒng)計量大于臨界T的絕對值的概率。描述性統(tǒng)計分析指標(2)MEANS過程一般使用格式PROCMEANSDATA=SAS數(shù)據(jù)集<選項列表>;VAR變量列表;CLASS變量列表;BY變量列表;FREQ變量;WEIGHT變量;ID變量列表;OUTPUT<OUT=輸出數(shù)據(jù)集名><統(tǒng)計量關鍵字=變量名列表>;RUN;描述性統(tǒng)計分析指標(3)UNIVARIATE過程一般使用格式PROCUNIVARIATEDATA=SAS數(shù)據(jù)集<選項列表>;VAR變量列表;BY變量列表;FREQ變量;WEIGHT變量;ID變量列表;OUTPUT<OUT=輸出數(shù)據(jù)集名><統(tǒng)計量關鍵字=變量名列表><PCTLPTS=百分位數(shù)PCTLPRE=變量前綴名PCTLNAME=變量后綴名>;RUN;描述性統(tǒng)計分析指標(3)SAS實例——描述小麥單穗粒數(shù)分布
在某農(nóng)業(yè)試驗基地進行試驗,從某塊農(nóng)田中隨機抽取50株小麥,并且測出其單穗粒數(shù)(count)(相應的SAS數(shù)據(jù)集在光盤中的存儲路徑為data/chap4/wheat),請據(jù)此計算其描述性統(tǒng)計指標,以得到小麥單穗粒數(shù)的分布狀況。2926342536313222432929303328292227333229252536312732262921252727302627182928302732242828342527262532描述性統(tǒng)計分析指標編程法:procmeansdata=chap4.wheatMAXDEC=2;/*調(diào)用means過程,輸出結果保留兩位小數(shù)*/varcount;/*指定分析變量為count*/run;procunivariatedata=chap4.wheatplot;/*調(diào)用univariate過程,輸出圖形*/varcount;run;菜單法描述性統(tǒng)計圖形(1)常見統(tǒng)計圖形介紹圖形類型主要特征舉例條形圖表示相互獨立的統(tǒng)計指標的數(shù)量大小。通??v軸表示數(shù)量,橫軸為分組標志。絕對數(shù)或相對數(shù)均可表示數(shù)量,圖中各長條的高度反映了數(shù)值大小。繪制不同城市的年度GDP情況。圓餅圖表示事物內(nèi)部的構成情況。圖中每個扇形面積的大小表示百分比數(shù)量大小,將360°圓心角看成是100%,把每一部分所占的百分比數(shù)折算成圓心角的度數(shù),畫出對應的扇形。繪制某種食物的不同營養(yǎng)成分所占的百分比。直方圖表示計量資料(測定每個觀察單位某項指標值的大?。└鹘M段上的頻數(shù)的分布情況。圖中各長條的面積表示各組數(shù)量的大小。如繪制某班學生中考平均得分的分布情況。折線圖用于資料中包含兩個數(shù)量指標,放在橫軸上的數(shù)量指標通常是時間。適用于表示一個或多個事物隨著時間的推移,在數(shù)量上的增減幅度。如繪制某城市某年12個月的CPI情況。散點圖用于資料中包含兩個數(shù)量指標,且兩個變量之間有自變量和因變量之分。通常把自變量放在橫軸上,因變量放在縱軸上。將成對的數(shù)據(jù)點(X,Y)在X和Y直角坐標系中用點表示出來,所以稱為散布圖或散點圖。如繪制某一組隨機樣本的身高和體重的散點圖。描述性統(tǒng)計圖形(2)GPLOT過程一般使用格式:PORCGPLOTDATA=數(shù)據(jù)集;PLOT縱坐標變量Y*橫坐標變量X……</選項列表>;SYMBOLN<選項列表>;AXISN<選項列表>;RUN;描述性統(tǒng)計圖形(3)GCHART過程一般使用格式:PROCGCHARTDATA=數(shù)據(jù)集;VBAR變量列表</<通用選項列表><VBAR專用選項列表>>;HBAR變量列表</<通用選項列表><HBAR專用選項列表>>;BLOCK變量列表</<通用選項列表><BLOCK專用選項列表>>;PIE變量列表</<通用選項列表><PIE專用選項列表>>;STAR變量列表</<通用選項列表><STAR專用選項列表>>;BY變量列表;RUN;描述性統(tǒng)計圖形(4)SAS實例——繪制年齡和血壓的散點圖根據(jù)例3-10中的數(shù)據(jù)繪制年齡和血壓的散點圖程序:procgplotdata=chap3.example3_10;/*調(diào)用gplot繪圖過程*/plotSBP*age/VAXIS=AXIS2HAXIS=AXIS1;/*定義繪圖變量,指定坐標軸設置*/SYMBOLv=stari=nonec=black;/*指定用黑色星形表示數(shù)據(jù)、數(shù)據(jù)間不連接*/AXIS1LABEL=('age')ORDER=(20TO64BY4);/*定義坐標軸1的標簽、刻度*/AXIS2LABEL=('Systolicbloodpressure')ORDER=(100TO160BY10);RUN;描述性統(tǒng)計圖形(5)SAS實例——繪制某班學生成績分布的直方圖
在一次高考前的英語摸底考試后,某理科實驗班40個學生的得分情況,請據(jù)此畫出學生得分的直方圖,以探索其分布特征。程序:procunivariatedata=chap4.histogram;/*調(diào)用univariate過程*/varscore;/*指定分析變量為score*/Histogram;/*指定繪制分析變量的直方圖*/run;描述性統(tǒng)計圖形(6)SAS實例——繪制國內(nèi)生產(chǎn)總值的折線圖
已知我國自1978年改革開放以來至2010年的國內(nèi)生產(chǎn)總值(GDP),請據(jù)此繪制折線圖。程序:Procgplotdata=chap4.line;/*調(diào)用gplot過程作圖*/PlotGDP*year/haxis=axis1vaxis=axis2;/*設定縱軸和橫軸變量分別為GDP、year,且縱軸和橫軸的設定參數(shù)分別見axis1、axis2*/Symboli=joinv=dotl=2h=0.5;/*設定數(shù)據(jù)用直徑為1cm的點表示,用虛線將數(shù)據(jù)點連接成折線*/Axis1label=('年份')order=(1978to2010by4);/*定義Axis1的標簽為“年份”,且取值從1978至2010每隔4年取一個刻度*/Axis2label=('GDP');/*定義Axis2的標簽為GDP*/Title'改革開放以來我國GDP走勢圖';/*定義標題*/Run;描述性統(tǒng)計圖形(7)SAS實例——繪制09年GDP構成的餅圖已知09年的國內(nèi)生產(chǎn)總值的構成,請繪制呈現(xiàn)不同產(chǎn)業(yè)生產(chǎn)總值占國內(nèi)生產(chǎn)總值的百分比的餅圖程序:Procgchartdata=chap4.pie;Pietype/discrete/*根據(jù)離散型變量Type分組繪制餅圖*/Sumvar=GDP/*定義計算變量為GDP*/Type=mean/*餅圖的每一個扇形代表的是不同產(chǎn)業(yè)生產(chǎn)總值均值,此選項為繪制餅圖必選項*/Slice=arrow/*定義用線將扇形和它的標簽連接起來*/Percent=arrow/*定義用線將扇形和它所代表的百分比形連接起來*/Value=arrow/*定義用線將扇形和它所代表的值連接起來*/Ctext=black/*設置圖中所有文字為黑色*/Cfill=black;/*設置扇形的輪廓為黑色*/title"09年GDP構成狀況”;Run;描述性統(tǒng)計圖形(8)SAS實例——繪制某種玉米株高的條形圖三類條形圖簡介:簡單條形圖——用若干平行、等寬的條狀來表示數(shù)量對比關系,組間有間隙。分組條形圖——指由每兩條或多條組成一組的條形圖,組間間隔大,組內(nèi)條形無間隔或間隔小。分段條形圖——以條形的全長代表某個變量的整體,條形內(nèi)部的各分段長短代表各組部分在整體中所占比例,每段用不同顏色或線條表示、之間無間隙,各條之間有間隙。從不同地區(qū)(A,B,C)抽取不同品種(m,n)的玉米分別20株,測量得出玉米的株高。1)請繪制不同地區(qū)的玉米平均株高的簡單條形圖;2)請分地區(qū)繪制不同品種玉米平均株高的分組條形圖;3)請分品種繪制不同地區(qū)的玉米平均株高的分段條形圖。描述性統(tǒng)計圖形程序:Procgchartdata=chap4.bar;/*調(diào)用gchart過程*/Vbararea/discretesumvar=heighttype=mea
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度民營醫(yī)院員工安全生產(chǎn)教育與責任合同4篇
- 二零二五年度嬰幼兒奶粉進口清關及倉儲物流服務合同
- 二零二五年度民法典物權編在遺產(chǎn)繼承中的法律咨詢合同4篇
- 2025年度個人農(nóng)業(yè)生產(chǎn)經(jīng)營質(zhì)押擔保貸款合同3篇
- 課題申報參考:面向國家重大戰(zhàn)略需求的博士生項目制培養(yǎng)模式研究
- 課題申報參考:馬來西亞華人音樂之存續(xù)與中華文化認同建構
- 二零二五年度木工行業(yè)安全生產(chǎn)責任保險合同
- 2025年度個人與公司租賃合同稅費承擔協(xié)議4篇
- 2025版門禁控制系統(tǒng)研發(fā)與定制服務合同4篇
- 2025年度個人股權贈與與受贈合同范本4篇
- JBT 14588-2023 激光加工鏡頭 (正式版)
- 2024年四川省成都市樹德實驗中學物理八年級下冊期末質(zhì)量檢測試題含解析
- 九型人格與領導力講義
- 廉潔應征承諾書
- 2023年四川省成都市中考物理試卷真題(含答案)
- 泵車述職報告
- 2024年山西文旅集團招聘筆試參考題庫含答案解析
- 恢復中華人民共和國國籍申請表
- 管理期貨的趨勢跟蹤策略 尋找危機阿爾法
- 瀝青化學分析試驗作業(yè)指導書
- 腦出血的護理課件腦出血護理查房PPT
評論
0/150
提交評論