畫(huà)條形圖PPT課件.ppt_第1頁(yè)
畫(huà)條形圖PPT課件.ppt_第2頁(yè)
畫(huà)條形圖PPT課件.ppt_第3頁(yè)
畫(huà)條形圖PPT課件.ppt_第4頁(yè)
畫(huà)條形圖PPT課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章SAS的描述統(tǒng)計(jì)功能 2 1描述性統(tǒng)計(jì)的基本概念2 2在SAS中計(jì)算統(tǒng)計(jì)量2 3統(tǒng)計(jì)圖形 2 1描述性統(tǒng)計(jì)的基本概念2 1 1統(tǒng)計(jì)學(xué)的基本概念2 1 2表示數(shù)據(jù)位置的統(tǒng)計(jì)量2 1 3表示數(shù)據(jù)分散程度的統(tǒng)計(jì)量2 1 4表示數(shù)據(jù)分布形狀的統(tǒng)計(jì)量2 1 5其它統(tǒng)計(jì)量 2 1 1統(tǒng)計(jì)學(xué)的基本概念1 總體與樣本總體 population 總體是指所研究對(duì)象的全體組成的集合 樣本 sample 樣本是指從總體中抽取的部分對(duì)象 個(gè)體 組成的集合 樣本中包含個(gè)體的個(gè)數(shù)稱(chēng)為樣本容量 容量為n的樣本常用n個(gè)隨機(jī)變量X1 X2 Xn表示 其觀測(cè)值 樣本數(shù)據(jù) 則表示為x1 xn 為簡(jiǎn)單起見(jiàn) 有時(shí)不加區(qū)別 2 參數(shù)與統(tǒng)計(jì)量參數(shù) parameter 參數(shù)是用來(lái)描述總體特征的概括性值 如總體平均值 總體方差 2 總體比例 等 統(tǒng)計(jì)量 statistics 統(tǒng)計(jì)量是用來(lái)描述樣本特征的概括性值 如樣本均值 樣本方差 s2 樣本比例 P 等 2 1 2表示數(shù)據(jù)位置的統(tǒng)計(jì)量如果要用簡(jiǎn)單的數(shù)字來(lái)概括一組觀測(cè)數(shù)據(jù)x1 xn 可以使用 位置統(tǒng)計(jì)量 來(lái)作為數(shù)據(jù)的總體代表 常見(jiàn)的位置統(tǒng)計(jì)量有 均值 中位數(shù) 分位數(shù) 眾數(shù)等 1 均值 Mean 均值是所有觀測(cè)值的平均值 是描述數(shù)據(jù)取值中心位置的一個(gè)度量 2 中位數(shù) Median或Med 中位數(shù)是描述觀測(cè)值數(shù)據(jù)中心位置的統(tǒng)計(jì)量 大體上比中位數(shù)大 小 的數(shù)據(jù)為觀測(cè)值的一半 中位數(shù)的一個(gè)優(yōu)點(diǎn)是它不受個(gè)別極端數(shù)據(jù)的影響 具有穩(wěn)健性 中位數(shù)的計(jì)算方法是 首先將數(shù)據(jù)從小到大排序?yàn)?x 1 x n 然后計(jì)算 3 眾數(shù) Mode 觀測(cè)值中出現(xiàn)最多的數(shù)稱(chēng)為眾數(shù) 眾數(shù)用得不如均值和中位數(shù)普遍 在屬性變量分析中 常需考慮頻數(shù) 因此眾數(shù)用得多些 4 百分位數(shù) Percentile 分位數(shù)也是描述數(shù)據(jù)分布和位置的統(tǒng)計(jì)量 0 5分位數(shù)就是中位數(shù) 0 75分位數(shù)和0 25分位數(shù)又分別稱(chēng)為上 下四分位數(shù) 并分別記為Q3和Q1 2 1 3表示數(shù)據(jù)分散程度的統(tǒng)計(jì)量1 極差 Range 與半極差 Interquartilerange 極差就是數(shù)據(jù)中的最大值和最小值之間的差 極差 max xi min xi 上 下四分位數(shù)之差Q3 Q1稱(chēng)為四分位極差或半極差 它描述了中間半數(shù)觀測(cè)值的散布情況 2 方差 Variance或Var 方差是由各觀測(cè)值到均值距離的平方和除以觀測(cè)量減1 3 標(biāo)準(zhǔn)差 Standarddeviation或StdDev 方差的開(kāi)方稱(chēng)為標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差的量綱與原變量一致 4 變異系數(shù) CoefficientofVariation或CV 變異系數(shù)是將標(biāo)準(zhǔn)差表示為均值的百分?jǐn)?shù) 是觀測(cè)數(shù)據(jù)分散性的一個(gè)度量 它在比較用不同單位測(cè)量的數(shù)據(jù)的分散性時(shí)是有用的 2 1 4表示數(shù)據(jù)分布形狀的統(tǒng)計(jì)量偏度和峰度是描述數(shù)據(jù)分布形狀的指標(biāo) 1 偏度 skewness 偏度是刻畫(huà)數(shù)據(jù)對(duì)稱(chēng)性的指標(biāo) 偏度的計(jì)算公式為 在SAS中 關(guān)于均值對(duì)稱(chēng)的數(shù)據(jù)其偏度為0 左側(cè)更為分散的數(shù)據(jù) 其偏度為負(fù) 稱(chēng)為左偏 右側(cè)更為分散的數(shù)據(jù) 其偏度為正 稱(chēng)為右偏 2 峰度 kurtosis 峰度描述數(shù)據(jù)向分布尾端散布的趨勢(shì) 峰度的計(jì)算公式為 利用峰度研究數(shù)據(jù)分布的形狀是以正態(tài)分布為標(biāo)準(zhǔn) 假定正態(tài)分布的方差與所研究分布的方差相等 比較兩端極端數(shù)據(jù)的分布情況 若 近似于標(biāo)準(zhǔn)正態(tài)分布 則峰度接近于零 尾部較正態(tài)分布更分散 則峰度為正 稱(chēng)為輕尾 尾部較正態(tài)分布更集中 則峰度為負(fù) 稱(chēng)為厚尾 2 1 5其它統(tǒng)計(jì)量1 均值的標(biāo)準(zhǔn)誤 StdErrorMean或StdMean或Stderror 2 校正平方和 Correctedsumofsquares 3 未校正平方和 Uncorrectedsumofsquares 4 k階原點(diǎn)矩其中A1即為均值 5 k階中心矩 2 2在SAS中計(jì)算統(tǒng)計(jì)量2 2 1用INSIGHT計(jì)算統(tǒng)計(jì)量2 2 2用 分析家 計(jì)算統(tǒng)計(jì)量2 2 3編程實(shí)現(xiàn)描述性統(tǒng)計(jì) 2 2 1用INSIGHT計(jì)算統(tǒng)計(jì)量INSIGHT可以非常方便地計(jì)算各種統(tǒng)計(jì)量 1 實(shí)例數(shù)據(jù) 例2 1 表2 1為兩個(gè)不同地區(qū)居民家庭收入和支出情況的抽樣調(diào)查 單位 元 試分別統(tǒng)計(jì)收入和支出情況 將表2 1中數(shù)據(jù)通過(guò)Excel導(dǎo)入到SAS數(shù)據(jù)集Mylib sryzc中 4個(gè)變量名分別為 ID R ID Income和Outgo 相應(yīng)的標(biāo)簽名為家庭編號(hào) 地區(qū)編號(hào) 家庭總收入和家庭總支出 2 在INSIGHT中打開(kāi)數(shù)據(jù)集在菜單中選擇 Solution 解決方案 Analysis 分析 InteractiveDataAnalysis 交互式數(shù)據(jù)分析 打開(kāi) SAS INSIGHTOpen 對(duì)話(huà)框 在對(duì)話(huà)框中選擇數(shù)據(jù)集 Mylib sryzc 單擊 Open 打開(kāi) 按鈕 即可在INSIGHT中打開(kāi)數(shù)據(jù)窗口 如圖所示 3 計(jì)算統(tǒng)計(jì)量選擇菜單 Analyze 分析 Distribution Y 分布 打開(kāi) Distribution Y 對(duì)話(huà)框 在數(shù)據(jù)集sryzc的變量列表中 選擇Income為分析變量 選擇R Id 為分組變量 單擊 Output 輸出 按鈕 在打開(kāi)的對(duì)話(huà)框中包含描述性統(tǒng)計(jì)量選項(xiàng) 選擇選項(xiàng)矩統(tǒng)計(jì)量和分位數(shù) 取消默認(rèn)的選項(xiàng) BoxPlot MosaicPlot 和 Histogram BarChart 單擊 OK 按鈕 即可得到變量Income按 R Id 分組的各種矩統(tǒng)計(jì)量 Moments 和分位數(shù) Quantiles 如圖所示 2 2 2用 分析家 計(jì)算統(tǒng)計(jì)量1 啟動(dòng) 分析家 選擇主菜單 Solutions 解決方案 Analysis 分析 Analyst 分析家 打開(kāi) 分析家 窗口 選擇主菜單 File 文件 OpenBySASName 打開(kāi) SelectAMember 對(duì)話(huà)框 選擇數(shù)據(jù)集Mylib sryzc 2 通過(guò)SummaryStatistics菜單計(jì)算描述性統(tǒng)計(jì)量選擇主菜單 Statistics 統(tǒng)計(jì) Descriptive 描述性統(tǒng)計(jì) SummaryStatistics 匯總統(tǒng)計(jì)量 打開(kāi) SummaryStatistics 對(duì)話(huà)框 選擇變量列表中的Income 單擊 Analysis 按鈕 選定分析變量 如圖所示 單擊 Statistics 按鈕 打開(kāi) SummaryStatistics Statistics 對(duì)話(huà)框 對(duì)話(huà)框中列出可以計(jì)算的所有統(tǒng)計(jì)量 如右圖所示 描述性統(tǒng)計(jì)量如下圖所示 3 通過(guò)Distributions菜單計(jì)算描述性統(tǒng)計(jì)量選擇主菜單 Statistics 統(tǒng)計(jì) Descriptive 描述性統(tǒng)計(jì) Distributions 分布 打開(kāi) Distributions 對(duì)話(huà)框 選擇變量列表中的Income 單擊 Analysis 按鈕 選定分析變量 單擊 OK 按鈕 即可得到關(guān)于變量Income的矩統(tǒng)計(jì)量和基本統(tǒng)計(jì)測(cè)度 2 2 3編程實(shí)現(xiàn)描述性統(tǒng)計(jì)SAS提供有多個(gè)不同的過(guò)程來(lái)實(shí)現(xiàn)統(tǒng)計(jì)量的計(jì)算 它們?cè)诠δ芊秶嫌性S多的重復(fù) 下面介紹用FREQ MEANS和UNIVARIATE這三個(gè)過(guò)程來(lái)計(jì)算簡(jiǎn)單的描述統(tǒng)計(jì)量 FREQ過(guò)程常用來(lái)計(jì)算分類(lèi)變量取值的頻數(shù) 而MEANS和UNIVARIATE過(guò)程則對(duì)數(shù)值型變量計(jì)算均值 標(biāo)準(zhǔn)差等統(tǒng)計(jì)量 1 FREQ過(guò)程FREQ過(guò)程包括多個(gè)控制頻數(shù)輸出與檢驗(yàn)的語(yǔ)句和選項(xiàng) 格式如下 PROCFREQDATA TABLES FORMAT RUN 其中PROCFREQ語(yǔ)句調(diào)用FREQ過(guò)程 標(biāo)志FREQ過(guò)程的開(kāi)始 TABLES語(yǔ)句用于創(chuàng)建有關(guān)變量所構(gòu)成的各種表格并進(jìn)行相應(yīng)的假設(shè)檢驗(yàn)和計(jì)算 可以多次使用 例如 統(tǒng)計(jì)數(shù)據(jù)集Mylib sryzc中變量R Id和Income頻數(shù)的代碼如下 procfreqdata mylib sryzc tablesR IdIncome RUN 顯示結(jié)果如圖所示 2 MEANS過(guò)程 1 語(yǔ)法格式MEANS過(guò)程的一般格式 PROCMEANSDATA VAR BY CLASS RUN PROCMEANS語(yǔ)句后的選項(xiàng)主要用來(lái)指定所要計(jì)算的統(tǒng)計(jì)量 默認(rèn)情況下 MEANS過(guò)程會(huì)給出頻數(shù) 均數(shù) 標(biāo)準(zhǔn)差 最大值和最小值等 其余統(tǒng)計(jì)量的計(jì)算均需要在選項(xiàng)中指定 VAR語(yǔ)句引導(dǎo)所要進(jìn)行分析的所有變量的列表 SAS將對(duì)VAR語(yǔ)句所引導(dǎo)的所有變量分別進(jìn)行描述性統(tǒng)計(jì)分析 BY語(yǔ)句與CLASS語(yǔ)句所指定的分類(lèi)變量用來(lái)進(jìn)行分組統(tǒng)計(jì) 但輸出格式不同 如對(duì)數(shù)據(jù)集Mylib sryzc中的Income變量計(jì)算簡(jiǎn)單統(tǒng)計(jì)量 只要用如下MEANS過(guò)程 procmeansdata mylib sryzc varIncome run 結(jié)果如圖2 15所示 2 使用統(tǒng)計(jì)量關(guān)鍵字列表在PROCMEANS語(yǔ)句中使用統(tǒng)計(jì)量關(guān)鍵字列表 procmeansdata mylib sryzcnmeanmedianp1p5p95p99q1q3maxmin varIncome run 結(jié)果如圖2 16所示 可以計(jì)算的描述性統(tǒng)計(jì)量關(guān)鍵字及其含義見(jiàn)下表 3 使用CLASS語(yǔ)句和BY語(yǔ)句使用CLASS語(yǔ)句和BY語(yǔ)句可以分組計(jì)算分析變量的描述統(tǒng)計(jì)量值 由CLASS語(yǔ)句和BY語(yǔ)句指定的變量在分析中起分組 類(lèi) 的作用 被稱(chēng)為分類(lèi)變量 兩個(gè)語(yǔ)句的區(qū)別是 使用BY語(yǔ)句時(shí)要求數(shù)據(jù)集須按BY變量排序 使用CLASS語(yǔ)句無(wú)此要求 使用BY語(yǔ)句時(shí)輸出按BY變量的每個(gè)值分別提供一個(gè)表 使用CLASS語(yǔ)句則將所有結(jié)果排列在一個(gè)表之中 使用BY語(yǔ)句之前先排序 如下代碼可以在上例中按變量R Id分組統(tǒng)計(jì) procsortdata mylib sryzc byR Id run procmeansdata mylib sryzcnmeanmedianp1p5p95p99q1q3maxmin varIncome byR Id run 使用CLASS語(yǔ)句分組較為簡(jiǎn)單 如下代碼也可以在上例中按變量R Id分組統(tǒng)計(jì) procmeansdata mylib sryzcnmeanmedianp1p5p95p99q1q3maxmin varIncome classR Id RUN 3 UNIVARIATE過(guò)程UNIVARIATE過(guò)程的一般格式為 PROCUNIVARIATEDATA VAR BY CLASS HISTOGRAM OUTPUTOUT RUN UNIVARIATE過(guò)程和MEANS過(guò)程的格式非常相似 相同的語(yǔ)句和選項(xiàng)其含義也相同 所不同的是某些統(tǒng)計(jì)量只能在UNIVARIATE過(guò)程中計(jì)算 如眾數(shù) 而且UNIVARIATE過(guò)程中具有繪圖功能 其中 HISTOGRAM語(yǔ)句用來(lái)指示SAS對(duì)其后所指定的變量繪制直方圖 其后的選項(xiàng)用來(lái)指示SAS添加不同類(lèi)型的擬合圖形 如正態(tài)分布的分布密度曲線 輸出包括五個(gè)部分 第一部分是矩統(tǒng)計(jì)量 各統(tǒng)計(jì)量已在2 1 1中作了介紹 第二部分為基本的位置和分散程度統(tǒng)計(jì)量 位置統(tǒng)計(jì)量包括均值 中位數(shù) 眾數(shù) 分散程度統(tǒng)計(jì)量包括標(biāo)準(zhǔn)差 方差 極差 四分位間距第三部分為關(guān)于均值等于零的三種檢驗(yàn)的結(jié)果 包括t檢驗(yàn) 符號(hào)檢驗(yàn)和符號(hào)秩檢驗(yàn) 第四部分為各個(gè)重要的分位數(shù) 第五部分是觀測(cè)數(shù)據(jù)的五個(gè)最低值和五個(gè)最高值 2 3統(tǒng)計(jì)圖形2 3 1定量變量的圖形表示2 3 2分類(lèi)變量的圖形表示 2 3 1定量變量的圖形表示1 直方圖對(duì)于數(shù)值型變量 常用直方圖 histogram 來(lái)展示變量取值的分布 將變量取值的范圍分成若干區(qū)間 在等間隔區(qū)間的情況 每個(gè)區(qū)間的長(zhǎng)度稱(chēng)為組距 考察數(shù)據(jù)落入每一區(qū)間的頻數(shù)與頻率 在每個(gè)區(qū)間上畫(huà)一個(gè)矩形 它的寬度是組距 它的高度可以是頻數(shù) 頻率或密度 頻率 組距 在高度是密度的情況 每一矩形的面積恰是數(shù)據(jù)落入?yún)^(qū)間的頻率 這種直方圖可以估計(jì)總體的概率密度 圖2 22密度直方圖與頻數(shù)直方圖SAS軟件會(huì)根據(jù)樣本容量在樣本取值范圍內(nèi)自動(dòng)地確定一個(gè)分組方式 另外也提供了設(shè)定分組的方法 2 盒形圖盒形圖 boxplot 又稱(chēng)箱圖 箱線圖 盒子圖 是用更為簡(jiǎn)潔的方法表現(xiàn)數(shù)據(jù)在數(shù)軸上的分布及其特點(diǎn)的圖形 圖2 23的左邊是根據(jù)居民家庭的收入情況所繪的盒形圖 右邊是分地區(qū)情況所繪的盒形圖 3 散點(diǎn)圖通常得到的數(shù)據(jù)可能有兩個(gè)變量 比如家庭的收入和支出情況的數(shù)據(jù) 這里家庭總收入是一個(gè)變量 而家庭總支出是第二個(gè)變量 希望通過(guò)圖形了解收入和支出的關(guān)系 這時(shí)可以用一個(gè)變量為橫坐標(biāo) 如家庭總收入 另一個(gè)為縱坐標(biāo) 這里是家庭總支出 來(lái)作圖 圖2 24 這種圖稱(chēng)為散點(diǎn)圖 ScatterPlot 4 線圖線圖 LinePlot 用來(lái)表示變量間的取值變化情況 有單式和復(fù)式兩種 圖2 25 在復(fù)式線圖中可用不同顏色的實(shí)線來(lái)標(biāo)志區(qū)別 如圖2 25右所示 2 3 2分類(lèi)變量的圖形表示分類(lèi)變量也可以通過(guò)圖形直觀地描繪出它們各類(lèi)的數(shù)量和所占比例 常用的有條形圖 餅圖和馬賽克圖 1 條形圖條形圖 BarChart 給出分類(lèi)變量取每個(gè)值的頻數(shù) 如圖2 26所示為變量R ID取值的條形圖 2 餅圖通常 餅圖 PieChart 可以對(duì)分類(lèi)變量描述其頻數(shù)取值的比例 對(duì)于數(shù)值變量 則像直方圖那樣應(yīng)先計(jì)算各區(qū)間取值的頻數(shù) 再按比例畫(huà)出 圖2 27中給出的是家庭支出分組頻數(shù)的餅圖 要注意的是 如果有太多的分組 那么餅圖就不那么好看了 3 馬賽克圖馬賽克圖 MosaicPlot 一般不對(duì)單個(gè)變量作 而是對(duì)兩個(gè)分類(lèi)變量來(lái)作 這種圖的好處是直觀顯示了兩個(gè)變量每種取值組合的觀測(cè)個(gè)數(shù)和比例 如圖2 28所示 2 4用SAS繪制統(tǒng)計(jì)圖形2 4 1用INSIGHT繪制統(tǒng)計(jì)圖形2 4 2用 分析家 繪制統(tǒng)計(jì)圖形2 4 3編程繪制統(tǒng)計(jì)圖2 4 4圖形的調(diào)整與輸出 2 4 1用INSIGHT繪制統(tǒng)計(jì)圖形INSIGHT模塊可以畫(huà)出多種統(tǒng)計(jì)圖形 而且圖形清晰 美觀 1 繪制直方圖選擇菜單 Analyze 分析 Histogram BarChart Y 直方圖 條形圖 打開(kāi) Histogram BarChart Y 對(duì)話(huà)框 在數(shù)據(jù)集的變量列表中 選擇變量 然后單擊 Y 按鈕 單擊 Output 輸出 按鈕 在打開(kāi)的對(duì)話(huà)框中選擇 Labels 標(biāo)簽 選項(xiàng) 如圖所示 以便輸出的圖形顯示中文標(biāo)簽名 單擊 OK 按鈕返回對(duì)話(huà)框 單擊 OK 按鈕 即可得到直方圖如圖2 30左所示 單擊圖形框左下角處的三角形 在打開(kāi)的菜單中選擇 Values 值 即可在圖中顯示頻數(shù)值 如圖2 30右所示 2 繪制條形圖INSIGHT模塊對(duì)分類(lèi)變量繪制條形圖 首先單擊R Id變量名上邊的變量作用按鈕 在彈出的菜單中選擇 Nominal 列名型 如圖左所示 選擇菜單 Analyze Histogram BarChart Y 打開(kāi) Histogram BarChart Y 對(duì)話(huà)框 在數(shù)據(jù)集的變量列表中選擇變量 然后單擊 Y 按鈕 如圖右所示 單擊 Output 輸出 按鈕 在打開(kāi)的對(duì)話(huà)框中選擇 Labels 標(biāo)簽 選項(xiàng) 單擊 OK 按鈕返回對(duì)話(huà)框 單擊 OK 按鈕 即可得到條形圖如圖2 34左所示 如果選擇Income freq 見(jiàn)2 2 2節(jié) 作為分析變量 則可以得到圖2 34右所示的條形圖 3 繪制盒形圖選擇菜單 Analyze BoxPlot MosaicPlot Y 可以對(duì)區(qū)間型變量作盒形圖 對(duì)分類(lèi)型變量作馬賽克圖 打開(kāi) BoxPlot MosaicPlot Y 對(duì)話(huà)框 在數(shù)據(jù)表sryzc的變量列表中 選擇income變量 然后單擊 Y 按鈕 income變量被選定 如圖左所示 單擊 Output 按鈕 在打開(kāi)的對(duì)話(huà)框中選擇 Labels 選項(xiàng) 取消 YAxisVertical 如圖右所示 單擊 OK 按鈕 即可得到盒形圖如圖2 36左所示 在 BoxPlot MosaicPlot Y 對(duì)話(huà)框中選定多個(gè)分析變量 可以將多個(gè)盒形圖畫(huà)在一個(gè)坐標(biāo)系下 這樣便于比較變量的取值情況 如圖所示 圖形分析 從圖中可以看到支出數(shù)據(jù)在均值兩邊的分布近似對(duì)稱(chēng) 說(shuō)明低于和高于平均支出的家庭幾乎各占一半 收入數(shù)據(jù)的二分之一分位數(shù)在均值的左邊 說(shuō)明大部分人的收入低于平均收入 另外 10號(hào)家庭的收入是一個(gè)極端值 它不具有代表性 4 繪制馬賽克圖選擇 Analyze 分析 BoxPlot MosaicPlot Y 盒形圖 馬賽克圖 命令 可以對(duì)分類(lèi)變量作馬賽克圖 下面以2 2 2中修改過(guò)的數(shù)據(jù)集sryzc為例 作出R Id變量和Income freq變量的馬賽克圖 4 繪制馬賽克圖首先將R Id變量改為 列名型 參見(jiàn)圖2 33左 選擇菜單 Analyze 分析 BoxPlot MosaicPlot Y 盒形圖 馬賽克圖 打開(kāi) BoxPlot MosaicPlot Y 對(duì)話(huà)框 在數(shù)據(jù)集sryzc的變量列表中 選擇R Id變量 然后單擊 Y 按鈕 R Id變量被選定 單擊 OK 按鈕 得到結(jié)果如圖2 38所示 5 繪制散點(diǎn)圖選擇菜單 Analyze ScatterPlot YX 打開(kāi) ScatterPlot YX 對(duì)話(huà)框 在變量列表中 選擇Income 單擊 Y 按鈕 Income變量被選定為Y軸變量 選擇Outgo 單擊 X 按鈕 Outgo變量被選定為X軸變量 如圖左所示 單擊 OK 按鈕 即可得到散點(diǎn)圖如圖右所示 可以看出收入與支出有一定的線性相關(guān)關(guān)系 在數(shù)據(jù)集窗口選中所有1號(hào)地區(qū)的觀測(cè)號(hào) 圖2 40是在散點(diǎn)圖中區(qū)分兩個(gè)地區(qū)的情況 細(xì)點(diǎn)為2號(hào)地區(qū) 粗點(diǎn)為1號(hào)地區(qū) 從該圖可以看出1號(hào)地區(qū)比2號(hào)地區(qū)在收入和支出水平上都要高出許多 6 繪制線圖選擇菜單 Analyze 分析 LinePlot YX 分布 打開(kāi) LinePlot YX 對(duì)話(huà)框 在數(shù)據(jù)集sryzc的變量列表中 選擇ID變量 單擊 X 按鈕 ID變量被選定為X軸 然后選擇Income變量 單擊 Y 按鈕 如圖左所示 單擊 OK 按鈕 即可得到線圖如圖右所示 若在 LinePlot YX 對(duì)話(huà)框中 將ID變量選定為X軸 選擇Income變量和Outgo變量 單擊 Y 按鈕 單擊 Output 輸出 按鈕 在打開(kāi)的對(duì)話(huà)框中選擇 Labels 標(biāo)簽 選項(xiàng) 如圖左所示 以便輸出的圖形顯示中文標(biāo)簽名 兩次單擊 OK 按鈕 得到關(guān)于Income變量和Outgo變量的復(fù)式線圖 圖右 2 4 2用 分析家 繪制統(tǒng)計(jì)圖形1 繪制餅圖在 分析家 中打開(kāi)數(shù)據(jù)集mylib sryzc 選擇主菜單 Graphs PieChart 打開(kāi) PieChart 對(duì)話(huà)框 選擇變量列表中的Income 單擊 Chart 按鈕 選定分析變量 如圖左所示 所得餅圖如圖右所示 2 繪制條形圖選擇主菜單 Graphs BarChart Horizontal 打開(kāi) HorizontalBarChart 對(duì)話(huà)框 選擇變量列表中的INCOME 單擊 Chart 按鈕 選定分析變量 選擇R ID變量 單擊 StackBy 按鈕 再選中3 D選項(xiàng) 如圖左所示 單擊 OK 按鈕 得到水平條形圖 如圖右所示 2 4 3編程繪制統(tǒng)計(jì)圖SAS可以把存貯在SAS數(shù)據(jù)集中的數(shù)據(jù)以圖形的方式形象直觀地顯示出來(lái) 在SAS GRAPH模塊的支持下 SAS可以作散點(diǎn)圖 曲線圖 直方圖 扇形圖 三維曲面圖 等高線圖 地圖 等等 1 GCHART過(guò)程 1 語(yǔ)法格式GCHART過(guò)程用于繪制直方圖 餅形圖 扇形圖 三維直方圖等表示變量分布的圖形 其語(yǔ)法格式為 PROCGCHARTDATA RUN GCHART過(guò)程可以使用的圖形關(guān)鍵字及其所繪制的圖形類(lèi)型見(jiàn)表2 5 圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時(shí)的分組變量 可以是數(shù)值型的 此時(shí)以各組的組中值為分組的標(biāo)志 也可以是字符型的 選項(xiàng)比較重要的有 TYPE 統(tǒng)計(jì)量關(guān)鍵字 表示以圖形對(duì)變量 SUMVAR所指定的變量 的哪一種統(tǒng)計(jì)量進(jìn)行描述 比如頻數(shù) FREQ 均數(shù) MEAN 總計(jì) SUM 頻數(shù)百分比 PCTN 等 SUBGROUP 變量名 分組變量 指定要進(jìn)行分組 各組段內(nèi)再分組 的變量 SUMVAR 變量名 數(shù)值變量 指定要進(jìn)行統(tǒng)計(jì)計(jì)算的變量 也就是 TYPE 統(tǒng)計(jì)量關(guān)鍵字 選項(xiàng)中統(tǒng)計(jì)量的計(jì)算所依據(jù)的變量 2 畫(huà)條形圖 直方圖 使用VBAR關(guān)鍵字可以畫(huà)條形圖 例如 畫(huà)出數(shù)據(jù)集Mylib sryzc中Income變量的條形圖的代碼如下 procgchartdata mylib sryzc vbarIncome run 結(jié)果如圖所示 其中繪圖用的變量用VBAR語(yǔ)句給出 如果把VBAR改成HBAR則條形方向變?yōu)闄M向 用GCHART繪制的條形圖和在INSIGHT中繪制的直方圖有所不同 它在橫軸標(biāo)的是區(qū)間的中點(diǎn)值 而在INSIGHT中橫軸標(biāo)的是區(qū)間的端點(diǎn)值 可以指定分組的變量 例如在每個(gè)區(qū)段內(nèi)再分段 可以用如下代碼 procgchartdata mylib sryzc vbarIncome subgroup R Id run 結(jié)果如圖所示 3 畫(huà)三維條形圖使用BLOCK關(guān)鍵字可以畫(huà)三維條形圖 例如 畫(huà)出數(shù)據(jù)集mylib sryzc中Income變量的三維條形圖的代碼如下 procgchartdata mylib sryzc blockIncome group R Id run 結(jié)果如圖所示 4 畫(huà)餅形圖使用PIE關(guān)鍵字可以畫(huà)餅形圖 PIE3D關(guān)鍵字可以畫(huà)三維餅形圖 例如 畫(huà)出數(shù)據(jù)集mylib sryzc中Income變量的三維餅形圖的代碼如下 procgchartdata mylib sryzc PIE3DIncome run 結(jié)果如圖所示 2 使用GPLOT過(guò)程繪制散點(diǎn)圖和連線圖通常用散點(diǎn)圖和連線圖可以表示 一個(gè)變量隨另一個(gè)變量的變化 變量之間的關(guān)系 數(shù)據(jù)值的分布 1 GPLOT過(guò)程的一般格式PROCGPLOTDATA PLOT SYMBOLn RUN 常用的選項(xiàng)見(jiàn)表2 6 表2 6PLOT語(yǔ)句的選項(xiàng) SYMBOL語(yǔ)句用來(lái)控制表示點(diǎn)的符號(hào)和點(diǎn)間的連線 其中n是不同SYMBOL語(yǔ)句的序號(hào) 可以是1 99 缺省為1 選項(xiàng)見(jiàn)表2 7 表2 7SYMBOL語(yǔ)句的選項(xiàng) 2 散點(diǎn)圖繪制家庭總收入對(duì)家庭總支出的散點(diǎn)圖 代碼

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論