




已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章 SPSS基本統(tǒng)計分析 描述性統(tǒng)計分析 描述性統(tǒng)計分析是統(tǒng)計分析的第一步 做好這第一步是下面進行正確統(tǒng)計推斷的先決條件 SPSS的許多模塊均可完成描述性分析 但專門為該目的而設計的幾個模塊則集中在DescriptiveStatistics菜單中 包括 Frequencies 頻數分析過程 特色是產生頻數表 主要針對分類變量 Descriptives 數據描述過程 進行一般性的統(tǒng)計描述 主要針對數值型變量 Explore 數據探察過程 用于對數據概況不清時的探索性分析Crosstabs 多維頻數分布交叉表分析 列聯(lián)表分析 Ratiostatistics 比率分析 4 1頻數分析 4 1 1頻數分析的目的和基本任務1 目的 基本統(tǒng)計分析往往從頻數分析開始 通過頻數分析能夠了解變量取值的狀況 對把握數據的分布特征是非常有用的 2 基本任務 1 頻數分析的第一個基本任務是編制頻數分布表 頻數 Frequency 即變量值落在某個區(qū)間 或某個類別 中的次數百分比 Percent 即各頻數占總樣本數的百分比有效百分比 ValidPercent 即各頻數占有效樣本數的百分比 這里有效樣本數 總樣本 缺失樣本數累計百分比 CumulativePercent 即各百分比逐級累加起來的結果 最終取值為100 2 頻數分析的第二個任務是繪制統(tǒng)計圖條形圖 BarChart 用寬度相同的條形的高度或長短來表示頻數分布變化的圖形 適用于定序和定類變量的分析 餅圖 PieChart 用圓形及圓內扇形的面積來表示頻數百分比變化的圖形 以利于研究事物內在結構組成等問題 直方圖 Histograms 用矩形的面積來表示頻數分布變化的圖形 適用于定距型變量的分析 注 變量的計量尺度 a定類 CategoryScale 只能計次b定序 OrdinalScale 計次 排序c定距 IntervalScale 計次 排序 加減d定比 RatioScale 計次 排序 加減 乘除 4 1 2頻數分析的基本操作 1 選擇菜單Analyze DescriptiveStatistics Frequencies 2 將若干頻數分析變量選擇到Variable s 框中 3 單擊Chart按鈕選擇繪制統(tǒng)計圖形 在ChartValues框中選擇條形圖中縱坐標 或餅圖中扇形面積 的含義 其中Frequencies表示頻數 Percentages表示百分比 輸出百分位數 輸出四分位數 顯示25 50 75 的百分位數 將數據平均分為所設定的相等等份 可輸入2 100的整數 如鍵入4則輸出第25 50 75百分位數自定義百分位數 可輸入0 100的整數 離散趨勢 分布形態(tài)欄 集中趨勢欄 輸出統(tǒng)計量對話框 4 1 3SPSS頻數分析的擴展功能1 計算分位數 PercentileValues 分位數是變量在不同分位點上的取值 分位點在0 100之間 一般使用較多的是四分位點 Quartiles 即將所有數據按升序排序后平均等分成四份 各分位點依次是25 50 75 于是四分位數便分別是25 50 75 點所對應的變量值 此外 還有八分位數 十六分位數等 SPSS提供了計算任意分位數的功能 用戶可以指定將數據等分為n份 Cutpointsfornequalgroups 還可以直接指定分位點 Percentile 2 計算其他基本描述統(tǒng)計量SPSS頻數分析還能夠計算其他基本統(tǒng)計量 其中包括描述集中趨勢 CentralTendency 的基本統(tǒng)計量 描述離散程度 Dispersion 的基本統(tǒng)計量 描述分布形態(tài) Distribution 的基本統(tǒng)計量等 Format對話框 控制頻數表輸出的分類數量 默認為10 多變量框中可設定多變量表格輸出的格式 設置頻數表輸出的格式 選擇頻數表中排列順序按變量升序排列 此為默認按變量降序排列按變量各種取值發(fā)生的頻數的升序排列按變量各種取值發(fā)生的頻數的降序排列 3 頻數分布表格式 Format 的定義 1 調整頻數分布表中數據的輸出順序 Orderby 頻數分布表中的內容的輸出順序可以按變量值的升序輸出 Ascendingvalues 按變量值的降序輸出 Descendingvalues 按頻數的升序輸出 Ascendingcounts 按頻數的降序輸出 Descendingcounts 2 multiplevariables單選框組 如果選擇了兩個以上變量作頻數表 則comparevariables可以將所有變量的結果在同一個頻數表過程輸出結果中顯示 便于互相比較 organizeoutputbyvariables則將結果在不同的頻數表過程輸出結果中顯示 每一個變量一張表 3 壓縮頻數分布表 Suppresstableswithmorethanncategories 如果變量取值的個數或取值區(qū)間的個數太多 頻數分布表將很龐大 此時可以壓縮它 SPSS默認 如果變量取值的個數或取值區(qū)間的個數大于10 則不輸出相應的頻數分布表 應用中可以修改該值 4 2計算基本描述統(tǒng)計量 4 2 1基本描述統(tǒng)計量常見的基本描述統(tǒng)計量有三大類 刻畫集中趨勢的統(tǒng)計量刻畫離中趨勢的統(tǒng)計量刻畫分布形態(tài)的統(tǒng)計量 1 刻畫集中趨勢的描述統(tǒng)計量集中趨勢是指一組數據向某一中心值靠攏的傾向 1 均值 Mean 即算術平均數 是反映某變量所有取值的集中趨勢或平均水平的指標 如某企業(yè)職工的平均月收入 其計算公式為 2 中位數 Median 即一組數據按升序排序后 處于中間位置上的數據值 如評價社會的老齡化程度時 可用中位數 3 眾數 Mode 即一組數據中出現次數最多的數據值 如生產鞋的廠商在制定各種型號鞋的生產計劃時應該運用眾數 2 刻畫離散程度的描述統(tǒng)計量離散程度是指一組數據遠離其 中心值 的程度 如果數據都緊密地集中在 中心值 的周圍 數據的離散程度較小 說明這個 中心值 對數據的代表性好 相反 如果數據僅是比較松散地分布在 中心值 的周圍 數據的離散程度較大 則此 中心值 說明數據特征是不具有代表性的 常見的刻畫離散程度的描述統(tǒng)計量如下 1 全距 Range 也稱極差 是數據的最大值 Maximum 與最小值 Minimum 之間的絕對離差 2 方差 Variance 也是表示變量取值離散程度的統(tǒng)計量 是各變量值與算數平均數離差平方的算術平均數 其計算公式為 3 標準差 StandardDeviation StdDev 表示變量取值距離均值的平均離散程度的統(tǒng)計量 其計算公式為 標準差值越大 說明變量值之間的差異越大 距均值這個 中心值 的離散趨勢越大 4 均值標準誤差 StandardErrorofMean 描述樣本均值與總體均值之間的平均差異程度的統(tǒng)計量 其計算公式為 其中 為總體標準差 n為樣本單位數 3 刻畫分布形態(tài)的描述統(tǒng)計量數據的分布形態(tài)主要指數據分布是否對稱 偏斜程度如何 分布陡峭程度等 刻畫分布形態(tài)的統(tǒng)計量主要有兩種 1 偏度 Skewness 描述變量取值分布形態(tài)對稱性的統(tǒng)計量 其計算公式為 當分布為對稱分布時 正負總偏差相等 偏度值等于0 當分布為不對稱分布時 正負總偏差不相等 偏度值大于0或小于0 偏度值大于0表示正偏差值大 稱為正偏或右偏 偏度值小于0表示負偏差值大 稱為負偏或左偏 偏度絕對值越大 表示數據分布形態(tài)的偏斜程度越大 2 峰度 Kurtosis 描述變量取值分布形態(tài)陡峭程度的統(tǒng)計量 其計算公式為 當數據分布與標準正態(tài)分布的陡峭程度相同時 峰度值等于0 峰度大于0表示數據的分布比標準正態(tài)分布更陡峭 為尖峰分布 峰度小于0表示數據的分布比標準正態(tài)分布平緩 為平峰分布 4 2 2計算基本描述統(tǒng)計量的操作 1 選擇菜單Analyze DescriptiveStatistics Descriptives 出現如下窗口 2 將需計算的數值型變量選擇到Variable s 框中 3 單擊Option按鈕指定計算哪些基本描述統(tǒng)計量 出現如下窗口 Options對話框 基本統(tǒng)計量 當Variables框中有多個變量時 此框確定其輸出順序 按Variables框中的排列順序輸出按各變量的字母順序輸出按均值的升序排列按均值的降序排列 分布 在上面窗口中 用戶可以指定分析多變量時結果輸出的次序 DisplayOrder 其中 Variablelist表示按變量在數據窗口中從左到右的次序輸出 Alphabetic表示按字母順序輸出 AscendingMeans表示按均值升序輸出 DescendingMeans表示按均值降序輸出 至此 SPSS便自動計算所選變量的基本描述統(tǒng)計量并顯示到輸出窗口中 4 3交叉分組下的頻數分析 4 3 1目的和基本任務1 目的 交叉分組下的頻數分析又稱列聯(lián)表分析 通過前面的頻數分析能夠掌握單個變量的數據分布情況 在實際分析中 不僅要了解單個變量的分布特征 還要分析多個變量不同取值下的分布 進而分析變量之間的相互影響和關系 對于這種涉及兩個或兩個以上變量分布情況的研究通常要利用交叉分組下的頻數分析來完成 2 基本任務 1 根據收集到的樣本數據 產生二維或多維交叉列聯(lián)表 2 在交叉列聯(lián)表的基礎上 對兩兩變量間是否存在一定的相關性進行分析 4 3 2交叉列聯(lián)表的主要內容編制交叉列聯(lián)表是交叉分組下頻數分析的第一個任務 交叉列聯(lián)表是兩個或兩個以上的變量交叉分組后形成的頻數分布表 例 職工基本情況數據按職稱和文化程度編制的二維交叉列聯(lián)表 見下頁表 上表中的職稱變量稱為行變量 Row 文化程度稱為列變量 Column 行標題和列標題分別是兩個變量的變量值 或分組值 表格中間是觀測頻數 ObservedCounts 和各種百分比 16名職工中 本科 ???高中 初中的人數分別為4 4 5 3 構成的分布稱為交叉列聯(lián)表的列邊緣分布 高級工程師 工程師 助理工程師 無技術職稱的人數分別為3 4 6 3 構成的分布稱為交叉列聯(lián)表的行邊緣分布 4個本科學歷職工中各職稱的人數分別是1 1 2等 這些頻數構成的分布稱為條件分布 即在行變量 列變量 取值條件下的列變量 行變量 的分布 在交叉列聯(lián)表中 除了頻數外還引進了各種百分比 例如表中第一行中的33 3 33 3 33 3 分別是高級工程師3人中各學歷人數所占的比例 稱為行百分比 Rowpercentage 一行的百分比總和為100 表中第一列的25 0 25 0 50 0 分別是本科學歷4人中各職稱人數所占的比例 稱為列百分比 Columnpercentage 一列的列百分比總和為100 表中的6 3 6 3 12 5 等分別是總人數16人中各交叉組中人數所占的百分比 稱為總百分比 Totalpercentage 所有格子中的總百分比之和也為100 4 3 3交叉分組下的頻數分析的基本操作 1 菜單選項Analyze DescriptiveStatistics Crosstabs 出現窗口如下 該框中的變量作為分布表中的行變量和列變量 該框中的變量作為控制變量 決定頻數分布表中的層 可有多個控制變量 顯示每一組中各變量的分類條形圖 只輸出統(tǒng)計量 不輸出多維列聯(lián)表 Crosstabs對話框 2 如果進行二維列聯(lián)表分析 則將行變量選擇到Row s 框中 將列變量選擇到Column s 框中 如果Row s 和Column s 框中有多個變量名 SPSS會將行列變量一一配對后產生多張二維列聯(lián)表 如果進行三維或多維列聯(lián)表分析 則將其他變量作為控制變量選到Layer框中 多控制變量間可以是同層次的 也可以是逐層疊加的 可通過Previous或Next按鈕確定控制變量間的層次關系 3 選擇Displayclusteredbarcharts選項 指定繪制各變量交叉分組下頻數分布條形圖 Suppresstables表示不輸出列聯(lián)表 在僅分析行列變量間關系時可選擇該選項 4 單擊Cells按鈕指定列聯(lián)表單元格中的輸出內容 窗口如下 Crosstabs的CellDisplay對話框 選擇在列聯(lián)表中輸出的統(tǒng)計量 包括觀測量數 百分比 殘差 輸出觀測量的實際數量如果行和列變量在統(tǒng)計上是獨立的或不相關的 那么會在單元格中輸出期望的觀測值的數量 輸出單元格中觀測量的數目占整行全部觀測量數目的百分比輸出單元格中觀測值的數目占整列全部觀測量數目的百分比輸出單元格中觀測量的數目占全部觀測量數目的百分比 計算非標準化殘差計算標準化殘差計算調整后殘差 SPSS默認列聯(lián)表單元格中只輸出觀測頻數 Observed 為便于分析 通常還應指定輸出Percentage框中的行百分比 Row 列百分比 Column 總百分比 Total Counts框中的Expected表示輸出期望頻數 Residuals框中的各個選項表示在各個單元格中輸出剩余 其中 Unstandardized為非標準化剩余 定義為觀測頻數 期望頻數 Standardized為標準化剩余 又稱Pearson剩余 定義為 5 單擊Format按鈕指定列聯(lián)表各單元格的輸出排列順序 Ascending表示以行變量取值的升序排列 是SPSS默認項 Descending表示以行變量取值的降序排列 6 單擊Statistics按鈕指定用哪種方法分析行變量和列變量間的關系 窗口如下 其中 Chi Square為卡方檢驗 4 3 4交叉列聯(lián)表行列變量間關系的分析對交叉列聯(lián)表中的行變量和列變量之間關系進行分析是交叉分組下頻數分析的第二個任務 為了理解行 列變量之間的關系 可以從分析兩個極端的例子出發(fā) 1 年齡與工資收入的交叉列聯(lián)表 一 2 年齡與工資收入交叉列聯(lián)表 二 表一中表示年齡與工資收入呈正相關關系 表二表示年齡與工資收入呈負相關關系 但大多數情況下 觀測頻數分散在列聯(lián)表的各個單元格中 不容易直接發(fā)現行列變量之間的關系強弱程度 此時就要借助非參數檢驗方法 通常用的方法是卡方檢驗 交叉列聯(lián)表的卡方檢驗 卡方檢驗屬假設檢驗的范疇 步驟如下 1 建立原假設在列聯(lián)表分析中卡方檢驗的原假設為行變量與列變量獨立 2 選擇和計算檢驗統(tǒng)計量列聯(lián)表分析卡方檢驗統(tǒng)計量是Pearson卡方統(tǒng)計量 其數學定義為 其中 r為列聯(lián)表的行數 c為列聯(lián)表的列數 為觀察頻數 為期望頻數 ExpectedCount 期望頻數的計算方法是 其中 RT是指定單元格所在行的觀測頻數合計 CT是指定單元格所在列的觀測頻數合計 n是觀測頻數的合計 期望頻數的分布反映的是行列變量互不相干下的分布 例如 具有本科學歷的高級工程師的期望頻數是0 75的計算公式是3 4 16 0 75 這里 期望頻數可以理解為 總共16個職工的學歷分布是25 25 31 3 18 8 如果遵從這種學歷的總體比例關系 高級職稱三人的學歷分布也應為25 25 31 3 18 8 于是期望頻數為3 25 3 25 3 31 3 3 18 8 同理可以理解 總共16個職工的職稱分布為18 8 25 37 5 18 8 本科學歷4人的期望頻數分別為4 18 8 4 25 4 37 5 4 18 8 卡方統(tǒng)計量觀測值的大小取決于兩個因素 第一 列聯(lián)表的單元格子數 第二 觀測頻數與期望頻數的總差值 在列聯(lián)表確定的情況下 卡方統(tǒng)計量觀測值的大小取決于觀測頻數與期望頻數的總差值 當總差值越大時 卡方值也就越大 實際分布與期望分布的差距越大 表明行列變量之間越相關 反之表明行列變量之間越獨立 那么 在統(tǒng)計上卡方統(tǒng)計量的觀測值究竟達到什么程度才能斷定行列變量不獨立呢 由于該檢驗中的pearson卡方統(tǒng)計量近似服從卡方分布 因此可依據卡方理論找到某自由度和顯著性水平下的卡方值 即卡方臨界值 3 確定顯著性水平 SignificantLevel 和臨界值顯著性水平是指原假設為真卻將其拒絕的風險 即棄真的概率 通常設為0 05或0 01 在卡方檢驗中 由于卡方統(tǒng)計量服從自由度為 行數 1 列數 1 的卡方分布 因此 在行列數目和顯著性水平確定時 卡方臨界值是可唯一確定的 4 結論和決策對統(tǒng)計推斷做決策通常有兩種方式 根據統(tǒng)計量觀測值和臨界值比較的結果進行決策 如果卡方觀測值大于臨界值 則認為實際分布與期望分布之間的差距顯著 可以拒絕原假設 斷定列聯(lián)表的行列變量間不獨立 存在相關關系 反之 接受原假設 根據統(tǒng)計量觀測值的概率p值和顯著性水平比較的結果進行決策 如果p值小于等于 則認為卡方觀測值出現的概率是很小的 拒絕原假設 斷定列聯(lián)表的行列變量間不獨立 存在依存關系 反之 接受原假設 什么是P值 是一個概率值 如果原假設為真 P 值是抽樣分布中大于或小于樣本統(tǒng)計量的概率 被稱為觀察到的 或實測的 顯著性水平 雙側檢驗的P值 左側檢驗的P值 右側檢驗的P值 利用P值進行檢驗 決策準則 若p 值 不拒絕H0若p 值 拒絕H0 5 3 5交叉分組下的頻數分析應用舉例利用居民儲蓄調查數據進行分析 實現以下目標 1 分析城鎮(zhèn)和農村儲戶對 未來收入狀況的變化趨勢 是否持相同的態(tài)度 2 分析城鎮(zhèn)和農村儲戶對什么合算的認同是否一致 分析 1 該問題列聯(lián)表的行變量為戶口 列變量為未來收入狀況 在列聯(lián)表中輸出各種百分比 期望頻數 剩余 標準化剩余 顯示各交叉分組下頻數分布柱形圖 并利用卡方檢驗方法 對城鎮(zhèn)和農村儲戶對該問題的態(tài)度是否一致進行分析 2 該問題列聯(lián)表的行變量為戶口 列變量為什么合算 在列聯(lián)表的基礎上進行卡方檢驗 5 3 6SPSS中列聯(lián)表分析的其他方法對列聯(lián)表中行列變量的分析 除上述卡方檢驗方法之外 SPSS還提供了其他測度變量間相關關系的檢驗方法 包括 適用于兩定類變量的方法 Nominal框中列出的方法屬該類方法 適用于兩定序變量的方法 Ordinal框中列出的方法屬該類方法 適用于一定類變量 一定距變量的方法 Nominalbyinterval框中的Eta方法屬該類方法 其他方法 5 4多選項分析 頻數分析和交叉分析 多選項問題的概念 多選項問題是根據實際調查的需要 要求被調查者從問卷給出的若干個可選答案中選擇一個以上的答案 目前 市場研究或許多領域對某事物評價的研究中常常遇到這樣的問題 可以選多個 分為限選和不限選 限選 如在11種工作種類中 選你喜歡的 最多可選4種 Var1 Var4 求所有人喜歡各種工作的頻數或頻率 不限選 如在所列的20種電器中 你家所擁有的電器 不限選 Var1 Var20 求所有被調查家庭擁有各種電器的頻數或頻率 5 4 1多選項問題的分解 多選項二分法及其編碼 multipledichotomiesmethod 多選項二分法是將多選項問題中的每一個答案設為一個SPSS變量 每個變量值有0或1兩個取值 分別表示選擇了該答案和不選擇該答案 如對下面問題有9個可能的答案 每個可選擇的答案由一個變量表示 每個變量的值只能有表明 是 和 否 的兩個代碼0或者1 左邊的表格為向顧客發(fā)放的顏色調查 在選擇服裝時 您喜歡什么顏色作為主體顏色 在答案的 中打 可多選 這是一組問題 每個問題均有兩個答案 回答者只能選擇其中一種 在建立數據文件時 變量名使用相同的變量主名 后面加以不同序號組成 本組問題的9個變量名可以是color1 color9 而答案的編碼規(guī)則為 回答 是 變量值為1 回答 否 變量值為0 其他值為缺失值 多選項分類法及其編碼 multiplecategorymethod 多選項分類法中 首先應估計多選項問題最多可能出現的答案個數 然后為每個答案設置一個SPSS變量 變量取值為多選項問題中的所有可選答案 如上面有關選擇服裝的主體顏色 您可以選擇喜歡的三種 在提供的10種答案前上選擇 1 紅2 橙3 黃4 綠5 青6 藍7 紫8 黑9 白10說不清這是一個問題 可以有三個答案 在建立數據文件時 要建立三個變量color1 color3表示回答者選擇的三個顏色 如選擇結果為1 紅 6 藍 8 黑 則變量color1的值為1 變量color2的值為6 變量color3的值為8 如果采用多選二分法則有6個選項 故應設6個變量 運用0 1編碼方法編碼 即 1 0 1 0 1 1 如果采用多選分類法 則編碼為1 3 5 6 0 0 1356 問題2 擇業(yè)中考慮的主要因素 多選 1經濟收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風險大小7勞動強度8社會福利9其他 編碼應為 1 0 1 1 1 0 1 1 0 或1 3 4 5 7 8 0 0 0 136 問題3 您擇業(yè)中考慮的主要因素有 限選三項 1經濟收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風險大小7勞動強度8社會福利9社會地位10其他 因為限選三項 故應設三個變量 編碼依次為1 3 6 5 4 2多選項分析的基本操作 首先將每個題的若干答案組成一個綜合變量即變量集 Set 然后對綜合變量的各種取值進行分析 只有通過定義多選項變量集 spss才能確定應對哪些變量取相同值的個案數進行累加 多選項分析在SPSS中是通過Analyze MultipleResponse中的各項功能實現的 1 DefineSets 1 從左邊的變量中將多選變量集的變量選擇到variablesinsets框中 建立多選二分變量集或多選分類變量集 2 在variablesarecodedas框中指定多選變量集中的變量是按照那種方法編碼的 Dichotomies表示以多選二分法編碼 并在countedvalue中輸入用哪個數值來表示選中該選項 categories表示以多選分類法編碼 并在range框中輸入變量取值的最小值和最大值 3 為多選項變量集命名 系統(tǒng)會自動在該名字前加字符 4 單擊add按鈕將定義好的多選項變量集加到multresponsesets框中 Spss可以定義多個多選項變量集 2 Frequencies 對多選變量集進行頻數分析 從multresponsesets中把待分析的多選項變量集選擇到tablesfor框中 3 Crosstabs 對多選變量集與其他變量集或與原基本變量進行交叉表分析 1 選擇列聯(lián)表的行變量并定義取值范圍 2 選擇列聯(lián)表的列變量并定義取值范圍 3 選擇列聯(lián)表的控制變量并定義取值范圍 4 單擊option按鈕選擇列聯(lián)表的輸出內容和計算方法 Matchvariableacrossresponsesets選項表示 如果列聯(lián)表的行列變量均為多選項變量集時 第一個變量集的第一個變量與第二個變量集的第一個變量作交叉分組 依次類推 結果中 注意PctofResponses 占總回答數的 和PctofCase 占總個案數 的區(qū)別 5 4 3多選項分析的應用舉例 利用居民儲蓄調查數據進行分析 實現以下兩個分析目標 1 分析儲戶的儲蓄目的 2 分析不同年齡段儲戶的儲蓄目的 分析 1 為進行多選項分析 首先定義名為cxmd的多選項變量集 其中包括a7 1 a7 2 a7 3三個變量 然后對多選項變量集進行頻數分析 2 對不同年齡段儲戶儲蓄目的進行分析 采用多選項交叉分組下的頻數分析 5 5探索分析Explore 1 分析目的和方法奇異性 數據過大或過小 找出 分析原因 是否剔除 分布特征 數據是否來自正態(tài)總體考察方法 統(tǒng)計量和統(tǒng)計圖形 箱式圖 莖葉圖 QQ圖 2 一般是考察定距變量3 Analyze DescriptiveStatistics Explore分析變量 DependentList 數值型變量分組變量 FactorList 分類變量標識變量 LabelCasesby 用某變量的值作為觀察值得標識如id 選擇一個或多個變量進入Dependent框作為分析變量 單擊OK可獲得分析變量的一系列基本統(tǒng)計量和圖形 此作為分組變量 可以是字符變量 對分析變量的分析將按該變量的觀測值進行分組分析 可有多個分組變量 這時會按多個變量的交叉組合進行分組 該框中的變量作為標識符 在輸出諸如異常值時 用該變量進行標識 只允許有一個標識符 可同時輸出基本統(tǒng)計量和圖形只輸出基本統(tǒng)計量只輸出圖形 Explore主對話框 輸出基本統(tǒng)計量均值的置信區(qū)間 可鍵入1 99 的任意值 根據該值算出置信區(qū)間的上下限 給出中心趨勢的最大似然比的穩(wěn)健估計量 當數據分布均勻 且兩尾較長 或當數據中存在極端值時 可給出比均值或中位數更合理的估計 輸出最大和最小的5個數 且在輸出窗口中加以標明 輸出5 10 25 50 75 90 和95 的百分位數 Statistics對話框 Statistics子對話框 用于選擇需要的描述統(tǒng)計量 descriptives 輸出均值 中位數 眾數 5 修正均值 估計標準誤 方差 標準差 最小值 最大值 全距 四分位差 峰度系數及其標準誤 偏度系數及其標準誤及指定的均值置信區(qū)間 m estmators 做集中趨勢的最大穩(wěn)健估計 該統(tǒng)計量是利用迭代方法計算出來的 受異常值的影響要小得多 如果該估計量離均值較遠 則說明數據可能存在異常值 此時宜用該估計量替代均值以反映集中趨勢 一共會輸出四種m估計量 其中huber適用于數據接近正態(tài)分布時 另三種則適用于數據中有許多異常值的情況 outliers 輸出五個最大值和五個最小值 percentiles 輸出第5 10 25 50 75 90 95 分位數 plots子對話框 用于選擇需要的統(tǒng)計圖 boxplots復選框 確定箱式圖的繪制方式 可以分組繪制 factorlevelstogether 也可以不分組繪制 dependentstogether 或者不繪制 none descriptive復選框 可以選擇繪制莖葉圖 stem and leaf 和直方圖 histogram normalityplotwithtest 繪制正態(tài)分布圖 QQ圖 并進行變量是否符合正態(tài)分布的檢驗 莖葉圖 stem and leaf 1 用于顯示未分組的原始數據的分布2 由 莖 和 葉 兩部分構成 其圖形是由數字組成的3 以該組數據的高位數值作樹莖 低位數字作樹葉4 樹葉上只保留一位數字5 莖葉圖類似于橫置的直方圖 但又有區(qū)別 直方圖可觀察一組數據的分布狀況 但沒有給出具體的數值莖葉圖既能給出數據的分布狀況 又能給出每一個原始數值 保留了原始數據的信息6 圖的下方會標示出莖寬和實際值的倍數 每行的莖和葉組成的數字再乘以莖寬 即得到實際數據的近似值如莖寬為10 則圖中的2 3代表23 同樣在圖的下方也會標示出每片葉子代表的記錄數 未分組數據 莖葉圖 練習 利用居民儲蓄調查數據 對一次存款金額變量進行探索性分析 5 6比率分析 5 6 1比率分析的目的和主要指標比率分析用于對兩變量間變量值比率變化的描述分析 適用于數值型變量 例如根據1999年各地區(qū)保險業(yè)務情況的數據 分析各地區(qū)財產保險業(yè)務的保費收入占全部業(yè)務保費收入的比例情況 通常的分析可以生成各個地區(qū)財產保險業(yè)務的保費收入占全部業(yè)務保費收入的比率變量 然后對該比率變量計算基本描述統(tǒng)計量 如均值 中位數 標準差 全距等 進而刻畫比率變量的集中趨勢和離散程度 SPSS的比率分析除能夠完成上述分析外 還提供了其他相對比描述指標 大致也屬于集中趨勢描述指標和離散程度描述指標的范疇 具體包括 1 加權比率均值 Weightedmean 兩變量均值的比 屬集中趨勢描述指標 2 AAD AverageAbsoluteDeviation 平均絕對離差 是對比率變量離散程度的描述 計算公式為 其中 是比率數 M是比率變量的中位數 N為樣本數 相對數或平均數計算平均數的計算相對數 或平均數 用Y表示 有Y a b a b為總量指標 求各期Y的平均一般不能采用簡單算術平均法 即因為各期數據Yi的對比基礎bi不同 它們對全期總平均水平的影響作用應輕重有別 計算公式 1 分別計算其分子 分母的平均數2 對比得 上式實質上等于對各期Y加權算術平均 3 COD CoefficientofDispersion 離散系數 也是對比率變量離散程度的描述 計算公式為 4 PRD Price relatedDifferential 相關價格微分 是比率均值與加權比率均值的比 也是比率變量離散程度的描述 5 COV變異系數 用于對比率變量離散程度的描述 分為基于均值的變異系數 MeancenteredCOV 和中位數的變異系數 MediancenteredCOV 前者是通常意義下的變異系數 是標準差除以均值 后者定義為 5 6 2比率分析的基本步驟 1 選擇菜單Analyze DescriptiveStatistics Radio 出現窗口 2 將比率變量的分子選擇到Numerator框中 將比率變量的分母選到Denominator框中 3 如果做不同組間的比率比較 則將分組變量選擇到GroupVariable框中 4 單擊Statistics按鈕指定輸出哪些關于比率的描述統(tǒng)計量 出現如下窗口 至此 SPSS將自動計算比率變量 并將相關指標輸出到輸出窗口中 報表中的描述性統(tǒng)計分析 casesummaries 過程 casesummaries過程用于按指定的分組變量的不同水平進行交叉描述性統(tǒng)計分析 Analyze report casesummary進入 variables框 選擇需要進行分析的變量 可多選 groupingvariables框 選擇用于分組的變量 如果選擇了多個分組變量 則系統(tǒng)會按各個變量的不同取值的交叉組合對匯總變量進行分析 Displaycase 用于確定是否輸出詳細的記錄列表 下面的三個復選框用于選擇具體的輸出方式 Statistics子對話框用于選擇一些常用的統(tǒng)計量 title子對話框 title框 用于定義輸出表格的標題 默認標題為casesummaries caption框 用于給輸出表格加上注解文字 subheadingsfortotals 用于選擇是否給每個分組均顯示所計算統(tǒng)計量的名稱 excludecasewithmissingvalueslistwise 用于選擇是否在分析中刪除帶有缺失值的變量 missingstatisticsappearas 用于輸出一個字符串 用于在輸出結果中表示缺失值 報表中的描述性統(tǒng)計分析舉例 1 對居民儲蓄調查數據中的居民存款金額按照戶口和職業(yè)進行分類匯總得到均值 中位數及標準差 分析 可以使用splitfile過程 然后使用descriptive過程來完成 但是我們用這里的casesummary過程一步就能完成 表格中的描述性統(tǒng)計分析 Basictables過程 Basictables過程可對定類資料或定量資料進行各種復雜格式的描述 菜單操作 Analyze tables Basictablessummaries框 選擇需要進行匯總的變量 可以是定類變量也可以是定距變量 可以選入多個 但所有變量只能使用同樣的匯總指標 subgroups框 用于定義分組匯總時的分組情況 表格中的描述性統(tǒng)計分析 Basictables過程 down框 選入分行匯總變量 表格中的匯總指標按照該變量的不同取值分行輸出 可以選入多個 across框 選入分列匯總變量 separatetable框 選入分層匯總變量 allcombination 默認選項 所有分組變量按照選入順序依次嵌套 eachseparately 所有分組變量分別輸出分組統(tǒng)計結果 只是放在同一個表格中 表格中的描述性統(tǒng)計分析 Basictables過程 statistics子對話框 percentilecutpoint框 選中percentile統(tǒng)計量時可用 用于選擇分界百分位點 format框 用于設置各種統(tǒng)計量的顯示格式 label框 用于設定各種統(tǒng)計量的顯示標簽 默認為統(tǒng)計量名稱 可以更改為中文 sortingbycellcount框 選擇是否按照表中的頻數順序輸出 表格中的描述性統(tǒng)計分析 Basictables過程 layout子對話框 用于設定各種標題 標簽的顯示方式 summaryvariablelables框 用于選擇匯總變量標簽的顯示方式 可以在左側 頂部和分不同表格輸出中選擇 statisticslables框 用于選擇統(tǒng)計量標簽的顯示方式 groupinsummaryvariabledimension框 如果在前面將匯總變量和分組變量選在了同一方向顯示 則可在此處選擇是將匯總變量是與各亞組之下還是將分則變量值與匯總變量之下 lablegroupswithvaluelablesonly框 如果選中該框 則各分組的變量名標簽將被省略 他們將用數值標簽或數值本身來表示 表格中的描述性統(tǒng)計分析 Basictables過程 totals子對話框 選擇是否進行匯總以及設定匯總標簽 totalsovereachgroupvariable框 要求給出每一分組的匯總結果 缺失值將不納入匯總分析 可在下方的lable框中更改分組匯總標簽 table margintotals框 為表格的每一個維度生成匯總結果 缺失值將不納入匯總分析 format子對話框 表格中的描述性統(tǒng)計分析 Basictables過程 format子對話框 emptycellappearance框 選擇無頻數單元格的表示方式 默認為空 可改為用零表示 missingstatisticsappearas框 選擇對缺失值的表示方式 默認為小數點 可更改為十個字符長度內的任意字符串 表格中的描述性統(tǒng)計分析 Basictables過程 例如 將收入情況和未來收入情況按照戶口和職業(yè)進行頻數統(tǒng)計 表格中的描述性統(tǒng)計分析 generaltables過程 Basictables過程已經為我們提供了非常強大的制表能力但它只能分別對定量資料或分類資料進行匯總而且對于多選題數據無能為力 generaltables則可以解決以上問題 菜單操作 Analyze tables generaltablesstatisticslablesappear 選擇統(tǒng)計量標簽的顯示方式 表格中的描述性統(tǒng)計分析 generaltables過程 acrossthetop 每個統(tǒng)計量單獨占一列 標簽在列頂部顯示 downtheside 每個統(tǒng)計量單獨占一行 標簽在行首顯示 inthelayer 每個統(tǒng)計量單獨占一頁 標簽在頁首顯示 rows框 選入行變量 這些變量實際上就是需要進行匯總分析的變量 可選入多個 使用右邊的選擇框對匯總指標加以定義 columns框 選入列變量 類似于分組變量 可選多個 layers框 選入分層匯總變量 表格中的描述性統(tǒng)計分析 generaltables過程 selectedvariable框組 用于對行 列變量的匯總指標 顯示標簽 組合方式加以定義 definescell 定類變量issummarized 定距變量omitlable 在結果中不輸出選中的變量名或標簽 nest與unnest 當同一個框中選入多個變量時可用 用于選擇和更改變量間的組合方式 前者為嵌套 后者為分別輸出 editstatistics 對行變量需要計算的匯總指標加以定義 inser
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現代漢語表達層次試題及答案
- 現代漢語練習題庫試題及答案
- 計算機一級WPS考點剖析試題及答案
- 一級Photoshop考試知識要點總結試題及答案
- 計算機一級Photoshop考試細分領域解析試題及答案
- 未來公司競爭優(yōu)勢與風險規(guī)避策略試題及答案
- Msoffice文獻管理技巧試題及答案
- 尤其關注的2025年稅法考試試題及答案
- MS Office各模塊總結試題及答案
- 現代漢語的社會文化啟示試題及答案
- 醫(yī)院護工面試題及答案
- 高校學生資助誠信教育主題活動
- 跨國公司海外人力資源外包與派遣管理合同
- LNG 加氣站防雷安全培訓與應急演練記錄 202505
- 普惠金融專員試題及答案
- 【課件】認識民法典+課件統(tǒng)編版道德與法治七年級下冊
- 2025年航天知識競賽題庫及答案
- 2025年人教版小學小升初科學模擬試卷(含答案解析)
- 腸易激綜合征中西醫(yī)結合診療專家共識(2025)解讀課件
- 《金屬疲勞與斷裂》課件
- 2025年《民法典》應知應會知識競賽題庫(含各題型)
評論
0/150
提交評論