第五章 SPSS基本統(tǒng)計(jì)分析.ppt

上傳人：m*** IP屬地：河南上傳時(shí)間：2020-01-27 格式：PPT 頁數(shù)：109 大?。?.28MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩104頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章 SPSS基本統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件 SPSS的許多模塊均可完成描述性分析但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在DescriptiveStatistics菜單中包括 Frequencies 頻數(shù)分析過程特色是產(chǎn)生頻數(shù)表主要針對(duì)分類變量 Descriptives 數(shù)據(jù)描述過程進(jìn)行一般性的統(tǒng)計(jì)描述主要針對(duì)數(shù)值型變量 Explore 數(shù)據(jù)探察過程用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析Crosstabs 多維頻數(shù)分布交叉表分析列聯(lián)表分析 Ratiostatistics 比率分析 4 1頻數(shù)分析 4 1 1頻數(shù)分析的目的和基本任務(wù)1 目的基本統(tǒng)計(jì)分析往往從頻數(shù)分析開始通過頻數(shù)分析能夠了解變量取值的狀況對(duì)把握數(shù)據(jù)的分布特征是非常有用的 2 基本任務(wù) 1 頻數(shù)分析的第一個(gè)基本任務(wù)是編制頻數(shù)分布表頻數(shù) Frequency 即變量值落在某個(gè)區(qū)間或某個(gè)類別中的次數(shù)百分比 Percent 即各頻數(shù)占總樣本數(shù)的百分比有效百分比 ValidPercent 即各頻數(shù)占有效樣本數(shù)的百分比這里有效樣本數(shù) 總樣本缺失樣本數(shù)累計(jì)百分比 CumulativePercent 即各百分比逐級(jí)累加起來的結(jié)果最終取值為100 2 頻數(shù)分析的第二個(gè)任務(wù)是繪制統(tǒng)計(jì)圖條形圖 BarChart 用寬度相同的條形的高度或長短來表示頻數(shù)分布變化的圖形適用于定序和定類變量的分析餅圖 PieChart 用圓形及圓內(nèi)扇形的面積來表示頻數(shù)百分比變化的圖形以利于研究事物內(nèi)在結(jié)構(gòu)組成等問題直方圖 Histograms 用矩形的面積來表示頻數(shù)分布變化的圖形適用于定距型變量的分析注變量的計(jì)量尺度 a定類 CategoryScale 只能計(jì)次b定序 OrdinalScale 計(jì)次排序c定距 IntervalScale 計(jì)次排序加減d定比 RatioScale 計(jì)次排序加減乘除 4 1 2頻數(shù)分析的基本操作 1 選擇菜單Analyze DescriptiveStatistics Frequencies 2 將若干頻數(shù)分析變量選擇到Variable s 框中 3 單擊Chart按鈕選擇繪制統(tǒng)計(jì)圖形在ChartValues框中選擇條形圖中縱坐標(biāo) 或餅圖中扇形面積的含義其中Frequencies表示頻數(shù) Percentages表示百分比輸出百分位數(shù) 輸出四分位數(shù) 顯示25 50 75 的百分位數(shù) 將數(shù)據(jù)平均分為所設(shè)定的相等等份可輸入2 100的整數(shù) 如鍵入4則輸出第25 50 75百分位數(shù)自定義百分位數(shù) 可輸入0 100的整數(shù) 離散趨勢分布形態(tài)欄集中趨勢欄輸出統(tǒng)計(jì)量對(duì)話框 4 1 3SPSS頻數(shù)分析的擴(kuò)展功能1 計(jì)算分位數(shù) PercentileValues 分位數(shù)是變量在不同分位點(diǎn)上的取值分位點(diǎn)在0 100之間一般使用較多的是四分位點(diǎn) Quartiles 即將所有數(shù)據(jù)按升序排序后平均等分成四份各分位點(diǎn)依次是25 50 75 于是四分位數(shù)便分別是25 50 75 點(diǎn)所對(duì)應(yīng)的變量值此外還有八分位數(shù) 十六分位數(shù)等 SPSS提供了計(jì)算任意分位數(shù)的功能用戶可以指定將數(shù)據(jù)等分為n份 Cutpointsfornequalgroups 還可以直接指定分位點(diǎn) Percentile 2 計(jì)算其他基本描述統(tǒng)計(jì)量SPSS頻數(shù)分析還能夠計(jì)算其他基本統(tǒng)計(jì)量其中包括描述集中趨勢 CentralTendency 的基本統(tǒng)計(jì)量描述離散程度 Dispersion 的基本統(tǒng)計(jì)量描述分布形態(tài) Distribution 的基本統(tǒng)計(jì)量等 Format對(duì)話框控制頻數(shù)表輸出的分類數(shù)量默認(rèn)為10 多變量框中可設(shè)定多變量表格輸出的格式設(shè)置頻數(shù)表輸出的格式選擇頻數(shù)表中排列順序按變量升序排列此為默認(rèn)按變量降序排列按變量各種取值發(fā)生的頻數(shù)的升序排列按變量各種取值發(fā)生的頻數(shù)的降序排列 3 頻數(shù)分布表格式 Format 的定義 1 調(diào)整頻數(shù)分布表中數(shù)據(jù)的輸出順序 Orderby 頻數(shù)分布表中的內(nèi)容的輸出順序可以按變量值的升序輸出 Ascendingvalues 按變量值的降序輸出 Descendingvalues 按頻數(shù)的升序輸出 Ascendingcounts 按頻數(shù)的降序輸出 Descendingcounts 2 multiplevariables單選框組如果選擇了兩個(gè)以上變量作頻數(shù)表則comparevariables可以將所有變量的結(jié)果在同一個(gè)頻數(shù)表過程輸出結(jié)果中顯示便于互相比較 organizeoutputbyvariables則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯示每一個(gè)變量一張表 3 壓縮頻數(shù)分布表 Suppresstableswithmorethanncategories 如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)太多頻數(shù)分布表將很龐大此時(shí)可以壓縮它 SPSS默認(rèn) 如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)大于10 則不輸出相應(yīng)的頻數(shù)分布表應(yīng)用中可以修改該值 4 2計(jì)算基本描述統(tǒng)計(jì)量 4 2 1基本描述統(tǒng)計(jì)量常見的基本描述統(tǒng)計(jì)量有三大類刻畫集中趨勢的統(tǒng)計(jì)量刻畫離中趨勢的統(tǒng)計(jì)量刻畫分布形態(tài)的統(tǒng)計(jì)量 1 刻畫集中趨勢的描述統(tǒng)計(jì)量集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向 1 均值 Mean 即算術(shù)平均數(shù) 是反映某變量所有取值的集中趨勢或平均水平的指標(biāo) 如某企業(yè)職工的平均月收入其計(jì)算公式為 2 中位數(shù) Median 即一組數(shù)據(jù)按升序排序后處于中間位置上的數(shù)據(jù)值如評(píng)價(jià)社會(huì)的老齡化程度時(shí) 可用中位數(shù) 3 眾數(shù) Mode 即一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值如生產(chǎn)鞋的廠商在制定各種型號(hào)鞋的生產(chǎn)計(jì)劃時(shí)應(yīng)該運(yùn)用眾數(shù) 2 刻畫離散程度的描述統(tǒng)計(jì)量離散程度是指一組數(shù)據(jù)遠(yuǎn)離其中心值的程度如果數(shù)據(jù)都緊密地集中在中心值的周圍數(shù)據(jù)的離散程度較小說明這個(gè) 中心值對(duì)數(shù)據(jù)的代表性好相反如果數(shù)據(jù)僅是比較松散地分布在中心值的周圍數(shù)據(jù)的離散程度較大則此中心值說明數(shù)據(jù)特征是不具有代表性的常見的刻畫離散程度的描述統(tǒng)計(jì)量如下 1 全距 Range 也稱極差是數(shù)據(jù)的最大值 Maximum 與最小值 Minimum 之間的絕對(duì)離差 2 方差 Variance 也是表示變量取值離散程度的統(tǒng)計(jì)量是各變量值與算數(shù)平均數(shù)離差平方的算術(shù)平均數(shù) 其計(jì)算公式為 3 標(biāo)準(zhǔn)差 StandardDeviation StdDev 表示變量取值距離均值的平均離散程度的統(tǒng)計(jì)量其計(jì)算公式為標(biāo)準(zhǔn)差值越大說明變量值之間的差異越大距均值這個(gè) 中心值的離散趨勢越大 4 均值標(biāo)準(zhǔn)誤差 StandardErrorofMean 描述樣本均值與總體均值之間的平均差異程度的統(tǒng)計(jì)量其計(jì)算公式為其中為總體標(biāo)準(zhǔn)差 n為樣本單位數(shù) 3 刻畫分布形態(tài)的描述統(tǒng)計(jì)量數(shù)據(jù)的分布形態(tài)主要指數(shù)據(jù)分布是否對(duì)稱偏斜程度如何分布陡峭程度等刻畫分布形態(tài)的統(tǒng)計(jì)量主要有兩種 1 偏度 Skewness 描述變量取值分布形態(tài)對(duì)稱性的統(tǒng)計(jì)量其計(jì)算公式為當(dāng)分布為對(duì)稱分布時(shí) 正負(fù)總偏差相等偏度值等于0 當(dāng)分布為不對(duì)稱分布時(shí) 正負(fù)總偏差不相等偏度值大于0或小于0 偏度值大于0表示正偏差值大稱為正偏或右偏偏度值小于0表示負(fù)偏差值大稱為負(fù)偏或左偏偏度絕對(duì)值越大表示數(shù)據(jù)分布形態(tài)的偏斜程度越大 2 峰度 Kurtosis 描述變量取值分布形態(tài)陡峭程度的統(tǒng)計(jì)量其計(jì)算公式為當(dāng)數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡峭程度相同時(shí) 峰度值等于0 峰度大于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭為尖峰分布峰度小于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布平緩為平峰分布 4 2 2計(jì)算基本描述統(tǒng)計(jì)量的操作 1 選擇菜單Analyze DescriptiveStatistics Descriptives 出現(xiàn)如下窗口 2 將需計(jì)算的數(shù)值型變量選擇到Variable s 框中 3 單擊Option按鈕指定計(jì)算哪些基本描述統(tǒng)計(jì)量出現(xiàn)如下窗口 Options對(duì)話框基本統(tǒng)計(jì)量當(dāng)Variables框中有多個(gè)變量時(shí) 此框確定其輸出順序按Variables框中的排列順序輸出按各變量的字母順序輸出按均值的升序排列按均值的降序排列分布在上面窗口中用戶可以指定分析多變量時(shí)結(jié)果輸出的次序 DisplayOrder 其中 Variablelist表示按變量在數(shù)據(jù)窗口中從左到右的次序輸出 Alphabetic表示按字母順序輸出 AscendingMeans表示按均值升序輸出 DescendingMeans表示按均值降序輸出至此 SPSS便自動(dòng)計(jì)算所選變量的基本描述統(tǒng)計(jì)量并顯示到輸出窗口中 4 3交叉分組下的頻數(shù)分析 4 3 1目的和基本任務(wù)1 目的交叉分組下的頻數(shù)分析又稱列聯(lián)表分析通過前面的頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況在實(shí)際分析中不僅要了解單個(gè)變量的分布特征還要分析多個(gè)變量不同取值下的分布進(jìn)而分析變量之間的相互影響和關(guān)系對(duì)于這種涉及兩個(gè)或兩個(gè)以上變量分布情況的研究通常要利用交叉分組下的頻數(shù)分析來完成 2 基本任務(wù) 1 根據(jù)收集到的樣本數(shù)據(jù) 產(chǎn)生二維或多維交叉列聯(lián)表 2 在交叉列聯(lián)表的基礎(chǔ)上對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析 4 3 2交叉列聯(lián)表的主要內(nèi)容編制交叉列聯(lián)表是交叉分組下頻數(shù)分析的第一個(gè)任務(wù) 交叉列聯(lián)表是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表例職工基本情況數(shù)據(jù)按職稱和文化程度編制的二維交叉列聯(lián)表見下頁表上表中的職稱變量稱為行變量 Row 文化程度稱為列變量 Column 行標(biāo)題和列標(biāo)題分別是兩個(gè)變量的變量值或分組值表格中間是觀測頻數(shù) ObservedCounts 和各種百分比 16名職工中本科 ?？?高中初中的人數(shù)分別為4 4 5 3 構(gòu)成的分布稱為交叉列聯(lián)表的列邊緣分布高級(jí)工程師工程師助理工程師無技術(shù)職稱的人數(shù)分別為3 4 6 3 構(gòu)成的分布稱為交叉列聯(lián)表的行邊緣分布 4個(gè)本科學(xué)歷職工中各職稱的人數(shù)分別是1 1 2等這些頻數(shù)構(gòu)成的分布稱為條件分布即在行變量列變量取值條件下的列變量行變量的分布在交叉列聯(lián)表中除了頻數(shù)外還引進(jìn)了各種百分比例如表中第一行中的33 3 33 3 33 3 分別是高級(jí)工程師3人中各學(xué)歷人數(shù)所占的比例稱為行百分比 Rowpercentage 一行的百分比總和為100 表中第一列的25 0 25 0 50 0 分別是本科學(xué)歷4人中各職稱人數(shù)所占的比例稱為列百分比 Columnpercentage 一列的列百分比總和為100 表中的6 3 6 3 12 5 等分別是總?cè)藬?shù)16人中各交叉組中人數(shù)所占的百分比稱為總百分比 Totalpercentage 所有格子中的總百分比之和也為100 4 3 3交叉分組下的頻數(shù)分析的基本操作 1 菜單選項(xiàng)Analyze DescriptiveStatistics Crosstabs 出現(xiàn)窗口如下該框中的變量作為分布表中的行變量和列變量該框中的變量作為控制變量決定頻數(shù)分布表中的層可有多個(gè)控制變量顯示每一組中各變量的分類條形圖只輸出統(tǒng)計(jì)量不輸出多維列聯(lián)表 Crosstabs對(duì)話框 2 如果進(jìn)行二維列聯(lián)表分析則將行變量選擇到Row s 框中將列變量選擇到Column s 框中如果Row s 和Column s 框中有多個(gè)變量名 SPSS會(huì)將行列變量一一配對(duì)后產(chǎn)生多張二維列聯(lián)表如果進(jìn)行三維或多維列聯(lián)表分析則將其他變量作為控制變量選到Layer框中多控制變量間可以是同層次的也可以是逐層疊加的可通過Previous或Next按鈕確定控制變量間的層次關(guān)系 3 選擇Displayclusteredbarcharts選項(xiàng) 指定繪制各變量交叉分組下頻數(shù)分布條形圖 Suppresstables表示不輸出列聯(lián)表在僅分析行列變量間關(guān)系時(shí)可選擇該選項(xiàng) 4 單擊Cells按鈕指定列聯(lián)表單元格中的輸出內(nèi)容窗口如下 Crosstabs的CellDisplay對(duì)話框選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量包括觀測量數(shù) 百分比殘差輸出觀測量的實(shí)際數(shù)量如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的那么會(huì)在單元格中輸出期望的觀測值的數(shù)量輸出單元格中觀測量的數(shù)目占整行全部觀測量數(shù)目的百分比輸出單元格中觀測值的數(shù)目占整列全部觀測量數(shù)目的百分比輸出單元格中觀測量的數(shù)目占全部觀測量數(shù)目的百分比計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差計(jì)算調(diào)整后殘差 SPSS默認(rèn)列聯(lián)表單元格中只輸出觀測頻數(shù) Observed 為便于分析通常還應(yīng)指定輸出Percentage框中的行百分比 Row 列百分比 Column 總百分比 Total Counts框中的Expected表示輸出期望頻數(shù) Residuals框中的各個(gè)選項(xiàng)表示在各個(gè)單元格中輸出剩余其中 Unstandardized為非標(biāo)準(zhǔn)化剩余定義為觀測頻數(shù) 期望頻數(shù) Standardized為標(biāo)準(zhǔn)化剩余又稱Pearson剩余定義為 5 單擊Format按鈕指定列聯(lián)表各單元格的輸出排列順序 Ascending表示以行變量取值的升序排列是SPSS默認(rèn)項(xiàng) Descending表示以行變量取值的降序排列 6 單擊Statistics按鈕指定用哪種方法分析行變量和列變量間的關(guān)系窗口如下其中 Chi Square為卡方檢驗(yàn) 4 3 4交叉列聯(lián)表行列變量間關(guān)系的分析對(duì)交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是交叉分組下頻數(shù)分析的第二個(gè)任務(wù) 為了理解行列變量之間的關(guān)系可以從分析兩個(gè)極端的例子出發(fā) 1 年齡與工資收入的交叉列聯(lián)表一 2 年齡與工資收入交叉列聯(lián)表二表一中表示年齡與工資收入呈正相關(guān)關(guān)系表二表示年齡與工資收入呈負(fù)相關(guān)關(guān)系但大多數(shù)情況下觀測頻數(shù)分散在列聯(lián)表的各個(gè)單元格中不容易直接發(fā)現(xiàn)行列變量之間的關(guān)系強(qiáng)弱程度此時(shí)就要借助非參數(shù)檢驗(yàn)方法通常用的方法是卡方檢驗(yàn) 交叉列聯(lián)表的卡方檢驗(yàn) 卡方檢驗(yàn)屬假設(shè)檢驗(yàn)的范疇步驟如下 1 建立原假設(shè)在列聯(lián)表分析中卡方檢驗(yàn)的原假設(shè)為行變量與列變量獨(dú)立 2 選擇和計(jì)算檢驗(yàn)統(tǒng)計(jì)量列聯(lián)表分析卡方檢驗(yàn)統(tǒng)計(jì)量是Pearson卡方統(tǒng)計(jì)量其數(shù)學(xué)定義為其中 r為列聯(lián)表的行數(shù) c為列聯(lián)表的列數(shù) 為觀察頻數(shù) 為期望頻數(shù) ExpectedCount 期望頻數(shù)的計(jì)算方法是其中 RT是指定單元格所在行的觀測頻數(shù)合計(jì) CT是指定單元格所在列的觀測頻數(shù)合計(jì) n是觀測頻數(shù)的合計(jì) 期望頻數(shù)的分布反映的是行列變量互不相干下的分布例如具有本科學(xué)歷的高級(jí)工程師的期望頻數(shù)是0 75的計(jì)算公式是3 4 16 0 75 這里期望頻數(shù)可以理解為總共16個(gè)職工的學(xué)歷分布是25 25 31 3 18 8 如果遵從這種學(xué)歷的總體比例關(guān)系高級(jí)職稱三人的學(xué)歷分布也應(yīng)為25 25 31 3 18 8 于是期望頻數(shù)為3 25 3 25 3 31 3 3 18 8 同理可以理解總共16個(gè)職工的職稱分布為18 8 25 37 5 18 8 本科學(xué)歷4人的期望頻數(shù)分別為4 18 8 4 25 4 37 5 4 18 8 卡方統(tǒng)計(jì)量觀測值的大小取決于兩個(gè)因素第一列聯(lián)表的單元格子數(shù) 第二觀測頻數(shù)與期望頻數(shù)的總差值在列聯(lián)表確定的情況下卡方統(tǒng)計(jì)量觀測值的大小取決于觀測頻數(shù)與期望頻數(shù)的總差值當(dāng)總差值越大時(shí) 卡方值也就越大實(shí)際分布與期望分布的差距越大表明行列變量之間越相關(guān) 反之表明行列變量之間越獨(dú)立那么在統(tǒng)計(jì)上卡方統(tǒng)計(jì)量的觀測值究竟達(dá)到什么程度才能斷定行列變量不獨(dú)立呢由于該檢驗(yàn)中的pearson卡方統(tǒng)計(jì)量近似服從卡方分布因此可依據(jù)卡方理論找到某自由度和顯著性水平下的卡方值即卡方臨界值 3 確定顯著性水平 SignificantLevel 和臨界值顯著性水平是指原假設(shè)為真卻將其拒絕的風(fēng)險(xiǎn) 即棄真的概率通常設(shè)為0 05或0 01 在卡方檢驗(yàn)中由于卡方統(tǒng)計(jì)量服從自由度為行數(shù) 1 列數(shù) 1 的卡方分布因此在行列數(shù)目和顯著性水平確定時(shí) 卡方臨界值是可唯一確定的 4 結(jié)論和決策對(duì)統(tǒng)計(jì)推斷做決策通常有兩種方式根據(jù)統(tǒng)計(jì)量觀測值和臨界值比較的結(jié)果進(jìn)行決策如果卡方觀測值大于臨界值則認(rèn)為實(shí)際分布與期望分布之間的差距顯著可以拒絕原假設(shè) 斷定列聯(lián)表的行列變量間不獨(dú)立存在相關(guān)關(guān)系反之接受原假設(shè) 根據(jù)統(tǒng)計(jì)量觀測值的概率p值和顯著性水平比較的結(jié)果進(jìn)行決策如果p值小于等于則認(rèn)為卡方觀測值出現(xiàn)的概率是很小的拒絕原假設(shè) 斷定列聯(lián)表的行列變量間不獨(dú)立存在依存關(guān)系反之接受原假設(shè) 什么是P值是一個(gè)概率值如果原假設(shè)為真 P 值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率被稱為觀察到的或?qū)崪y的顯著性水平雙側(cè)檢驗(yàn)的P值左側(cè)檢驗(yàn)的P值右側(cè)檢驗(yàn)的P值利用P值進(jìn)行檢驗(yàn) 決策準(zhǔn)則若p 值不拒絕H0若p 值拒絕H0 5 3 5交叉分組下的頻數(shù)分析應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析實(shí)現(xiàn)以下目標(biāo) 1 分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì) 未來收入狀況的變化趨勢是否持相同的態(tài)度 2 分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)什么合算的認(rèn)同是否一致分析 1 該問題列聯(lián)表的行變量為戶口列變量為未來收入狀況在列聯(lián)表中輸出各種百分比期望頻數(shù) 剩余標(biāo)準(zhǔn)化剩余顯示各交叉分組下頻數(shù)分布柱形圖并利用卡方檢驗(yàn)方法對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)該問題的態(tài)度是否一致進(jìn)行分析 2 該問題列聯(lián)表的行變量為戶口列變量為什么合算在列聯(lián)表的基礎(chǔ)上進(jìn)行卡方檢驗(yàn) 5 3 6SPSS中列聯(lián)表分析的其他方法對(duì)列聯(lián)表中行列變量的分析除上述卡方檢驗(yàn)方法之外 SPSS還提供了其他測度變量間相關(guān)關(guān)系的檢驗(yàn)方法包括適用于兩定類變量的方法 Nominal框中列出的方法屬該類方法適用于兩定序變量的方法 Ordinal框中列出的方法屬該類方法適用于一定類變量一定距變量的方法 Nominalbyinterval框中的Eta方法屬該類方法其他方法 5 4多選項(xiàng)分析頻數(shù)分析和交叉分析多選項(xiàng)問題的概念多選項(xiàng)問題是根據(jù)實(shí)際調(diào)查的需要要求被調(diào)查者從問卷給出的若干個(gè)可選答案中選擇一個(gè)以上的答案目前市場研究或許多領(lǐng)域?qū)δ呈挛镌u(píng)價(jià)的研究中常常遇到這樣的問題可以選多個(gè) 分為限選和不限選限選如在11種工作種類中選你喜歡的最多可選4種 Var1 Var4 求所有人喜歡各種工作的頻數(shù)或頻率不限選如在所列的20種電器中你家所擁有的電器不限選 Var1 Var20 求所有被調(diào)查家庭擁有各種電器的頻數(shù)或頻率 5 4 1多選項(xiàng)問題的分解多選項(xiàng)二分法及其編碼 multipledichotomiesmethod 多選項(xiàng)二分法是將多選項(xiàng)問題中的每一個(gè)答案設(shè)為一個(gè)SPSS變量每個(gè)變量值有0或1兩個(gè)取值分別表示選擇了該答案和不選擇該答案如對(duì)下面問題有9個(gè)可能的答案每個(gè)可選擇的答案由一個(gè)變量表示每個(gè)變量的值只能有表明是和否的兩個(gè)代碼0或者1 左邊的表格為向顧客發(fā)放的顏色調(diào)查在選擇服裝時(shí) 您喜歡什么顏色作為主體顏色在答案的中打可多選這是一組問題每個(gè)問題均有兩個(gè)答案回答者只能選擇其中一種在建立數(shù)據(jù)文件時(shí) 變量名使用相同的變量主名后面加以不同序號(hào)組成本組問題的9個(gè)變量名可以是color1 color9 而答案的編碼規(guī)則為回答是變量值為1 回答否變量值為0 其他值為缺失值多選項(xiàng)分類法及其編碼 multiplecategorymethod 多選項(xiàng)分類法中首先應(yīng)估計(jì)多選項(xiàng)問題最多可能出現(xiàn)的答案個(gè)數(shù) 然后為每個(gè)答案設(shè)置一個(gè)SPSS變量變量取值為多選項(xiàng)問題中的所有可選答案如上面有關(guān)選擇服裝的主體顏色您可以選擇喜歡的三種在提供的10種答案前上選擇 1 紅2 橙3 黃4 綠5 青6 藍(lán)7 紫8 黑9 白10說不清這是一個(gè)問題可以有三個(gè)答案在建立數(shù)據(jù)文件時(shí) 要建立三個(gè)變量color1 color3表示回答者選擇的三個(gè)顏色如選擇結(jié)果為1 紅 6 藍(lán) 8 黑則變量color1的值為1 變量color2的值為6 變量color3的值為8 如果采用多選二分法則有6個(gè)選項(xiàng) 故應(yīng)設(shè)6個(gè)變量運(yùn)用0 1編碼方法編碼即 1 0 1 0 1 1 如果采用多選分類法則編碼為1 3 5 6 0 0 1356 問題2 擇業(yè)中考慮的主要因素多選 1經(jīng)濟(jì)收入2專業(yè)對(duì)口3發(fā)展前途4地理區(qū)位5個(gè)人愛好6風(fēng)險(xiǎn)大小7勞動(dòng)強(qiáng)度8社會(huì)福利9其他編碼應(yīng)為 1 0 1 1 1 0 1 1 0 或1 3 4 5 7 8 0 0 0 136 問題3 您擇業(yè)中考慮的主要因素有限選三項(xiàng) 1經(jīng)濟(jì)收入2專業(yè)對(duì)口3發(fā)展前途4地理區(qū)位5個(gè)人愛好6風(fēng)險(xiǎn)大小7勞動(dòng)強(qiáng)度8社會(huì)福利9社會(huì)地位10其他因?yàn)橄捱x三項(xiàng) 故應(yīng)設(shè)三個(gè)變量編碼依次為1 3 6 5 4 2多選項(xiàng)分析的基本操作首先將每個(gè)題的若干答案組成一個(gè)綜合變量即變量集 Set 然后對(duì)綜合變量的各種取值進(jìn)行分析只有通過定義多選項(xiàng)變量集 spss才能確定應(yīng)對(duì)哪些變量取相同值的個(gè)案數(shù)進(jìn)行累加多選項(xiàng)分析在SPSS中是通過Analyze MultipleResponse中的各項(xiàng)功能實(shí)現(xiàn)的 1 DefineSets 1 從左邊的變量中將多選變量集的變量選擇到variablesinsets框中建立多選二分變量集或多選分類變量集 2 在variablesarecodedas框中指定多選變量集中的變量是按照那種方法編碼的 Dichotomies表示以多選二分法編碼并在countedvalue中輸入用哪個(gè)數(shù)值來表示選中該選項(xiàng) categories表示以多選分類法編碼并在range框中輸入變量取值的最小值和最大值 3 為多選項(xiàng)變量集命名系統(tǒng)會(huì)自動(dòng)在該名字前加字符 4 單擊add按鈕將定義好的多選項(xiàng)變量集加到multresponsesets框中 Spss可以定義多個(gè)多選項(xiàng)變量集 2 Frequencies 對(duì)多選變量集進(jìn)行頻數(shù)分析從multresponsesets中把待分析的多選項(xiàng)變量集選擇到tablesfor框中 3 Crosstabs 對(duì)多選變量集與其他變量集或與原基本變量進(jìn)行交叉表分析 1 選擇列聯(lián)表的行變量并定義取值范圍 2 選擇列聯(lián)表的列變量并定義取值范圍 3 選擇列聯(lián)表的控制變量并定義取值范圍 4 單擊option按鈕選擇列聯(lián)表的輸出內(nèi)容和計(jì)算方法 Matchvariableacrossresponsesets選項(xiàng)表示如果列聯(lián)表的行列變量均為多選項(xiàng)變量集時(shí) 第一個(gè)變量集的第一個(gè)變量與第二個(gè)變量集的第一個(gè)變量作交叉分組依次類推結(jié)果中注意PctofResponses 占總回答數(shù)的和PctofCase 占總個(gè)案數(shù) 的區(qū)別 5 4 3多選項(xiàng)分析的應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析實(shí)現(xiàn)以下兩個(gè)分析目標(biāo) 1 分析儲(chǔ)戶的儲(chǔ)蓄目的 2 分析不同年齡段儲(chǔ)戶的儲(chǔ)蓄目的分析 1 為進(jìn)行多選項(xiàng)分析首先定義名為cxmd的多選項(xiàng)變量集其中包括a7 1 a7 2 a7 3三個(gè)變量然后對(duì)多選項(xiàng)變量集進(jìn)行頻數(shù)分析 2 對(duì)不同年齡段儲(chǔ)戶儲(chǔ)蓄目的進(jìn)行分析采用多選項(xiàng)交叉分組下的頻數(shù)分析 5 5探索分析Explore 1 分析目的和方法奇異性數(shù)據(jù)過大或過小找出分析原因是否剔除分布特征數(shù)據(jù)是否來自正態(tài)總體考察方法統(tǒng)計(jì)量和統(tǒng)計(jì)圖形箱式圖莖葉圖 QQ圖 2 一般是考察定距變量3 Analyze DescriptiveStatistics Explore分析變量 DependentList 數(shù)值型變量分組變量 FactorList 分類變量標(biāo)識(shí)變量 LabelCasesby 用某變量的值作為觀察值得標(biāo)識(shí)如id 選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為分析變量單擊OK可獲得分析變量的一系列基本統(tǒng)計(jì)量和圖形此作為分組變量可以是字符變量對(duì)分析變量的分析將按該變量的觀測值進(jìn)行分組分析可有多個(gè)分組變量這時(shí)會(huì)按多個(gè)變量的交叉組合進(jìn)行分組該框中的變量作為標(biāo)識(shí)符在輸出諸如異常值時(shí) 用該變量進(jìn)行標(biāo)識(shí) 只允許有一個(gè)標(biāo)識(shí)符可同時(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形 Explore主對(duì)話框輸出基本統(tǒng)計(jì)量均值的置信區(qū)間可鍵入1 99 的任意值根據(jù)該值算出置信區(qū)間的上下限給出中心趨勢的最大似然比的穩(wěn)健估計(jì)量當(dāng)數(shù)據(jù)分布均勻且兩尾較長或當(dāng)數(shù)據(jù)中存在極端值時(shí) 可給出比均值或中位數(shù)更合理的估計(jì) 輸出最大和最小的5個(gè)數(shù) 且在輸出窗口中加以標(biāo)明輸出5 10 25 50 75 90 和95 的百分位數(shù) Statistics對(duì)話框 Statistics子對(duì)話框用于選擇需要的描述統(tǒng)計(jì)量 descriptives 輸出均值中位數(shù) 眾數(shù) 5 修正均值估計(jì)標(biāo)準(zhǔn)誤方差標(biāo)準(zhǔn)差最小值最大值全距四分位差峰度系數(shù)及其標(biāo)準(zhǔn)誤偏度系數(shù)及其標(biāo)準(zhǔn)誤及指定的均值置信區(qū)間 m estmators 做集中趨勢的最大穩(wěn)健估計(jì) 該統(tǒng)計(jì)量是利用迭代方法計(jì)算出來的受異常值的影響要小得多如果該估計(jì)量離均值較遠(yuǎn) 則說明數(shù)據(jù)可能存在異常值此時(shí)宜用該估計(jì)量替代均值以反映集中趨勢一共會(huì)輸出四種m估計(jì)量其中huber適用于數(shù)據(jù)接近正態(tài)分布時(shí) 另三種則適用于數(shù)據(jù)中有許多異常值的情況 outliers 輸出五個(gè)最大值和五個(gè)最小值 percentiles 輸出第5 10 25 50 75 90 95 分位數(shù) plots子對(duì)話框用于選擇需要的統(tǒng)計(jì)圖 boxplots復(fù)選框確定箱式圖的繪制方式可以分組繪制 factorlevelstogether 也可以不分組繪制 dependentstogether 或者不繪制 none descriptive復(fù)選框可以選擇繪制莖葉圖 stem and leaf 和直方圖 histogram normalityplotwithtest 繪制正態(tài)分布圖 QQ圖并進(jìn)行變量是否符合正態(tài)分布的檢驗(yàn) 莖葉圖 stem and leaf 1 用于顯示未分組的原始數(shù)據(jù)的分布2 由莖和葉兩部分構(gòu)成其圖形是由數(shù)字組成的3 以該組數(shù)據(jù)的高位數(shù)值作樹莖低位數(shù)字作樹葉4 樹葉上只保留一位數(shù)字5 莖葉圖類似于橫置的直方圖但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況又能給出每一個(gè)原始數(shù)值保留了原始數(shù)據(jù)的信息6 圖的下方會(huì)標(biāo)示出莖寬和實(shí)際值的倍數(shù) 每行的莖和葉組成的數(shù)字再乘以莖寬即得到實(shí)際數(shù)據(jù)的近似值如莖寬為10 則圖中的2 3代表23 同樣在圖的下方也會(huì)標(biāo)示出每片葉子代表的記錄數(shù) 未分組數(shù)據(jù) 莖葉圖練習(xí) 利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù) 對(duì)一次存款金額變量進(jìn)行探索性分析 5 6比率分析 5 6 1比率分析的目的和主要指標(biāo)比率分析用于對(duì)兩變量間變量值比率變化的描述分析適用于數(shù)值型變量例如根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù) 分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況通常的分析可以生成各個(gè)地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量然后對(duì)該比率變量計(jì)算基本描述統(tǒng)計(jì)量如均值中位數(shù) 標(biāo)準(zhǔn)差全距等進(jìn)而刻畫比率變量的集中趨勢和離散程度 SPSS的比率分析除能夠完成上述分析外還提供了其他相對(duì)比描述指標(biāo) 大致也屬于集中趨勢描述指標(biāo)和離散程度描述指標(biāo)的范疇具體包括 1 加權(quán)比率均值 Weightedmean 兩變量均值的比屬集中趨勢描述指標(biāo) 2 AAD AverageAbsoluteDeviation 平均絕對(duì)離差是對(duì)比率變量離散程度的描述計(jì)算公式為其中是比率數(shù) M是比率變量的中位數(shù) N為樣本數(shù) 相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù)的計(jì)算相對(duì)數(shù) 或平均數(shù) 用Y表示有Y a b a b為總量指標(biāo) 求各期Y的平均一般不能采用簡單算術(shù)平均法即因?yàn)楦髌跀?shù)據(jù)Yi的對(duì)比基礎(chǔ)bi不同它們對(duì)全期總平均水平的影響作用應(yīng)輕重有別計(jì)算公式 1 分別計(jì)算其分子分母的平均數(shù)2 對(duì)比得上式實(shí)質(zhì)上等于對(duì)各期Y加權(quán)算術(shù)平均 3 COD CoefficientofDispersion 離散系數(shù) 也是對(duì)比率變量離散程度的描述計(jì)算公式為 4 PRD Price relatedDifferential 相關(guān)價(jià)格微分是比率均值與加權(quán)比率均值的比也是比率變量離散程度的描述 5 COV變異系數(shù) 用于對(duì)比率變量離散程度的描述分為基于均值的變異系數(shù) MeancenteredCOV 和中位數(shù)的變異系數(shù) MediancenteredCOV 前者是通常意義下的變異系數(shù) 是標(biāo)準(zhǔn)差除以均值后者定義為 5 6 2比率分析的基本步驟 1 選擇菜單Analyze DescriptiveStatistics Radio 出現(xiàn)窗口 2 將比率變量的分子選擇到Numerator框中將比率變量的分母選到Denominator框中 3 如果做不同組間的比率比較則將分組變量選擇到GroupVariable框中 4 單擊Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量出現(xiàn)如下窗口至此 SPSS將自動(dòng)計(jì)算比率變量并將相關(guān)指標(biāo)輸出到輸出窗口中報(bào)表中的描述性統(tǒng)計(jì)分析 casesummaries 過程 casesummaries過程用于按指定的分組變量的不同水平進(jìn)行交叉描述性統(tǒng)計(jì)分析 Analyze report casesummary進(jìn)入 variables框選擇需要進(jìn)行分析的變量可多選 groupingvariables框選擇用于分組的變量如果選擇了多個(gè)分組變量則系統(tǒng)會(huì)按各個(gè)變量的不同取值的交叉組合對(duì)匯總變量進(jìn)行分析 Displaycase 用于確定是否輸出詳細(xì)的記錄列表下面的三個(gè)復(fù)選框用于選擇具體的輸出方式 Statistics子對(duì)話框用于選擇一些常用的統(tǒng)計(jì)量 title子對(duì)話框 title框用于定義輸出表格的標(biāo)題默認(rèn)標(biāo)題為casesummaries caption框用于給輸出表格加上注解文字 subheadingsfortotals 用于選擇是否給每個(gè)分組均顯示所計(jì)算統(tǒng)計(jì)量的名稱 excludecasewithmissingvalueslistwise 用于選擇是否在分析中刪除帶有缺失值的變量 missingstatisticsappearas 用于輸出一個(gè)字符串用于在輸出結(jié)果中表示缺失值報(bào)表中的描述性統(tǒng)計(jì)分析舉例 1 對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù)中的居民存款金額按照戶口和職業(yè)進(jìn)行分類匯總得到均值中位數(shù)及標(biāo)準(zhǔn)差分析可以使用splitfile過程然后使用descriptive過程來完成但是我們用這里的casesummary過程一步就能完成表格中的描述性統(tǒng)計(jì)分析 Basictables過程 Basictables過程可對(duì)定類資料或定量資料進(jìn)行各種復(fù)雜格式的描述菜單操作 Analyze tables Basictablessummaries框選擇需要進(jìn)行匯總的變量可以是定類變量也可以是定距變量可以選入多個(gè) 但所有變量只能使用同樣的匯總指標(biāo) subgroups框用于定義分組匯總時(shí)的分組情況表格中的描述性統(tǒng)計(jì)分析 Basictables過程 down框選入分行匯總變量表格中的匯總指標(biāo)按照該變量的不同取值分行輸出可以選入多個(gè) across框選入分列匯總變量 separatetable框選入分層匯總變量 allcombination 默認(rèn)選項(xiàng) 所有分組變量按照選入順序依次嵌套 eachseparately 所有分組變量分別輸出分組統(tǒng)計(jì)結(jié)果只是放在同一個(gè)表格中表格中的描述性統(tǒng)計(jì)分析 Basictables過程 statistics子對(duì)話框 percentilecutpoint框選中percentile統(tǒng)計(jì)量時(shí)可用用于選擇分界百分位點(diǎn) format框用于設(shè)置各種統(tǒng)計(jì)量的顯示格式 label框用于設(shè)定各種統(tǒng)計(jì)量的顯示標(biāo)簽默認(rèn)為統(tǒng)計(jì)量名稱可以更改為中文 sortingbycellcount框選擇是否按照表中的頻數(shù)順序輸出表格中的描述性統(tǒng)計(jì)分析 Basictables過程 layout子對(duì)話框用于設(shè)定各種標(biāo)題標(biāo)簽的顯示方式 summaryvariablelables框用于選擇匯總變量標(biāo)簽的顯示方式可以在左側(cè) 頂部和分不同表格輸出中選擇 statisticslables框用于選擇統(tǒng)計(jì)量標(biāo)簽的顯示方式 groupinsummaryvariabledimension框如果在前面將匯總變量和分組變量選在了同一方向顯示則可在此處選擇是將匯總變量是與各亞組之下還是將分則變量值與匯總變量之下 lablegroupswithvaluelablesonly框如果選中該框則各分組的變量名標(biāo)簽將被省略他們將用數(shù)值標(biāo)簽或數(shù)值本身來表示表格中的描述性統(tǒng)計(jì)分析 Basictables過程 totals子對(duì)話框選擇是否進(jìn)行匯總以及設(shè)定匯總標(biāo)簽 totalsovereachgroupvariable框要求給出每一分組的匯總結(jié)果缺失值將不納入?yún)R總分析可在下方的lable框中更改分組匯總標(biāo)簽 table margintotals框為表格的每一個(gè)維度生成匯總結(jié)果缺失值將不納入?yún)R總分析 format子對(duì)話框表格中的描述性統(tǒng)計(jì)分析 Basictables過程 format子對(duì)話框 emptycellappearance框選擇無頻數(shù)單元格的表示方式默認(rèn)為空可改為用零表示 missingstatisticsappearas框選擇對(duì)缺失值的表示方式默認(rèn)為小數(shù)點(diǎn) 可更改為十個(gè)字符長度內(nèi)的任意字符串表格中的描述性統(tǒng)計(jì)分析 Basictables過程例如將收入情況和未來收入情況按照戶口和職業(yè)進(jìn)行頻數(shù)統(tǒng)計(jì) 表格中的描述性統(tǒng)計(jì)分析 generaltables過程 Basictables過程已經(jīng)為我們提供了非常強(qiáng)大的制表能力但它只能分別對(duì)定量資料或分類資料進(jìn)行匯總而且對(duì)于多選題數(shù)據(jù)無能為力 generaltables則可以解決以上問題菜單操作 Analyze tables generaltablesstatisticslablesappear 選擇統(tǒng)計(jì)量標(biāo)簽的顯示方式表格中的描述性統(tǒng)計(jì)分析 generaltables過程 acrossthetop 每個(gè)統(tǒng)計(jì)量單獨(dú)占一列標(biāo)簽在列頂部顯示 downtheside 每個(gè)統(tǒng)計(jì)量單獨(dú)占一行標(biāo)簽在行首顯示 inthelayer 每個(gè)統(tǒng)計(jì)量單獨(dú)占一頁標(biāo)簽在頁首顯示 rows框選入行變量這些變量實(shí)際上就是需要進(jìn)行匯總分析的變量可選入多個(gè) 使用右邊的選擇框?qū)R總指標(biāo)加以定義 columns框選入列變量類似于分組變量可選多個(gè) layers框選入分層匯總變量表格中的描述性統(tǒng)計(jì)分析 generaltables過程 selectedvariable框組用于對(duì)行列變量的匯總指標(biāo) 顯示標(biāo)簽組合方式加以定義 definescell 定類變量issummarized 定距變量omitlable 在結(jié)果中不輸出選中的變量名或標(biāo)簽 nest與unnest 當(dāng)同一個(gè)框中選入多個(gè)變量時(shí)可用用于選擇和更改變量間的組合方式前者為嵌套后者為分別輸出 editstatistics 對(duì)行變量需要計(jì)算的匯總指標(biāo)加以定義 inser

人人文庫> 全部分類> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第五章 SPSS基本統(tǒng)計(jì)分析.ppt

文檔簡介

溫馨提示

最新文檔

評(píng)論

第五章 SPSS基本統(tǒng)計(jì)分析.ppt

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔