SPSS基本統(tǒng)計分析_第1頁
SPSS基本統(tǒng)計分析_第2頁
SPSS基本統(tǒng)計分析_第3頁
SPSS基本統(tǒng)計分析_第4頁
SPSS基本統(tǒng)計分析_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章SPSS基本統(tǒng)計分析對樣本數(shù)據(jù)的刻畫與描述1提要頻數(shù)分析計算基本描述統(tǒng)計量交叉分組下的頻數(shù)分析多選項分析比率分析要求:掌握每種方法的基本功能、作用掌握每種方法的基本操作方法掌握每種方法的適用范圍2一、頻數(shù)分析頻數(shù)分析,用于了解變量取值的狀況,有利于把握數(shù)據(jù)的分布特征(一)基本概念頻數(shù):頻率,變量值落在給定區(qū)間的次數(shù)(數(shù)目)百分比:各頻數(shù)占總樣本數(shù)的百分比有效百分比:各頻數(shù)占有效樣本數(shù)的百分比有效樣本數(shù):不包含缺失值的樣本的個數(shù)=總樣本數(shù)-缺失樣本數(shù)累積百分比:各百分比逐級累加起來的結(jié)果注意:頻數(shù),只針對單個變量進行!3(二)基本分析步驟1.選擇菜單AnalyzeDescriptive

StatisticsFrequencies2.選擇分析對象變量在Variable(s)框中,放置要進行頻數(shù)分析的變量;可放置多個,但分析是分別進行的3.調(diào)正輸出分布表中數(shù)據(jù)的輸出順序

Format…按鈕,可按變量值的升降,頻數(shù)Counts的升降進行排序4.選擇輸出圖形

Chart…按鈕,可選擇顯示的內(nèi)容:頻數(shù)Frequencies,百分比Percentanges5.輸出裁剪可視分析的具體情況,對結(jié)果做必要的裁剪(去掉某些變量的分析結(jié)果)圖形可被編輯:雙擊圖形,出現(xiàn)ChartEdit圖形編輯窗口4(三)擴展功能Statistics計算分位數(shù)(PercenticleValues)、計算集中趨勢(CentralTendency)、計算離散趨勢(Dispersion)、描述分布形態(tài)(Distribution)等計算分位數(shù):變量在不同區(qū)段內(nèi)的取值情況、數(shù)目(PercenticleValues)注意:分位數(shù)的分位范圍為0~100,作用:描述數(shù)據(jù)離散程度,差越大,說明在相應(yīng)位段上的離散程度越大*拆分會對以后的分析操作一直起作用,即,都會是在每個拆分的組上分別進行分析!5頻數(shù)分析過程(Frequencies)該過程可計算數(shù)據(jù)資料的各種描述統(tǒng)計指標、給出變量簡單頻數(shù)分布表、繪制幾種變量分布圖。Analyze?DescriptiveStatistics

?Frequencies出現(xiàn)對話框操作6案例4-1:住房狀況分析打開對話框選擇頻數(shù)表選擇柱狀圖789101112描述統(tǒng)計量表平均數(shù)中位數(shù)眾數(shù)標準差方差偏度系數(shù)峰度系數(shù)全距(極差)最小值最大值百分比13次級數(shù)據(jù)資料分析—擴展分析1、對資料進行分組

TransformRecodeIntoDifferentVariable2、對已分組的資料進行頻數(shù)分析(1)、對頻數(shù)進行加權(quán)DataWeightCases

(2)、求分組數(shù)據(jù)的頻數(shù)分析表和描述統(tǒng)計量

Analyze?DescriptiveStatistics

?Frequencies14案例4-2151617二、計算基本描述統(tǒng)計量若要對定距型數(shù)據(jù)的分布特征進行更精確的把握,可通過計算基本描述統(tǒng)計量來實現(xiàn),如:計算均值、標準差、偏度、峰度等。常用基本描述統(tǒng)計量:刻畫集中趨勢的描述統(tǒng)計量刻畫離散程度的描述統(tǒng)計量Dispersion刻畫分布形態(tài)的描述統(tǒng)計量Distribution181.刻畫集中趨勢的描述統(tǒng)計量集中趨勢:一組數(shù)據(jù)向某一中心值靠攏的傾向。目的:找到能夠反映數(shù)據(jù)一般水平的“代表值”常用的中心值:均值Mean:(算術(shù)平均值)中位數(shù)Median:按升序排列后,處于中間位置的數(shù)據(jù)值;評價社會老齡化程度眾數(shù)Mode:一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值;生產(chǎn)鞋號的生產(chǎn)計劃均值標準誤差StandardErrorofMean:反映樣本均值與總體均值間的差異程度19各種平均數(shù)之間的關(guān)系不同的平均數(shù)適用于研究不同的問題,各種平均數(shù)都具有自己的含義、特點和應(yīng)用場合。如算術(shù)平均數(shù)適用于正態(tài)分布的資料,中位數(shù)則適用于所有分布類型的資料,幾何平均數(shù)適用于對數(shù)正態(tài)分布??坍嫈?shù)據(jù)集中程度的特征量20刻畫數(shù)據(jù)集中程度的特征量算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的關(guān)系若根據(jù)光滑的頻數(shù)曲線來解釋這三種測度,可以說均值是變量分布的平衡點或重心;中位數(shù)把這個分布正好劃分兩半;眾數(shù)正好在分布頂端出現(xiàn)。在頻數(shù)分布完全對稱的情況下,均值=中位數(shù)=眾數(shù)在頻數(shù)分布右偏時,眾數(shù)<中位數(shù)<均值在頻數(shù)分布左偏時,均值<中位數(shù)<眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值212.刻畫離散程度的描述統(tǒng)計量Dispersion離散程度:一組數(shù)據(jù)遠離其中心值的程度,即所有數(shù)據(jù)相對于中心值的疏密程度;越密,離散程度越小,中心值的代表性越強。目的:結(jié)合中心值,給出數(shù)據(jù)更全面、完整的描述常用統(tǒng)計量:樣本標準差StandardDeviation(StdDev):表示變量取值距均值的平均離散程度;值越大,差異越大樣本方差Variance:意義同上;值越大,差異越大全距Range:極差,數(shù)據(jù)最大值與最小值間的絕對差;全距大筆全距小的數(shù)據(jù)分散22方差(Varance)和標準差(StandardDeviation)A、方差方差是每個變量與其算術(shù)平均數(shù)之間差的平方的算術(shù)平均數(shù)。設(shè)從某個總體中抽取的數(shù)據(jù)為,則樣本方差為:設(shè)該總體的全部數(shù)據(jù)就是,則總體方差為:

23B、標準差設(shè)從某個總體中抽取的數(shù)據(jù)為,則樣本標準差為:設(shè)該總體的全部數(shù)據(jù)就是則總體標準差為:24例:樣本方差

原始數(shù)據(jù):1059136825例:樣本標準差26標準差是測定數(shù)據(jù)離散程度的最常用的方法。標準差廣泛應(yīng)用于相關(guān)與回歸分析、抽樣推斷、統(tǒng)計預測等各方面。27C、極差(全距)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響未考慮數(shù)據(jù)的分布計算公式為未分組數(shù)據(jù)R=max(Xi)-min(Xi)組距分組數(shù)據(jù)R=最高組上限-最低組下限283.刻畫分布形態(tài)的描述統(tǒng)計量Distribution數(shù)據(jù)形態(tài):指數(shù)據(jù)分布是否對稱、偏斜程度、分布陡緩程度等;作為集中趨勢和離散程度的補充常用統(tǒng)計量:偏度系數(shù)Skewness:描述變量取值分布形態(tài)對稱性的統(tǒng)計量;絕對值越大,偏斜程度越大;為0,表示對稱;正,正偏/右偏,低于平均標準;負,負偏/左偏,高于評價標準峰度系數(shù)Kurtosis:描述變量取值分布形態(tài)陡緩程度的統(tǒng)計量(與標準正態(tài)圖做對比);0,相同;正數(shù),更陡(尖峰分布),少數(shù)人占東西的多,低于平均標準;負數(shù),更緩(平峰分布),大家比較平均,高于平均標準29偏態(tài)與峰度分布的形狀左偏分布右偏分布扁平分布尖峰分布偏態(tài)峰度與標準正態(tài)分布比較!30偏態(tài)1. 數(shù)據(jù)分布偏斜程度的測度2. 偏態(tài)系數(shù)=0為對稱分布3. 偏態(tài)系數(shù)>0為右偏分布4. 偏態(tài)系數(shù)<0為左偏分布5.計算公式為31峰度1. 數(shù)據(jù)分布扁平程度的測度2. 峰度系數(shù)=3扁平程度適中3. 偏態(tài)系數(shù)<3為扁平分布4. 偏態(tài)系數(shù)>3為尖峰分布5.計算公式為32基本分析步驟選擇菜單:AnalyzeDescriptive

StatisticsDescriptives選擇分析變量到Variable(S)中設(shè)置要分析的方法Option最上:描述集中趨勢Dispersion:描述離散程度Distribution:描述分布形態(tài)設(shè)置輸出特點DisplayOrder:輸出顯示規(guī)律Variablelist:按變量在數(shù)據(jù)窗口中從左到右的次序輸出Alphabetic:按變量名字母順序輸出Ascendiingmeans:按均值升序輸出Descendingmeans:按均值降序輸出33數(shù)據(jù)描述過程

(Descriptives)該過程計算數(shù)據(jù)資料的各種描述統(tǒng)計指標,但不給出分布圖。Analyze?DescriptiveStatistics

?Descriptives

出現(xiàn)對話框操作34案例4-335案例4-436三、交叉分組下的頻數(shù)分析(一)基本概念1.交叉分組下的頻數(shù)分析:又稱列聯(lián)表分析,(條件概率),用于分析多變量不同取值下的數(shù)據(jù)分布情況,可用于掌握多變量的聯(lián)合分布特征,進而分析變量間的相互影響和關(guān)系,主要是看是否存在關(guān)聯(lián)(相同,一致)。例如:針對職工基本情況表,分析不同職稱、不同文化程度交叉分組下的職工頻數(shù)分析----條件概率37(二)基本分析步驟1.根據(jù)收集到的樣本數(shù)據(jù)編制交叉列聯(lián)表2.在交叉列聯(lián)表的基礎(chǔ),對兩兩變量間是否存在一定的相關(guān)性進行分析舉例:針對職工基本情況表,分析不同職稱、不同文化程度交叉分組下的職工頻數(shù)分析38(三)SPSS下的操作步驟1.進行數(shù)據(jù)的預處理2.選擇AnalyzeDescriptive

StatisticsCrosstabs3.選擇需要分析的變量:3.1若進行二維列聯(lián)表分析,行變量放到Rows框,列變量到Columns框。3.2若進行多維列聯(lián)表分析,將其它維的變量放到Layer框中。(多變量間可以同層次Previous\Next,也可以疊加)(Layer中,放置的一般是互不相干變量,如:性別)4.選擇Displayclusteredbarcharts,指定繪制個變量交叉分組下的頻數(shù)分布柱形圖395.指定輸出的內(nèi)容,Cells按鈕Observed:觀測頻數(shù)Expected:期望頻數(shù)Percentages:行、列百分比Residuals:各單元格中暑促觀測頻數(shù)與期望頻數(shù)的差Unstandardized,非標準化剩余,觀測-期望Standardized,標準化剩余6.指定各單元格的輸出順序,F(xiàn)ormat鈕完成列聯(lián)表的設(shè)定7.指明用于行列間關(guān)系的分析方法,Statistics鈕--選擇變量間關(guān)系的分析方法Chi-Square:卡方檢驗40列變量行變量列百分比行百分比總百分比頻數(shù)邊緣百分比邊緣百分比案例4-54142(四)結(jié)果說明1.交叉列聯(lián)表的主要內(nèi)容行:行變量,其標題為相關(guān)變量的變量值。列:列變量,其標題為相關(guān)變量的變量值。行邊緣分布:僅針對行變量的分布列邊緣分布:僅針對列變量的分布交叉列聯(lián)表的條件分布:在行(列)變量取值條件下的列(行)變量的分布行百分比:針對行變量在當前行總數(shù)的比例列百分比:針對列變量在當前列總數(shù)的比例總百分比:針對總體書的比例432.交叉列聯(lián)表行列變量間關(guān)系的分析目的:分析行、列變量間是否有聯(lián)系、聯(lián)系的緊密程度等常用方法:非參數(shù)檢驗方法和度量變量間相關(guān)程度的統(tǒng)計量(卡方χ2檢驗、相關(guān)性檢驗)441)卡方檢驗Pearson(屬于假設(shè)檢驗,看假設(shè)是否正確)原假設(shè):行、列變量彼此獨立。根據(jù)統(tǒng)計量觀測值和臨界值比較的結(jié)果進行決策:若觀測值大于臨界值,則差異顯著,行列變量不獨立,可拒絕原假設(shè)。反之,不能拒絕原假設(shè),行列變量獨立。根據(jù)統(tǒng)計量觀測值的概率P-值和顯著性水平α比較的結(jié)果進行決策:若P<=α,卡方觀測值出現(xiàn)的概率很小,是一個本不該發(fā)生卻發(fā)生了的事情,因此拒絕原假設(shè),行列變量不獨立,存在依存關(guān)系;反之,接受原假設(shè),行列變量相互獨立。452)交叉列聯(lián)表卡方檢驗的說明

A.列聯(lián)表個單元格中期望頻數(shù)大小的問題不應(yīng)有期望頻數(shù)小于1的單元格,或不應(yīng)有大量期望頻數(shù)小于5的單元格。(>20%時,會存在偏大的趨勢,不應(yīng)使用此方法,可考慮使用似然率卡方檢驗等方法進行修正)

B.樣本量大小的問題卡方值受樣本量的影響。463)卡方檢驗結(jié)果表說明自己選一個顯著性水平0.05>P,所以無關(guān),不一致。

LikelihoodRatio:似然比卡方(大樣本數(shù)時,與卡方基本一致)

Linear-byLinearAssociation:線性相關(guān)卡方,只適合于定序變量,用于檢驗行列變量的線性相關(guān)性,原假設(shè)為行列變量0相關(guān)。(相關(guān),但戶口為定類變量!,不能用此)47四、多選項分析(一)基本概念1.多選項分析:針對問卷調(diào)查中多選項的分析(一個變量,可選擇一個以上答案,定序、定類)2.編碼:將多選項中內(nèi)容轉(zhuǎn)化為數(shù)值型數(shù)據(jù)的方式。多選項問題的回答方式,答案有一定的先后次序,答案無序,因此在編碼時需要考慮。48(二)基本步驟1.將多選項問題分解2.用多選項頻數(shù)分析或多選項交叉分組下的頻數(shù)分析等方法進行分析SPSS對調(diào)查問卷的處理過程:單選:一個問題設(shè)為一個變量,用戶的選項為變量值,可選項為變量的取值范圍多選:一般是將該問題分解為若干個問題,對應(yīng)設(shè)置若干個SPSS變量,分別存放描述這些問題的幾個可能被選擇的答案(一個變?yōu)槎鄠€)多選的分解辦法:多選項二分法(MultipleDichotomiesMethod)、多選項分類法(MultipleCategoryMethod)49多選項二分法:將多選項中的每個答案設(shè)為一個SPSS變量,每個變量只有0或1的值,表示是否選擇該答案。---不利于內(nèi)容順序性的體現(xiàn)多選項分類法:首選估計多選項問題中最多可能出現(xiàn)的答案個數(shù),將其每個組合設(shè)置為1個SPSS變量,變量取值為多個可能答案組合中的一個。(依據(jù)要求用戶可選擇的最大數(shù)目,來設(shè)置變量)---利于順序性的分析多選項分解辦法的選擇:是否便于分析和是否丟失信息的角度選擇有順序性的選分類法,無順序性要求的選二分法50(三)SPSS操作步驟對數(shù)據(jù)中多選項變量進行分解,輸入數(shù)據(jù)將分解開的變量定義為多項選擇變量集AnalyzeMultipleResponseDefineSets進行多選項頻數(shù)分析AnalyzeMultiple

ResponseFrequencies

結(jié)果說明51五、比率分析(一)基本概念1.比率分析:可理解為比例,用于對兩變量間變量值比率變化的描述分析,適用于定距變量例:根據(jù)各地保險業(yè)務(wù)情況,分析財險收入占全部業(yè)務(wù)收入的比例情況,得到個地區(qū)財險收入占總業(yè)務(wù)收入的比率變量,進而可進行下一步分析2.比例分析的結(jié)果可用于計算基本描述統(tǒng)計量(均值、中位數(shù)、標準差、全距)等3.加權(quán)比率均值:兩變量均值的比,描述集中趨勢4.ADD平均絕對離差:,Ri,比率值;M,比率變量的中位值;N,樣本數(shù);描述離散趨勢525.COD離散系數(shù):,,平均比率6.PRD相關(guān)價格微分:比率均值與加權(quán)比率均值的比,描述離散程度7.COV變異系數(shù):分基于均值的變異系數(shù)和中位數(shù)的變異系數(shù),描述離散程度53(二)SPSS步驟1.AnalyzeDescriptiveStatisticsRatio2.Numerator:作為比率變量的分子3.Denominator:比率變量的分母4.GroupVariable:用于分組的變量,可用于做不同組間的比率比較5.Statistics:指明要輸出哪些關(guān)于比率的描述統(tǒng)計量CentralTendency:描述集中趨勢的統(tǒng)計量Dispersion:描述離散趨勢的統(tǒng)計量54(三)結(jié)果分析1.占比例高,說明高于平均水平2.離散程度高于平均,說明發(fā)展水平差異大55案例分析:教學評估某綜合性大學,為進行教學評估,其中進行一項是對本校的畢業(yè)生調(diào)查,隨機抽取了48名畢業(yè)生組成樣本,對三個學院的畢業(yè)生,要求他們所在的工作單位對其工作表現(xiàn)、專業(yè)水平外、語水平的表現(xiàn)進行評分,評分由0到10分,分值越大表明滿意程度越高。收集的數(shù)據(jù)如下:56學院工作表現(xiàn)專業(yè)水平外語水平學院工作表現(xiàn)專業(yè)水平外語水平生物學院醫(yī)學院生物學院醫(yī)學院醫(yī)學院生物學院農(nóng)學院農(nóng)學院農(nóng)學院農(nóng)學院生物學院醫(yī)學院農(nóng)學院醫(yī)學院農(nóng)學院農(nóng)學院醫(yī)學院醫(yī)學院生物學院生物學院農(nóng)學院農(nóng)學院生物學院農(nóng)學院7.008.008.009.007.007.007.006.008.009.007.009.008.009.009.007.007.009.009.009.008.007.009.008.008.009.007.008.006.004.006.005.006.006.006.006.007.006.005.007.005.005.007.009.006.006.004.006.003.004.004.005.003.006.004.008.003.007.006.002.007.006.006.003.002.004.007.005.004.005.005.008.00農(nóng)學院生物學院農(nóng)學院農(nóng)學院醫(yī)學院生物學院醫(yī)學院農(nóng)學院生物學院醫(yī)學院醫(yī)學院農(nóng)學院生物學院農(nóng)學院生物學院醫(yī)學院醫(yī)學院生物學院農(nóng)學院生物學院醫(yī)學院生物學院醫(yī)學院生物學院6.007.007.007.009.008.009.007.009.009.008.007.008.007.008.0010.0010.009.007.008.008.0010.009.008.006.008.007.005.006.007.008.004.007.006.009.006.008.006.008.007.007.006.004.004.006.008.008.005.006.004.007.002.002.006.004.005.009.005.005.006.002.003.005.005.006.007.007.005.006.006.007.007.0057要求:管理報告對這些數(shù)據(jù)做出數(shù)值的和圖型的描述。用人單位對該校畢業(yè)生哪個方面最為滿意,哪個方面最不滿意,應(yīng)在哪個方面作出教學改革?用人單位對該校畢業(yè)生哪個方面的滿意程度差別最大?什么原因產(chǎn)生?社會對三個學院的畢業(yè)生的滿意程度是否一致?能否提出提高社會對該校畢業(yè)生滿意程度的建議?58思考:我們需做哪些分析?樣本有效性分析評價對象分析:各學院人數(shù)、比例學生各方面的整體評價各種評價的比例整體情形(集中、離散趨勢等)各學院與整體情況的對比591.對這些數(shù)據(jù)做出數(shù)值的和圖型的描述。從圖中可看出,隨機抽取48名學生是由醫(yī)學院、生物學院和農(nóng)學院組成,各學院畢業(yè)生人數(shù)分別占樣本的31%、33.3%、35.4%,可見各學院抽取畢業(yè)生大致相同,樣本具有一定的代表性。602.頻數(shù)分析過程(Frequencies)表16162633.數(shù)據(jù)描述過程(Descriptives)64結(jié)論和政策建議(1)從表1可知,用人單位對某綜合大學的畢業(yè)生的工作表現(xiàn)評分最高,而外語水平評分最低。工作表現(xiàn)評分平均得分為8.04分,外語水平平均得分為5.08分。有50%畢業(yè)生的工作表現(xiàn)評分在8分以上,其中一半在9分以上,而外語水平評分在5分以下的有50%的畢業(yè)生,僅有25%在6分以上,由此可見,用人單位最滿意該校畢業(yè)生的是工作表現(xiàn),最不滿意的是外語水平。最近,知名管理咨詢公司麥肯錫在上海發(fā)布的最新研究報告稱,“在龐大的中國畢業(yè)生隊伍中,很少有人能夠直接勝任在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論