薛薇第四版SPSS第四章_第1頁
薛薇第四版SPSS第四章_第2頁
薛薇第四版SPSS第四章_第3頁
薛薇第四版SPSS第四章_第4頁
薛薇第四版SPSS第四章_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第四章 SPSS基本統(tǒng)計分析主要內(nèi)容頻數(shù)分析計算描述統(tǒng)計量列聯(lián)分析多選項分析頻數(shù)分析目的:粗略把握變量值的分布狀況。例:研究被調(diào)查者的特征(如:性別,年齡,收入)研究被調(diào)查者對某個問題的總體看法(如:教學方式,選修課程)采用的方法計算頻分布表:包括頻數(shù)、累計頻數(shù)、百分比、累計百分比繪制統(tǒng)計圖形:條形圖、餅圖頻數(shù)分析基本操作步驟(1)菜單選項:分析-描述統(tǒng)計-頻率(2)選擇幾個待分析的變量到變量框.(3)圖表選項,選擇所需要的圖形頻數(shù)分析頻數(shù)分析中的其他分析計算分位數(shù):適用于定距數(shù)據(jù)數(shù)據(jù)按升序排序后,找到若干個分位點上的變量值計算四分位數(shù):25%(QL)、50%(中位數(shù))、75%(QU)分位數(shù)的

2、應用:在排除極端值影響的條件下,通過計算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度例:( QL=50,QU=80)和(QL=70,QU=75)的比較與頻數(shù)分析相關的圖形以制作條形圖為例第一種模式:用于變量在各組下的頻數(shù)對比第二種模式:用于多個變量基本描述統(tǒng)計量的對比與頻數(shù)分析相關的圖形交互作圖:以制作條形圖為例計算描述統(tǒng)計量目的:精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢、離散趨勢、對稱程度、陡峭程度?;痉椒ǎ河嬎慊久枋鼋y(tǒng)計量計算描述統(tǒng)計量描述集中趨勢的統(tǒng)計量均值:表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計量。適用于定距數(shù)據(jù)。特點:利用了全部數(shù)據(jù),易受極端值的影響。描述離散程度的統(tǒng)計量標準

3、差:表示某變量的所有變量值離散程度的統(tǒng)計量。SPSS中計算的是樣本標準差極差:最大值最小值計算描述統(tǒng)計量描述對稱程度的統(tǒng)計量 偏度(skewness):描述某變量分布形態(tài)的偏斜程度和方向的統(tǒng)計量.偏度為0表示對稱;大于0表示正偏差大(右偏)小于0表示負偏差大(左偏)計算描述統(tǒng)計量描述陡峭程度的統(tǒng)計量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計量。峭度為0表示與標準正態(tài)分布峭度相同。大于0表示比標準正態(tài)分布陡,尖峰。小于0表示比標準正態(tài)分布緩,平峰。計算描述統(tǒng)計量其他統(tǒng)計量 均值標準誤差(means of S.E)中心極限定理認為:樣本均值N(u,2/n)反映樣本均值與總

4、體真值間的平均離散程度樣本數(shù)越大,樣本均值的離散程度越小,對真值的估計越準確計算描述統(tǒng)計量基本操作步驟(1)菜單選項:分析-描述統(tǒng)計-描述(2)選擇將參加計算的數(shù)值型變量名到變量框其他功能數(shù)據(jù)標準化處理新變量的均值為0,標準差為1;小于0表示在平均水平下,大于0反之.正態(tài)分布的數(shù)據(jù)標準化后呈標準正態(tài)分布3準則:(68.2%,95.4%,99.7%)將變量作標準化后,結(jié)果存入名為“Z+原變量名”的新變量中.計算描述統(tǒng)計量描述連續(xù)變量分布的圖形箱線圖:以四分位差的1.5倍為標準剔除極端值描述連續(xù)變量分布的圖形直方圖和金字塔圖Q-Q圖和P-P圖:累計分布函數(shù)(CDF)和概率密度函數(shù)(PDF)函數(shù)的應

5、用交叉分組下的頻數(shù)分析目的:了解不同變量在不同水平下的數(shù)據(jù)分布例:學習成績與性別有關聯(lián)嗎?(兩變量)例:職業(yè)、性別、愛逛商店有關聯(lián)嗎?(三變量)分析的主要步驟產(chǎn)生交叉列聯(lián)表分析列聯(lián)表中變量間的關系列聯(lián)表列聯(lián)表中的元素:列變量行變量地區(qū)控制變量頻數(shù)產(chǎn)生交叉列聯(lián)表基本操作步驟(1)菜單選項: 分析-描述統(tǒng)計- 交叉表(2)選擇一個變量作為行變量到行框.(3)選擇一個變量作為列變量到列框.(4)可選一個或多個變量作為控制變量到層框.控制變量的層次設置:同層為水平數(shù)加;不同層為水平數(shù)積.(5)是否顯示復式條形圖產(chǎn)生交叉列聯(lián)表進一步計算單元格選項:選擇在頻數(shù)分析表中輸出各種百分比.行百分比;列百分比;總

6、百分比 列聯(lián)表例:住房滿意程度與購房計劃列聯(lián)表中行列變量間的關系目的:通過列聯(lián)表分析,檢驗行列變量之間是否獨立方法:卡方檢驗(分類變量相關性的檢驗)年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 0 0 中 0 500 0 老 0 0 600 低 中 高 青 0 0 500 中 0 600 0 老 400 0 0列聯(lián)表中行列變量間的關系卡方檢驗基本步驟(1)H0:行列變量獨立(2)構(gòu)造卡方統(tǒng)計量:從(r-1)*(c-1)個自由度的卡方分布期望分布反映的是H0成立情況下的分布特征(3)計算卡方的觀測值,得到概率P值(4)比較顯著性水平和概率P值。小于等于則拒絕H0,否則不能拒絕列聯(lián)表中行列變量

7、間的關系例:不同行業(yè)的人職業(yè)選擇標準是否存在差異? 制造業(yè) 服務業(yè) 物質(zhì)報酬 105 45 穩(wěn)定性 40 352乘2的列聯(lián)表進行yates連續(xù)性校正:列聯(lián)表中行列變量間的關系卡方檢驗的要求:一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過20%,否則會夸大卡方值,容易得出拒絕結(jié)論,可以合并單元格??ǚ街禃軜颖緮?shù)的影響列聯(lián)表中行列變量間的關系行列變量相關性的其他測度指標phi系數(shù):適用于22列聯(lián)表行列變量獨立時(期望頻數(shù)): 有:行列變量完全相關時: 有:越接近于1,相關性越強。越接近0,相關性越弱 A11 A12 R1 A21 A22 R2 C1 C2列聯(lián)表中行列變量間的關系行列變量相關性的其他

8、測度指標列聯(lián)C系數(shù)(contingency coefficient):0,1);取值受到行列數(shù)的影響V系數(shù):0,1值越大表示行列變量的相關性越大多選項分析多選項分析是針對多選項問題的SPSS多選項問題的處理思路:將一個問題定義成幾個變量。分別用幾個變量描述問題的幾個可能被選擇的答案具體策略:采用不同的編碼方式多選項二分法(multiple dichotomize method)將每個答案作為一個變量,每個變量只有兩個取值(0或1)多選項分類法(multiple category method)預先指定多選項問題被選擇的最多答案數(shù)每個答案建立一個變量,取值為多選項問題的備選答案多選項分析多選項分析的基本思路定義多選項變量集多選項頻數(shù)分析多選項交叉分組下的頻數(shù)分析多選項分析定義多選項變量集目的:將已分解的變量定義為一個集合,便于進行多選項分析菜單選項:分析-多重響應-定義變量集從

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論