SPSS數(shù)據(jù)的基本統(tǒng)計(jì)分析_第1頁
SPSS數(shù)據(jù)的基本統(tǒng)計(jì)分析_第2頁
SPSS數(shù)據(jù)的基本統(tǒng)計(jì)分析_第3頁
SPSS數(shù)據(jù)的基本統(tǒng)計(jì)分析_第4頁
SPSS數(shù)據(jù)的基本統(tǒng)計(jì)分析_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSSSPSS基本統(tǒng)計(jì)分析基本統(tǒng)計(jì)分析單變量的頻數(shù)分析單變量的基本描述統(tǒng)計(jì)量的計(jì)算多變量的交叉頻數(shù)表的編制和分析探索性分析數(shù)據(jù)的多選項(xiàng)分析通過頻數(shù)分析能夠了解變量取值的狀況,把握數(shù)據(jù)的分布特征,能反映樣本是否具有總體代表性,抽樣是否存在系統(tǒng)偏差等。u(1)程序:分析(analyze)-描述統(tǒng)計(jì)(descriptive)-頻數(shù)(frequency)u(2)選擇一個(gè)或多個(gè)頻數(shù)分析變量放進(jìn)變量框中u(3)選中右下角顯示頻數(shù)表格u(4)點(diǎn)擊統(tǒng)計(jì)量、圖表、格式依次進(jìn)行設(shè)置源變量框源變量框待分析變量待分析變量要求輸出頻數(shù)分析表格要求輸出頻數(shù)分析表格選擇統(tǒng)計(jì)量選擇統(tǒng)計(jì)量選擇圖表選擇圖表選擇輸出格式選擇輸出

2、格式 制作頻數(shù)分布表(頻數(shù)、百分比):以表格形式呈現(xiàn)各個(gè)數(shù)據(jù)的次數(shù)分布情況,包括頻數(shù)、百分比,有效百分比、累計(jì)百分比。 百分位百分位數(shù)選項(xiàng)數(shù)選項(xiàng)第第2525、5050、7575個(gè)百分個(gè)百分位數(shù)點(diǎn)對(duì)位數(shù)點(diǎn)對(duì)應(yīng)的變量應(yīng)的變量值值把數(shù)值平均把數(shù)值平均分為分為n n份,每份,每個(gè)等分位點(diǎn)個(gè)等分位點(diǎn)對(duì)應(yīng)的變量對(duì)應(yīng)的變量值值(2n1002n100)指定輸出指定輸出多個(gè)百分多個(gè)百分位數(shù)位數(shù)數(shù)據(jù)分布形態(tài)的偏數(shù)據(jù)分布形態(tài)的偏斜度和方向斜度和方向數(shù)據(jù)分布形態(tài)的陡數(shù)據(jù)分布形態(tài)的陡緩程度緩程度離散離散趨勢(shì)趨勢(shì)測(cè)量測(cè)量集中趨勢(shì)測(cè)量集中趨勢(shì)測(cè)量對(duì)于分組數(shù)據(jù),計(jì)算百分位數(shù)值對(duì)于分組數(shù)據(jù),計(jì)算百分位數(shù)值和中位數(shù)時(shí),用各組的組

3、中值代和中位數(shù)時(shí),用各組的組中值代表各組數(shù)據(jù)。表各組數(shù)據(jù)。分位數(shù)是變量在不同分位點(diǎn)上的取值,從一個(gè)側(cè)面清楚地刻畫了變量的取值分布狀態(tài)。分位數(shù)差是一種描述數(shù)據(jù)離散程度的方式。分位數(shù)差越大,表示數(shù)據(jù)在相應(yīng)分位段上的離散程度越大。 是描述某變量所有取值的分布形態(tài)陡緩程度的統(tǒng)計(jì)量,是描述某變量所有取值的分布形態(tài)陡緩程度的統(tǒng)計(jì)量,而峰度對(duì)陡緩程度的度量是與正態(tài)分布進(jìn)行比較的結(jié)果。如果峰度等于而峰度對(duì)陡緩程度的度量是與正態(tài)分布進(jìn)行比較的結(jié)果。如果峰度等于0 0 ,其數(shù)據(jù)分布的陡緩程度與正態(tài)分布相同;峰度大于其數(shù)據(jù)分布的陡緩程度與正態(tài)分布相同;峰度大于0 0,其數(shù)據(jù)分布比正態(tài)分布,其數(shù)據(jù)分布比正態(tài)分布更陡峭

4、;峰度小于更陡峭;峰度小于0 0,其數(shù)據(jù)分布比正態(tài)分布更平坦,其數(shù)據(jù)分布比正態(tài)分布更平坦。是描述數(shù)據(jù)分布對(duì)稱性的統(tǒng)計(jì)量,而且也是與正態(tài)分布的是描述數(shù)據(jù)分布對(duì)稱性的統(tǒng)計(jì)量,而且也是與正態(tài)分布的對(duì)稱性相比較而得到的。如果分布的偏度等于對(duì)稱性相比較而得到的。如果分布的偏度等于0 0 ,則其數(shù)據(jù)分布的對(duì)稱性與,則其數(shù)據(jù)分布的對(duì)稱性與正態(tài)分布相同;如果偏度大于正態(tài)分布相同;如果偏度大于0 0,則其分布為正偏或右偏;如果偏度小于,則其分布為正偏或右偏;如果偏度小于0 0,則為負(fù)偏或左偏。則為負(fù)偏或左偏。集中趨勢(shì)Central tendency (一組數(shù)據(jù)向某一中心靠攏的傾向)離散趨勢(shì)Dispersion(

5、一組數(shù)據(jù)遠(yuǎn)離其中心值的程度)定類眾數(shù)Mode異眾比率V定序中位數(shù)Median四分位差Quartiles定距 定比均值Mean全距 Range方差 Variance標(biāo)準(zhǔn)差Std.deviant不同等級(jí)的變量描述性指標(biāo)不同等級(jí)的變量描述性指標(biāo)均值:均值:某變量所有取值的平均水平,其大小易受到數(shù)據(jù)中極端值的影響。眾數(shù)眾數(shù)Mode:是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù)中位數(shù)Median:一組數(shù)據(jù)按升序排序后處于中間位置的數(shù)據(jù)。均值標(biāo)準(zhǔn)誤差:均值標(biāo)準(zhǔn)誤差:是描述樣本均值與總體均值之間差異程度的統(tǒng)計(jì)量。標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:反映變量取值距離均值的平均離散程度。其值越大,變量間的差異越大。方差:方差:是標(biāo)準(zhǔn)差的

6、平方,反映變量取值離散程度。其值越大,變量間的差異越大。全距全距range:也稱為極差,是數(shù)據(jù)最大值與最小值之間的絕對(duì)差,也是反映變量取值的離散程度。是用矩形的面積來表示頻數(shù)分布變化的圖形。適用于連續(xù)性數(shù)據(jù),適用于連續(xù)性數(shù)據(jù),即:定距數(shù)據(jù)適用于離散型數(shù)據(jù),適用于離散型數(shù)據(jù),即定序、定類和分組后的定距數(shù)據(jù)。其中,條形圖(bar chart)是用寬度相同的條形的高度或長(zhǎng)短來表示頻數(shù)分布變化的圖形;餅圖(pie chart)是用圓形或圓內(nèi)扇形的面積來表示頻數(shù)分布變化的圖形。不輸出任何圖形不輸出任何圖形輸出條形圖輸出條形圖輸出餅圖輸出餅圖直方圖直方圖輸出正態(tài)分布曲線輸出正態(tài)分布曲線居民儲(chǔ)蓄調(diào)查數(shù)據(jù)居民

7、儲(chǔ)蓄調(diào)查數(shù)據(jù)分析儲(chǔ)戶的戶口和職業(yè)的基本情況;分析儲(chǔ)戶一次存(?。┛罱痤~的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行分析比較。目標(biāo)一:被調(diào)查者的戶口和職業(yè)情況的頻數(shù)分布表和統(tǒng)計(jì)圖目標(biāo)一:被調(diào)查者的戶口和職業(yè)情況的頻數(shù)分布表和統(tǒng)計(jì)圖分析儲(chǔ)戶一次存(?。┛罱痤~的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行分析比較。分析思路:分析思路:由于存(?。┛罱痤~屬于定距型變量,直接采用頻數(shù)分析不利于對(duì)分布形態(tài)的把握。 運(yùn)用數(shù)據(jù)預(yù)處理中的數(shù)據(jù)分組功能對(duì)數(shù)據(jù)分組后再編制頻數(shù)分布表。如:將(?。┛罱痤~重新分成5組:少于500元、500-2000、2000-3500、3500-5000、5000以上。對(duì)比城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶情況,可采用數(shù)據(jù)

8、預(yù)處理中的數(shù)據(jù)拆分并計(jì)算樣本存(取)款金額的四分位數(shù)、峰度、偏度等。儲(chǔ)戶一次存(取)款金額的分布情況:儲(chǔ)戶一次存(取)款金額的分布情況:被調(diào)查者有近一半的儲(chǔ)戶一次存取款金額在500元以下,2000-3500元的最少。從圖形看來,儲(chǔ)戶的存(?。┛罱痤~呈明顯的右偏分布,即一次存取款金額偏低的占較大比例,也有少數(shù)金額偏高的儲(chǔ)戶。城鎮(zhèn)和農(nóng)村居民儲(chǔ)戶一次存(?。┛罱痤~的比較:城鎮(zhèn)和農(nóng)村居民儲(chǔ)戶一次存(取)款金額的比較:從均值以及四分位數(shù)差可以看出城鎮(zhèn)儲(chǔ)戶存取款金額的離散度大于農(nóng)村儲(chǔ)戶(尤其在高金額區(qū)),且城鎮(zhèn)儲(chǔ)戶的存取款金額高于農(nóng)村儲(chǔ)戶。一是刻畫集中趨勢(shì)的描述統(tǒng)計(jì)量;二是刻畫離散程度的描述統(tǒng)計(jì)量;三是刻

9、畫分布形態(tài)的描述統(tǒng)計(jì)量。通過以上三類統(tǒng)計(jì)量能較為準(zhǔn)確地把握數(shù)據(jù)的分布特點(diǎn)。 (1)程序:分析(analyze)-描述統(tǒng)計(jì)(descriptive statistics)-描述(descriptive) (2)選擇要描述的一個(gè)或多個(gè)數(shù)值型變量 (3)點(diǎn)擊選項(xiàng)按鈕,做二級(jí)對(duì)話框設(shè)置 (4)選中右下角標(biāo)準(zhǔn)化得分保存為變量可將數(shù)據(jù)標(biāo)準(zhǔn)化后的取值保存到數(shù)據(jù)文檔中。對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化 ,并作,并作為新變量保存在文件中。為新變量保存在文件中。uxiiZ居民儲(chǔ)蓄調(diào)查數(shù)據(jù)居民儲(chǔ)蓄調(diào)查數(shù)據(jù)計(jì)算存(?。┛罱痤~的基本描述統(tǒng)計(jì)量,并分別對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行比較;分析儲(chǔ)戶一次存(?。┛罱痤~的數(shù)量是否存在不均衡現(xiàn)

10、象。城鎮(zhèn)儲(chǔ)戶的平均存取款金額(2687.2)高于農(nóng)村儲(chǔ)戶(1944.97);從標(biāo)準(zhǔn)差及全距可看出,城鎮(zhèn)儲(chǔ)戶存取款金額的離散程度低于農(nóng)村儲(chǔ)戶。從峰度和偏度看來,城鎮(zhèn)和農(nóng)村儲(chǔ)戶存取款金額的分布均呈現(xiàn)右偏和尖峰分布,只是農(nóng)村儲(chǔ)戶右偏斜程度及尖峰程度更大;總體而言,城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶中的大部分人一次存取款金額都低于平均水平,且農(nóng)村儲(chǔ)戶表現(xiàn)得更為明顯。分析儲(chǔ)戶一次存(?。┛罱痤~的數(shù)量是否存在不均衡現(xiàn)象是否存在不均衡現(xiàn)象, 可以從分析金額是入手。一般而言,若儲(chǔ)戶存取款金額服從正態(tài)分布,那么根據(jù)3準(zhǔn)則(3個(gè)標(biāo)準(zhǔn)差準(zhǔn)則),異常值通常為3個(gè)標(biāo)準(zhǔn)差之外的變量值??赏ㄟ^數(shù)據(jù)的標(biāo)準(zhǔn)化處理來判斷。(先標(biāo)準(zhǔn)化,再依據(jù)標(biāo)準(zhǔn)

11、化值分組,后用頻數(shù)分析)從頻數(shù)分析可得,低異常組占比0%,高異常組占比2.6%。一般認(rèn)為異常組的總比例大于理論值0.3%,可以認(rèn)為存取款金額存在一定的不均衡現(xiàn)象。主要包括兩大基本任兩大基本任務(wù)務(wù):根據(jù)收集到樣本數(shù)據(jù)產(chǎn)生交叉列聯(lián)表;在交叉列聯(lián)表的基礎(chǔ)上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。分析(analyze)-描述統(tǒng)計(jì)(descriptive statistics)-交叉表(cross table)行變量(自變量)的選取行變量(自變量)的選取列變量(因變量)的選取列變量(因變量)的選取顯示每組變量的條形分類圖顯示每組變量的條形分類圖相關(guān)統(tǒng)

12、計(jì)量的相關(guān)統(tǒng)計(jì)量的計(jì)算計(jì)算輸出表格的形式輸出表格的形式表格排列順序表格排列順序分層變量(控制變量)的選取分層變量(控制變量)的選取不輸出列聯(lián)表不輸出列聯(lián)表測(cè)量級(jí)別相關(guān)系數(shù)取值范圍PRE意義檢驗(yàn)方法SPSS程序類-類(類-序)0.12 crosstabs序-序G/ rs-1.1G/rs2T檢驗(yàn)Crosstabs/correlation類序-距(3)E/E20.1E2F檢驗(yàn)crosstabs/Oneway/means距-距r-1.1r2T檢驗(yàn)crosstabs/correlation/linear相關(guān)分析的概念相關(guān)分析的概念定類變量定類變量定序變量定序變量E E系數(shù)系數(shù)類距類距G相關(guān)相關(guān)進(jìn)行分層卡

13、方檢驗(yàn)進(jìn)行分層卡方檢驗(yàn)得到相對(duì)風(fēng)險(xiǎn)測(cè)評(píng)的得到相對(duì)風(fēng)險(xiǎn)測(cè)評(píng)的OROR值值選中進(jìn)行配對(duì)卡方檢驗(yàn)選中進(jìn)行配對(duì)卡方檢驗(yàn)一致性檢驗(yàn)。(行列變量的數(shù)目相一致性檢驗(yàn)。(行列變量的數(shù)目相同)同)當(dāng)KappaKappa0.750.75時(shí),表明兩者一致性較好;0.750.75Kappa Kappa 0.40.4時(shí),表明一致性一般;KappaKappa2000時(shí),結(jié)果以kolmogorov-smimov 為準(zhǔn)。測(cè)量級(jí)別相關(guān)系數(shù)取值范圍PRE意義檢驗(yàn)方法SPSS程序類-類(類-序)0.12 crosstabs序-序G/ rs-1.1G/rs2T檢驗(yàn)Crosstabs/correlation類序-距(3)E/E20.1

14、E2F檢驗(yàn)crosstabs/Oneway/means距-距r-1.1r2T檢驗(yàn)crosstabs/correlation/linear相關(guān)分析的要點(diǎn):相關(guān)方向、相關(guān)程度及線性與否PearsonPearson簡(jiǎn)單相關(guān)系數(shù):用來度量簡(jiǎn)單相關(guān)系數(shù):用來度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)系。顯示相應(yīng)顯著度水平顯示相應(yīng)顯著度水平Kendall Kendall 相關(guān)系數(shù):采用非參數(shù)檢驗(yàn)方相關(guān)系數(shù):采用非參數(shù)檢驗(yàn)方法度量法度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)系。SpearmanSpearman等級(jí)相關(guān)系數(shù):用來度量等級(jí)相關(guān)系數(shù):用來度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)

15、系。6.1 6.1 兩個(gè)變量間的相關(guān)性分析兩個(gè)變量間的相關(guān)性分析程序:程序:分析(analyze)相關(guān)(correlate)雙變量(bivariate)剔除正在參與運(yùn)算的2個(gè)變量值是缺失值的觀測(cè)量剔除所有參與運(yùn)算變量中帶有缺失值的觀測(cè)量 高??蒲醒芯繑?shù)據(jù)資料搜集了1999年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究的數(shù)據(jù)。研究立項(xiàng)課題數(shù)(當(dāng)年)、與投入的具有高級(jí)職稱的人數(shù)(上年) 、發(fā)表論文數(shù)(上年)是否有較強(qiáng)的線性關(guān)系;在5%的水平下,當(dāng)年的立項(xiàng)課題總數(shù)將受到上年投入高級(jí)職稱的人數(shù)、論文數(shù)的正向影響運(yùn)用居民存取款數(shù)據(jù)分析不同年齡段與收入水平的相關(guān)關(guān)系。在5%的水平下,收入水平會(huì)隨著年齡的增長(zhǎng)而增長(zhǎng)(二者有較弱的正向相關(guān)關(guān)系)問題:相關(guān)系數(shù)本身未必是兩事物間線性相關(guān)強(qiáng)弱的正式體現(xiàn),往往有夸大的趨勢(shì)。6.2 6.2 兩個(gè)變量間的偏相關(guān)性分析兩個(gè)變量間的偏相關(guān)性分析又稱為凈相關(guān)分析凈相關(guān)分析,它是在控制其他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論