第2講描述性統(tǒng)計

上傳人：a*** IP屬地：湖北上傳時間：2023-02-05 格式：PPT 頁數(shù)：50 大?。?.53MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩45頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

SPSS統(tǒng)計軟件姓名:曹玉茹電話:67703852E-mail:caoyuru2003@答疑地點:學(xué)院樓B418答疑時間:商務(wù)信息學(xué)院計算機教學(xué)部上節(jié)回顧一、數(shù)據(jù)的編碼、錄入與整理二、數(shù)據(jù)問卷與編碼三、編碼類型四、缺失值的處理五、數(shù)據(jù)處理中的操作術(shù)語六、定義變量七、數(shù)據(jù)的錄入八、數(shù)據(jù)的導(dǎo)入九、數(shù)據(jù)的整理分值轉(zhuǎn)換、量表統(tǒng)分、排序、限選、加權(quán)、計數(shù)、合并于聚合第2講

描述性統(tǒng)計分析一、描述性統(tǒng)計分析概念目的通過變量的描述性統(tǒng)計分析，能夠掌握和了解樣本數(shù)據(jù)的統(tǒng)計特征和總體分布形態(tài)，進而更深入地揭示變量變化的統(tǒng)計規(guī)律。方法

數(shù)據(jù)計算：計算常見的描述性統(tǒng)計量的值，準(zhǔn)確反映樣本數(shù)據(jù)的統(tǒng)計特征。

圖形繪制：繪制常見的統(tǒng)計圖形，通過圖形來直觀展現(xiàn)數(shù)據(jù)的分布特征，比較

數(shù)據(jù)分布的異同。

通常，兩種方法混合使用。SPSS軟件中相關(guān)的7種功能頻數(shù)分析（Frenquencies）：描述統(tǒng)計量（Descriptives）：探索性分析（Explore）：交叉列聯(lián)表（Crosstabs）：比率分析（Ratio）：P-P圖Q-Q圖

頻數(shù)分析二、頻數(shù)分析概念統(tǒng)計的是每一組中觀測點的個數(shù)，而不考慮其實際取值。了解變量取值的一般特征。如，哪些數(shù)值出現(xiàn)的頻率高？變量取值的大致范圍是什么？考察數(shù)據(jù)是否符合要進行的統(tǒng)計分析的假設(shè)。如：樣本數(shù)足夠大嗎？每個變量的觀測值是否合理呢？評估數(shù)據(jù)的質(zhì)量。如，有多少缺失值或者有多少數(shù)據(jù)錄入錯誤？二、頻數(shù)分析SPSS中的頻數(shù)分布表

頻數(shù)分析的基本功能之一：是編制頻數(shù)分布表，以下是幾個頻數(shù)分析時常用的概念：頻數(shù)（Frenquency）：變量值落在某個區(qū)間或者某個取值點的個數(shù)。百分比（Percent）：各頻數(shù)占總樣本數(shù)的百分比。有效百分比（ValidPercent）：各頻數(shù)占有效樣本數(shù)的百分比。累計百分比（CumulativePercent）：各百分比逐級累加起來的結(jié)果，最終取值是100。取值不及格及格中等良好優(yōu)秀合計取值區(qū)間0-5960-6970-7980-8990-1000－100頻數(shù)1919321677百分比1.30%11.69%24.68%41.56%20.78%100.00%累計百分比1.30%12.99%37.66%79.22%100.00%100.00%二、頻數(shù)分析頻數(shù)分析中的統(tǒng)計圖

頻數(shù)分析的基本功能之二：是繪制統(tǒng)計圖，統(tǒng)計圖能非常清晰直觀地展示變量的取值狀況，包括以下三種圖：條形圖（BarChart）：餅圖（PieChart）：直方圖（Histograms）：條形圖與直方圖區(qū)別條形圖1.用條形的長度表示各類別頻數(shù)的多少，其寬度是固定的2.各矩形通常是分開排列的；3.主要用于展示分類數(shù)據(jù)。直方圖1.用面積表示各組頻數(shù)的多少，矩形的高度表示每一組的頻數(shù)或頻率寬度表示各組的組距；2.由于分組數(shù)據(jù)具有連續(xù)性，各矩形通常是連續(xù)排列；3.主要用于展示數(shù)值型數(shù)據(jù)。二、頻數(shù)分析SPSS操作及案例例一：各門成績統(tǒng)計結(jié)果保存為：3-StudentScore.spo二、頻數(shù)分析SPSS操作及案例（數(shù)據(jù)文件：3－StudentScore.sav）Analyze→DescriptiveStatistics→Frequencies…SPSS操作及案例（數(shù)據(jù)文件：3－StudentScore.sav）例二：語文成績區(qū)間頻度分布表

步驟1：對“語文”成績進行分段Transform→RecodeIntoDifferentVariables…

（結(jié)果保存為：3-StudentScore_成績分段.sav）

二、頻數(shù)分析二、頻數(shù)分析SPSS操作及案例步驟2：對“分?jǐn)?shù)分段”進行統(tǒng)計Analyze→DescriptiveStatistics→Frequencies…二、頻數(shù)分析SPSS操作及案例

二、頻數(shù)分析SPSS操作及案例輸出三門成績的均值、標(biāo)準(zhǔn)差

極差及4分位數(shù)

基本描述統(tǒng)計量三、基本描述統(tǒng)計量概念

通過頻數(shù)分析對數(shù)據(jù)的總體分布狀況有了基本了解之后，通常還需要對定距變量的分布特征有更為精確的認(rèn)識，這就需要通過計算基本描述統(tǒng)計量等途徑來實現(xiàn)。

常見的描述統(tǒng)計量大致可以分為三類：第一類：描述集中趨勢(CentralTendency)的統(tǒng)計量第二類：描述離散趨勢(Dispersion)的統(tǒng)計量第三類：描述分布形態(tài)(Distribution)的統(tǒng)計量變量的值之間可以比較大小，兩個值的差有實際意義，這樣的變量叫定距變量。在調(diào)查被訪者的“年齡”和“每月平均收入”，都是定距變量。三、基本描述統(tǒng)計量描述集中趨勢的統(tǒng)計量指一組數(shù)據(jù)向某一中心集中的程度，即在某一中心附近觀測值數(shù)目較多，遠(yuǎn)離該中心的觀測值數(shù)目較少。有如下統(tǒng)計量：

平均值（Mean）：即算術(shù)平均值（＝（X1+X2+…+Xn）/n）。

易受極端值影響。

中位數(shù)（Median）：把變量的值有序排列，位于中間位置的值即中位數(shù)。

是位置平均置，不易受極端值的影響。

眾數(shù)（Mode）：樣本中出現(xiàn)次數(shù)最多的值，代表數(shù)據(jù)的集中程序。

求和（Sum）：所有變量之和，反映變量的總體水平。三、基本描述統(tǒng)計量描述離散趨勢的統(tǒng)計量與“集中趨勢”相反，“離散趨勢”反映的是一組資料中各個觀察值之間的差異或離散程度。即考察所有數(shù)據(jù)相對于“中心值”分布的疏密程度。有如下統(tǒng)計量：方差（Variance）：

樣本方差越大，說明變量值之間的差異越大，樣本方差沒有單位。標(biāo)準(zhǔn)差（std.deviation）：

樣本標(biāo)準(zhǔn)差越大，說明變量的觀測值之間

的差異越大，距離均值這個“中心”的離散程

度越大。三、基本描述統(tǒng)計量描述離散趨勢的統(tǒng)計量極差（Range）：也稱全距或跨度或范圍，R＝最大值－最小值

極差不考慮最大值與最小值之間的觀測值，僅僅依靠端點值來確定，因而穩(wěn)定性差。

最小值（Minimum）：一組資料中各個觀測值的最小者。最大值（Maximum）：一組資料中各個觀測值的最大者。均值標(biāo)準(zhǔn)誤差（S.E.Mean,StandardErrorofMean，簡稱標(biāo)準(zhǔn)誤）：樣本數(shù)據(jù)是從總體數(shù)據(jù)中抽取出來的。雖然在一定程度上，樣本數(shù)據(jù)可以反映總體數(shù)據(jù)的特征。但在不同次抽樣中所得的樣本均值是不同的，并且它們與總體均值間存在差異。均值標(biāo)準(zhǔn)誤差就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計量。即：樣本均值的標(biāo)準(zhǔn)差。三、基本描述統(tǒng)計量描述分布形態(tài)的統(tǒng)計量

考察數(shù)據(jù)分布形態(tài)特征的統(tǒng)計量，例如，數(shù)據(jù)分布是否對稱、偏斜程度以及陡緩程度，主要有如下兩種統(tǒng)計量：偏度（Skewness）：

偏度值>0，為正偏或右偏；偏度值<0，為負(fù)偏或左偏。偏度絕對值越大，偏斜越大。峰度（Kurtosis）：

峰度值>0，數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭，為尖峰分布；峰度值<0，數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更平緩，為平峰分布。三、基本描述統(tǒng)計量SPSS操作及案例分析（數(shù)據(jù)文件：3－StudentScore.sav）

例三：計算全部學(xué)生各門成績的平均值、標(biāo)準(zhǔn)差、最大值和最小值，并考察學(xué)生成績的分布形態(tài)。三、基本描述統(tǒng)計量SPSS操作及案例分析

數(shù)據(jù)文件：3－StudentScore.sav

Analyze→DescriptiveStatistics→Descriptives…

探索性分析四、探索性分析概念

數(shù)據(jù)探索是統(tǒng)計分析中非常重要的一步，可以幫助我們決定選擇哪種統(tǒng)計方法進行數(shù)據(jù)分析，有如下三方面的考察：（1）考察數(shù)據(jù)的正確性

考察數(shù)據(jù)中的一些異常值，分析這些值產(chǎn)生的原因，判斷其正確性，再決定修改、刪除或保留它們。（2）考察數(shù)據(jù)的分布特征

考察數(shù)據(jù)的正態(tài)分布特征可以為以后進行統(tǒng)計分析時采用正確的統(tǒng)計方法提供正確的依據(jù)。（3）考察變量之間數(shù)據(jù)的相互關(guān)系

變量與變量之間相關(guān)性的考察、方差齊性的考察，是一些統(tǒng)計分析過程必須事先了解的。四、探索性分析通過莖葉圖（Stem-and-LeafPlots）描述頻度分布例四：

數(shù)據(jù)文件：3－StudentScore.sav

莖葉圖由數(shù)字構(gòu)成，表達(dá)變量的頻數(shù)分布。Analyze→DescriptiveStatistics→Explore…

例如，語文成績莖葉圖。

通過箱圖（Boxplots）描述數(shù)據(jù)分布箱圖也稱為箱線圖(箱式圖)，顯示了變量數(shù)據(jù)的中位數(shù)、25%百分位數(shù)和75%百分位數(shù)，并給出偏離總體分布的奇異個案和極端個案。四、探索性分析通過箱圖（Boxplots）描述數(shù)據(jù)分布

四、探索性分析通過箱圖（Boxplots）描述數(shù)據(jù)分布

語文成績箱圖四、探索性分析通過箱圖（Boxplots）描述數(shù)據(jù)分布

（數(shù)據(jù)文件：3－StudentScore.sav）四、探索性分析四、探索性分析通過正態(tài)分布檢驗的Q－Q概率圖描述數(shù)據(jù)分布的正態(tài)性(有兩種)

（1）正態(tài)概率圖以變量（語文成績）的觀測值為X軸坐標(biāo)，以該變量分布的Z分?jǐn)?shù)為縱坐標(biāo)。斜線為正態(tài)分布的Z分?jǐn)?shù)的期望標(biāo)準(zhǔn)線，若觀測點離線越近，表示點越符合正態(tài)分布。反之，越不符合正態(tài)分布。四、探索性分析通過正態(tài)分布檢驗的Q－Q概率圖描述數(shù)據(jù)分布的正態(tài)性

（2）反趨勢正態(tài)概率圖也是以變量（語文成績）的觀測值為X軸坐標(biāo)，以該變量分布的Z分?jǐn)?shù)與正態(tài)分布期望值的偏差為縱坐標(biāo)。水平直線為期望標(biāo)準(zhǔn)線，若觀測點離線越近，表示該點越符合正態(tài)分布。反之，越不符合正態(tài)分布。四、探索性分析通過正態(tài)分布檢驗的Q－Q概率圖描述數(shù)據(jù)分布的正態(tài)性（數(shù)據(jù)文件：3－StudentScore.sav）Analyze→DescriptiveStatistics→Explore…四、探索性分析四、探索性分析SPSS操作及案例分析例五：按照書上要求完成案例（數(shù)據(jù)文件：4－Explore.sav）考察學(xué)生“英語”、“數(shù)學(xué)”、“語文”三門課程成績的分布、極端值以及正態(tài)分布性和方差的齊性。以語文為例：四、探索性分析SPSS操作及案例分析箱圖四、探索性分析SPSS操作及案例分析

正態(tài)概率圖反趨勢正態(tài)概率圖

四、探索性分析SPSS操作及案例分析

從K－S檢驗以及S－W檢驗兩種方法的Sig.值看，均大于0.05，表明三門課程成績按男女分開的樣本都是正態(tài)分布的。四、探索性分析SPSS操作及案例分析

根據(jù)方差齊性檢驗結(jié)果可以看出，語文成績按照男女分開的樣本顯著性水平Sig.值都大于0.05，表明方差的差異不顯著，也就是說方差是齊性的。四、探索性分析SPSS操作及案例分析

例五：操作步驟（數(shù)據(jù)文件：4－Explore.sav）

Analyze→DescriptiveStatistics→Explore...

交叉列聯(lián)表分析五、交叉列聯(lián)表分析概念

通過頻數(shù)分析，能夠掌握單個變量的數(shù)據(jù)分布情況。

實際情況，還要了解和分析多個變量不同取值下的分布，掌握多變量的聯(lián)合分布特征，進而分析變量之間的相互影響和關(guān)系。例如：年齡段和成績水平之間的關(guān)系

本節(jié)主要講交叉列聯(lián)表分析，它包括如下兩大基本任務(wù)：

五、交叉列聯(lián)表分析根據(jù)樣本數(shù)據(jù)，產(chǎn)生二維或多維交叉列聯(lián)表

交叉列聯(lián)表是兩個或兩個以上的變量交叉分組后形成的頻數(shù)分布表。例如，一個二維交叉列聯(lián)表，反映了不同年齡段和成績水平交叉分組下的分?jǐn)?shù)頻數(shù)分布情況。例六：數(shù)據(jù)文件：4-crosstabulation1.sav數(shù)據(jù)格式：如圖（部分

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第2講描述性統(tǒng)計

文檔簡介

溫馨提示

最新文檔

評論

第2講 描述性統(tǒng)計

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第2講描述性統(tǒng)計