描述性統(tǒng)計(jì)分析_第1頁(yè)
描述性統(tǒng)計(jì)分析_第2頁(yè)
描述性統(tǒng)計(jì)分析_第3頁(yè)
描述性統(tǒng)計(jì)分析_第4頁(yè)
描述性統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于描述性統(tǒng)計(jì)分析本章學(xué)習(xí)目標(biāo):掌握數(shù)據(jù)分析項(xiàng)目的整個(gè)過(guò)程;掌握數(shù)據(jù)的分類(lèi)方法;掌握對(duì)數(shù)據(jù)進(jìn)行描述的圖形化方法和數(shù)值方法;學(xué)習(xí)分析數(shù)據(jù)分布的方法;掌握應(yīng)用SPSS進(jìn)行描述性數(shù)據(jù)分析的方法;掌握常用統(tǒng)計(jì)圖形的繪制方法和解釋技巧

第2頁(yè),共59頁(yè),2024年2月25日,星期天前言:描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)統(tǒng)計(jì)學(xué)分為描述性統(tǒng)計(jì)分析和推斷性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)應(yīng)用分類(lèi)、制表、圖形以及概括性數(shù)據(jù)指標(biāo)來(lái)概括數(shù)據(jù)分布特征的方法。結(jié)論不能推及總體。

推斷性統(tǒng)計(jì)推斷性統(tǒng)計(jì)分析得到的結(jié)論適用于總體。第3頁(yè),共59頁(yè),2024年2月25日,星期天統(tǒng)計(jì)量統(tǒng)計(jì)分析往往是從了解數(shù)據(jù)的基本特征開(kāi)始的。統(tǒng)計(jì)上,需要把樣本數(shù)據(jù)所含信息進(jìn)行概括、融合和抽象,從而得到反映樣本數(shù)據(jù)的綜合指標(biāo),這些指標(biāo)稱(chēng)為統(tǒng)計(jì)量。第4頁(yè),共59頁(yè),2024年2月25日,星期天描述性統(tǒng)計(jì)分析指標(biāo)統(tǒng)計(jì)量可分為兩類(lèi)一類(lèi)表示數(shù)據(jù)的中心位置,例如均值、中位數(shù)、眾數(shù)等一類(lèi)表示數(shù)據(jù)的離散程度,例如方差、標(biāo)準(zhǔn)差、極差等用來(lái)衡量個(gè)體偏離中心的程度。

第5頁(yè),共59頁(yè),2024年2月25日,星期天3.1頻率分析功能:頻率分析主要通過(guò)頻率分布表、條形圖和直方圖,以及集中趨勢(shì)和離散趨勢(shì)的各種統(tǒng)計(jì)量來(lái)描述數(shù)據(jù)的分布特征第6頁(yè),共59頁(yè),2024年2月25日,星期天頻率分析意義意義:SPSS的頻數(shù)分析過(guò)程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通過(guò)頻數(shù)分析,我們可以得到詳細(xì)的頻數(shù)表以及平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計(jì)量,還可以通過(guò)分析得到合適的統(tǒng)計(jì)圖。所以進(jìn)行頻數(shù)分析不僅可以方便地對(duì)數(shù)據(jù)按組進(jìn)行歸類(lèi)整理,還可以對(duì)數(shù)據(jù)的分布特征形成初步的認(rèn)識(shí)。第7頁(yè),共59頁(yè),2024年2月25日,星期天頻率分析術(shù)語(yǔ)頻率

對(duì)于定性觀測(cè)值時(shí),把它們按照某種原則分成一些組,每個(gè)觀測(cè)值必須落入一個(gè)類(lèi)并且只能夠落入一個(gè)類(lèi)中。對(duì)于給定的類(lèi),落入這個(gè)類(lèi)的個(gè)案數(shù)稱(chēng)為頻率

落入該類(lèi)中的個(gè)案數(shù)和個(gè)案總數(shù)的比例稱(chēng)為相對(duì)頻率第8頁(yè),共59頁(yè),2024年2月25日,星期天案例數(shù)據(jù)文件EmployData.sav記錄了某公司職工的基本信息,例如性別、民族、出生日期、教育水平、工資水平、工作年限等。教育水平為分類(lèi)變量,它有11個(gè)類(lèi)別。

第9頁(yè),共59頁(yè),2024年2月25日,星期天SPSS頻率分析選擇【分析】→【描述統(tǒng)計(jì)】→【頻率】

第10頁(yè),共59頁(yè),2024年2月25日,星期天頻率分析選項(xiàng)-統(tǒng)計(jì)量第11頁(yè),共59頁(yè),2024年2月25日,星期天頻率分析選項(xiàng)-圖表第12頁(yè),共59頁(yè),2024年2月25日,星期天頻率分析的結(jié)果解釋頻率表格條形圖、直方圖第13頁(yè),共59頁(yè),2024年2月25日,星期天當(dāng)堂練習(xí)-頻率分析實(shí)例案例3.1身高數(shù)據(jù)給出了河南省某學(xué)校50名高二學(xué)生的身高。試分析該50名學(xué)生的身高分布特征,計(jì)算平均值、最大值、最小值、標(biāo)準(zhǔn)差等統(tǒng)計(jì)量,并繪制頻數(shù)表、直方圖。第14頁(yè),共59頁(yè),2024年2月25日,星期天3.2中心趨勢(shì)的描述均值(尺度數(shù)據(jù)和定序數(shù)據(jù))中位數(shù)(尺度數(shù)據(jù)和定序數(shù)據(jù))眾數(shù)(定性數(shù)據(jù)和尺度數(shù)據(jù))5%截尾均值(尺度數(shù)據(jù)和定序數(shù)據(jù))

第15頁(yè),共59頁(yè),2024年2月25日,星期天均值均值即數(shù)據(jù)的算術(shù)平均數(shù),是數(shù)據(jù)中心趨勢(shì)的主要度量指標(biāo),設(shè)變量有n個(gè)測(cè)量值,則算術(shù)均值為:第16頁(yè),共59頁(yè),2024年2月25日,星期天均值的特點(diǎn)最常用的中心位置度量受極端值影響例:1,3,5,7,9和

1,3,5,7,14第17頁(yè),共59頁(yè),2024年2月25日,星期天中位數(shù)重要的中心位置度量在遞增排序后的數(shù)據(jù)列中若數(shù)據(jù)個(gè)數(shù)為奇數(shù),中位數(shù)是正中央的數(shù)若數(shù)據(jù)個(gè)數(shù)是偶數(shù),中位數(shù)是正中央的兩數(shù)的平均值.不受極端值的影,例如:1,5,7,3,9第18頁(yè),共59頁(yè),2024年2月25日,星期天眾數(shù)發(fā)生頻數(shù)最高的數(shù)據(jù)值不受極端值的影響眾數(shù)可能不存在可能有多個(gè)眾數(shù)(單峰,雙峰,多峰)可用于定量或定性數(shù)據(jù)第19頁(yè),共59頁(yè),2024年2月25日,星期天5%截尾均值避免了極端值的影響

第20頁(yè),共59頁(yè),2024年2月25日,星期天3.3離散趨勢(shì)的描述僅僅根據(jù)數(shù)據(jù)的中心趨勢(shì)指標(biāo)進(jìn)行決策是不夠的。例如,如果一個(gè)國(guó)家的不同家庭收入差距很少;而另一個(gè)國(guó)家的家庭收入差距很大,既存在大量的貧困家庭,也存在許多十分富有的家庭,那么即使這兩個(gè)國(guó)家的中等收入家庭的收入完全一樣,其家庭收入情況仍然完全不同。第21頁(yè),共59頁(yè),2024年2月25日,星期天例子假設(shè)我們有以下的三組觀測(cè)值:觀測(cè)A:11,12,13,16,16,17,18,21觀測(cè)B:14,15,15,15,16,16,16,17觀測(cè)C:11,11,11,12,19,20,20,20這三組觀測(cè)值的均值都是15.5,那么這三組數(shù)據(jù)是否相似呢?第22頁(yè),共59頁(yè),2024年2月25日,星期天離散趨勢(shì)第23頁(yè),共59頁(yè),2024年2月25日,星期天離散趨勢(shì)的描述極差(range)方差(Variance)標(biāo)準(zhǔn)差(S.d.)分位數(shù)(Percentage)變異指標(biāo)第24頁(yè),共59頁(yè),2024年2月25日,星期天極差極差=最大值-最小值受極端值影響較大第25頁(yè),共59頁(yè),2024年2月25日,星期天方差和標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差第26頁(yè),共59頁(yè),2024年2月25日,星期天變異系數(shù)在比較兩組數(shù)據(jù)離散程度大小時(shí),如果數(shù)據(jù)的測(cè)量尺度相差太大,直接比較二者的標(biāo)準(zhǔn)差并不合適。需要首先消除測(cè)量尺度和量綱的影響。變異系數(shù)可以剔除這些影響,其計(jì)算公式為:第27頁(yè),共59頁(yè),2024年2月25日,星期天分位數(shù)第p百分位數(shù)使得至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且使得至少有(100-p)%的數(shù)據(jù)大于或等于這個(gè)值如何計(jì)算?將原數(shù)據(jù)從小到大排列計(jì)算i=(p/100)n若i是整數(shù),則第p百分位數(shù)為第i與第i+1項(xiàng)的平均若i不是整數(shù),則向上取整。第28頁(yè),共59頁(yè),2024年2月25日,星期天總結(jié)五數(shù)最小值、第一個(gè)四分位數(shù)、中位數(shù)、第三個(gè)四分位數(shù)、最大值從這五個(gè)值可以大致看出數(shù)據(jù)分布的中心和離散程度。而箱圖則是這五個(gè)數(shù)的圖形表現(xiàn)

第29頁(yè),共59頁(yè),2024年2月25日,星期天3.4分布的形狀偏度當(dāng)偏度系數(shù)大于0時(shí),分布為正偏或右偏,布圖形在右邊拖尾,分布圖有很長(zhǎng)的右尾,尖峰偏左當(dāng)偏度系數(shù)小于0,分布為負(fù)偏或左偏,即分布圖形在左邊拖尾,分布圖有很長(zhǎng)的左尾,峰尖偏右當(dāng)偏度系數(shù)為0,分布對(duì)稱(chēng)第30頁(yè),共59頁(yè),2024年2月25日,星期天峰度峰度

>3,分布為高峰度,即比正態(tài)分布的峰要陡峭;<3,分布為低峰度,即比正態(tài)分布的峰要平坦些;=0,分布為正態(tài)峰。第31頁(yè),共59頁(yè),2024年2月25日,星期天3.5SPSS描述性統(tǒng)計(jì)許多菜單均可進(jìn)行描述性分析,提供描述性統(tǒng)計(jì)指標(biāo)的輸出。例如T檢驗(yàn)、方差分析、因子分析等SPSS自定義表模塊也可以產(chǎn)生大部分的描述性統(tǒng)計(jì)指標(biāo)第32頁(yè),共59頁(yè),2024年2月25日,星期天SPSS中的菜單專(zhuān)門(mén)的描述性統(tǒng)計(jì)菜單:頻率(F):該過(guò)程將產(chǎn)生頻數(shù)表,輸出頻數(shù)分布的條形圖、餅圖或者直方圖;描述(D):該過(guò)程則進(jìn)行一般性的統(tǒng)計(jì)描述;探索(E):該過(guò)程用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析;交叉表(C):該過(guò)程完成分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)描述和一般的統(tǒng)計(jì)檢驗(yàn),我們常用的檢驗(yàn)也包含在該對(duì)話框中。第33頁(yè),共59頁(yè),2024年2月25日,星期天頻率:實(shí)例【分析】→【描述】→【頻率】

第34頁(yè),共59頁(yè),2024年2月25日,星期天頻率:統(tǒng)計(jì)量的選擇第35頁(yè),共59頁(yè),2024年2月25日,星期天頻率:結(jié)果的解釋第36頁(yè),共59頁(yè),2024年2月25日,星期天描述性子菜單第37頁(yè),共59頁(yè),2024年2月25日,星期天當(dāng)堂練習(xí)-描述性分析實(shí)例案例3.2體重?cái)?shù)據(jù)給出了河南省某高校50名大一入學(xué)新生的體重。試對(duì)該50名學(xué)生的體重進(jìn)行描述性分析,從而了解這50名學(xué)生體重的基本特征。第38頁(yè),共59頁(yè),2024年2月25日,星期天探索子菜單【分析】→【描述統(tǒng)計(jì)】→【探索】該菜單可以對(duì)不同的組分別給出描述性統(tǒng)計(jì)量第39頁(yè),共59頁(yè),2024年2月25日,星期天探索:選擇統(tǒng)計(jì)量第40頁(yè),共59頁(yè),2024年2月25日,星期天探索:圖第41頁(yè),共59頁(yè),2024年2月25日,星期天探索:結(jié)果解釋?zhuān)?)第42頁(yè),共59頁(yè),2024年2月25日,星期天探索:結(jié)果解釋?zhuān)?)第43頁(yè),共59頁(yè),2024年2月25日,星期天當(dāng)堂練習(xí)-探索分析實(shí)例實(shí)例3.3氣溫?cái)?shù)據(jù)給出了鄭州、泰安兩城市2012年各月份的平均氣溫。試據(jù)此對(duì)兩城市平均氣溫進(jìn)行探索性統(tǒng)計(jì)分析,研究其基本特征。第44頁(yè),共59頁(yè),2024年2月25日,星期天設(shè)定表格第45頁(yè),共59頁(yè),2024年2月25日,星期天表格:摘要統(tǒng)計(jì)量設(shè)置第46頁(yè),共59頁(yè),2024年2月25日,星期天當(dāng)堂練習(xí)-列聯(lián)表分析實(shí)例數(shù)據(jù)文件EmployeeData給出了某公司職工的基本信息,據(jù)此對(duì)職工的教育水平進(jìn)行列聯(lián)表分析,研究不同性別的職工教育水平之間有無(wú)明顯的差別。第47頁(yè),共59頁(yè),2024年2月25日,星期天3.6統(tǒng)計(jì)圖進(jìn)行描述性統(tǒng)計(jì)分析定性數(shù)據(jù)條形圖餅圖帕累托圖定量數(shù)據(jù)直方圖莖葉圖箱圖第48頁(yè),共59頁(yè),2024年2月25日,星期天頻率描述-頻率->圖表?xiàng)l形圖餅圖直方圖示例:數(shù)據(jù)文件DisasterReason.sav條形圖餅圖直方圖帕累托圖第49頁(yè),共59頁(yè),2024年2月25日,星期天條形圖第50頁(yè),共59頁(yè),2024年2月25日,星期天餅圖第51頁(yè),共59頁(yè),2024年2月25日,星期天帕累托圖第52頁(yè),共59頁(yè),2024年2月25日,星期天直方圖-莖葉圖-箱圖描述性->探索直方圖莖葉圖箱圖示例:數(shù)據(jù)EmployeeData.sav直方圖莖葉圖箱圖第53頁(yè),共59頁(yè),2024年2月25日,星期天直方圖和莖葉圖第54頁(yè),共59頁(yè),2024年2月25日,星期天箱圖第55頁(yè),共59頁(yè),2024年2月25日,星期天從舊對(duì)話框作圖重新完成上面兩個(gè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論