第四章基本統(tǒng)計(jì)分析_第1頁(yè)
第四章基本統(tǒng)計(jì)分析_第2頁(yè)
第四章基本統(tǒng)計(jì)分析_第3頁(yè)
第四章基本統(tǒng)計(jì)分析_第4頁(yè)
第四章基本統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章基本統(tǒng)計(jì)分析第一頁(yè),共四十七頁(yè),編輯于2023年,星期五基本統(tǒng)計(jì)分析功能概述1.報(bào)告分析(Reports)(有興趣的自學(xué))2.描述性統(tǒng)計(jì)分析(DescriptiveStatistics)第二頁(yè),共四十七頁(yè),編輯于2023年,星期五報(bào)告分析簡(jiǎn)介:報(bào)告分析包括:

1.OLAP在線分析處理過(guò)程2.報(bào)表根據(jù)報(bào)表制作的側(cè)重點(diǎn)不同,可以分為3種:

(1)個(gè)案簡(jiǎn)明統(tǒng)計(jì)報(bào)表(CasesSummary)

(2)行形式報(bào)表(ReportSummariesinRows)

(3)列形式報(bào)表(ReportSummariesincolumns)第三頁(yè),共四十七頁(yè),編輯于2023年,星期五描述性統(tǒng)計(jì)分析

(DescriptiveStatistics)1.Frequencies頻數(shù)分析2.Descriptive描述性統(tǒng)計(jì)分析3.Explore探索分析4.Crosstabs列聯(lián)表分析5.Ratio比率分析第四頁(yè),共四十七頁(yè),編輯于2023年,星期五第五頁(yè),共四十七頁(yè),編輯于2023年,星期五第一節(jié)頻數(shù)分析一、頻數(shù)的定義頻數(shù)就是一個(gè)變量在各個(gè)變量值上取值的個(gè)案數(shù)??删幹祁l數(shù)分布表和繪制統(tǒng)計(jì)圖,把握數(shù)據(jù)分布的基本特征。二、命令

Analyze/Descriptivestatistics/Frequencies

第六頁(yè),共四十七頁(yè),編輯于2023年,星期五

Frequencies主對(duì)話框顯示頻數(shù)分布表統(tǒng)計(jì)量統(tǒng)計(jì)圖形頻數(shù)輸出的順序第七頁(yè),共四十七頁(yè),編輯于2023年,星期五輸出統(tǒng)計(jì)量對(duì)話框第八頁(yè),共四十七頁(yè),編輯于2023年,星期五Chart對(duì)話框第九頁(yè),共四十七頁(yè),編輯于2023年,星期五Format對(duì)話框按各個(gè)變量組織輸出,輸出結(jié)果將按照每個(gè)變量一張表的形式顯示按頻數(shù)的升序輸出按變量值的升序輸出統(tǒng)計(jì)表中變量的各項(xiàng)分析結(jié)果在一張表并列顯示控制頻數(shù)表輸出范圍類型的最大數(shù)目為第十頁(yè),共四十七頁(yè),編輯于2023年,星期五第十一頁(yè),共四十七頁(yè),編輯于2023年,星期五第十二頁(yè),共四十七頁(yè),編輯于2023年,星期五第十三頁(yè),共四十七頁(yè),編輯于2023年,星期五某頻次分析結(jié)果第十四頁(yè),共四十七頁(yè),編輯于2023年,星期五統(tǒng)計(jì)量分析結(jié)果第十五頁(yè),共四十七頁(yè),編輯于2023年,星期五條形圖第十六頁(yè),共四十七頁(yè),編輯于2023年,星期五餅圖(圓餅圖)第十七頁(yè),共四十七頁(yè),編輯于2023年,星期五直方圖第十八頁(yè),共四十七頁(yè),編輯于2023年,星期五第二節(jié)計(jì)算基本描述統(tǒng)計(jì)量功能:對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算均值、標(biāo)準(zhǔn)差、全距和均值標(biāo)準(zhǔn)誤差等,并可將原始數(shù)據(jù)轉(zhuǎn)換成Z分?jǐn)?shù)。調(diào)用命令:按Analyze/DescriptiveStatistics/Frequencies或者Descriptives順序單擊,打開(kāi)主對(duì)話框。第十九頁(yè),共四十七頁(yè),編輯于2023年,星期五一、均值(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)

1.定義均值表示的是某變量所有取值的集中趨勢(shì)或平均水平;中位數(shù)是把一組數(shù)據(jù)按遞增順序排列,處于中間位置上的變量值就是中位數(shù);眾數(shù)是指一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個(gè)變量值。

2.命令調(diào)用Analyze/Descriptivestatistics/Frequencies第二十頁(yè),共四十七頁(yè),編輯于2023年,星期五集中趨勢(shì)描述對(duì)話框第二十一頁(yè),共四十七頁(yè),編輯于2023年,星期五三、方差、標(biāo)準(zhǔn)差、全距、均值的標(biāo)準(zhǔn)誤差

1.定義

(1)方差是所有變量值與平均數(shù)偏差平方和的平均值。(2)標(biāo)準(zhǔn)差表示一組數(shù)據(jù)關(guān)于平均數(shù)的平均離散程度。(3)全距是數(shù)據(jù)最大值與最小值之間的絕對(duì)差。(4)均值標(biāo)準(zhǔn)誤差:描述樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。

2.命令調(diào)用Analyze/Descriptivestatistics/Frequencies

第二十二頁(yè),共四十七頁(yè),編輯于2023年,星期五描述數(shù)據(jù)離散程度第二十三頁(yè),共四十七頁(yè),編輯于2023年,星期五三、分位數(shù)

1.應(yīng)用:數(shù)據(jù)按升序排列后,找到若干個(gè)分位點(diǎn)上的值。從一個(gè)側(cè)面比較兩組數(shù)據(jù)的集中趨勢(shì)。如四分位數(shù)是將一組個(gè)案由小到大排序后,用3個(gè)點(diǎn)將全部數(shù)據(jù)分為四等份,與三個(gè)點(diǎn)上相對(duì)應(yīng)的值稱為四分位數(shù)。

2.命令調(diào)用Analyze/Descriptivestatistics/Frequencies

第二十四頁(yè),共四十七頁(yè),編輯于2023年,星期五計(jì)算分位數(shù)第二十五頁(yè),共四十七頁(yè),編輯于2023年,星期五四、峰度(Kurtosis)和偏度(Skewness)1.定義(1)峰度是描述某變量所有取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。(2)偏度也是描述數(shù)據(jù)分布形態(tài)的,它是描述某變量取值分布對(duì)稱性的統(tǒng)計(jì)量。2.命令調(diào)用Analyze/Descriptivestatistics/Frequencies第二十六頁(yè),共四十七頁(yè),編輯于2023年,星期五計(jì)算峰度和偏度第二十七頁(yè),共四十七頁(yè),編輯于2023年,星期五五、標(biāo)準(zhǔn)化Z分?jǐn)?shù)

1.定義Z分?jǐn)?shù)表示的是此變量值大于或小于平均數(shù)幾個(gè)標(biāo)準(zhǔn)差。2.命令A(yù)nalyze→DescriptiveStatistics→Descriptive第二十八頁(yè),共四十七頁(yè),編輯于2023年,星期五計(jì)算標(biāo)準(zhǔn)分第二十九頁(yè),共四十七頁(yè),編輯于2023年,星期五例題分析:

已知20個(gè)初生嬰兒的體重?cái)?shù)據(jù)如下表,對(duì)其進(jìn)行描述統(tǒng)計(jì)。27702915279529952860297030873126312546542272350342183418392126693707231025733881第三十頁(yè),共四十七頁(yè),編輯于2023年,星期五

1.打開(kāi)數(shù)據(jù)文件“嬰兒體重.sav”。打開(kāi)Descriptives主對(duì)話框,選定變量“嬰兒體重”進(jìn)入Variable欄中。2.選中Savestandardizedvaluesasvariables復(fù)選框,要求計(jì)算變量的z值,并保存結(jié)果到當(dāng)前數(shù)據(jù)集中。3.單擊Options按鈕,選中Mean、Std.Deviation、Minimum、Maximum項(xiàng)。操作步驟:第三十一頁(yè),共四十七頁(yè),編輯于2023年,星期五嬰兒體重的描述統(tǒng)計(jì)量第三十二頁(yè),共四十七頁(yè),編輯于2023年,星期五這時(shí)打開(kāi)原數(shù)據(jù)集,可看到多了一列“z嬰兒體”,這是“嬰兒體重”的z分?jǐn)?shù),如下圖所示:第三十三頁(yè),共四十七頁(yè),編輯于2023年,星期五第三節(jié)探索分析一、定義調(diào)用此過(guò)程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述;有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。故稱為探索分析。二、命令

AnalyzeDescriptiveStatisticsExplore第三十四頁(yè),共四十七頁(yè),編輯于2023年,星期五Explore主對(duì)話框第三十五頁(yè),共四十七頁(yè),編輯于2023年,星期五Statistics對(duì)話框輸出中心趨勢(shì)的粗略最大似然估計(jì)輸出5%、10%、25%、50%、75%、90%、95%的百分位數(shù)第三十六頁(yè),共四十七頁(yè),編輯于2023年,星期五

Explore欄中Plots對(duì)話框?yàn)槊總€(gè)因變量生成一個(gè)箱圖所有因變量生成一個(gè)箱圖生成散布—層次圖,方差齊性檢驗(yàn)轉(zhuǎn)換冪值估計(jì)第三十七頁(yè),共四十七頁(yè),編輯于2023年,星期五Explore欄中Options對(duì)話框確定缺失值的處置:因變量或分組變量中帶有缺失值的觀測(cè)量都將在分析過(guò)程中被剔除。在分析過(guò)程中根據(jù)分組變量產(chǎn)生的組中帶缺失值的觀測(cè)量都將被剔除。分組變量的缺失值被單獨(dú)分為一組,輸出頻數(shù)時(shí)將標(biāo)出缺失組。第三十八頁(yè),共四十七頁(yè),編輯于2023年,星期五例題:下表為30名10歲少兒的身高(cm)數(shù)據(jù)(略),試對(duì)其進(jìn)行探索分析。編號(hào)身高編號(hào)身高編號(hào)身高男女男女男女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.7編號(hào)身高編號(hào)身高編號(hào)身高男女男女男女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.7第三十九頁(yè),共四十七頁(yè),編輯于2023年,星期五步驟:1.打開(kāi)Explore主對(duì)話框,打開(kāi)數(shù)據(jù)文件“Explore分析.sav”選變量height進(jìn)入DependentList欄中,選sex變量進(jìn)入FactorList欄中;2.在Display欄中選擇Both項(xiàng);3.打開(kāi)Statistics對(duì)話框,選中Descriptive、M-estimators、Outliers復(fù)選項(xiàng),單擊Continue返回;4.打開(kāi)Plot對(duì)話框,選擇Boxplots欄中的Factorlevelstogether項(xiàng),選擇Descriptives欄內(nèi)的Stem-and-leaf復(fù)選項(xiàng),單擊Continue返回。單擊OK第四十頁(yè),共四十七頁(yè),編輯于2023年,星期五觀測(cè)量摘要表M估計(jì)量表第四十一頁(yè),共四十七頁(yè),編輯于2023年,星期五少兒身高的性別分組描述統(tǒng)計(jì)量第四十二頁(yè),共四十七頁(yè),編輯于2023年,星期五少兒身高的極端值第四十三頁(yè),共四十七頁(yè),編輯于2023年,星期五方差一致性檢驗(yàn)零假設(shè)是分組后的方差相等。表中四行是依據(jù)不同的統(tǒng)計(jì)量得到的檢驗(yàn),分別是基于均值、基于中位數(shù)、基于中位數(shù)及調(diào)整后的自由度和基于調(diào)整后的均值。由于其顯著值均大于0.05,不能否定零假設(shè),即可以認(rèn)為男生和女生的身高的方差是無(wú)差異的。第四十四頁(yè),共四十七頁(yè),編輯于2023年,星期五從左到右分為三部分:頻數(shù)、莖和葉。莖是整數(shù)部分,葉是小數(shù)部分,Stemwidth表示莖寬。每行的莖和葉組成的數(shù)字再乘以莖寬,即得到實(shí)際數(shù)據(jù)的近似值,實(shí)際數(shù)據(jù)中與該近似值靠近的值的個(gè)數(shù)即為頻數(shù)表示的個(gè)數(shù)。莖葉圖HIGHTStem-and-LeafPlotforSEX=1

FrequencyStem&Leaf1.0012.14.0012.89993.0013.1225.0013.555672.0014.00Stemwidth:10.00Eachleaf:1case(s)第四十五頁(yè),共四十七頁(yè),編

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論