基本描述統(tǒng)計_第1頁
基本描述統(tǒng)計_第2頁
基本描述統(tǒng)計_第3頁
基本描述統(tǒng)計_第4頁
基本描述統(tǒng)計_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基本描述統(tǒng)計第1頁,課件共62頁,創(chuàng)作于2023年2月頻數(shù)分布表利用頻數(shù)分布表可以方便地對數(shù)據(jù)按組進(jìn)行歸類整理,形成各變量的不同水平(分組)的頻數(shù)分布表及圖形,以便對各變量的數(shù)據(jù)特征和觀測量的分布狀況有一個概括的認(rèn)識;單變量頻數(shù)分布分析,可通過Frequencies頻數(shù)分布對話框(Analyze

DescriptiveStatisticsFrequencies)來具體實(shí)現(xiàn)。第2頁,課件共62頁,創(chuàng)作于2023年2月例1已知5種軟飲料購買頻數(shù)的原始記錄,分析各種飲料的頻數(shù)分布情況(數(shù)據(jù)集1)??煽诳蓸沸买T士可口可樂雪碧雪碧杏仁露可口可樂可口可樂醒目可口可樂新騎士可口可樂可口可樂雪碧可口可樂醒目可口可樂雪碧杏仁露杏仁露雪碧雪碧可口可樂可口可樂雪碧新騎士雪碧可口可樂雪碧醒目雪碧雪碧杏仁露可口可樂可口可樂杏仁露可口可樂杏仁露新騎士杏仁露可口可樂新騎士雪碧可口可樂杏仁露可口可樂醒目可口可樂醒目雪碧第3頁,課件共62頁,創(chuàng)作于2023年2月Frequencies對話框輸出頻數(shù)分布表選擇要求輸出的統(tǒng)計量設(shè)置圖形的類型及坐標(biāo)軸設(shè)置頻數(shù)表輸出格式第4頁,課件共62頁,創(chuàng)作于2023年2月四分位數(shù)將數(shù)據(jù)分為設(shè)定的相等分?jǐn)?shù)百分位數(shù)均值中位數(shù)眾數(shù)總和偏度峰度標(biāo)準(zhǔn)差方差全距最小值最大值均值標(biāo)準(zhǔn)誤Frequencies對話框第5頁,課件共62頁,創(chuàng)作于2023年2月四分位數(shù):將一組個案由小到大(或由大到?。┡判蚝?,用3個點(diǎn)將全部數(shù)據(jù)分為四等份,與3個點(diǎn)上相對應(yīng)的變量稱為四分位數(shù),分別記為Q1(第一四分位數(shù))、Q2(第二四分位數(shù))、Q3(第三四分位數(shù))。其中,Q3到Q1之間的距離又稱為四分位距(interquartilerange),記為IQR。四分位差(Quartiledeviation)為1/2IQR。百分位數(shù):將一組數(shù)據(jù)由小到大(或由大到小)排序后分割為100等份,與99個分割點(diǎn)位置上相對應(yīng)的變量稱為百分位數(shù),分別記為P1,P2,…,P99,表示1%的數(shù)據(jù)落在P1下,2%的數(shù)據(jù)落在P2下,…,99%落在P99下。四分位數(shù)、十分位數(shù)、百分位數(shù)第6頁,課件共62頁,創(chuàng)作于2023年2月峰度:描述某變量所有取值分布形態(tài)陡緩程度的統(tǒng)計量。與正態(tài)分布相比較,峰度為0表示其數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;峰度大于0表示比正態(tài)分布高峰要更加陡峭,為尖頂峰;峰度小于0表示比正態(tài)分布的高峰要平坦,為平頂峰。計算公式為偏度:描述某變量取值分布對稱性的統(tǒng)計量。與正態(tài)分布相比較,偏度為0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布偏度x相同;偏度大于0為正偏或右偏,即有一條長尾巴拖在右邊;偏度小于0表示負(fù)偏或左偏,有一條長尾拖在左邊。而偏度的絕對值數(shù)值越大表示分布形態(tài)的偏斜程度越大。計算公式為峰度、偏度第7頁,課件共62頁,創(chuàng)作于2023年2月不輸出圖形條形圖餅形圖直方圖選擇頻數(shù)表排列順序按變量值升序排列按變量值降序排列按變量值發(fā)生頻數(shù)升序排列按變量值發(fā)生頻數(shù)降序排列選擇多變量輸出表格設(shè)置控制頻數(shù)表輸出的分類數(shù)Frequencies對話框第8頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果:本例均選系統(tǒng)默認(rèn)項(xiàng)第9頁,課件共62頁,創(chuàng)作于2023年2月描述統(tǒng)計分析描述統(tǒng)計分析過程,是通過計算均值、算術(shù)和、標(biāo)準(zhǔn)差、極值、方差、均值、標(biāo)準(zhǔn)誤等統(tǒng)計量來描述樣本數(shù)據(jù)的集中趨勢、離散趨勢及分布特征;描述統(tǒng)計分析過程,可通過Descriptives對話框(Analyze

DescriptiveStatistics

Descriptives)來具體實(shí)現(xiàn)。第10頁,課件共62頁,創(chuàng)作于2023年2月序號性別年齡身高體重序號性別年齡身高體重1

2

3

4

5

6

7

8

9

101112131415男男男男男男女女女女女男男男男131313131313131313131314141414156.0155.0144.6161.5161.3158.0161.0162.0164.3144.0157.9176.1168.0164.5153.047.537.838.641.643.347.347.147.033.833.849.254.550.044.058.0161718192021222324252627282930女女女女女男男男男男女女女女女141414141415151515151515151515164.7160.5147.0153.2157.9166.0169.0170.0165.1172.0159.4161.3158.0158.6169.044.153.036.430.140.457.058.551.058.055.044.745.444.342.851.1例2已知三十名學(xué)生的身高與體重數(shù)據(jù),要求對其進(jìn)行簡單的描述統(tǒng)計分析(數(shù)據(jù)集2)。第11頁,課件共62頁,創(chuàng)作于2023年2月Descriptives對話框指定統(tǒng)計量與輸出結(jié)果顯示的順序計算并保存所選變量的標(biāo)準(zhǔn)化值,公式為第12頁,課件共62頁,創(chuàng)作于2023年2月Descriptives對話框均值合計偏度峰度標(biāo)準(zhǔn)差方差全距均值標(biāo)準(zhǔn)誤離散趨勢分布輸出順序按均值升序顯示統(tǒng)計量按均值降序顯示統(tǒng)計量按變量名字母順序顯示統(tǒng)計量按數(shù)據(jù)集中變量的排列順序顯示統(tǒng)計量第13頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果:標(biāo)準(zhǔn)化值第14頁,課件共62頁,創(chuàng)作于2023年2月探索分析探索分析是指對測得的數(shù)據(jù)進(jìn)行初步考察與核實(shí),目的是檢查數(shù)據(jù)中是否存在奇異值、影響點(diǎn)或錯誤數(shù)據(jù),判別數(shù)據(jù)分布特征,以及進(jìn)行假設(shè)檢驗(yàn)等;探索分析過程,可通過Explore對話框?qū)崿F(xiàn)(Analyze

DescriptiveStatistics

Explore),該過程要求參與分析的變量是等距測度的數(shù)值型變量,分組變量可以是數(shù)值型或是字符型。第15頁,課件共62頁,創(chuàng)作于2023年2月例3對例2中三十名學(xué)生的身高數(shù)據(jù)按性別進(jìn)行簡單的探索分析(數(shù)據(jù)集2)。選擇分析變量指定分組變量選擇標(biāo)識變量選擇輸出項(xiàng)選擇描述統(tǒng)計量設(shè)置輸出圖形指定缺失值的處理方式第16頁,課件共62頁,創(chuàng)作于2023年2月Explore對話框輸出基本描述統(tǒng)計量指定均值的置信區(qū)間輸出最大似然比的穩(wěn)健估計輸出5個最大與最小值輸出5﹪、10﹪、25﹪、50﹪、75﹪、90﹪以及95﹪的百分位數(shù)剔除帶有缺失值的觀測量同時剔除缺失值及與其有成對關(guān)系的觀測量將缺失值單列一組顯示第17頁,課件共62頁,創(chuàng)作于2023年2月Explore對話框箱圖描述圖形莖葉圖直方圖輸出正態(tài)概率與離散概率圖輸出散布-水平圖及方差齊性的Levene’s檢驗(yàn)轉(zhuǎn)換冪值估計對原始數(shù)據(jù)進(jìn)行變換不同分組的同一因變量顯示在一個箱圖中同一組的不同因變量顯示在一個箱圖中SpreadversusLevel:橫軸為各水平組的中位數(shù)及縱軸為四分位距的自然對數(shù)。Powerestimation:對原始數(shù)據(jù)進(jìn)行冪轉(zhuǎn)換,直到各組間滿足方差齊性。Transformed為原始數(shù)據(jù)轉(zhuǎn)換后,再劃圖。第18頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果(一)選項(xiàng)均為系統(tǒng)默認(rèn)第19頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果(二)箱圖莖葉圖奇異值極值IQR第20頁,課件共62頁,創(chuàng)作于2023年2月輸出身高正態(tài)概率圖(NormalQ-QPlotof身高)。男孩身高變量的正態(tài)概率圖輸出結(jié)果(三)第21頁,課件共62頁,創(chuàng)作于2023年2月女孩身高變量的正態(tài)概率圖正態(tài)分布Q-Q檢驗(yàn)圖,橫坐標(biāo)為實(shí)際觀測值按從小到大的順序排列,縱坐標(biāo)為正態(tài)分布下的期望值。如果實(shí)際觀測值取自正態(tài)分布的總體,圖中所示的落點(diǎn)應(yīng)該分布在趨勢線的附近,并且應(yīng)該表現(xiàn)出一定的集中趨勢,即平均數(shù)附近應(yīng)該聚集較多的落點(diǎn),越靠近兩個極端落點(diǎn)越少。第22頁,課件共62頁,創(chuàng)作于2023年2月輸出離散正態(tài)概率圖(DetrendedNormalQ-QPlotof身高)。以實(shí)際觀測值為橫坐標(biāo),以實(shí)際觀測值與期望值的差為縱坐標(biāo)。在符合正態(tài)分布的情況下,圖中的落點(diǎn)應(yīng)該分布在中央橫線的附近,甚至完全落到這條橫線上,而且也應(yīng)表現(xiàn)出集中在平均數(shù)周圍的趨勢。

男孩身高離散正態(tài)概率圖女孩身高離散正態(tài)概率圖第23頁,課件共62頁,創(chuàng)作于2023年2月橫坐標(biāo)為實(shí)際觀測值的累加百分比,縱坐標(biāo)為假定正態(tài)分布下的累加百分比。是否接近正態(tài)分布的判斷標(biāo)準(zhǔn)與Q-Q輸出圖相同。P-P概率圖P-PPlots輸出結(jié)果第24頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果(離散正態(tài)分布P-P概率圖)該圖描述的是正態(tài)概率圖中各點(diǎn)偏離正態(tài)直線的偏差;若數(shù)據(jù)為正態(tài)分布,各散點(diǎn)應(yīng)隨機(jī)聚集在一條通過零點(diǎn)的水平直線的周圍;說明第25頁,課件共62頁,創(chuàng)作于2023年2月Lilliefors顯著水平下,正態(tài)總體檢驗(yàn)Kolmogorov-Smirnov統(tǒng)計量,如果樣本量在3~500之間還計算Shapiro-Wilk統(tǒng)計量。輸出結(jié)果(四)第26頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果(五)Levene檢驗(yàn)對數(shù)據(jù)進(jìn)行方差齊次性檢驗(yàn)時,不強(qiáng)求數(shù)據(jù)必須服從正態(tài)分布,它先計算出各個觀測值減去組內(nèi)均值的差,然后再通過這些差值的絕對值進(jìn)行單因素方差分析。如果得到顯著性水平小于0.05,那么就可以拒絕方差相同的假設(shè)。第27頁,課件共62頁,創(chuàng)作于2023年2月列聯(lián)表列聯(lián)表是指交叉分組的多維頻數(shù)分析表,用來反映多個變量不同取值的數(shù)據(jù)分布情況、變量間的相互影響和關(guān)系等;列聯(lián)表分析過程,可通過Crosstabs對話框?qū)崿F(xiàn)(Analyze

DescriptiveStatisticsCrosstabs)。第28頁,課件共62頁,創(chuàng)作于2023年2月公司1公司2公司3公司4合計贊成68755779279反對32453331141合計10012090110420例4已知對集團(tuán)公司某項(xiàng)改革方案意見的調(diào)查結(jié)果,試分析各子公司對該項(xiàng)改革方案的態(tài)度是否一致.

第29頁,課件共62頁,創(chuàng)作于2023年2月定義變量(形成數(shù)據(jù)集3)公司company公司11公司22公司33公司446832754557337931態(tài)度attitude贊成1反對2贊成1反對2贊成1反對2贊成1反對2觀察頻數(shù)freq第30頁,課件共62頁,創(chuàng)作于2023年2月指定freq為加權(quán)變量第31頁,課件共62頁,創(chuàng)作于2023年2月Crosstabs對話框指定行變量指定列變量指定分布表的層變量顯示分類條形圖不輸出多維交叉表第32頁,課件共62頁,創(chuàng)作于2023年2月Crosstabs對話框本例中選擇chi-square卡方檢驗(yàn)分類變量相關(guān)指標(biāo)相關(guān)列聯(lián)系數(shù)Φ和V系數(shù)λ值不確定系數(shù)定序變量的相關(guān)指標(biāo)適用于一個為分類變量、另一個為等距變量的檢驗(yàn)第33頁,課件共62頁,創(chuàng)作于2023年2月Contingencycoefficient:列聯(lián)系數(shù)。用于名義變量之間的相關(guān)系數(shù)計算。計算公式由卡方統(tǒng)計量修改而得,公式為其中,N為樣本個數(shù)PhiandCramer‘sV:ψ系數(shù)。用于名義變量之間的相關(guān)系數(shù)計算。計算公式由卡方統(tǒng)計量修改而得,公式為數(shù)值界于0~1之間,其中K為行數(shù)和列數(shù)較小的實(shí)際數(shù)。第34頁,課件共62頁,創(chuàng)作于2023年2月Crosstabs對話框本例中選擇頻數(shù)及頻率輸出項(xiàng)觀察頻數(shù)期望頻數(shù)頻率行頻率列頻率總和頻率殘差非標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化調(diào)整的標(biāo)準(zhǔn)化殘差頻數(shù)升序行順序降序第35頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果㈠:第36頁,課件共62頁,創(chuàng)作于2023年2月輸出結(jié)果㈡:第37頁,課件共62頁,創(chuàng)作于2023年2月多選項(xiàng)分析是對多選項(xiàng)問題的分析方法。多選項(xiàng)問題的編碼方案有兩種:多選項(xiàng)二分法(MultipleDichotomiesMethod)將每個可能的答案設(shè)置為一個SPSS變量,變量的取值有兩個,分別表示選中或沒選中。比如一道題目有6個選項(xiàng),則一道多選題目就需要用6個變量來表示。多選項(xiàng)分類法(MultipleCategoryMethod)首先估計多選項(xiàng)問題可能出現(xiàn)的答案個數(shù)。比如一個多選題,如果最多有3個答案,那么就設(shè)置3個SPSS變量,分別用來存放3個可能的答案。如果某個案的答案只有兩個,那么第3個SPSS變量取值為缺失值。多選項(xiàng)分析

第38頁,課件共62頁,創(chuàng)作于2023年2月ID康佳長虹西湖TCL東芝創(chuàng)維性別110101012101100030001110410110005100101060011101701110018100011190011100100111000111110000121010011130111001141011000150011010161110000171110000180110011190111001201101001例5某商場對6種品牌的電視機(jī)進(jìn)行消費(fèi)者滿意度調(diào)查,隨機(jī)調(diào)查了20位消費(fèi)者,讓他們選出最滿意的3個電視機(jī)品牌,收集到相應(yīng)的數(shù)據(jù)。第39頁,課件共62頁,創(chuàng)作于2023年2月

Analyze-MultipleResponseFrequenciesDefineMultipleResponseSets第40頁,課件共62頁,創(chuàng)作于2023年2月“MultipleResponseCrosstabs”第41頁,課件共62頁,創(chuàng)作于2023年2月ID答案1答案2答案3性別115312134034560414305146063451723418561195340104230113120123611133241144310156340162310172130182631193241202141例6某商場對6種品牌的電視機(jī)進(jìn)行消費(fèi)者滿意度調(diào)查,隨機(jī)調(diào)查了20位消費(fèi)者,讓他們選出最滿意的3個電視機(jī)品牌,收集到相應(yīng)的數(shù)據(jù)。第42頁,課件共62頁,創(chuàng)作于2023年2月DefineMultipleResponseSetsMultipleResponseFrequencies第43頁,課件共62頁,創(chuàng)作于2023年2月MultipleResponseCrosstabsMultipleResponseCrosstabs:options第44頁,課件共62頁,創(chuàng)作于2023年2月結(jié)果和討論(1)多選項(xiàng)二分法頻數(shù)分析結(jié)果:第45頁,課件共62頁,創(chuàng)作于2023年2月(2)多選項(xiàng)分類法頻數(shù)分析結(jié)果:結(jié)果和討論第46頁,課件共62頁,創(chuàng)作于2023年2月基本統(tǒng)計分析的報表制作

本章討論了SPSS的一些基本統(tǒng)計功能。SPSS還提供了這些基本統(tǒng)計分析的報表制作功能,根據(jù)報表制作的側(cè)重點(diǎn)不同,可以分為以下3種。

1.個案簡明統(tǒng)計報表(CasesSummary)2.行形式報表(ReportSummariesinRows)3.列形式報表(ReportSummariesinColumns)第47頁,課件共62頁,創(chuàng)作于2023年2月部門基本工資獎金分紅010001500800080013005000800130050008001000400080010004000800130050008001000800090010005000900130050008001000400080010004001900130050019001000800190010005001900130050019001000400190010004001110015005001900100050018001200600例7某公司兩個部門共有20名員工,收集到員工的基本工資、獎金和分紅信息,生成個案簡明統(tǒng)計報表。第48頁,課件共62頁,創(chuàng)作于2023年2月Analyze-Report-CaseSummaries實(shí)現(xiàn)步驟第49頁,課件共62頁,創(chuàng)作于2023年2月SummaryReport:StatisticsSummaryReport:Options第50頁,課件共62頁,創(chuàng)作于2023年2月

使用例7的數(shù)據(jù),生成行形式報表Analyze-ReportSummariesinRowsFormat第51頁,課件共62頁,創(chuàng)作于2023年2月Report:SummaryLinesfor部門Report:BreakOptionsfor部門第52頁,課件共62頁,創(chuàng)作于2023年2月Report:FinalSummaryLinesReport:OptionsReport:LayoutReport:Title(s第53

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論