第4章數(shù)據(jù)的統(tǒng)計描述_第1頁
第4章數(shù)據(jù)的統(tǒng)計描述_第2頁
第4章數(shù)據(jù)的統(tǒng)計描述_第3頁
第4章數(shù)據(jù)的統(tǒng)計描述_第4頁
第4章數(shù)據(jù)的統(tǒng)計描述_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)的統(tǒng)計描述第4章內(nèi)容提要4.1連續(xù)變量的統(tǒng)計描述4.2分類變量的統(tǒng)計描述4.3多選題的統(tǒng)計描述4.4統(tǒng)計圖的呈現(xiàn)統(tǒng)計描述描述性統(tǒng)計分析:用少量數(shù)字(即描述指標(biāo))概括大量原始數(shù)字,對數(shù)據(jù)進(jìn)行描述;推斷性統(tǒng)計分析:從樣本信息回推總體特征。統(tǒng)計描述中可用的工具各種初步匯總描述方法:分組匯總、百分位數(shù)刻畫各種統(tǒng)計描述指標(biāo):均數(shù)、標(biāo)準(zhǔn)差、四分位數(shù)間距、百分比等;統(tǒng)計表:將統(tǒng)計指標(biāo)組成表格,可同時呈現(xiàn)多種統(tǒng)計指標(biāo),并進(jìn)行復(fù)雜的樣本分組、合并計算;統(tǒng)計圖:按照統(tǒng)計指標(biāo)的大小將其繪制成一張圖形,對于連續(xù)變量數(shù)據(jù),常用直方圖、箱圖加以展示,對于分類變量,常用條圖、餅圖加以展示。變量的類型Nominal變量(名義型)分類變量Ordinal變量(定序型)可視作分類變量,也可處理后視作連續(xù)變量Scale變量(定距定比型)連續(xù)變量4.1連續(xù)變量的統(tǒng)計描述5(一)集中趨勢的描述統(tǒng)計量集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,是關(guān)于中心位置的描述。在統(tǒng)計學(xué)中,關(guān)于數(shù)據(jù)分布的中心位置的統(tǒng)計量被稱為位置統(tǒng)計量(LocationStatistic)。常用的位置統(tǒng)計量有:均數(shù)——適用于正態(tài)分布和對稱分布資料;中位數(shù)——適用于所有分布類型的資料。眾數(shù)——適用于所有分布類型的資料。1.算術(shù)均數(shù)算術(shù)均數(shù)(ArithmeticMean)是最常用的描述數(shù)據(jù)分布的集中趨勢的統(tǒng)計量??傮w均數(shù)用μ表示,樣本均數(shù)用X表示。均數(shù)的最重要意義在于它高度濃縮了數(shù)據(jù),使大量的觀測數(shù)據(jù)變?yōu)橐粋€代表性數(shù)值。但它掩蓋了各個觀測數(shù)據(jù)之間的差異性,且對極端值比較靈敏,在某些情況下也有一定欺騙性。均數(shù)適用范圍:單峰和基本對稱的分布情況下適用于描述集中趨勢。嚴(yán)格講均數(shù)只適用于定距變量,但有時對于定序變量,求平均等級也可使用均數(shù)。2.中位數(shù)中位數(shù)(Median)是將總體各單位的標(biāo)志值按大小順序排列,處于中間位置的那個標(biāo)志值。剩下的值一半比它大,一半比它小。中位數(shù)是位置平均數(shù),因此不受極端值的影響。中位數(shù)適用范圍:非基本對稱的分布情況下可使用于中位數(shù)描述集中趨勢。中位數(shù)對于定序變量、連續(xù)變量都可以使用。中位數(shù)只考慮居中位置,因此用于描述連續(xù)變量會損失很多信息。所以對于對稱分布的資料,往往優(yōu)先考慮均數(shù)。3.眾數(shù)眾數(shù)(Mode)是樣本數(shù)據(jù)中出現(xiàn)頻次最大的那個數(shù)字。眾數(shù)不受極端值影響,但對資料的使用不完全,使用眾數(shù)反映連續(xù)變量會損失很多信息。

當(dāng)數(shù)據(jù)為對稱分布或接近對稱分布時:應(yīng)選擇均值作為集中趨勢的代表值,因為此時均值與眾數(shù)和中位數(shù)的差異很小,而又是全部數(shù)據(jù)的綜合,因此具有很好的代表性。當(dāng)數(shù)據(jù)為偏斜度較大的非對稱分布時:

均值此時受極端值的影響,而偏離數(shù)據(jù)的集中點;此時應(yīng)選擇眾數(shù)和中位數(shù)來代表。正偏或右偏分布負(fù)偏或左偏分布對稱分布(一)集中趨勢的描述統(tǒng)計量4.截尾均數(shù)由于均數(shù)較易受極端值的影響,因此可以考慮將數(shù)據(jù)排序后,按一定比例去掉兩端的數(shù)據(jù),只使用中部的數(shù)據(jù)來求均數(shù),即截尾均數(shù)。如果截尾均數(shù)和原均數(shù)相差不大,則說明數(shù)據(jù)不存在極端值,或者兩側(cè)極端值的影響正好抵消;反之,則說明數(shù)據(jù)中有極端值,此時截尾均數(shù)能更好地反映數(shù)據(jù)的集中趨勢。

常用的截尾均數(shù)有5%截尾均數(shù),即兩端各去掉5%的數(shù)。(二)離散趨勢的描述統(tǒng)計量離散趨勢是指一組數(shù)據(jù)遠(yuǎn)離其中心值的程度,是關(guān)于數(shù)據(jù)波動范圍的描述。在統(tǒng)計學(xué)中,關(guān)于數(shù)據(jù)離散趨勢的統(tǒng)計量被稱為尺度統(tǒng)計量(ScaleStatistic)。常用的尺度統(tǒng)計量有:全距——適用于所有分布類型的資料標(biāo)準(zhǔn)差、方差——適用于正態(tài)分布資料四分位數(shù)間距——適用于所有分布類型的資料1.全距(Range)全距又稱為極差,是一組數(shù)據(jù)中最大值(Maximum)與最小值(Minimum)之差.極差衡量的是變量分布的變異范圍或離散幅度。它僅僅取決于兩個極端值的水平,不能反映其間的變量分布。它容易受個別極端值的影響,并不穩(wěn)定。全距一般只用于預(yù)備性檢查,目的是大體上了解數(shù)據(jù)的分布范圍。2.方差(Variance)和標(biāo)準(zhǔn)差(Std.Deviation)方差:即平均了每個數(shù)據(jù)的離均差的平方值??捎糜诓煌繕颖緮?shù)據(jù)分布離散程度的比較。方差越大,數(shù)據(jù)分布的離散程度越大。標(biāo)準(zhǔn)差:將方差開方得到標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差度量了偏離平均數(shù)的大小,相當(dāng)于平均偏差,可直接地、概括地、平均地描述數(shù)據(jù)變異的大小。標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)越整齊,變異程度越小。標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)分布越分散,變異程度越大。方差和標(biāo)準(zhǔn)差的適用范圍:由于方差和標(biāo)準(zhǔn)差的計算涉及到每一個變量值,所以它們反映的信息在離散指標(biāo)中是最全面、最可靠的變異描述指標(biāo)。由于涉及每一個變量值,方差和標(biāo)準(zhǔn)差也會受極端值的影響,當(dāng)數(shù)據(jù)中有明顯的極端值時不宜使用。只有均數(shù)能反映集中趨勢時才能使用方差和標(biāo)準(zhǔn)差來反映離散趨勢。因此,方差和標(biāo)準(zhǔn)差的適用范圍應(yīng)當(dāng)是正態(tài)分布。2.方差(Variance)和標(biāo)準(zhǔn)差(Std.Deviation)3.百分位數(shù)、四分位數(shù)和四分位數(shù)間距百分位數(shù)(Percentile)是一種位置指標(biāo),用Px表示。一個百分位數(shù)將一組觀察值分為兩部分,理論位置有x%的觀察值比它小,(100-x)%的觀察值比它大。四分位數(shù)即三個數(shù)據(jù)的總稱,分別是P25、P50和P75分位數(shù)。這三個分位數(shù)將全部總體單位按標(biāo)志值的大小等分為四部分。分別記為Q1、Q2和Q3。

四分位數(shù)間距即(Q3—Q1)3.百分位數(shù)、四分位數(shù)和四分位數(shù)間距四分位數(shù)間距(Q3-Q1)的適用范圍:四分位數(shù)間距包括了中間50%的觀察值,因此既排除了兩端極端值的影響,又能夠反映較多數(shù)據(jù)的離散程度,是當(dāng)方差、標(biāo)準(zhǔn)差不適用時較好的離散程度描述指標(biāo)。四分位數(shù)間距越大表明中間的數(shù)據(jù)越分散,越小表明中間的數(shù)據(jù)越集中,在描述數(shù)據(jù)的離散程度上比極差的穩(wěn)定性要高。(三)分布形態(tài)的描述統(tǒng)計量數(shù)據(jù)的分布形態(tài)主要指數(shù)據(jù)分布是否對稱,偏斜程度如何,分布陡緩程度等。在統(tǒng)計學(xué)中,關(guān)于數(shù)據(jù)分布形態(tài)的統(tǒng)計量被稱為分布統(tǒng)計量(DistributionStatistic)。常用的分布統(tǒng)計量有:偏度系數(shù)峰度系數(shù)1.偏度系數(shù)(Skewness)偏度系數(shù)是描述變量取值分布形態(tài)對稱性的統(tǒng)計量。當(dāng)分布為對稱分布時,正負(fù)總偏差相等,偏度值等于0;當(dāng)分布為不對稱分布時,正負(fù)總偏差不相等,偏度值大于0或小于0;偏度值大于0表示正偏差值大,為正偏或右偏,直方圖中有一條長尾拖在右邊;偏度小于0表示負(fù)偏差數(shù)值大,為負(fù)偏或左偏,直方圖中有一條長尾拖在左邊;正偏態(tài)說明數(shù)據(jù)多集中在偏低的一端,但存在較大的極端值;負(fù)偏態(tài)說明數(shù)據(jù)多集中在偏高的一端,但存在較小的極端值。偏度絕對值越大,表示數(shù)據(jù)分布形態(tài)的偏斜程度越大。2.峰度系數(shù)(Kurtosis)峰度系數(shù)是描述變量取值分布形態(tài)的陡緩程度的統(tǒng)計量。當(dāng)數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡緩程度相同時,峰度值等于0;峰度大于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭,為尖峰分布;峰度小于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布平緩,為平峰分布。尖峰分布說明集中在眾數(shù)附近的數(shù)值多,兩側(cè)數(shù)值少;平峰分布說明集中在眾數(shù)附近的數(shù)值少,兩側(cè)數(shù)值多。(四)正態(tài)分布與標(biāo)準(zhǔn)化數(shù)據(jù)正態(tài)分布:在自然現(xiàn)象和社會現(xiàn)象中,大量的隨機(jī)變量都服從或近似服從正態(tài)分布,也叫高斯分布。正態(tài)分布的特征:正態(tài)分布曲線是一條對稱曲線,關(guān)于均數(shù)對稱;曲線是單峰,在均值處達(dá)到最高點;正態(tài)分布曲線的矮闊與尖峭與標(biāo)準(zhǔn)差有關(guān)。標(biāo)準(zhǔn)差越大,個體差異越大,正態(tài)曲線也越矮闊;反之,標(biāo)準(zhǔn)差越小,個體差異越小,正態(tài)曲線也越尖峭。曲線無論向左或向右延伸,都越來越接近橫軸,但不會與橫軸相交,以橫軸為漸近線。(四)正態(tài)分布與標(biāo)準(zhǔn)化數(shù)據(jù)正態(tài)曲線下的面積:約68%的個體的取值與平均數(shù)的距離在1個標(biāo)準(zhǔn)差(μ±σ)之內(nèi),或者說1個標(biāo)準(zhǔn)差范圍內(nèi)的曲線下面積為68%;約95%的個體的取值與平均數(shù)的距離在1.96個標(biāo)準(zhǔn)差(μ±1.96σ)之內(nèi);約99.7%個體的取值與平均數(shù)的距離在3個標(biāo)準(zhǔn)差(μ±3σ)之內(nèi)。3個標(biāo)準(zhǔn)差之外的值通常看作異常值。(四)正態(tài)分布與標(biāo)準(zhǔn)化數(shù)據(jù)標(biāo)準(zhǔn)正態(tài)分布即將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換,也被稱為Z分布。通過標(biāo)準(zhǔn)化可得到一系列的變量值,通常稱為標(biāo)準(zhǔn)化值,或Z分?jǐn)?shù)。標(biāo)準(zhǔn)化值反映的是變量值與變量均值的差是幾個標(biāo)準(zhǔn)差單位。如果標(biāo)準(zhǔn)化值等于0,則表明該變量值等于變量均值;如果標(biāo)準(zhǔn)化值大于0,則表明該變量值大于變量均值;如果標(biāo)準(zhǔn)化值小于0,則表明該變量值小于變量均值;異常值的判斷將數(shù)據(jù)標(biāo)準(zhǔn)化后分為三組:Z≤-3,-3<Z<3,Z≥3如果數(shù)據(jù)在第一組或第三組的比例大于理論值0.3%,則可認(rèn)為存在異常值。(五)連續(xù)變量的統(tǒng)計描述——FrequenciesFrequencies過程即頻數(shù)分析,是最基本的數(shù)據(jù)分析過程。主要功能:既可用于連續(xù)變量,也可用于分類變量生成頻數(shù)表計算各種基本統(tǒng)計量,可計算百分位數(shù)對于連續(xù)變量可繪制帶正態(tài)曲線的直方圖對于分類變量可繪制餅圖、條圖等【案例4.1】頻數(shù)分析針對數(shù)據(jù)“住房狀況調(diào)查”分析戶主的“從業(yè)情況”和“房屋產(chǎn)權(quán)情況”,繪制頻數(shù)表和條圖針對“家庭收入”和“現(xiàn)住面積”計算均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)以及P5、P95,并繪制帶正態(tài)曲線的直方圖;比較本地戶口和外地戶口的人均住房面積情況。分析人均住房面積是否存在不均衡現(xiàn)象?!景咐?.1】頻數(shù)分析I.使用Frequencies過程繪制頻數(shù)表和條圖(Charts選項卡)??赏瑫r選入多個需要描述的變量,系統(tǒng)依次進(jìn)行分析確定是否在結(jié)果中輸出頻數(shù)表。連續(xù)變量通常不輸出頻數(shù)表?!景咐?.1】頻數(shù)分析集中趨勢選項組百分點數(shù)值選項組按某一數(shù)值等分輸入給定位置的百分點離散趨勢選項組分布選項組偏度峰度II.使用Frequencies過程計算統(tǒng)計量(Statistics)并繪制直方圖(Charts選項卡)。【案例4.1】頻數(shù)分析條圖指統(tǒng)計圖數(shù)值給出頻數(shù)或百分比餅圖直方圖II.使用Frequencies過程計算統(tǒng)計量(Statistics)并繪制直方圖(Charts選項卡)。【案例4.1】頻數(shù)分析III.先用SplitFile將數(shù)據(jù)進(jìn)行拆分,然后使用Descriptives過程計算統(tǒng)計量。結(jié)果說明:本市戶口的人均面積均值低于外地戶口。但外地戶口的標(biāo)準(zhǔn)差高于本地戶口。因此相對于本市戶口,外地戶口的住房面積離散程度更高。人均住房面積的分布均呈右偏分布,且本市戶口的右偏程度更大,說明本市戶口的人均住房面積主要集中在數(shù)值較低的一端。人均住房面積的分布均呈尖峰分布,且本市戶口的峰態(tài)更高,說明本市戶口的人均住房面積在眾數(shù)附近的分布更密集?!景咐?.1】頻數(shù)分析IV.(1)取消數(shù)據(jù)拆分,使用Descriptives過程將數(shù)據(jù)標(biāo)準(zhǔn)化。將標(biāo)準(zhǔn)化后的變量值作為一個新變量保存在數(shù)據(jù)集中。(2)將標(biāo)準(zhǔn)化后的Z值進(jìn)行排序(SortCases),看是否存在絕對值大于3的Z值,即為異常值。(3)用Recode命令將Z值分組,計算異常值組的百分比,與理論值0.3%相比較判斷是否存在不均衡現(xiàn)象。(六)連續(xù)變量的統(tǒng)計描述——DescriptivesDescriptives過程通常用于輸出連續(xù)變量的基本描述統(tǒng)計量。主要功能:只可用于連續(xù)變量。計算各種基本統(tǒng)計量,但與Frequencies相比,不可計算分位數(shù)、中位數(shù)、眾數(shù)等。重要功能在于將數(shù)據(jù)標(biāo)準(zhǔn)化。(七)連續(xù)變量的統(tǒng)計描述——ExploreExplorer過程可用于輸出將變量分類后的連續(xù)變量的基本描述統(tǒng)計量。主要功能:用于連續(xù)變量統(tǒng)計量與統(tǒng)計圖的輸出??芍付ǚ诸愖兞?,功能相當(dāng)于拆分?jǐn)?shù)據(jù)文件??奢敵霎惓V?、計算截尾均數(shù)。可輸出莖葉圖、盒須圖??奢敵雠袛嗾龖B(tài)性的P-P圖、Q-Q圖。【案例4.2】數(shù)據(jù)探測——Explore過程根據(jù)“住房狀況調(diào)查.sav”,根據(jù)“從業(yè)狀況”對“現(xiàn)住面積”進(jìn)行數(shù)據(jù)探測。選入需要分析的連續(xù)變量選入按某種因素分組的分類變量【案例4.2】數(shù)據(jù)探測——Explore過程輸出描述性統(tǒng)計量,指定置信區(qū)間極端值,輸出5個最大值,5個最小值。輸出5%、10%、25%、50%、75%、95%分位數(shù)箱圖莖葉圖直方圖繪制正態(tài)分布圖,進(jìn)行變量是否符合正態(tài)分布的檢驗【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之描述性統(tǒng)計量集中趨勢指標(biāo)離散趨勢指標(biāo)分布特征指標(biāo)去除5%極端值的截尾均數(shù)95%的置信區(qū)間參數(shù)估計【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之直方圖【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之莖葉圖對樣本量較小的情形,直方圖會損失一部分信息,此時可以使用莖葉圖來進(jìn)行更精確的描述。莖葉圖(Stem-and-LeafGraph)的形狀與功能與直方圖非常相似,是一種文本化的圖形。莖葉圖的生成:Explore——Plots現(xiàn)住面積Stem-and-LeafPlotfor從業(yè)狀況=大專院??蒲袉挝籉requencyStem&Leaf1.00Extremes(=<10)

1.001.8

1.002.0

5.003.46679

14.004.00045555555779

23.005.00000001222234444557889

30.006.000000000001223333455555556778

24.007.000000000023333555567899

18.008.000000000244667799

9.009.000356788

9.0010.000000048

5.0011.035682.00Extremes(>=120)Stemwidth:10.00Eachleaf:1case(s)【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之箱圖(盒須圖)箱圖也稱箱線圖、盒須圖。和直方圖一樣用于考察連續(xù)變量的分布情況。直方圖側(cè)重對一個連續(xù)變量的分布情況進(jìn)行詳細(xì)考察,箱圖注重勾勒出統(tǒng)計上的主要信息箱圖也可通過Graphs—Boxplot輸出中位數(shù)上限:1.5(Q3-Q1)下限:1.5(Q3-Q1)Q3:第75個百分點Q1:第25個百分點離群值:與四分位數(shù)值的距離超過1.5倍四分位數(shù)間距的值極值:與四分位數(shù)值的距離超過3倍四分位數(shù)間距的值用*表示【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之箱圖(盒須圖)箱圖可同時反映出中位數(shù)(集中趨勢)和四分位數(shù)(離散趨勢)的位置;中位數(shù)距離方框邊界和最值邊界是否對稱則直接體現(xiàn)了數(shù)據(jù)分布的對稱性;異常值對統(tǒng)計分析有較大的影響,箱圖可直接標(biāo)示出統(tǒng)計上認(rèn)為可疑的離群值和極端值。箱圖主要是對以百分位數(shù)為基礎(chǔ)的信息進(jìn)行呈現(xiàn),因此當(dāng)百分位數(shù)不穩(wěn)定時,箱圖并不適用。即當(dāng)樣本量太少,或者相同數(shù)值過多時,不宜使用箱圖。此時莖葉圖或條圖是更好的選擇?!景咐?.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之正態(tài)性檢驗【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之正態(tài)性檢驗(1)正態(tài)概率圖正態(tài)概率圖是在統(tǒng)計圖中描繪比較變量的實際累積概率以及所考察分布類型的理論累積概率符合程度,以判斷資料是否服從所考察的分布類型。如果變量服從正態(tài)分布,則實際累積概率與理論累積概率應(yīng)基本一致。如果數(shù)據(jù)呈正態(tài)分布,則圖中數(shù)據(jù)點和理論直線(對角線)基本重合實際(觀測)概率值理論(期望)概率值【案例4.2】數(shù)據(jù)探測——Explore過程結(jié)果說明:數(shù)據(jù)探測之正態(tài)性檢驗(2)偏離正態(tài)圖偏離正態(tài)圖是根據(jù)變量的實際分位數(shù)與理論分布進(jìn)行繪圖,并據(jù)此判斷變量是否服從特定的分布。Explorer—Plots—NormalityPlotswithtest如果數(shù)據(jù)呈正態(tài)分布,則圖中數(shù)據(jù)點應(yīng)較均勻地分布在y=0這條直線的上下。實際值按正態(tài)分布計算的理論值4.2分類變量的統(tǒng)計描述45(一)分類變量的統(tǒng)計描述指標(biāo)體系頻數(shù)分布情況的描述頻數(shù):在一張頻數(shù)表中,描述各個類別的樣本數(shù);百分比:本類別出現(xiàn)的次數(shù)占總次數(shù)的比例;累積頻數(shù):本類別及較低類別出現(xiàn)的次數(shù)之和;累積頻率(累積百分比):本類別及較低類別出現(xiàn)的次數(shù)之和占總次數(shù)的百分比。累積指標(biāo)適用于描述分類有序變量。例如學(xué)歷調(diào)查:高中及以下;2.大專;3.大學(xué);4.研究生及以上。(一)分類變量的統(tǒng)計描述指標(biāo)體系集中趨勢的描述可以使用眾數(shù)來描述它的集中趨勢。眾數(shù)只反映了頻數(shù)最多的類別的情況,而浪費了其他所有的信息。只有集中趨勢顯著時,才使用眾數(shù)作為總體的代表值。使用相對數(shù)進(jìn)行深入描述比(Ratio)指兩個有關(guān)指標(biāo)之比A/B,用于反映這兩個指標(biāo)在數(shù)量/頻數(shù)上的大小關(guān)系。如:兩個電視臺相同時段收視份額之比。構(gòu)成比(Proportion):百分比和累積百分比率(Rate)用于說明某個時期內(nèi)某個事件發(fā)生的頻率或強(qiáng)度。(一)分類變量的統(tǒng)計描述指標(biāo)體系分類變量的聯(lián)合描述頻數(shù)表:可以描述一個分類變量的數(shù)值分布情況。對財經(jīng)類節(jié)目的喜愛程度頻數(shù)表FrequencyPercentValidPercentCumulativePercentValid很喜歡3225.625.625.6一般6048.048.073.6不喜歡3326.426.4100.0Total125100.0100.0(一)分類變量的統(tǒng)計描述指標(biāo)體系分類變量的聯(lián)合描述列聯(lián)表:當(dāng)一共有兩個分類變量時,這種因分類變量的類別交叉而成的復(fù)合頻數(shù)表被稱為行×列表,也稱列聯(lián)表。對財經(jīng)類節(jié)目的喜歡程度與受教育水平的列聯(lián)表CountfavorTotal很喜歡一般不喜歡edu高205328中10201040低2352057Total326033125(一)分類變量的統(tǒng)計描述指標(biāo)體系分類變量的聯(lián)合描述行百分比:每一單元格的頻數(shù)占所在行的單元格取值之和的百分比。列百分比:每一單元格的頻數(shù)占所在列的單元格取值之和的百分比。行、列百分比選擇的通常原則自變量為行變量,則選擇行百分比!自變量為列變量,則選擇列百分比?。ㄒ唬┓诸愖兞康慕y(tǒng)計描述指標(biāo)體系對財經(jīng)類節(jié)目的喜歡程度與受教育水平的列聯(lián)表favorTotal很喜歡一般不喜歡edu高Count205328%withinedu71.4%17.9%10.7%100.0%中Count10201040%withinedu25.0%50.0%25.0%100.0%低Count2352057%withinedu3.5%61.4%35.1%100.0%TotalCount326033125%withinedu25.6%48.0%26.4%100.0%(二)分類變量的統(tǒng)計描述——CrosstabsAnalyze→DescriptiveStatistics→Crosstabs顯示分組的條形圖單擊打開統(tǒng)計量對話框單擊打開單元格對話框單擊打開表格格式對話框加入層變量可得到三維交叉列聯(lián)表4.3多選題的統(tǒng)計描述53(一)多選題的統(tǒng)計描述指標(biāo)應(yīng)答人數(shù):是指選擇了本選項的人數(shù),或者說就是原始頻數(shù)。應(yīng)答人數(shù)百分比(PercentofCases):選擇該項的人占總?cè)藬?shù)的比例。應(yīng)答人數(shù)百分比可以反映該選項在人群中的受歡迎程度。應(yīng)答次數(shù)百分比(PercentofResponses):在做出的所有選擇中,選擇該項的次數(shù)占總次數(shù)(總反應(yīng)數(shù))的比例。應(yīng)答次數(shù)百分比可以用于不同選項受歡迎程度的比較?!景咐?.3】多選題的統(tǒng)計描述根據(jù)數(shù)據(jù)“上網(wǎng)行為調(diào)查.sav”分析多選題:4、您上網(wǎng)的主要目的是(可多選):

(1)玩網(wǎng)絡(luò)游戲(2)聊天或交友(3)看動漫、電影、下載音樂等(4)獲取信息(5)學(xué)習(xí)或工作(6)通訊或聯(lián)絡(luò)(7)其它第一步:定義多選題變量集【案例4.3】多選題的統(tǒng)計描述第一步:定義多選題變量集。選入多選題的對應(yīng)變量二分法輸入答案為“是”的代碼多重分類法$q4FrequenciesResponsesPercentofCasesNPercent上網(wǎng)的主要目的a玩網(wǎng)絡(luò)游戲473917.7%77.6%聊天或交友375414.0%61.5%看動漫、電影、下載音樂等278510.4%45.6%獲取信息24329.1%39.8%學(xué)習(xí)或工作332412.4%54.4%通訊或聯(lián)絡(luò)410315.3%67.2%其他568621.2%93.1%Total26823100.0%439.4%a.Dichotomygrouptabulatedatvalue0.【案例4.3】多選題的統(tǒng)計描述第二步:對變量集進(jìn)行分析——頻數(shù)分析Analyze——MultipleResponse——Frequencies應(yīng)答次數(shù)百分比應(yīng)答人數(shù)百分比【案例4.3】多選題的統(tǒng)計描述第三步:對變量集進(jìn)行分析——交互分析Analyze——MultipleResponse——Crosstabs設(shè)置自變量的取值范圍設(shè)置單元格輸出指標(biāo)【案例4.3】多選題的統(tǒng)計描述第三步:對變量集進(jìn)行分析——交互分析Analyze——MultipleResponse——Crosstabs設(shè)置單元格輸出指標(biāo)輸出行列百分比輸出應(yīng)答人數(shù)百分比輸出應(yīng)答次數(shù)百分比【案例4.3】多選題的統(tǒng)計描述q1*$q4Crosstabulation上網(wǎng)的主要目的aTotal玩網(wǎng)絡(luò)游戲聊天或交友看動漫、電影、下載音樂等獲取信息學(xué)習(xí)或工作通訊或聯(lián)絡(luò)其他你的性別男Count21761992151013631852223729273184%withinq168.3%62.6%47.4%42.8%58.2%70.3%91.9%女Count25631762127510691472186627592921%withinq187.7%60.3%43.6%36.6%50.4%63.9%94.5%TotalCount47393754278524323324410356866105Percentagesandtotalsarebasedonrespondents.a.Dichotomygrouptabulatedatvalue0.結(jié)果說明:(1)通訊聯(lián)絡(luò)、網(wǎng)絡(luò)游戲和聊天交友是男性和女性上網(wǎng)最主要的三大目的。(2)除網(wǎng)絡(luò)游戲外,男性在聊天交友、學(xué)習(xí)工作、通訊聯(lián)絡(luò)、獲取信息以及看動漫電影下載音樂等上網(wǎng)目的上均高于女性。4.4統(tǒng)計圖的呈現(xiàn)61常用描述性統(tǒng)計圖餅圖條圖線圖直方圖莖葉圖箱圖(一)餅圖餅圖用于表示各類別某種特征的構(gòu)成比情況。圓形總面積為100%,扇形面積的大小表示事物內(nèi)部各部分的百分比。一般以12點為起點,各部分按習(xí)慣順序或數(shù)值大小順時針排列。Graphs——LegacyDialogs——Pie注:只有當(dāng)分類數(shù)的百分比之和為100%時,餅圖才適用。(二)條圖條圖用等寬的直條長短代表相互獨立的各指標(biāo)數(shù)值大小,該指標(biāo)可以是連續(xù)變量的匯總指標(biāo),也可是分類變量的頻數(shù)或百分比。條圖的縱軸從0開始,各部分按大小或自然順序排列。Graphs——LegacyDialogs——BarSimple——簡單條圖Clustered——復(fù)式條圖Stacked——堆積條圖簡單條圖:用于單變量Graphs——LegacyDialogs——Bar——SummariesofGroupsofCases(二)條圖指定直條代表的意義指定分類軸變量(通常為橫軸)指定第二分類變量(直條組變量)可指定第三分類變量(層變量)輸出行或列條圖個案分組匯總模式(SummariesofGroupsofCases)下的條形圖。(二)條圖分組條圖:兩個以上變量(二)條圖分段條圖:兩個以上變量(二)條圖單個變量匯總模式(Summariesof

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論