度量分布偏斜的程度課件_第1頁
度量分布偏斜的程度課件_第2頁
度量分布偏斜的程度課件_第3頁
度量分布偏斜的程度課件_第4頁
度量分布偏斜的程度課件_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章數(shù)據(jù)的描述統(tǒng)計度量分布偏斜的程度課件目錄第一節(jié)集中趨勢的度量第二節(jié)離散趨勢的度量第三節(jié)偏斜度與峰度的度量第四節(jié)SPSS在描述統(tǒng)計中的運用目錄集中趨勢(centraltendency)是指一組數(shù)據(jù)向某中心值靠攏的傾向,集中趨勢的測度實際上就是對數(shù)據(jù)一般水平代表值或中心值的測度。不同類型的數(shù)據(jù)用不同的集中趨勢測度值,選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定。集中趨勢的特征數(shù),是代表一組數(shù)據(jù)典型水平或集中趨勢的統(tǒng)計量。常用的集中趨勢的特征數(shù)包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。3第一節(jié)集中趨勢的度量3第一節(jié)集中趨勢的度量一、算數(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean)簡稱為均數(shù)(mean)。樣本均數(shù)通常用

表示,總體均數(shù)用希臘字母μ表示。算術(shù)平均數(shù)是集中趨勢的最主要測度值。適用于對稱分布,特別是正態(tài)或近似正態(tài)分布的計量資料。根據(jù)所掌握數(shù)據(jù)形式的不同,算術(shù)平均數(shù)有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)。4第一節(jié)集中趨勢的度量一、算數(shù)平均數(shù)4第一節(jié)集中趨勢的度量(1)簡單算術(shù)平均數(shù)(simplearithmeticmean)。未經(jīng)分組整理的原始數(shù)據(jù),其算術(shù)平均數(shù)的計算就是直接將一組數(shù)據(jù)的各個數(shù)值相加除以數(shù)值個數(shù)。計算公式為:(2)加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)。根據(jù)分組整理的數(shù)據(jù)計算的算術(shù)平均數(shù),就要以各組變量值出現(xiàn)的次數(shù)或頻數(shù)為權(quán)數(shù)計算加權(quán)的算術(shù)平均數(shù)。計算公式為:5第一節(jié)集中趨勢的度量5第一節(jié)集中趨勢的度量二、幾何平均數(shù)幾何平均數(shù)(geometricmean),是指社會經(jīng)濟現(xiàn)象的同質(zhì)總體在時間上變動速度的平均數(shù),也即統(tǒng)計總體在一段時期內(nèi)的平均發(fā)展速度。幾何平均數(shù)通常用于計算指數(shù)、百分比和增長速度的平均數(shù)。根據(jù)掌握的數(shù)據(jù)資料不同,幾何平均數(shù)可分為簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種。6第一節(jié)集中趨勢的度量二、幾何平均數(shù)6第一節(jié)集中趨勢的度量(1)簡單幾何平均數(shù)。根據(jù)未經(jīng)分組資料計算平均數(shù)。計算公式為:(2)加權(quán)幾何平均數(shù)。當掌握的數(shù)據(jù)資料為分組資料,且各個變量值出現(xiàn)的次數(shù)不相同時,應(yīng)用加權(quán)方法計算幾何平均數(shù)。計算公式為:7第一節(jié)集中趨勢的度量7第一節(jié)集中趨勢的度量三、中位數(shù)中位數(shù)(median)是一組按大小順序排列的觀察值中位居中間的數(shù)值,通常用

表示。它常用于描述偏態(tài)分布資料的集中趨勢。中位數(shù)是一個位置代表值,因此它不受極端變量值的影響,特別是當分布末端無確定數(shù)據(jù)不能求算術(shù)平均數(shù)和幾何平均數(shù)時,可以用中位數(shù)來表示數(shù)據(jù)分布的集中趨勢。8第一節(jié)集中趨勢的度量三、中位數(shù)8第一節(jié)集中趨勢的度量對于已分組的數(shù)據(jù)來說,中位數(shù)的計算公式為:其中,是到中位數(shù)組前面一組為止的向上累計頻數(shù),

則是到中位數(shù)組后面一組為止的向下累計頻數(shù);

為中位數(shù)組的頻數(shù);i為中位數(shù)組的組距。9第一節(jié)集中趨勢的度量9第一節(jié)集中趨勢的度量四、眾數(shù)眾數(shù)(mode)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用

表示。從變量分布的角度看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應(yīng)的變量值即為眾數(shù)。當然,如果數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點,眾數(shù)也可以不存在;如果有多個高峰點,也就有多個眾數(shù)。在統(tǒng)計實踐中,當一組數(shù)據(jù)出現(xiàn)不同質(zhì)的情況,或分布中出現(xiàn)極端數(shù)據(jù)時,用眾數(shù)來描述數(shù)據(jù)的集中趨勢較為合適。10第一節(jié)集中趨勢的度量四、眾數(shù)10第一節(jié)集中趨勢的度量設(shè)眾數(shù)組的頻數(shù)為

,眾數(shù)前一組的頻數(shù)為

,眾數(shù)后一組的頻數(shù)為

。當眾數(shù)相鄰兩組的頻數(shù)相等時,即

=,眾數(shù)組的組中值即為眾數(shù);當眾數(shù)組的前一組的頻數(shù)多于眾數(shù)組后一組的頻數(shù)時,即

,則眾數(shù)會向其前一組靠,眾數(shù)小于其組中值;當眾數(shù)組后一組的頻數(shù)多于眾數(shù)組前一組的頻數(shù)時,即

,則眾數(shù)會向其后一組靠,眾數(shù)大于其組中值。基于這種思路,借助于幾何圖形而導(dǎo)出的分組數(shù)據(jù)眾數(shù)的計算公式為:其中,

L表示眾數(shù)所在組的下限;U表示眾數(shù)所在組的上限。上述下限和上限公式是假定數(shù)據(jù)分布具有明顯的集中趨勢,且眾數(shù)組的頻數(shù)在該組內(nèi)是均勻分布的,若這些假定不成立,則眾數(shù)的代表性就會很差。11第一節(jié)集中趨勢的度量11第一節(jié)集中趨勢的度量五、調(diào)和平均數(shù)調(diào)和平均數(shù)(reciprocalmean)也稱倒數(shù)平均數(shù),它是對變量(x)的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù)。根據(jù)掌握的統(tǒng)計資料不同,調(diào)和平均數(shù)可以分為簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。12第一節(jié)集中趨勢的度量五、調(diào)和平均數(shù)12第一節(jié)集中趨勢的度量(1)簡單調(diào)和平均數(shù):(2)加權(quán)調(diào)和平均數(shù):13第一節(jié)集中趨勢的度量13第一節(jié)集中趨勢的度量六、集中趨勢度量的例題分析【例7-1】2010年中國南方某城鎮(zhèn)3200戶家庭的平均每一勞動力年收入的頻數(shù)分布情況如表7-1所示,請計算其算術(shù)平均數(shù)、中位數(shù)和眾數(shù)。14第一節(jié)集中趨勢的度量年收入分組/元組中值X/元頻數(shù)f累積頻數(shù)8000-1700017000-2600026000-3500035000-4400044000-5300053000-62000125002150030500395004850057500700100080040020010070017002500290031003200總計3200六、集中趨勢度量的例題分析14第一節(jié)集中趨勢的度量年收入分解:(1)算術(shù)平均數(shù)(2)中位數(shù)(3)眾數(shù)15第一節(jié)集中趨勢的度量解:15第一節(jié)集中趨勢的度量【例7-2】1950年我國總?cè)丝跒?.5億,1985年達到了10.5億,共計增長了1.9倍(表7-2)。(1)測算1950~1985年,我國平均每5年的人口增長速度;(2)測算1950~1975年,我國平均每5年的人口增長速度;(3)如果1975~1985年期間不實行計劃生育政策,請測算1985年我國的人口總數(shù)。16第一節(jié)集中趨勢的度量年度人口數(shù)/萬人環(huán)比增長速度1950195519601965197019751980198555196614656620772538829929242098705104532-1.1141.0771.0961.1441.1141.0681.05916第一節(jié)集中趨勢的度量年度人口數(shù)/萬人環(huán)比增長速度195

解:(1)MG=1.114?1.077?1.096?1.144?1.144?1.068?1.059)1/7≈1.096,即1950~1985年,我國平均每5年的人口增長速度為9.6%;

(2)MG=(1.114?1.077?1.096?1.144?1.144)1/5≈1.1096,即1950~1975年,我國平均每5年的人口增長速度10.9%;

(3)P=92420?(1.109)2=113590(萬人),即1985年我國的人口總數(shù)達到11.359億。17第一節(jié)集中趨勢的度量解:17第一節(jié)集中趨勢的度量【例7-3】東方信托投資公司某筆投資的年收益率是按復(fù)利計算的,該筆投資的年收益情況如表7-3所示,請測算該筆投資25年的平均年收益率。18第一節(jié)集中趨勢的度量年收益率/%環(huán)比增長率/%年數(shù)/F3481015103104108110115148102總計-2518第一節(jié)集中趨勢的度量年收益率/%環(huán)比增長率/%年數(shù)/F解:用幾何平均數(shù)求該筆投資的年收益率

XG=[(103%)1?(104%)4?(108%)8?(110%)10?(115%)2]1/25=(7.6504)1/25=108.48%則該筆投資的年平均收益率為8.48%。19第一節(jié)集中趨勢的度量19第一節(jié)集中趨勢的度量

【例7-4】某汽車公司某年1~12月份生產(chǎn)的平均成本和總成本如表7-4所示。請測算:(1)該公司汽車的月平均生產(chǎn)量;(2)該公司某年汽車的平均生產(chǎn)成本。20第一節(jié)集中趨勢的度量月份平均成本(萬元)生產(chǎn)總成本(億元)12345678910111241.841.442.741.241.643.742.541.641.142.541.641.31421.218632433.914422329.62053.93697.51414.42219.425502329.61858.5總計2561320第一節(jié)集中趨勢的度量月份平均成本(萬元)生產(chǎn)總成本(億解:(1)每個月的生產(chǎn)總成本除以平均成本,就可以得到該公司汽車的月平均生產(chǎn)量,分別為:34,45,57,35,56,47,87,34,54,60,56,45。(2)通過計算加權(quán)調(diào)和平均數(shù),就可以得到該公司汽車的平均生產(chǎn)成本:即該公司汽車的平均生產(chǎn)成本約為42萬元。21第一節(jié)集中趨勢的度量21第一節(jié)集中趨勢的度量公共管理研究或調(diào)查所得到的數(shù)據(jù),大都具有隨機變量的性質(zhì)。而對這些隨機變量的描述,僅有集中趨勢的度量是不夠的。集中量數(shù)只描述數(shù)據(jù)的集中趨勢和典型情況,還不能說明一組數(shù)據(jù)的全貌。對于數(shù)據(jù)變異性即離散趨勢進行度量的一組統(tǒng)計量,稱作差異量數(shù),這些差異量數(shù)有標準差或方差、全距、平均差、四分差及各種百分差等等。如果一組數(shù)據(jù)是產(chǎn)品質(zhì)量檢查的結(jié)果,那么數(shù)據(jù)的變異情況說明生產(chǎn)是否穩(wěn)定;如果數(shù)據(jù)是測量的結(jié)果,那么變異的情況說明測量方法是否正確、儀器是否精密;如果數(shù)據(jù)是學(xué)生的成績,那么變異的情況說明成績是否整齊(而不是高低)。22第二節(jié)離散趨勢的度量22第二節(jié)離散趨勢的度量一、極差極差又稱全距(range),是指總體中最大標志值與最小標志值之差。用極差反映總體分布的離散程度,十分簡便。其計算公式為:其中,

分別為數(shù)據(jù)中的極大值和極小值。23第二節(jié)離散趨勢的度量一、極差23第二節(jié)離散趨勢的度量三、平均差平均差(meanabsolutedeviation,M.D.)是離差(樣本值與均值之差)的絕對值的平均數(shù),即:對于已分組的頻數(shù)分布(組數(shù)為k)平均差反映全部標本數(shù)據(jù)平均的誤差,比極差和四分位差更能全面反映總體的數(shù)據(jù)變動情況,它的缺點是絕對值不適于作進一步的數(shù)學(xué)分析。24第二節(jié)離散趨勢的度量三、平均差24第二節(jié)離散趨勢的度量三、方差與標準差方差(variance)也稱變異數(shù)、均方,常用符號

表示;作為總體參數(shù)時,常用符號

表示。它是每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差平方后的均值,即離均差平方后的平均數(shù)。標準差(standarddeviation)即方差的平方根,常用S或SD表示。若用

表示,則是指總體的標準差。25第二節(jié)離散趨勢的度量三、方差與標準差25第二節(jié)離散趨勢的度量(1)總體方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(2)樣本方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(3)總體標準差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(4)樣本標準差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))26第二節(jié)離散趨勢的度量26第二節(jié)離散趨勢的度量

方差與標準差是表示一組數(shù)據(jù)離散程度的最好、最常用的指標。其值大,說明離散程度大;其值小,說明數(shù)據(jù)比較集中。它基本具備一個良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏;②由一定的計算公式嚴密確定;③容易計算;④適合代數(shù)運算;⑤受抽樣變動的影響?。虎藓唵蚊髁?,這一點與其他差異量數(shù)比較稍有不足,但其意義還是較明白的。除上述之外,方差還具有可加性特點,它是對一組數(shù)據(jù)中造成各種變異的總和的測量,能利用其可加性分解并確定出屬于不同來源的變異性(如組間、組內(nèi)等)并可進一步說明每種變異對總結(jié)果的影響。27第二節(jié)離散趨勢的度量27第二節(jié)離散趨勢的度量五、變差系數(shù)變差系數(shù)又稱變異系數(shù)、相對標準差等,通常用符號CV表示,其計算公式為:其中,S為某樣本的標準差;

為該樣本的平均數(shù)。變異系數(shù)是一個無量綱的量。變差系數(shù)適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的情況。28第二節(jié)離散趨勢的度量五、變差系數(shù)28第二節(jié)離散趨勢的度量六、離散趨勢度量的實例

【例7-5】2012年某大學(xué)公共管理學(xué)院MPA報考人數(shù)為311人,缺考2人,其余309人的英語考試成績?nèi)绫?-5所示,請計算相關(guān)的表征離散趨勢的特征數(shù)。29第二節(jié)離散趨勢的度量六、離散趨勢度量的實例29第二節(jié)離散趨勢的度量302012年某大學(xué)公共管理

學(xué)院MPA報考人員

英語成績83.0082.0078.0063.0067.0077.0062.0065.0076.0067.0068.0073.0073.0074.0065.0075.0063.0076.0060.0065.0065.0068.0064.0073.0059.0060.0064.0070.0048.0067.0055.0061.0061.0062.0075.0077.0061.0067.0049.0062.0068.0072.0052.0063.0073.0059.0062.0066.0073.0054.0060.0062.0065.0069.0042.0050.0072.0079.0055.0055.0056.0057.0067.0073.0050.0052.0055.0057.0060.0044.0061.0062.0065.0045.0053.0060.0068.0054.0073.0055.0045.0054.0062.0041.0041.0056.0058.0061.0064.0054.0065.0075.0075.0046.0051.0051.0053.0075.0048.0049.0050.0053.0056.0059.0061.0036.0044.0047.0052.0058.0058.0040.0044.0047.0050.0056.0065.0057.0048.0051.0053.0053.0059.0060.0060.0035.0042.0045.0046.0054.0066.0034.0046.0038.0040.0047.0068.0042.0054.0043.0046.0054.0056.0081.0035.0036.0038.0056.0057.0061.0049.0037.0038.0044.0037.0040.0045.0045.0057.0057.0037.0038.0041.0045.0047.0049.0060.0066.0041.0042.0051.0038.0043.0046.0053.0063.0063.0030.0045.0049.0056.0034.0043.0054.0045.0046.0046.0049.0057.0042.0044.0041.0043.0045.0021.0040.0037.0036.0040.0045.0058.0030.0034.0035.0044.0060.0025.0053.0039.0043.0047.0048.0049.0011.0034.0036.0045.0048.0050.0026.0034.0042.0043.0033.0034.0020.0034.0044.0028.0042.0045.0049.0036.0039.0049.0037.0038.0043.0027.0033.0041.0041.0021.0033.0070.0033.0052.0025.0027.0036.0039.0046.0027.0030.0035.0033.0034.0020.0024.0026.0027.0031.0027.0035.0048.0031.0034.0038.0029.0022.0037.0024.0025.0031.0048.0039.0033.0029.0031.0034.0030.0032.0034.0016.0019.0030.0036.0030.0028.0024.0026.0032.0023.0034.0031.0019.0023.0024.0017.0010.0016.0028.0014.0024.0021.0014.0015.0048.0015.00302012年某大學(xué)公共管理

學(xué)院MPA報考人員

英語成績8解:(1)極差:R=最大值-最小值=83-10=73(2)四分位差:

(3)方差和標準差。

31第二節(jié)離散趨勢的度量解:31第二節(jié)離散趨勢的度量(4)變差系數(shù)。32第二節(jié)離散趨勢的度量32第二節(jié)離散趨勢的度量集中趨勢和離散趨勢是數(shù)據(jù)分布的兩個重要特征,但要全面了解數(shù)據(jù)分布的特點,還需要知道數(shù)據(jù)分布的形狀是否對稱、偏斜的程度以及分布的扁平程度等。偏斜度和峰度就是對這些分布特征的描述。偏斜度是對數(shù)據(jù)分布的偏移方向和程度所作的進一步描述;峰度是用來對數(shù)據(jù)分布的扁平程度所做的描述。對于偏斜程度的描述用偏斜度系數(shù);扁平程度的描述用峰度系數(shù)。33第三節(jié)偏斜度與峰度的度量33第三節(jié)偏斜度與峰度的度量一、動差法動差又稱矩,原是物理學(xué)上用以表示力與力臂對重心關(guān)系的術(shù)語,這個關(guān)系和統(tǒng)計學(xué)中變量與權(quán)數(shù)對平均數(shù)的關(guān)系在性質(zhì)上很類似,所以統(tǒng)計學(xué)也用動差來說明頻數(shù)分布的性質(zhì)。一般地說,取變量的

值為中點,所有變量值與

之差的K次方的平均數(shù)稱為變量X關(guān)于

的K階動差。用公式表示為:34第三節(jié)偏斜度與峰度的度量一、動差法34第三節(jié)偏斜度與峰度的度量當

時,即變量以原點為中心,上式稱為K階原點動差,用大寫英文字母M表示。一階原點動差:

,即算術(shù)平均數(shù);二階原點動差:

,即平方平均數(shù);三階原點動差:

,等等。當

時,即變量以算術(shù)平均數(shù)為中心,上式稱為K階中心動差,用小寫英文字母m表示。一階中心動差:

;二階中心動差:

;三階中心動差:

;等等。35第三節(jié)偏斜度與峰度的度量35第三節(jié)偏斜度與峰度的度量二、偏斜度偏斜度是對統(tǒng)計數(shù)據(jù)分布偏斜方向及程度的度量。統(tǒng)計數(shù)據(jù)的頻數(shù)分布有的是對稱的,有的是不對稱的,即呈現(xiàn)偏態(tài)。在偏態(tài)的分布中,又有兩種不同的形態(tài),即左偏態(tài)和右偏態(tài)。度量分布偏斜的程度,可計算偏斜度。采用動差法計算偏斜度系數(shù)是用變量的三階中心動差

進行對比,計算公式為:當分布對稱時,變量的三階中心動差

由于離差三次方后正負相互抵消而取得0值,則

;當分布不對稱時,正負離差不能抵消,就形成正的或負的三階中心動差

。當

為正值時,表示正偏離差值比負偏離差值要大,可以判斷為正偏態(tài)或右偏態(tài);反之,當

為負值時,表示負偏離差值比正偏離差值要大,可以判斷為負偏態(tài)或左偏態(tài)。

越大,表示偏斜的程度就越大。由于三階中心動差

含有計量單位,為消除計量單位的影響,就用

去除

,使其轉(zhuǎn)化為相對數(shù)。同樣的,

的絕對值越大,表示偏斜的程度就越大。36第三節(jié)偏斜度與峰度的度量二、偏斜度36第三節(jié)偏斜度與峰度的度量三、峰度峰度是用來衡量統(tǒng)計數(shù)據(jù)分布的集中程度或分布曲線的尖峭程度的指標。計算公式為:當峰度

時,表示分布的形狀比正態(tài)分布更尖更高,這意味著分布比正態(tài)分布更集中在平均數(shù)周圍,這樣的分布稱為尖峰分布;

時,分布為正態(tài)分布;

時,表示分布比正態(tài)分布更扁平,意味著分布比正態(tài)分布更分散,這樣的分布稱為扁平分布。37第三節(jié)偏斜度與峰度的度量三、峰度37第三節(jié)偏斜度與峰度的度量一、SPSS簡介社會科學(xué)統(tǒng)計軟件包(statisticalpackageforthesocialscience,SPSS)是世界上著名的統(tǒng)計分析軟件之一。它由美國斯坦福大學(xué)的三位研究生于1968年研制,同年成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。20世紀80年代以前,SPSS統(tǒng)計軟件主要應(yīng)用于企事業(yè)單位。1984年,SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,極大地擴充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,標志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。38第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用一、SPSS簡介38第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用

SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。39第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用39第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用二、SPSS的基本操作(一)啟動SPSS單擊Windows的[開始]按鈕,在[所有程序]菜單項[IBMSPSSStatistics]中找到[IBMSPSSStatistics20]并單擊(圖7-3)。40第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用二、SPSS的基本操作40第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(二)打開SPSS的主窗口。SPSS啟動成功后,打開SPSS的主窗口[DataView]。SPSS的主窗口名為IBMSPSSStatisticsDataEditor(數(shù)據(jù)編輯窗口),如圖7-4所示。41第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用41第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用在SPSS的主窗口的菜單欄中,共有12個選項:(1)File:文件管理菜單,有關(guān)文件的調(diào)入、存儲、顯示和打印等;(2)Edit:編輯菜單,有關(guān)文本內(nèi)容的選擇、拷貝、剪貼、尋找和替換等;(3)View:視圖菜單,運用“視圖”菜單可顯示或隱藏狀態(tài)行、工具欄、網(wǎng)絡(luò)線、值標簽和改變字體等;(4)Data:數(shù)據(jù)管理菜單,有關(guān)數(shù)據(jù)變量定義、數(shù)據(jù)格式選定、觀察對象的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接、匯總等;(5)Transform:數(shù)據(jù)轉(zhuǎn)換處理菜單,有關(guān)數(shù)值的計算、重新賦值、缺失值替代等;(6)Analyze:統(tǒng)計菜單,有關(guān)一系列統(tǒng)計方法的應(yīng)用;(7)DirectMarketing:直銷菜單,有關(guān)了解顧客、改進行銷活動等;(8)Graphs:作圖菜單,有關(guān)統(tǒng)計圖的制作;(9)Utilities:用戶選項菜單,有關(guān)命令解釋、字體選擇、文件信息、定義輸出標題、窗口設(shè)計等;(10)Window:窗口管理菜單,有關(guān)窗口的排列、選擇、顯示等;(11)Add-ons:附加程序菜單,有關(guān)輸出管理系統(tǒng)控制、數(shù)據(jù)文件注釋、定義和使用變量集、運行腳本、定制對話框等;(12)Help:求助菜單,有關(guān)幫助文件的調(diào)用、查詢、顯示等。42第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用42第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(三)定義變量

打開[VariableView]進入變量定義窗口,對變量進行定義。變量定義包括11個方面的內(nèi)容,分別為:[Name],[Type],[Width],[Decimals],[Label],[Values],[Missing],[Columns],[Align],[Measure],[Role],如圖7-5所示。43第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用43第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(1)[Name]:定義變量名。要求定義變量名,不能超過8個字符(中文和英文均可以),但不能與SPSS軟件運算符相同的一些字符串,如all,and,by,not,or,to,with,eq,ge,gt,le,lt,ne;“(”,“)”,“/”,“?”等符號。(2)[Type]:定義變量類型。SPSS的主要變量類型有:Numeric(標準數(shù)值型)、Comma(帶逗點的數(shù)值型)、Dot(逗點作小數(shù)點的數(shù)值型)、ScientificNotation(科學(xué)記數(shù)法)、Date(日期型)、Dollar(帶美元符號的數(shù)值型)、CustomCurrency(自定義型)、String(字符型)、RestrictedNumeric(Integerwithleadingzeros)(受限數(shù)值,值限于非負整數(shù)的變量,在顯示值時,填充先導(dǎo)0以達到最大變量寬度)。(3)[Width]:設(shè)置變量長度。設(shè)置數(shù)值變量的長度,當變量為日期型時無效。(4)[Decimals]:設(shè)置變量小數(shù)點位數(shù)。設(shè)置數(shù)值變量的小數(shù)點位數(shù),當變量為日期型時無效。(5)[Label]:設(shè)置變量標簽。變量標簽是對變量名的進一步描述,變量只能由不超過8個字符組成,8個字符經(jīng)常不足以表示變量的含義。而變量標簽可長達120個字符,變量標簽對大小寫敏感,顯示時與輸入值完全一樣,需要時可用變量標簽對變量名的含義加以解釋。(6)[Values]:設(shè)置變量值標簽。變量值標簽是對變量值進一步說明,主要針對名義(nominal)變量和等級(ordinal)變量。單擊[Values]相應(yīng)單元,在如圖7-7所示的對話框中進行設(shè)置。44第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用44第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(7)[Missing]:缺失值的定義方式。SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。在數(shù)據(jù)長方形中任何空的數(shù)字單元都被認為系統(tǒng)缺失值,用點號(·)表示。SPSS可以指定那些由于特殊原因造成的信息缺失值,然后將它們標為用戶缺失值,統(tǒng)計過程識別這種標識,帶有缺失值的觀測被特別處理。默認值為[None]。單擊[Values]相應(yīng)單元中的按鈕,可改變?nèi)笔е刀x方式。(8)[Column]:設(shè)置變量的顯示寬度。設(shè)置在屏幕上變量的顯示寬度,默認為8位,也可以根據(jù)需求自己設(shè)置。(9)[Align]:設(shè)置變量顯示的對齊方式。選擇變量值顯示時的對齊方式:[Left](左對齊),[Right](右對齊),[Center](居中對齊)。(10)[Measure]:設(shè)置變量的測量尺度。按測量精度的要求,SPSS將測量變量分為三大類分類變量[Nominal]、順序變量[Ordinal]、等距變量和等比變量[Scale]。等距變量和等比變量經(jīng)常不加以區(qū)別。如果變量為定距變量或定比變量,則在[Measure]相應(yīng)單元的下拉列表中選擇[Scale];如果變量為定序變量,則選擇[Ordinal];如果變量為定類變量,則選擇[Nominal]。(11)[Role]:設(shè)置變量的角色。分配變量的角色:[Input](變量用作輸入)、[Target](變量用作輸出或目標)、[Both](變量同時用作輸入和輸出)、[None](變量沒有角色分配)、[Partition](分區(qū),用于將數(shù)據(jù)劃分為單獨的訓(xùn)練、檢驗和驗證樣本)、[Split](拆分,包括以便與IBMSPSSModeler相互兼容,具有此角色的變量不會在IBMSPSSStatistics中用作拆分文件變量)。45第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用45第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(四)數(shù)據(jù)的輸入與編輯定義了變量后就可以輸入數(shù)據(jù)了。由于各種原因,已經(jīng)輸入的數(shù)據(jù)往往會有錯誤,這就需要進行編輯。用Windows的基本操作方式可實現(xiàn)對數(shù)據(jù)的編輯。46第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用46第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用三、SPSS在描述統(tǒng)計中的應(yīng)用實例

運用SPSS對例7-5中的2012年某大學(xué)公共管理學(xué)院309位MPA考生的英語成績進行初步的統(tǒng)計分析。

運用SPSS進行數(shù)據(jù)的初步統(tǒng)計分析的基本程序如下:(1)在SPSS中錄入原始數(shù)據(jù),建立SPSS數(shù)據(jù)文件;(2)在主菜單中選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies],如圖7-9所示。47第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用三、SPSS在描述統(tǒng)計中的應(yīng)用實例47第四節(jié)SPSS在描述

(3)打開[Frequencies]對話框,把分析變量(X)輸入右框,如圖7-10所示。48第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用48第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用

(4)打開[Statistics]對話框,做如圖7-11所示的選擇,并單擊[Continue]。49第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用49第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(5)打開[Charts]對話框,作如圖7-12所示的選擇,并單擊[Continue]。50第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用50第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用

(6)單擊[Ok],輸出結(jié)果。51第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用

Valid309Missing0Mean47.39Std.Error

of

Mean0.891Median47.00ModeStd.Deviation15.663Variance245.342Skewness-0.017Std.Error

of

Skewness0.139Kurtosis-0.610Std.Error

of

Kurtosis0.276Range73Minimum10Maximum83Sum14643Percentiles1027.002034.002536.003038.004043.005047.006052.007057.007560.008062.009068.00a.Multiple

modes

exist.The

smallest

value

is

shown表7-7基本統(tǒng)計表51第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用Valid309帶曲線的正態(tài)分布圖52第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用52第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用復(fù)習(xí)思考題1.舉例說明什么是集中趨勢。2.集中趨勢有哪些統(tǒng)計特征數(shù),對它們的優(yōu)點和缺點進行比較分析。3.舉例說明什么是離散趨勢。4.離散趨勢有哪些統(tǒng)計特征數(shù),對它們的優(yōu)點和缺點進行比較分析。5.簡要說明偏斜度的概念。6.簡要說明峰度的概念。7.結(jié)合某個研究課題,運用SPSS進行描述性統(tǒng)計分析。53復(fù)習(xí)思考題53

謝謝!54謝謝!54第七章數(shù)據(jù)的描述統(tǒng)計度量分布偏斜的程度課件目錄第一節(jié)集中趨勢的度量第二節(jié)離散趨勢的度量第三節(jié)偏斜度與峰度的度量第四節(jié)SPSS在描述統(tǒng)計中的運用目錄集中趨勢(centraltendency)是指一組數(shù)據(jù)向某中心值靠攏的傾向,集中趨勢的測度實際上就是對數(shù)據(jù)一般水平代表值或中心值的測度。不同類型的數(shù)據(jù)用不同的集中趨勢測度值,選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定。集中趨勢的特征數(shù),是代表一組數(shù)據(jù)典型水平或集中趨勢的統(tǒng)計量。常用的集中趨勢的特征數(shù)包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。57第一節(jié)集中趨勢的度量3第一節(jié)集中趨勢的度量一、算數(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean)簡稱為均數(shù)(mean)。樣本均數(shù)通常用

表示,總體均數(shù)用希臘字母μ表示。算術(shù)平均數(shù)是集中趨勢的最主要測度值。適用于對稱分布,特別是正態(tài)或近似正態(tài)分布的計量資料。根據(jù)所掌握數(shù)據(jù)形式的不同,算術(shù)平均數(shù)有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)。58第一節(jié)集中趨勢的度量一、算數(shù)平均數(shù)4第一節(jié)集中趨勢的度量(1)簡單算術(shù)平均數(shù)(simplearithmeticmean)。未經(jīng)分組整理的原始數(shù)據(jù),其算術(shù)平均數(shù)的計算就是直接將一組數(shù)據(jù)的各個數(shù)值相加除以數(shù)值個數(shù)。計算公式為:(2)加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)。根據(jù)分組整理的數(shù)據(jù)計算的算術(shù)平均數(shù),就要以各組變量值出現(xiàn)的次數(shù)或頻數(shù)為權(quán)數(shù)計算加權(quán)的算術(shù)平均數(shù)。計算公式為:59第一節(jié)集中趨勢的度量5第一節(jié)集中趨勢的度量二、幾何平均數(shù)幾何平均數(shù)(geometricmean),是指社會經(jīng)濟現(xiàn)象的同質(zhì)總體在時間上變動速度的平均數(shù),也即統(tǒng)計總體在一段時期內(nèi)的平均發(fā)展速度。幾何平均數(shù)通常用于計算指數(shù)、百分比和增長速度的平均數(shù)。根據(jù)掌握的數(shù)據(jù)資料不同,幾何平均數(shù)可分為簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種。60第一節(jié)集中趨勢的度量二、幾何平均數(shù)6第一節(jié)集中趨勢的度量(1)簡單幾何平均數(shù)。根據(jù)未經(jīng)分組資料計算平均數(shù)。計算公式為:(2)加權(quán)幾何平均數(shù)。當掌握的數(shù)據(jù)資料為分組資料,且各個變量值出現(xiàn)的次數(shù)不相同時,應(yīng)用加權(quán)方法計算幾何平均數(shù)。計算公式為:61第一節(jié)集中趨勢的度量7第一節(jié)集中趨勢的度量三、中位數(shù)中位數(shù)(median)是一組按大小順序排列的觀察值中位居中間的數(shù)值,通常用

表示。它常用于描述偏態(tài)分布資料的集中趨勢。中位數(shù)是一個位置代表值,因此它不受極端變量值的影響,特別是當分布末端無確定數(shù)據(jù)不能求算術(shù)平均數(shù)和幾何平均數(shù)時,可以用中位數(shù)來表示數(shù)據(jù)分布的集中趨勢。62第一節(jié)集中趨勢的度量三、中位數(shù)8第一節(jié)集中趨勢的度量對于已分組的數(shù)據(jù)來說,中位數(shù)的計算公式為:其中,是到中位數(shù)組前面一組為止的向上累計頻數(shù),

則是到中位數(shù)組后面一組為止的向下累計頻數(shù);

為中位數(shù)組的頻數(shù);i為中位數(shù)組的組距。63第一節(jié)集中趨勢的度量9第一節(jié)集中趨勢的度量四、眾數(shù)眾數(shù)(mode)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用

表示。從變量分布的角度看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應(yīng)的變量值即為眾數(shù)。當然,如果數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點,眾數(shù)也可以不存在;如果有多個高峰點,也就有多個眾數(shù)。在統(tǒng)計實踐中,當一組數(shù)據(jù)出現(xiàn)不同質(zhì)的情況,或分布中出現(xiàn)極端數(shù)據(jù)時,用眾數(shù)來描述數(shù)據(jù)的集中趨勢較為合適。64第一節(jié)集中趨勢的度量四、眾數(shù)10第一節(jié)集中趨勢的度量設(shè)眾數(shù)組的頻數(shù)為

,眾數(shù)前一組的頻數(shù)為

,眾數(shù)后一組的頻數(shù)為

。當眾數(shù)相鄰兩組的頻數(shù)相等時,即

=,眾數(shù)組的組中值即為眾數(shù);當眾數(shù)組的前一組的頻數(shù)多于眾數(shù)組后一組的頻數(shù)時,即

,則眾數(shù)會向其前一組靠,眾數(shù)小于其組中值;當眾數(shù)組后一組的頻數(shù)多于眾數(shù)組前一組的頻數(shù)時,即

,則眾數(shù)會向其后一組靠,眾數(shù)大于其組中值?;谶@種思路,借助于幾何圖形而導(dǎo)出的分組數(shù)據(jù)眾數(shù)的計算公式為:其中,

L表示眾數(shù)所在組的下限;U表示眾數(shù)所在組的上限。上述下限和上限公式是假定數(shù)據(jù)分布具有明顯的集中趨勢,且眾數(shù)組的頻數(shù)在該組內(nèi)是均勻分布的,若這些假定不成立,則眾數(shù)的代表性就會很差。65第一節(jié)集中趨勢的度量11第一節(jié)集中趨勢的度量五、調(diào)和平均數(shù)調(diào)和平均數(shù)(reciprocalmean)也稱倒數(shù)平均數(shù),它是對變量(x)的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù)。根據(jù)掌握的統(tǒng)計資料不同,調(diào)和平均數(shù)可以分為簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。66第一節(jié)集中趨勢的度量五、調(diào)和平均數(shù)12第一節(jié)集中趨勢的度量(1)簡單調(diào)和平均數(shù):(2)加權(quán)調(diào)和平均數(shù):67第一節(jié)集中趨勢的度量13第一節(jié)集中趨勢的度量六、集中趨勢度量的例題分析【例7-1】2010年中國南方某城鎮(zhèn)3200戶家庭的平均每一勞動力年收入的頻數(shù)分布情況如表7-1所示,請計算其算術(shù)平均數(shù)、中位數(shù)和眾數(shù)。68第一節(jié)集中趨勢的度量年收入分組/元組中值X/元頻數(shù)f累積頻數(shù)8000-1700017000-2600026000-3500035000-4400044000-5300053000-62000125002150030500395004850057500700100080040020010070017002500290031003200總計3200六、集中趨勢度量的例題分析14第一節(jié)集中趨勢的度量年收入分解:(1)算術(shù)平均數(shù)(2)中位數(shù)(3)眾數(shù)69第一節(jié)集中趨勢的度量解:15第一節(jié)集中趨勢的度量【例7-2】1950年我國總?cè)丝跒?.5億,1985年達到了10.5億,共計增長了1.9倍(表7-2)。(1)測算1950~1985年,我國平均每5年的人口增長速度;(2)測算1950~1975年,我國平均每5年的人口增長速度;(3)如果1975~1985年期間不實行計劃生育政策,請測算1985年我國的人口總數(shù)。70第一節(jié)集中趨勢的度量年度人口數(shù)/萬人環(huán)比增長速度1950195519601965197019751980198555196614656620772538829929242098705104532-1.1141.0771.0961.1441.1141.0681.05916第一節(jié)集中趨勢的度量年度人口數(shù)/萬人環(huán)比增長速度195

解:(1)MG=1.114?1.077?1.096?1.144?1.144?1.068?1.059)1/7≈1.096,即1950~1985年,我國平均每5年的人口增長速度為9.6%;

(2)MG=(1.114?1.077?1.096?1.144?1.144)1/5≈1.1096,即1950~1975年,我國平均每5年的人口增長速度10.9%;

(3)P=92420?(1.109)2=113590(萬人),即1985年我國的人口總數(shù)達到11.359億。71第一節(jié)集中趨勢的度量解:17第一節(jié)集中趨勢的度量【例7-3】東方信托投資公司某筆投資的年收益率是按復(fù)利計算的,該筆投資的年收益情況如表7-3所示,請測算該筆投資25年的平均年收益率。72第一節(jié)集中趨勢的度量年收益率/%環(huán)比增長率/%年數(shù)/F3481015103104108110115148102總計-2518第一節(jié)集中趨勢的度量年收益率/%環(huán)比增長率/%年數(shù)/F解:用幾何平均數(shù)求該筆投資的年收益率

XG=[(103%)1?(104%)4?(108%)8?(110%)10?(115%)2]1/25=(7.6504)1/25=108.48%則該筆投資的年平均收益率為8.48%。73第一節(jié)集中趨勢的度量19第一節(jié)集中趨勢的度量

【例7-4】某汽車公司某年1~12月份生產(chǎn)的平均成本和總成本如表7-4所示。請測算:(1)該公司汽車的月平均生產(chǎn)量;(2)該公司某年汽車的平均生產(chǎn)成本。74第一節(jié)集中趨勢的度量月份平均成本(萬元)生產(chǎn)總成本(億元)12345678910111241.841.442.741.241.643.742.541.641.142.541.641.31421.218632433.914422329.62053.93697.51414.42219.425502329.61858.5總計2561320第一節(jié)集中趨勢的度量月份平均成本(萬元)生產(chǎn)總成本(億解:(1)每個月的生產(chǎn)總成本除以平均成本,就可以得到該公司汽車的月平均生產(chǎn)量,分別為:34,45,57,35,56,47,87,34,54,60,56,45。(2)通過計算加權(quán)調(diào)和平均數(shù),就可以得到該公司汽車的平均生產(chǎn)成本:即該公司汽車的平均生產(chǎn)成本約為42萬元。75第一節(jié)集中趨勢的度量21第一節(jié)集中趨勢的度量公共管理研究或調(diào)查所得到的數(shù)據(jù),大都具有隨機變量的性質(zhì)。而對這些隨機變量的描述,僅有集中趨勢的度量是不夠的。集中量數(shù)只描述數(shù)據(jù)的集中趨勢和典型情況,還不能說明一組數(shù)據(jù)的全貌。對于數(shù)據(jù)變異性即離散趨勢進行度量的一組統(tǒng)計量,稱作差異量數(shù),這些差異量數(shù)有標準差或方差、全距、平均差、四分差及各種百分差等等。如果一組數(shù)據(jù)是產(chǎn)品質(zhì)量檢查的結(jié)果,那么數(shù)據(jù)的變異情況說明生產(chǎn)是否穩(wěn)定;如果數(shù)據(jù)是測量的結(jié)果,那么變異的情況說明測量方法是否正確、儀器是否精密;如果數(shù)據(jù)是學(xué)生的成績,那么變異的情況說明成績是否整齊(而不是高低)。76第二節(jié)離散趨勢的度量22第二節(jié)離散趨勢的度量一、極差極差又稱全距(range),是指總體中最大標志值與最小標志值之差。用極差反映總體分布的離散程度,十分簡便。其計算公式為:其中,

分別為數(shù)據(jù)中的極大值和極小值。77第二節(jié)離散趨勢的度量一、極差23第二節(jié)離散趨勢的度量三、平均差平均差(meanabsolutedeviation,M.D.)是離差(樣本值與均值之差)的絕對值的平均數(shù),即:對于已分組的頻數(shù)分布(組數(shù)為k)平均差反映全部標本數(shù)據(jù)平均的誤差,比極差和四分位差更能全面反映總體的數(shù)據(jù)變動情況,它的缺點是絕對值不適于作進一步的數(shù)學(xué)分析。78第二節(jié)離散趨勢的度量三、平均差24第二節(jié)離散趨勢的度量三、方差與標準差方差(variance)也稱變異數(shù)、均方,常用符號

表示;作為總體參數(shù)時,常用符號

表示。它是每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差平方后的均值,即離均差平方后的平均數(shù)。標準差(standarddeviation)即方差的平方根,常用S或SD表示。若用

表示,則是指總體的標準差。79第二節(jié)離散趨勢的度量三、方差與標準差25第二節(jié)離散趨勢的度量(1)總體方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(2)樣本方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(3)總體標準差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(4)樣本標準差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))80第二節(jié)離散趨勢的度量26第二節(jié)離散趨勢的度量

方差與標準差是表示一組數(shù)據(jù)離散程度的最好、最常用的指標。其值大,說明離散程度大;其值小,說明數(shù)據(jù)比較集中。它基本具備一個良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏;②由一定的計算公式嚴密確定;③容易計算;④適合代數(shù)運算;⑤受抽樣變動的影響小;⑥簡單明了,這一點與其他差異量數(shù)比較稍有不足,但其意義還是較明白的。除上述之外,方差還具有可加性特點,它是對一組數(shù)據(jù)中造成各種變異的總和的測量,能利用其可加性分解并確定出屬于不同來源的變異性(如組間、組內(nèi)等)并可進一步說明每種變異對總結(jié)果的影響。81第二節(jié)離散趨勢的度量27第二節(jié)離散趨勢的度量五、變差系數(shù)變差系數(shù)又稱變異系數(shù)、相對標準差等,通常用符號CV表示,其計算公式為:其中,S為某樣本的標準差;

為該樣本的平均數(shù)。變異系數(shù)是一個無量綱的量。變差系數(shù)適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的情況。82第二節(jié)離散趨勢的度量五、變差系數(shù)28第二節(jié)離散趨勢的度量六、離散趨勢度量的實例

【例7-5】2012年某大學(xué)公共管理學(xué)院MPA報考人數(shù)為311人,缺考2人,其余309人的英語考試成績?nèi)绫?-5所示,請計算相關(guān)的表征離散趨勢的特征數(shù)。83第二節(jié)離散趨勢的度量六、離散趨勢度量的實例29第二節(jié)離散趨勢的度量842012年某大學(xué)公共管理

學(xué)院MPA報考人員

英語成績83.0082.0078.0063.0067.0077.0062.0065.0076.0067.0068.0073.0073.0074.0065.0075.0063.0076.0060.0065.0065.0068.0064.0073.0059.0060.0064.0070.0048.0067.0055.0061.0061.0062.0075.0077.0061.0067.0049.0062.0068.0072.0052.0063.0073.0059.0062.0066.0073.0054.0060.0062.0065.0069.0042.0050.0072.0079.0055.0055.0056.0057.0067.0073.0050.0052.0055.0057.0060.0044.0061.0062.0065.0045.0053.0060.0068.0054.0073.0055.0045.0054.0062.0041.0041.0056.0058.0061.0064.0054.0065.0075.0075.0046.0051.0051.0053.0075.0048.0049.0050.0053.0056.0059.0061.0036.0044.0047.0052.0058.0058.0040.0044.0047.0050.0056.0065.0057.0048.0051.0053.0053.0059.0060.0060.0035.0042.0045.0046.0054.0066.0034.0046.0038.0040.0047.0068.0042.0054.0043.0046.0054.0056.0081.0035.0036.0038.0056.0057.0061.0049.0037.0038.0044.0037.0040.0045.0045.0057.0057.0037.0038.0041.0045.0047.0049.0060.0066.0041.0042.0051.0038.0043.0046.0053.0063.0063.0030.0045.0049.0056.0034.0043.0054.0045.0046.0046.0049.0057.0042.0044.0041.0043.0045.0021.0040.0037.0036.0040.0045.0058.0030.0034.0035.0044.0060.0025.0053.0039.0043.0047.0048.0049.0011.0034.0036.0045.0048.0050.0026.0034.0042.0043.0033.0034.0020.0034.0044.0028.0042.0045.0049.0036.0039.0049.0037.0038.0043.0027.0033.0041.0041.0021.0033.0070.0033.0052.0025.0027.0036.0039.0046.0027.0030.0035.0033.0034.0020.0024.0026.0027.0031.0027.0035.0048.0031.0034.0038.0029.0022.0037.0024.0025.0031.0048.0039.0033.0029.0031.0034.0030.0032.0034.0016.0019.0030.0036.0030.0028.0024.0026.0032.0023.0034.0031.0019.0023.0024.0017.0010.0016.0028.0014.0024.0021.0014.0015.0048.0015.00302012年某大學(xué)公共管理

學(xué)院MPA報考人員

英語成績8解:(1)極差:R=最大值-最小值=83-10=73(2)四分位差:

(3)方差和標準差。

85第二節(jié)離散趨勢的度量解:31第二節(jié)離散趨勢的度量(4)變差系數(shù)。86第二節(jié)離散趨勢的度量32第二節(jié)離散趨勢的度量集中趨勢和離散趨勢是數(shù)據(jù)分布的兩個重要特征,但要全面了解數(shù)據(jù)分布的特點,還需要知道數(shù)據(jù)分布的形狀是否對稱、偏斜的程度以及分布的扁平程度等。偏斜度和峰度就是對這些分布特征的描述。偏斜度是對數(shù)據(jù)分布的偏移方向和程度所作的進一步描述;峰度是用來對數(shù)據(jù)分布的扁平程度所做的描述。對于偏斜程度的描述用偏斜度系數(shù);扁平程度的描述用峰度系數(shù)。87第三節(jié)偏斜度與峰度的度量33第三節(jié)偏斜度與峰度的度量一、動差法動差又稱矩,原是物理學(xué)上用以表示力與力臂對重心關(guān)系的術(shù)語,這個關(guān)系和統(tǒng)計學(xué)中變量與權(quán)數(shù)對平均數(shù)的關(guān)系在性質(zhì)上很類似,所以統(tǒng)計學(xué)也用動差來說明頻數(shù)分布的性質(zhì)。一般地說,取變量的

值為中點,所有變量值與

之差的K次方的平均數(shù)稱為變量X關(guān)于

的K階動差。用公式表示為:88第三節(jié)偏斜度與峰度的度量一、動差法34第三節(jié)偏斜度與峰度的度量當

時,即變量以原點為中心,上式稱為K階原點動差,用大寫英文字母M表示。一階原點動差:

,即算術(shù)平均數(shù);二階原點動差:

,即平方平均數(shù);三階原點動差:

,等等。當

時,即變量以算術(shù)平均數(shù)為中心,上式稱為K階中心動差,用小寫英文字母m表示。一階中心動差:

;二階中心動差:

;三階中心動差:

;等等。89第三節(jié)偏斜度與峰度的度量35第三節(jié)偏斜度與峰度的度量二、偏斜度偏斜度是對統(tǒng)計數(shù)據(jù)分布偏斜方向及程度的度量。統(tǒng)計數(shù)據(jù)的頻數(shù)分布有的是對稱的,有的是不對稱的,即呈現(xiàn)偏態(tài)。在偏態(tài)的分布中,又有兩種不同的形態(tài),即左偏態(tài)和右偏態(tài)。度量分布偏斜的程度,可計算偏斜度。采用動差法計算偏斜度系數(shù)是用變量的三階中心動差

進行對比,計算公式為:當分布對稱時,變量的三階中心動差

由于離差三次方后正負相互抵消而取得0值,則

;當分布不對稱時,正負離差不能抵消,就形成正的或負的三階中心動差

。當

為正值時,表示正偏離差值比負偏離差值要大,可以判斷為正偏態(tài)或右偏態(tài);反之,當

為負值時,表示負偏離差值比正偏離差值要大,可以判斷為負偏態(tài)或左偏態(tài)。

越大,表示偏斜的程度就越大。由于三階中心動差

含有計量單位,為消除計量單位的影響,就用

去除

,使其轉(zhuǎn)化為相對數(shù)。同樣的,

的絕對值越大,表示偏斜的程度就越大。90第三節(jié)偏斜度與峰度的度量二、偏斜度36第三節(jié)偏斜度與峰度的度量三、峰度峰度是用來衡量統(tǒng)計數(shù)據(jù)分布的集中程度或分布曲線的尖峭程度的指標。計算公式為:當峰度

時,表示分布的形狀比正態(tài)分布更尖更高,這意味著分布比正態(tài)分布更集中在平均數(shù)周圍,這樣的分布稱為尖峰分布;

時,分布為正態(tài)分布;

時,表示分布比正態(tài)分布更扁平,意味著分布比正態(tài)分布更分散,這樣的分布稱為扁平分布。91第三節(jié)偏斜度與峰度的度量三、峰度37第三節(jié)偏斜度與峰度的度量一、SPSS簡介社會科學(xué)統(tǒng)計軟件包(statisticalpackageforthesocialscience,SPSS)是世界上著名的統(tǒng)計分析軟件之一。它由美國斯坦福大學(xué)的三位研究生于1968年研制,同年成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。20世紀80年代以前,SPSS統(tǒng)計軟件主要應(yīng)用于企事業(yè)單位。1984年,SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,極大地擴充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,標志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。92第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用一、SPSS簡介38第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用

SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。93第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用39第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用二、SPSS的基本操作(一)啟動SPSS單擊Windows的[開始]按鈕,在[所有程序]菜單項[IBMSPSSStatistics]中找到[IBMSPSSStatistics20]并單擊(圖7-3)。94第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用二、SPSS的基本操作40第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(二)打開SPSS的主窗口。SPSS啟動成功后,打開SPSS的主窗口[DataView]。SPSS的主窗口名為IBMSPSSStatisticsDataEditor(數(shù)據(jù)編輯窗口),如圖7-4所示。95第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用41第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用在SPSS的主窗口的菜單欄中,共有12個選項:(1)File:文件管理菜單,有關(guān)文件的調(diào)入、存儲、顯示和打印等;(2)Edit:編輯菜單,有關(guān)文本內(nèi)容的選擇、拷貝、剪貼、尋找和替換等;(3)View:視圖菜單,運用“視圖”菜單可顯示或隱藏狀態(tài)行、工具欄、網(wǎng)絡(luò)線、值標簽和改變字體等;(4)Data:數(shù)據(jù)管理菜單,有關(guān)數(shù)據(jù)變量定義、數(shù)據(jù)格式選定、觀察對象的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接、匯總等;(5)Transform:數(shù)據(jù)轉(zhuǎn)換處理菜單,有關(guān)數(shù)值的計算、重新賦值、缺失值替代等;(6)Analyze:統(tǒng)計菜單,有關(guān)一系列統(tǒng)計方法的應(yīng)用;(7)DirectMarketing:直銷菜單,有關(guān)了解顧客、改進行銷活動等;(8)Graphs:作圖菜單,有關(guān)統(tǒng)計圖的制作;(9)Utilities:用戶選項菜單,有關(guān)命令解釋、字體選擇、文件信息、定義輸出標題、窗口設(shè)計等;(10)Window:窗口管理菜單,有關(guān)窗口的排列、選擇、顯示等;(11)Add-ons:附加程序菜單,有關(guān)輸出管理系統(tǒng)控制、數(shù)據(jù)文件注釋、定義和使用變量集、運行腳本、定制對話框等;(12)Help:求助菜單,有關(guān)幫助文件的調(diào)用、查詢、顯示等。96第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用42第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(三)定義變量

打開[VariableView]進入變量定義窗口,對變量進行定義。變量定義包括11個方面的內(nèi)容,分別為:[Name],[Type],[Width],[Decimals],[Label],[Values],[Missing],[Columns],[Align],[Measure],[Role],如圖7-5所示。97第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用43第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(1)[Name]:定義變量名。要求定義變量名,不能超過8個字符(中文和英文均可以),但不能與SPSS軟件運算符相同的一些字符串,如all,and,by,not,or,to,with,eq,ge,gt,le,lt,ne;“(”,“)”,“/”,“?”等符號。(2)[Type]:定義變量類型。SPSS的主要變量類型有:Numeric(標準數(shù)值型)、Comma(帶逗點的數(shù)值型)、Dot(逗點作小數(shù)點的數(shù)值型)、ScientificNo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論