第四章連續(xù)變量的描述統(tǒng)計(jì)_第1頁
第四章連續(xù)變量的描述統(tǒng)計(jì)_第2頁
第四章連續(xù)變量的描述統(tǒng)計(jì)_第3頁
第四章連續(xù)變量的描述統(tǒng)計(jì)_第4頁
第四章連續(xù)變量的描述統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章連續(xù)變量的描述統(tǒng)計(jì)1.連續(xù)變量的統(tǒng)計(jì)描述概述連續(xù)變量的統(tǒng)計(jì)描述概述2. 集中趨勢(shì)的描述指標(biāo)集中趨勢(shì)的描述指標(biāo)3.離散趨勢(shì)的描述指標(biāo)離散趨勢(shì)的描述指標(biāo)4.實(shí)例操作實(shí)例操作Part 2:第四章:第四章 連續(xù)變量的描述統(tǒng)計(jì)連續(xù)變量的描述統(tǒng)計(jì)學(xué)習(xí)要求學(xué)習(xí)要求掌握SPSS軟件中用于連續(xù)變量統(tǒng)計(jì)描述的Explore、Frequencies、Descriptive過程學(xué)習(xí)要求學(xué)習(xí)要求理解連續(xù)變量的均值、方差等統(tǒng)計(jì)描述指標(biāo)4.1 4.1 連續(xù)變量的統(tǒng)計(jì)描述概述連續(xù)變量的統(tǒng)計(jì)描述概述統(tǒng)計(jì)描述的工具統(tǒng)計(jì)描述的工具統(tǒng)計(jì)圖統(tǒng)計(jì)圖 統(tǒng)計(jì)表統(tǒng)計(jì)表統(tǒng)計(jì)描述指標(biāo)統(tǒng)計(jì)描述指標(biāo) 數(shù)據(jù)分布的特征數(shù)據(jù)分布的特征集中趨勢(shì)集中趨勢(shì)

2、 ( (位置位置) )離中趨勢(shì)離中趨勢(shì) ( (分散程度分散程度) )偏態(tài)和峰度偏態(tài)和峰度(形狀)(形狀)連續(xù)變量統(tǒng)計(jì)描述的常用指標(biāo)連續(xù)變量統(tǒng)計(jì)描述的常用指標(biāo)均值均值眾數(shù)眾數(shù)中位數(shù)中位數(shù)極差極差四分位差四分位差方差方差統(tǒng)計(jì)描述指標(biāo)統(tǒng)計(jì)描述指標(biāo)集中趨勢(shì)集中趨勢(shì)離散趨勢(shì)離散趨勢(shì)4.2 4.2 集中趨勢(shì)的描述指標(biāo)集中趨勢(shì)的描述指標(biāo) 一組數(shù)據(jù)向其中心值靠攏的傾向和程度;一組數(shù)據(jù)向其中心值靠攏的傾向和程度; 測度集中趨勢(shì)就是尋找數(shù)據(jù)一般水平的代表值或中心值;測度集中趨勢(shì)就是尋找數(shù)據(jù)一般水平的代表值或中心值;集中趨勢(shì)測度均值集中趨勢(shì)測度均值 集中趨勢(shì)的測度值之一;集中趨勢(shì)的測度值之一; 最常用的測度值;最常

3、用的測度值; 一組數(shù)據(jù)的均衡點(diǎn)所在;一組數(shù)據(jù)的均衡點(diǎn)所在; 設(shè)一組數(shù)據(jù)為:設(shè)一組數(shù)據(jù)為:x1 ,x2 , ,xn ,簡單算術(shù)平均數(shù)的計(jì)算公式為:,簡單算術(shù)平均數(shù)的計(jì)算公式為:nxnxxxxniin121集中趨勢(shì)測度中位數(shù)集中趨勢(shì)測度中位數(shù)集中趨勢(shì)的測度值之一;集中趨勢(shì)的測度值之一;排序后處于中間位置上的值:排序后處于中間位置上的值:Me50%50%集中趨勢(shì)測度眾數(shù)集中趨勢(shì)測度眾數(shù) 集中趨勢(shì)的測度值之一;集中趨勢(shì)的測度值之一; 出現(xiàn)次數(shù)最多的變量值;出現(xiàn)次數(shù)最多的變量值;數(shù)據(jù)類型與集中趨勢(shì)測度值數(shù)據(jù)類型與集中趨勢(shì)測度值數(shù)據(jù)類型和所適用的集中趨勢(shì)測度值數(shù)據(jù)類型和所適用的集中趨勢(shì)測度值數(shù)據(jù)類型定類數(shù)

4、據(jù) 定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值眾數(shù)中位數(shù)均值均值四分位數(shù)眾數(shù)調(diào)和平均數(shù)眾數(shù)中位數(shù)幾何平均數(shù)四分位數(shù) 中位數(shù)四分位數(shù)眾數(shù)4.3 4.3 離中趨勢(shì)的描述指標(biāo)離中趨勢(shì)的描述指標(biāo) 數(shù)據(jù)分布的另一個(gè)重要特征;數(shù)據(jù)分布的另一個(gè)重要特征; 離中趨勢(shì)的各測度值是對(duì)數(shù)據(jù)離散程度所作的描述;離中趨勢(shì)的各測度值是對(duì)數(shù)據(jù)離散程度所作的描述; 反映各變量值遠(yuǎn)離其中心值的程度從另一個(gè)側(cè)面,從令一側(cè)面說反映各變量值遠(yuǎn)離其中心值的程度從另一個(gè)側(cè)面,從令一側(cè)面說明了集中趨勢(shì)測度值的代表程度;明了集中趨勢(shì)測度值的代表程度;離中趨勢(shì)測度極差離中趨勢(shì)測度極差離散程度的測度值之一;離散程度的測度值之一;一組數(shù)據(jù)的最大值與最小

5、值之差,計(jì)算公式為:一組數(shù)據(jù)的最大值與最小值之差,計(jì)算公式為: R = max(xi) - min(xi)離中趨勢(shì)測度方差離中趨勢(shì)測度方差離散程度最常用的測度值;離散程度最常用的測度值;反映了各變量值與均值的平均差異;反映了各變量值與均值的平均差異;計(jì)算公式:計(jì)算公式:nxxnii122)(離中趨勢(shì)測度四分位差離中趨勢(shì)測度四分位差離中趨勢(shì)的測度值之一;離中趨勢(shì)的測度值之一;排序后處于排序后處于75%和和25%位置上的值的差位置上的值的差 :數(shù)據(jù)類型與離中趨勢(shì)測度值數(shù)據(jù)類型與離中趨勢(shì)測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型數(shù)據(jù)類型定類數(shù)據(jù)定類數(shù)據(jù) 定序數(shù)據(jù)定

6、序數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)適適用用的的測測度度值值四分位差四分位差 方差或標(biāo)準(zhǔn)差方差或標(biāo)準(zhǔn)差 離散系數(shù)(比較時(shí)用)離散系數(shù)(比較時(shí)用) 平均差平均差 極差極差 四分位差四分位差4.4 4.4 數(shù)據(jù)分布的形狀測度數(shù)據(jù)分布的形狀測度扁平分布尖峰分布峰度峰度左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)與標(biāo)準(zhǔn)正態(tài)分布比較!分布比較!偏態(tài)偏態(tài)數(shù)據(jù)分布的形狀測度偏態(tài)數(shù)據(jù)分布的形狀測度偏態(tài)數(shù)據(jù)分布偏斜程度的測度;數(shù)據(jù)分布偏斜程度的測度;計(jì)算公式:計(jì)算公式:偏態(tài)系數(shù)偏態(tài)系數(shù)=0為對(duì)稱分布;為對(duì)稱分布; 偏態(tài)系數(shù)偏態(tài)系數(shù)0為右偏分布;為右偏分布; 偏態(tài)系數(shù)偏態(tài)系數(shù)0為左偏分布。為左偏分布。3113niiniiif

7、fxx算例算例【例】已知2007年我國農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如下表。試計(jì)算偏態(tài)系數(shù)。2007年年農(nóng)村居民家庭純收入數(shù)據(jù)農(nóng)村居民家庭純收入數(shù)據(jù)按純收入分組(元)戶數(shù)比重(%)500以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94計(jì)算過程計(jì)算過程農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計(jì)算表農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計(jì)算表按純收入分組(百元)組中值xi戶數(shù)比重(%)fi(xi- x

8、) fi3(xi- x ) fi45以下5101015152020252530303535404045455050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合計(jì)1001689.257

9、2521.25計(jì)算結(jié)果計(jì)算結(jié)果根據(jù)上表數(shù)據(jù)計(jì)算得:將計(jì)算結(jié)果代入公式得:結(jié)論:結(jié)論:偏態(tài)系數(shù)為正值,說明農(nóng)村居民家庭純收入的分布為右偏分布。956. 07339.176625.1689089.12429.21311133113iiiniiniiifxffxx429.21.11niiiniiffxx089.12.11niiiniiffx農(nóng)村居民家庭純收入數(shù)據(jù)的直方圖農(nóng)村居民家庭純收入數(shù)據(jù)的直方圖結(jié)論結(jié)論說明農(nóng)村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù)。按純收入分組按純收入分組(元元)10戶戶數(shù)數(shù)比比重重(% %)數(shù)據(jù)分布的形狀測度峰度數(shù)據(jù)分布的形狀測度峰

10、度數(shù)據(jù)分布扁平程度的測度;數(shù)據(jù)分布扁平程度的測度;計(jì)算公式:計(jì)算公式:峰度系數(shù)峰度系數(shù)=3扁平程度適中;扁平程度適中; 峰度系數(shù)峰度系數(shù)3為尖峰分布。為尖峰分布。4114niiniiiffxx4.5 4.5 連續(xù)變量的統(tǒng)計(jì)描述實(shí)例操作連續(xù)變量的統(tǒng)計(jì)描述實(shí)例操作【例例】:某班:某班3030名學(xué)生名學(xué)生統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)期末考試成績?nèi)缦?,試?duì)該考試進(jìn)行統(tǒng)期末考試成績?nèi)缦拢噷?duì)該考試進(jìn)行統(tǒng)計(jì)描述分析。計(jì)描述分析。 117 122 124 129 107 117 130 122 110 118 123 126 127 123 118 112 100 125 117 122 126 122 118 108 1

11、12 127 123 119 113 120描述統(tǒng)計(jì)過程描述統(tǒng)計(jì)過程SPSSSPSS軟件中用于連續(xù)變量統(tǒng)計(jì)描述的工具主要有軟件中用于連續(xù)變量統(tǒng)計(jì)描述的工具主要有FrequenciesFrequencies、Descriptive Descriptive 、 Explore Explore三大過程。三大過程。FrequenciesFrequencies過程過程頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,F(xiàn)requenciesFrequencies過程就是過程就是專門為產(chǎn)生頻數(shù)表而設(shè)計(jì)的。專門為產(chǎn)生頻數(shù)表而設(shè)計(jì)的。FrequenciesFrequencies

12、過程不僅可以產(chǎn)生詳細(xì)的頻數(shù)表,還可以按要求給出百分過程不僅可以產(chǎn)生詳細(xì)的頻數(shù)表,還可以按要求給出百分位點(diǎn)的數(shù)值,以及常用的條圖、圓圖等統(tǒng)計(jì)圖。位點(diǎn)的數(shù)值,以及常用的條圖、圓圖等統(tǒng)計(jì)圖。統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)成績成績【例】:某班30名學(xué)生統(tǒng)計(jì)學(xué)期末考試成績?nèi)缦?,試?duì)該考試進(jìn)行分析。117117117117123123112112126126127127122122130130126126100100122122123123124124122122127127125125118118119119129129110110123123117117108108113113107107118118118118122

13、122112112120120主對(duì)話框主對(duì)話框選擇要分析的變量選擇要分析的變量選定頻數(shù)表格式選定頻數(shù)表格式做統(tǒng)計(jì)圖做統(tǒng)計(jì)圖定義需計(jì)算的統(tǒng)計(jì)量定義需計(jì)算的統(tǒng)計(jì)量StatisticsStatistics子對(duì)話框子對(duì)話框離散趨勢(shì)離散趨勢(shì)集中趨勢(shì)集中趨勢(shì)百分位數(shù)百分位數(shù)分布分布結(jié)果輸出表格結(jié)果輸出表格StatisticsStatistics成績300119.231.290121.001227.06549.909-.828.427.511.833301001303577116.00121.00124.25ValidMissingNMeanStd. Error of MeanMedianModeStd.

14、DeviationVarianceSkewnessStd. Error of SkewnessKurtosisStd. Error of KurtosisRangeMinimumMaximumSum255075PercentilesFrequencies過程的表格輸出不僅主要有均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差等過程的表格輸出不僅主要有均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差等等常用的描述統(tǒng)計(jì)指標(biāo)。等常用的描述統(tǒng)計(jì)指標(biāo)。ChartsCharts子對(duì)話框子對(duì)話框條圖條圖正態(tài)曲線正態(tài)曲線直方圖直方圖餅圖餅圖Charts子對(duì)話框子對(duì)話框主要主要是定義輸出的圖形類型:條圖、餅圖、直方圖。是定義輸出的圖形類型:條圖、餅圖、直

15、方圖。結(jié)果輸出直方圖結(jié)果輸出直方圖FormatFormat子對(duì)話框子對(duì)話框限制分組數(shù)限制分組數(shù)選擇兩個(gè)以上變量選擇兩個(gè)以上變量作頻數(shù)表作頻數(shù)表定義頻數(shù)表定義頻數(shù)表排列順序排列順序Format 子對(duì)話框子對(duì)話框主要主要是定義輸出頻數(shù)表的格式。是定義輸出頻數(shù)表的格式。DescriptiveDescriptive過程過程它可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo),它可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo),這和其他過程相比并無不同。這和其他過程相比并無不同。該過程可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分值,并以變量的形式存入數(shù)據(jù)該過程可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分值,并以變量的

16、形式存入數(shù)據(jù)庫供以后分析。庫供以后分析。主對(duì)話框主對(duì)話框選擇要分析的變量選擇要分析的變量OptionsOptions子對(duì)話框子對(duì)話框Options子對(duì)話框子對(duì)話框主要是選擇需要輸出的描述統(tǒng)計(jì)指標(biāo):均值、中位數(shù)、主要是選擇需要輸出的描述統(tǒng)計(jì)指標(biāo):均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差等等。眾數(shù)、標(biāo)準(zhǔn)差等等。D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s30301001303577119.231.2907.06549.909-.828.427.511.83330成績Valid N (listwise)StatisticStati

17、sticStatisticStatisticStatisticStatisticStd. ErrorStatisticStatisticStatisticStd. ErrorStatisticStd. ErrorNRangeMinimumMaximumSumMeanStd.DeviationVarianceSkewnessKurtosis結(jié)果輸出表格結(jié)果輸出表格ExploreExplore過程過程可對(duì)變量進(jìn)行更深入詳盡的描述性統(tǒng)計(jì)分析,主要用于對(duì)資料的性質(zhì)、可對(duì)變量進(jìn)行更深入詳盡的描述性統(tǒng)計(jì)分析,主要用于對(duì)資料的性質(zhì)、分布特點(diǎn)等完全不清楚時(shí),故又稱為探索性分析。分布特點(diǎn)等完全不清楚時(shí),故又稱為

18、探索性分析。在常用的描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,它增加了有關(guān)數(shù)據(jù)詳細(xì)分布特征在常用的描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,它增加了有關(guān)數(shù)據(jù)詳細(xì)分布特征的文字與圖形描述,如莖葉圖、箱式圖等。的文字與圖形描述,如莖葉圖、箱式圖等。主對(duì)話框主對(duì)話框選入所需分析變量選入所需分析變量選定分組變量選定分組變量選定標(biāo)簽變量選定標(biāo)簽變量選定結(jié)果中包括的內(nèi)容選定結(jié)果中包括的內(nèi)容StatisticsStatistics子對(duì)話框子對(duì)話框所有以上兩個(gè)過所有以上兩個(gè)過程有的指標(biāo)程有的指標(biāo)集中趨勢(shì)集中趨勢(shì)輸出輸出5個(gè)個(gè)最大與最大與最小值最小值百分位數(shù)百分位數(shù)PlotsPlots子對(duì)話框子對(duì)話框箱式圖的繪制方箱式圖的繪制方式式莖葉圖和直莖葉圖和直方圖方圖正態(tài)圖正態(tài)圖和正態(tài)和正態(tài)檢驗(yàn)檢驗(yàn)判斷離散程度是否相同(比較合適的判斷離散程度是否相同(比較合適的變量變換方法)變量變換方法)結(jié)果輸出表格結(jié)果輸出表格C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論