數(shù)據(jù)描述分析_第1頁(yè)
數(shù)據(jù)描述分析_第2頁(yè)
數(shù)據(jù)描述分析_第3頁(yè)
數(shù)據(jù)描述分析_第4頁(yè)
數(shù)據(jù)描述分析_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章數(shù)據(jù)描述與分析本章內(nèi)容?3.1集中趨勢(shì)的測(cè)定與分析?

3.2離中趨勢(shì)的測(cè)定與分析?

3.3分布形態(tài)的測(cè)定與分析?

3.4描述統(tǒng)計(jì)分析工具的使用下一頁(yè)返回目錄1第三章數(shù)據(jù)描述與分析3.1集中趨勢(shì)的測(cè)定與分析?

3.1.1集中趨勢(shì)的測(cè)定內(nèi)容?

3.1.2用Excel函數(shù)描述集中趨勢(shì)?

3.1.3三種平均數(shù)的特點(diǎn)?

3.1.4案例研究-網(wǎng)上沖浪者的年齡上一頁(yè)下一頁(yè)返回本章首頁(yè)2第三章數(shù)據(jù)描述與分析3.1.1集中趨勢(shì)的測(cè)定內(nèi)容

在上圖的分布中,各個(gè)變量值與中間位置的距離越近,所出現(xiàn)的次越多,與中間位置的距離越遠(yuǎn),所出現(xiàn)的次數(shù)越少,從而形成了以中間值為中心的集中趨勢(shì)。集中趨勢(shì)是現(xiàn)象共性的特征,是現(xiàn)象規(guī)律性的數(shù)量表現(xiàn)。用均值來(lái)描述總體分布的集中趨勢(shì)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)3第三章數(shù)據(jù)描述與分析3.1.2

用Excel工作表函數(shù)

描述集中趨勢(shì)在Excel中既可手工創(chuàng)建公式計(jì)算各種平均數(shù),也可利用Excel中的統(tǒng)計(jì)函數(shù)。在“統(tǒng)計(jì)函數(shù)”類別中用于集中趨勢(shì)測(cè)定的常用函數(shù)有三種:均值、中位數(shù)和眾數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)4第三章數(shù)據(jù)描述與分析

1.Excel的平均數(shù)函數(shù)

(1)均值函數(shù)(AVERAGE)

均值函數(shù)是應(yīng)用比較廣泛的一種平均數(shù)函數(shù),它能夠計(jì)算一組數(shù)據(jù)的算術(shù)平均數(shù)。其語(yǔ)法結(jié)構(gòu)為:AVERAGE(number1,number2,...)。其中:number1,number2,...為要計(jì)算平均數(shù)的1~30個(gè)參數(shù)。

均值的計(jì)算公式為:。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)5第三章數(shù)據(jù)描述與分析(2)中位數(shù)函數(shù)(MEDIAN)中位數(shù)函數(shù)用于描述居于數(shù)據(jù)分布中心位置的數(shù)值。其語(yǔ)法結(jié)構(gòu)為:MEDIAN(number1,number2,...)。其中:number1,number2,...是需要找出中位數(shù)的1~30個(gè)數(shù)字參數(shù)。(3)眾數(shù)函數(shù)(MODE)眾數(shù)函數(shù)用于計(jì)算一組數(shù)據(jù)中出現(xiàn)頻率最多的數(shù)值。其語(yǔ)法結(jié)構(gòu)為:MODE(number1,number2,...)。其中:number1,number2,...是用于眾數(shù)計(jì)算的1~30個(gè)參數(shù),也可以使用單一數(shù)組(即對(duì)數(shù)組區(qū)域的引用)來(lái)代替由逗號(hào)分隔的參數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)6第三章數(shù)據(jù)描述與分析(4)切尾均值函數(shù)(TRIMMEAN)

返回?cái)?shù)據(jù)分布中心部分的算術(shù)平均值。其語(yǔ)法結(jié)構(gòu)為:TRIMMEAN(array,percent)。其中:Array為需要進(jìn)行篩選并求平均值的數(shù)組或數(shù)據(jù)區(qū)域。Percent為計(jì)算時(shí)所要除去的數(shù)據(jù)點(diǎn)的比例。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)7第三章數(shù)據(jù)描述與分析2.均值函數(shù)的使用例

某企業(yè)的生產(chǎn)部門使用抽樣方法檢測(cè)一批新產(chǎn)品的質(zhì)量,該批產(chǎn)品的抗拉強(qiáng)度見(jiàn)“原始數(shù)據(jù)”。管理人員希望知道這批產(chǎn)品的抗拉強(qiáng)度的平均水平,以決定產(chǎn)品質(zhì)量是否合格。由此需要計(jì)算抗拉強(qiáng)度的均值、中位數(shù)與眾數(shù)。

操作步驟如下:上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)8第三章數(shù)據(jù)描述與分析①打開(kāi)“第3章數(shù)據(jù)描述分析.xls”工作簿,選擇“抗拉強(qiáng)

度”工作表。如圖所示:

②在單元格A7中輸入“均值”,在A8中輸入“中位數(shù)”,

在A9中輸入“眾數(shù)”。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)9第三章數(shù)據(jù)描述與分析③選定單元格B7,單擊“插入”菜單,選擇“函數(shù)”選項(xiàng),Excel會(huì)彈出“粘貼函數(shù)”對(duì)話框窗口。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)10第三章數(shù)據(jù)描述與分析④在“函數(shù)分類”列表中選擇“統(tǒng)計(jì)”,在“函數(shù)名”

列表中選均值函數(shù)“AVERAGE”。單擊“確定”,

則彈出“AVERAGE”函數(shù)對(duì)話窗口。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)11第三章數(shù)據(jù)描述與分析⑤在“Number1”區(qū)域中輸入數(shù)據(jù)B2:B6后,對(duì)話窗口底部便顯示出計(jì)算結(jié)果30。如果對(duì)話窗口中沒(méi)有計(jì)算結(jié)果,便說(shuō)明計(jì)算有錯(cuò)誤,需要再檢查一下。⑥單擊“確定”按鈕,計(jì)算完成。⑦也可以直接在單元格B7中輸入均值函數(shù)公式“=AVERAGE(B2:B6)”,然后敲回車鍵,得到同樣結(jié)果。⑧在單元格B8中輸入公式“=MEDIAN(B2:B6)”計(jì)算中位數(shù)。⑨在單元格B9中輸入公式“=MODE(B2:B6))”計(jì)算眾數(shù)。計(jì)算結(jié)果如圖所示:上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)12第三章數(shù)據(jù)描述與分析計(jì)算結(jié)果表明,抗拉強(qiáng)度的均值是30,中位數(shù)也是30,由于數(shù)據(jù)中的數(shù)值所出現(xiàn)的次數(shù)都為1,所以沒(méi)有眾數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)13第三章數(shù)據(jù)描述與分析3.1.3三種平均數(shù)的特點(diǎn)

均值是所有的標(biāo)志值之和除以其觀察值的個(gè)數(shù)。它考慮了所有數(shù)值,因而均值的大小受總體中極端數(shù)值的影響。如果總體中有極大值出現(xiàn),則會(huì)使均值偏于分布的右邊,如果總體中出現(xiàn)極小值,均值則會(huì)偏于分布的左邊。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)14第三章數(shù)據(jù)描述與分析眾數(shù)

眾數(shù)是總體中出現(xiàn)次數(shù)最多的數(shù)值,它只考慮總體中各數(shù)值出現(xiàn)頻數(shù)的多少,不受極端數(shù)值的影響,但當(dāng)總體中出現(xiàn)多個(gè)眾數(shù)時(shí),眾數(shù)便沒(méi)有意義。

中位數(shù)

中位數(shù)只是考慮各單位數(shù)值在總體中的順序變化,它受極端數(shù)值的影響不大。

三種平均數(shù)的這些特點(diǎn)通過(guò)Excel更容易理解。下面通過(guò)修改例題中的數(shù)據(jù)來(lái)觀察三種平均數(shù)的變化。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)15第三章數(shù)據(jù)描述與分析3.1.4案例研究:網(wǎng)上

沖浪者的年齡據(jù)報(bào)道,越來(lái)越多的人熱心于網(wǎng)上沖浪,因?yàn)樗軌虼蜷_(kāi)空間的界限,帶給人許多新的知識(shí)?,F(xiàn)隨機(jī)抽取一些上網(wǎng)人進(jìn)行調(diào)查,得知其年齡數(shù)據(jù)如下:22、58、24、50、29、52、57、31、30、41、44、40、46、29、31、37、32、44、49、29。試根據(jù)此樣本資料對(duì)網(wǎng)上沖浪者的年齡水平給以描述。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)16第三章數(shù)據(jù)描述與分析操作步驟如下:

①打開(kāi)“第3章數(shù)據(jù)描述分析.xls”工作簿,選擇

“網(wǎng)上沖浪”工作表。

②在單元格A22:A25中分別輸入“均值”、“中位數(shù)”、“眾數(shù)”和“切尾平均數(shù)”。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)17第三章數(shù)據(jù)描述與分析③在單元格B22中輸入公式“=AVERAGE(B2:B21)”,計(jì)算均值為為38.75。④在單元格B23中輸入公式“=MEDIAN(B2:B21)”,計(jì)算中位數(shù)為38.5。⑤在單元格B24中輸入公式“=MODE(B2:B21)”,計(jì)算眾數(shù)為29。⑥在單元格B25中輸入公式“=TRIMMEAN(B2:B21,0.05)”,便在兩端各切掉5%,其平均值為38.75。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)18第三章數(shù)據(jù)描述與分析3.2離中趨勢(shì)的測(cè)定與分析3.2.1離中趨勢(shì)的測(cè)定內(nèi)容3.2.2用Excel函數(shù)計(jì)算標(biāo)準(zhǔn)差3.2.3四分位數(shù)與四分位距3.2.4案例研究:磁盤存儲(chǔ)量質(zhì)量控制上一頁(yè)下一頁(yè)返回本章首頁(yè)19第三章數(shù)據(jù)描述與分析3.2.1離中趨勢(shì)的測(cè)定內(nèi)容

如下如所示,三個(gè)不同的曲線表示三個(gè)不同的總體,其均值相同,但離中趨勢(shì)不同。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)20第三章數(shù)據(jù)描述與分析離中趨勢(shì)

用于測(cè)定數(shù)據(jù)集中各數(shù)值之間的差異程度。表現(xiàn)在一個(gè)分布中各數(shù)值與均值的離差程度。它的作用主要有以下三方面:

?用于說(shuō)明均值的代表性大小

?反映現(xiàn)象的質(zhì)量與風(fēng)險(xiǎn)

?用于統(tǒng)計(jì)推斷。

標(biāo)準(zhǔn)差的計(jì)算公式:

總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差:上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)21第三章數(shù)據(jù)描述與分析3.2.2用Excel函數(shù)計(jì)算標(biāo)準(zhǔn)差可以利用Excel來(lái)創(chuàng)建公式進(jìn)行標(biāo)準(zhǔn)差測(cè)定,也可以利用Excel中的工作表函數(shù)來(lái)直接進(jìn)行計(jì)算。在Excel中用于計(jì)算標(biāo)準(zhǔn)差的函數(shù)有兩個(gè)。(1)總體標(biāo)準(zhǔn)差函數(shù)(STDEVP)總體標(biāo)準(zhǔn)差函數(shù)用來(lái)反映相對(duì)于均值的離散程度。其語(yǔ)法結(jié)構(gòu)為:STDEVP(number1,number2,...)。其中,number1,number2,...為對(duì)應(yīng)于樣本總體的1~30個(gè)參數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)22第三章數(shù)據(jù)描述與分析(2)樣本標(biāo)準(zhǔn)差函數(shù)(STDEV)樣本標(biāo)準(zhǔn)差函數(shù)用來(lái)計(jì)算樣本中相對(duì)于均值的離散程度。其語(yǔ)法結(jié)構(gòu)為:STDEV(number1,number2,...)其中,Number1,number2,...為對(duì)應(yīng)于總體樣本的1~30個(gè)參數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)23第三章數(shù)據(jù)描述與分析操作步驟如下:①建立如前述的“網(wǎng)上沖浪”工作表。②單擊工具欄中的“函數(shù)”快捷按鈕,彈出對(duì)話框如前述所示的“粘貼函數(shù)”的對(duì)話框。在“函數(shù)分類”列表中選擇“統(tǒng)計(jì)”,在“函數(shù)名”列表中選擇總體標(biāo)準(zhǔn)差函數(shù)STDEVP,對(duì)話框如下圖所示。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)24第三章數(shù)據(jù)描述與分析③在數(shù)據(jù)區(qū)域中輸入B2:B21,則計(jì)算結(jié)果便顯示在對(duì)話窗口下面,其值為10.61543687,單擊“確定”按鈕結(jié)束。

④樣本標(biāo)準(zhǔn)差的計(jì)算方法與其相同。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)25第三章數(shù)據(jù)描述與分析3.2.3四分位數(shù)與四分位距將總體分成相等的四個(gè)部分的測(cè)定數(shù)為四分位數(shù)。位于總體第25%位置的數(shù)值是第1四分位數(shù)Q1;位于總體第50%位置的數(shù)值是第2四分位數(shù)Q2;位于總體第75%位置的數(shù)值是第3四分位數(shù)Q3。四分位數(shù)函數(shù)QUARTILE可以計(jì)算一組數(shù)據(jù)的四分位數(shù)。其語(yǔ)法結(jié)構(gòu)為:QUARTILE(array,quart)

其中:上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)26第三章數(shù)據(jù)描述與分析(1)Array為計(jì)算四分位數(shù)的數(shù)組或數(shù)據(jù)區(qū)域。(2)Quart決定返回第幾個(gè)四分位數(shù)。如果quart等于0,函數(shù)QUARTILE返回最小值;quart等于1,函數(shù)QUARTILE返回第1四分位數(shù)(第25個(gè)百分排位);quart等于2,函數(shù)QUARTILE返回中位數(shù)(第50個(gè)百分排位);如果quart等于3,函數(shù)QUARTILE返回第3四分位數(shù)(第75個(gè)百分排位);如果quart等于4,函數(shù)QUARTILE返回最大值。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)27第三章數(shù)據(jù)描述與分析四分位距是總體中第3四分位數(shù)與第1四分?jǐn)?shù)之差四分位距可包括位于總體分布中心的50%,它能集中地反映總體的特征。例仍以網(wǎng)上沖浪者年齡為例,計(jì)算數(shù)據(jù)的最小值、第1四分位數(shù)、第2四分位數(shù)、第3四分位數(shù)和四分位距。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)28第三章數(shù)據(jù)描述與分析①打開(kāi)“第3章數(shù)據(jù)描述分析.xls”工作簿,選擇“網(wǎng)上沖浪”

工作表。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)29第三章數(shù)據(jù)描述與分析②在單元格A27、A28、A29、A30和A31中分別輸入“最

小值”、“第1四分位數(shù)”、“第2四分位數(shù)”、“第3四分位

數(shù)”、“最大值”和“四分位距”。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)30第三章數(shù)據(jù)描述與分析③在B27單元格中打開(kāi)“插入”菜單,單擊“函數(shù)”選項(xiàng),在

“函數(shù)類型”列表中選擇“統(tǒng)計(jì)”,在“函數(shù)名”列表中選擇

四分位數(shù)函數(shù)QUARTILE,單擊“確定”按鈕,進(jìn)入四分

位數(shù)對(duì)話框窗口。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)31第三章數(shù)據(jù)描述與分析④在四分位數(shù)函數(shù)QUARTILE的對(duì)話框中,在Array中輸入數(shù)據(jù)區(qū)域B2:B21;在Quart中輸入0,表示計(jì)算最小值或第0四分位數(shù);單擊“確定”按鈕,其值便顯示在單元格B27中。⑤在單元格B28中輸入“=QUARTILE(B2:B21,1)”,計(jì)算第1四分位數(shù),顯示29.75。⑥在單元格B29中輸入“=QUARTILE(B2:B21,2)”,計(jì)算第2四分位數(shù),顯示38.5。⑦在單元格B30中輸入“=QUARTILE(B2:B21,3)”,計(jì)算第3四分位數(shù),顯示46.75。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)32第三章數(shù)據(jù)描述與分析⑧在單元格B31中輸入“=QUARTILE(B2:B21,4)”,計(jì)算最大值,顯示58。⑨在單元格B32中輸入“=B30-B28”,計(jì)算四分位距,顯示值為17。四分位距表明整個(gè)總體中位于29.75到46.75之間的數(shù)值有50%。換句話說(shuō),從29.75到46.75這個(gè)17歲范圍內(nèi)可包括總體的50%。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)33第三章數(shù)據(jù)描述與分析3.2.4案例研究:磁盤

存儲(chǔ)量質(zhì)量控制某生產(chǎn)磁盤公司的管理人員要監(jiān)測(cè)磁盤存儲(chǔ)量的質(zhì)量。10天為一個(gè)周期,得到如下圖的數(shù)據(jù)。試根據(jù)這些樣本資料對(duì)該公司的產(chǎn)品進(jìn)行質(zhì)量控制分析。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)34第三章數(shù)據(jù)描述與分析操作步驟如下:(1)求樣本均值①打開(kāi)“第3章數(shù)據(jù)描述分析”工作簿,選擇“磁盤質(zhì)量”工作表。②在J2單元格中輸入“樣本均值”。③在單元格J3中輸入公式“=AVERAGE(B3:I3)”,并復(fù)制到J4:J12各單元格中。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)35第三章數(shù)據(jù)描述與分析

(2)制作折線圖①在EXCEL“插入”菜單中選擇“圖表”選項(xiàng),打開(kāi)“圖表向?qū)А睂?duì)話框。②在步驟1的“圖表類型”列表中選擇“折線圖”,在“子圖表類型”中選擇“數(shù)據(jù)點(diǎn)折線圖”,單擊“下一步”按鈕。③在步驟2中確認(rèn)數(shù)據(jù)源為J3:J12,單擊“下一步”按鈕。④在步驟3的圖表選項(xiàng)中,單擊“標(biāo)題”頁(yè)面,在“圖表標(biāo)題”中輸入“質(zhì)量控制圖”,在分類(X)軸中輸入“樣本數(shù)”,在分類(Y)軸中輸入“樣本均值”。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)36第三章數(shù)據(jù)描述與分析⑤打開(kāi)“網(wǎng)格線”頁(yè)面,去掉網(wǎng)格線;打開(kāi)“圖例”頁(yè)面,去掉圖例。單擊“下一步”按鈕,單擊“完成”按鈕,得質(zhì)量控制草圖。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)37第三章數(shù)據(jù)描述與分析(3)繪制質(zhì)量控制圖的中心線①在I13單元格中輸入“總體均值”,在J13單元格中輸入公式“=AVERAGE(J3:J12)”。②在K2單元格中輸入“中心線”,單擊K3單元格,輸入公式“=$J$13”。③將單元格K3,復(fù)制到K4:K12的各單元格中。④選取單元格K3:K12,然后將鼠標(biāo)移近所選單元格的邊緣,直到變成一個(gè)箭頭,然后把單元格的值拖動(dòng)到圖中并釋放鼠標(biāo)鍵,則中心線便出現(xiàn)在圖中。⑤雙擊圖表,選取中心線并雙擊,在“數(shù)據(jù)系列格式”對(duì)話框中將“數(shù)據(jù)標(biāo)記”選為“無(wú)”,單擊“確定”按鈕。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)38第三章數(shù)據(jù)描述與分析(4)繪制質(zhì)量控制圖的上下限①在單元格L2中輸入“樣本標(biāo)準(zhǔn)差”,在單元格L3中輸入公式“=STDEV(B3:I3)”,并復(fù)制到L4:L12各單元格中,以確定控制界限。②在單元格L13中輸入公式“=AVERAGE(L3:L12)”,計(jì)算總體標(biāo)準(zhǔn)差。③在單元格M2和N2中分別輸入“控制下限”和“控制上限”。④在單元格M3中輸入公式“=K3-1.96*$L$13”,并向下復(fù)制到K13各個(gè)單元格中,用來(lái)計(jì)算控制下限。其中的1.96為概率度,數(shù)據(jù)點(diǎn)在均值加減1.96標(biāo)準(zhǔn)差范圍內(nèi)可包括總體的95%。⑤在單元格N3中輸入公式“=K3+1.96*$L$13”,并向下復(fù)制到N13各個(gè)單元格中,用來(lái)計(jì)算控制上限。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)39第三章數(shù)據(jù)描述與分析⑥選取單元格M3:N12,然后將鼠標(biāo)移近所選單元格的邊緣,直到變成一個(gè)箭頭,然后把單元格的值拖動(dòng)到圖中并釋放鼠標(biāo)鍵,則控制上、下限便出現(xiàn)在圖中。⑦雙擊圖表,選取控制上、下限并雙擊,在“數(shù)據(jù)系列格式”對(duì)話框中將“數(shù)據(jù)標(biāo)記”選為“無(wú)”,單擊確定。

所得下圖為質(zhì)量控制圖,從圖中可以看到大多數(shù)數(shù)據(jù)點(diǎn)都位于控制范圍之內(nèi)。但第8個(gè)數(shù)據(jù)點(diǎn)躍出范圍之外,在質(zhì)量控制中稱其為失控點(diǎn),對(duì)于這種情況,需要仔細(xì)檢查生產(chǎn),過(guò)程,以判斷質(zhì)量異常的原因。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)40第三章數(shù)據(jù)描述與分析上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)41第三章數(shù)據(jù)描述與分析3.3分布形態(tài)的測(cè)定與分析?3.3.1分布形態(tài)的測(cè)定內(nèi)容?

3.3.2用Excel工作表函數(shù)描述分布形態(tài)上一頁(yè)下一頁(yè)返回本章首頁(yè)42第三章數(shù)據(jù)描述與分析3.3.1分布形態(tài)的測(cè)定內(nèi)容對(duì)于一組數(shù)據(jù),不僅要描述其集中趨勢(shì)、離中趨勢(shì),而且也要描述其分布形態(tài)。這是因?yàn)橐粋€(gè)總體如果均值相同,標(biāo)準(zhǔn)差相同,但也可能分布形態(tài)不同。另外,分布的形態(tài)有助于識(shí)別整個(gè)總體的數(shù)量特征??傮w的分布形態(tài)可以從兩個(gè)角度考慮,一是分布的對(duì)稱程度,另一個(gè)是分布的高低。前者的測(cè)定參數(shù)稱為偏度或偏斜度,后者的測(cè)定參數(shù)稱為峰度。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)43第三章數(shù)據(jù)描述與分析在統(tǒng)計(jì)分析中,用偏度指標(biāo)對(duì)其進(jìn)行測(cè)定。偏度數(shù)值等于零,說(shuō)明分布為對(duì)稱;偏度數(shù)值大于零,說(shuō)明分布呈現(xiàn)右偏態(tài);如果偏度數(shù)值小于零,說(shuō)明分布呈左偏態(tài)。峰度是掌握分布形態(tài)的另一個(gè)指標(biāo),它能夠描述分布的平緩或陡峭。如果峰度數(shù)值等于0,說(shuō)明分布為正態(tài);如果峰度數(shù)值大于0,說(shuō)明分布呈陡峭狀態(tài);如果峰度值小于0,則說(shuō)明分布形態(tài)趨于平緩。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)44第三章數(shù)據(jù)描述與分析3.3.2用Excel工作表函數(shù)

描述分布形態(tài)Excel提供了計(jì)算偏度與峰度的工作表函數(shù)。偏度函數(shù)(SKEW)用于計(jì)算次數(shù)分布的不對(duì)稱程度。其語(yǔ)法結(jié)構(gòu)為:SKEW(number1,number2,...)其中:number1,number2...為需要計(jì)算偏斜度的1~30個(gè)參數(shù)。峰度函數(shù)(KURT)用于反映次數(shù)分布的尖銳度或平坦度。其語(yǔ)法結(jié)構(gòu)為:KURT(number1,number2,...)其中:number1,number2,為需要計(jì)算其峰值的1~30個(gè)參數(shù)。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)45第三章數(shù)據(jù)描述與分析仍以網(wǎng)上沖浪者年齡為例,計(jì)算其偏態(tài)與峰度。計(jì)算步驟如下:①建立如下圖“網(wǎng)上沖浪”工作表。②在A33單元格中輸入“偏態(tài)”,在B33單元格中輸入“=SKEW(B2:B21)”,其顯示值為0.27701322。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)46第三章數(shù)據(jù)描述與分析③在A34單元格中輸入“峰度”,在B34單元格中輸入“=KURT(B2:B21)”,其顯示值為-1.0811953。結(jié)果如下圖所示。從圖中偏度與峰度計(jì)算結(jié)果中可以看出,偏度0.27701322,說(shuō)明其分布形態(tài)呈輕微右偏態(tài),基本接近于對(duì)稱分布。峰度系數(shù)為-1.0811953,小于0,說(shuō)明其分布形態(tài)趨勢(shì)于平坦。這主要是由于觀察數(shù)據(jù)過(guò)少,不能表現(xiàn)其應(yīng)有的峰度。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)47第三章數(shù)據(jù)描述與分析3.4描述統(tǒng)計(jì)分析工具的使用?3.4.1描述統(tǒng)計(jì)分析工具的輸入內(nèi)容?3.4.2描述統(tǒng)計(jì)分析工具的輸出結(jié)果解釋?3.4.3案例研究:“OldFaithful”間歇噴泉的噴發(fā)

上一頁(yè)下一頁(yè)返回本章首頁(yè)48第三章數(shù)據(jù)描述與分析3.4.1描述統(tǒng)計(jì)分析工具

的輸入內(nèi)容Excel描述統(tǒng)計(jì)工具計(jì)算與數(shù)據(jù)的集中趨勢(shì)、離中趨勢(shì)、偏度等有關(guān)的描述性統(tǒng)計(jì)指標(biāo)?!懊枋鼋y(tǒng)計(jì)”對(duì)話框如下圖所示。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)49第三章數(shù)據(jù)描述與分析“描述統(tǒng)計(jì)”對(duì)話框中選項(xiàng)的主要內(nèi)容包括:輸入?yún)^(qū)域在此輸入待分析數(shù)據(jù)區(qū)域的單元格引用。該引用必須由兩個(gè)或兩個(gè)以上按列或行組織的相鄰數(shù)據(jù)區(qū)域組成。分組方式如果需要指出輸入?yún)^(qū)域中的數(shù)據(jù)是按行還是按列排列,請(qǐng)單擊“行”或“列”。標(biāo)志位于第一行

如果輸入?yún)^(qū)域的第一行中包含標(biāo)志項(xiàng),請(qǐng)選中“標(biāo)志位于第一行”復(fù)選框。如果輸入?yún)^(qū)域沒(méi)有標(biāo)志項(xiàng),則不選擇,Excel將在輸出表中自動(dòng)生成數(shù)據(jù)標(biāo)志。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)50第三章數(shù)據(jù)描述與分析輸出區(qū)域

在此輸入對(duì)輸出表左上角單元格的引用。此工具將為每個(gè)數(shù)據(jù)集產(chǎn)生兩列信息。左邊一列包含統(tǒng)計(jì)標(biāo)志項(xiàng),右邊一列包含統(tǒng)計(jì)值。根據(jù)所選擇的“分組方式”選項(xiàng)的不同,Excel將為輸入表中的每一行或每一列生成一個(gè)兩列的統(tǒng)計(jì)表。新工作表組

單擊此選項(xiàng),可在當(dāng)前工作簿中插入新工作表,并由新工作表的A1單元格開(kāi)始粘貼計(jì)算結(jié)果。如果需要給新工作表命名,請(qǐng)?jiān)谟覀?cè)編輯框中鍵入名稱。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)51第三章數(shù)據(jù)描述與分析新工作簿單擊此選項(xiàng),可創(chuàng)建一新工作簿,并在新工作簿的新工作表中粘貼計(jì)算結(jié)果。匯總統(tǒng)計(jì)如果需要Excel在輸出表中生成下列統(tǒng)計(jì)結(jié)果,請(qǐng)選中此項(xiàng)。這些統(tǒng)計(jì)結(jié)果有:均值、標(biāo)準(zhǔn)差、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)誤差、方差、峰值、偏度、全距、最小值、最大值、總和、總個(gè)數(shù)、第K個(gè)最大值、第K個(gè)最小值和置信度。平均數(shù)置信度如果需要在輸出表的某一行中包含均值的置信度,請(qǐng)選中此項(xiàng),然后在右側(cè)的編輯框中,輸入所要使用的置信度。例如,數(shù)值95%可用來(lái)計(jì)算在顯著性水平為5%時(shí)的均值置信度。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)52第三章數(shù)據(jù)描述與分析第k個(gè)最大值如果需要在輸出表的某一行中包含每個(gè)區(qū)域的數(shù)據(jù)的第k個(gè)最大值,請(qǐng)選中復(fù)選框,然后在右側(cè)的編輯框中,輸入k的數(shù)值。如果輸入1,則這一行將包含數(shù)據(jù)集中的最大數(shù)值。第k個(gè)最小值如果需要在輸出表的某一行中包含每個(gè)區(qū)域的數(shù)據(jù)的第k個(gè)最小值,請(qǐng)選復(fù)選取框,然后在右側(cè)的編輯框中,輸入k的數(shù)值。如果輸入1,則這一行將包含數(shù)據(jù)集中的最小數(shù)值。

上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)53第三章數(shù)據(jù)描述與分析3.4.2描述分析工具的

輸出結(jié)果解釋①打開(kāi)“第3章數(shù)據(jù)描述分析.xls”工作簿,選擇“描述工具”工作表。②打開(kāi)“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開(kāi)數(shù)據(jù)分析對(duì)話框如圖所示。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)54第三章數(shù)據(jù)描述與分析③雙擊“描述統(tǒng)計(jì)”項(xiàng)或先單擊此項(xiàng)再選擇“確定”按鈕,描述統(tǒng)計(jì)對(duì)話框打開(kāi)如圖所示。④在“輸入?yún)^(qū)域”中輸入A1:A7。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)55第三章數(shù)據(jù)描述與分析⑤由于所選數(shù)據(jù)范圍包括一個(gè)標(biāo)志名稱,單擊“標(biāo)志位于第一行”選項(xiàng)邊上的復(fù)選框。⑥單擊“輸出區(qū)域”項(xiàng),旁邊出現(xiàn)了一個(gè)輸入框,單擊此框出現(xiàn)插入符,單擊B1,在輸入框中出現(xiàn)輸出地址“$B$1”,這是輸出結(jié)果的左上角起始位置。⑦單擊“匯總統(tǒng)計(jì)”,如不選此項(xiàng),則Excel省略部分輸出結(jié)果。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)56第三章數(shù)據(jù)描述與分析⑧單擊“確定”按鈕,將產(chǎn)生輸出結(jié)果,如下圖所示。⑨結(jié)果輸出在B、C兩欄的1到16行中。如果結(jié)果只是3行,說(shuō)明沒(méi)有選擇“匯總統(tǒng)計(jì)”,可以重新打開(kāi)對(duì)話框進(jìn)行選擇。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)57第三章數(shù)據(jù)描述與分析3.4.3案例研究:

“OldFaithful”間歇噴泉的噴發(fā)間歇噴泉是一種向空中噴出熱水和熱氣的溫泉,其名字的由來(lái)是因?yàn)檫@種噴泉要經(jīng)過(guò)一段相對(duì)穩(wěn)定的狀態(tài)后才能噴發(fā)。有時(shí)它噴射的時(shí)間間隔不太穩(wěn)定。Ohio(俄亥俄)州黃石國(guó)家公園中的“OldFaithful”間歇噴泉是世界上最著名的間歇噴泉之一。參觀者們都希望到公園后不用等多久就能看到噴泉的噴發(fā)。國(guó)家公園的服務(wù)部門就在噴泉處安裝了一個(gè)指示牌預(yù)報(bào)下次噴泉噴發(fā)的時(shí)間如下表所示。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)58第三章數(shù)據(jù)描述與分析開(kāi)始時(shí)間持續(xù)時(shí)間預(yù)測(cè)區(qū)間預(yù)測(cè)下一次噴發(fā)時(shí)間6:351分55秒58分7:33am7:32接近4秒82分8:54am8:591分51秒58分9:57am10:124分33秒89分11:41am11:461分42秒58分12:44am中午吃飯2:061分41秒55分3:01am注:數(shù)據(jù)來(lái)源:《應(yīng)用線性回歸》第二版,作者:S.Weisberg?!癘ldFaithful”間歇噴泉噴發(fā)時(shí)間表上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)59第三章數(shù)據(jù)描述與分析那么,公園是如何得到這個(gè)結(jié)果的呢?為了了解噴泉噴發(fā)間隔時(shí)間的規(guī)律,以1978年8月至1979年8月間噴泉222次噴發(fā))的間隔時(shí)間記錄為樣本(見(jiàn)上表)進(jìn)行分析。①打開(kāi)”第三章數(shù)據(jù)描述分析.xls”工作簿,“噴泉“工作表。②單擊“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開(kāi)“直方圖”對(duì)話框。③在輸入?yún)^(qū)域輸入單元格C1:C223,選擇“標(biāo)志”,在輸出區(qū)域中輸入單元格“D1”,選擇“圖表輸出”,單擊“確定”按鈕。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)60第三章數(shù)據(jù)描述與分析將所得的直方圖進(jìn)行修飾,便得到下圖:從圖中可以看出,噴泉噴發(fā)的間隔時(shí)間一般在40~100分鐘內(nèi)變動(dòng)。但是,在數(shù)據(jù)中明顯地存在兩個(gè)子群,它們的中心大約分別在噴發(fā)間隔55分鐘和80分鐘,這樣在圖形中間形成一個(gè)缺口。然而我們利用描述統(tǒng)計(jì)分析工具所得的結(jié)果與此便大不一樣。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)61第三章數(shù)據(jù)描述與分析利用描述統(tǒng)計(jì)分析工具分析該噴泉的間隔時(shí)間,方法如下:①打開(kāi)“第三章數(shù)據(jù)描述分析.xls”工作簿,選擇“噴泉”工作表。②從“工具”菜單中選擇“數(shù)據(jù)分析”選項(xiàng),打開(kāi)“描述統(tǒng)計(jì)”對(duì)話框。③在輸入?yún)^(qū)域中輸入“C1:C223”,選擇標(biāo)志位于第一行。“輸出區(qū)域”選擇D19。⑥選擇“匯總統(tǒng)計(jì)”和“平均數(shù)置信度”,單擊“確定”按鈕,結(jié)果如下表所示。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)62第三章數(shù)據(jù)描述與分析

“OldFaithfaul”

噴泉間隔時(shí)間描述統(tǒng)計(jì)表

(表一)(表二)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論