統(tǒng)計(jì)數(shù)據(jù)的采集和整理_第1頁
統(tǒng)計(jì)數(shù)據(jù)的采集和整理_第2頁
統(tǒng)計(jì)數(shù)據(jù)的采集和整理_第3頁
統(tǒng)計(jì)數(shù)據(jù)的采集和整理_第4頁
統(tǒng)計(jì)數(shù)據(jù)的采集和整理_第5頁
已閱讀5頁,還剩164頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)數(shù)據(jù)的采集和整理第一頁,共一百六十九頁,2022年,8月28日2.1.2統(tǒng)計(jì)分析的過程和方法1.統(tǒng)計(jì)分析過程(1)數(shù)據(jù)準(zhǔn)備。(2)方法選擇。(3)數(shù)據(jù)運(yùn)算。(4)判斷預(yù)測。第二頁,共一百六十九頁,2022年,8月28日2.統(tǒng)計(jì)分析方法(1)統(tǒng)計(jì)描述方法。(2)統(tǒng)計(jì)推論方法。(3)多元統(tǒng)計(jì)方法。返回本節(jié)第三頁,共一百六十九頁,2022年,8月28日2.2.1統(tǒng)計(jì)數(shù)據(jù)的構(gòu)成統(tǒng)計(jì)數(shù)據(jù)包括五個(gè)組成部分:1.?dāng)?shù)據(jù)名稱2.?dāng)?shù)據(jù)值3.計(jì)量單位4.時(shí)間范圍5.空間范圍返回本節(jié)第四頁,共一百六十九頁,2022年,8月28日2.2.2統(tǒng)計(jì)數(shù)據(jù)的種類1.按照數(shù)據(jù)值的表現(xiàn)形式不同(1)屬性數(shù)據(jù)(定性數(shù)據(jù))(2)數(shù)值數(shù)據(jù)(定量數(shù)據(jù))

2.按照取得數(shù)據(jù)時(shí)的計(jì)量方式不同(1)測量值數(shù)據(jù)(2)計(jì)數(shù)值數(shù)據(jù)(3)分類數(shù)據(jù)(4)排序數(shù)據(jù)返回本節(jié)第五頁,共一百六十九頁,2022年,8月28日2.2.3數(shù)據(jù)清單1.?dāng)?shù)據(jù)清單結(jié)構(gòu)圖2-1數(shù)據(jù)清單第六頁,共一百六十九頁,2022年,8月28日2.錄入數(shù)據(jù)數(shù)據(jù)的錄入有三種基本方法:(1)單擊目標(biāo)單元格直接輸入數(shù)據(jù)。(2)雙擊目標(biāo)單元格輸入數(shù)據(jù)。(3)單擊目標(biāo)單元格,在編輯欄中輸入數(shù)據(jù)。第七頁,共一百六十九頁,2022年,8月28日3.?dāng)?shù)據(jù)自動填充圖2-2“Ctrl+Enter”組合鍵自動填充第八頁,共一百六十九頁,2022年,8月28日圖2-3“序列”對話框第九頁,共一百六十九頁,2022年,8月28日圖2-4利用“序列”對話框產(chǎn)生等比數(shù)列第十頁,共一百六十九頁,2022年,8月28日4.利用“記錄單”編輯數(shù)據(jù)(如圖2-5所示)(1)瀏覽記錄(2)瀏覽符合條件的記錄(3)添加記錄(4)修改記錄(5)刪除記錄第十一頁,共一百六十九頁,2022年,8月28日圖2-5“數(shù)據(jù)清單”對話框返回本節(jié)第十二頁,共一百六十九頁,2022年,8月28日2.3.1統(tǒng)計(jì)數(shù)據(jù)整理的內(nèi)容根據(jù)分析的目的,對數(shù)據(jù)進(jìn)行排序和分類(組)。對分類后的數(shù)據(jù)進(jìn)行匯總,計(jì)算各類(組)及總體的指標(biāo)。Excel提供了多種數(shù)據(jù)整理工具,主要有:數(shù)據(jù)排序和篩選;頻數(shù)分布函數(shù);數(shù)據(jù)透視表;統(tǒng)計(jì)圖;直方圖分析工具。返回本節(jié)第十三頁,共一百六十九頁,2022年,8月28日2.3.2統(tǒng)計(jì)數(shù)據(jù)的排序與篩選(1)按單字段排序(2)按多字段排序(如圖2-6~2-11所示)第十四頁,共一百六十九頁,2022年,8月28日圖2-6“排序”對話框第十五頁,共一百六十九頁,2022年,8月28日圖2-7企業(yè)財(cái)務(wù)數(shù)據(jù)第十六頁,共一百六十九頁,2022年,8月28日圖2-8數(shù)據(jù)按“主營業(yè)務(wù)收入”排序第十七頁,共一百六十九頁,2022年,8月28日圖2-9設(shè)置關(guān)鍵字及排序方式圖2-10“排序選項(xiàng)”對話框第十八頁,共一百六十九頁,2022年,8月28日圖2-11數(shù)據(jù)按多字段排序第十九頁,共一百六十九頁,2022年,8月28日圖2-12打開“自動篩選”功能第二十頁,共一百六十九頁,2022年,8月28日圖2-13“自動篩選前10個(gè)”對話框圖2-14“自定義自動篩選方式”對話框第二十一頁,共一百六十九頁,2022年,8月28日圖2-15設(shè)定篩選條件圖2-16自定義篩選結(jié)果第二十二頁,共一百六十九頁,2022年,8月28日圖2-17“高級篩選”對話框第二十三頁,共一百六十九頁,2022年,8月28日圖2-18設(shè)定條件區(qū)域第二十四頁,共一百六十九頁,2022年,8月28日圖2-19輸入列表區(qū)域和條件區(qū)域第二十五頁,共一百六十九頁,2022年,8月28日圖2-20高級篩選結(jié)果返回本節(jié)第二十六頁,共一百六十九頁,2022年,8月28日2.3.3統(tǒng)計(jì)數(shù)據(jù)的分類匯總利用Excel的分類匯總功能將數(shù)據(jù)歸類,并進(jìn)行求和、均值等計(jì)算,并將計(jì)算結(jié)果顯示出來,以便對數(shù)據(jù)進(jìn)行進(jìn)一步分析。例2-6

某班10個(gè)學(xué)生的《成本會計(jì)》課程考試成績?nèi)鐖D2-21所示,要求統(tǒng)計(jì)不同分?jǐn)?shù)學(xué)生的人數(shù)如圖2-22、2-23所示。例2-7

利用例2-6中排序后的資料(圖2-22),分別統(tǒng)計(jì)60分以下、60-69分、70-79分、80-89分、90分(含)以上的學(xué)生人數(shù)如圖2-24、2-25所示。第二十七頁,共一百六十九頁,2022年,8月28日圖2-21學(xué)生成績圖2-22按成績排序第二十八頁,共一百六十九頁,2022年,8月28日圖2-23對“成績”分類第二十九頁,共一百六十九頁,2022年,8月28日圖2-24“函數(shù)參數(shù)”對話框第三十頁,共一百六十九頁,2022年,8月28日圖2-25頻數(shù)分布結(jié)果返回本節(jié)第三十一頁,共一百六十九頁,2022年,8月28日2.3.4統(tǒng)計(jì)數(shù)據(jù)的透視分析1.?dāng)?shù)據(jù)透視表例2-8

某地區(qū)三個(gè)商場6月份彩電和空調(diào)的銷售數(shù)據(jù)清單如圖2-26所示,通過數(shù)據(jù)透視表比較不同商場及不同廠家的不同產(chǎn)品的銷售情況。具體如圖2-27~2-35所示。2.?dāng)?shù)據(jù)透視圖為了更直觀地反映數(shù)據(jù)透視表的分析結(jié)果,可以采用數(shù)據(jù)透視圖繪制統(tǒng)計(jì)圖形。有兩種方法可以創(chuàng)建數(shù)據(jù)透視圖。具體如圖2-36~2-39所示。第三十二頁,共一百六十九頁,2022年,8月28日圖2-26商品銷售資料第三十三頁,共一百六十九頁,2022年,8月28日圖2-27“數(shù)據(jù)透視表和數(shù)據(jù)透視圖向?qū)В媸健睂υ捒虻谌捻?,共一百六十九頁?022年,8月28日圖2-28設(shè)計(jì)版式第三十五頁,共一百六十九頁,2022年,8月28日圖2-29“數(shù)據(jù)透視表選項(xiàng)”對話框第三十六頁,共一百六十九頁,2022年,8月28日圖2-30生成的數(shù)據(jù)透視表第三十七頁,共一百六十九頁,2022年,8月28日圖2-31改變數(shù)據(jù)透視表版式(1)第三十八頁,共一百六十九頁,2022年,8月28日圖2-32改變數(shù)據(jù)透視表版式(2)第三十九頁,共一百六十九頁,2022年,8月28日圖2-33改變數(shù)據(jù)透視表版式(3)第四十頁,共一百六十九頁,2022年,8月28日圖2-34“自動套用格式”對話框第四十一頁,共一百六十九頁,2022年,8月28日圖2-35設(shè)置透視表格式第四十二頁,共一百六十九頁,2022年,8月28日圖2-36數(shù)據(jù)透視圖(堆積柱形圖)第四十三頁,共一百六十九頁,2022年,8月28日圖2-37數(shù)據(jù)透視圖(簇狀柱形圖)第四十四頁,共一百六十九頁,2022年,8月28日圖2-38數(shù)據(jù)透視圖雛形第四十五頁,共一百六十九頁,2022年,8月28日圖2-39圖表工具欄返回本節(jié)第四十六頁,共一百六十九頁,2022年,8月28日2.3.5統(tǒng)計(jì)圖與直方圖分析1.統(tǒng)計(jì)圖使用統(tǒng)計(jì)圖可以更加直觀形象地描述大量統(tǒng)計(jì)數(shù)據(jù)所體現(xiàn)出的現(xiàn)象的發(fā)展規(guī)律與發(fā)展趨勢,以及現(xiàn)象之間的相互關(guān)系和現(xiàn)象內(nèi)部的結(jié)構(gòu)。例2-10

某大學(xué)共有教師600人,其中助教180人、講師240人、副教授120人、教授60人,計(jì)算教師的職稱結(jié)構(gòu),并繪制職稱結(jié)構(gòu)的餅形圖。具體如圖2-40~2-47所示。第四十七頁,共一百六十九頁,2022年,8月28日圖2-40教師結(jié)構(gòu)工作表圖2-41計(jì)算合計(jì)與比重第四十八頁,共一百六十九頁,2022年,8月28日圖2-42選擇圖表類型第四十九頁,共一百六十九頁,2022年,8月28日圖2-43確定數(shù)據(jù)區(qū)域第五十頁,共一百六十九頁,2022年,8月28日圖2-44設(shè)置圖表選項(xiàng)第五十一頁,共一百六十九頁,2022年,8月28日圖2-45繪制的餅形圖第五十二頁,共一百六十九頁,2022年,8月28日圖2-46“圖表標(biāo)題格式”對話框第五十三頁,共一百六十九頁,2022年,8月28日圖2-47修飾后的圖形第五十四頁,共一百六十九頁,2022年,8月28日2.直方圖分析Excel提供了一個(gè)直方圖分析工具,可用于確定數(shù)據(jù)的頻數(shù)分布、累計(jì)頻數(shù)分布等。直方圖分析工具是Excel分析工具庫中的一種,利用分析工具庫中的分析工具可以進(jìn)行更加復(fù)雜的統(tǒng)計(jì)計(jì)算及數(shù)據(jù)分析。如圖2-48所示。例2-11

以例2-6資料,用直方圖分析工具對學(xué)生成績進(jìn)行分析。具體如圖2-49~2-53所示。第五十五頁,共一百六十九頁,2022年,8月28日圖2-48“加載宏”對話框第五十六頁,共一百六十九頁,2022年,8月28日圖2-49“數(shù)據(jù)分析”對話框第五十七頁,共一百六十九頁,2022年,8月28日圖2-50“直方圖”對話框第五十八頁,共一百六十九頁,2022年,8月28日圖2-51直方圖選項(xiàng)設(shè)置第五十九頁,共一百六十九頁,2022年,8月28日圖2-52頻率分布表圖2-53直方圖表返回本節(jié)第六十頁,共一百六十九頁,2022年,8月28日3.1.1集中趨勢的測定內(nèi)容在統(tǒng)計(jì)研究中,需要搜集大量數(shù)據(jù)并對其進(jìn)行加工整理,對這些數(shù)據(jù)進(jìn)行整理之后發(fā)現(xiàn):大多數(shù)情況下數(shù)據(jù)都會呈現(xiàn)出一種鐘形分布,即各個(gè)變量值與中間位置的距離越近,出現(xiàn)的次數(shù)越多;與中間位置距離越遠(yuǎn),出現(xiàn)的次數(shù)越少,從而形成了一種以中間值為中心的集中趨勢。這個(gè)集中趨勢是現(xiàn)象共性的特征,是現(xiàn)象規(guī)律性的數(shù)量表現(xiàn)。返回本節(jié)第六十一頁,共一百六十九頁,2022年,8月28日3.1.2用Excel工作表函數(shù)描述集中趨勢1.均值函數(shù)(1)算術(shù)平均數(shù)。(2)調(diào)和平均數(shù)。(3)幾何平均數(shù)。第六十二頁,共一百六十九頁,2022年,8月28日2.中位數(shù)(中位次數(shù))函數(shù)中位數(shù)是指全體數(shù)值按大小排列后位于中間的數(shù)值。語法:MEDIAN(number1,number2,...)如果參數(shù)集合中包含有偶數(shù)個(gè)數(shù)字,函數(shù)MEDIAN()將返回位于中間的兩個(gè)數(shù)的平均值。第六十三頁,共一百六十九頁,2022年,8月28日3.眾數(shù)函數(shù)眾數(shù)是一組數(shù)列中出現(xiàn)次數(shù)最多的數(shù)值,眾數(shù)函數(shù)MODE()返回某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。與MEDIAN相同,MODE也是一個(gè)位置測量函數(shù)。語法:MODE(number1,number2,...)如果數(shù)據(jù)集合中不含有重復(fù)的數(shù)據(jù),則MODE()函數(shù)返回錯(cuò)誤值N/A。第六十四頁,共一百六十九頁,2022年,8月28日4.最大(?。┲岛瘮?shù)最大(小)值函數(shù)可以返回?cái)?shù)據(jù)集中的最大(?。?shù)值。語法:MAX(number1,number2,...)MIN(number1,number2,...)如果參數(shù)不包含數(shù)字,函數(shù)MAX(MIN)返回0。返回本節(jié)第六十五頁,共一百六十九頁,2022年,8月28日3.1.3三種平均數(shù)的特點(diǎn)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,它用于對分類數(shù)據(jù)的概括性度量,其特點(diǎn)是不受極端值的影響,但它沒有利用全部數(shù)據(jù)信息,而且還具有不惟一性。一組數(shù)據(jù)可能有眾數(shù),也可能沒有眾數(shù);可能有一個(gè)眾數(shù),也可能有多個(gè)眾數(shù)。中位數(shù)是一組數(shù)據(jù)按大小順序排序后處于中間位置上的變量,它主要用于對順序數(shù)據(jù)的概括性度量。均值是一組數(shù)據(jù)的算術(shù)平均,它利用了全部數(shù)據(jù)信息,是概括一組數(shù)據(jù)最常用的一個(gè)值。第六十六頁,共一百六十九頁,2022年,8月28日例3-1

某商場家用電器銷售情況如圖3-1所示。(1)計(jì)算各種電器的全年平均銷售量,如圖3-2所示。(2)計(jì)算各種電器銷售量的中位數(shù),如圖3-3所示。(3)計(jì)算各種電器銷售量的眾數(shù),如圖3-4所示。第六十七頁,共一百六十九頁,2022年,8月28日3.2.1離中趨勢的測定內(nèi)容在研究現(xiàn)象總體標(biāo)志的一般水平時(shí),不僅要研究總體標(biāo)志的集中趨勢,還要研究總體標(biāo)志的離中趨勢,如研究價(jià)格背離價(jià)值的平均程度。研究離中趨勢可以通過計(jì)算標(biāo)志變異指標(biāo)來進(jìn)行。標(biāo)志變異指標(biāo)是同統(tǒng)計(jì)平均數(shù)相聯(lián)系的一種綜合指標(biāo),用于度量隨機(jī)變量在取值區(qū)間內(nèi)的分布情況,主要有平均差、標(biāo)準(zhǔn)差、方差、四分位數(shù)、百分位數(shù)等。在一般計(jì)算中,這些指標(biāo)計(jì)算是比較復(fù)雜的,但在Excel中都有相應(yīng)的函數(shù),因而使計(jì)算變得很簡單。返回本節(jié)第六十八頁,共一百六十九頁,2022年,8月28日1.樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差函數(shù)用來估算樣本的標(biāo)準(zhǔn)偏差,反映相對于平均值(mean)的離散程度,Excel計(jì)算樣本標(biāo)準(zhǔn)差采用不偏估計(jì)式(亦即自由度=n-1),其計(jì)算公式為語法:STDEV(number1,number2,...)第六十九頁,共一百六十九頁,2022年,8月28日2.總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差函數(shù)返回以參數(shù)形式給出的整個(gè)樣本總體的標(biāo)準(zhǔn)偏差,反映相對于平均值(mean)的離散程度。計(jì)算總體標(biāo)準(zhǔn)差使用整個(gè)總體的變量,通常采用偏性估計(jì)式(亦即自由度為n),其計(jì)算公式為語法:STDEVP(number1,number2,...)第七十頁,共一百六十九頁,2022年,8月28日例3-2

使用例3-1資料,計(jì)算各家電銷售量的總體標(biāo)準(zhǔn)差,如圖3-5所示。圖3-5計(jì)算總體標(biāo)準(zhǔn)差第七十一頁,共一百六十九頁,2022年,8月28日例3-3

兩組工人生產(chǎn)某種零件的產(chǎn)量如圖3-6所示。圖3-6兩組工人產(chǎn)量第七十二頁,共一百六十九頁,2022年,8月28日圖3-8計(jì)算兩組工人產(chǎn)量標(biāo)準(zhǔn)差第七十三頁,共一百六十九頁,2022年,8月28日圖3-9計(jì)算兩組工人產(chǎn)量標(biāo)準(zhǔn)差系數(shù)返回本節(jié)第七十四頁,共一百六十九頁,2022年,8月28日3.2.3四分位數(shù)與四分位距四分位數(shù)是將中值的前后兩部分?jǐn)?shù)值再等分為二,以數(shù)值小的一端算起,前半部的分區(qū)點(diǎn)稱為第1四分位數(shù),后半部的分區(qū)點(diǎn)稱為第3四分位數(shù),而中值即為第2四分位數(shù)。四分位數(shù)通常用于在銷售額和測量值數(shù)據(jù)集中對總體進(jìn)行分組。語法:QUARTILE(array,quart)array:需要求四分位數(shù)值的數(shù)組或數(shù)字型單元格區(qū)域。quart:決定返回哪一個(gè)四分位值。Quart值與QUARTILE返回值的對應(yīng)關(guān)系見表3-1所示。第七十五頁,共一百六十九頁,2022年,8月28日quart值函數(shù)QUARTILE返回值0最小數(shù)值1第一個(gè)四分位數(shù)(第25個(gè)百分排位)2中分位數(shù)(第50個(gè)百分排位)3第三個(gè)四分位數(shù)(第75個(gè)百分排位)4最大數(shù)值表3-1Quart值與QUARTILE返回值的對應(yīng)關(guān)系第七十六頁,共一百六十九頁,2022年,8月28日例3-4使用例3-1資料,計(jì)算四分位數(shù)和四分位距,如圖3-10所示。圖3-10計(jì)算四分位數(shù)和四分位距返回本節(jié)第七十七頁,共一百六十九頁,2022年,8月28日3.3.1分布形態(tài)的測定內(nèi)容只用集中趨勢和離中趨勢來表示所有數(shù)據(jù),難免不夠準(zhǔn)確。分析總體次數(shù)的分布形態(tài)有助于識別整個(gè)總體的數(shù)量特征。總體的分布形態(tài)可以從兩個(gè)角度考慮,一是分布的對稱程度,另一個(gè)是分布的高低。前者的測定參數(shù)稱為偏度或偏斜度,后者的測定參數(shù)稱為峰度。峰度是掌握分布形態(tài)的另一指標(biāo),它能描述分布的平緩或陡峭程度。如果峰度數(shù)值等于零,說明分布為正態(tài);如果峰度數(shù)值大于零,說明分布呈陡峭狀態(tài);如果峰度數(shù)值小于零,說明分布形態(tài)趨于平緩。返回本節(jié)第七十八頁,共一百六十九頁,2022年,8月28日1.偏度函數(shù)偏度函數(shù)返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對稱程度。正偏斜度表示不對稱邊的分布更趨向正值,負(fù)偏斜度表示不對稱邊的分布更趨向負(fù)值。其計(jì)算公式為語法:SKEW(number1,number2,...)第七十九頁,共一百六十九頁,2022年,8月28日2.峰度函數(shù)峰度函數(shù)返回?cái)?shù)據(jù)集的峰值,表示次數(shù)分布高峰的起伏狀態(tài)。峰值反映與正態(tài)分布相比某一分布的尖銳度或平坦度。正峰值表示相對尖銳的分布,負(fù)峰值表示相對平坦的分布。其計(jì)算公式為語法:KURT(number1,number2,...)第八十頁,共一百六十九頁,2022年,8月28日例3-5

使用例3-1資料,計(jì)算各家電銷售量的偏度和峰度,如圖3-11所示。返回本節(jié)第八十一頁,共一百六十九頁,2022年,8月28日3.4描述統(tǒng)計(jì)工具對于統(tǒng)計(jì)數(shù)據(jù)的一些常用統(tǒng)計(jì)量,比如均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差、峰度系數(shù)、偏度系數(shù)等,可以利用上述統(tǒng)計(jì)函數(shù)計(jì)算。但Excel提供了一種更快捷的方法,就是描述統(tǒng)計(jì)工具。描述統(tǒng)計(jì)分析工具用于生成數(shù)據(jù)源區(qū)域中數(shù)據(jù)的單變量統(tǒng)計(jì)分析報(bào)表,它可以同時(shí)計(jì)算出一組數(shù)據(jù)的多個(gè)常用統(tǒng)計(jì)量,提供有關(guān)數(shù)據(jù)集中趨勢和離中趨勢以及分布形態(tài)等方面的信息。返回首頁第八十二頁,共一百六十九頁,2022年,8月28日例3-6

調(diào)查某企業(yè)生產(chǎn)車間10名工人的月工資水平,資料如圖3-12所示。用描述統(tǒng)計(jì)工具對工人工資數(shù)據(jù)進(jìn)行分析。圖3-12工資資料第八十三頁,共一百六十九頁,2022年,8月28日圖3-13“統(tǒng)計(jì)描述”對話框第八十四頁,共一百六十九頁,2022年,8月28日圖3-14“描述統(tǒng)計(jì)”工具輸出結(jié)果返回本節(jié)第八十五頁,共一百六十九頁,2022年,8月28日4.1.1概率與概率分布Excel提供的離散概率分布包括:l

BINOMDIST:二項(xiàng)分布l

CRITBINOM:累積二項(xiàng)分布(依臨界值,找最小整數(shù)K)l

HYPGEOMDIST:超幾何分布l

NEGBINOMDIST:負(fù)二項(xiàng)分布l

POISSON:泊松分布第八十六頁,共一百六十九頁,2022年,8月28日Excel提供的連續(xù)概率分布包括:l

BETADIST:累積概率密度函數(shù)l

BETAINV:累積概率密度函數(shù)的反函數(shù)l

EXPONDIST:指數(shù)分布函數(shù)l

GAMMADIST:伽瑪分布函數(shù)l

GAMMAINV:伽瑪累積分布函數(shù)的反函數(shù)l

LOGNORMDIST:對數(shù)正態(tài)累加分布函數(shù)第八十七頁,共一百六十九頁,2022年,8月28日l

LOGINV:對數(shù)正態(tài)累加分布函數(shù)的反函數(shù)l

NORMDIST:正態(tài)分布函數(shù)l

NORMINV:正態(tài)累積分布函數(shù)的反函數(shù)l

NORMSDIST:標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)l

NORMSINV:標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)l

WEIBULL:韋伯分布函數(shù)返回本節(jié)第八十八頁,共一百六十九頁,2022年,8月28日1.二項(xiàng)分布函數(shù)二項(xiàng)分布函數(shù)適用于固定次數(shù)的獨(dú)立試驗(yàn),當(dāng)試驗(yàn)的結(jié)果只包含成功或失敗兩種情況時(shí),且當(dāng)成功的概率在試驗(yàn)期間固定不變,該函數(shù)返回一元二項(xiàng)式分布的概率值,其計(jì)算公式為語法:BINOMDIST(number_s,trials,probability_s,cumulative)第八十九頁,共一百六十九頁,2022年,8月28日例4-1

拋硬幣的結(jié)果不是正面就是反面,如果每次硬幣為正面的概率是0.5。則拋硬幣10次中6次正面的概率為多少?(1)建立“BINOMDIST函數(shù).xls”工作表,輸入有關(guān)數(shù)據(jù),如圖4-1所示。(2)在單元格C2中輸入公式“=BINOMDIST(B2,B3,B4,FALSE)”,按回車鍵顯示結(jié)果等于0.205078,如圖4-2所示。表示拋10硬幣出現(xiàn)6次的概率為0.205078。第九十頁,共一百六十九頁,2022年,8月28日圖4-1BINOMDIST函數(shù)工作表第九十一頁,共一百六十九頁,2022年,8月28日圖4-2BINOMDIST函數(shù)計(jì)算結(jié)果第九十二頁,共一百六十九頁,2022年,8月28日2.累積二項(xiàng)分布函數(shù)該函數(shù)可以計(jì)算使累積二項(xiàng)分布大于或等于臨界值的最小整數(shù)值。累積二項(xiàng)分布函數(shù)可以用于質(zhì)量檢驗(yàn)。例如,使用函數(shù)CRITBINOM來決定最多允許出現(xiàn)多少個(gè)有缺陷的部件,才可以保證整個(gè)產(chǎn)品在離開裝配線時(shí)檢驗(yàn)合格。語法:CRITBINOM(trials,probability_s,alpha)第九十三頁,共一百六十九頁,2022年,8月28日圖4-3CRITBINOM函數(shù)工作表第九十四頁,共一百六十九頁,2022年,8月28日圖4-4CRITBINOM函數(shù)計(jì)算結(jié)果第九十五頁,共一百六十九頁,2022年,8月28日3.負(fù)二項(xiàng)分布函數(shù)該函數(shù)返回負(fù)二項(xiàng)式分布。當(dāng)成功概率為常量probability_s時(shí),函數(shù)NEGBINOMDIST返回在到達(dá)number_s次成功之前,出現(xiàn)number_f次失敗的概率。此函數(shù)與二項(xiàng)式分布函數(shù)相似,只是它的成功次數(shù)固定,試驗(yàn)總數(shù)為變量。與二項(xiàng)式分布類似的是,試驗(yàn)次數(shù)被假設(shè)為自變量,其計(jì)算公式為:語法:NEGBINOMDIST(number_f,number_s,probability_s)第九十六頁,共一百六十九頁,2022年,8月28日圖4-5NEGBINOMDIST函數(shù)工作表第九十七頁,共一百六十九頁,2022年,8月28日圖4-6NEGBINOMDIST函數(shù)計(jì)算結(jié)果返回本節(jié)第九十八頁,共一百六十九頁,2022年,8月28日圖4-7“序列”對話框第九十九頁,共一百六十九頁,2022年,8月28日圖4-8結(jié)果顯示(4~117行隱藏)第一百頁,共一百六十九頁,2022年,8月28日圖4-9“坐標(biāo)軸格式”對話框第一百零一頁,共一百六十九頁,2022年,8月28日圖4-10“數(shù)據(jù)系列格式”對話框第一百零二頁,共一百六十九頁,2022年,8月28日圖4-11正態(tài)分布圖繪制結(jié)果返回本節(jié)第一百零三頁,共一百六十九頁,2022年,8月28日4.2.1利用Excel模擬抽樣過程通過抽樣方法,可由母體產(chǎn)生所要的樣本,下面抽取一個(gè)容量為10的樣本。圖4-12建立工作表第一百零四頁,共一百六十九頁,2022年,8月28日圖4-13產(chǎn)生隨機(jī)數(shù)第一百零五頁,共一百六十九頁,2022年,8月28日圖4-14取整函數(shù)對話框第一百零六頁,共一百六十九頁,2022年,8月28日圖4-15選定參數(shù)對話框第一百零七頁,共一百六十九頁,2022年,8月28日圖4-16索引函數(shù)對話框第一百零八頁,共一百六十九頁,2022年,8月28日圖4-17抽樣結(jié)果返回本節(jié)第一百零九頁,共一百六十九頁,2022年,8月28日4.2.2總體分布與抽樣分布總體分布與抽樣分布之間具有一定數(shù)量關(guān)系,這個(gè)數(shù)量關(guān)系可以描述為:,即樣本均值抽樣分布的均值等于總體均值;,即樣本均值抽樣分布的方差等于總體方差除以樣本容量的平方根,即,此式又稱為標(biāo)準(zhǔn)誤差,是抽樣分布的標(biāo)準(zhǔn)差。返回本節(jié)第一百一十頁,共一百六十九頁,2022年,8月28日4.2.3中心極限定理在概率統(tǒng)計(jì)中,正態(tài)分布占有很重要的地位,很多隨機(jī)變量服從正態(tài)分布,即使原來不服從正態(tài)分布的一些獨(dú)立的隨機(jī)變量,當(dāng)隨機(jī)變量的個(gè)數(shù)無限增大時(shí),它們的和的分布也服從正態(tài)分布。返回本節(jié)第一百一十一頁,共一百六十九頁,2022年,8月28日4.2.4t分布11.t分布函數(shù)該函數(shù)用于在一定自由度和顯著水平下得出t分布的概率面積。t分布用于小樣本數(shù)據(jù)集合的假設(shè)檢驗(yàn),使用此函數(shù)可以代替t分布的臨界值表。語法:TDIST(x,degrees_freedom,tails)第一百一十二頁,共一百六十九頁,2022年,8月28日2.t分布反函數(shù)該函數(shù)返回作為概率和自由度函數(shù)的t分布的t值。語法:TINV(probability,degrees_freedom)其中:probability為對應(yīng)于雙尾t分布的概率,degrees_freedom為分布的自由度。返回本節(jié)第一百一十三頁,共一百六十九頁,2022年,8月28日5.1參數(shù)估計(jì)的基本內(nèi)容參數(shù)估計(jì)就是要從樣本出發(fā)去構(gòu)造一個(gè)統(tǒng)計(jì)量作為總體中某未知參數(shù)的一個(gè)估計(jì)量。包括點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。若總體X的分布函數(shù)形式已知,但它的一個(gè)或多個(gè)參數(shù)未知,則由總體X的一個(gè)樣本估計(jì)總體未知參數(shù)的值的問題就是參數(shù)的點(diǎn)估計(jì)問題。要求由樣本構(gòu)造一個(gè)以較大的概率包含真實(shí)參數(shù)的一個(gè)范圍或區(qū)間,這種帶有概率的區(qū)間稱為置信區(qū)間,通過構(gòu)造一個(gè)置信區(qū)間對未知參數(shù)進(jìn)行估計(jì)的方法稱為區(qū)間估計(jì)。返回首頁第一百一十四頁,共一百六十九頁,2022年,8月28日5.2.1總體均值區(qū)間估計(jì)的基本內(nèi)容設(shè)是總體X的一個(gè)樣本,X~N(μ,σ2),求總體均值μ的置信區(qū)間。1.總體方差σ2已知,求μ的置信區(qū)間構(gòu)造總體均值μ的置信區(qū)間為:2.總體方差σ2未知,求μ的置信區(qū)間構(gòu)造均值μ的置信區(qū)間為:返回本節(jié)第一百一十五頁,共一百六十九頁,2022年,8月28日5.2.2利用Excel計(jì)算總體均值置信區(qū)間例5-1從某班男生中隨機(jī)抽取10名學(xué)生,測得其身高(cm)分別為170、175、172、168、165、178、180、176、177、164,以95%的置信度估計(jì)本班男生的平均身高。在95%的置信度下,本班男生身高的置信區(qū)間為(168.5063658,176.4936342)。計(jì)算結(jié)果如圖5-1所示。第一百一十六頁,共一百六十九頁,2022年,8月28日圖5-1總體均值置信區(qū)間的計(jì)算返回本節(jié)第一百一十七頁,共一百六十九頁,2022年,8月28日5.2.3必要抽樣容量的計(jì)算公式在總體均值的區(qū)間估計(jì)中,置信區(qū)間為。從公式中可以看出,從到的距離實(shí)際上為置信區(qū)間長度的1/2,這段距離表示在一定的置信度1-α下,用樣本均值估計(jì)總體均值時(shí)所允許的最大絕對誤差,即抽樣極限誤差,它表示抽樣誤差的可能范圍,又稱允許誤差。如果用Δ表示抽樣極限誤差,則那么樣本容量n的大小則為第一百一十八頁,共一百六十九頁,2022年,8月28日確定抽樣數(shù)目,應(yīng)考慮以下幾個(gè)問題:(1)被調(diào)查總體的標(biāo)志變動程度??傮w各單位值之間差異程度大,抽樣數(shù)目就多,反之可以少些。(2)對推斷精確度的要求,即被允許的抽樣誤差范圍。在標(biāo)志變動程度不變的條件下,精確度要求越高,即被允許的誤差范圍越小,抽樣數(shù)目就需要增加,反之可以減少。(3)對推斷把握程度的要求。在其他條件不變的情況下,要提高抽樣的把握程度,抽樣數(shù)目就需要增加,反之可以減少。(4)抽取調(diào)查單位的方式。返回本節(jié)第一百一十九頁,共一百六十九頁,2022年,8月28日5.2.4利用Excel計(jì)算必要樣本單位數(shù)例5-2某縣進(jìn)行農(nóng)村經(jīng)濟(jì)情況調(diào)查,已知農(nóng)戶平均年收入標(biāo)準(zhǔn)差為30元,要求把握程度(置信度)為95.45%,抽樣極限誤差為5元,計(jì)算應(yīng)抽取的樣本戶數(shù)?如圖5-2、5-3所示。第一百二十頁,共一百六十九頁,2022年,8月28日圖5-2“樣本容量計(jì)算”工作表圖5-3必要樣本容量計(jì)算返回本節(jié)第一百二十一頁,共一百六十九頁,2022年,8月28日5.3.1總體方差已知返回本節(jié)第一百二十二頁,共一百六十九頁,2022年,8月28日5.3.2大樣本總體方差未知第一百二十三頁,共一百六十九頁,2022年,8月28日返回本節(jié)第一百二十四頁,共一百六十九頁,2022年,8月28日5.3.3小樣本總體方差未知但相等返回本節(jié)第一百二十五頁,共一百六十九頁,2022年,8月28日5.3.4小樣本總體方差未知且不等如果正態(tài)分布總體的方差未知,而且不相等,則當(dāng)小樣本時(shí):第一百二十六頁,共一百六十九頁,2022年,8月28日并不服從t分布,只是近似服從t分布,其自由度為:返回本節(jié)第一百二十七頁,共一百六十九頁,2022年,8月28日上述的兩均值之差是建立在兩個(gè)獨(dú)立樣本上,樣本之間彼此無關(guān)。但如果兩個(gè)樣本是成對地發(fā)生,那么這兩個(gè)樣本必定相關(guān)。由于受試者是成對地被觀察,例如抽取某個(gè)家庭的老大和老?。徽{(diào)查某位先生和他的太太;測量某位受試者受訓(xùn)前和受訓(xùn)后的體重,因此兩樣本之間會有關(guān)連,而非兩個(gè)獨(dú)立樣本。5.3.5成對樣本的均值之差第一百二十八頁,共一百六十九頁,2022年,8月28日返回本節(jié)第一百二十九頁,共一百六十九頁,2022年,8月28日5.4.1樣本比例的區(qū)間估計(jì)同均值的區(qū)間估計(jì)一樣,總體比例的推斷也建立在樣本比例的抽樣分布基礎(chǔ)上。樣本比例分布直接來源于二項(xiàng)分布。從理論上說,二項(xiàng)分布是確定置信區(qū)間用以估計(jì)總體比例的一種恰當(dāng)?shù)姆植?,但?dāng)樣本單位數(shù)較大時(shí),概率的計(jì)算非常復(fù)雜,所以使用二項(xiàng)分布估計(jì)總體比例非常困難。根據(jù)中心極限定理,隨著樣本容量的增加,二項(xiàng)分布漸近于正態(tài)分布,所以這時(shí)可以用正態(tài)分布代替二項(xiàng)分布。第一百三十頁,共一百六十九頁,2022年,8月28日樣本比例抽樣分布的數(shù)量特征如下:樣本比例抽樣分布的標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)正態(tài)分布,確定圍繞值的置信區(qū)間是:第一百三十一頁,共一百六十九頁,2022年,8月28日圖5-4建立工作表第一百三十二頁,共一百六十九頁,2022年,8月28日圖5-5樣本比例區(qū)間估計(jì)的計(jì)算結(jié)果返回本節(jié)第一百三十三頁,共一百六十九頁,2022年,8月28日5.4.2估計(jì)總體比例的必要抽樣容量比例估計(jì)同均值估計(jì)相同,也存在一個(gè)必要樣本容量問題,也受極限誤差、置信水平的制約。對于比例估計(jì)來講,其必要樣本容量的計(jì)算公式為:第一百三十四頁,共一百六十九頁,2022年,8月28日圖5-6“比例樣本容量”工作表第一百三十五頁,共一百六十九頁,2022年,8月28日圖5-7計(jì)算結(jié)果返回本節(jié)第一百三十六頁,共一百六十九頁,2022年,8月28日1.大樣本情況下總體標(biāo)準(zhǔn)差的區(qū)間估計(jì)第一百三十七頁,共一百六十九頁,2022年,8月28日2.小樣本情況下正態(tài)總體方差的置信區(qū)間第一百三十八頁,共一百六十九頁,2022年,8月28日Excel提供了兩個(gè)用于方差估計(jì)的工作表函數(shù)。(1)卡方分布函數(shù)。該函數(shù)返回卡方分布的單尾概率。(2)卡方分布反函數(shù)。該函數(shù)返回卡方分布單尾概率的反函數(shù)值。返回本節(jié)第一百三十九頁,共一百六十九頁,2022年,8月28日5.5.2總體方差的置信區(qū)間例5-5對某機(jī)床生產(chǎn)的一批模具隨機(jī)抽取20件進(jìn)行尺寸檢測,其尺寸的標(biāo)準(zhǔn)差為0.5毫米,假定總體服從正態(tài)分布,以95%的置信度估計(jì)這批模具尺寸的方差的置信區(qū)間。結(jié)果如下圖所示。第一百四十頁,共一百六十九頁,2022年,8月28日圖5-8“方差區(qū)間估計(jì)”工作表第一百四十一頁,共一百六十九頁,2022年,8月28日圖5-9計(jì)算結(jié)果返回本節(jié)第一百四十二頁,共一百六十九頁,2022年,8月28日6.1.1假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)是根據(jù)樣本的信息來判斷總體分布是否具有指定的特征,在管理方面有時(shí)稱之為古典決策。在質(zhì)量管理中經(jīng)常用到它,例如檢驗(yàn)新產(chǎn)品質(zhì)量是否有顯著提高,利用各種控制圖判斷工序是否出現(xiàn)異?,F(xiàn)象等。在數(shù)理統(tǒng)計(jì)中,把需要用樣本判斷正確與否的命題稱為一個(gè)假設(shè)。根據(jù)研究目的提出的假設(shè)稱為原假設(shè),記為H0;其對立面假設(shè)稱為備擇假設(shè)(或?qū)α⒓僭O(shè)),記為H1。提出假設(shè)之后,要用適當(dāng)?shù)慕y(tǒng)計(jì)方法決定是否接受假設(shè),稱為假設(shè)檢驗(yàn)或統(tǒng)計(jì)假設(shè)檢驗(yàn)。返回本節(jié)第一百四十三頁,共一百六十九頁,2022年,8月28日6.1.2假設(shè)檢驗(yàn)的基本步驟一般來說,假設(shè)檢驗(yàn)需要經(jīng)過以下操作步驟:(1)構(gòu)造假設(shè)。(2)確定檢驗(yàn)的統(tǒng)計(jì)量及其分布。(3)確定顯著性水平。(4)確定決策規(guī)則。(5)判斷決策。返回本節(jié)第一百四十四頁,共一百六十九頁,2022年,8月28日6.2.1構(gòu)造檢驗(yàn)統(tǒng)計(jì)量第一百四十五頁,共一百六十九頁,2022年,8月28日圖6-1雙側(cè)檢驗(yàn)的拒絕與接受域第一百四十六頁,共一百六十九頁,2022年,8月28日圖6-2單側(cè)檢驗(yàn)的拒絕與接受域(1)第一百四十七頁,共一百六十九頁,2022年,8月28日圖6-3單側(cè)檢驗(yàn)的拒絕與接受域(2)第一百四十八頁,共一百六十九頁,2022年,8月28日圖6-4“雙側(cè)檢驗(yàn)”工作表第一百四十九頁,共一百六十九頁,2022年,8月28日圖6-5最終計(jì)算結(jié)果返回本節(jié)第一百五十頁,共一百六十九頁,2022年,8月28日6.2.2P值法P值法是將統(tǒng)計(jì)量z值轉(zhuǎn)換成概率,即大于統(tǒng)計(jì)量z的絕對值的概率。以例6-2資料為例,如圖6-6所示,陰影區(qū)域的面積即為該概率。在Excel中可以用標(biāo)準(zhǔn)正態(tài)分布函數(shù)NORMSDIST計(jì)算這個(gè)面積,返回小于已知標(biāo)準(zhǔn)正態(tài)變量的概率。如果變量值為-2.76694,則NORMSDIST將返回圖6-6中左側(cè)陰影區(qū)域的面積;如果變量值為2.76694,則NORMSDIST將返回這個(gè)值左邊區(qū)域的面積,它等于1減去圖6-6中右側(cè)陰影部分的概率。本例要求的是雙側(cè)陰影區(qū)域的面積,把由-2.76694所計(jì)算的概率加倍,即可得到該概率。第一百五十一頁,共一百六十九頁,2022年,8月28日具體操作步驟如下:(1)打開“雙側(cè)檢驗(yàn)”工作表。(2)在單元格D1中輸入公式“=2*NORMSDIST(-ABS(B7))”,回車后顯示P值0.005659。(3)在單元格D2中輸入公式“=IF(D1<B7,"拒絕","接受")”,回車后顯示“拒絕”,如圖6-7所示,即有95%的把握相信總體的平均身高有改變。第一百五十二頁,共一百六十九頁,2022年,8月28日圖6-6P值法的概率第一百五十三頁,共一百六十九頁,2022年,8月28日圖6-7P值法檢驗(yàn)結(jié)果返回本節(jié)第一百五十四頁,共一百六十九頁,2022年,8月28日6.2.3臨界值法臨界值法是將顯著性水平轉(zhuǎn)換成臨界值zα,定義“拒絕域”。落入拒絕域中的z值的概率等于顯著性水平所對應(yīng)的陰影面積。對于雙側(cè)檢驗(yàn)來說,每個(gè)單側(cè)的面積是顯著性水平的一半。第一百五十五頁,共一百六十九頁,2022年,8月28日圖6-8臨界值法檢驗(yàn)結(jié)果返回本節(jié)第一百五十六頁,共一百六十九頁,2022年,8月28日6.3標(biāo)準(zhǔn)差未知時(shí)總體均值的假設(shè)檢驗(yàn)設(shè)總體X服從正態(tài)分布N(μ,σ2),方差σ2未知,此時(shí),可以用服從t分布的統(tǒng)計(jì)量去檢驗(yàn)總體均值。由于總體方差σ2未知,因而需要用樣本標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差。返回首頁第一百五十七頁,共一百六十九頁,2022年,8月28日例6-3某糖廠用自動打包機(jī)包糖,每包重量服從正態(tài)分布,其標(biāo)準(zhǔn)重量μ0=100斤,某日開工后測得10包的平均重量為99.98斤,標(biāo)準(zhǔn)差為1.23斤,如果顯著性水平為0.05,那么打包機(jī)的工作是否正常?設(shè)每包糖的重量為X,X~N(μ,σ2),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論