![描述統(tǒng)計(jì)中的測(cè)度_第1頁(yè)](http://file4.renrendoc.com/view/8e2eedca7592751bd5064f205a4cfa3b/8e2eedca7592751bd5064f205a4cfa3b1.gif)
![描述統(tǒng)計(jì)中的測(cè)度_第2頁(yè)](http://file4.renrendoc.com/view/8e2eedca7592751bd5064f205a4cfa3b/8e2eedca7592751bd5064f205a4cfa3b2.gif)
![描述統(tǒng)計(jì)中的測(cè)度_第3頁(yè)](http://file4.renrendoc.com/view/8e2eedca7592751bd5064f205a4cfa3b/8e2eedca7592751bd5064f205a4cfa3b3.gif)
![描述統(tǒng)計(jì)中的測(cè)度_第4頁(yè)](http://file4.renrendoc.com/view/8e2eedca7592751bd5064f205a4cfa3b/8e2eedca7592751bd5064f205a4cfa3b4.gif)
![描述統(tǒng)計(jì)中的測(cè)度_第5頁(yè)](http://file4.renrendoc.com/view/8e2eedca7592751bd5064f205a4cfa3b/8e2eedca7592751bd5064f205a4cfa3b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
描述統(tǒng)計(jì)中的測(cè)度第1頁(yè),共71頁(yè),2023年,2月20日,星期五數(shù)據(jù)的特征和度量數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)集中趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度第2頁(yè),共71頁(yè),2023年,2月20日,星期五數(shù)據(jù)的特征和度量對(duì)于描述統(tǒng)計(jì)中的測(cè)度,主要可以分為三個(gè)方面來(lái)描述:一是數(shù)據(jù)的集中趨勢(shì),反映各數(shù)據(jù)向其中心值靠攏或聚焦的程度;二是分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì);三是數(shù)據(jù)分布的形狀,即數(shù)據(jù)分布的偏態(tài)和峰度。第3頁(yè),共71頁(yè),2023年,2月20日,星期五4.1數(shù)據(jù)分布的集中趨勢(shì)測(cè)度集中趨勢(shì)(Generaltendency)是指分布的定位,它是指一組數(shù)據(jù)向某一中心值靠攏的傾向,或是表明一組統(tǒng)計(jì)數(shù)據(jù)所具有的一般水平。對(duì)集中趨勢(shì)進(jìn)行測(cè)度也就是尋找數(shù)據(jù)一般水平的代表值或中心值。對(duì)集中趨勢(shì)的度量有數(shù)值平均數(shù)和位置平均數(shù)之分。第4頁(yè),共71頁(yè),2023年,2月20日,星期五4.1數(shù)據(jù)分布的集中趨勢(shì)測(cè)度數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)集中趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度第5頁(yè),共71頁(yè),2023年,2月20日,星期五一、數(shù)值平均數(shù)
數(shù)值平均數(shù)又稱均值(Mean),是根據(jù)統(tǒng)計(jì)資料的數(shù)值計(jì)算而得到,在統(tǒng)計(jì)學(xué)中具有重要的作用和地位,是度量集中趨勢(shì)的最主要的指標(biāo)之一。平均的對(duì)象可理解為變量,平均數(shù)可記為。第6頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)
1.簡(jiǎn)單算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)是根據(jù)原始數(shù)據(jù)直接計(jì)算均值。一般地,設(shè)一組數(shù)據(jù)為,其簡(jiǎn)單算術(shù)平均數(shù)計(jì)算的一般公式可表達(dá)為:第7頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)例如:為了研究目前大學(xué)中班級(jí)學(xué)生人數(shù)的情況,從北京某大學(xué)抽樣五個(gè)班級(jí),其學(xué)生人數(shù)分別為:46,54,42,46,32。我們使用,…分別表示該五個(gè)數(shù)據(jù),計(jì)算其均值,可以寫成:
第8頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)2.加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)計(jì)算的所依靠的數(shù)據(jù)是經(jīng)過一定整理的,即是根據(jù)一定規(guī)則分組的。可分為(1)由數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)(2)根據(jù)組距計(jì)算加權(quán)算術(shù)平均數(shù)第9頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)(1)由數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)由單項(xiàng)變量數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)的基礎(chǔ)是要先將數(shù)據(jù)進(jìn)行分組,即將n個(gè)數(shù)據(jù)按變量值(xi)進(jìn)行分組,并統(tǒng)計(jì)在各個(gè)變量取值出現(xiàn)的次數(shù),或稱為頻數(shù)(fi
)。其加權(quán)算術(shù)平均數(shù)的計(jì)算公式如下:第10頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)設(shè)某班級(jí)10名同學(xué)的年齡分別為:18,19,17,18,17,18,19,18,18,19。則根據(jù)簡(jiǎn)單平均數(shù)的公式,我們可計(jì)算得到該班10名同學(xué)的平均年齡:第11頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)年齡(歲)人數(shù)人數(shù)比重1722/10(0.2)1866/10(0.6)1922/10(0.2)合計(jì)101第12頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)(2)根據(jù)組距計(jì)算加權(quán)算術(shù)平均數(shù)選擇適當(dāng)?shù)慕M距來(lái)對(duì)數(shù)據(jù)進(jìn)行分組,再求加權(quán)平均數(shù)往往就簡(jiǎn)單、容易許多。根據(jù)組距計(jì)算加權(quán)平均數(shù)的方法與上面所述的數(shù)列加權(quán)平均數(shù)方法基本相同,只需以各組的組中值來(lái)代替相應(yīng)的x值即可第13頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)①簡(jiǎn)單算術(shù)平均數(shù)適用于數(shù)據(jù)量較少的未分組數(shù)據(jù);加權(quán)算術(shù)平均數(shù)則只適用于分組數(shù)據(jù),且在進(jìn)行數(shù)據(jù)分組時(shí),可以根據(jù)每個(gè)變量的取值來(lái)分組,亦或根據(jù)一定的區(qū)間來(lái)分組,這應(yīng)該根據(jù)所針對(duì)問題的具體數(shù)據(jù)來(lái)來(lái)選取。②簡(jiǎn)單算術(shù)平均數(shù)其數(shù)值的大小只與變量值的大小有關(guān);對(duì)最終加權(quán)平均數(shù)大小的影響因素有兩個(gè):一是各組變量值的影響;另一個(gè)是各組變量值的頻數(shù)的影響。第14頁(yè),共71頁(yè),2023年,2月20日,星期五(一)算術(shù)平均數(shù)③加權(quán)算術(shù)平均數(shù)計(jì)算公式中頻數(shù)的大小起著重要作用,當(dāng)變量值比較大的次數(shù)多時(shí),平均數(shù)就接近于變量值大的一方;當(dāng)變量值比較小的次數(shù)多時(shí),平均數(shù)就接近于變量值小的一方。可見,次數(shù)對(duì)變量值在平均數(shù)中的影響起著某種權(quán)衡輕重的作用,因此被稱為權(quán)數(shù)。④在加權(quán)算術(shù)平均數(shù)計(jì)算中當(dāng)各組變量的權(quán)重相等時(shí),則權(quán)重的權(quán)衡輕重的作用也就消失了,此時(shí)加權(quán)算術(shù)平均數(shù)轉(zhuǎn)化為簡(jiǎn)單算術(shù)平均數(shù)的計(jì)算形式。第15頁(yè),共71頁(yè),2023年,2月20日,星期五(二)調(diào)和平均數(shù)
調(diào)和平均數(shù)(Harmonicmean)是均值的另一種重要表示形式,由于它是根據(jù)變量值倒數(shù)計(jì)算的,也叫倒數(shù)平均數(shù),一般用字母表示Hm。根據(jù)所給資料情況的不同,調(diào)和平均數(shù)可分為:簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種。第16頁(yè),共71頁(yè),2023年,2月20日,星期五(二)調(diào)和平均數(shù)1.簡(jiǎn)單調(diào)和平均數(shù)事實(shí)上簡(jiǎn)單調(diào)和平均數(shù)是權(quán)數(shù)均相等條件下的加權(quán)調(diào)和平均數(shù)的特例。當(dāng)權(quán)數(shù)相等時(shí),就產(chǎn)生了通常所說的加權(quán)調(diào)和平均數(shù)。
第17頁(yè),共71頁(yè),2023年,2月20日,星期五(二)調(diào)和平均數(shù)2.加權(quán)調(diào)和平均數(shù)用公式表示為:由此可以看出,當(dāng)權(quán)重mi相等時(shí),則加權(quán)調(diào)和平均數(shù)則轉(zhuǎn)換為簡(jiǎn)單調(diào)和平均數(shù)。
第18頁(yè),共71頁(yè),2023年,2月20日,星期五(二)調(diào)和平均數(shù)3.調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形在一定的條件下,加權(quán)調(diào)和平均數(shù)和加權(quán)算術(shù)平均數(shù)只是計(jì)算形式不同,在經(jīng)濟(jì)內(nèi)容上沒有實(shí)質(zhì)性的區(qū)別,調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形,是在缺少總體單位的資料時(shí)才被迫使用的計(jì)算平均數(shù)的一種方法。即:第19頁(yè),共71頁(yè),2023年,2月20日,星期五(三)幾何平均數(shù)幾何平均數(shù)(Geometricmean)是個(gè)變量值連乘積的次方根,常用字母表示。它是平均指標(biāo)的另一種計(jì)算形式。幾何平均數(shù)是計(jì)算平均比率和平均速度最適用的一種方法。根據(jù)掌握的數(shù)據(jù)資料不同,幾何平均數(shù)可分為簡(jiǎn)單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種。第20頁(yè),共71頁(yè),2023年,2月20日,星期五(三)幾何平均數(shù)1.簡(jiǎn)單幾何平均數(shù)假定有n個(gè)變量值x1,x2,……xn,則簡(jiǎn)單幾何平均數(shù)的基本計(jì)算公式為:第21頁(yè),共71頁(yè),2023年,2月20日,星期五(三)幾何平均數(shù)2.加權(quán)幾何平均數(shù)當(dāng)掌握的數(shù)據(jù)資料為分組資料,且各個(gè)變量值出現(xiàn)的次數(shù)不相同時(shí),應(yīng)用加權(quán)方法計(jì)算幾何平均數(shù)。加權(quán)幾何平均數(shù)的公式為:第22頁(yè),共71頁(yè),2023年,2月20日,星期五二、位置平均數(shù)數(shù)值平均數(shù)是根據(jù)所提供資料的具體數(shù)值計(jì)算而得到,和我們通常觀念中的平均含義比較接近,但結(jié)果受極端值的影響而不能真是地反應(yīng)改組資料的整體集中趨勢(shì),在這種情況下,一般可以考慮用位置中位數(shù)取代算術(shù)中位數(shù)來(lái)對(duì)數(shù)據(jù)的集中趨勢(shì)進(jìn)行描述。常用的位置平均數(shù)有:平均數(shù)、眾數(shù)、分位數(shù)。第23頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)
中位數(shù)(Median)是度量數(shù)據(jù)集中趨勢(shì)的另一重要測(cè)度,它是一組數(shù)據(jù)按數(shù)值的大小從小到大排序后,處于中點(diǎn)位置上的變量值。通常用表示Me。定義表明,中位數(shù)就是將某變量的全部數(shù)據(jù)均等地分為兩半的那個(gè)變量值。其中,一半數(shù)值小于中位數(shù),另一半數(shù)值大于中位數(shù)。中位數(shù)是一個(gè)位置代表值,因此它不受極端變量值影響。第24頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)1.根據(jù)未分組數(shù)據(jù)確定中位數(shù)對(duì)于未分組的數(shù)據(jù),確定其中位數(shù)的具體步驟為:(1)將變量按變量值大小從小到大進(jìn)行排列。(2)確定中位數(shù)的位置,即中點(diǎn)位置。一般的,設(shè)一組數(shù)據(jù)的個(gè)數(shù)為,則中點(diǎn)的位置為(n+1)/2。(3)確定中位數(shù)。第25頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)如果觀測(cè)值的數(shù)目n為奇數(shù),則(n+1)/2為整數(shù),該位置上所對(duì)應(yīng)的變量即為所求的中位數(shù)如果觀測(cè)值的數(shù)目n為偶數(shù),則(n+1)/2為非整數(shù),則取位于中間位置的兩個(gè)變量值的算術(shù)平均數(shù)作為中位數(shù)。第26頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)2.根據(jù)單項(xiàng)數(shù)列確定中位數(shù)根據(jù)單項(xiàng)數(shù)列資料確定中位數(shù)與根據(jù)未分組資料確定中位數(shù)方法基本一致。具體步驟為:(1)計(jì)算各組的累計(jì)次數(shù)(或頻數(shù))(2)確定中位數(shù)的位置,。(3)確定中位數(shù)。中位數(shù)所在組的變量值即為中位數(shù)。第27頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)3.根據(jù)組距數(shù)列確定中位數(shù)如果我們掌握的資料是分組后得到的組距數(shù)列,則確定中位數(shù)的步驟為:(1)確定中位數(shù)的位置。(2)計(jì)算累計(jì)次數(shù),據(jù)以找出中位數(shù)所在的組。(3)利用以下公式,確定中位數(shù)的近似值第28頁(yè),共71頁(yè),2023年,2月20日,星期五(一)中位數(shù)第29頁(yè),共71頁(yè),2023年,2月20日,星期五(二)眾數(shù)眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)變量值,通常用MO表示。如果在一個(gè)總體當(dāng)中,各變量值皆不相同,或各個(gè)變量值出現(xiàn)的次數(shù)皆相同,則沒有眾數(shù)。如果在一個(gè)總體中,有兩個(gè)標(biāo)志值出現(xiàn)的次數(shù)都最多,稱為雙眾數(shù)。只有在總體單位比較多、變量值又有明顯集中趨勢(shì)的條件下確定的眾數(shù),才能代表總體的一般水平;在總體單位較少,或雖多但無(wú)明顯集中趨勢(shì)的條件下,眾數(shù)的確定是沒有意義的。眾數(shù)的確定方法要根據(jù)給定資料的具體情況而定。第30頁(yè),共71頁(yè),2023年,2月20日,星期五(二)眾數(shù)1.未分組資料或單項(xiàng)數(shù)列資料眾數(shù)觀察給定的數(shù)據(jù),某個(gè)變量出現(xiàn)次數(shù)最多,則該變量即為所求眾數(shù)。這樣的方法確定比較容易,不需要計(jì)算。第31頁(yè),共71頁(yè),2023年,2月20日,星期五(二)眾數(shù)2.根據(jù)組距變量數(shù)量確定眾數(shù)具體步驟為:第32頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)中位數(shù)是從中間點(diǎn)將全部數(shù)據(jù)等分為兩部分。與中位數(shù)類似的還有四分位數(shù)、八分位數(shù)、十分位數(shù)和百分位數(shù)等。它們分別是用3個(gè)點(diǎn)、7個(gè)點(diǎn)、9個(gè)點(diǎn)和99個(gè)點(diǎn)將數(shù)據(jù)四等分、八等分、十等分和100等分后各分位點(diǎn)上的值。這里只介紹四分位數(shù)的計(jì)算,其他分位數(shù)與之類似。第33頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)1.百分位數(shù)百分位數(shù)(Percentile)是用99個(gè)點(diǎn)將排列好的數(shù)據(jù)100等分后各能給出從最小值到最大值區(qū)間內(nèi)數(shù)據(jù)的信息分位點(diǎn)上的值。其中每個(gè)部分包含了1%的數(shù)據(jù)。百分位數(shù)的計(jì)算方法與中位數(shù)的類似第34頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)升序或降序)進(jìn)行排列。(2)確定所求百分位數(shù)的位置。假設(shè)求第p百分位數(shù),則該第p百分位數(shù)位置為:i=pn/100(3)確定百分位數(shù)。如果計(jì)算i的為整數(shù),則直接在排列的數(shù)據(jù)列中找到第個(gè)變量即為所求。若i不為整數(shù),則取位于兩側(cè)的變量的平均數(shù)作為所要求的百分位數(shù)。第35頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)2.四分位數(shù)一組數(shù)據(jù)排序后處于25%和75%位置上的值,稱為四分位數(shù)(quartile),也稱四分位點(diǎn)。四分位數(shù)是通過三個(gè)點(diǎn)即將全部數(shù)據(jù)等分為四部分,其中每部分包含25%的數(shù)據(jù)。中間的分位數(shù)就是中位數(shù)。因此通常所說的四分位數(shù)是指處在25%位置上的數(shù)值(下四分位數(shù))和處在75%位置上的數(shù)值(上四分位數(shù))。第36頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)設(shè)下四分位數(shù)為Q1,中間的四分位數(shù)為Q2,上四分位數(shù)為Q3,則這分三個(gè)四位數(shù)所在位置:Q1的位置為(n+1)/4Q2的位置為(n+1)/2,即中位數(shù)點(diǎn)的位置。Q3的位置為3(n+1)/4。第37頁(yè),共71頁(yè),2023年,2月20日,星期五(三)分位數(shù)第38頁(yè),共71頁(yè),2023年,2月20日,星期五三、眾數(shù)、中位數(shù)與均值的比較(一)正態(tài)分布時(shí)三者的關(guān)系正態(tài)分布是以算術(shù)平均數(shù)為對(duì)稱軸,兩邊頻數(shù)相等。其中頻數(shù)最大的標(biāo)志值就是數(shù)列居中位置的標(biāo)志值,也就是權(quán)數(shù)最大、最具有代表性的那個(gè)變量值。因此,正態(tài)分布時(shí),算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相等,即第39頁(yè),共71頁(yè),2023年,2月20日,星期五三、眾數(shù)、中位數(shù)與均值的比較第40頁(yè),共71頁(yè),2023年,2月20日,星期五三、眾數(shù)、中位數(shù)與均值的比較(二)偏態(tài)分布時(shí)三者的關(guān)系頻數(shù)分布呈偏態(tài)時(shí),算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的計(jì)算結(jié)果不同。當(dāng)右偏時(shí),算術(shù)平均數(shù)大于中位數(shù),而中位數(shù)又大于眾數(shù),左偏時(shí)眾數(shù)大于中位數(shù),中位數(shù)大于算術(shù)平均數(shù)。在偏態(tài)分布情況下,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的上述關(guān)系是容易理解的,由于算術(shù)平均數(shù)受極端值影響,在發(fā)生右偏出現(xiàn)較大極端值時(shí),算術(shù)平均數(shù)將增加得更快,而中位數(shù)總是居于中間位置,。左偏同樣可作類似的解釋,從而有第41頁(yè),共71頁(yè),2023年,2月20日,星期五4.2數(shù)據(jù)分布的離散趨勢(shì)測(cè)度
變量的變異程度的度量則是將變量值的差異揭示出來(lái),反映總體各變量值對(duì)其平均數(shù)這個(gè)中心的離中趨勢(shì)。變異指標(biāo)與平均指標(biāo)分別從不同的側(cè)面反映總體的數(shù)量特征。第42頁(yè),共71頁(yè),2023年,2月20日,星期五4.2數(shù)據(jù)分布的離散趨勢(shì)測(cè)度數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)集中趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度第43頁(yè),共71頁(yè),2023年,2月20日,星期五一、極差極差(Range)也叫全距,常用R表示,它是一組數(shù)據(jù)的最大值與最小值之差,即:極差表明數(shù)列中各變量值變動(dòng)的范圍。R越大,表明數(shù)列中變量值變動(dòng)的范圍越大,即數(shù)列中各變量值差異大;反之,R越小,表明數(shù)列中變量值的變動(dòng)范圍越小,即數(shù)列中各變量值差異小。第44頁(yè),共71頁(yè),2023年,2月20日,星期五二、四分位距四分位距(quartiledeviation)是度量變異數(shù)的另一種方法,也稱為內(nèi)距或四分位差,是第一四分位數(shù)(下四分位數(shù)Q1)與第三四分位數(shù)(上四分位數(shù)Q3)的差,也就是75%百分位數(shù)與25%百分位數(shù)間的距離。它代表分布中間50%的距離。常用表示IQR,其計(jì)算公式為:第45頁(yè),共71頁(yè),2023年,2月20日,星期五三、平均差
平均差(meandeviation)是變量數(shù)列中各個(gè)變量值與算術(shù)平均數(shù)的絕對(duì)離差的平均數(shù),常用MD表示。各變量值與平均數(shù)的離差的絕對(duì)值越大,平均差也越大,則說明變量值變動(dòng)大,數(shù)列離散趨勢(shì)越大;反之亦然。根據(jù)所給資料的形式不同,對(duì)平均差的計(jì)算可以劃分為簡(jiǎn)單和加權(quán)式平均差兩種形式。第46頁(yè),共71頁(yè),2023年,2月20日,星期五(一)簡(jiǎn)單平均差
對(duì)未經(jīng)分組的數(shù)據(jù)資料,采用簡(jiǎn)單平均差,公式如下:第47頁(yè),共71頁(yè),2023年,2月20日,星期五(二)加權(quán)式
根據(jù)分組整理的數(shù)據(jù)計(jì)算平均差,應(yīng)采用加權(quán)式,公式如下:第48頁(yè),共71頁(yè),2023年,2月20日,星期五四、方差與標(biāo)準(zhǔn)差
方差(variance)是變量數(shù)列中各變量值與其算術(shù)平均數(shù)差的平方。標(biāo)準(zhǔn)差(standarddeviation)是方差的平方根,故又稱均方差或均方差根,其計(jì)量單位與平均數(shù)的計(jì)量單位相同。根據(jù)給定資料的不同,對(duì)方差和標(biāo)準(zhǔn)差的求解也可以分為兩種形式。第49頁(yè),共71頁(yè),2023年,2月20日,星期五(一)簡(jiǎn)單式
對(duì)未經(jīng)分組的數(shù)據(jù)資料,采用簡(jiǎn)單式,公式如下:方差的計(jì)算公式:標(biāo)準(zhǔn)差的計(jì)算公式:第50頁(yè),共71頁(yè),2023年,2月20日,星期五(二)加權(quán)式
根據(jù)分組整理的數(shù)據(jù)計(jì)算標(biāo)準(zhǔn)差,應(yīng)采用加權(quán)式,公式如下:方差:
標(biāo)準(zhǔn)差:第51頁(yè),共71頁(yè),2023年,2月20日,星期五五、相對(duì)位置和相對(duì)離散程度的度量前面介紹的極差、四分位差、平均差和標(biāo)準(zhǔn)差都是反映數(shù)據(jù)分散程度的絕對(duì)值,其數(shù)據(jù)的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān)。因此,在對(duì)比分析中,不宜直接用上述各種標(biāo)志變異指標(biāo)來(lái)比較不同水平數(shù)列之間的離散程度,必須剔除數(shù)列水平的影響,必須用反映標(biāo)志變異程度的相對(duì)指標(biāo)來(lái)比較,用相對(duì)位置和離散系數(shù)來(lái)反映數(shù)列的離散趨勢(shì)。第52頁(yè),共71頁(yè),2023年,2月20日,星期五
(一)標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分(standardscore)也稱標(biāo)準(zhǔn)化值或分?jǐn)?shù),它是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,是對(duì)每個(gè)數(shù)據(jù)在該組數(shù)據(jù)中相對(duì)位置的測(cè)量。常用字母z表示,有
第53頁(yè),共71頁(yè),2023年,2月20日,星期五(一)標(biāo)準(zhǔn)分?jǐn)?shù)
實(shí)際上,分?jǐn)?shù)是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在該數(shù)據(jù)組中的位置,也沒有改變?cè)摻M數(shù)據(jù)的分布形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。經(jīng)驗(yàn)表明,不管分布狀態(tài)如何,按照著名的“切貝舍夫定理”,至少有75%的數(shù)據(jù)位于,89%的數(shù)據(jù)位于;當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí),大約有68%的數(shù)據(jù)在范圍內(nèi);大約有95%的數(shù)據(jù)在的范圍內(nèi);而在的范圍內(nèi)大約有98%的數(shù)據(jù)。第54頁(yè),共71頁(yè),2023年,2月20日,星期五(二)離散系數(shù)
離散系數(shù)(Coefficientofvariation)通常是就標(biāo)準(zhǔn)差來(lái)計(jì)算的,因此,也稱為標(biāo)準(zhǔn)差系數(shù),它反映數(shù)列離散趨勢(shì)的相對(duì)程度,是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其對(duì)應(yīng)的平均數(shù)之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其計(jì)算公式如下:離散系數(shù)的作用主要用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散系數(shù)大的說明數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說明數(shù)據(jù)的離散程度也就小。第55頁(yè),共71頁(yè),2023年,2月20日,星期五4.3數(shù)據(jù)分布的形狀測(cè)度數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)集中趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度第56頁(yè),共71頁(yè),2023年,2月20日,星期五一、分布偏態(tài)測(cè)度
偏態(tài)(Skewness)是對(duì)分布偏斜方向和程度的測(cè)度,是次數(shù)分配的非對(duì)稱程度。它與平均數(shù)和標(biāo)準(zhǔn)差一樣,是反映次數(shù)分布特征的又一重要指標(biāo)。第57頁(yè),共71頁(yè),2023年,2月20日,星期五一、分布偏態(tài)測(cè)度
偏態(tài)通常分為兩種:右偏(或正偏)與左偏(或負(fù)偏)。它們是與對(duì)稱分配為標(biāo)準(zhǔn)相比較而言的。第58頁(yè),共71頁(yè),2023年,2月20日,星期五一、分布偏態(tài)測(cè)度統(tǒng)計(jì)分析中測(cè)定偏態(tài)系數(shù)的方法很多,一般采用動(dòng)差概念計(jì)算,其計(jì)算公式為三階中心動(dòng)差與標(biāo)準(zhǔn)差的三次方之比。具體公式如下:第59頁(yè),共71頁(yè),2023年,2月20日,星期五一、分布偏態(tài)測(cè)度從上式可以看到,它是離差三次方的平均數(shù)再除以標(biāo)準(zhǔn)差的三次方。當(dāng)分布對(duì)稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而的分子等于0,則=0;當(dāng)分布不對(duì)稱時(shí),正負(fù)離差不能抵消,就形成了正與負(fù)的偏態(tài)系數(shù)。當(dāng)為正值時(shí),表示正偏離差值較大,可以判斷為正偏或右偏;反之,為負(fù)值時(shí),表示負(fù)偏離差值較大,可以判斷為負(fù)偏或左偏。偏態(tài)系數(shù)的數(shù)值一般在0與±3之間,越接近0,分布的偏斜度越小;越接近±3,分布的偏斜度越大。第60頁(yè),共71頁(yè),2023年,2月20日,星期五二、分布峰態(tài)測(cè)度
峰度(Kurtosis)是分布集中趨勢(shì)高峰的形狀,指次數(shù)分配曲線頂端的尖峭程度。在變量數(shù)列的分布特征中,常常將數(shù)分配曲線與正態(tài)曲線相比較,判斷是尖頂還是平頂及其尖頂或平頂?shù)某潭?。峰度通常分為三種:正態(tài)峰度、尖頂峰度與平頂峰度。當(dāng)分配數(shù)列的次數(shù)比較集中于眾數(shù)的位置,使次數(shù)分配曲線較正態(tài)分配曲線更為隆起的,屬于尖頂峰度。當(dāng)分配數(shù)列的次數(shù),對(duì)眾數(shù)來(lái)說比較分散,使次數(shù)分配曲線較正態(tài)分配曲線更為平滑的,屬于平頂峰度。第61頁(yè),共71頁(yè),2023年,2月20日,星期五二、分布峰態(tài)測(cè)度
測(cè)度峰度的方法一般運(yùn)用統(tǒng)計(jì)動(dòng)差法,即運(yùn)用四階中心動(dòng)差與標(biāo)準(zhǔn)差的四次方對(duì)比,以此來(lái)判斷各分布曲線峰度的尖平程度。公式如下:第62頁(yè),共71頁(yè),2023年,2月20日,星期五二、分布峰態(tài)測(cè)度
峰度系數(shù)是統(tǒng)計(jì)中描述次數(shù)分布狀態(tài)的又一個(gè)重要特征值,用以測(cè)定鄰近數(shù)值周圍變量值分布的集中或分散程度。它以四階中心動(dòng)差為測(cè)量標(biāo)準(zhǔn),除以好是為了消除單位量綱的影響,而得
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農(nóng)信息人才培養(yǎng)計(jì)劃及實(shí)施方案
- 多領(lǐng)域融合的智能科技項(xiàng)目開發(fā)協(xié)議
- 工程項(xiàng)目居間的合同
- 化工廠員工勞動(dòng)協(xié)議
- 經(jīng)營(yíng)承包合同
- 勞務(wù)輸出合作協(xié)議書
- 第2課 獎(jiǎng)品數(shù)量好計(jì)算(教學(xué)設(shè)計(jì))2024-2025學(xué)年五年級(jí)上冊(cè)信息技術(shù)泰山版
- 新媒體主播合約協(xié)議書8篇
- Unit 8 Knowing the world Lesson 2 My home country 教學(xué)設(shè)計(jì) 2024-2025學(xué)年冀教版英語(yǔ)七年級(jí)上冊(cè)
- 甘肅幼兒園塑膠施工方案
- 胃癌影像診斷課件
- 建筑工程勞務(wù)作業(yè)服務(wù)方案
- 探究水垢的主要成份
- (完整版)小學(xué)生心理健康教育課件
- 軍隊(duì)文職專用簡(jiǎn)歷(2023年)
- 建筑裝飾工程施工總平面布置圖
- 鐵路基本建設(shè)工程設(shè)計(jì)概(預(yù))算編制辦法-國(guó)鐵科法(2017)30號(hào)
- 顏真卿《勸學(xué)》ppt課件1
- 特種設(shè)備安全技術(shù)檔案(附表格)
- (完整版)中國(guó)古代書法史課件
- 人教版英語(yǔ)八年級(jí)上冊(cè)單詞默寫表
評(píng)論
0/150
提交評(píng)論