




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、本資料來源 Session2 THEME:Descriptive StatisticsSession2 THEME:Descriptive Statistics (一)數(shù)據(jù)的整理與顯示(一)數(shù)據(jù)的整理與顯示 2.1數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理q 數(shù)據(jù)的審核與篩選q 數(shù)據(jù)的排序原始數(shù)據(jù)的審核:完整性、準(zhǔn)確性二手?jǐn)?shù)據(jù)的審核:適用性和及時(shí)性2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示(一)數(shù)據(jù)的整理與顯示(一)數(shù)據(jù)的整理與顯示定類數(shù)據(jù)的整理與顯示 頻數(shù)與頻數(shù)分布1)頻數(shù):也稱次數(shù),是落在各類別中的數(shù)據(jù)個(gè)數(shù); 頻數(shù)分布:用數(shù)據(jù)概括表的形式來列示若干個(gè)互不重疊分組中每組數(shù)據(jù)出現(xiàn)的次數(shù)2.2品質(zhì)數(shù)據(jù)的整理與
2、顯示品質(zhì)數(shù)據(jù)的整理與顯示例:由購買50臺(tái)計(jì)算機(jī)的樣本數(shù)據(jù)得到的頻數(shù)分布表:公司發(fā)生頻數(shù)相對(duì)頻數(shù)百分比頻數(shù)蘋果130.3626康柏120.3424蓋特威-200050.1010IBM90.1818帕科特.貝爾110.2222合計(jì)501.001002.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示2) 比例(Proportion):總體中各個(gè)部分的數(shù)量占總體數(shù)量的比重,通常用于反映總體的構(gòu)成或結(jié)構(gòu)。又可以稱為相對(duì)頻數(shù)。N1 N2 N3 N4 .,Nk比例:Ni/N。 比例的性質(zhì)含義。2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示3) 百分比頻數(shù)(Precentage):將比例乘以100,用%表示。4)
3、 比率(Ratio):各不同類別的數(shù)量的比值。 比例與比率的區(qū)別。2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示公司發(fā)生頻數(shù)相對(duì)頻數(shù)百分比頻數(shù)蘋果130.3626康柏120.3424蓋特威-200050.1010IBM90.1818帕科特.貝爾110.2222合計(jì)501.001002.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示 定類數(shù)據(jù)的圖示1)條形圖(Bar chart)、柱形圖頻數(shù)051015蘋果康柏蓋特偉IBM帕科特頻數(shù)頻數(shù)051015蘋果蓋特偉帕科特頻數(shù)2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示2)圓餅圖(Pie chart)頻數(shù)13125911蘋果康柏蓋特偉IBM帕科特2.2品質(zhì)
4、數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示定類數(shù)據(jù)整理與顯示定類數(shù)據(jù)整理與顯示知識(shí)點(diǎn)知識(shí)點(diǎn): 條形圖 和圓餅圖是描述頻數(shù)或百分比分布已經(jīng)經(jīng)過匯總的定類數(shù)據(jù)的圖形方法。 組別同數(shù)據(jù)種類關(guān)系一致 頻數(shù)總和與數(shù)據(jù)集中項(xiàng)目總數(shù)相同:相對(duì)頻數(shù)總和為1.00;百分比頻數(shù)總和為100。 條形圖、柱形圖的長(zhǎng)度或高度代表頻數(shù),其寬度都相同。2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示2. 定序數(shù)據(jù)的整理與顯示 累積頻數(shù)和累積頻率 1)累積頻數(shù)(Cumulative frequencies):就是將各類別的頻數(shù)逐級(jí)累加。 向上累加:從類別順序開始的一方向最后一方累加頻數(shù); 向下累加:從類別順序的最后一方向開始一方累加
5、頻數(shù)。2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)百分比戶數(shù)百分比非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703008447590100300276168753010092562510合計(jì)300100 甲城市家庭對(duì)住房狀況的評(píng)價(jià)甲城市家庭對(duì)住房狀況的評(píng)價(jià)2.2品質(zhì)數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示2)累積頻率或百分比(Cumulative percentages):就是將各類別的百分比逐級(jí)累加起來。分向上和向下累積兩種方法。 定序數(shù)據(jù)的圖示 1)累積頻數(shù)分布圖。 2)環(huán)形圖。12345
6、直方圖05101512345其他接收頻率.00%50.00%100.00%150.00%頻率累積 %2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示1. 數(shù)據(jù)的分組:將數(shù)據(jù)按某種標(biāo)準(zhǔn)化分成不同的組。再進(jìn)行頻數(shù)統(tǒng)計(jì),形成頻數(shù)分布表。 單變量值分組:把每一個(gè)變量值作為一組。例:某企業(yè)10名工人日加工零件數(shù)(個(gè))如下:117122107117130115122114118122排序:107114115117117118122122122130(一)頻數(shù)分布2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示將上述數(shù)據(jù)采用單變量分組如下表:零件數(shù)(個(gè))頻數(shù)(人)零件數(shù)(個(gè))頻數(shù)(人) 107 1 114 1
7、115 1 117 2 1181 1223 1301只適用于離散變量且變量值較少的情況。2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示 組距分組:將全部變量值依次劃分若干區(qū)間,并將這一區(qū)間的變量值作為一組。步驟如下: 1)確定互不重疊分組的個(gè)數(shù)。 2)確定每組的組距 3)確定組限 建議分組數(shù)目:5-20個(gè)。2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示例:年終審計(jì)時(shí)間用時(shí)(天) 14191815151817202722232221332814181613第一步:確定組數(shù) 根據(jù)數(shù)據(jù)集大小確定。Sturgesdes的經(jīng)驗(yàn)公式 本例中N=20,可以取組數(shù)為5。2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理
8、與顯示第二步:組距的確定。組距(Class width)是一個(gè)組上限與下限的差。近似組距=(數(shù)據(jù)最大值數(shù)據(jù)最小值)/ 組數(shù) 組限: 下限確定分配給該組可能的最小數(shù)據(jù)值; 上限確定分配給該組可能的最大數(shù)據(jù)值。2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示在本例中,每組的組距近似為:(3312)/ 5=4.2采用5作為組寬因此,分組為:10-14,15-19,20-24,25-29,30-342.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示分組中的其他問題: 分組的不重不漏原則 上組限不在內(nèi) 開口組 等距分組和不等距分組 頻數(shù)密度=頻數(shù)/組距 組中值=(下限值+上限值)/2 (均勻分布2.3數(shù)量數(shù)據(jù)
9、的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示 審計(jì)時(shí)間數(shù)據(jù)頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù) 10-14 4 15-19 8 20-24 5 25-29 2 29-34 1 合計(jì)202.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示(二)相對(duì)頻數(shù)分布和百分比頻數(shù)分布每組相對(duì)頻數(shù)=每組的頻數(shù)/ n n是數(shù)據(jù)的個(gè)數(shù)每組的百分比頻數(shù)=相對(duì)頻數(shù)*100 審計(jì)時(shí)間(天) 相對(duì)頻數(shù) 百分比頻數(shù) 10-14 0.20 20 15-19 0.4040 20-24 0.2525 25-29 0.1010 30-34 0.055 合計(jì) 1.001002.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示 點(diǎn)圖 直方圖(注意區(qū)分直方圖與條形圖的
10、區(qū)別) 折線圖 累積分布2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示051015202530點(diǎn)圖:橫軸表示數(shù)據(jù)的值域,數(shù)據(jù)值打點(diǎn)表示2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示0 10 20 30 400.50.40.30.20.1注意:區(qū)分條形圖與直方圖2.3數(shù)量數(shù)據(jù)的整理與顯示數(shù)量數(shù)據(jù)的整理與顯示累積頻數(shù) 分布表格顯示小于或等于每組上限的數(shù)值次數(shù)。審計(jì)時(shí)間累積頻數(shù)累積相對(duì)頻數(shù)百分比頻數(shù)小于等于1440.220小于等于19120.660小于等于24170.8585小于等于29190.9595小于等于342011002.4探索性數(shù)據(jù)的整理與顯示探索性數(shù)據(jù)的整理與顯示 探索性數(shù)據(jù)分析技術(shù)由簡(jiǎn)
11、單運(yùn)算和容易繪制的圖形組成。 常用技術(shù)莖葉圖例:6 7 8 9 10 11 89 233566 01123456 12224556 002466 12.4探索性數(shù)據(jù)的整理與顯示探索性數(shù)據(jù)的整理與顯示 交叉(分組)列表:一種同時(shí)概括兩個(gè)變量數(shù)據(jù)的表格方法,將兩個(gè)或兩個(gè)以上具有有限類目數(shù)和確定值的變量按一定順序?qū)?yīng)排列在一張表中。分析手段:常常應(yīng)用行、列的邊際分布。2.5 交叉分組列表和散點(diǎn)圖交叉分組列表和散點(diǎn)圖 300家飯店質(zhì)量等級(jí)和餐價(jià)交叉列表分組表質(zhì)量等級(jí)餐價(jià)/美元總計(jì)10-1920-2930-3940-49好42402084非常好3460466150極好214282266總計(jì)7811876
12、283002.5 交叉分組列表和散點(diǎn)圖交叉分組列表和散點(diǎn)圖交叉分組列表的優(yōu)點(diǎn): 提供了變量之間的關(guān)系 廣泛用于調(diào)查兩個(gè)變量之間的問題 交叉列表是統(tǒng)計(jì)調(diào)查報(bào)告最常見的形式之一。2.5 交叉分組列表和散點(diǎn)圖交叉分組列表和散點(diǎn)圖散點(diǎn)圖: 1250 2557 3 141 4354 5454 6138 7563 8348商店廣告次數(shù)與銷售額資料 廣告次數(shù) 銷售額0204060800246廣告次數(shù)銷售額銷售額2.5 交叉分組列表和散點(diǎn)圖交叉分組列表和散點(diǎn)圖散點(diǎn)圖的類型練習(xí)練習(xí) PMP考試要求在4小時(shí)內(nèi)回答200個(gè)問題?,F(xiàn)在將其中20人正確的答題數(shù)列在下表,繪制莖葉圖并評(píng)估結(jié)果。 P61,36; P62,3
13、8;41。123100688010012389901001321161171201158796102Session2 THEME:Descriptive StatisticsSession2 THEME:Descriptive Statistics (一)數(shù)據(jù)的數(shù)值描述方法(一)數(shù)據(jù)的數(shù)值描述方法主要內(nèi)容: 集中趨勢(shì)的測(cè)度 離中趨勢(shì)的測(cè)度 探索性數(shù)據(jù)分析 雙變量相關(guān)關(guān)系測(cè)度 分布集中趨勢(shì)的測(cè)度值反映的是數(shù)據(jù)一般水平的代表值,或者是數(shù)據(jù)分布的中心值。從不同的角度考慮,集中趨勢(shì)的測(cè)度值有多個(gè),主要有:眾數(shù)(mode)中位數(shù)(median)分位數(shù) (Quartile) 均值(mean) 集中趨勢(shì)的測(cè)
14、度集中趨勢(shì)的測(cè)度集中趨勢(shì)的測(cè)度集中趨勢(shì)的測(cè)度 眾數(shù)(M0):出現(xiàn)頻率最高的一個(gè)數(shù)據(jù)值 例:當(dāng)前手機(jī)市場(chǎng)分額:諾基亞摩托羅拉三星TCL波導(dǎo) 20.235.716.810.49.6單項(xiàng)式變量數(shù)列單項(xiàng)式變量數(shù)列:找出出現(xiàn)次數(shù)最多的標(biāo)志值就是眾數(shù)找出出現(xiàn)次數(shù)最多的標(biāo)志值就是眾數(shù) 組距式變量數(shù)列:組距式變量數(shù)列:n首先確定眾數(shù)組,一般最大頻數(shù)對(duì)應(yīng)組就是眾數(shù)組。首先確定眾數(shù)組,一般最大頻數(shù)對(duì)應(yīng)組就是眾數(shù)組。n其次求具體的眾數(shù)值,通常用下面的近似公式計(jì)算:其次求具體的眾數(shù)值,通常用下面的近似公式計(jì)算: iLM2110(3、1)式中0M表示眾數(shù),L表示眾數(shù)所在組的下組限,1表示眾數(shù)組與前一組次數(shù)之差,2表示眾
15、數(shù)組次數(shù)與后一組次數(shù)之差,i表示眾數(shù)組的組距 。眾數(shù)是一種位置代表值。例如;在農(nóng)貿(mào)市場(chǎng)上某種商品的價(jià)格常以眾數(shù)值為代表。鞋子,帽子等物品的尺碼。集中趨勢(shì)的測(cè)度集中趨勢(shì)的測(cè)度 中位數(shù):一組數(shù)據(jù)從小到大排序后,處于中間位置上的數(shù)據(jù)值,用Me表示。 如果數(shù)據(jù)是奇數(shù),中位數(shù)處于正中心的一項(xiàng)數(shù)據(jù)值; 如果數(shù)據(jù)是偶數(shù),中位數(shù)是正中心兩項(xiàng)的平均值;計(jì)算公式:特點(diǎn):應(yīng)用場(chǎng)合。數(shù)據(jù)是已分組的資料數(shù)據(jù)是已分組的資料n此時(shí)原始數(shù)值已被隱去,不能直接對(duì)其排隊(duì)求其準(zhǔn)確的中位數(shù)數(shù)值,可用以下的近似公式計(jì)算:ifSNLMmme12 (3、2)式中2N表示中位數(shù)所在位置,L表示中位數(shù)所在組的下組限,1mS表示中位數(shù)所在組以前
16、各組的累積次數(shù),mf表示中位數(shù)所在組的次數(shù),i表示中位數(shù)所在組的組距。中位數(shù)有這樣一個(gè)性質(zhì),就是數(shù)據(jù)值與中位數(shù)之差的絕對(duì)值最小,即min1nieiMX表明數(shù)據(jù)值與中位數(shù)的距離最短,在工程設(shè)計(jì)中有應(yīng)用價(jià)值。分位數(shù)分位數(shù)n中位數(shù)是將統(tǒng)計(jì)分布從中間分成相等的兩部分,與中位數(shù)性質(zhì)相似的還有四分位數(shù)(quartiles)、十分位數(shù)(decile)、和百分位數(shù)(percentile)。n顯然,四分位數(shù)就是將數(shù)據(jù)分布四等分的三個(gè)數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別是將數(shù)據(jù)分布是等分和一百等分的數(shù)值。n以分位值作集中趨勢(shì)分析,在西方統(tǒng)計(jì)學(xué)中討論和運(yùn)用較多,在中國較少用到。均值(均值(me
17、an)n主要指算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢(shì)的最主要測(cè)度值。任何統(tǒng)計(jì)推斷和分析都離不開均值。n從統(tǒng)計(jì)思想看,它反映了一組數(shù)據(jù)的中心點(diǎn)或代表值,是數(shù)據(jù)誤差互相抵消后,客觀事物必然性數(shù)量特征的一種反映。n從數(shù)學(xué)公式看,均值有一些非常重要的性質(zhì): 1 數(shù)據(jù)觀察值與均值的離差之和為零,即01NiiXX2 數(shù)據(jù)觀察值與均值的離差平方和最小,min21NiiXX 3 均值是統(tǒng)計(jì)分布的均衡點(diǎn),不論統(tǒng)計(jì)分布是對(duì)稱分布還是偏態(tài)分布,只有在均值點(diǎn)上才能支撐這一分布,使其保持平衡,這一均衡點(diǎn)在物理上稱為重心。算術(shù)平均數(shù)算術(shù)平均數(shù)n它是最常用的集中趨勢(shì)描述指標(biāo),其原因有二:n一是因?yàn)樗挠?jì)算方法,與許多客觀現(xiàn)象中的個(gè)別現(xiàn)
18、象與總體現(xiàn)象之間存在的數(shù)量關(guān)系相符合;二是算術(shù)平均值作為一種變量值的集中值,不僅考慮到變量值的次數(shù),而且考慮到變量值的大小。變量數(shù)列中任何次數(shù)和變量值大小的變化都會(huì)引起算術(shù)平均值的改變。因此它是一個(gè)最靈敏的指標(biāo),也是對(duì)資料所提供信息運(yùn)用最充分的指標(biāo)。n算術(shù)平均數(shù)的計(jì)算通式:由于所掌握資料條件不同,算術(shù)平均值有兩種具體計(jì)算形式:簡(jiǎn)單算術(shù)平均值和加權(quán)算術(shù)平均值。總體單位總量總體標(biāo)志總量算術(shù)平均數(shù) 簡(jiǎn)單算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)n將被研究標(biāo)志的各個(gè)數(shù)值相加,除以具有這個(gè)標(biāo)志的單位數(shù)所得之商,就可求出簡(jiǎn)單算術(shù)平均數(shù)。即nxnxxxxxn321簡(jiǎn)單算術(shù)平均值的特點(diǎn)是每一變量值出現(xiàn)的次數(shù)都等于1。 加權(quán)算術(shù)
19、平均數(shù)加權(quán)算術(shù)平均數(shù) 當(dāng)變量數(shù)列各組次數(shù)不等時(shí),計(jì)算算術(shù)平均值要用加權(quán)平均法。這里“權(quán)”,是指各組的次數(shù)或各組次數(shù)占總次數(shù)的比重。計(jì)算公式:ffxfxfx x :標(biāo)志的個(gè)別數(shù)值 n:個(gè)別數(shù)值的項(xiàng)數(shù)f:各組次數(shù)各組次數(shù)占總次數(shù)比重實(shí)例(單項(xiàng)數(shù)列)實(shí)例(單項(xiàng)數(shù)列)n有三個(gè)鄉(xiāng)鎮(zhèn)企業(yè)的工人數(shù)及每一企業(yè)的月平均工資有三個(gè)鄉(xiāng)鎮(zhèn)企業(yè)的工人數(shù)及每一企業(yè)的月平均工資資料,如何計(jì)算所有這些企業(yè)共同的月平均工資?資料,如何計(jì)算所有這些企業(yè)共同的月平均工資? 表表 :1999年某地區(qū)三個(gè)鄉(xiāng)鎮(zhèn)企業(yè)工人工資年某地區(qū)三個(gè)鄉(xiāng)鎮(zhèn)企業(yè)工人工資 企業(yè)名稱企業(yè)名稱 工人數(shù)(人)工人數(shù)(人) 月平均工資(元月平均工資(元/人)工資總額
20、(元)人)工資總額(元)(甲(甲 ) f x xf 甲甲1 500 620 310000 甲甲2 600 625 375000 甲甲3 900 635 571500 合計(jì)合計(jì) 2000 628.7 1256500n所有這三個(gè)企業(yè)的平均工資為:25.62820001256500fxfx將計(jì)算出來的平均工資乘上工人實(shí)際人數(shù),即可得到所有工人的全部實(shí)際工資總額。628.7元/人*2000人=1257400元實(shí)例(組距數(shù)列)實(shí)例(組距數(shù)列)表:某企業(yè)1999年工人按工資額分配情況 月工資(元) 各組平均工資(元/人) 工人數(shù)(人)工資總額 甲 x f xf( 元) 600以下 550 40 22000
21、 600-700 650 100 65000 700-800 750 200 150000 800-900 850 400 340000 900-1000 950 450 427500 1000-1200 1100 250 275000 1200以上 1300 60 78000 合計(jì) - 1500 135750090515001357500fxfx元元/人人調(diào)和平均數(shù)調(diào)和平均數(shù)n當(dāng)算術(shù)平均數(shù)計(jì)算公式中的分母項(xiàng)“總體單位數(shù)”未知時(shí),算術(shù)平均值無法直接算得,這時(shí)要用調(diào)和平均法計(jì)算,但當(dāng)各變量值對(duì)平均數(shù)所起的作用不同時(shí),計(jì)算式為:xfxxfx1若設(shè)xf=M 則:MxMxH1Hx調(diào)和平均數(shù)f各組變量值
22、x各組變量值重復(fù)出現(xiàn)的次數(shù)此計(jì)算式從形式上看,是以各變量值的倒數(shù) 來計(jì)算的,故也稱倒數(shù)平均數(shù)。 x1例如有某采購站收購某種藥材的資料:例如有某采購站收購某種藥材的資料:見表 等級(jí) 單價(jià)(元/斤) 收購額(元) 收購量(斤)符號(hào) x xf 一級(jí) 1.2 24 20 二極 1.0 30 30 三級(jí) 0.7 7 10 合計(jì) - 61 60 已知資料計(jì)算欄xxf016. 1116061MxMxfxxfxH(元/斤)簡(jiǎn)單調(diào)和平均數(shù)簡(jiǎn)單調(diào)和平均數(shù)n在所有權(quán)數(shù)相同或等于1時(shí),按簡(jiǎn)單調(diào)和平均數(shù)計(jì)算。如將前式中的M(相同的權(quán)數(shù))移到 的前面,并將分?jǐn)?shù)式化簡(jiǎn),可得如下公式:xnXMMnMXMxH111n;個(gè)別標(biāo)志
23、值項(xiàng)數(shù)假設(shè)前表中,每種藥材等級(jí)的收購額均為24元的話,這時(shí)求該藥材平均價(jià)格的計(jì)算公式,就可采用簡(jiǎn)單調(diào)和平均法。即92. 07 . 010 . 112 . 1131xnxH元/斤幾何平均數(shù)(幾何平均數(shù)(Geometric Mean)n這是與算術(shù)平均數(shù) 不同的另一種平均數(shù)。在計(jì)算社會(huì)經(jīng)濟(jì)問題的平均發(fā)展速度等方面有很重要的應(yīng)用。n簡(jiǎn)單幾何平均數(shù)簡(jiǎn)單幾何平均數(shù) :如果掌握的資料未分組,應(yīng)采用簡(jiǎn)單幾何平均法。其計(jì)算公式:nnGxxxxM321 各項(xiàng)變量值,為各期發(fā)展速度或各個(gè)比率 n 變量值的次數(shù)ixnniix 1=通常利用對(duì)數(shù)方法簡(jiǎn)化計(jì)算,將上式兩邊取對(duì)數(shù)即:nxnxxxMnglglglglglg21
24、實(shí)際資料:我國實(shí)際資料:我國19791993年各年的社會(huì)總產(chǎn)值為:年各年的社會(huì)總產(chǎn)值為:n單位:億元 1979年 1980年 1981年 1982年 1983 年 7642 8531 9071 9963 11052 求出這幾年間社會(huì)總產(chǎn)值的平均發(fā)展速度。n先分別計(jì)算19801983年各年的發(fā)展速度,即 1980年 1981年 1982年 1983年 111.63 106.33 109.83 110.93n代入公式:n即由19791983年是社會(huì)總產(chǎn)值以平均每年109.86%的速度發(fā)展。%66.1091093. 10983. 10633. 11163. 14G加權(quán)幾何平均法加權(quán)幾何平均法 n如果
25、掌握的資料已經(jīng)分組,每個(gè)變量值出現(xiàn)的次數(shù)(或比重)不相同時(shí),應(yīng)采用加權(quán)幾何法,其計(jì)算公式如下:nffnffGffffxxxMn212121f次數(shù)總和fxffffxfxfxfMnnnGlglglglglg212211切尾均值(切尾均值(trimmed mean)n是切掉數(shù)據(jù)大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值。這種集中趨勢(shì)測(cè)度方法在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的竟賽項(xiàng)目中已得到廣泛應(yīng)用。我們?cè)陔娨曋惺煜さ模骸叭サ粢粋€(gè)最低分,去掉一個(gè)最高分,最后得分是-分”。就是利用切尾均值方法得到的結(jié)果。n計(jì)算公式:nnXXXXnnnn221式中,n 表示觀察值的個(gè)數(shù); 表示切尾系數(shù), ,到大形
26、成的順序統(tǒng)計(jì)值。數(shù)據(jù)兩端切去幾個(gè)數(shù)據(jù),通過切尾系數(shù)決定。當(dāng)系數(shù)取0和系數(shù)接近1/2時(shí),切尾均值公式變成算術(shù)平均數(shù)和中位數(shù)的公式,這是公式的兩種特例。 210 nXXX,21是數(shù)據(jù)nXXX,21經(jīng)過排隊(duì)以后有小 離中趨勢(shì)測(cè)度離中趨勢(shì)測(cè)度n 對(duì)對(duì) 統(tǒng)計(jì)分布或次數(shù)分配數(shù)據(jù)規(guī)律性的研究,集中統(tǒng)計(jì)分布或次數(shù)分配數(shù)據(jù)規(guī)律性的研究,集中趨勢(shì)表示的是分布的中心位置或一般水平的代表值,趨勢(shì)表示的是分布的中心位置或一般水平的代表值,離散程度反映的是離中趨勢(shì)和差異程度。對(duì)統(tǒng)計(jì)數(shù)據(jù)離散程度反映的是離中趨勢(shì)和差異程度。對(duì)統(tǒng)計(jì)數(shù)據(jù)的描述和分析正是利用這一對(duì)對(duì)立統(tǒng)一的代表值展開的描述和分析正是利用這一對(duì)對(duì)立統(tǒng)一的代表值展開
27、的。的。離中趨勢(shì)測(cè)度離中趨勢(shì)測(cè)度n全距;極差(range)n內(nèi)距(inter-quartile range ,IQR)n平均絕對(duì)差(mean absolute deviation ,MAD)n方差(variance)n標(biāo)準(zhǔn)差(Standard Deviation)n離散系數(shù) 極差系數(shù) 平均絕對(duì)差系數(shù) 標(biāo)準(zhǔn)差系數(shù)(coefficient of variation)極差極差 (Range)n極差也稱全距,是數(shù)據(jù)最大值減去最小值之差,它是數(shù)據(jù)離散或差異程度的最 簡(jiǎn)單測(cè)度值,即 n其中R為全距max( )和min( )分別表示數(shù)據(jù) 中的最大值和最小值; 和 則 是用順序統(tǒng)計(jì)量表示的最大值和最小值。n數(shù)
28、據(jù)的分散程度越大,極差就越大;反之則小。 n極差的計(jì)算很簡(jiǎn)單,但它易受極端值的影響。 內(nèi)距(內(nèi)距(inter-quartile range,IQR)n是兩個(gè)分位數(shù)之差,內(nèi)距=上四分位數(shù)-下四分位數(shù);IQR= 它是與集中趨勢(shì)代表值四分位數(shù) 相對(duì)應(yīng)的離散程度代表值。iniixxRxxR)min()max(ixixixnxix13QQ 平均絕對(duì)差(mean absolute deviation,MAD)n是數(shù)據(jù)值與均值之差絕對(duì)值的平均數(shù),即n簡(jiǎn)單式 (樣本未分組) 加權(quán)式(樣本已分組 ) n平均絕對(duì)差實(shí)際上是對(duì)數(shù)據(jù)與均值的離差進(jìn)行平均。根據(jù)均值的數(shù)學(xué)性質(zhì),數(shù)據(jù)值與均值離差之和為0。為避免平均離差數(shù)值
29、為0反映不出數(shù)據(jù)差異的大小,就對(duì)離差取了絕對(duì)值。n平均絕對(duì)差越大,離差絕對(duì)值就越大 。數(shù)據(jù)差異程度越也就越大。nxxMADnii1kiikiiiffxxMAD11方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差n方差(variance)是離差平方的平均數(shù)。n總體方差總體標(biāo)準(zhǔn)差n樣本方差n樣本標(biāo)準(zhǔn)差 SNXXNi122)(KiiKiiiffXX1122)(1)(122nxxsniikiiKiiiffxxS11221)(離散系數(shù)、變異系數(shù)離散系數(shù)、變異系數(shù)n極差、 內(nèi)距、平均絕對(duì)差、方差和標(biāo)準(zhǔn)差,都是具有其所依據(jù)資料相同的計(jì)量單位的絕對(duì)數(shù)。用絕對(duì)數(shù)表示離中趨勢(shì),意義明顯,易于理解。n但當(dāng)對(duì)兩個(gè)或兩個(gè)以上變量數(shù)列的均衡性和
30、離散性比較時(shí),如果絕對(duì)數(shù)變異指標(biāo)的計(jì)量單位不同,或者各個(gè)變量數(shù)列的平均水平不同,這時(shí)就不能直接比較絕對(duì)數(shù)變異指標(biāo),而要采用相對(duì)數(shù)變異指標(biāo),叫離散系數(shù)或變異系數(shù)它主要指絕對(duì)數(shù)變異指標(biāo)與其算術(shù)平均數(shù)之間的比率。是一個(gè)反映總體某一 數(shù)量標(biāo)志變異相對(duì)程度的統(tǒng)計(jì)指標(biāo)。極差系數(shù)極差系數(shù)n設(shè) 為極差系數(shù)則:n例如有男青年和女青年兩個(gè)抽樣總體,各由125名20歲青年所組成,其平均體重和極差如下: 平均體重(公斤) 極差(公斤) 男青年組 55.52 18 女青年組 48.52 16n單從極差來看:R(男)R(女),但不能就此得出結(jié)論說男青年組平均體重的代表性小,需進(jìn)一步計(jì)算極差系數(shù): 男青年組 女青年組n由于
31、男青年組體重的極差系數(shù)小于女青年組體重的極差系數(shù)由于男青年組體重的極差系數(shù)小于女青年組體重的極差系數(shù),因因此此,男青年組平均體重的代表性大男青年組平均體重的代表性大.%100 xRvRRv%98.32%10052.4816%100%38.32%1009 .5518%100 xRvxRvFRmmR六六 集中趨勢(shì)離散趨勢(shì)的集中趨勢(shì)離散趨勢(shì)的 應(yīng)用應(yīng)用資金風(fēng)險(xiǎn)價(jià)值的計(jì)算資金風(fēng)險(xiǎn)價(jià)值的計(jì)算n計(jì)算資金風(fēng)險(xiǎn)程度,一般計(jì)算期望報(bào)酬率、標(biāo)準(zhǔn)離差、標(biāo)準(zhǔn)離差率等指標(biāo)。n期望報(bào)酬率:是各種可能的報(bào)酬率按其概率進(jìn)行加權(quán)平均得到的報(bào)酬率,表示在所有各種風(fēng)險(xiǎn)條件下,期望可能得到的平均報(bào)酬率,是反映集中趨勢(shì)的一種量度。其計(jì)算公式為:n式中, 期望報(bào)酬率; 第i種可能結(jié)果的報(bào)酬率; 第i種可能結(jié)果的概率; n 可能結(jié)果的個(gè)數(shù)。 iniiPKK1KIKiP期望報(bào)酬率的標(biāo)準(zhǔn)差期望報(bào)酬率的標(biāo)準(zhǔn)差n指各種可能的報(bào)酬率對(duì)期望報(bào)酬率的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國乳酸丁酯行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國鄉(xiāng)村旅游行業(yè)市場(chǎng)現(xiàn)狀供需分析及重點(diǎn)企業(yè)投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國中空玻璃行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國不銹鋼彩虹餐具行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國三氧化二銻(1309-64-4)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國TWS耳機(jī)市場(chǎng)供需狀況與競(jìng)爭(zhēng)格局展望研究研究報(bào)告
- 2025-2030中國RFID貼標(biāo)機(jī)行業(yè)市場(chǎng)深度調(diào)研及前景趨勢(shì)與投資研究報(bào)告
- 2024-2025學(xué)年高二俄語人教版新教材 選擇性必修第三冊(cè) урок 1.8
- 2025-2030中國HDPE球閥行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國EMBA教育培訓(xùn)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 大客戶銷售謀略課件
- 測(cè)控電路期末考試試題和答案
- 社會(huì)保障學(xué)(全套課件617P)
- 《博弈論》最完整版課件(加專題研究)
- 市人民醫(yī)院卒中防治中心培訓(xùn)制度
- 荷葉圓圓 一等獎(jiǎng)-完整版課件
- 醫(yī)院換藥室消毒隔離流程
- 紙板線設(shè)備基礎(chǔ)知識(shí)培訓(xùn)53
- 九年級(jí)中考數(shù)學(xué)復(fù)習(xí)構(gòu)思三角形復(fù)習(xí)課件
- 二年級(jí)有余數(shù)的除法口算題1000道
- 湖南省惡性腫瘤門診放化療定點(diǎn)醫(yī)療機(jī)構(gòu)申請(qǐng)表
評(píng)論
0/150
提交評(píng)論