




已閱讀5頁,還剩178頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1,除了統(tǒng)計(jì)圖和統(tǒng)計(jì)表之外,還可以用少量的特征值(代表值)對數(shù)據(jù)分布的數(shù)量規(guī)律進(jìn)行精確、簡潔的描述。,第三章 數(shù)據(jù)分布特征的統(tǒng)計(jì)描述,2,大量的數(shù)據(jù)經(jīng)過整理后,已經(jīng)能初步反映總體分布的特征。 為了更加準(zhǔn)確的了解數(shù)據(jù)分布的特征和規(guī)律,需要找到反映數(shù)據(jù)分布特征的代表值,三類:集中趨勢、離中趨勢、分布形態(tài),說明:,3,集中趨勢:即反映各數(shù)據(jù)向中心值靠攏的程度,返回本節(jié)首頁,4,離中趨勢:即反映各數(shù)據(jù)遠(yuǎn)離中心值的程度,兩個(gè)不同的曲線表示兩個(gè)不同的總體,它們的 集中趨勢相同但離中趨勢不同。,因?yàn)榧词宫F(xiàn)象的集中趨勢相同,其離中趨勢 也可能不同。,5,實(shí)際中還會遇到:集中趨勢和離中趨勢均相同的現(xiàn)象,其分布的形態(tài)也可能不同。,這表明:除了集中和離中趨勢外,分布還有其他方面的特征:分布的形態(tài)。,指:數(shù)據(jù)分布的對稱程度和扁平(高低)程度,測度指標(biāo)是偏度,測度指標(biāo)是峰度,是相對于對稱分布而言,相對于正態(tài)分布而言,6,偏度:測定分布的偏斜程度的指標(biāo),偏斜是相對于對稱分布而言,峰度:測定分布的高低(尖峭)程度的指標(biāo),尖峭是相對于正態(tài)分布而言,7,正態(tài)分布,對稱分布,8,峰態(tài),偏態(tài),與對稱分 布比較,9,正態(tài)分布中有兩個(gè)參數(shù):,一般記為:,、2 是正態(tài)分布的參數(shù),不確定常數(shù)。 不同的、不同的2對應(yīng)不同的正態(tài)分布,10,標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布中的一種,記為:,11,本章內(nèi)容,第一節(jié) 集中趨勢的測度 第二節(jié) 離散程度的測度 第三節(jié) 偏度與峰度,12,第一節(jié) 集中趨勢的測度,集中趨勢是指一組數(shù)據(jù)向其中心值靠攏的傾向 測度集中趨勢就是尋找一組數(shù)據(jù)的代表值或中心值,在統(tǒng)計(jì)中是使用平均指標(biāo)來測度的。,13,本節(jié)內(nèi)容,一、平均指標(biāo)含義 二、平均指標(biāo)的計(jì)算 (一)算術(shù)平均數(shù) (二)調(diào)和平均數(shù) (三)幾何平均數(shù) (四)眾數(shù) (五)中位數(shù) 三、各種平均數(shù)之間的相互關(guān)系,數(shù)值平均,位置平均,14,一、平均指標(biāo)含義,1、定義:又稱平均數(shù)。 是將同質(zhì)總體內(nèi)各單位的數(shù)量差異抽象化,以反映總體的一般水平。,被平均的對象必須具有同質(zhì)性,15,2、平均指標(biāo)有兩大類,數(shù)值平均:,位置平均:,根據(jù)總體內(nèi)全部數(shù)據(jù)計(jì)算:算術(shù)平均、調(diào)和平均、幾 何平均。,根據(jù)數(shù)據(jù)在分配數(shù)列中的位置確定:眾數(shù)、中位數(shù)。,16,3、平均指標(biāo)作用,a、反映總體各單位變量值分布的集中趨勢 b、比較同一現(xiàn)象在不同空間或不同時(shí)間的發(fā)展 水平 c、分析現(xiàn)象間的依存關(guān)系,17,集中趨勢:,總體中各單位某一標(biāo)志值的具體表現(xiàn)是各不相 同的,但一般呈正態(tài)分布,即很小或很大的標(biāo) 志值出現(xiàn)的次數(shù)較少,接近平均數(shù)的標(biāo)志值出 現(xiàn)的次數(shù)較多,大多數(shù)的標(biāo)志值都圍繞著平均 數(shù)左右波動。,返回本節(jié)首頁,18,現(xiàn)象間的依存關(guān)系:,19,二、平均指標(biāo)計(jì)算,(一)算術(shù)平均數(shù),又稱均值。根據(jù)掌握的資料不同: 簡單法和加權(quán)法。,20,1、簡單法:適用于沒有分組的原始數(shù)據(jù),均值,即算術(shù)平均數(shù),x 標(biāo)志值或變量值,見49頁例題,21,2、加權(quán)法:分組且各組標(biāo)志值出現(xiàn)的次數(shù) (權(quán)數(shù) f )不相等時(shí),公式:,返回本節(jié)首頁,x 為標(biāo)志值,又稱變量值; f 為各組標(biāo)志值出現(xiàn)的次數(shù),22,計(jì)算平均日產(chǎn)量,23,24,用統(tǒng)計(jì)功能的計(jì)算器計(jì)算: 2ndF,ON, 201M+ 224M+ 246M+ 268M+ 2812M+ 3010M+, xM 結(jié)果為26.73,25,例1:用計(jì)算器對下列數(shù)據(jù)求平均,26,mode2 Shift scl = 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90DT 55 Shift;30 DT Shift,注意: DT是儲存功能的加號,27,注意:當(dāng)各組權(quán)數(shù)均相等時(shí),加權(quán)算術(shù)平均數(shù) 等于簡單算術(shù)平均數(shù):,返回本節(jié)首頁,28,可用簡單式計(jì)算均值,各組權(quán)數(shù)都相等的數(shù)列,29,對稱數(shù)列:,可用簡單式計(jì)算均值,30,3、權(quán)數(shù),加權(quán)均值的大小受兩個(gè)因素的影響: 各組變量值(x) 各組次數(shù),即權(quán)數(shù)(f),31,(1)權(quán)數(shù)的定義,權(quán)數(shù):即次數(shù),分布在各組間的總體單位數(shù), 因?yàn)樗鼘档拇笮∑饳?quán)衡輕重的作 用,故又稱權(quán)數(shù)。,出現(xiàn)次數(shù)多的標(biāo)志值 對平均數(shù)的影響大,32,(2)權(quán)數(shù)的表現(xiàn)及應(yīng)用,絕對數(shù)權(quán)數(shù) f 相對數(shù)權(quán)數(shù),第一、權(quán)數(shù)表現(xiàn):有兩種形式:,33,絕對權(quán)數(shù):,相對權(quán)數(shù):,計(jì)算公式:,例題見教科書51頁表33,34,第二、權(quán)數(shù)的實(shí)質(zhì),是相對數(shù)權(quán)數(shù)。 即權(quán)數(shù)對均值的影響作用,取決于相對權(quán)數(shù)而非絕對權(quán)數(shù)。,舉例:,35,計(jì)算平均獎金額,雖然各組絕對人數(shù)變化了,但各組人數(shù)的比重未變,比重%,10,37.5,52.5,100,36,4、平均數(shù)應(yīng)用舉例:,統(tǒng)計(jì)中有三大綜合指標(biāo): 總量指標(biāo)、相對指標(biāo)和平均指標(biāo),反映現(xiàn)象總規(guī)模、總水平,用絕對數(shù)表示 如:2010年中國GDP 39.8萬億元人民幣,相對指標(biāo)是兩個(gè)有聯(lián)系的指標(biāo)值對比的比率, 如:三次產(chǎn)業(yè)比重、企業(yè)勞動生產(chǎn)率、產(chǎn)出的 計(jì)劃完成百分?jǐn)?shù)、經(jīng)濟(jì)發(fā)展速度和增長速度,37,例1、10個(gè)企業(yè)資金利潤率資料:,求:10個(gè)企業(yè)的平均利潤率,“企業(yè)的平均利潤率” 等同于 “企業(yè)的總利潤率”,企業(yè)的總利潤率 = 利潤總額 / 資金總額,39,利潤總額,資金總額,40,計(jì)算150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù),例2、150個(gè)企業(yè)的資料:,“150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù)” 就是“150個(gè)企 業(yè)總的計(jì)劃完成百分?jǐn)?shù)”。,企業(yè)總計(jì)劃完成百分?jǐn)?shù) = 總實(shí)際數(shù) / 總計(jì)劃數(shù),42,實(shí)際產(chǎn)值,計(jì)劃產(chǎn)值,43,5、算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì),見52頁,44,(二)調(diào)和平均數(shù),1、含義:總體內(nèi)各個(gè)變量值倒數(shù)的算術(shù)平均 數(shù)的倒數(shù),又稱倒數(shù)平均數(shù)。,如有三個(gè)變量值: 8、10、12,求調(diào)和平均數(shù)。步驟如下:,45,、,、,即為調(diào)和平均數(shù),公式:,46,(1)簡單式:,(2)加權(quán)式:,各變量值出現(xiàn)次數(shù)相等,各變量值出現(xiàn)次數(shù)不等,設(shè) m為次數(shù),2、 調(diào)和平均數(shù)的計(jì)算,47,舉例:,某蔬菜單價(jià)早中晚分別為0.5、0.4、 0.25(元/斤) (1)早中晚各買1元,求平均價(jià)格 (2)早中晚各買1斤,求平均價(jià)格 (3)早中晚各買2元、3元、4元,求平均價(jià)格 (4)早中晚各買2斤、3斤、4斤,求平均價(jià)格,48,(1)問:用調(diào)和平均。先求早、中、晚購買的斤 數(shù)。早 1/0.5=2(斤) 、中 1/0.4=2.5(斤)、晚 1/0.25=4(斤),(2)問:用算術(shù)平均,49,(3)問:用加權(quán)調(diào)和平均,(4)問:用加權(quán)算術(shù)平均,50,3、調(diào)和平均數(shù)和算術(shù)平均數(shù)間的關(guān)系,調(diào)和平均數(shù)是一種特殊的均值,(1)兩者存在著變形關(guān)系:,51,(2)當(dāng)掌握的資料無法直接計(jì)算算術(shù)平均數(shù)時(shí),可用調(diào)和法計(jì)算。,這時(shí)兩者計(jì)算結(jié)果相同,只是根據(jù)已知 條件不同,需選擇不同的公式。,52,已知對比分母,將分母定為f,求分子xf,然后用加權(quán)算術(shù)公式,即:,已知對比分子,將分子定為m,求分母mx 用加權(quán)調(diào)和公式,即 :,53,某公司下屬三個(gè)部門銷售利潤資料,求三個(gè)部門的平均利潤率。,54,思考: 如果已知銷售利潤率和銷售額資料, 該如何計(jì)算?,55,56,計(jì)算:20個(gè)商店平均銷售計(jì)劃完成程度及總的流通費(fèi)用率。,57,58,(1)20個(gè)商店的平均銷售計(jì)劃完成程度,(2)20個(gè)商店總的流通費(fèi)用率,59,(三)幾何平均數(shù),1.定義: n 個(gè)變量值乘積的 n 次方根,60,3、計(jì)算方法,簡單法:,加權(quán)法:,61,例1:2004-2008年我國某工業(yè)品產(chǎn)量環(huán)比發(fā) 展速度分別為107.6%、102.5%、100.6%、 102.7%、102.2%。計(jì)算平均每年的發(fā)展速度,62,按計(jì)算器:1.076,1.025, ,1.006, ,1.027, ,1.022,=,2ndF, 5,=,出現(xiàn)結(jié)果:1.0309 即103.1%,63,例2:某廠有四個(gè)流水連續(xù)作業(yè)車間,某月的合格率分別為:0.95,0.92,0.90,0.80,求四個(gè)車間的平均合格率。,64,例3:某地區(qū)25年的年經(jīng)濟(jì)發(fā)展速度分別是: 1年103%,4年105%,8年108%, 10年 110%,2年115%, 求該地區(qū)經(jīng)濟(jì)的平均年發(fā)展速度。,65,1.03,(,1.05,yx,4,),(,1.08,yx,8,), ,(,1.1,yx,10,),(,1.15,yx,2,), =,2ndF, 25,=,出現(xiàn)結(jié)果:1.086 即108.6%,66,4、使用幾何平均法注意問題,第一、變量值要是相對數(shù),且不能為負(fù)值或零,第二、這些相對數(shù)的連乘積要等于總速度或總比率,幾何平均法適用于對比率數(shù)據(jù)(相對數(shù))的平均, 主要用于計(jì)算平均比率和平均速度,67,幾何平均數(shù)是一種特殊的均值:,可寫成:,68,(四)眾數(shù),1、定義: 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,2、計(jì)算:分兩種情況:,品質(zhì)數(shù)列和單項(xiàng)式數(shù)列 組距式數(shù)列,69,Mo可口可樂,(1)品質(zhì)數(shù)列計(jì)算眾數(shù),定性變量,70,Mo不滿意,甲城市家庭對住房狀況評價(jià)的頻數(shù)分布,71,眾數(shù)是數(shù)列中出現(xiàn)次數(shù)最多的變量值,眾數(shù),(2)單項(xiàng)數(shù)列計(jì)算眾數(shù),定性變量,72,(3)組距式數(shù)列計(jì)算眾數(shù),先確定眾數(shù)所在的組,然后用公式計(jì)算 分:上限公式和下限公式,返回本節(jié)首頁,定性變量,73,分?jǐn)?shù)x 人數(shù) f 60以下 2 6070 7 7080 15 8090 10 90以上 6 合計(jì) 40,fm-1,fm+1,fm,L :眾數(shù)所在組的下限 U :眾數(shù)所在組的上限,74,上限公式:,下限公式:,75,76,3、眾數(shù)說明,(1)不受極端值的影響 (2)既適用于品質(zhì)數(shù)列,也適用于變量數(shù)列 (3)一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù),返回本節(jié)首頁,77,無眾數(shù) 原始數(shù)據(jù): 10 5 9 12 6 8,多于一個(gè)眾數(shù) 原始數(shù)據(jù): 25 28 28 36 42 42,一個(gè)眾數(shù) 原始數(shù)據(jù): 6 5 9 8 5 5,78,(五)中位數(shù),1、中位數(shù)的含義: 將各單位標(biāo)志值按大小排列,居于中間位 置的那個(gè)標(biāo)志值。,返回本節(jié)首頁,79,2、中位數(shù)的計(jì)算,分兩種情況: (1)未分組原始資料 (2)組距式數(shù)據(jù),返回本節(jié)首頁,80,(1)未分組原始資料,先將數(shù)據(jù)從小到大排序,項(xiàng)數(shù)為奇數(shù)時(shí),中間位置 上的標(biāo)志值即為中位數(shù),項(xiàng)數(shù)為偶數(shù)時(shí),中間位置 上2個(gè)標(biāo)志值的平均為中位數(shù),81,有9個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14 中位數(shù)為第5個(gè),即9 有10個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14、15 中位數(shù)為第5、第6個(gè)數(shù)據(jù)的平均值,即9.5,82,(2)組距數(shù)列,fm,SMe+1,SMe-1,83,B、確定中位數(shù)所在的組: 本例為: 40/2=20,即中位數(shù)應(yīng)在將分?jǐn)?shù)從 高到低排列后的第20個(gè)學(xué)生的分?jǐn)?shù)上,A、先將次數(shù)進(jìn)行累計(jì),C、利用公式計(jì)算中位數(shù) ( 公式 見56頁 ),84,公式:,下限公式= 上限公式=,85,帶入資料得:,(分) (分),86,附:四分位數(shù),四分位數(shù):是指位于全部數(shù)據(jù) 位置和 位 置上的數(shù)據(jù),分別稱為下四分位數(shù)和上四分位 數(shù)。也稱為第一個(gè)四分位數(shù) 和 第三個(gè)四分位數(shù)。,即:排序后處于25%和75%位置上的值。 實(shí)際上,中位數(shù)就是第二個(gè)四分位數(shù),87,四分位的位置:,88,箱線圖:可以觀察數(shù)據(jù)分布的特征,4,6,8,10,12,Median/Quart./Range箱線圖,Me,89,某電腦公司2005年前四個(gè)月120天的銷售量數(shù)據(jù),試?yán)孟渚€圖對數(shù)據(jù)分布特征進(jìn)行分析。,90,未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖,91,某電腦公司銷量分組表,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖,從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試通過多批箱線圖分析各科考試成績的分布特征。,93,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖,8門課程考試成績的Median/Quart./Range箱線圖,94,11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖,95,96,三、各種平均數(shù)之間的關(guān)系,兩者都屬于抽象化的代表值,但有區(qū)別, 前者容易受極端值的影響,后者不會。,1、數(shù)值平均數(shù)和位置平均數(shù)的比較:,97,某公司中層干部2010年的收入,求平均收入,職位 收入(元) 財(cái)務(wù)部經(jīng)理 10 000 市場部經(jīng)理 450000 人事部經(jīng)理 90 000 研發(fā)部經(jīng)理 100 000 生產(chǎn)部經(jīng)理 10 000,實(shí)際中可利用切尾平均法:去掉極端值, 將剩余的數(shù)據(jù)求平均。,98,收入(元) 人數(shù) 1000 5 3000 25 5000 56 10000 10 50000 3 30000000 1,計(jì)算其平均收入時(shí), 位置平均和數(shù)值平均哪一種方法更合適?,99,2、三種平均數(shù)之間的關(guān)系,有極小值,拉動均 值向極小值靠近,有極大值,拉動均值向極大值靠近,100,眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用,眾數(shù):不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用 中位數(shù):不受極端值影響 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 平均數(shù):易受極端值影響 數(shù)據(jù)對稱分布或接近對稱分布時(shí)應(yīng)用,101,離散程度是測定數(shù)據(jù)分布特征的另一重要指標(biāo),第二節(jié) 離散程度測度,統(tǒng)計(jì)是使用變異指標(biāo)來測度分布的離散程度,用于測定一組數(shù)據(jù)中各數(shù)值之間的差異程度, 即:在一個(gè)分布中各數(shù)值與均值的離差程度,102,三個(gè)集中趨勢相同但離中趨勢不同的總體,離散程度指標(biāo)可從另一個(gè)角度說明集中趨勢測度值的代表程度。,103,一、變異指標(biāo)的意義和作用 二、變異指標(biāo)的種類 (一)全距(極差) (二)平均差 (三)標(biāo)準(zhǔn)差 (四)離散系數(shù),返回本章首頁,本節(jié)內(nèi)容,104,一、變異指標(biāo)的意義和作用,變異指標(biāo)的含義 又稱標(biāo)志變動度、離散程度或離中程度。 是描述總體內(nèi)各數(shù)據(jù)之間差別大小程度的指標(biāo),返回本節(jié)首頁,甲:20,40,60,70,80,100,120 乙:67,68,69,70,71,72,73,如兩組數(shù)據(jù),請直觀判斷哪一組的離散程度大,105,70,70,返回本節(jié)首頁,106, 標(biāo)志變動度的作用,2、能衡量現(xiàn)象變動的均衡性或穩(wěn)定性,3、能反映各變量值分布的離散程度(離中趨勢),1、是評價(jià)平均數(shù)代表性的依據(jù),甲企業(yè) 25 25 25 25 均勻、協(xié)調(diào) 乙企業(yè) 10 15 20 55 丙企業(yè) 5 10 15 70 不均勻。,企業(yè)產(chǎn)值各季度計(jì)劃完成情況,107,平均數(shù)的代表性和標(biāo)志變動度的關(guān)系,標(biāo)志變動度大,平均數(shù)的代表性就??; 反之 ,平均數(shù)的代表性就大 例如:三組學(xué)生的年齡(歲) 20 20 20 20 20 -差距最小,20歲的代表性最好 18 19 20 21 22 15 16 20 24 25-差距最大,20 歲的代表性最差,108,二、標(biāo)志變異指標(biāo)的種類,全距 1、含義:總體各單位標(biāo)志的最大值和最小值之差。 R = Xmax-Xmin,109,2、全距的優(yōu)點(diǎn)和缺點(diǎn),優(yōu)點(diǎn):計(jì)算簡單、涵義直觀,缺點(diǎn):易受極端數(shù)值的影響 不能反映中間標(biāo)志值的變動,110,附:四分位差(見 60 頁),四分位差Qd = Q3 - Q1,111,(二)平均差,1、含義 是各變量值與其算術(shù)平均數(shù)離差絕對值 的算術(shù)平均數(shù),即:,平均差能全面反映一組數(shù)據(jù)的離散狀況,112,2、平均差計(jì)算:,返回本節(jié)首頁,簡單式:,加權(quán)式:,113,18 19 20 21 22,-2 -1 0 1 2,2 1 0 1 2,x,合計(jì) - 6,一組學(xué)生年齡: 18 19 20 21 22 求平均差。,114,某廠200個(gè)工人產(chǎn)量資料(單位:公斤),日產(chǎn)量 30以下 3040 4050 50以上 合計(jì) 求A.D,工人數(shù) 10 70 90 30 200,115,X 25 35 45 55 合計(jì),-17 -7 3 13 -,f 10 70 90 30 200,17 7 3 13 -,170 490 270 390 1320,250 2450 4050 1650 8400,116,結(jié)論: 該廠工人平均日產(chǎn)量為42公斤,但各工人生產(chǎn)水平有差異,其差異平均為6.6公斤。,117,3、平均差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):和全距相比,彌補(bǔ)了全距不足,能反 映中間標(biāo)志值的變動。 缺點(diǎn):加絕對值號為計(jì)算帶來了不便。,118,(三)標(biāo)準(zhǔn)差(均方差),1、概念 是各變量值與其算術(shù)平均數(shù)離差平方的算術(shù) 平均數(shù)的平方根,又稱均方差。,119,2、計(jì)算: 已知資料不同采用不同方法:,加權(quán)式:,簡單式:,120,標(biāo)準(zhǔn)差的平方即為方差,121,一組學(xué)生年齡: 18 19 20 21 22 18 -2 4 19 -1 1 20 0 0 21 1 1 22 2 4 合計(jì) - 10,簡單式舉例:,122,某廠200個(gè)工 人產(chǎn)量資料: (單位:公斤),日產(chǎn)量 30以下 3040 4050 50以上 合計(jì),工人數(shù) 10 70 90 30 200,求標(biāo)準(zhǔn)差,加權(quán)式舉例:,123,x 25 35 45 55 合計(jì),-17 -7 3 13 -,f 10 70 90 30 200,289 49 9 169 -,2890 3430 810 5070 12200,250 2450 4050 1650 8400,124,標(biāo)準(zhǔn)差的計(jì)算可以用統(tǒng)計(jì)功能的計(jì)算器。,結(jié)論: 各工人生產(chǎn)產(chǎn)量與平均產(chǎn)量相比,平均相差7.8公斤。,125,計(jì)算器的使用,開機(jī):ON,2ndF,ON 進(jìn)入到統(tǒng)計(jì)功能后,用計(jì)算平均數(shù)的方法輸數(shù)據(jù) 所有的數(shù)據(jù)輸完后,按 2ndF 鍵, 再按xM 健,即為標(biāo)準(zhǔn)差,注意:所有的數(shù)據(jù)輸完后,如果直接 按xM 健,即為平均數(shù)。,126,統(tǒng)計(jì)功能的計(jì)算器的使用 Mode2 Shift scl = 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90 DT 55 Shift;30 DT Shift,127,3、標(biāo)準(zhǔn)差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):彌補(bǔ)了平均差和全距的不足。 缺點(diǎn):利用標(biāo)準(zhǔn)差不能比較性質(zhì)不同的數(shù)列(即水平高低不等和計(jì)量單位不同)離散程度的大小。,128,如:兩組動物體重(單位:公斤),甲: , , 乙:, 試比較平均數(shù)的代表性。,129,130,上述結(jié)論不一定正確,因?yàn)椋簝山M數(shù)據(jù)性質(zhì)不同(水平高低不等或者計(jì)量單位不同),不能直接用標(biāo)準(zhǔn)差(或平均差)比較平均數(shù)的代表性。須用相對離散程度指標(biāo) 離散系數(shù)。,131,(四)離散系數(shù),又稱變異系數(shù),是一組相對數(shù)形式的變異指標(biāo) 有全距系數(shù)、平均差系數(shù)、標(biāo)準(zhǔn)差系數(shù)等等 以標(biāo)準(zhǔn)差系數(shù)為例說明其計(jì)算。,132,對于上例,133,總結(jié):,比較兩組數(shù)據(jù)的離散程度,即比較平均數(shù)的代表性時(shí): 如果兩組數(shù)據(jù)的平均數(shù)相等且計(jì)量單位相同,可直接使用標(biāo)準(zhǔn)差比較; 除此之外,均需使用標(biāo)準(zhǔn)差系數(shù)比較。,134,對稱鐘形分布特點(diǎn):以均值為中心兩邊對稱, 且中間數(shù)據(jù)出現(xiàn)的頻數(shù)多而兩尾出現(xiàn)的頻數(shù)少。,附:標(biāo)準(zhǔn)差的應(yīng)用,約有68%數(shù)據(jù)在均值加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有95%數(shù)據(jù)在均值加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有99%數(shù)據(jù)在均值加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),1、對稱鐘形分布中的,法則:,135,1、求是非標(biāo)志(交替標(biāo)志)的標(biāo)準(zhǔn)差,按品質(zhì)標(biāo)志分組且只有兩種表現(xiàn)的標(biāo)志,136,是否是是非標(biāo)志?,137,是非標(biāo)志 變量 x 次數(shù) 是 1 否 0 求是非標(biāo)志的平均數(shù)及方差,138,139,140,3、標(biāo)準(zhǔn)化值(數(shù)據(jù)的標(biāo)準(zhǔn)得分),有兩個(gè)班(1、2班)的同一門課成績,假定兩個(gè)班水平類似,但由于兩個(gè)任課老師的評分標(biāo)準(zhǔn)不同,使得兩個(gè)班成績的均值和標(biāo)準(zhǔn)差都不同:,那么1班得90分的張英和2班得82分的劉抒成績能否比較?,1班均值:78.53,標(biāo)準(zhǔn)差:9.43 2班均值:70.19,標(biāo)準(zhǔn)差:7.0,不能直接比,但可以將它們進(jìn)行標(biāo)準(zhǔn)化后再對比。,141,標(biāo)準(zhǔn)化的方法:,劉抒標(biāo)準(zhǔn)得分:,張英的標(biāo)準(zhǔn)得分:,劉抒的成績優(yōu)于張英。,142,標(biāo)準(zhǔn)化值實(shí)際上是將不同均值和標(biāo)準(zhǔn)差的 總體都轉(zhuǎn)化為均值為0 ,標(biāo)準(zhǔn)差為1 的總體。,如:一組數(shù)據(jù):25、28、31、34、37、40、43。試計(jì)算其標(biāo)準(zhǔn)化值。,首先計(jì)算出均值為34,標(biāo)準(zhǔn)差為6,143,均值為34,標(biāo)準(zhǔn)差為6,均值為0,標(biāo)準(zhǔn)差為1,標(biāo)準(zhǔn)化后的數(shù)據(jù)雖然均值和標(biāo)準(zhǔn)差發(fā)生了改變 但數(shù)據(jù)內(nèi)部點(diǎn)的相對位置是沒有變化的。,144,科目 平均分 標(biāo)準(zhǔn)差 甲生 乙生 語文 70 8 91 71 數(shù)學(xué) 56 4 50 64 外語 42 5 40 51 政治 80 10 85 80 物理 50 4 60 70 化學(xué) 40 12 75 45 合計(jì) - - 401 381,原始成績,例:已知某年高考全部考生分科總平均成績和 標(biāo)準(zhǔn)差值,又知兩名考生的實(shí)際成績?nèi)缦拢?計(jì)算兩考生的標(biāo)準(zhǔn)化值,并進(jìn)行比較。,145,146,第一、甲考生偏科,數(shù)學(xué)和英語成績均低于 平均成績;乙考生比較全面,各科成績都不 低于平均成績。,原因:,第二、乙考生在平均分偏低且水平差距較小(標(biāo)準(zhǔn)差)的物理、數(shù)學(xué)和英語等科目中取得了較好的成績,甲考生則在這些科目上表現(xiàn)不好,影響了其標(biāo)準(zhǔn)成績。,147,3、總方差、組間方差和組內(nèi)方差,在總體分組的情況下會產(chǎn)生上述三種方差 總方差:各標(biāo)志值與總平均數(shù)的離差 組間方差:各組平均數(shù)與總平均數(shù)的離差 組內(nèi)方差:各組組內(nèi)的標(biāo)志值與各組內(nèi)平均數(shù)的離差,三者關(guān)系: 總方差 = 組間方差 + 組內(nèi)方差的算術(shù)平均數(shù),148,其中 i 代表總體內(nèi)的組數(shù),149,150,舉例:,某公司7個(gè)門市部營業(yè)額數(shù)據(jù): 88、90、96、98、110、140、200 分成兩組: 88、90、96、98 110、140、200 計(jì)算總方差、組內(nèi)方差和組間方差,151,152,組內(nèi)方差的算術(shù)平均數(shù):,153,第三節(jié) 分布形態(tài)的測定 (偏度和峰度),集中趨勢和離中趨勢是數(shù)據(jù)分布的兩個(gè)重要 特征。但即使集中趨勢和離中趨勢均相同的現(xiàn)象,其分布的形態(tài)也有可能不同。,這表明:除了集中趨勢和離中趨勢外,分 布還有其他方面的特征:分布的形態(tài)。,154,反映數(shù)據(jù)分布形狀的指標(biāo)有兩個(gè):偏態(tài)和峰度,偏態(tài):是測定分布的偏斜方向和偏斜程度的指標(biāo),是相對于對稱分布而言,峰度:是測定分布的尖峭程度的指標(biāo),是相對于正態(tài)分布而言,155,正態(tài)分布,對稱分布,156,首先介紹“矩”的概念,矩:又稱動差,物理學(xué)上的術(shù)語。統(tǒng)計(jì)上用 來刻畫數(shù)據(jù)分布特征的的指標(biāo)的統(tǒng)稱。,K 階矩:所有變量值與數(shù)值a之離差的K 次方 的平均數(shù)稱為變量 x 關(guān)于 a 的K 階矩,當(dāng):a等于0時(shí)稱為 K 階原點(diǎn)矩 a等于 時(shí)稱為 K 階原點(diǎn)矩,一階原點(diǎn)階矩就是算術(shù)平均數(shù) 二階中心距就是方差,157,一階原點(diǎn)矩 即為均值,二階中心矩 即為方差,158,1、偏態(tài):,偏態(tài):是對分布的偏斜方向和偏斜程度的測定,測定偏態(tài)程度的指標(biāo)稱為偏態(tài)系數(shù),如果次數(shù)的分布是完全對稱的,稱為對稱分布 否為非對稱分布,即偏態(tài)分布,分左偏和右偏,和 對稱分布比較而言,159,偏態(tài)系數(shù):用三階中心矩定義,該系數(shù)為0時(shí),為對稱分布 大于0時(shí),為右偏態(tài)分布 小于0時(shí),為左偏態(tài)分布 越接近0,偏斜程度就越低,若分布不對稱,只有一階中心矩為0,其余的奇數(shù)階中心矩都不為0。若分布對稱,所有奇數(shù)階中心矩應(yīng)為0,,消除 量綱,160,2、峰度,峰度:是指分布圖形的尖峭程度。,和標(biāo)準(zhǔn)正態(tài)分布比較而言的,實(shí)際中,標(biāo)準(zhǔn)正態(tài)分布曲線的峰頂為正態(tài)峰, 和標(biāo)準(zhǔn)正態(tài)分布曲線相比,陡峭的為尖峰, 平緩的為平峰頂。,測定峰度的指標(biāo)稱為 峰度系數(shù)。,161,峰態(tài),162,峰度系數(shù):用四階中心矩定義。因?yàn)榉植嫉募馇统潭群团紨?shù)階中心矩?cái)?shù)值大小有關(guān).,所以該系數(shù)和3比:等于3,為正態(tài)分布; 大于3時(shí),為尖峰分布;小于3時(shí),平峰分布,消除量綱,因?yàn)椋赫龖B(tài)分布曲線的四階中心 矩和標(biāo)準(zhǔn)差的4次方之比為3,163,尖頂分布(K3),平頂分布(K3),正態(tài)分布(K=3),164,因?yàn)閷τ谡龖B(tài)分布,所以,峰度的標(biāo)準(zhǔn)測定公式為:,165, 用EXCEL計(jì)算描述統(tǒng)計(jì)量,用EXCEL計(jì)算平均數(shù)、標(biāo)準(zhǔn)差等描述性統(tǒng)計(jì) 量有兩種方法: 一是用函數(shù) 二是用“數(shù)據(jù)分析”工具,166,第一、函數(shù),均值:average 中位數(shù):median 眾數(shù):mode 標(biāo)準(zhǔn)差: 總體標(biāo)準(zhǔn)差:stdevp; 樣本標(biāo)準(zhǔn)差: stdev 分位數(shù):quartile,Excel用于計(jì)算描述統(tǒng)計(jì)量的函數(shù):,167,168,分位數(shù)quartile的語法結(jié)構(gòu),Quartile(array, quart),Array:計(jì)算四分?jǐn)?shù)的數(shù)據(jù)區(qū)域。輸入待計(jì)算數(shù)據(jù)的地址即可。,Quart:計(jì)算的是第幾個(gè)四分?jǐn)?shù) 可輸入:0、1、2、3、4。分別表示最小值、第1、2、3個(gè)四分位數(shù)和最大值。,169,第二、 “數(shù)據(jù)分析”工具,第一次使用“數(shù)據(jù)分析”時(shí),需在EXCEL工具 菜單中選“加載宏”,選“分析工具庫”。 這樣在“工具”菜單中就會出現(xiàn)“數(shù)據(jù)分析”。,170,選擇“網(wǎng)上沖浪”工作表。 打開“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開數(shù)據(jù)分析對話框如圖所示。,171,雙擊“描述統(tǒng)計(jì)”項(xiàng)或先單擊此項(xiàng)再選擇“確定”按鈕,描述統(tǒng)計(jì)對話框打開如圖所示。 在“輸入?yún)^(qū)域”中輸入A1:A21。,172,由于所選數(shù)據(jù)范圍包括一個(gè)標(biāo)志名稱,單擊“標(biāo)志位于第一行”選項(xiàng)邊上的復(fù)選框。 單擊“輸出區(qū)域”項(xiàng),旁邊出現(xiàn)了一個(gè)輸入框,單擊此框出現(xiàn)插入符,單擊C1,在輸入框中出現(xiàn)輸出地址“$B$1”,這是輸出結(jié)果的左上角起始位置。 單擊“匯總統(tǒng)計(jì)”,如不選此項(xiàng),則Excel省略部分輸出結(jié)果。,173,平均 38.75 標(biāo)準(zhǔn)誤差 2.435348 中位數(shù) 38.5 眾數(shù) 29 標(biāo)準(zhǔn)差 10.89121 方差 118.6184 峰度 -1.0812 偏度 0.277013 區(qū)域 36 最小值 22 最大值 58 求和 775 觀測數(shù) 20,單擊“確定”按鈕,輸出結(jié)果如下圖所示:,174,案例研究 “Old Faithful”間歇噴泉的噴發(fā),間歇噴泉是一種向空中噴出熱水和熱氣的溫泉,其名字的由來是因?yàn)檫@種噴泉要經(jīng)過一段相對穩(wěn)定的狀態(tài)后才能噴發(fā)。有時(shí)它噴射的時(shí)間間隔不太穩(wěn)定。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 木工班班組勞務(wù)分包合同
- 仔豬購銷合同協(xié)議書
- 深圳住房租賃合同書
- 辦公用品采購買賣合同
- 衢州職業(yè)技術(shù)學(xué)院《搜索引擎營銷》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東化工職業(yè)學(xué)院《英語學(xué)科教學(xué)設(shè)計(jì)與技能訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- 三江學(xué)院《世界古代史(下)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣東食品藥品職業(yè)學(xué)院《醫(yī)務(wù)社會工作》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安交通大學(xué)城市學(xué)院《環(huán)境化學(xué)Ⅱ》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴州財(cái)經(jīng)大學(xué)《中學(xué)政治課教師技能訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- 銷售沙盤演練培訓(xùn)
- 2025年中國工程建設(shè)行業(yè)現(xiàn)狀、發(fā)展環(huán)境及投資前景分析報(bào)告
- 《海瀾之家公司績效管理現(xiàn)狀、問題及優(yōu)化對策(7600字論文)》
- 小學(xué)四年級英語教學(xué)反思3篇
- DB1509T 0025-2024 肉牛舍設(shè)計(jì)與建筑技術(shù)規(guī)范
- 上海室內(nèi)裝飾施工合同示范文本2024年
- 2024版2024年《汽車文化》全套教案
- 房地產(chǎn) -中建科工五大類型項(xiàng)目成本指標(biāo)庫
- 2024小紅書保健品行業(yè)營銷通案
- 未來網(wǎng)絡(luò)支撐下的數(shù)字身份體系:產(chǎn)業(yè)和技術(shù)發(fā)展趨勢(2024年)定稿版本
- 新《卷煙營銷》理論知識考試題庫(附答案)
評論
0/150
提交評論