統(tǒng)計學(xué)第五章變量數(shù)列分析_第1頁
統(tǒng)計學(xué)第五章變量數(shù)列分析_第2頁
統(tǒng)計學(xué)第五章變量數(shù)列分析_第3頁
統(tǒng)計學(xué)第五章變量數(shù)列分析_第4頁
統(tǒng)計學(xué)第五章變量數(shù)列分析_第5頁
已閱讀5頁,還剩105頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)第五章變量數(shù)列分析第1頁,共110頁,2023年,2月20日,星期六

該項活動中,每月都有數(shù)據(jù)統(tǒng)計及分析以用來進(jìn)行該項活動的調(diào)整與實施。如:有一組關(guān)于病人進(jìn)入“救助”活動的時間長度的數(shù)據(jù):

67個樣本:時間長度從1天到185天。為了改善頻臨死亡的病人及其家庭的生活質(zhì)量救助活動“服務(wù)隊”:醫(yī)生家庭健康保健員社會工作者受訓(xùn)志愿者給予病人及家庭一些指導(dǎo)幫助減輕由于疾病、分離等而引起的精神緊張例:美國一家具有福利院性質(zhì)的醫(yī)院(BarnesHospital)。第2頁,共110頁,2023年,2月20日,星期六

均值(mean):35.7天;

中位數(shù)(median):17天;

眾數(shù)(Mode):1天Interpretation:

(1)theaveragetimeapatientstaysintheProgramis35.7days,orslightlyoveramonth;(2)halfofthepatientsareintheProgram17daysorlessandhalfareintheProgram17daysormore;(3)manypatientshaveashortdayintheProgram.除了對該組數(shù)據(jù)進(jìn)行頻數(shù)方面的描述和分析外,下面的統(tǒng)計方法在描述數(shù)據(jù)分布特征及分析方面也很重要:第3頁,共110頁,2023年,2月20日,星期六第五章變量數(shù)列分析★§5.1集中趨勢的測定§5.2離中趨勢的測定§5.3分布偏態(tài)與峰度第4頁,共110頁,2023年,2月20日,星期六§5.1集中趨勢的測定一、集中趨勢的涵義二、平均指標(biāo)的種類及計算方法★第5頁,共110頁,2023年,2月20日,星期六83名女生的身高分布的集中趨勢、中心數(shù)值《統(tǒng)計學(xué)》第五章變量數(shù)列分析算術(shù)平均數(shù)第6頁,共110頁,2023年,2月20日,星期六指總體中各單位的次數(shù)分布從兩邊向中間集中的趨勢,用平均指標(biāo)來反映。集中趨勢指同質(zhì)總體中各單位某一數(shù)量標(biāo)志的一般水平,是對總體單位間數(shù)量差異的抽象化《統(tǒng)計學(xué)》第五章變量數(shù)列分析集中趨勢是一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值。不同類型的數(shù)據(jù)用不同的集中趨勢測度值。(定類數(shù)據(jù):眾數(shù)、定序數(shù)據(jù):中位數(shù)和分位數(shù)、定距和定比數(shù)據(jù):均值)第7頁,共110頁,2023年,2月20日,星期六§5.1集中趨勢的測定一、集中趨勢的涵義二、平均指標(biāo)的種類及計算方法★★第8頁,共110頁,2023年,2月20日,星期六二、平均指標(biāo)的種類及計算方法㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)★第9頁,共110頁,2023年,2月20日,星期六基本形式:例:直接承擔(dān)者算術(shù)平均數(shù)(均值)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第10頁,共110頁,2023年,2月20日,星期六A.簡單算術(shù)平均數(shù)——適用于總體資料未經(jīng)分組整理、尚為原始資料的情況式中:為算術(shù)平均數(shù);為總體單位總數(shù);為第個單位的標(biāo)志值。算術(shù)平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第11頁,共110頁,2023年,2月20日,星期六平均每人日銷售額為:算術(shù)平均數(shù)的計算方法某售貨小組5個人,某天的銷售額分別為520元、600元、480元、750元、440元,則【例】《統(tǒng)計學(xué)》第五章變量數(shù)列分析第12頁,共110頁,2023年,2月20日,星期六B.加權(quán)算術(shù)平均數(shù)——適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況式中:為算術(shù)平均數(shù);為第組的次數(shù);為組數(shù);為第組的標(biāo)志值或組中值。算術(shù)平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第13頁,共110頁,2023年,2月20日,星期六【例】某企業(yè)某日工人的日產(chǎn)量資料如下:日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計800計算該企業(yè)該日全部工人的平均日產(chǎn)量。算術(shù)平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第14頁,共110頁,2023年,2月20日,星期六解:算術(shù)平均數(shù)的計算方法若上述資料為組距數(shù)列,則應(yīng)取各組的組中值作為該組的代表值用于計算;此時求得的算術(shù)平均數(shù)只是其真值的近似值。說明《統(tǒng)計學(xué)》第五章變量數(shù)列分析第15頁,共110頁,2023年,2月20日,星期六《統(tǒng)計學(xué)》第五章變量數(shù)列分析思考題

比特啤酒公司雇用了468名員工,其中有56名管理人員,130名行政和技術(shù)人員,其余282人是工人。這三組人的周平均工資分別是500英鎊、300英鎊和200英鎊。財務(wù)主管希望計算全體員工的平均工資。?第16頁,共110頁,2023年,2月20日,星期六《統(tǒng)計學(xué)》第五章變量數(shù)列分析正確的計算方法第17頁,共110頁,2023年,2月20日,星期六分析:成績(分)人數(shù)(人)甲班乙班丙班603915010013950平均成績(分)619980起到權(quán)衡輕重的作用算術(shù)平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析決定平均數(shù)的變動范圍第18頁,共110頁,2023年,2月20日,星期六表現(xiàn)為次數(shù)、頻數(shù)、單位數(shù);即公式中的表現(xiàn)為頻率、比重;即公式中的算術(shù)平均數(shù)的計算方法指變量數(shù)列中各組標(biāo)志值出現(xiàn)的次數(shù),是變量值的承擔(dān)者,反映了各組的標(biāo)志值對平均數(shù)的影響程度權(quán)數(shù)絕對權(quán)數(shù)相對權(quán)數(shù)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第19頁,共110頁,2023年,2月20日,星期六⒈變量值與其算術(shù)平均數(shù)的離差之和衡等于零,即:⒉變量值與其算術(shù)平均數(shù)的離差平方和為最小,即:算術(shù)平均數(shù)的主要數(shù)學(xué)性質(zhì)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第20頁,共110頁,2023年,2月20日,星期六離差的概念12345678-1-1-213《統(tǒng)計學(xué)》第五章變量數(shù)列分析第21頁,共110頁,2023年,2月20日,星期六▲注意:

均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平”時失去意義,這時往往用“剔除極端值”的方法加以修正。第22頁,共110頁,2023年,2月20日,星期六二、平均指標(biāo)的種類及計算方法㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)★★第23頁,共110頁,2023年,2月20日,星期六【例】

設(shè)X=(2,4,6,8),則其調(diào)和平均數(shù)可由定義計算如下:⒉再求算術(shù)平均數(shù):⒈求各標(biāo)志值的倒數(shù):,,,⒊再求倒數(shù):是總體各單位標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又叫倒數(shù)平均數(shù)調(diào)和平均數(shù)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第24頁,共110頁,2023年,2月20日,星期六A.簡單調(diào)和平均數(shù)——適用于總體資料未經(jīng)分組整理、尚為原始資料的情況式中:為調(diào)和平均數(shù);為變量值的個數(shù);為第個變量值。調(diào)和平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第25頁,共110頁,2023年,2月20日,星期六B.加權(quán)調(diào)和平均數(shù)——適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況式中:為第組的變量值;為第組的標(biāo)志總量。調(diào)和平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第26頁,共110頁,2023年,2月20日,星期六——當(dāng)己知各組變量值和標(biāo)志總量時,作為算術(shù)平均數(shù)的變形使用。因為:調(diào)和平均數(shù)的應(yīng)用《統(tǒng)計學(xué)》第五章變量數(shù)列分析第27頁,共110頁,2023年,2月20日,星期六日產(chǎn)量(件)各組工人日總產(chǎn)量(件)10111213147001100456019501400合計9710【例】某企業(yè)某日工人的日產(chǎn)量資料如下:計算該企業(yè)該日全部工人的平均日產(chǎn)量。調(diào)和平均數(shù)的應(yīng)用《統(tǒng)計學(xué)》第五章變量數(shù)列分析第28頁,共110頁,2023年,2月20日,星期六即該企業(yè)該日全部工人的平均日產(chǎn)量為12.1375件。調(diào)和平均數(shù)的應(yīng)用解:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第29頁,共110頁,2023年,2月20日,星期六二、平均指標(biāo)的種類及計算方法㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)★★★第30頁,共110頁,2023年,2月20日,星期六是N項變量值連乘積的開N次方根幾何平均數(shù)用于計算現(xiàn)象的平均比率或平均速度應(yīng)用:各個比率或速度的連乘積等于總比率或總速度;相乘的各個比率或速度不為零或負(fù)值。應(yīng)用的前提條件:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第31頁,共110頁,2023年,2月20日,星期六A.簡單幾何平均數(shù)——適用于總體資料未經(jīng)分組整理尚為原始資料的情況式中:為幾何平均數(shù);為變量值的個數(shù);為第個變量值。幾何平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第32頁,共110頁,2023年,2月20日,星期六【例】某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的合格率分別為95﹪、92﹪、90﹪、85﹪、80﹪,求整個流水生產(chǎn)線產(chǎn)品的平均合格率。分析:設(shè)最初投產(chǎn)100A個單位,則第一道工序的合格品為100A×0.95;第二道工序的合格品為(100A×0.95)×0.92;

……第五道工序的合格品為(100A×0.95×0.92×0.90×0.85)×0.80;《統(tǒng)計學(xué)》第五章變量數(shù)列分析第33頁,共110頁,2023年,2月20日,星期六因該流水線的最終合格品即為第五道工序的合格品,故該流水線總的合格品應(yīng)為100A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計算?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第34頁,共110頁,2023年,2月20日,星期六因該流水線的最終合格品即為第五道工序的合格品,故該流水線總的合格品應(yīng)為100A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計算。解:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第35頁,共110頁,2023年,2月20日,星期六思考若上題中不是由五道連續(xù)作業(yè)的工序組成的流水生產(chǎn)線,而是五個獨立作業(yè)的車間,且各車間的合格率同前,又假定各車間的產(chǎn)量相等均為100件,求該企業(yè)的平均合格率。幾何平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第36頁,共110頁,2023年,2月20日,星期六因各車間彼此獨立作業(yè),所以有第一車間的合格品為:100×0.95;第二車間的合格品為:100×0.92;

……

第五車間的合格品為:100×0.80。則該企業(yè)全部合格品應(yīng)為各車間合格品的總和,即總合格品=100×0.95+……+100×0.80幾何平均數(shù)的計算方法分析:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第37頁,共110頁,2023年,2月20日,星期六不再符合幾何平均數(shù)的適用條件,需按照求解比值的平均數(shù)的方法計算。又因為應(yīng)采用加權(quán)算術(shù)平均數(shù)公式計算,即《統(tǒng)計學(xué)》第五章變量數(shù)列分析第38頁,共110頁,2023年,2月20日,星期六B.加權(quán)幾何平均數(shù)——適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況式中:為幾何平均數(shù);為第組的次數(shù);為組數(shù);為第組的標(biāo)志值或組中值。幾何平均數(shù)的計算方法《統(tǒng)計學(xué)》第五章變量數(shù)列分析第39頁,共110頁,2023年,2月20日,星期六【例】某金融機(jī)構(gòu)以復(fù)利計息。近12年來的年利率有4年為3﹪,2年為5﹪,2年為8﹪,3年為10﹪,1年為15﹪。求平均年利率。設(shè)本金為V,則至各年末的本利和應(yīng)為:第1年末的本利和為:第2年末的本利和為:………………第12年末的本利和為:分析:第2年的計息基礎(chǔ)第12年的計息基礎(chǔ)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第40頁,共110頁,2023年,2月20日,星期六則該筆本金12年總的本利率為:即12年總本利率等于各年本利率的連乘積,符合幾何平均數(shù)的適用條件,故計算平均年本利率應(yīng)采用幾何平均法。解:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第41頁,共110頁,2023年,2月20日,星期六幾何平均數(shù)的計算方法思考若上題中不是按復(fù)利而是按單利計息,且各年的利率與上相同,求平均年利率。分析第1年末的應(yīng)得利息為:第2年末的應(yīng)得利息為:第12年末的應(yīng)得利息為:…………設(shè)本金為V,則各年末應(yīng)得利息為:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第42頁,共110頁,2023年,2月20日,星期六則該筆本金12年應(yīng)得的利息總和為:=V(0.03×4+0.05×2+……+0.15×1)這里的利息率或本利率不再符合幾何平均數(shù)的適用條件,需按照求解比值的平均數(shù)的方法計算。因為假定本金為V《統(tǒng)計學(xué)》第五章變量數(shù)列分析第43頁,共110頁,2023年,2月20日,星期六所以,應(yīng)采用加權(quán)算術(shù)平均數(shù)公式計算平均年利息率,即:解:《統(tǒng)計學(xué)》第五章變量數(shù)列分析(比較:按復(fù)利計息時的平均年利率為6.85﹪)第44頁,共110頁,2023年,2月20日,星期六注:可看作是均值的一種變形幾何平均等于對數(shù)的算術(shù)平均調(diào)和平均數(shù)與算術(shù)平均數(shù)的區(qū)別:凡是掌握被平均指標(biāo)的分母資料時,用算術(shù)平均法。凡是掌握被平均指標(biāo)的分子資料時,用調(diào)和平均法。平均指標(biāo)=分子:標(biāo)志總量分母:總體單位總數(shù)第45頁,共110頁,2023年,2月20日,星期六價格(元)3.32.52.0合計銷售量(斤)34512算術(shù)平均求某種商品三種零售價格的平均價格調(diào)和平均價格(元)3.32.52.0合計銷售額(元)10101030第46頁,共110頁,2023年,2月20日,星期六例求95%、93%、90%的幾何平均數(shù)(計算誤差:0.0007)第47頁,共110頁,2023年,2月20日,星期六是否為比率或速度各個比率或速度的連乘積是否等于總比率或總速度是否為其他比值是否否是否是幾何平均法算術(shù)平均法求解比值的平均數(shù)的方法數(shù)值平均數(shù)計算公式的選用順序指標(biāo)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第48頁,共110頁,2023年,2月20日,星期六二、平均指標(biāo)的種類及計算方法㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)★★★★第49頁,共110頁,2023年,2月20日,星期六《統(tǒng)計學(xué)》第五章變量數(shù)列分析

如果統(tǒng)計資料中含有異常的或極端的數(shù)據(jù),就有可能得到非典型的甚至可能產(chǎn)生誤導(dǎo)的平均數(shù),這時使用中位數(shù)來度量集中趨勢比較合適。比如有5筆付款:

9元,10元,10元,11元,60元平均付款為100/5=20元。很明顯,這并不是一個好的代表值,而中位數(shù)10元是一個更好的代表值。第50頁,共110頁,2023年,2月20日,星期六將總體各單位標(biāo)志值按大小順序排列后,指處于數(shù)列中間位置的標(biāo)志值,用表示中位數(shù)不受極端數(shù)值的影響,在總體標(biāo)志值差異很大時,具有較強(qiáng)的代表性。由于均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平”時失去意義,這時用中位數(shù)代替均值則更有意義。中位數(shù)的作用:二、平均指標(biāo)的種類及計算方法第51頁,共110頁,2023年,2月20日,星期六中位數(shù)的位次為:即第3個單位的標(biāo)志值就是中位數(shù)【例A】某售貨小組5個人,某天的銷售額按從小到大的順序排列為440元、480元、520元、600元、750元,則中位數(shù)的確定(未分組資料)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第52頁,共110頁,2023年,2月20日,星期六中位數(shù)的位次為:中位數(shù)應(yīng)為第3和第4個單位標(biāo)志值的算術(shù)平均數(shù),即【例B】若上述售貨小組為6個人,某天的銷售額按從小到大的順序排列為440元、480元、520元、600元、750元、760元,則中位數(shù)的確定(未分組資料)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第53頁,共110頁,2023年,2月20日,星期六【例C】某企業(yè)某日工人的日產(chǎn)量資料如下:日產(chǎn)量(件)工人人數(shù)(人)向上累計次數(shù)(人)10111213147010038015010070170550700800合計800—計算該企業(yè)該日全部工人日產(chǎn)量的中位數(shù)。中位數(shù)的位次:中位數(shù)的確定(單值數(shù)列)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第54頁,共110頁,2023年,2月20日,星期六中位數(shù)的確定(組距數(shù)列)【例D】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向上累計次數(shù)(人)200以下200~400400~600600以上373283104250合計50—計算該車間工人月產(chǎn)量的中位數(shù)?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第55頁,共110頁,2023年,2月20日,星期六二、平均指標(biāo)的種類及計算方法㈠算術(shù)平均數(shù)㈡調(diào)和平均數(shù)㈢幾何平均數(shù)㈣中位數(shù)㈤眾數(shù)數(shù)值平均數(shù)位置平均數(shù)★★★★★第56頁,共110頁,2023年,2月20日,星期六《統(tǒng)計學(xué)》第五章變量數(shù)列分析有時眾數(shù)是一個合適的代表值

比如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在做有關(guān)生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。

第57頁,共110頁,2023年,2月20日,星期六指總體中出現(xiàn)次數(shù)最多的變量值,用表示,它不受極端數(shù)值的影響,用來說明總體中大多數(shù)單位所達(dá)到的一般水平。眾數(shù)二、平均指標(biāo)的種類及計算方法第58頁,共110頁,2023年,2月20日,星期六購買五類不同品牌計算機(jī)的統(tǒng)計中,得到如表所示的頻數(shù)分布表。顯然,眾數(shù),即個人購買最多的計算機(jī)品牌是Apple。在這類數(shù)據(jù)中,“均值”與“中位數(shù)”是沒有任何意義的。“眾數(shù)”提供了頻數(shù)最高的個人電腦購買品牌。CompanyFrequencyApple13Compaq12Gateway20005IBM9PackardBell11第59頁,共110頁,2023年,2月20日,星期六日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計800【例A】已知某企業(yè)某日工人的日產(chǎn)量資料如下:眾數(shù)的確定(單值數(shù)列)計算該企業(yè)該日全部工人日產(chǎn)量的眾數(shù)?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第60頁,共110頁,2023年,2月20日,星期六眾數(shù)的確定(組距數(shù)列)【例B】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向上累計次數(shù)(人)200以下200~400400~600600以上373283104250合計50—計算該車間工人月產(chǎn)量的眾數(shù)。概約眾數(shù):眾數(shù)所在組的組中值,在本例為500件第61頁,共110頁,2023年,2月20日,星期六眾數(shù)的原理及應(yīng)用83名女生身高原始數(shù)據(jù)83名女生身高組距數(shù)列《統(tǒng)計學(xué)》第五章變量數(shù)列分析第62頁,共110頁,2023年,2月20日,星期六當(dāng)數(shù)據(jù)分布存在明顯的集中趨勢,且有顯著的極端值時,適合使用眾數(shù);當(dāng)數(shù)據(jù)分布的集中趨勢不明顯或存在兩個以上分布中心時,不適合使用眾數(shù)(前者無眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒有眾數(shù))。眾數(shù)的原理及應(yīng)用《統(tǒng)計學(xué)》第五章變量數(shù)列分析第63頁,共110頁,2023年,2月20日,星期六

眾數(shù)、中位數(shù)和均值都是對數(shù)據(jù)集中趨勢的測度,

1、均值由全部數(shù)據(jù)計算,包含了全部數(shù)據(jù)的信息,具有良好的數(shù)學(xué)性質(zhì),當(dāng)數(shù)據(jù)接近對稱分布時,具有較好的代表性;但對于偏態(tài)分布,其代表性較差。

2、中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),其代表性要比均值好。

3、眾數(shù)是一組數(shù)據(jù)分布的峰值,是一種位置的代表,當(dāng)數(shù)據(jù)的分布具有明顯的集中趨勢時,尤其對于偏態(tài)分布,眾數(shù)的代表性比均值好。

4、對接近正態(tài)的分布數(shù)據(jù),常用均值描述數(shù)據(jù)的集中趨勢;對偏態(tài)分布,常用眾數(shù)或中位數(shù)描述數(shù)據(jù)的集中趨勢。

5、均值只適用于定距或定比尺度的數(shù)據(jù);定序尺度數(shù)據(jù)可用中位數(shù)或眾數(shù)進(jìn)行描述,而對定類尺度數(shù)據(jù),只能用眾數(shù)進(jìn)行描述。

眾數(shù)、中位數(shù)和均值的應(yīng)用場合第64頁,共110頁,2023年,2月20日,星期六眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值第65頁,共110頁,2023年,2月20日,星期六第五章變量數(shù)列分析★§5.1集中趨勢的測定§5.2離中趨勢的測定★第66頁,共110頁,2023年,2月20日,星期六課程學(xué)生語文數(shù)學(xué)英語總成績平均成績甲乙丙606555656565706575195195195656565單位:分某班三名同學(xué)三門課程的成績?nèi)缦拢赫埍容^三名同學(xué)學(xué)習(xí)成績的差異?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第67頁,共110頁,2023年,2月20日,星期六集中趨勢弱、離中趨勢強(qiáng)集中趨勢強(qiáng)、離中趨勢弱《統(tǒng)計學(xué)》第五章變量數(shù)列分析第68頁,共110頁,2023年,2月20日,星期六§5.2離中趨勢的測定一、離中趨勢的涵義二、標(biāo)志變異指標(biāo)的種類及計算三、是非標(biāo)志的標(biāo)準(zhǔn)差及方差★第69頁,共110頁,2023年,2月20日,星期六指總體中各單位標(biāo)志值背離分布中心的規(guī)?;虺潭?,用標(biāo)志變異指標(biāo)來反映。離中趨勢反映統(tǒng)計數(shù)據(jù)差異程度的綜合指標(biāo),也稱為標(biāo)志變動度變異指標(biāo)值越大,平均指標(biāo)的代表性越??;反之,平均指標(biāo)的代表性越大《統(tǒng)計學(xué)》第五章變量數(shù)列分析第70頁,共110頁,2023年,2月20日,星期六例:如果你是一家制造業(yè)公司的供應(yīng)部門經(jīng)理,與兩家原材料供應(yīng)商聯(lián)系供貨,兩家供應(yīng)商均表示能在大約10個工作日內(nèi)供齊所需原材料。幾個月的運(yùn)轉(zhuǎn)之后,你發(fā)現(xiàn)盡管兩家供貨商供貨的平均時間都是大約10天,但他們供貨所需天數(shù)的分布情況卻是不同的(圖)。問:兩家供貨商按時供貨的可信度相同嗎?考慮它們直方圖的差異,你更愿意選擇哪家供貨商供貨呢?第71頁,共110頁,2023年,2月20日,星期六測定離中趨勢的意義用來衡量和比較平均數(shù)代表性的大??;用來反映社會經(jīng)濟(jì)活動過程的均衡性和節(jié)奏性;用來測定變量數(shù)列次數(shù)分布較正態(tài)分布的偏離程度。 《統(tǒng)計學(xué)》第五章變量數(shù)列分析第72頁,共110頁,2023年,2月20日,星期六§5.2離中趨勢的測定一、離中趨勢的涵義二、標(biāo)志變異指標(biāo)的種類及計算三、是非標(biāo)志的標(biāo)準(zhǔn)差及方差★★第73頁,共110頁,2023年,2月20日,星期六測定標(biāo)志變異度的絕對量指標(biāo)(與原變量值名數(shù)相同)測定標(biāo)志變異度的相對量指標(biāo)(表現(xiàn)為無名數(shù))標(biāo)志變異指標(biāo)的種類《統(tǒng)計學(xué)》第五章變量數(shù)列分析全距標(biāo)準(zhǔn)差異眾比率四分位差標(biāo)準(zhǔn)差系數(shù)第74頁,共110頁,2023年,2月20日,星期六指所研究的數(shù)據(jù)中,最大值與最小值之差,又稱極差。全距最大變量值或最高組上限或開口組假定上限最小變量值或最低組下限或開口組假定下限【例A】某售貨小組5人某天的銷售額分別為440元、480元、520元、600元、750元,則《統(tǒng)計學(xué)》第五章變量數(shù)列分析第75頁,共110頁,2023年,2月20日,星期六【例B】某季度某工業(yè)公司18個工業(yè)企業(yè)產(chǎn)值計劃完成情況如下:計劃完成程度(﹪)組中值(﹪)企業(yè)數(shù)(個)計劃產(chǎn)值(萬元)90以下90~100100~110110以上8595105115231038002500172004400合計—1824900計算該公司該季度計劃完成程度的全距?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第76頁,共110頁,2023年,2月20日,星期六優(yōu)點:計算方法簡單、易懂;缺點:易受極端數(shù)值的影響,由于極差只利用了數(shù)據(jù)兩端的信息,沒有反映中間數(shù)據(jù)的分散狀況,因而不能準(zhǔn)確描述數(shù)據(jù)的分散程度。往往應(yīng)用于生產(chǎn)過程的質(zhì)量控制中全距的特點《統(tǒng)計學(xué)》第五章變量數(shù)列分析第77頁,共110頁,2023年,2月20日,星期六異眾比率

(概念要點)1. 離散程度的測度值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為

4.用于衡量眾數(shù)的代表性(取值在0到1之間,越趨近于1,說明眾數(shù)所在組的頻數(shù)占總頻數(shù)的比率越低,代表性越弱)第78頁,共110頁,2023年,2月20日,星期六異眾比率

(算例)表3-1某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)頻率(%)

商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計200100根據(jù)表3-1中的數(shù)據(jù),計算異眾比率解:在所調(diào)查的200人當(dāng)中,關(guān)注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關(guān)注的一般趨勢,其代表性不是很好

Vr=200-112200

=1-

112

200

=0.44=44%第79頁,共110頁,2023年,2月20日,星期六四分位差Q1Q2Q325%25%25%25%四分位數(shù):

用于衡量中位數(shù)的代表性反映了中間50%數(shù)據(jù)的離散程度第80頁,共110頁,2023年,2月20日,星期六⑴簡單標(biāo)準(zhǔn)差——適用于未分組資料是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)的開平方根,用來表示;標(biāo)準(zhǔn)差的平方又叫作方差,用來表示。標(biāo)準(zhǔn)差計算公式:總體單位總數(shù)第個單位的變量值總體算術(shù)平均數(shù)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第81頁,共110頁,2023年,2月20日,星期六【例A】某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的標(biāo)準(zhǔn)差。解:即該售貨小組銷售額的標(biāo)準(zhǔn)差為109.62元?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第82頁,共110頁,2023年,2月20日,星期六⑵加權(quán)標(biāo)準(zhǔn)差——適用于分組資料標(biāo)準(zhǔn)差的計算公式總體算術(shù)平均數(shù)第組變量值出現(xiàn)的次數(shù)第組的變量值或組中值《統(tǒng)計學(xué)》第五章變量數(shù)列分析第83頁,共110頁,2023年,2月20日,星期六【例B】計算下表中某公司職工月工資的標(biāo)準(zhǔn)差。月工資(元)組中值(元)職工人數(shù)(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合計—2000《統(tǒng)計學(xué)》第五章變量數(shù)列分析第84頁,共110頁,2023年,2月20日,星期六解:即該公司職工月工資的標(biāo)準(zhǔn)差為167.9元?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第85頁,共110頁,2023年,2月20日,星期六標(biāo)準(zhǔn)差的特點不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實際差異程度;用平方的方法消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問題,可方便地用于數(shù)學(xué)處理和統(tǒng)計分析運(yùn)算.《統(tǒng)計學(xué)》第五章變量數(shù)列分析第86頁,共110頁,2023年,2月20日,星期六測定標(biāo)志變異度的絕對量指標(biāo)(與原變量值名數(shù)相同)測定標(biāo)志變異度的相對量指標(biāo)(表現(xiàn)為無名數(shù))標(biāo)志變異指標(biāo)的種類《統(tǒng)計學(xué)》第五章變量數(shù)列分析全距標(biāo)準(zhǔn)差異眾比率四分位差標(biāo)準(zhǔn)差系數(shù)第87頁,共110頁,2023年,2月20日,星期六可比變異系數(shù)指標(biāo)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第88頁,共110頁,2023年,2月20日,星期六身高的差異水平:cm體重的差異水平:kg用變異系數(shù)可以相互比較可比《統(tǒng)計學(xué)》第五章變量數(shù)列分析第89頁,共110頁,2023年,2月20日,星期六變異系數(shù)指標(biāo)用來對比不同水平的同類現(xiàn)象,特別是不同類現(xiàn)象總體平均數(shù)代表性的大小:——標(biāo)準(zhǔn)差系數(shù)小的總體,其平均數(shù)的代表性大;反之,亦然。應(yīng)用:《統(tǒng)計學(xué)》第五章變量數(shù)列分析標(biāo)準(zhǔn)差系數(shù)(離散系數(shù))第90頁,共110頁,2023年,2月20日,星期六【例】某年級一、二兩班某門課的平均成績分別為82分和76分,其成績的標(biāo)準(zhǔn)差分別為15.6分和14.8分,比較兩班平均成績代表性的大小。解:一班成績的標(biāo)準(zhǔn)差系數(shù)為:二班成績的標(biāo)準(zhǔn)差系數(shù)為:因為,所以一班平均成績的代表性比二班大?!督y(tǒng)計學(xué)》第五章變量數(shù)列分析第91頁,共110頁,2023年,2月20日,星期六§5.2離中趨勢的測定一、離中趨勢的涵義二、標(biāo)志變異指標(biāo)的種類及計算三、是非標(biāo)志的標(biāo)準(zhǔn)差及方差★★★第92頁,共110頁,2023年,2月20日,星期六是非標(biāo)志總體分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計—為研究是非標(biāo)志總體的數(shù)量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現(xiàn)形式的標(biāo)志,又叫交替標(biāo)志是非標(biāo)志《統(tǒng)計學(xué)》第五章變量數(shù)列分析第93頁,共110頁,2023年,2月20日,星期六是非標(biāo)志總體的指標(biāo)具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)指是非標(biāo)志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重成數(shù)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第94頁,共110頁,2023年,2月20日,星期六是非標(biāo)志總體的指標(biāo)均值標(biāo)準(zhǔn)差《統(tǒng)計學(xué)》第五章變量數(shù)列分析第95頁,共110頁,2023年,2月20日,星期六是非標(biāo)志總體的指標(biāo)方差標(biāo)準(zhǔn)差系數(shù)《統(tǒng)計學(xué)》第五章變量數(shù)列分析第96頁,共110頁,2023年,2月20日,星期六【例】某廠某月份生產(chǎn)了400件產(chǎn)品,其中合格品380件,不合格品20件。求產(chǎn)品質(zhì)量分布的集中趨勢與離中趨勢。是非標(biāo)志總體的指標(biāo)解:《統(tǒng)計學(xué)》第五章變量數(shù)列分析第97頁,共110頁,2023年,2月20日,星期六§5.3分布偏態(tài)與峰度一、偏態(tài)及其測度二、峰度及其測度第98頁,共110頁,2023年,2月20日,星期六

動差又稱矩,可用來說明數(shù)據(jù)頻數(shù)分布的特征。

一般地,取數(shù)據(jù)中的a點為中心點,所有數(shù)據(jù)與a之差的k次方的平均數(shù):稱為數(shù)據(jù)X關(guān)于a的k階動差(k階矩)。當(dāng)時,數(shù)據(jù)以算術(shù)平均數(shù)為中心,上式稱為中心k階動差(矩)。一、統(tǒng)計學(xué)中常以中心3階動差(矩)來測度分布的偏態(tài)。

動差法當(dāng)a=0時,即數(shù)據(jù)以原點為中心,上式稱為原點k階動差(矩)第99頁,共110頁,2023年,2月20日,星期六偏態(tài)是對分布偏斜方向及程度的測度,通過偏斜系數(shù)進(jìn)行測度

3=0時,為對稱分布;

3>0時,為正偏(右偏)分布;

3<0時,為負(fù)偏(左偏)分布。

式中,3表示偏態(tài)系數(shù),3是標(biāo)準(zhǔn)差的三次方。因此,該指標(biāo)是相對指標(biāo)。第100頁,共110頁,2023年,2月20日,星期六峰度是頻數(shù)分布的另一重要特點。其測度的是:某種頻數(shù)分布的曲線與正態(tài)分布曲線相比,是尖頂,還是平頂,其尖或平的程度如何。峰度就是頻數(shù)分布曲線頂端的尖峭程度。

峰度的測度,往往以中心4階動差為基礎(chǔ)進(jìn)行;

二、峰度及其測度第101頁,共110頁,2023年,2月20日,星期六將4階動差的數(shù)值,除以標(biāo)準(zhǔn)差的4次方,化為相對數(shù),就是峰度的測度值,即峰度系數(shù):經(jīng)驗上,峰度系數(shù)為3時,恰為正態(tài)分布,因此,

當(dāng)峰度系數(shù)<3時,為平頂分布曲線;當(dāng)峰度系數(shù)>3時,為尖頂分布曲線;

當(dāng)峰度系數(shù)接近于1.8時,則頻數(shù)分布曲線趨向于一條水平線;

當(dāng)峰度系數(shù)小于1.8時,為U型曲線。第102頁,共110頁,2023年,2月20日,星期六注意:

1、在用動差法計算偏態(tài)系數(shù)與峰度系數(shù)時,對所考察的對象按總體公式測度其方差與標(biāo)準(zhǔn)差。

2、偏度與峰度主要用于檢查樣本的分布是否正態(tài)來判斷總體的分布是否接近于正態(tài)分布。如果樣本的偏度接近于0而峰度接近于3,就可以推斷總體的分布是接近于正態(tài)分布的。第103頁,共110頁,2023年,2月20日,星期六偏態(tài)

(實例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論