版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第4章數(shù)據(jù)的概括性度量1集中趨勢的度量2離散程度的度量3偏態(tài)與峰態(tài)的度量4.1集中趨勢的度量一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)選用哪一個(gè)測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定集中趨勢(位置)4.1.1分類數(shù)據(jù):眾數(shù)集中趨勢的測度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個(gè)眾數(shù)主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)1.根據(jù)第三章例3.3中的數(shù)據(jù),計(jì)算眾數(shù)2.根據(jù)第三章例3.5中的數(shù)據(jù),計(jì)算眾數(shù)3.數(shù)值型分組數(shù)據(jù)的眾數(shù)算例某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—4.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)1.中位數(shù)集中趨勢的測度值之一排序后處于中間位置上的值不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即計(jì)算公式未分組數(shù)據(jù)的中位數(shù)數(shù)值型分組數(shù)據(jù)的中位數(shù)原始數(shù)據(jù):
2422212620位
置: 12345中位數(shù)的計(jì)算排序: 2021222426原始數(shù)據(jù):
10591268位
置:123456 排序: 56891012中位數(shù)=(8+9)/2=8.5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~11033110~11558115~120816120~1251430125~1301040130~135646135~140450合計(jì)
50—
中位數(shù)的位置=50/2=25,即中位數(shù)在120~125這一組,L=120,Sm?1=16,U=125,Sm+1=20,fm=14,d=5,根據(jù)中位數(shù)公式得:2.四分位數(shù)
人們經(jīng)常會將數(shù)據(jù)劃分為4個(gè)部分,每一個(gè)部分大約包含有1/4即25%的數(shù)據(jù)項(xiàng)。QLQMQU25%25%25%25%1.集中趨勢的測度值之一2.排序后處于25%和75%位置上的值3.不受極端值的影響4.主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—計(jì)算甲城市家庭對住房滿意狀況評價(jià)的四分位數(shù)解:下四分位數(shù)(QL)的位置為:
QL位置=(300)/4=75
上四分位數(shù)(QL)的位置為:
QU位置=(3×300)/4=225從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此
QL
=不滿意
QU
=一般原始數(shù)據(jù):23213032282526排序:21232526283032位置:1 23 4567QL=23N+17+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30數(shù)值型未分組數(shù)據(jù)的四分位數(shù)原始數(shù)據(jù):232130282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)
=28.5數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算公式)上四分位數(shù):
下四分位數(shù):
計(jì)算50名工人日加工零件數(shù)的四分位數(shù)某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—QL位置=50/4=12.5QU位置=3×50/4=37.54.1.3數(shù)值型數(shù)據(jù):平均值1.集中趨勢的測度值之一2.最常用的測度值3.一組數(shù)據(jù)的均衡點(diǎn)所在4.易受極端值的影響5.用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)均值(計(jì)算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN簡單均值的計(jì)算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK
相應(yīng)的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權(quán)均值的計(jì)算公式為簡單均值(算例)原始數(shù)據(jù): 10 5 9 13 6 8加權(quán)均值(算例4.7)加權(quán)均值(權(quán)數(shù)對均值的影響)甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下甲組:考試成績(X):020100
人數(shù)分布(F):118
乙組:考試成績(X):020100
人數(shù)分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)均值(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零
2.各變量值與均值的離差平方和最小幾何平均數(shù)(概念要點(diǎn))1.集中趨勢的測度值之一2.N
個(gè)變量值乘積的N
次方根3.適用于特殊的數(shù)據(jù)4.主要用于計(jì)算平均發(fā)展速度5.計(jì)算公式為6.可看作是均值的一種變形幾何平均數(shù)(算例)【例4.10】一位投資者持有一種股票,2001-2004年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率。平均收益率=108.0787%-1=8.0787%4.1.4眾數(shù)、中位數(shù)和均值的比較1.眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布
均值=中位數(shù)=眾數(shù)左偏分布均值
中位數(shù)
眾數(shù)右偏分布眾數(shù)
中位數(shù)
均值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值眾數(shù)中位數(shù)均值均值—四分位數(shù)眾數(shù)調(diào)和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)
中位數(shù)———四分位數(shù)———眾數(shù)4.2離散程度的度量數(shù)據(jù)分布的另一個(gè)重要特征離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述反映各變量值遠(yuǎn)離其中心值的程度,因此也稱為離中趨勢從另一個(gè)側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值4.2.1分類數(shù)據(jù):異眾比率1. 離散程度的測度值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計(jì)算公式為
4.用于衡量眾數(shù)的代表性異眾比率(算例)根據(jù)表中的數(shù)據(jù),計(jì)算異眾比率某城市居民關(guān)注廣告類型的頻數(shù)分布
廣告類型人數(shù)(人)頻率(%)
商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計(jì)200100解:在所調(diào)查的200人當(dāng)中,關(guān)注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關(guān)注的一般趨勢,其代表性不是很好
Vr=200-112200
=1-112200
=0.44=44%4.2.2順序數(shù)據(jù):四分位差1. 離散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差
QD=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度5.不受極端值的影響6.用于衡量中位數(shù)的代表性四分位差(定序數(shù)據(jù)的算例)根據(jù)表中的數(shù)據(jù),計(jì)算甲城市家庭對住房滿意狀況評價(jià)的四分位差甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知QL=不滿意=2,
QU=一般=3四分位差:
QD=QU-QL =3–2=14.2.3數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差1.極差1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)R
=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R
最高組上限-最低組下限5.計(jì)算公式為2.平均差1.離散程度的測度值之一2.各變量值與其均值離差絕對值的平均數(shù)3.能全面反映一組數(shù)據(jù)的離散程度4.數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少5.計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差(計(jì)算過程及結(jié)果)某廠按月收入水平分組的組距數(shù)列如表中前兩列,計(jì)算平均差。3.方差和標(biāo)準(zhǔn)差離散程度的測度值之一最常用的測度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012X=8.3總體方差和標(biāo)準(zhǔn)差(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式總體標(biāo)準(zhǔn)差(計(jì)算過程及結(jié)果)根據(jù)表中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計(jì)—50—3100.5樣本方差和標(biāo)準(zhǔn)差(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!樣本方差自由度一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n
時(shí),若樣本均值x確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x=5
確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差σ2時(shí),它是σ2的無偏估計(jì)量樣本方差與標(biāo)準(zhǔn)差(算例)原始數(shù)據(jù):10 591368方差(簡化計(jì)算公式)樣本方差總體方差方差(數(shù)學(xué)性質(zhì))各變量值對均值的方差小于對任意值的方差設(shè)X0為不等于X的任意數(shù),D2為對X0的方差,則4.相對位置的度量(1)標(biāo)準(zhǔn)分?jǐn)?shù)給出某一個(gè)值在一組數(shù)據(jù)中的相對位置可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)用于對變量的標(biāo)準(zhǔn)化處理計(jì)算公式為(2)經(jīng)驗(yàn)法則當(dāng)一組數(shù)據(jù)對稱分布時(shí),經(jīng)驗(yàn)法則表明約有68%的數(shù)據(jù)在平均數(shù)±1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)±2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)±3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)(3)切比雪夫不等式
在任何數(shù)據(jù)集中,與平均數(shù)超過K倍標(biāo)準(zhǔn)差的數(shù)據(jù)占的比例至多是1/K^2。4.2.4相對離散程度:離散系數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 母嬰行業(yè)深度:預(yù)計(jì)24-25年促生育政策密集落地
- Q3全球半導(dǎo)體銷售額同比增長23.2中國智能手機(jī)出貨量同比增長3
- 城市雕塑鋼板樁施工合同
- 運(yùn)動(dòng)場照明安全管理辦法
- 設(shè)計(jì)院聘用協(xié)議模板
- 保險(xiǎn)行業(yè)技術(shù)合同指南
- 商場室外植物租賃合同
- 學(xué)校教室墻面漆施工合同協(xié)議書
- 辦公樓宇廣告安裝合同文本格式
- 全方位翻譯服務(wù)合同范本
- 消毒供應(yīng)室護(hù)理查房
- 年產(chǎn)十二萬噸天然橙汁食品工廠設(shè)計(jì)樣本
- 消防安全與建筑設(shè)計(jì)的結(jié)合
- 幼兒細(xì)菌科普知識
- 保潔綠化養(yǎng)護(hù)管理專項(xiàng)方案
- 提高門診患者滿意度的品管圈課件
- 膀胱疼痛綜合癥間質(zhì)性膀胱炎上海第二醫(yī)科大學(xué)課件
- 國家開放大學(xué)《人文英語2》綜合練習(xí)參考答案
- 計(jì)算機(jī)應(yīng)用技術(shù)生涯規(guī)劃發(fā)展報(bào)告
- 短波治療儀的
- 生物質(zhì)顆粒燃料項(xiàng)目評價(jià)分析報(bào)告
評論
0/150
提交評論