




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
(優(yōu)選)四單變量的描述統(tǒng)計離散趨勢分析和集中趨勢分析1現(xiàn)在是1頁\一共有66頁\編輯于星期六知識點:
兩個維度——七個統(tǒng)計量數(shù)現(xiàn)在是2頁\一共有66頁\編輯于星期六學習要求1、集中趨勢各測量法的計算方法;2、集中趨勢各測量法的特點和應用;3、離散程度各測量法的計算方法;4、離散程度各測量法的特點與應用;
現(xiàn)在是3頁\一共有66頁\編輯于星期六單變量描述統(tǒng)計在統(tǒng)計分析中,是否可以找出一個有代表性的數(shù)值來說明變量的分布,反映資料的集中或差異情況?集中趨勢測量,就是以一個數(shù)值來代表變量的資料分布,反映的是變量值向中心值聚集的程度,也就是說以這一個數(shù)值(或稱典型值)來估計或預測每一個研究對象的數(shù)值時發(fā)生的錯誤總數(shù)在理論上是最小的。離散趨勢測量(Measuresofdispersion)就是用一個值表示數(shù)據(jù)之間的差異情況。離散趨勢測量法和集中趨勢測量法具有互補作用。在進行統(tǒng)計分析時,既要測量變量的集中趨勢,也要測量離散趨勢。
現(xiàn)在是4頁\一共有66頁\編輯于星期六集中趨勢測量/分析集中趨勢測量:用某一個典型的變量值或特征值來代表全體變量的問題,這個典型的變量值或特征值就稱作集中值或集中趨勢?!锉娭担∕ode)——定類層次★中位值(Median)——定序?qū)哟巍锞担∕ean)——定距層次現(xiàn)在是5頁\一共有66頁\編輯于星期六一、眾數(shù)(mode)1、出現(xiàn)頻次最多的變量值;2、眾數(shù)的不唯一性;3、主要應用于定類變量,當然也可以應用于定序和定距變量現(xiàn)在是6頁\一共有66頁\編輯于星期六
眾數(shù)的特點:不唯一性原始數(shù)據(jù):4、5、7、8、19(無眾值)原始數(shù)據(jù):4、5、7、5、5、16(一個眾值)原始數(shù)據(jù):4、4、5、7、7、9(兩個眾值)現(xiàn)在是7頁\一共有66頁\編輯于星期六例1:非連續(xù)取值現(xiàn)在是8頁\一共有66頁\編輯于星期六例2分組數(shù)據(jù)收入(元)fCf↑Cf↓500-6991010550700-8996575540900-10991262114751100-12991583693391300-14991415101811500-16994055040總數(shù)550現(xiàn)在是9頁\一共有66頁\編輯于星期六從分布來看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應的數(shù)值及為眾數(shù)?,F(xiàn)在是10頁\一共有66頁\編輯于星期六二、中位值(Median)1、把一組數(shù)據(jù)按順序排列,處于中間位置的那個數(shù)值就是中位值。2、主要應用于定序變量,也可用于定距變量,但不可用于定類變量。50%50%Md現(xiàn)在是11頁\一共有66頁\編輯于星期六(1)未分組數(shù)據(jù)求中位數(shù):Md位置=
(2)中位數(shù)=中間位置的值注意:先找位置,再找中位數(shù)將各個個案由低至高排列起來,居序列中央位置的個案值就是中位值?,F(xiàn)在是12頁\一共有66頁\編輯于星期六(1)、個案數(shù)為奇數(shù)【例1】:甲地的5戶人家的人數(shù)為:2,4,3,6,8,求中位值。
解:Md的位置===3排序2,3,4,6,8中位值Md=4現(xiàn)在是13頁\一共有66頁\編輯于星期六(2)個案數(shù)為偶數(shù)【例2】:乙地的6戶人家的人數(shù)為:2,4,3,6,8,5求中位值。解:Md的位置===3.5排序2,3,4,5,6,8Md==4.5現(xiàn)在是14頁\一共有66頁\編輯于星期六(3)頻數(shù)分布表【例3】根據(jù)下表求中位值。解:Md位置==
=250.5中位值Md=乙現(xiàn)在是15頁\一共有66頁\編輯于星期六2、分組數(shù)據(jù)根據(jù)統(tǒng)計表中的累積百分比,找出含有50%的區(qū)間找出含有50%區(qū)間的上界值U,下界值L,上界累計百分數(shù)U%,下界累計百分數(shù)L%以及組距等信息根據(jù)線段對應成比例的原理,計算出累計百分比為50%的變量值現(xiàn)在是16頁\一共有66頁\編輯于星期六L:中位數(shù)組的下限f:中位數(shù)組的頻數(shù)w:中位數(shù)組的組距(U-L)cf:低于中位數(shù)組下限的累加次數(shù)n:全部個案數(shù)Md位置=n/2(上下各50%的位置)現(xiàn)在是17頁\一共有66頁\編輯于星期六例:分組數(shù)據(jù):首先將各組的次數(shù)累加起來求中位數(shù)的位置:Md位置=n/2=212/2=106第106個位置在25-35之間現(xiàn)在是18頁\一共有66頁\編輯于星期六分組變量看作是一組連續(xù)的數(shù)值259435124?106103012現(xiàn)在是19頁\一共有66頁\編輯于星期六【例4】:根據(jù)下表數(shù)據(jù)求中位值。解:Md位置=50;從累積頻數(shù)cf欄找到中位數(shù)位置所在組為“300-400”引入公式:=350現(xiàn)在是20頁\一共有66頁\編輯于星期六三、均值1、均值的定義:總體各單位取值之和除以總體單位數(shù)目。2、僅適用于定距變量,不適用于定類和定序;現(xiàn)在是21頁\一共有66頁\編輯于星期六1、未分組數(shù)據(jù)
(1)簡單原始資料求均值現(xiàn)在是22頁\一共有66頁\編輯于星期六均值的計算——未分組數(shù)據(jù)【例5】某班10名學生年齡分別為20、21、19、19、20、20、21、22、18、20歲,求他們的平均年齡。解:根據(jù)平均數(shù)的計算公式有:現(xiàn)在是23頁\一共有66頁\編輯于星期六(2)、加權(quán)平均數(shù)某個變項值重復出現(xiàn)多次,可以先統(tǒng)計每個值(x)的次數(shù)(f),再求次數(shù)與相應變量值的乘積(fx),利用各乘積之和求出均值。(f也稱為權(quán)數(shù),f/n稱為權(quán)重)公式:現(xiàn)在是24頁\一共有66頁\編輯于星期六未分組數(shù)據(jù)加權(quán)平均數(shù)【例6】調(diào)查某年120名學生的年齡,結(jié)果如下表,求平均年齡。解:根據(jù)公式得=18.9歲現(xiàn)在是25頁\一共有66頁\編輯于星期六2、分組資料求均值:根據(jù)組中值求均值先求出組中值組中值=(上限+下限)/2計算組中值的和計算分組數(shù)據(jù)的均值組中值現(xiàn)在是26頁\一共有66頁\編輯于星期六眾值、中位數(shù)和均值的比較1注:▲表示該數(shù)據(jù)類型最適合用的測度值現(xiàn)在是27頁\一共有66頁\編輯于星期六眾數(shù)、中位數(shù)和平均值的比較眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值。但在社會調(diào)查中眾數(shù)的代表性較小現(xiàn)在是28頁\一共有66頁\編輯于星期六中位數(shù)和平均數(shù)的比較計算平均數(shù)時用到數(shù)據(jù)中所有的數(shù)值,而求中位數(shù)時只用到數(shù)值的相對位置,平均數(shù)比中位數(shù)利用了更多的有關數(shù)據(jù)的信息平均數(shù)容易受到極端值的影響,而中位數(shù)則不會受這種影響。當樣本中數(shù)據(jù)值的分布是高度傾斜的,中位數(shù)一般比平均數(shù)更適合一些如100,200,400,500,600,均值為360,中位數(shù)為400100,200,400,500,1000,均值為440,中位數(shù)為400現(xiàn)在是29頁\一共有66頁\編輯于星期六對隨機抽樣調(diào)查來說,平均數(shù)比中位數(shù)更穩(wěn)定,它隨樣本的變化比較小平均數(shù)比中位數(shù)更容易進行算術(shù)運算?,F(xiàn)在是30頁\一共有66頁\編輯于星期六眾數(shù)、中位數(shù)、均值比較2但兩種情況不宜用均值:(1)分組數(shù)據(jù)的極端組沒有組限。(2)個別數(shù)值非常特殊。現(xiàn)在是31頁\一共有66頁\編輯于星期六現(xiàn)在是32頁\一共有66頁\編輯于星期六練習:
求下表(單項數(shù)列)所示數(shù)據(jù)的算術(shù)平均數(shù)。人口數(shù)(X)戶數(shù)(f)頻率(P)23456785816106410.100.160.320.200.120.080.02合計501.00現(xiàn)在是33頁\一共有66頁\編輯于星期六求下表所示數(shù)據(jù)的的算術(shù)平均數(shù)間距頻數(shù)(f)組中值(X)148―152152―156156―160160―164164―168168―172172―176176―180180―184184―188188―192192―19612510192517125301150154158162166170174178182186190194合計100——現(xiàn)在是34頁\一共有66頁\編輯于星期六求54,65,78,66,43這些數(shù)字的中位數(shù)。求54,65,78,66,43,38這些數(shù)字的中位數(shù)?,F(xiàn)在是35頁\一共有66頁\編輯于星期六某年級學生身高如下,求中位數(shù)現(xiàn)在是36頁\一共有66頁\編輯于星期六人口數(shù)(X)戶數(shù)(f)頻率(P)23456785816106410.100.160.320.200.120.080.02合計501.00求下表中的眾數(shù)現(xiàn)在是37頁\一共有66頁\編輯于星期六求下表中的眾數(shù)現(xiàn)在是38頁\一共有66頁\編輯于星期六
城鎮(zhèn)自殺率的分組次數(shù)分布自殺率次數(shù)真實組限組中值向上累積次數(shù)3-5126-8359-118112-145215-173018-20721-23924-263合計229現(xiàn)在是39頁\一共有66頁\編輯于星期六第五講單變量的描述統(tǒng)計(2)
離散趨勢測量40現(xiàn)在是40頁\一共有66頁\編輯于星期六離散趨勢測量(Measuresofdispersion)反映的是各變量值偏離其中心值的程度,是個案與個案之間的差異情況。這種測量法,與前面所講的集中趨勢測量法具有相互補充的作用。集中趨勢求出的是一個最能代表變量所有資料的值,但是集中趨勢值代表性的高低還要看各個個案之間的差異情況?,F(xiàn)在是41頁\一共有66頁\編輯于星期六舉例:某校3個系各選5名同學參加智力競賽,他們的成績?nèi)缦拢褐形南担?8,79,80,81,82
(=80)數(shù)學系:65,72,80,88,95(=80)英語系:35,78,89,98,100(=80)如果僅從集中趨勢測量(平均分數(shù))來看,這三個系的成績都一致,不存在什么差別。但從直觀上可看出,三個系選手之間的差距程度(離散程度)很不一樣……???現(xiàn)在是42頁\一共有66頁\編輯于星期六
異眾比率/離異比率(Variationratio)——定類層次四分位差(Interquartilerange)——定序?qū)哟畏讲睿╒ariance)標準差(Standarddeviation)——定距層次現(xiàn)在是43頁\一共有66頁\編輯于星期六一、異眾比率(Variationratio)1、異眾比率(簡寫Vr):指非眾值在總數(shù)中所占的比率。表示以眾數(shù)來預測一組數(shù)據(jù)時,所犯錯誤的大小.即Vr值越大,則眾值的代表性就越小.Vr值越小,則眾值的代表性就越大.2、計算公式::眾值的頻次現(xiàn)在是44頁\一共有66頁\編輯于星期六異眾比率(先找出眾值.找到眾值的頻次分布)【例1】:根據(jù)表1中的數(shù)據(jù),計算眾值和異眾比率。解:眾值Mo=“核心家庭”異眾比率現(xiàn)在是45頁\一共有66頁\編輯于星期六例2:眾數(shù)和異眾比率的比較表2甲乙兩校學生的父親職業(yè)甲乙兩校學生的父親職業(yè)的眾數(shù)都為“農(nóng)民”甲校乙校眾數(shù)的代表性中甲校小于乙校,甲校中有47.6%非農(nóng)民,乙校只有38.5%.現(xiàn)在是46頁\一共有66頁\編輯于星期六異眾比率&眾值異眾比率是眾值的補充。取值范圍是[0,1]。不屬于眾數(shù)的個案所占的比例愈大,就表示眾數(shù)的代表性愈小,以之作估計或預測時所犯的錯誤也就愈大。當Vr=0,說明變量只有一個值,那就是眾值;當Vr0,說明資料比較集中,眾值的代表性比較高;當Vr1,說明資料比較分散,眾值的代表性低?,F(xiàn)在是47頁\一共有66頁\編輯于星期六二、四分位差(Interquartilerange)
將數(shù)據(jù)由低至高排列,然后分為四等分(即每個等分包括25%的數(shù)據(jù)),第一個四分位置的值(Q1)與第三個四分位置的值(Q3)的差異,就是四分位差(簡寫為Q)。Q1Q2Q3Q425%25%25%25%現(xiàn)在是48頁\一共有66頁\編輯于星期六1.離散程度的測度值之一2.也稱為內(nèi)距或四分間距3.上四分位數(shù)與下四分位數(shù)之差4.反映了中間50%數(shù)據(jù)的離散程度5.不受極端值的影響6.用于衡量中位數(shù)的代表性現(xiàn)在是49頁\一共有66頁\編輯于星期六基本公式求位置,找出4分位對應的數(shù)值Q1=Q3=四分位差Q=Q3-Q1。現(xiàn)在是50頁\一共有66頁\編輯于星期六1、根據(jù)原始未分組資料求四分位差解:
Q1的位置==75.25Q3的位置==225.75那么Q1=不滿意;Q3=一般Q=Q3-Q1=一般-不滿意結(jié)論,有一半的家庭對住房評價在不滿意到一般之間。表甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410894443024132226270300合計300—【例3】求下表的四分位差現(xiàn)在是51頁\一共有66頁\編輯于星期六例4:調(diào)查甲乙兩村的家庭人數(shù)其中甲村有11戶人家,每戶人數(shù)為2,2,3,4,6,9,10,10,11,13,15乙村有8戶人家,每戶人口數(shù)為2,3,4,7,9,10,12,12則甲村中:Q1位置=(n+1)/4=(11+1)/4=3,Q1=3Q3位置=3(n+1)/4=9,Q3=11
Q=Q3-Q1=11-3=8則乙村中:Q1位置=(n+1)/4=2.25,Q1=3+0.25(4-3)=3.25Q3位置=3(n+1)/4=6.75,Q3=10+0.75(12-10)=11.5
Q=Q3-Q1=11.5-3.25=8.25甲的離散程度低于乙村,以中位置估計甲乙兩村的人口數(shù)時,在甲村犯的錯誤小于乙村現(xiàn)在是52頁\一共有66頁\編輯于星期六2、根據(jù)分組資料求四分位差有四步:計算向上累加次數(shù)求出Q1和Q3的位置
Q1=Q3=參考累加次數(shù)分布,決定Q1和Q3屬于哪一組從所屬組中,計算Q1位置和Q3位置的數(shù)值?,F(xiàn)在是53頁\一共有66頁\編輯于星期六公式如下:L1=Q1屬組之真實下限L3=Q3屬組之真實下限f1=Q1屬組之次數(shù)f3=Q3屬組之次數(shù)cf1=低于Q1屬組之累計次數(shù)cf3=低于Q3屬組之累計次數(shù)w1=Q1屬組之組距w3=Q3屬組之組距n=全部個案數(shù)目現(xiàn)在是54頁\一共有66頁\編輯于星期六四分位差&中位數(shù)四分位差反映的是中位數(shù)的代表性差距越大,中位數(shù)的代表性越小,用中位數(shù)估計變量時所犯的錯誤越大;反之,中位數(shù)的代表性越大,用中位數(shù)作估計犯的錯誤越小?,F(xiàn)在是55頁\一共有66頁\編輯于星期六三、方差和標準差1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異5.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012X=8.3現(xiàn)在是56頁\一共有66頁\編輯于星期六三、方差與標準差所謂方差(Variance),觀察值與其均值之差的平方和除以全部觀察總數(shù)N。方差的平方根就是標準差(Standarddeviation),用或S現(xiàn)在是57頁\一共有66頁\編輯于星期六表示以均值作代表值時引起的偏差或錯誤,也就是說用均值來估計或預測各個個案的數(shù)值,所犯的錯誤()平均是σ標準差是用得最多,也是最重要的離散量數(shù)的統(tǒng)計量;方差是統(tǒng)計學上的一個重要概念,在以后的統(tǒng)計方法學習過程中會進一步了解;只適用于定距層次的變量;現(xiàn)在是58頁\一共有66頁\編輯于星期六總體方差和標準差未分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):方差的計算公式標準差的計算公式現(xiàn)在是59頁\一共有66頁\編輯于星期六樣本方差和標準差
分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!未分組數(shù)據(jù)現(xiàn)在是60頁\一共有66頁\編輯于星期六樣本方差的
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當樣本數(shù)據(jù)的個數(shù)為
n時,若樣本均值x
確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Delphi編程技巧總結(jié)與實踐2025年考試題及答案
- 2025年MySQL數(shù)據(jù)庫設計原則試題及答案
- 企業(yè)財務成本管理的生命周期分析試題及答案
- 2025年凍煮扇貝肉項目市場調(diào)查研究報告
- C++模塊與包管理的試題及答案
- 2025年公共考試重點試題及答案清單
- 適用范圍廣的2025年MSOffice試題及答案
- 計算機一級WPS項目管理工具試題及答案
- 自我價值的實現(xiàn)2023年高考作文試題及答案
- 計算機二級Delphi達成計劃試題及答案
- 公司級新員工安全培訓課件
- 折彎工藝培訓
- 2025-2030年煤炭貿(mào)易產(chǎn)業(yè)發(fā)展分析及發(fā)展趨勢與投資前景預測報告
- 行政管理??乒舶踩芾碓囶}及答案
- 高碳鉻鐵生產(chǎn)流程
- 口腔醫(yī)院前臺服務培訓標準
- 搬運卸貨合同協(xié)議書
- 學?!靶@餐”專項整治推進工作情況匯報范文
- 2024年撫順市三支一扶考試真題
- 換藥術(shù)課件完整版本
- 北師大版二年級數(shù)學下冊全冊10套試卷(附答案)
評論
0/150
提交評論