管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析_第1頁(yè)
管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析_第2頁(yè)
管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析_第3頁(yè)
管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析_第4頁(yè)
管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析_第5頁(yè)
已閱讀5頁(yè),還剩109頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

管理統(tǒng)計(jì)學(xué)第2章-樣本數(shù)據(jù)特征初步分析第一頁(yè),共114頁(yè)。2.1樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:

頻次與頻率數(shù)據(jù)集合的最基本的結(jié)構(gòu)特征:頻次與頻率主要方法:表格法、條形圖和餅圖法第二頁(yè),共114頁(yè)。2.1.1頻次與頻率的基本概念頻次:在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值(樣本值)出現(xiàn)的次數(shù)。某樣本值的頻率=該樣本值出現(xiàn)的頻次/該數(shù)據(jù)集合的數(shù)據(jù)總數(shù)第三頁(yè),共114頁(yè)。第四頁(yè),共114頁(yè)。第五頁(yè),共114頁(yè)。,使列出來(lái)的價(jià)格數(shù)據(jù)看得更清楚些。第六頁(yè),共114頁(yè)。例2.1.2在對(duì)某小區(qū)的家庭家具的抽樣調(diào)查后,得到客戶家具的基色調(diào)的數(shù)據(jù):本例中數(shù)據(jù)是名義級(jí)的,它們自身不存在大小排序的問(wèn)題。第七頁(yè),共114頁(yè)。大致可看清楚樣本數(shù)據(jù)(家具基色調(diào))結(jié)構(gòu)的特點(diǎn)第八頁(yè),共114頁(yè)。例:抽樣調(diào)查某單位16人的受教育程度的數(shù)據(jù)小學(xué),大學(xué),大學(xué),初中,高中,碩士,大學(xué),大學(xué),高中,大學(xué),大學(xué),初中,大學(xué),碩士,大學(xué)按照受教育程度排序,統(tǒng)計(jì)出各個(gè)樣本值出現(xiàn)的頻次和頻率受教育程度小學(xué)初中高中大學(xué)碩士合計(jì)各個(gè)受教育程度出現(xiàn)的頻次1229216各個(gè)受教育程度出現(xiàn)的頻率6.2512.512.556.2512.5100可以較為清楚地看到“受教育程度”樣本數(shù)據(jù)集合的結(jié)構(gòu)特征。第九頁(yè),共114頁(yè)。2.1.2觀察樣本數(shù)據(jù)基本特征(頻次與頻率)的圖形方法餅圖表示頻次與頻度適用于所有測(cè)度等級(jí)的數(shù)據(jù)。但要求不同樣本值的個(gè)數(shù)(不重復(fù)的樣本值個(gè)數(shù))不能很多。表示頻度與頻次的餅圖繪制的方法:(1)畫一個(gè)大小適當(dāng)?shù)膱A圈,給每一個(gè)不同的樣本值一個(gè)與其頻次(頻率)相當(dāng)?shù)膱A心角,就像切割的一塊餅。(2)每個(gè)不同的樣本值所占據(jù)的圓心角的大小由下式計(jì)算:第十頁(yè),共114頁(yè)。第十一頁(yè),共114頁(yè)。第十二頁(yè),共114頁(yè)。條形圖適用于不重復(fù)的樣本值的個(gè)數(shù)不多的情況。第十三頁(yè),共114頁(yè)。第十四頁(yè),共114頁(yè)。第十五頁(yè),共114頁(yè)。一般情況,條形圖只適用于順序級(jí)以上的樣本集合。人們也可“強(qiáng)行”抹去橫坐標(biāo)的從左向右的順序概念,“規(guī)定”橫坐標(biāo)沒(méi)有大小之分。第十六頁(yè),共114頁(yè)。2.1.3樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率第十七頁(yè),共114頁(yè)。順序級(jí)以上的樣本數(shù)據(jù)(包括順序級(jí)數(shù)據(jù)),才存在累積頻率。第十八頁(yè),共114頁(yè)。例的樣本數(shù)據(jù)集合的累積概率某單位職工受教育程度≤xi的累積頻率受教育程度xi小學(xué)初中高中大學(xué)碩士合計(jì)各個(gè)受教育程度出現(xiàn)的頻率(%)6.2512.512.556.2512.5100教育程度≤xi的累積頻率(%)第十九頁(yè),共114頁(yè)。例的樣本數(shù)據(jù)集合的累積概率某單位職工受教育程度≤xi的累積頻率受教育程度xi小學(xué)初中高中大學(xué)碩士合計(jì)各個(gè)受教育程度出現(xiàn)的頻率(%)6.2512.512.556.2512.5100教育程度≤xi的累積頻率(%)6.2518.7531.2587.5100第二十頁(yè),共114頁(yè)。第二十一頁(yè),共114頁(yè)。2.2觀察刻度級(jí)樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法2.2.1莖葉圖的概念與作法第二十二頁(yè),共114頁(yè)。莖葉圖適用于刻度級(jí)的樣本數(shù)據(jù)的頻率結(jié)構(gòu)。不適用名義級(jí)。順序級(jí)的樣本數(shù)據(jù)本質(zhì)上是半定量的。也可使用莖葉圖。最好使用條形圖。如果對(duì)某個(gè)樣本數(shù)據(jù)集合規(guī)定,所有的樣本值的百位數(shù)為“莖節(jié)”(莖節(jié)的寬度為100),所有的十位數(shù)和個(gè)位數(shù)為“葉”。2.2觀察刻度級(jí)樣本數(shù)據(jù)結(jié)構(gòu)的

莖葉圖與直方圖方法2.2.1莖葉圖的概念與作法第二十三頁(yè),共114頁(yè)。樣本值=“莖節(jié).葉”表達(dá)ד莖節(jié)”的寬度一個(gè)樣本數(shù)據(jù)集合中的所有不相同的莖節(jié),從小到大連接起來(lái),構(gòu)成了樣本數(shù)據(jù)的”莖“。確定”莖“的位數(shù)基本依據(jù)是樣本數(shù)據(jù)的分布范圍。莖節(jié)的寬度,就是莖的寬度。確定”莖節(jié)”的寬度的原則:樣本數(shù)據(jù)集合中的”莖節(jié)“必須是有變化的。第二十四頁(yè),共114頁(yè)。(1)依據(jù)樣本數(shù)據(jù)集合中數(shù)字的大小范圍,確定”莖“的數(shù)字位和”葉“的數(shù)字位;(2)把樣本數(shù)據(jù)集合中的所有的樣本數(shù)據(jù),分成”莖節(jié)“、”葉“兩部分;(3)把樣本數(shù)據(jù)集合中的所有的”莖節(jié)“,從小到大,從上到下縱向排列,并在”莖節(jié)“后標(biāo)出小數(shù)點(diǎn),小數(shù)點(diǎn)要縱向?qū)R;(4)按照”莖節(jié)“的從小到大的順序,依次把樣本數(shù)據(jù)集合中的所有”莖節(jié)“相同的數(shù)據(jù)取出來(lái),把這些數(shù)據(jù)的”葉“,按照從小到大的順序,寫在這個(gè)”莖節(jié)“后小數(shù)點(diǎn)的右邊,從左到右橫向排列,直至把樣本數(shù)據(jù)集合中的所有數(shù)據(jù)處理完。2.莖葉圖的作法第二十五頁(yè),共114頁(yè)。第二十六頁(yè),共114頁(yè)。第二十七頁(yè),共114頁(yè)。常見(jiàn)的細(xì)分莖節(jié)的方法之一,是把莖節(jié)分成兩個(gè)子莖節(jié),也就是把該“莖節(jié)”右側(cè)的“葉”,處于0-4的,歸為“L”子莖節(jié)(低段子莖節(jié));“葉”的數(shù)字處于“5-9”的,歸為“H”子莖節(jié)(高段子莖節(jié))。第二十八頁(yè),共114頁(yè)。例如:可把每個(gè)“莖節(jié)”分解成相等的5個(gè)“子莖節(jié)”,即每個(gè)“子莖節(jié)”所覆蓋的“葉”的依次為0-1,2-3,4-5,6-7,8-9.這樣,每個(gè)子莖節(jié)的長(zhǎng)度,就是原來(lái)每個(gè)莖節(jié)長(zhǎng)度的1/5。莖節(jié)長(zhǎng)度的概念:莖葉圖中,每個(gè)“莖節(jié)”所允許覆蓋的“葉”的數(shù)字范圍。莖節(jié)長(zhǎng)度=允許覆蓋最大值-允許覆蓋最小值+1第二十九頁(yè),共114頁(yè)。練習(xí)1:某籃球運(yùn)動(dòng)員在某賽季各場(chǎng)得分情況如下:

12,15,24,25,31,31,36,36,37,39,44,49,50.試分析該運(yùn)動(dòng)員的整體水平及發(fā)揮的穩(wěn)定程度?

第三十頁(yè),共114頁(yè)。解:上述運(yùn)動(dòng)員的得分可用下面莖葉圖來(lái)表示。頻次莖

葉21.2522.4563.11667924.4915.0

結(jié)論:該運(yùn)動(dòng)員平均得分在30到40之間,且分布較對(duì)稱,集中程度高,說(shuō)明其發(fā)揮比較穩(wěn)定。

第三十一頁(yè),共114頁(yè)。練習(xí)2某賽季,兩籃球運(yùn)動(dòng)員本賽季每場(chǎng)比賽的得分如下,試比較這兩位運(yùn)動(dòng)員的得分水平。

甲:9,17,18,25,28,32,35,36,37,36,32,40,50.

乙:11,9,13,16,22,23,22,24,32,33,38,41,52.

第三十二頁(yè),共114頁(yè)。解:畫出甲、乙兩人得分的莖葉圖,為便于對(duì)比分析,可將莖放在中間共用,葉分列左、右兩側(cè)。

葉莖葉9.0.078.1.13658.2.2234225667.3.2380.4.10.5.2

甲運(yùn)動(dòng)員的得分大致對(duì)稱,平均得分30多分;乙運(yùn)動(dòng)員的得分也大致對(duì)稱,平均得分是20多分。但甲運(yùn)動(dòng)員總體得分情況比乙好。第三十三頁(yè),共114頁(yè)。從全年級(jí)的兩個(gè)班考試成績(jī)中每班任意抽取20名的數(shù)學(xué)成績(jī)?nèi)缦拢偡?50分)甲班:12011813513414014610811098981421261081129510314892121132乙班:1281241479612611712512912013413212197104114135127124115107試用莖葉圖分析,哪個(gè)班成績(jī)比較穩(wěn)定。第三十四頁(yè),共114頁(yè)。解:畫出甲、乙兩班成績(jī)的莖葉圖。

葉莖葉2588.9.67388.10.47028.11.457016.12.014456789245.13.2450268.14.7甲班成績(jī)波動(dòng)較大,乙班成績(jī)總體集中在120-130分之間,且分布大致對(duì)稱,因此乙班成績(jī)比較穩(wěn)定,總體情況比甲班好。第三十五頁(yè),共114頁(yè)。總結(jié):(莖葉圖的特征)1.用莖葉圖刻畫數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有的信息都可以從這個(gè)莖葉圖中得到;二是莖葉圖便于記錄和表示。2.但莖葉圖表示三位數(shù)以上的數(shù)據(jù)時(shí)不夠方便。第三十六頁(yè),共114頁(yè)。2.2.2直方圖的概念與作法第三十七頁(yè),共114頁(yè)。這就是直方圖。區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7,起點(diǎn)為160,終點(diǎn)為195。162.5167.5172.5177.5182.5187.5192.5身高(厘米)第三十八頁(yè),共114頁(yè)。2.直方圖的基本作法:(1)按照樣本值的大小,選擇恰當(dāng)?shù)膮^(qū)間長(zhǎng)度(通常要求區(qū)間是等長(zhǎng)度的),對(duì)所有的樣本值分組;(2)統(tǒng)計(jì)所有組(區(qū)間)內(nèi)的樣本值的頻次或頻率;(3)用橫坐標(biāo),按照順序表示不同的區(qū)間(組),用豎立于區(qū)間上的矩形條,表示相應(yīng)區(qū)間的樣本值的頻次或頻率。第三十九頁(yè),共114頁(yè)。3.直方圖的使用范圍當(dāng)刻度級(jí)樣本數(shù)據(jù)很多或者精度相對(duì)高,使得數(shù)據(jù)集合中重復(fù)出現(xiàn)的樣本值過(guò)少時(shí),就需要對(duì)數(shù)據(jù)分組,用直方圖觀察不同組數(shù)據(jù)的頻次與頻率。第四十頁(yè),共114頁(yè)。4.直方圖與條形圖的區(qū)別直方圖要對(duì)數(shù)據(jù)分組;而條形圖不對(duì)數(shù)據(jù)分組,直接統(tǒng)計(jì)不同樣本值的重復(fù)次數(shù)。直方圖適用于大量不重復(fù)樣本值的數(shù)據(jù)集合;條形圖適用于不重復(fù)的樣本值的個(gè)數(shù)不多的情況。直方圖只適用于刻度級(jí)的樣本數(shù)據(jù);條形圖主要適用于順序級(jí)以上的樣本數(shù)據(jù)。第四十一頁(yè),共114頁(yè)。5.直方圖的具體作法(1)數(shù)據(jù)分組數(shù)據(jù)分組,一般采取等區(qū)間長(zhǎng)度的原則。數(shù)據(jù)分組,一般先確定區(qū)間長(zhǎng)度,然后按下式確定組的個(gè)數(shù):式中,R表示用四舍五入法,把括號(hào)中的數(shù)據(jù)表達(dá)為整數(shù)。第四十二頁(yè),共114頁(yè)。直方圖分組組數(shù)選用表(通常)樣本量推薦組數(shù)50~1006~10101~2507~12250以上10~20第四十三頁(yè),共114頁(yè)。(2)確定分組區(qū)間長(zhǎng)度確定分組區(qū)間長(zhǎng)度的過(guò)程以某個(gè)量綱單位為初始區(qū)間長(zhǎng)度(d)區(qū)間個(gè)數(shù)合適?區(qū)間長(zhǎng)度減半,為初始區(qū)間長(zhǎng)度的0.5區(qū)間個(gè)數(shù)還少?新的區(qū)間長(zhǎng)度為初始區(qū)間長(zhǎng)度的0.25,或0.2區(qū)間個(gè)數(shù)還少?結(jié)束新區(qū)間長(zhǎng)度=d×10新區(qū)間長(zhǎng)度=d/10不少少了多了少還少不少合適第四十四頁(yè),共114頁(yè)。討論例的數(shù)據(jù)分組的區(qū)間長(zhǎng)度問(wèn)題。首先,確定區(qū)間長(zhǎng)度的量綱。定為“米”or”分米“or”厘米“?分米(即10厘米)組的個(gè)數(shù)=R((190-160)/10)+1=4組太少,區(qū)間長(zhǎng)度減半組的個(gè)數(shù)=R((190-160)/5)+1=7確定出:分組的區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7。第四十五頁(yè),共114頁(yè)。(3)確定分組區(qū)間起點(diǎn)位置的方法確定第一個(gè)區(qū)間(最左邊的區(qū)間)起點(diǎn)位置的方法①取出樣本數(shù)據(jù)集合中的最小數(shù)據(jù)(量綱為確定區(qū)間長(zhǎng)度時(shí)所選定的量綱),記為y1。例如在中,y1=16(分米)第四十六頁(yè),共114頁(yè)。②確定備選的第一個(gè)區(qū)間起點(diǎn)的位置:a.當(dāng)分組區(qū)間長(zhǎng)度為0.2(某量綱單位)時(shí),備選的第一個(gè)區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0,[y1]+0.2,[y1]+0.4,[y1]+0.6,[y1]+0.8。式中,[y1]表示對(duì)y1取整。例,[16.1]=16,[16.9]=16,等。b.當(dāng)分組區(qū)間長(zhǎng)度為0.25(某量綱單位)時(shí),備選的第一個(gè)區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0,[y1]+0.25,[y1]+0.5,[y1]+0.75。c.當(dāng)分組區(qū)間長(zhǎng)度為0.5(某量綱單位)時(shí),備選的第一個(gè)區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0,[y1]+0.5。d.當(dāng)分組區(qū)間長(zhǎng)度為1(某量綱單位)時(shí),備選的起始區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0。第四十七頁(yè),共114頁(yè)。確定備選的第一個(gè)區(qū)間的起點(diǎn)位置可概括為:備選的x1=[y1]+k×區(qū)間長(zhǎng)度,k=0,1,…,同時(shí),k×區(qū)間長(zhǎng)度<1第四十八頁(yè),共114頁(yè)。③包含最小值在內(nèi),哪個(gè)備選區(qū)間的起點(diǎn)位置x1與y1最近,就確定該位置為第一個(gè)區(qū)間的起始位置。例如的身高數(shù)據(jù)的分組問(wèn)題。已選定分組區(qū)間長(zhǎng)度為0.5分米,而[y1]=16,備選的第一個(gè)區(qū)間的起點(diǎn)坐標(biāo)可能是:[y1]+0=16分米,或者[y1]+0.5=16.5分米。顯然,第一個(gè)坐標(biāo)離y1最近。所以,確定第一個(gè)區(qū)間是[16,16.5)。注意:若某樣本數(shù)據(jù)正好處于兩個(gè)區(qū)間的分界點(diǎn)上,一般應(yīng)把它歸為右邊的區(qū)間。第四十九頁(yè),共114頁(yè)。表2.2.2某班級(jí)男生的身高數(shù)據(jù)排序(單位:分米)16.016.316.516.817.017.117.217.517.517.617.617.717.717.817.818.018.118.218.318.518.619.0表2.2.3某班級(jí)男生的身高數(shù)據(jù)分組組別組1組2組3組4組5組6組7組界[16,16.5)[16.5,17)[17,17.5)[17.5,18)[18,18.5)[18.5,19)[19,19.5)身高16.0,16.316.5,16.817.0,17.1,17.217.5,17.6,17.7,17.818.0,18.1,18.2,18.318.5,18.619.0頻次111111122221111111組頻次2238421第五十頁(yè),共114頁(yè)。直方圖中的一些概念組中值:區(qū)間中心位置的坐標(biāo)x。x=(組上界+組下界)/2組頻次:組內(nèi)數(shù)據(jù)出現(xiàn)的次數(shù)。組距:組區(qū)間的長(zhǎng)度。組頻率:組頻次/樣本數(shù)據(jù)集合中的樣本個(gè)數(shù)。頻次直方圖(頻數(shù)直方圖):縱坐標(biāo)表示頻次(頻數(shù))的直方圖。頻率直方圖:縱坐標(biāo)表示頻率的直方圖。第五十一頁(yè),共114頁(yè)。(4)繪制直方圖在橫坐標(biāo)上,從小到大,依次標(biāo)出分組區(qū)間的邊界;在縱軸方向,按照各個(gè)區(qū)間的組頻次或組頻率的大小,繪制不同高度的矩形。第五十二頁(yè),共114頁(yè)。區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7,起點(diǎn)為160,終點(diǎn)為195。男生身高頻次直方圖162.5167.5172.5177.5182.5187.5192.5身高(厘米)第五十三頁(yè),共114頁(yè)。練習(xí):某中學(xué)為了了解本校學(xué)生的身體發(fā)育情況,對(duì)同年齡的40名女生的身高進(jìn)行了測(cè)量,結(jié)果如下(數(shù)據(jù)均為整數(shù),單位:cm):168,160,157,161,158,153,158,164,158,163,158,157,167,154,159,166,159,156,162,158,159,160,164,164,170,163,162,154,151,146,151,160,165,158,149,157,162,159,165,157.請(qǐng)對(duì)上述數(shù)據(jù)分組,確定出數(shù)據(jù)的分組個(gè)數(shù)、組距、分組區(qū)間起點(diǎn)位置,畫出頻次直方圖。并根據(jù)所畫的直方圖說(shuō)明:大部分同學(xué)處于哪個(gè)身高段?身高的整體分布情況如何?第五十四頁(yè),共114頁(yè)。解:(1)根據(jù)題意,選定初始區(qū)間長(zhǎng)度為10cm。數(shù)據(jù)中最小的為146cm,最大的為170cm。則,組的個(gè)數(shù)=R((170-146)/10)+1=3,組數(shù)少,區(qū)間長(zhǎng)度減半,則,組的個(gè)數(shù)=R((170-146)/5)+1=6,組數(shù)合適,由此,確定出區(qū)間長(zhǎng)度為5cm,組的個(gè)數(shù)為6組。(2)確定起始區(qū)間位置由題意知,[y1]=14,備選的第一個(gè)區(qū)間起始坐標(biāo)可能是:[y1]=14,[y1]+0.5=14.5。由此可確定第一個(gè)區(qū)間是[14.5,15)。第五十五頁(yè),共114頁(yè)。女生身高的數(shù)據(jù)分組組別組1組2組3組4組5組6組界[14.5,15)[15,15.5)[15.5,16)[16,16.5)[16.5,17)[17,17.5)身高14.6,14.915.1,15.3,15.415.6,15.7,15.8,15.916.0,16.1,16.2,16.3,16.416.5,16.6,16.7,16.817.0頻次1121214643132321111組頻次25151251第五十六頁(yè),共114頁(yè)。女生身高直方圖大部分學(xué)生處于155cm到165cm之間,占抽查人數(shù)的67.5%,低于155cm和高于165cm的學(xué)生比較少,分別占17.5%和15%,學(xué)生身高分布大致成正態(tài)分布。第五十七頁(yè),共114頁(yè)。2.3樣本數(shù)據(jù)的位置特征:對(duì)數(shù)據(jù)中心的描述樣本數(shù)據(jù)集合的另一個(gè)重要特征,就是樣本數(shù)據(jù)集合中心所處的位置,它在一定程度上反映了樣本數(shù)據(jù)集合的位置。第五十八頁(yè),共114頁(yè)。2.3.1樣本眾數(shù)單一眾數(shù):一個(gè)樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的樣本值只有一個(gè),簡(jiǎn)稱為該樣本數(shù)據(jù)集合的(樣本)眾數(shù)。復(fù)眾數(shù):在一個(gè)樣本數(shù)據(jù)集合中,有多個(gè)“出現(xiàn)頻次最高的數(shù)據(jù)”。無(wú)眾數(shù):一個(gè)樣本數(shù)據(jù)集合中,所有不同的樣本值出現(xiàn)頻次都相同的。第五十九頁(yè),共114頁(yè)。樣本眾數(shù)的例子(1)順序級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖受教育程度小學(xué)初中高中大學(xué)碩士合計(jì)各個(gè)受教育程度出現(xiàn)的頻次1229216各個(gè)受教育程度出現(xiàn)的頻率6.2512.512.556.2512.5100樣本的眾數(shù):“大學(xué)”這個(gè)眾數(shù)可以在一定程度上表示數(shù)據(jù)集合的“位置”第六十頁(yè),共114頁(yè)。第六十一頁(yè),共114頁(yè)。(2)名義級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖樣本的眾數(shù):“Y”這個(gè)眾數(shù)對(duì)樣本數(shù)據(jù)集合的“位置”的表示意義,就比較弱。名義級(jí)的數(shù)據(jù)只有相同與否的區(qū)別,沒(méi)有順序位置的區(qū)別。不同樣本值的位置是可以任意排列的。第六十二頁(yè),共114頁(yè)。第六十三頁(yè),共114頁(yè)。(3)刻度級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖樣本的眾數(shù):9.99,10.00,10.01刻度級(jí)的數(shù)據(jù)當(dāng)不重復(fù)的數(shù)據(jù)大多數(shù)是等距離分開的,并且重復(fù)出現(xiàn)的數(shù)據(jù)較多,適宜用定義1確定眾數(shù)。當(dāng)數(shù)據(jù)集合的數(shù)據(jù)精度高,不重復(fù)的數(shù)據(jù)量非常大,不適宜用定義1確定眾數(shù)。第六十四頁(yè),共114頁(yè)。樣本眾數(shù)定義2及其例子第六十五頁(yè),共114頁(yè)。通過(guò)條形圖確定眾數(shù),遠(yuǎn)沒(méi)有直方圖更能反映數(shù)據(jù)集合的特征。第六十六頁(yè),共114頁(yè)。如:眾數(shù)。第六十七頁(yè),共114頁(yè)。2.3.2樣本中位數(shù)在對(duì)樣本數(shù)據(jù)集合中的所有數(shù)據(jù)排序后,樣本中位數(shù)Me由下式確定:第六十八頁(yè),共114頁(yè)。當(dāng)樣本個(gè)數(shù)為奇數(shù)時(shí),樣本中位數(shù)適用于順序級(jí)以上的數(shù)據(jù)集合;當(dāng)樣本個(gè)數(shù)為偶數(shù)時(shí),樣本中位數(shù)僅適用于刻度級(jí)的數(shù)據(jù)集合(順序級(jí)的數(shù)據(jù)不能做加減)。分奇偶個(gè)數(shù)第六十九頁(yè),共114頁(yè)。2.3.3樣本均值第七十頁(yè),共114頁(yè)。2.4樣本數(shù)據(jù)的離散特征一、點(diǎn)狀描述二、區(qū)間描述第七十一頁(yè),共114頁(yè)。2.4.1對(duì)樣本數(shù)據(jù)離散特征的點(diǎn)狀描述:極值、四分點(diǎn)與百分位點(diǎn)適用于順序級(jí)以上的數(shù)據(jù)。極大值是數(shù)據(jù)集合中的最大值,極小值是數(shù)據(jù)集合中的最小值。第七十二頁(yè),共114頁(yè)。2.4.1對(duì)樣本數(shù)據(jù)離散特征的點(diǎn)狀描述:極值、四分點(diǎn)與百分位點(diǎn)中位數(shù)所在的“正中間位置”,把排序后的樣本數(shù)據(jù)集合分成左右兩部分,使左右兩部分包含的樣本數(shù)據(jù)的個(gè)數(shù)相等,即都包含50%的樣本總數(shù)。第七十三頁(yè),共114頁(yè)。該位置的左邊,有n×0.25個(gè)數(shù)據(jù),占總數(shù)的25%。該位置的左邊,有n×0.5個(gè)數(shù)據(jù),占總數(shù)的50%。該位置的左邊,有n×0.75個(gè)數(shù)據(jù),占總數(shù)的75%。第七十四頁(yè),共114頁(yè)。當(dāng)Q1、Q2、Q3的位置為整數(shù)時(shí),相應(yīng)整數(shù)位置上的樣本值,就是Q1、Q2、Q3的值。當(dāng)Q1、Q2、Q3的位置不為整數(shù)時(shí)Q2=Q2位置左邊的樣本值+(Q2位置右邊的樣本值-Q2位置左邊的樣本值)×Q2位置的小數(shù)部分第七十五頁(yè),共114頁(yè)。Q2=Q2位置左邊的樣本值+(Q2位置右邊的樣本值-Q2位置左邊的樣本值)×{(n+1)×0.5-[(n+1)×0.5]}第七十六頁(yè),共114頁(yè)。第七十七頁(yè),共114頁(yè)。第七十八頁(yè),共114頁(yè)。練習(xí)1下面的數(shù)據(jù)是某一天20位工人收割麻黃草的數(shù)量7.04.85.06.84.83.75.83.64.05.93.93.45.12.74.47.05.62.64.85.61.求收獲量的上四分位數(shù)值和下四分位數(shù)值。2.求中位數(shù)值。第七十九頁(yè),共114頁(yè)。2.62.73.43.63.73.94.04.44.84.84.85.05.15.65.65.85.96.87.07.0解:(1)對(duì)數(shù)據(jù)從小到大排序,結(jié)果示于下表。第八十頁(yè),共114頁(yè)。(2)設(shè)Q1為下四分點(diǎn)、Q3為上四分點(diǎn)、Q2為中位數(shù)。計(jì)算Q1,Q2,Q3的位置。由題意知,n=20,則:Q1的位置=(n+1)×0.25=(20+1)×0.25=5.25Q2的位置=(n+1)×0.5=(20+1)×0.5=10.5Q3的位置=(n+1)×0.75=(20+1)×0.75=15.75(3)計(jì)算Q1,Q2,Q3的值Q1=3.7+(3.9-3.7)×0.25=3.75Q2=4.8+(4.8-4.8)×0.5=4.8Q3=5.6+(5.8-5.6)×0.75=5.75第八十一頁(yè),共114頁(yè)。練習(xí)2如果計(jì)算出下四分點(diǎn)在數(shù)據(jù)13.6與數(shù)據(jù)15之間,且下四分點(diǎn)的位置是12.75,求下四分點(diǎn)的值。第八十二頁(yè),共114頁(yè)。解:設(shè)Q1為下四分點(diǎn),根據(jù)Q1=Q1位置左邊的樣本值+(Q1位置右邊的樣本值-Q1位置左邊的樣本值)×Q1位置的小數(shù)部分可得,Q1=13.6+(15-13.6)×0.75=14.65第八十三頁(yè),共114頁(yè)。上下百分位點(diǎn)1)下百分點(diǎn):把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左邊部分包含10%的樣本總個(gè)數(shù),右邊部分包含90%的樣本總個(gè)數(shù)。2)上百分點(diǎn):把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左邊部分包含90%的樣本總個(gè)數(shù),右邊部分包含10%的樣本總個(gè)數(shù)。上、下百分點(diǎn)也在一定意義上反映了樣本數(shù)據(jù)的離散情況。第八十四頁(yè),共114頁(yè)。2.4.2對(duì)樣本數(shù)據(jù)離散特征的區(qū)間

描述:極差、四分位距與離差第八十五頁(yè),共114頁(yè)。第八十六頁(yè),共114頁(yè)。2.4.3離散狀況的統(tǒng)計(jì)值描述:

樣本方差樣本方差:樣本標(biāo)準(zhǔn)差:第八十七頁(yè),共114頁(yè)。數(shù)據(jù)特征的度量指標(biāo)樣本數(shù)據(jù)集中趨勢(shì)的三種度量指標(biāo):眾數(shù)、中位數(shù)、均值樣本數(shù)據(jù)離散趨勢(shì)的三種區(qū)間描述度量指標(biāo):極差、四分位距、方差(標(biāo)準(zhǔn)差)第八十八頁(yè),共114頁(yè)。練習(xí)1.從學(xué)院學(xué)生中隨機(jī)地挑選15名學(xué)生,問(wèn)到他們昨晚睡眠的小時(shí)數(shù)。得到的樣本數(shù)據(jù)是:5,6,6,8,7,7,9,5,4,8,11,6,7,8,7。求出以下各值:a.均值b.中位數(shù)c.眾數(shù)d.方差e.標(biāo)準(zhǔn)差第八十九頁(yè),共114頁(yè)。4556667777888911解:對(duì)上述數(shù)據(jù)排序后,如表所示。

=(4+5×2+6×3+7×4+8×3+9+11)/15=6.93Me=x8=7眾數(shù)是7S=1.75第九十頁(yè),共114頁(yè)。2.以下是一組兒童首次牙科檢查的年齡的樣本:首次牙科檢查的年齡x:12345兒童的數(shù)目f:911231621a.求對(duì)這些兒童首次牙科檢查年齡的均值。b.求中位數(shù)年齡。c.求標(biāo)準(zhǔn)差。第九十一頁(yè),共114頁(yè)。解:由題意可知,n=9+11+23+16+21=80,根據(jù)

Me=(x40+x41)/2=(3+3)/2=3第九十二頁(yè),共114頁(yè)。2.5樣本數(shù)據(jù)特征的綜合表達(dá):

箱形圖2.5.1箱形圖的基本構(gòu)造第九十三頁(yè),共114頁(yè)。箱形圖的繪制步驟1. 將樣本數(shù)據(jù)值由小到大的順序排列。2. 求出中位數(shù)Me。3. 求Q1和Q3。4. 將Q1,Me及Q3,繪成一長(zhǎng)方形。5.找出樣本數(shù)據(jù)中的極小、極大值,畫出左、右胡須。

第九十四頁(yè),共114頁(yè)。當(dāng)胡須特別長(zhǎng)時(shí)(外圍值的范圍分布很大時(shí)),特別是由于個(gè)別過(guò)大或過(guò)小值出現(xiàn)在樣本數(shù)據(jù)集合中時(shí),需對(duì)箱形圖進(jìn)行修正,來(lái)“剔除”特別大或特別小的數(shù)據(jù)對(duì)箱形圖的影響,從而較為恰當(dāng)?shù)乇磉_(dá)樣本數(shù)據(jù)集合的基本特征。3.5.2修正的箱形圖第九十五頁(yè),共114頁(yè)。回到上頁(yè)第九十六頁(yè),共114頁(yè)。第九十七頁(yè),共114頁(yè)。修正箱形圖中的一些概念外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)的樣本值。近外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)、但小于3倍的四分位距(3Iqr)的樣本值。遠(yuǎn)外圍值(極端值):處在胡須上的、離箱體的距離大于3倍的四分位距(3Iqr)的樣本值。第九十八頁(yè),共114頁(yè)。修正箱形圖的繪制步驟1. 將樣本數(shù)據(jù)值由小到大的順序排列。2. 求出中位數(shù)Me。3. 求Q1和Q3。4. 求四分位距Iqr,“非外圍值”上邊界Q3+1.5Iqr,“非外圍值”下邊界Q1-1.5Iqr。5.將Q1,Me及Q3,繪成一長(zhǎng)方形。6.找出樣本數(shù)據(jù)中“非外圍值”范圍內(nèi)的最小值、最大值,畫出左、右胡須。第九十九頁(yè),共114頁(yè)。修正箱形圖的主要作用可了解數(shù)據(jù)分布,是否為對(duì)稱性;可清楚指出中位數(shù)的位置;可判斷數(shù)據(jù)有無(wú)離群值(奇異值)存在。第一百頁(yè),共114頁(yè)。2.5.3箱形圖示例1.例身高數(shù)據(jù)的箱形圖表2.5.2某班級(jí)男生的身高數(shù)據(jù)排序(單位:厘米)160163165168170171172175175176176177177178178180181182183185186190表2.5.1某班級(jí)男生的身高數(shù)據(jù)(單位:厘米)171182175177178181185168170175177180176172165160178186190176163183第一百零一頁(yè),共114頁(yè)。由表知,n=22,極大值為190cm,極小值為160cm。中位數(shù)的位置=(n+1)×0.5=23×0.5=11.5Me=Q2=176+(177-176)×0.5=176.5Q1的位置=(n+1)×0.25=23×0.25=5.75Q1=170+(171-170)×0.75=170.75Q3的位置=(n+1)×0.75=23×0.75=17.25Q3=181+(182-181)×0.25=181.25第一百零二頁(yè),共114頁(yè)。由圖可知,箱形圖上箱體短、上胡須短,所以,數(shù)據(jù)向高端傾斜。例箱形圖第一百零三頁(yè),共114頁(yè)。2.假設(shè)在例中,該班級(jí)轉(zhuǎn)來(lái)1名身高213厘米的巨人,則該班級(jí)男生的身高數(shù)據(jù)如表所示。畫出此時(shí)的箱形圖。表2.5.4某班級(jí)男生的身高數(shù)據(jù)排序(單位:厘米)160163165168170171172175175176176177177178178180181182183185186190213表2.5.3某班級(jí)男生的身高數(shù)據(jù)(單位:厘米)171182175177178181185168170175177180176172165160178186190176163183213第一百零四頁(yè),共114頁(yè)。由表知,n=23。中位數(shù)的位置=(n+1)×0.5=24×0.5=12Me=Q2=177Q1的位置=(n+1)×0.25=24×0.25=6Q1=171Q3的位置=(n+1)×0.75=24×0.75=18Q3=182四分位距Iqr=182-171=11由此可知,“非外圍值”的上邊界為:182+11×1.5=198.5,下邊界為:171-11×1.5=154.5在“非外圍值”的上下邊界內(nèi),數(shù)據(jù)集合的最小值為160,最大值為190。第一百零五頁(yè),共114頁(yè)。例修正箱形圖由圖可知,除去“外圍值”213cm外,修正箱形圖上箱體短、上胡須短,所以,數(shù)據(jù)向高端傾斜。離群值第一百零六頁(yè),共114頁(yè)。例:下面給出某醫(yī)院21個(gè)病人的住院時(shí)間(以天計(jì)),試畫出修正箱型圖12334456677991012121315182355以下是22個(gè)病人的血壓(收縮壓,mmHg)數(shù)據(jù)已排序,試畫出箱型圖。102110140142147117118122123132150142146148147129132137142145147138第一百零七頁(yè),共114頁(yè)。箱形圖給出了一個(gè)數(shù)據(jù)集合的哪些量?(A)極小值、極大值(B)極差、中位數(shù)(C)上四分點(diǎn)、下四分點(diǎn)(D)四分位距√√√√第一百零八頁(yè),共114頁(yè)。試述以下基本概念:1.總體(或母體),個(gè)體,變量(或指標(biāo)),變量值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論