總體取值規(guī)律的估計_第1頁
總體取值規(guī)律的估計_第2頁
總體取值規(guī)律的估計_第3頁
總體取值規(guī)律的估計_第4頁
總體取值規(guī)律的估計_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

9.2用樣本估計總體9.2.1總體取值規(guī)律的估計一個統(tǒng)計小故事的啟示新課引入一個統(tǒng)計小故事的啟示這位統(tǒng)計學(xué)家在分析問題的時候,能夠做到不被表面現(xiàn)象所迷惑,在獲取數(shù)據(jù)之后,擇合適的工具對數(shù)據(jù)進行整理和直觀描述,在此基礎(chǔ)上,通過數(shù)據(jù)分析,找出數(shù)據(jù)蘊含的信息,進而得到了正確的統(tǒng)計分析結(jié)果。新課引入收集數(shù)據(jù)是為了尋找數(shù)據(jù)中蘊含的信息,因為實際問題中數(shù)據(jù)多而且雜亂,往往無法直接從原始數(shù)據(jù)中發(fā)現(xiàn)規(guī)律所以需要根據(jù)問題的背景特點,選擇合適的統(tǒng)計圖表對數(shù)據(jù)進行整理和直觀描述,在此基礎(chǔ)上,通過數(shù)據(jù)分析,找出數(shù)據(jù)中蘊含的信息,就可以用這些信息來解決實際問題了下面我們討論對隨機抽樣獲取的數(shù)據(jù)的處理方法.1.隨機抽樣有哪幾種基本的抽樣方法?簡單隨機抽樣、分層抽樣.溫故知新

前面研究學(xué)習(xí)了兩種抽樣方法來收集數(shù)據(jù),還知道了一些常見的獲取數(shù)據(jù)的途徑,數(shù)據(jù)收集后,必須從中尋找包含的信息,以使我們能通過樣本的規(guī)律估計總體的規(guī)律,解決相應(yīng)的實際問題。但由于數(shù)據(jù)多而雜,所以需要通過一定的方法去處理數(shù)據(jù)??梢酝ㄟ^表、圖、計算方法來分析數(shù)據(jù),進而對總體做出相應(yīng)的估計。學(xué)習(xí)新知問題1我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出,某市政府為了減少水資源的浪費,計劃對居民生活用水費用實施階梯式水價制度,即確定一戶居民月均用水量標準a,用水量不超過a的部分按平價收費,超出a的部分按議價收費.如果希望確定一個比較合理的標準,以使大部分居民用戶的水費支出不受影響,你認為需要做哪些工作?假設(shè)通過簡單隨機抽樣,獲得了100戶居民用戶的月均用水量數(shù)據(jù)(單位:1):學(xué)習(xí)新知9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.422.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6從這組數(shù)據(jù)你能發(fā)現(xiàn)什么信息呢?如果將這組數(shù)據(jù)從小到大排序,容易發(fā)現(xiàn),這組數(shù)據(jù)的最小值是1.3t,最大值是28.0t,其他在1.3t至28.0t之間.學(xué)習(xí)新知

我們曾用頻數(shù)分布表和頻數(shù)分布圖來整理和表示這種數(shù)值型數(shù)據(jù),由此能使我們清楚地知道數(shù)據(jù)分布在各個小組的個數(shù).

在這個實際問題中,因為我們更關(guān)心月均用水量在不同范圍內(nèi)的居民用戶占全市居民用戶的比例,所以選擇頻率分布表(frequencydistributiontable)和頻率分布直方圖(frequencydistributionhistogram)來整理和表示數(shù)據(jù),與畫頻數(shù)分布直方圖類似,我們可以按以下步驟制作頻率分布表、畫頻率分布直方圖學(xué)習(xí)新知1.求極差:

極差為一組數(shù)據(jù)中最大值與最小值的差.樣本觀測數(shù)據(jù)的最小值是1.3t,最大值是28.0t,極差為28.0-1.3=26.7這說明樣本觀測數(shù)據(jù)的變化范圍是26.7t.學(xué)習(xí)新知2.決定組距與組數(shù):合適的組距與組數(shù)對發(fā)現(xiàn)數(shù)據(jù)分布規(guī)律有重要意義.數(shù)太多或太少,都會影響我們了解數(shù)據(jù)的分布情況.數(shù)據(jù)分組可以是等距的,也可以是不等距的,要根據(jù)數(shù)據(jù)的特點而定。有時為了方便,往往按等距分組,或者除了第一和最后的兩段,其余各段按等距分組組距與與組數(shù)的確定沒有固定的標準.數(shù)據(jù)分組的組數(shù)與數(shù)據(jù)的個數(shù)有關(guān),一般數(shù)據(jù)的個數(shù)越多,所分組數(shù)也越多,當(dāng)樣本容量不超過100時,常分成5~12組.為方便起見,一般取等長組距,并且組距應(yīng)力求“取整”分組時可以先確定組距,也可以先確定組數(shù),如果我們?nèi)∷薪M距為3,則學(xué)習(xí)新知學(xué)習(xí)新知3.將數(shù)據(jù)分組:由于組距為3,9個組距的長度超過極差,我們可以使第一組的左端點略小于數(shù)據(jù)中的最小值,最后一組的右端點略大于數(shù)據(jù)中的最大值,例如,可以取區(qū)間為[1.2,28.2],按如下方式把樣本觀測數(shù)據(jù)以組距3分為9組:[1.2,4.2),[4.2,7.2),...,[25.2,28.2].4.列頻率分布表計算各小組的頻率,例如第一小組的頻率作出頻率分布表學(xué)習(xí)新知月均用水量/t0.020.040.060.080.101.24.27.210.213.216.219.222.225.228.200.12頻率/組距學(xué)習(xí)新知5.畫頻率分布直方圖根據(jù)頻率分布表畫出如圖所示的頻率分布直方圖頻率分布直方圖中各小長方形的高度,它反映了各組樣本觀測數(shù)據(jù)的疏密程度樣本數(shù)據(jù)的頻率分布直方圖是根據(jù)頻率分布表畫出來的,一般地,頻率分布直方圖的作圖步驟如何?

第一步,畫平面直角坐標系.第二步,在橫軸上均勻標出各組分點,在縱軸上標出單位長度.第三步,以組距為寬,各組的頻率與組距的商為高,分別畫出各組對應(yīng)的小長方形.學(xué)習(xí)新知學(xué)習(xí)新知頻率分布直方圖與頻數(shù)分布直方圖有什么區(qū)別?通過調(diào)查或?qū)嶒炇占降臄?shù)據(jù)一般數(shù)量較大且無序,為了得到有用的信息,就需要對數(shù)據(jù)進行分類(組)整理,利用統(tǒng)計表(或圖)表示數(shù)據(jù)的特征.數(shù)據(jù)是對客觀現(xiàn)象計量的結(jié)果,按照計量的精確程度可以大致分為兩類.第一類,只能對事物的屬性進行分類.例如,性別分男、女,商品分不同品牌,等級成績分為優(yōu)、良、及格和不及格,民意調(diào)查中對某觀點的態(tài)度分為同意、中立、不同意,視力情況分為正常、輕度近視、中度近視、重度近視等.各類別可以用字母表示或數(shù)字表示,對此類數(shù)據(jù)的整理就是列頻數(shù)分布表,記錄各類別出現(xiàn)的頻數(shù),計算百分比.用條形圖直觀表示各類數(shù)據(jù)的頻數(shù),用扇形圖表示各類數(shù)據(jù)所占的百分比大小.第二類,計量結(jié)果表現(xiàn)為數(shù)值,例如,考試成績,中學(xué)生的身高或體重,居民家庭的收入,居民家庭月用電量等.對這類連續(xù)數(shù)據(jù)的整理需要按數(shù)據(jù)個數(shù)的多少,進行適當(dāng)?shù)姆纸M(不重不漏),統(tǒng)計各組的頻數(shù),計算百分比,用直方圖表示數(shù)據(jù)的分布狀況.學(xué)習(xí)新知

觀察頻率分布表和頻率分布直方圖,你覺得這組數(shù)據(jù)中蘊含了哪些有用的信息?你能從圖表中發(fā)現(xiàn)居民用戶月均用水量的哪些分布規(guī)律?(1)從頻率分布表中可以清楚地看出,樣本觀測數(shù)據(jù)落在各個小組的比例大小,例如,月均用水量在區(qū)間[4.2,7.2)內(nèi)的居民用戶最多,在區(qū)間[1.2,4.2)內(nèi)的次之,而月均用水量超過16.2的各區(qū)間內(nèi)數(shù)據(jù)所占比例較小,等等.學(xué)習(xí)新知

觀察頻率分布表和頻率分布直方圖,你覺得這組數(shù)據(jù)中蘊含了哪些有用的信息?你能從圖表中發(fā)現(xiàn)居民用戶月均用水量的哪些分布規(guī)律?(2)從頻率分布直方圖能直觀的表明數(shù)據(jù)分布的形狀和總體趨勢.從上圖容易看出,居民用戶月均用水量的樣本觀測數(shù)據(jù)的分布是不對稱的,圖形的左邊高、右邊低,右邊有一個較長的“尾巴”,這表明大部分居民用戶的月均用水量集中在一個較低值區(qū)域,尤其在區(qū)間[1.2,7.2)最為集中,少數(shù)居民用戶的月均用水量偏多,而且隨著月均用水量的增加,居民用戶數(shù)呈現(xiàn)降低趨勢.有了樣本觀測數(shù)據(jù)的頻率分布,我們可以用它估計總體的取值規(guī)律學(xué)習(xí)新知

根據(jù)100戶居民用戶的月均用水量的頻率分布,可以推測該市全體居民用戶月均用水量也會有類似的分布,即大部分居民用戶月均用水量集中在較低值區(qū)域.這使我們確定用水量標準時,可以定一個合適的值,以達到既不影響大多數(shù)居民用戶的水費支出,又能節(jié)水的目的.

需要注意的是,由于樣本的隨機性,這種估計可能會存在一定誤差,但這一誤差一般不會影響我們對總體分布情況的大致了解.分別以3和27為組數(shù),對數(shù)據(jù)進行等距分組,畫出100戶居民用戶月均用水量的頻率分市直方圖.觀察圖形,你發(fā)現(xiàn)不同的組數(shù)對于直方圖呈現(xiàn)數(shù)據(jù)分市規(guī)律有什么影響?學(xué)習(xí)新知分別以3和27為組數(shù),對數(shù)據(jù)進行等距分組,畫出100戶居民用戶月均用水量的頻率分市直方圖.觀察圖形,你發(fā)現(xiàn)不同的組數(shù)對于直方圖呈現(xiàn)數(shù)據(jù)分市規(guī)律有什么影響?從圖中可以看出,同一組數(shù)據(jù),組數(shù)不同,得到的直方圖形狀也不盡相同,會給人以不同的頻率分布印象有時會影響人們對總體的判斷當(dāng)頻率分布直方圖的組數(shù)少、組距大時,容易從中看出數(shù)據(jù)整體的分布特點,但由于無法看出每組內(nèi)的數(shù)據(jù)分布情況,損失了較多的原始數(shù)據(jù)信息當(dāng)頻率分布直方圖的組數(shù)多、組距小時,保留了較多的原始數(shù)據(jù)信息,會依賴樣本數(shù)據(jù),穩(wěn)定性差,由于小長方形較多,有時圖形會變得非常不規(guī)則,不容易從中看出總體數(shù)據(jù)的分布特點.學(xué)習(xí)新知

例某地區(qū)為了了解知識分子的年齡結(jié)構(gòu),隨機抽樣50名,其年齡分別如下:

42,38,29,36,41,43,54,43,34,44,

40,59,39,42,44,50,37,44,45,29,

48,45,53,48,37,28,46,50,37,44,

42,39,51,52,62,47,59,46,45,67,

53,49,65,47,54,63,57,43,46,58.(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計年齡在32~52歲的知識分子所占的比例約是多少.典型例題(1)極差為67-28=39,取組距為5,分為8組.

分組頻數(shù)頻率

[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06

合計501.00樣本頻率分布表:(2)樣本頻率分布直方圖:年齡0.060.050.040.030.020.01273237424752576267頻率組距O(3)因為0.06+0.18+0.32+0.14=0.7,故年齡在32~52歲的知識分子約占70%.鞏固練習(xí)鞏固練習(xí)0.030.050.07體重(kg)頻率/組距54.558.562.566.570.574.5鞏固練習(xí)鞏固練習(xí)鞏固練習(xí)鞏固練習(xí)7.為了讓學(xué)生了解環(huán)保知識,增強環(huán)保意識,某中學(xué)舉行了一次“環(huán)保知識競賽”,共有900名學(xué)生參加了這次競賽.為了解本次競賽成績情況,從中抽取了部分學(xué)生的成績(得分均為整數(shù),滿分為100分)進行統(tǒng)計.請你根據(jù)尚未完成的頻率分布表和頻率分布直方圖,解答下列問題:分組頻數(shù)頻率[50.5,60.5)40.08[60.5,70.5)0.16[70.5,80.5)10[80.5,90.5)160.32[90.5,100.5]合計50(1)填充頻率分布表的空格(將答案直接填在表格內(nèi));(2)補全頻率分布直方圖.分組頻數(shù)頻率[50.5,60.5)40.08[60.5,70.5)80.16[70.5,80.5)100.20[80.5,90.5)160.32[90.5,100.5]120.24合計501.00頻率分布直方圖頻率分布表8.對“小康縣”的經(jīng)濟評價標準如下:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某縣有40萬人,調(diào)查數(shù)據(jù)如下:鞏固練習(xí)年人均收入/元)02000400060008000100001200016000人數(shù)/萬人63556753則該縣(

)A.是小康縣B.達到標準①,未達到標準②,不是小康縣C.達到標準②,未達到標準①,不是小康縣D.兩個標準都未達到,不是小康縣B其他的統(tǒng)計圖:扇形圖條形圖折線圖例1:已知某市2015年全年空氣質(zhì)量等級如下表:頻數(shù)頻率8322.8%12133.2%6818.6%4913.4%308.2%143.8%合計365100%2016年5月和6月的空氣質(zhì)量指數(shù)如下:5月2408056539212645875660191625558565389901251241038189443453798162116886月63921101221021168116315876331026553385552769912712080108333573829014695請選擇合適的統(tǒng)計圖描述數(shù)據(jù),并回答下列問題:(1)分析該市2016年6月的空氣質(zhì)量情況.(2)比較該市2016年5月和6月的空氣質(zhì)量,哪個月的空氣質(zhì)量較好?(3)比較該市2016年6月與該市2015年全年的空氣質(zhì)量,2016年6月

的空氣質(zhì)量是否好于去年?(4)要想對比該市2016年全年與2015年全年的空氣質(zhì)量情況,需要

收集哪些數(shù)據(jù)?請選擇合適的統(tǒng)計圖描述數(shù)據(jù),并回答下列問題:(1)分析該市2016年6月的空氣質(zhì)量情況.2016年6月63921101221021168116315876331026553385552769912712080108333573829014695

頻數(shù)頻率8322.8%12133.2%6818.6%4913.4%308.2%143.8%合計365100%2015年請選擇合適的統(tǒng)計圖描述數(shù)據(jù),并回答下列問題:(1)分析該市2016年6月的空氣質(zhì)量情況.空氣質(zhì)量等級合計優(yōu)良輕度污染中度污染重度污染嚴重污染天數(shù)415920030比例13.33%50%30%6.67%00100%

頻率分布表:條形圖:優(yōu)良天數(shù)

20151050輕度污染中度污染重度污染嚴重污染空氣質(zhì)量等級扇形圖:2016/5/302016/6/42016/6/92016/6/142016/6/192016/6/242016/6/29日期折線圖:請選擇合適的統(tǒng)計圖描述數(shù)據(jù),并回答下列問題:(2)比較該市2016年5月和6月的空氣質(zhì)量,哪個月的空氣質(zhì)量較好?5

月空氣質(zhì)量等級合計優(yōu)良輕度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論