版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
關于用樣本頻率分布估計總體分布第1頁,講稿共50頁,2023年5月2日,星期三
我們用簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣的方法收集樣本數據后,就可以通過樣本研究總體。
用樣本估計總體的兩種情況:①用樣本的頻率分布估計總體分布②用樣本的數字特征(平均數、標準差等)估計總體的數字特征
第2頁,講稿共50頁,2023年5月2日,星期三復習回顧頻數:不分組時,數據中某個數據出現的次數分組時,一個組內的數據的個數頻率:極差:最大數-最小數分組頻數頻率頻率/組距頻率分布表:第3頁,講稿共50頁,2023年5月2日,星期三知識探究(一):頻率分布表
某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超出a的部分按議價收費.問題1:如果希望大部分居民的日常生活不受影響,那么標準a定為多少比較合理?問題2:為了較為合理的確定標準a,需要做哪些工作?第4頁,講稿共50頁,2023年5月2日,星期三通過抽樣調查,獲得100位居民2007年的月均用水量如下表(單位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2問題3:這些數字告訴了我們什么信息?第5頁,講稿共50頁,2023年5月2日,星期三我們可以看出,樣本數據中的最大值4.3和最小值,其他數據在0.2~4.3之間分析數據的基本方法:用圖畫出來用表格重新排列第6頁,講稿共50頁,2023年5月2日,星期三1、借助于圖:頻率分布直方圖、頻率分布折線圖、莖葉圖兩個目的①從數據中提取信息②利用圖形傳遞信息2、借助于表格:
頻率分布表兩個目的①改變數據的排列方式②提供解釋數據的新方式第7頁,講稿共50頁,2023年5月2日,星期三第二步:確定組距,組數組距=每個小組兩個端點的差.組數=極差÷組距(取整數)探究一頻率分布表(4.1÷0.5=8.2將8.2取整,組數=9,組距=0.5思考1:上述100個數據的最小值和最大值分別是多少?第一步:求極差思考2:分成多少組合適?如果將上述100個數據按組距為0.5進行分組,那么這些數據共分為多少組?極差:4.3-0.2=4.15~12組第8頁,講稿共50頁,2023年5月2日,星期三第四步:列頻率分布表探究一頻率分布表思考3:各組數據的取值范圍如何設定?第三步:確定端點,將數據分組
各組均為左開右閉區(qū)間,最后一個閉區(qū)間思考4:如何統(tǒng)計各族中的頻數、頻率?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].第9頁,講稿共50頁,2023年5月2日,星期三
分組頻數頻率頻率/組距[0,0.5)40.040.08[0.5,1)80.080.16[1,1.5)150.150.30[1.5,2)220.220.44[2,2.5)250.250.50[2.5,3)140.140.28[3,3.5)60.060.12[3.5,4)40.040.08[4,4.5]20.020.04合計1001.002第10頁,講稿共50頁,2023年5月2日,星期三探究(二):畫頻率分布直方圖月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第一步:畫直角坐標系:x軸為數據單位,y軸為頻率/組距第二步:在x軸上均勻標出各組分點,在y軸上標出單位長度第三步:以組距為寬,各組的頻率/組距為高,分別畫出各組對應的長方形第11頁,講稿共50頁,2023年5月2日,星期三
問題1:頻率分布直方圖中各小長方形的寬度和高度在數量上有何特點?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距2頻率分布直方圖的意義第12頁,講稿共50頁,2023年5月2日,星期三問題2:頻率分布直方圖中各小長方形的面積表示什么?各小長方形的面積之和為多少?各小長方形的面積=各小組的頻率各小長方形的面積之和=1月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距第13頁,講稿共50頁,2023年5月2日,星期三3分析例題:頻率分布直方圖非常直觀地表明了樣本數據的分布情況,使我們能夠看到頻率分布表中看不太清楚的數據模式,但原始數據不能在圖中表示出來.你能根據上述頻率分布直方圖指出居民月均用水量的一些數據特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第14頁,講稿共50頁,2023年5月2日,星期三(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第15頁,講稿共50頁,2023年5月2日,星期三思考:對一組給定的樣本數據,頻率分布直方圖的外觀形狀與哪些因素有關?在居民月均用水量樣本中,你能以1為組距畫頻率分布直方圖嗎?
與分組數(或組距)及坐標系的單位長度有關.月均用水量/t頻率組距0.40.30.20.112345
O第16頁,講稿共50頁,2023年5月2日,星期三1、求極差(即一組數據中最大值與最小值的差)知道這組數據的變動范圍4.3-0.2=4.12、決定組距與組數(將數據分組)3、將數據分組(8.2取整,分為9組)畫頻率分布直方圖的步驟4、列出頻率分布表.(填寫頻率/組距一欄)5、畫出頻率分布直方圖。組距:指每個小組的兩個端點的距離,組距組數:將數據分組,當數據在100個以內時,按數據多少常分5-12組。
小結第17頁,講稿共50頁,2023年5月2日,星期三理論遷移
例1
某地區(qū)為了了解知識分子的年齡結構,隨機抽樣50名,其年齡分別如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計年齡在32~52歲的知識分子所占的比例約是多少.第18頁,講稿共50頁,2023年5月2日,星期三(1)極差為67-28=39,取組距為5,分為8組.
分組頻數頻率頻率/組距[27,32)30.060.012[32,37)30.060.012[37,42)90.180.036[42,47)160.320.064[47,52)70.140.028[52,57)50.100.020[57,62)40.080.016[62,67)30.060.012合計501.000.200樣本頻率分布表:第19頁,講稿共50頁,2023年5月2日,星期三(2)樣本頻率分布直方圖:年齡0.060.050.040.030.020.01273237424752576267頻率組距O(3)因為0.06+0.18+0.32+0.14=0.7,故年齡在32~52歲的知識分子約占70%.第20頁,講稿共50頁,2023年5月2日,星期三90100110120130140150次數o0.0040.0080.0120.0160.0200.0240.028頻率/組距0.0320.036〖例2〗:為了了解高一學生的體能情況,某校抽取部分學生進行一分鐘跳繩次數次測試,將所得數據整理后,畫出頻率分布直方圖(如圖),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數為12.第二小組的頻率是多少?樣本容量是多少?若次數在110以上(含110次)為達標,試估計該學校全體高一學生的達標率是多少?第21頁,講稿共50頁,2023年5月2日,星期三練習鞏固
1.有一個容量為50的樣本數據的分組及各組的頻數如下:[12.5,15.5)3[24.5,27.5)10[15.5,18.5)8[27.5,30.5)5[18.5,21.5)9[30.5,33.5)4[21.5,24.5)11⑴列出樣本的頻率分布表和畫出頻率分布直方圖;⑵根據樣本的頻率分布估計,小于30.5的數據約占多少?第22頁,講稿共50頁,2023年5月2日,星期三解:組距為3
分組頻數頻率頻率/組距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第23頁,講稿共50頁,2023年5月2日,星期三頻率分布直方圖如下:頻率組距0.0100.0200.0300.0400.05012.515.50.0600.070第24頁,講稿共50頁,2023年5月2日,星期三課堂練習2.(2006年全國卷II)一個社會調查機構就某地居民的月收入調查了10000人,并根據所得數據畫了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學歷、職業(yè)等方面的關系,要從這10000人中再用分層抽樣方法抽出100人作進一步調查,則在[2500,3000](元)月收入段應抽出_______人.0.00010.00020.00030.00040.00051000150020002500300035004000月收入(元)頻率/組距第25頁,講稿共50頁,2023年5月2日,星期三課堂練習2.一個社會調查機構就某地居民的月收入調查了10000人,并根據所得數據畫了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學歷、職業(yè)等方面的關系,要從這10000人中再用分層抽樣方法抽出100人作進一步調查,則在[2500,3000](元)月收入段應抽出_______人.0.00010.00020.00030.00040.0005月收入(元)頻率/組距251000150020002500300035004000第26頁,講稿共50頁,2023年5月2日,星期三課堂練習3.某班50名學生在一次百米測試中,成績全部介于13秒與19秒之間,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;……第六組,成績大于等于18秒且小于等于19秒.右圖是按上述分組方法得到的頻率分布直方圖.設成績小于17秒的學生人數占全班總人數的百分比為x,成績大于等于15秒且小于17秒的學生人數為y,則從頻率分布直方圖中可分析出x和y分別為()A.0.9,35 B.0.9,45C.0.1,35 D.0.1,45O13141516171819秒頻率/組距0.360.340.180.060.040.02第27頁,講稿共50頁,2023年5月2日,星期三課堂練習3.某班50名學生在一次百米測試中,成績全部介于13秒與19秒之間,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;……第六組,成績大于等于18秒且小于等于19秒.右圖是按上述分組方法得到的頻率分布直方圖.設成績小于17秒的學生人數占全班總人數的百分比為x,成績大于等于15秒且小于17秒的學生人數為y,則從頻率分布直方圖中可分析出x和y分別為()A.0.9,35 B.0.9,45C.0.1,35 D.0.1,45O13141516171819秒頻率/組距0.360.340.180.060.040.02A第28頁,講稿共50頁,2023年5月2日,星期三課堂練習4.為了了解某地區(qū)高三學生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為17.5歲-18歲的男生體重(kg),得到頻率分布直方圖如下:根據上圖可得這100名學生中體重在[56.5,64.5]的學生人數是()A.20B.30C.40D.500.030.050.07體重(kg)頻率/組距54.558.562.566.570.574.5第29頁,講稿共50頁,2023年5月2日,星期三課堂練習4.為了了解某地區(qū)高三學生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為17.5歲-18歲的男生體重(kg),得到頻率分布直方圖如下:C0.030.050.07體重(kg)頻率/組距54.558.562.566.570.574.5根據上圖可得這100名學生中體重在[56.5,64.5]的學生人數是(
)A.20B.30C.40D.50第30頁,講稿共50頁,2023年5月2日,星期三課堂練習身高/cm人數/人14515516517518550150250350450550195輸入A1,A2,…,Ana=0i=4輸出s是否開始結束第31頁,講稿共50頁,2023年5月2日,星期三課堂練習B身高/cm人數/人14515516517518550150250350450550195輸入A1,A2,…,Ana=0i=4輸出s是否開始結束第32頁,講稿共50頁,2023年5月2日,星期三小結:
畫頻率分布直方圖的步驟:
第一步:求極差:(數據組中最大值與最小值的差距)
第二步:決定組距與組數:(強調取整)
第三步:將數據分組
(給出組的界限)
第四步:列頻率分布表.
(包括分組、頻數、頻率、頻率/組距)
第五步:畫頻率分布直方圖(在頻率分布表的基礎上繪制,橫坐標為樣本數據尺寸,縱坐標為頻率/組距.)
組距:指每個小組的兩個端點的距離,組距組數:將數據分組,當數據在100個以內時,按數據多少常分5-12組。第33頁,講稿共50頁,2023年5月2日,星期三注意(2)縱坐標為:第34頁,講稿共50頁,2023年5月2日,星期三第二節(jié)第35頁,講稿共50頁,2023年5月2日,星期三3分析例題:頻率分布直方圖非常直觀地表明了樣本數據的分布情況,使我們能夠看到頻率分布表中看不太清楚的數據模式,但原始數據不能在圖中表示出來.你能根據上述頻率分布直方圖指出居民月均用水量的一些數據特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第36頁,講稿共50頁,2023年5月2日,星期三(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第37頁,講稿共50頁,2023年5月2日,星期三頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5在頻率分布直方圖中①取各小長方形上端的中點②用折線依次連接各中點得到頻率分布折線圖第38頁,講稿共50頁,2023年5月2日,星期三用樣本頻分布估計總體分布
上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?第39頁,講稿共50頁,2023年5月2日,星期三總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個區(qū)間(a,b)內取值的百分比)。當樣本容量無限增大,分組的組距無限縮小,那么頻率分布折線圖就會無限接近一條光滑曲線——總體密度曲線.總體密度曲線第40頁,講稿共50頁,2023年5月2日,星期三用樣本分布直方圖去估計相應的總體分布時,一般樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個范圍內取值百分比。
總體密度曲線反映了總體在各個范圍內取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.總體密度曲線第41頁,講稿共50頁,2023年5月2日,星期三莖葉圖某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:(1)甲運動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運動員得分:
49,24,12,31,50,31,44,36,15,37,25,36,39第42頁,講稿共50頁,2023年5月2日,星期三
甲乙
80
463125
368254
3893161679449
150
(1)甲:8,13,16,14,23,26,28,38,33,39,51。(2)乙:
12,15,24,25,31,36,31,36,37,39,44,49,50,第43頁,講稿共50頁,2023年5月2日,星期三莖葉圖當樣本數據較少時,用莖葉圖表示數據的效果較好,它不但可以保留所有的信息,而且
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 青春創(chuàng)造社團打造創(chuàng)新思維計劃
- 《動脈總論各論》課件
- 《宗苗答辯》課件
- 2022年黑龍江省雙鴨山市公開招聘警務輔助人員輔警筆試自考題1卷含答案
- 2021年陜西省榆林市公開招聘警務輔助人員輔警筆試自考題1卷含答案
- 2022年廣西壯族自治區(qū)賀州市公開招聘警務輔助人員輔警筆試自考題2卷含答案
- 實證護理讀書報告撰寫格式
- 江西省九江市(2024年-2025年小學六年級語文)部編版小升初真題(上學期)試卷及答案
- 2024年藥用粉碎機械項目資金申請報告
- 2024年化學陶瓷化學品項目投資申請報告代可行性研究報告
- 2024-2030年中國高密度聚乙烯管道行業(yè)發(fā)展展望與投資策略建議報告
- 2024-2030年中國醋酸乙烯行業(yè)運營狀況與發(fā)展風險評估報告
- 企業(yè)文化塑造與員工激勵方案
- 2024年01月22504學前兒童科學教育活動指導期末試題答案
- 多發(fā)性神經病護理
- 【MOOC】線性代數-浙江大學 中國大學慕課MOOC答案
- 開門紅包費用申請
- 區(qū)塊鏈原理與實踐全套完整教學課件
- 運動神經元病小講課
- 工會的財務管理制度〔13篇〕
- 新版醫(yī)務人員法律法規(guī)知識培訓課件
評論
0/150
提交評論