版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2.2.1用樣本的頻率分布估計總體分布,統(tǒng)計的基本思想方法:,用樣本估計總體,即通常不直接去研究總體,而是通過從總體中抽取一個樣本,根據樣本的情況去估計總體的相應情況.,統(tǒng)計的核心問題:,如何根據樣本的情況對總體的情況作出一種推斷. 這里包括兩類問題:,一類是如何從總體中抽取樣本?,另一類是如何根據對樣本的整理、計算、分析,對總體的情況作出推斷.,用樣本的有關情況去估計總體的相應情況, 這種估計大體分為兩類,一類是用樣本頻率分 布估計總體分布,一類是用樣本的某種數字特 征(例如平均數、方差等)去估計總體的相應 數字特征。,整體介紹:,如何用樣本的頻率分布估計總體分布?,頻率分布直方圖,學習目標
2、: 1.會畫頻率分布直方圖,認清頻率分布直方圖的特征。 2.能通過樣本的頻率分布估計總體的分布。,2.2.1用樣本的頻率分布估計總體分布,1什么是總體分布? 提示:總體分布是指總體取值的分布規(guī)律,即某小組數據在總體數據中所占的比例大小,問題探究,2.畫頻率分布直方圖的步驟?,自學后提問,1.如何得知鋼鐵加工廠所生產的鋼管中優(yōu)等 品所占的比例?,(1)求極差,(2)決定組距與組數 :,即數據中最大值與最小值的差.,(3)決定分點,將數據分組,(4)列頻率分布表,(5)繪制頻率分布直方圖,對課本58頁例子思考:,當數據很多時,,可借助算法.,注意:為方便起見,組距的選擇應力求“取整”,如果極差不
3、利于分組(如不能被組數整除),要適當增加極差,如在左、 右兩端各增加適當范圍(盡量使兩端增加的量相同).,分點的決定方法:一般使分點比數據多一位小樹數,使分點與樣本數據不重合,若數據為整數,則分點數據減去0.5;若數據是小數點后有 一位的數,則分點數據減去0.05,依次類推.,分組時,取左閉右開區(qū)間 , 最后一組取閉區(qū)間.,2如何確定組距與組數?,問題探究,(4)列頻率分布表 (5)繪制頻率分布直方圖,自學后提問,對課本58頁例子思考:,2.畫頻率分布直方圖的步驟?,頻率分布: 樣本中所有數據(或者數據組)的 和 . 的比,就是該數據的頻率所有數據(或者數據組)的頻率的分布,可以用 、 、頻率
4、分布折線圖、莖葉圖等來表示,頻數,樣本容量,頻率分布表,頻率分布直方圖,在頻率分布直方圖中,縱軸表示 ,數據落在各小組內的頻率用 表示,各小長方形面積的總和等于 .,頻率/組,距,各小長方形的,面積,1,自學后提問,對課本58頁例子思考:,3.若規(guī)定鋼管內徑尺寸(標準為25.40mm)的誤差超過0.105mm時為不合格品,估計鋼鐵加工廠生產的所有產品的不合格率.,5.頻率分布直方圖的優(yōu)缺點各是什么?,4.用樣本的頻率分布估計總體的分布時, 怎樣才能使樣本更好的反映總體的特性?,頻率分布直方圖的特征:,(1)從頻率分布直方圖可以清楚的看出數據分布的總體趨勢. (2)從頻率分布直方圖得不出原始的數
5、據內容,把數據表示成直方圖后,原有的具體數據信息就被抹掉了.,:某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a , 用水量不超過a的部分按平價收費,超過a的部分按議價收費.,如果希望大部分居民的日常生活不受影響,那 么標準a定為多少比較合理呢?,為了較合理地確定這個標準,你認為需要做 哪些工作?,自學檢測:,思考:由上表,大家可以得到什么信息?,通過抽樣,我們獲得了100位居民某年的月平均用 水量(單位:t) ,如下表:,1、求極差(即一組數據中最大值與最小值的差) 知道這組數據的變動范圍4.3-0.2=4.1,2、決定組距與組數(將數據分組),3、
6、 將數據分組(8.2取整,分為9組),畫頻率分布直方圖的步驟,4、列出頻率分布表.(學生填寫頻率/組距一欄),5、畫出頻率分布直方圖。,組距:指每個小組的兩個端點的距離,組距 組數:將數據分組,當數據在100個以內時, 按數據多少常分8-12組.,4.列頻率分布表,100位居民月平均用水量的頻率分布表,5.畫頻率分布直方圖,小長方形的面積=?,5.畫頻率分布直方圖,小長方形的面積總和=?,5.畫頻率分布直方圖,月均用水量最多的在那個區(qū)間?,0.06,0.02,0.04,0.14,0.25,0.22,0.15,0.04,0.08,1.如果當地政府希望85%以上的居民的日常生活不受影響,根據頻率分
7、布表或頻率分布直方圖,你認為這個標準a應定為多少噸?,2.你認為3噸這個標準一定能夠保證85%以上的居民用水量不超過標準嗎?,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,探究: 同樣一組數據,如果組距不同,橫軸、縱軸的單位不同,得到的圖的形狀也會不同。不同的形狀給人以不同的印象,這種印象有時會影響我們對總體的判斷。分別以1和0.1為組距重新作圖,然后談談你對圖的印象。,頻率分布直方圖如下:,連接頻率分布直方圖中各小長方形上端的中點,得到頻率分布折線圖,利用樣本頻分布對總體分布進行相應估計,(3)當樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就
8、會無限接近于一條光滑曲線總體密度曲線.,(2)樣本容量越大,這種估計越精確。,(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?,總體密度曲線,月均用水量/t,a,b,(圖中陰影部分的面積,表示總體在某個區(qū)間 (a, b) 內取值的百分比)。,用樣本分布直方圖去估計相應的總體分布時,一般樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個范圍內取值百分比。,總體密度曲線反映了總體在各個范圍內取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.,總體密度曲線,莖葉圖,某
9、賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:,(1)甲運動員得分: 13,51,23,8,26,38,16,33,14,28,39,(2)乙運動員得分: 49,24,12,31,50,31,44,36,15,37,25,36,39,莖葉圖,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,葉就是從莖的旁邊生長出來的數,表示得分的個位數.,莖是指中間的一列數,表示得分的十位數,從運動員的成績的分布來看,乙運動員的成績更好;從葉在莖上的分布情況來看,乙運動員的得分更集中于峰值附近,說明乙運動員的發(fā)揮更穩(wěn)定.,但當樣本
10、數據較多時,莖葉圖就顯得不太方便.因為每一個數據都要在莖葉圖中占據一個空間,如果數據很多,枝葉就會很長.,莖葉圖的特點 當樣本數據較少時,用莖葉圖表示數據的效果較好,它不但可以 ,而且可以隨時記錄,給數據的 . 和 都帶來了方便,保留,所有信息,記錄,表示,繪制莖葉圖的關鍵是分清莖和葉,一般地說如果數據是整數(至少為兩位數)的,除個位數字以外的其它數字為“莖”,個位數字為“葉”;如果是小數的,通常把整數部分作為“莖”,小數部分作為“葉”解題時要根據數據特點合理選擇莖和葉,某車站在春運期間為了了解旅客購票情況,隨機抽樣調查了100名旅客從開始在售票窗口排隊到購到車票所用的時間t(以下簡稱為購票用
11、時,單位為min),下面是這次調查統(tǒng)計分析得到的頻率分布表和頻率分布直方圖(如圖所示).,解答下列問題: (1)這次抽樣的樣本容量是多少? (2)在表中填寫出缺失的數據并補全頻率分布直方圖; (3)旅客購票用時的平均數可能落在哪一組?,100,50,0.10,規(guī)律方法總結,2繪制莖葉圖的步驟 (1)將數據分為“莖”、“葉”兩部分; (2)將最大“莖”與最小“莖”之間的數字按大小順序排成一列,莖相同者共用一個莖,再畫上豎線作為分界線; (3)將各個數據的“葉”在分界線的一側對應莖處同行列出,練習:,1、對于樣本頻率分布折線圖與總體密度曲線的關系, 下列說法中正確的是( ),a、頻率分布折線圖與總體密度曲線無關,b、頻率分布折線圖就是總體密度曲線,c、樣本容量很大的頻率分布折線圖就是總體密度曲線,d、如果樣本容量無限增大,分組的組距無限減小,那么頻率 分布折線圖就會無限接近于總體密度曲線,2、一個容量為20的樣本,分組后,組距與頻數如下:10,20, 2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2,則樣本 在(-,50上的頻率為( ),3、對于用樣本頻率估計總體分布的過程,下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年全球及中國水泥3D建筑打印行業(yè)發(fā)展前景及投資戰(zhàn)略研究報告
- 2024-2030年全球及中國果蔬切片機行業(yè)營銷策略及渠道策略研究報告
- 2024-2030年全球及中國數據中心機柜行業(yè)現狀規(guī)模及發(fā)展前景預測報告
- 2024年招標代理單位工程合同
- 2024-2030年全球及中國動力調音臺行業(yè)銷售現狀及發(fā)展趨勢預測報告
- 2024學校轉讓過程中雙方保密協(xié)議
- 2024-2030年全球與中國聚氨酯同步帶行業(yè)前景動態(tài)及投資前景預測報告
- 2024年度項目調研合同
- 2024-2030年中國魚子醬行業(yè)生產銷售模式及發(fā)展策略分析報告
- 2024-2030年中國高纖維蔓越莓零食行業(yè)銷售狀況與競爭前景預測報告
- 長江三峽水利樞紐可行性報告
- 江蘇省某高速公路結構物臺背回填監(jiān)理細則
- 電大護理本科臨床實習手冊內容(原表)
- 當代德國學校勞動教育課程構建的經驗與啟示共3篇
- “小金庫”治理與防范 習題及答案
- 王偉核桃經濟價值及加工利用
- 新生兒胎糞吸入綜合征臨床路徑標準住院流程及路徑表單
- 氯化鈉特性表
- 鉆井井架起升鋼絲繩管理臺賬
- 單片機原理與應用說課
- 船舶租賃盡職調查
評論
0/150
提交評論