用樣本數字特征估計總體數字特征_第1頁
用樣本數字特征估計總體數字特征_第2頁
用樣本數字特征估計總體數字特征_第3頁
用樣本數字特征估計總體數字特征_第4頁
用樣本數字特征估計總體數字特征_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2.2 2.2 用樣本估計總體用樣本估計總體.2.2.2.2用樣本的數字特征估計總體的用樣本的數字特征估計總體的數字特征數字特征 第一課時第一課時 問題提出問題提出1.1.對一個未知總體,我們常用樣本的頻率分對一個未知總體,我們常用樣本的頻率分布估計總體的分布,其中表示樣本數據的頻布估計總體的分布,其中表示樣本數據的頻率分布的基本方法有哪些?率分布的基本方法有哪些? 2.2.美國美國nbanba在在2006200720062007年度賽季中,甲、年度賽季中,甲、乙兩名籃球運動員在隨機抽取的乙兩名籃球運動員在隨機抽取的1212場比賽中場比賽中的得分情況如下:的得分情況如下:甲運動員得分:甲運動員

2、得分:1212,1515,2020,2525,3131,3131, 3636,3636,3737,3939,4444,49.49.乙運動員得分:乙運動員得分:8 8,1313,1414,1616,2323,2626, 2828,3838,3939,5151,3131,29.29. 如果要求我們根據上面的數據,估如果要求我們根據上面的數據,估計、比較甲,乙兩名運動員哪一位發(fā)計、比較甲,乙兩名運動員哪一位發(fā)揮得比較穩(wěn)定,就得有相應的數據作揮得比較穩(wěn)定,就得有相應的數據作為比較依據,即通過樣本數據對總體為比較依據,即通過樣本數據對總體的數字特征進行研究,用樣本的數字的數字特征進行研究,用樣本的數字特

3、征估計總體的數字特征特征估計總體的數字特征. 甲運動員得分:甲運動員得分:1212,1515,2020,2525,3131,3131, 3636,3636,3737,3939,4444,49.49.乙運動員得分:乙運動員得分:8 8,1313,1414,1616,2323,2626, 2828,3838,3939,5151,3131,29.29.知識探究(一):眾數、中位數和平均數知識探究(一):眾數、中位數和平均數 思考思考1 1:在初中我們學過眾數、中位數和在初中我們學過眾數、中位數和平均數的概念,這些數據都是反映樣本平均數的概念,這些數據都是反映樣本信息的數字特征,對一組樣本數據如何信息

4、的數字特征,對一組樣本數據如何求眾數、中位數和平均數?求眾數、中位數和平均數? 思考思考2 2:在城市居民月均用水量樣本數據在城市居民月均用水量樣本數據的頻率分布直方圖中,你認為眾數應在的頻率分布直方圖中,你認為眾數應在哪個小矩形內?由此估計總體的眾數是哪個小矩形內?由此估計總體的眾數是什么?什么? 月均用水量月均用水量/t頻率頻率組距組距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o思考思考3 3:在頻率分布直方圖中,每個小矩在頻率分布直方圖中,每個小矩形的面積表示

5、什么?中位數左右兩側的形的面積表示什么?中位數左右兩側的直方圖的面積應有什么關系?直方圖的面積應有什么關系?取最高矩形下端取最高矩形下端中點的橫坐標中點的橫坐標2.252.25作為眾數作為眾數. . 思考思考4 4:在城市居民月均用水量樣本數據的頻在城市居民月均用水量樣本數據的頻率分布直方圖中,從左至右各個小矩形的面率分布直方圖中,從左至右各個小矩形的面積分別是積分別是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估計總體的由此估計總體的中位數是什么?中位數是什么? 月均用

6、水量月均用水量/t頻率頻率組距組距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.50.50.10.10.25=0.020.25=0.02,中位數是,中位數是2.02.2.02. 思考思考5 5:平均數是頻率分布直方圖的平均數是頻率分布直方圖的“重心重心”,在城市居民月均用水量樣本數據的頻率分布在城市居民月均用水量樣本數據的頻率分布直方圖中,各個小矩

7、形的重心在哪里?從直直方圖中,各個小矩形的重心在哪里?從直方圖估計總體在各組數據內的平均數分別為方圖估計總體在各組數據內的平均數分別為多少?多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25, 2.752.75,3.253.25,3.753.75,4.25.4.25. 月均用水量月均用水量/t頻率頻率組距組距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o思考思考6 6:根據統計學中數學期望原理,將頻率根據統計學中數學期望

8、原理,將頻率分布直方圖中每個小矩形的面積與小矩形底分布直方圖中每個小矩形的面積與小矩形底邊中點的橫坐標之積相加,就是樣本數據的邊中點的橫坐標之積相加,就是樣本數據的估值平均數估值平均數. . 由此估計總體的平均數是什么?由此估計總體的平均數是什么?0.250.250.040.04+ +0.750.750.080.08+ +1.251.250.150.15+ +1.751.750.220.22+ +2.252.250.250.25+ +2.752.750.140.14+ +3.253.25 0.060.06+ +3.753.750.040.04+ +4.254.250.02=2.020.02=2

9、.02(t t). . 平均數是平均數是2.02.2.02. 平均數與中位數相等,是必然還是巧合?平均數與中位數相等,是必然還是巧合?思考思考7 7:從居民月均用水量樣本數據可知,該從居民月均用水量樣本數據可知,該樣本的眾數是樣本的眾數是2.32.3,中位數是,中位數是2.02.0,平均數是,平均數是1.9731.973,這與我們從樣本頻率分布直方圖得出,這與我們從樣本頻率分布直方圖得出的結論有偏差,你能解釋一下原因嗎?的結論有偏差,你能解釋一下原因嗎? 頻率分布直方圖損失了一些樣本數據,得頻率分布直方圖損失了一些樣本數據,得到的是一個估計值,且所得估值與數據分組到的是一個估計值,且所得估值與

10、數據分組有關有關. .注注: :在只有樣本頻率分布直方圖的情況下,我在只有樣本頻率分布直方圖的情況下,我們可以按上述方法估計眾數、中位數和平均們可以按上述方法估計眾數、中位數和平均數,并由此估計總體特征數,并由此估計總體特征. .思考思考8 8:一組數據的中位數一般不受少數一組數據的中位數一般不受少數幾個極端值的影響,這在某些情況下是幾個極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時一個優(yōu)點,但它對極端值的不敏感有時也會額成為缺點,你能舉例說明嗎?樣也會額成為缺點,你能舉例說明嗎?樣本數據的平均數大于(或小于)中位數本數據的平均數大于(或小于)中位數說明什么問題?你怎樣理解說

11、明什么問題?你怎樣理解“我們單位我們單位的收入水平比別的單位高的收入水平比別的單位高”這句話的含這句話的含義?義? 如:樣本數據收集有個別差錯不影響中如:樣本數據收集有個別差錯不影響中位數;大學畢業(yè)生憑工資中位數找單位位數;大學畢業(yè)生憑工資中位數找單位可能收入較低可能收入較低. . 平均數大于(或小于)中位數,說明平均數大于(或小于)中位數,說明樣本數據中存在許多較大(或較小)的樣本數據中存在許多較大(或較?。┑臉O端值極端值. . 這句話具有模糊性甚至蒙騙性,其中這句話具有模糊性甚至蒙騙性,其中收入水平是員工工資的某個中心點,它收入水平是員工工資的某個中心點,它可以是眾數、中位數或平均數可以是

12、眾數、中位數或平均數. .知識探究(二):標準差知識探究(二):標準差 樣本的眾數、中位數和平均數常用來表示樣本樣本的眾數、中位數和平均數常用來表示樣本數據的數據的“中心值中心值”,其中眾數和中位數容易計算,其中眾數和中位數容易計算,不受少數幾個極端值的影響,但只能表達樣本數不受少數幾個極端值的影響,但只能表達樣本數據中的少量信息據中的少量信息. 平均數代表了數據更多的信息,平均數代表了數據更多的信息,但受樣本中每個數據的影響,越極端的數據對平但受樣本中每個數據的影響,越極端的數據對平均數的影響也越大均數的影響也越大.當樣本數據質量比較差時,使當樣本數據質量比較差時,使用眾數、中位數或平均數描

13、述數據的中心位置,用眾數、中位數或平均數描述數據的中心位置,可能與實際情況產生較大的誤差,難以反映樣本可能與實際情況產生較大的誤差,難以反映樣本數據的實際狀況,因此,我們需要一個統計數字數據的實際狀況,因此,我們需要一個統計數字刻畫樣本數據的離散程度刻畫樣本數據的離散程度. 思考思考1 1:在一次射擊選拔賽中,甲、乙在一次射擊選拔賽中,甲、乙兩名運動員各射擊兩名運動員各射擊1010次,每次命中的環(huán)次,每次命中的環(huán)數如下:數如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7

14、 7 甲、乙兩人本次射擊的平均成績分甲、乙兩人本次射擊的平均成績分別為多少環(huán)?別為多少環(huán)?77乙甲, xx77乙甲, xx77乙甲, xx思考思考2 2:甲、乙兩人射擊的平均成績相等,觀甲、乙兩人射擊的平均成績相等,觀察兩人成績的頻率分布條形圖,你能說明其察兩人成績的頻率分布條形圖,你能說明其水平差異在那里嗎?水平差異在那里嗎?環(huán)數環(huán)數頻率頻率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 o o(甲)(甲)環(huán)數環(huán)數頻率頻率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 o

15、o(乙)(乙)甲的成績比較分散,極差較大,乙的甲的成績比較分散,極差較大,乙的成績相對集中,比較穩(wěn)定成績相對集中,比較穩(wěn)定. .思考思考3 3:對于樣本數據對于樣本數據x x1 1,x x2 2,x xn n,設想通過各數據到其平均數的平均距離設想通過各數據到其平均數的平均距離來反映樣本數據的分散程度,那么這個來反映樣本數據的分散程度,那么這個平均距離如何計算?平均距離如何計算? 12| |nxxxxxxn-+-+-l思考思考4 4:反映樣本數據的分散程度的大小,最反映樣本數據的分散程度的大小,最常用的統計量是標準差,一般用常用的統計量是標準差,一般用s s表示表示. .假設假設樣本數據樣本數

16、據x x1 1,x x2 2,x xn n的平均數為,則標準的平均數為,則標準差的計算公式是:差的計算公式是:22212()()()nxxxxxxsn-+-+-=l 那么標準差的取值范圍是什么?標準差為那么標準差的取值范圍是什么?標準差為0 0的樣本數據有何特點?的樣本數據有何特點? s0s0,標準差為,標準差為0 0的樣本數據都相等的樣本數據都相等. . 思考思考5 5:對于一個容量為對于一個容量為2 2的樣本:的樣本:x x1 1,x x2 2(x(x1 1x x2 2) ),則,則 , , 在數軸上,這兩個統計數據有什么幾何意義?在數軸上,這兩個統計數據有什么幾何意義?由此說明標準差的大

17、小對數據的離散程度有由此說明標準差的大小對數據的離散程度有何影響?何影響? 122xxx+=212xxs-=標準差越大離散程度越大,數據較分散;標準差越大離散程度越大,數據較分散;標準差越小離散程度越小,數據較集中標準差越小離散程度越小,數據較集中在平均數周圍在平均數周圍. . 知識遷移知識遷移 s s甲甲=2=2,s s乙乙=1.095. =1.095. 計算甲、乙兩名運動員的射擊成績的計算甲、乙兩名運動員的射擊成績的標準差,比較其射擊水平的穩(wěn)定性標準差,比較其射擊水平的穩(wěn)定性. 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8

18、7 6 8 6 7 79 5 7 8 7 6 8 6 7 7小結作業(yè)小結作業(yè)1.1.用樣本的數字特征估計總體的數字特征,用樣本的數字特征估計總體的數字特征,是指用樣本的眾數、中位數、平均數和標準是指用樣本的眾數、中位數、平均數和標準差等統計數據,估計總體相應的統計數據差等統計數據,估計總體相應的統計數據. .2.2.平均數對數據有平均數對數據有“取齊取齊”的作用,代表一的作用,代表一組數據的平均水平組數據的平均水平. .標準差描述一組數據圍繞標準差描述一組數據圍繞平均數波動的幅度平均數波動的幅度. .在實際應用中,我們常綜在實際應用中,我們常綜合樣本的多個統計數據,對總體進行估計,合樣本的多個

19、統計數據,對總體進行估計,為解決問題作出決策為解決問題作出決策. . 2.2 2.2 用樣本估計總體用樣本估計總體.2.2.2.2用樣本的數字特征估計總體的用樣本的數字特征估計總體的數字特征數字特征 第二課時第二課時 知識回顧知識回顧1.1.如何根據樣本頻率分布直方圖,分如何根據樣本頻率分布直方圖,分別估計總體的眾數、中位數和平均數?別估計總體的眾數、中位數和平均數?(1 1)眾數:最高矩形下端中點的橫坐標)眾數:最高矩形下端中點的橫坐標. .(2 2)中位數:直方圖面積平分線與橫軸)中位數:直方圖面積平分線與橫軸交點的橫坐標交點的橫坐標. .(3 3)平均數:每個小矩形的面積與小矩)平均數:

20、每個小矩形的面積與小矩形底邊中點的橫坐標的乘積之和形底邊中點的橫坐標的乘積之和. . 2.2.對于樣本數據對于樣本數據x x1 1,x x2 2,x xn n,其標,其標準差如何計算?準差如何計算? 22212()()()nxxxxxxsn-+-+-=l知識補充知識補充1.1.標準差的平方標準差的平方s s2 2稱為方差,有時用方稱為方差,有時用方差代替標準差測量樣本數據的離散度差代替標準差測量樣本數據的離散度. .方差與標準差的測量效果是一致的,在方差與標準差的測量效果是一致的,在實際應用中一般多采用標準差實際應用中一般多采用標準差. .2.2.現實中的總體所包含的個體數往往現實中的總體所包

21、含的個體數往往很多,總體的平均數與標準差是未知很多,總體的平均數與標準差是未知的,我們通常用樣本的平均數和標準的,我們通常用樣本的平均數和標準差去估計總體的平均數與標準差,但差去估計總體的平均數與標準差,但要求樣本有較好的代表性要求樣本有較好的代表性. .3.3.對于城市居民月均用水量樣本數據,其平均對于城市居民月均用水量樣本數據,其平均數數 ,標準差標準差s=0.868s=0.868. .在這在這100100個數據中,個數據中,落在區(qū)間落在區(qū)間( -s-s, +s+s)=1.105=1.105,2.8412.841外的有外的有2828個;個;落在區(qū)間落在區(qū)間( -2s-2s, +2s+2s)

22、=0.237=0.237,3.7093.709外的只有外的只有4 4個;個;落在區(qū)間落在區(qū)間( -3s-3s, +3s+3s)=-0.631=-0.631,4.5774.577外的有外的有0 0個個. .1. 973x=xxxxxxx 一般地,對于一個正態(tài)總體,數據落一般地,對于一個正態(tài)總體,數據落在區(qū)間(在區(qū)間( -s-s, +s+s)、)、 ( -2s-2s, +2s+2s)、()、( -3s-3s, +3s+3s)內的百分比分別為內的百分比分別為68.3%68.3%、95.4%95.4%、99.7%99.7%,這個原理在產品質量控制中有這個原理在產品質量控制中有著廣泛的應用(參考教材著廣

23、泛的應用(參考教材p79“p79“閱讀與閱讀與思考思考”). . xxxxxx例題分析例題分析例例1 1 畫出下列四組樣本數據的條形圖,畫出下列四組樣本數據的條形圖,說明他們的異同點說明他們的異同點. .(1) (1) ,;,;(2) (2) ,;,;o o頻率頻率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)50 xs=o o頻率頻率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)50. 82xs=(3) (3) ,;,;(4) (4) ,. .頻率頻率1.01.00.80.80.60.60

24、.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 o o(3 3)頻率頻率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 o o(4 4)51. 49xs=52. 83xs=例例2 2 甲、乙兩人同時生產內徑為甲、乙兩人同時生產內徑為25.40mm25.40mm的一種的一種零件,為了對兩人的生產質量進行評比,從他們零件,為了對兩人的生產質量進行評比,從他們生產的零件中各隨機抽取生產的零件中各隨機抽取2020件,量得其內徑尺寸件,量得其內徑尺寸如下(單位:如下(單位:mmmm):):甲甲

25、:25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.40 25.43 25.

26、44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.4825.47 25.31 25.32 25.32 25.32 25.48 從生產零件內徑的尺寸看,誰生產的零件質量從生產零件內徑的尺寸看,誰生產的零件質量較高?較高? 25. 401x甲25. 406x乙0. 037s甲0. 068s乙 甲生產的零件內徑更接近內徑標準,且穩(wěn)定甲生產的零件內徑更接近內徑標準,且

27、穩(wěn)定程度較高,故甲生產的零件質量較高程度較高,故甲生產的零件質量較高. . 說明:說明:1.1.生產質量可以從總體的平均數與標準差生產質量可以從總體的平均數與標準差兩個角度來衡量,但甲、乙兩個總體的平均數與兩個角度來衡量,但甲、乙兩個總體的平均數與標準差都是不知道的,我們就用樣本的平均數與標準差都是不知道的,我們就用樣本的平均數與標準差估計總體的平均數與標準差標準差估計總體的平均數與標準差. . 2. 2.問題中問題中25.40mm25.40mm是內徑的標準值,而不是是內徑的標準值,而不是總體的平均數總體的平均數. .例例3 3 以往招生統計顯示,某所大學錄以往招生統計顯示,某所大學錄取的新生

28、高考總分的中位數基本穩(wěn)定在取的新生高考總分的中位數基本穩(wěn)定在550550分,若某同學今年高考得了分,若某同學今年高考得了520520分,分,他想報考這所大學還需收集哪些信息?他想報考這所大學還需收集哪些信息?要點:(要點:(1 1)查往年錄取的新生的平均分數)查往年錄取的新生的平均分數. .若平均數小于中位數很多,說明最低錄取若平均數小于中位數很多,說明最低錄取線較低,可以報考;線較低,可以報考;(2 2)查往年錄取的新生高考總分的標準差)查往年錄取的新生高考總分的標準差. .若標準差較大,說明新生的錄取分數較分若標準差較大,說明新生的錄取分數較分散,最低錄取線可能較低,可以考慮報考散,最低錄

29、取線可能較低,可以考慮報考. .例例4 4 在去年的足球甲在去年的足球甲a a聯賽中,甲隊每場比賽聯賽中,甲隊每場比賽平均失球數是平均失球數是1.51.5,全年比賽失球個數的標準,全年比賽失球個數的標準差為差為1.11.1;乙隊每場比賽平均失球數是;乙隊每場比賽平均失球數是2.12.1,全年比賽失球個數的標準差為全年比賽失球個數的標準差為0.4.0.4.你認為下你認為下列說法是否正確,為什么?列說法是否正確,為什么? (1 1)平均來說甲隊比乙隊防守技術好;平均來說甲隊比乙隊防守技術好;(2 2)乙隊比甲隊技術水平更穩(wěn)定;)乙隊比甲隊技術水平更穩(wěn)定;(3 3)甲隊有時表現很差,有時表現又非常)甲隊有時表現很差,有時表現又非常 好;好;(4 4)乙隊很少不失球)乙隊很少不失球. .例例5 5 有有2020種不同的零食,它們的熱量種不同的零食,它們的熱量含量如下:含量如下:110 120 123 165 432 190 110 120 123 165 432 190 174 235 428 318 249 280 174 235 428 318 249 280 162 146 210 120 123 120 162 146 210 120 12

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論