用樣本的數字特征估計總體的數字特征2_第1頁
用樣本的數字特征估計總體的數字特征2_第2頁
用樣本的數字特征估計總體的數字特征2_第3頁
用樣本的數字特征估計總體的數字特征2_第4頁
用樣本的數字特征估計總體的數字特征2_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 第二章第二章 統計統計2.2.2 2.2.2 用樣本的數字特征估計用樣本的數字特征估計 總體的數字特征總體的數字特征眾數、中位數和平均數眾數、中位數和平均數 思考:在城市居民月均用水量樣本數據的頻率分布直方圖思考:在城市居民月均用水量樣本數據的頻率分布直方圖中,你認為眾數應在哪個小矩形內?由此估計總體的眾數中,你認為眾數應在哪個小矩形內?由此估計總體的眾數是什么?是什么? 月 均 用 水月 均 用 水量量/t頻率頻率組距組距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

2、 O取最高矩形下端取最高矩形下端中點的橫坐標中點的橫坐標2.252.25作為眾數作為眾數. . 標準差標準差 平均數向我們提供了樣本數據的重要信息,但是,平均數向我們提供了樣本數據的重要信息,但是,平均數有時也會使我們作出對總體的片面判斷,難平均數有時也會使我們作出對總體的片面判斷,難以概括樣本數據的實際狀態(tài),而數據的離散程度可以概括樣本數據的實際狀態(tài),而數據的離散程度可以用以用極差、方差或標準差極差、方差或標準差來描述。來描述。為了表示樣本數據的單位表示的波動幅度,通常要求為了表示樣本數據的單位表示的波動幅度,通常要求出出樣本方差樣本方差或者它的或者它的算術平方根算術平方根. .思考思考1

3、1:在一次射擊選拔賽中,甲、乙兩名運動員各射擊:在一次射擊選拔賽中,甲、乙兩名運動員各射擊1010次,每次命中的環(huán)數如下:次,每次命中的環(huán)數如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙兩人本次射擊的平均成績分別為多少環(huán)?甲、乙兩人本次射擊的平均成績分別為多少環(huán)?77xx乙甲, 思考思考2 2:甲、乙兩人射擊的平均成績相等,觀察兩人成績:甲、乙兩人射擊的平均成績相等,觀察兩人成績的頻率分布條形圖,你能說明其水平差異在那里嗎?的頻率分布條形圖,你能說明其水平

4、差異在那里嗎?環(huán)數環(huán)數頻率頻率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)環(huán)數環(huán)數頻率頻率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)甲的成績比較分散,極差較大,乙的成績相對集中,甲的成績比較分散,極差較大,乙的成績相對集中,比較穩(wěn)定比較穩(wěn)定. .環(huán)數環(huán)數思考思考3 3:對于樣本數據:對于樣本數據x x1 1,x x2 2,x xn n,設想通過各數,設想通過各數據到其平均數的平均距離來反映樣本數據的分散程度,據到其平均數的平均距離

5、來反映樣本數據的分散程度,那么這個平均距離如何計算?那么這個平均距離如何計算? nxxxxxxn.21標準差標準差:我們把數據的方差的算術平方根叫做這組數:我們把數據的方差的算術平方根叫做這組數據的標準差,它也是一個用來衡量一組數據的波動大據的標準差,它也是一個用來衡量一組數據的波動大小的重要的量。小的重要的量。222121()()() nsxxxxxxn計算標準差的算法:計算標準差的算法: 標準差標準差方差方差(1 1)方差方差:設在一組數據,:設在一組數據,x x1 1,x x2 2,x xn n中,各數中,各數據與它們的平均數據與它們的平均數x x的差的平方分別是的差的平方分別是2221

6、2() ,() ,()nxxxxxx那么我們用它們的平均數,即那么我們用它們的平均數,即2222121()()() nsxxxxxxn 來衡量這組數據的波動大小,并把它叫做這組來衡量這組數據的波動大小,并把它叫做這組數據的數據的方差方差,一組數據方差越大,則這組數據波動,一組數據方差越大,則這組數據波動越大。越大。 思考思考4 4:反映樣本數據的分散程度的大小,最常用的統:反映樣本數據的分散程度的大小,最常用的統計量是標準差,一般用計量是標準差,一般用s s表示表示. .假設樣本數據假設樣本數據x x1 1,x x2 2,x xn n的平均數為的平均數為 ,則標準差的計算公式是:,則標準差的計

7、算公式是: 那么標準差的取值范圍是什么?標準差為那么標準差的取值范圍是什么?標準差為0 0的樣本數據的樣本數據有何特點?有何特點? s0s0,標準差為,標準差為0 0的樣本數據都相等的樣本數據都相等. . xnxxxxxxsn22221)()()(思考思考5 5:對于一個容量為:對于一個容量為2 2的樣本:的樣本:x x1 1,x x2 2(x(x1 1x x2 2) ),則則 , , 在數軸上,這兩個統計數據有什么幾何意義?由此說明標在數軸上,這兩個統計數據有什么幾何意義?由此說明標準差的大小對數據的離散程度有何影響?準差的大小對數據的離散程度有何影響? 122xxx+=212xxs-=標準

8、差越大離散程度越大,數據較分散;標準差越小離標準差越大離散程度越大,數據較分散;標準差越小離散程度越小,數據較集中在平均數周圍散程度越小,數據較集中在平均數周圍. . 知識補充知識補充1.1.標準差的平方標準差的平方 稱為方差,有時用方差代替標準差測稱為方差,有時用方差代替標準差測量樣本數據的離散度量樣本數據的離散度. .方差與標準差的測量效果是一致方差與標準差的測量效果是一致的,在實際應用中一般多采用標準差的,在實際應用中一般多采用標準差. .2s2.2.現實中的總體所包含的個體數往往很多,總體的平均現實中的總體所包含的個體數往往很多,總體的平均數與標準差是未知的,我們通常用樣本的平均數和標

9、準數與標準差是未知的,我們通常用樣本的平均數和標準差去估計總體的平均數與標準差,但要求樣本有較好的差去估計總體的平均數與標準差,但要求樣本有較好的代表性代表性. .例例1 1 畫出下列四組樣本數據的條形圖,畫出下列四組樣本數據的條形圖,說明他們的異同點說明他們的異同點. .(1) (1) ,;,;(2) (2) ,;,;O O頻率頻率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)50 xs=O O頻率頻率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)50. 82xs=(3) (3) ,;,;

10、(4) (4) ,. .頻率頻率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)頻率頻率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(4 4)51. 49xs=52. 83xs=例例2 2 甲、乙兩人同時生產內徑為甲、乙兩人同時生產內徑為25.40mm25.40mm的一種零件,的一種零件,為了對兩人的生產質量進行評比,從他們生產的零件中為了對兩人的生產質量進行評比,從他們生產的零件中各隨機抽取各隨機抽取2020件,量得其內

11、徑尺寸如下(單位:件,量得其內徑尺寸如下(單位:mmmm):):甲甲 :25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.4

12、8 25.48 25.47 25.49 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.4825.47 25.31 25.32 25.32 25.32 25.48 從生產零件內徑的尺寸看,誰生產的零件質量較高?從生產零件內徑的尺寸看,誰生產的零件質量較高? 甲生產的零件內徑更接近內徑標準,且穩(wěn)定程度較高,甲生產的零件內徑更接近內

13、徑標準,且穩(wěn)定程度較高,故甲生產的零件質量較高故甲生產的零件質量較高. . 說明:說明:. .生產質量可以從總體的平均數與標準差兩個生產質量可以從總體的平均數與標準差兩個角度來衡量,但甲、乙兩個總體的平均數與標準差都角度來衡量,但甲、乙兩個總體的平均數與標準差都是不知道的,我們就用樣本的平均數與標準差估計總是不知道的,我們就用樣本的平均數與標準差估計總體的平均數與標準差體的平均數與標準差. . 068.0037.0406.25401.25乙甲乙甲ssxx例例2. 2. 計算數據計算數據5 5,7 7,7 7,8 8,1010,1111的標準差的標準差. .解:解:S1 x= =85+7+7+8

14、+10+116數據數據 xiS1 xS2 xixS3 (xix)258397811781188001082411839S4 s2= =4;9+1+1+0+4+96S5 .24 s所以這組數據的標準差是所以這組數據的標準差是2.2.例例3 3 以往招生統計顯示,某所大學錄取的新生高考總以往招生統計顯示,某所大學錄取的新生高考總分的中位數基本穩(wěn)定在分的中位數基本穩(wěn)定在550550分,若某同學今年高考得了分,若某同學今年高考得了520520分,他想報考這所大學還需收集哪些信息?分,他想報考這所大學還需收集哪些信息?要點:(要點:(1 1)查往年錄取的新生的平均分數)查往年錄取的新生的平均分數. .若

15、平均數小于中位數若平均數小于中位數很多,說明最低錄取線較低,可以報考;很多,說明最低錄取線較低,可以報考;(2 2)查往年錄取的新生高考總分的標準差)查往年錄取的新生高考總分的標準差. .若標準差較大,說明若標準差較大,說明新生的錄取分數較分散,最低錄取線可能較低,可以考慮報考新生的錄取分數較分散,最低錄取線可能較低,可以考慮報考. .例例4 4 在去年的足球甲在去年的足球甲A A聯賽中,甲隊每場比賽平均失球數聯賽中,甲隊每場比賽平均失球數是是1.51.5,全年比賽失球個數的標準差為,全年比賽失球個數的標準差為1.11.1;乙隊每場比賽;乙隊每場比賽平均失球數是平均失球數是2.12.1,全年比

16、賽失球個數的標準差為,全年比賽失球個數的標準差為0.4.0.4.你你認為下列說法是否正確,為什么?認為下列說法是否正確,為什么? (1 1)平均來說甲隊比乙隊防守技術好;()平均來說甲隊比乙隊防守技術好;(2 2)乙隊比甲隊)乙隊比甲隊技術水平更穩(wěn)定;(技術水平更穩(wěn)定;(3 3)甲隊有時表現很差,有時表現又)甲隊有時表現很差,有時表現又非常好;(非常好;(4 4)乙隊很少不失球)乙隊很少不失球. .小結作業(yè)小結作業(yè)1.1.對同一個總體,可以抽取不同的樣本,相應的平均數對同一個總體,可以抽取不同的樣本,相應的平均數與標準差都會發(fā)生改變與標準差都會發(fā)生改變. .如果樣本的代表性差,則對總如果樣本的代表性差,則對總體所作的估計就會產生偏差;如果樣本沒有代表性,則體所作的估計就會產生偏差;如果樣本沒有代表性,則對總體作出錯誤估計的可能性就非常大,由此可見

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論