版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第六章統(tǒng)計
6.1獲取數(shù)據(jù)的途徑......................................................1
6.2抽樣的基本方法......................................................5
1、簡單隨機(jī)抽樣.....................................................5
2、分層隨機(jī)抽樣.....................................................9
6.3用樣本估計總體分布.................................................12
6.4用樣本估計總體數(shù)字特征............................................18
6.1獲取數(shù)據(jù)的途徑
1.直接獲取數(shù)據(jù)與間接獲取數(shù)據(jù)
(1)統(tǒng)計的定義:統(tǒng)計是研究如何合理收集、整理、分析數(shù)據(jù)的學(xué)科.
⑵獲取數(shù)據(jù)的途徑:
數(shù)據(jù)來源直接獲取間接獲取
通過社會調(diào)查或觀察、試
定義借助各種媒介獲取數(shù)據(jù)
驗等渠道獲取數(shù)據(jù)
數(shù)據(jù)名稱直接數(shù)據(jù)或一手?jǐn)?shù)據(jù)間接數(shù)據(jù)或二手?jǐn)?shù)據(jù)
報紙雜志、統(tǒng)計報表和年鑒、廣播、
獲取形式問卷調(diào)查、試驗收集等
電視或互聯(lián)網(wǎng)等
(1)了解并正確理解間接數(shù)據(jù)的含義、
計算方法,以防止誤用、錯用他人的
獲取數(shù)據(jù)時應(yīng)注意數(shù)據(jù)
數(shù)據(jù);
注意事項來源的廣泛性、代表性、
(2)引用間接數(shù)據(jù)時要注明數(shù)據(jù)來源,
均衡性
尊重他人的勞動成果,保護(hù)他人的知
識產(chǎn)權(quán)
2.普查和抽查
調(diào)查
普查抽查
方式
從全體調(diào)查對象中,按照一定的
普查是為了掌握調(diào)查對象的整
方法抽取一部分對象作為代表
定義體情況,對全體調(diào)查對象進(jìn)行研
進(jìn)行調(diào)查分析,并以此推斷全體
究的一種調(diào)查方式
調(diào)查對象的狀況
適用需要獲取全部整體數(shù)據(jù)或調(diào)查
調(diào)查對象很難全部獲取
情形對象較少
迅速、及時,節(jié)約人力、物力和
優(yōu)點(diǎn)所取得的數(shù)據(jù)更加全面、系統(tǒng)
財力
缺點(diǎn)費(fèi)時、費(fèi)力結(jié)果具有不確定性
3.總體和樣本
(1)總體和樣本
名稱定義
總體調(diào)查對象的全體稱為總體
樣本從總體中抽取的部分稱為樣本
個體構(gòu)成總體的每一個對象稱為個體
樣本容量樣本中個體的數(shù)目稱為樣本容量
(2)總體的分布:總體中各類數(shù)據(jù)的百分比稱為總體的分布.
思考(1)根據(jù)你的觀察,舉例說明我國常進(jìn)行的普查有哪些?
⑵要了解一批燈管的壽命是否達(dá)標(biāo),能用普查嗎?
[提示](1)人口普查、經(jīng)濟(jì)普查、農(nóng)業(yè)普查等.
(2)檢驗具有破壞性,故不能普查.
疑難解惑
□類型1抽查與普查的辨析
【例1】下面的四個問題中,適合用抽樣調(diào)查方法的是()
A.檢驗10件產(chǎn)品的質(zhì)量
B.銀行對公司10萬元存款的現(xiàn)鈔的真假檢驗
C.跳傘運(yùn)動員檢查20個傘包及傘的質(zhì)量
D.檢驗一批汽車的防碰撞性能
D[根據(jù)抽樣調(diào)查與普查的概念可知A,B,C一般采用普查的方法,只有D
是采用抽樣調(diào)查的方法.]
1.......反C?領(lǐng)悟
普查與抽樣調(diào)查的特點(diǎn)
方式抽樣調(diào)查普查
節(jié)省人力、物力和財力需要大量的人力、物力和財力
可以用于帶有破壞性的檢查不能用于帶有破壞性的檢查
特點(diǎn)
在操作正確的情況下,能得到準(zhǔn)
結(jié)果與實際情況之間有誤差
確結(jié)果
口類型2抽樣調(diào)查的實施
【例2】兒童的喂養(yǎng)及輔食添加是影響兒童生長發(fā)育、身體健康的重要因
素,喂養(yǎng)不當(dāng)及輔食添加不正確,容易導(dǎo)致兒童貧血及其他疾病,影響兒童生長
發(fā)育.為了了解農(nóng)村兒童的喂養(yǎng)、輔食添加情況、發(fā)現(xiàn)存在的問題、確定兒童的
喂養(yǎng)及輔食添加的促進(jìn)措施,欲在該地農(nóng)村進(jìn)行一次3歲以下兒童的喂養(yǎng)、輔食
添加情況和貧血相關(guān)因素的調(diào)查研究.請給出一個合理的調(diào)查方案(該地區(qū)共10
個縣).
[解]可采用如下抽樣:先從該地區(qū)10個縣中隨機(jī)抽取4個縣,再在隨機(jī)
抽取的各縣中隨機(jī)抽取5個鄉(xiāng)(鎮(zhèn)),在隨機(jī)抽取的鄉(xiāng)(鎮(zhèn))中再隨機(jī)抽取5個行政
村,在被抽中的行政村中各抽取24戶有3歲以下兒童的住戶,在樣本戶的3歲
以下兒童中隨機(jī)抽取1名兒童.當(dāng)抽樣村符合要求的家庭不足24戶時,將其全
部調(diào)查,不夠的戶在鄰村補(bǔ)齊(鄰村是指距離最近的非抽樣村)(根據(jù)實際情況,
也可有其他合理的抽樣).
廠.....??反c?領(lǐng)悟.............................
在統(tǒng)計活動中,尤其是大型的統(tǒng)計活動,為避免一些外界因素的干擾,通常
需要確定調(diào)查的對象、調(diào)查的方法與策略,需要精心設(shè)計前期的準(zhǔn)備工作和收集
數(shù)據(jù)的方法,然后對數(shù)據(jù)進(jìn)行分析,得出統(tǒng)計推斷.
□類型3總體和樣本
[例3]從某公司600名員工中抽取20名進(jìn)行體重的統(tǒng)計分析,下列說
法正確的是()
A.600名員工是總體
B.每個被抽查的員工是個體
C.抽取的20名員工的體重是一個樣本
D.抽取的20名員工的體重是樣本容量
[思路點(diǎn)撥]根據(jù)總體、樣本、樣本容量的定義判斷.
C[本題抽取的是20名員工的體重,因此600名員工的體重是總體,每個
員工的體重是個體,這20名員工的體重構(gòu)成一個樣本,樣本的容量為20.]
[母題探究]
1.在本例中,該公司想調(diào)查一下本公司員工對某項規(guī)章制度的意見,由于
本公司車間工人工作任務(wù)繁重,負(fù)責(zé)調(diào)查該項事務(wù)的公司辦公室只調(diào)查了本公司
的50名中層及以上領(lǐng)導(dǎo)干部,便得到了調(diào)查意見,你認(rèn)為該調(diào)查結(jié)果具有代表
性嗎?為什么?
[解]不具有代表性.因為公司的規(guī)章制度往往是領(lǐng)導(dǎo)干部制定的,而這部
分員工的意見不能很好地代表全體員工,所以結(jié)果是片面的,不合理的,不具有
代表性.
2.在本例中,公司抽取20名員工后經(jīng)過統(tǒng)計,得到20名員工的體重數(shù)據(jù),
公司希望利用這些數(shù)據(jù)給公司的所有員工定制工作服,你認(rèn)為合理嗎?如果不合
理,應(yīng)該怎么做?
[解]不合理.為員工定制工作服,應(yīng)該對公司的所有員工進(jìn)行普查,而不
是抽查,并且應(yīng)該普查每個員工的身高、體重、三圍等指標(biāo),來確定其工作服的
號碼大小.
「......??反領(lǐng)悟??.........................
解決此類問題要注意區(qū)分以下幾個概念
(1)總體:在抽樣調(diào)查中,調(diào)查對象的全體稱為總體.
(2)樣本:從總體中抽取的一部分稱為樣本.
(3)個體:構(gòu)成總體的每一個元素稱為個體.
(4)樣本容量:樣本中個體的個數(shù)稱為樣本容量.
(5)總體容量:總體中個體的個數(shù)稱為總體容量.
6.2抽樣的基本方法
1、簡單隨機(jī)抽樣
1.簡單隨機(jī)抽樣的概念
(1)定義:一般地,從w個不同個體構(gòu)成的總體中,逐個不放回地抽取〃個
個體組成樣本,并且每次抽取時總體內(nèi)的每個個體被抽到的可能性相等,這樣的
抽取方法叫作簡單隨機(jī)抽樣.
(2)實施方法:簡單隨機(jī)抽樣的實施方法通常采用抽簽法和隨機(jī)數(shù)法.
2.抽簽法
(1)定義:先把總體中的N個個體編號,并把編號依次分別寫在形狀、大小
相同的簽上(簽可以是紙條、卡片或小球等),然后將這些號簽放在同一個不透明
的箱子里搖均勻.每次隨機(jī)地從中抽取一個,然后將箱中余下的號簽搖均勻,再
進(jìn)行下一次抽取.如此下去,直至抽到預(yù)先設(shè)定的樣本容量.
(2)抽簽法的具體步驟:
①給總體中的每個個體編號;②抽簽.
3.隨機(jī)數(shù)法
(1)定義:先把總體中的及個個體依次編碼為0,1,2,…,A-l,然后利用
工具(轉(zhuǎn)盤或摸球、隨機(jī)數(shù)表、科學(xué)計算器或計算機(jī))產(chǎn)生0,1,2,…,N—\中的
隨機(jī)數(shù),產(chǎn)生的隨機(jī)數(shù)是幾,就選第幾號個體,直至選到預(yù)先設(shè)定的樣本容量.
(2)利用隨機(jī)數(shù)表進(jìn)行抽樣的具體步驟:
①給總體中的每個個體編號;
②在隨機(jī)數(shù)表中蒯抽取某行某列作為抽樣的起點(diǎn),并規(guī)定讀取方法;
③依次從隨機(jī)數(shù)表中抽取樣本號碼,凡是抽到編號范圍內(nèi)的號碼,就是樣本
的號碼,并剔除相同的號碼,直至抽滿為止.
思考氐⑴某同學(xué)說:“隨機(jī)數(shù)表只有一張,并且讀數(shù)時只能按照從左向右
的順序讀取,否則產(chǎn)生的隨機(jī)樣本就不同了,對總體的估計就不準(zhǔn)確了."你認(rèn)
為這種說法正確嗎?
(2)抽簽法中確保樣本代表性的關(guān)鍵是什么?
[提示](1)不正確,隨機(jī)數(shù)表的產(chǎn)生是隨機(jī)的,讀數(shù)的順序也是隨機(jī)的,
不同的樣本對總體的估計相差并不大.
(2)攪拌均勻是為了使每個個體進(jìn)入樣本的可能性相等,保證樣本真實反映
總體特征.
疑難解惑
□類型1簡單隨機(jī)抽樣的判斷
【例1】下列抽樣中,簡單隨機(jī)抽樣的個數(shù)是()
①一位兒童從玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,連
續(xù)玩了5件;
②倉庫中有1萬支奧運(yùn)火炬,從中一次性抽取100支火炬進(jìn)行質(zhì)量檢查;
③某班從50名同學(xué)中,選出5名數(shù)學(xué)成績最優(yōu)秀的同學(xué)代表本班參加數(shù)學(xué)
競賽;
④一彩民選號,從裝有36個大小、形狀都相同的號簽的盒子中無放回地抽
出6個號簽.
A.0B.1
C.2D.3
B[根據(jù)簡單隨機(jī)抽樣的特點(diǎn)逐個判斷.①不是簡單隨機(jī)抽樣.因為兒童從
玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,連續(xù)玩了5件它不是
“逐個”抽取.②不是簡單隨機(jī)抽樣.雖然“一次性抽取”和“逐個抽取”不影
響個體被抽到的可能性,但簡單隨機(jī)抽樣要求的是“逐個抽取”.③不是簡單隨
機(jī)抽樣.因為5名同學(xué)是從中挑出來的,是最優(yōu)秀的,每個個體被抽到的可能性
不同,不符合簡單隨機(jī)抽樣中“等可能抽樣”的要求.④是簡單隨機(jī)抽樣.因為
總體中的個體數(shù)是有限的,并且是從總體中逐個進(jìn)行抽取的,等可能的抽樣.綜
上,只有④是簡單隨機(jī)抽樣.]
廠........反領(lǐng)悟...........................
簡單隨機(jī)抽樣必須具備下列特點(diǎn):
(1)被抽取樣本的總體中的個體數(shù)N是有限的;
(2)抽取的樣本是從總體中逐個抽取的;
(3)簡單隨機(jī)抽樣是一種等可能的抽樣.
如果三個特征有一個不滿足,就不是簡單隨機(jī)抽樣.
□類型2抽簽法的應(yīng)用
[例2]為迎接新生入校,現(xiàn)從報名的20名志愿者中選取5人組成志愿
小組,請用抽簽法設(shè)計抽樣方案.
[解](D將20名志愿者編號,號碼分別是01,02,…,20;
(2)將號碼分別寫在20張大小、形狀都相同的紙條上,揉成團(tuán)兒,制成號簽;
(3)將所得號簽放在一個不透明的袋子中,并攪拌均勻;
(4)從袋子中依次不放回地抽取5個號簽,并記錄下上面的編號;
(5)所得號碼對應(yīng)的志愿者就是志愿小組的成員.
「......??反領(lǐng)悟??..........................
1.一個抽樣試驗?zāi)芊裼贸楹灧?,關(guān)鍵看兩點(diǎn):一是制簽是否方便;二是個
體之間差異不明顯.
2.應(yīng)用抽簽法時應(yīng)注意以下幾點(diǎn):
(1)編號時,如果已有編號可不必重新編號;
(2)號簽要求大小、形狀完全相同;
(3)號簽要均勻攪拌;
(4)根據(jù)實際需要采用有放回或無放回抽取.
□類型3隨機(jī)數(shù)法
[例3]假設(shè)我們要考察某公司生產(chǎn)的500克袋裝牛奶的質(zhì)量是否達(dá)標(biāo),
現(xiàn)從500袋牛奶中抽取60袋進(jìn)行檢驗,利用隨機(jī)數(shù)表抽取樣本時,應(yīng)如何操作?
下面為隨機(jī)數(shù)表第7行至第9行
32114919730649167677(第7行)
27486198716441487086(第8行)
74770111163024042979(第9行)
[解]第一步,將500袋牛奶編號為000,001,…,499.
第二步,在隨機(jī)數(shù)表中任選一個數(shù)作為起始數(shù)(例如選出第8行第2列的數(shù)
7).
第三步,從選定的數(shù)7開始依次向右三位三位讀(讀數(shù)的方向也可以是向左、
向上、向下等),將編號范圍內(nèi)的數(shù)取出,編號范圍外的數(shù)去掉,重復(fù)的只記一
次,直到取滿60個號碼為止,就得到一個容量為60的樣本.
[母題探究]
1.在本例中,如果從以下隨機(jī)數(shù)表第7行第4列的數(shù)2開始,從左往右讀
數(shù),則依次抽到的第4個個體的編號是(下面摘錄了隨機(jī)數(shù)表第6行至
第8行各數(shù)).
162277943949545354821737932378873520964384
26349164(第6行)
864217533157245506887704744767217206502583
42163376(第7行)
630163785916955567199810507175128673580744
39523879(第8行)
206[找到第7行第4列的數(shù)開始向右讀,第1個符合條件的數(shù)是217,第
2個數(shù)533,不成立,第3個數(shù)157,第4個數(shù)245,這樣依次讀出結(jié)果,合適的
數(shù)是217,157,245,217,206,其中217與前面重復(fù),舍掉.故第4個數(shù)是206.]
2.在本例中,對抽取的60袋牛奶進(jìn)行檢驗,其中有3袋牛奶為不合格產(chǎn)品,
據(jù)此試估計在500袋牛奶中,大約有多少袋牛奶為不合格產(chǎn)品?
[解]由題意可知,在500袋牛奶中任意一袋牛奶為不合格產(chǎn)品的可能性為
311
正=右,所以在500袋牛奶中,不合格產(chǎn)品的數(shù)量大約為500X^=25.
602020
廠.......?反o?領(lǐng)悟...........................
隨機(jī)數(shù)法的注意點(diǎn)
(1)當(dāng)總體容量較大,樣本容量不大時,可用隨機(jī)數(shù)法抽取樣本.
(2)用隨機(jī)數(shù)法抽取樣本,為了方便,在編號時需統(tǒng)一編號的位數(shù).
(3)將總體中的個體進(jìn)行編號時,可以從0開始,也可以從1開始.
(4)注意從隨機(jī)數(shù)表中抽取編號時應(yīng)遵循的規(guī)則.
2、分層隨機(jī)抽樣
分層隨機(jī)抽樣的概念
將總體按其屬性特征分成互不交叉的若干類型(有時稱作層),然后
定義在每個類型中按照所占比例隨機(jī)抽取一定的個體,這種抽樣方法通
常叫作分層隨機(jī)抽樣
適用總體是由差異明顯的幾類個體構(gòu)成,并且知道某一類個體在總體中
條件所占的百分比
優(yōu)點(diǎn)能很好地反映總體的規(guī)律,也會提高對總體推斷的準(zhǔn)確性
思考(1)某市為調(diào)查中小學(xué)生的近視情況,在全市范圍內(nèi)分別對小學(xué)生、
初中生、高中生三個群體抽樣,進(jìn)而了解中小學(xué)生的總體情況和三個群體近視情
況的差異大小.在抽取樣本時可以用簡單隨機(jī)抽樣嗎?為什么?
(2)簡單隨機(jī)抽樣和分層隨機(jī)抽樣有什么區(qū)別和聯(lián)系?
[提示](1)在此總體中,小學(xué)生、初中生、高中生三個群體在年齡、體質(zhì)、
近視情況等方面存在著明顯的差異.若采用簡單隨機(jī)抽樣,抽取的樣本可能集中
于某一個群體,不具有代表性.
(2)區(qū)別:簡單隨機(jī)抽樣是從總體中逐個抽取樣本;分層隨機(jī)抽樣則首先將
總體分成幾層,在各層中按同一抽樣比抽取樣本.
聯(lián)系:(1)抽樣過程中每個個體被抽到的可能性相等;
(2)每次抽出個體后不再將它放回,即不放回抽樣.
疑難解惑
□類型1對分層隨機(jī)抽樣概念的理解
【例1】分層隨機(jī)抽樣又稱類型抽樣,即將相似的個體歸入一類(層),然
后每類抽取若干個個體構(gòu)成樣本,所以分層隨機(jī)抽樣為保證每個個體等可能抽
樣,必須進(jìn)行()
A.每層等可能抽樣
B.每層可以不等可能抽樣
C.所有層按同一抽樣比等可能抽樣
D.所有層抽取的個體數(shù)量相同
C[保證每個個體等可能的被抽取是分層隨機(jī)抽樣的基本特征,為了保證這
一點(diǎn),分層隨機(jī)抽樣時必須在所有層都按同一抽樣比等可能抽取.]
廠.......反廓領(lǐng)悟.......-f
1.使用分層隨機(jī)抽樣的前提
分層隨機(jī)抽樣的適用前提條件是總體可以分層、層與層之間有明顯區(qū)別,而
層內(nèi)個體間差異較小.
2.使用分層隨機(jī)抽樣應(yīng)遵循的原則
(1)將相似的個體歸入一類,即為一層,分層要求每層的各個個體互不交叉,
即遵循不重復(fù)、不遺漏的原則;
(2)分層隨機(jī)抽樣為保證每個個體等可能入樣,需遵循在各層中進(jìn)行簡單隨
機(jī)抽樣,每層樣本數(shù)量與每層個體數(shù)量的比等于抽樣比.
II類型2分層隨機(jī)抽樣的應(yīng)用
[例2]某學(xué)校有在職人員160人,其中行政人員有16人,教師有112
人,后勤人員有32人.教育部門為了了解在職人員對學(xué)校機(jī)構(gòu)改革的意見,要
從中抽取一個容量為20的樣本,請利用分層隨機(jī)抽樣的方法抽取,寫出抽樣過
程.
[解]抽樣過程如下:
201
第一步,確定抽樣比,樣本容量與總體容量的比為
1608
第二步,確定分別從三類人員中抽取的人數(shù),從行政人員中抽取16X:=
O
2(人);
從教師中抽取112X1=14(A);
O
從后勤人員中抽取32義:=4(人).
O
第三步,采用簡單隨機(jī)抽樣的方法,抽取行政人員2人,教師14人,后勤
人員4人.
第四步,把抽取的個體組合在一起構(gòu)成所需樣本.
反領(lǐng)悟......
分層隨機(jī)抽樣的步驟
口類型3分層隨機(jī)抽樣中的計算問題
[例3](1)交通管理部門為了解機(jī)動車駕駛員(簡稱駕駛員)對某新法規(guī)
的知曉情況,對甲、乙、丙、丁四個社區(qū)做分層隨機(jī)抽樣調(diào)查,假設(shè)四個社區(qū)駕
駛員的總?cè)藬?shù)為從其中甲社區(qū)有駕駛員96人.若在甲、乙、丙、丁四個社區(qū)
抽取駕駛員的人數(shù)分別為12,21,25,43,則這四個社區(qū)駕駛員的總?cè)藬?shù)川為
()
A.101B.808
C.1212D.2012
(2)將一個總體分為4B,C三層,其個體數(shù)之比為5:3:2.若用分層隨機(jī)
抽樣方法抽取容量為100的樣本,則應(yīng)從。中抽取個個體.
(DB(2)20[(1)因為甲社區(qū)有駕駛員96人,并且在甲社區(qū)抽取的駕駛
員的人數(shù)為12人,
121
所以四個社區(qū)抽取駕駛員的比例為靛=$,
968
所以駕駛員的總?cè)藬?shù)為(12+21+25+43)+:=808(人).
O
(2)':A,B,,三層個體數(shù)之比為5:3:2,
又總體中每個個體被抽到的概率相等,
2
分層隨機(jī)抽樣應(yīng)從。中抽取100X二=20(個)個體.]
[母題探究]
1.在本例(1)中,把條件“其中甲社區(qū)有駕駛員96人,若在甲、乙、丙、
丁四個社區(qū)抽取駕駛員的人數(shù)分別為12,21,25,43”換為“甲社區(qū)的駕駛員人
數(shù)占四個社區(qū)駕駛員總?cè)藬?shù)的《,若從甲社區(qū)抽取的駕駛員人數(shù)為16”,則抽取
的樣本容量是多少?
[解]設(shè)抽取的樣本容量為〃,由題意可知生=上解得〃=96,即所抽取的
n6
樣本容量為96.
2.在本例(2)中,把條件“其個體數(shù)之比為5:3:2”換為“已知4層的個
體數(shù)為200,且從中抽取的樣本數(shù)為10”,其余不變,則總體容量是多少?
[解]設(shè)總體容量為M由題意可知,卡=薪,解得A-2000.
r......??反領(lǐng)悟??..........................
進(jìn)行分層隨機(jī)抽樣的相關(guān)計算時,常用到的2個關(guān)系
m樣本容量〃該層抽取的個體數(shù)
I??傮w的個數(shù)該層的個體數(shù);
(2)總體中某兩層的個體數(shù)之比等于樣本中這兩層抽取的個體數(shù)之比.
6.3用樣本估計總體分布
從頻數(shù)到頻率頻率分布直方圖
知識點(diǎn)1從頻數(shù)到頻率
1.頻率的定義
頻率表示頻數(shù)與總數(shù)的比值,能更好地反映樣本和總體的相應(yīng)特征.
2.頻率的意義
頻率反映了相對總數(shù)而言的相對強(qiáng)度,其所攜帶的總體信息遠(yuǎn)超過頻數(shù).在
實際問題中,如果總體容量比較小,頻數(shù)也可以較客觀地反映總體分布;當(dāng)總體
容量較大時,頻率就更能客觀地反映總體分布.
3.頻率的作用
在統(tǒng)計中,經(jīng)常要用樣本數(shù)據(jù)的頻率,去估計總便中相應(yīng)的頻率,即對總體
分布進(jìn)行估計.
知識點(diǎn)2頻率分布直方圖
1.頻率分布直方圖
頻率分布直方圖中每個矩形的底邊長是該組的組距,矩形的高是該組的頻率
頻率
與組距的比,從而矩形的面積等于這個組的頻率,即矩形的面積=組距義薪=
頻率.我們把這樣的圖叫作頻率分布直方圖.頻率分布直方圖以面積的形式反映
了數(shù)據(jù)落在各個小組的頻率的大小.
2.頻率分布直方圖的應(yīng)用
當(dāng)考慮數(shù)據(jù)落在若干個組內(nèi)的頻率之和時,可以用相應(yīng)矩形面積之和來表
示.
3.畫頻率分布直方圖的步驟
(1)計算極差:即一組數(shù)據(jù)中最大值和最小值的差:
(2)確定組距與組數(shù):當(dāng)數(shù)據(jù)在120個以內(nèi)時,通常按照數(shù)據(jù)的多少分成讓
絲_組,在實際操作中,一般要求各組的組距相等.
(3)分組:按組距將數(shù)據(jù)分組,分組時,各組均為左閉右開區(qū)間,最后一組
是閉區(qū)間.
(4)列表:一般分四列:寬度分組、頻數(shù)、頻率、篝.其中頻數(shù)合計應(yīng)是樣
本容量,頻率合計是L
頻率
(5)畫頻率分布直方圖:畫圖時,應(yīng)以橫軸表示分組,縱軸表示贏,其相
應(yīng)組距上的頻率等于該組上的小長方形的面積.即每個小長方形的面積=組距
頻率
X=頻率.
4.頻率折線圖
在頻率分布直方圖中,按照分組原則,再在左邊和右邊各加一個區(qū)間.從所
加的左邊區(qū)間的中點(diǎn)開始,用線段依次連接各個矩形的頂端中點(diǎn),直至右邊所加
區(qū)間的中點(diǎn),就可以得到一條折線,我們稱之為頻率折線圖.有時也用它來估計
總體的分布情況.
隨著樣本容量的增大,所劃分的區(qū)間數(shù)也可以隨之增多,而每個區(qū)間的長度
則會相應(yīng)隨之減小,相應(yīng)的頻率折線圖就會越來越接近于一條光滑曲線.
思考k(l)為什么需要用頻率分布直方圖對原始數(shù)據(jù)進(jìn)行整理?
(2)為什么要對樣本數(shù)據(jù)進(jìn)行分組?
[提示](1)因為通過抽樣獲得的原始數(shù)據(jù)多而且雜亂,無法直接從中理解
它們的含義,并提取信息,也不便于我們用它來傳遞信息.正因為如此我們才用
頻率分布直方圖來整理數(shù)據(jù).
(2)不分組很難看出樣本中的數(shù)字所包含的信息,分組后,計算出頻率,從
而估計總體的分布特征.
疑難解惑
□類型1統(tǒng)計圖表中的頻率的計算
【例1】某省有關(guān)部門要求各中小學(xué)要把“每天鍛煉一小時”寫入課程
表,為了響應(yīng)這一號召,某校圍繞著“你最喜歡的體育活動項目是什么?(只寫
一項)”的問題,對在校學(xué)生進(jìn)行了隨機(jī)抽樣調(diào)查,從而得到一組數(shù)據(jù).下圖是
根據(jù)這組數(shù)據(jù)繪制的條形統(tǒng)計圖.請結(jié)合統(tǒng)計圖回答下列問題:
(1)該校對多少名學(xué)生進(jìn)行了抽樣調(diào)查?
(2)本次抽樣調(diào)查中,最喜歡籃球活動的有多少人?占被調(diào)查人數(shù)的百分比
是多少?
[解]⑴由題圖知4+8+10+18+10=50(名).
即該校對50名學(xué)生進(jìn)行了抽樣調(diào)查.
18
(2)本次調(diào)查中,最喜歡籃球活動的有18人,—X100%=36%.
即最喜歡籃球活動的人數(shù)占被調(diào)查人數(shù)的36%.
「........反c?領(lǐng)悟.............................
條形圖和扇形統(tǒng)計圖的視圖方法
(1)條形統(tǒng)計圖是用一個單位長度表示一定的數(shù)量,根據(jù)數(shù)量的多少畫成長
短不同的矩形條,然后把這些矩形條按照一定的順序排列起來.其特點(diǎn)是便于看
出和比較各種數(shù)量的多少,即條形統(tǒng)計圖能清楚地表示出每個項目的具體數(shù)目.
(2)扇形統(tǒng)計圖是用整個圓面積表示總數(shù)(100%),用圓內(nèi)的扇形面積表示各
部分所占總數(shù)的百分?jǐn)?shù).
總之,用統(tǒng)計圖來表示數(shù)量關(guān)系更生動形象、具體,使人一目了然.
「類型2畫頻率分布直方圖和頻率折線圖
【例2】為了了解某片經(jīng)濟(jì)林的生長情況,隨機(jī)測量其中的100棵樹的底
部周長,得到如下數(shù)據(jù)(單位:cm):
135981021109912111096100103
1259711711311092102109104112
1091248713197102123104104128
10512311110310592114108104102
12912697100115111106117104109
1118911012180120121104108118
12999909912112310711191100
991011169710210810195107101
1021081179911810611997126108
12311998121101113102103104108
(1)列出頻率分布表;
(2)畫出頻率分布直方圖及頻率折線圖;
(3)估計該片經(jīng)濟(jì)林中底部周長小于100cm的樹占多少,底部周長不小于
120cm的樹占多少.
[解](1)這組數(shù)據(jù)的最大的數(shù)為135,最小的數(shù)為80,最大的數(shù)與最小的
數(shù)的差為55,可將該組數(shù)據(jù)分為11組,組距為5.
頻率分布表如下:
頻率
底部周長分組頻數(shù)頻率
組距
[80,85)10.010.002
[85,90)20.020.004
[90,95)40.040.008
[95,100)140.140.028
[100,105)240.240.048
[105,110)150.150.030
[110,115)120.120.024
[115,120)90.090.018
[120,125)110.110.022
[125,130)60.060.012
[130,135]20.020.004
(2)頻率分布直方圖和頻率折線圖如下圖所示.
(3)從頻率分布表得,樣本中底部周長小于100cm的頻率為0.01+0.02+
0.04+0.14=0.21,樣本中底部周長不小于120cm的頻率為0.11+0.06+0.02
=0.19.所以估計該片經(jīng)濟(jì)林中底部周長小于100cm的樹占21%,底部周長不小
于120cm的樹占19%.
「......反G?領(lǐng)悟.....................
繪制頻率分布直方圖應(yīng)注意的2個問題
(1)在繪制出頻率分布表后,畫頻率分布直方圖的關(guān)鍵就是確定小矩形的
高.一般地,頻率分布直方圖中兩坐標(biāo)軸上的單位長度是不一致的,合理的定高
方法是“以一個恰當(dāng)?shù)膯挝婚L度”(沒有統(tǒng)一規(guī)定),然后以各組的“頻率/組
距”所占的比例來定高.如我們預(yù)先設(shè)定以“一”為一個單位長度,代表
"0.1",則若一個組的就為0.2,則該小矩形的高就是“一”(占兩個單位
長度),如此類推.
(2)數(shù)據(jù)要合理分組,組距要選取恰當(dāng),一般盡量取整,數(shù)據(jù)為30?100個
左右時,應(yīng)分成5?12組,在頻率分布直方圖中,各個小長方形的面積等于各組
的頻率,小長方形的高與頻數(shù)成正比,各組頻數(shù)之和等于樣本容量,頻率之和為
1.
U類型3頻率分布直方圖的應(yīng)用
【例3】為了了解高一年級學(xué)生的體能情況,某校抽取部分學(xué)生進(jìn)行一分
鐘跳繩次數(shù)測試,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖(如圖所示),圖中從
左到右各小矩形的面積之比為2:4:17:15:9:3,第二小組的頻數(shù)為12.
頻率
0.036
0.032
0.028
0.024
0.020
0.016
0.012
0.008
0.004
090100110120130140150次數(shù)
(1)第二小組的頻率是多少?樣本容量是多少?
(2)若次數(shù)在110以上(含110次)為達(dá)標(biāo),則該校全體高一年級學(xué)生的達(dá)標(biāo)
率是多少?
4
[解](1)第一小組的頻率為2+4+17+15+9+3=0.08.
第一小組的頻數(shù)
又因為第二小組的頻率=制界
柘2玨十狀日第二小組的頻數(shù)__12___
所以樣本合里=第二小組的頻率而=1150.
17+15+9+3
(2)由直方圖可估計該校高一年級學(xué)生的達(dá)標(biāo)率為
2+4+17+15+9+3
X100%=88%.
廠........反G?領(lǐng)悟.............................A
頻率分布直方圖的性質(zhì)
頻率
(1)因為小矩形的面積=組距X端=頻率,所以各小矩形的面積表示相應(yīng)
各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數(shù)據(jù)落在各個小組內(nèi)
的頻率大小.
(2)在頻率分布直方圖中,各小矩形的面積之和等于1.
⑶樣本容量=扁頻數(shù)裊.
6.4用樣本估計總體數(shù)字特征
樣本的數(shù)字特征
1.眾數(shù)、中位數(shù)、平均數(shù)定義
(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)量空的數(shù).
(2)中位數(shù):把一組數(shù)據(jù)按從小到大的順序排列,處在史間位置(或中間兩個
數(shù)的平均數(shù))的數(shù)稱為這組數(shù)據(jù)的中位數(shù).
—1
(3)平均數(shù):如果〃個數(shù)不,毛,…,x,?那么x=-(E+X2H---Fx)稱為這
n
〃個數(shù)的平均數(shù).
2.極差:數(shù)據(jù)中最大值和最小值的差.
3.方差
2I2II2
X\—X十XLX十,?,十X-X
(1)公式:6=一―.
n
(2)意義:方差刻畫的是數(shù)據(jù)偏離平均數(shù)的離散程度.
4.標(biāo)準(zhǔn)差
/_Xy—X2+Xz-X2~1------FX「X2
N二?
思考(1)眾數(shù)、中位數(shù)和平均數(shù)各有什么優(yōu)點(diǎn)和缺點(diǎn)?
(2)標(biāo)準(zhǔn)差、方差的意義是什么?
[提示](1)三種數(shù)字特征的優(yōu)缺點(diǎn)比較:
名稱優(yōu)點(diǎn)缺點(diǎn)
①它只能表達(dá)樣本數(shù)據(jù)中
①體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn);很少的一部分信息;
眾數(shù)
②容易計算②無法客觀地反映總體的
特征
①不受少數(shù)幾個極端數(shù)據(jù)(即排序
靠前或靠后的數(shù)據(jù))的影響;
中位數(shù)對極端值不敏感
②容易計算,便于利用中間數(shù)據(jù)的
信息
任何一個數(shù)據(jù)的改變都會
代表性較好,是反映數(shù)據(jù)集中趨勢
引起平均數(shù)的改變.數(shù)據(jù)
平均數(shù)的量.一般情況下,可以反映出更
越“離群”,對平均數(shù)的
多的關(guān)于樣本數(shù)據(jù)全體的信息
影響越大
(2)標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小.標(biāo)準(zhǔn)差、方差越
大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小.
疑難解惑
□類型1平均數(shù)、中位數(shù)和眾數(shù)的計算
【例1】已知10名工人生產(chǎn)同一零件,生產(chǎn)的件數(shù)分別是
16,18,15,11,16,18,
18,17,15,13,設(shè)其平均數(shù)為a,中位數(shù)為6,眾數(shù)為c,則有()
A.a>b>cB.a>c>b
C.c>a>8D.c>t>>a
1157
D[由題意得a=—(16+18+15+11+16+18+18+17+15+13)=-^-=
15.7.
將數(shù)據(jù)從小到大排列為11,13,15,15,16,16,17,18,18,18,則其中位數(shù)為
16,眾數(shù)為18,則6=16,c=18,/.c>b>a.]
1.........反領(lǐng)悟.............................
1.求樣本數(shù)據(jù)的中位數(shù)和眾數(shù)時,把數(shù)據(jù)按照從小到大的順序排列后,按
照其求法進(jìn)行.
2.求樣本數(shù)據(jù)的平均數(shù)的難點(diǎn)在于計算的準(zhǔn)確性.
U類型2根據(jù)頻率分布直方圖求平均數(shù)、中位數(shù)和眾數(shù)
[例2]某校從參加高二年級學(xué)業(yè)水平測試的學(xué)生中抽出80名學(xué)生,其
數(shù)學(xué)成績(均為整數(shù))的頻率分布直方圖如圖所示.
頻率/組距
0.030---------------------------------------
0.025------------------------------------------------
0.020------------------------------
0.015---------------------
0.005-----1----------------1
0405060708090100分?jǐn)?shù)
(1)求這次測試數(shù)學(xué)成績的眾數(shù);
(2)求這次測試數(shù)學(xué)成績的中位數(shù).
YQ_i_on
[解](1)由題干圖知眾數(shù)為T一=75.
(2)由題干圖知,設(shè)中位數(shù)為x,由于前三個矩形面積之和為0.4,第四個矩
形面積為0.3,0.3+0.4>0.5,因此中位數(shù)位于第四個矩形內(nèi),得0.1=0.03(x
-70),所以后73.3.
[母題探究]
1.(變設(shè)問)若本例的條件不變,求數(shù)學(xué)成績的平均分.
[解]由題干圖知這次數(shù)學(xué)成績的平均分為:
40+50,50+6060+7070+80
---X0.005X10+---XO.015X10+---X0.02X10+---
乙乙乙乙
80+90,90+100
X0.03X10卜一--X0.025X10+---X0.005X10=72.
乙乙
2.(變設(shè)問)若本例條件不變,求80分以下的學(xué)生人數(shù).
[解][40,80)分的頻率為:(0.005+0.015+0.020+0.030)X10=0.7,
所以80分以下的學(xué)生人數(shù)為80X0.7=56.
廠........反G?領(lǐng)悟..........A
眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的聯(lián)系
(1)眾數(shù):眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的底邊中點(diǎn)
的橫坐標(biāo).
(2)中位數(shù):在樣本中,有50%的個體大于或等于中位數(shù),因此,在頻率分
布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可估計中位數(shù)的
值.
(3)平均數(shù):用頻率分布直方圖估計平均數(shù)時,平均數(shù)等于頻率分布直方圖
中每個小矩形的面積乘以每個小矩形底邊中點(diǎn)的橫坐標(biāo)之和.
□類型3極差、方差、標(biāo)準(zhǔn)差的計算及應(yīng)用
【例3】某班20位女同學(xué)平均分為甲、乙兩組,她們的勞動技術(shù)課考試
成績?nèi)缦?單位:分):
甲組:60,90,85,75,65,70,80,90,95,80;
乙組:85,95,75,70,85,80,85,65,90,85.
(1)試分別計算兩組數(shù)據(jù)的極差、方差和標(biāo)準(zhǔn)差;
(2)哪一組的成績較穩(wěn)定?
[解](1)甲組:最高分為95分,最低分為60分,極差為95—60=35(分),
_1
平均分為“單=m*(60+90+85+75+65+70+80+90+95+80)=
79(分),
222
方差為4=^X[(60-79)+(90—79尸+(85-79)+(75-79)+(65-
79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
標(biāo)準(zhǔn)差為s甲=/^>=、/7而弋10.91(分).
乙組:最高分為95分,最低分為65分,極差為95—65=30(分),
_1
平均分為=(85+95+75+70+85+80+85+65+90+85)=
81.5(分),
方差為4=^X[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2
+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85
-81.5”]=75.25.
標(biāo)準(zhǔn)差為5乙=麻=)75.25-8.67(分).
(2)由于乙組的方差(標(biāo)準(zhǔn)差)小于甲組的方差(標(biāo)準(zhǔn)差),因此乙組的成績較
穩(wěn)定.
從(1)中得到的極差也可得到乙組的成績比較穩(wěn)定.
「........反o?領(lǐng)悟.............................
計算標(biāo)準(zhǔn)差的5步驟
(1)求出樣本數(shù)據(jù)的平均數(shù)
(2)求出每個樣本數(shù)據(jù)與樣本平均數(shù)的差%—7(,=1,2,…,ri).
(3)求出x,—x(/=1,2,…,〃)的平方值.
(4)求出上一步中〃個平方值的平均數(shù),即為樣本方差.
(5)求出上一步中平均數(shù)的算術(shù)平方根,即為樣本標(biāo)準(zhǔn)差.
分層隨機(jī)抽樣的均值與方差百分位數(shù)
1.分層隨機(jī)抽樣的均值
設(shè)樣本中不同層的平均數(shù)和相應(yīng)權(quán)重分別為XI,Xu…,&和跖,陶…,
第,則這個樣本的平均數(shù)為獷|7|+股/?+…+典三.為了簡化表示,引進(jìn)求和符
______n_
號,記作用x1+股xzH---F閱x〃=£嚴(yán)x
2.分層隨機(jī)抽樣的方差
設(shè)樣本中不同層的平均數(shù)分別為J2,…,方差分別為熊m,…,
S,?相應(yīng)的權(quán)重分別為修,修,…,典,則這個樣本的方差為#=£叼[s:+(X,一
7)2],其中1為樣本平均數(shù).
3.百分位數(shù)
(1)定義:一般地,當(dāng)總體是連續(xù)變量時,給定一個百分?jǐn)?shù)0e(0,1),總體
的。分位數(shù)有這樣的特點(diǎn):總體數(shù)據(jù)中的任意一個數(shù)小于或等于它的可能性是
P-
(2)常用的百分位數(shù):
①四分位數(shù):25%,50%,75%,
②其它常用的百分位數(shù):1%,5%,10虬90%,95%,99%.
⑶計算一組〃個數(shù)據(jù)的0分位數(shù)的一般步驟如下:
第1步,按照從小到大排列原始數(shù)據(jù):
第2步,計算/=如;
第3步,若/不是整數(shù),大于I.的最小整數(shù)為j,則。分位數(shù)為第.7項數(shù)據(jù);
若i是整數(shù),則夕分位數(shù)為第I?項與第(i+1)項數(shù)據(jù)的平均數(shù).
思考(1)甲班和乙班各有學(xué)生20人、40人,甲班的數(shù)學(xué)成績的平均數(shù)為
80分,方差為2,乙班的數(shù)學(xué)成績的平均數(shù)為82分,方差為4,那么甲班和乙
班這60人的數(shù)學(xué)成績的平均分是氣J=81分嗎?方差是十=3嗎?為什
么?
(2)“這次數(shù)學(xué)測試成績的70%分位數(shù)是85分”這句話是什么意思?
[提示](1)不是,因為甲班和乙班在這60人中的權(quán)重是不同的.
(2)有70%的同學(xué)數(shù)學(xué)測試成績小于或等于85分.
疑難解惑
□類型1分層隨機(jī)抽樣的均值與方差
【例1】工廠為了解每個工人對某零件的日加工量,統(tǒng)計員分別從兩車間
抽取了甲、乙兩人日加工量的兩個樣本.抽到甲的一個樣本容量為10,樣本平
均數(shù)為5,方差為1;乙的一個樣本容量為12,樣本平均數(shù)為6,方差為2.現(xiàn)將
這兩組樣本合在一起,求合在一起后的樣本的平均數(shù)與方差.
[解]設(shè)抽到甲的一個樣本數(shù)據(jù)為為,物…,x,。;乙的一個樣本數(shù)據(jù)為加
先,…,刀2,
—1I。
由題思知A-=—
110
方差S=-E(X--5)J=1,
_112J12
y=—Y.y,=6,方差t2=-X(y;—6);:=2,
12,=i12/=1
則合在一起后的樣本容量為22,
1012
WHI=—?W7=—
樣本平均數(shù)為a=w甲x+獷乙y=;^X5+方X6心5.55,
乙乙乙乙
樣本方差為t)=wv\_^+(X—a)"]+獷乙"+(y—a)']=1|[1+(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國沿海監(jiān)視行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 2024-2030年中國油底殼行業(yè)發(fā)展態(tài)勢及投資盈利分析報告
- 2024-2030年中國河蟹養(yǎng)殖行業(yè)市場發(fā)展分析及發(fā)展前景與投資發(fā)展策略研究報告
- 2024-2030年中國沙灘車行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究報告
- 2024-2030年中國汽車高壓油泵(噴油泵)產(chǎn)業(yè)前景展望與趨勢預(yù)測分析報告
- 2024-2030年中國汽車節(jié)能服務(wù)行業(yè)市場深度調(diào)研及發(fā)展策略與投資前景研究報告
- 2024-2030年中國汽車修理行業(yè)經(jīng)營策略及投資盈利預(yù)測研究報告
- 受托支付貸款合同
- 股票融資合同范本
- 設(shè)計院設(shè)計合同范本
- 2024年成人高考專升本《英語》試卷真題及答案
- 2023全國青少年文化遺產(chǎn)知識大賽試題及答案(共1270題)
- 油田注入水細(xì)菌分析方法+絕跡稀釋法
- 通用橫版企業(yè)報價單模板
- 周視瞄準(zhǔn)鏡的初步設(shè)計-北京理工大學(xué)-光電學(xué)院小學(xué)期作業(yè)
- PU膠物質(zhì)安全資料表MSDS
- 小學(xué)科學(xué)蘇教版三年級上冊單元知識點(diǎn)總結(jié)
- 化學(xué)材料理化屬性及部分術(shù)語解釋
- CEMS運(yùn)行質(zhì)量控制(共13頁)
- 紙箱生產(chǎn)工藝及流程知識概述
- 企業(yè)微信群管理規(guī)定2018
評論
0/150
提交評論