隨機抽樣、正態(tài)分布_第1頁
隨機抽樣、正態(tài)分布_第2頁
隨機抽樣、正態(tài)分布_第3頁
隨機抽樣、正態(tài)分布_第4頁
隨機抽樣、正態(tài)分布_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

隨機抽樣、正態(tài)分布1第一頁,共四十頁,編輯于2023年,星期四隨機抽樣、正態(tài)分布第二頁,共四十頁,編輯于2023年,星期四1.數(shù)據(jù)的基本數(shù)字特征(1)平均數(shù):一組數(shù)據(jù)的平均數(shù),記為.設(shè)有n個數(shù)據(jù)x1,x2,…,xn,則平均數(shù)為=①

.(2)中位數(shù):一組數(shù)據(jù)按照從小到大或從大到小的順序進行排列時,處于中間位置的數(shù).當(dāng)這組數(shù)據(jù)的個數(shù)為奇數(shù)時,中位數(shù)為中間一個數(shù);當(dāng)這組數(shù)據(jù)的個數(shù)為偶數(shù)時,中位數(shù)為中間的兩個數(shù)的平均數(shù).第三頁,共四十頁,編輯于2023年,星期四(3)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).(4)極差:一組數(shù)據(jù)中最大數(shù)與最小數(shù)的差.(5)方差:一組數(shù)據(jù)中所有數(shù)與平均數(shù)的差的平方和的平均數(shù),記為s2,即s2=②

.(6)標(biāo)準差:方差的算術(shù)平方根,記作s.2.主要統(tǒng)計圖表(1)基本統(tǒng)計圖表:象形、條形、折線、扇形統(tǒng)計圖.第四頁,共四十頁,編輯于2023年,星期四(2)頻率分布直方圖的畫圖步驟:(ⅰ)求極差;(ⅱ)決定組距與組數(shù);(ⅲ)將數(shù)據(jù)分組;(ⅳ)列頻率分布表;(ⅴ)畫頻率分布直方圖(以頻率組距為縱坐標(biāo)).(3)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點所得的折線.(4)總體密度曲線:隨著樣本容量的增加,作頻率分布折線圖時所分的組數(shù)增加,組距減小,相應(yīng)的頻率折線圖會越來越接近于一條光滑曲線,則稱這條光滑曲線為總體密度曲線.第五頁,共四十頁,編輯于2023年,星期四(5)莖葉圖:中間的數(shù)字表示數(shù)據(jù)的十位數(shù)字,旁邊的數(shù)字分別表示兩組數(shù)據(jù)中各個數(shù)據(jù)的個位數(shù)字.3.抽樣方法(1)簡單隨機抽樣:從含有N個個體的總體中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做③

.有兩種常用方法:簡單隨機抽樣第六頁,共四十頁,編輯于2023年,星期四(ⅰ)④

:就是把總體中的N個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中取出一個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本.(ⅱ)⑤

:利用隨機數(shù)表、隨機數(shù)骰子或計算機產(chǎn)生的隨機數(shù)進行抽樣.(2)系統(tǒng)抽樣:按下列步驟進行抽樣:(ⅰ)先將總體的N個個體編號;(ⅱ)確定分段間隔k,對編號進行分段;(ⅲ)在第1段用簡單隨機抽樣確定第一個個體編號l(l≤k);(ⅳ)按照一定的規(guī)則抽取樣本.抽簽法隨機數(shù)表法第七頁,共四十頁,編輯于2023年,星期四(3)分層抽樣:即⑥

.

.

..4.正態(tài)分布(1)如果隨機變量ξ的概率密度為φμ,σ(x)=⑦

.其中μ、σ分別表示總體的平均數(shù)與標(biāo)準差,稱ξ服從參數(shù)為μ、σ的正態(tài)分布,記作ξ~N(μ,σ2),函數(shù)圖象稱為正態(tài)密度曲線,簡稱正態(tài)曲線.在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽出一定數(shù)量的個體,將各層取出的個體合在一起作為樣本(x∈(-∞,+∞))第八頁,共四十頁,編輯于2023年,星期四一般的,如果對于任何實數(shù)a<b,隨機變量ξ滿足P(a<ξ≤b)=φμ,σ(x)dx,則稱ξ的分布為⑧

.(2)標(biāo)準正態(tài)分布在正態(tài)分布中,當(dāng)μ=⑨

,σ=⑩

時,正態(tài)總體稱為標(biāo)準正態(tài)總體,正態(tài)分布N(0,1),稱為標(biāo)準正態(tài)分布,記作ξ~N(0,1).(3)正態(tài)曲線的性質(zhì)(ⅰ)曲線在x軸的上方,與x軸不相交;(ⅱ)曲線關(guān)于直線x=μ對稱;正態(tài)分布01第九頁,共四十頁,編輯于2023年,星期四(ⅲ)曲線在x=μ時位于最高點;(ⅳ)當(dāng)x<μ時,曲線上升;當(dāng)x>μ時,曲線下降,并且當(dāng)曲線向左、右兩邊無限延伸時,以x軸為漸近線向它無限靠近;(ⅴ)當(dāng)μ一定時,曲線的形狀由σ確定,σ越大,曲線越“矮胖”,表示總體的分布越分散;σ越小,曲線越“瘦高”,表示總體的分布越集中.(4)若ξ~N(μ,σ2),則Eξ=μ,Dξ=σ2.第十頁,共四十頁,編輯于2023年,星期四(5)若X~N(μ,σ2),則P(μ-σ<X≤μ+σ)=0.6826,P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-3σ<X≤μ+3σ)=0.9974.(6)通常認為服從正態(tài)分布N(μ,σ2)的隨機變量X只取

,并簡稱之為3σ原則.(μ-3σ,μ+3σ)之間的值11第十一頁,共四十頁,編輯于2023年,星期四題型一抽樣方法例1在我國東南沿海有60個人均GDP在3萬元以上的城市,其中人均GDP在3~4萬元之間的有36個,在4~5萬元之間的有18個,在5萬元以上的有6個.國家環(huán)??偩钟梅謱映闃訌闹须S機抽取部分城市進行環(huán)境調(diào)查,若抽取的人均GDP在4~5萬元之間的城市個數(shù)為3,則抽取的人均GDP在3~4萬元之間的城市個數(shù)為.第十二頁,共四十頁,編輯于2023年,星期四根據(jù)分層抽樣的特征,在各層抽取的比例是相同的,故可先依據(jù)已知求出這個比例,再求解.抽取的人均GDP在4~5萬元之間的城市的比例為,故抽取的人均GDP在3~4萬元之間的城市的比例也是,則抽取的城市個數(shù)為36×=6.分層抽樣在各層抽取樣本的比例是相等的,這是解決分層抽樣計算問題的主要依據(jù).第十三頁,共四十頁,編輯于2023年,星期四題型二正態(tài)分布例2某批材料的強度ξ服從正態(tài)分布N(200,182),任取一件這種材料,強度在164~236的概率是多少?依題意,得μ=200,σ=18.則P(164<ξ≤236)=P(200-2×18<ξ≤200+2×18)=P(μ-2σ<ξ≤μ+2σ)=0.9544.故任取一件材料,其強度在164~236的概率是0.9544.第十四頁,共四十頁,編輯于2023年,星期四設(shè)在一次數(shù)學(xué)考試中,某班學(xué)生的分數(shù)服從ξ~N(110,),且已知滿分為150分,這個班的學(xué)生共50人,求這個班在這次考試中不小于90分的人數(shù)和超過130分以上的人數(shù).第十五頁,共四十頁,編輯于2023年,星期四因為ξ~N(110,),則μ=110,σ=20,P(110-20<x≤110+20)=0.6826.所以P(ξ>130)=1/2*(1-0.6826)=0.1587.P(ξ≥90)=0.6826+0.1587=0.8413.故不小于90分的人數(shù)為50×0.8413≈42(人).超過130分以上的人數(shù)為50×0.1587≈8(人).求此概率需將問題化為正態(tài)隨機變量的幾種特殊值的概率形式,然后利用對稱性求解.第十六頁,共四十頁,編輯于2023年,星期四題型三頻率分布表與頻率分布直方圖例3在生產(chǎn)過程中,測得纖維產(chǎn)品的纖度(表示纖維粗細的一種量)共有100個數(shù)據(jù),數(shù)據(jù)分組如下表分組[1.30,1.34)[1.34,1.38)[1.38,1.42)[1.42,1.46)[1.46,1.50)[1.50,1.54)合計頻數(shù)4253029102100第十七頁,共四十頁,編輯于2023年,星期四(1)完成頻率分布表,并在給定的坐標(biāo)系中畫出頻率分布直方圖;分組頻數(shù)頻率[1.30,1.34)4[1.34,1.38)25[1.38,1.42)30[1.42,1.46)29[1.46,1.50)10[1.50,1.54)2合計100第十八頁,共四十頁,編輯于2023年,星期四第十九頁,共四十頁,編輯于2023年,星期四(2)估計纖度落在[1.38,1.50)中的概率及纖度小于1.40的概率是多少?(3)統(tǒng)計方法中,同一組數(shù)據(jù)常用該組區(qū)間的中點值(例如區(qū)間[1.30,1.34)的中點值是1.32)作為代表.據(jù)此,估計纖度的期望.第二十頁,共四十頁,編輯于2023年,星期四分組頻數(shù)頻率[1.30,1.34)40.04[1.34,1.38)250.25[1.38,1.42)300.3[1.42,1.46)290.29[1.46,1.50)100.10[1.50,1.54)20.02合計1001.00(1)頻率分布表為:第二十一頁,共四十頁,編輯于2023年,星期四第二十二頁,共四十頁,編輯于2023年,星期四(2)纖度落在[1.38,1.50)中的概率約為0.30+0.29+0.10=0.69,纖度小于1.40的概率約為0.04+0.25+12×0.30=0.44.(3)總體數(shù)據(jù)的期望約為1.32×0.04+1.36×0.25+1.40×0.30+1.44×0.29+1.48×0.10+1.52×0.02=1.4088.第二十三頁,共四十頁,編輯于2023年,星期四

1.解答本題時,第(1)問首先需計算出每組的頻率(利用頻數(shù)100);第(2)問注意[1.38,1.42)中既有小于1.40,又有大于1.40的,可以認為各一半;第(3)問先計算出中點的概率,然后根據(jù)期望的定義求解.

2.本題主要考查頻率分布直方圖、頻率、期望等概念和用樣本頻率估計整體分布的統(tǒng)計方法,考查運用概率、統(tǒng)計知識解決實際問題的能力.第二十四頁,共四十頁,編輯于2023年,星期四題型三樣本的數(shù)字特征估計總體例3對甲、乙兩名自行車賽手在相同條件下進行了6次測試,測得他們的最大速度(m/s)的數(shù)據(jù)如下表:(1)畫出莖葉圖,由莖葉圖你能獲得哪些信息?(2)分別求出甲、乙兩名自行車賽手最大速度(m/s)數(shù)據(jù)的平均數(shù)、中位數(shù)、標(biāo)準差,并判斷選誰參加比賽更合適.甲273830373531乙332938342836第二十五頁,共四十頁,編輯于2023年,星期四

(1)畫莖葉圖,中間數(shù)為數(shù)據(jù)的十位數(shù)字:從這個莖葉圖上可以看出,甲、乙的最大速度情況都是分布均勻的,只是乙更好一些;乙的中位數(shù)是33.5,甲的中位數(shù)是33.因此,乙發(fā)揮比較穩(wěn)定,總體情況比甲好.(2)=33,=33;s甲=3.96,s乙=3.56;甲的中位數(shù)是33,乙的中位數(shù)是33.5.綜合比較,選乙參加比賽較為合適.第二十六頁,共四十頁,編輯于2023年,星期四在某籃球比賽中,根據(jù)甲和乙兩人的得分情況得到如圖所示的莖葉圖.(1)從莖葉圖的特征來說明他們誰發(fā)揮得更穩(wěn)定;

(2)用樣本的數(shù)字特征驗證他們誰發(fā)揮得更好.第二十七頁,共四十頁,編輯于2023年,星期四莖葉圖的直觀形狀像橫放的頻率分布直方圖,且保留了所有原始數(shù)據(jù)的信息,所以從數(shù)與形的特征來看,甲和乙的得分都是對稱的,葉的分布是“單峰”的,但甲全部的葉都集中在莖2上,而乙只有57的葉集中在莖2上,這說明甲發(fā)揮得更穩(wěn)定.第二十八頁,共四十頁,編輯于2023年,星期四(2)

==25,==25,=[(20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)2]≈9.14,=[(17-25)2+(23-25)2+(24-25)2+(25-25)2+(26-25)2+(29-25)2+(31-25)2]≈17.43.因為=,<,所以甲發(fā)揮得更好.第二十九頁,共四十頁,編輯于2023年,星期四1.統(tǒng)計的基本思想方法是用樣本估計總體,即用局部推斷整體,這就要求樣本應(yīng)具有很好的代表性,而樣本良好客觀的代表性,完全依賴抽樣方法,弄清簡單隨機抽樣和分層抽樣的客觀合理性,從而會在不同的情況下采用適當(dāng)?shù)某闃臃椒?掌握三種抽樣方法的抽樣步驟.第三十頁,共四十頁,編輯于2023年,星期四三種抽樣方法的比較:類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣①抽樣過程中每個個體被抽取的概率是相等的;②均屬于不放回抽樣從總體中逐個抽取最基本的抽樣方法總體中的個體數(shù)較少分層抽樣將總體分成幾層進行抽取各層抽樣時采用簡單隨機抽樣總體由差異明顯的幾部分組成系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多第三十一頁,共四十頁,編輯于2023年,星期四2.頻率分布直方圖會使樣本的一些數(shù)字特征更明顯,繪制頻率分布直方圖時,要合理分組,以便使數(shù)據(jù)中的特征能更好地反映出來.總體分布估計中,(1)先確定分組的組數(shù),其方法是:最大數(shù)據(jù)與最小數(shù)據(jù)之差除組距得組數(shù).(2)計算每組中的頻數(shù)及頻率,其中頻率=.(3)畫出直方圖.3.畫莖葉圖的步驟如下:(1)將每個數(shù)據(jù)分為莖(高位)和葉(低位)兩部分;第三十二頁,共四十頁,編輯于2023年,星期四(2)將最小莖和最大莖之間數(shù)按大小次序排成一列,寫在左(右)側(cè);(3)將各個數(shù)據(jù)的葉按大小次序?qū)懺谄淝o右(左)側(cè);4.用樣本的數(shù)字特征(眾數(shù)、中位數(shù)、平均數(shù))估計總體數(shù)字特征.5.正態(tài)分布應(yīng)用十分廣泛,應(yīng)用正態(tài)分布的關(guān)鍵是通過數(shù)形結(jié)合,利用正態(tài)分布曲線分析求解,或轉(zhuǎn)化為“σ,2σ,3σ原則”問題求解.第三十三頁,共四十頁,編輯于2023年,星期四6.由正態(tài)曲線過點(a,0)和點(b,0)的兩條x軸的垂線,及x軸所圍成的平面圖形的面積,就是隨機變量ξ落在區(qū)間(a,b)的概率的近似值.7.正態(tài)曲線與x軸之間的面積為1.第三十四頁,共四十頁,編輯于2023年,星期四1.某初級中學(xué)共有30個班,其中初一有12個班,初二有12個班,初三有6個班.現(xiàn)從中抽出5個班進行調(diào)查,則應(yīng)在初三6個班中抽取

個班.12.把數(shù)據(jù)x1,x2,…,xn分成若干組,已知某數(shù)xi的頻數(shù)和頻率分別為4和0.125,則n的值是()CA.16B.24C.32D.64第三十五頁,共四十頁,編輯于2023年,星期四3.數(shù)據(jù)5,10,73,1,3,105,111的中位數(shù)與極差的差為

.-100因為中位數(shù)是10,極差是111-1=110,故所求的值為10-110=-100.4.將一組數(shù)據(jù)同時減去3.1,得到一組新數(shù)據(jù),若原數(shù)據(jù)的平均數(shù)、方差分別為、s2,則新數(shù)據(jù)的平均數(shù)是

,方差是

.-3.1s2第三十六頁,共四十頁,編輯于2023年,星期四設(shè)=(x1+

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論