統(tǒng)計抽樣與參數估計_第1頁
統(tǒng)計抽樣與參數估計_第2頁
統(tǒng)計抽樣與參數估計_第3頁
統(tǒng)計抽樣與參數估計_第4頁
統(tǒng)計抽樣與參數估計_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計抽樣與參數估計第1頁,共62頁,2023年,2月20日,星期六第1節(jié)抽樣與抽樣分布

一、有關抽樣的基本概念

總體(母體)(Population)樣本(子樣)(Sample)總體指標(總體參數)(Populationparameter)樣本指標(樣本統(tǒng)計量)(Samplestatistic)第2頁,共62頁,2023年,2月20日,星期六抽樣方法

重置抽樣(重復抽樣)(Samplingwithreplacement)

要從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,把順序號登記下來之后,重新放回參加下一次抽選,連續(xù)反復抽取n次組成所要求容量的樣本。不重置抽樣(不重復抽樣)(Samplingwithoutreplacement)

要從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進行次便組成樣本。不重復抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復抽樣。

第3頁,共62頁,2023年,2月20日,星期六

概率抽樣的組織方式簡單隨機抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進行抽樣,如果容量為n的每個可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機樣本。分層抽樣:也稱分類抽樣或類型抽樣,它是按某個主要標志對總體各單位進行分類,然后從各層中按隨機原則分別抽取一定數目的單位構成樣本。等距抽樣也稱機械抽樣或系統(tǒng)抽樣。它是先將總體單位按一定順序排隊,計算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。整群抽樣:也稱叢聚抽樣或集團抽樣。它是將總體分為若干部分(每一部分稱為一個群),然后按隨機原則從中一群一群地抽選,對抽中群內的所有單位進行全面調查。第4頁,共62頁,2023年,2月20日,星期六總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布

(populationdistribution)總體第5頁,共62頁,2023年,2月20日,星期六一個樣本中各觀察值的分布也稱經驗分布當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本分布

(sampledistribution)樣本第6頁,共62頁,2023年,2月20日,星期六二、抽樣分布

(Samplingdistribution)

1、抽樣分布的意義

對統(tǒng)計量的所有可能取值及其對應概率的描述,就是統(tǒng)計量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計量的分布特征,根據抽樣分布的規(guī)律,可揭示樣本統(tǒng)計量與總體參數之間的關系,計算抽樣誤差,并說明抽樣推斷的可靠程度。

第7頁,共62頁,2023年,2月20日,星期六抽樣分布

(samplingdistribution)總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本第8頁,共62頁,2023年,2月20日,星期六例:樣本均值的抽樣分布

【例】設一個總體,含有4個元素(個體),即總體單位數N=4。4個個體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第9頁,共62頁,2023年,2月20日,星期六現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為

3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第10頁,共62頁,2023年,2月20日,星期六計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布

3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5第11頁,共62頁,2023年,2月20日,星期六樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X第12頁,共62頁,2023年,2月20日,星期六2、樣本均值的抽樣分布

樣本平均數的標準差反映了樣本平均數與總體平均數的平均誤差,故稱之為抽樣平均誤差(或抽樣標準差)。計算公式:(重復抽樣)可見,抽樣平均誤差與總體標準差成正比變化,與樣本容量的平方根成反比變化。當總體為正態(tài)分布時,對于任何樣本容量,樣本平均數的抽樣分布是正態(tài)分布。若總體方差σ2未知,則可用樣本方差s2取而代之。樣本容量很大,無論總體分布如何,樣本平均數近似服從正態(tài)分布。

第13頁,共62頁,2023年,2月20日,星期六3、樣本比例的抽樣分布

當從總體中抽出一個容量為n的樣本時,樣本比例服從二項分布。當n→∞時,二項分布趨近于正態(tài)分布。所以,在大樣本下,若np≥5且n(1-p)≥5,樣本比例p近似服從正態(tài)分布。比例的抽樣平均誤差(重復抽樣)式中,P為總體比例,實際計算時通常采用以往經驗數據或樣本比例。第14頁,共62頁,2023年,2月20日,星期六例:燈泡廠從10000只燈泡中隨機抽取500只檢查其耐用時數,結果如下表。該廠規(guī)定耐用時數在850以下為不合格。求平均耐用時數及不合格率的抽樣平均誤差。耐用時數燈泡數xxf800-850850-900900-950950-10001000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合計500——4625001475000第15頁,共62頁,2023年,2月20日,星期六解:重復抽樣條件下不重復抽樣條件下第16頁,共62頁,2023年,2月20日,星期六練習:1、從某大學學生中隨機抽選100名調查體重,結果平均體重為58千克。根據過去的資料知道該校學生體重標準差為10千克。求抽樣誤差。2、某工廠共生產新型聚光燈2000只,隨機抽選400只進行耐用時間調查,結果平均壽命為4800小時,標準差為300小時。求抽樣誤差。3、從某校學生中隨機抽選400名,發(fā)現(xiàn)戴眼鏡的有80人。計算求抽樣誤差。4、一批食品罐頭60000桶,隨機抽查300桶,有6桶不合格。求合格率的抽樣誤差。5、假設4個人工資分別為:400、500、700、800元,現(xiàn)隨機抽選2人進行調查。(1)驗證(2)計算重復抽樣及不重復抽樣的抽樣平均誤差。第17頁,共62頁,2023年,2月20日,星期六第2節(jié)參數估計的基本方法

參數估計——以實際觀察的樣本數據所計算的統(tǒng)計量作為未知總體參數的估計值。一、點估計(Pointestimate)點估計也稱定值估計,就是直接以樣本統(tǒng)計量作為總體參數的估計值。點估計的優(yōu)點是它提供了總體參數的具體估計值,可作為決策的依據,其缺點是不能提供有關抽樣誤差的信息。樣本均值是總體均值μ的點估計量,樣本方差s2是總體方差σ2的點估計量,樣本比例p是總體比例P的點估計量。優(yōu)良估計量的標準:無偏性有效性一致性第18頁,共62頁,2023年,2月20日,星期六二、區(qū)間估計(Intervalestimate)

抽樣誤差統(tǒng)計調查的誤差,是指調查所得結果與總體真值之間的差異。誤差的來源有登記性誤差和代表性誤差兩大類。代表性誤差分為系統(tǒng)性誤差和偶然性誤差。抽樣估計中所謂的抽樣誤差,就是指這種偶然性誤差或隨機誤差。(1)實際抽樣誤差。指某一特定樣本的樣本估計值與總體參數真值之間的離差。(2)抽樣平均誤差。統(tǒng)計學中常用標準差來衡量均值的代表性,所以抽樣平均誤差可以衡量樣本對總體的代表性大小。(3)抽樣極限誤差。指一定概率條件下抽樣誤差的可能范圍,也稱允許誤差。抽樣極限誤差的可能范圍與抽樣估計的可能性即概率緊密相聯(lián)。第19頁,共62頁,2023年,2月20日,星期六樣本平均數的抽樣極限誤差樣本比例的抽樣極限誤差抽樣誤差與抽樣可靠性的關系第20頁,共62頁,2023年,2月20日,星期六影響抽樣誤差的主要因素

1、抽樣單位數的多少。在其它條件不變的情況下,抽樣單位數愈多,抽樣誤差愈??;反之抽樣單位數愈少,抽樣誤差就愈大。

2、總體離散程度的高低。當其它條件不變時,總體離散程度愈低,抽樣誤差愈小;反之總體離散程度愈高,抽樣誤差愈大。

3、抽樣方法

4、組織方式第21頁,共62頁,2023年,2月20日,星期六

第3節(jié)總體均值的區(qū)間估計一、區(qū)間估計的基本原理1、大數定律大數定律主要是說明:當n足夠大時,獨立同分布的隨機變量的算術平均數趨近于數學期望;事件發(fā)生的頻率接近于其發(fā)生的概率。即樣本統(tǒng)計量接近于總體參數。2、中心極限定理中心極限定理是說明:當n充分大時,大量的起微小作用的相互獨立的隨機變量之和趨于正態(tài)分布。第22頁,共62頁,2023年,2月20日,星期六大樣本(n≥30)下總體均值的區(qū)間估計

區(qū)間估計就是根據樣本求出總體未知參數的估計區(qū)間,并使其可靠程度達到預定要求。(1)

總體方差σ2已知時由于,所以對于給定的置信度1-α,有即可見,極限誤差的計算公式為則總體均值的置信區(qū)間為第23頁,共62頁,2023年,2月20日,星期六例:從某大學學生中隨機抽取100名調查體重情況。經稱量和計算,得到平均體重為58千克。根據過去的資料知道大學生體重的標準差是10千克。在95%的置信水平下,求該大學學生平均體重的置信區(qū)間。

解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)

=1.96×1=1.96(千克)

置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。第24頁,共62頁,2023年,2月20日,星期六

(2)

總體方差σ2未知時

由于~t(n-1),對于給定的置信度1-α,有置信下限置信上限在大樣本下,總體均值的置信區(qū)間為第25頁,共62頁,2023年,2月20日,星期六例:某進出口公司出口一種名茶,規(guī)定每包重量不低于150克。現(xiàn)不重復抽取1%檢驗,結果如下。以95.45%的概率估計這批茶葉平均每包重量范圍,以確定該批茶葉是否達到要求。每包重量(克)包數xxf148——149149——150150——151151——15210205020148.5149.5150.5151.5148529907525303032.412.8228.8合計100——1503076第26頁,共62頁,2023年,2月20日,星期六解:在95.45%的概率保證下,

=2×0.087=0.174(g)

則總體平均數置信區(qū)間為即(150.126,150.474)之間說明該批茶葉達到要求。第27頁,共62頁,2023年,2月20日,星期六小樣本下(n<30)總體均值的區(qū)間估計在小樣本條件下,樣本平均數的分布依賴于總體的概率分布。若總體服從正態(tài)分布,無論樣本容量如何,樣本平均數都服從正態(tài)概率分布。若總體不服從正態(tài)分布,必須擴大樣本容量。(1)總體方差σ2已知時

總體均值的置信區(qū)間為(2)總體方差σ2未知時總體均值的置信區(qū)間為(,)第28頁,共62頁,2023年,2月20日,星期六例:某保險公司投保人年齡設某保險公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計該保險公司投保人的平均年齡。

解:當置信度為95%時,=2.26222.6544=6.00(歲)因為40.7-6.00=34.740.7+6.00=46.7所以該保險公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。

第29頁,共62頁,2023年,2月20日,星期六第4節(jié)總體比例的區(qū)間估計在大樣本條件下,若np》5,n(1-p)》5,則樣本比例趨近于正態(tài)分布。對于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。第30頁,共62頁,2023年,2月20日,星期六例:總體比例的區(qū)間估計

【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

第31頁,共62頁,2023年,2月20日,星期六例:某廠對一批產品進行質量檢驗,隨機重復抽取樣品100只,樣本合格品率為95%,試計算把握程度為90%的合格品率置信區(qū)間。

解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.645

=0.0218

Δp=zα/2=1.645×0.0218=0.0359或3.59%

95%-3.59%=91.41%,95%+3.59%=98.59%

故該批產品合格率的置信區(qū)間為(91.41%,98.59%)第32頁,共62頁,2023年,2月20日,星期六練習1、從一批產品中按不重復隨機方法抽選1/20,共200件,其中廢品8件。當概率保證程度為95.45%時,可否認為該批產品的廢品率不超過5%?2、一電視節(jié)目主持人想了解觀眾對電視節(jié)目的喜歡情況,他選取500名觀眾作樣本,結果說喜歡該節(jié)目的175人?,F(xiàn)以95%的概率估計觀眾喜歡這一節(jié)目的區(qū)間范圍。若該主持人希望估計極限誤差不超過5%,有多大把握?3、已知煉鋼廠的鐵水含碳量在正常情況下服從正態(tài)分布,其方差為0.108×0.108,現(xiàn)測定了9爐鋼水,平均含碳量4.484。按95%的可靠程度估計該廠鐵水含碳量。第33頁,共62頁,2023年,2月20日,星期六4.某市抽查25戶家庭用戶電力消費量,結果如下。試以95%的概率保證,估計全市家庭用戶電力平均消費量的置信區(qū)間、總消費量的置信區(qū)間及用電量在85度以上的比例。用電量(度)戶數45——5555——6565——7575——8585——9525963合計25第34頁,共62頁,2023年,2月20日,星期六第5節(jié)樣本容量的確定

在重置抽樣下,

所以,必要抽樣單位數在不重置抽樣下,必要抽樣單位數

第35頁,共62頁,2023年,2月20日,星期六例:某市進行職工家庭生活費抽樣調查,已知職工家庭平均每人每月生活費收入的標準差為110元,允許誤差范圍10元,概率把握程度95%,試確定應抽選的戶數。

解:例:某企業(yè)要調查產品合格率,已知以往的合格率曾有90%、98%、99%。現(xiàn)要求誤差不超過1%,把握程度為95%,問需要抽選多少件產品?解:例:要調查某校大學生英語四級考試成績,假設根據歷史資料該校學生平均成績的標準差為20分,及格率為65%?,F(xiàn)用重復抽樣方法,要求在95%的置信度下,平均分數的誤差不超過2分,及格率的誤差不超過4%,求必要抽樣數目。解:第36頁,共62頁,2023年,2月20日,星期六【例】擁有工商管理學士學位的大學畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應抽取多大的樣本容量?

解:第37頁,共62頁,2023年,2月20日,星期六影響必要抽樣數目的因素(1)允許誤差范圍Δ。當其它條件不變時,允許誤差愈小,必要的抽樣單位數就需要愈多;反之,允許誤差愈大,抽樣單位數就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數應愈多;反之,樣本單位數可愈少。(3)抽樣估計的可靠程度1-α。當其他條件不變時,抽樣估計的可靠程度愈高,zα/2數值愈大,抽樣數目就必須愈多;反之,抽樣估計的可靠程度愈低,抽樣數目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復抽樣比不重復抽樣的誤差大,所以,前者應比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數的一個原因。第38頁,共62頁,2023年,2月20日,星期六練習:1、假定總體為5000單位,被研究的標志方差不小于400,抽樣極限誤差不超過3。當概率為99.73%時,需要有多少不重復抽樣單位?(371)2、對某型號電池進行電流強度檢查,根據以往正常生產經驗,電流強度的標準差為0。4安培,合格率為90%。現(xiàn)用重復抽樣方式,要求在95.45%的置信度下,抽樣平均電流強度的誤差范圍不超過0.08安培,抽樣合格率的極限誤差不超過5%,問必要的抽樣單位數應為多少?(144)3、對某型號電子元件10000只進行耐用性能檢查。根據以往抽樣測定,求得耐用時數的均方差為51.91小時,合格率的均方差為28.62%,試計算:(1)概率保證為68.27%時,元件平均耐用時數的誤差范圍不超過9小時,在重復抽樣的條件下,要抽查多少元件?(34)(2)概率保證為99.73%時,元件合格率的極限誤差不超過5%,在重復抽樣的條件下,要抽查多少元件?(295)(3)在不重復抽樣的條件下,要同時滿足上述(1)、(2)條件,要抽查多少元件?第39頁,共62頁,2023年,2月20日,星期六4、某藥廠為了檢查瓶裝藥片數量,從成品庫隨機抽檢100瓶,結果平均每瓶101.5片,標準差為3片。試以99.73%的概率推斷成品庫中該種藥平均每瓶數量的置信區(qū)間。如果允許誤差減少到原來的1/2,其它條件不變,問需要抽取多少瓶?5、在對一條廣告效應進行的電話追蹤調查中,30名被追蹤者中有20名會想起廣告用語。試求在看過該廣告的所有人中,會想起廣告語的人所占比重的置信區(qū)間。(α=5%)6、設成年男子身高呈正態(tài)分布。某地區(qū)成年男子平均身高170厘米,標準差為2厘米。(1)若抽查10人,問這10人的平均身高介于166.2——173.8厘米之間的可能性有多大?(2)如果進行一次成年男子身高的抽樣調查,要求以95%的把握程度保證誤差不超過3厘米,問需抽查多少人?(3)如果以95%的把握保證誤差不超過1.5厘米,問需抽查多少人?這一結果與上一結果有何關系?(4)如果允許誤差仍為1.5厘米,但要求保證程度提高到99.73%,問需要抽查多少人?第40頁,共62頁,2023年,2月20日,星期六7、某公司電話咨詢服務部門在每次通話結束時都要記下通話時間,從一個由16個記錄組成的隨機樣本得出平均一次通話時間為16分鐘。已知總體服從正態(tài)分布,其標準差為0.7分鐘。試以95.45%的概率推斷總體均值的置信區(qū)間。8、某公司推出一種營養(yǎng)型豆奶,為了做好促銷工作,隨機地選取顧客詢問喜歡此豆奶情況。若要使置信度為95%,抽樣誤差不超過0.05,在下列情況下,你建議樣本的容量為多大?(1)假如初步估計約有60%的顧客喜歡此豆奶;(2)假如無任何資料可用來估計喜歡此豆奶的比例。9、對某磚廠產品質量進行抽樣調查,要求抽樣誤差不超過0.01111,概率把握程度為0.9545。已知過去進行的幾次同樣調查所得不合格產品比例為1.25%、1.23%、1.14%,試確定必要的抽樣數目。第41頁,共62頁,2023年,2月20日,星期六10、根據高教廳統(tǒng)計,某地區(qū)有17%的大學生申請免息教育貸款。假定樣本容量為300。試求:(1)當地大學生中申請免息教育貸款的總體比例的95.45%的置信區(qū)間。(2)當地大學生中申請免息教育貸款的總體比例的99%的置信區(qū)間。(3)當把握程度由95.45%提高到99%時,允許誤差如何變動?11、某職業(yè)研究所隨機抽取100名IT行業(yè)人員了解本地人員薪金,樣本均值為50124.58元,樣本標準差為1685元,試分別求IT行業(yè)人員年薪的總體均值的90%、95%和99%的置信區(qū)間。當置信水平增大時,置信區(qū)間的寬度如何變化?第42頁,共62頁,2023年,2月20日,星期六第6節(jié)其它抽樣方法及其抽樣分布特征

一、分層抽樣((Stratifiedsampling)

設總體容量為N,將總體劃分為k層(組或類),有N=N1+N2+…+Nk。從每層的Ni個單位中抽取ni個單位構成容量為n的樣本,即n=n1+n2+…+nk。從每層中抽取樣本單位時,為了保持樣本結構與總體結構相同,通常采用按(等)比例取樣,即按各層單位數占總體單位數的比例從中抽取樣本,使各層樣本單位數與各層總體單位數之比等于樣本容量與總體容量之比。即

第43頁,共62頁,2023年,2月20日,星期六分層抽樣的抽樣平均誤差重置抽樣下,不重置抽樣下,對于等比例分層抽樣,其分布特征如下:

樣本平均數總體層內方差平均數抽樣平均誤差(重復抽樣)(不重復抽樣)第44頁,共62頁,2023年,2月20日,星期六總體方差未知時樣本層內方差平均數抽樣平均誤差計算公式為(重復抽樣)(不重復抽樣)對于分層抽樣,若總體各層為正態(tài)分布或為大樣本非正態(tài)分布,則各子樣本平均數、樣本平均數均服從或近似服從正態(tài)分布。對于給定的置信度1-α,總體均值的置信區(qū)間為:第45頁,共62頁,2023年,2月20日,星期六比例的抽樣平均誤差

重置抽樣不重置抽樣總體比例未知時,其中,當總體服從或近似服從正態(tài)分布時,對于給定的置信度1-α,總體比例的置信區(qū)間為:第46頁,共62頁,2023年,2月20日,星期六例:某電視臺分別從三個縣按比例抽選600戶,調查晚間新聞的收視率和每周看電視時間(小時),結果如表所示。在95%的置信度下,求

(1)

三縣總體收視率的置信區(qū)間;

(2)

三縣住戶每周看電視的平均時間置信區(qū)間。

縣住戶抽選戶比例平均數層內方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.01第47頁,共62頁,2023年,2月20日,星期六樣本容量的確定

重復抽樣不重復抽樣分層抽樣有如下的特點:

1、由于總體方差等于組內方差與組間方差之和,所以分層抽樣的誤差一般小于簡單隨機抽樣的誤差。2、由于總體方差是唯一確定的數值,因此分層抽樣時可以擴大層間方差,縮小層內方差,使抽樣誤差減小。第48頁,共62頁,2023年,2月20日,星期六練習:

1、某鄉(xiāng)全部糧食耕地5000畝,按平原和山區(qū)面積比例抽取樣本,容量為630畝,計算各組平均畝產和標準差如下。以95%的概率保證對全鄉(xiāng)平均畝產作區(qū)間估計。全部面積抽樣面積平均畝產標準差平原山區(qū)40001000504126960750200400合計5000630918253第49頁,共62頁,2023年,2月20日,星期六2、對某公司職工的工資進行抽樣調查,共抽取600名職工,其中400名工人,200名職員,結果如下。試分別計算類型抽樣和簡單隨機抽樣的誤差,并加以比較?,F(xiàn)若采用類型抽樣方式,試對該公司職工平均工資作區(qū)間估計。如果要求誤差不超過1元,應至少抽選多少工人和職員?(置信度為95%)工人職員月工資人數月工資人數500——600600——700700——800100180120700——800800——900900——1000708050第50頁,共62頁,2023年,2月20日,星期六3、從三種不同規(guī)模的工廠中,分別隨機抽查1%機床,得到機床利用率如下,試以95.45%的概率確定全部機床利用率的置信區(qū)間。工廠類型金屬切削機床數機床利用率(%)全部抽樣小型中型大型8000250003000080250300836559第51頁,共62頁,2023年,2月20日,星期六4、假定類型抽樣的結果如下,試確定總體均值的95.45%的置信區(qū)間。區(qū)域抽取單位標志平均數標準差甲乙60030032362030第52頁,共62頁,2023年,2月20日,星期六二、等距抽樣(Systematicsampling)

如果對總體的差異程度不了解,可以按無關標志排隊。這種抽樣結果接近于簡單隨機抽樣的效果,所以可采用簡單隨機抽樣的誤差計算方法,但要注意等距抽樣通常都是不重置抽樣。如果對總體的變異程度有所了解,可以按有關標志排隊。按有關標志排隊的等距抽樣實質上運用了分層抽樣的一些特點,有利于提高樣本的代表性,與分層抽樣不同的,只是分類更細致,層數更多,在各層只抽取1個單位。因此,一般可以采用不重復分層抽樣的誤差公式來近似計算。第53頁,共62頁,2023年,2月20日,星期六按有關標志排隊并將總體單位n等分后,取樣方法有以下兩種:

1、半距中點取樣。即在每部分的中間(抽樣距離的一半)抽取一個單位組成樣本。如,第一部分取第k/2單位,第二部分取第3k/2單位,…,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個樣本。2、對稱等距取樣。即第一部分隨機抽取一個單位,然后據此在各部分中抽取兩兩對稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,…,第(n-1)部分取第(n-2)k+i單位,第n部分取第nk-i單位。這種取樣方法,既遵循隨機原則,又能取到較有代表性的樣本,并且可以抽取k個樣本。樣本容量確定的方法與不重復分層抽樣相同。第54頁,共62頁,2023年,2月20日,星期六練習1、假定對總體2000個單位進行5%的機械抽樣。試確定:(1)將總體劃分為多少個同等部分?(2)抽選的間隔如何?(3)每部分的單位數是多少?(4)能否說出抽取單位的號碼和抽取單位的總數?2、某產品零件方差為另一同類零件方差(0.12)的3倍,若以95%的可靠性估計抽樣誤差不多于0.17厘米,現(xiàn)打算從4000件零件中做機械抽樣,必須抽出多少零件做檢驗?第55頁,共62頁,2023年,2月20日,星期六三、整群抽樣(Clustersampling)

設總體N個單位劃分為R群,每群包含M個單位,即N=RM?,F(xiàn)從總體R群中隨機抽取r群,并分別對中選群的所有M個單位進行調查。整群抽樣都采用不重復抽樣。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論