§2__抽樣方法_第1頁
§2__抽樣方法_第2頁
§2__抽樣方法_第3頁
§2__抽樣方法_第4頁
§2__抽樣方法_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、抽樣方法,問題,1. 2011年高考考試中,某地有考生有2萬名,如果為了了解這些考生數(shù)學(xué)的主觀題的得分情況,我們應(yīng)該怎樣做?,2. 今有某燈泡廠生產(chǎn)的燈泡10000只,怎樣才能了解到這批燈泡的使用壽命呢?,數(shù)理統(tǒng)計(jì)是研究如何有效地收集,整理,分析受隨機(jī)影響的數(shù)據(jù),并對(duì)所考慮的問題作出推斷或預(yù)測,直至為采取決策和行動(dòng)提供依據(jù)和建議的一門學(xué)科。它是一門應(yīng)用性很強(qiáng)的學(xué)科,凡是有大量數(shù)據(jù)出現(xiàn)的地方,都要用到數(shù)理統(tǒng)計(jì)?,F(xiàn)在,數(shù)理統(tǒng)計(jì)的內(nèi)容已異常豐富,成為數(shù)學(xué)中最活躍的學(xué)科之一。教科書選擇了數(shù)理統(tǒng)計(jì)中最基本問題來介紹這門學(xué)科的思想與方法。,數(shù)理統(tǒng)計(jì)所要解決的問題是如何根據(jù)樣本來推斷總體,第一個(gè)問題:總體、

2、個(gè)體、樣本、樣本容量的概念,總體:所要考察對(duì)象的全體。,個(gè)體:總體中的每一個(gè)考察對(duì)象。,樣本:從總體中抽取的一部分個(gè)體叫做這個(gè)總體的 一個(gè)樣本。,樣本容量:樣本中個(gè)體的數(shù)目。,1. 2011年高考考試中,某地有考生有2萬名,如果為了了解這些考生數(shù)學(xué)的主觀題的得分情況,我們隨機(jī)抽取了200名考生的主觀題得分情況.,2. 今有某燈泡廠生產(chǎn)的燈泡10只,我們隨機(jī)抽取了3只做實(shí)驗(yàn)來了解到這批燈泡的使用壽命.,總體、個(gè)體、樣本、樣本容量,如何抽取樣本?怎樣使抽取的樣本充分地反映總體的況?,注意以下四點(diǎn):,(1)它要求被抽取樣本的總體的個(gè)體數(shù)有限;,(2)它是從總體中逐個(gè)進(jìn)行抽取;,(3)它是一種不放回抽

3、樣;,(4)它是一種等概率抽樣。,一般地,設(shè)一個(gè)總體的個(gè)體數(shù)為N,如果通過逐個(gè)抽取的方法從中抽取一個(gè)樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率相等,就稱這樣的抽樣為簡單隨機(jī)抽樣。,1、簡單隨機(jī)抽樣,結(jié)論,用簡單隨機(jī)抽樣,從含有N個(gè)個(gè)體的總體中抽取一個(gè)容 量為n的樣本時(shí),每次抽取一個(gè)個(gè)體時(shí)任一個(gè)體被抽到的概率 為 ;在整個(gè)抽樣過程中各個(gè)個(gè)體被抽到的概率為 ,簡單隨機(jī)抽樣體現(xiàn)了抽樣的客觀性與公平性,抽簽法,隨機(jī)抽樣的方法:,隨機(jī)數(shù)表法,練習(xí):將全班同學(xué)按學(xué)號(hào)編號(hào),制作相應(yīng)的卡片號(hào)簽,放入同一個(gè)箱子里均勻攪拌,從中抽出15個(gè)號(hào)簽,就相應(yīng)的15名學(xué)生對(duì)看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不

4、喜愛)進(jìn)行調(diào)查。分析并說明整個(gè)抽簽過程中每個(gè)同學(xué)被抽到的概率是相等的。,1、抽簽法,先將總體中的所有個(gè)體(共N個(gè))編號(hào)(號(hào)碼可以從1到N),并把號(hào)碼寫在形狀、大小相同的號(hào)簽上(號(hào)簽可以用小球、卡片、紙條等制作),然后將這些號(hào)簽放在同一個(gè)箱子里,進(jìn)行均勻攪拌。抽簽時(shí),每次從中抽出1個(gè)號(hào)簽,連續(xù)抽取n次,就得到一個(gè)容量為n的樣本。對(duì)個(gè)體編號(hào)時(shí),也可以利用已有的編號(hào)。例如學(xué)生的學(xué)號(hào),座位號(hào)等。,下面舉例說明如何用隨機(jī)數(shù)表來抽取樣本。 為了檢驗(yàn)?zāi)撤N產(chǎn)品的質(zhì)量,決定從40件產(chǎn)品中抽取10件進(jìn)行檢查,在利用隨機(jī)數(shù)表抽取這個(gè)樣本時(shí),可以按下面的步驟進(jìn)行: 第一步,先將40件產(chǎn)品編號(hào),可以編為00,01,02

5、,38,39。 第二步,在附錄1隨機(jī)數(shù)表中任選一個(gè)數(shù)作為開始,例如從第8行第9列的數(shù)5開始,為便于說明,我們將附錄1中的第6行至第10行摘錄如下。 16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 3

6、3 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,2、用隨機(jī)數(shù)表法進(jìn)行抽取,(1)隨機(jī)數(shù)表是統(tǒng)計(jì)工作者用計(jì)算機(jī)生成的隨機(jī)數(shù),并保證表中的每個(gè)位置上的數(shù)字是等可能出現(xiàn)的。,第三步,從選定的數(shù)5開始向右讀下去,得到一個(gè)兩位數(shù)字號(hào)碼59,由于5939,將它去掉;繼續(xù)向右讀,得到16,將它取出;繼續(xù)下去,又得到19,10,12,07,39,38,33,21,

7、隨后的兩位數(shù)字號(hào)碼是12,由于它在前面已經(jīng)取出,將它去掉,再繼續(xù)下去,得到34。至此,10個(gè)樣本號(hào)碼已經(jīng)取滿,于是,所要抽取的樣本號(hào)碼是 16191012073938332134,注將總體中的N個(gè)個(gè)體編號(hào)時(shí)可以從0開始,例如N100時(shí)編號(hào)可以是00,01,02,99,這樣總體中的所有個(gè)體均可用兩位數(shù)字號(hào)碼表示,便于運(yùn)用隨機(jī)數(shù)表。,注:當(dāng)隨機(jī)地選定開始讀數(shù)的數(shù)后,讀數(shù)的方向可以向右,也可以向左、向上、向下等等。 在上面每兩位、每兩位地讀數(shù)過程中,得到一串兩位數(shù)字號(hào)碼,在去掉其中不合要求和與前面重復(fù)的號(hào)碼后,其中依次出現(xiàn)的號(hào)碼可以看成是依次從總體中抽取的各個(gè)個(gè)體的號(hào)碼。由于隨機(jī)數(shù)表中每個(gè)位置上出現(xiàn)

8、哪一個(gè)數(shù)字是等概率的,每次讀到哪一個(gè)兩位數(shù)字號(hào)碼,即從總體中抽到哪一個(gè)個(gè)體的號(hào)碼也是等概率的。因而利用隨機(jī)數(shù)表抽取樣本保證了各個(gè)個(gè)體被抽取的概率相等。,2、用隨機(jī)數(shù)表法進(jìn)行抽取,隨機(jī)抽樣并不是隨意或隨便抽取,因?yàn)殡S意或隨便抽取都會(huì)帶有主觀或客觀的影響因素,(1)隨機(jī)數(shù)表是統(tǒng)計(jì)工作者用計(jì)算機(jī)生成的隨機(jī)數(shù),并保證表中的每個(gè)位置上的數(shù)字是等可能出現(xiàn)的。,(2)隨機(jī)數(shù)表并不是唯一的,因此可以任選一個(gè)數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。,(3)用隨機(jī)數(shù)表進(jìn)行抽樣的步驟:將總體中個(gè)體編號(hào);選定開始的數(shù)字;獲取樣本號(hào)碼。,(4)由于隨機(jī)數(shù)表是等概率的,因此利用隨機(jī)數(shù)表抽取樣本保證了被

9、抽取個(gè)體的概率是相等的。,抽簽法,隨機(jī)抽樣的方法:,隨機(jī)數(shù)表法,練習(xí):將全班同學(xué)按學(xué)號(hào)編號(hào),制作相應(yīng)的卡片號(hào)簽,放入同一個(gè)箱子里均勻攪拌,從中抽出15個(gè)號(hào)簽,就相應(yīng)的15名學(xué)生對(duì)看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進(jìn)行調(diào)查。,上述問題中抽取樣本的方法用隨機(jī)數(shù)表法來進(jìn)行!,規(guī)則:從39頁表中第31行第11、12列的兩位數(shù)開始,依次向下讀數(shù),到頭后再轉(zhuǎn)向它左面的兩位數(shù)號(hào)碼,并向上讀數(shù),以此下去,直到取足樣本。,2分層抽樣,當(dāng)已知總體由差異明顯的幾部分組成時(shí),為了使樣本充分地反映總體的情況,常將總體分成幾部分,然后按照各部分所占的比例進(jìn)行抽樣。其中所分成的各部分叫做層。,由于

10、分層抽樣的要求不同,各層的抽樣的樣本容量也不相同,所以,應(yīng)當(dāng)按照實(shí)際情況,合理地將樣本容量分配到各個(gè)層,以確保抽樣的合理性,研究時(shí)可以根據(jù)不同的要求來分層抽樣。,分層抽樣適用于總體由差異明顯的幾部分組成的情況,每一部分稱為層,在每一層中實(shí)行簡單隨機(jī)抽樣。這種方法較充分地利用了總體己有信息,是一種實(shí)用、操作性強(qiáng)的方法。,分層抽樣的一個(gè)重要問題是一個(gè)總體如何分層。分層抽樣中分多少層,要視具體情況而定??偟脑瓌t是:層內(nèi)樣本的差異要小,而層與層之間的差異盡可能地大,否則將失去分層的意義。,例2、一個(gè)單位的職工有500人,其中不到35歲的有125人,3549歲的有280人,50歲以上的有95人。為了了解

11、該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽取?,解:抽取人數(shù)與職工總數(shù)的比是100:5001:5,則各年齡段(層)的職工人數(shù)依次是125:280:9525:56:19,然后分別在各年齡段(層)運(yùn)用簡單隨機(jī)抽樣方法抽取。 答:在分層抽樣時(shí),不到35歲、3549歲、50歲以上的三個(gè)年齡段分別抽取25人、56人和19人。,分析:這總體具有某些特征,它可以分成幾個(gè)不同的部分:不到35歲;3549歲;50歲以上,把每一部分稱為一個(gè)層,因此該總體可以分為3個(gè)層。由于抽取的樣本為100,所以必須確定每一層的比例,在每一個(gè)層中實(shí)行簡單隨機(jī)抽樣。,分層抽樣的抽取步驟:,(1)總

12、體與樣本容量確定抽取的比例。,(2)由分層情況,確定各層抽取的樣本數(shù)。,(3)各層的抽取數(shù)之和應(yīng)等于樣本容量。,(4)對(duì)于不能取整的數(shù),求其近似值。,3系統(tǒng)抽樣,當(dāng)總體的個(gè)數(shù)較多時(shí),采用簡單隨機(jī)抽樣太麻煩,這時(shí)將總體分成均衡的部分,然后按照預(yù)先定出的規(guī)則,從每一部分中抽取1個(gè)個(gè)體,得到所需要的樣本,這種抽樣稱為系統(tǒng)抽樣。,系統(tǒng)抽樣時(shí),將總體中的個(gè)體均分后的每一段進(jìn)行抽樣時(shí),采用簡單隨機(jī)抽樣;系統(tǒng)抽樣每次抽樣時(shí),總體中各個(gè)個(gè)體被抽取的概率也是相等的;如總體的個(gè)體數(shù)不能被樣本容量整除時(shí),可以先用簡單隨機(jī)抽樣從總體中剔除幾個(gè)個(gè)體,然后再按系統(tǒng)抽樣進(jìn)行。需要說明的是整個(gè)抽樣過程中每個(gè)個(gè)體被抽到的概率仍

13、然相等。,(3)第一段用簡單隨機(jī)抽樣確定起始號(hào)碼l。,(4)按照規(guī)則抽取樣本:l;lk;l2k;lnk,系統(tǒng)抽樣的步驟為:,(1)先將總體中的N個(gè)體編號(hào).有時(shí)可直接利用個(gè)體自 身所帶的號(hào)碼.,(2)確定分段間隔k。對(duì)編號(hào)均衡地分段, 是整 數(shù)時(shí), ; 不是整數(shù)時(shí),從N中剔除一些個(gè)體,使 得其為整數(shù)為止。,系統(tǒng)抽樣與簡單隨機(jī)抽樣比較, 有何優(yōu)、缺點(diǎn)?,1、系統(tǒng)抽樣比簡單隨機(jī)抽樣更容易實(shí)施;,2、系統(tǒng)抽樣的效果會(huì)受個(gè)體編號(hào)的影響,而 簡單隨機(jī)抽樣的效果不受個(gè)體編號(hào)的影響;,3、系統(tǒng)抽樣比簡單隨機(jī)抽樣的應(yīng)用范圍廣。,4三種抽樣方法的比較,5課堂練習(xí),1、系統(tǒng)抽樣適合的總體應(yīng)是( ) A、容量較小的總

14、體;B、容量較大的總體; C、個(gè)體數(shù)較多但均衡的總體;D、任何總體,C,2、要從已編號(hào)(150)的50件產(chǎn)品中隨機(jī)抽取5件進(jìn)行檢查,用系統(tǒng)抽樣可能的編號(hào)是( ) A、5,10,15,20,25 B、3,13,23,33,43 C、1,2,3,4,5, D、2,4,8,16,32,B,3、從2005個(gè)編號(hào)中抽取20個(gè)號(hào)碼入樣,采用系統(tǒng)抽樣的方法,則抽樣的間隔為( ) A、99 B、99.5 C、100 D、100.5,C,5、某校有老師200人,男學(xué)生1200人,女學(xué)生1000人,現(xiàn)用分層抽樣的方法從所有師生中抽取一個(gè)容量為N的樣本,已知女學(xué)生中抽取的人數(shù)為80,則N=,192,4、某單位有職工160人,其中業(yè)務(wù)員有104人,管理人員32人,后期24人,現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論