




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章 簡單隨機抽樣 1.本章要點 簡單隨機抽樣是抽樣中最根本、最成熟、也是最簡單的抽樣設計方式,是一切概率抽樣方法開展、比較的根底。 要求經過學習熟練掌握簡單隨機抽樣的抽樣方式和樣本抽選方法; 熟知總體均值、總體總值和總體比例的簡單估計; 掌握樣本量確實定;了解子總體的估計。2.第一節(jié) 抽樣方式3. 簡單隨機抽樣也稱純隨機抽樣。對于大小為的總體,抽取樣本量為的樣本,假設全部能夠的樣本被抽中的概率都相等,那么稱這樣的抽樣為簡單隨機抽樣。根據抽樣單位能否放回可分為放回簡單隨機抽樣和不放回簡單隨機抽樣。 一放回簡單隨機抽樣 二不放回簡單隨機抽樣 三不放回與放回簡單隨機抽樣的比較 一、什么是簡單隨機
2、抽樣4.一放回簡單隨機抽樣 假設抽樣是有放回的,那么每次抽取都都是從 個總體單位中抽取,這時能夠的樣本為 個思索樣本單位的順序或 個不思索樣本單位的順序,每個樣本被抽中的概率為 或 ,這種抽樣方式就是放回簡單隨機抽樣,所得的樣本稱為放回的簡單隨機樣本。思索與不思索樣本單位順序的放回簡單隨機抽樣,有一個共同的特點,即同一個單位有能夠在同一個樣本中反復出現。但是他們也有明顯的區(qū)別:一是能夠的樣本數不同;二是樣本的概率分布不同,由此會導致估計量的概率分布不同。 5. 可以證明,不思索順序的放回簡單隨機抽樣的估計量的方差大于等于思索順序的放回簡單隨機抽樣的估計量的方差,因此在抽樣實際中,假設用到放回簡
3、單隨機抽樣這種方式,也只討論和運用思索順序的情形。 6.二不放回簡單隨機抽樣 假設抽樣是無放回的,即同一個單位不能在樣本中反復出現,那么,假設思索樣本單位的順序,那么能夠的樣本為 個,每個樣本被抽中的概率為 ;假設不思索樣本單位的順序,那么能夠的樣本為 個,每個樣本被抽中的概率為 。這樣的抽樣方式就是不放回簡單隨機抽樣,所得的樣本稱為不放回簡單隨機樣本。 7. 思索樣本單位順序與不思索樣本單位順序的不放回簡單隨機抽樣,除了單位不能夠在同一個樣本中反復出現這一共同特點外,還有一個共同點,即雖然他們的能夠樣本數不同,思索順序是不思索順序的 倍,但是它們的樣本卻有一樣的概率分布。由此會導致依據樣本構
4、造的估計量的概率分布也是一樣的。 由于這一共同點的存在,加之不思索順序的放回簡單隨機抽樣的任務量更小,所以抽樣實際中對于不放回簡單隨機抽樣,只討論和運用不思索順序不放回簡單隨機抽樣這種方式。 8.(三)不放回與放回簡單隨機抽樣的比較 1、每次抽取樣本單位面對的總體構造不同。這是二者的主要不同之處。這一點使得前者的數學處置相對簡單。 2、樣本提供的信息量不同。顯然,在樣本量一定的條件下,由于后者提供的信息量大于前者,其抽樣效率更高。 在實際中,普通多采用不思索順序的不放回簡單隨機抽樣,所以以下討論如無特別闡明,都指這一類簡單隨機抽樣。 9.二、簡單隨機樣本的抽選方法 簡單隨機樣本的抽選,首先要將
5、總體 個單位從1到 編號,每個單位對應一個號;然后從所編的號中抽號,假設抽到某個號,那么對應的那個單位入樣,直到抽夠 個單位為止。 一抽簽法 二隨機數法 10.一抽簽法 當總體不大時,可分別采用兩種方法抽取。一種是全樣本抽選法,另一種是逐個抽選法,按這兩種方法抽到的 個單位的樣本是等價的,每個被抽到的樣本的概率都等于 。11.二隨機數法 當總體較大時,抽簽法實施起來比較困難,這時可以利用隨機數表、隨機數骰子、搖獎機、計算機產生的偽隨機數進展抽樣。1、利用隨機數表進展抽選。隨機數表是一張由0,1,2,9這十個數字組成的,普通常用的是五位數的隨機數字表,10個數字在表中出現的順序是隨機的,每個數字
6、都有同樣的時機被抽中。12. 用隨機數表抽選簡單隨機樣本時,普通可根據總體大小 的位數決議在隨機數表中隨機抽取幾列,比如 =768,要從中抽取 =10的簡單隨機樣本,那么在隨機數表中隨機抽取相鄰的3列,順序往下或往上,選出前10個001到768之間的互不一樣的數,假設這3列隨機數字不夠,可另選其他3列繼續(xù),直到抽夠個 單位為止。13. 用此種方法,當 的最高位數較小,比如小于5,且不小 時,由于讀到的隨機數被舍棄不用的比例較大,抽選效率較差。此時采用下面的方法。在隨機數表中隨機抽取3列,順序往下,假設得到的隨機數大于247,小于989由于247的4倍為988,因此000及989到999的數字應
7、舍棄,那么用這個數除以247,得到的余數入樣,顯然這種方法效率要高得多。隨機數表的起始頁和起始點都運用隨機數產生。14.3、利用搖獎機進展抽選。 4、利用計算機產生的偽隨機數進展抽選。通常產生的偽隨機數有循環(huán)周期。因此在有條件的情況下,普通不建議運用此種方法。 2、利用隨機數骰子進展抽選。15.一簡單隨機抽樣在抽樣實際中的位置它是抽樣中最容易掌握的技術、也是開展最成熟的技術,建立了最完備的實際。簡單隨機抽樣也是比較其他抽樣設計方法優(yōu)劣的根底。其他抽樣方法技術都是在它的實際技術根底上,針對它的局限開展起來的。 三、簡單隨機抽樣在抽樣實際中的位置 與局限性16. 假設總體單位數 很大時,編制抽樣框
8、困難;抽樣框中即使有輔助信息也不加利用,使得估計的統計效率較其他利用輔助信息的抽樣設計方法低;由于樣本在總體中的地理分布范圍較廣,假設采取面訪,那么費時、費錢、費力,困難較大;能夠得到一個“差的簡單隨機樣本;假設不用計算機,而用隨機數表或隨機數骰子抽取一個大樣本,比較勞神單調。 二簡單隨機抽樣的局限性17.四、有關目的與符號指 標 總 體 樣 本 總值均值比例比率有限總體方差無限總體方差18.第二節(jié) 總體均值與總體總值的簡單估計19.一簡單估計量的定義 三簡單估計量 的方差四簡單估計量 的方差的無偏估計 二簡單估計量 的無偏性五放回簡單隨機抽樣的簡單估計 六設計效應七影響估計量精度的要素一、總
9、體均值的簡單估計 20.一簡單估計量的定義 對于簡單隨機抽樣,最簡單的估計是利用樣本均值作為總體均值的估計,即總體均值的簡單估計量為: 也就是說,樣本均值是總體均值的簡單估計量。21.二簡單估計量 的無偏性對于簡單隨機抽樣, 是 的無偏估計,即有 證明: 這就是對稱性論證法。由于總體中每一個單位的入樣概率都相等,所以不放回簡單隨機抽樣是一種等概率抽樣。 22.(三)簡單估計量 的方差 式中, 抽樣比; 為有限總體校正系數。 證明: 根據對稱性論證法,有 23.因此有24. (四)簡單估計量 的方差的無偏估計 的無偏估計是: 式中 為樣本方差。 證明: 25.根據對稱性論證法及 的表達式,有 由
10、此可得: 26.五放回簡單隨機抽樣的簡單估計 現實中有許多情況下,抽樣必需是放回的,即從總體中抽中的單位每次都要放回總體中去。例如在城市中對行人、車輛的調查,對超市顧客、影劇院觀眾的調查等抽樣都是有放回的,從而,有能夠反復抽中某些單位。 對于每次抽到的結果(視為隨機變量) 都有 27.由此可以證明: 留意到 28.因此樣本方差 是無限總體方差 的無偏估計量。 方差 的一個無偏估計是: 思索樣本單位順序的放回簡單隨機抽樣也是等概率抽樣。 29.這闡明除非 =1,否那么在一樣的樣本量下,放回簡單隨機抽樣的方差總是大于不放回的方差,即它的抽樣效率普通比不放回簡單隨機抽樣的低。根據抽樣設計效應定義:
11、放回簡單隨機抽樣的 為:30.【例3-3】為調查某大學學生的電信消費程度,在全校=15230名學生中,用簡單隨機抽樣的方法抽得一個=36的樣本。對每個抽中的學生調查其上個月的電信支出金額如表3-6所示。試以95%的置信度估計該校大學生該月電信消費的平均支出額。 樣本序號消費額元樣本序號消費額元樣本序號消費額元123456789101112453671317089337522567951314151617181920212223244853243941931959111643576252627282930313233343536835133252890175743146194731. , , ,
12、 , , 。因此,對該校大學生某月的電信消費的人均支出額的估計為53.64元,由于置信度95%對應的 =1.96,所以,可以以95%的把握 說該校大學生該月的電信消費的人均支出額大約在53.641.966.5,即41.6165.67元之間。 假設采取放回簡單隨機抽樣,那么: , , ,以95%的把握估計該校大學生該月的電信消費的人均支出額大約在53.641.966.1428,即41.6065.68元之間。 計算結果闡明,不放回比放回簡單隨機抽樣估計的置信區(qū)間略小一些。由于總體較大而抽樣比較小,所以兩者之間相差很小。解:根據題意和表中數據,可計算得:32. 總體總值為總體均值的 倍,即 一簡單估
13、計量的定義 N倍的樣本均值是總體總值的簡單估計量,即 二、總體總值的簡單估計 只需我們有了總體均值的估計結果,就可以很容易地推出總體總值的估計結果。33.由于總體總值是總體均值的N倍,其簡單估計量也是總體均值估計量的N倍,而N是固定常數,所以總體總值的簡單估計量的性質由總體均值的簡單估計量的性質來決議。 容易證明的無偏估計為 二簡單估計量的性質34.【例3.4】試以95%的置信度估計例3.3中該校大學生該月電信消費的總支出額。解:依題意,N=15230,根據例3.3計算的結果,可估計該校大學生該月電信消費的總支出額為 元。在不放回簡單隨機抽樣下, =1523037.6444 =1523037.
14、6444=8731 727 749元, 元, 以95%的把握估計該校大學生該月電信消費的總支出額為: 816 937.21.9693 443.71元即在633 787.531 000 086.87元之間。 假設為放回簡單隨機抽樣,那么可得: 1523037.7336 =8752417947元, 元,以95%的把握估計該校大學生該月電信消費的總支出額為816 937.21.9693 554.36元,即在633 570.651 000 303.75元之間。35.第三節(jié) 總體比例的簡單估計36.規(guī)定 設總體中有 個單位,具有某種屬性的單位數為 ;不具有該種屬性的單位數為 。具有某種屬性的單位比例為:
15、 不具有該種屬性的單位的比例為: 因此對總體比例的估計就是對總體均值的估計,對總體中具有某種屬性單位的總個數 的估計是對總體總值估計的一個特例。 一、問題的提法 37.一簡單估計量的定義 二、總體比例的簡單估計量及其性質 根據調查要求,利用簡單隨機抽樣的方式隨機抽取個單位組成樣本,其中 個具有某種屬性,那么樣本比例樣本均值 就是總體比例 的簡單估計量; 就是總體中具有某種屬性單位的總個數 的簡單估計量。 38.二估計量的性質1、 是 的無偏估計。即有:2、 的方差為:3、 的無偏估計量是 ,即39.當 都比較大時,我們以正態(tài)分布給出 及 的近似置信區(qū)間置信度為 為:修正后的 與 的置信區(qū)間分別
16、為:40. 【例3.5】試以95%的置信度估計例3.3中該校大學生該月電信消費支出超出80元的人數及其比例。解:根據例3.3所給的資料可知, =15230, =36, 7, =1.96。由此可計算得: 于是 的95%的置信區(qū)間為 的95%的置信區(qū)間為0.0496 ,0.3392 =(755,5166)。 =0.0496,0.339241.第四節(jié) 樣本量確實定42. 在抽樣調查的實際方法研討中,樣本量確實定既有重要的實際意義,又有現實的適用價值。樣本量過大,不符合抽樣調查的目的;過小,那么抽樣誤差偏大,無法保證估計精度的要求。樣本量確實定主要受兩個方面要素的影響和制約: 一是對抽樣估計量精度的要
17、求。對于一個確定的抽樣設計,估計量的精度要求高意味著要求的抽樣誤差小,而要想抽樣誤差小,就必需樣本量大。而總體單位調查標志的變異程度、總體的大小、樣本設計和所運用的估計量、回答率等都是影響估計精度的要素,從而也是影響樣本量的要素。一、確定樣本量主要思索的要素43. 二是實踐調查運作的限制。調查的經費能支持多大的樣本?允許調查繼續(xù)的時間有多長?需求多少調查人員?雖然有些限制要素在樣本量的計算公式中還無法表達,但是在確定最終所需的樣本量時必需加以思索。實際中樣本量確實定是在多種約束條件下進展的折衷過程。 由于大部分限制約束條件不便于量化,確定樣本量的計算公式時往往只在抽樣精度與調查費用兩者之間權衡
18、。采用兩種不同的方式來確定:一種是在總費用一定的條件下使精度最高;另一種是在滿足一定精度要求的條件下使費用最小。 44.給定絕對誤差限 、相對誤差限 和變異系數 的允許上限的樣本量確定公式,即分別有: 二、估計總體均值總值的樣本確定45. 由于總體方差 和總體均值 未知,因此在利用上述公式時,必需事先對它們做出估計。實踐任務中,可以經過以往對同類問題調查積累的閱歷來估計,也可以經過預調查來估計,或經過其他調查方法和定性分析方法獲得。 對于復雜抽樣設計方法,由于確定樣本量的公式比較復雜,經常難于計算。在同樣精度要求的條件下,簡單隨機抽樣的樣本量 相對容易獲得,這時可以利用3.21式先計算復雜抽樣
19、設計的設計效應 ,然后再間接推算復雜抽樣設計方法所需求的樣本量 ,即有: 46.【例3.6】在例3.3中,假設要求以95%的置信度估計該校大學生該月人均電信消費支出的絕對允許誤差不超越5元,樣本量應確定為多少? 解:根據所給條件: =15230, =5,置信度95%對應的規(guī)范正態(tài)分布表的上側分位數為 1.96,且 =8.41,據此可計算得: = 也就是說,至少應抽取一個樣本量為206的簡單隨機樣本,才干滿足95%置信度條件下絕對誤差不超越5元的精度要求。47.根據樣本比例 的方差公式 可以推得: 其中 同樣可求得給定絕對誤差限 、相對誤差限 和變異系數 的允許上限的樣本量確定公式,即分別有:
20、在無限總體或放回抽樣情形下, 即為所確定的樣本量。 三、估計總體比例的樣本量確定48.【例3.7】 在例3.5中,假設要求以95%的置信度估計該校大學生該月電信消費支出超出80元的人數比例的相對允許誤差不超越10%,樣本量至少應為多少?解:根據例3.5所給的資料和計算的結果可知: =15230, =36, 7, =1.96。 ,由此可計算得: 計算結果闡明,至少應抽取一個樣本量為1442的簡單隨機樣本,才干滿足95%置信度條件下相對允許誤差不超越10%的精度要求。49.四、逆抽樣法 現實中有這樣一種情況,即總體中具有所思索屬性的單位數很少,也就是說 值很小。對于此類稀有事件的比例估計問題,利用
21、前面給出的公式確定樣本量有困難。 霍丹Haldane1945年提出一種稱為逆抽樣的方法,專門用于此類小比例的抽樣。50.第五節(jié) 子總體估計51.一、問題的提出 我們把總體中具有某種共同屬性特征的單位的集合稱為子總體。 對子總體的處置有多種方法:假設每個子總體在編制抽樣框時就可以區(qū)分開,可以采用分層抽樣方法進展估計;假設事先不能將各個子總體區(qū)分開來,但是事先可以知道各個子總體的單位數 ,那么可采用事后分層的方法進展估計;還有一種情況是,既不能事先將各個子總體區(qū)分開來,又無法事先知道各個子總體的單位數 。本節(jié)的討論僅限于后一類子總體的估計 。52. 二、子總體均值的估計樣本均值是子總體均值的無偏估
22、計量53.式中 為第 個子總體的抽樣比,子總體的方差未知,可用其樣本方差 其方差為 來估計。至此我們的問題并沒有處理,由于 未知,所以 也是未知的。 54. 我們可以將單位能否屬于第 個子總體看作是總體單位的一個屬性特征,那么 就是總體的比例 ,而 就是其樣本的比例 , 是 的無偏估計,因此有由于 和 都是固定的,所以 因此可用 來估計 據此我們可得到 的無偏估計量為55. 上一小節(jié)處理了子總體均值的估計問題,但是由于 未知,子總體總值的估計問題依然沒有得到處理。 定義記它們可以分別用 , 進展估計。三、子總體總值的估計56.于是有 57. 總體總值 也就是子總體總值 的一個簡單無偏估計為 它的方差為 58.而樣本方差 因此 的一個無偏估計為 59.編號為奇數的習題答案3.1判別以下抽取方式能否為等概率抽樣:(1)是 (2)否 (3)是 (4)否60.3.3為調查某中學學生的每月購書支出程度,在全校名學生中,用不放
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 英文國際海運合同模板
- 校企合作合同延期詳情在線查閱
- 綠色建筑環(huán)保驗收服務合同
- 脾臟影像診斷
- 技術合作合同
- 歷史遺留房屋買賣合同樣本
- 含外債離婚合同范本
- 度新能源設備供應合同
- 科研成果轉化合同
- 合同范本揭秘:演藝經紀合作指南
- 第六部分 帶束層設計子午線輪胎設計
- GB/T 33744-2017地震應急避難場所運行管理指南
- 2022初三體育中考仿真模擬測試實施方案
- c語言程序設計第7章數組課件
- 儲能熱管理行業(yè)專題報告
- “科學與文化論著研習”學習任務群的課程論分析
- 租車費結算單
- 陜北民歌之簡介課件
- 近視眼的防控課件
- 食品添加劑 亞硫酸鈉標準文本(食品安全國家標準)
- 抖音直播運營團隊薪酬績效考核管理方案(直播帶貨團隊薪酬績效提成方案)
評論
0/150
提交評論