抽樣設(shè)計抽樣方案總體和樣本_第1頁
抽樣設(shè)計抽樣方案總體和樣本_第2頁
抽樣設(shè)計抽樣方案總體和樣本_第3頁
抽樣設(shè)計抽樣方案總體和樣本_第4頁
抽樣設(shè)計抽樣方案總體和樣本_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三部分抽樣設(shè)計

這是一個很著名的例子。

1936年,美國總統(tǒng)選舉前夕,兩家民意測驗(yàn)機(jī)構(gòu)就誰將當(dāng)選總統(tǒng)進(jìn)行民意調(diào)查。

競選人黨派得票率F.Roosevelt民主黨60.8%A.Landon共和黨31.5%W.Lemke小黨--調(diào)查結(jié)果是:共和黨候選人Landon將以壓倒多數(shù)的票數(shù)當(dāng)選總統(tǒng)?!段膶W(xué)文摘》雜志耗資50萬,發(fā)放1000萬份問卷,回收200萬份。

蓋洛普(Gallup)美國輿論研究所抽了3000個選民,預(yù)測結(jié)果是:先來看一個例子!調(diào)查結(jié)果是:Roosevelt的得票率為54%,當(dāng)選為總統(tǒng)!《文學(xué)文摘》失敗的主要原因是:他們按照電話簿發(fā)放問卷,而當(dāng)時安裝了電話的都是比較富有的人,因此,他們所調(diào)查的結(jié)果僅代表了比較富有的人的意見,樣本缺乏代表性。由這個例子可以看出,科學(xué)地設(shè)計抽樣方法很重要!

§3.1抽樣方案設(shè)計從一定總體抽取樣本資料以前,預(yù)先確定抽樣程序和方案,在保證所抽選的樣本對總體有充分代表性的前提下,力求取得最經(jīng)濟(jì)最有效的結(jié)果。抽樣方案設(shè)計抽樣方案設(shè)計的內(nèi)容與步驟確定總體與總體目標(biāo)量確定抽樣方法提出精度要求計算樣本量確定總體目標(biāo)量的估計方法和估計效果制定實(shí)施抽樣方案的辦法和步驟§3.2總體與樣本1、總體(Population)定義:研究對象的全體分類:有限總體和無限總體元素的特點(diǎn):

(1)在抽樣調(diào)查中一般考慮有限總體,即元素個數(shù)有限

(2)個體均可識別2、總體的目標(biāo)量總和。如:全國人口總數(shù)均值。如:全校學(xué)生每月的平均支出比例:具有某種特性的單元在總體中占的比例。如:對我校本科畢業(yè)生就業(yè)前景感到樂觀的同學(xué)的比例。方差:總體中元素之間的變異程度。如:我校08級全體本科生的英語水平的變異程度。3、總體的表示形式分類描述中山校區(qū)班級閔行校區(qū)班級未觀看春晚25%10%觀看了春晚不超過2小時31%33%觀看了春晚大于等于2小時37%53%不清楚7%4%3、總總體體的的表表示示形形式式分布布描描述述彩電電的的彩彩色色濃濃度度是是彩彩電電質(zhì)質(zhì)量量好好壞壞的的一一個個重重要要指指標(biāo)標(biāo),,它它可可用用一一個個實(shí)實(shí)數(shù)數(shù)表表示示。。二十十世世紀(jì)紀(jì)七七十十年年代代在在美國國銷銷售售的的SONY牌彩彩電電有兩兩個個產(chǎn)產(chǎn)地地::美國國和日本本,兩兩地地的的工工廠廠是是按按同同一一設(shè)設(shè)計計方方案案和和相相同同的的生生產(chǎn)產(chǎn)線線生生產(chǎn)產(chǎn)同同一一牌牌號號SONY彩電電,,連連使使用用說說明明書書和和檢檢驗(yàn)驗(yàn)合合格格的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)也也是是一一樣樣的的。。關(guān)于于彩彩色色濃濃度度X的標(biāo)標(biāo)準(zhǔn)準(zhǔn)是是::目目標(biāo)標(biāo)值值為為m,公公差差為為5,即即當(dāng)當(dāng)X在[m-5,m+5]內(nèi)該該彩彩電電的的彩彩色色濃濃度度合合格格,,否否則則不不合合格格。。例::彩電電之之間間的的區(qū)區(qū)別別3、總總體體的的表表示示形形式式分布布描描述述在七七十十年年代代后后期期,,美美國國消消費(fèi)費(fèi)者者購購買買日日本本產(chǎn)產(chǎn)SONY彩電的熱熱情高于于購買美美國產(chǎn)SONY彩電,原原因何在在?兩種彩電電彩色濃濃度的分布不同。日產(chǎn)SONY彩電的彩色濃濃度服從從正態(tài)分布布N(m,25/9)美產(chǎn)SONY彩電的彩色濃濃度服從從均勻分布布U(m-5,m+5)例:彩電之間間的區(qū)別別3、總體的的表示形形式分布描述述例:彩電之間間的區(qū)別別各等級彩彩電的比比例(%)等級IIIIIIIIIIV美產(chǎn)33.333.333.30日產(chǎn)68.327.14.30.34、抽樣單單元(samplingunit)定義::把總體體按實(shí)實(shí)際情情況劃劃分成成若干干小部部分抽抽取,,這就就是抽抽樣單單元。。這些單單元應(yīng)應(yīng)互不不重疊疊且能能合成成總體體。抽樣單單元不一定定是組成成總體體的最最小單單元。。抽樣單單元還還有大大小之之分,,一個個大的的抽樣樣單元元可以以分成成一些些小的的抽樣樣單元元。樣本((sample):按一定定的程程序從從總體體中抽抽取的的一組組抽樣單單元。樣本容容量((samplingsize):樣本中中包含含的抽抽樣單單元個個數(shù)。。5、樣本本(sample)5、樣本本(sample)人們從從總體體中抽抽取樣樣本是是為了了認(rèn)識識總體體,即從樣本本推斷斷總體體,為了了使此此種推推斷有有所依依據(jù)、、推斷斷結(jié)果果有效效,對對樣本本的抽抽取應(yīng)應(yīng)有所所要求求。滿足下下面兩兩個條條件的的樣本本稱為為簡單隨隨機(jī)樣樣本,簡稱稱樣本本:(1)隨機(jī)性性:總體中中每個個個體體有相同同的機(jī)機(jī)會被選入入樣本本;(2)獨(dú)立性性:從總體體中抽抽取的的每個個樣品品對其其他樣樣本的的抽取取沒有有影響響。對無限限總體體,獨(dú)獨(dú)立性性容易易實(shí)現(xiàn)現(xiàn),對對有限限總體體,只只要總總體所所含個個體數(shù)數(shù)很大大,特特別是是與樣樣本量量相比比很大大,則則獨(dú)立立性也也可基基本得得到滿滿足。。據(jù)彭彭博博社社2005年12月3日報報道道,,美美國國《時代代》雜志志進(jìn)進(jìn)行行的的民民意意調(diào)調(diào)查查顯顯示示,,受受伊伊拉拉克克戰(zhàn)戰(zhàn)爭爭和和一一系系列列國國內(nèi)內(nèi)問問題題影影響響,,美美國國總總統(tǒng)統(tǒng)布布什什的的支支持持率率近近期期一一直直在在低低谷谷徘徘徊徊。。53%的美美國國人人不不滿滿意意布布什什的的工工作作表表現(xiàn)現(xiàn),,而而在在伊伊拉拉克克問問題題上上,,更更是是有有60%的美美國國人人對對布布什什不不滿滿。。布布什什在在伊伊拉拉克克政政策策等等領(lǐng)領(lǐng)域域的的糟糟糕糕表表現(xiàn)現(xiàn)引引發(fā)發(fā)美美國國“民心心思思變變”,高高達(dá)達(dá)60%的的美美國國人人希希望望白白宮宮的的下下一一位位主主人人,,在在類類型型上上要要與與布布什什完完全全相相反反。?!稌r代代》的這這項(xiàng)項(xiàng)民民調(diào)調(diào)是是在在11月29日至至12月1日進(jìn)行的,共共對全美各地地1004名成年人進(jìn)行行了電話采訪訪,誤差率在在正負(fù)3個百分點(diǎn)。例:伊拉克政政策讓布什支支持率墜入谷谷底總體:全體美國人,,美國人口約約24951.1萬,總體中有24951.1萬個個體;樣本:1004人,樣本容量量為1004?!罢`差率在3%之內(nèi)”的精確含意是是,“誤差率在3%之內(nèi)的可能性性為95%”。隨機(jī)調(diào)查1004人(樣本容量量)就是根據(jù)據(jù)這個精度要要求而計算出出來的。例:伊拉克政政策讓布什支支持率墜入谷谷底好樣本和壞樣樣本樣本容量的大小顯然會會影響到樣本本作為總體的的代表的可信信程度,抽取取樣本的目的的是要由樣本本的數(shù)量特征征去推斷總體體的數(shù)量特征征,由于樣本本具有隨機(jī)性性(在樣本中中包含那些個個體,不包含含那些個體是是不確定的)),用樣本特征推推斷總體特征征總是會有一一定的誤差。如何科學(xué)地從從總體中抽取取樣本,怎樣樣控制用樣本本推斷總體所所產(chǎn)生的誤差差,這是統(tǒng)計計學(xué)的主要研研究問題。但研究究的前前提是是:我我們首首先應(yīng)應(yīng)保證證樣本本是好好的!!在實(shí)踐踐中,,得到到隨機(jī)樣樣本不容易易。很很多搞搞調(diào)查查的人人就采采取簡簡單的的辦法法,這這就產(chǎn)產(chǎn)生了了各種種各樣樣的樣樣本,,也就就有了了好樣樣本和和壞樣樣本之之分。。好樣本和壞壞樣本繼續(xù)總統(tǒng)預(yù)預(yù)測的例子子。從常理來看看,應(yīng)該調(diào)調(diào)查數(shù)據(jù)越越多,結(jié)論越可靠靠。但這得以好好樣本為前前提!羅斯福的實(shí)實(shí)際得票率率為54%,《文學(xué)摘要》雜志的預(yù)測測為43%,誤差達(dá)到到11%。誤差之大大令人驚異異。這樣大大的誤差是是怎么得來來的呢?好樣本和壞壞樣本問題之一::抽樣總體體與目標(biāo)總總體不一致致經(jīng)過研究發(fā)發(fā)現(xiàn),原因因在于《文學(xué)摘要》雜志選取樣樣本有偏性性。雜志是是根據(jù)電話話簿和俱樂樂部會員的的名冊,將將問卷郵寄寄給一千萬萬人。當(dāng)時時美國四個個家庭中僅僅有一家裝裝電話。他選取的樣樣本有排斥斥窮人的選選擇偏性。。這樣的民意意測驗(yàn)非常常不利于民民主黨人羅羅斯福。好樣本和壞壞樣本許多方便樣本中都存在抽抽樣總體與與目標(biāo)總體體不一致的的問題!1、電話調(diào)查查中:以上海市民民對建設(shè)滬滬杭磁懸浮浮高速列車車的觀點(diǎn)的的調(diào)查為例例,若按照照隨機(jī)選出出的電話號號碼進(jìn)行調(diào)調(diào)查,這樣樣肯定節(jié)省省時間和資資源,但這這樣得到的的就不是一個隨隨機(jī)樣本了。如果按按照隨機(jī)選選擇的數(shù)字字(無論號號碼本上有有沒有)打打電話,那那很多電話話是空號或或單位電話話,顯然這這種樣本也也不是隨機(jī)樣樣本,它稱為方便樣本。好樣本和壞壞樣本2、其他問題題中,也有使用用方便樣本本的情況。。比如在肺癌癌研究中,,人們往往往看到吸煙煙和肺癌的的關(guān)系的數(shù)數(shù)據(jù),這些些數(shù)據(jù)并不不是整個人人群中采集集的隨機(jī)樣樣本,它們們可能只是是醫(yī)院中的的病人記錄錄中得到的的。在雜志和報報紙上也有有問卷,但但得到的只只是擁有這這份報刊,,而且愿意意回答的人人的觀點(diǎn)。。好樣本和壞壞樣本問題之二::可能存在在不回答偏偏性《文學(xué)摘要》雜志調(diào)查的的一千萬人人中只有二二百四十萬萬人回答了了問卷,不回答者可可能非常有有別于回答答者,這二百四四十萬人代代表不了被被郵寄問卷卷的一千萬萬人。譬如,1936年《文學(xué)摘要》雜志的一次次專門的調(diào)調(diào)查,給在在芝加哥的的選民每三三人寄去一一張問卷。。約20%的被調(diào)查者者作了回答答,其中支支持蘭登的的超過半數(shù)數(shù)。但是在在選舉中,,蘭登在芝芝加哥的得得票率只有有三分之一一。所以當(dāng)出現(xiàn)現(xiàn)高不回答答率時,謹(jǐn)謹(jǐn)防不回答答偏性。好樣本和壞壞樣本在調(diào)查中,,即使選擇擇對象的確確是隨機(jī)的的,最理想想的情況所所得到的樣樣本也只代代表那些愿愿意回答問問題人的觀觀點(diǎn)所組成成的總體,,沒有回答問問題的人的的觀點(diǎn)永遠(yuǎn)遠(yuǎn)不會被這這種調(diào)查的的樣本所代代表。心理研究表表明,低收收入和高收收入的人傾傾向于不回回答問卷,,因此中等等收入的人人在回答者者中的比例例過高。為為此現(xiàn)代調(diào)調(diào)查機(jī)構(gòu)更更喜歡采用用親自詢問問來代替郵郵寄問卷。。好樣本和壞壞樣本即使親自詢詢問,也有有不回答偏性性的問題。訪問員來訪訪時,不在在家的人與與在家接受受訪問的人人可能在工工作時間、、家庭關(guān)系系和社會背背景等方面面有比較大大的差異,,從而看法法也不一樣樣。例如有一項(xiàng)項(xiàng)關(guān)于快餐餐的市場調(diào)調(diào)查。抽取取500戶家庭進(jìn)行行調(diào)查。白白天訪問時時,有150戶家庭沒人人。能不能僅用用白天有人人的350戶家庭的數(shù)數(shù)據(jù)?不能能。這里有有不回答偏偏性。白天天不在家的的150戶可能是吃吃快餐比較較多的家庭庭。好樣本和壞壞樣本問題之三::對目標(biāo)總總體缺乏了了解《文學(xué)摘要》不了解其目目標(biāo)總體,,沒有考慮慮到安裝電電話與未安安裝電話的的居民的特特征,導(dǎo)致致樣本不具具代表性。。好樣本和壞壞樣本蓋洛普也失失誤過!1948年蓋洛普的的民意調(diào)查查預(yù)測共和和黨候選人人杜威將戰(zhàn)勝民主主黨候選人人杜魯門,而選舉舉結(jié)果正正好相反反。樣本出現(xiàn)現(xiàn)了偏差差!當(dāng)時城市市居民傾傾向于投投民主黨黨的票,,農(nóng)名傾傾向于投投共和黨黨的票。。第二次次世界大大戰(zhàn)后,,美國大大量人口口從農(nóng)村村流向城城市。而而蓋洛普普對人口口總體的的認(rèn)識卻卻仍停留留在1940年的狀況況,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論