版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大學(xué)生平均每月的手機(jī)話費(fèi)支出是多少?導(dǎo)入案例某大學(xué)經(jīng)濟(jì)管理學(xué)院大學(xué)生月手機(jī)話費(fèi)抽樣調(diào)查表月支出電話費(fèi)用/元學(xué)生人數(shù)/人30以下2330~505050~702970~901390以上11合計(jì)126
大學(xué)生平均每月的手機(jī)話費(fèi)支出是多少?導(dǎo)入案例分析在社會(huì)生產(chǎn)實(shí)踐中,常常會(huì)遇到這樣一些問題,如對(duì)某些產(chǎn)品質(zhì)量的檢驗(yàn)、藥品藥效的檢驗(yàn)、煙花爆竹的檢驗(yàn)等。因其檢驗(yàn)過程對(duì)產(chǎn)品本身具有破壞性而不可能進(jìn)行全面調(diào)查獲取總體資料。而統(tǒng)計(jì)的研究對(duì)象是大量的社會(huì)經(jīng)濟(jì)現(xiàn)象總體的數(shù)量方面。那么,如何獲取這些現(xiàn)象的總體資料呢?通過本章的學(xué)習(xí)就能夠找到答案。目錄1第一節(jié)抽樣推斷概述2第二節(jié)抽樣誤差3第三節(jié)參數(shù)估計(jì)4第四節(jié)抽樣調(diào)查的組織方式第一節(jié)抽樣推斷概述1一抽樣推斷概述一、抽樣推斷的概念與特點(diǎn)(一)抽樣推斷的概念抽樣調(diào)查是一種科學(xué)的非全面調(diào)查方法,是指按照隨機(jī)性原則從總體中抽取一部分單位進(jìn)行調(diào)查,以獲得各項(xiàng)數(shù)據(jù)。抽樣推斷是進(jìn)一步運(yùn)用數(shù)理統(tǒng)計(jì)的原理,根據(jù)抽樣調(diào)查的數(shù)據(jù),對(duì)總體現(xiàn)象本質(zhì)的認(rèn)識(shí)。抽樣包括抽樣調(diào)查和抽樣推斷兩部分。一抽樣推斷概述(二)抽樣推斷的特點(diǎn)抽樣調(diào)查是一種非全面調(diào)查,調(diào)查的目的不在于了解部分單位的情況,它只是作為進(jìn)一步推斷的手段,目的在于要認(rèn)識(shí)總體的數(shù)量特征。(1)抽樣推斷是由部分推算整體的一種認(rèn)識(shí)方法一抽樣推斷概述抽樣調(diào)查可以是隨機(jī)抽樣,也可以是非隨機(jī)抽樣,但是作為抽樣推斷的前提必須是隨機(jī)抽樣。隨機(jī)抽樣指從總體中抽取樣本單位時(shí),樣本單位的中選機(jī)會(huì)均等。
這樣做的原因之一是可以利用概率論的原理對(duì)調(diào)查的結(jié)果做出具有一定可靠程度的估計(jì)與推斷;二是防止出現(xiàn)由于主觀抽選被調(diào)查單位帶來的傾向性誤差。(2)抽樣推斷是建立在隨機(jī)取樣的基礎(chǔ)上一抽樣推斷概述以抽樣調(diào)查的樣本指標(biāo)數(shù)值來推斷總體指標(biāo)數(shù)值,雖然存在一定誤差,但這種誤差在抽樣調(diào)查之前是可以計(jì)算的,并能根據(jù)統(tǒng)計(jì)研究的任務(wù)、目的、精確性等,采取相應(yīng)的措施加以控制,使抽樣推斷的結(jié)論達(dá)到一定的可靠程度。這也是抽樣調(diào)查不同于其他調(diào)查方式的重要區(qū)別之一。(3)抽樣推斷的誤差可以事先計(jì)算并進(jìn)行控制一抽樣推斷概述二、抽樣推斷的作用(1)對(duì)某些不必要或不可能進(jìn)行全面調(diào)查而又要了解全面情況的現(xiàn)象,采用抽樣調(diào)查獲取資料可以大大節(jié)省人力、財(cái)力、物力,有利于提高經(jīng)濟(jì)效益和統(tǒng)計(jì)資料的時(shí)效性。(2)抽樣調(diào)查和全面調(diào)查同時(shí)進(jìn)行,可以發(fā)揮相互補(bǔ)充和驗(yàn)證的作用。(3)抽樣調(diào)查是開展專題研究、提供信息咨詢的重要手段。一抽樣推斷概述三、抽樣推斷的基本概念(一)抽樣單位和抽樣框1.總體和樣本總體是抽樣推斷所要研究對(duì)象的全部單位組成的整體,也稱母體??傮w的特點(diǎn)是,在一個(gè)總體中,各單位具有某種(或某些)相同的性質(zhì),同時(shí),在各個(gè)個(gè)體的某個(gè)標(biāo)志值之間又往往存在著差異。樣本是總體的一部分,它是由從總體中抽取出來的單位組成的整體,也稱子樣。如果說總體是由各個(gè)同質(zhì)單位組成的一個(gè)母集,則樣本是來自該母集的一個(gè)子集,樣本代表總體,是總體的一個(gè)縮影,因此,可以用樣本的數(shù)量特征對(duì)總體的數(shù)量特征進(jìn)行估計(jì)和推斷。一抽樣推斷概述2.抽樣框要從一個(gè)總體中抽選樣本,很重要的一個(gè)問題就是需要一個(gè)包括全部總體單位的框架,以此代表總體,從中抽取樣本單位。從中抽取樣本的這個(gè)框架就稱為抽樣框。它的作用就是將無形的總體變成有形的事物以便于實(shí)際抽取。一抽樣推斷概述要很好地理解抽樣框,需要區(qū)分一對(duì)概念:目的總體和被抽樣總體。在統(tǒng)計(jì)研究中,根據(jù)研究目的所確定的理想總體,就是目的總體。但是,有時(shí)目的總體非常復(fù)雜,尤其在社會(huì)經(jīng)濟(jì)調(diào)查中,我們想得到一個(gè)包括目的總體全部單位的框架往往很難,只能用一個(gè)接近目的總體,并且容易取得和便于操作的框架來代替,這就是被抽樣總體,即抽樣框包含的總體范圍。一抽樣推斷概述抽樣框有以下幾種具體表現(xiàn)形式:一種是一覽表(即名單或目錄),顧名思義,就是將總體全部單位的名稱羅列起來;另一種是地圖,調(diào)查對(duì)象與地理分布有關(guān)的時(shí)候,往往借助于地圖,根據(jù)地圖上的自然或人工標(biāo)志,例如,河流、公路、自然村落、城市街區(qū)等將調(diào)查區(qū)域劃分成可以進(jìn)行抽樣的單位;還有一種是時(shí)間抽樣框,有些抽樣單位是隨時(shí)間推移而變化的,例如,生產(chǎn)流水線上的產(chǎn)品、街道路口的汽車流量等。一抽樣推斷概述3.抽樣單位抽樣單位是構(gòu)成抽樣框的基本要素,它與總體單位的關(guān)系有以下兩種情況:一種是抽樣單位就是總體的基本單位,在總體單位數(shù)不大并且比較集中的情況下,一般是從總體單位中直接抽取若干形成樣本,這時(shí)抽樣單位與總體單位一致;另一種情況是抽樣單位是總體單位的集合,在總體單位數(shù)很大,抽樣比較復(fù)雜時(shí),我們一般不直接從總體中抽取總體單位,而是首先抽取若干總體單位的集合(比如整群抽樣),或者通過幾個(gè)階段來抽取總體單位(比如多階段抽樣),這時(shí),抽樣單位與總體的基本單位往往是不一致的。此時(shí),抽樣框就是抽樣單位的名單。一抽樣推斷概述抽樣單位的不同劃分,是針對(duì)不同抽樣方法而言的。若抽樣單位只包含一個(gè)個(gè)體,并且沒有分級(jí),與之相對(duì)應(yīng)的是簡單隨機(jī)抽樣;若抽樣單位中包含若干個(gè)體,與之對(duì)應(yīng)的是整群抽樣;在抽樣單位分級(jí)情況下,與之對(duì)應(yīng)的是多階段抽樣。由于抽樣單位可以分級(jí),于是就有了與之相對(duì)應(yīng)的不同級(jí)上的抽樣框。抽樣實(shí)踐中,抽選哪一級(jí)抽樣單位,有同級(jí)的抽樣框即可。一抽樣推斷概述(二)樣本容量和樣本可能數(shù)目1.樣本容量樣本容量是指一個(gè)樣本中所包含的單位數(shù)的多少。總體單位數(shù)通常用N表示,樣本容量一般用n表示。在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,總體單位數(shù)N一般很大,有時(shí)可以是無限多的,樣本容量n相對(duì)于總體單位數(shù)N一般是很小的。
的樣本叫小樣本,的樣本叫大樣本。根據(jù)數(shù)理統(tǒng)計(jì)理論,在用樣本數(shù)量特征去推斷總體數(shù)量特征時(shí),大樣本與小樣本兩種不同條件下,使用的推斷方法也有所不同。社會(huì)經(jīng)濟(jì)現(xiàn)象的抽樣推斷中,絕大多數(shù)采用的是大樣本。一抽樣推斷概述2.樣本可能數(shù)目樣本可能數(shù)目是指按一定抽樣方法和一定樣本容量從總體中抽取樣本時(shí),所有可能的樣本組合個(gè)數(shù),一般用M表示。對(duì)于無限總體,樣本可能數(shù)目也是無限多的;對(duì)于有限總體,樣本可能數(shù)目與總體單位數(shù)、樣本容量以及所用的抽樣方法有關(guān)。按照隨機(jī)原則從總體中具體抽取樣本單位時(shí),按抽樣的方法來分,有重復(fù)抽樣和不重復(fù)抽樣兩種。一抽樣推斷概述重復(fù)抽樣又稱回置抽樣,其具體做法是:從總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次從總體中抽取一個(gè)單位,觀察登記后,將該單位放回總體,保持總體單位數(shù)不變,再進(jìn)行下一個(gè)單位的抽取,如此反復(fù)n次,直到抽足n個(gè)單位為止。重復(fù)抽樣具有這樣的特點(diǎn):n次抽取可以看作n次獨(dú)立試驗(yàn),每次抽取是在完全相同的條件下進(jìn)行的,因此每個(gè)單位中選或不中選的機(jī)會(huì)在各次都完全一樣。但是,采用重復(fù)抽樣的方法,同一單位有可能被反復(fù)抽到,從而會(huì)影響樣本的代表性,抽樣誤差較大。一般來講,整群抽樣和多階段抽樣方式不宜采用這種方法。一抽樣推斷概述不重復(fù)抽樣又稱不回置抽樣,其具體做法是:從總體N個(gè)單位中抽取一個(gè)容量為n的樣本,每次從總體中隨機(jī)抽取一個(gè)單位,觀察登記后不再放回總體,在此基礎(chǔ)上抽取第二個(gè)單位,依次類推。不重復(fù)抽樣有這樣的特點(diǎn):每次抽樣以后,總體都會(huì)少一個(gè)單位。因此,不重復(fù)抽樣的每次抽取都會(huì)影響到下一次,n次抽取不是相互獨(dú)立的。所以,不重復(fù)抽樣的每次抽一個(gè),連續(xù)抽n次,相當(dāng)于一次從總體中抽出n個(gè)單位組成樣本。由于每次抽取時(shí)總體單位數(shù)不同,每個(gè)單位中選或不中選的機(jī)會(huì)在各次是不同的。一抽樣推斷概述在不重復(fù)抽樣中,每個(gè)單位只有一次被抽中的機(jī)會(huì),不可能被抽中兩次或兩次以上。因此,在樣本容量相同的情況下,采用不重復(fù)抽樣方法抽選出來的樣本的代表性高于用重復(fù)抽樣方法抽選出來的樣本的代表性。實(shí)際工作中,多采用不重復(fù)抽樣的方法。一抽樣推斷概述根據(jù)對(duì)樣本的要求不同,在采用重復(fù)抽樣和不重復(fù)抽樣方法的基礎(chǔ)上,又有考慮順序抽樣和不考慮順序抽樣兩種??紤]順序的抽樣,即從總體N個(gè)單位中取n個(gè)單位組成樣本時(shí),不但要考慮樣本的構(gòu)成單位,還要考慮樣本中各單位的中選順序,即使是相同單位組成的樣本,若各單位中選順序不同,也作為不同的樣本。不考慮順序的抽樣,即從總體個(gè)單位中抽取個(gè)單位組成樣本,只考慮樣本的組成單位,而不管各單位的中選順序,只要樣本的組成單位相同,都作為同一個(gè)樣本。一抽樣推斷概述(1)考慮順序的重復(fù)抽樣的樣本可能數(shù)目??紤]順序和不考慮順序抽樣,與重復(fù)抽樣和不重復(fù)抽樣方法相聯(lián)系,就產(chǎn)生了四種情況:考慮順序的重復(fù)抽樣,考慮順序的不重復(fù)抽樣,不考慮順序的重復(fù)抽樣,不考慮順序的不重復(fù)抽樣。采用重復(fù)抽樣的方法從總體N個(gè)單位中抽取一個(gè)容量為n的樣本,在考慮順序的情況下,可以看作進(jìn)行n次抽取,每次抽取都有N種不同的抽法,所以:一抽樣推斷概述(2)考慮順序的不重復(fù)抽樣的樣本可能數(shù)目。采用不重復(fù)抽樣的方法從總體N個(gè)單位中抽取一個(gè)容量為n的樣本,在考慮順序的情況下,可能樣本數(shù)目可以看作從N個(gè)單位中抽取n個(gè)單位的排列,即:一抽樣推斷概述(3)不考慮順序的重復(fù)抽樣的樣本可能數(shù)目。采用重復(fù)抽樣的方法從總體N個(gè)單位中抽取一個(gè)容量為n的樣本,在不考慮順序的情況下,可能組成的樣本個(gè)數(shù)等于從N+n-1個(gè)單位中抽取n個(gè)單位的組合,即:一抽樣推斷概述(4)不考慮順序的不重復(fù)抽樣的可能樣本數(shù)目。采用不重復(fù)抽樣的方法從總體N個(gè)單位中抽取一個(gè)容量為n的樣本,在不考慮順序的情況下,可能組成的本個(gè)數(shù)可以看作從N個(gè)單位中抽取n個(gè)單位的組合,即:應(yīng)用以上4個(gè)公式,應(yīng)注意分析樣本的具體要求,根據(jù)提出的問題確定樣本可能數(shù)目。一抽樣推斷概述(三)參數(shù)和統(tǒng)計(jì)量1.參數(shù)參數(shù)即總體指標(biāo),是根據(jù)總體中各單位的變量值或?qū)傩蕴卣饔?jì)算的、反映總體數(shù)量特征的綜合指標(biāo)。由于總體是唯一確定的,根據(jù)總體計(jì)算的指標(biāo)也是唯一確定的,所以,總體指標(biāo)也稱為總體參數(shù)。不同性質(zhì)的總體,需要計(jì)算不同的總體指標(biāo)。對(duì)于變量總體,由于各單位的標(biāo)志表現(xiàn)可以用數(shù)量表示,所以可以計(jì)算總體平均數(shù)(或總體成數(shù)P),總體方差和總體標(biāo)準(zhǔn)差。一抽樣推斷概述設(shè)總體單位變量值分別為:,則有:(簡單算術(shù)平均數(shù))(加權(quán)算術(shù)平均數(shù))或一抽樣推斷概述方差:(簡單式)(加權(quán)式)或一抽樣推斷概述標(biāo)準(zhǔn)差:(簡單式)(加權(quán)式)或一抽樣推斷概述對(duì)于屬性總體,由于各單位的標(biāo)志表現(xiàn)不能用數(shù)量來表示,所以,其總體指標(biāo)常以成數(shù)指標(biāo)P來表示總體中具有某種屬性的單位數(shù)占總體全部單位數(shù)的比重,以Q
表示總體中不具有某種屬性的單位數(shù)占總體全部單位數(shù)的比重。一抽樣推斷概述設(shè)總體N個(gè)單位中,有N1個(gè)單位具有某種屬性,N0個(gè)不具有某種屬性,則有:在抽樣調(diào)查中,總體指標(biāo)的意義和計(jì)算方法是明確的,但指標(biāo)的具體數(shù)值事先未知,需要用樣本指標(biāo)來估計(jì)。屬性總體的平均數(shù)就是成數(shù)P,即:其方差和標(biāo)準(zhǔn)差分別為:一抽樣推斷概述2.統(tǒng)計(jì)量統(tǒng)計(jì)量即樣本指標(biāo),是由樣本中各單位的變量值或?qū)傩蕴卣饔?jì)算的、反映樣本數(shù)量特征的綜合指標(biāo)。與總體指標(biāo)相對(duì)應(yīng),樣本指標(biāo)有樣本平均數(shù)、樣本成數(shù)、樣本方差
和樣本標(biāo)準(zhǔn)差。為了與總體指標(biāo)相區(qū)別,樣本指標(biāo)用小寫字母表示。一抽樣推斷概述對(duì)于從變量總體中抽選出來的樣本,設(shè)樣本各單位變量值分別為,則有:(簡單算術(shù)平均數(shù))(加權(quán)算術(shù)平均數(shù))或一抽樣推斷概述方差:(簡單式)(加權(quán)式)或一抽樣推斷概述標(biāo)準(zhǔn)差:(簡單式)(加權(quán)式)或一抽樣推斷概述對(duì)于從屬性總體中選出來的樣本,設(shè)樣本n個(gè)單位中,有n1個(gè)單位具有某種屬性,n0個(gè)單位不具有某種屬性,則有:由于從一個(gè)總體中可以抽取多個(gè)樣本,樣本不同,樣本指標(biāo)的數(shù)值也不同,所以樣本指標(biāo)不是唯一確定的,是個(gè)隨機(jī)應(yīng)量,因此,樣本指標(biāo)也稱為樣本統(tǒng)計(jì)量。屬性總體的平均數(shù)就是成數(shù)P,即:其方差和標(biāo)準(zhǔn)差分別為:一抽樣推斷概述四、抽樣推斷的理論基礎(chǔ)大數(shù)定律與中心極限定理是與統(tǒng)計(jì)學(xué)密切相關(guān)的重要數(shù)學(xué)定理,它們?yōu)槌闃油茢嗵峁┝藬?shù)學(xué)理論基礎(chǔ)。獨(dú)立同分布的隨機(jī)變量,并且有數(shù)學(xué)期望和方差
,則對(duì)任意的正數(shù),有(一)大數(shù)定律一抽樣推斷概述該定理說明,當(dāng)充分大時(shí),獨(dú)立同分布的一系列隨機(jī)變量,其平均數(shù)與它們共同的期望值之間的偏差,可以有很大把握被控制在任意給定的范圍之內(nèi)。由于從總體中抽出的樣本是獨(dú)立且與總體同分布的,因此當(dāng)樣本容量充分大時(shí),樣本平均與總體平均之間的誤差可以有很大的把握被控制在任意給定的要求之內(nèi),這就是用樣本平均估計(jì)總體平均的理論依據(jù)。一抽樣推斷概述由于比率指標(biāo)是一個(gè)特殊的平均數(shù),大數(shù)定律對(duì)比率指標(biāo)自然也成立,設(shè)是次試驗(yàn)中事件發(fā)生的次數(shù),是事件發(fā)生的概率,則對(duì)于任意的正數(shù),有即當(dāng)充分大時(shí),事件發(fā)生的頻率接近(依概率收斂于)事件發(fā)生的概率,反映了頻率在大量重復(fù)試驗(yàn)過程中的穩(wěn)定性。該定理稱為貝努里大數(shù)定律,它提供了用頻率代替概率的理論依據(jù)。一抽樣推斷概述大數(shù)定律表明:盡管個(gè)別現(xiàn)象受偶然因素影響,有各自不同的表現(xiàn),但是對(duì)總體在大量觀察后進(jìn)行平均,就能使偶然因素的影響相互抵消,消除由個(gè)別偶然因素引起的極端性影響,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律。一抽樣推斷概述(二)正態(tài)分布再生定理如果變量服從正態(tài)分布,總體平均數(shù)是,標(biāo)準(zhǔn)差是,從這個(gè)總體中抽出一個(gè)容量是的樣本,則樣本平均數(shù)也服從正態(tài)分布,其平均數(shù)仍是,其標(biāo)準(zhǔn)差是。從正態(tài)分布的再生定理可以看出,只要總體變量服從正態(tài)分布,則從中抽取的樣本,不管是多少,樣本平均數(shù)都服從正態(tài)分布。但是在客觀實(shí)際中,總體并非都是正態(tài)分布。對(duì)于從非正態(tài)分布總體中抽取的樣本平均數(shù)的分布問題,需要由中心極限定理來解決。一抽樣推斷概述(1)樣本平均數(shù)的中心極限定理。從任一比率為,方差為的0-1分布總體中,抽取容量為的樣本,其樣本比率的分布會(huì)隨著的增大而趨近于平均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。
(2)樣本比率的中心極限定理。(三)中心極限定理從任一比率為,方差為的0-1分布總體中,抽取容量為的樣本,其樣本比率的分布會(huì)隨著的增大而趨近于平均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。第二節(jié)抽樣誤差2二抽樣誤差一、抽樣誤差的概念及影響因素(一)抽樣誤差的概念抽樣誤差是指樣本指標(biāo)和全及指標(biāo)之間的差數(shù)。具體來說,就是樣本平均數(shù)和全及平均數(shù)之間的差數(shù),或是樣本成數(shù)和全及成數(shù)之間的差數(shù)。因?yàn)槌闃诱{(diào)查只是從全及總體中抽取一部分單位進(jìn)行調(diào)查,即使做到嚴(yán)格地遵守隨機(jī)原則,要使樣本總體的結(jié)構(gòu)與全及總體的結(jié)構(gòu)完全一致是不可能的,只要樣本總體的結(jié)構(gòu)與全及總體的結(jié)構(gòu)稍有不同,計(jì)算出來的樣本指標(biāo)就不會(huì)與全及指標(biāo)完全一致,而是存在一定的差異。在抽樣調(diào)查過程中,會(huì)發(fā)生許多種誤差。一種是登記性誤差,這是由于沒有如實(shí)登記,或者登記、匯總錯(cuò)誤等造成的。這種登記性誤差可以通過提高調(diào)查人員的思想和業(yè)務(wù)水平,改進(jìn)調(diào)查方法和組織工作,建立嚴(yán)格的工作責(zé)任制等加以避免。另一種誤差是代表性誤差,它又分為兩種情況:其一是在抽樣過程中,沒有按照隨機(jī)原則取樣,存在人為的主觀因素在內(nèi),是因破壞了隨機(jī)原則造成的。這種誤差叫偏差,是應(yīng)該避免的。其二是在抽樣過程中,嚴(yán)格按照隨機(jī)原則取樣(消除登記性誤差和偏差的條件下),由于用樣本指標(biāo)代替全及總體指標(biāo)所引起的誤差。這種誤差是不可避免的,而且是按隨機(jī)原則產(chǎn)生的,稱為隨機(jī)誤差。抽樣誤差一般是指隨機(jī)誤差。抽樣誤差是衡量抽樣調(diào)查準(zhǔn)確性的指標(biāo)。抽樣誤差越大,表明樣本總體對(duì)全及總體的代表性越小,抽樣調(diào)查的結(jié)果越不可靠。反之,抽樣誤差越小,表明樣本總體的代表性越大,抽樣調(diào)查越準(zhǔn)確可靠。二抽樣誤差(二)影響抽樣誤差大小的因素1.樣本單位數(shù)的多少在其他條件不變的情況下樣本單位數(shù)越多,抽樣誤差越??;反之,樣本單位數(shù)越少,抽樣誤差越大。這是因?yàn)殡S著樣本單位數(shù)的增加,樣本結(jié)構(gòu)就越接近總體的結(jié)構(gòu)。二抽樣誤差2.總體標(biāo)志變異程度的大小在其他條件不變的情況下,總體被研究標(biāo)志的變異程度越大,抽樣誤差也越大;反之,總體被研究標(biāo)志的變異程度越小,抽樣誤差也越小。這是因?yàn)榭傮w標(biāo)志變異程度小,表示總體各單位標(biāo)志值之間的差異小,則抽樣指標(biāo)與總體指標(biāo)之間的差異可能也小。如果總體各單位標(biāo)志值相等,即標(biāo)志變動(dòng)度等于零,這時(shí)抽樣指標(biāo)就完全等于總體指標(biāo),抽樣誤差也就不存在了。所以,抽樣誤差的大小是同全及總體被研究標(biāo)志的變異程度成正比的。二抽樣誤差3.抽樣調(diào)查的組織方式不同的組織方式產(chǎn)生的誤差不同。一般說來,機(jī)械抽樣和分類抽樣由于先把全及總體各單位分組排隊(duì),因而較其他抽樣組織方式更能保證樣本單位在全及總體中分布均勻,從而提高樣本的代表性。因此,這種抽樣組織方式比其他方式抽樣誤差小。二抽樣誤差4.抽樣方法抽樣方法不同,抽樣誤差也不同,一般來說,重復(fù)抽樣比不重復(fù)抽樣的誤差要大些。二、抽樣平均誤差抽樣平均誤差是抽樣誤差的一般水平,它的數(shù)值隨著可能抽取的樣本不同而或大或小,所以是個(gè)隨機(jī)變量。為了總的衡量樣本代表性的高低,就需要計(jì)算抽樣誤差的一般水平,抽樣平均誤差就是反映抽樣誤差一般水平的指標(biāo)。通常是用抽樣平均數(shù)的標(biāo)準(zhǔn)差或抽樣成數(shù)的標(biāo)準(zhǔn)差來作為衡量誤差一般水平的尺度。這是因?yàn)?,抽樣平均?shù)的平均數(shù)等于總體平均數(shù),而抽樣成數(shù)的平均數(shù)等于總體成數(shù),所以抽樣標(biāo)準(zhǔn)差恰好反映了抽樣指標(biāo)的平均離差程度。二抽樣誤差設(shè)以表示抽樣平均數(shù)的平均誤差,表示樣本平均數(shù),表示總體平均數(shù),表示樣本可能數(shù)目,則設(shè)為抽樣成數(shù)的平均誤差,為樣本成數(shù),為總體成數(shù),則二抽樣誤差以上公式表明了抽樣平均誤差的意義。但是由于樣本可能數(shù)目很多,總體指標(biāo)與
也是不知道的,故按上述公式來計(jì)算抽樣平均誤差實(shí)際上是不可行的。在實(shí)用上要推導(dǎo)出其他公式來計(jì)算,下面直接給出這些公式并加以討論。(一)抽樣平均數(shù)的平均誤差1.重復(fù)抽樣【例題】數(shù)理統(tǒng)計(jì)證明:在純隨機(jī)重復(fù)抽樣條件下,抽樣平均誤差與全及總體的標(biāo)準(zhǔn)差成正比,而與樣本總體單位數(shù)的平方根成反比。根據(jù)這個(gè)關(guān)系可得出純隨機(jī)重復(fù)抽樣平均數(shù)抽樣誤差的計(jì)算公式為:式中,為全及總體的標(biāo)準(zhǔn)差,為全及總體方差;為樣本總體的單位數(shù)。解二抽樣誤差【例7-1】設(shè)有4個(gè)工人的全及總體,他們的月工資是:甲140元、乙150元、丙170元、丁180元,則其平均工資和工資標(biāo)準(zhǔn)差為:二抽樣誤差現(xiàn)以重復(fù)抽樣方法從4人總體中隨機(jī)抽取2人組成樣本,計(jì)算樣本平均工資,用以代表4人總體的工資水平,共可組成16個(gè)樣本。每個(gè)樣本都可算出平均收入(),它們與總體平均收入()都有個(gè)離差,下面用表7-1列示出來。二抽樣誤差表7-1重復(fù)抽樣誤差計(jì)算表二抽樣誤差樣本工資收入/元樣本平均數(shù)離差離差平方甲甲140140140-20400甲乙140150145-15225甲丙140170155-525甲丁140180160-00乙甲150140145-15225乙乙150150150-10100乙丁150180165+525丙甲170140155-525丙丙170170170+10100丙丁170180175+15225丁乙180150165+525丁丙180170175+15225丁丁180180180+25400合計(jì)—2560—200016個(gè)樣本平均的平均數(shù)為:按定義:二抽樣誤差抽樣平均誤差按純隨機(jī)重復(fù)抽樣平均數(shù)抽樣誤差的計(jì)算公式:按定義和按公式計(jì)算的抽樣平均誤差完全相同。從以上計(jì)算過程,可以得出幾個(gè)基本關(guān)系:(1)抽樣平均數(shù)的平均數(shù)等于總體平均數(shù),即。(2)抽樣平均誤差小于總體標(biāo)準(zhǔn)差,即<,重復(fù)抽樣時(shí)僅為總體標(biāo)準(zhǔn)差的,所以抽樣平均數(shù)作為估計(jì)量更是有效的。(3)抽樣平均誤差和總體標(biāo)準(zhǔn)差是成正比的,與樣本單位數(shù)的平方根成反比。因此,要想減少抽樣平均誤差以提高抽樣指標(biāo)的代表性,只能增大樣本單位數(shù),因?yàn)榭傮w標(biāo)準(zhǔn)差是不能改變的(它是客觀存在的)。例如,抽樣平均誤差減少1/2,則樣本單位數(shù)必須增大到4倍;抽樣平均誤差要減少到原來的1/3,則樣本的單位數(shù)就要擴(kuò)大到9倍。二抽樣誤差2.不重復(fù)抽樣有不重復(fù)抽樣的條件下,抽樣平均數(shù)的平均誤差不但和總體變異程度、樣本單位數(shù)有關(guān),而且和總體單位數(shù)N的多少有關(guān)。其計(jì)算公式為:當(dāng)總體單位數(shù)N很大時(shí),公式中的N-1可以用N代替。所以,在實(shí)際計(jì)算時(shí),不重復(fù)抽樣的抽樣平均的平均誤差可用下式計(jì)算:二抽樣誤差將上面重復(fù)抽樣和不重復(fù)抽樣的平均誤差公式相比,兩者相差一個(gè)修正系數(shù)(1-n/N),這個(gè)修正系數(shù)是大于0而小于1的正數(shù)??梢姡谕瑯訔l件下,不重復(fù)抽樣的平均誤差永遠(yuǎn)小于重復(fù)抽樣的平均誤差。在不重復(fù)抽樣情況下,如果全及總體單位數(shù)很多,樣本單位數(shù)又很少時(shí),n/N的數(shù)值接近于零,(1-n/N)接近于1,于是修正系數(shù)的作用不大了。又因?yàn)樵S多社會(huì)經(jīng)濟(jì)現(xiàn)象不能進(jìn)行重復(fù)抽樣,所以在實(shí)際抽樣調(diào)查中,一般都采用不重復(fù)抽樣方法進(jìn)行抽樣,而采用重復(fù)抽樣的公式計(jì)算抽樣平均誤差,這樣計(jì)算的結(jié)果偏大。二抽樣誤差【例7-2】現(xiàn)仍以【例7-1】中4個(gè)工人工資的例子,用不重復(fù)抽樣的方法從總體中隨機(jī)抽取2人組成樣本,則可能出現(xiàn)的樣本情況如表7-2所示。二抽樣誤差樣本工次收入/元樣本平均數(shù)離差離差平方甲乙140150145-15225甲丙140170155-525甲丁1401801600.0乙甲150140145-15225乙丁150180165+525丙甲170140155-525丙丁170180175+15225丁乙180150165+525丁丙180170175+15225合計(jì)
1920—1000表7-2不重復(fù)抽樣誤差計(jì)算表按定義抽樣平均誤差:12個(gè)樣本平均數(shù)的平均數(shù):二抽樣誤差按公式抽樣平均誤差:兩者計(jì)算結(jié)果完全相同。由上可知,在不重復(fù)抽樣的條件下,抽樣平均數(shù)的平均數(shù)仍然等于總體平均數(shù),而它的抽樣平均誤差9.13元?jiǎng)t比重復(fù)抽樣的平均誤差11.18元小。3.總體方差的確定方法上面介紹的重復(fù)或不重復(fù)條件下的抽樣平均誤差公式,只有掌握總體標(biāo)準(zhǔn)差的數(shù)值才能計(jì)算,但是總體標(biāo)準(zhǔn)差一般是不知道的。二抽樣誤差實(shí)際工作中常用下面的方法來確定:(1)用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,即用代替。理論和實(shí)踐都證明,只要樣本總體單位數(shù)量多(n>50)時(shí),抽樣總體的標(biāo)準(zhǔn)差與全及總體的標(biāo)準(zhǔn)差是相當(dāng)接近的。所以,這種方法是可行的。但是只能在抽樣調(diào)查之后方能計(jì)算。(2)用過去調(diào)查資料的標(biāo)準(zhǔn)差。如果歷史上做過同類型的全面調(diào)查或抽樣調(diào)查,就使用過去所掌握的總體標(biāo)準(zhǔn)差或樣本標(biāo)準(zhǔn)差。(3)抽取一個(gè)小樣本進(jìn)行估計(jì)。如果既沒有歷史資料,又需要在調(diào)查之前就要計(jì)算抽樣平均誤差,則可組織一次小規(guī)模的試驗(yàn)性抽樣調(diào)查,計(jì)算出抽樣標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值。二抽樣誤差【例7-3】一批新燈泡共500只,用純隨機(jī)抽樣方式從中抽取25只進(jìn)行燈泡壽命的檢驗(yàn)。經(jīng)計(jì)算,燈泡的平均壽命為1500h,樣本標(biāo)準(zhǔn)差為60h,求抽樣平均誤差。重復(fù)抽樣:解二抽樣誤差不重復(fù)抽樣:計(jì)算結(jié)果表明,樣本平均壽命為1500h,它的總體平均壽命的抽樣平均誤差在重復(fù)抽樣時(shí)為12h,不重復(fù)抽樣時(shí)為11.70 h。(二)抽樣成數(shù)的平均誤差抽樣成數(shù)平均誤差的計(jì)算方法與平均數(shù)抽樣誤差的計(jì)算方法基本上是一樣的,首先要求出成數(shù)的總體方差。要計(jì)算成數(shù)的總體方差,須先求出成數(shù)的平均數(shù)。前面講過,某一現(xiàn)象有兩種表現(xiàn)時(shí),例如合格或不合格,用N1代表具有某種表現(xiàn)的總體單位數(shù),N0代表不具有某種表現(xiàn)的總體單位數(shù);假定N1的變量值為1,N0的變量值為0,則它們的平均數(shù)為:二抽樣誤差由此可見,成數(shù)的平均數(shù)是成數(shù)本身,即成數(shù)是一種最簡單的平均數(shù),是只取0和1兩個(gè)變量值的變量的平均數(shù)。根據(jù)標(biāo)準(zhǔn)差的計(jì)算公式,成數(shù)的標(biāo)準(zhǔn)差為:由此可見,成數(shù)的標(biāo)準(zhǔn)差就是具有某一標(biāo)志表現(xiàn)的單位在總體中的成數(shù)和不具有這一標(biāo)志表現(xiàn)的單位在總體中的成數(shù)二者乘積的平方根。二抽樣誤差因此可以從抽樣平均數(shù)的平均誤差和總體標(biāo)準(zhǔn)差的關(guān)系推出抽樣成數(shù)平均誤差的計(jì)算公式為:抽樣成數(shù)平均誤差公式中的P是總體的成數(shù),一般也是無法知道的。這時(shí)我們也可以用實(shí)際抽樣的樣本成數(shù)來代替,或用已掌握的歷史同類現(xiàn)象的相應(yīng)成數(shù)來代替。二抽樣誤差在總體單位數(shù)N較大的情況下,近似地為:不重復(fù)抽樣:重復(fù)抽樣:【例7-4】從10000件產(chǎn)品中隨機(jī)抽取200件進(jìn)行質(zhì)量檢查,發(fā)現(xiàn)其中有10件不合格,問合格率的抽樣平均誤差是多少?先求樣本產(chǎn)品的合格率,即抽樣成數(shù):解二抽樣誤差用重復(fù)抽樣計(jì)算成數(shù)抽樣平均誤差:用不重復(fù)抽樣計(jì)算成數(shù)抽樣平均誤差:計(jì)算結(jié)果表明,樣本的合格率為95%,它與總體合格率之間的抽樣平均誤差為1.53%。三、抽樣極限誤差(一)抽樣極限誤差的意義抽樣極限誤差是指抽樣指標(biāo)與總體指標(biāo)之間抽樣誤差的可能范圍,又叫抽樣誤差范圍。用樣本指標(biāo)來估計(jì)總體指標(biāo),總是要產(chǎn)生誤差,兩者完全相等幾乎是不可能的。由于樣本是隨機(jī)抽取的,樣本指標(biāo)是隨機(jī)變量,所以要確切地指出某一抽樣指標(biāo)究竟誤差有多大,也幾乎是不可能的,我們只能把抽樣誤差控制在一定的范圍內(nèi),這就需要研究抽樣極限誤差。二抽樣誤差由于總體指標(biāo)是一個(gè)確定的數(shù),而抽樣指標(biāo)則圍繞著總體指標(biāo)左右變動(dòng),它與總體指標(biāo)可能產(chǎn)生正離差,也可能產(chǎn)生負(fù)離差,抽樣指標(biāo)變動(dòng)的上限或下限與總體指標(biāo)之差的絕對(duì)值就可以表示抽樣誤差的可能范圍,我們將這個(gè)抽樣誤差的可能范圍稱為抽樣極限誤差。二抽樣誤差設(shè)與分別表示抽樣平均數(shù)與抽樣成數(shù)的誤差范圍,則有:二抽樣誤差將上列等式變成相應(yīng)不等式為:上式表明,抽樣平均數(shù)是以總體平均數(shù)為中心,在之間變動(dòng),區(qū)間(,)稱為平均數(shù)的估計(jì)區(qū)間,區(qū)間總長度為;同樣,抽樣成數(shù)是以總體成數(shù)為中心,在之間變動(dòng),區(qū)間(,)稱為成數(shù)的估計(jì)區(qū)間,區(qū)間總長度為
。由于總體平均數(shù)和成數(shù)是未知的,它需要靠實(shí)測的抽樣平均數(shù)和成數(shù)來估計(jì),因而抽樣限誤差的實(shí)際意義是希望總體平均數(shù)落在抽樣平均數(shù)的范圍內(nèi),總體成數(shù)落在抽樣成數(shù)的范圍內(nèi),因此上述不等式應(yīng)該變換為:容易驗(yàn)證后面兩個(gè)不等式和前面兩個(gè)不等式是完全等價(jià)的,前面兩個(gè)不等式成立,后面的兩個(gè)不等式也同樣成立?!纠?-3】中的25只樣本燈泡的平均壽命為1500h,抽樣平均誤差為12h,用這個(gè)誤差來推斷全部500只燈泡的平均壽命:,即總體的平均壽命在1488~1512h之間。二抽樣誤差(二)抽樣誤差的可靠程度抽樣極限誤差的估計(jì)總是要和一定的概率保證程度聯(lián)系在一起的。因?yàn)榧热怀闃诱`差是一個(gè)隨機(jī)變量,就不能期望抽樣平均數(shù)(或成數(shù))落在一定區(qū)間內(nèi)是一個(gè)必然事件,而只是給予一定的概率保證而已。所以在進(jìn)行抽樣估計(jì)時(shí),不但要考慮抽樣誤差的可能范圍有多大,而且還必須考慮落到這一范圍的概率有多大。數(shù)理統(tǒng)計(jì)證明,如果抽樣單位數(shù)達(dá)到足夠多的條件下,抽樣誤差范圍的變化和抽樣的可靠程度之間具有密切聯(lián)系,抽樣誤差范圍越擴(kuò)大,抽樣的可靠程度也越高;反之,當(dāng)抽樣誤差范圍越小時(shí),抽樣的可靠程度也越低。二抽樣誤差數(shù)理統(tǒng)計(jì)還證明,在大樣本條件下,抽樣平均數(shù)服從正態(tài)分布。因此抽樣誤差范圍同概率的關(guān)系是這樣的:當(dāng)誤差范圍為1倍平均誤差時(shí),其概率為0.6827,即68.27%;當(dāng)誤差范圍擴(kuò)大為2時(shí),其概率為0.9545,即95.45%;當(dāng)誤差范圍擴(kuò)大為3時(shí),其概率為0.9973,即99.73%。二抽樣誤差上面列舉的抽樣誤差擴(kuò)大的倍數(shù),叫概率度,用符號(hào)t表示。而擴(kuò)大或縮小后的誤差就是極限誤差(或允許誤差),用符號(hào)表示。【例7-3】中500只燈泡的估計(jì)中,當(dāng)概率度t=1時(shí),允許誤差為h,估計(jì)的概率為68.27%,當(dāng)t=2時(shí),許誤差
h,估計(jì)的概率為95.45%。由此得出,允許誤差、概率度和抽樣平均誤差三者之間的關(guān)系式為:二抽樣誤差抽樣極限誤差通常是以抽樣平均誤差作為標(biāo)準(zhǔn)來衡量的,用或分別除或,得出相對(duì)數(shù)為t概率度,表示相對(duì)誤差范圍。其計(jì)算公式為:二抽樣誤差抽樣極限誤差也可以表示為抽樣平均誤差的若干倍,其倍數(shù)即是概率度(t),用公式表如下:抽樣極限誤差(△)可以用倍的抽樣平均誤差()來表示,在抽樣平均誤差一定的條件下,概率度的數(shù)值越大,則抽樣極限誤差的范圍也越大,抽樣指標(biāo)代表總體指標(biāo)所作的估計(jì)的可靠程度也就越高;反之,概率度的數(shù)值越小,則抽樣極限誤差的范圍也越小,抽樣指標(biāo)代表總體指標(biāo)所作的估計(jì)的可靠程度也就越低。如果把可靠程度(即概率)用P來表示,那么就是
t
的函數(shù),也就是P=f(t),表明概率分布是概率度的函數(shù)。二抽樣誤差從一個(gè)全及總體中連續(xù)進(jìn)行多次抽樣,可以得到一系列的樣本,分別求出各個(gè)樣本的平均數(shù)(或成數(shù)),便可形成一個(gè)抽樣平均數(shù)(或成數(shù))的概率分布。根據(jù)中心極限定理證明,不論全及總體是否屬于正態(tài)分布,只要當(dāng)抽樣總體單位數(shù)足夠多時(shí)(一般以n>30為標(biāo)準(zhǔn)),則抽樣平均數(shù)(或成數(shù))的分布,逼近于以全及平均數(shù)(或成數(shù))為對(duì)稱中心的正態(tài)分布。二抽樣誤差其主要特點(diǎn)是:(1)若干個(gè)抽樣平均數(shù)(或成數(shù))大于或小于全及平均數(shù)(或成數(shù))的概率分布是完全對(duì)稱的,即正誤差和負(fù)誤差的可能性(即概率)是完全一致的。(2)抽樣平均數(shù)(或成數(shù))越接近全及平均數(shù)(或成數(shù)),其出現(xiàn)的可能性越大;反之,抽樣平均數(shù)越遠(yuǎn)離全及平均數(shù),其出現(xiàn)的可能性越小。隨著概率度的增大,概率的數(shù)值也隨之增大,逐漸接近于1。這說明預(yù)定的概率保證程度越大,則抽樣推斷估計(jì)的可靠程度越大。二抽樣誤差為了方便計(jì)算,在實(shí)際工作中,按不同t的值和相應(yīng)的F(t)編制成正態(tài)分布概率表供查用。下面列舉幾個(gè)常用的概率度和概率之間的函數(shù)數(shù)量關(guān)系,詳見表7-3。利用概率表,我們可以根據(jù)概率度查出相應(yīng)的概率保證程度,也可以按規(guī)定的概率保證程度來估計(jì)可能的誤差范圍。二抽樣誤差表7-3概率度和概率的函數(shù)關(guān)系表tF(t)1.000.68274.6450.90001.960.95002.000.95452.580.99003.000.9973(三)抽樣極限誤差的計(jì)算1.平均數(shù)的抽樣極限誤差重復(fù)抽樣:不重復(fù)抽樣:二抽樣誤差2.成數(shù)的抽樣及限誤差二抽樣誤差重復(fù)抽樣:不重復(fù)抽樣:【例7-5】解二抽樣誤差某燈泡廠檢查一批燈泡,按隨機(jī)原則抽取100只進(jìn)行壽命檢驗(yàn),查得平均使用壽命為1600h,標(biāo)準(zhǔn)差為50h,在概率為95%的保證下,求抽樣極限誤差。根據(jù)題意s=50,n=100,由F(t)=95%,查表得t=1.96,按重復(fù)抽樣公式計(jì)算:【例7-6】解二抽樣誤差根據(jù)題意,由N=6000,n=300,n0=45,F(xiàn)(t)=95.45%,查表得t=2,于是樣本合格率為:按不重復(fù)抽樣公式計(jì)算:從6000件產(chǎn)品中,隨機(jī)抽查300件,發(fā)現(xiàn)45件不合格,在概率為95.45%時(shí),求抽樣極限誤差。=4.06%第三節(jié)參數(shù)估計(jì)3三參數(shù)估計(jì)一、估計(jì)量及其評(píng)價(jià)標(biāo)準(zhǔn)參數(shù)估計(jì)是用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù),如用樣本均值估計(jì)總體均值,樣本比例估計(jì)總體比例。用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量。如果估計(jì)總體均值時(shí),樣本均值、樣本中位數(shù)或者樣本眾數(shù),哪一個(gè)是最好的估計(jì)量?統(tǒng)計(jì)學(xué)家給出了以下三個(gè)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn),滿足這些標(biāo)準(zhǔn)的估計(jì)量才是優(yōu)良估計(jì)量。三參數(shù)估計(jì)(一)無偏性如果估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),即則該估計(jì)量為無偏估計(jì)量。從總體中抽出不同的樣本就可以計(jì)算出不同的估計(jì)值,估計(jì)值與被估計(jì)的總體參數(shù)的真實(shí)值之間有偏差,但是如果把所有的樣本都抽選出來,估計(jì)值的均值等于被估計(jì)總體參數(shù)的真實(shí)值,也就是說雖然某個(gè)估計(jì)值與總體參數(shù)有偏差,但平均而言估計(jì)是沒有偏差的。三參數(shù)估計(jì)(二)有效性估計(jì)量的方差越小,則估計(jì)就越有效。如果有兩個(gè)無偏估計(jì)量,具有較小方差的估計(jì)量的值更接近總體參數(shù),估計(jì)量的所有取值應(yīng)該集中在被估計(jì)總體參數(shù)真實(shí)值的周圍,從而使得估計(jì)更加準(zhǔn)確。三參數(shù)估計(jì)(三)一致性一致性就是指隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)總體的參數(shù)。換句話講,對(duì)于一個(gè)具有一致性的估計(jì)量,一個(gè)大容量樣本的估計(jì)值要比一個(gè)小容量樣本的估計(jì)值更接近總體參數(shù)??梢宰C明,樣本均值、樣本比例和樣本方差符合無偏性、有效性和一致性三個(gè)標(biāo)準(zhǔn),它們分別是總體均值、總體比例和總體方差的優(yōu)良估計(jì)量。三參數(shù)估計(jì)二、參數(shù)估計(jì)的方法(一)點(diǎn)估計(jì)點(diǎn)估計(jì)就是直接將估計(jì)量的一個(gè)樣本觀察值作為被估計(jì)總體參數(shù)的估計(jì)值。根據(jù)前面介紹的估計(jì)量評(píng)價(jià)標(biāo)準(zhǔn),樣本均值、樣本比例以及樣本方差分別是總體均值、總體比例以及總體方差的優(yōu)良估計(jì)量,因而隨機(jī)抽取一個(gè)樣本,計(jì)算得到其樣本均值、樣本比例以及樣本方差的具體數(shù)值,即可估計(jì)出總體均值、總體比例以及總體方差的數(shù)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。三參數(shù)估計(jì)【例7-7】試用點(diǎn)估計(jì)的方法估計(jì)這批酸奶的平均容量以及容量的標(biāo)準(zhǔn)差。根據(jù)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn),樣本均值是總體均值的優(yōu)良估計(jì)量,因而整批酸奶平均容量的估計(jì)值為解某市某乳業(yè)公司欲估計(jì)某一批酸奶平均每盒的容量,隨機(jī)從生產(chǎn)線中抽取24盒,測得這24盒酸奶的容量如下(單位為mL):239.5240.4239.0241.0237.5239.4239.0238.6238.6240.3239.6240.0237.9238.4239.5239.6238.5240.5240.0239.8239.5240.4240.0240.6三參數(shù)估計(jì)點(diǎn)估計(jì)的優(yōu)點(diǎn)是能夠提供總體參數(shù)的具體估計(jì)值,且方法簡單,但不能說明估計(jì)結(jié)果的準(zhǔn)確程度和置信程度,所以經(jīng)常采用區(qū)間估計(jì)的方法。而這些批酸奶每盒容標(biāo)準(zhǔn)差的估計(jì)值為三參數(shù)估計(jì)(二)區(qū)間估計(jì)1.區(qū)間估計(jì)的概念在統(tǒng)計(jì)分析中,常常用一個(gè)區(qū)間及其出現(xiàn)的概率來估計(jì)總體參數(shù)。這種估計(jì)總體參數(shù)的方法稱為區(qū)間估計(jì)。具體地說,區(qū)間估計(jì)是用估計(jì)量或所構(gòu)成的區(qū)間來估計(jì)總體參數(shù),并以一定的概率保證總體參數(shù)將落在所估計(jì)的區(qū)間內(nèi)。這一概率保證程度稱為置信度,這種估計(jì)區(qū)間稱為置信區(qū)間。例如即三參數(shù)估計(jì)2.區(qū)間估計(jì)的方法及要素1.總體平均數(shù)的區(qū)間估計(jì)或2.總體比例的區(qū)間估計(jì)或由上述區(qū)間估計(jì)公式可概括出區(qū)間估計(jì)的基本要素:①估計(jì)值或;②抽樣極限誤差或;③置信度(概率保證程度)。三參數(shù)估計(jì)3.區(qū)間估計(jì)的步驟1)置信度約束下的區(qū)間估計(jì)步驟根據(jù)抽樣估計(jì)原理,自總體中抽取容量為的樣本,在置信度一定的情況下,我們可以采取如下步驟進(jìn)行區(qū)間估計(jì)(1)明確置信水平()或。常用的置信水平主要有95%,95.45%,99.73%等。(2)確定概率度t(即臨界值水平)。根據(jù)置信度,查標(biāo)準(zhǔn)正態(tài)概率雙側(cè)臨界值表確定概率度(臨界值)。(3)計(jì)算統(tǒng)計(jì)量的值。對(duì)總體平均數(shù)進(jìn)行估計(jì)時(shí),要計(jì)算樣本平均數(shù)及抽樣平均誤差和允許誤差;對(duì)總體比例(比例)進(jìn)行估計(jì)時(shí),要計(jì)算樣本比例和抽樣平均誤差及允許誤差,對(duì)總體方差進(jìn)行估計(jì)時(shí),要計(jì)算樣本修正方差及其抽樣誤差和允許誤差。(4)構(gòu)造置信區(qū)間。置信區(qū)間是“優(yōu)良的統(tǒng)計(jì)量±允許誤差”構(gòu)成的,對(duì)于總體平均數(shù)在某置信度約束下的置信區(qū)間就是“樣本平均數(shù)±允許誤差”。三參數(shù)估計(jì)【例7-8】則65-1.86≤≤65+1.86即95%的估計(jì)區(qū)間為:63.14≤≤66.86。解某制造廠的產(chǎn)品質(zhì)量服從正態(tài)分布,其總體標(biāo)準(zhǔn)差=15千克,平均質(zhì)量未知?,F(xiàn)隨機(jī)抽取一個(gè)n=250的樣本,計(jì)算結(jié)果是=65千克。以95%的置信度估計(jì)總體平均質(zhì)量的置信區(qū)間。已知條件為:樣本容量n=250,X~N(65,15);置信水平為95%,查表有:t=1.96。計(jì)算結(jié)果說明,我們有95%的把握程度認(rèn)為總體平均數(shù)介于63.14~66.86千克之間。三參數(shù)估計(jì)【例7-9】又該廠質(zhì)量規(guī)定使用壽命在3000小時(shí)以下為不合格。(1)按不重復(fù)抽樣方法,以95.45%的概率保證程度估計(jì)該批燈泡的平均使用壽命。(2)按不重復(fù)抽樣方法,以68.27%的置信度估計(jì)該批燈泡的合格率。從某廠生產(chǎn)的5000只燈泡中,隨機(jī)不重復(fù)抽取100只,對(duì)其使用壽命進(jìn)行調(diào)查,調(diào)查結(jié)果見表7-4。表7-4抽取燈泡結(jié)果使用壽命/小時(shí)組中值x產(chǎn)品數(shù)量fxf()3000以下250025000-148067712003000~4000350030105000-840211680004000~500045005022500016012800005000以上55001899000116024220800
—100434000—53440000三參數(shù)估計(jì)樣本標(biāo)準(zhǔn)差解(1)因?yàn)?。所以,樣本平均?shù)樣本平均壽命抽樣平均誤差小時(shí)小時(shí)三參數(shù)估計(jì)(2)因?yàn)?。所以,樣本合格率樣本合格率的抽樣平均誤差總體平均壽命所在的置信區(qū)為:下限4340-144.71=4195.26小時(shí)上限4340+144.74=4484.74小時(shí)即可以95.45%的概率保證程度估計(jì)該批燈泡的平均使用壽命在4484.74~4195.26小時(shí)之間。三參數(shù)估計(jì)總體合格率所在的置信內(nèi)間為:下限上限即可以68.27%的置信度估計(jì)該燈泡的合格率為96.6%~99.4%三參數(shù)估計(jì)【例7-10】廢品率解對(duì)某些成品按不重復(fù)抽樣方法抽選200件檢查,其中廢品8件,又知樣本容量為成品總量的(1/20)。以95%的概率保證程度估計(jì)該批成品的廢品率范圍??傮w比例所在的區(qū)間上下限為上限下限即可以95%的把握程度估計(jì)該批成品的廢品率范圍在1.35%~6.65%之間。三參數(shù)估計(jì)如果在區(qū)間估計(jì)中,先給定允許誤差,我們也可以根據(jù)上述原理,推算出置信區(qū)間和置信度,具體步驟如下:(1)明確極限誤差(允許誤差)。(2)計(jì)算樣本統(tǒng)計(jì)量。根據(jù)樣本統(tǒng)計(jì)量與允許誤差構(gòu)成估計(jì)(置信)區(qū)間,即區(qū)間為[統(tǒng)計(jì)量±允許誤差](3)計(jì)算抽樣平均誤差。據(jù)允許誤差和抽樣平均誤差的關(guān)系求得臨界值,如平均數(shù)的臨界值為(4)確定置信度。查標(biāo)準(zhǔn)正態(tài)概率雙側(cè)臨界值表,確定置信區(qū)間所對(duì)應(yīng)的置信概率()水平。2)允許誤差約束下的區(qū)間估計(jì)步驟三參數(shù)估計(jì)【例7-11】從全校近萬名學(xué)生中,隨機(jī)抽取100名學(xué)生測得其平均身高160cm。根據(jù)以往經(jīng)驗(yàn)學(xué)生身高的標(biāo)準(zhǔn)差為3cm,現(xiàn)要求以最大不超過0.6cm的允許誤差,來估計(jì)全體學(xué)生的平均身高。解因?yàn)樗怨烙?jì)的區(qū)間為[159.4,160.6]。又因?yàn)閯t查正態(tài)概率雙側(cè)臨界值表有=0.9545??梢娫搶W(xué)校學(xué)生平均身高為159.4~160.6cm的可能性有95.45%。三參數(shù)估計(jì)三、樣本容量的確定(一)確定樣本容量的意義我們探討一下樣本容量、抽樣誤差及調(diào)查費(fèi)用之間的關(guān)系。由于抽樣極限誤差為
,在固定的概率保證度下,樣本容量越大,誤差越小,區(qū)間估計(jì)的精度(等于)也越高,但是調(diào)查費(fèi)用也越大。小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大,大樣本容量調(diào)查精度高但費(fèi)用較大,兩者之間如何取舍?在實(shí)際工作中,有兩種不同的方案。一種方案是:找出在規(guī)定誤差范圍內(nèi)的最小樣本容量,這樣確定的樣本容量可以在保證滿足誤差要求下,使得調(diào)查費(fèi)用最??;另一種方案是:找出在限定費(fèi)用范圍內(nèi)的最大樣本容量,這樣確定的樣本容量可以保證在滿足費(fèi)用要求下,使得調(diào)查誤差最小。在本節(jié)中,主要討論第一種方案的樣本容量的確定。三參數(shù)估計(jì)(二)估計(jì)均值時(shí)的樣本容量1.總體方差已知,重復(fù)抽樣情形因?yàn)槌闃訕O限誤差為,所以這就是在給定抽樣極限誤差和概率保證度下,至少應(yīng)抽取的樣本容量。三參數(shù)估計(jì)2.總體方差已知,不重復(fù)抽樣情形這時(shí),因?yàn)槌闃訕O限誤差為,兩邊平方并進(jìn)行整理,可得:
以上兩種情形都要求方差或樣本方差必須事先知道,但通常樣本容量需要在調(diào)查之前確定,而此時(shí)方差或樣本方差是未知的。實(shí)際工作中,一般按以下方法確定其估計(jì)值:(1)用歷史資料中的方差或樣本方差代替。(2)在正式抽樣前進(jìn)行若干次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差。注意:計(jì)算結(jié)果中小數(shù)點(diǎn)通常要向上進(jìn)位,例如n=50.05,就要取51而不是50。三參數(shù)估計(jì)【例7-12】某地碩士研究生畢業(yè)第一年年薪的標(biāo)準(zhǔn)差大約為2000元人民幣。如果以95%的置信度估計(jì)其平均年薪,并且希望抽樣極限誤差分別不超過500元和100,重復(fù)抽樣條件下樣本容量應(yīng)為多少?解置信度為95%,查表得t=1.96,標(biāo)準(zhǔn)差=2000元。抽樣極限誤差分別不超過500元時(shí),至少應(yīng)抽取的樣本容量:
抽樣極限誤差分別不超過100元時(shí),至少應(yīng)抽取的樣本容量:
三參數(shù)估計(jì)(三)估計(jì)成數(shù)時(shí)的樣本容量假設(shè)總體成數(shù)為P,樣本成數(shù)為p。在重復(fù)抽樣情況下,樣本成數(shù)的抽樣平均誤差為:兩邊平方并整理后,得到樣本成數(shù)的抽樣極限誤差為:這就是在給定抽樣極限誤差和概率保證度下,至少應(yīng)抽取的樣本容量。三參數(shù)估計(jì)在不重復(fù)抽樣情況下,樣本成數(shù)的抽樣平均誤差為:兩邊平方并整理后,得到樣本成數(shù)的抽樣極限誤差為:這就是在給定抽樣極限誤差和概率保證度下,至少應(yīng)抽取的樣本容量。三參數(shù)估計(jì)同樣,以上兩種情形都要總體成數(shù)P或者樣本成數(shù)p必須事先知道,但通常是未知的。實(shí)際工作中,一般按以下方法確定其估計(jì)值:(1)用歷史資料中樣本成數(shù)p代替。(2)在正式抽樣前進(jìn)行若干次試驗(yàn)性調(diào)查,用試驗(yàn)中樣本成數(shù)p代替。(3)在完全缺乏資料的情況下,就取p=0.5。三參數(shù)估計(jì)【例7-13】某網(wǎng)站一個(gè)由400名使用者組成的樣本表明,該網(wǎng)站的使用者中26%的使用者為女性。在95%的置信度下,若希望將抽樣極限誤差控制在3%,則樣本容量應(yīng)為多少?解總體單位數(shù)很大,可以看作重復(fù)抽樣。已知抽樣極限誤差為3%,,p=95%的置信度,查表得t=1.96,因此,樣本容量至少應(yīng)為:樣本容量至少應(yīng)為822人。(人)三參數(shù)估計(jì)【例7-14】從一個(gè)企業(yè)全部職工中任意抽取400人,計(jì)算得知其平均月收入為1400元,標(biāo)準(zhǔn)差為4000元,月工資在1500元以上的職工人數(shù)有244人。如果要求平均工資的允許誤差范圍不超過400元,月工資在1500元以上的職工所占的比重的允許誤差范圍不超過5%,置信度都要求是95.45%,問至少應(yīng)抽取多少名職工?解本例同時(shí)包含了平均數(shù)和成數(shù)的誤差要求,因此應(yīng)分別計(jì)算兩個(gè)樣本容量,然后取兩者中的最大者。估計(jì)平均工資:標(biāo)準(zhǔn)差為s=4000元,允許誤差范圍不超過400元,即,置信度要求是95.45%,查表得到t=2。因此,樣本容量至少應(yīng)為:(人)三參數(shù)估計(jì)估計(jì)月工資在1500元以上的職工所占的比重為:樣本成數(shù),允許誤差范圍不超過5%,即,樣本容量至少應(yīng)為:所以,為了同時(shí)滿足兩個(gè)誤差要求,樣本容量至少應(yīng)為400人。(人)第四節(jié)抽樣調(diào)查的組織方式4四抽樣調(diào)查的組織方式一、簡單隨機(jī)抽樣在進(jìn)行抽樣調(diào)查工作時(shí),必須根據(jù)研究總體本身的特點(diǎn)和抽樣調(diào)查的目的要求,對(duì)抽取樣本的程序和方式講行周密的設(shè)計(jì)和安排,這些工作概括來說稱為抽樣調(diào)查組織方式。針對(duì)不同的調(diào)查目的和不同的調(diào)查對(duì)象特點(diǎn),應(yīng)當(dāng)采用不同的抽樣組織方式。在抽樣調(diào)查實(shí)踐中常用的組織方式主要有五種,即簡單隨機(jī)抽樣、類型抽樣(又稱分層抽樣)、等距抽樣(又稱機(jī)械抽樣)、整群抽樣和多階段抽樣。四抽樣調(diào)查的組織方式一、簡單隨機(jī)抽樣(一)簡單隨機(jī)抽樣的概念與特點(diǎn)簡單隨機(jī)抽樣又稱純隨機(jī)抽樣,它是按照隨機(jī)原則直接從全及總體個(gè)單位中抽取個(gè)單位作為樣本進(jìn)行調(diào)查的組織方式。這種抽樣方式除了需用全及總體單位名單外,基本不需要其他信息。全部抽樣推斷理論都是建立在簡單隨機(jī)抽樣基礎(chǔ)上的,因此簡單隨機(jī)抽樣是抽樣推斷理論的基礎(chǔ)。四抽樣調(diào)查的組織方式從本質(zhì)上講,簡單隨機(jī)抽樣最符合隨機(jī)抽樣原則。但從抽樣推斷效果上考察,它的應(yīng)用卻受到客觀條件的限制。一般來說,它只適用于均勻總體(即具有被研究特征的單位均勻地分布在全及總體的各個(gè)部分),且各單位之間被研究標(biāo)志值的差異較小,總體單位數(shù)較少,且便于編號(hào)和抽取。簡單隨機(jī)抽樣的不足是沒有充分利用全及總體已知信息或輔助資料;在總體單位很多、編號(hào)困難甚至不可能時(shí),無法組織抽樣;有時(shí)抽到的單位很分散,致使調(diào)查工作十分困難。四抽樣調(diào)查的組織方式(二)簡單隨機(jī)抽樣下的取樣方法1.直接抽選法在簡單隨機(jī)抽樣下,抽取樣本的具體方法主要有直接抽選法、抽簽法和隨機(jī)數(shù)表法等。即直接從全及總體中隨機(jī)抽取樣本單位的方法。如從糧食倉庫中不同地點(diǎn)取出若干袋糧食進(jìn)行質(zhì)量檢驗(yàn),從正在教室聽課的坐位不同排不同行的學(xué)生中,隨機(jī)抽取若干名調(diào)查教學(xué)情況等。四抽樣調(diào)查的組織方式2.抽簽法即先給每個(gè)總體單位編號(hào),然后在遵循隨機(jī)原則的前提下,采用一定方法抽取號(hào)碼(如將各單位號(hào)碼寫在紙片上,捏成外表看不到號(hào)碼的紙砣,然后隨機(jī)取號(hào);用搖號(hào)機(jī)器取號(hào);或利用隨機(jī)數(shù)表取號(hào)等),確定中選單位。隨機(jī)數(shù)表上數(shù)字的出現(xiàn)及其排列是隨機(jī)形式的,從0到9共10個(gè)數(shù)字,每個(gè)數(shù)字各占1/10,而且表上數(shù)字組成的多位數(shù)(兩位數(shù)、三位數(shù)、四位數(shù)、五位數(shù)等)也有大體相同的出現(xiàn)機(jī)會(huì)。使用時(shí)從表中任一行任一列開始,按照事先設(shè)定的樣本單位數(shù)目的位數(shù),依次抽取數(shù)字,直到取夠預(yù)定單位數(shù)為止。四抽樣調(diào)查的組織方式二、類型抽樣(一)類型抽樣的概念類型抽樣又稱分層抽樣,它是先對(duì)調(diào)查總體各單位按主要標(biāo)志加以分組,然后再從各組中按照隨機(jī)原則抽取一定數(shù)量的單位組成樣本,進(jìn)行調(diào)查和推斷的一種抽樣組織方式。例如,在學(xué)生學(xué)習(xí)情況抽樣調(diào)查中,先按已掌握的學(xué)生學(xué)習(xí)成績將學(xué)生分成優(yōu)秀、良好和一般三類,然后按預(yù)定樣本容量在各類中抽取學(xué)生組成調(diào)查樣本;在勞動(dòng)者工資收入抽樣調(diào)查中,先按工作性質(zhì)將勞動(dòng)者分為工業(yè)、商業(yè)、交通、教育、衛(wèi)生、農(nóng)業(yè)、公務(wù)員等部門,然后再按一定方法抽取預(yù)定數(shù)目勞動(dòng)者組成調(diào)查樣本等。四抽樣調(diào)查的組織方式類型抽樣中又有類型比例抽樣和類型非比例抽樣兩種。類型非比例抽樣就是分類后確定各類應(yīng)抽取的樣本單位數(shù)時(shí),不考慮各類單位數(shù)占總體單位數(shù)的比重。而類型比例抽樣則是在分類的基礎(chǔ)上,按照各類單位數(shù)占總體單位數(shù)的比重確定應(yīng)抽取的樣本單位數(shù)。類型比例抽樣可使樣本變量值的分布結(jié)構(gòu)與總體變量值的分布結(jié)構(gòu)趨向一致,從而進(jìn)一步提高樣本的代表性,縮小抽樣誤差。一般來說,類型比例抽樣的抽樣平均誤差比完全隨機(jī)抽樣小得多。四抽樣調(diào)查的組織方式類型比例抽樣實(shí)際上是統(tǒng)計(jì)分組和隨機(jī)抽樣的結(jié)合應(yīng)用。劃分類型時(shí)必須界限清楚,準(zhǔn)確掌握各類的單位數(shù)及其在總體中的比重;同時(shí),組數(shù)不宜太多。通過分類,把總體中變量值比較接近的單位歸為一類,使各類變量值的分布比較均勻,而且保證各類變量值都有中選機(jī)會(huì),這樣抽樣平均數(shù)的變異程度就比較小。在總體各單位變量值差異較大的情況下,運(yùn)用類型抽樣對(duì)比簡單隨機(jī)抽樣來說可以取得更理想的效果,因此類型抽樣的特點(diǎn)是樣本代表性強(qiáng)、抽樣誤差小。在一定情況下,必要樣本單位數(shù)可以減少。四抽樣調(diào)查的組織方式(二)類型抽樣單位的分配方法1.等比例分類抽樣類型抽樣單位在各類中的分配有等比例和不等比例兩種分配方法。即在對(duì)各類分配樣本數(shù)目時(shí),按照各類單位數(shù)在總體單位數(shù)中的比例確定。即某類在樣本總體中占的比重與其在全及總體中所占比重相同。一般來說,這種方法簡便易行,分配比例比較合理,計(jì)算方法也很簡便。因此,該方法在實(shí)踐中使用較多。四抽樣調(diào)查的組織方式2.不等比例分類抽樣不等比例分類抽樣是針對(duì)一些特殊情況進(jìn)行的分類抽樣。如在各類型總體單位數(shù)相差懸殊,等比例抽樣會(huì)影響樣本代表性時(shí),可以采用不等比例抽樣方法。再如,當(dāng)各類中變量值差異程度較大時(shí),也不宜采用等比例抽樣。這時(shí),對(duì)變量值差異程度(方差)大的類,應(yīng)適當(dāng)多抽樣一些單位;對(duì)變量值差異程度(方差)小的類,可適當(dāng)少抽樣一些單位。四抽樣調(diào)查的組織方式(三)類型抽樣推斷步驟類型抽樣推斷工作主要有以下幾個(gè)步驟:(1)抽取樣本,計(jì)算樣本各類(組)平均數(shù)(成數(shù)).樣本各類(組)平均數(shù):樣本各類(組)成數(shù):四抽樣調(diào)查的組織方式(2)計(jì)算樣本各類(組)平均數(shù)(成數(shù))方差樣本各類(組)平均數(shù)方差:樣本各類(組)成數(shù)方差:四抽樣調(diào)查的組織方式(3)計(jì)算樣本平均(成數(shù))組內(nèi)方差的平均數(shù)樣本平均數(shù)組內(nèi)方差的平均數(shù):樣本成數(shù)組內(nèi)方差的平均數(shù)四抽樣調(diào)查的組織方式(4)計(jì)算類型抽樣樣本平均數(shù)(成數(shù))類型抽樣的樣本平均數(shù)類型抽樣的樣本成數(shù)四抽樣調(diào)查的組織方式(5)計(jì)算類型抽樣平均誤差類型抽樣平均數(shù)平均誤差類型抽樣成數(shù)平均誤差(重復(fù)抽樣)(不重復(fù)抽樣)(重復(fù)抽樣)(不重復(fù)抽樣)四抽樣調(diào)查的組織方式【例7-15】某縣有5萬農(nóng)戶,根據(jù)地理情況分為平原和丘陵兩類,其中平原3萬戶,丘陵2萬戶。本年按1%比例抽取樣本單位進(jìn)行平均年收入調(diào)查,調(diào)查結(jié)果如表7-5所示。要求:(1)以95%的概率估計(jì)本年該縣農(nóng)戶平均年收入;(2)估計(jì)本年收入達(dá)到5萬元的農(nóng)戶比重;(3)若明年仍進(jìn)行該項(xiàng)調(diào)查,概率保證程度為95.45%,允許誤差不超過0.15萬元,應(yīng)當(dāng)抽多少農(nóng)戶進(jìn)行調(diào)查,其中平原和丘陵各抽多少戶。表7-5某縣農(nóng)戶年收入抽樣調(diào)查資料戶年收入(萬元)2以下2~44~66~88以上合計(jì)平原地區(qū)(戶)10501854015300丘陵地區(qū)(戶)20100502010200合計(jì)301502356025500四抽樣調(diào)查的組織方式(1)估計(jì)該縣本年農(nóng)戶平均年收入1)計(jì)算樣本各類平均數(shù)平原農(nóng)戶收入平均數(shù):(萬元)解丘陵農(nóng)戶收入平均數(shù):(萬元)四抽樣調(diào)查的組織方式2)計(jì)算樣本各類平均數(shù)(萬元)四抽樣調(diào)查的組織方式3)計(jì)算樣本各類平均數(shù)(萬元)平原農(nóng)戶收入方差:四抽樣調(diào)查的組織方式(萬元)丘陵農(nóng)戶收入方差:四抽樣調(diào)查的組織方式4)計(jì)算樣本方差(即組內(nèi)方差平均數(shù))(萬元)5)計(jì)算抽樣平均誤差(萬元)四抽樣調(diào)查的組織方式6)計(jì)算抽樣極限誤差(萬元)∵∴7)計(jì)算抽樣極限誤差(萬元)農(nóng)戶平均年收入下限:農(nóng)戶平均年收入上限:(萬元)四抽樣調(diào)查的組織方式(2)估計(jì)該縣本年農(nóng)戶平均年收入1)計(jì)算類型抽樣成數(shù)平原地區(qū):丘陵地區(qū):四抽樣調(diào)查的組織方式2)計(jì)算抽樣極限誤差平原地區(qū):平原地區(qū):樣本成數(shù)方差:四抽樣調(diào)查的組織方式3)計(jì)算樣本成數(shù)抽樣平均誤差4)計(jì)算抽樣極限誤差∵∴四抽樣調(diào)查的組織方式5)估計(jì)本年收入達(dá)到5萬元的農(nóng)戶比重農(nóng)戶年收入達(dá)5萬元的比重下限:農(nóng)戶年收入達(dá)5萬元的比重上限:即農(nóng)戶年收入達(dá)5萬元的比重在60.18%~67.82%之間,其可靠程度為95%。四抽樣調(diào)查的組織方式(3)計(jì)算明年進(jìn)行同樣調(diào)查的樣本容量∵∴不重復(fù)抽樣樣本平均數(shù)樣本容量為(戶)四抽樣調(diào)查的組織方式三、等距抽樣(一)等距抽樣的概念和特點(diǎn)等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣。它是事先將全及總體各總體按某種標(biāo)志排列,然后依固定順序和間隔抽取調(diào)查單位的一種抽樣組織形式。等距抽樣方式能使抽取的調(diào)查單位更均勻地分布在全及總體中因而其抽樣誤差一般較簡單隨機(jī)抽樣小。特別是當(dāng)研究現(xiàn)象變異程度大,而在實(shí)際工作中又不可能抽取更多單位時(shí),等距抽樣比簡單隨機(jī)抽樣更有效。四抽樣調(diào)查的組織方式(二)等距抽樣方法等距抽樣方法按照將總體單位排隊(duì)時(shí)所依據(jù)的標(biāo)志不同,分為無關(guān)標(biāo)志排隊(duì)和有關(guān)標(biāo)志排隊(duì)兩種。無關(guān)標(biāo)志排隊(duì)即指用來排隊(duì)的標(biāo)志與調(diào)查研究的目的無關(guān),如研究學(xué)生學(xué)習(xí)情況時(shí)將學(xué)生按照姓氏筆畫順序排隊(duì)。有關(guān)標(biāo)志排隊(duì)即指用來排隊(duì)的標(biāo)志與調(diào)查研究的目的有關(guān),如研究職工的收入水平時(shí)將職工按照職務(wù)或技術(shù)等級(jí)順序排隊(duì)。顯然,按有關(guān)標(biāo)志排隊(duì)的調(diào)查效果會(huì)優(yōu)于按無關(guān)標(biāo)志排隊(duì)的調(diào)查效果。等距抽樣樣本平均數(shù)、抽樣平均誤差、極限誤差以及對(duì)全及總體指標(biāo)的估計(jì)等計(jì)算方法與簡單隨機(jī)抽樣相同。四抽樣調(diào)查的組織方式(三)等距抽樣的具體組織1.隨機(jī)起點(diǎn)等距抽樣等距抽樣有三種具體組織方法,即隨機(jī)起點(diǎn)等距抽樣、半距起點(diǎn)等距抽樣和隨機(jī)起點(diǎn)對(duì)稱等距抽樣。即根據(jù)事先預(yù)定的樣本單位數(shù)n,將全及總體所有單位分成n等份(即n組),每組的單位數(shù),也即抽樣距離為k。抽樣起點(diǎn)在第一組的個(gè)單位之間隨機(jī)確定。若設(shè)第1個(gè)抽中單位為第1組的第r個(gè)單位,則各抽中單位可表示為第1個(gè)抽中單位為第r個(gè)單位;第2個(gè)抽中單位為第r+k個(gè)單位;第3個(gè)抽中單位為第r+2k個(gè)單位;第4個(gè)抽中單位為第r+3k個(gè)單位;……確定隨機(jī)起點(diǎn)時(shí),要注意回避全及總體的某種規(guī)律性變動(dòng),以免產(chǎn)生系統(tǒng)性偏差。四抽樣調(diào)查的組織方式2.半距起點(diǎn)等距抽樣半距起點(diǎn)就是選第1組的第個(gè)單位k/2為第一個(gè)抽取的樣本單位。即第1個(gè)抽中單位為第k/2個(gè)單位;第2個(gè)抽中單位為第k/2
+k個(gè)單位;第3個(gè)抽中單位為第k/2+2k個(gè)單位;第4個(gè)抽中單位為第k/2+3k個(gè)單位;……半距起點(diǎn)等距抽樣在社會(huì)經(jīng)濟(jì)調(diào)查中應(yīng)用較廣,但也存在一定局限,這就是隨機(jī)性不夠明顯,只有在組距半數(shù)起點(diǎn)系統(tǒng)中的單位才能被抽中。同時(shí),它只能抽出一個(gè)樣本,抽樣框的利用率較低,且不能在一個(gè)抽樣框中進(jìn)行交叉樣本和輪換樣本的抽樣設(shè)計(jì)。四抽樣調(diào)查的組織方式3.隨機(jī)起點(diǎn)對(duì)稱等距抽樣這種方法就是通過隨機(jī)起點(diǎn),系統(tǒng)抽出對(duì)稱樣本。它要求每兩個(gè)組距合成一個(gè)大組,在每兩個(gè)組距中對(duì)稱抽出兩個(gè)樣本單位,而且要求各對(duì)稱樣本與其相近的下限或上限的距離是相等的,即都等于r值。其抽樣程序?yàn)椋孩倬幹瞥闃涌?②計(jì)算組距;③決定隨機(jī)起點(diǎn),即在1-k中,利用隨機(jī)數(shù)表或計(jì)算機(jī)(計(jì)算器)中的隨機(jī)函數(shù)確定;④計(jì)算各樣本單位的位置值,即:第1個(gè)抽中單位為第r個(gè)單位;第2個(gè)抽中單位為第2k-r個(gè)單位;第3個(gè)抽中單位為第2k+r個(gè)單位;第4個(gè)抽中單位為第4k-r個(gè)單位;第5個(gè)抽中單位為第4k+r個(gè)單位;……四抽樣調(diào)查的組織方式【例7-16】某社區(qū)住戶按家庭年收入高低排隊(duì),然后每隔20戶抽1戶,共抽取100戶,得知他們的家庭年平均收入為30000元,樣本標(biāo)準(zhǔn)差為5000元,試計(jì)算該社區(qū)住戶家庭年平均收入的抽樣平均誤差。這是按有關(guān)標(biāo)志排隊(duì)的等距抽樣,已知N=2000,n=100,x=30000,sx=5000則解(元)四抽樣調(diào)查的組織方式四、整群抽樣(一)整群抽樣的概念和特點(diǎn)整群抽樣是先將全及總體劃分為若子組群,然后從中隨機(jī)抽取一些群,對(duì)中選群的所有單位進(jìn)行全面調(diào)查的抽樣組織形式。例如,在冷庫裝箱鮮蛋檢驗(yàn)中,以箱為單位抽出進(jìn)行檢驗(yàn);在人口普查質(zhì)量檢驗(yàn)中,以村、鄉(xiāng)或縣為單位進(jìn)行抽樣檢查;在大量連續(xù)生產(chǎn)的產(chǎn)品質(zhì)量檢驗(yàn)中,每隔1小時(shí)抽取10分鐘的產(chǎn)品進(jìn)行檢驗(yàn)等,都屬于整群抽樣。四抽樣調(diào)查的組織方式整群抽樣是在各群間進(jìn)行抽樣,對(duì)中選的群進(jìn)行全面調(diào)查。所以,整群抽樣誤差的大小取決于群間差異(方差)的大小和樣本群數(shù)的多少。在其他條件不變的情況下,各群間平均變異程度越小,則抽樣結(jié)果就越準(zhǔn)確;同理,抽取的樣本群數(shù)越多,則抽樣誤差就越小。整群抽樣劃分組群時(shí),要注意盡量使各群內(nèi)單位標(biāo)志變異較大,而各群間單位標(biāo)志變異較小。整群抽樣的優(yōu)點(diǎn)是抽選的單位比較集中,調(diào)查方便,可以節(jié)省人力、物力和財(cái)力。特別適合總體單位很多且缺乏可靠的登記資料(如名冊(cè)),或雖可編制抽樣名冊(cè)、但費(fèi)用太高的情況。四抽樣調(diào)查的組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB 4234.3-2024外科植入物金屬材料第3部分:鍛造鈦-6鋁-4釩合金
- 高考物理總復(fù)習(xí)專題七電場第2講電勢能、電勢、電勢差練習(xí)含答案
- 《品牌規(guī)劃方案》課件
- 高中信息技術(shù) 《虛擬現(xiàn)實(shí)初探》教案 滬教版選修5
- 八年級(jí)物理下冊(cè) 第九章 壓強(qiáng) 第1節(jié) 壓強(qiáng)第2課時(shí) 壓強(qiáng)的綜合運(yùn)用教案(新版)新人教版
- 2024年五年級(jí)數(shù)學(xué)上冊(cè) 三 游三峽-小數(shù)除法信息窗2 除數(shù)是小數(shù)的小數(shù)除法除法教案 青島版六三制
- 2024-2025版新教材高中化學(xué) 第2章 第2節(jié) 第2課時(shí) 離子反應(yīng)教案 魯科版必修第一冊(cè)
- 2023九年級(jí)數(shù)學(xué)下冊(cè) 第24章 圓24.4 直線與圓的位置關(guān)系第3課時(shí) 切線長定理教案 (新版)滬科版
- 2024年七年級(jí)生物下冊(cè) 2.1.3營養(yǎng)物質(zhì)的吸收和利用教學(xué)設(shè)計(jì) (新版)冀教版
- 應(yīng)急管理工作格言
- 有限空間作業(yè)流程圖
- 《化學(xué)反應(yīng)工程》課件第二章 氣-固相催化反應(yīng)本征及宏觀動(dòng)力學(xué)(簡明)
- 第13課__生活與科幻
- 新《行政處罰法》修訂對(duì)比解讀PPT課件
- 交互分配法教案
- 材料力學(xué)內(nèi)部習(xí)習(xí)題集及問題詳解
- 《電磁屏蔽技術(shù)》PPT課件
- 正常胃鏡圖片及常見病變
- 手機(jī)項(xiàng)目管理流程
- 金屬探測器使用規(guī)程及相關(guān)操作流程
- 儀隴縣先鋒鎮(zhèn)小學(xué)校迎國檢應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論