統(tǒng)計學基礎 第七章 抽樣推斷_第1頁
統(tǒng)計學基礎 第七章 抽樣推斷_第2頁
統(tǒng)計學基礎 第七章 抽樣推斷_第3頁
統(tǒng)計學基礎 第七章 抽樣推斷_第4頁
統(tǒng)計學基礎 第七章 抽樣推斷_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實用文檔統(tǒng)計學基礎 第七章 抽樣推斷【教學目的】1.理解抽樣推斷的含義及特點2.深刻理解抽樣誤差產生的原因3.對抽樣誤差、抽樣平均誤差、抽樣極限誤差加以區(qū)別4.了解各種抽樣組織形式的特點5.重點掌握簡單隨機抽樣組織形式的區(qū)間估計方法6.掌握必要樣本單位數的確定方法【教學重點】1.理解抽樣推斷中的幾個基本概念(總體指標、樣本指標、平均數、成數、方差、標準差)。2.理解抽樣誤差的概念3.理解和運用不同抽樣方法下計算抽樣誤差4.掌握簡單隨機抽樣組織形式的區(qū)間估計方法6.掌握必要樣本單位數的確定方法【教學難點】1.理解抽樣推斷中的幾個基本概念(總體指標、樣本指標、平均數、成數、方差、標準差)。2.理解抽樣誤差的概念3.理解和運用不同抽樣方法下計算抽樣誤差4.掌握簡單隨機抽樣組織形式的區(qū)間估計方法6.掌握必要樣本單位數的確定方法【教學時數】教學學時為10課時【教學內容參考】第一節(jié) 抽樣推斷的意義一、抽樣推斷的含義 (一)抽樣推斷的特點抽樣推斷又稱為抽樣估計,它是在抽樣調查的基礎上,利用樣本實際資料計算樣本指標,并據以推算總體相應數量特征的一種統(tǒng)計調查方式?!景咐繌娜珖泄煞葜破髽I(yè)中,抽取一部分企業(yè),詳細調查其生產經營狀況,根據這一部分企業(yè)的調查資料,來推算所有股份制企業(yè)的生產經營狀況,這就屬于抽樣推斷。抽樣推斷有以下幾個特點:1.按隨機原則從總體中抽取調查單位。所謂隨機原則是指在抽取調查單位時,總體中每個單位都有同等被抽中的機會,完全排除了人為主觀意識的影響,哪個單位抽中與否,純粹是隨機的、偶然的。按隨機原則抽取調查單位是進行抽樣推論的基本要求。2.根據被抽取的調查單位,計算各種指標,并對總體的指標作出估計。 3.抽樣推斷中的抽樣誤差可以事先計算并加以控制,從而保證抽樣推斷的結論符合預定的精確度和可靠度要求。 (二)抽樣推斷的作用 抽樣推斷的主要作用有: 1.對某些不可能進行全面調查而又需要了解全面情況的社會經濟現象,可以采用抽樣推斷方式。另外,對于無限總體也不可能進行全面調查,只能采用抽樣推斷方式。2.對于某些不必要或在經濟上不允許經常采用全面調查的社會經濟現象,最適宜采用抽樣推斷方式。3.對于需要及時了解情況的現象,也經常采用抽樣推斷方式。因為全面調查浪費人力、物力和財力,資料也不易及時取得,而抽樣推斷方式不僅節(jié)省人力、資金,且時間快,方式靈活,能夠及時滿足了解情況的需要。4.對全面調查的資料進行評價和修正。全面調查由于范圍廣、工作量大、參加的人員多,發(fā)生登記性誤差的可能性就大。因此,為了保證全面調查資料的準確性,檢驗全面調查資料的質量,在全面調查之后,一般都要進行抽樣推斷。在總體中再抽取一部分單位重新調查,然后將兩次調查的資料進行比較,計算出差錯率,并據此對全面調查的資料加以修正。5.抽樣推斷還可以用于工業(yè)生產過程中的質量控制?!灸芰τ柧殹肯铝惺马棇儆诔闃油茢嗟挠校?)。 為了測定車間的工時損失,對車間中的每三班工人中的第一班工人進行調查。 為了解某大學食堂衛(wèi)生狀況,對該校的五個食堂進行調查。 對某城市1%的家庭進行調查,以便研究該城市居民的消費狀況。對某公司三個分廠中的一個分廠進行調查,以便研究該工廠的能源利用效果。 二、抽樣的基本概念 (一)總體和樣本 總體又稱全及總體。它是根據研究目的,由全部調查單位所組成的集合體。總體的單位數通常都是很大的,甚至是無限的,這樣才有必要組織抽樣調查,進行抽樣推斷??傮w單位數一般用符號N表示。 樣本又稱子樣。它是從總體中隨機抽取出來的部分調查單位所組成的集合體。樣本的單位數是有限的。樣本單位數一般用符號n表示,也稱樣本容量。 對于某一特定研究問題來說,作為推斷對象的總體是確定的,而且是惟一的。但由于從一個總體中可以抽取許多個樣本,所以作為觀察對象的樣本,不是惟一的,而是可變的。明白這一點對于理解抽樣推斷原理是很重要的。 (二)總體指標和樣本指標 總體指標又稱參數。它是根據總體各單位的標志表現計算的綜合指標。 對于總體中的數量標志,可以計算的總體指標有總體平均數、總體方差2 (或總體標準差)。設總體變量X的取值為:X1,X2,則 對于總體中的品質標志,由于各單位品質標志不能用數量來表示,因此,可以計算的總體指標有總體成數、總體成數方差或總體成數標準差P)。 設P表示總體中具有某種性質的單位數在總體單位數中所占的比重,Q表示總體中不具有某種性質的單位數在總體單位數中所占的比重。在總體N個單位中,有N1 個單位具有某種性質,N0 個單位不具有某種性質,N=N1 +N0 。則 如果總體中的品質表現只有“是”、“非”兩種。例如,產品質量的標志表現為合格和不合格,人口性別的標志表現為男性和女性,則可以把“是”的標志表現表示為1,而“非”的標志表現表示為0。那么成數P就可以視為(0,1)分布的相對數,并可以計算相應的方差(或標準差)。其計算公式為 在抽樣推斷中,總體指標的意義和計算方法是明確的,但總體指標的具體數值事先是未知的,需要用樣本指標來估計它。樣本指標又稱統(tǒng)計量。它是根據樣本各單位的標志表現計算的、用來估計總體指標的綜合指標??梢杂嬎愕臉颖局笜擞袠颖酒骄鶖怠颖痉讲顂2和樣本成數P等。設樣本變量x的取值為x1,x2,xn,則 在抽樣推斷中,樣本指標的計算方法是確定的,但它的取值隨著樣本的不同,有不同的樣本變量。所以,樣本指標本身是隨機變量,用它作為總體指標的估計值,有時誤差大些,有時誤差小些;有時產生正誤差,有時產生負誤差。 【能力訓練】總體指標和樣本指標( )。都是隨機變量都是確定性變量 前者是惟一確定的,后者是隨機變量前者是隨機變量,后者是惟一確定的三、抽樣方法在抽樣調查中,從總體中抽取樣本單位的方法有兩種:重復抽樣和不重復抽樣。(一)重復抽樣 重復抽樣也稱重置抽樣、放回抽樣、回置抽樣等。它是指從總體N個單位中隨機抽取容量為n的樣本時,每次抽取一個單位,把結果登記下來后,重新放回,再從總體中抽取下一個樣本單位。在這種抽樣方式中,同一單位可能有被重復抽中的機會。可見,重復抽樣的總體單位在各次抽取中都是不變的,每個單位中選的機會在每次抽取中都是均等的。 用重復抽樣的方法從總體N個單位中抽取n個單位組成樣本,可能得到的樣本總數為Nn個。(二)不重復抽樣不重復抽樣也稱不重置抽樣、不放回抽樣、不回置抽樣等。它是指從總體N個單位中隨機抽取容量為n的樣本時,每次抽取一個單位后,不再放回去,下一次則從剩下的總體單位中繼續(xù)抽取,如此反復,最終構成一個樣本。也就是說,每個總體單位至多只能被抽中一次,所以從總體中每抽取一次,總體就少一個單位。因此,先后抽出來的各個單位被抽中的機會是不相等的。用不重復抽樣的方法從總體N個單位中抽取n個單位組成樣本,可能得到的樣本總數為。不考慮順序的組合數為。 可見,在相同樣本容量的要求下,不重復抽樣可能得到的樣本個數比重復抽樣可能得到的樣本個數少。當采用不重復抽樣、而全及總體所包含的單位數又不多時,越到后來,留在總體中的單位就越少,被抽中的機會就越大。不過當全及總體單位數很多、樣本總體單位數所占的比重很小時,則對先后抽出來的各個單位被抽中的機會影響不大。由于不重復抽樣簡便易行,所以在實際工作中經常被采用。第二節(jié) 抽樣誤差一、抽樣誤差的含義在抽樣推斷中,用樣本指標推斷總體指標,總會存在一定的誤差,其誤差來源主要有兩個方面:(一)登記性誤差即在調查和整理資料的過程中,由于主、客觀因素的影響而引起的誤差,如在登記的過程中由于疏忽而將3誤寫為8,將1誤寫為7;在計算合計的過程中所造成的計算錯誤等。(二)代表性誤差即由于樣本的結構情況不足以代表總體特征而導致的誤差。代表性誤差的產生又有兩種情況:一種是違反了抽樣推斷的隨機原則,如調查者有意地多選較好的單位或多選較差的單位來進行調查,這樣計算出來的樣本指標必然出現偏高或偏低的情況,造成系統(tǒng)性誤差,也稱為偏差。另一種情況是遵守了抽樣推斷的隨機原則,但由于從總體中抽取樣本時有多種多樣的可能,當取得一個樣本時,只要被抽中樣本的內部結構與被研究總體的結構有所出入,就會出現或大或小的偶然性的代表性誤差,也稱為隨機誤差。系統(tǒng)性誤差和登記性誤差都是由于抽樣工作組織不好而導致的,應該采取預防措施避免發(fā)生。而偶然性的代表性誤差是無法消除的。抽樣誤差就是指這種偶然性的代表性誤差,即按隨機原則抽樣時,單純由于不同的隨機樣本得出不同的估計量而產生的誤差。抽樣誤差是抽樣推斷所固有的,雖然它無法避免,但可以運用大數定律的數學公式加以精確地計算,確定其具體的數量界限,并通過抽樣設計加以控制。所以這種抽樣誤差也稱為可控制誤差。 【能力訓練】抽樣誤差是( )。 樣本數目過少引起的觀察、測量、計算的失誤引起的抽樣過程中的偶然性因素引起的抽樣推斷中產生的系統(tǒng)性誤差二、抽樣平均誤差 (一)抽樣平均誤差的含義 抽樣誤差描述了樣本指標與總體指標之間的離差絕對數,在用樣本指標估計相應的總體指標時,它可以反映估計的準確程度。但是由于抽樣誤差是隨機變量,具有取值的多樣性和不確定性特點,因而就不能以它的某一個樣本的具體誤差數值來代表所有樣本與總體之間的平均誤差情況,應該用抽樣平均誤差來反映抽樣誤差平均水平。 所謂抽樣平均誤差,就是所有可能出現的樣本指標(平均數或成數)的標準差,也可以理解為所有的樣本指標與總體指標之間的平均離差。我們所說的抽樣誤差可以事先計算和控制,就是針對抽樣平均誤差而言的。抽樣平均誤差是用樣本指標推斷總體指標時,計算誤差范圍的基礎。 抽樣平均誤差的計算,與抽樣方法和抽樣組織形式有直接關系,不同的抽樣方法和抽樣組織形式計算抽樣平均誤差的公式是不同的。 (二)抽樣平均誤差的計算 在實際工作中,只求得一個樣本指標,無法得到抽樣平均誤差(即樣本指標的標準差),因而常常是根據抽樣平均誤差和總體標準差的關系來推算。樣本平均數的抽樣平均誤差計算公式如下: 在一般情況下,總體平均數是未知的。當樣本較多時,可用樣本平均數的平均數來代替(這已經得到證明)。而在實際工作中,通常只需從總體中抽取一個樣本,這樣就可以根據總體標準差和樣本單位數的關系來計算。 1.重復抽樣條件下抽樣平均誤差的計算 數理統(tǒng)計可以證明:在重復抽樣條件下,抽樣平均誤差與總體標準差成正比,與樣本單位數的平方根成反比。故在已知總體標準差的條件下,可用下面的公式計算樣本平均數的抽樣平均誤差: 在大樣本(n30)下,如果沒有總體標準差的資料,可用樣本標準差s來代替,其公式如下: 相應地有樣本成數的抽樣平均誤差公式: 同樣,在大樣本下,如果P未知,可用樣本成數p來代替,即 總體成數方差還有一個特點,就是它的最大值是0.50.5=0.25,也就是說,當兩類總體單位各占一半時,它的變異程度最大,方差為25%,標準差則為50%。因此,在總體成數方差值未知時,可用其最大值來代替,這樣會使計算出來的抽樣平均誤差偏大一些,一般而言這對推斷認識有益而無害。2.不重復抽樣條件下抽樣平均誤差的計算對上述重復抽樣下的公式作如下修正: 不重復抽樣的平均誤差和重復抽樣的平均誤差公式,兩者相差的因子()永遠小于1。在不重復抽樣下,抽中的單位不再放回,總體單位數逐漸減少,余下的每個單位被抽中的機會就會增大,所以不重復抽樣的抽樣平均誤差小于重復抽樣的抽樣平均誤差,這就是用因子()作為調整系數來修正原式的道理。但在抽中單位占全體單位的比重很小時,這個因子接近于1,對于計算抽樣平均誤差所起的作用不大。因而實際工作中不重復抽樣有時仍按重復抽樣的公式計算。 抽樣平均誤差的計算,在抽樣調查中占有相當重要的地位。抽樣調查的優(yōu)點在于它能計算出抽樣平均誤差,且以抽樣平均誤差作為用樣本指標推斷總體指標的重要補充指標。三、影響抽樣平均誤差的因素影響抽樣平均誤差的因素主要有:(一)樣本單位數的多少 在其他條件不變的情況下,樣本單位數愈多,抽樣誤差就愈??;反之,樣本單位數愈少,則抽樣誤差就愈大。樣本單位數越大,樣本就越能反映總體的數量特征,如果樣本單位數擴大到接近總體單位數時,抽樣調查也就接近于全面調查,抽樣誤差就縮小到幾乎完全消失的程度。 (二)總體被研究標志的變異程度 在其他條件不變的情況下,總體各單位標志值變異程度愈小,則抽樣誤差也愈小,抽樣誤差和總體變異程度成正比變化。這是因為總體變異程度小,表示總體各單位標志值之間的差異小,則樣本指標與總體指標之間的差異也就小。如果總體各單位標志值相等,則標志變異程度等于0,樣本指標就完全等于總體指標,抽樣誤差也就不存在了。 (三)抽樣的組織形式和抽樣方法 在其他條件不變的情況下,不重復抽樣下的樣本比重復抽樣下的樣本代表性強,其抽樣誤差相應也要小。在不同的抽樣組織形式下,抽樣誤差也不同。 了解影響抽樣誤差的因素,對于控制和分析抽樣誤差十分重要。在上述影響抽樣誤差的三個因素中,標志變異程度是客觀存在的因素,是調查者無法控制的,但樣本單位數、抽樣方法及抽樣的組織形式卻是調查者能夠選擇和控制的。因此,在實際工作中,應當根據研究的目的和具體情況,做好抽樣設計和實施工作,以獲得經濟有效的抽樣效果。四、抽樣極限誤差 (一)抽樣極限誤差的含義 抽樣極限誤差是從另一個角度來考慮抽樣誤差問題的。用樣本指標推斷總體指標時,要想達到完全準確和毫無誤差,幾乎是不可能的。樣本指標和總體指標之間總會有一定的差距,所以在估計總體指標時就必須同時考慮誤差的大小。我們不希望誤差太大,因為這會影響樣本資料的價值。誤差愈大,樣本資料的價值便愈小,當誤差超過一定限度時,樣本資料也就毫無價值了。所以在進行抽樣推斷時,應該根據所研究對象的變異程度和分析任務的需要確定允許的誤差范圍,在這個范圍內的數字就算是有效的。這就是抽樣極限誤差的問題。 抽樣極限誤差是指樣本指標和總體指標之間抽樣誤差的可能范圍。由于總體指標是一個確定的數,而樣本指標則是圍繞著總體指標左右變動的量,它與總體指標可能產生正離差,也可能產生負離差,樣本指標變動的上限或下限與總體指標之差的絕對值就可以表示抽樣誤差的可能范圍。 設分別表示樣本平均數的抽樣極限誤差和樣本成數的抽樣極限誤差,則有:上面的不等式可以變換為下列不等式關系: 上面第一式表明樣本平均數 是以總體平均數為中心,在至至之間變動的,區(qū)間稱為樣本平均數的估計區(qū)間,區(qū)間的長度為2,在這個區(qū)間內樣本平均數和總體平均數之間的絕對離差不超過。同樣,上面第二式表明,樣本成數是以總體成數P為中心,在至之間變動的,在區(qū)間內樣本成數與總體成數的絕對離差不超過。由于總體平均數和總體成數是未知的,它需要用實測的樣本平均數和樣本成數來估計,因而抽樣極限誤差的實際意義是希望估計區(qū)間能以一定的可靠程度覆蓋總體平均數,能以一定的可靠程度覆蓋總體成數P,因而上面的不等式應變換為 (二)抽樣極限誤差的計算 基于概率估計的要求,抽樣極限誤差通常需要以抽樣平均誤差或為標準單位來衡量。把抽樣極限誤差或分別除以或,得相對數t,它表示誤差范圍為抽樣平均誤差的若干倍,t是測量估計可靠程度的一個參數,稱為抽樣誤差的概率度。 抽樣估計的概率度是表明樣本指標和總體指標的誤差不超過一定范圍的概率保證程度。由于樣本指標隨著樣本的變動而變動,它本身是一個隨機變量,因而樣本指標和總體指標的誤差仍然是一個隨機變量,并不能保證誤差不超過一定范圍這個事件是必然事件,而只能給以一定程度的概率保證。因此,就有必要計算樣本指標落在一定區(qū)間范圍內的概率,這種概率稱為抽樣估計的概率保證程度。根據抽樣極限誤差的基本公式=t得出,概率度t的大小要根據對推斷結果要求的把握程度來確定,即根據概率保證程度的大小來確定。概率論和數理統(tǒng)計證明,概率度t與概率保證程度F(t)之間存在著一定的函數關系,給定t值,就可以計算出F(t)來;相反,給出一定的概率保證程度F(t),則可以根據總體的分布,獲得對應的t值。在實際應用中,因為我們所研究的總體大部分為正態(tài)總體,對于正態(tài)總體而言,為了應用的方便編有正態(tài)概率表以供使用。根據正態(tài)概率表,已知概率度t可查得相應的概率保證程度F(t);相反,已知概率保證程度F(t)也可查得相應的概率度t。 從抽樣極限誤差的計算公式來看,抽樣極限誤差與概率度t和抽樣平均誤差三者之間存在如下關系: 1.在值保持不變的情況下,增大t值,抽樣極限誤差也隨之擴大,這時估計的精確度將降低;反之,要提高估計的精確度,就得縮小t值,此時概率保證程度也會相應降低。 2.在t值保持不變的情況下,如果值小,則抽樣極限誤差就小,估計的精確度就高;反之,如果值大,抽樣極限誤差就大,估計的精確度就低。 由此可見,估計的精確度與概率保證程度是一對矛盾,進行抽樣估計時必須在兩者之間進行慎重的選擇。【能力訓練】在一定的誤差范圍要求下( )。 概率度大,要求可靠性低,樣本數目相應要多概率度大,要求可靠性高,樣本數目相應要多概率度小,要求可靠性低,樣本數目相應要少概率度小,要求可靠性高,樣本數目相應要少概率度小,要求可靠性低,樣本數目相應要多第三節(jié) 抽樣估計 抽樣估計是指利用實際調查的樣本指標的數值來估計相應的總體指標的數值的方法。由于總體指標是表明總體數量特征的參數,例如總體平均數、總體成數等,所以抽樣估計也稱為參數估計。參數估計有點估計和區(qū)間估計兩種方法。一、點估計 點估計的基本特點是,根據樣本資料計算樣本指標,再以樣本指標數值直接作為相應的總體指標的估計值。例如,以實際計算的樣本平均數作為相應總體平均數的估計值;以實際計算的樣本成數作為相應總體成數的估計值等等。設以樣本平均數作為總體平均數的估計值,樣本成數p作為總體成數P的估計值。 點估計的優(yōu)點是原理直觀,計算簡便,在實際工作中經常采用。不足之處是這種估計方法沒有考慮到抽樣估計的誤差,更沒有指明誤差在一定范圍內的概率保證程度。因此,當抽樣誤差較小,或抽樣誤差即使較大也不妨礙對問題的認識和判斷時,才可以使用這種方法。二、區(qū)間估計 (一)區(qū)間估計的含義 區(qū)間估計的基本特點是,根據給定的概率保證程度F(t)的要求,利用實際樣本資料,給出總體指標估計值的上限和下限,即指出可能覆蓋總體指標的區(qū)間范圍。也就是說,區(qū)間估計要解決兩個問題: 第一,根據樣本指標和誤差范圍估計出一個可能包括總體指標的區(qū)間,即確定出估計區(qū)間的上限和下限。 第二,確定出估計區(qū)間覆蓋總體未知參數的概率保證程度。區(qū)間估計的基本公式有 從而得到總體平均數的估計區(qū)間:總體成數的估計區(qū)間:(二)區(qū)間估計的模式 在進行區(qū)間估計的時候,根據所給定條件的不同,總體平均數和總體成數的估計有以下兩套模式可供選擇使用。 1.根據已給定的誤差范圍,求概率保證程度。具體步驟是:第一步,抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數p,作為總體指標的估計值,并計算樣本標準差s以推算抽樣平均誤差。第二步,根據給定的抽樣極限誤差,估計總體指標的上限和下限。 第三步,將抽樣極限誤差除以抽樣平均誤差,求出概率度t,再根據t值查正態(tài)概率表求出相應的概率保證程度。【案例】對工廠生產設備中某種型號的機械零件進行耐磨性能檢驗,抽查的樣本資料見表7-5,要求耐磨時數的允許誤差范圍為10小時(=10)。試估計這批機械零件的平均耐磨時數。 表7-5 某型號機械零件耐磨性能資料耐磨時數(小時)組中值x(小時)零件數f(個)900以下87519009509252950100097561000105010253510501100107543110011501125911501200117531200以上12251合計-100 第一步,計算,s, 注意:總體標準差以樣本標準差s代替第二步,根據給定的=10,計算總體平均數的上、下限:下限=1055.5-10=1045.5(小時)上限=1055.5+10=1065.5(小時)第三步,根據,查正態(tài)概率表得概率保證程度F(t)=94.64%。 推斷的結論是:根據要求耐磨時數的允許誤差范圍為10小時,估計這批機械零件耐磨時數在(1045.5,1065.5)之間,其概率保證程度為94.64%?!景咐咳杂帽?-5中的資料,設該種型號零件質量標準規(guī)定,耐磨時數達1000小時以上為合格品,要求合格率估計的允許誤差范圍不超過4%,試估計該批機械零件的合格率。第一步,計算p,,第二步,根據給定的=4%,求總體合格率的上、下限:下限=91%-4%=87%上限=91%+4%=95% 第三步,根據=1.4,查正態(tài)概率表得概率F(t)=83.85%。 推斷的結論是:根據要求,合格率允許誤差范圍不超過4%,估計這批零件的合格率在(87%,95%)之間,其概率保證程度為83.85%。 2.根據已給定的概率保證程度,求抽樣極限誤差。具體步驟是: 第一步,抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數p,作為總體指標的估計值,并計算樣本標準差s以推算抽樣平均誤差。 第二步,根據給定的概率保證程度F(t),查概率表求得概率度t值。 第三步,根據概率度t和抽樣平均誤差推算出抽樣極限誤差,并根據抽樣極限誤差求出被估計總體指標的上限和下限。【案例】對我國某中等城市進行居民家庭年人均旅游消費支出調查,隨機抽取400戶居民家庭,調查得知居民家庭年人均旅游消費支出額為400元,標準差為100元,要求以95%的概率保證程度,估計該市年人均旅游消費支出額。第一步,根據已知資料算得年人均消費支出額=400(元)樣本標準差s=100(元)注意:總體標準差以樣本標準差s代替第二步,根據給定的概率保證程度F(t)=95%,查正態(tài)概率表得t=1.96。第三步,計算=1.965=9.80,則該市居民家庭年人均旅游消費支出額:下限=400-9.80=390.20(元)上限=400+9.80=409.80(元) 結論:在95%的概率保證程度下,估計該市居民家庭年人均旅游消費支出額在(390.20,409.80)之間?!景咐繛榱私鈬鴥嚷糜稳藬登闆r,在一些地區(qū)隨機調查5000人,結果發(fā)現800人有當年國內旅游計劃,要求以95%的概率保證程度,估計國內旅游人數比率的可能范圍。第一步,根據已知資料算得注意:P(1-P)用p(1-p)代替第二步,根據給定的概率保證程度F(t)=95%,查正態(tài)概率表得概率度t=1.96。第三步,計算=1.960.518%=1.015%則總體比率的上、下限為:下限=16%-1.015%=14.985%上限=16%+1.015%=17.015% 結論:在95%的概率保證程度下,估計國內旅游人數的比率在15%,17%之間。第四節(jié) 必要樣本單位數的確定一、樣本單位數的確定【引言】科學地組織抽樣調查,保證隨機抽樣條件的實現,并合理有效地取得各項數據,是抽樣設計中一個至關重要的問題。注意相關問題如下:首先要保證隨機原則的實現。其次,樣本單位數確定。 再次,科學選擇抽樣組織形式。最后,還必須重視調查費用這個基本因素。實際上任何一項抽樣調查都是在一定費用的限制下進行的。抽樣設計應該力求采用調查費用最省的方案。一般地說,提高精確度的要求與節(jié)省費用的要求往往有矛盾,抽樣誤差要求愈小,則調查費用需要愈多。因此,抽樣誤差最小的方案并非是最好的方案,在許多情況下,允許一定范圍的誤差仍能夠滿足分析的要求。我們的任務就是在允許的誤差要求下,選擇費用最少的抽樣設計方案。綜上所述,抽樣設計應該掌握兩個基本原則: 第一,保證實現抽樣的隨機原則,即保證總體各單位的相互獨立性,以及任何一個單位在每次抽樣中被抽中機會的均等性。 第二,保證實現最大的抽樣效果原則,即在一定的調查費用下,選取抽樣誤差最小的方案;或在給定調查精確度的要求下,選取調查費用最省的方案。 (一)根據平均數的抽樣極限誤差確定樣本單位數 影響抽樣誤差的因素之一,是樣本單位數的多少。在抽樣調查中,事先確定必要的樣本單位數,是一項重要的工作。由于樣本單位數n是抽樣極限誤差公式的組成部分,所以可以根據抽樣極限誤差公式推導出樣本單位數。以簡單隨機抽樣為例,測定總體平均數所必需的樣本單位數n。 1.重復抽樣條件下: 2.不重復抽樣條件下: (二)根據成數的抽樣極限誤差確定樣本單位數1.重復抽樣條件下2.不重復抽樣條件下或是指在抽樣誤差不超過預先規(guī)定的數值,即滿足抽樣極限誤差小于等于或的條件下,至少應抽取的樣本單位數。(三)確定必要樣本單位數應注意的問題 在確定必要樣本單位數的過程中,可能會遇到一些應用性問題,主要應注意以下幾個方面: 1.總體指標未知的問題。公式中涉及到總體標準差與總體成數資料時,一般可利用以前的經驗數據或樣本數據來代替。若遇到有不止一個經驗數據或樣本數據時,宜選擇最大的一個。若總體成數未知,可選取使成數方差達到最大(0.25)或接近最大的P值代入。 2.估計對象導致數目不相等的問題。對于同一資料既要估計平均數又要估計成數時,根據這兩種估計所求的必要樣本單位數可能不相等,這時應選擇其中樣本單位數較大的進行抽樣,以保證抽樣推斷的精確性和可靠性。 3.抽樣方式導致數目不相等的問題。按重復抽樣公式計算的必要樣本單位數要比按不重復抽樣公式確定的必要樣本單位數大。在條件允許的情況下,為保證抽樣推斷的精確度和可靠程度,原則上,一切抽樣調查在計算必要樣本單位數時,都可采用重復抽樣公式計算。 二、影響樣本單位數的因素 影響樣本單位數的因素主要有以下幾個:(一)總體標準差在其他條件不變的情況下,總體標準差與樣本單位數成正比??傮w標準差大,說明總體差異程度高,總體各單位標志值較平均數的離散程度高,則樣本單位數就多;反之,總體標準差小,則樣本單位數就少。(二)抽樣極限誤差在其他條件不變的情況下,抽樣極限誤差與樣本單位數成反比。如果允許的誤差范圍越大,對抽樣估計的精確度要求越低,則樣本單位數就越少;反之,若允許的誤差范圍越小,對精確度的要求越高,則樣本單位數就越多。(三)抽樣方法及抽樣的組織形式抽樣方法和抽樣組織形式不同,樣本單位數的多少也不同。在其他條件不變的情況下,重復抽樣條件下的樣本單位數多于不重復抽樣條件下的樣本單位數;在適宜的條件下,類型抽樣比簡單重復抽樣的樣本單位數少。此外,樣本單位數的多少,一方面要考慮耗費的人力、財力、物力和時間的允許條件;另一方面要考慮能否達到研究的預期目的。一般而言,樣本單位數越多,抽樣誤差越小,樣本的代表性越大。但是,樣本單位數越多,耗費的人力、物力、財力和時間也越多,從而又導致研究結果的時效性差。因此,在確定樣本單位數時,還要考慮到這個方面的需要與可能。 【案例】仍利用表7-5中的資料,確定必要樣本單位數。根據表7-5中的已知資料計算得到=1055.5小時,s=51.91小時,=10小時,t=1.93,p=90%(耐磨時數達1000小時以上比重),=4%.按樣本平均數的重復抽樣公式,確定必要樣本單位數為按樣本成數的重復抽樣公式,確定必要樣本單位數為 根據計算結果,進行抽樣調查時所確定的必要樣本單位數應為210個。第五節(jié) 抽樣的組織形式一、簡單隨機抽樣 簡單隨機抽樣又稱純隨機抽樣。它是對總體中的所有單位不進行任何分組、排隊,而是完全隨機地直接從總體N個單位中抽取n個單位,作為一個樣本進行調查。在抽樣中保證總體中每個單位都有同等的被抽中的機會。 簡單隨機抽樣是抽樣中最基本、最單純的組織形式,它適用于均勻總體,即具有某種特征的單位均勻地分布于總體的各個部分,使總體的各個部分都是同等分布的。獲得簡單隨機樣本的具體做法主要有兩種:1.抽簽法。抽簽法就是將總體各單位編號,以抽簽的方式從中任意抽取所需樣本單位的方法。 2.查隨機數表法。所謂隨機數表是指含有一系列組別的隨機數字的表格。表中數字的出現及其排列是隨機的。查隨機數表時,可以豎查、橫查、順查、逆查;可以用每組數字左邊的頭幾位數,也可以用其右邊的后幾位數,還可以用中間的某幾位數字。這些都需要事先定好。但一經決定采用某一種具體做法,就必須保證對整個樣本的抽取完全遵從同一規(guī)則。簡單隨機抽樣在理論上最符合隨機原則,但在實際應用中有很大的局限性:第一,無論用抽簽法還是用查隨機數表法取樣,均需對總體各個單位逐一編號。而抽樣推斷中的總體單位數很多,編號查號的工作量很大。第二,當總體各單位標志變異程度較大時,簡單隨機抽樣的代表性就比較差。第三,對某些事物根本無法進行簡單隨機抽樣,如對正在連續(xù)生產的大量產品進行質量檢驗,就不可能對全部產品進行編號抽檢。所以簡單隨機抽樣適用于所調查的總體單位數不多、且各單位標志變異程度較小的情況。二、類型抽樣 類型抽樣亦稱分類抽樣或分層抽樣。它是先將總體各單位按主要相關標志分組(或分類),然后在各組(或各類)中再按隨機原則抽取樣本單位的組織形式。例如,在進行城市職工家庭旅游消費支出抽樣調查時,首先把職工按所屬國民經濟部門分類,然后再在各部門中抽取若干個調查戶;再如,進行星級賓館入住情況調查時,先將各賓館按星級標準分為五星、四星、三星、二星和一星五類,然后再在各類賓館中抽取若干個調查單位。 類型抽樣實質上是分組法和隨機抽樣法相結合的產物。先劃分出性質不同的各個組,以減少組內標志值之間的變異程度;然后按照隨機原則,從各組中抽取調查單位。所以,類型抽樣所抽取的樣本代表性較高,抽樣誤差小,能夠以較少的樣本單位數獲得比較準確的推斷結果。特別是當總體各單位標志值相差很大,各組間標志值變異程度很大時,類型抽樣則更為優(yōu)越。 經過劃類分組后,確定各類型組樣本單位數一般有兩種方法: 第一,不等比例抽樣。即各類型組所抽取的單位數,按各類型組標志值的變異程度來確定,變異程度大則多抽一些單位,變異程度小則少抽一些單位。這種方法又稱為類型適宜抽樣或稱一般抽樣。 第二,等比例抽樣。即按各類型組的單位數占總體單位數的比重進行抽樣。 在實際工作中,由于事先很難了解各組的標志變異程度,因此,大多數類型抽樣采用等比例抽樣法。 類型抽樣的特點是,樣本單位數不是從整個總體,而是從各類中分別抽取,且彼此獨立。三、等距抽樣 等距抽樣亦稱機械抽樣。它是先把總體各單位按照某一標志排隊,然后按相等的距離抽取樣本單位的組織形式。排隊的標志可以是與調查標志無關的,也可以是與調查標志有關的。 按無關標志排隊,是指排隊時采用與調查項目無關的標志進行。例如,按姓氏筆畫多少排隊、按地名筆畫排隊、按人名冊、戶口簿及按地圖上的地理位置排隊等。也可以按時間順序排隊,例如,檢查產品質量,確定按10%的比率抽檢,這時即可按時間順序在每10個產品中抽取一個進行質量檢查,直至將規(guī)定的樣本單位數抽滿為止。 按有關標志排隊,是指排隊時采用與調查項目有關的標志進行。例如,進行我國糧食產量抽樣調查,由省抽縣,縣抽鄉(xiāng),鄉(xiāng)抽村,都是按前三年的糧食平均畝產量排隊的;進行我國城市職工家計抽樣調查,是按職工平均工資排隊的。按有關標志排隊,能使被研究對象標志值的變動均勻地分布在總體中,保證樣本具有較高的代表性。 等距抽樣除考慮排隊的標志外,還需要考慮抽樣距離的問題。設N為全及總體單位數,n為樣本單位數,k為抽樣距離,則k=N/n。 等距抽樣的隨機性表現在抽取的第一個樣本單位上,當第一個樣本單位確定后,其余的各個樣本單位也就確定了。就是說,第一個樣本單位確定后,每加一個抽樣距離就是下一個被抽取的樣本單位,直至抽滿規(guī)定的樣本單位數為止。例如,進行工業(yè)產品質量檢查,當確定按5%的比率抽取樣本單位時,可以按時間順序每隔5件抽取一件產品進行登記,一直達到預定的樣本單位數為止。又如,進行糧食產量抽樣調查時,抽取樣本單位是先按最近三年糧食平均畝產量排隊,再根據累計播種面積和預定抽取的樣本單位數計算抽樣距離,第一個樣本單位在1/2抽樣距離處,以后每加一個抽樣距離就是下一個被抽取的樣本單位,直至抽滿規(guī)定的樣本單位數為止。 等距抽樣在按無關標志排隊、等距抽取樣本單位時,實質上仍是簡單隨機抽樣,其抽樣平均誤差的計算公式與簡單隨機抽樣相同。在按有關標志排隊、等距抽取樣本單位時,實質上就成為類型抽樣的特例。因此,抽樣平均誤差的公式與類型抽樣公式相同。但按有關標志排隊的等距抽樣與類型抽樣略有不同,等距抽樣只在各組中抽取一個單位,而類型抽樣是在各組中抽取若干個單位。四、整群抽樣 整群抽樣亦稱成組抽樣。前面介紹的三種抽樣組織形式,都是一個一個地抽取樣本單位,故稱為個體抽樣。整群抽樣則是一批一批地抽取樣本單位,每抽取一批時,對其中所有的單位都進行登記調查。抽取的形式,既可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論