第三章-抽樣與抽樣分布2014_第1頁
第三章-抽樣與抽樣分布2014_第2頁
第三章-抽樣與抽樣分布2014_第3頁
第三章-抽樣與抽樣分布2014_第4頁
第三章-抽樣與抽樣分布2014_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

湖北大學商學院chenqianli第

章抽樣與抽樣分布3.1

常用的抽樣方法3.2

抽樣分布3.3

中心極限定理的應用

湖北大學商學院chenqianli你不必吃完整一頭牛,才知道它的肉是咬不動的。

SamelJohnson湖北大學商學院chenqianli統(tǒng)計應用

“抓鬮”征兵計劃

在美國的對越戰(zhàn)爭中,為使前線有足夠的士兵,美國政府制定了一個“抓鬮”的征兵計劃。該計劃打算把1到366的號碼隨機地分配給一年中每一天,然后由軍事部門按分配的號碼順序把生日與之對應的年輕人分批征召入伍。這種方法的目的是為了給大家相等的機會卷入這場不受歡迎的戰(zhàn)爭中,因此被征召的可能性應該是隨機的在第一年的征兵計劃中,號碼1被分配給了9月14日,分配方法是隨機抽取一個大容器中的366個寫上了日子的乒乓球。結(jié)果所有年滿18歲且生于9月14日的合格青年將作為第一批被征召入伍。生日被分配為號碼2的青年則在第二批被征召入伍,以此類推湖北大學商學院chenqianli統(tǒng)計應用

“抓鬮”征兵計劃我們知道,并不是所有的人都被征召入伍,因此,生日被分配的號碼較大的人也許永遠輪不上到軍隊服役這種抓鬮看起來對決定應該被征召入伍是一個相當不錯的方法。然而,在抓鬮的第二天,當所有的日子和它們對應的號碼公布以后,統(tǒng)計學家們開始研究這些數(shù)據(jù)。經(jīng)過觀察和計算,統(tǒng)計學家們發(fā)現(xiàn)了一些規(guī)律。例如,我們本應期望應該有差不多一半的較小的號碼(1到183)被分配給前半年的日子,即從1月份到6月份;另外一半較小的號碼被分配給后半年的日子,從7月到12月份。由于抓鬮的隨機性,前半年中可能不會分到正好一半較小的號碼,但是應當接近一半湖北大學商學院chenqianli統(tǒng)計應用

“抓鬮”征兵計劃然而結(jié)果是,有73個較小的號碼被分配給了前半年的日子,同時有110個較小的號碼被分配給了后半年的日子。換句話說,如果你生于后半年的某一天,那么,你因為被分配給一個較小號碼而去服兵役的機會要大于生于前半年的人在這種情況下,兩個數(shù)字之間只應該有隨機誤差,而73和110之間的差別超出了隨機性所能解釋的范圍。這種非隨機性是由于乒乓球在被抽取之前沒有被充分攪拌造成的。在第二年,主管這件事的部門在抓鬮之前去咨詢了統(tǒng)計學家(這可能使生于后半年的人感覺稍微舒服些)湖北大學商學院chenqianli3.1

常用的抽樣方法非概率抽樣與概率抽樣

簡單隨機抽樣分層抽樣系統(tǒng)抽樣整群抽樣湖北大學商學院chenqianli抽樣方法非概率抽樣與概率抽樣統(tǒng)計推斷是根據(jù)一部分單位構(gòu)成的樣本來推斷總體特征的統(tǒng)計方法,盡管樣本的大小很重要,但決定統(tǒng)計推斷最關(guān)鍵的因素是樣本的代表性,即能否及在多大程度上代表總體。非概率抽樣是指人為地選擇一部分單位作為樣本的方法,盡管有時并不是那么明顯。如方便抽樣和自愿樣本。湖北大學商學院chen

qianli非概率抽樣方便抽樣(conveniencesampling)是由調(diào)查人員的便利來獲取樣本的方法,最典型的形式為商場或購物中心的消費者調(diào)查。但商場調(diào)查的人并不能代表人口總體,如這些人可能比較有錢,青少年或退休人士較多,且調(diào)查傾向于外表整潔,看起來不具威脅的人,由此商場的樣本是有偏的,代表性較差。自愿樣本,又稱自愿回應樣本(voluntaryresponsesample)是指對某一訴求的回應而自然形成的樣本。如寫信回應、電話回應或網(wǎng)上回應,樣本是由本調(diào)查者自己決定的,樣本也是有偏的。湖北大學商學院

chen

qianli湖北大學商學院chenqianliAvoluntaryresponsesampleconsistsofpeoplewhochoosethemselvesbyrespondingtoageneralappeal.Voluntaryresponsesamplesarebiasedbecausepeoplewithstrongopinions,especiallynegativeopinions,aremostlikelytorespond.conveniencesamplingchoosestheindividualseasiesttoreach.Hereisanexampleofconveniencesampling.Bothvoluntaryresponsesamplesandconveniencesamplesproducesamplesthatarealmostguaranteednottorepresenttheentirepopulation.Thesesamplingmethodsdisplaybias,orsystematicerror,infavoringsomepartsofthepopulationoverothers.湖北大學商學院chenqianli

概率抽樣

(probabilitysampling)根據(jù)隨機性原則來抽取樣本單位,也稱隨機抽樣,隨機性原則來消除人為因素的影響,具有較好的代表性,目前成為抽樣的主要的專業(yè)方法,如蓋洛普的調(diào)查等。特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率湖北大學商學院chenqianliProbabilitySample

ProbabilitySampleAprobabilitysampleisasamplechosenbychance.Wemustknowwhatsamplesarepossibleandwhatchance,orprobability,eachpossiblesamplehas.Ineverycase,however,theuseofchancetoselectthesampleistheessentialprincipleofstatisticalsampling.湖北大學商學院chenqianli簡單隨機抽樣(simplerandomsampling)從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中

(注意:教材中SRS的定義“每一個總體單位有相同的機會被抽中”是不正確的。考慮一個有相同數(shù)量的男性和女性組成的總體,隨機拋擲一枚硬幣,如正面朝上,隨機選擇100名女性構(gòu)成樣本,如反面朝上,隨機選擇100名男性構(gòu)成樣本,每個人被抽中的概率相同但顯然不是SRS)抽取元素的具體方法有重復抽樣和不重復抽樣特點:簡單、直觀,在抽樣框完整時,可直接抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性:當N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率湖北大學商學院chenqianlisimplerandomsamplingAsimplerandomsample(SRS)ofsizenconsistsofnindividualsfromthepopulationchoseninsuchawaythateverysetofnindividualshasanequalchancetobethesampleactuallyselected.湖北大學商學院chenqianli簡單隨機樣本

(simplerandomsample)由簡單隨機抽樣形成的樣本從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中參數(shù)估計和假設(shè)檢驗所依據(jù)的主要是簡單隨機樣本湖北大學商學院chenqianli簡單隨機抽樣的一般步驟1確定抽樣框,對每個個體指定一個數(shù)字代碼,一般要求每個代碼具有相同的位數(shù)。2利用隨機數(shù)表來隨機選取代碼。現(xiàn)在大部分統(tǒng)計軟件可以對一組數(shù)據(jù)直接進行簡單抽樣。湖北大學商學院chenqianli分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計湖北大學商學院chenqianliStratifiedRandomSampleToselectastratifiedrandomsample,firstdividethepopulationintogroupsofsimilarindividuals,calledstrata.ThenchooseaseparateSRSineachstratumandcombinetheseSRSstoformthefullsample.AmarketresearchfirminCaliforniausesrandomdigitdialingtochoosetelephonenumbersatrandom.NumbersareselectedseparatelywithineachCaliforniaareacode.Thesizeofthesampleineachareacodeisproportionaltothepopulationlivingthere.StratifiedRandomSampleThevalueofstratifiedrandomsamplingdependsonhowhomogeneoustheelementsarewithinthestrata.Ifelementswithinstrataarealike,thestratawillhavelowvariances.Thusrelativelysmallsamplesizecanbeusedtoobtaingoodestimatesofthestratacharacteristics.Ifstrataarehomogeneous,thestratifiedrandomsamplingprocedureprovidesresultsjustaspreciseasthoseofsimplerandomsamplingbyusingasmallertotalsamplesize湖北大學商學院chenqianli湖北大學商學院chenqianli系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難湖北大學商學院chenqianli整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差ClustersamplingClustersamplingtendstoprovidethebestresultswhentheelementswithintheclustersarenotalike.Intheidealcase,eachclusterisarepresentativesmall-scaleversionoftheentirepopulation.Thevalueofclustersamplingdependsonhowrepresentativeeachclusterisoftheentirepopulation.Ifallclustersarealikeinthisregard,samplingasmallnumberofclusterswillprovidegoodestimatesofthepopulationparameters湖北大學商學院chenqianli湖北大學商學院chenqianli多階段抽樣

(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法

湖北大學商學院chenqianlimultistagesampleTheCurrentPopulationSurveysamplingdesignisroughlyasfollows:Stage1.DividetheUnitedStatesinto2007geographicalareascalledPrimarySamplingUnits,orPSUs.PSUsdonotcrossstatelines.Selectasampleof754PSUs.Thissampleincludesthe428PSUswiththelargestpopulationsandastratifiedsampleof326oftheothers.Stage2.DivideeachPSUselectedintosmallerareascalled“blocks.”StratifytheblocksusingethnicandotherinformationandtakeastratifiedsampleoftheblocksineachPSU.Stage3.Sortthehousingunitsineachblockintoclustersoffournearbyunits.Interviewthehouseholdsinaprobabilitysampleoftheseclusters.抽樣調(diào)查的清單(checklist):無論是自己調(diào)查還是依賴其他人收集的數(shù)據(jù),無論是自己分析數(shù)據(jù)還是閱讀別人的分析報告,你應該確信能夠回答關(guān)于樣本來源的幾個問題。如果你開始于有偏的樣本,無論后續(xù)的分析多好均無濟于事,你的結(jié)論令人懷疑。樣本框是什么?它與總體匹配嗎?樣本是簡單隨機樣本(SRS)嗎?如果不是,抽樣是如何設(shè)計的?抽樣調(diào)查的清單(checklist):不回應率是多少?不回應的問題在于,不回應的個體不同于回應的個體。不好的做法是發(fā)出大量的調(diào)查表但回應率比較低,好的做法是選擇一個較小的樣本而有資源保證高的回應率。如果回應率比較低,如20%,你需要了解參與的個體與拒絕的個體是否相似。低回應率的簡單隨機樣本類似于自愿性回應樣本。抽樣調(diào)查的清單(checklist):問題的措辭如何?問題的措辭對回答有重要影響,讓人迷惑的或引導人的問題會帶來強烈的偏差。如美國人對政府幫助窮人方面看法如何?只有13%的人認為政府花了太多的資金在幫助窮人上,但有44%的人認為政府花太多的資金在福利上。在蘇格蘭人對獨立于英國的運動的看法上,51%會投票支持蘇格蘭獨立,但只有34%支持獨立的蘇格蘭與英國分開。選項的位置也會影響回答。有研究發(fā)現(xiàn),選票頂上的候選人平均會比其他位置多獲得2%的選票抽樣調(diào)查的清單(checklist):訪談員會影響結(jié)果嗎?許多調(diào)查需要面對面,如果訪談員與回答者相互影響,答案可能反映他們之間的影響而不是我們想度量的,一般而言,回答者往往會以一種讓訪談者高興的方式回答問題,無論是有意還是無意。訪談者的性別、打扮或行為會通過細微的暗示來影響回答。抽樣調(diào)查的清單(checklist):幸存者偏差(survivorbias)會影響調(diào)查嗎幸存者偏差指某些活的比較長的個體更可能被選擇為樣本而產(chǎn)生的偏差。此詞來自于醫(yī)學研究,在商業(yè)上會經(jīng)常遇到。如許多投資者投資基金,為了了解基金的情況從現(xiàn)有基金的列表中隨機選擇一個樣本進行分析,這樣分析的結(jié)果會遭遇幸存者偏差,因為樣本中沒有已清盤的基金。湖北大學商學院chenqianli3.2抽樣分布總體分布與抽樣分布一個總體參數(shù)推斷時樣本統(tǒng)計量的抽樣分布兩個總體參數(shù)推斷時樣本統(tǒng)計量的抽樣分布湖北大學商學院chenqianli總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布

(populationdistribution)總體湖北大學商學院chenqianli樣本統(tǒng)計量的概率分布,是一種理論分布在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學性的重要依據(jù) 抽樣分布

(samplingdistribution)湖北大學商學院chenqianli抽樣分布的形成過程

(samplingdistribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本湖北大學商學院chenqianli

樣本統(tǒng)計量的抽樣分布

(一個總體參數(shù)推斷時)樣本均值的抽樣分布樣本比例的抽樣分布樣本方差的抽樣分布湖北大學商學院chenqianli在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布湖北大學商學院chenqianli樣本均值的抽樣分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14均值和方差湖北大學商學院chenqianli樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)湖北大學商學院chenqianli樣本均值的抽樣分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.00P

(x)1.53.04.03.52.02.5湖北大學商學院chenqianli樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14抽樣分布P(x)1.01.53.04.03.52.02.5x湖北大學商學院chenqianli樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學期望為μ,方差為σ2/n。即x~N(μ,σ2/n)湖北大學商學院chenqianli中心極限定理

(centrallimittheorem)當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ,方差為σ2/n的正態(tài)分布一個任意分布的總體x湖北大學商學院chenqianli中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程湖北大學商學院chenqianli抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布湖北大學商學院chenqianli樣本均值的數(shù)學期望樣本均值的方差重復抽樣不重復抽樣樣本均值的抽樣分布

(數(shù)學期望與方差)湖北大學商學院chenqianli總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

比例

(proportion)湖北大學商學院chenqianli在重復選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例的理論基礎(chǔ) 樣本比例的抽樣分布湖北大學商學院chenqianli樣本比例的數(shù)學期望樣本比例的方差重復抽樣不重復抽樣樣本比例的抽樣分布

(數(shù)學期望與方差)湖北大學商學院chenqianli樣本方差的分布在重復選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即湖北大學商學院chenqianli由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導出來設(shè),則令,則Y服從自由度為1的2分布,即

當總體,從中抽取容量為n的樣本,則2分布

(2

distribution)湖北大學商學院chenqianli分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為E(2)=n,方差為D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的服從2分布的隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布2分布

(性質(zhì)和特點)湖北大學商學院chenqianlic2分布

(圖示)

選擇容量為n的簡單隨機樣本計算樣本方差s2計算卡方值2=(n-1)s2/σ2計算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20

ms總體湖北大學商學院chenqianlic2分布

(例題的圖示)16個樣本方差的分布樣本方差s2s2取值的概率0.04/160.56/1624/164.52/16湖北大學商學院chenqianli樣本統(tǒng)計量的抽樣分布

(兩個總體參數(shù)推斷時)

兩個樣本均值之差的抽樣分布兩個樣本比例之差的抽樣分布兩個樣本方差比的抽樣分布湖北大學商學院chenqianli兩個總體都為正態(tài)分布,即,兩個樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學期望為兩個總體均值之差方差為各自的方差之和 兩個樣本均值之差的抽樣分布湖北大學商學院chenqianli兩個樣本均值之差的抽樣分布

m

1s

1總體1s

2

m

2總體2抽取簡單隨機樣樣本容量n1計算x1抽取簡單隨機樣樣本容量n2計算x2計算每一對樣本的x1-x2所有可能樣本的x1-x2m1-m2抽樣分布湖北大學商學院chenqianli兩個總體都服從二項分布分別從兩個總體中抽取容量為n1和n2的獨立樣本,當兩個樣本都為大樣本時,兩個樣本比例之差的抽樣分布可用正態(tài)分布來近似分布的數(shù)學期望為方差為各自的方差之和 兩個樣本比例之差的抽樣分布湖北大學商學院chenqianli兩個樣本方差比的抽樣分布

兩個總體都為正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個總體中分別抽取容量為n1和n2的獨立樣本兩個樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即湖北大學商學院chenqianli由統(tǒng)計學家費希爾(R.A.Fisher)

提出的,以其姓氏的第一個字母來命名設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F分布

(F

distribution)湖北大學商學院chenqianliF分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)湖北大學商學院chenqianli3.3

中心極限定理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論