




已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章 抽樣分布,主要內(nèi)容 第一節(jié) 抽樣的概念與方法 第二節(jié) 簡(jiǎn)單隨機(jī)樣本的抽樣分布 第三節(jié) 抽樣其它組織形式及其分布特征,統(tǒng)計(jì)應(yīng)用:兩個(gè)例子,The purpose of Statistics inference is to obtain information about a population from information contained in sample. 例1:一汽車(chē)輪胎制造商生產(chǎn)一種被認(rèn)為壽命更長(zhǎng)新型輪胎。 例2:某黨派想支持某一候選人參選美國(guó)某州議員,為了決定是否支持該候選人,該黨派領(lǐng)導(dǎo)需要估計(jì)支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時(shí)間及財(cái)力的限制:,抽樣估計(jì)方法主要用在下列兩種情況: 1、對(duì)所考查的總體不可能進(jìn)行全部測(cè)度; 2、從理論上說(shuō)可以對(duì)所考查的總體進(jìn)行全部測(cè)度,但實(shí)踐上由于人力、財(cái)力、時(shí)間等方面的原因,無(wú)法或沒(méi)有必要(不劃算)進(jìn)行全部測(cè)度。 注意: 抽樣調(diào)查必須遵循隨機(jī)原則。 抽樣估計(jì)只能得到對(duì)總體特征的近似測(cè)度,因此,抽樣估計(jì)還必須同時(shí)考察所得結(jié)果的“可能范圍”與“可靠程度”。,第一節(jié) 抽樣的概念與方法,一、抽樣的基本概念 二、簡(jiǎn)單隨機(jī)抽樣的方法,一、抽樣的基本概念,例3:某大公司人事部經(jīng)理整理其2500個(gè)中層干部的檔案。其中一項(xiàng)內(nèi)容是考察這些中層干部的平均年薪及參加過(guò)公司培訓(xùn)計(jì)劃的比例。 總體:2500名中層干部(population ), 如果:上述情況可由每個(gè)人的個(gè)人檔案中得知,可容易地測(cè)出這2500名中層干部的平均年薪及標(biāo)準(zhǔn)差。 假如:1:已經(jīng)得到了如下的結(jié)果: 總體均值=51800 總體標(biāo)準(zhǔn)差=4000,2、同時(shí),有1500人參加了公司培訓(xùn), 則參加公司培訓(xùn)計(jì)劃的比例為: P =1500/2500=0.60 參數(shù)是總體的數(shù)值特征(A parameter is a numerical characteristic of a population.)。 如:例3中的中層干部平均年薪,年薪標(biāo)準(zhǔn)差及受培訓(xùn)人數(shù)所占比例均為該公司中層干部這一總體的參數(shù)。 抽樣估計(jì)就是要通過(guò)樣本而非總體來(lái)估計(jì)總體參數(shù)。,假如抽取30名,得到樣本平均數(shù)、標(biāo)準(zhǔn)差和成數(shù)是,則,樣本:抽取到的30名中層干部。 統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的綜合指標(biāo),是樣本變量的函數(shù)。 另注意區(qū)分樣本容量和樣本個(gè)數(shù): 樣本容量是指一個(gè)樣本所包含的單位數(shù)。 樣本個(gè)數(shù)是指樣本的可能數(shù)目。,二、簡(jiǎn)單隨機(jī)抽樣的方法,(一)放回抽樣 n個(gè)單位的樣本是有n次試驗(yàn)的結(jié)果構(gòu)成 每次試驗(yàn)都是獨(dú)立的 每次試驗(yàn)都在相同條件進(jìn)行 樣本的可能個(gè)數(shù)為 (考慮順序)或 (不考慮順序),(二)不放回抽樣,n個(gè)單位的樣本是有n次試驗(yàn)的結(jié)果構(gòu)成 每次試驗(yàn)不是獨(dú)立的 每個(gè)單位在多次試驗(yàn)中中選機(jī)會(huì)是不等的 樣本的可能個(gè)數(shù)為N(N-1)(N-2)(N-n+1)(考慮順序)或 (不考慮順序),在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,往往采用的是較大總體(視為無(wú)限總體)下的無(wú)序不重復(fù)抽樣。,第二節(jié) 簡(jiǎn)單隨機(jī)樣本的 抽樣分布,一、重置抽樣的抽樣分布 二、不重置抽樣的抽樣分布,一、重置抽樣的抽樣分布,樣本統(tǒng)計(jì)量的分布就是抽樣分布 (一)樣本均值的抽樣分布 容量相同的所有可能樣本的樣本均值的概率分布 一種理論概率分布 進(jìn)行推斷總體總體均值的理論基礎(chǔ),【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為x1=1、x2=2、x3=3 、x4=4 ??傮w的均值、方差及分布如下,均值和方差,總體特征值, 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為,樣本均值的抽樣分布,樣本均值的抽樣分布, 計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,樣本均值的分布與總體分布的比較, = 2.5 2 =1.25,總體分布,顯然,不同的樣本對(duì)應(yīng)著不同的樣本統(tǒng)計(jì)量,而由于樣本抽取的隨機(jī)性,樣本統(tǒng)計(jì)量即為一種隨機(jī)變量。 一般地,樣本統(tǒng)計(jì)量的可能取值及其取值概率,形成其概率分布,統(tǒng)計(jì)上稱(chēng)為抽樣分布(sampling distribution)。 正是抽樣分布及其特征使得用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的“精確程度”能夠給予概率上的描述。 由于樣本統(tǒng)計(jì)量的隨機(jī)性及其抽樣分布的存在,同樣可計(jì)算其均值、方差、標(biāo)準(zhǔn)差等數(shù)字特征來(lái)反映該分布的中心趨勢(shì)和離散趨勢(shì)。,1、樣本平均數(shù)的期望值 由于不同的樣本可得到不同的樣本均值,因此,考察樣本均值的期望就顯得非常重要。 用 表示樣本均值的期望值, 表示總體均值,可證明在簡(jiǎn)單隨機(jī)抽樣中。,結(jié)論:,樣本平均數(shù)的標(biāo)準(zhǔn)差可得: 樣本均值的標(biāo)準(zhǔn)差可用來(lái)測(cè)度樣本均值與總體均值的“距離”,即可用來(lái)計(jì)算可能的誤差,它也被稱(chēng)為均值標(biāo)準(zhǔn)誤(standard error of the mean)或抽樣平均誤差。,2.樣本平均數(shù)的標(biāo)準(zhǔn)差,(二)樣本比例的抽樣分布,在經(jīng)濟(jì)與商務(wù)的許多場(chǎng)合,需要用樣本比例p對(duì)總體比例P進(jìn)行統(tǒng)計(jì)推斷。 樣本比例抽樣分布是樣本比例所有可能值概率分布。 同樣地,要考察樣本比例p與總體比例P的接近程度,需要有樣本比例抽樣分布的相關(guān)信息。,結(jié)論,根據(jù)p的期望值、標(biāo)準(zhǔn)差及前面樣本平均數(shù)的特性(抽樣分布形狀)。 1、期望值:E (p)=P 2、標(biāo)準(zhǔn)差:, 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在不重復(fù)抽樣條件下,共有12個(gè)樣本。所有樣本的結(jié)果為,二、不重置抽樣的抽樣分布 (一)樣本均值的抽樣分布,樣本均值的抽樣分布, 計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,X,樣本均值的分布與總體分布的比較, = 2.5 2 =1.25,總體分布,結(jié)論:(不放回抽樣),1、樣本平均數(shù)的期望值 2、樣本平均數(shù)的標(biāo)準(zhǔn)差 稱(chēng)為有限總體修正因子(finite population correction factor),(二)樣本比例的抽樣分布,不放回抽樣p的期望值、標(biāo)準(zhǔn)差分別為。 1、期望值:E (p)=P 2、標(biāo)準(zhǔn)差:,附注:正態(tài)分布理論與中心極限定理,1、正態(tài)分布的密度函數(shù) 式中 為正態(tài)分布的平均數(shù), 是它的標(biāo)準(zhǔn)差。這兩個(gè)參數(shù)決定正態(tài)分布密度函數(shù)的形狀。也可簡(jiǎn)記為N,正態(tài)分布密度函數(shù)特性:,(1)對(duì)稱(chēng)性。 (2)非負(fù)性。 (3)當(dāng)x處于中心位置時(shí),密度函數(shù)值最大。 (4)在 處為密度函數(shù)的拐點(diǎn),越大圖形越 扁平。,(5)當(dāng)x 時(shí),密度函數(shù)f(x) 0,即曲線(xiàn)向兩邊下垂,伸向無(wú)窮遠(yuǎn)處。,2、正態(tài)分布標(biāo)準(zhǔn)化,正態(tài)分布函數(shù)為:,不同的正態(tài)分布參數(shù)也就有不同的正態(tài)分布形式,利用上式分布函數(shù)計(jì)算各類(lèi)不同的正態(tài)分布形式某點(diǎn)或某區(qū)間的概率是很困難的。必須對(duì)各種正態(tài)分布加以標(biāo)準(zhǔn)化,才能求其概率, 標(biāo)準(zhǔn)化:要求平均數(shù)為0,方差為1,用N(0,1)來(lái)表示。即是原變量變?yōu)樾伦兞浚?例 :某農(nóng)場(chǎng)的小麥畝產(chǎn)量服從正態(tài)分布,已知平均畝產(chǎn)為550公斤,標(biāo)準(zhǔn)差50公斤,求畝產(chǎn)在525575公斤間所占的比例。,例:解放軍戰(zhàn)士的身高是按正態(tài)分布,經(jīng)抽查平均身高175公分,標(biāo)準(zhǔn)差是4公分,現(xiàn)軍服廠要裁制100,000套軍服,問(wèn)身高在171179公分之間要裁多少套?,3、正態(tài)分布再生定理,則無(wú)論樣本容量n大小如何,樣本均值都為正態(tài)分布。,當(dāng)總體分布未知時(shí),需要用到中心極限定理: 對(duì)容量為n 的簡(jiǎn)單隨機(jī)樣本,樣本均值的分布隨樣本容量的增大而趨于正態(tài)分布。 經(jīng)驗(yàn)上驗(yàn)證,當(dāng)樣本容量等于或大于30時(shí),無(wú)論總體的分布如何,樣本均值的分布則非常接近正態(tài)分布。因此統(tǒng)計(jì)上常稱(chēng)容量在30(含30)以上的樣本為大樣本(large-sample-size)。,4、中心極限定理 (Central limit Theorem),5、樣本容量與樣本均值分布的關(guān)系 由于樣本標(biāo)準(zhǔn)差與總體標(biāo)準(zhǔn)差及樣本容量有關(guān): 因此,樣本容量增大,樣本均值標(biāo)準(zhǔn)差變小,從而使樣本分布峰度變高,于是在相同區(qū)間內(nèi),概率分布線(xiàn)下的面積變大,提高了樣本均值落在該區(qū)間的可能性。 注意: 1、所有可能的樣本均值的平均數(shù)等于總體均值,而與樣本容量無(wú)關(guān)。 2、點(diǎn)估計(jì)往往是在總體方差已知的情況下進(jìn)行的。,附注:關(guān)于正態(tài)分布查表的基本方法,概率是曲線(xiàn)下的面積,關(guān)于正態(tài)分布查表的基本方法: f(z) f(z) f(z) z z z -0.5 0 0.5 -0.5 0.5 P(-0.5x 0.5)=0.3829 P(x-0.5)=(1-0.3829)/2=0.5-0.3829/2=0.30855 P(x0.5)=0.30855 P (x0.5)=1-0.30855=0.69145,第三節(jié) 抽樣其它組織形式及其分布特征,一、抽樣其他組織形式 二、抽樣設(shè)計(jì)的基本原則 三、抽樣組織設(shè)計(jì) 四、抽樣方案的設(shè)計(jì),一、抽樣其他組織形式,類(lèi)型抽樣 整群抽樣 系統(tǒng)抽樣 分層抽樣 多階段抽樣,(一)保證隨機(jī)原則的實(shí)現(xiàn) (二)考慮樣本容量和結(jié)構(gòu)問(wèn)題 (三)關(guān)于抽樣的組織形式問(wèn)題 (四)必須重視調(diào)查費(fèi)用這個(gè)基本因素,二、抽樣設(shè)計(jì)的基本原則,三、抽樣的組織設(shè)計(jì),(一)簡(jiǎn)單隨機(jī)抽樣 1、有限總體的抽樣 方法:將總體單位編成抽樣框,而后用直接抽選法、抽簽法或隨機(jī)數(shù)表法抽取樣本單位。 適用:總體規(guī)模不大;總體內(nèi)部差異小。 2、無(wú)限總體的抽樣 方法:必須特殊制定一種獨(dú)立選取樣本點(diǎn)的抽樣過(guò)程,以避免由于某些類(lèi)型的個(gè)體以較大概率被選入而產(chǎn)生誤差。 適用:總體太大或是無(wú)限的;總體內(nèi)部差異小。,隨機(jī)數(shù)字表(摘錄),63271 59986 71744 51102 15141 80714 58683 93108 13554 79945 88547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66355 40102 26646 60147 15702 46276 87453 44790 67122 45573 84358 21625 16999 13385 22782 55363 07449 34835 15290 76616 67191 12777 21861 68689 03263 69393 92785 49902 58447 42048 30378 87618 26933 40640 16281 13186 29431 88190 04588 38733 81290 89541 70290 40113 08243 17726 28652 56836 78351 47327 18518 92222 55201 27340 10493 36520 64465 05550 30157 82242 29520 69753 72602 23756 54935 81628 36100 39254 56835 37636 02421 98063 89641 64953 99337 隨機(jī)數(shù)字表中,可以從任何一個(gè)位置、任何方向開(kāi)始挑選隨機(jī)數(shù)。一旦選擇一個(gè)任意起點(diǎn),就采用事先確定的程序。,(二)類(lèi)型抽樣(分層抽樣或分類(lèi)抽樣) 1、方法:將總體全部單位分類(lèi),形成若干個(gè)類(lèi)型組,后從各類(lèi)型中分別抽取樣本單位,合成樣本。,總體,層1,層2,層, ,2、類(lèi)型抽樣的特點(diǎn):,根據(jù)方差定理: 總方差=組內(nèi)方差的平均數(shù)+組間方差 在劃分類(lèi)型后,類(lèi)型抽樣實(shí)際是對(duì)每組都抽去了一個(gè)樣本,如果各組內(nèi)的抽樣誤差都為0,那么不論各組之間差異如何,整個(gè)樣本的方差就等于總方差(總方差=組間方差),也就是說(shuō)抽取得到的樣本分布完全和總體分布一樣,也就不存在抽樣誤差。 所以說(shuō),類(lèi)型抽樣總的抽樣誤差主要取決于各組內(nèi)的抽樣誤差。,3、類(lèi)型抽樣平均誤差的計(jì)算,設(shè)總體有N個(gè)單位組成,把總體分為k組,然后從每組中抽取樣本單位構(gòu)成樣本總體。怎樣從每類(lèi)中抽取呢?通常是等比例抽樣。,(三)等距抽樣 (機(jī)械抽樣或系統(tǒng)抽樣),1、方法:將總體單位按某一標(biāo)志排序,而后按一定的間隔抽取樣本單位。設(shè)總體有N個(gè)單位組成,現(xiàn)在抽取一個(gè)容量為n的樣本,現(xiàn)將總體N個(gè)單位按標(biāo)志排隊(duì),然后將N劃分為n個(gè)單位相等部分,每部分包含k個(gè)單位,(Nnk),然后在每部分中抽取一個(gè)單位。 按排隊(duì)標(biāo)志性質(zhì)的不同,可分為有關(guān)標(biāo)志排隊(duì)等距抽樣和無(wú)關(guān)標(biāo)志排隊(duì)等距抽樣。,按有關(guān)標(biāo)志排隊(duì)的抽取方法: ()半距中點(diǎn)取樣 1 2 3 4 n ()對(duì)稱(chēng)等距抽樣 或 1 2 3 4 n 按無(wú)關(guān)標(biāo)志排隊(duì)的抽取方法: ()任意起點(diǎn)抽樣 1 2 3 4 n,1、方法,2、等距抽樣平均誤差的計(jì)算,關(guān)于等距抽樣的平均誤差,它和標(biāo)志排列順序有關(guān), 情況比較復(fù)雜。如果用來(lái)排隊(duì)的標(biāo)志是無(wú)關(guān)標(biāo)志, 而且是隨機(jī)起點(diǎn)抽樣,那么它的抽樣誤差就十分 接近簡(jiǎn)單隨機(jī)抽樣的誤差,為了簡(jiǎn)便起見(jiàn),可以 采用簡(jiǎn)單隨機(jī)抽樣誤差公式來(lái)近似計(jì)算即:,(四)整群抽樣(集團(tuán)抽樣),1、方法: 將總體全部單位分為許多個(gè)“群”,然后隨機(jī)抽取若干“群”,對(duì)被抽中的各“群”內(nèi)的所有單位登記調(diào)查。,總體,群1,群2,群, ,2、整群抽樣的特點(diǎn):,根據(jù)方差定理: 總方差=組內(nèi)方差的平均數(shù)+組間方差 在分群后,整群抽樣實(shí)際是對(duì)中選群進(jìn)行全面調(diào)查,其樣本的代表性取決于抽中的群體對(duì)總體的代表性每組。如果各群體之間沒(méi)有差異(即組間方差=0),群內(nèi)方差就等于總方差(總方差=組內(nèi)方差),則樣本能完全代替總體,也就不存在抽樣誤差。 所以說(shuō),整群抽樣總的抽樣誤差主要取決于各群間的抽樣誤差或群間差異程度。,3、整群抽樣平均抽樣誤差計(jì)算公式: 設(shè)總體全部單位劃分為群每群包含單位則現(xiàn)在從總體群中隨機(jī)抽取群組成樣本,并分別對(duì)中選群的所有單位進(jìn)行調(diào)查,(五)階段抽樣,1、方法:是指在抽樣時(shí)先抽總體中某種更大范圍的單位,再?gòu)闹羞x大單位中較小的單
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 儲(chǔ)備干部面試題及答案
- java面試題及答案項(xiàng)目經(jīng)驗(yàn)
- 消化系統(tǒng)疾病護(hù)理共同要點(diǎn)
- 保育員消毒培訓(xùn)
- 2025年中國(guó)木制小提琴弓行業(yè)市場(chǎng)全景分析及前景機(jī)遇研判報(bào)告
- 腫瘤科急診的護(hù)理
- 中風(fēng)中醫(yī)護(hù)理病例討論
- 中心靜脈壓測(cè)量護(hù)理查房
- 流程講解規(guī)范實(shí)施指南
- 直腸癌術(shù)后引流管的護(hù)理
- 感染性疾病分子診斷試劑行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢(xún)報(bào)告
- GB/T 45355-2025無(wú)壓埋地排污、排水用聚乙烯(PE)管道系統(tǒng)
- 安全生產(chǎn)風(fēng)險(xiǎn)防控課件
- ISO45001 2024職業(yè)健康安全管理體系要求及使用指南
- 2025年湖南株洲南方中學(xué)自主招生英語(yǔ)試卷真題(含答案詳解)
- 勞務(wù)綠化合同范本
- 2025年云南黃金礦業(yè)集團(tuán)股份有限公司招聘筆試參考題庫(kù)含答案解析
- 基于BOPPPS框架與線(xiàn)上線(xiàn)下混合教學(xué)模式的探索
- 中國(guó)瑜伽服市場(chǎng)需求現(xiàn)狀調(diào)研及未來(lái)營(yíng)銷(xiāo)趨勢(shì)研究報(bào)告
- DB32-T 186-2015建筑消防設(shè)施檢測(cè)技術(shù)規(guī)程
- DBJ33T 1271-2022 建筑施工高處作業(yè)吊籃安全技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論