版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)
PowerPoint統(tǒng)計(jì)學(xué)南昌大學(xué)教育學(xué)院心理李力現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)PowerPoint統(tǒng)計(jì)學(xué)南昌大學(xué)教育1抽樣與抽樣分布1、抽樣及抽樣方法2、三種不同性質(zhì)的分布抽樣與抽樣分布1、抽樣及抽樣方法2一、抽樣及抽樣方法(一)抽樣的意義和原則1、抽樣調(diào)查研究的特點(diǎn)和作用(1)節(jié)省人力及費(fèi)用(2)節(jié)省時(shí)間,提高調(diào)查研究的時(shí)效性(3)保證研究結(jié)果的準(zhǔn)確性2、抽樣的原則——隨機(jī)化原則(保證總體中的個(gè)體被抽取的可能性相等)**被抽取的樣本應(yīng)具有代表性和可靠性一、抽樣及抽樣方法3(二)抽樣方法(二)抽樣方法4概率抽樣
(probabilitysampling)根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位,也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率概率抽樣
(probabilitysampling)根據(jù)一5簡(jiǎn)單隨機(jī)抽樣
(simplerandomsampling)概念:從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為樣本都有相同的機(jī)會(huì)(概率)被抽中。
抽取元素的具體方法
a、抽簽法b、隨機(jī)數(shù)字法步驟:給總體元素編號(hào)
確定使用起始號(hào)碼登錄入樣號(hào)碼特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本;機(jī)會(huì)均等、相互獨(dú)立局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其他輔助信息以提高估計(jì)的效率簡(jiǎn)單隨機(jī)抽樣
(simplerandomsampling6等距抽樣——將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位。方法:——將總體元素連續(xù)編號(hào)——確定樣本間的間距(N/n=K)——隨機(jī)確定一個(gè)起點(diǎn)A(1<A<K)后,每隔K個(gè)單位抽取一個(gè)。等距抽樣——將總體中的所有單位(抽樣單位)按一定順序排列,在7分層抽樣
(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本
原則:層間差異大于層內(nèi)差異(層內(nèi)樣本差異要??;層與曾間的差異盡可能大)方法:——按各層比例分配樣本元素個(gè)數(shù)——各個(gè)層次按簡(jiǎn)單隨機(jī)抽樣的方法抽樣,產(chǎn)生自己的樣本,最后合成整個(gè)整體
例:抽樣了解某年參加高考考生的語(yǔ)文考試成績(jī)(科目、地區(qū)、學(xué)校類型、學(xué)校規(guī)模等要求)優(yōu)點(diǎn):保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)分層抽樣
(stratifiedsampling)8整群抽樣
(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差整群抽樣
(clustersampling)將總體中若干個(gè)9多階段抽樣
(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法
例:從500所小學(xué)抽100名學(xué)生。先抽取50所小學(xué),然后從每所小學(xué)抽2名學(xué)生。多階段抽樣
(multi-stagesampling)先抽10非概率抽樣
(non-probabilitysampling)相對(duì)于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式非概率抽樣
(non-probabilitysamplin11方便抽樣調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場(chǎng)所進(jìn)行攔截調(diào)查廠家在出售產(chǎn)品柜臺(tái)前對(duì)路過(guò)顧客進(jìn)行的調(diào)查優(yōu)點(diǎn):容易實(shí)施,調(diào)查的成本低缺點(diǎn):樣本單位的確定帶有隨意性,樣本無(wú)法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體方便抽樣調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的12判斷抽樣研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的選擇一些單位作為樣本有重點(diǎn)抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒(méi)有依據(jù)隨機(jī)的原則,調(diào)查結(jié)果不能用于對(duì)推斷總體判斷抽樣研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的選擇13自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如:參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問(wèn)卷活動(dòng),向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機(jī)性無(wú)關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供14滾雪球抽樣先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)適合于對(duì)稀少群體和特定群體研究?jī)?yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低滾雪球抽樣先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供15配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡(jiǎn)單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時(shí),不是依據(jù)隨機(jī)原則,屬于非概率抽樣配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,16概率抽樣與非概率抽樣的比較概率抽樣依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的分布是不確定的無(wú)法使用樣本的結(jié)果推斷總體概率抽樣與非概率抽樣的比較概率抽樣17二、三種不同性質(zhì)的分布1、總體分布2、樣本分布3、抽樣分布二、三種不同性質(zhì)的分布1、總體分布18總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布
(populationdistribution)總體總體中各元素的觀察值所形成的分布總體分布
(populat19一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布
(sampledistribution)樣本一個(gè)樣本中各觀察值的分布樣本分布
(sampledist20從隨機(jī)變量X中,隨機(jī)抽取n個(gè)樣本元素:x1、x2……xn
則f(x1、x2……xn)的統(tǒng)計(jì)量分布例:平均數(shù)的抽樣分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布
(samplingdistribution)從隨機(jī)變量X中,隨機(jī)抽取n個(gè)樣本元素:x1、x2……xn21抽樣分布的形成過(guò)程
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本抽樣分布的形成過(guò)程
(samplingdistribut22在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相23樣本均值的抽樣分布【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),24樣本均值的抽樣分布
現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,采用重復(fù)抽樣條件(C41*C41),共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,采25樣本均值的抽樣分布計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P
(x)1.53.04.03.52.02.5樣本均值的抽樣分布計(jì)算出各樣本的均值,如下表。并給出樣本26樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較=2.5總體分布127樣本均值的抽樣分布
與中心極限定理=50
=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x
的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)樣本均值的抽樣分布
與中心極限定理=50=10X總28中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x中心極限定理
(centrallimittheorem)29中心極限定理x的分布趨于正態(tài)分布的過(guò)程中心極限定理x的分布趨于正態(tài)分布的過(guò)程30抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣31樣本均值的數(shù)學(xué)期望樣本均值的方差樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n樣本均值的數(shù)學(xué)期望樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)比較32若總體服從正態(tài)分布,μ已知,方差σ2未知。則樣本平均數(shù)的抽樣分布服從一個(gè)自由度df=n-1的t分布,其平均數(shù)、方差分布為:若總體服從正態(tài)分布,μ已知,方差σ2未知。則樣本平均數(shù)的抽33
例已知某單位職工的月獎(jiǎng)金服從正態(tài)分布,總體均值為200,總體標(biāo)準(zhǔn)差為40,從該總體抽取一個(gè)容量為20的樣本,求樣本均值介于190~210的概率.解
例已知某單位職工的月獎(jiǎng)金服從正態(tài)分解34t
分布的定義t分布的定義35t分布
t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大(N>45),分布也逐漸趨于正態(tài)分布xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z**標(biāo)準(zhǔn)正態(tài)分布不管n的大小,曲線只有一條,而t分布是一蔟曲線。t分布t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要36T分布的密度函數(shù)比較復(fù)雜,因而編制了t分布表,表中列出了t變量不同自由度下的臨界值雙側(cè)臨界值表單側(cè)臨界值表T分布的密度函數(shù)比較復(fù)雜,因而編制了t分布表,表中列出了t變371、t分布的特點(diǎn)2、t分布表的使用1、t分布的特點(diǎn)38樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可39
分布定義分布定義40分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為:E(2)=df,方差為:D(2)=2df可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布2分布(P189)(性質(zhì)和特點(diǎn))不同容量樣本的抽樣分布c2n=1n=4n=10n=20分布的變量值始終為正2分布(P189)(性質(zhì)和特點(diǎn))不同41例已知容量為11的樣本來(lái)自正態(tài)總體解
例已知容量為11的樣本來(lái)自正態(tài)總體解42兩個(gè)總體都為正態(tài)分布,即,兩個(gè)樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差方差為各自的方差之和 兩個(gè)樣本均值之差的抽樣分布兩個(gè)總體都為正態(tài)分布,即43兩個(gè)樣本均值之差的抽樣分布
m1s1總體1s2
m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算x1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算x2計(jì)算每一對(duì)樣本的x1-x2所有可能樣本的x1-x2m1-m2抽樣分布兩個(gè)樣本均值之差的抽樣分布m1s1總體1s244兩個(gè)樣本方差比的抽樣分布
兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即兩個(gè)樣本方差比的抽樣分布兩個(gè)總體都為正態(tài)分布,即X1~N(45F分布
(圖示)
不同自由度的F分布F(1,10)(5,10)(10,10)F分布
(圖示)不同自由度的F分布F(1,10)(5,46或
F分布的臨界值可以通過(guò)查
F分布的臨界值表(見附表
IV)求得.
F分布的性質(zhì)
或47例解
例解48現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)
PowerPoint統(tǒng)計(jì)學(xué)南昌大學(xué)教育學(xué)院心理李力現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)PowerPoint統(tǒng)計(jì)學(xué)南昌大學(xué)教育49抽樣與抽樣分布1、抽樣及抽樣方法2、三種不同性質(zhì)的分布抽樣與抽樣分布1、抽樣及抽樣方法50一、抽樣及抽樣方法(一)抽樣的意義和原則1、抽樣調(diào)查研究的特點(diǎn)和作用(1)節(jié)省人力及費(fèi)用(2)節(jié)省時(shí)間,提高調(diào)查研究的時(shí)效性(3)保證研究結(jié)果的準(zhǔn)確性2、抽樣的原則——隨機(jī)化原則(保證總體中的個(gè)體被抽取的可能性相等)**被抽取的樣本應(yīng)具有代表性和可靠性一、抽樣及抽樣方法51(二)抽樣方法(二)抽樣方法52概率抽樣
(probabilitysampling)根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位,也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率概率抽樣
(probabilitysampling)根據(jù)一53簡(jiǎn)單隨機(jī)抽樣
(simplerandomsampling)概念:從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為樣本都有相同的機(jī)會(huì)(概率)被抽中。
抽取元素的具體方法
a、抽簽法b、隨機(jī)數(shù)字法步驟:給總體元素編號(hào)
確定使用起始號(hào)碼登錄入樣號(hào)碼特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本;機(jī)會(huì)均等、相互獨(dú)立局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其他輔助信息以提高估計(jì)的效率簡(jiǎn)單隨機(jī)抽樣
(simplerandomsampling54等距抽樣——將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位。方法:——將總體元素連續(xù)編號(hào)——確定樣本間的間距(N/n=K)——隨機(jī)確定一個(gè)起點(diǎn)A(1<A<K)后,每隔K個(gè)單位抽取一個(gè)。等距抽樣——將總體中的所有單位(抽樣單位)按一定順序排列,在55分層抽樣
(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本
原則:層間差異大于層內(nèi)差異(層內(nèi)樣本差異要?。粚优c曾間的差異盡可能大)方法:——按各層比例分配樣本元素個(gè)數(shù)——各個(gè)層次按簡(jiǎn)單隨機(jī)抽樣的方法抽樣,產(chǎn)生自己的樣本,最后合成整個(gè)整體
例:抽樣了解某年參加高考考生的語(yǔ)文考試成績(jī)(科目、地區(qū)、學(xué)校類型、學(xué)校規(guī)模等要求)優(yōu)點(diǎn):保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)分層抽樣
(stratifiedsampling)56整群抽樣
(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差整群抽樣
(clustersampling)將總體中若干個(gè)57多階段抽樣
(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法
例:從500所小學(xué)抽100名學(xué)生。先抽取50所小學(xué),然后從每所小學(xué)抽2名學(xué)生。多階段抽樣
(multi-stagesampling)先抽58非概率抽樣
(non-probabilitysampling)相對(duì)于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式非概率抽樣
(non-probabilitysamplin59方便抽樣調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場(chǎng)所進(jìn)行攔截調(diào)查廠家在出售產(chǎn)品柜臺(tái)前對(duì)路過(guò)顧客進(jìn)行的調(diào)查優(yōu)點(diǎn):容易實(shí)施,調(diào)查的成本低缺點(diǎn):樣本單位的確定帶有隨意性,樣本無(wú)法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體方便抽樣調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的60判斷抽樣研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的選擇一些單位作為樣本有重點(diǎn)抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒(méi)有依據(jù)隨機(jī)的原則,調(diào)查結(jié)果不能用于對(duì)推斷總體判斷抽樣研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的選擇61自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如:參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問(wèn)卷活動(dòng),向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機(jī)性無(wú)關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供62滾雪球抽樣先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)適合于對(duì)稀少群體和特定群體研究?jī)?yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低滾雪球抽樣先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供63配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡(jiǎn)單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時(shí),不是依據(jù)隨機(jī)原則,屬于非概率抽樣配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,64概率抽樣與非概率抽樣的比較概率抽樣依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的分布是不確定的無(wú)法使用樣本的結(jié)果推斷總體概率抽樣與非概率抽樣的比較概率抽樣65二、三種不同性質(zhì)的分布1、總體分布2、樣本分布3、抽樣分布二、三種不同性質(zhì)的分布1、總體分布66總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布
(populationdistribution)總體總體中各元素的觀察值所形成的分布總體分布
(populat67一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布
(sampledistribution)樣本一個(gè)樣本中各觀察值的分布樣本分布
(sampledist68從隨機(jī)變量X中,隨機(jī)抽取n個(gè)樣本元素:x1、x2……xn
則f(x1、x2……xn)的統(tǒng)計(jì)量分布例:平均數(shù)的抽樣分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布
(samplingdistribution)從隨機(jī)變量X中,隨機(jī)抽取n個(gè)樣本元素:x1、x2……xn69抽樣分布的形成過(guò)程
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本抽樣分布的形成過(guò)程
(samplingdistribut70在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相71樣本均值的抽樣分布【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),72樣本均值的抽樣分布
現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,采用重復(fù)抽樣條件(C41*C41),共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,采73樣本均值的抽樣分布計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P
(x)1.53.04.03.52.02.5樣本均值的抽樣分布計(jì)算出各樣本的均值,如下表。并給出樣本74樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較=2.5總體分布175樣本均值的抽樣分布
與中心極限定理=50
=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x
的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)樣本均值的抽樣分布
與中心極限定理=50=10X總76中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x中心極限定理
(centrallimittheorem)77中心極限定理x的分布趨于正態(tài)分布的過(guò)程中心極限定理x的分布趨于正態(tài)分布的過(guò)程78抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣79樣本均值的數(shù)學(xué)期望樣本均值的方差樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n樣本均值的數(shù)學(xué)期望樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)比較80若總體服從正態(tài)分布,μ已知,方差σ2未知。則樣本平均數(shù)的抽樣分布服從一個(gè)自由度df=n-1的t分布,其平均數(shù)、方差分布為:若總體服從正態(tài)分布,μ已知,方差σ2未知。則樣本平均數(shù)的抽81
例已知某單位職工的月獎(jiǎng)金服從正態(tài)分布,總體均值為200,總體標(biāo)準(zhǔn)差為40,從該總體抽取一個(gè)容量為20的樣本,求樣本均值介于190~210的概率.解
例已知某單位職工的月獎(jiǎng)金服從正態(tài)分解82t
分布的定義t分布的定義83t分布
t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大(N>45),分布也逐漸趨于正態(tài)分布xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z**標(biāo)準(zhǔn)正態(tài)分布不管n的大小,曲線只有一條,而t分布是一蔟曲線。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人貸款合同電子合同續(xù)簽服務(wù)3篇
- 2025年度個(gè)人貨車租賃合同綠色物流服務(wù)標(biāo)準(zhǔn)3篇
- 2025年度個(gè)人房屋室內(nèi)裝修設(shè)計(jì)與施工環(huán)保評(píng)估合同4篇
- 2025年度個(gè)人房產(chǎn)投資合作合同范本2篇
- 二零二五年度新型面包磚研發(fā)與應(yīng)用合作協(xié)議4篇
- 征收補(bǔ)償協(xié)議書(2篇)
- 2025年度個(gè)人旅游住宿無(wú)息分期支付合同2篇
- 鐵礦粉供應(yīng)與采購(gòu)合同2025版5篇
- 財(cái)務(wù)季度報(bào)告模板
- 2024年注冊(cè)城鄉(xiāng)規(guī)劃師考試題庫(kù)附參考答案(滿分必刷)
- 中央2025年國(guó)務(wù)院發(fā)展研究中心有關(guān)直屬事業(yè)單位招聘19人筆試歷年參考題庫(kù)附帶答案詳解
- 外呼合作協(xié)議
- 小學(xué)二年級(jí)100以內(nèi)進(jìn)退位加減法800道題
- 保險(xiǎn)公司2025年工作總結(jié)與2025年工作計(jì)劃
- GB/T 33629-2024風(fēng)能發(fā)電系統(tǒng)雷電防護(hù)
- 2024淘寶天貓運(yùn)動(dòng)戶外羽絨服白皮書-WN8正式版
- 記賬實(shí)操-砂石企業(yè)賬務(wù)處理分錄
- 2024屆四川省瀘州市江陽(yáng)區(qū)八年級(jí)下冊(cè)數(shù)學(xué)期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 全球250個(gè)國(guó)家中英文名稱及縮寫
- 深靜脈血栓(DVT)課件
- 2023年四川省廣元市中考數(shù)學(xué)試卷
評(píng)論
0/150
提交評(píng)論