第六章抽樣理論與參數(shù)估計作業(yè)_第1頁
第六章抽樣理論與參數(shù)估計作業(yè)_第2頁
第六章抽樣理論與參數(shù)估計作業(yè)_第3頁
第六章抽樣理論與參數(shù)估計作業(yè)_第4頁
第六章抽樣理論與參數(shù)估計作業(yè)_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第六章第六章 抽樣理論與參數(shù)估計抽樣理論與參數(shù)估計第一節(jié)第一節(jié) 抽樣的基本概念抽樣的基本概念 一、概念回顧一、概念回顧 二、抽樣方法二、抽樣方法 三、抽樣設計的意義及原則三、抽樣設計的意義及原則 四、樣本容量的計算四、樣本容量的計算統(tǒng)計推斷的可靠性與下列因素有關 1樣本對總體的代表性,既涉及到樣本對總體的代表性,既涉及到,又涉及到又涉及到。2運用運用及數(shù)據(jù)處理的準及數(shù)據(jù)處理的準確性確性3樣本對總體樣本對總體的的在收集數(shù)據(jù)的過程中控制選擇恰當?shù)姆椒ㄍㄟ^抽樣設計控制一、概念回顧一、概念回顧 總體、個體、樣本總體、個體、樣本 參數(shù)、統(tǒng)計量參數(shù)、統(tǒng)計量二幾種重要的隨機抽樣方法二幾種重要的隨機抽樣方法

2、1簡單隨機抽樣(simple random sampling)簡單隨機抽樣就是按照隨機原則直接從總體簡單隨機抽樣就是按照隨機原則直接從總體中抽取出若干個單位作為樣本。中抽取出若干個單位作為樣本。簡單隨機抽樣法能保證總體中的每一個對象簡單隨機抽樣法能保證總體中的每一個對象都有同等的被抽取到的可能性,并且個體都有同等的被抽取到的可能性,并且個體之間都相互獨立。這是在總體異質(zhì)性不是之間都相互獨立。這是在總體異質(zhì)性不是很大而且所抽取的樣本較小時經(jīng)常采用的很大而且所抽取的樣本較小時經(jīng)常采用的一種形式。一種形式。 簡單隨機抽樣法的局限是:當樣本簡單隨機抽樣法的局限是:當樣本規(guī)模小時,樣本的代表性較差。規(guī)模

3、小時,樣本的代表性較差。 簡單隨機取樣有兩種基本方式: 抽簽法(drawing lots) 隨機數(shù)字表法(random number table) 2等距抽樣 等距抽樣等距抽樣(interval sampling)也稱為也稱為機械抽樣或系統(tǒng)抽樣。實施時,先把機械抽樣或系統(tǒng)抽樣。實施時,先把總體中的所有個體按一定順序編號,總體中的所有個體按一定順序編號,然后依固定的間隔取樣。然后依固定的間隔取樣。 等距抽樣可以保證樣本的成分與總體等距抽樣可以保證樣本的成分與總體一致,但隨機性不如單純隨機抽樣法。一致,但隨機性不如單純隨機抽樣法。應用中可將兩種方法結(jié)合使用。應用中可將兩種方法結(jié)合使用。 3分層隨機

4、抽樣 分層隨機取樣簡稱分層抽樣分層隨機取樣簡稱分層抽樣(stratified sampling 或或 hierarchical sampling),是進行),是進行大規(guī)模研究時常常使用的抽樣方大規(guī)模研究時常常使用的抽樣方法。法。先將總體按照一定標準先將總體按照一定標準分為若干類型(統(tǒng)計上稱為層),再根據(jù)分為若干類型(統(tǒng)計上稱為層),再根據(jù)各層對象的數(shù)量在總體數(shù)量中所占的比例,各層對象的數(shù)量在總體數(shù)量中所占的比例,確定從每一種類型(層)中抽取樣本的數(shù)確定從每一種類型(層)中抽取樣本的數(shù)量,然后按隨機原則和所確定的各層取樣量,然后按隨機原則和所確定的各層取樣的數(shù)量,從各層中取樣。的數(shù)量,從各層中取

5、樣。分類的標準要分類的標準要科學,要符合實際情況。各層內(nèi)的差別要科學,要符合實際情況。各層內(nèi)的差別要小,而層與層之間的差異則越大越好。小,而層與層之間的差異則越大越好。 :為了調(diào)查某區(qū)重點中學為了調(diào)查某區(qū)重點中學720名名高一學生的視力,首先按視力的情高一學生的視力,首先按視力的情況將他們分成況將他們分成(108人人)、(360人)、人)、(252人)三種水平。若用人)三種水平。若用分層抽樣法抽取分層抽樣法抽取120人進行調(diào)查,問人進行調(diào)查,問各層應抽多少人?各層應抽多少人? 計算Nnn好好60720360120NNnn中中42720252120NNnn差差最佳配置法

6、 最佳配置法不僅考慮各層的人數(shù)比例,而最佳配置法不僅考慮各層的人數(shù)比例,而且考慮到了各層的標準差。當各層內(nèi)的且考慮到了各層的標準差。當各層內(nèi)的標準差已知,應該在標準差大的層內(nèi)多標準差已知,應該在標準差大的層內(nèi)多分配而在標準差小的層內(nèi)少分配抽樣數(shù)分配而在標準差小的層內(nèi)少分配抽樣數(shù)量。量。最佳配置法可以使得到的樣本具有較好的最佳配置法可以使得到的樣本具有較好的。 在各層內(nèi)應抽取個體數(shù)計算 公式中,公式中,ni表示從某一層所抽個體數(shù)表示從某一層所抽個體數(shù) n表示樣本容量表示樣本容量 Ni表示某層個體總數(shù)表示某層個體總數(shù) i表示某層標準差表示某層標準差 iiiiiNNnn(222)當各個當各個沒有現(xiàn)成

7、資料可以應用時,沒有現(xiàn)成資料可以應用時,可以先從該層抽一個小樣本,由這可以先從該層抽一個小樣本,由這一小樣本計算出的樣本標準差一小樣本計算出的樣本標準差S對對進行估計。進行估計。iiiiiSNSNnn(223) 分層隨機取樣法的分層隨機取樣法的是代表性和是代表性和推論的精確性較好。它適用于總體推論的精確性較好。它適用于總體單位數(shù)量較多,并且內(nèi)部差異較大單位數(shù)量較多,并且內(nèi)部差異較大的研究對象。的研究對象。 分層隨機取樣法的分層隨機取樣法的性是要求對性是要求對總體各單位的情況有較多的了解,總體各單位的情況有較多的了解,否則就難以作出科學的分類。否則就難以作出科學的分類。 4兩階段隨機抽樣 當總體

8、容量很大時,直接以總體中當總體容量很大時,直接以總體中的所有個體為對象,從中進行抽樣,的所有個體為對象,從中進行抽樣,在實際調(diào)查或研究中存在很大困難。在實際調(diào)查或研究中存在很大困難。 采用分階段的抽樣方法,可以縮小采用分階段的抽樣方法,可以縮小實際抽樣的范圍,使實際抽樣工作實際抽樣的范圍,使實際抽樣工作能夠按研究設計的要求順利進行。能夠按研究設計的要求順利進行。 兩階段隨機抽樣(兩階段隨機抽樣(two-stages random sampling)的一般過程是:)的一般過程是:先將總體分成先將總體分成個部分;個部分;從這從這個部分中隨機抽取個部分中隨機抽取m個部分作為第一階段樣本個部分作為第一

9、階段樣本;是分別從這是分別從這m個部分中抽取個部分中抽取一定數(shù)量(一定數(shù)量(ni)的個體構成第二階段)的個體構成第二階段樣本。樣本。5整群抽樣 整群隨機抽樣是先將整群隨機抽樣是先將總體各單位按一定的總體各單位按一定的標準分成許多群(小標準分成許多群(小組),然后按隨機原組),然后按隨機原則從這些群中抽取若則從這些群中抽取若干群作為樣本。干群作為樣本。 整群隨機取樣法的整群隨機取樣法的是樣本比較集是樣本比較集中,適宜于某些特定的研究,尤其是中,適宜于某些特定的研究,尤其是在教育實驗中常用此法。此外,在規(guī)在教育實驗中常用此法。此外,在規(guī)模較大的調(diào)查研究中,整群隨機取樣模較大的調(diào)查研究中,整群隨機取

10、樣易于組織,可節(jié)省人力、物力和時間。易于組織,可節(jié)省人力、物力和時間。 整群隨機抽樣法的整群隨機抽樣法的是樣本分布不是樣本分布不均勻,代表性較差。均勻,代表性較差。 三抽樣設計的意義及原則三抽樣設計的意義及原則 1 1抽樣設計的意義抽樣設計的意義 使研究節(jié)省人力及費用;使研究節(jié)省人力及費用; 使研究節(jié)省時間,提高時效性;使研究節(jié)省時間,提高時效性;保證研究結(jié)果的準確性。保證研究結(jié)果的準確性。 2抽樣設計的原則 抽樣設計的要求是樣本對研究總體有良抽樣設計的要求是樣本對研究總體有良好的好的,即樣本的構成與總體保持,即樣本的構成與總體保持一致。為了保證這一點,抽樣時必須遵一致。為了保證這一點,抽樣時

11、必須遵循循(randomization)的基本原)的基本原則。則。 所謂隨機化原則,是指在抽樣時,樣本所謂隨機化原則,是指在抽樣時,樣本中的每一個體都是按照隨機的原理被抽中的每一個體都是按照隨機的原理被抽取的,總體中每一個體被抽到的可能性取的,總體中每一個體被抽到的可能性是相等的。是相等的。 四四 樣本容量的確定樣本容量的確定 在應用中應根據(jù)研究所要求的精確度及在應用中應根據(jù)研究所要求的精確度及經(jīng)費情況確定樣本容量。如果樣本容量經(jīng)費情況確定樣本容量。如果樣本容量過小,會影響樣本對總體的代表性,增過小,會影響樣本對總體的代表性,增大抽樣誤差而降低研究推論的精確性;大抽樣誤差而降低研究推論的精確性

12、;樣本容量過大,雖然減小了抽樣誤差,樣本容量過大,雖然減小了抽樣誤差,但可能增大過失誤差,并且增加不必要但可能增大過失誤差,并且增加不必要的人力物力資源的浪費。的人力物力資源的浪費。 樣本容量與抽樣誤差并不樣本容量與抽樣誤差并不是直線關系。是直線關系。 確定容量的基本原則是:確定容量的基本原則是:在盡量節(jié)省人力、經(jīng)費和在盡量節(jié)省人力、經(jīng)費和時間的條件下,確保用樣時間的條件下,確保用樣本推斷總體達到預定的可本推斷總體達到預定的可行度及準確性。行度及準確性。2總體平均數(shù)估計樣本容量的確定 nXZ222dZn其中,最大允許誤差為其中,最大允許誤差為 ,可信度為,可信度為1。 Xd由由有有(224)可

13、以看到,當可以看到,當確定之后,總體標準差和確定之后,總體標準差和最大允許誤差最大允許誤差d d是決定樣本容量的兩個因素。是決定樣本容量的兩個因素。總體未知 由nSXt222dStn有當樣本容量當樣本容量n n 未確定時,未確定時,t t 值無法確定,值無法確定,因此一般采用嘗試法。因此一般采用嘗試法。 (225)擬估計某市高校四級英語考試擬估計某市高校四級英語考試成績的總體平均分數(shù)。以往考試成成績的總體平均分數(shù)。以往考試成績的標準差為績的標準差為13,這次的估計最大,這次的估計最大允許誤差為允許誤差為2分,可信度為分,可信度為95%,問,問應抽取多大的樣本?應抽取多大的樣本?221396.

14、11633 .16222dZn第二節(jié)第二節(jié) 樣本分布樣本分布 一、什么是樣本分布一、什么是樣本分布 二、正態(tài)分布及漸近正態(tài)分布二、正態(tài)分布及漸近正態(tài)分布 三、三、t分布分布 四、四、 分布分布 五、五、F分布分布2一、樣本分布一、樣本分布/抽樣分布抽樣分布 樣本分布指樣本統(tǒng)計量的分布,它是統(tǒng)計樣本分布指樣本統(tǒng)計量的分布,它是統(tǒng)計推論的重要依據(jù)。推論的重要依據(jù)。 在談及樣本統(tǒng)計量的分布時,首先要保證在談及樣本統(tǒng)計量的分布時,首先要保證各個樣本是獨立的,各個樣本都服從同樣各個樣本是獨立的,各個樣本都服從同樣的分布。要保證這一點,取樣方法應該用的分布。要保證這一點,取樣方法應該用隨機抽樣的方法。隨機

15、抽樣的方法。樣本統(tǒng)計量的概率分布樣本統(tǒng)計量的概率分布是一種理論概率分布是一種理論概率分布隨機變量是隨機變量是 樣本統(tǒng)計量樣本統(tǒng)計量樣本均值樣本均值, 樣本比例,樣本方差等樣本比例,樣本方差等結(jié)果來自結(jié)果來自容量相同容量相同的的所有所有可能樣本可能樣本提供了樣本統(tǒng)計量長遠我們穩(wěn)定的信息,是進提供了樣本統(tǒng)計量長遠我們穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù)要依據(jù) 抽樣分布 (sampling distribution)抽樣分布 (sampling distribution)樣本統(tǒng)計量的抽樣分布樣本統(tǒng)計量的抽樣分布1、樣本平均數(shù)的分布、樣

16、本平均數(shù)的分布 2、樣本方差的抽樣分布、樣本方差的抽樣分布容量相同的所有可能樣本的樣本均值的概容量相同的所有可能樣本的樣本均值的概率分布率分布一種理論概率分布一種理論概率分布進行推斷總體總體均值進行推斷總體總體均值 的理論基礎的理論基礎樣本均值的抽樣分布樣本均值的抽樣分布樣本均值的抽樣分布(例題分析)(重復抽樣)5 .21NxNii25. 1)(122NxNii樣本均值的抽樣分布 (例題分析)(重復抽樣)所有可能的所有可能的n = 2 的樣本(共的樣本(共16個)個)第一個第一個觀察值觀察值第二個觀察值第二個觀察值123411,11,21,31,422,12,22,32,433,13,23,3

17、3,444,14,24,34,4樣本均值的抽樣分布 (例題分析)(重復抽樣)16個樣本的均值(個樣本的均值(x)第一個第一個觀察值觀察值第二個觀察值第二個觀察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0均值均值X的取值的取值1.01.52.02.53.03.54.0均值均值X的個數(shù)的個數(shù)1234321取值的概率取值的概率P(X ) 1/16 2/16 3/16 4/16 3/16 2/16 1/16樣本均值的分布與總體分布的比較 (例題分析)(重復抽樣)5 . 2X21.250.6252X樣本均值的抽樣分布 (例題分析)(不

18、重復抽樣)所有可能的所有可能的n = 2 的樣本(共的樣本(共12個)個)第一個第一個觀察值觀察值第二個觀察值第二個觀察值123411,21,31,422,12,32,433,13,23,444,14,24,3樣本均值的抽樣分布 (例題分析)(不重復抽樣)16個樣本的均值(個樣本的均值(x)第一第一個個觀察觀察值值第二個觀察值第二個觀察值123411.52.02.521.52.53.032.02.53.542.53.03.5均值均值X的取值的取值1.52.02.53.03.5均值均值X的個數(shù)的個數(shù)22422取值的概率取值的概率P(X ) 2/12 2/12 4/12 2/12 2/12樣本均值

19、的抽樣分布 (例題分析)(不重復抽樣)5 . 2X21.2542524 112X樣本均值的抽樣分布與中心極限定理X5x50 x5 . 2x中心極限定理(central limit theorem) xn x 抽樣分布與總體分布的關系正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布問題問題 樣本平均數(shù)的分布是怎么得到的?樣本平均數(shù)的分布是怎么得到的? 樣本平均數(shù)分布的平均數(shù)與方差和母總體的平均數(shù)樣本平均數(shù)分布的平均數(shù)與方差和母總體的平均數(shù)與方差有何關系?在不同情況下一樣嗎?與方差有何關系?在不同情況下一樣嗎? 什么叫自由度?什么叫自由度? 樣本平均數(shù)的分布

20、與樣本平均數(shù)的分布與t分布的關系?分布的關系? 分布是什么分布?特點?應用于?分布是什么分布?特點?應用于? F分布用來分析什么?特點?分布用來分析什么?特點?2二、正態(tài)分布及漸近正態(tài)分布二、正態(tài)分布及漸近正態(tài)分布樣本平均數(shù)的分布樣本平均數(shù)的分布總體方差已知,總體分布為正態(tài),樣本平均數(shù)的分布為正態(tài)分布。總體方差已知,總體分布為正態(tài),樣本平均數(shù)的分布為正態(tài)分布??傮w方差已知,總體分布非正態(tài),當樣本容量足夠大總體方差已知,總體分布非正態(tài),當樣本容量足夠大(n30)時,其樣本平均數(shù)的分布為漸近正態(tài)分布。時,其樣本平均數(shù)的分布為漸近正態(tài)分布。XXXuXZnSEnuuiXX .22XXuXZnuuiX

21、.二、正態(tài)分布及漸近正態(tài)分布二、正態(tài)分布及漸近正態(tài)分布方差及標準差的分布方差及標準差的分布自正態(tài)分布總體中抽取容量為自正態(tài)分布總體中抽取容量為n的樣本,當?shù)臉颖?,當n足夠大(足夠大(n30) ,樣本方差及標準差的分布,漸趨于正態(tài)分布。,樣本方差及標準差的分布,漸趨于正態(tài)分布。因此公式要求樣本容量足夠大,一般難以保證,故標準因此公式要求樣本容量足夠大,一般難以保證,故標準差及方差的統(tǒng)計推論,較少用到漸近分布,而用其精確差及方差的統(tǒng)計推論,較少用到漸近分布,而用其精確分布(分布( 分布)。分布)。此外,還有多種統(tǒng)計量的分布為正態(tài)分布或漸近正態(tài)分此外,還有多種統(tǒng)計量的分布為正態(tài)分布或漸近正態(tài)分布,如

22、兩樣本平均數(shù)之差的分布、相關系數(shù)的分布、比布,如兩樣本平均數(shù)之差的分布、相關系數(shù)的分布、比率的分布等將在以后章節(jié)介紹。率的分布等將在以后章節(jié)介紹。nnXsXsss222222 .2三、三、t分布分布t分布是統(tǒng)計分析中應用較多的一種隨機變量函數(shù)的分布,分布是統(tǒng)計分析中應用較多的一種隨機變量函數(shù)的分布,是統(tǒng)計學者高賽特是統(tǒng)計學者高賽特1908年在以筆名年在以筆名“Student”發(fā)表的一發(fā)表的一篇論文中推導的一種分布。這種分布是一種左右對稱、篇論文中推導的一種分布。這種分布是一種左右對稱、峰態(tài)比較高狹、分布形狀隨樣本容量峰態(tài)比較高狹、分布形狀隨樣本容量n-1的變化而變化的的變化而變化的一族分布。一

23、族分布。t分布與分布與n-1(自由度自由度)有關,有關, t分布的自由度通常用符號分布的自由度通常用符號df表表示。自由度是指任何變量中可以自由變化的數(shù)目,它代示。自由度是指任何變量中可以自由變化的數(shù)目,它代表表t分布中獨立隨機變量的數(shù)目。分布中獨立隨機變量的數(shù)目。NxsnsuXt2.1/三、三、t分布分布 t分布的特點分布的特點平均值為平均值為0以平均值以平均值0左右對稱的分布,左側(cè)左右對稱的分布,左側(cè)t為負值,右側(cè)為負值,右側(cè)t為正值。為正值。變量取值在變量取值在 之間。之間。曲線下總面積為曲線下總面積為1。 t分布曲線隨自由度變化而變化,為一簇分布。樣本容分布曲線隨自由度變化而變化,為一

24、簇分布。樣本容量越小,曲線越低闊,樣本容量大于量越小,曲線越低闊,樣本容量大于30時,時, 曲線接近曲線接近正態(tài)分布,當正態(tài)分布,當 時,時, t分布與標準正態(tài)曲線重分布與標準正態(tài)曲線重合,方差為合,方差為1。t分布表的使用分布表的使用 - n三、三、t分布分布樣本平均數(shù)的分布樣本平均數(shù)的分布總體分布為正態(tài),方差未知時,樣本平均數(shù)的分布為總體分布為正態(tài),方差未知時,樣本平均數(shù)的分布為t分布。分布。當總體分布為非正態(tài)而其方差又未知時,若滿足當總體分布為非正態(tài)而其方差又未知時,若滿足n30這一條件,樣本平均數(shù)的分布近似為這一條件,樣本平均數(shù)的分布近似為t分布。分布。112121 nxsnxsnsn

25、ssnnX.四、四、 分布分布定義定義12222222 ndfnsXXndfZuXi.).)22(2四、四、 分布分布2。差差異是否顯著的檢驗以及樣本方差與總體方于計數(shù)數(shù)據(jù)的假設檢驗分布在統(tǒng)計分析中應用分布表(三)分布。似有些離散型的分布也近分布是連續(xù)型分布,但。,方差分布的平均數(shù):,這時大于如果分布具有可加性。分布,即分布的和也是值都是正值。分布是一個正偏態(tài)分布分布的特點(二)222222222222)475(5.224.3.2.1.22Pdfdfudf五、F分布是是否否取取自自同同一一總總體體??煽煞址治鑫鋈稳我庖鈨蓛蓸訕颖颈痉椒讲畈睿瑒t則,即即從從一一個個總總體體中中抽抽樣樣若若總總體體

26、方方差差的的比比率率。比比率率為為樣樣本本方方差差除除以以其其上上式式可可理理解解,、及及、為為:,其其平平均均數(shù)數(shù)與與方方差差分分別別設設有有兩兩個個正正態(tài)態(tài)分分布布總總體體(一一)定定義義21212221212122221212121122122221121212111111 nnnnnnnissFFssnsnnsnFsnXXdfdfFuu2221222122221/)(/)()(/)()()(/五、五、F分布分布)459455(13.2.1.21PPFtFFdfdfFF,分布表(三)相同。值(雙側(cè)概率)的平方率的值與分母自由度相同概時,值,分母的自由度為任意當分子的自由度為總為正值。漸趨

27、正態(tài)分布。的增加而與同,隨分母的自由度不同而不,分布曲線隨分子、分布是一個正偏態(tài)分布分布的特點(二)樣本方差的分布) 1() 1(222nsn22) 1(sn 卡方(2)分布(2 distribution)2分布分布:設設X1,X2,Xn是來自總體是來自總體N(0,1)的樣本,的樣本,則統(tǒng)計量則統(tǒng)計量 服從自由度為服從自由度為n的的2分布,記為分布,記為2 2(n)。設設 ,則,則令令 ,則,則 Y 服從自由度為服從自由度為1的的 2分布,即分布,即 當總體當總體 ,從中抽取容量為,從中抽取容量為n的樣本,的樣本,則則222212nXXX),(2NX) 1 , 0( NXZ2ZY ) 1 (2

28、Y),(2NX222122()1(1)niiXXnSn分布的變量值始終為正分布的變量值始終為正 分布的形狀取決于其自由度分布的形狀取決于其自由度n的大小,通常為不的大小,通常為不對稱的右偏分布,但隨著自由度的增大逐漸趨對稱的右偏分布,但隨著自由度的增大逐漸趨于對稱于對稱 期望為:期望為:E( 2)=n,方差為:,方差為:D( 2)=2n ( (n為自由度為自由度) ) 可加性:若可加性:若U和和V為兩個獨立的為兩個獨立的 2分布隨機變量,分布隨機變量,U 2(n1), V 2(n2),則則U+V 這一隨機變量服從這一隨機變量服從自由度為自由度為n1+n2的的 2分布分布 2分布(性質(zhì)和特點)2

29、分布(圖示)選擇容量為選擇容量為n 的的簡單隨機樣本簡單隨機樣本計算樣本方差計算樣本方差S2計算卡方值計算卡方值 2 = (n-1)S2/2計算出所有的計算出所有的 2值值總體總體第三節(jié)第三節(jié) 參數(shù)估計參數(shù)估計 當在研究中從樣本獲得一組數(shù)據(jù)后,如何當在研究中從樣本獲得一組數(shù)據(jù)后,如何通過這組數(shù)據(jù)信息,對總體特征進行估計,通過這組數(shù)據(jù)信息,對總體特征進行估計,也就是如何從局部結(jié)果推論總體的情況,也就是如何從局部結(jié)果推論總體的情況,稱為總體參數(shù)估計。稱為總體參數(shù)估計。 參數(shù)估計可分為點估計和區(qū)間估計兩種。參數(shù)估計可分為點估計和區(qū)間估計兩種。第一節(jié)第一節(jié) 點估計、區(qū)間估計與標準誤點估計、區(qū)間估計與標

30、準誤一、點估計的定義一、點估計的定義點估計是指在進行參數(shù)估計時,直接用一個特定點值作為總體參數(shù)的估計值。二、良好估計量的標準二、良好估計量的標準無偏性:無偏性:即用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值,其偏差的平均數(shù)為0。有效性:有效性:當總體參數(shù)的無偏估計不止一個統(tǒng)計量時,無偏估計變異小者有效性高,變異大者有效性低,即方差越小越好。一致性一致性:當樣本容量無限增大時,估計值應能夠越來越接近它所估計的總體參數(shù),估計值越來越精確,逐漸趨近于真值。充分性:充分性:指一個容量為n的樣本統(tǒng)計量,是否充分地反映了全部n個數(shù)據(jù)所反映總體的信息。三、區(qū)間估計與標準誤三、區(qū)間估計與標準誤區(qū)間估計的定義區(qū)間估計

31、的定義是根據(jù)樣本統(tǒng)計量,利用抽樣分布的原理,在一定的可靠程度上,估計出總體參數(shù)所在的范圍,即以數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍。置信區(qū)間與顯著性水平置信區(qū)間與顯著性水平置信區(qū)間:置信區(qū)間:也稱置信間距,指在一定可靠程度上,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信界限(臨界值):置信界限(臨界值):置信區(qū)間的上下兩端點值。顯著性水平顯著性水平:指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用符號 表示。有時也稱為意義階段、信任系數(shù)等。置信度(置信水平):置信度(置信水平): 。-1三、區(qū)間估計與標準誤三、區(qū)間估計與標準誤區(qū)間估計的原理與標準誤區(qū)間估計的原理與標準誤區(qū)間估計是根據(jù)樣本分布

32、理論,用樣本分布的標準誤計算區(qū)間長度,解釋總體參數(shù)落入某置信區(qū)間可能的概率。區(qū)間估計存在成功估計的概率大小成功估計的概率大小及估計范圍大小估計范圍大小兩個問題。妥協(xié)辦法:在保證置信度的前提下,盡可能提高精確度。規(guī)定正確估計的概率即置信度為0.95和0.99,則顯著性水平為0.05和0.01。小概率事件在一次抽樣中不可能出現(xiàn)。區(qū)間估計的原理是樣本分布理論。區(qū)間估計的原理是樣本分布理論。在計算區(qū)間估計值解釋估計的正確概率時,依據(jù)的是該樣本統(tǒng)計量的分布規(guī)律及樣本分布的標準誤。樣本分布可提供概率解釋,而標準誤的大小決定區(qū)間估計的長度。一般情況下,加大樣本容量可使標準誤變小。一、參數(shù)估計的原理區(qū)間估計的

33、原理和方法置信區(qū)間和顯著性水平 區(qū)間估計時, 某一概率下,總體參數(shù)所在的區(qū)間稱為置信區(qū)間,區(qū)間的端點值稱為臨界值,這個概率稱為置信度,以概率 表示, 又稱顯著性水平,表示該區(qū)間估計的不可靠程度。區(qū)間估計的原理和方法 1。之間正確的概率為在或者說之間,數(shù)被包含在任何一個平均的機會有,也就是說體參數(shù)這一間距之內(nèi)將包含總的平均數(shù)那么所有平均數(shù)中有之間,落在的推理:所有平均數(shù)中有。的之間包含所有或者說之間,落在的有根據(jù)正態(tài)分布:?;驑藴收`,寫作稱均數(shù)分布的標準差(簡平均數(shù)的離散程度即平,樣本平均數(shù)的平均數(shù)漸近正態(tài)分布,此時,分布或本平均數(shù)的分布為正態(tài)當總體方差已知時,樣95%96. 196. 195%

34、96. 195%96. 195%95%96. 196. 195%)XXXXXXXXXXSEXuSEXuuSEXSEuXXSEuSEuXnSESEuu第二節(jié) 總體平均數(shù)的估計一、總體平均數(shù)估計的計算步驟:利用抽樣的方法抽取樣本,計算出樣本的平均值 和標準差S。計算樣本平均數(shù)的標準誤 :當總體方差已知時,樣本平均數(shù)的標準誤的計算為:當總體方差未知時,樣本平均數(shù)的標準誤的計算為:XXSEnSEX1nSSEnX一、總體平均數(shù)估計的計算步驟:確定顯著性水平和置信水平根據(jù)樣本平均數(shù)的抽樣分布確定查何種分布表,確定理論值。確定置信區(qū)間:解釋總體平均數(shù)的置信區(qū)間。XXXXXXXXSEtXSEtXSEtXSEt

35、XtSEZXSEZXSEZXSEZXZ2222222222,:,:,記為置信區(qū)間為時當理論值為記為置信區(qū)間為時當理論值為二、總體方差已知時,對總體平均數(shù)的估計二、總體方差已知時,對總體平均數(shù)的估計當總體分布為正態(tài)分布時,(無論樣當總體分布為正態(tài)分布時,(無論樣本容量本容量n的大小,從該總體抽取的樣本的大小,從該總體抽取的樣本分布均成正態(tài)分布。)對總體平均數(shù)的分布均成正態(tài)分布。)對總體平均數(shù)的估計可以依正態(tài)分布進行估計。估計可以依正態(tài)分布進行估計。例1 已知某市6歲正常男童體重的總體方差為6.55公斤,從該市隨機抽取15 名6歲男童,其平均體重為20.4公斤,試求該市6 歲男童平均體重的95%和

36、99%的置信區(qū)間。例1的計算 解:95%的置信區(qū)間的顯著性水平=0.05,因此,的95%的置信區(qū)間為:即:的99%的置信區(qū)間為:即:故該市6歲男童平均體重的95%的置信區(qū)間為19.11,21.69;99%的置信區(qū)間為18.7,22.1。66. 087. 356. 21555. 6nSEX96. 12Z66. 096. 14 .2066. 096. 14 .2069.2111.1966. 058. 24 .2066. 058. 24 .201 .227 .18二、總體方差已知時,對總體平均數(shù)的估計二、總體方差已知時,對總體平均數(shù)的估計當總體為非正態(tài)分布時(只有當樣本容量當總體為非正態(tài)分布時(只有

37、當樣本容量n30時時,此時樣本抽樣分布漸近正態(tài)分布。這此時樣本抽樣分布漸近正態(tài)分布。這時可依正態(tài)分布進行估計,否則不能對總體平時可依正態(tài)分布進行估計,否則不能對總體平均數(shù)進行估計。)均數(shù)進行估計。)例3 已知某區(qū)15 歲男生立定跳遠的方差為 ,現(xiàn)從該區(qū)抽取58名15歲男生,測得該組男生立定跳遠的平均數(shù)為198.4cm,試求該區(qū)15歲男生立定跳遠平均成績的95%和99%的置信區(qū)間。cm8 .436例3解:由題意知:由于樣本容量(n=58)大于30 ,該樣本的抽樣分布為漸進正態(tài)分布。因此,的95%的置信區(qū)間為: 198.41.962.75198.41.962.75即 193.01203.79的99

38、%的置信區(qū)間為: 198.42.582.75198.42.582.75即 191.3205.5故該區(qū)15歲男生立定跳遠的平均成績有95%的可能落入193.01,203.79內(nèi),有99%的可能落入191.3,205.5內(nèi)。75. 26 . 79 .20588 .436nSEX三、總體方差未知,對總體平均數(shù)的估計三、總體方差未知,對總體平均數(shù)的估計當總體分布為正態(tài)分布時(無論樣本容量當總體分布為正態(tài)分布時(無論樣本容量n的的大小,從該總體抽取的樣本所形成的分布均服大小,從該總體抽取的樣本所形成的分布均服從自由度為從自由度為n-1的的t分布,對總體平均數(shù)的估計分布,對總體平均數(shù)的估計可依可依t分布進行估計)分布進行估計)例4 從某市抽取20 名7 歲女童,經(jīng)測量,這20 名女童的平均身高為116cm,標準差為5cm,試求該市7歲女童總平均身高的95%和99%的置信區(qū)間。例4解:由題意知,其總體方差未知,但其總體分布為正態(tài)分布,則此樣本均數(shù)的分布服從t分布,可以依t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論