第7章 統(tǒng)計(jì)學(xué)抽樣推斷_第1頁
第7章 統(tǒng)計(jì)學(xué)抽樣推斷_第2頁
第7章 統(tǒng)計(jì)學(xué)抽樣推斷_第3頁
第7章 統(tǒng)計(jì)學(xué)抽樣推斷_第4頁
第7章 統(tǒng)計(jì)學(xué)抽樣推斷_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第7章抽樣推斷統(tǒng)計(jì)學(xué)——原理與SPSS應(yīng)用PowerPoint統(tǒng)計(jì)學(xué)第7章抽樣推斷§7.1

抽樣調(diào)查的意義§7.2抽樣調(diào)查的組織設(shè)計(jì)§7.3抽樣調(diào)查的梳理基礎(chǔ)§7.4抽樣誤差的計(jì)算§7.5參數(shù)估計(jì)§7.6抽樣數(shù)目的確定抽樣調(diào)查的含義和特點(diǎn)抽樣調(diào)查是一種科學(xué)的非全面調(diào)查。它是按照隨機(jī)原則從調(diào)查對象的總體中抽取部分單位進(jìn)行調(diào)查,并根據(jù)這部分單位的調(diào)查結(jié)果推斷總體的數(shù)量特征。節(jié)省人力、費(fèi)用和時(shí)間調(diào)查結(jié)果比全面調(diào)查準(zhǔn)確隨機(jī)原則最主要抽樣誤差可以計(jì)算,也可以加以控制抽樣調(diào)查的應(yīng)用范圍用于不可能進(jìn)行全面調(diào)查的對象用于進(jìn)行全面調(diào)查就會失去現(xiàn)實(shí)意義的對象用于經(jīng)濟(jì)上不允許或精度上不必要進(jìn)行全面調(diào)查的現(xiàn)象用于時(shí)效性要求較強(qiáng)的調(diào)查抽樣調(diào)查的作用有些現(xiàn)象是無法進(jìn)行全面調(diào)查的有些現(xiàn)象是實(shí)際上沒有必要或者很難進(jìn)行全面調(diào)查的抽樣調(diào)查的結(jié)果可以驗(yàn)證全面調(diào)查的結(jié)果用于工業(yè)生產(chǎn)過程的質(zhì)量控制進(jìn)行假設(shè)檢驗(yàn)抽樣的基本概念總體和樣本參數(shù)和統(tǒng)計(jì)量樣本容量和樣本個(gè)數(shù)抽樣調(diào)查的組織設(shè)計(jì)簡單隨機(jī)抽樣

等距抽樣分層抽樣整群抽樣簡單隨機(jī)抽樣簡單隨機(jī)抽樣是指從總體的全部單位中按隨機(jī)原則直接抽取n個(gè)單位組成樣本進(jìn)行調(diào)查。通常采用信手抽取法、抽簽法、隨機(jī)數(shù)表法、計(jì)算機(jī)隨機(jī)函數(shù)法抽取樣本。簡單隨機(jī)抽樣只適用于總體單位數(shù)不多,總體單位標(biāo)志變異度較小的情形。隨機(jī)數(shù)表法現(xiàn)在要從80戶居民中抽取10戶進(jìn)行收入調(diào)查,現(xiàn)將80戶居民從1到80進(jìn)行編號,然后假設(shè)從隨機(jī)數(shù)表中第一行的第六列開始自左向右、自上而下取樣,則順序取得的樣本號是?隨機(jī)數(shù)表法28465335747213452067421520578090043628192664371555012664985671497258435789642754分層抽樣

分層抽樣是先將總體按有關(guān)的研究標(biāo)志分組,然后在從每組中按隨機(jī)原則抽取樣本。在每個(gè)組中抽取的調(diào)查單位的數(shù)目,可按相同的比例(n/N)抽取,也可按不同的比例抽取。為了簡便起見,通常都是按相同比例抽取,稱做等比例分層抽樣。等距抽樣等距抽樣是將總體各單位按一定順序排列,然后每隔N/n個(gè)總體單位抽取一個(gè)樣本單位組成樣本進(jìn)行調(diào)查。等距抽樣能使樣本十分均勻地分布在總體中,從而能增加樣本的代表性,減少抽樣誤差,提高抽樣效率。整群抽樣整群抽樣是將總體按某一標(biāo)志分組后形成的每個(gè)群視為單位進(jìn)行隨機(jī)抽樣,然后對抽中的每個(gè)群體進(jìn)行全面調(diào)查。整群抽樣的特點(diǎn)是先分群,后抽群作為樣本單位,在抽中的群內(nèi)實(shí)行全面調(diào)查,不再從中抽樣。多階段抽樣

在抽取樣本時(shí)分多個(gè)階段來進(jìn)行,第一階段是從總體中用隨機(jī)抽樣的方法抽取若干個(gè)群體,稱為初級單位。然后在第二階段從這些初級單位中又隨機(jī)抽取若干個(gè)樣本單位,稱為基本單位或最終單位,依此類推。最后根據(jù)所抽的基本單位組成的樣本進(jìn)行調(diào)查,用取得的樣本資料來推斷總體。例如,農(nóng)產(chǎn)品產(chǎn)量調(diào)查中,由省抽縣,由中選的縣抽鄉(xiāng),由中選的鄉(xiāng)抽村,由中選的村抽地塊,就是采用多階段抽樣。三種不同性質(zhì)的分布總體分布樣本分布抽樣分布總體分布

(populationdistribution)總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體樣本分布

(sampledistribution)一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本抽樣分布

(samplingdistribution)樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本樣本統(tǒng)計(jì)量的抽樣分布(一個(gè)總體參數(shù)推斷時(shí))樣本均值的抽樣分布樣本比例的抽樣分布抽樣方差的抽樣分布樣本均值的抽樣分布樣本均值的抽樣分布容量相同的所有可能樣本的樣本均值的概率分布一種理論概率分布進(jìn)行推斷總體總體均值

的理論基礎(chǔ) 樣本均值的抽樣分布

(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1、x2=2、x3=3

、x4=4

。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(例題分析)

計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X樣本均值的抽樣分布

與中心極限定理

=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值

X也服從正態(tài)分布,

X

的數(shù)學(xué)期望為μ,方差為σ2/n。即

X~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為

,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X中心極限定理

(centrallimittheorem)的分布趨于正態(tài)分布的過程樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布比例

(proportion)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似一種理論概率分布推斷總體比例P的理論基礎(chǔ) 樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本方差的抽樣分布樣本方差的分布

對于來自正態(tài)總體的簡單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)

2分布,即

2分布

(

2

distribution)由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則Y服從自由度為1的

2分布,即

當(dāng)總體,從中抽取容量為n的樣本,則

2分布

(性質(zhì)和特點(diǎn))分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(

2)=n,方差為:D(

2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的

2分布隨機(jī)變量,U~

2(n1),V~

2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的

2分布c2分布

(圖示)

選擇容量為n的簡單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算卡方值

2=(n-1)S2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體評價(jià)估計(jì)量的標(biāo)準(zhǔn)無偏性

(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)P(

)BA無偏有偏有效性

(efficiency)有效性:對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量更小標(biāo)準(zhǔn)差的估計(jì)量更有效

AB

的抽樣分布

的抽樣分布P(

)一致性

(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn)估計(jì)

(pointestimate)1.用樣本的估計(jì)量直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)2.沒有給出估計(jì)值接近總體參數(shù)程度的信息3.點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)的圖示

X95%

-1.96

x

+1.96

x99%

-2.58

x

+2.58x90%

-1.65

x

+1.65

x置信水平將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-

為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的

為0.01,0.05,0.10置信區(qū)間

(confidenceinterval)由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值置信區(qū)間與置信水平均值的抽樣分布(1-

)%區(qū)間包含了

%的區(qū)間未包含

1-aa/2a/2一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號表示樣本統(tǒng)計(jì)量均值比例方差總體均值的區(qū)間估計(jì)

(正態(tài)總體、

2已知,或非正態(tài)總體、大樣本)總體均值的區(qū)間估計(jì)

(大樣本)假定條件總體服從正態(tài)分布,且方差(

2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計(jì)量Z總體均值

在1-

置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計(jì)

(例題分析)解:已知X~N(

,102),n=25,1-=95%,z

/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:

總體均值

在1-

置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44克~109.28克之間總體均值的區(qū)間估計(jì)

(例題分析)【例】一家保險(xiǎn)公司收集到由36投保個(gè)人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個(gè)投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(jì)

(例題分析)解:已知n=36,1-=90%,z

/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值

在1-

置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲總體均值的區(qū)間估計(jì)

(正態(tài)總體、

2未知、小樣本)總體均值的區(qū)間估計(jì)

(小樣本)假定條件總體服從正態(tài)分布,且方差(

2)

未知小樣本(n<30)

使用t

分布統(tǒng)計(jì)量總體均值

在1-

置信水平下的置信區(qū)間為t分布

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的t分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,t分布也逐漸趨于正態(tài)分布Xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z總體均值的區(qū)間估計(jì)

(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命(小時(shí))如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(jì)

(例題分析)解:已知X~N(

,2),n=16,1-=95%,t

/2=2.131根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值

在1-

置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時(shí)~1503.2小時(shí)總體比例的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)假定條件可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量Z總體比例P在1-

置信水平下的置信區(qū)間為總體比例的區(qū)間估計(jì)

(例題分析)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

總體方差的區(qū)間估計(jì)總體方差的區(qū)間估計(jì)估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體服從正態(tài)分布總體方差

2

的點(diǎn)估計(jì)量為S2,且總體方差在1-

置信水平下的置信區(qū)間為總體方差的區(qū)間估計(jì)

(圖示)

2

21-

2

總體方差1-

的置信區(qū)間自由度為n-1的

2總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表7所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論