參數(shù)估計和假設(shè)檢驗_第1頁
參數(shù)估計和假設(shè)檢驗_第2頁
參數(shù)估計和假設(shè)檢驗_第3頁
參數(shù)估計和假設(shè)檢驗_第4頁
參數(shù)估計和假設(shè)檢驗_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第7章章 參數(shù)估計和假設(shè)檢驗參數(shù)估計和假設(shè)檢驗參數(shù)估計假設(shè)檢驗全及總體抽樣方法抽樣組織形式基本問題抽樣分布樣本總體極限誤差樣本容量的確定樣本指標全及指標71 抽樣推斷中的幾個基本問題抽樣推斷中的幾個基本問題u抽樣推斷中的幾個基本概念抽樣推斷中的幾個基本概念u抽樣方法抽樣方法u抽樣調(diào)查的組織方式抽樣調(diào)查的組織方式返回返回 抽樣推斷中的幾個基本概念抽樣推斷中的幾個基本概念全及總體全及總體和和樣本樣本樣本統(tǒng)計量樣本統(tǒng)計量和和總體參數(shù)總體參數(shù)全及總體是指我們在抽樣推斷中所要研究的某一個現(xiàn)象總體,也稱為總體或母體。一個有限全及總體所包含的單位數(shù)通常用“N”來表示。從全及總體中按隨機原則抽取的部分個體稱

2、為樣本。樣本中的每個個體叫樣本單位。樣本中所包含個體的數(shù)量稱為樣本容量。樣本容量通常用“n”來表示。樣本容量達到或超過30個稱為大樣本,而低于30個稱為小樣本??傮w參數(shù)是說明全及總體數(shù)量特征的指標樣本統(tǒng)計量是說明樣本數(shù)量特征的指標返回返回抽樣方法抽樣方法抽樣方法重復(fù)抽樣不重復(fù)抽樣重復(fù)抽樣也叫有放回抽樣,是指在總體中抽取樣本單位時,每次抽取一個單位進行調(diào)查登錄后再放回到總體,重新參與下一個單位的抽選,直到抽夠n個樣本單位為止,在抽取樣本單位的過程中,總體的單位數(shù)始終不變。不重復(fù)抽樣也叫不放回抽樣,是指在抽樣時對被抽到的單位經(jīng)登記后不再放回總體中,每抽取一個單位,總體的單位數(shù)就減少一個單位。 返回

3、返回抽樣的組織形式抽樣的組織形式抽樣組織形式簡單隨機抽樣類型抽樣等距抽樣整群抽樣多階段抽樣1、直接從總體中按隨機原則抽取n個單位作為樣本的抽樣方式。2、適用于規(guī)模不大、內(nèi)部差異較小的均勻總體3、特點是簡單、直觀,對總體參數(shù)進行估計比較方便1、先將總體的全部單位按照某個標志分成若干組,然后從不同的組中獨立、隨機地抽取樣本單位的方式2、適用于總體情況比較復(fù)雜,各類型或各層次之間的差異較大,而總體單位數(shù)又比較多的情形3、優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度;組織實施調(diào)查方便1、先將總體各單位按某一標志順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按照固定的順序和相

4、等的間隔來抽取樣本單位的方式2、優(yōu)點是操作簡便,可提高估計的精度3、缺點是對估計量方差的估計比較困難1、先將總體劃分為若干群,然后以群為單位從中隨機抽取部分群,對中選群中的所有單位一一進行調(diào)查的調(diào)查方式2、適用于總體單位多且分布區(qū)域廣,缺少抽樣框的情況3、特點是抽取的單位比較集中,調(diào)查登記比較方便,節(jié)省調(diào)查費用。缺點是估計的精度較差。1、它是把抽取樣本單位的過程劃分為幾個階段,然后逐階段抽取樣本單位的抽樣組織形式。2、特點是比較靈活,便于組織。當總體單位很多、且分布廣泛,幾乎不可能直接從總體中抽取樣本單位時,常采用多階段抽樣。返回返回 72 抽樣分布抽樣分布抽樣分布的概念抽樣分布的概念樣本平均

5、數(shù)的抽樣分布樣本平均數(shù)的抽樣分布兩個樣本平均數(shù)之差的抽樣分布兩個樣本平均數(shù)之差的抽樣分布樣本比率(成數(shù))的抽樣分布樣本比率(成數(shù))的抽樣分布兩個樣本成數(shù)之差的抽樣分布兩個樣本成數(shù)之差的抽樣分布返回返回 抽樣分布的概念抽樣分布的概念統(tǒng)計量作為樣本的函數(shù)統(tǒng)計量作為樣本的函數(shù) ,隨著每次抽樣值的變化而變化。我們把根,隨著每次抽樣值的變化而變化。我們把根據(jù)樣本所有可能的樣本值計算出來的某一統(tǒng)計量的概率分布,稱為抽據(jù)樣本所有可能的樣本值計算出來的某一統(tǒng)計量的概率分布,稱為抽樣分布。樣分布。它是一種理論分布它是一種理論分布隨機變量是樣本統(tǒng)計量(樣本均值、樣本比率、樣本方差)隨機變量是樣本統(tǒng)計量(樣本均值、

6、樣本比率、樣本方差)是進行抽樣推斷的理論基礎(chǔ)是進行抽樣推斷的理論基礎(chǔ) 返回返回 簡單隨機抽樣下簡單隨機抽樣下 樣本平均數(shù)的抽樣分布樣本平均數(shù)的抽樣分布當總體服從正態(tài)分布當總體服從正態(tài)分布N( ,2)時,由正態(tài)分布的性質(zhì)可知,樣)時,由正態(tài)分布的性質(zhì)可知,樣本均值也服從正態(tài)分布,即樣本平均數(shù)服從本均值也服從正態(tài)分布,即樣本平均數(shù)服從N( ,2/n)。)。當總體不服從正態(tài)分布時,在樣本容量充分大時,根據(jù)中心極限定當總體不服從正態(tài)分布時,在樣本容量充分大時,根據(jù)中心極限定理可知,樣本平均數(shù)近似服從理可知,樣本平均數(shù)近似服從N(, 2/n )。)。當從有限總體不重復(fù)抽樣時,只要樣本容量足夠大,樣本平均

7、數(shù)就當從有限總體不重復(fù)抽樣時,只要樣本容量足夠大,樣本平均數(shù)就近似地服從近似地服從N ,(,(2/n)()(1-n/N),其中),其中n/N稱為抽樣稱為抽樣比。比。返回返回 兩個樣本平均數(shù)之差的抽樣分布兩個樣本平均數(shù)之差的抽樣分布如果兩個總體平均數(shù)分別服從如果兩個總體平均數(shù)分別服從N(1,12 )和)和N (2,22 ),則兩個),則兩個樣本平均數(shù)之差服從樣本平均數(shù)之差服從 N(1 2 , 12 /n1+22 /n2)如果兩個總體都是非正態(tài)無限總體,則當兩個樣本容量都充分大時,根如果兩個總體都是非正態(tài)無限總體,則當兩個樣本容量都充分大時,根據(jù)中心極限定理,兩個樣本平均數(shù)之差近似服從據(jù)中心極限定

8、理,兩個樣本平均數(shù)之差近似服從 N(1 2 ,12 / n1+22 /n2)如果兩個總體都是有限總體,并且兩個樣本都是不重復(fù)抽取的則當兩個樣如果兩個總體都是有限總體,并且兩個樣本都是不重復(fù)抽取的則當兩個樣本容量都充分大,并且兩個抽樣比都小于本容量都充分大,并且兩個抽樣比都小于5% 時,根據(jù)中心極限定理,兩時,根據(jù)中心極限定理,兩個樣本平均數(shù)之差就近似服從個樣本平均數(shù)之差就近似服從N( 1 2 , 12 / n1+22 /n2) 。若。若抽樣比不小于抽樣比不小于5%,則可用校正系數(shù)校正。,則可用校正系數(shù)校正。返回返回樣本比率(成數(shù))的抽樣分布樣本比率(成數(shù))的抽樣分布當總體為無限總體時,不論總體

9、的分布如何,在樣本容量充分大當總體為無限總體時,不論總體的分布如何,在樣本容量充分大時,樣本成數(shù)服從時,樣本成數(shù)服從 N(P,PQ/n) 當總體為有限總體且抽樣為不重復(fù)抽樣時,在當總體為有限總體且抽樣為不重復(fù)抽樣時,在np,nq都大于都大于5時,樣本成數(shù)就近似地服從時,樣本成數(shù)就近似地服從 NP,PQ/n(1-n/N)返回返回 兩個樣本成數(shù)之差的抽樣分布兩個樣本成數(shù)之差的抽樣分布當總體為無限總體時,不論總體的分布如何,在兩樣本容量都充分大當總體為無限總體時,不論總體的分布如何,在兩樣本容量都充分大時,兩個樣本成數(shù)之差服從時,兩個樣本成數(shù)之差服從 NP1 P2 ,(,(P1Q1 / n1+P2Q

10、2/n2) 當兩個總體都為有限總體且為不重復(fù)抽樣時,在兩個樣本容量都充分當兩個總體都為有限總體且為不重復(fù)抽樣時,在兩個樣本容量都充分大時,兩個樣本成數(shù)之差近似服從大時,兩個樣本成數(shù)之差近似服從N(P1 P2 ,P1Q1 / n1(1-n1/N1) +P2Q2 / n2(1-n2/N2 )返回返回73 總體參數(shù)估計總體參數(shù)估計總體參數(shù)的估計方法總體參數(shù)的估計方法總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計總體成數(shù)的區(qū)間估計總體成數(shù)的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計兩個總體成數(shù)之差的區(qū)間估計兩個總體成數(shù)之差的區(qū)間估計返回返回 總體參數(shù)的估計方法總體參數(shù)的估計方法點估計點

11、估計區(qū)間估計區(qū)間估計 返回返回 點估計點估計點估計,簡單地說,就是用樣本估計量的一個具體觀測值點估計,簡單地說,就是用樣本估計量的一個具體觀測值直接作為總體的未知參數(shù)的估計值的方法。直接作為總體的未知參數(shù)的估計值的方法。 點估計的優(yōu)良標準:點估計的優(yōu)良標準:1、無偏性無偏性 2、一致性一致性3 、有效性有效性4、充分性充分性估計量抽樣分布的數(shù) 學(xué)期望等于被估計的總體參數(shù)??梢宰C明樣本平均數(shù)是總體平均數(shù)的無偏估計量;樣本成數(shù)是總體成數(shù)的無偏估計量 隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)可以證明樣本平均數(shù)是總體平均數(shù)的一致估計量;樣本成數(shù)是總體成數(shù)的一致估計量;樣本方差是總體方差

12、的一致估計量。對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效可以證明樣本平均數(shù)是總體平均數(shù)的有效估計量;樣本成數(shù)是總體成數(shù)的無有效估計量。一個統(tǒng)計量能把含在樣本中有關(guān)總體的信息完全提取出來,那么就稱該統(tǒng)計量為充分估計量??梢宰C明對于方差已知的正態(tài)總體,樣本平均數(shù)是總體平均數(shù)的充分估計量;樣本成數(shù)是總體成數(shù)的充分估計量。返回返回 區(qū)間估計區(qū)間估計區(qū)間估計是根據(jù)樣本統(tǒng)計量來估計總體未知參數(shù)所在的可能區(qū)間的區(qū)間估計是根據(jù)樣本統(tǒng)計量來估計總體未知參數(shù)所在的可能區(qū)間的方法。由于這種估計的區(qū)間能以一定的置信度來保證估計的準確性,方法。由于這種估計的區(qū)間能以一定的置信度來保證估計的準確性,因此

13、,也稱該區(qū)間為置信區(qū)間。因此,也稱該區(qū)間為置信區(qū)間。區(qū)間估計的基本要求:區(qū)間估計的基本要求:置信度:區(qū)間估計時,希望區(qū)間包含總體參數(shù)的概率越大越好;置信度:區(qū)間估計時,希望區(qū)間包含總體參數(shù)的概率越大越好;精確度:區(qū)間估計時,希望區(qū)間的平均長度越短越好。精確度:區(qū)間估計時,希望區(qū)間的平均長度越短越好。返回返回 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計樣本取自正態(tài)分布總體,且總體方差已知時,總體平均數(shù)的區(qū)間估樣本取自正態(tài)分布總體,且總體方差已知時,總體平均數(shù)的區(qū)間估計計樣本取自正態(tài)分布總體,總體方差未知且為小樣本時,總體平均數(shù)樣本取自正態(tài)分布總體,總體方差未知且為小樣本時,總體平均數(shù)的區(qū)間估計的區(qū)

14、間估計樣本取自非正態(tài)總體,且樣本為大樣本時,樣本取自非正態(tài)總體,且樣本為大樣本時, 總體平均數(shù)的區(qū)間估總體平均數(shù)的區(qū)間估計計返回返回 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計樣本取自正態(tài)分布總體,且總體方差已知時,總體平均數(shù)樣本取自正態(tài)分布總體,且總體方差已知時,總體平均數(shù)的的1的置的置信區(qū)間為信區(qū)間為 (重復(fù)抽樣時)(重復(fù)抽樣時) (有限總體不重復(fù)抽樣時)(有限總體不重復(fù)抽樣時)nZx2NnnZx12返回返回 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計(例題分析例題分析)【例】某制造廠質(zhì)量管理部門的負責(zé)人希望估計移交給接受部門的【例】某制造廠質(zhì)量管理部門的負責(zé)人希望估計移交給接受部門的5500

15、包原材料包原材料的平均重量。對一個由的平均重量。對一個由250包原材料組成的隨機樣本進行了測量,平均重量為包原材料組成的隨機樣本進行了測量,平均重量為65千克。千克。已知總體服從正態(tài)分布,標準差為已知總體服從正態(tài)分布,標準差為15千克。試以千克。試以95%的概率估計這批原材料平的概率估計這批原材料平均重量所在區(qū)間。均重量所在區(qū)間。解:假設(shè)抽樣為重復(fù)抽樣,解:假設(shè)抽樣為重復(fù)抽樣,F(xiàn)()=95%,則,則Z /2=1.96 (查表查表) 即在即在63.1466.86之間。也即我們有之間。也即我們有95%的把握估計這批原材料的平均重量在的把握估計這批原材料的平均重量在63.14千克到千克到66.86千

16、克之間。千克之間。86.1652501596.1652nxXz 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計樣本取自正態(tài)分布總體,總體方差未知且為小樣本時,總體平樣本取自正態(tài)分布總體,總體方差未知且為小樣本時,總體平均數(shù)的置信區(qū)間為:均數(shù)的置信區(qū)間為:nsntx)1(2返回返回 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計(例題分析例題分析)【例】為了估計每分鐘廣告的平均費用,隨機抽取【例】為了估計每分鐘廣告的平均費用,隨機抽取16個電視臺組成樣本個電視臺組成樣本進行調(diào)查。調(diào)查結(jié)果樣本的平均費用為進行調(diào)查。調(diào)查結(jié)果樣本的平均費用為2000元,標準差為元,標準差為1000元。元。假定所有被抽樣的這類電視

17、臺的廣告費用都近似服從正態(tài)分布,試以假定所有被抽樣的這類電視臺的廣告費用都近似服從正態(tài)分布,試以99%的置信度推斷電視臺廣告平均費用的置信區(qū)間。的置信度推斷電視臺廣告平均費用的置信區(qū)間。解:由于解:由于n=1630,屬于小樣本,需要利用,屬于小樣本,需要利用t分布進行估計,查自由度分布進行估計,查自由度為為161=15的的t分布表,與置信度為分布表,與置信度為99%對應(yīng)的對應(yīng)的t值為:值為:t=2.9467即在即在99%的置信度下,電視臺廣告平均費用在的置信度下,電視臺廣告平均費用在2000736.675到到2000+736.675之間。即在之間。即在1263.325到到2736.675之間。

18、之間。2501610000002nx675.7362509467. 2xxt 總體平均數(shù)的區(qū)間估計總體平均數(shù)的區(qū)間估計樣本取自非正態(tài)總體,且樣本為大樣本時,樣本取自非正態(tài)總體,且樣本為大樣本時, 總體平均數(shù)的置信總體平均數(shù)的置信區(qū)間與樣本取自正態(tài)分布總體時的區(qū)間相同,當總體方差未知時,區(qū)間與樣本取自正態(tài)分布總體時的區(qū)間相同,當總體方差未知時,可用樣本方差代替??捎脴颖痉讲畲?。返回返回 總體成數(shù)的區(qū)間估計總體成數(shù)的區(qū)間估計 大樣本近似正態(tài)分布的總體成數(shù)的區(qū)間為:大樣本近似正態(tài)分布的總體成數(shù)的區(qū)間為: 重復(fù)抽樣時重復(fù)抽樣時 有限總體不重復(fù)抽樣時有限總體不重復(fù)抽樣時 npqZp2)(NnnpqpP

19、z12返回返回 總體成數(shù)的區(qū)間估計總體成數(shù)的區(qū)間估計(例題分析例題分析)【例】對一批成品按隨機不重復(fù)抽樣抽取【例】對一批成品按隨機不重復(fù)抽樣抽取200件進行檢驗,結(jié)果發(fā)現(xiàn)其件進行檢驗,結(jié)果發(fā)現(xiàn)其中廢品有中廢品有8件,又知道抽樣單位數(shù)是成品總量的件,又知道抽樣單位數(shù)是成品總量的1/20,當概率為,當概率為95.45%時,可否認為這批產(chǎn)品的廢品率不超過時,可否認為這批產(chǎn)品的廢品率不超過5%解:解:p=8/200=4% Z /2=2(查表)(查表)當概率為當概率為95.45%時,這批產(chǎn)品的廢品率在時,這批產(chǎn)品的廢品率在1.3%到到6.7%之間。不之間。不能認為這批產(chǎn)品的廢品率不超過能認為這批產(chǎn)品的廢

20、品率不超過5%。)(NnnpqpPz12%7 . 2%4)2011 (20096. 004. 02%4 區(qū)間估計(綜合例題分析)區(qū)間估計(綜合例題分析)【例例】某高校進行一次英語不測試,為了解考試情況,采用不重復(fù)某高校進行一次英語不測試,為了解考試情況,采用不重復(fù)抽樣方法隨機抽取抽樣方法隨機抽取1%的學(xué)生進行調(diào)查,調(diào)查結(jié)果如下:的學(xué)生進行調(diào)查,調(diào)查結(jié)果如下:學(xué)生英語考試成績(分)學(xué)生人數(shù)(人) 60分以下607070808090 90100102022408合 計100 區(qū)間估計(綜合例題分析)區(qū)間估計(綜合例題分析)要求在置信度為要求在置信度為95.45%時估計時估計:(1)該校學(xué)生英語平均

21、考試成績的置信區(qū)間;該校學(xué)生英語平均考試成績的置信區(qū)間;(2)成績在成績在80分以上的學(xué)生人數(shù)占學(xué)生總數(shù)的比重的置信區(qū)間分以上的學(xué)生人數(shù)占學(xué)生總數(shù)的比重的置信區(qū)間 區(qū)間估計(例題分析)區(qū)間估計(例題分析)解解(1)由計算可得:樣本平均數(shù)為由計算可得:樣本平均數(shù)為76.6分,方差為分,方差為129.44,根據(jù)根據(jù) 可得該校學(xué)生英語平均考試成績的置信區(qū)間為(可得該校學(xué)生英語平均考試成績的置信區(qū)間為(74.34,78.86)。)。 (2)p=48%,由,由 可得成績在可得成績在80分以上的學(xué)生人數(shù)占學(xué)生總數(shù)的比重的置信區(qū)間為分以上的學(xué)生人數(shù)占學(xué)生總數(shù)的比重的置信區(qū)間為(38.06%,57.94%)N

22、nnZx12)1(2NnnpqZp兩個正態(tài)總體且方差已知時,兩個總體平均數(shù)之差的區(qū)間估計兩個正態(tài)總體且方差已知時,兩個總體平均數(shù)之差的區(qū)間估計 兩個非正態(tài)總體方差未知且為大樣本時,兩個總體平均數(shù)之差兩個非正態(tài)總體方差未知且為大樣本時,兩個總體平均數(shù)之差 的區(qū)間估計的區(qū)間估計 兩個正態(tài)總體方差未知但相等且為小樣本時,兩個總體平均數(shù)兩個正態(tài)總體方差未知但相等且為小樣本時,兩個總體平均數(shù) 之差的區(qū)間估計之差的區(qū)間估計 兩個總體平均數(shù)之差的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計返回返回兩個正態(tài)總體且方差已知時,兩個總體平均數(shù)之差的1的置信區(qū)間為:222121221)(nnZxx兩個正態(tài)總體方差未知但相等

23、且為小樣本時,兩個總體平均數(shù)之差的1的置信區(qū)間為:其中221221221)2()(nsnsnntxx2)1()1(212222112nnsnsns兩個非正態(tài)總體方差未知且為大樣本時,兩個總體平均數(shù)之差的區(qū)間估計222121221)(nnZxxss 正態(tài)總體,方差已知(例題分析)正態(tài)總體,方差已知(例題分析)【例】為調(diào)查甲、乙兩家銀行的戶均存款數(shù),從兩家銀行各抽取一個由【例】為調(diào)查甲、乙兩家銀行的戶均存款數(shù),從兩家銀行各抽取一個由25戶儲戶組戶儲戶組成的隨即成的隨即=機樣本進行調(diào)查。調(diào)查結(jié)果兩個樣本平均數(shù)分別為機樣本進行調(diào)查。調(diào)查結(jié)果兩個樣本平均數(shù)分別為4500元和元和3250元,兩個總體的標準

24、差分別為元,兩個總體的標準差分別為920元和元和960元。根據(jù)經(jīng)驗,知道兩個總體均服元。根據(jù)經(jīng)驗,知道兩個總體均服從正態(tài)分布。試求的從正態(tài)分布。試求的1-2置信度為置信度為90%的置信區(qū)間。的置信區(qū)間。 解:兩個總體均服從正態(tài)分布,且總體方差已知,查標準正態(tài)分布概率雙側(cè)臨界解:兩個總體均服從正態(tài)分布,且總體方差已知,查標準正態(tài)分布概率雙側(cè)臨界值表,值表, Z /2=1.65,故,故1-2的的90%的置信區(qū)間為:的置信區(qū)間為: 即我們有即我們有90%的把握估計甲、乙兩家銀行戶均存款額之差在的把握估計甲、乙兩家銀行戶均存款額之差在811元到元到1689元之元之間。間。439125025960259

25、2065.1)32504500()(22222121221nnZxx 兩個總體平均數(shù)之差的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計 (課堂作業(yè))(課堂作業(yè))【思考題】某地隨機抽選了【思考題】某地隨機抽選了50戶農(nóng)民,戶農(nóng)民,60戶非農(nóng)業(yè)居民。發(fā)現(xiàn)這戶非農(nóng)業(yè)居民。發(fā)現(xiàn)這50戶農(nóng)戶農(nóng)民家庭的平均人口數(shù)為民家庭的平均人口數(shù)為4.50人,人,60戶非農(nóng)民家庭的平均人口數(shù)為戶非農(nóng)民家庭的平均人口數(shù)為3.75人。根據(jù)以往經(jīng)驗,居民家庭人口數(shù)服從正態(tài)分布,而且知道農(nóng)人。根據(jù)以往經(jīng)驗,居民家庭人口數(shù)服從正態(tài)分布,而且知道農(nóng)民家庭人口的總體方差為民家庭人口的總體方差為1.18,非農(nóng)民家庭人口總體的方差為,非農(nóng)民家庭

26、人口總體的方差為2.1,試構(gòu)造兩個總體均值之差的試構(gòu)造兩個總體均值之差的95%的置信區(qū)間。的置信區(qū)間。提示:提示: 根據(jù)根據(jù)得兩個總體平均數(shù)之差的得兩個總體平均數(shù)之差的95%的置信區(qū)間為(的置信區(qū)間為(0.275,1.225) 222121221)(nnZxx 兩個總體平均數(shù)之差的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計 (例題分析)(例題分析)【例】甲、乙兩所大學(xué)某學(xué)期期末英語考試采用同一試題,甲校認【例】甲、乙兩所大學(xué)某學(xué)期期末英語考試采用同一試題,甲校認為該校學(xué)生英語平均考試成績比乙校高出為該校學(xué)生英語平均考試成績比乙校高出10分。為了證明這一分。為了證明這一說法,主管部門從兩校各抽取一個隨

27、機樣本進行調(diào)查。已知兩個說法,主管部門從兩校各抽取一個隨機樣本進行調(diào)查。已知兩個隨機樣本的容量分別為隨機樣本的容量分別為75人和人和80人,調(diào)查結(jié)果兩個學(xué)校學(xué)生的人,調(diào)查結(jié)果兩個學(xué)校學(xué)生的英語考試的平均成績分別為英語考試的平均成績分別為78.6分和分和73.8分,標準差分別為分,標準差分別為8.2分和分和7.4分。試在分。試在95%的把握程度下估計兩校平均分數(shù)之差的把握程度下估計兩校平均分數(shù)之差的置信區(qū)間。的置信區(qū)間。 兩個總體平均數(shù)之差的區(qū)間估計兩個總體平均數(shù)之差的區(qū)間估計 (例題分析)(例題分析)解:本題符合兩個總體平均數(shù)之差的區(qū)間估計(三)的條件,解:本題符合兩個總體平均數(shù)之差的區(qū)間估計

28、(三)的條件, Z/2=1.96(查表),所以(查表),所以1-2的的90%的置信區(qū)間為:的置信區(qū)間為:即我們有即我們有95%的把握說甲、乙兩校英語平均考試成績之差之差在的把握說甲、乙兩校英語平均考試成績之差之差在2.3分到分到7.3元之間。這一結(jié)果說明甲校的英語成績確實高于乙元之間。這一結(jié)果說明甲校的英語成績確實高于乙校校,但病沒有高出但病沒有高出10分分.5 . 28 . 4804 . 7752 . 896. 1)8 .736 .78()(22222121221nnZxxss 兩個總體成數(shù)之差的區(qū)間估計兩個總體成數(shù)之差的區(qū)間估計在兩個樣本均為大樣本時,兩個總體成數(shù)之差的在兩個樣本均為大樣本

29、時,兩個總體成數(shù)之差的1的置信區(qū)間為:的置信區(qū)間為: 222111221)(nqpnqpZpp 兩個總體成數(shù)之差的區(qū)間估計兩個總體成數(shù)之差的區(qū)間估計(例題分析例題分析)【例】一個隨機樣本有甲居民區(qū)的【例】一個隨機樣本有甲居民區(qū)的400戶家庭組成,其中有戶家庭組成,其中有18%的的家庭至少有一個學(xué)齡前兒童。另一個由乙居民區(qū)的家庭至少有一個學(xué)齡前兒童。另一個由乙居民區(qū)的600戶家庭組戶家庭組成,其中有成,其中有23%的家庭至少有一個學(xué)齡前兒童。試求兩個總體的家庭至少有一個學(xué)齡前兒童。試求兩個總體成數(shù)之差的置信度為成數(shù)之差的置信度為95%的置信區(qū)間。的置信區(qū)間。 兩個總體成數(shù)之差的區(qū)間估計兩個總體成

30、數(shù)之差的區(qū)間估計(例題分析例題分析) 解:根據(jù)以上置信區(qū)間的公式,解:根據(jù)以上置信區(qū)間的公式,Z/2=2(查表),所以查表),所以P1-P2的的95%的置信區(qū)間為:的置信區(qū)間為:可得兩個總體成數(shù)之差的置信度為可得兩個總體成數(shù)之差的置信度為95%的置信區(qū)間為的置信區(qū)間為(10.05%,0.05%)。)。%05. 5%560077. 023. 040082. 018. 02%)23%18()(222111221nqpnqpZpp 7-4 樣本容量的確定樣本容量的確定影響樣本容量大小的因素影響樣本容量大小的因素簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定返回返回 影響樣本容量大小的因素影

31、響樣本容量大小的因素總體單位被研究標志的變動程度,即方差??傮w單位被研究標志的變動程度,即方差。要求的估計精度。要求的估計精度。抽樣推斷的可靠程度。抽樣推斷的可靠程度。抽樣方法和抽樣組織形式。抽樣方法和抽樣組織形式。返回返回 簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定(一)估計總體平均數(shù)時樣本容量的確定(一)估計總體平均數(shù)時樣本容量的確定1、在重復(fù)抽樣時、在重復(fù)抽樣時2、有限總體不重復(fù)抽樣時、有限總體不重復(fù)抽樣時222xzn22222)1(zNNznx返回返回(二)估計總體成數(shù)時樣本容量的確定(二)估計總體成數(shù)時樣本容量的確定 1、在重復(fù)抽樣時、在重復(fù)抽樣時 2、有限總體不重復(fù)抽

32、樣時、有限總體不重復(fù)抽樣時222ppqznpqzNpqNznp22222)1( 簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定 簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定 (例題分析)(例題分析)【例【例1】某高校對一年級】某高校對一年級1 000名新生英語的平均成績進名新生英語的平均成績進行抽樣推斷,已知上屆學(xué)生的英語成績的標準差為行抽樣推斷,已知上屆學(xué)生的英語成績的標準差為9.2分,試確定在允許誤差不超過分,試確定在允許誤差不超過2分,概率保證程度為分,概率保證程度為95.45%的情況下,應(yīng)該抽取多少名新生進行調(diào)查。的情況下,應(yīng)該抽取多少名新生進行調(diào)查。 簡單隨機抽

33、樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定 (例題分析(例題分析)解:根據(jù)給定的概率保證程度,查概率表得概率度解:根據(jù)給定的概率保證程度,查概率表得概率度t2。重復(fù)抽樣下重復(fù)抽樣下 不重復(fù)抽樣下不重復(fù)抽樣下 由上可見,在相同的要求下,不重復(fù)抽樣與重復(fù)抽樣相比所需的樣本單位數(shù)由上可見,在相同的要求下,不重復(fù)抽樣與重復(fù)抽樣相比所需的樣本單位數(shù)目較少。其原因在于,不重復(fù)抽樣比重復(fù)抽樣的誤差小,因而在允許誤目較少。其原因在于,不重復(fù)抽樣比重復(fù)抽樣的誤差小,因而在允許誤差相同的情況下,不重復(fù)抽樣所抽取的樣本單位數(shù)目則可少一些。差相同的情況下,不重復(fù)抽樣所抽取的樣本單位數(shù)目則可少一些。人8522 .

34、92222222xxtn 人782 . 922100010002 . 922222222222xxxttNNn 某企業(yè)有某企業(yè)有3000名職工,該企業(yè)想估計職工們上下班花在路上的平均名職工,該企業(yè)想估計職工們上下班花在路上的平均時間。以置信度為時間。以置信度為99.73%的置信區(qū)間進行估計,并使估計值處在的置信區(qū)間進行估計,并使估計值處在真正平均值附近真正平均值附近1分鐘的誤差范圍之內(nèi)。在一個先前抽取的小樣本給分鐘的誤差范圍之內(nèi)。在一個先前抽取的小樣本給出的標準差為出的標準差為4.3分鐘。試問應(yīng)抽取多大的樣本?分鐘。試問應(yīng)抽取多大的樣本? 答案答案提示提示:假設(shè)為重復(fù)抽樣,根據(jù)重復(fù)抽樣下計算樣

35、本容量的公式,假設(shè)為重復(fù)抽樣,根據(jù)重復(fù)抽樣下計算樣本容量的公式,可得可得 n=167人。人。簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定 (課堂作業(yè))(課堂作業(yè))簡單隨機抽樣下樣本容量的確定簡單隨機抽樣下樣本容量的確定 (例題分析)(例題分析)【例【例2】某高校對一年級】某高校對一年級1000名新生英語及格率進行調(diào)查,已知上屆名新生英語及格率進行調(diào)查,已知上屆學(xué)生的英語成績的及格率為學(xué)生的英語成績的及格率為96%,試確定在,試確定在95.45%的概率保證的概率保證程度下,允許誤差不超過程度下,允許誤差不超過2%時應(yīng)該抽取多少名新生進行調(diào)查。時應(yīng)該抽取多少名新生進行調(diào)查。簡單隨機抽樣

36、下樣本容量的確定簡單隨機抽樣下樣本容量的確定 (例題分析)(例題分析) 解:根據(jù)給定的概率保證程度,查概率表得概率度解:根據(jù)給定的概率保證程度,查概率表得概率度t2。重復(fù)抽樣下重復(fù)抽樣下 不重復(fù)抽樣:不重復(fù)抽樣: 人242%4%962%21000%4%9621000)1 ()1 (222222pPNpPNnttp人384%2%4%96212222PPPtn 75 總體參數(shù)的假設(shè)檢驗總體參數(shù)的假設(shè)檢驗假設(shè)檢驗的概念和步驟假設(shè)檢驗的概念和步驟假設(shè)檢驗中的兩類錯誤假設(shè)檢驗中的兩類錯誤假設(shè)檢驗與區(qū)間估計的關(guān)系假設(shè)檢驗與區(qū)間估計的關(guān)系幾種常見的假設(shè)檢驗幾種常見的假設(shè)檢驗 假設(shè)檢驗的概念和步驟假設(shè)檢驗的概

37、念和步驟假設(shè)檢驗假設(shè)檢驗是指對總體的某些未知參數(shù)先作某種假設(shè),然后抽取樣本是指對總體的某些未知參數(shù)先作某種假設(shè),然后抽取樣本構(gòu)造適當?shù)慕y(tǒng)計量,對假設(shè)的正確性進行判斷。構(gòu)造適當?shù)慕y(tǒng)計量,對假設(shè)的正確性進行判斷。假設(shè)檢驗的步驟為:假設(shè)檢驗的步驟為:提出原假設(shè)和被選假設(shè);提出原假設(shè)和被選假設(shè);確定適當?shù)臋z驗統(tǒng)計量;確定適當?shù)臋z驗統(tǒng)計量;規(guī)定顯著性水平規(guī)定顯著性水平;計算檢驗統(tǒng)計量的值;計算檢驗統(tǒng)計量的值;作出拒絕或接受的判斷。作出拒絕或接受的判斷。返回返回 假設(shè)檢驗中的兩類錯誤假設(shè)檢驗中的兩類錯誤假設(shè)檢驗是根據(jù)樣本所提供的信息進行判斷的,由于樣本具有隨機性,假設(shè)檢驗是根據(jù)樣本所提供的信息進行判斷的,

38、由于樣本具有隨機性,因而根據(jù)樣本作出判斷就有可能犯兩類因而根據(jù)樣本作出判斷就有可能犯兩類錯誤錯誤: 一類錯誤是原假設(shè)本來正確,但按檢驗規(guī)則卻被我們拒絕了。犯一類錯誤是原假設(shè)本來正確,但按檢驗規(guī)則卻被我們拒絕了。犯這類錯誤的概率用這類錯誤的概率用來表示,所以也稱作來表示,所以也稱作錯誤或棄真錯誤。錯誤或棄真錯誤。 另一類錯誤是原假設(shè)本來不正確,但卻被我們接受了,犯這類錯另一類錯誤是原假設(shè)本來不正確,但卻被我們接受了,犯這類錯誤的概率用誤的概率用來表示,所以也稱作來表示,所以也稱作錯誤或取偽錯誤。錯誤或取偽錯誤。返回返回 假設(shè)檢驗與區(qū)間估計的關(guān)系假設(shè)檢驗與區(qū)間估計的關(guān)系區(qū)間估計和假設(shè)檢驗是統(tǒng)計推斷

39、的兩個組成部分,然而二者存在明顯區(qū)間估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,然而二者存在明顯區(qū)別:區(qū)別:n區(qū)間估計是根據(jù)給出的置信度要求,指出總體參數(shù)被估計的上限或區(qū)間估計是根據(jù)給出的置信度要求,指出總體參數(shù)被估計的上限或下限;下限;n假設(shè)檢驗則是利用區(qū)間估計的上限和下限來判斷結(jié)果是否合理,即假設(shè)檢驗則是利用區(qū)間估計的上限和下限來判斷結(jié)果是否合理,即判斷被估計的總體參數(shù)是否存在顯著差異。判斷被估計的總體參數(shù)是否存在顯著差異。返回返回 幾種常見的假設(shè)檢驗幾種常見的假設(shè)檢驗總體均值的假設(shè)檢驗總體均值的假設(shè)檢驗兩個均值之差的假設(shè)檢驗兩個均值之差的假設(shè)檢驗總體成數(shù)的假設(shè)檢驗總體成數(shù)的假設(shè)檢驗兩個總體成

40、數(shù)之差的假設(shè)檢驗兩個總體成數(shù)之差的假設(shè)檢驗返回返回 總體均值的假設(shè)檢驗總體均值的假設(shè)檢驗總體均值的檢驗包括下面三種類型:總體均值的檢驗包括下面三種類型:H0: =0 H1: 0H0: 0 H1: 0H0: 0 H1: 0返回返回 正態(tài)總體均值的檢驗正態(tài)總體均值的檢驗 總體方差已知總體方差已知構(gòu)造檢驗統(tǒng)計量構(gòu)造檢驗統(tǒng)計量 當當=0時,檢驗統(tǒng)計量時,檢驗統(tǒng)計量ZN(0,1)。給定顯著水平)。給定顯著水平,檢,檢驗問題(驗問題(1),(),(2),(),(3)的檢驗規(guī)則為:)的檢驗規(guī)則為:(1)當)當ZZ/2拒絕原假設(shè)。通常稱此檢驗為拒絕原假設(shè)。通常稱此檢驗為Z檢驗。檢驗。(2)當)當ZZ拒絕原假設(shè)

41、。拒絕原假設(shè)。(3)當)當ZZ拒絕原假設(shè)。拒絕原假設(shè)。 nxZ/0返回返回 正態(tài)總體均值的檢驗正態(tài)總體均值的檢驗總體方差已知總體方差已知 (例題分析)(例題分析)【例】一家食品加工公司的質(zhì)量管理部門規(guī)定,某種包裝食品每包凈重不得【例】一家食品加工公司的質(zhì)量管理部門規(guī)定,某種包裝食品每包凈重不得少于少于20千克。經(jīng)驗表明,重量近似服從標準差為千克。經(jīng)驗表明,重量近似服從標準差為1.5千克的正態(tài)分布。千克的正態(tài)分布。假定從一個有假定從一個有50包食品構(gòu)成的隨機樣本中得到的平均重量為包食品構(gòu)成的隨機樣本中得到的平均重量為19.5千克,千克,問是否有充分證據(jù)說明這些包裝食品的重量減少了?問是否有充分證

42、據(jù)說明這些包裝食品的重量減少了?正態(tài)總體均值的檢驗正態(tài)總體均值的檢驗總體方差已知總體方差已知 (例題分析)(例題分析)解:解: 建立假設(shè):建立假設(shè):20千克千克 H1 :20千克千克 ,由于重量近似服從,由于重量近似服從正態(tài)分布,所以可用正態(tài)分布,所以可用 為檢驗統(tǒng)計量。為檢驗統(tǒng)計量。=0.05,且為單側(cè)檢驗,查表,且為單側(cè)檢驗,查表Z/2=1.645, 所以拒絕。即檢驗結(jié)果能提供充分證據(jù)說明這些包裝食品的重量減少所以拒絕。即檢驗結(jié)果能提供充分證據(jù)說明這些包裝食品的重量減少了。了。nxZ/0645. 1826. 130/5 . 1205 .19/0nxZ由于總體方差未知,通常用樣本方差代替總體

43、方差,并選擇由于總體方差未知,通常用樣本方差代替總體方差,并選擇t作為檢驗統(tǒng)作為檢驗統(tǒng)計量:計量:當當=0時,這個統(tǒng)計量服從自由度為時,這個統(tǒng)計量服從自由度為n-1的的t分布。分布。給定顯著水平給定顯著水平,檢驗問題(,檢驗問題(1)、()、(2)、()、(3)的檢驗規(guī)則為:)的檢驗規(guī)則為: (1)當)當tt/2(n-1)時,拒絕)時,拒絕H0。 (2)當)當t-t(n-1)時,拒絕)時,拒絕H0。 (3)當)當tt(n-1)時,拒絕)時,拒絕H0。nsxt/0 正態(tài)總體均值的檢驗正態(tài)總體均值的檢驗 總體方差未知且為小樣本總體方差未知且為小樣本返回返回 正態(tài)總體均值的檢驗正態(tài)總體均值的檢驗 總

44、體方差未知且為小樣本(例題分析)總體方差未知且為小樣本(例題分析) 【例】某汽車輪胎廠聲稱,該廠一等品輪胎的平均使用壽命在一定的重量【例】某汽車輪胎廠聲稱,該廠一等品輪胎的平均使用壽命在一定的重量和正常駕駛下大于和正常駕駛下大于25000千米。對一個由千米。對一個由15個輪胎組成的隨機樣本進個輪胎組成的隨機樣本進行實驗,得到的平均值和標準差分別為行實驗,得到的平均值和標準差分別為27000千米和千米和5000千米。假定千米。假定輪胎的壽命近似服從正態(tài)分布,試問是否可以相信產(chǎn)品同廠家所說的標輪胎的壽命近似服從正態(tài)分布,試問是否可以相信產(chǎn)品同廠家所說的標準相符?(準相符?(=0.05) 正態(tài)總體均

45、值的檢驗正態(tài)總體均值的檢驗 總體方差未知且為小樣本(例題分析)總體方差未知且為小樣本(例題分析)解解:要對廠家所說的標準取得強有力的支持要對廠家所說的標準取得強有力的支持,必須把不符合標準作為原假設(shè)必須把不符合標準作為原假設(shè): H0:25000 , H1: 25000由于正態(tài)近似服從正態(tài)分布,正態(tài)方差未知,所以選取檢驗統(tǒng)計量由于正態(tài)近似服從正態(tài)分布,正態(tài)方差未知,所以選取檢驗統(tǒng)計量其觀測值為其觀測值為查查t分布表分布表t0.05(14)=1.7613,由于,由于tt0.05(14),所以只能接受原假設(shè),也即所以只能接受原假設(shè),也即沒有充分的理由相信廠家相符。沒有充分的理由相信廠家相符。nsxt

46、/055.11550002500027000/0nsxt 總體為非正態(tài)分布且為大樣本時總體為非正態(tài)分布且為大樣本時 總體均值的檢驗總體均值的檢驗總體為非正態(tài)分布,但當樣本為大樣本時,由中心極限定理可知樣總體為非正態(tài)分布,但當樣本為大樣本時,由中心極限定理可知樣本平均數(shù)的抽樣分布近似服從正態(tài)分布。即檢驗統(tǒng)計量本平均數(shù)的抽樣分布近似服從正態(tài)分布。即檢驗統(tǒng)計量 當當=0時,近似服從時,近似服從N(0,1)當總體方差未知時,可以用樣本方差代替它。其檢驗方法與正態(tài)總當總體方差未知時,可以用樣本方差代替它。其檢驗方法與正態(tài)總體均值的檢驗方法相同。體均值的檢驗方法相同。nxZ/0返回返回總體為非正態(tài)分布且為

47、大樣本時總體為非正態(tài)分布且為大樣本時 總體均值的檢驗(例題分析)總體均值的檢驗(例題分析)【例】某房地產(chǎn)經(jīng)紀人宣稱某鄰近地區(qū)房屋的平均價值低于【例】某房地產(chǎn)經(jīng)紀人宣稱某鄰近地區(qū)房屋的平均價值低于480000元。元。從從40間房屋組成的一個隨機樣本得出的平均價值為間房屋組成的一個隨機樣本得出的平均價值為45000元,標準元,標準差為差為120000元。在元。在0.05的置信水平下,這些數(shù)據(jù)的置信水平下,這些數(shù)據(jù) 是否支持這位是否支持這位經(jīng)紀人的說法?經(jīng)紀人的說法?總體為非正態(tài)分布且為大樣本時總體為非正態(tài)分布且為大樣本時 總體均值的檢驗(例題分析)總體均值的檢驗(例題分析)解:建立假設(shè)解:建立假設(shè)

48、H0:480000 , H1: 480000由于總體分布及方差均未知,但樣本為大樣本,所以可以選擇檢驗統(tǒng)計由于總體分布及方差均未知,但樣本為大樣本,所以可以選擇檢驗統(tǒng)計量并計算其觀測值為量并計算其觀測值為查正態(tài)查正態(tài)t分布表分布表z0.05=1.645, -z0.05=-1.645由于由于zz0.05,所以不,所以不能否定原假設(shè),也即這些數(shù)據(jù)不能支持經(jīng)紀人的說法。能否定原假設(shè),也即這些數(shù)據(jù)不能支持經(jīng)紀人的說法。581.140120000480000450000/0nsxZ 兩個總體均值之差的檢驗兩個總體均值之差的檢驗兩個總體均值之差的檢驗包括下面三種類型:兩個總體均值之差的檢驗包括下面三種類型:(1)H0: 1- 2 =0 H1: 1- 2 0 (2)H0:1- 2 0 H1: 1- 2 0 (3)H0:1- 2 0 H1: 1- 2 0 應(yīng)用上常見的情況是應(yīng)用上常見的情況是0 =0,下面分三種情況進行討論。,下面分三種情

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論