Session4置信區(qū)間估計_第1頁
Session4置信區(qū)間估計_第2頁
Session4置信區(qū)間估計_第3頁
Session4置信區(qū)間估計_第4頁
Session4置信區(qū)間估計_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Session 4Confidence Interval Estimation置信區(qū)間估計置信區(qū)間估計 Session 4 Confidence Interval Estimation置信區(qū)間估計置信區(qū)間估計Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-2Need for Samplingn總體容量大(人口統(tǒng)計)n破壞性試驗(產品壽命試驗)n連續(xù)生產過程(生產線)抽樣可以得到充足信息以有效推斷總體狀態(tài)Copyright 2010 Pearson Education, Inc. Publishing as

2、Prentice Hall4-3抽樣方法n主觀抽樣n判斷抽樣n方便抽樣n隨機抽樣n簡單隨機抽樣 總體中每一個樣本都有同樣被抽中機會,分為重復抽樣和不重復抽樣Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-4其它抽樣方法n系統(tǒng)抽樣(間隔抽取樣本)n分層抽樣(分成幾個層,每層設計抽樣比例)n整群抽樣(把樣本劃為幾個群,對群抽樣)n連續(xù)抽樣Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-5抽樣誤差n非抽樣誤差n糟糕的抽樣設計n

3、抽樣誤差n依賴于樣本容量n抽樣調查費用與抽樣誤差之間權衡Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-6參數估計nEstimation 根據樣本數據對總體參數的估計.n點估計 用一個數字估計總體參數n區(qū)間估計 給出總體參數的估計區(qū)間,并給出其置信度n常用點估計n樣本均值n樣本方差1212nxxsniinxxnii1Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-7抽樣分布n常用統(tǒng)計量n樣本均值 n樣本方差1212nxx

4、sniinxxnii1Copyright 2010 Pearson Education, Inc. Publishing as Prentice Hall4-8統(tǒng)計量的優(yōu)良準則n無偏估計:統(tǒng)計量的數學期望=總體估計值(參數真實值)n有效性:無偏估計量中,方差越小越有效n相合性:樣本容量越大,估計值越接近待估計參數的真實值一、兩種主要的估計方法一、兩種主要的估計方法p點估計是指根據抽取到的具體樣本數據,點估計是指根據抽取到的具體樣本數據,代入估計量得到的一個估計值。代入估計量得到的一個估計值。p區(qū)間估計是在點估計的基礎上估計出總體區(qū)間估計是在點估計的基礎上估計出總體參數一個可能的范圍,同時還給出

5、總體參參數一個可能的范圍,同時還給出總體參數以多大的概率落在這個范圍之內。數以多大的概率落在這個范圍之內。二、為什么要區(qū)間估計呢?在警察逮捕人數的例子中,你計算得出均值為15.6人,你的上司可能會問,這一均值的確是15.6嗎?你的回答將是不知道。但是,你的計算告訴你,這一均值的最優(yōu)估計值是15.6。你的上司可能又會問了,15.6這一估計值到底有多好? 也就是說,這一均值估計量包含多大的誤差?回答上述問題的一個辦法是抽取很多的樣本,計算回答上述問題的一個辦法是抽取很多的樣本,計算每一個樣本的均值,然后向上司展示均值估計量每一個樣本的均值,然后向上司展示均值估計量的變化范圍。不過,這種辦法顯得有些

6、笨。的變化范圍。不過,這種辦法顯得有些笨。如果你想把這一問題處理得更加高明些,你就應該如果你想把這一問題處理得更加高明些,你就應該計算所有樣本均值的平均誤差。均值的標準差有計算所有樣本均值的平均誤差。均值的標準差有一個專門的名稱:均值標準誤差。一個專門的名稱:均值標準誤差。關于區(qū)間估計設 為總體x 的未知參數, 為來自總體的容量為n的簡單隨機樣本,對于預先給定的一個充分小的正數 ,我們構造兩個統(tǒng)計量:使得使得則稱區(qū)間則稱區(qū)間 為總體參數為總體參數 的區(qū)間估的區(qū)間估計或置信區(qū)間。計或置信區(qū)間。 稱為置信區(qū)間的置稱為置信區(qū)間的置信度,也稱置信概率、置信系數或置信水平,信度,也稱置信概率、置信系數或

7、置信水平, 稱為置信下限,稱為置信下限, 稱為置信上限。稱為置信上限。三、置信區(qū)間的含義三、置信區(qū)間的含義若獨立地反復多次抽取容量相同的簡單隨機樣本,每一個樣若獨立地反復多次抽取容量相同的簡單隨機樣本,每一個樣本都確定一個隨機區(qū)間本都確定一個隨機區(qū)間 ,在這些區(qū)間中,包含,在這些區(qū)間中,包含總體參數總體參數 真值的約占真值的約占 ,或者說有,或者說有 的隨機區(qū)間的隨機區(qū)間 會包含總體參數會包含總體參數 的真值。的真值。例如,若例如,若 ,獨立地反復抽取容量相同的簡單隨機,獨立地反復抽取容量相同的簡單隨機樣本樣本10001000次,在得到的次,在得到的10001000個隨機區(qū)間中,不包含總體參個

8、隨機區(qū)間中,不包含總體參數數 真值的大約有真值的大約有5050個。個。四、簡單隨機抽樣和等距抽樣的參數估計四、簡單隨機抽樣和等距抽樣的參數估計(一)總體均值的置信區(qū)間和參數估計(一)總體均值的置信區(qū)間和參數估計總體均值的區(qū)間估計根據已知條件不同,有不總體均值的區(qū)間估計根據已知條件不同,有不同的計算方法。同的計算方法。1.1.從正態(tài)總體中抽取樣本,且總體方差已知,從正態(tài)總體中抽取樣本,且總體方差已知,均值均值的區(qū)間估計的區(qū)間估計 1.1.從正態(tài)總體中抽取樣本,且總體方差已知從正態(tài)總體中抽取樣本,且總體方差已知,均值,均值的區(qū)間估計的區(qū)間估計 (1)重復抽樣的條件下設 , 已知, 為來自總體的容量

9、為n的簡單隨機樣本,則 的抽樣分布為n在重復抽樣的方式下,總體均值在重復抽樣的方式下,總體均值的置的置信度為信度為1-1-的置信區(qū)間為的置信區(qū)間為其中,其中, 是標準正態(tài)分布是標準正態(tài)分布水平的雙側分位數。水平的雙側分位數。例一:例一: 假設參加某種壽險投保人的年齡服從正態(tài)分布,標準差為=7.77歲。從中抽取36人組成一個簡單隨機樣本(重復抽樣),其平均年齡為39.5歲,試建立投保人平均年齡的90 %的置信區(qū)間。解解 假設用隨機變量假設用隨機變量X X表示某種壽險投保人的表示某種壽險投保人的年齡,則由已知條件有年齡,則由已知條件有 , ,n=36n=36。與置信度。與置信度90%90%相對應的

10、相對應的=0.10=0.10,查表,得到查表,得到 由公式,由公式,得,總體均值得,總體均值的置信度為的置信度為90%90%的置信區(qū)間為的置信區(qū)間為 于是可以說,我們有于是可以說,我們有90%90%的把握確信,壽險投保的把握確信,壽險投保人總體的平均年齡介于人總體的平均年齡介于37.3737.37到到 41.6341.63歲之間。歲之間。1.1.從正態(tài)總體中抽取樣本,且總體方差已知從正態(tài)總體中抽取樣本,且總體方差已知,均值,均值的區(qū)間估計的區(qū)間估計 (2)在不重復抽樣的條件下,置信區(qū)間為21NnXZNn例例2 2 一家食品公司,每天大約生產袋裝食品一家食品公司,每天大約生產袋裝食品若干,總體方

11、差為若干,總體方差為100100。為對產品質量進行檢。為對產品質量進行檢測,該企業(yè)質檢部門采用抽樣技術,每天抽測,該企業(yè)質檢部門采用抽樣技術,每天抽取一定數量的食品,以分析每袋重量是否符取一定數量的食品,以分析每袋重量是否符合質量要求?,F(xiàn)從某一天生產的一批食品合質量要求?,F(xiàn)從某一天生產的一批食品80008000袋中隨機抽取了袋中隨機抽取了2525袋(不重復抽樣),袋(不重復抽樣),測得它們的重量如下表所示:測得它們的重量如下表所示:已知產品重量服從正態(tài)分布,且總體方差為已知產品重量服從正態(tài)分布,且總體方差為100100。試估計該批產品平均重量的置信區(qū)間,。試估計該批產品平均重量的置信區(qū)間,置信

12、水平為置信水平為9595。解解 已知已知=10=10;n=25;1-n=25;1-=95%; =1.96=95%; =1.96根據樣本資料,計算的樣本均值為:根據樣本資料,計算的樣本均值為:根據公式得根據公式得 =105.36=105.361.961.96 2Z2634105.3625xXn21NnXZNn100258000258000 1即105.363.914115=(101.4459, 109.2741),該批產品平均重量在95置信水平下的置信區(qū)間為:101.4459109.2741。2. . 正態(tài)總體,大樣本,若總體方正態(tài)總體,大樣本,若總體方差差 未知,可用樣本標準差未知,可用樣本標

13、準差S S代代替。替。能夠把公式寫出來嗎?能夠把公式寫出來嗎?重復抽樣:?重復抽樣:?不重復抽樣:不重復抽樣: ?2例三:例三: 假設參加某種壽險投保人的年齡服從正態(tài)分布。從中抽取36人組成一個簡單隨機樣本(重復抽樣,年齡數據見下頁表),試建立投保人平均年齡的90 %的置信區(qū)間。解:已知解:已知n=36n=36, 1-=90%=90%; 1.6451.645,由于總體方差未知,但為大樣本,故可由于總體方差未知,但為大樣本,故可用樣本方差代替。用樣本方差代替。 根據樣本資料計算的樣本均值和樣根據樣本資料計算的樣本均值和樣本標準差為:本標準差為:2Z142239.536xXn2()7.771xxs

14、n則置信區(qū)間為:則置信區(qū)間為:即即39.539.52.13=(37.372.13=(37.37,41.63)41.63),投保人平,投保人平均年齡在均年齡在9090的置信水平下的置信區(qū)間的置信水平下的置信區(qū)間為為37.3737.37歲歲41.6341.63歲。歲。27.7739.5 1.64536sXZn3.3.正態(tài)總體、小樣本情況下,總體方差未知,正態(tài)總體、小樣本情況下,總體方差未知,總體均值的估計總體均值的估計 (重復抽樣條件下)(重復抽樣條件下) (不重復抽樣條件下)(不重復抽樣條件下)21sN nX tNn 如果總體服從正態(tài)分布如果總體服從正態(tài)分布, , 只要總體方差已知,只要總體方差

15、已知,即使在小樣本情況下,也可以計算總體均值的置信即使在小樣本情況下,也可以計算總體均值的置信區(qū)間。如果總體方差未知,需用樣本方差代替,在區(qū)間。如果總體方差未知,需用樣本方差代替,在小樣本情況下,小樣本情況下,應用應用t t分布分布來建立總體均值的置信區(qū)來建立總體均值的置信區(qū)間。間。 t t分布是類似正態(tài)分布的一種對稱分布,通常要分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。隨著自由度的增大,比正態(tài)分布平坦和分散。隨著自由度的增大,t t分布分布逐漸趨于正態(tài)分布。逐漸趨于正態(tài)分布。4 4.非正態(tài)總體且大樣本時,均值非正態(tài)總體且大樣本時,均值的區(qū)間估計的區(qū)間估計 首先,當總體為非

16、正態(tài)分布時,只要樣本容量充分首先,當總體為非正態(tài)分布時,只要樣本容量充分大(一般習慣上要求大(一般習慣上要求n=30n=30),), 的抽樣分布近似服從正態(tài)分布。的抽樣分布近似服從正態(tài)分布。當當 已知時,仍可用上述公式,根據重復抽樣與否,已知時,仍可用上述公式,根據重復抽樣與否,近似求出總體均值近似求出總體均值的置信區(qū)間;的置信區(qū)間;其次,當其次,當未知時,只要將上述公式中的總體未知時,只要將上述公式中的總體標準差標準差用樣本標準差用樣本標準差S S代替,就可近似得到代替,就可近似得到總體均值總體均值的置信區(qū)間:的置信區(qū)間: (重復抽樣條件下)(重復抽樣條件下) (不重復抽樣條件下)(不重復抽

17、樣條件下)21sN nX tNn例例 為了解居民用于服裝消費的支出情況(非為了解居民用于服裝消費的支出情況(非正態(tài)分布),隨機抽取正態(tài)分布),隨機抽取9090戶居民組成一個簡單戶居民組成一個簡單隨機樣本(重復抽樣),計算得樣本均值為隨機樣本(重復抽樣),計算得樣本均值為810810元,樣本標準差為元,樣本標準差為8585元,試建立該地區(qū)每元,試建立該地區(qū)每戶居民平均用于服裝消費支出的戶居民平均用于服裝消費支出的95%95%的置信區(qū)的置信區(qū)間。間。 解解 假設用隨機變量假設用隨機變量X X表示居民的服裝消費支出表示居民的服裝消費支出,本題雖然總體分布未知,但由于,本題雖然總體分布未知,但由于n=

18、90n=90,是大,是大樣本且樣本且未知,所以可利用公式近似得到總體未知,所以可利用公式近似得到總體均值均值的置信區(qū)間。根據題意,的置信區(qū)間。根據題意, 元,元, 元,元,n=90n=90,與置信度,與置信度95%95%相對應的相對應的=0.05=0.05,查,查表得到:表得到: 將這些數據代入公式,便可得到總將這些數據代入公式,便可得到總體均值體均值的置信度為的置信度為95%95%的置信區(qū)間為的置信區(qū)間為于是,我們有于是,我們有95%95%的把握認為,該地區(qū)每戶居的把握認為,該地區(qū)每戶居民平均用于服裝消費的支出大約介于民平均用于服裝消費的支出大約介于792.44792.44元元到到827.5

19、6827.56元之間。元之間。21NnXZNn21NnXZNn21NnXZNn總體總體分布分布樣本容量已知重復抽樣已知不重復抽樣正態(tài)分布小樣本(=30)非正態(tài)分布小樣本(=30) 總體均值總體均值的區(qū)間估計(置信度為的區(qū)間估計(置信度為1-1-) 簡單隨機抽樣和等距抽樣簡單隨機抽樣和等距抽樣 21sN nX tNn21sNnXtNn21sN nX tNn 總體均值總體均值的區(qū)間估計(置信度為的區(qū)間估計(置信度為1-1-) 簡單隨機抽樣和等距抽樣簡單隨機抽樣和等距抽樣 總體總體分布分布樣本容量未知重復抽樣未知不重復抽樣正態(tài)分布小樣本(=30)非正態(tài)分布小樣本(=30)四、簡單隨機抽樣和等距抽樣的

20、參數估計四、簡單隨機抽樣和等距抽樣的參數估計(二)兩個總體均值之差的區(qū)間估計間(二)兩個總體均值之差的區(qū)間估計間1 1兩正態(tài)總體方差已知時,且大樣本,兩正態(tài)總體方差已知時,且大樣本, 的區(qū)間估計的區(qū)間估計因此,兩個總體均值差因此,兩個總體均值差 的置信度為的置信度為1-1-的置信區(qū)間為:的置信區(qū)間為: 如果兩個總體方差如果兩個總體方差 , 未知,則可利未知,則可利用用 , 代替兩個總體方差即可。代替兩個總體方差即可。下述公式可近似求出兩個總體均值差下述公式可近似求出兩個總體均值差 的置信度為的置信度為1-1-的置信區(qū)間。的置信區(qū)間。四、簡單隨機抽樣和等距抽樣的參數估計四、簡單隨機抽樣和等距抽樣

21、的參數估計(二)兩個總體均值之差的區(qū)間估計間(二)兩個總體均值之差的區(qū)間估計間2 2兩正態(tài)總體方差未知但相等時,兩正態(tài)總體方差未知但相等時, 的的區(qū)間估計(小樣本)區(qū)間估計(小樣本) 當兩個正態(tài)總體方差未知但相等,即當兩個正態(tài)總體方差未知但相等,即 ,且,且 未知時,這時兩個樣本均值之差(未知時,這時兩個樣本均值之差( )的抽樣分布為)的抽樣分布為n所以n因為 未知,則用共同方差 的合并估計量n兩個總體均值差兩個總體均值差 的置信度為的置信度為1-1-的置信區(qū)間為的置信區(qū)間為n其中,其中, 是是水平的自由度為水平的自由度為 的的t t分布雙側分位數。分布雙側分位數。例題:n某公司為了解男女推銷

22、員的推銷能力是否有差別,隨機抽取16名男推銷員和25名女推銷員進行測試。男推銷員的平均銷售額為30250元,標準差為18400元,女推銷員的平均銷售額為33750元,標準差為13500元。假設男女推銷員的銷售額服從正態(tài)分布,且方差相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。 n 解解 假設用隨機變量 , 分別表示男女推銷員的銷售額,則由已知條件有 元, 元, 元, 元, , 。又因兩總體方差相等,可以估計出它們的共同方差: n與置信度與置信度95%95%相對應的相對應的=0.05=0.05,查,查t t 分分布表,得到布表,得到 ,由公,由公式得男女推銷員銷售額之差的置信度為式得男女推

23、銷員銷售額之差的置信度為95%95%的置信區(qū)間為的置信區(qū)間為n于是,我們有于是,我們有95%95%的把握認為:男推銷的把握認為:男推銷員的銷售額既有可能比女推銷員多員的銷售額既有可能比女推銷員多65686568元,也有可能比女推銷員少元,也有可能比女推銷員少1356813568元,所元,所以男女推銷員的推銷能力沒有顯著差別以男女推銷員的推銷能力沒有顯著差別。 四、簡單隨機抽樣和等距抽樣的參數估計四、簡單隨機抽樣和等距抽樣的參數估計(二)兩個總體均值之差的區(qū)間估計間(二)兩個總體均值之差的區(qū)間估計間3 3兩正態(tài)總體方差未知但不等時兩正態(tài)總體方差未知但不等時, , 的的區(qū)間估計(小樣本)區(qū)間估計(

24、小樣本) n 當兩正態(tài)總體方差未知但不等時,即當兩正態(tài)總體方差未知但不等時,即 , 未知,且兩者不相等時,統(tǒng)計量未知,且兩者不相等時,統(tǒng)計量近似服從于自由度為近似服從于自由度為v v的的t t分布,其中分布,其中v v的計算公式如下的計算公式如下 n于是,兩個總體均值差 的置信度為1-的置信區(qū)間為例題:n某公司為了解男女推銷員的推銷能力是某公司為了解男女推銷員的推銷能力是否有差別,隨機抽取否有差別,隨機抽取1616名男推銷員和名男推銷員和2525名女推銷員進行測試。男推銷員的平均名女推銷員進行測試。男推銷員的平均銷售額為銷售額為3025030250元,標準差為元,標準差為1840018400元

25、,元,女推銷員的平均銷售額為女推銷員的平均銷售額為3375033750元,標準元,標準差為差為1350013500元。假設男女推銷員的銷售額元。假設男女推銷員的銷售額服從正態(tài)分布,且方差不相等。試建立服從正態(tài)分布,且方差不相等。試建立男女推銷員銷售額之差的男女推銷員銷售額之差的95%95%的置信區(qū)間的置信區(qū)間。 解解 首先根據公式計算自由度首先根據公式計算自由度v v, n查查t t分布表,得到分布表,得到 ,由公,由公式得男女推銷員銷售額之差的置信度為式得男女推銷員銷售額之差的置信度為95%95%的置信區(qū)間為的置信區(qū)間為n于是,我們有于是,我們有95%95%的把握認為:男推銷員的把握認為:男

26、推銷員的銷售額既有可能比女推銷員多的銷售額既有可能比女推銷員多74347434元元,也有可能比女推銷員少,也有可能比女推銷員少1443414434元,所以元,所以男女推銷員的推銷能力沒有顯著差別。男女推銷員的推銷能力沒有顯著差別。 四四、簡單隨機抽樣和等距抽樣的參數估計、簡單隨機抽樣和等距抽樣的參數估計(二)兩個總體均值之差的區(qū)間估計間(二)兩個總體均值之差的區(qū)間估計間4 4兩非正態(tài)總體且大樣本時,兩非正態(tài)總體且大樣本時, 的區(qū)間的區(qū)間估計估計 如果兩個總體方差如果兩個總體方差 , 已知,則可利用公已知,則可利用公式下述公式近似求出兩個總體均值差式下述公式近似求出兩個總體均值差 的置信度為的置

27、信度為1-1-的置信區(qū)間。的置信區(qū)間。 如果兩個總體方差如果兩個總體方差 , 未知,則可利用未知,則可利用 , 代替兩個總體方差即可。代替兩個總體方差即可。下述公式可近似求出兩個總體均值差下述公式可近似求出兩個總體均值差 的置信度為的置信度為1-1-的置信區(qū)間。的置信區(qū)間。四、簡單隨機抽樣和等距抽樣的參數估計四、簡單隨機抽樣和等距抽樣的參數估計(三)一個總體比例的區(qū)間估計(三)一個總體比例的區(qū)間估計在許多實際應用中,經常會遇到總體比例在許多實際應用中,經常會遇到總體比例的估計問題。例如:企業(yè)的管理人員想的估計問題。例如:企業(yè)的管理人員想了解一批產品中次品的比例;職工收入了解一批產品中次品的比例

28、;職工收入中工資外收入所占的比例;某高校學生中工資外收入所占的比例;某高校學生參加英語四級考試的通過率;某地區(qū)綠參加英語四級考試的通過率;某地區(qū)綠化荒山新栽樹木的成活率等?;纳叫略詷淠镜某苫盥实?。 n在總體中具有某種特征的單位數占總體全部單在總體中具有某種特征的單位數占總體全部單位的比例稱為總體比例,記為位的比例稱為總體比例,記為p p;在樣本中具;在樣本中具有某種特征的單位數占樣本全部單位的比例稱有某種特征的單位數占樣本全部單位的比例稱為樣本比例,記為為樣本比例,記為 。在大樣本條件下,樣。在大樣本條件下,樣本比例本比例 的抽樣分布近似服從正態(tài)分布,其的抽樣分布近似服從正態(tài)分布,其數學期望

29、為數學期望為 方差為方差為 即即1.1.在大樣本情況下,且總體比例已知,重在大樣本情況下,且總體比例已知,重復抽樣。則總體比例復抽樣。則總體比例P P的置信度為的置信度為1-1-的的置信區(qū)間為置信區(qū)間為 需要說明:在實際應用中,除了要求需要說明:在實際應用中,除了要求N=30N=30以外,還要求以外,還要求 和和 ,且,且 ,這時近似效果較,這時近似效果較好。好。2.2.在大樣本情況下,且總體比例未知,重在大樣本情況下,且總體比例未知,重復抽樣。則總體比例復抽樣。則總體比例P P的置信度為的置信度為1-1-的的置信區(qū)間為置信區(qū)間為例題:在對某地區(qū)在對某地區(qū)10001000名下崗工人的調查中發(fā)現(xiàn)

30、,女工名下崗工人的調查中發(fā)現(xiàn),女工所占的比例為所占的比例為65%65%。試建立在下崗工人中,女。試建立在下崗工人中,女工所占比例的工所占比例的95%95%的置信區(qū)間。能否作出下崗的置信區(qū)間。能否作出下崗工人中女性所占比例超過男性的結論?工人中女性所占比例超過男性的結論?n 解解 假設用假設用p p表示下崗工人中女工所占的表示下崗工人中女工所占的比例,則由已知條件可知,樣本比例比例,則由已知條件可知,樣本比例 。因為。因為 ,n ,n ,所以,所以 的的抽樣分布近似服從正態(tài)分布。抽樣分布近似服從正態(tài)分布。 n對于對于=0.05=0.05,查表得,查表得 。應用公式得到在下崗工人中,女工所占比例應

31、用公式得到在下崗工人中,女工所占比例的置信度為的置信度為95%95%的置信區(qū)間為的置信區(qū)間為n 于是,我們有于是,我們有95%95%的把握認為,下崗工人的把握認為,下崗工人中女工所占比例大約在中女工所占比例大約在0.620.62到到0.680.68之間,之間,超過了超過了0.50.5,所以可以得出女性所占比例超,所以可以得出女性所占比例超過男性的結論。過男性的結論。3. 如果總體為有限總體,采用不重復抽樣,且如果總體為有限總體,采用不重復抽樣,且抽樣比抽樣比 時,時, 的抽樣分布的方差要用的抽樣分布的方差要用修正系數修正系數 加以修正,這時總體比例加以修正,這時總體比例p(未知時未知時)的置信

32、度為的置信度為1-的置信區(qū)間為的置信區(qū)間為 例例 某地區(qū)有某地區(qū)有2020所高等院校,有副教授以上職稱的教師所高等院校,有副教授以上職稱的教師78007800名。高校的管理部門想了解具有高級職稱的教師名。高校的管理部門想了解具有高級職稱的教師中有基礎研究課題的教師占多大的比例,于是抽取中有基礎研究課題的教師占多大的比例,于是抽取400400人組成一個隨機樣本(不重復抽樣)。經調查,其中人組成一個隨機樣本(不重復抽樣)。經調查,其中8080人有基礎研究課題。試建立在具有副教授以上職稱人有基礎研究課題。試建立在具有副教授以上職稱的教師中,有基礎研究課題的教師所占比例的的教師中,有基礎研究課題的教師

33、所占比例的95%95%的置的置信區(qū)間。信區(qū)間。 n解解 假設用假設用p p表示在具有副教授以上職稱的表示在具有副教授以上職稱的教師中,有基礎研究課題的教師所占的比教師中,有基礎研究課題的教師所占的比例,則由已知條件可知例,則由已知條件可知N=7800,n=400,N=7800,n=400,n樣本比例樣本比例 =80/400=0.2 =80/400=0.2 ,=0.05,=0.05,n 。n因為因為n n,所以抽樣分布近似服從正態(tài)分布。,所以抽樣分布近似服從正態(tài)分布。 所以所以 的抽樣分布近似服從正態(tài)分布。又因為的抽樣分布近似服從正態(tài)分布。又因為抽樣比大于抽樣比大于5%5%,所以要對,所以要對

34、的抽樣分布的方的抽樣分布的方差加以修正。應用公式得到在具有副教授以差加以修正。應用公式得到在具有副教授以上職稱的教師中,有基礎研究課題的教師所上職稱的教師中,有基礎研究課題的教師所占比例的占比例的95%95%的置信區(qū)間為的置信區(qū)間為 n于是我們有于是我們有95%95%的把握認為,該地區(qū)的把握認為,該地區(qū)2020所高所高校具有副教授以上職稱的教師中,有(校具有副教授以上職稱的教師中,有( ) 到(到( )的教師有基礎研究課題。)的教師有基礎研究課題。四、簡單隨機抽樣和等距抽樣的參數估計四、簡單隨機抽樣和等距抽樣的參數估計(四)一個正態(tài)總體方差的區(qū)間估計(四)一個正態(tài)總體方差的區(qū)間估計 為來自總體

35、的容量為為來自總體的容量為n n的簡的簡單隨機樣本,單隨機樣本,未知,未知,s s為樣本標準差。為樣本標準差。 總體標準差總體標準差的置信度為的置信度為1-1-的的置信區(qū)間為置信區(qū)間為n因此,總體方差因此,總體方差 的置信度為的置信度為1-1-的的置信區(qū)間為置信區(qū)間為n例例 假設公司預計的每股收益率服從正假設公司預計的每股收益率服從正態(tài)分布,現(xiàn)有態(tài)分布,現(xiàn)有8 8個公司組成一個簡單隨機樣個公司組成一個簡單隨機樣本,樣本方差為本,樣本方差為2.6192.619,試建立總體方差、,試建立總體方差、總體標準差的總體標準差的95 %95 %的置信區(qū)間。的置信區(qū)間。樣本容量的確定 我們應該一直有這樣的疑

36、問:我們學習了我們應該一直有這樣的疑問:我們學習了問卷的設計、調查方法的選擇、數據的描述問卷的設計、調查方法的選擇、數據的描述、數據的整理以及參數估計的有關問題。但、數據的整理以及參數估計的有關問題。但是,如何進行調查呢?或者說選擇多少樣本是,如何進行調查呢?或者說選擇多少樣本呢?或者說需要選擇多少個被調查者呢?呢?或者說需要選擇多少個被調查者呢?n一、影響樣本容量的因素一、影響樣本容量的因素n(一)置信度,也即總體參數真值落在置信區(qū)(一)置信度,也即總體參數真值落在置信區(qū)間內的可靠程度。要求較高的置信度,就需要間內的可靠程度。要求較高的置信度,就需要較大的樣本容量,置信度越高,樣本容量就越較

37、大的樣本容量,置信度越高,樣本容量就越大。大。n一、影響樣本容量的因素一、影響樣本容量的因素n(二)估計的精度,也即置信區(qū)間的寬度。要(二)估計的精度,也即置信區(qū)間的寬度。要求較高的置信度,就會擴大置信區(qū)間的寬度,求較高的置信度,就會擴大置信區(qū)間的寬度,也就是說降低了估計的精度。因此,要想既提也就是說降低了估計的精度。因此,要想既提高估計的精度,又不降低估計的可靠性程度,高估計的精度,又不降低估計的可靠性程度,必須增加樣本容量。必須增加樣本容量。n一、影響樣本容量的因素一、影響樣本容量的因素n(三)建立置信區(qū)間的費用。雖然增加樣本容(三)建立置信區(qū)間的費用。雖然增加樣本容量可以提高置信區(qū)間的可

38、靠性程度和估計的精量可以提高置信區(qū)間的可靠性程度和估計的精度,但也不是樣本容量愈大愈好。因為增加樣度,但也不是樣本容量愈大愈好。因為增加樣本容量,就會延長調查時間,增大工作量和成本容量,就會延長調查時間,增大工作量和成本費用,同時還可能增大調查誤差。本費用,同時還可能增大調查誤差。二、估計總體均值時,樣本容量的確定二、估計總體均值時,樣本容量的確定 對于正態(tài)總體,在對于正態(tài)總體,在重復抽樣或抽樣比重復抽樣或抽樣比n/N5%n/N5%時,總體均值時,總體均值的置信度為的置信度為1-1-的置信的置信區(qū)間為區(qū)間為二、估計總體均值時,樣本容量的確定二、估計總體均值時,樣本容量的確定記記 ,稱為允許誤差,它表示總體均,稱為允許誤差,它表示總體均值值與樣本均值與樣本均值 的絕對誤差不超過的絕對誤差不超過。于是。于是,可以推出樣本容量的計算公式為,可以推出樣本容量的計算公式為n1 1樣本容量樣本容量n n與置信度所對應的標準正態(tài)分布的雙側與置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論