




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第7章 抽樣分佈與估計式 .前言抽樣的目的並不意味著我們關(guān)心的焦點是在樣本的資料上。樣本背後的母體才是關(guān)心的重點。以樣本的統(tǒng)計量statistic,如樣本平均數(shù)、樣本變異數(shù)等,來推論母體的參數(shù)parameter,如母體平均數(shù)、母體變異數(shù)等。要達到此目的,必須知道樣本的統(tǒng)計量的機率分佈,以及如何在眾多的統(tǒng)計量中,選擇最恰當?shù)?,以便估計母體參數(shù)。.第一節(jié) 抽樣誤差 (1)不針對母體進行普查的主要緣由有:1. 母體太大,客觀條件限制。2. 無法確知母體的範圍。3. 破壞性檢測。4. 從樣本的結(jié)果已經(jīng)可以有效推知母體。.第一節(jié) 抽樣誤差 (2)估計誤差抽樣誤差sampling error :任何因為抽
2、樣中的機遇chance所產(chǎn)生的變動。添加樣本數(shù),可以降低抽樣誤差。運用恰當?shù)臉颖窘y(tǒng)計量來估計母體參數(shù),也是降低抽樣誤差的方法之一。適當?shù)某闃臃椒ǎ梢越档统闃诱`差。非抽樣誤差nonsampling error :一切不是因為抽樣所產(chǎn)生的誤差。例如樣本沒有代表性,在資料的蒐集、整理、分析時也能夠產(chǎn)生誤差。.第二節(jié) 抽樣方法 (1)抽樣方法隨機抽樣random sampling:按照隨機的方式,使母群體中的每一個份子都有能夠被抽到。非隨機抽樣nonrandom sampling:取決於研討者主觀的想法或是參照客觀環(huán)境的限制,所設(shè)計出來的抽樣方法,因此母群體的某些份子完全沒有被抽到的機會。 .第二節(jié)
3、 抽樣方法 (2)隨機抽樣1. 簡單隨機抽樣simple random sampling2. 間隔抽樣interval sampling3. 分層抽樣stratified sampling4. 集群抽樣cluster sampling5. 分段抽樣staged sampling非隨機抽樣1. 配額抽樣quota sampling2. 判斷抽樣judgment sampling.第二節(jié) 抽樣方法 (3)簡單隨機抽樣先將母體加以編號,然後如抽籤般的抽出200位即可。也可以利用均勻分佈所產(chǎn)生的數(shù)值來替代抽籤。假設(shè)母群體很大,將母體加以編號恐怕不切實際。有時研討者並不確知母群體的大小,簡單隨機抽樣並不
4、見得可行。 .第二節(jié) 抽樣方法 (4)間隔抽樣每隔幾個就抽取一個。在工商界中,常用此方法進行抽樣,如每隔幾個上門的顧客就訪問一位,每隔幾個產(chǎn)品就抽樣一個。運用間隔抽樣時,必須確保樣本的資料並無規(guī)律性變化才可。 .第二節(jié) 抽樣方法 (5)分層抽樣先決定有哪幾個重要的層strata,接著就按照母體分佈的比率,隨機抽樣。這樣一來可以保證樣本與母群體的分佈情形非常相近,因此所得到的調(diào)查結(jié)果比簡單隨機抽樣更能夠推論到母群體。假設(shè)選擇一些不相關(guān)的層,就會一點效果都沒有。因此在實務上,通常只選取少數(shù)幾個最為重要的層而已。 .第二節(jié) 抽樣方法 (6)集群抽樣先將母群體分為數(shù)個類似的集群,然後隨機抽取數(shù)個集群,
5、加以調(diào)查。在集群抽樣裡,集群與集群間要非常類似,集群內(nèi)則差異要大越接近母群體的分佈越好。在分層抽樣裡,層與層之間的差異要大,但層之內(nèi)要非常類似。 .第二節(jié) 抽樣方法 (7)分段抽樣採用多種抽樣的方法。例如先集群抽樣,然後再簡單隨機抽樣。或先集群再分層抽樣。實務上,仍以兩階段和三階段的抽樣最為普遍。 .第二節(jié) 抽樣方法 (8)配額抽樣它和分層抽樣的概念非常類似,只不過在分層抽樣裡,研討者確知母群體中各層的比率,但在配額抽樣裡,事先並不完全知道母群體的分佈,但按照研討者的學識和判斷,研擬出配額的依據(jù)。.第二節(jié) 抽樣方法 (9)判斷抽樣它必須仰賴研討者主觀的判斷來進行抽樣。判斷抽樣又比配額抽樣更為主
6、觀。因為在配額抽樣中,研討者只是去估計母體的比例而已。但在判斷抽樣裡,研討者甚至判斷哪些份子較具代表性,以決定能否要對它進行調(diào)查。.第三節(jié) 抽樣分佈 (1)推論統(tǒng)計學就是利用樣本統(tǒng)計量來估計母體參數(shù)的一門學問。統(tǒng)計量的機率分佈稱為抽樣分佈理論sampling distribution theory。根本上我們關(guān)心該分佈是何種機率分佈,平均數(shù)和變異數(shù)各為多少,藉以估計母體參數(shù)。.第三節(jié) 抽樣分佈 (2)定理7.1令X1, , Xn為獨立隨機變項,其平均數(shù)分別為m1, , m n,其變異數(shù)分別為 , , 。假設(shè)令Y的平均數(shù)和變異數(shù)分別為 .第三節(jié) 抽樣分佈 (3)例子1令X1表示丟公平硬幣出現(xiàn)的點
7、數(shù),X2表示丟公平骰子出現(xiàn)的點數(shù),則3X1 2X2的平均數(shù)和變異數(shù)分別是多少?作法公平硬幣出現(xiàn)的點數(shù)的平均數(shù)和變異數(shù)分別為0.5以及0.25。丟骰子出現(xiàn)的點數(shù)為間斷均勻分佈,平均數(shù)和變異數(shù)分別為3.5以及2.92。X1和X2互為獨立,得3X1 2X2的平均數(shù)為3 0.5 2 3.5 = -5.5,變異數(shù)為32 0.25 + 22 2.92 = 13.93。 .第三節(jié) 抽樣分佈 (4)例子2X和Y變項互為獨立,X變項的變異數(shù)為 ,Y變項的變異數(shù)為 ,aX + bY的變異數(shù)是多少?作法aX + bY的變異數(shù)為a2 + b2 。.第三節(jié) 抽樣分佈 (5)推論1X1,Xn的平均數(shù)均為m,變異數(shù)均為 ,
8、且ai 都等於1/n: 的平均數(shù)會等於母體平均數(shù)m,變異數(shù)會等於母體變異數(shù)除以n,即s2/n。即: .第三節(jié) 抽樣分佈 (6)定理7.2令X1, , Xn為來自常態(tài)分佈的獨立隨機變項,其平均數(shù)分別為m1, , mn,變異數(shù)分別為 , , 。假設(shè)令則Y為常態(tài)分佈,平均數(shù)為和變異數(shù)分別為.第三節(jié) 抽樣分佈 (7)推論 1令X1, , Xn為來自常態(tài)分佈N(m, s2)的獨立隨機變項,則樣本平均數(shù) 推論2令X1, , Xn為來自常態(tài)分佈N(m, s2)的獨立隨機變項,則.第三節(jié) 抽樣分佈 (8)推論3令X1, , Xn為來自標準常態(tài)分佈N(0, 1)的獨立隨機變項,則.第三節(jié) 抽樣分佈 (9)例子3
9、假設(shè)智商的分佈為N(100, 225)。隨機抽樣25人調(diào)查其智商,並計算智商的樣本平均數(shù)。假設(shè)重複抽樣無數(shù)次,每次抽樣25人,並計算樣本平均數(shù),則樣本平均數(shù)會成何分佈?其平均數(shù)和變異數(shù)各為多少? 作法令這25人的智商分別為X1, , X25。知它們均服從常態(tài)分佈N(100, 225),根據(jù)定理7.2得知,樣本平均數(shù)的抽樣分佈為N(100, 225/25)。 .第三節(jié) 抽樣分佈 (10)定理7.3令Z1, , Zn為標準常態(tài)分佈的獨立隨機變項,則定理7.4令X1, , Xn為來自常態(tài)分佈N(m, s2)的獨立隨機變項,且其樣本平均數(shù)為 ,樣本變異數(shù)為S2 ,則 (1) 和S2相互獨立,(2).第
10、三節(jié) 抽樣分佈 (11)例子4假設(shè)智商的分佈為常態(tài)分佈,平均數(shù)和變異數(shù)分別為100和225。假設(shè)隨機抽樣25人調(diào)查其智商,並計算智商的樣本變異數(shù)S2。假設(shè)重複抽樣無數(shù)次,每次抽樣25人,並計算樣本變異數(shù),則樣本變異數(shù)S2會成何分佈?其平均數(shù)和變異數(shù)各為多少? .第三節(jié) 抽樣分佈 (12)作法令這25人的智商分別為X1, , X25,均服從常態(tài)分佈N(100, 225),因此由於卡方分佈的平均數(shù)是其自在度,變異數(shù)為2倍的自在度,因此 的平均數(shù)是24,變異數(shù)是48。所以S2的平均數(shù)是225,變異數(shù)是4218.7 (=48 / (24/225)2)。 .第三節(jié) 抽樣分佈 (13)定理7.5 中央極限
11、定理令X1, , Xn為來自某平均數(shù)為m,變異數(shù)為s2的母體的獨立隨機變項,當n趨近無限大時,其樣本平均數(shù)會趨近於N(m, s2/n)。在實用上,只需樣本數(shù)n夠大如n 25,樣本平均數(shù)就會很接近常態(tài)分佈。其實即使n小於25,只需母體分佈與常態(tài)分佈相去不遠,如類似單峰和左右對稱形狀,樣本平均數(shù)會近似常態(tài)分佈。.第三節(jié) 抽樣分佈 (14)例子5知丟骰子出現(xiàn)點數(shù)為間斷均勻分佈,平均數(shù)和變異數(shù)分別為3.5和2.92?,F(xiàn)丟骰子25次,計算骰子點數(shù)的平均數(shù)。假設(shè)這樣無數(shù)次,每次均丟骰子25次,並計算骰子點數(shù)的平均數(shù),則骰子點數(shù)的平均數(shù)會成何分佈?其平均數(shù)和變異數(shù)各為多少?作法根據(jù)中央極限定理,樣本平均數(shù)接
12、近常態(tài)分佈,其平均數(shù)為母體平均數(shù)3.5,變異數(shù)為0.12 (=2.92/25)。 .第三節(jié) 抽樣分佈 (15) 定理7.6 假設(shè)由平均數(shù)為m1和m2,變異數(shù)為 和 的常態(tài)分佈母體抽隨機抽出樣本數(shù)為n1和n2的獨立樣本,則假設(shè)母體並非常態(tài)分佈,只需樣本數(shù)n1和n2夠大如均大於25,就可放心運用常態(tài)分佈了。 .第三節(jié) 抽樣分佈 (16)例子6丟硬幣25次,計算出現(xiàn)點數(shù)的平均數(shù)正面一點,反正零點,也丟骰子25次,計算出現(xiàn)點數(shù)的平均數(shù)。然後將硬幣的平均數(shù)減骰子的平均數(shù),得到兩平均數(shù)差異。假設(shè)重複這樣無數(shù)多次,這些無數(shù)多次的平均數(shù)差異成何分佈?平均數(shù)和變異數(shù)各式多少?.第三節(jié) 抽樣分佈 (17)作法丟硬
13、幣出現(xiàn)的點數(shù)的平均數(shù)和變異數(shù)分別為0.5以及0.25。丟骰子出現(xiàn)的點數(shù)的平均數(shù)和變異數(shù)分別為3.5以及2.92。令 為硬幣的平均數(shù), 為骰子的平均數(shù),則 的平均數(shù)為0.53.5 = -3,變異數(shù)為 根據(jù)中央極限定理, 近似常態(tài)分佈。 .第四節(jié) 估計式 (1)推論統(tǒng)計包括兩大部份:估計和假設(shè)檢定。估計分為點估計和區(qū)間估計。母體參數(shù)的點估計:利用統(tǒng)計量的某一個值加以估計。例如用樣本平均數(shù)這個統(tǒng)計量的大寫表示變項,小寫表示特定的數(shù)值估計母體平均數(shù)m。統(tǒng)計量又稱為估計式estimator,以闡明其估計母體參數(shù)的功用。同一個參數(shù)可以有好多個估計式。.第四節(jié) 估計式 (2)不偏性 令q為所欲估計的參數(shù),
14、唸做theta hat為其估計式。假設(shè) E ( ) = q,那麼 就具有不偏性。或謂 是q的不偏估計式unbiased estimator。 樣本平均數(shù)的期望值為母體平均數(shù),因此樣本平均數(shù)是母體平均數(shù)的不偏估計式。 .第四節(jié) 估計式 (3)例子7令X1, X2, X3, X4為隨機從母體抽出的4個值,樣本平均數(shù)是母體平均數(shù)m的不偏估計式,已如上述。但X1、 、 、 能否也是母體平均數(shù)的不偏估計式? .第四節(jié) 估計式 (3)作法E(X1) =m.第四節(jié) 估計式 (4)例子8樣本變異數(shù)S2是母體變異數(shù)s2的不偏估計式嗎?作法.第四節(jié) 估計式 (5)有效性 假設(shè)q是所欲估計的參數(shù), 是眾多估計式中的
15、一種。假設(shè)E( -q )2在一切的估計式中最小, 就是最有效的估計式。在一切的估計式中,具有最小的均方誤,就是最有效的估計式。假設(shè)只限於從不偏估計式中挑選最有效的,那麼該估計式就是不偏的最小變異估計式。 .第四節(jié) 估計式 (6)例子9在例子7中, 、X1、Y1、Y2都是母體平均數(shù)的不偏估計式。何者較為有效?作法 .第四節(jié) 估計式 (7)一致性假設(shè)樣本數(shù)n越大,估計式 與母體參數(shù)q 的誤差量越小。假設(shè)樣本數(shù)趨近於無限大, 與q 的差量小於微量e的機率趨近1。即該估計式 就具有一致性consistency 是母體平均數(shù)的不偏估計式,且變異數(shù)為s2/n。假設(shè)n趨近於無限大,則s2/n趨近於0 ,因此
16、 具有一致性。 .第四節(jié) 估計式 (8)例子10例子7中的X1、Y1、Y2能否具有一致性?作法即使樣本數(shù)n再大,X1、Y1、Y2的變異數(shù)都不會改變,當然也不會趨近於0。換句話說,樣本數(shù)添加,並無助於X1、Y1、Y2趨近於母體平均數(shù),因此它們不具有一致性。 .第四節(jié) 估計式 (9)充分性令X1,Xn為隨機變項,其聯(lián)合機率函數(shù)為f(x1, , xn; q)。統(tǒng)計量 是q的充分統(tǒng)計式或具有充分性,假設(shè)且為假設(shè)f(x1, , xn; q) = g( ; q) h(x1, , xn)其中h(x1, , xn) 與q 無關(guān)。此時, 包含了一切從樣本資料來推估q的訊息,再也沒有其他剩餘的訊息了。固定充分統(tǒng)計量後,X1,Xn的條件機率就與q無關(guān)。 .第四節(jié) 估計式 (10)在二項式分佈中,樣本中勝利次數(shù)就是勝利機率p的充分統(tǒng)計量。其他的訊息例如這幾次試驗中,哪幾次是勝利,哪幾次是失敗。是無法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 超市銷售培訓總結(jié)
- 2025至2031年中國鍋爐循環(huán)變頻控制設(shè)備行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國柴油調(diào)節(jié)劑行業(yè)投資前景及策略咨詢研究報告
- 項目貸款融資協(xié)議書(2篇)
- 2025至2031年中國牛奶果行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國海運提單行業(yè)投資前景及策略咨詢研究報告
- 《跨境電商英語》課件- E-mail Writing
- 《跨境電商》課件-阿里巴巴國際站
- 《安裝工程計量與計價》課件-2.04-給排水工程量清單實例-識圖
- 2025至2031年中國光電式煙感探測器行業(yè)投資前景及策略咨詢研究報告
- 北京大學DeepSeek系列-DeepSeek與AIGC應用
- 2025年皖北衛(wèi)生職業(yè)學院單招職業(yè)適應性測試題庫必考題
- 電梯日管控、周排查、月調(diào)度內(nèi)容表格
- 切格瓦拉完整
- 往復式壓縮機組單機試運方案
- 硝酸鉀牙膏抗牙本質(zhì)敏感效果的循證分析
- 車輛清障救援合作協(xié)議
- 人教2011版小學數(shù)學四年級《乘法分配率》
- BM 帶小葉片的高壓比壓氣機葉輪設(shè)計BladeGen實例
- 輸變電工程建設(shè)管理程序指南
- 運營管理部績效考核表
評論
0/150
提交評論