計(jì)算機(jī)數(shù)據(jù)庫(kù)抽樣分布隨堂_第1頁(yè)
計(jì)算機(jī)數(shù)據(jù)庫(kù)抽樣分布隨堂_第2頁(yè)
計(jì)算機(jī)數(shù)據(jù)庫(kù)抽樣分布隨堂_第3頁(yè)
計(jì)算機(jī)數(shù)據(jù)庫(kù)抽樣分布隨堂_第4頁(yè)
計(jì)算機(jī)數(shù)據(jù)庫(kù)抽樣分布隨堂_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2023/5/121第五章抽樣分布第一節(jié)抽樣分布的基本問(wèn)題第二節(jié)抽樣分布第三節(jié)一些重要的結(jié)論第四節(jié)幾種常用的抽樣組織方式第1頁(yè),共37頁(yè)。第一節(jié)抽樣分布的基本問(wèn)題2023/5/122第五章抽樣分布第2頁(yè),共37頁(yè)。一、抽樣調(diào)查的概念及應(yīng)用

(一)抽樣的概念

抽樣是從所研究的總體中隨機(jī)地抽取其中一部分總體單位的過(guò)程。抽得的部分總體單位稱為樣本。其基本要求是要保證所抽取的樣本對(duì)總體具有充分的代表性。抽樣的目的是從被抽取的樣本出發(fā),分析推斷總體的特征。

(二)抽樣的應(yīng)用1.當(dāng)不能采用全面調(diào)查了解總體的信息時(shí),可以采用抽樣做出對(duì)總體特征的推斷。2.當(dāng)某些場(chǎng)合沒(méi)有必要采用全面調(diào)查時(shí),可以利用抽樣調(diào)查做出推斷。3.抽樣調(diào)查可以輔助檢驗(yàn)普查獲得的結(jié)果的準(zhǔn)確程度。2023/5/123第3頁(yè),共37頁(yè)。二、抽樣的有關(guān)概念

(一)總體和樣本1.總體:是指所研究對(duì)象的全體,是由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成。2.樣本:是從總體中抽取部分總體單位構(gòu)成的集合,是總體的一部分。(二)參數(shù)和統(tǒng)計(jì)量1.參數(shù):也稱總體參數(shù),是反映總體數(shù)量特征的指標(biāo)。2.統(tǒng)計(jì)量:也稱樣本統(tǒng)計(jì)量,是不含任何總體參數(shù)的樣本函數(shù)。2023/5/124第4頁(yè),共37頁(yè)。二、抽樣的有關(guān)概念

(三)抽樣方法

(四)抽樣方法隨機(jī)誤差是指在抽樣中遵循了隨機(jī)原則,樣本指標(biāo)與相應(yīng)的待推斷的總體實(shí)際指標(biāo)之間的偏差。也稱抽樣誤差。誤差的平均值:2023/5/125抽樣方法不重復(fù)抽樣重復(fù)抽樣從總體中抽取一個(gè)樣本單位,記錄其標(biāo)志值后,又將其放回總體中并繼續(xù)參加下一輪樣本單位抽取,如此反復(fù),直至抽足樣本所需的所有樣本單位數(shù)目為止。每次從總體中抽取一個(gè)樣本單位,記錄其標(biāo)志值并且不放回總體參加下一輪樣本單位抽樣,直至抽足樣本所需的所有樣本單位數(shù)目為止。第5頁(yè),共37頁(yè)。第二節(jié)抽樣分布2023/5/126第五章抽樣分布第6頁(yè),共37頁(yè)。一、抽樣分布的概念抽樣分布即指樣本統(tǒng)計(jì)量的分布。從一個(gè)總體中可以抽取許多個(gè)樣本,統(tǒng)計(jì)量是關(guān)于樣本的函數(shù),所以統(tǒng)計(jì)量是隨樣本變化而變化的隨機(jī)變量,樣本統(tǒng)計(jì)量的全部可能取值及其相應(yīng)的概率分布就是(統(tǒng)計(jì)量的)抽樣分布。常用的抽樣分布有樣本平均數(shù)的抽樣分布、樣本比例的抽樣分布、樣本方差的抽樣分布。

2023/5/127第7頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布樣本平均數(shù)的抽樣分布即由總體中全部樣本平均數(shù)的可能取值及與之對(duì)應(yīng)的概率組成。

2023/5/128圖5-4樣本均值抽樣分布的形成過(guò)程第8頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布

(一)

的數(shù)學(xué)期望即所有可能的平均值(二)的方差

(三)抽樣分布的形態(tài)樣本容量越大,的抽樣分布與正態(tài)分布近似程度越高。(四)的抽樣平均誤差2023/5/129第9頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布

(五)修正系數(shù)如果是有限總體且不重復(fù)抽樣,那么樣本方差和平均數(shù)的抽樣平均誤差公式要做一定的修正,修正系數(shù)為。(六)標(biāo)準(zhǔn)化變換標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)記為,即:三個(gè)性質(zhì):1.2.3.2023/5/1210第10頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布2023/5/1211總體的分布的抽樣分布(n=30)的抽樣分布(n=5)的抽樣分布(n=2)不同樣本容量下的抽樣分布第11頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布

【例5-3】2013年我國(guó)汽車行業(yè)持續(xù)發(fā)展,政府為了調(diào)查北京某一地區(qū)私家車市場(chǎng)情況,從該地區(qū)的車主中隨機(jī)抽取200人做樣本。(1)假設(shè)該地區(qū)私家車平均價(jià)格為18.5萬(wàn)元,總體標(biāo)準(zhǔn)差等于4萬(wàn)元,試描述的抽樣分布,并計(jì)算其抽樣平均誤差;(2)大于18萬(wàn)元且小于19萬(wàn)元的概率是多少?(3)如果總體方差未知,那么的抽樣分布是怎樣的?2023/5/1212第12頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布解:已知,,(1)根據(jù)中心極限定理,大樣本且總體方差已知時(shí),的抽樣分布是正態(tài)分布,且,,故抽樣平均誤差

(2)

(3)如果總體方差未知,則的抽樣分布將服從t分布。2023/5/1213第13頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布【例5-4】我國(guó)第一艘航母“遼寧號(hào)”航母標(biāo)準(zhǔn)排水量55000噸。假設(shè)在某次任務(wù)中規(guī)定某型號(hào)艦載機(jī)載20架,總重量不得超過(guò)700噸,同時(shí)假定每架艦載機(jī)的重量服從正態(tài)分布,平均重量32噸,標(biāo)準(zhǔn)差為5噸,問(wèn)隨機(jī)停放在航母上20架該型號(hào)艦載機(jī),超重的概率為多少?2023/5/1214第14頁(yè),共37頁(yè)。二、樣本平均數(shù)的抽樣分布解:已知,,因?yàn)橐?guī)定中要求最大載重量為700噸,限載20架。所以,如果樣本平均數(shù)則會(huì)超重。由于總體服從正態(tài)分布,總體方差已知,當(dāng)小樣本時(shí),根據(jù)中心極限定理,的抽樣分布仍服從正態(tài)分布。即

,則隨機(jī)停放20架該型號(hào)艦載機(jī)超重的概率是

因此,超重的概率不超過(guò)0.4%。2023/5/1215第15頁(yè),共37頁(yè)。三、樣本比例p

的抽樣分布由概率論知識(shí)我們有以下結(jié)論:當(dāng)樣本容量足夠大時(shí),樣本比率p的抽樣分布近似服從正態(tài)分布。其大樣本的標(biāo)準(zhǔn)是:同時(shí)滿足或的n為大樣本標(biāo)準(zhǔn),如果總體比率P未知,可用樣本比率p代替。(一)p的數(shù)學(xué)期望和方差

(二)p的抽樣分布的形態(tài)

(三)p的抽樣平均誤差

(四)修正系數(shù)

(五)標(biāo)準(zhǔn)化變換

2023/5/1216第16頁(yè),共37頁(yè)。三、樣本比例p

的抽樣分布

【例5-5】根據(jù)以往的經(jīng)驗(yàn),某科目學(xué)生考試通過(guò)率為90%。現(xiàn)從該科目的考生中隨機(jī)抽取200人進(jìn)行檢驗(yàn),問(wèn)樣本通過(guò)率不低于85%的概率是多少?

解:已知P=90%,n=200根據(jù)中心極限定理有

樣本合格率不低于85%的概率,即求

的概率。樣本通過(guò)率不低于85%的概率約為99.1%。

2023/5/1217第17頁(yè),共37頁(yè)。四、樣本方差的抽樣分布由概率論知識(shí)可以證明,關(guān)于樣本方差的統(tǒng)計(jì)量:

分布的特點(diǎn)是,隨機(jī)變量的取值范圍是,其分布的形態(tài)是一個(gè)非對(duì)稱分布,并依賴于自由度。

我們可以通過(guò)查分布表,求出給定的自由度下某一設(shè)定的上側(cè)面積對(duì)應(yīng)的臨界值,或通過(guò)計(jì)算機(jī)得到相關(guān)的結(jié)果。2023/5/1218第18頁(yè),共37頁(yè)。第三節(jié)一些重要的結(jié)論2023/5/1219第五章抽樣分布第19頁(yè),共37頁(yè)。一、大數(shù)定律兩種主要的表述形式:

2023/5/1220(一)獨(dú)立同分布大數(shù)定律(二)伯努利大數(shù)定數(shù)第20頁(yè),共37頁(yè)。二、正態(tài)分布的再生定理如果都是服從的獨(dú)立隨機(jī)變量,那么其線性組合也服從正態(tài)分布

其均值為方差為

2023/5/1221第21頁(yè),共37頁(yè)。三、中心極限定理的推廣

【例5-6】為了比較2013年7月份北京和沈陽(yáng)兩市城區(qū)新建住宅價(jià)格情況,獨(dú)立地從兩市城區(qū)抽取的樣本容量分別為:北京100套,沈陽(yáng)120套。假設(shè)兩市城區(qū)新建住宅價(jià)格服從正態(tài)分布,且北京市城區(qū)新建住宅價(jià)格為3萬(wàn)元/平方米,標(biāo)準(zhǔn)差為0.8萬(wàn)元;沈陽(yáng)市城區(qū)新建住宅價(jià)格為1.2萬(wàn)元/平方米,標(biāo)準(zhǔn)差為0.6萬(wàn)元。

(1)描述兩個(gè)樣本平均數(shù)之差的抽樣分布;

(2)兩個(gè)樣本平均數(shù)之差在1.5~2萬(wàn)元之間的概率。

2023/5/1222第22頁(yè),共37頁(yè)。三、中心極限定理的推廣

解:已知

(1)設(shè)

分別表示兩個(gè)樣本的平均數(shù),則有即

即兩個(gè)樣本平均數(shù)之差的抽樣分布服從正態(tài)分布。

(2)兩個(gè)樣本平均數(shù)之差在1.5~2萬(wàn)元之間的概率

2023/5/1223第23頁(yè),共37頁(yè)。第四節(jié)幾種常用的抽樣組織方式2023/5/1224第五章抽樣分布第24頁(yè),共37頁(yè)。一、類型抽樣

(一)平均數(shù)的抽樣平均誤差1.重復(fù)抽樣式中,為第i組平均數(shù)的平均組內(nèi)方差。平均組內(nèi)方差的計(jì)算公式為式中,為第i

組的組內(nèi)方差.2.不重復(fù)抽樣準(zhǔn)確的抽樣誤差公式是2023/5/1225第25頁(yè),共37頁(yè)。一、類型抽樣【例5-7】某制造企業(yè)有生產(chǎn)部、銷售部、技術(shù)部和物流部四個(gè)主要部門(mén),現(xiàn)對(duì)這四個(gè)部門(mén)員工的月收入進(jìn)行抽樣調(diào)查,按20%的比例總共抽取50戶進(jìn)行調(diào)查,結(jié)果如表5-5所示。計(jì)算樣本平均月收入及其標(biāo)準(zhǔn)差。2023/5/1226部門(mén)員工總數(shù)

抽樣人數(shù)

抽樣平均月收入(元)平均月收入方差(元2)生產(chǎn)售部60123800100技術(shù)部102300020物流部306290040總計(jì)25050

表5-5各部門(mén)員工月收入表第26頁(yè),共37頁(yè)。一、類型抽樣解:樣本平均數(shù)和方差分別是因此,抽樣樣本平均數(shù)的標(biāo)準(zhǔn)差為2023/5/1227第27頁(yè),共37頁(yè)。一、類型抽樣

(二)比率的抽樣平均誤差1.重復(fù)抽樣式中,為比例的平均組內(nèi)方差。比例的平均組內(nèi)方差的計(jì)算公式為式中,為第i組比例各組的組內(nèi)方差。2.不重復(fù)抽樣同平均數(shù)的不重復(fù)抽樣誤差一樣,首先要對(duì)各個(gè)組的組內(nèi)方差進(jìn)行修正,然后計(jì)算抽樣誤差。公式為2023/5/1228第28頁(yè),共37頁(yè)。二、等距抽樣

(一)無(wú)關(guān)標(biāo)志排序1.平均數(shù)抽樣平均誤差重復(fù)抽樣時(shí),公式如下:不重復(fù)抽樣時(shí),公式如下:

2.比例抽煙平均誤差重復(fù)抽樣時(shí),公式如下:不重復(fù)抽樣時(shí),公式如下:(二)有關(guān)標(biāo)志排序法按照與調(diào)查項(xiàng)目的數(shù)量多少有關(guān)系的標(biāo)志排序。2023/5/1229第29頁(yè),共37頁(yè)。二、等距抽樣【例5-8】某西部地區(qū)為繼續(xù)加快經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變,現(xiàn)在調(diào)查該地,對(duì)該地區(qū)20萬(wàn)居民采用按街區(qū)每隔1000戶抽取1戶的等距抽樣方法進(jìn)行抽樣,共調(diào)查了200戶,得到如下資料。試計(jì)算樣本平均年收入及標(biāo)準(zhǔn)差。

解:樣本平均年收入樣本的標(biāo)準(zhǔn)差樣本平均的標(biāo)準(zhǔn)差2023/5/1230人均年收入(萬(wàn)元)3以下3~55~77~99以上戶數(shù)1040806010表5-6居民人均年收入情況第30頁(yè),共37頁(yè)。三、整群抽樣首先將總體分為若干群,然后一群一群地抽選,每一群中包含若干個(gè)總體單位。

整群抽樣的抽樣誤差受三個(gè)因素的影響:第一,抽出的群數(shù)多少。顯然抽出的群數(shù)越多,抽樣誤差越小。第二,群間方差。要注意,在整群抽樣時(shí),無(wú)論群內(nèi)方差多大,都不影響抽樣誤差。因?yàn)閷?duì)每一個(gè)群來(lái)說(shuō),進(jìn)行的是全面調(diào)查,不發(fā)生抽樣誤差問(wèn)題。當(dāng)然群間方差的大小是會(huì)影響抽樣誤差的,顯然,群間方差越大,抽樣誤差也越大。第三,抽樣方法。整群抽樣采用的是不重復(fù)抽樣方法。因此,在計(jì)算抽樣誤差時(shí)要對(duì)系數(shù)做相應(yīng)的調(diào)整。2023/5/1231第31頁(yè),共37頁(yè)。三、整群抽樣設(shè)總體的全部N個(gè)單位被劃分為R群,現(xiàn)在從總體r群中隨機(jī)抽取群組成樣本,樣本容量是n。(一)平均數(shù)的抽樣誤差平均數(shù)的抽樣誤差的計(jì)算公式為式中,為平均數(shù)的群間方差:其中,為總體中各群的平均數(shù);為總體的總平均數(shù)??傮w的群間方差有時(shí)是沒(méi)有的,必要時(shí)可以用樣本的群間方差的資料來(lái)代替,即

2023/5/1232第32頁(yè),共37頁(yè)。三、整群抽樣(二)比例的抽樣誤差比例的抽樣誤差的計(jì)算公式為

式中,

為平均數(shù)的群間方差:其中,為總體中各群的比例;為總體的比率??傮w的群間方差有時(shí)是沒(méi)有的,必要時(shí)可以用樣本的群間方差的資料來(lái)代替,即:

2023/5/1233第

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論