第四章抽樣分布_第1頁
第四章抽樣分布_第2頁
第四章抽樣分布_第3頁
第四章抽樣分布_第4頁
第四章抽樣分布_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023/2/41第四章概率分布與抽樣2023/2/42第一節(jié)隨機(jī)變量的概率分布第二節(jié)大數(shù)定律與中心極限定理第三節(jié)統(tǒng)計(jì)量的抽樣分布(54張)第四章抽樣分布2023/2/43

學(xué)習(xí)目標(biāo)1.定義和解釋隨機(jī)變量及其概率分布2.計(jì)算隨機(jī)變量的概率和概率分布3.理解正態(tài)分布及其標(biāo)準(zhǔn)化問題;√4.理解大數(shù)定律和中心極限定理;5.掌握常用統(tǒng)計(jì)量的抽樣分布;√6.會(huì)用Excel計(jì)算常見分布的概率?!?023/2/44

重點(diǎn)與難點(diǎn)1.隨機(jī)變量概率分布意義的理解2.統(tǒng)計(jì)量抽樣分布的若干結(jié)論3.兩類極限定理的意義及其若干結(jié)論4.小樣本的精確分布2023/2/45第一節(jié)隨機(jī)變量的概率分布一、隨機(jī)變量的定義及其類型

1.隨機(jī)變量的定義

2.兩種類型的隨機(jī)變量二、隨機(jī)變量的概率分布

1.概率分布的含義及意義

2.離散型隨機(jī)變量的概率分布

3.連續(xù)型隨機(jī)變量的概率分布

4.隨機(jī)變量的分布函數(shù)三、幾種常見的概率分布

1.正態(tài)分布

2.小樣本的精確分布2023/2/46一、隨機(jī)變量的定義及其類型(一)隨機(jī)變量的定義在隨機(jī)試驗(yàn)中,若隨著試驗(yàn)結(jié)果的不同而隨機(jī)地取各種不同的數(shù)值,并且對取每一個(gè)數(shù)值或某一范圍內(nèi)的值都有相應(yīng)的概率,即對任意實(shí)數(shù),是隨機(jī)事件,且概率存在,則稱為一個(gè)隨機(jī)變量。(二)兩種類型的隨機(jī)變量(按取值的特點(diǎn)不同來劃分)1.離散型隨機(jī)變量2.連續(xù)型隨機(jī)變量

2023/2/471.離散型隨機(jī)變量

如果隨機(jī)變量的所有取值是有限個(gè)或都可以逐個(gè)列舉出來,則稱為離散型隨機(jī)變量。例如,擲骰子試驗(yàn)中“出現(xiàn)的點(diǎn)數(shù)”、質(zhì)量檢驗(yàn)中從一批產(chǎn)品里“取到次品的個(gè)數(shù)”等都是離散型隨機(jī)變量。2023/2/482.連續(xù)型隨機(jī)變量

如果隨機(jī)變量的取值不僅是無窮多個(gè),而是可取到某個(gè)區(qū)間或整個(gè)數(shù)軸上的一切值,不能夠無遺漏地一一列舉出來,則稱該隨機(jī)變量為連續(xù)型隨機(jī)變量。例如,一批電子元件的“使用壽命”、抽樣調(diào)查中的“測量誤差”等都是連續(xù)型隨機(jī)變量。2023/2/49二、隨機(jī)變量的概率分布(一)概率分布的含義及意義1.概率分布的含義隨機(jī)變量在其取值范圍內(nèi),取值與取值概率間一一對應(yīng)的關(guān)系,稱之為隨機(jī)變量的概率分布,簡稱分布。2.概率分布的意義描述隨機(jī)變量變化的統(tǒng)計(jì)規(guī)律。方便地計(jì)算任一事件發(fā)生的概率。2023/2/410(二)離散型隨機(jī)變量的概率分布

1.離散型隨機(jī)變量概率分布的兩種表現(xiàn)形式分布列(律)2.概率函數(shù)2023/2/411概率函數(shù)的數(shù)學(xué)性質(zhì)2023/2/412(三)連續(xù)型隨機(jī)變量的概率分布(1)

1.連續(xù)型隨機(jī)變量的表現(xiàn)方式--密度函數(shù)2023/2/413(三)連續(xù)型隨機(jī)變量的概率分布(2)2.密度函數(shù)的數(shù)學(xué)性質(zhì)3.事件“”發(fā)生的概率的計(jì)算方法2023/2/414(三)連續(xù)型隨機(jī)變量的概率分布(3)4.事件“”發(fā)生的概率的幾何意義5.連續(xù)型隨機(jī)變量的期望值和方差分別為2023/2/415(四)隨機(jī)變量的分布函數(shù)

1.分布函數(shù)的來源離散型隨機(jī)變量的分布用概率函數(shù)來描述,連續(xù)型隨機(jī)變量的分布用密度函數(shù)來描述,兩者形式不同,表現(xiàn)各異。為了更方便地表現(xiàn)隨機(jī)變量的分布,下面引入分布函數(shù)。

2.分布函數(shù)的定義2023/2/416分布函數(shù)的幾何意義及數(shù)學(xué)性質(zhì)1.幾何意義2.數(shù)學(xué)性質(zhì)2023/2/417隨機(jī)變量分布函數(shù)的具體表現(xiàn)2023/2/4182023/2/419(五)連續(xù)型隨機(jī)變量的概率分布1.密度函數(shù)的定義2023/2/420(六)常見的連續(xù)型隨機(jī)變量的分布---------

正態(tài)分布定義2023/2/421

正態(tài)分布正態(tài)分布的密度函數(shù)圖形是一條以均值為中心的對稱鐘型曲線2023/2/422

正態(tài)分布正態(tài)分布密度函數(shù)的數(shù)學(xué)性質(zhì)2023/2/423

正態(tài)分布參數(shù)和對曲線形態(tài)的影響2023/2/424標(biāo)準(zhǔn)正態(tài)分布及其重要意義2023/2/425

正態(tài)分布標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化法2023/2/426標(biāo)準(zhǔn)化法的幾何意義標(biāo)準(zhǔn)化變換實(shí)質(zhì)上是作了一個(gè)坐標(biāo)軸的平移和尺度變換,使正態(tài)分布的平均數(shù),標(biāo)準(zhǔn)差。2023/2/427

正態(tài)分布正態(tài)分布表及上側(cè)分位數(shù)2023/2/428

正態(tài)分布

準(zhǔn)則2023/2/429

正態(tài)分布(P118)(記住啦)準(zhǔn)則示意圖2023/2/430

正態(tài)分布正態(tài)分布的重要意義在隨機(jī)理論中,正態(tài)分布是最重要的一種分布,理由如下:⑴它是最常見的一種分布,現(xiàn)實(shí)中許多隨機(jī)變量服從或近似服從正態(tài)分布。⑵在一定的條件下,正態(tài)分布是其他分布的近似分布。⑶許多有用的分布,特別是小樣本的精確分布是由正態(tài)分布推導(dǎo)出來的。2023/2/431

小樣本的精確分布

1.分布由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來。2.分布也稱學(xué)生氏(Student)分布,是由哥塞特(W.S.Gosset)在1908年首次提出,其重要意義在于提供了小樣本研究方法。3.分布是由統(tǒng)計(jì)學(xué)家費(fèi)雪(R.A.Fisher)首次提出的。2023/2/432

分布--定義2023/2/433

分布--密度函數(shù)圖象

2023/2/434

分布--期望和方差及上側(cè)分位數(shù)

2023/2/435

分布--定義2023/2/436

分布--密度函數(shù)圖象2023/2/437

分布--期望和方差及上側(cè)分位數(shù)2023/2/438

分布的上側(cè)分位數(shù)2023/2/439

分布--定義2023/2/440

分布--密度函數(shù)圖象2023/2/441

分布--期望和方差2023/2/442

分布--上側(cè)分位數(shù)2023/2/443常見的概率分布在抽樣推斷中的作用2023/2/444第二節(jié)大數(shù)定律與中心極限定理p119一、大數(shù)定律1.切比雪夫大數(shù)定律2.貝努里大數(shù)定律二、中心極限定理1.林德貝格-勒維中心極限定理2.棣莫弗-拉普拉斯中心極限定理2023/2/445一、大數(shù)定律

大數(shù)定律又稱作大數(shù)法則,是關(guān)于“均值具有穩(wěn)定性”的一類定理。個(gè)別事物因偶然因素的影響而產(chǎn)生變異,有各自不同的表現(xiàn),但是,對總體進(jìn)行大量觀察后平均,就能使偶然因素的影響相互抵消,消除由個(gè)別偶然因素引起的極端性影響,從而使總體均值穩(wěn)定下來,反映出事物變化的一般規(guī)律。2023/2/446(一)切比雪夫大數(shù)定律2023/2/447(一)切比雪夫大數(shù)定律2023/2/448(二)貝努里大數(shù)定律

2023/2/449

二、中心極限定理

大數(shù)定律說明了當(dāng)樣本容量n充分大時(shí),樣本均值趨于總體均值,但并不等于總體均值,說明樣本推斷總體時(shí)存在誤差。若要控制推斷誤差,顯然須知樣本均值這一隨機(jī)變量的概率分布,可惜大數(shù)定律只提供了推斷方法,并未給出推斷誤差的概率分布。而中心極限定理正好彌補(bǔ)了大數(shù)定律的這一不足。2023/2/450(一)林德貝格-勒維中心極限定理2023/2/451(一)林德貝格-勒維中心極限定理2023/2/452(二)棣莫弗-拉普拉斯()

中心極限定理2023/2/453兩類極限定理的意義1.如果說大數(shù)定律是關(guān)于“均值具有穩(wěn)定性”的一類定律,它提供了樣本估計(jì)總體的方法,那么中心極限定理則是關(guān)于“估計(jì)誤差概率分布”的一類定理,它不僅提供了估計(jì)方法,而且還提供了控制估計(jì)誤差的方法。2.中心極限定理還揭示了正態(tài)分布形成的機(jī)制,即如果某一個(gè)量是許多隨機(jī)因素綜合影響迭加形成的,在這許多影響因素中沒有任何一個(gè)起著主導(dǎo)作用,那么這個(gè)量就是一個(gè)服從正態(tài)分布的正態(tài)隨機(jī)變量?;貧w模型中的隨機(jī)誤差項(xiàng)常假定服從正態(tài)分布,其依據(jù)便在于此。2023/2/454第三節(jié)統(tǒng)計(jì)量的抽樣分布

(重點(diǎn))p123-137一、抽樣方式二、樣本與統(tǒng)計(jì)量三、抽樣分布1.樣本均值的抽樣分布2.樣本方差的抽樣分布3.樣本成數(shù)的抽樣分布(大樣本情形)注意:

在學(xué)習(xí)下面內(nèi)容之前,同學(xué)們自己一定要去好好復(fù)習(xí)、理解隨機(jī)變量、概率、概率分布、隨機(jī)變量的分布函數(shù)、正態(tài)分布、正態(tài)分布標(biāo)準(zhǔn)化、t分布、參數(shù)、統(tǒng)計(jì)量等概念的涵義,會(huì)查表計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率。2023/2/4552023/2/456

第三節(jié)統(tǒng)計(jì)量的抽樣分布

一、抽樣方式

抽樣調(diào)查屬于非全面調(diào)查,抽樣的核心問題是如何保證樣本對總體具有充分的代表性。按是否根據(jù)已知概率抽選樣本單位,抽樣方式可分為概率抽樣和非概率抽樣;統(tǒng)計(jì)推斷主要采用概率推斷。按抽取樣本單位后是否放回,抽樣方式又可分為重置抽樣(放回)和不重置抽樣(不放回)。2023/2/457一、抽樣方式P123(一)概率抽樣概率抽樣是按照隨機(jī)原則進(jìn)行抽樣的方式,它不加任何主觀因素,組成總體的每個(gè)單位都有被抽中的概率,樣本對總體有很強(qiáng)的代表性。1.概率抽樣的優(yōu)點(diǎn)和不足概率抽樣的優(yōu)點(diǎn)有:(1)調(diào)查結(jié)果可以用來推斷總體;(2)能估算出并能控制抽樣誤差。概率抽樣的不足有:(1)在大多數(shù)案例中,相同規(guī)模的概率抽樣的費(fèi)用要比非概率抽樣高;(2)概率抽樣比非概率抽樣的技術(shù)要求高,需要更多的時(shí)間策劃和實(shí)施。2.常用的概率抽樣方法

(1)簡單隨機(jī)抽樣,又稱純隨機(jī)抽樣,它是抽樣前對總體不加任何分組、劃類、排隊(duì)等處理,完全隨機(jī)地抽取樣本單位的方法。(2)等距抽樣,又稱機(jī)械抽樣或系統(tǒng)抽樣,它是抽樣前將總體各單位按一定標(biāo)志或次序排隊(duì),然后按相等的距離抽取樣本單位的方法。(3)類型抽樣,又稱分類抽樣或分層抽樣,它是抽樣前將總體單位按其屬性特征分成若干類型或?qū)樱缓笤诟黝愋突驅(qū)又须S機(jī)抽取樣本單位的方法。(4)整群抽樣,又稱集團(tuán)抽樣,它是抽樣前將總體各單位按一定標(biāo)準(zhǔn)分成若干群或組,再從總體中隨機(jī)抽取一定數(shù)量的群或組,對抽中的群或組的所有單位進(jìn)行全面調(diào)查的方法。(5)多階段抽樣,又稱多級抽樣,它是將調(diào)查分成兩個(gè)或兩個(gè)以上的階段進(jìn)行抽樣的方法。第一階段先將總體按照一定的規(guī)范分成若干抽樣單位,稱之為一級抽樣單位,再把抽中的一級抽樣單位分成若干更小的二級抽樣單位,從抽中的二級抽樣單位再分三級抽樣單位,…,這樣就形成一個(gè)多階段抽樣過程。其特點(diǎn)是,當(dāng)一次抽樣不能得到樣本單位而總體又超大、復(fù)雜時(shí)使用。

在抽樣調(diào)查的實(shí)際工作中,經(jīng)常是要將幾種抽樣方法結(jié)合起來應(yīng)用。2023/2/459(二)非概率抽樣

非概率抽樣是按主觀意向進(jìn)行抽樣的方式,因組成總體的一部分單位沒有被抽中的機(jī)會(huì),故容易出現(xiàn)樣本對總體的系統(tǒng)性偏差。一般情況下,非概率抽樣得到的樣本不適宜推斷總體。1.非概率抽樣的特點(diǎn)非概率抽樣的優(yōu)點(diǎn)是簡單易行、成本低、省時(shí)間等,在操作上也比概率抽樣簡單。但由于無法排除抽樣者的主觀性,無法客觀地評價(jià)樣本的代表性,特別是不能計(jì)算和控制抽樣誤差,因此樣本不具有推論總體的性質(zhì)。非概率抽樣多用于探索性研究、預(yù)備性研究和總體邊界不清難于實(shí)施概率抽樣的研究。實(shí)際應(yīng)用時(shí),采用非概率抽樣的原因包括:(1)受客觀條件的限制,無法采用嚴(yán)格的概率抽樣方法;(2)調(diào)查時(shí)效性要求高,要迅速取得調(diào)查結(jié)果;(3)調(diào)查對象不確定或者無法確定;(4)總體各單位的標(biāo)志值差異不大,而且調(diào)查者有豐富的調(diào)查經(jīng)驗(yàn)等。因概率抽樣與非概率抽樣各有優(yōu)缺點(diǎn),且各有適宜使用的場合,故在實(shí)際應(yīng)用中,非概率抽樣往往與概率抽樣結(jié)合使用。2.常用的非概率抽樣方法常用的非概率抽樣方法包括方便抽樣、配額抽樣、判斷抽樣和滾雪球抽樣等。2023/2/461(三)重復(fù)抽樣和不重復(fù)抽樣1.重復(fù)抽樣又稱有放回抽樣,它是每次從總體中抽取一個(gè)單位,觀察記錄后又放回,再抽取下一個(gè)。因此,重復(fù)抽樣的樣本是由次相互獨(dú)立的連續(xù)試驗(yàn)所組成的,每次實(shí)驗(yàn)在相同條件下進(jìn)行,在整個(gè)抽樣過程中總體單位數(shù)始終不變,各單位被抽中的概率前后相等。2.不重復(fù)抽樣又稱無放回抽樣,它是每次從總體中抽取一個(gè)單位,觀察記錄后不放回,再抽取下一個(gè)。因此,不重復(fù)抽樣的樣本雖由次連續(xù)試驗(yàn)所組成,而實(shí)質(zhì)等于一次同時(shí)從總體中抽個(gè)單位組成一個(gè)樣本,每次實(shí)驗(yàn)不是相互獨(dú)立的,在整個(gè)抽樣過程中每抽一次總體單位就少一個(gè),各單位被抽中的概率前后不等,越往后被抽中的機(jī)會(huì)就越大。在實(shí)踐中當(dāng)總體單位數(shù)很大,樣本單位數(shù)相對較小時(shí),可以把不重復(fù)抽樣看成重復(fù)抽樣,這時(shí)的計(jì)算比較簡單。2023/2/462二、樣本與統(tǒng)計(jì)量

(一)簡單隨機(jī)樣本(二)參數(shù)、統(tǒng)計(jì)量參數(shù)(parameter)來描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等總體參數(shù)通常用希臘字母表示統(tǒng)計(jì)量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)出來的一些量,是樣本的函數(shù)。(統(tǒng)計(jì)量是隨機(jī)變量)。所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等樣本統(tǒng)計(jì)量通常用小寫英文字母來表示2023/2/464(三)常用統(tǒng)計(jì)量--12023/2/465(三)常用統(tǒng)計(jì)量

-22023/2/466(三)常用統(tǒng)計(jì)量-32023/2/467補(bǔ)充:三種不同性質(zhì)的分布P129

總體分布:總體中各元素的觀察值所形成的相對頻率分布。

樣本分布:一個(gè)樣本中各元素的觀察值所成的相對頻率分布。當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布。抽樣分布:樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對頻數(shù)分布2023/2/468補(bǔ)充:抽樣分布(第66-76張)①指樣本統(tǒng)計(jì)量的概率分布;②樣本統(tǒng)計(jì)量是樣本的函數(shù),依據(jù)不同的樣本計(jì)算出來的值是不同的所以統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等;③它的結(jié)果來自容量相同的所有可能樣本;④它提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 補(bǔ)充:樣本均值抽樣分布的形成過程【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體的均值、方差及分布如下:總體分布14230.1.2.3均值和方差

補(bǔ)充:現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))總體1、2、3、4樣本總體1、2、3、4

計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布P1853.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值()樣本均值的抽樣分布樣本均值所有可能取值2023/2/472補(bǔ)充:樣本均值的抽樣分布形式(樣本均值的分布與總體分布的比較)

=2.5why?σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)總體分布14230.1.2.3的抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)(記住,已知)2023/2/474中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機(jī)變量取值的分散程度。方差越小,隨機(jī)變量的取值越集中在期望值附近。)

重復(fù)抽樣不重復(fù)抽樣補(bǔ)充:樣本均值抽樣分布的特征(數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論