管理統(tǒng)計(jì)學(xué)之抽樣與抽樣分布_第1頁(yè)
管理統(tǒng)計(jì)學(xué)之抽樣與抽樣分布_第2頁(yè)
管理統(tǒng)計(jì)學(xué)之抽樣與抽樣分布_第3頁(yè)
管理統(tǒng)計(jì)學(xué)之抽樣與抽樣分布_第4頁(yè)
管理統(tǒng)計(jì)學(xué)之抽樣與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩78頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

管理統(tǒng)計(jì)學(xué)畢德春遼東學(xué)院信息技術(shù)學(xué)院第6章

抽樣與抽樣分布第1節(jié)抽樣方法第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1總體(population)所研究的全部個(gè)體(數(shù)據(jù))的集合,其中的每一個(gè)元素稱(chēng)為個(gè)體,總體中所包含的元素?cái)?shù)量多少稱(chēng)為總體容量,用N表示。有限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的1無(wú)限總體無(wú)限總體所包括的元素是無(wú)限的,不可數(shù)的2第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1什么才是好的抽樣?有足夠的代表性符合統(tǒng)計(jì)學(xué)基本原理具有充分的可操作性有效率的實(shí)施/執(zhí)行中的偏差越小越好從理論上講,樣本數(shù)越大,抽樣誤差越小,結(jié)果的代表性越好。但是,同時(shí)考慮費(fèi)用和時(shí)間因素,大樣本量不一定是最有效率的辦法。在隨機(jī)抽樣條件下,不同樣本規(guī)模的抽樣誤差如下:

第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1樣本量的選取置信度樣本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%樣本(sample)從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素?cái)?shù)目稱(chēng)為樣本容量,用n表示。第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1=<30小樣本>30大樣本參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值,所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等,總體參數(shù)通常用希臘字母表示。第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1πμσ總體均值標(biāo)準(zhǔn)差總體比例統(tǒng)計(jì)量(statistic)用來(lái)描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一些量,是樣本的函數(shù),所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等,樣本統(tǒng)計(jì)量通常用小寫(xiě)英文字母表示。第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1pxs樣本均值樣本標(biāo)準(zhǔn)差樣本比例總體參數(shù)樣本統(tǒng)計(jì)量第6章第1節(jié)

抽樣方法關(guān)于抽樣的基礎(chǔ)概念1抽樣推斷的過(guò)程抽樣方法概率抽樣非概率抽樣多階段抽樣整群抽樣系統(tǒng)抽樣自愿抽樣配額抽樣簡(jiǎn)單隨機(jī)抽樣分層抽樣方便抽樣判斷抽樣滾雪球抽樣抽樣第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2概率抽樣非概率抽樣概率抽樣也稱(chēng)隨機(jī)抽樣,是按照隨機(jī)原則抽選樣本的抽樣方式,抽樣時(shí)每個(gè)樣本單位被選中的概率是已知。不滿(mǎn)足概率抽樣要求的抽樣都被歸為非概率抽樣。非概率抽樣單個(gè)單位被選中的概率是不可知的簡(jiǎn)單隨機(jī)抽樣樣(SimpleRandomSampling)也稱(chēng)純隨機(jī)抽樣。直接從總體體單位中抽選選樣本單位,,每個(gè)個(gè)體被被選入樣本的的概率都相等等??煞譃橛蟹呕睾蜔o(wú)放回兩種方式。是最基本的抽抽樣方法,許多抽樣方方法都是在它它的基礎(chǔ)上發(fā)發(fā)展起來(lái)的。。其數(shù)學(xué)性質(zhì)質(zhì)簡(jiǎn)單,理論論也最為成熟熟。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2整群抽樣(ClusterSampling)先將總體分為為R個(gè)群(即次級(jí)級(jí)單位或子總總體),每個(gè)個(gè)群包含若干干總體單位。。按某種方式式從中隨機(jī)抽抽取r個(gè)群,然后對(duì)對(duì)抽中的群的的所有單位都都進(jìn)行調(diào)查的的抽樣方式。??傮w分成4個(gè)群隨機(jī)選擇2個(gè)群構(gòu)成樣本本第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2多階段抽樣先從總體中隨隨機(jī)地抽取若若干初級(jí)單位位,再?gòu)某跫?jí)級(jí)單位中抽取取若干二級(jí)單單位,……如此下去直至至抽取所要調(diào)調(diào)查的基本單單位的抽樣方方法。例:[統(tǒng)計(jì)年鑒2004指出]2003年人口變動(dòng)情情況抽樣調(diào)查查是以全國(guó)為為總體,各省省、自治區(qū)、、直轄市為次次總體,采用用分層、等距距、整群抽樣樣方法,在全全國(guó)31個(gè)省、自治區(qū)區(qū)、直轄市抽抽取了990個(gè)縣(市、區(qū))、3734個(gè)鄉(xiāng)(鎮(zhèn)、街道)、6544個(gè)調(diào)查小區(qū)的的126萬(wàn)人。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2分層抽樣(StratifiedSampling)也稱(chēng)分類(lèi)抽樣樣或類(lèi)型抽樣樣。即先將總總體所有單位位按某種標(biāo)志志劃分為若干干層,然后從從各層中隨機(jī)機(jī)抽取一定數(shù)數(shù)目的單位構(gòu)構(gòu)成樣本,根根據(jù)各層樣本本匯總對(duì)總體體指標(biāo)作出估估計(jì)的一種抽抽樣方式。男生女生樣本第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2例:一個(gè)單位的職職工有500人,其中不不到35歲的有125人,35~49歲的有280人,50歲以上的有有95人。為了了了解該單位位職工年齡齡與身體狀狀況的有關(guān)關(guān)指標(biāo),從從中抽取100名職工作為為樣本,應(yīng)應(yīng)該怎樣抽抽?。康?章第1節(jié)

抽樣方法關(guān)于抽樣的方法2分析:這總體具有有某些特征征,它可以以分成幾個(gè)個(gè)不同的部部分:不到到35歲;35~49歲;50歲以上,把把每一部分分稱(chēng)為一個(gè)個(gè)層,因此此該總體可可以分為3個(gè)層。由于于抽取的樣樣本為100,所以必須須確定每一一層的比例例,在每一一個(gè)層中實(shí)實(shí)行簡(jiǎn)單隨隨機(jī)抽樣。。解:抽取人數(shù)與與職工總數(shù)數(shù)的比是100:500=1:5,則各年齡齡段(層))的職工人人數(shù)依次是是125:280:95=25:56:19,然后分別別在各年齡齡段(層))運(yùn)用簡(jiǎn)單單隨機(jī)抽樣樣方法抽取取。答:在分層抽樣樣時(shí),不到到35歲、35~49歲、50歲以上的三三個(gè)年齡段段分別抽取取25人、56人和19人。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法219系統(tǒng)抽樣也也稱(chēng)等距抽抽樣(SystematicSampling)將總體N個(gè)單位按某某種順序排排列,按規(guī)規(guī)則確定一一個(gè)隨機(jī)起起點(diǎn),再每每隔一定間間隔逐個(gè)抽抽取樣本單單位的抽樣樣方法。直線等距抽抽樣:將總體分成成n個(gè)組,每組組有k=N/n個(gè)單位。在第一組隨隨機(jī)選擇一一個(gè)單位,,之后每隔隔k個(gè)選擇一個(gè)個(gè)。N=64n=8k=8第一組第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2例:一個(gè)禮堂有30排座位,每每排有40個(gè)座位。一一次報(bào)告會(huì)會(huì)禮堂坐滿(mǎn)滿(mǎn)了聽(tīng)眾。。會(huì)后為聽(tīng)聽(tīng)取意見(jiàn)留留下了座位位號(hào)為20的30名聽(tīng)眾進(jìn)行行座談。這這里選用了了哪種抽取取樣本的方方法?寫(xiě)出出抽取過(guò)程程。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2由于每排的座位有40個(gè),各排每個(gè)號(hào)碼被抽取的概率都是,第1排被抽取前,其他各排中各號(hào)碼被抽取哪率也是,也就是說(shuō)被抽取的概率是,每排的抽樣也是簡(jiǎn)單隨機(jī)抽樣,因此這種抽樣的方法是系統(tǒng)抽樣。方便抽樣(Conveniencesampling)純粹以方便便基本著眼眼的抽樣方方法,事先先不預(yù)定樣樣本,碰到到即問(wèn)或被被調(diào)查者主主動(dòng)回答問(wèn)問(wèn)題。又稱(chēng)稱(chēng)便利抽樣、偶遇抽樣。例:在街頭的攔攔截式訪問(wèn)問(wèn)。登在報(bào)刊、、網(wǎng)上的問(wèn)問(wèn)卷。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2判斷抽樣(JudgmentSampling)調(diào)查者根據(jù)據(jù)主觀經(jīng)驗(yàn)和和判斷從總體中選選取有代表表性的單位位構(gòu)成樣本本。精度取決于于抽樣者的的經(jīng)驗(yàn)。不能獲得估估計(jì)值的精精度。適用于總體體單位極不不相同而樣樣本容量又又很小的情情況第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2配額抽樣(Quotasampling)是非隨機(jī)抽抽樣方法中中最常用的的一種抽樣樣方法。分分為兩個(gè)步步驟:根據(jù)研究人人員認(rèn)為較較重要的一一些變量把把總體單位位分類(lèi),指指定每一類(lèi)類(lèi)中的定額額;然后在每一一類(lèi)中使用用方便抽樣樣或判斷抽抽樣的方法法抽選指定定數(shù)量的樣樣本單位。。問(wèn)題:與分分層抽樣的的區(qū)別?第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2雪球抽樣也譯為為滾雪球抽抽樣(SnowballSampling)其原理是先先找到最初初的樣本單單位,然后后根據(jù)他們們提供的信信息去獲得得新的樣本本單位;這這種過(guò)程不不斷繼續(xù),,直到完成成規(guī)定的樣樣本容量為為止。主要要用于對(duì)稀稀少群體的的調(diào)查。例:某研究部門(mén)門(mén)在調(diào)查保保姆問(wèn)題時(shí)時(shí),先訪問(wèn)問(wèn)了7名保姆,然然后再請(qǐng)她她們提供其其他保姆名名單,逐步步擴(kuò)大到近近百人。第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2在下列問(wèn)題中中,各采用用什么抽樣樣方法抽取取樣本較合合適?從20臺(tái)電腦中抽抽取4臺(tái)進(jìn)行質(zhì)量量檢測(cè);從2004名同學(xué)中,,抽取一個(gè)個(gè)容量為20的樣本某中學(xué)有180名教工,其其中業(yè)務(wù)人人員136名,管理人人員20名,后勤人人員24名,從中抽抽取一個(gè)容容量為15的樣本。簡(jiǎn)單抽樣系統(tǒng)抽樣分層抽樣第6章第1節(jié)

抽樣方法關(guān)于抽樣的方法2抽樣調(diào)查中的誤差抽樣誤差非抽樣誤差計(jì)量誤差抽樣框誤差無(wú)回答誤差第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3誤差是指估計(jì)值值與真實(shí)值值之間的差差異。抽樣樣誤誤差差((Samplingerror)::由于于抽抽選選樣樣本本的的隨隨機(jī)機(jī)性性造造成成的的誤誤差差,,也也稱(chēng)稱(chēng)為為代表表性性誤誤差差。樣本本只只是是總總體體的的一一部部分分,,它它對(duì)對(duì)總總體體的的代代表表性性存存在在局局限限性性,,從從而而會(huì)會(huì)造造成成誤誤差差。。在在抽抽樣樣調(diào)調(diào)查查中中,,抽抽樣樣誤誤差差就就不不可可避避免免。。在概率抽抽樣中抽抽樣誤差差是能夠夠計(jì)量且且可以得得到控制制的。影響抽樣樣誤差的的主要因因素包括括:總體內(nèi)部部的差異異程度;;樣本容容量的大大??;抽抽樣的方方式方法法等。第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3非抽樣誤誤差(Nonsamplingerror)除抽樣誤誤差以外外的所有有誤差。。通常認(rèn)認(rèn)為是由由于調(diào)查程序序執(zhí)行中中的錯(cuò)誤誤與不足足引起的。。主要包括括抽樣框框誤差、、無(wú)回答答誤差和和計(jì)量誤誤差。國(guó)內(nèi)也稱(chēng)稱(chēng)為“工工作誤差差”或或“調(diào)查查誤差””。第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3在抽樣調(diào)調(diào)查中可可以把總總體分成成若干個(gè)個(gè)互不重重疊又窮窮盡的有有限個(gè)部部分,每每個(gè)部分分稱(chēng)為一一個(gè)抽樣單位位(Samplingunit)。抽樣單位位可以是是一個(gè)總總體單位位,也可可以包含含多個(gè)個(gè)個(gè)體。抽樣單位位的名單單稱(chēng)為抽樣框((SamplingFrame)。抽樣框框應(yīng)盡可可能與目目標(biāo)總體體相一致致。例如如名單抽樣樣框、區(qū)域抽樣樣框、時(shí)間表抽抽樣框。第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3大學(xué)學(xué)生生花名冊(cè)冊(cè)、城市市黃頁(yè)里里的電話話列表、、工商企企業(yè)名錄錄、街道道派出所所里居民民戶(hù)籍冊(cè)冊(cè)、意向向購(gòu)房人人信息冊(cè)冊(cè)……。例:要從10000名職工中中抽出200名組成一一個(gè)樣本本,抽樣樣框是什什么?10000名職工的的名冊(cè)第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3抽樣框誤誤差(samplingframeerror,CoverageError)當(dāng)目標(biāo)總總體與抽抽樣框所所涵蓋的的元素不不一致時(shí)時(shí),就會(huì)會(huì)產(chǎn)生抽抽樣誤差差。抽樣框誤誤差包括括:丟失目標(biāo)標(biāo)總體單單位、包含非目目標(biāo)總體體單位,復(fù)合連接接等。第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3案例:《文學(xué)摘要要》民意測(cè)驗(yàn)驗(yàn)1936年美國(guó)總總統(tǒng)選舉舉F.D.Roosevelt(羅斯福))任美國(guó)國(guó)總統(tǒng)的的第一任任期屆滿(mǎn)滿(mǎn)(民主黨)A.Landon(蘭登)Kansas州州長(zhǎng)(共和黨黨)經(jīng)濟(jì)背背景::國(guó)家正正努力力從大大蕭條條中恢恢復(fù),,失業(yè)業(yè)人數(shù)數(shù)高達(dá)達(dá)九百百萬(wàn)人人。TheliteraryDigest《文學(xué)摘摘要》進(jìn)行民民意測(cè)測(cè)驗(yàn),,將問(wèn)問(wèn)卷郵郵寄給給一千千萬(wàn)人人,他他們的的名字字和地地址摘摘自電電話簿簿或俱俱樂(lè)部部會(huì)員員名冊(cè)冊(cè)。其其中240萬(wàn)人寄回答答案((回收收率24%)。預(yù)測(cè)結(jié)結(jié)果:Roosevelt43%,Landon57%競(jìng)選結(jié)結(jié)果::Roosevelt62%,Landon38%主要原原因::選擇偏偏倚——將一類(lèi)類(lèi)人排排除在在外((當(dāng)時(shí)時(shí)四個(gè)個(gè)家庭庭中,,只有有一家家安裝裝電話話)不回答答偏倚倚——低收入入和高高收入入的人人傾向向不回答抽樣總總體目標(biāo)總總體第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差31936年美國(guó)國(guó)總統(tǒng)統(tǒng)競(jìng)選選(Gallup的預(yù)測(cè)測(cè))樣本容容量3000人,在《摘要》公布其其預(yù)測(cè)測(cè)結(jié)果果之前前,僅僅以一一個(gè)百百分位位數(shù)的的誤差差預(yù)言言了《摘要》的預(yù)測(cè)測(cè)結(jié)果果。方法::從《摘要》要用的的名單單中隨隨機(jī)選選取3000人,并并給他他們每每人寄寄去一一張明明信片片,詢(xún)?cè)儐?wèn)他他們打打算怎怎樣投投票。。大樣本本并不不能防防止偏偏倚::當(dāng)抽樣樣框不不正確確時(shí),,抽取取一個(gè)個(gè)大的的樣本本并無(wú)無(wú)幫助助,它它只不不過(guò)是是在較較大的的規(guī)模模下,,去重重復(fù)基基本錯(cuò)錯(cuò)誤。。利用一一個(gè)約約5萬(wàn)人的樣本本,正正確地地預(yù)測(cè)測(cè)了Roosevelt的勝利利。

Roosevelt的百分?jǐn)?shù)蓋洛普預(yù)言《摘要》的預(yù)測(cè)結(jié)果44《摘要》預(yù)測(cè)的選舉結(jié)果43

Roosevelt的百分?jǐn)?shù)蓋洛普預(yù)測(cè)的選舉結(jié)果56選舉結(jié)果62第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3無(wú)回答答誤差差((NonresponseError)因缺失部分指指定樣樣本單單位的的數(shù)據(jù)據(jù)或調(diào)調(diào)查問(wèn)問(wèn)卷中中的部部分?jǐn)?shù)數(shù)據(jù)項(xiàng)項(xiàng)而引引起的的誤差差都稱(chēng)稱(chēng)為無(wú)回答答誤差差。樣本個(gè)個(gè)體拒拒絕訪訪問(wèn)樣本個(gè)個(gè)體無(wú)無(wú)法接接受訪訪問(wèn)樣本個(gè)個(gè)體拒拒絕回回答部部分問(wèn)問(wèn)題第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3計(jì)量誤誤差((MeasurementError)是指調(diào)調(diào)查中中獲得得的數(shù)數(shù)據(jù)與與調(diào)查查項(xiàng)目目真實(shí)實(shí)值之之間不不一致致而產(chǎn)產(chǎn)生的的誤差差,也也稱(chēng)稱(chēng)為登記性性誤差差。測(cè)量工工具不不準(zhǔn)確確調(diào)查員員的工工作失失誤(如計(jì)量量錯(cuò)誤誤、計(jì)計(jì)算錯(cuò)錯(cuò)誤、、記錄錄錯(cuò)誤誤等))被調(diào)查查者沒(méi)沒(méi)有提提供真真實(shí)情情況第6章第1節(jié)

抽樣方法抽樣調(diào)查中的誤差3第2節(jié)樣本均值的分布與中心極限定理總體分分布((populationdistribution)總體中中各元元素的的觀察察值所所形成成的分分布。。分布通通常是是未知知的可以假假定它它服從從某種種分布布總體第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1樣本分分布(sampledistribution)一個(gè)樣樣本中中各觀觀察值值的分分布,,也稱(chēng)稱(chēng)經(jīng)驗(yàn)驗(yàn)分布布,是是指當(dāng)當(dāng)樣本本容量量n逐漸增增大時(shí)時(shí),樣樣本分分布逐逐漸接接近總總體的的分布布。樣本第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1抽樣分分布(SamplingDistribtuion)按照簡(jiǎn)簡(jiǎn)單隨隨機(jī)抽抽樣方方法,,從個(gè)個(gè)數(shù)為為N的總體中抽抽取容量為為n的樣本,兩兩種抽法::放回抽樣樣:樣本本個(gè)數(shù)為為不放回抽抽樣:樣樣本個(gè)數(shù)數(shù)為每一個(gè)可可能的樣樣本都有有一個(gè)對(duì)對(duì)應(yīng)的均值和標(biāo)準(zhǔn)差,那么所所有樣本本均值的的分布就就是樣本均值值的抽樣樣分布,所有樣樣本的標(biāo)標(biāo)準(zhǔn)差的的分布就就是樣本標(biāo)準(zhǔn)準(zhǔn)差的抽抽樣分布布。第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本抽樣分布布的形成成過(guò)程第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1樣本均值值的抽樣樣分布在重復(fù)選選取容量量為n的樣本時(shí)時(shí),由樣樣本均值值所有可可能取值值形成的的相對(duì)頻頻數(shù)分布布一種理論論概率分分布推斷總體體均值的理論基基礎(chǔ)第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1例:設(shè)一個(gè)總體體,含有有4個(gè)元素((個(gè)體)),即總總體單位位數(shù)N=4。4個(gè)個(gè)體分分別為X1=1、X2=2、X3=3、X4=4??傮w的的均值、、方差及及分布如如下均值和方方差總體分布14230.1.2.3第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1例:現(xiàn)從總體中中抽取n=2的簡(jiǎn)單隨隨機(jī)樣本本,在重重復(fù)抽樣樣條件下下,共有有42=16個(gè)樣本。。所有樣樣本的結(jié)結(jié)果如下下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1計(jì)算出各樣本本的均值值,如下下表。并并給出樣樣本均值值的抽樣樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1式中:M為樣本數(shù)目,比比較及結(jié)論:樣本均值值的均值((數(shù)學(xué)期期望)等等于總體體均值樣本均值值的方差等等于總體體方差的的1/n第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1抽樣分布布=2.5σσ2=1.25總體分布布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值值的分布布與總體體分布的的比較第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1例:設(shè)一個(gè)總體(比比如擲骰子)),含有6個(gè)元素(個(gè)體),即總體單位位數(shù)N=6。6個(gè)個(gè)體分別為為x1=1,x2=2,x3=3,x4=4,x5=5,x6=6?,F(xiàn)從總體中抽抽取n=2的簡(jiǎn)單隨機(jī)樣本本,試比較總總體分布和樣本均值分布。第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1解:總體的均值、、方差及分布布如下:第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1均值和方差現(xiàn)從總體中抽抽取n=2的簡(jiǎn)單隨機(jī)樣樣本,在重復(fù)復(fù)抽樣條件下下,有62=36個(gè)樣本。所有有樣本的結(jié)果果為:

第二觀察值第一觀察值1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1計(jì)算出各樣本的均均值,如下表表。并給出樣樣本均值的抽抽樣分布

第二觀察值第一觀察值123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5636個(gè)樣本的均值值第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1=3.5σ2=2.9=3.5σ2=1.45樣本均值的抽抽樣分布與總總體分布的比比較第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1=50σ2

=10X總體分布n=2抽樣分布Xn=4當(dāng)總體服從正正態(tài)分布N~(μμ,σ2)時(shí),來(lái)自該總總體的所有容容量為n的樣本的均值值X也服從正態(tài)分分布,X的數(shù)學(xué)期望為為μ,方差為σ2/n。即X~N(μ,σ2/n)σ2=5σ2=2.5第6章第2節(jié)

樣本均值的分布與中心極限定理樣本均值的分布1當(dāng)樣本容量足夠大時(shí)(n>30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理理(centrallimittheorem)設(shè)從均值為,方差為2的一個(gè)任意總總體中抽取容容量為n的樣本,當(dāng)n充分大時(shí),樣樣本均值的抽抽樣分布近似似服從均值為為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2極限定理:簡(jiǎn)單講,凡是是采用極限的的方法(例如如,觀察次數(shù)數(shù)n趨于無(wú)限)所所得出的一系系列定理統(tǒng)稱(chēng)稱(chēng)極限定理。。極限定理分分為兩類(lèi):大數(shù)定理(Lawoflargenumbers)中心極限定理理(Centrallimittheorem)第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2中心極限定理理(centrallimittheorem)說(shuō)明,任何變量,不不管其原有分分布如何,如如果把它們n個(gè)加在一起,,只要n足夠大,其和和的分布必然然接近正態(tài)分分布,均值的的分布也接近近正態(tài)分布。。第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2x的分布趨于正正態(tài)分布的過(guò)過(guò)程第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2為什么社會(huì)經(jīng)經(jīng)濟(jì)生活、自自然界存在許許多隨機(jī)變量量的分布都服服從正態(tài)分布布?請(qǐng)結(jié)合中心極限定理理來(lái)解釋。第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2如果一個(gè)現(xiàn)實(shí)實(shí)的量是由大大量獨(dú)立偶然然的因素的影影響疊加而得得,且其中每每一個(gè)偶然因因素的影響又又是均勻地微微小的話,可可以斷定這個(gè)個(gè)量將近似地地服從正態(tài)分分布。這就解解釋了為什么么在自然、社社會(huì)、經(jīng)濟(jì)領(lǐng)領(lǐng)域里大量存存在服從正態(tài)態(tài)分布的隨機(jī)機(jī)變量。例如如,身高、體體重、智商、、婚齡等等,,因?yàn)橛绊懰鼈兊囊蛩囟级际谴罅康?。。?章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2抽樣分布與總總體分布的關(guān)關(guān)系從正態(tài)總體中中抽取的全部部可能樣本,,無(wú)論樣本容容量有多大,,樣本平均數(shù)數(shù)的抽樣分布布必定遵從于于正態(tài)分布;;如果是從非正正態(tài)總體中抽抽樣,只要n≥30,樣本均值的的抽樣分布必必定趨近于正正態(tài)分布;第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2對(duì)稱(chēng)鐘形分布中的的3σ法則3σ法則——關(guān)于鐘形分布布的一個(gè)近似似的或經(jīng)驗(yàn)的的法則:變量值落在[-3σ,+3σ]范圍以外的情情況極為少見(jiàn)見(jiàn)。因此通常常將落在區(qū)間間[-3σ,+3σ]之外的數(shù)據(jù)稱(chēng)稱(chēng)為異常數(shù)據(jù)或稱(chēng)稱(chēng)為離群點(diǎn)。x99.73%68.27%95.45%第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2正態(tài)分布非正態(tài)分布大樣本小樣本大樣本小樣本總體分布正態(tài)分布正態(tài)分布正態(tài)分布第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2例:每到臨近重大大節(jié)日,為了了滿(mǎn)足巨大的的市場(chǎng)需要,,副食品加工工廠提高了對(duì)對(duì)于食品的生生產(chǎn)規(guī)模,而而此時(shí)工廠的的質(zhì)量管理人人員,對(duì)工廠廠生產(chǎn)的副食食品進(jìn)行質(zhì)量量檢驗(yàn),檢驗(yàn)驗(yàn)的指標(biāo)中主主要是某個(gè)硝硝酸鹽的NO(<45mg/kg)指標(biāo)是否超超標(biāo),一個(gè)生生產(chǎn)商聲明自自己的食品中中NO的含量為43mg/kg,標(biāo)準(zhǔn)差為8mg。假設(shè)質(zhì)量監(jiān)監(jiān)督機(jī)構(gòu)決定定抽取40個(gè)樣本本來(lái)檢檢測(cè)含含量,,來(lái)進(jìn)進(jìn)行核核實(shí)。。假設(shè)設(shè)如下下:(1)建設(shè)設(shè)這個(gè)個(gè)生產(chǎn)產(chǎn)商所所言是是真實(shí)實(shí)的,,嘗試試描述述這40個(gè)樣本本的平平均NO含量的的抽樣樣分布布;(2)假設(shè)設(shè)這個(gè)個(gè)生產(chǎn)產(chǎn)商的的包裝裝說(shuō)明明是真真實(shí)的的,則則質(zhì)監(jiān)監(jiān)部門(mén)門(mén)抽取取的樣樣本硝硝酸鹽鹽含量量等于于45mg的概率率是多多少??第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2解:(1)盡管我們沒(méi)沒(méi)有總總體分分布信信息,,但是是根據(jù)據(jù)中心極極限定定理推斷::對(duì)著著這40個(gè)樣本本來(lái)說(shuō)說(shuō),平平均的的NO含量的的抽樣樣分布布是近近似正正態(tài)分分布的的。因因此這這批樣樣本的的均值值與總總體的的均值值是相相同的的。根根據(jù)生生產(chǎn)商商的聲聲明,,平均均含量量為43mg,方差差為5mg,則樣本本方差差為:如果我我們假假設(shè)此此聲明明是真真實(shí)的的,則則這40個(gè)樣本本平均均壽命命的抽抽樣分分布如如下圖圖所示示:第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2(2)假設(shè)生生產(chǎn)商聲聲稱(chēng)的是是真實(shí)的的,則對(duì)對(duì)于其40個(gè)樣本來(lái)說(shuō)說(shuō),硝酸鹽鹽含量大于于等于45mg/kg的概率P(x>=45)計(jì)算公式式如下:可以算出來(lái)來(lái)z(2.53)=0.9943,即根據(jù)生產(chǎn)產(chǎn)商的聲明明,硝酸鹽鹽含量高于于45mg的概率為1-0.9943=0.0057,因此根據(jù)這這個(gè)結(jié)果.該食品在此此次抽樣中中出現(xiàn)硝酸酸鹽含量超超標(biāo)的可能能性為極小小概率事件件,如果此此次樣本抽抽查出其中中一個(gè)出現(xiàn)現(xiàn)超標(biāo)(1/40=0.025),則有理理由認(rèn)為該該廠生產(chǎn)的的食品不合合格。第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2例:在一次研究某某一企業(yè)職職工收入情情況的調(diào)查查中,準(zhǔn)備備從該企業(yè)業(yè)隨機(jī)抽取取100個(gè)職工個(gè)人人的收入狀狀況數(shù)據(jù)構(gòu)構(gòu)成樣本,,以此推斷斷該企業(yè)職職工平均月月收入。若該企業(yè)職工工平均月收收入的總體體均值為2000元,總體標(biāo)標(biāo)準(zhǔn)差為為為250元,試計(jì)算算樣本均值值不小于1950元的概率。第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2解:根據(jù)中心極限定定理,在樣樣本容量充充分大時(shí),,樣本均值值漸進(jìn)地趨趨于數(shù)學(xué)期期望為總體體均值,方方差為總體體方差的n分之一的正正態(tài)分布,,有本例的的樣本均值值漸進(jìn)地趨趨于數(shù)學(xué)期期望為2000元,標(biāo)準(zhǔn)差差為25的正態(tài)分布布,即。代代入正態(tài)分分布概率計(jì)計(jì)算公式,,得即樣本均值值不小于1950元的概率為為97.7%。(查表)第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2σx=均值的標(biāo)準(zhǔn)誤

σ=個(gè)體標(biāo)準(zhǔn)差n=均值的樣本容量樣本均值的標(biāo)標(biāo)準(zhǔn)差小于總總體標(biāo)準(zhǔn)差,,且隨著樣本本容量的增加加減小,這也也正是抽樣平平均誤差的度度量。第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2樣本均值的數(shù)數(shù)學(xué)期望樣本均值的方方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽抽樣分布(數(shù)學(xué)期望與方方差)第6章第2節(jié)

樣本均值的分布與中心極限定理中心極限定理2樣本方差的分布:在重復(fù)選取容量量為的樣本時(shí)時(shí),由樣本方方差的所有可可能取值形成成的相對(duì)頻數(shù)分布。對(duì)于來(lái)自正態(tài)態(tài)總體的簡(jiǎn)單單隨機(jī)樣本,,則比值的抽樣分布服從從自由度為(n-1)的2分布,即第6章第2節(jié)

樣本均值的分布與中心極限定理常用統(tǒng)計(jì)量的分布3設(shè)總體服從正態(tài)態(tài)分布N~(μμ,σ2),X1,X2,…,Xn為來(lái)自該正態(tài)態(tài)總體的樣本本,則樣本方方差s2的分布為將2(n–1)稱(chēng)為自由度為為(n-1)的卡方分布第6章第2節(jié)

樣本均值的分布與中心極限定理常用統(tǒng)計(jì)量的分布3兩個(gè)總體都為為正態(tài)分布,,即,,兩個(gè)樣本均值值之差的的抽抽樣分布服從從正態(tài)分布,,其分布的數(shù)數(shù)學(xué)期望為兩兩個(gè)總體均值值之差方差為各自的的方差之和兩個(gè)樣本均值值之差的抽樣樣分布第6章第2節(jié)

樣本均值的分布與中心極限定理常用統(tǒng)計(jì)量的分布3

m1s1總體1s2

m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算x1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算x2計(jì)算每一對(duì)樣本的x1-x2所有可能樣本的x1-x2m1-m2抽樣分布第6章第2節(jié)

樣本均值的分布與中心極限定理常用統(tǒng)計(jì)量的分布3兩個(gè)總體都為正正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個(gè)總體中中分別抽取容容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差差比的抽樣分分布,服從分分子自由度為為(n1-1),分母自由度度為(n2-1)的F分布,即兩個(gè)樣本方差差比的抽樣分分布第6章第2節(jié)

樣本均值的分布與中心極限定理常用統(tǒng)計(jì)量的分布3c2-分布(2-distribution)由阿貝(Abbe)于1863年首先給出,,后來(lái)由海爾爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來(lái)。設(shè)X1,X2,┈,Xn是來(lái)自總體N(0,1)的樣本,則稱(chēng)稱(chēng)隨機(jī)變量X1,X2,┈,Xn2=X12+X22+,┈+Xn2服從自由度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論