版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第五抽樣與參數(shù)估計(jì)第一頁,共一百一十八頁,編輯于2023年,星期一第5章抽樣與參數(shù)估計(jì)5.1
抽樣與抽樣分布5.2參數(shù)估計(jì)的基本方法5.3總體均值的區(qū)間估計(jì)5.4總體比例的區(qū)間估計(jì)5.5樣本容量的確定第二頁,共一百一十八頁,編輯于2023年,星期一學(xué)習(xí)目標(biāo)理解概率抽樣方法理解抽樣分布估計(jì)量與估計(jì)值的概念點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別評價(jià)估計(jì)量優(yōu)良性的標(biāo)準(zhǔn)總體均值的區(qū)間估計(jì)方法總體比例的區(qū)間估計(jì)方法樣本容量的確定方法第三頁,共一百一十八頁,編輯于2023年,星期一5.1抽樣與抽樣分布什么是抽樣推斷抽樣方法抽樣分布抽樣推斷中常用的統(tǒng)計(jì)量及其分布第四頁,共一百一十八頁,編輯于2023年,星期一一、抽樣推斷
(概念要點(diǎn))是根據(jù)觀測到的樣本數(shù)據(jù)對總體作出推測,這種推測伴隨某種不確定性,需要用概率來表示其可靠程度,這是統(tǒng)計(jì)推斷的一個(gè)重要特點(diǎn)。第五頁,共一百一十八頁,編輯于2023年,星期一統(tǒng)計(jì)推斷的過程樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差總體均值、比例、方差等第六頁,共一百一十八頁,編輯于2023年,星期一二、抽樣方法第七頁,共一百一十八頁,編輯于2023年,星期一抽樣方法第八頁,共一百一十八頁,編輯于2023年,星期一(一)概率抽樣
(probabilitysampling)也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來的當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率第九頁,共一百一十八頁,編輯于2023年,星期一簡單隨機(jī)抽樣
(simplerandomsampling)從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,每個(gè)單位入選樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)特點(diǎn)簡單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒有利用其它輔助信息以提高估計(jì)的效率第十頁,共一百一十八頁,編輯于2023年,星期一簡單隨機(jī)抽樣
(simplerandomsampling)抽取方式:總體N個(gè)單位從1-N編號,從中抽取n個(gè)單位1、抽簽法:做材質(zhì)相同的N個(gè)標(biāo)簽,不放回抽取2、隨機(jī)數(shù)法:⑴隨機(jī)數(shù)表⑵隨機(jī)數(shù)色子⑶搖獎(jiǎng)機(jī)第十一頁,共一百一十八頁,編輯于2023年,星期一分層抽樣
(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本層1層2層N總體第十二頁,共一百一十八頁,編輯于2023年,星期一分層抽樣
(stratifiedsampling)分層抽樣的值依賴于層內(nèi)各元素是同質(zhì)性(相似的)。使層內(nèi)差異小,層間差異大優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對總體參數(shù)進(jìn)行估計(jì),也可以對各層的目標(biāo)量進(jìn)行估計(jì)第十三頁,共一百一十八頁,編輯于2023年,星期一分層抽樣
(抽樣方法)1、等額分配法:在各類型組中分配同等單位數(shù)。
n1=n2=…=ni2、等比例抽樣:按各層在總體中所占的比例分配樣本單位數(shù)。第十四頁,共一百一十八頁,編輯于2023年,星期一整群抽樣
(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對中選群中的所有單位全部實(shí)施調(diào)查群1群2群N總體第十五頁,共一百一十八頁,編輯于2023年,星期一整群抽樣
(clustersampling)整群抽樣的值依賴于每一群對總體的代表性,當(dāng)群中元素不同質(zhì)(不相似)時(shí),整群抽樣得到的結(jié)果最佳。特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡化工作量調(diào)查的地點(diǎn)相對集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差第十六頁,共一百一十八頁,編輯于2023年,星期一系統(tǒng)抽樣
(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位。優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度缺點(diǎn):對估計(jì)量方差的估計(jì)比較困難第十七頁,共一百一十八頁,編輯于2023年,星期一系統(tǒng)抽樣
(抽樣方法)1、無關(guān)標(biāo)志排隊(duì)等距抽樣如:產(chǎn)品質(zhì)量檢查按生產(chǎn)時(shí)間順序排隊(duì);學(xué)生成績調(diào)查按學(xué)號排隊(duì);居民住戶收入調(diào)查按門牌號排序。2、有關(guān)標(biāo)志排隊(duì)等距抽樣如:職工家計(jì)調(diào)查按工資水平排隊(duì);農(nóng)產(chǎn)量抽樣調(diào)查,按平均畝產(chǎn)排序。3、起點(diǎn)和間隔的確定:⑴隨機(jī)起點(diǎn):間隔k=N/n,a1=r,a2=r+k,a3=r+2k…an=r+(n-1)k⑵中點(diǎn)起點(diǎn)等距抽樣:a1=k/2,a2=k/2+k,a3=k/2+2k…an=k/2+(n-1)k⑶隨機(jī)起點(diǎn)對稱等距抽樣:a1=r,a2=(2k+1)-r,a3=2k+r,a4=(4k+1)-r,a5=4k+r第十八頁,共一百一十八頁,編輯于2023年,星期一多階段抽樣
(multi-stagesampling)先將總體單位劃分成若干大群,大群內(nèi)再分成若干小群。先按某種方法抽取大群,然后在中選群中抽取小群,再進(jìn)一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查二階抽樣中群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的階段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對集中,節(jié)約調(diào)查費(fèi)用適用于大規(guī)模的抽樣調(diào)查,如:我國的農(nóng)作物產(chǎn)量調(diào)查、職工家計(jì)調(diào)查等
第十九頁,共一百一十八頁,編輯于2023年,星期一多階段抽樣例:全國農(nóng)作物產(chǎn)量抽樣調(diào)查,首先由省所有縣市級中抽取部分縣市作為第一階段樣本,再從被抽中的縣市中抽取鄉(xiāng)鎮(zhèn)作為第二階段樣本,從被抽中鄉(xiāng)鎮(zhèn)中抽取村作為第三階段樣本,最后從中選村中抽取農(nóng)戶,并從農(nóng)戶的播種面積中抽取部分地塊,進(jìn)行實(shí)割實(shí)測,計(jì)算平均畝產(chǎn)量,然后逐級往上綜合計(jì)算平均畝產(chǎn)量,并推算全國總產(chǎn)量。第二十頁,共一百一十八頁,編輯于2023年,星期一多階段抽樣實(shí)例
2005年全國1%人口抽樣調(diào)查是以全國為總體,各省、自治區(qū)、直轄市為次總體,采用分層、多階段、整群概率比例抽樣方法,在全國31個(gè)省、自治區(qū)、直轄市抽取了2869個(gè)縣(市、區(qū))、21181個(gè)鄉(xiāng)(鎮(zhèn)、街道)、77417個(gè)調(diào)查小區(qū)的1699萬人。經(jīng)加權(quán)后匯總,2005年全國人口出生率為12.40‰,死亡率為6.51‰,自然增長率為5.89‰。按此推算,2005年末全國總?cè)丝跒?30756萬人,出生人口為1617萬人,死亡人口為849萬人,凈增人口為768萬人。第二十一頁,共一百一十八頁,編輯于2023年,星期一非概率抽樣
(non-probabilitysampling)相對于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實(shí)施調(diào)查。有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式。第二十二頁,共一百一十八頁,編輯于2023年,星期一方便抽樣調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入選樣本的單位。調(diào)查員在街頭、公園、商店等公共場所進(jìn)行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進(jìn)行的調(diào)查優(yōu)點(diǎn):容易實(shí)施,調(diào)查的成本低缺點(diǎn):樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體第二十三頁,共一百一十八頁,編輯于2023年,星期一判斷抽樣研究人員根據(jù)經(jīng)驗(yàn)、判斷和對研究對象的了解,有目的選擇一些單位作為樣本有重點(diǎn)抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據(jù)隨機(jī)的原則,調(diào)查結(jié)果不能用于推斷總體第二十四頁,共一百一十八頁,編輯于2023年,星期一自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動(dòng),向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機(jī)性無關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體第二十五頁,共一百一十八頁,編輯于2023年,星期一滾雪球抽樣先選擇一組調(diào)查單位,對其實(shí)施調(diào)查之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過程持續(xù)下去,就會形成滾雪球效應(yīng)。適合于對稀少群體和特定群體研究優(yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低。第二十六頁,共一百一十八頁,編輯于2023年,星期一配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位。操作簡單,可以保證樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似。抽取具體樣本單位時(shí),不是依據(jù)隨機(jī)原則,屬于非概率抽樣。第二十七頁,共一百一十八頁,編輯于2023年,星期一概率抽樣與非概率抽樣的比較概率抽樣依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的分布是不確定的無法使用樣本的結(jié)果推斷總體第二十八頁,共一百一十八頁,編輯于2023年,星期一三、抽樣分布第二十九頁,共一百一十八頁,編輯于2023年,星期一總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布
總體分布
(populationdistribution)總體第三十頁,共一百一十八頁,編輯于2023年,星期一一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布
(sampledistribution)樣本第三十一頁,共一百一十八頁,編輯于2023年,星期一樣本統(tǒng)計(jì)量(如均值、比例、方差等)的概率分布,是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布
(samplingdistribution)第三十二頁,共一百一十八頁,編輯于2023年,星期一抽樣分布
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本第三十三頁,共一百一十八頁,編輯于2023年,星期一(一)樣本均值的抽樣分布第三十四頁,共一百一十八頁,編輯于2023年,星期一在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ)
樣本均值的抽樣分布第三十五頁,共一百一十八頁,編輯于2023年,星期一樣本均值的抽樣分布
(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)
,即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為x1=1、x2=2、x3=3
、x4=4
??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3P(X)第三十六頁,共一百一十八頁,編輯于2023年,星期一樣本均值的抽樣分布
(例題分析)
從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第三十七頁,共一百一十八頁,編輯于2023年,星期一樣本均值的抽樣分布
(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5第三十八頁,共一百一十八頁,編輯于2023年,星期一樣本均值抽樣分布的特征值
(數(shù)學(xué)期望)設(shè)總體的均值是μ,方差是σ2,從中抽取容量為n的樣本,則在重復(fù)抽樣和不重復(fù)抽樣條件下:樣本均值的數(shù)學(xué)期望第三十九頁,共一百一十八頁,編輯于2023年,星期一樣本均值的抽樣分布
(方差)2、樣本均值的方差重復(fù)抽樣不重復(fù)抽樣當(dāng)抽樣比n/N≤5%時(shí),修正系數(shù)可以忽略不計(jì)。第四十頁,共一百一十八頁,編輯于2023年,星期一所有樣本均值的均值和方差式中:N為樣本數(shù)目,n為樣本容量。比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值
2.樣本均值的方差等于總體方差的1/n第四十一頁,共一百一十八頁,編輯于2023年,星期一樣本均值的分布與總體分布的比較
(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5XP(X)第四十二頁,共一百一十八頁,編輯于2023年,星期一樣本均值的抽樣分布
(總體是正態(tài)分布)=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)第四十三頁,共一百一十八頁,編輯于2023年,星期一中心極限定理
(centrallimittheorem)中心極限定理:設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布當(dāng)樣本容量足夠大時(shí)(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布一個(gè)任意分布的總體第四十四頁,共一百一十八頁,編輯于2023年,星期一中心極限定理
(centrallimittheorem)的分布趨于正態(tài)分布的過程第四十五頁,共一百一十八頁,編輯于2023年,星期一抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第四十六頁,共一百一十八頁,編輯于2023年,星期一(二)樣本比例的抽樣分布第四十七頁,共一百一十八頁,編輯于2023年,星期一比例
(proportion)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為
第四十八頁,共一百一十八頁,編輯于2023年,星期一在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對頻數(shù)分布當(dāng)樣本容量很大時(shí)(np≥5或n(1-p)≥5
),樣本比例的抽樣分布可用正態(tài)分布近似一種理論概率分布推斷總體比例的理論基礎(chǔ) 樣本比例的抽樣分布第四十九頁,共一百一十八頁,編輯于2023年,星期一樣本比例的抽樣分布
(數(shù)學(xué)期望與方差)樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣當(dāng)抽樣比n/N≤5%時(shí),修正系數(shù)第五十頁,共一百一十八頁,編輯于2023年,星期一四、抽樣推斷中常用的統(tǒng)計(jì)量及其分布第五十一頁,共一百一十八頁,編輯于2023年,星期一(一)Z統(tǒng)計(jì)量及其分布第五十二頁,共一百一十八頁,編輯于2023年,星期一標(biāo)準(zhǔn)正態(tài)分布設(shè)隨機(jī)變量X~N(μ,σ2)
,n個(gè)隨機(jī)變量X1,X2,…,Xn為X的一個(gè)簡單隨機(jī)樣本,則樣本均值~N(μ,σ2/n),將其標(biāo)準(zhǔn)化,得到Z統(tǒng)計(jì)量及其分布:第五十三頁,共一百一十八頁,編輯于2023年,星期一標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布是均值=0,標(biāo)準(zhǔn)差=1的正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的橫軸以Z值為刻度,Z值度量的是一個(gè)點(diǎn)距離均值多少倍標(biāo)準(zhǔn)差。大于均值的數(shù)據(jù)點(diǎn),其Z值為正,小于均值的數(shù)據(jù)點(diǎn),其Z值為負(fù)。第五十四頁,共一百一十八頁,編輯于2023年,星期一標(biāo)準(zhǔn)正態(tài)分布xms一般正態(tài)分布
=1Z標(biāo)準(zhǔn)正態(tài)分布第五十五頁,共一百一十八頁,編輯于2023年,星期一標(biāo)準(zhǔn)化的例子
P(5X6.2)
x=5=10一般正態(tài)分布6.2
=1Z標(biāo)準(zhǔn)正態(tài)分布00.120.0478第五十六頁,共一百一十八頁,編輯于2023年,星期一(二)t統(tǒng)計(jì)量及其分布第五十七頁,共一百一十八頁,編輯于2023年,星期一t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出
t分布是小樣本分布,一般指n<30。
t分布適用于當(dāng)總體標(biāo)準(zhǔn)差未知,用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,由樣本平均數(shù)推斷總體平均數(shù)以及兩個(gè)樣本之間差異的顯著性檢驗(yàn)等。第五十八頁,共一百一十八頁,編輯于2023年,星期一t
統(tǒng)計(jì)量的分布
設(shè)隨機(jī)變量X~N(μ,σ2),n個(gè)隨機(jī)變量X1,X2,…,Xn為X的一個(gè)簡單隨機(jī)樣本,稱為統(tǒng)計(jì)量,它服從自由度為(n-1)的t分布Xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z第五十九頁,共一百一十八頁,編輯于2023年,星期一t
分布的性質(zhì)1、
t
分布的均值為02、t
分布是一個(gè)均值對稱的分布3、取值范圍在-∞與+∞之間,曲線以x軸為漸進(jìn)線4、t
分布方差大于1,與標(biāo)準(zhǔn)正態(tài)分布比,t
分布中心略低,兩尾部較高,自由度越小,差別越明顯。5、隨著樣本容量(自由度n-1)不斷增大,t分布越來越趨近于標(biāo)準(zhǔn)正態(tài)分布,并以標(biāo)準(zhǔn)正態(tài)分布為極限。
第六十頁,共一百一十八頁,編輯于2023年,星期一(三)2統(tǒng)計(jì)量及其分布第六十一頁,共一百一十八頁,編輯于2023年,星期一2分布
(2
distribution)2分布是由阿貝(Abbe)于1863年首先提出,后來由海爾墨特(Hermert)和卡爾·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來的。主要適用于:總體方差的估計(jì)和檢驗(yàn)、對擬合優(yōu)度檢驗(yàn)和獨(dú)立性檢驗(yàn)等。第六十二頁,共一百一十八頁,編輯于2023年,星期一2分布
(2
distribution)1.設(shè)隨機(jī)變量X1,X2,…,Xn相互獨(dú)立,
且服從標(biāo)準(zhǔn)正態(tài)分布,則它們的平方和∑X2服從自由度為n的2分布。2.令,則Y服從自由度為1的2分布,即
3.當(dāng)總體,從中抽取容量為n的樣本,則第六十三頁,共一百一十八頁,編輯于2023年,星期一分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若X和Y為兩個(gè)獨(dú)立的2分布隨機(jī)變量,X~2(n1),Y~2(n2),則X+Y這一隨機(jī)變量服從自由度為n1+n2的2分布2分布
(性質(zhì)和特點(diǎn))第六十四頁,共一百一十八頁,編輯于2023年,星期一卡方(c2)分布
選擇容量為n的簡單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算卡方值2=(n-1)S2/σ2計(jì)算出所有的
2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20
ms總體第六十五頁,共一百一十八頁,編輯于2023年,星期一(四)F統(tǒng)計(jì)量及其分布第六十六頁,共一百一十八頁,編輯于2023年,星期一F分布
(F
distribution)由統(tǒng)計(jì)學(xué)家費(fèi)舍(R.A.Fisher)
提出的適用于方差分析、協(xié)方差分析和回歸分析等。設(shè)若X為服從自由度為n的2分布,即X~2(n),Y為服從自由度為m的2分布,即Y~2(m),且X和Y相互獨(dú)立,則F統(tǒng)計(jì)量及其分布為:稱F為服從自由度n和m的F分布。第六十七頁,共一百一十八頁,編輯于2023年,星期一如果X~F(n,m),則1/X~F(m,n)。F分布曲線是右偏型的,并且隨著自由度n,m取值的變小,F(xiàn)分布曲線的偏斜程度增大。
不同自由度的F分布F分布
(性質(zhì)和特點(diǎn))F(1,10)(5,10)(10,10)第六十八頁,共一百一十八頁,編輯于2023年,星期一5.2參數(shù)估計(jì)的基本方法估計(jì)量與估計(jì)值參數(shù)估計(jì)的方法第六十九頁,共一百一十八頁,編輯于2023年,星期一一、估計(jì)量與估計(jì)值第七十頁,共一百一十八頁,編輯于2023年,星期一估計(jì)量:用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱如:樣本均值、樣本比例、樣本方差等樣本均值就是總體均值的一個(gè)估計(jì)量2.估計(jì)值:根據(jù)一個(gè)具體樣本計(jì)算出來的估計(jì)量的數(shù)值如果樣本均值x
=80,則80就是的估計(jì)值估計(jì)量與估計(jì)值
(estimator&estimatedvalue)第七十一頁,共一百一十八頁,編輯于2023年,星期一二、參數(shù)估計(jì)的方法第七十二頁,共一百一十八頁,編輯于2023年,星期一參數(shù)估計(jì)的方法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)第七十三頁,共一百一十八頁,編輯于2023年,星期一(一)點(diǎn)估計(jì)
(pointestimate)用樣本估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)2. 方法:矩估計(jì)法、順序量估計(jì)法、極大似然估計(jì)法等。二戰(zhàn)中的點(diǎn)估計(jì)第七十四頁,共一百一十八頁,編輯于2023年,星期一(二)區(qū)間估計(jì)
(intervalestimate
)1. 概念:根據(jù)樣本估計(jì)量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在75~85之間,置信度為95%樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))置信區(qū)間置信下限θ1置信上限θ2第七十五頁,共一百一十八頁,編輯于2023年,星期一區(qū)間估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x第七十六頁,共一百一十八頁,編輯于2023年,星期一置信區(qū)間
(confidenceinterval)設(shè)總體參數(shù)為θ,θ1和θ2為由樣本確定的統(tǒng)計(jì)量,對于給定的α(0<α<1),若θ1和θ2滿足稱(θ1,θ2)為參數(shù)θ的置信水平為1-α的置信區(qū)間。樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))置信區(qū)間置信下限θ1置信上限θ2置信水平(1-α)第七十七頁,共一百一十八頁,編輯于2023年,星期一將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,稱為置信水平或置信系數(shù)。表示為(1-為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10相應(yīng)的/2為0.005,0.025,0.05相應(yīng)的Zα/2值是2.58,1.96,1.645置信水平
(1-第七十八頁,共一百一十八頁,編輯于2023年,星期一置信區(qū)間與置信水平
均值的抽樣分布(1-)%區(qū)間包含了
%的區(qū)間未包含1-aa/2a/2用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)-Za/2Za/2第七十九頁,共一百一十八頁,編輯于2023年,星期一置信區(qū)間
(95%的置信區(qū)間)重復(fù)構(gòu)造出的20個(gè)置信區(qū)間點(diǎn)估計(jì)值第八十頁,共一百一十八頁,編輯于2023年,星期一三、評價(jià)估計(jì)量的標(biāo)準(zhǔn)第八十一頁,共一百一十八頁,編輯于2023年,星期一無偏性
(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)
P(
)BA無偏有偏的抽樣分布第八十二頁,共一百一十八頁,編輯于2023年,星期一有效性
(efficiency)有效性:對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效
AB
的抽樣分布
的抽樣分布P(
)第八十三頁,共一百一十八頁,編輯于2023年,星期一一致性
(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(
)第八十四頁,共一百一十八頁,編輯于2023年,星期一5.3總體均值的區(qū)間估計(jì)正態(tài)總體或大樣本的估計(jì)正態(tài)總體小樣本的估計(jì)第八十五頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體、2已知,
或非正態(tài)總體、大樣本的估計(jì)第八十六頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體或非正態(tài)總體、大樣本
(2已知)假定條件總體服從正態(tài)分布,方差(2)
已知非正態(tài)分布,可由正態(tài)分布來近似(n
30)使用正態(tài)分布統(tǒng)計(jì)量Z第八十七頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體或非正態(tài)總體、大樣本
(2已知)2、總體均值在1-置信水平下的置信區(qū)間為重復(fù)抽樣不重復(fù)抽樣第八十八頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體
(2已知)【例】某種零件的長度服從正態(tài)分布,從某天生產(chǎn)一批零件中按重復(fù)抽樣方法隨機(jī)抽取9個(gè),測得其平均長度為21.4cm。已知總體標(biāo)準(zhǔn)差為=0.15cm。試估計(jì)該批零件平均長度的置信區(qū)間,置信水平為95%。解:已知X~N(,0.152),n=9,1-=95%,z/2=1.96總體均值的置信區(qū)間為我們可以95%的概率保證該批零件平均長度的在21.302cm~21.498cm之間
第八十九頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體(2已知)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對食品質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5
95.0108.8115.6100.0123.5102.0101.6102.2116.6
95.4
97.8108.6105.0136.8102.8101.5
98.4
93.3第九十頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體
(2已知例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96??傮w均值在1-置信水平下的置信區(qū)間為:該食品平均重量95%的置信區(qū)間為101.44g~109.28g第九十一頁,共一百一十八頁,編輯于2023年,星期一非正態(tài)總體、大樣本
(2已知)解:已知x=26,=6,n=100>30,1-=0.95,Z/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時(shí)間在24.824~27.176分鐘之間【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。試以95%的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36分鐘)。第九十二頁,共一百一十八頁,編輯于2023年,星期一
正態(tài)總體、2未知,
或非正態(tài)總體、大樣本的估計(jì)第九十三頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體或非正態(tài)總體大樣本
(2未知)1、假定條件總體服從正態(tài)分布,方差(2)
未知非正態(tài)分布,樣本容量足夠大時(shí)(n
30),用S2n-1代替22、使用正態(tài)分布統(tǒng)計(jì)量Z第九十四頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體或非正態(tài)總體大樣本
(2未知)3、總體均值在1-置信水平下的置信區(qū)間為重復(fù)抽樣不重復(fù)抽樣第九十五頁,共一百一十八頁,編輯于2023年,星期一總體均值的區(qū)間估計(jì)
(例題分析)【例】一家保險(xiǎn)公司收集到由36個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間
36個(gè)投保人年齡的數(shù)據(jù)
233539273644364246433133425345544724342839364440394938344850343945484532第九十六頁,共一百一十八頁,編輯于2023年,星期一總體均值的區(qū)間估計(jì)
(例題分析)解:已知n=36,1-=90%,z/2=1.645。
總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡90%的置信區(qū)間為37.37歲~41.63歲第九十七頁,共一百一十八頁,編輯于2023年,星期一正態(tài)總體、2未知、小樣本的估計(jì)第九十八頁,共一百一十八頁,編輯于2023年,星期一總體均值的區(qū)間估計(jì)
(小樣本)1. 假定條件總體服從正態(tài)分布,2未知,用S2n-1代替2小樣本(n<30)使用t
分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為第九十九頁,共一百一十八頁,編輯于2023年,星期一總體均值的區(qū)間估計(jì)
(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命(小時(shí))如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470第一百頁,共一百一十八頁,編輯于2023年,星期一總體均值的區(qū)間估計(jì)
(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2(15)=2.131根據(jù)樣本數(shù)據(jù)計(jì)算得:
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命95%的置信區(qū)間為1476.8~1503.2小時(shí)第一百零一頁,共一百一十八頁,編輯于2023年,星期一總體參數(shù)區(qū)間估計(jì)使用的分布
(小結(jié))第一百零二頁,共一百一十八頁,編輯于2023年,星期一總體參數(shù)的區(qū)間估計(jì)
(小結(jié))第一百零三頁,共一百一十八頁,編輯于2023年,星期一5.4總體比例的區(qū)間估計(jì)大樣本重復(fù)抽樣時(shí)的估計(jì)方法大樣本不重復(fù)抽樣時(shí)的估計(jì)方法第一百零四頁,共一百一十八頁,編輯于2023年,星期一總體比例的區(qū)間估計(jì)
(重復(fù)抽樣)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量Z3.總體比例在1-置信水平下的置信區(qū)間為第一百零五頁,共一百一十八頁,編輯于2023年,星期一總體比例的區(qū)間估計(jì)
(不重復(fù)抽樣)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量Z3.總體比例在1-置信水平下的置信區(qū)間為第一百零六頁,共一百一十八頁,編輯于2023年,星期一總體比例的區(qū)間估計(jì)
(例題分析)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,z/2=1.96該城
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人住宅裝潢協(xié)議范本(2024年修訂)版
- 2025年度叉車安全操作培訓(xùn)課程優(yōu)化與推廣合同4篇
- 2025版廠房買賣及土地使用權(quán)變更與售后服務(wù)合同4篇
- 專業(yè)咨詢顧問合作合同(2024年度版)版B版
- 2025年度拆除宴會廳墻體改造項(xiàng)目施工協(xié)議4篇
- 2024陶瓷杯系列新品研發(fā)與市場推廣合作合同3篇
- 2025年度企業(yè)股權(quán)激勵(lì)計(jì)劃稅務(wù)籌劃與合規(guī)合同3篇
- 2025年新能源電站設(shè)備購銷合同協(xié)議4篇
- 2025年度醫(yī)療中心場地租賃及醫(yī)療設(shè)備租賃補(bǔ)充協(xié)議3篇
- 2025年度醫(yī)療設(shè)備存放租賃合同(2025年度)4篇
- 茶室經(jīng)營方案
- 軍隊(duì)文職崗位述職報(bào)告
- 小學(xué)數(shù)學(xué)六年級解方程練習(xí)300題及答案
- 電抗器噪聲控制與減振技術(shù)
- 中醫(yī)健康宣教手冊
- 2024年江蘇揚(yáng)州市高郵市國有企業(yè)招聘筆試參考題庫附帶答案詳解
- 消費(fèi)醫(yī)療行業(yè)報(bào)告
- 品學(xué)課堂新范式
- GB/T 1196-2023重熔用鋁錠
- 運(yùn)輸行業(yè)員工崗前安全培訓(xùn)
- 公路工程安全風(fēng)險(xiǎn)辨識與防控手冊
評論
0/150
提交評論