社會(huì)統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第1頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第2頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第3頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第4頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章參數(shù)估計(jì)統(tǒng)計(jì)推論基本概念抽樣分布點(diǎn)估計(jì)區(qū)間估計(jì)大樣本區(qū)間估計(jì)6.1統(tǒng)計(jì)推論統(tǒng)計(jì)推論是根據(jù)局部資料(樣本資料)對(duì)總體的特征進(jìn)行推斷。屬于歸納推理的范疇。統(tǒng)計(jì)推論的特點(diǎn):(1)局部反映總體;(2)抽樣結(jié)果總是存在隨機(jī)性。統(tǒng)計(jì)推論的內(nèi)容:(1)參數(shù)估計(jì)(parameter’sestimation)(2)假設(shè)檢驗(yàn)(Hypothesistest)6.2基本概念總體(Population):是研究對(duì)象的全體??梢钥醋魇且粋€(gè)研究對(duì)象的集合,又可以看作是所研究的變量的一個(gè)分布。例如家庭和家庭收入??傮w由個(gè)體(調(diào)查單位)構(gòu)成。樣本(Sample):從總體中按一定方式將要調(diào)查的個(gè)體抽出來(lái),就組成一個(gè)樣本。其中包含的個(gè)體數(shù)目n稱(chēng)為樣本大小或樣本容量。簡(jiǎn)單隨機(jī)樣本:樣本中個(gè)體的抽取是獨(dú)立的,且和總體同分布,由此形成的樣本即簡(jiǎn)單隨機(jī)樣本。要研究的總體的特征叫做參數(shù)值。要研究的樣本的特征叫做統(tǒng)計(jì)量。根據(jù)樣本觀(guān)測(cè)值得到的統(tǒng)計(jì)數(shù)字叫做統(tǒng)計(jì)量的觀(guān)測(cè)值。有時(shí)也把它們看作是統(tǒng)計(jì)量的本身。統(tǒng)計(jì)量的分布即抽樣分布。6.3抽樣分布總體分布(populationdistribution)是變量X的所有取值形成的分布。但我們?cè)诜治鲋型荒苤揽傮w分布的情況。1、樣本均值的分布(1)總體正態(tài)分布,方差已知

反映了統(tǒng)計(jì)量圍繞總體均值(μ)的分散程度,或者說(shuō)反映了抽樣均值與μ的平均誤差水平。所以它又稱(chēng)作抽樣均值的平均誤差或標(biāo)準(zhǔn)誤差。

是由抽樣引起的,其大小可以反映統(tǒng)計(jì)量的可靠性程度。其標(biāo)準(zhǔn)化后也得到標(biāo)準(zhǔn)正態(tài)分布。(2)總體正態(tài)分布,方差未知用樣本方差作為總體方差的估計(jì)值;統(tǒng)計(jì)量服從t分布。(3)任意總體,大樣本情況在社會(huì)現(xiàn)象的研究中,可以不考慮總體分布如何,只要n足夠大(≥50),樣本均值的分布將確定為一個(gè)近似的正態(tài)分布。2、樣本方差S2的分布樣本方差是隨機(jī)變量,當(dāng)總體為正態(tài)分布時(shí),S2的分布與分布相聯(lián)系?!?/p>

2023/2/57

分布回顧該分布是指一些相互獨(dú)立、服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量平方和的分布。即從正態(tài)分布總體中抽取出來(lái)的樣本,經(jīng)過(guò)標(biāo)準(zhǔn)化后,它的平方和服從分布?!╪-1)常用于列聯(lián)表檢驗(yàn)。2023/2/586.4點(diǎn)估計(jì)點(diǎn)估計(jì):是以一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值來(lái)代表總體參數(shù)值。具體說(shuō),用樣本均值作為總體均值的點(diǎn)估計(jì)值。用樣本方差作為總體方式差的點(diǎn)估計(jì)值。估計(jì)量如果具有無(wú)偏性、一致性和有效性,就可以認(rèn)為這種統(tǒng)計(jì)量是總體參數(shù)的合理估計(jì)或最佳估計(jì)。6.4.1求點(diǎn)估計(jì)值的標(biāo)準(zhǔn)無(wú)偏性:要求統(tǒng)計(jì)量抽樣分布的均值恰好等于被估計(jì)的參數(shù)之值。比如,中心極限定理告訴我們,樣本均值抽樣分布的均值恰好等于總體均值,因此用樣本均值估計(jì)總體均值就滿(mǎn)足這個(gè)標(biāo)準(zhǔn)。但絕不是說(shuō)任何的值將等于μ。一致性:當(dāng)樣本容量逐漸增加時(shí),統(tǒng)計(jì)量越來(lái)越接近總體參數(shù)。要求統(tǒng)計(jì)量隨著樣本容量n的增大以更大的概率接近被估計(jì)參數(shù)。有效性:是指統(tǒng)計(jì)量的抽樣分布集中在真實(shí)參數(shù)周?chē)某潭?。要求估?jì)值的抽樣分布有較小的分散性,即選擇抽樣分布的標(biāo)準(zhǔn)差較小的統(tǒng)計(jì)量作為估計(jì)量。6.4.2點(diǎn)估計(jì)值的計(jì)算總體均值的點(diǎn)估計(jì)總體方差的點(diǎn)估計(jì)值在統(tǒng)計(jì)學(xué)中,常常用符號(hào)“”來(lái)表示無(wú)偏估計(jì)量。數(shù)學(xué)上可以證明,對(duì)于隨機(jī)樣本而言,才是總體方差的無(wú)偏估計(jì)量,它稱(chēng)為修正樣本方差。當(dāng)Xi表示的是變量,其取值是0和1。如果A類(lèi)(X=1)出現(xiàn)了m次,我們用樣本的成數(shù)P作為總體的估計(jì)值。[例]工會(huì)為了了解春游期間需用幾輛公共汽車(chē),在全廠(chǎng)10000名職工中進(jìn)行了共100人的簡(jiǎn)單隨機(jī)抽樣調(diào)查。統(tǒng)計(jì)結(jié)果,其中有20名愿意外出春游。假設(shè)每輛車(chē)可載乘客50名,問(wèn)估計(jì)要預(yù)租多少輛公共汽車(chē)?用樣本成數(shù)來(lái)估計(jì)。[例]研究者要調(diào)查某社區(qū)居民家庭收入分布的差異情況,現(xiàn)隨機(jī)抽查了10戶(hù),得到樣本方差為=200(元2)。試以此資料估計(jì)總體家庭收入分布的差異情況。

[解]因?yàn)闃颖救萘枯^小,宜用修正樣本方差作為總體方差點(diǎn)估計(jì)量。即

===222.26.5區(qū)間估計(jì)(Intervalestimation)區(qū)間估計(jì)的任務(wù)是,在點(diǎn)估計(jì)值的兩側(cè)設(shè)置一個(gè)區(qū)間,使得總體參數(shù)被估計(jì)到的概率大大增加??煽啃院途_性(即信度和效度)在區(qū)間估計(jì)中是相互矛盾的兩個(gè)方面。

6.5.1有關(guān)區(qū)間估計(jì)的幾個(gè)概念置信區(qū)間:區(qū)間估計(jì)是求所謂置信區(qū)間的方法。置信區(qū)間就是我們?yōu)榱嗽黾訁?shù)被估計(jì)到的信心而在點(diǎn)估計(jì)兩邊設(shè)置的估計(jì)區(qū)間。區(qū)分精確性與可靠性顯著性水平

α:表示用置信區(qū)間來(lái)估計(jì)的不可靠的概率。置信度(水平)1-α:表示置信區(qū)間估計(jì)的可靠性(把握度)。例如置信水平取0.90。抽樣平均誤差與概率度

Z抽樣平均誤差:樣本均值抽樣分布的標(biāo)準(zhǔn)差。反映在參數(shù)周?chē)闃悠骄档钠骄儺惓潭?。越大,樣本均值越分散。概率度:Z在參數(shù)估計(jì)中被稱(chēng)為概率度,其大小由

α決定.

顯著性水平、置信水平、概率度之間的關(guān)系:

α

=0.10時(shí),1-

α

=0.90,Zα/2=1.65

α=0.05時(shí),1-

α

=0.95,Zα/2=1.96

α=0.01時(shí),1-

α

=0.99,Zα/2=2.582023/2/5186.5.2區(qū)間估計(jì)的做法從點(diǎn)估計(jì)值開(kāi)始,向兩側(cè)展開(kāi)一定倍數(shù)的抽樣平均誤差,并估計(jì)總體參數(shù)很可能就包含在這個(gè)區(qū)間之內(nèi)。置信區(qū)間的大小主要由和Z這兩個(gè)量所決定,并且是2Z。所以參數(shù)μ的區(qū)間估計(jì)就歸結(jié)為計(jì)算這兩個(gè)量(即就各種抽樣分布計(jì)算概率度和就各種抽樣方式計(jì)算抽樣平均誤差)。

的大小對(duì)設(shè)置置信區(qū)間的范圍起著很重要的作用。在同等置信度的情況下,抽樣平均誤差小,估計(jì)區(qū)間就縮小了,從而獲得對(duì)參數(shù)較為有效的估計(jì)(決定效度的關(guān)鍵因素)。Z則與信度相聯(lián)系。對(duì)參數(shù)μ的區(qū)間估計(jì)的步驟:

1.首先從總體抽取一個(gè)樣本,根據(jù)收集的樣本資料求出它的均值。

2.根據(jù)合乎實(shí)際的置信水平查表求得概率度

3.根據(jù)總體標(biāo)準(zhǔn)差和樣本容量求出抽樣平均誤差

4.以均值為基準(zhǔn),向兩側(cè)展開(kāi)Z倍抽樣平均誤差的區(qū)間。根據(jù)總體方差是否知道,估計(jì)分兩種情況。(1)已知(2)未知,用S代替6.5.3大樣本,總體均值的區(qū)間估計(jì)[例]設(shè)某工廠(chǎng)婦女從事家務(wù)勞動(dòng)服從正態(tài)分布N

,0.662],根據(jù)36人的隨機(jī)抽樣調(diào)查,樣本每天平均從事家務(wù)勞動(dòng)的時(shí)間為2.65小時(shí),求μ的置信區(qū)間(置信度1-α

=0.95)。

[解]按題意,此為大樣本,且總體方差已知,又

n=36,=2.65,=0.66,1-α=0.95。查表得Z=1.96,代入公式有=2.65±1.96=2.65±0.22

因此,有95%的把握,該廠(chǎng)婦女平均從事家務(wù)勞動(dòng)的時(shí)間在2.87~2.43小時(shí)之間。[例]從某校隨機(jī)地抽取100名男學(xué)生,測(cè)得平均身高為170厘米,標(biāo)準(zhǔn)差為7.5厘米,試求該校學(xué)生平均身高95%的置信區(qū)間。

[解]按題意,此為大樣本,且總體方差未知,又n=100,=170,S=7.5,1—α=0.95.查表得=1.96,代入公式有

=170±1.96=170±1.47因此,有95%的把握,該校學(xué)生的平均身高在168.5~171.5厘米之間。[習(xí)題]從來(lái)自“白領(lǐng)犯罪與罪犯生涯:一些初步研究結(jié)果”的一項(xiàng)研究報(bào)告的數(shù)據(jù)表明,白領(lǐng)犯罪可能是年紀(jì)較大者,并且顯示比街頭罪犯有較低的犯罪率。給出數(shù)據(jù)為:白領(lǐng)犯罪發(fā)作平均年齡為54歲,n

=100,標(biāo)準(zhǔn)差被估計(jì)為7.5歲。建立真實(shí)平均年齡的90%置信區(qū)間。采用t分布6.5.4小樣本,正態(tài)總體均值區(qū)間估計(jì)[例]在一個(gè)正態(tài)總體中抽取一個(gè)容量為25的樣本,其均值為52,標(biāo)準(zhǔn)差為12,求置信水平為95%的總體均值的置信區(qū)間。

[解]根據(jù)題意,總體方差未知,且為小樣本,故用t分布統(tǒng)計(jì)量。由95%置信水平查t分布表得概率度=(24)=2.064

代入公式得

=52±2.064=52±4.95因此,置信水平95%的總體均值的置信區(qū)間是從47.05到56.95。從總體的均值估計(jì)過(guò)渡到總體的成數(shù)估計(jì),其方法和思路完全相同,只要用代替,用代替。6.5.5大樣本總體成數(shù)的估計(jì)[例]假若從某社區(qū)抽取一個(gè)由200個(gè)家庭組成的樣本,發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開(kāi)支上作決定的次數(shù)超過(guò)半數(shù)。試問(wèn)家庭開(kāi)支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)[例]假若從某社區(qū)抽取一個(gè)由200個(gè)家庭組成的樣本,發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開(kāi)支上作決定的次數(shù)超過(guò)半數(shù)。試問(wèn)家庭開(kāi)支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)

[解法一][解法二]2023/2/530n1≥50n2≥50現(xiàn)在從兩總體獨(dú)立地各抽取一個(gè)隨機(jī)樣本:只要樣本都大于或等于50,則兩個(gè)樣本均值的抽樣分布都服從正態(tài)分布,根據(jù)正態(tài)隨機(jī)變量線(xiàn)性組合的隨機(jī)變量仍然服從正態(tài)分布的原理,則均值差也服從正態(tài)分布。6.5.5大樣本二總體均值差的估計(jì)若總體方差未知,則用樣本方差代替總體方差。在大樣本的情況下置信度為1-a的(μ1-μ2)的區(qū)間估計(jì)為:2023/2/533

與單樣本成數(shù)的區(qū)間估計(jì)一樣,成數(shù)差區(qū)間估計(jì)可以被看作均值差的特例來(lái)處理(但它適用于各種量度層次)。即對(duì)給定的置信水平(1―α),得兩總體成數(shù)差(p1―p2)之估計(jì)區(qū)間為

6.5.5大樣本成數(shù)差的區(qū)間估計(jì)2023/2/534

[例]有一個(gè)大學(xué)生的隨機(jī)樣本,按照性格“外向”和“內(nèi)向”,把他們分成兩類(lèi)。結(jié)果發(fā)現(xiàn),新生中有73%屬于“外向”類(lèi),四年級(jí)學(xué)生中有58%屬于“外向”類(lèi)。樣本中新生有171名,四年級(jí)學(xué)生有117名。試在99%的置信水平上,求新生、老生性性格“外向”的成數(shù)差的置信區(qū)間。2023/2/535

[解]據(jù)題意,

新生組的抽樣結(jié)果為:=0.73,

=027,

n1=171(人)

四年級(jí)學(xué)生組的抽樣結(jié)果為:

=0.58,

=0.42,n2=117(人)

由(1―α)=0.99,得Zα/2=Z0.005=2.58,代入上式得

得在99%置信水平上,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論