社會統(tǒng)計學-參數(shù)估計

上傳人：a*** IP屬地：湖北上傳時間：2023-02-05 格式：PPT 頁數(shù)：36 大?。?.26MB 積分：28 舉報 版權申訴

已閱讀5頁，還剩31頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

第6章參數(shù)估計統(tǒng)計推論基本概念抽樣分布點估計區(qū)間估計大樣本區(qū)間估計6.1統(tǒng)計推論統(tǒng)計推論是根據(jù)局部資料（樣本資料）對總體的特征進行推斷。屬于歸納推理的范疇。統(tǒng)計推論的特點：（1）局部反映總體；（2）抽樣結(jié)果總是存在隨機性。統(tǒng)計推論的內(nèi)容：（1）參數(shù)估計（parameter’sestimation）（2）假設檢驗(Hypothesistest)6.2基本概念總體（Population）：是研究對象的全體?？梢钥醋魇且粋€研究對象的集合，又可以看作是所研究的變量的一個分布。例如家庭和家庭收入?？傮w由個體（調(diào)查單位）構成。樣本（Sample）：從總體中按一定方式將要調(diào)查的個體抽出來，就組成一個樣本。其中包含的個體數(shù)目n稱為樣本大小或樣本容量。簡單隨機樣本：樣本中個體的抽取是獨立的，且和總體同分布，由此形成的樣本即簡單隨機樣本。要研究的總體的特征叫做參數(shù)值。要研究的樣本的特征叫做統(tǒng)計量。根據(jù)樣本觀測值得到的統(tǒng)計數(shù)字叫做統(tǒng)計量的觀測值。有時也把它們看作是統(tǒng)計量的本身。統(tǒng)計量的分布即抽樣分布。6.3抽樣分布總體分布（populationdistribution）是變量X的所有取值形成的分布。但我們在分析中往往不能知道總體分布的情況。1、樣本均值的分布（1）總體正態(tài)分布，方差已知

反映了統(tǒng)計量圍繞總體均值（μ）的分散程度，或者說反映了抽樣均值與μ的平均誤差水平。所以它又稱作抽樣均值的平均誤差或標準誤差。

是由抽樣引起的，其大小可以反映統(tǒng)計量的可靠性程度。其標準化后也得到標準正態(tài)分布。（2）總體正態(tài)分布，方差未知用樣本方差作為總體方差的估計值；統(tǒng)計量服從t分布。（3）任意總體，大樣本情況在社會現(xiàn)象的研究中，可以不考慮總體分布如何，只要n足夠大（≥50），樣本均值的分布將確定為一個近似的正態(tài)分布。2、樣本方差S2的分布樣本方差是隨機變量，當總體為正態(tài)分布時，S2的分布與分布相聯(lián)系?！?/p>

2023/2/57

分布回顧該分布是指一些相互獨立、服從標準正態(tài)分布的隨機變量平方和的分布。即從正態(tài)分布總體中抽取出來的樣本，經(jīng)過標準化后，它的平方和服從分布?！╪-1）常用于列聯(lián)表檢驗。2023/2/586.4點估計點估計：是以一個最適當?shù)臉颖窘y(tǒng)計值來代表總體參數(shù)值。具體說，用樣本均值作為總體均值的點估計值。用樣本方差作為總體方式差的點估計值。估計量如果具有無偏性、一致性和有效性，就可以認為這種統(tǒng)計量是總體參數(shù)的合理估計或最佳估計。6.4.1求點估計值的標準無偏性：要求統(tǒng)計量抽樣分布的均值恰好等于被估計的參數(shù)之值。比如，中心極限定理告訴我們，樣本均值抽樣分布的均值恰好等于總體均值，因此用樣本均值估計總體均值就滿足這個標準。但絕不是說任何的值將等于μ。一致性：當樣本容量逐漸增加時，統(tǒng)計量越來越接近總體參數(shù)。要求統(tǒng)計量隨著樣本容量n的增大以更大的概率接近被估計參數(shù)。有效性：是指統(tǒng)計量的抽樣分布集中在真實參數(shù)周圍的程度。要求估計值的抽樣分布有較小的分散性，即選擇抽樣分布的標準差較小的統(tǒng)計量作為估計量。6.4.2點估計值的計算總體均值的點估計總體方差的點估計值在統(tǒng)計學中，常常用符號“”來表示無偏估計量。數(shù)學上可以證明，對于隨機樣本而言，才是總體方差的無偏估計量，它稱為修正樣本方差。當Xi表示的是變量，其取值是0和1。如果A類（X=1）出現(xiàn)了m次,我們用樣本的成數(shù)P作為總體的估計值。[例]工會為了了解春游期間需用幾輛公共汽車，在全廠10000名職工中進行了共100人的簡單隨機抽樣調(diào)查。統(tǒng)計結(jié)果，其中有20名愿意外出春游。假設每輛車可載乘客50名，問估計要預租多少輛公共汽車？用樣本成數(shù)來估計。[例]研究者要調(diào)查某社區(qū)居民家庭收入分布的差異情況，現(xiàn)隨機抽查了10戶，得到樣本方差為＝200(元2)。試以此資料估計總體家庭收入分布的差異情況。

[解]因為樣本容量較小，宜用修正樣本方差作為總體方差點估計量。即

＝＝＝222.26.5區(qū)間估計（Intervalestimation)區(qū)間估計的任務是，在點估計值的兩側(cè)設置一個區(qū)間，使得總體參數(shù)被估計到的概率大大增加?？煽啃院途_性(即信度和效度)在區(qū)間估計中是相互矛盾的兩個方面。

6.5.1有關區(qū)間估計的幾個概念置信區(qū)間：區(qū)間估計是求所謂置信區(qū)間的方法。置信區(qū)間就是我們?yōu)榱嗽黾訁?shù)被估計到的信心而在點估計兩邊設置的估計區(qū)間。區(qū)分精確性與可靠性顯著性水平

α：表示用置信區(qū)間來估計的不可靠的概率。置信度（水平）1-α：表示置信區(qū)間估計的可靠性（把握度）。例如置信水平取0.90。抽樣平均誤差與概率度

Z抽樣平均誤差：樣本均值抽樣分布的標準差。反映在參數(shù)周圍抽樣平均值的平均變異程度。越大，樣本均值越分散。概率度：Z在參數(shù)估計中被稱為概率度，其大小由

α決定.

顯著性水平、置信水平、概率度之間的關系：

=0.10時，1-

=0.90，Zα/2=1.65

α=0.05時，1-

=0.95，Zα/2=1.96

α=0.01時，1-

=0.99，Zα/2=2.582023/2/5186.5.2區(qū)間估計的做法從點估計值開始，向兩側(cè)展開一定倍數(shù)的抽樣平均誤差，并估計總體參數(shù)很可能就包含在這個區(qū)間之內(nèi)。置信區(qū)間的大小主要由和Z這兩個量所決定，并且是2Z。所以參數(shù)μ的區(qū)間估計就歸結(jié)為計算這兩個量（即就各種抽樣分布計算概率度和就各種抽樣方式計算抽樣平均誤差）。

的大小對設置置信區(qū)間的范圍起著很重要的作用。在同等置信度的情況下，抽樣平均誤差小，估計區(qū)間就縮小了，從而獲得對參數(shù)較為有效的估計（決定效度的關鍵因素）。Z則與信度相聯(lián)系。對參數(shù)μ的區(qū)間估計的步驟：

1.首先從總體抽取一個樣本，根據(jù)收集的樣本資料求出它的均值。

2.根據(jù)合乎實際的置信水平查表求得概率度

3.根據(jù)總體標準差和樣本容量求出抽樣平均誤差

4.以均值為基準，向兩側(cè)展開Z倍抽樣平均誤差的區(qū)間。根據(jù)總體方差是否知道，估計分兩種情況。（1）已知（2）未知，用S代替6.5.3大樣本，總體均值的區(qū)間估計[例]設某工廠婦女從事家務勞動服從正態(tài)分布N

[μ

，0.662]，根據(jù)36人的隨機抽樣調(diào)查，樣本每天平均從事家務勞動的時間為2.65小時，求μ的置信區(qū)間（置信度1-α

=0.95）。

[解]按題意，此為大樣本，且總體方差已知，又

n＝36，＝2.65，＝0.66，1-α＝0.95。查表得Z＝1.96，代入公式有＝2.65±1.96＝2.65±0.22

因此，有95％的把握，該廠婦女平均從事家務勞動的時間在2.87～2.43小時之間。[例]從某校隨機地抽取100名男學生，測得平均身高為170厘米，標準差為7.5厘米，試求該校學生平均身高95％的置信區(qū)間。

[解]按題意，此為大樣本，且總體方差未知，又n＝100，＝170，S＝7.5，1—α＝0.95．查表得＝1.96，代入公式有

=170±1.96＝170±1.47因此，有95％的把握，該校學生的平均身高在168.5~171.5厘米之間。[習題]從來自“白領犯罪與罪犯生涯：一些初步研究結(jié)果”的一項研究報告的數(shù)據(jù)表明，白領犯罪可能是年紀較大者，并且顯示比街頭罪犯有較低的犯罪率。給出數(shù)據(jù)為：白領犯罪發(fā)作平均年齡為54歲，n

=100，標準差被估計為7.5歲。建立真實平均年齡的90%置信區(qū)間。采用t分布6.5.4小樣本，正態(tài)總體均值區(qū)間估計[例]在一個正態(tài)總體中抽取一個容量為25的樣本，其均值為52，標準差為12，求置信水平為95％的總體均值的置信區(qū)間。

[解]根據(jù)題意，總體方差未知，且為小樣本，故用t分布統(tǒng)計量。由95％置信水平查t分布表得概率度＝(24)＝2.064

代入公式得

＝52±2.064＝52±4.95因此，置信水平95％的總體均值的置信區(qū)間是從47.05到56.95。從總體的均值估計過渡到總體的成數(shù)估計，其方法和思路完全相同，只要用代替，用代替。6.5.5大樣本總體成數(shù)的估計[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本，發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開支上作決定的次數(shù)超過半數(shù)。試問家庭開支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少？（置信水平99%）[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本，發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開支上作決定的次數(shù)超過半數(shù)。試問家庭開支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少？（置信水平99%）

[解法一][解法二]2023/2/530n1≥50n2≥50現(xiàn)在從兩總體獨立地各抽取一個隨機樣本：只要樣本都大于或等于50，則兩個樣本均值的抽樣分布都服從正態(tài)分布，根據(jù)正態(tài)隨機變量線性組合的隨機變量仍然服從正態(tài)分布的原理，則均值差也服從正態(tài)分布。6.5.5大樣本二總體均值差的估計若總體方差未知，則用樣本方差代替總體方差。在大樣本的情況下置信度為1-a的（μ1-μ2）的區(qū)間估計為：2023/2/533

與單樣本成數(shù)的區(qū)間估計一樣，成數(shù)差區(qū)間估計可以被看作均值差的特例來處理(但它適用于各種量度層次)。即對給定的置信水平（1―α），得兩總體成數(shù)差(p1―p2)之估計區(qū)間為

6.5.5大樣本成數(shù)差的區(qū)間估計2023/2/534

[例]有一個大學生的隨機樣本，按照性格“外向”和“內(nèi)向”，把他們分成兩類。結(jié)果發(fā)現(xiàn)，新生中有73％屬于“外向”類，四年級學生中有58％屬于“外向”類。樣本中新生有171名，四年級學生有117名。試在99％的置信水平上，求新生、老生性性格“外向”的成數(shù)差的置信區(qū)間。2023/2/535

[解]據(jù)題意，

新生組的抽樣結(jié)果為：＝0.73，

＝027，

n1＝171(人)

四年級學生組的抽樣結(jié)果為：

＝0.58，

＝0.42，n2＝117(人)

由（1―α）＝0.99，得Zα/2＝Z0.005＝2.58，代入上式得

得在99％置信水平上，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

社會統(tǒng)計學-參數(shù)估計

文檔簡介

溫馨提示

最新文檔

評論

社會統(tǒng)計學-參數(shù)估計

文檔簡介

溫馨提示

最新文檔

評論

相關文檔