




已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章從樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),第一節(jié)點(diǎn)估計(jì)第二節(jié)區(qū)間估計(jì)一、樣本平均數(shù)的抽樣分布二、總體平均數(shù)的區(qū)間估計(jì),1,從樣本統(tǒng)計(jì)量估計(jì)或推斷總體參數(shù)是推斷統(tǒng)計(jì)的一個(gè)重要部分。我們?cè)谝搿皹颖尽焙汀翱傮w”這兩個(gè)概念時(shí)看到,語(yǔ)言研究所涉及的總體往往非常大(甚至是無(wú)限大的),因而難以對(duì)其中所有個(gè)體都加以研究,研究者們所能做的只是通過(guò)隨機(jī)的方法從總體中抽取一個(gè)具有代表性的樣本加以研究,然后再?gòu)挠嘘P(guān)樣本統(tǒng)計(jì)量來(lái)估計(jì)或推斷未知的總休參數(shù),例如從樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)。本章只討論如何從樣本平均數(shù)X和比分別估計(jì)總體平均數(shù)和比。估計(jì)的方法有兩種:點(diǎn)估計(jì)與區(qū)間估計(jì)。,2,第一節(jié)點(diǎn)估計(jì),當(dāng)總休平均數(shù)或比例未知時(shí),我們可以直接把樣本平均數(shù)或比例用作它的估計(jì)值。由于樣本統(tǒng)計(jì)量為數(shù)軸上的一個(gè)點(diǎn),所以稱為“點(diǎn)估計(jì)值”。一個(gè)理想的點(diǎn)估計(jì)值至少應(yīng)具備以下兩個(gè)條件:,3,(1)無(wú)偏性,一般情況下,樣本統(tǒng)計(jì)量是不會(huì)和相應(yīng)的總體參數(shù)完全相同的,兩者多少都會(huì)有一定的差距,但是如果用無(wú)限多個(gè)樣本的統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),平均估計(jì)誤差將會(huì)等于0。具有這一特征的統(tǒng)計(jì)量就無(wú)偏估計(jì)值。例如,用樣本平均數(shù)估計(jì)總體平均數(shù)時(shí),總會(huì)有些誤差,在有些樣本中,它可能會(huì)大于總體平均數(shù),而在另一些樣本中它又可能會(huì)小于總體平均數(shù),而且對(duì)于不同的樣本估計(jì)誤差的大小也是不同的,但是無(wú)限多個(gè)樣本平均數(shù)的平均估計(jì)誤差為0。換句話說(shuō),樣本平均數(shù)的平均數(shù)將會(huì)等于總體平均數(shù)。,4,因而樣本平均數(shù)是一個(gè)無(wú)偏點(diǎn)估計(jì)值(在第四章里,我們?cè)谟懻摌颖痉讲詈蜆?biāo)準(zhǔn)差時(shí)曾經(jīng)指出,公式中要用N-1(而不能用N)做分母,就是要保證方差和標(biāo)準(zhǔn)差具有無(wú)偏性,因?yàn)橛肗做分母時(shí),樣本方差一般要小于總休的方差)。(2)一致性。樣本容量越大,根據(jù)樣本計(jì)算出的估計(jì)值越接近總體參數(shù)的真值。作為總休平均數(shù)的估計(jì)值,樣本平均數(shù)就具有一致性。,5,第二節(jié)區(qū)間估計(jì),即便是一個(gè)理想的點(diǎn)估計(jì)值,也無(wú)法克服點(diǎn)估計(jì)的一個(gè)致命缺陷,那就是它易受樣本變化的影響:每次抽取的樣本不同,得出的統(tǒng)計(jì)量也就不同,因而它所提供的參數(shù)估計(jì)值也就會(huì)不同。如果能把抽樣所帶來(lái)的這種變異性或不確定性考慮進(jìn)去,對(duì)總體參數(shù)的估計(jì)將會(huì)更有意義簡(jiǎn)而言之,區(qū)間估計(jì)就是為總體參數(shù)計(jì)算出一個(gè)可能的取值范圍或值域,然后指出總體參數(shù)處在該值域的可能性有多大。,6,一、樣本平均數(shù)的抽樣分布,假如有一個(gè)變量的總體(至于何種總體無(wú)關(guān)緊要),我們從中隨機(jī)抽取取一個(gè)含有若干個(gè)觀測(cè)值的樣本(記作S1),計(jì)算出樣本平均數(shù)(記作X1),然后把所抽取的觀測(cè)值再放回總體。按照此法,再抽取樣本S2,得樣本平均數(shù)X2,等等。從理論上講,我們可以無(wú)限次地重復(fù)這一過(guò)程,抽取n個(gè)樣本,計(jì)算出n個(gè)樣本平均數(shù)。正如我們可以為觀測(cè)值繪制分布圖那樣,我們也可以為這些樣本平均數(shù)繪制分布圖(為了便于理解,不妨把這些平均數(shù)看作觀測(cè)值),這個(gè)分布就叫做平均數(shù)的抽樣分布。,7,1.(漸近)正態(tài)分布,平均數(shù)的抽樣分布的形態(tài)取決于總體的分布和總體方差是否已知,以及樣本容量的大?。寒?dāng)總體的分布為正態(tài),總體方差已知時(shí),樣本平均數(shù)的分布為正態(tài)分布;當(dāng)總體的分布為非正態(tài),總體方差已知時(shí),如果樣本較大,則樣本平均數(shù)的分布接近正態(tài)分布,其樣本越大,總體偏接近的程度取決于樣本容量以及總體的偏斜程度斜程度越輕,兩者就越接近。這一現(xiàn)象叫做“中心極限定理”。,8,當(dāng)樣本平均數(shù)的分布為正態(tài)或漸近正態(tài)時(shí),分布的平均數(shù)與總體平均數(shù)相等,而分布的離散程度則小于總休的離散程度。如果橫軸上的測(cè)量單位相同,那么總體的分布形態(tài)較為平闊,而樣本平均數(shù)的分布則較為尖狹。不過(guò),如前所述,一個(gè)呈正態(tài)分布的變量可以通過(guò)求標(biāo)準(zhǔn)分的方法,轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)變量(見(jiàn)第五章),我們也可以用此方法把每個(gè)樣本平均數(shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分,進(jìn)而把正態(tài)的樣本平均數(shù)的抽樣分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,公式為,9,樣本平均數(shù)分布的離散程度是用樣本平均數(shù)的抽樣分布的標(biāo)準(zhǔn)差來(lái)表示的。為了與樣本標(biāo)準(zhǔn)差區(qū)別開來(lái),抽樣分布的標(biāo)準(zhǔn)差習(xí)慣上稱作“標(biāo)準(zhǔn)誤”,用符號(hào)SE表示。標(biāo)準(zhǔn)誤與樣本容量(N)以及總體的標(biāo)準(zhǔn)差有關(guān),即也就是說(shuō),標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差的大小成正比,與樣本的大小成反比(嚴(yán)格來(lái)說(shuō)是與樣本大小的開方成反比,因此在總休標(biāo)準(zhǔn)差一定時(shí),為了使標(biāo)準(zhǔn)誤減少一半,就必須使樣本容量擴(kuò)大四倍)。,10,2.t分布,前面講的是樣本平均數(shù)呈正態(tài)分布或接近正態(tài)分布的情況。此外,還有兩種情況:一是總體分布為正態(tài),但總體方差未知,且樣本容量又較??;二是總休分布為非正態(tài),而且總體方差未知,樣本容量又較小。在這些情況下,樣木平均數(shù)的分布為t分布這是因?yàn)榭傮w力一差末知,在計(jì)算這一比率時(shí),要用樣本標(biāo)準(zhǔn)差S取代,但是在樣本較小的情況下,樣本方差差S2作為總體方差的估計(jì)值并不是很準(zhǔn)確的,這時(shí)不再呈正態(tài)分布,而是呈“t分布”,因而該比率也就不再稱作Z值,而是t值。,11,t分布在某些方面與正態(tài)分布是一樣的,譬如它的平均值為0,平均值兩側(cè)是對(duì)稱的,左側(cè)t為負(fù)值,右側(cè)為正值。但是不同的是,t分布的方差要大于(標(biāo)準(zhǔn))正態(tài)分布的方差(即大于1),因而與正態(tài)分布相比,t分布的中間要低平一些。樣本越小,分布的方差就越大,其中間也就越低,兩尾端就翹得越高。反過(guò)來(lái),隨著樣本容量的增加,t分布的方差(逐漸接近1),而當(dāng)樣本容量大到一定程度時(shí),t分布的方差就等于1。因而,t分布的形狀隨著樣本大小的變化而變化,但是這里“樣本大小”不是通常所指的N,而是N-1(即樣本容量減1),即所謂的“自由度”。,12,從以上的討論可以看到,雖然決定樣本平均數(shù)分布的因素有總體的分布形態(tài)、總體方差是否已知以及樣本容量,但是由于在實(shí)際應(yīng)用中總體的分布情況和方差往往是未知的(當(dāng)然在語(yǔ)言研究中經(jīng)常遇到的許多變量都是呈正態(tài)分布的),因而在多數(shù)情況下,樣本的容量就成了關(guān)鍵因素或唯一的因素。因而,除非對(duì)統(tǒng)計(jì)的條件要求很嚴(yán)格或?qū)y(tǒng)計(jì)結(jié)果的準(zhǔn)碗性要求非常高,一般是避繁就簡(jiǎn),而僅考慮樣本的容量:樣本較大時(shí),就認(rèn)定其平均數(shù)的抽樣分布為正態(tài)分布,否則為t分布。至于何為“大樣本”,下面還要進(jìn)一步討論。,13,二、總體平均數(shù)的區(qū)間估計(jì),顧名思義,區(qū)間估計(jì)不像點(diǎn)估計(jì)那樣給出一個(gè)值(樣本統(tǒng)計(jì)量)作為總體的參數(shù),而是在樣本的基礎(chǔ)上計(jì)算出總體參數(shù)值所在的可能區(qū)域。由于這個(gè)區(qū)域在數(shù)軸上不是一個(gè)點(diǎn),而是一個(gè)區(qū)間或一段距離,所以稱作“區(qū)間估計(jì)值”。,14,1.樣本抽樣分布為正態(tài)時(shí)的區(qū)間估計(jì),(1)幾個(gè)基本概念置信水平:從樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)時(shí)的把握程度或信心程度。置信區(qū)間:兩個(gè)標(biāo)準(zhǔn)誤的值所界定的區(qū)間。置信界限:這一區(qū)間的上下界。臨界值:定義這一置信區(qū)間的標(biāo)準(zhǔn)誤的值。,15,(2)總體平均數(shù)的區(qū)間估計(jì)從樣本平均數(shù)X來(lái)估計(jì)總體平均數(shù),是進(jìn)行總體參數(shù)估計(jì)的常見(jiàn)情形之一。這時(shí),我們的任務(wù)就是根據(jù)樣本平均數(shù)計(jì)算出總體平均數(shù)可能落入的置信區(qū)間,以此來(lái)估計(jì)總體平均數(shù)的可能取值范圍。該置信區(qū)間的計(jì)算方法是我們看到,對(duì)于大樣本,抽樣分布服從正態(tài)分布,這時(shí)式中的“臨界值”為對(duì)應(yīng)于某置信水平(或顯著水平)的Z值(從正態(tài)分布表中可以查到)。該式用符號(hào)表示,則為或,16,第二式表示處于其兩邊的式子(表示置信區(qū)間的下限和上限)所界定的范圍之內(nèi)。式中表示以平均數(shù)為界置信水平的一半所對(duì)應(yīng)的Z值。在有的書中該項(xiàng)寫成,這表示顯著水平的一半(即正態(tài)分布的一端的尾巴)所對(duì)應(yīng)的Z值。不同的表示方法適用于按不同的方法編制的正態(tài)分布表(第二式適用于本書所列的正態(tài)分布表),但最后查得的Z值是一樣的。在計(jì)算標(biāo)準(zhǔn)誤時(shí),如果總體標(biāo)準(zhǔn)差未知,則用樣本標(biāo)準(zhǔn)差S代替,即。,17,(3)比例的區(qū)間估計(jì)如同對(duì)總體平均數(shù)的估計(jì)那樣,我們可以為其計(jì)算一個(gè)可能的取值區(qū)間(即置信區(qū)間),并同時(shí)指出正確估計(jì)的概率。為了計(jì)算此置信區(qū)間,同樣要先計(jì)算樣本的比例的抽樣分布的標(biāo)準(zhǔn)誤SE公式為樣本中的比例,N樣本容量。,18,計(jì)算總體比例P的置信區(qū)間的公式為用符號(hào)表示為式中校正值。對(duì)于較大的樣本,加與不加該值對(duì)結(jié)果不會(huì)有太大的影響,但當(dāng)樣本較小時(shí),則最好加上。,19,2.從小樣本對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì),我們上面討論的是當(dāng)樣本平均數(shù)的抽樣分布為正態(tài)時(shí)如何對(duì)總體平均數(shù)或比例進(jìn)行估計(jì)。從小樣本對(duì)總體平均數(shù)或比例進(jìn)行區(qū)間估計(jì)的方法是一樣的,即:。唯一不同的是,當(dāng)樣本較小時(shí),其抽樣分布不是正態(tài)分布,而是t分布。這時(shí),公式中的“臨界值”不再是從正態(tài)分布表中查得的Z值,而是t分布表中對(duì)應(yīng)于某一置信水平或顯著水平的t值。,20,3.置信區(qū)間與置信水平、樣本容量以及標(biāo)準(zhǔn)差的關(guān)系,區(qū)間估計(jì)是在樣本統(tǒng)計(jì)量的基礎(chǔ)上來(lái)估計(jì)相應(yīng)的總體參數(shù),因而我們所希望的當(dāng)然是:這一區(qū)間越小越好,而估計(jì)的正確概率越大越好。但是,從進(jìn)行區(qū)間估計(jì)的公式可以看出,在其它條件一定時(shí),要提高正碗估計(jì)的概率(即提高置信水平),置信區(qū)間就不可避免地會(huì)增大,而要使置信區(qū)間縮小,就要降低正確估計(jì)的概率。必須牢記的是,置信水平越低,置信區(qū)間越小,該區(qū)間不包括總體參數(shù)的可能性就越大;置信水平越高,置信區(qū)間越大,該區(qū)間包括總體參數(shù)的可能性就越大。,21,4.樣本容量,樣本的“大”與“小”是相對(duì)的,一般情況下,一個(gè)變量的總體的分布是未知的。如果一個(gè)量是由數(shù)個(gè)互相獨(dú)立的部分相加而來(lái)的,那么該量的分布一般為正態(tài).在語(yǔ)言研究中經(jīng)常遇到的許多變量(例如“測(cè)試分?jǐn)?shù)”)都具有這種性質(zhì),那么不需要太大的樣本容量就可以保證樣本平均數(shù)的正態(tài)分布。當(dāng)樣本容量大于30時(shí),不論總體的分布是否為正態(tài),基本上都可以保證樣本平均數(shù)的抽樣分布為正態(tài)或接近正態(tài)。因此,一般30為界,樣本的觀測(cè)值少于30,就是“小”樣本,大于30就叫做“大”樣本。,22,此外,所需樣本容量的大小與其中觀測(cè)值是否互相獨(dú)立也有關(guān)系。如果它們不具備相互獨(dú)立性(觀測(cè)值之間在有關(guān)方面互相聯(lián)系,或者一些觀測(cè)值的性質(zhì)受其它觀測(cè)值的影響),就需要增大樣本容量才能保證樣本平均數(shù)的正態(tài)分布。,23,5.要達(dá)到一定的精確度,如何計(jì)算所需樣本容量,估計(jì)總體平均數(shù):如果用E來(lái)表示容許的誤差(或估計(jì)的精確度),以表示總體標(biāo)準(zhǔn)差,以Z表示對(duì)應(yīng)于某一置信水平)的標(biāo)準(zhǔn)分(假設(shè)抽樣分布為正態(tài)),所需樣本容量的計(jì)算公式為但是,在通常情況下,總體的標(biāo)準(zhǔn)差都是未知的,因此在計(jì)算所需樣本容量之前,就需要先抽取一個(gè)小一些的樣本,計(jì)算出標(biāo)準(zhǔn)差S,以此作為總體標(biāo)準(zhǔn)差的估計(jì)值,這時(shí),上面的公式就應(yīng)改寫為,24,估計(jì)總體比例:同樣可以設(shè)定一個(gè)容許誤差,然后計(jì)算所需樣本容量。估計(jì)總休比例的公式是當(dāng)樣本容量較大時(shí),要不要校正值關(guān)系不
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2026學(xué)年遼源市龍山區(qū)數(shù)學(xué)三年級(jí)第一學(xué)期期末達(dá)標(biāo)檢測(cè)試題含解析
- 2025-2026學(xué)年甘肅省慶陽(yáng)市環(huán)縣三年級(jí)數(shù)學(xué)第一學(xué)期期末復(fù)習(xí)檢測(cè)模擬試題含解析
- 2025-2026學(xué)年撫州市崇仁縣三上數(shù)學(xué)期末試題含解析
- 2025-2026學(xué)年福建省泉州市南安市三上數(shù)學(xué)期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)模擬試題含解析
- 2024年黃岡市羅田縣數(shù)學(xué)三年級(jí)第一學(xué)期期末聯(lián)考試題含解析
- 護(hù)理學(xué)的創(chuàng)新實(shí)踐執(zhí)業(yè)醫(yī)師考試試題及答案
- 衛(wèi)生資格考試難點(diǎn)突破試題及答案
- 醫(yī)學(xué)與人際關(guān)系的試題及答案
- 對(duì)比分析衛(wèi)生資格考試的變化試題及答案
- 系統(tǒng)化學(xué)習(xí)的行政法學(xué)試題及答案
- 分子診斷技術(shù)在感染性疾病中的應(yīng)用
- 龍門吊安裝拆除安全施工專項(xiàng)方案
- 盆腔器官脫垂的中國(guó)診治指南(2023年)
- 如何做好醫(yī)患溝通
- 2022年浙江建設(shè)技師學(xué)院工作人員招聘考試真題
- 食品安全責(zé)任保險(xiǎn)課件
- 國(guó)開電大《應(yīng)用寫作(漢語(yǔ))》形考任務(wù)1-6答案
- 穿孔機(jī)作業(yè)指導(dǎo)書
- 統(tǒng)考考生本科志愿樣表
- 人教鄂教版六年級(jí)下冊(cè)科學(xué)全冊(cè)知識(shí)點(diǎn)匯總
- 新航道托福雅思培訓(xùn)班
評(píng)論
0/150
提交評(píng)論