6教育統(tǒng)計學(xué)第六章課件_第1頁
6教育統(tǒng)計學(xué)第六章課件_第2頁
6教育統(tǒng)計學(xué)第六章課件_第3頁
6教育統(tǒng)計學(xué)第六章課件_第4頁
6教育統(tǒng)計學(xué)第六章課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章抽樣分布及總體

平均數(shù)的推斷

第一節(jié)抽樣分布

第二節(jié)總體平均數(shù)的推斷

第三節(jié)假設(shè)檢驗的基本原理

第四節(jié)總體平均數(shù)的顯著性檢驗第六章抽樣分布及總體

平均數(shù)的1一、抽樣分布的概念區(qū)分三種不同性質(zhì)的分布總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一統(tǒng)計量的頻數(shù)分布

第一節(jié)抽樣分布

二、平均數(shù)抽樣分布的幾個定理(1)從總體中隨機抽取容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù),即一、抽樣分布的概念第一節(jié)抽樣分布二、平均數(shù)抽2

(2)容量為n的平均數(shù)在抽樣分布上的標準差,等于總體標準差除以n的平方根,即(3)從服從正態(tài)分布的總體中,隨機抽取容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。(4)雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體和的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。(2)容量為n的平均數(shù)在抽樣分布上的標準差3以上幾條定理反應(yīng)了平均數(shù)抽樣分布的形態(tài),一切可能樣本平均數(shù)與總體平均數(shù)之間的關(guān)系;平均數(shù)抽樣分布的標準差與總體標準差之間的關(guān)系。抽樣分布是統(tǒng)計推斷的理論依據(jù)。實際中只能抽取一個隨機樣本根據(jù)一定的概率來推斷總體的參數(shù)。即使是抽取一切可能樣本,計算出的某種統(tǒng)計量與總體相應(yīng)參數(shù)的真值,大多也是不相同的,這是由于抽樣誤差的緣故。抽樣誤差用抽樣分布的標準差來表示。因此,某種統(tǒng)計量在抽樣分布上的標準差稱為該種統(tǒng)計量的標準誤。標準誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大,所以標準誤是統(tǒng)計推斷可靠性的指標。以上幾條定理反應(yīng)了平均數(shù)抽樣分布的形態(tài)4三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量的形態(tài)

從正態(tài)總體中隨機抽取樣本容量為n的一切可能樣本平均數(shù)以總體平均數(shù)為中心呈正態(tài)分布。當總體標準差已知時:當總體標準差未知時:三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量的形態(tài) 5總體標準差的無偏估計量為總體標準差的無偏估計量為6參數(shù)估計假設(shè)檢驗

一、總體參數(shù)估計的基本原理根據(jù)樣本統(tǒng)計量對相應(yīng)總體參數(shù)所作的估計叫總體參數(shù)估計??傮w參數(shù)估計分為點估計和區(qū)間估計。1.點估計

點估計是指用樣本統(tǒng)計量的值來估計相應(yīng)總體參數(shù)的值。點估計的優(yōu)點在于它能夠提供總體參數(shù)的估計值;缺點在于它總是以誤差的存在為前提,但又不能提供正確估計的概率。第二節(jié)總體平均數(shù)的估計參數(shù)估計假7良好估計量的標準

(1)無偏性:用統(tǒng)計量估計總體參數(shù)一定會有誤差,不可能恰恰相同。因此,好的估計量應(yīng)該是一個無偏估計量,即用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值,其偏差的的平均值為0。

(2)有效性:當總體參數(shù)的無偏估計不止一個統(tǒng)計量,無偏估計變異性小者有效性高,變異大者有效性低。(3)一致性:當樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,估計值越來越精確,逐漸趨近于真值。(4)充分性:一個容量為的樣本統(tǒng)計量,是否充分地反映了全部個數(shù)據(jù)所反映總體的信息。

良好估計量的標準82.區(qū)間估計

區(qū)間估計的概念區(qū)間估計是指以樣本統(tǒng)計量的樣本分布為理論依據(jù),按一定的概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍。置信區(qū)間與顯著性水平置信區(qū)間是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。

顯著性水平是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用α表示。1-α為置信度或置信水平。2.區(qū)間估計9區(qū)間估計的原理

區(qū)間估計的原理是樣本分布理論。在計算區(qū)間估計值、解釋估計的正確概率時,依據(jù)是該樣本統(tǒng)計量的分布規(guī)律及樣本分布的標準誤。下面以平均數(shù)的區(qū)間估計為例,說明如何根據(jù)平均數(shù)的樣本分布及平均數(shù)分布的標準誤,計算置信區(qū)間和解釋成功估計的概率。當總體標準差σ為已知時,樣本平均數(shù)的分布為正態(tài)分布或漸近正態(tài)分布,此時樣本平均數(shù)分布的平均數(shù),標準誤。根據(jù)正態(tài)分布,可以說:有95%的落在

之間,或者說:

之間包含所有的的95%

,即

區(qū)間估計的原理10

但是,在實際研究中,只能得到一個樣本平均數(shù),我們可以將這個樣本平均數(shù)看做是無限多個樣本平均數(shù)之中的一個。于是將上式經(jīng)過移項寫成這意味著有95%的μ落在之間,或者說,估計μ落在

之間正確的概率為95%

。

11估計總體平均數(shù)的步驟

(1)根據(jù)實得樣本的數(shù)據(jù),計算樣本平均數(shù)與標準差。(2)計算標準誤。 (已知)或(未知)(3)確定置信區(qū)間或顯著性水平。(4)根據(jù)樣本平均數(shù)的抽樣分布,確定查何種統(tǒng)計表。(5)計算置信區(qū)間。(正態(tài)分布)或(t分布)(6)解釋總體平均數(shù)的置信區(qū)間。估計總體平均數(shù)的步驟12總體方差σ2已知時,對總體平均數(shù)μ的估計

(1)當總體分布為正態(tài)時

當總體分布為正態(tài),總體方差已知時,樣本平均數(shù)的分布為正態(tài)分布,這時可用下式計算其置信區(qū)間:

(其中)(2)當總體分布為非正態(tài)時總體分布非正態(tài),總體方差

已知,這時只有當樣本容量

時,其樣本平均數(shù)的分布為漸近正態(tài)分布,這時可用下式計算其置信區(qū)間:

(其中)總體方差σ2已知時,對總體平均數(shù)μ的估計(1)當總體分布13例如:某小學(xué)10歲全體女童身高歷年來標準差6.25cm,現(xiàn)從該校隨機抽27名10歲女童,測得平均身高為134.2cm,試估計該校全體10歲女童平均身高95%和99%置信區(qū)間。例如:某小學(xué)10歲全體女童身高歷年來標準差6.14總體方差σ2未知時,對總體平均數(shù)μ的估計

(1)當總體分布為正態(tài)時

當總體分布為正態(tài),總體方差

未知時,樣本平均數(shù)的分布為t分布,這時可用下式計算其置信區(qū)間:

(其中)

(2)當總體分布為非正態(tài)時總體分布非正態(tài),總體方差

未知,這時只有當樣本容量

時,其樣本平均數(shù)的分布為漸近t分布,這時可用下式計算其置信區(qū)間:

(其中)總體方差σ2未知時,對總體平均數(shù)μ的估計(1)當總體分布15小樣本的情況例如,從某小學(xué)二年級隨機抽取12名學(xué)生,其閱讀能力得分為28、32、36、22、34、30、33、25、31、33、29、26.試估計該校二年級閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。小樣本的情況例如,從某小學(xué)二年級隨機抽取12名16大樣本的情況例如,從某年高考中隨機抽取102份作文試卷,平均分數(shù)為26,標準差為1.5,估計總體平均數(shù)95%和99%的置信區(qū)間。說明:樣本容量n=103>30,t分布接近正態(tài)分布,故可用正態(tài)分布近似處理。大樣本的情況例如,從某年高考中隨機抽取102份17第三節(jié)假設(shè)檢驗的基本原理

一、假設(shè)

假設(shè)是根據(jù)已知理論與事實對研究對象所做的假定性說明,統(tǒng)計學(xué)中的假設(shè)一般專指用統(tǒng)計學(xué)術(shù)語對總體參數(shù)所做的假定性說明。在進行任何一項研究時,都需要根據(jù)已有的理論和經(jīng)驗對研究結(jié)果作出一種預(yù)想的希望證實的假設(shè),這種假設(shè)叫科學(xué)假設(shè),用統(tǒng)計術(shù)語表示時叫研究假設(shè)(備擇假設(shè)),記作H1。在統(tǒng)計學(xué)中不能對H1的真實性直接檢驗,需要第三節(jié)假設(shè)檢驗的基本原理一、假設(shè)18建立與之對立的假設(shè),稱做零假設(shè)(虛無假設(shè),無差假設(shè),原假設(shè)),記作H0。

假設(shè)檢驗的問題,就是要判斷零假設(shè)H0

是否正確,決定接受還是拒絕零假設(shè)H0,若拒絕零假設(shè)H0

,則接受備擇假設(shè)H1。假設(shè)檢驗是從零假設(shè)出發(fā),視其被拒絕的機會,如果根據(jù)樣本信息,不得不否定零假設(shè)的真實性時,就不得不承認備擇假設(shè)的真實性,這時,就要拒絕零假設(shè)而接受備擇假設(shè);如果根據(jù)樣本的信息不能否定零假設(shè)的真實性時,就要保留零假設(shè)而拒絕備擇假設(shè)。建立與之對立的假設(shè),稱做零假設(shè)(虛無假設(shè),無差假設(shè),原假設(shè))19

二、小概率事件

假設(shè)檢驗的基本思想是概率性質(zhì)的反證法。為了檢驗零假設(shè),首先假定零假設(shè)為真。在零假設(shè)為真的前提下,如果導(dǎo)致違反邏輯或違反人們常識和經(jīng)驗的不合理現(xiàn)象出現(xiàn),則表明“零假設(shè)為真”的假定是不正確的,也就不難接受零假設(shè)。若沒有導(dǎo)致不合理的現(xiàn)象出現(xiàn),那就認為“零假設(shè)為真”的假定是正確的,也就是接受了零假設(shè)。二、小概率事件20假設(shè)檢驗中的“反證法”思想不同于數(shù)學(xué)中的反證法,后者是在假設(shè)某一條件下導(dǎo)致邏輯上的矛盾從而否定原來的假設(shè)。假設(shè)檢驗中“不合理現(xiàn)象”是指小概率事件在一次試驗中發(fā)生了,它是基于人們在實踐中廣泛采用的小概率事件原理(小概率事件原理是指“小概率事件在一次試驗中幾乎不可能發(fā)生”。通常情況下,將概率不超過0.05或0.01的事件當做“小概率事件”)。假設(shè)檢驗中的“反證法”思想不同于數(shù)學(xué)中的反證法,后者是21

三、假設(shè)檢驗中的兩類錯誤

統(tǒng)計學(xué)中將這類拒絕H0時所犯的錯誤稱做

α

錯誤,α

錯誤的概率,可以由研究者通過選擇適當?shù)娘@著性水平加以主動控制。稱這類接受H0時所犯的錯誤為β

錯誤,控制β錯誤的概率有以下兩種方法:①利用已知的實際總體參數(shù)值與假設(shè)參數(shù)值之間大小關(guān)系,合理安排拒絕區(qū)域的位置;②增大樣本的容量。兩類錯誤的關(guān)系:(1)

α+β

不一定等于1;(2)

α

與β

不可能同時減小或增大;(3)1-β

反映著正確辨認真實差異的能力。三、假設(shè)檢驗中的兩類錯誤22單側(cè)檢驗與雙側(cè)檢驗

只強調(diào)差異而不強調(diào)方向性的檢驗叫雙側(cè)檢驗,假設(shè)形式為強調(diào)某一方向的檢驗叫單側(cè)檢驗。右側(cè)檢驗:左側(cè)檢驗:單側(cè)檢驗與雙側(cè)檢驗只強調(diào)差異而不強調(diào)方向23假設(shè)檢驗的步驟

(1)根據(jù)問題要求,提出零假設(shè)和備擇假設(shè)。(2)選擇適當?shù)臋z驗統(tǒng)計量并計算其值。(3)規(guī)定顯著性水平。(4)選擇檢驗的方式(單側(cè)還是雙側(cè))。(5)做出統(tǒng)計決策。假設(shè)檢驗的步驟(1)根據(jù)問題要求,提出零假設(shè)和備擇24假設(shè)檢驗的基本思想引例

解假設(shè)檢驗的基本思想引例解25

我們知道,即使應(yīng)屆與歷屆成績一樣,即

成立,個別應(yīng)屆畢業(yè)生成績也是有波動的,成績r.v.正說明了這一點.故實測值與理論值總有一些差異.

用數(shù)理統(tǒng)計的語言就是說:如果

成立,即往屆應(yīng)屆成績一樣.

如果

不成立,即往屆應(yīng)屆成績不一樣.我們知道,即使應(yīng)屆與歷屆成績一樣,即26如何確定k呢?對于適當小的正數(shù)α(α=0.05,0.01,等),如何確定k呢?對于適當小的正數(shù)α(α=0.05,0.01,27由實際推斷原理若為真由實際推斷原理若為真28綜述假設(shè)檢驗方法的基本思想是:由樣本出發(fā),在為真的前提下通過對被檢參數(shù)的點估計量,結(jié)合統(tǒng)計量的分布,構(gòu)造統(tǒng)計量(樞軸函數(shù)),由此結(jié)合實際,并利用上α分位點確定小概率事件,便得檢驗真?zhèn)蔚臉藴?其思想方法是帶有概率的反證法,理論依據(jù)是實際水平推斷原理.綜述假設(shè)檢驗方法的基本思想是:由樣本出29注1稱為原假設(shè),稱為備擇假設(shè),

α稱為檢驗水平,U=稱為檢驗統(tǒng)計量.注2由小概率事件確定的區(qū)域W={U|}稱為拒絕域,而{U|}稱為接受域,稱為臨界值.注1稱為原假設(shè),稱為備擇假設(shè),30第四節(jié)總體平均數(shù)的顯著性檢驗平均數(shù)的顯著性檢驗是指根據(jù)樣本平均數(shù)與假設(shè)總體平均數(shù)的差異檢驗樣本所在總體的平均數(shù)與假設(shè)總體的平均數(shù)的差異。第四節(jié)總體平均數(shù)的顯著性檢驗平均數(shù)的顯著31(1)總體正態(tài)分布、總體方差已知的條件下平均數(shù)的顯著性檢驗

(2)總體正態(tài)分布、總體方差未知條件下平均數(shù)的顯著性檢驗

平均數(shù)顯著性檢驗的方法(1)總體正態(tài)分布、總體方差已知的條件下平均數(shù)的32

(3)總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗

①當n≥30時,盡管總體分布非正態(tài),對于平均數(shù)的顯著性檢驗仍可用Z檢驗。

(σ已知)或(σ未知)

②當n<30時,若總體分布非正態(tài),對于平均數(shù)的顯著性檢驗不符合近似Z檢驗的條件,嚴格講此時也不符合t檢驗的條件。(3)總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗33一、已知條件下總體平均數(shù)的顯著性檢驗例1:某小學(xué)歷屆畢業(yè)生漢語拼音測驗平均分數(shù)為66分,標準差為11.7.現(xiàn)已同樣的試題測驗應(yīng)屆畢業(yè)生,并從中隨機抽18份試卷,算的平均分為69分,問該校應(yīng)屆與往屆畢業(yè)生漢語拼音測驗成績是否一致?(1)提出假設(shè)一、已知條件下總體平均數(shù)的顯著性檢驗例1:34(2)選擇檢驗統(tǒng)計量并計算其值(3)確定檢驗形式雙側(cè)檢驗(2)選擇檢驗統(tǒng)計量并計算其值(3)確定檢驗形式35(4)統(tǒng)計決斷表6.2雙側(cè)Z檢驗統(tǒng)計決斷規(guī)則接收H0拒絕H1結(jié)論為:該校應(yīng)屆與歷屆畢業(yè)生漢語拼音成績無顯著性差異(4)統(tǒng)計決斷表6.2雙側(cè)Z檢驗統(tǒng)計決斷規(guī)則接收H036例2:某市高中入學(xué)考試數(shù)學(xué)平均分為68分,標準差為8.6.其中某所中學(xué)參加此次考試的46名學(xué)生的平均分數(shù)為63分,過去的資料表明,該校數(shù)學(xué)成績低于全市平均水平,問此次考試該校數(shù)學(xué)平均分數(shù)是否仍顯著低于全市平均分數(shù)?(1)提出假設(shè)例2:某市高中入學(xué)考試數(shù)學(xué)平均分為68分,標準37(2)選擇檢驗統(tǒng)計量并計算其值(3)確定檢驗形式左側(cè)檢驗(2)選擇檢驗統(tǒng)計量并計算其值(3)確定檢驗形式38(4)統(tǒng)計決斷表6.3單側(cè)Z檢驗統(tǒng)計決斷規(guī)則在0.01的水平上拒絕H0而接收H1。其結(jié)論為:該校高中入學(xué)考試數(shù)學(xué)的平均分數(shù)極其顯著的低于全市平均分數(shù)。(4)統(tǒng)計決斷表6.3單側(cè)Z檢驗統(tǒng)計決斷規(guī)則39二、未知條件下總體平均數(shù)的顯著性檢驗1.小樣本情況例1:某區(qū)初三英語統(tǒng)一測驗平均分數(shù)為65分,該區(qū)某校20份試卷的分數(shù)為:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62.問該校初三英語平均分數(shù)與全區(qū)是否一致?(1)提出假設(shè)二、未知條件下總體平均數(shù)的顯著性檢驗1.小樣本情況40(2)選擇檢驗統(tǒng)計量并計算其值未知,n=20<30(2)選擇檢驗統(tǒng)計量并計算其值未知,n=2041(4)統(tǒng)計決斷表6.3t檢驗統(tǒng)計決斷規(guī)則在0.05的顯著性水平上拒絕H0而接收H1。其結(jié)論為:該校初三英語平均分數(shù)與全區(qū)平均分數(shù)有本質(zhì)區(qū)別,或者說,它不屬于平均分為65的總體。(3)確定檢驗形式——雙側(cè)檢驗(4)統(tǒng)計決斷表6.3t檢驗統(tǒng)計決斷規(guī)則42例2:某校上一屆初一學(xué)生自學(xué)能力平均分為38分,這一屆初一24個學(xué)生自學(xué)能力平均分為42分,標準差為5.7.假定這一屆與上一屆初一學(xué)生的學(xué)習(xí)條件相同,問這一屆初一學(xué)生的自學(xué)能力是否高于上一屆?(1)提出假設(shè)例2:某校上一屆初一學(xué)生自學(xué)能力平均分為38分43(2)選擇檢驗統(tǒng)計量并計算其值未知,n=24<30(3)確定檢驗形式——右側(cè)檢驗(2)選擇檢驗統(tǒng)計量并計算其值未知,n=2444(4)統(tǒng)計決斷表6.3t檢驗統(tǒng)計決斷規(guī)則在0.01的顯著性水平上拒絕H0而接收H1。其結(jié)論為:這一屆初一學(xué)生的自學(xué)能力極其顯著的高于上一屆。(4)統(tǒng)計決斷表6.3t檢驗統(tǒng)計決斷規(guī)則452.大樣本情況例:某年高考某市數(shù)學(xué)平均分為60,現(xiàn)從參加此次考試的文科學(xué)生中,隨機抽取94份試卷,算得平均分數(shù)為58分,標準差為9.2,問文科數(shù)學(xué)成績與全市考生是否相同?(1)提出假設(shè)2.大樣本情況例:某年高考某市數(shù)學(xué)平均分為6046(2)選擇檢驗統(tǒng)計量并計算其值未知,n=94>30(3)確定檢驗形式——雙側(cè)檢驗(2)選擇檢驗統(tǒng)計量并計算其值未知,n=9447(4)統(tǒng)計決斷表6.3單側(cè)Z檢驗統(tǒng)計決斷規(guī)則在0.05的顯著性水平上拒絕H0而接收H1。其結(jié)論為:某市文科學(xué)生數(shù)學(xué)平均分數(shù)與全市平均分數(shù)有本質(zhì)區(qū)別,或者說,它不屬于平均數(shù)為60的總體。(4)統(tǒng)計決斷表6.3單側(cè)Z檢驗統(tǒng)計決斷規(guī)則48第六章抽樣分布及總體

平均數(shù)的推斷

第一節(jié)抽樣分布

第二節(jié)總體平均數(shù)的推斷

第三節(jié)假設(shè)檢驗的基本原理

第四節(jié)總體平均數(shù)的顯著性檢驗第六章抽樣分布及總體

平均數(shù)的49一、抽樣分布的概念區(qū)分三種不同性質(zhì)的分布總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一統(tǒng)計量的頻數(shù)分布

第一節(jié)抽樣分布

二、平均數(shù)抽樣分布的幾個定理(1)從總體中隨機抽取容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù),即一、抽樣分布的概念第一節(jié)抽樣分布二、平均數(shù)抽50

(2)容量為n的平均數(shù)在抽樣分布上的標準差,等于總體標準差除以n的平方根,即(3)從服從正態(tài)分布的總體中,隨機抽取容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。(4)雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體和的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。(2)容量為n的平均數(shù)在抽樣分布上的標準差51以上幾條定理反應(yīng)了平均數(shù)抽樣分布的形態(tài),一切可能樣本平均數(shù)與總體平均數(shù)之間的關(guān)系;平均數(shù)抽樣分布的標準差與總體標準差之間的關(guān)系。抽樣分布是統(tǒng)計推斷的理論依據(jù)。實際中只能抽取一個隨機樣本根據(jù)一定的概率來推斷總體的參數(shù)。即使是抽取一切可能樣本,計算出的某種統(tǒng)計量與總體相應(yīng)參數(shù)的真值,大多也是不相同的,這是由于抽樣誤差的緣故。抽樣誤差用抽樣分布的標準差來表示。因此,某種統(tǒng)計量在抽樣分布上的標準差稱為該種統(tǒng)計量的標準誤。標準誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大,所以標準誤是統(tǒng)計推斷可靠性的指標。以上幾條定理反應(yīng)了平均數(shù)抽樣分布的形態(tài)52三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量的形態(tài)

從正態(tài)總體中隨機抽取樣本容量為n的一切可能樣本平均數(shù)以總體平均數(shù)為中心呈正態(tài)分布。當總體標準差已知時:當總體標準差未知時:三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量的形態(tài) 53總體標準差的無偏估計量為總體標準差的無偏估計量為54參數(shù)估計假設(shè)檢驗

一、總體參數(shù)估計的基本原理根據(jù)樣本統(tǒng)計量對相應(yīng)總體參數(shù)所作的估計叫總體參數(shù)估計。總體參數(shù)估計分為點估計和區(qū)間估計。1.點估計

點估計是指用樣本統(tǒng)計量的值來估計相應(yīng)總體參數(shù)的值。點估計的優(yōu)點在于它能夠提供總體參數(shù)的估計值;缺點在于它總是以誤差的存在為前提,但又不能提供正確估計的概率。第二節(jié)總體平均數(shù)的估計參數(shù)估計假55良好估計量的標準

(1)無偏性:用統(tǒng)計量估計總體參數(shù)一定會有誤差,不可能恰恰相同。因此,好的估計量應(yīng)該是一個無偏估計量,即用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值,其偏差的的平均值為0。

(2)有效性:當總體參數(shù)的無偏估計不止一個統(tǒng)計量,無偏估計變異性小者有效性高,變異大者有效性低。(3)一致性:當樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,估計值越來越精確,逐漸趨近于真值。(4)充分性:一個容量為的樣本統(tǒng)計量,是否充分地反映了全部個數(shù)據(jù)所反映總體的信息。

良好估計量的標準562.區(qū)間估計

區(qū)間估計的概念區(qū)間估計是指以樣本統(tǒng)計量的樣本分布為理論依據(jù),按一定的概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍。置信區(qū)間與顯著性水平置信區(qū)間是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。

顯著性水平是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用α表示。1-α為置信度或置信水平。2.區(qū)間估計57區(qū)間估計的原理

區(qū)間估計的原理是樣本分布理論。在計算區(qū)間估計值、解釋估計的正確概率時,依據(jù)是該樣本統(tǒng)計量的分布規(guī)律及樣本分布的標準誤。下面以平均數(shù)的區(qū)間估計為例,說明如何根據(jù)平均數(shù)的樣本分布及平均數(shù)分布的標準誤,計算置信區(qū)間和解釋成功估計的概率。當總體標準差σ為已知時,樣本平均數(shù)的分布為正態(tài)分布或漸近正態(tài)分布,此時樣本平均數(shù)分布的平均數(shù),標準誤。根據(jù)正態(tài)分布,可以說:有95%的落在

之間,或者說:

之間包含所有的的95%

,即

區(qū)間估計的原理58

但是,在實際研究中,只能得到一個樣本平均數(shù),我們可以將這個樣本平均數(shù)看做是無限多個樣本平均數(shù)之中的一個。于是將上式經(jīng)過移項寫成這意味著有95%的μ落在之間,或者說,估計μ落在

之間正確的概率為95%

。

59估計總體平均數(shù)的步驟

(1)根據(jù)實得樣本的數(shù)據(jù),計算樣本平均數(shù)與標準差。(2)計算標準誤。 (已知)或(未知)(3)確定置信區(qū)間或顯著性水平。(4)根據(jù)樣本平均數(shù)的抽樣分布,確定查何種統(tǒng)計表。(5)計算置信區(qū)間。(正態(tài)分布)或(t分布)(6)解釋總體平均數(shù)的置信區(qū)間。估計總體平均數(shù)的步驟60總體方差σ2已知時,對總體平均數(shù)μ的估計

(1)當總體分布為正態(tài)時

當總體分布為正態(tài),總體方差已知時,樣本平均數(shù)的分布為正態(tài)分布,這時可用下式計算其置信區(qū)間:

(其中)(2)當總體分布為非正態(tài)時總體分布非正態(tài),總體方差

已知,這時只有當樣本容量

時,其樣本平均數(shù)的分布為漸近正態(tài)分布,這時可用下式計算其置信區(qū)間:

(其中)總體方差σ2已知時,對總體平均數(shù)μ的估計(1)當總體分布61例如:某小學(xué)10歲全體女童身高歷年來標準差6.25cm,現(xiàn)從該校隨機抽27名10歲女童,測得平均身高為134.2cm,試估計該校全體10歲女童平均身高95%和99%置信區(qū)間。例如:某小學(xué)10歲全體女童身高歷年來標準差6.62總體方差σ2未知時,對總體平均數(shù)μ的估計

(1)當總體分布為正態(tài)時

當總體分布為正態(tài),總體方差

未知時,樣本平均數(shù)的分布為t分布,這時可用下式計算其置信區(qū)間:

(其中)

(2)當總體分布為非正態(tài)時總體分布非正態(tài),總體方差

未知,這時只有當樣本容量

時,其樣本平均數(shù)的分布為漸近t分布,這時可用下式計算其置信區(qū)間:

(其中)總體方差σ2未知時,對總體平均數(shù)μ的估計(1)當總體分布63小樣本的情況例如,從某小學(xué)二年級隨機抽取12名學(xué)生,其閱讀能力得分為28、32、36、22、34、30、33、25、31、33、29、26.試估計該校二年級閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。小樣本的情況例如,從某小學(xué)二年級隨機抽取12名64大樣本的情況例如,從某年高考中隨機抽取102份作文試卷,平均分數(shù)為26,標準差為1.5,估計總體平均數(shù)95%和99%的置信區(qū)間。說明:樣本容量n=103>30,t分布接近正態(tài)分布,故可用正態(tài)分布近似處理。大樣本的情況例如,從某年高考中隨機抽取102份65第三節(jié)假設(shè)檢驗的基本原理

一、假設(shè)

假設(shè)是根據(jù)已知理論與事實對研究對象所做的假定性說明,統(tǒng)計學(xué)中的假設(shè)一般專指用統(tǒng)計學(xué)術(shù)語對總體參數(shù)所做的假定性說明。在進行任何一項研究時,都需要根據(jù)已有的理論和經(jīng)驗對研究結(jié)果作出一種預(yù)想的希望證實的假設(shè),這種假設(shè)叫科學(xué)假設(shè),用統(tǒng)計術(shù)語表示時叫研究假設(shè)(備擇假設(shè)),記作H1。在統(tǒng)計學(xué)中不能對H1的真實性直接檢驗,需要第三節(jié)假設(shè)檢驗的基本原理一、假設(shè)66建立與之對立的假設(shè),稱做零假設(shè)(虛無假設(shè),無差假設(shè),原假設(shè)),記作H0。

假設(shè)檢驗的問題,就是要判斷零假設(shè)H0

是否正確,決定接受還是拒絕零假設(shè)H0,若拒絕零假設(shè)H0

,則接受備擇假設(shè)H1。假設(shè)檢驗是從零假設(shè)出發(fā),視其被拒絕的機會,如果根據(jù)樣本信息,不得不否定零假設(shè)的真實性時,就不得不承認備擇假設(shè)的真實性,這時,就要拒絕零假設(shè)而接受備擇假設(shè);如果根據(jù)樣本的信息不能否定零假設(shè)的真實性時,就要保留零假設(shè)而拒絕備擇假設(shè)。建立與之對立的假設(shè),稱做零假設(shè)(虛無假設(shè),無差假設(shè),原假設(shè))67

二、小概率事件

假設(shè)檢驗的基本思想是概率性質(zhì)的反證法。為了檢驗零假設(shè),首先假定零假設(shè)為真。在零假設(shè)為真的前提下,如果導(dǎo)致違反邏輯或違反人們常識和經(jīng)驗的不合理現(xiàn)象出現(xiàn),則表明“零假設(shè)為真”的假定是不正確的,也就不難接受零假設(shè)。若沒有導(dǎo)致不合理的現(xiàn)象出現(xiàn),那就認為“零假設(shè)為真”的假定是正確的,也就是接受了零假設(shè)。二、小概率事件68假設(shè)檢驗中的“反證法”思想不同于數(shù)學(xué)中的反證法,后者是在假設(shè)某一條件下導(dǎo)致邏輯上的矛盾從而否定原來的假設(shè)。假設(shè)檢驗中“不合理現(xiàn)象”是指小概率事件在一次試驗中發(fā)生了,它是基于人們在實踐中廣泛采用的小概率事件原理(小概率事件原理是指“小概率事件在一次試驗中幾乎不可能發(fā)生”。通常情況下,將概率不超過0.05或0.01的事件當做“小概率事件”)。假設(shè)檢驗中的“反證法”思想不同于數(shù)學(xué)中的反證法,后者是69

三、假設(shè)檢驗中的兩類錯誤

統(tǒng)計學(xué)中將這類拒絕H0時所犯的錯誤稱做

α

錯誤,α

錯誤的概率,可以由研究者通過選擇適當?shù)娘@著性水平加以主動控制。稱這類接受H0時所犯的錯誤為β

錯誤,控制β錯誤的概率有以下兩種方法:①利用已知的實際總體參數(shù)值與假設(shè)參數(shù)值之間大小關(guān)系,合理安排拒絕區(qū)域的位置;②增大樣本的容量。兩類錯誤的關(guān)系:(1)

α+β

不一定等于1;(2)

α

與β

不可能同時減小或增大;(3)1-β

反映著正確辨認真實差異的能力。三、假設(shè)檢驗中的兩類錯誤70單側(cè)檢驗與雙側(cè)檢驗

只強調(diào)差異而不強調(diào)方向性的檢驗叫雙側(cè)檢驗,假設(shè)形式為強調(diào)某一方向的檢驗叫單側(cè)檢驗。右側(cè)檢驗:左側(cè)檢驗:單側(cè)檢驗與雙側(cè)檢驗只強調(diào)差異而不強調(diào)方向71假設(shè)檢驗的步驟

(1)根據(jù)問題要求,提出零假設(shè)和備擇假設(shè)。(2)選擇適當?shù)臋z驗統(tǒng)計量并計算其值。(3)規(guī)定顯著性水平。(4)選擇檢驗的方式(單側(cè)還是雙側(cè))。(5)做出統(tǒng)計決策。假設(shè)檢驗的步驟(1)根據(jù)問題要求,提出零假設(shè)和備擇72假設(shè)檢驗的基本思想引例

解假設(shè)檢驗的基本思想引例解73

我們知道,即使應(yīng)屆與歷屆成績一樣,即

成立,個別應(yīng)屆畢業(yè)生成績也是有波動的,成績r.v.正說明了這一點.故實測值與理論值總有一些差異.

用數(shù)理統(tǒng)計的語言就是說:如果

成立,即往屆應(yīng)屆成績一樣.

如果

不成立,即往屆應(yīng)屆成績不一樣.我們知道,即使應(yīng)屆與歷屆成績一樣,即74如何確定k呢?對于適當小的正數(shù)α(α=0.05,0.01,等),如何確定k呢?對于適當小的正數(shù)α(α=0.05,0.01,75由實際推斷原理若為真由實際推斷原理若為真76綜述假設(shè)檢驗方法的基本思想是:由樣本出發(fā),在為真的前提下通過對被檢參數(shù)的點估計量,結(jié)合統(tǒng)計量的分布,構(gòu)造統(tǒng)計量(樞軸函數(shù)),由此結(jié)合實際,并利用上α分位點確定小概率事件,便得檢驗真?zhèn)蔚臉藴?其思想方法是帶有概率的反證法,理論依據(jù)是實際水平推斷原理.綜述假設(shè)檢驗方法的基本思想是:由樣本出77注1稱為原假設(shè),稱為備擇假設(shè),

α稱為檢驗水平,U=稱為檢驗統(tǒng)計量.注2由小概率事件確定的區(qū)域W={U|}稱為拒絕域,而{U|}稱為接受域,稱為臨界值.注1稱為原假設(shè),稱為備擇假設(shè),78第四節(jié)總體平均數(shù)的顯著性檢驗平均數(shù)的顯著性檢驗是指根據(jù)樣本平均數(shù)與假設(shè)總體平均數(shù)的差異檢驗樣本所在總體的平均數(shù)與假設(shè)總體的平均數(shù)的差異。第四節(jié)總體平均數(shù)的顯著性檢驗平均數(shù)的顯著79(1)總體正態(tài)分布、總體方差已知的條件下平均數(shù)的顯著性檢驗

(2)總體正態(tài)分布、總體方差未知條件下平均數(shù)的顯著性檢驗

平均數(shù)顯著性檢驗的方法(1)總體正態(tài)分布、總體方差已知的條件下平均數(shù)的80

(3)總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗

①當n≥30時,盡管總體分布非正態(tài),對于平均數(shù)的顯著性檢驗仍可用Z檢驗。

(σ已知)或(σ未知)

②當n<30時,若總體分布非正態(tài),對于平均數(shù)的顯著性檢驗不符合近似Z檢驗的條件,嚴格講此時也不符合t檢驗的條件。(3)總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗81一、已知條件下總體平均數(shù)的顯著性檢驗例1:某小學(xué)歷屆畢業(yè)生漢語拼音測驗平均分數(shù)為66分,標準差為11.7.現(xiàn)已同樣的試題測驗應(yīng)屆畢業(yè)生,并從中隨機抽18份試卷,算的平均分為69分,問該校應(yīng)屆與往屆畢業(yè)生漢語拼音測驗成績是否一致?(1)提出假設(shè)一、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論