《應用統(tǒng)計學(第三版)》課件第11章 假設檢驗_第1頁
《應用統(tǒng)計學(第三版)》課件第11章 假設檢驗_第2頁
《應用統(tǒng)計學(第三版)》課件第11章 假設檢驗_第3頁
《應用統(tǒng)計學(第三版)》課件第11章 假設檢驗_第4頁
《應用統(tǒng)計學(第三版)》課件第11章 假設檢驗_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第11章假設檢驗本章主要闡述假設檢驗的基本問題、正態(tài)總體的參數(shù)檢驗、正態(tài)總體方差檢驗、檢定法、符號檢驗法、等級檢驗法、趨勢性與隨機性檢驗。其核心是怎樣根據(jù)隨機樣本對某一統(tǒng)計假設作出接受或拒絕的統(tǒng)計決策。11.1

假設檢驗的基本問題11.1.1.假設檢驗的意義假設檢驗是以樣本統(tǒng)計量來驗證假設的總體參數(shù)是否成立,借以決定采取適當行動的統(tǒng)計方法,又稱假設檢定或假設測驗。包括假設和檢驗兩個基本環(huán)節(jié)。統(tǒng)計假設:對總體參數(shù)作出假設,這種假設可能正確,也可能是錯誤的。統(tǒng)計檢驗:檢驗所作的統(tǒng)計假設是否成立,作出接受或作出拒絕的結論。11.1.2假設檢驗的程序1.提出原假設H0和備選假設H1。原假設H0:是假設未知參數(shù)等于某一具體的值,是需要接受檢驗的假設。備選假設H1:又稱替代假設或備擇假設,是原假設的對立假設。關于總體平均數(shù)的假設有三種狀況:①H0:u=u0;H1:u≠u0;(雙尾檢驗)②H0:u≥u0;H1:u<u0;(單尾檢驗)③H0:u≤u0;H1:u>u0;(單尾檢驗)2.確定樣本統(tǒng)計量及其分布。樣本統(tǒng)計量有樣本均值、樣本比率、樣本方差等,不同的樣本統(tǒng)計量具有不同的分布,用于檢驗不同的統(tǒng)計假設。3.選擇顯著水平。顯著水平a:原假設是正確的,發(fā)生的概率大1-a,而不發(fā)生的概率a則小

。a

常取0.05或0.01。顯著水平的選擇存在著犯兩種錯誤的可能性:第一類為棄真錯誤:原假設本是正確的,由于a值選擇過大,拒絕了原假設。第二類為取偽錯誤:原假設本是錯誤的,由于a值選擇過小,接受了原假設。4.計算檢驗統(tǒng)計量或構建置信區(qū)間。根據(jù)樣本統(tǒng)計量的數(shù)據(jù)和被假設的總體參數(shù),計算檢驗統(tǒng)計量;或者根據(jù)樣本統(tǒng)計量和置信概率構建置信區(qū)間,作為檢驗決策的依據(jù)。檢驗統(tǒng)計量的基本計算公式為:

5.作出統(tǒng)計決策。雙尾檢驗:檢驗統(tǒng)計量落在接受區(qū)域內(nèi),接受原假設,反之,則拒絕原假設。單尾檢驗:檢驗統(tǒng)計量的絕對值大于臨界絕對值,拒絕原假設。反之,接受原假設。11.1.3假設檢驗的方法假設檢驗的方法有參數(shù)假設檢驗和非參數(shù)假設檢驗兩類。1.有參數(shù)假設檢驗.是指在已知總體分布的條件下,對總體均值、總體比率、總體方差等參數(shù)進行假設檢驗。有參數(shù)檢驗的方法主要有Z檢驗、t檢驗、F檢驗等等。2.非參數(shù)假設檢驗.。是在不考慮原總體分布或不作關于分布假定的前提下,進行統(tǒng)計檢驗和判斷分析的一系列方法的總稱。

主要應用于以下兩個方面:(1)凡要求解決的問題不符合參數(shù)假設檢驗條件時,采用非參數(shù)假設檢驗。(2)采用列名尺度和順序尺度計量的現(xiàn)象,需要進行檢驗時,采用非參數(shù)假設檢驗。非參數(shù)統(tǒng)計方法主要有的獨立性檢驗、的一致性檢驗、的吻合性檢驗、正負符合檢定法、各種等級檢定法、游程檢驗法等。11.2一個正態(tài)總體的參數(shù)檢驗11.2.1總體方差已知的均值檢驗。若總體為正態(tài)分布,且總體方差已知,則可先計算檢驗統(tǒng)計量Z:

其次選擇顯著水平a,查Z分表,求得兩個臨界值,若檢驗統(tǒng)計量Z落在兩個臨界值構成的區(qū)域內(nèi),則可作出接受原假設的決策;否則拒絕原假設。圖8-1假設檢驗示意圖(雙尾檢驗)

11.2.2總體方差未知的均值檢驗當總體為正態(tài)分布,總體方差未知,n>30時,可用樣本方差代替總體方差,采用Z檢驗。當樣本容量n<30,則需要采用t檢驗。由于總體方差未知,則可用樣本方差先估計總體方差,再計算檢驗統(tǒng)計量t進行假設檢驗。

它服從自由度為n-1的t分布。

11.2.3.總體比率的假設檢驗在單個總體比例的假設檢驗中,當樣本容量n大于30,np和n(1—p)兩者都大于5時,樣本比率p的抽樣分布近似正態(tài)分布,可采用Z檢驗。檢驗統(tǒng)計量為:

其中p0為假設的總體比率,p為樣本比率。

11.3兩個正態(tài)總體的參數(shù)檢驗

11.3.1兩個總體平均數(shù)之差的檢驗1.

樣本容量n>30,采用Z檢驗。在檢驗兩個總體平均數(shù)之差的假設時,無論總體是否服從正態(tài)分布,當樣本容量n>30時,來自兩個總體的樣本平均數(shù)之差趨近于正態(tài)分布,故可采用Z檢驗,檢驗統(tǒng)計量為:

若兩個總體方差未知,n>30時,可用樣本方差代替或估計總體方差。(2)樣本容量n<30,兩個正態(tài)總體方差未知,采用t檢驗。如果兩個正態(tài)總體方差已知,而樣本容量n<30時,仍可采用Z檢驗。如果兩個正態(tài)總體的方差相等而又未知,且n<30,則采用t分布檢驗。首先利用兩個樣本的方差求出它們共同方差的估計值。即:檢驗統(tǒng)計量為:當時μ1=μ2,t服從自由度為n1+n2的t分布。在給定的顯著水平a的條件下,查t分布表,得出臨界值ta/2,當│t│≥│ta/2│時,拒絕原假設H0,反之則接受原假設H0。

11.3.2兩個總體比率之差的檢驗當樣本容量較大時,來自兩個總體的樣本比率之差的抽樣分布近似服從正態(tài)分布。若兩個總體的比率P大體相同時,可求兩個樣本比率的聯(lián)合估計值,代替未知的總體比率值;再檢驗統(tǒng)計量Z值進行兩個總體比率之差的檢驗:

11.4正態(tài)總體方差的假設檢驗11.4.1單個正態(tài)總體方差的假設檢驗采用χ2分布檢驗,有兩種檢驗方法:1.根據(jù)樣本方差S2和給定的顯著水平a,建立總體方差的置信區(qū)間,若假設的總體方差σ2

落在置信區(qū)間內(nèi),則接受原假設,反之,則拒絕原假設??傮w方差估計的置信區(qū)間為:2.根據(jù)樣本方差和假設的總體方差,計算檢驗統(tǒng)計量χ2,然后根據(jù)給定的顯著水平α查χ2分布的兩個臨界值,若檢驗統(tǒng)計量落在兩個臨界值的區(qū)域內(nèi),則接受原假設,反之,則拒絕原假設。計算式為:接受區(qū)域:

11.4.2兩個正態(tài)總體方差比的假設檢驗采用服從F分布的統(tǒng)計量來檢驗兩個總體方差是否相等或同質(zhì)的問題。有兩種檢驗方法。1.根據(jù)兩個樣本方差建立兩個總體之比的置信區(qū)間,然后觀察

是否落在置信區(qū)間內(nèi),則可作出接受或拒絕原假設的決策。其置信區(qū)間為:

Fa/2根據(jù)自由度(n1-l,n2-1)和顯著水平a/2從F分布表中查得,F(xiàn)1-a/2/2則根據(jù)自由度(n2

-l

,n1-l)和顯著水平a/2從F分布表中查得F值后再取倒數(shù)。2.直接計算兩個樣本方差的檢驗統(tǒng)計量

,再與F分布的理論臨界值Fa/2或F1-a/2比較,若F1-a/2<F<Fa/2,則接受原假設;若F<F1-a/2或

F>Fa/2,則拒絕原假設。11.5χ2檢定法11.5.1χ2檢驗的基本原理為了了解某變量出現(xiàn)的實際次數(shù)(Oi)與理論次數(shù)(Ei)之間是否具有一致性,可采用χ2檢驗。χ2統(tǒng)計量定義為:

數(shù)理統(tǒng)計已證明,在大量的試驗中若實際次數(shù)分布與理論次數(shù)分布相一致時,統(tǒng)計量χ2就服從分布。如果實際結果和理論假設不一致,其統(tǒng)計量χ2值很大,當大到按χ2分布出現(xiàn)的概率很小時,就可判斷實際結果和理論假設不一致。χ2檢驗就是利用這一基本原理。χ2檢驗可用于獨立性檢驗,一致性檢驗和吻合性檢驗。應用時應注意:1.卡方檢驗都是單尾檢驗。2.要求實際次數(shù)和理論次數(shù)必須為絕對次數(shù),不能采用相對次數(shù)或頻率。3.要求所有觀察值的理論次數(shù)都需大于等于5,否則需合并。4.樣本太小(n<20),χ2檢驗不能使用;樣本太大,又會使檢驗失效。11.5.2χ2的獨立性檢驗χ2的獨立性檢驗用于判別兩個變量或兩種分類標準是否有聯(lián)系的問題,如果兩者之間沒有聯(lián)系,則兩個變量或兩種分類標準是相互獨立的。檢驗兩個變量之間是否有聯(lián)系,通常要將研究對象按兩個變量進行交錯分類,編制兩向分類的列聯(lián)表,如表設n為樣本容量(總次數(shù)),變量x1各組的次數(shù)合計為ni,組數(shù)為,變量χ2各組的次數(shù)合計為nj,組數(shù)為C;兩個變量交叉分組的實際次數(shù)用Oij表示,理論次數(shù)用Eij表示,則檢驗統(tǒng)計量χ2為:

其中:理論次數(shù)

當顯著水平為a時,根據(jù)自由度(γ-1)(γ-C)查χ2分布表,得χ21-α臨界值,則:

χ2>χ21-α兩變量間有聯(lián)系(不是獨立的)

χ2<χ21-α

兩變量間獨立的χ2的獨立性檢驗,當兩個變量的分類都只有兩類時,從而形成了2×2的列聯(lián)表,若用a、b、c、d分別表示其觀察值,則χ2統(tǒng)計量的簡便公式為:由χ2于分布是一個連續(xù)變量分布,而2×2的列聯(lián)表中用的是離散的方法,其自由度為1,因此1934年耶莎(Yate)提出了修正公式:11.5.3χ2的一致性檢驗χ2的一致性檢驗用于判斷兩個或兩個以上的樣本比率是否具有顯著的差別,或者說檢驗兩個或兩個以上的獨立隨機樣本是否來自一致的總體。其統(tǒng)計量和決策法則均與的χ2獨立性檢驗一樣,但二者的不同之處有兩點:1.獨立性檢驗僅自一總體中抽取樣本,而一致性檢驗是由不同總體分別抽取樣本;2.獨立性檢驗是檢驗不同分類標準間是否互相獨立,而一致性檢驗是檢驗不同的隨機樣本所來自的總體是否具有一致性。11.5.4χ2的吻合性檢驗χ2的吻合性檢驗又稱擬合優(yōu)度或適合度檢驗。主要用于檢驗某變量的實際次數(shù)分布與理論分布是否相吻合,亦即判別某變量是否服從于某一理論分布。檢驗的統(tǒng)計量χ2仍為:自由度v=k-1(k為組數(shù)),若總體σ、μ等m個參數(shù)未知,須先作估計再求理論次數(shù),則自由度v=(k-m-1)。檢驗的決策法則為:χ2>χ2(1-α,ν),次數(shù)分配不適合某理論分布。χ2>χ2(1-α,ν),次數(shù)分配適合某理論分布。理論次數(shù)由Ei=nPi確定,其中pi為按某種理論分布計算的概率或頻率。11.6符號檢驗法符號檢驗法又稱正負檢驗法,主要用于對總體中位數(shù)M是否為特定的值M0進行檢驗。

11.6.1單一樣本中位數(shù)的符號檢驗設樣本來自的總體的中位數(shù)為M0,D為樣本內(nèi)各觀察值x與M0的離差,即D=x—M0,若有一個D為0,則刪去。當D=x—M0的正負符號數(shù)目的概率均等(均為1/2)時,就可接受中位數(shù)M=M0的假設。當正號或負號出現(xiàn)的次數(shù)超過了應有的理論次數(shù)時,就可否定中位數(shù)M=M0的假設。

令檢驗統(tǒng)計量S為正號或負號中出現(xiàn)較少者的次數(shù),則可視為在n次獨立試驗中成功的次數(shù),故S分布為成功概率p=1/2的二項分布,當S值很小,表示中位數(shù)M可能不為M0。1.當樣本容量n較小,采用二項分布處理,拒絕M=M0的條件為:2.當樣本容量n較大,采用Z分布處理,拒絕M=M0的條件為:以上均為單尾檢驗,若作雙尾檢驗,只需將顯著水平a改為a/2即可。11.6.2兩個獨立樣本的符號檢驗兩個獨立樣本的符號檢驗用于檢驗抽自兩個總體的獨立樣本的中位數(shù)是否相同。檢驗的方法是將兩個樣本的觀察值統(tǒng)一按照順序排列,找出中位數(shù)(M0),并分別計算各樣本的D=x—M0的正、負符號數(shù)目,并整理成列聯(lián)表的形式,采用χ2檢驗:若:χ2<χ21-α,兩個總體中位數(shù)相同。

χ2>

χ21-α,兩個總體中位數(shù)不同。

11.6.3兩個有聯(lián)系樣本的符號檢驗兩個有聯(lián)系樣本的符號檢驗主要用于對某種處理或試驗進行比較,用以說明這種處理或試驗是否具有顯著的效應。檢驗時,要求兩個有聯(lián)系的樣本有n對成對的樣本觀察值(x1,y1),(x2,y2),……,(xn,yn),然后計算觀察值之差xi-yi再計算這些觀察值之差M0的正負符號數(shù)目S+或S-,即可采用下列方法檢驗這種處理或試驗是否具有顯著的效應。1.n小,采用二項分布檢驗:效應顯著

其中S為S+、S-中的較小者。雙尾檢驗將a改為a/2。

2.n大,采用Z分布檢驗:

效應顯著

11.7等級檢驗法

11.7.1符號等級檢驗法符號等級檢定法不僅要考慮觀察值與平均數(shù)或中位數(shù)之差的正負號,同時還要考慮其差額的大小,故檢驗的效率比單純的符號檢定法要高一些,又稱威爾科克森檢驗法,可用于檢驗總體中位數(shù)M是否為特定值M0,也可用于兩個有聯(lián)系的樣本的比較。設x為觀察值,M0為中位數(shù)的特定值。則單一樣本的符號等級檢法的步驟為:1.求D=x—M0,并刪去D=0者,使有效樣本大小為n。2.排定|D|的等級,如絕對值有兩個或兩個以上相同的,則先給每個|D|一個順序等級,再求其平均數(shù)代表它們的相同等級。3.分別求算D的正、負等級之和T+,T-;且檢查4.以統(tǒng)計量T表示T+或T-二者中的較小者。5.作出檢驗決策。決策法則因樣本大小不同而不同:

(1)當5≤n≤30,T≤Ta時,則M≠M0;或T≤Ta-2,則M≠M0。(2)當n>30,采用正態(tài)分布,計算統(tǒng)計量:若Z<-Z(1-a),則M≠M0;或Z<-Z(1-a/2),M≠M0。11.7.2曼—惠特尼U檢驗這種檢驗方法是建立在等級和的基礎上的檢驗,常用于兩個獨立樣本的比較,以檢驗兩個總體是否具有相同的分布,或者檢驗兩個獨立樣本所來自總體的中位數(shù)是否相等。它有兩個基本假定:一是兩總體均為連續(xù)分布,且變異程度相同;二是兩個獨立樣本均為隨機樣本。其檢驗的步驟為:1.將兩個樣本混合排列,按觀察值大小編上等級;2.分別計算兩個樣本的等級和,即T1,T2。3.計算兩個樣本的統(tǒng)計量U1,U2。U1+U2=n1n2,故取U1,U2中的小者作為檢驗統(tǒng)計量U。

4.作出檢驗決策。當n1,n2均≤20時,根據(jù)a、n1、n2查曼—惠特尼檢驗臨界值表,決策法則為:U≤U(a),兩個總體不具有相同分布(中位數(shù)不同)U≤U(a/2),兩個總體不具有相同分布(中位數(shù)不同)當n1,n2中有一個大于20時,采用Z檢驗:Z<-Z(1-a),

兩個總體不具有相同分布(中位數(shù)不同)。Z<-Z(1-a/2),兩個總體不具有相同分布(中位數(shù)不同)。11.7.3多個樣本的等級檢驗法多個樣本的等級檢驗法又稱克羅斯考爾—瓦里斯單因素方差分析法,它也是建立在等級和基礎之上的非參數(shù)檢驗方法。它同樣要求研究的變量是連續(xù)的,計量的水準至少是順序的。檢驗時,等級的編排與等級和的計算同曼—惠特尼U檢驗相同,但檢驗的統(tǒng)計量為H:

其中:Ti為各樣本的等級和,ni為各樣本容量,n為各樣本容量的總和。

H是近似于自由度為k-1的χ2分布,故可利用χ2分布進行檢驗。決策法則為:H>χ21-2:k個總體的中位數(shù)不相同。H<χ21-2

:k個總體的中位數(shù)相同。11.8趨勢性與隨機性檢驗11.8.1趨勢性檢驗趨勢性檢驗在于判別某種序列是否具有增加或減少的趨勢性(傾向性),在實際工作中,某些數(shù)列的發(fā)展趨勢往往不夠明顯,難以運用圖表判別序列是否具有趨勢性,可采用LOX-stuart趨勢性檢驗法進行檢驗?;境绦驗椋?.建立假設,有三種情形:(1)H0:無增長趨勢;H1:有增長趨勢(2)H0:無減少趨勢;H1:有減少趨勢(3)H0:無趨勢性H1:有趨勢性2.數(shù)據(jù)配對。具體做法取xi和xi+c組成一對,這里c為:

n/2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論