多元課件第三章_第1頁
多元課件第三章_第2頁
多元課件第三章_第3頁
多元課件第三章_第4頁
多元課件第三章_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元課件第三章1第1頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗目錄(二)§3.3

多總體均值向量的檢驗§3.4協(xié)差陣的檢驗§3.5獨立性檢驗§3.6正態(tài)性檢驗

第三章所涉及的最大似然估計量小結

2第2頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

當p=1時,因且相互獨立,故有1.兩總體協(xié)差陣相等(但未知)時均值向量的檢驗設X(α)(α=1,…,n)為來自總體X~Np(μ(1),Σ)的隨機樣本;Y(α)(α=1,…,m)為來自總體Y~Np(μ(2),Σ)的隨機樣本,且相互獨立,Σ未知.檢驗3第3頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

取檢驗統(tǒng)計量為~t(n+m-2)(在H0成立時),即4第4頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

推廣到p元總體,檢驗統(tǒng)計量的形式類似,可考慮以下檢驗統(tǒng)計量T2:其中A1和A2是兩總體的樣本離差陣.它們是一元統(tǒng)計中的偏差平方和∑(X(i)-X)2在p元情況下的推廣.以下來證明統(tǒng)計量T

2

~T

2(p,n+m-2).因5第5頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

由Wishart分布的可加性知A1+

A2~Wp(n+m-2,Σ),由T2統(tǒng)計量的定義3.1.5可知6第6頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

利用T2與F的關系,檢驗統(tǒng)計量取為可以證明T2

(或F)統(tǒng)計量是檢驗以上假設H0的似然比統(tǒng)計量.(見習題3-10)7第7頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子

例3.3.1為了研究日、美兩國在華投資企業(yè)對中國經營環(huán)境的評價是否存在差異,今從兩國在華投資企業(yè)中各抽出10家,讓其對中國的政治、經濟、法律、文化環(huán)境進行打分,評分結果見表3.2(表中1至10號為美國在華投資企業(yè)的代號,11至20號為日本在華投資企業(yè)的代號.數(shù)據來源于:國務院發(fā)展研究中心APEC在華投資企業(yè)情況調查).

解比較日、美兩國在華投資企業(yè)對中國多方面的經營環(huán)境的評價是否有差異問題,就是兩總體均值向量是否相等的檢驗問題.(見yydy331a.sas或yydy331b.sas)8第8頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子

9第9頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子記美國在華投資企業(yè)對中國4個方面的經營環(huán)境的評價為4維總體X,并設X~N4(μ(1),Σ).日本在華投資企業(yè)對中國經營環(huán)境的評價為4維總體Y,并設Y~N4(μ(2),Σ).來自兩總體的樣本容量n=m=10.檢驗取檢驗統(tǒng)計量為由樣本值計算得:X=(64,43,30.5,63)′,Y=(51.5,51,40,70.5)′,10第10頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子進一步計算可得:11第11頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子對給定顯著性水平α=0.01,利用統(tǒng)計軟件進行檢驗時,首先計算p值(此時檢驗統(tǒng)計量F~F(4,15)):p=P{F≥6.2214}=0.0037.因p值=0.0037<0.01=α,故否定H0,即日、美兩國在華投資企業(yè)對中國經營環(huán)境的評價存在顯著性差異.在這種情況下,可能犯第一類錯誤,且犯第一類錯誤的概率為0.01.12第12頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

2.兩總體協(xié)差陣不等時均值向量的檢驗

在一元統(tǒng)計中(p=1時),當σ12≠σ22時,檢驗H0:μ(1)=μ(2)也沒有很好的方法,以下介紹實用中的幾種方法.①當n=m時,作為成對數(shù)據進行處理.令Z(i)=X(i)-Y(i)(i=1,…,n),化為單個p元總體Z的均值檢驗問題

H0:μ(1)=μ(2)

<==>H0:μZ=0利用前面介紹的方法進行檢驗.

注意:在這里兩組樣本相互獨立的信息沒有利用.13第13頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體

②當n≠m時(不妨設n<m):想法也是化為單個p元新總體的均值檢驗問題.若只取n對數(shù)據按方法①處理,又將損失一些信息.改進的辦法是利用X(i)(i=1,…,n)和Y(j)(j=1,…,m),構造新總體Z的樣本Z(i),令可以證明:14第14頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩個p元正態(tài)總體所以Z(i)~N

p(μ(1)-μ(2),ΣZ)(i=1,…,n),且相互獨立.利用前面介紹的單個正態(tài)總體均值向量的檢驗方法進行檢驗.

③當Σ1,

Σ2相差甚大時,可構造近似檢驗統(tǒng)計量進行檢驗(見參考文獻[1]).其中15第15頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析

多個正態(tài)總體均值向量的檢驗問題也稱為多元方差分析.

設有k個p元正態(tài)總體Np(μ(t),Σ)(t=1,…,k),樣品

(t=1,…,k,α=1,…,nt)是來自Np(μ(t),Σ)的隨機樣本,檢驗

H0:μ(1)=…=μ(k),H1:至少存在i≠j使得μ(i)≠μ(j)(即μ(1),…,μ(k)中至少有一對不等).

當p=1時,此檢驗問題就是一元方差分析問題,比如比較k個不同品牌的同類產品中一個質量指標X(如耐磨度)有無顯著差異的問題,我們把不同品牌對應不同總體(假定為正態(tài)總體),這種多組比較問題就是檢驗問題.16第16頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析

從第i個總體抽取容量為ni的隨機樣本如下(i=1,…,k;記n=n1+n2+…+nk):17第17頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析(p=1)

當p=1時,利用一元方差分析的思想來構造檢驗統(tǒng)計量.記則有平方和分解公式:SST=SSA+SSE18第18頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析(p=1)

直觀考察,若H0成立(即k個總體均值無顯著差異),當總偏差平方和SST固定不變時,應有組間偏差平方和SSA小,而組內偏差平方和SSE大,因而比值SSA/SSE應很小.檢驗統(tǒng)計量取為給定顯著性水平α,按傳統(tǒng)檢驗方法,查F分布臨界值表得Fα滿足:

P{F>Fα}=α,否定域W={F>Fα

}.19第19頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析

推廣到k個p元總體Np(μt,Σ)(假定k個總體的協(xié)差陣相等,且記為Σ),記第i個p元總體的數(shù)據陣為對總離差陣進行分解:20第20頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析

其中稱為組間離差陣.

故交叉項=O稱為組內離差陣.

21第21頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析

根據直觀想法及用似然比原理得到檢驗H0的統(tǒng)計量為由Wishart分布的定義容易得出:①因Ai~Wp(ni-1,Σ)且相互獨立(i=1,…,k),由可加性可得A=A1+…+Ak~Wp(n-k,Σ)(n=n1+…+nk).②在H0下,T~Wp(n-1,Σ).③還可以證明在H0下,B~Wp(k-1,Σ),且B與A相互獨立.22第22頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析根據Λ分布的定義,可知給定顯著性水平α,查Wilks分布臨界值表,可得λα,使P{Λ<λα}=α,故否定域W={Λ<λα

}.當手頭沒有Wilks臨界值表時,可用χ2分布或F分布來近似,即由Λ的函數(shù)的近似分布進行檢驗(見參考文獻[1]或[2]).23第23頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗—多元方差分析的例子

例3.3.2為了研究某種疾病,對一批人同時測量了四個指標:β脂蛋白(X1),甘油三酯(X2),α脂蛋白(X3),前β脂蛋白(X4).按不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性),數(shù)據見書中表3.3.試問這三組的四項指標間有無顯著性差異?

解比較三個組(k=3)的4項指標(p=4)間是否有差異問題,就是多總體均值向量是否相等的檢驗問題.設第i組為4維總體N4(μ(i),Σ)(i=1,2,3).來自3個總體的樣本容量n1=n2=n3=20.檢驗

H0:μ(1)=μ(2)=μ(3)H1:μ(1),μ(2),μ(3)至少有一對不相等.(見yydy332?.sas)24第24頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--兩總體均值檢驗例子

25第25頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--多元方差分析的例子因似然比統(tǒng)計量Λ~Λ(p,n-k,k-1),此例中k-1=2,可以利用Λ統(tǒng)計量與F統(tǒng)計量的關系,取檢驗統(tǒng)計量為F統(tǒng)計量:由樣本值計算得:X=(259.08,84.12,32.37,17.8)′,26第26頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--多元方差分析的例子27第27頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--多元方差分析的例子進一步計算可得對給定α=0.01,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(此時檢驗統(tǒng)計量F~F(8,108)):p=P{F≥3.09007}=0.003538.因p值=0.003538<0.01=α,故否定H0,這表明三個組的指標之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率為0.01.28第28頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--多元方差分析的例子進一步地若還想了解三個組指標間的差異究竟是哪幾項指標引起的,可以對4項指標逐項用一元方差分析方法進行檢驗,我們將發(fā)現(xiàn)三組指標間只有第一項指標X1有顯著差異.事實上,用一元方差分析檢驗第一項指標X1在三個組中是否有顯著差異時,因29第29頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.3多總體均值向量的檢驗--多元方差分析的例子其中t11和a11分別是T和A中的第一個對角元素.p1=P{F1≥8.8780}=0.0004401(檢驗統(tǒng)計量F1~F(2,57))p值=0.0004401顯著地小于0.01,故第一項指標X1在三個組中有顯著差異.30第30頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

設X(α)(α=1,…,n)為來自p元正態(tài)總體Np(μ,Σ)(Σ>0未知)的隨機樣本,檢驗

H0:Σ=Σ0(Σ0>0為已知陣),H1:Σ≠Σ01.當Σ0=Ip時檢驗H0:Σ=Ip,H1:Σ≠Ip

利用似然比原則來導出檢驗統(tǒng)計量λ1

當Σ=Ip成立時,似然函數(shù)L(μ,Ip)在μ=X達最大值.31第31頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

所以似然比統(tǒng)計量其中32第32頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

利用定理3.2.1可知,當n很大且H0成立時,ξ=-2lnλ1的近似分布為χ2(p(p+1)/2),參數(shù)空間的維數(shù)為p+p(p+1)/2,而0的維數(shù)為p,故卡方分布的自由度為p(p+1)/2.取ξ作為檢驗統(tǒng)計量,按傳統(tǒng)檢驗方法,對給定顯著性水平α,否定域為{ξ>χα2},其中χα2滿足:P{ξ>χα2}=α.33第33頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

2.當Σ0≠Ip時檢驗H0:Σ=Σ0,H1:Σ≠Σ0

因Σ0>0,存在p階非退化陣D,使DΣ0D′=Ip,令Y(α)=DX

(α)(α=1,…,n),則Y(α)~N

p(Dμ,DΣD′)==N

p(μ*,Σ*)檢驗H0:Σ=Σ0

<==>H0:Σ*=Ip

從新樣本Y(α)(α=1,…,n)出發(fā),檢驗H0:Σ*=Ip的檢驗統(tǒng)計量取為記為34第34頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

其中若注意到DΣ0D′=Ip,即35第35頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

研究似然比統(tǒng)計量λ2的抽樣分布是很困難的.通常根據定理3.2.1由λ2的近似分布來構造檢驗法.當樣本容量n很大,在H0成立時,-2lnλ2

的極限分布為χ2(p(p+1)/2).除此外在不同適用范圍下還有其它近似分布可用來構造檢驗法.則似然比統(tǒng)計量λ2還可以表示為36第36頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

3.檢驗H0:Σ=σ2Σ0(σ2

未知)

當Σ0

=Ip

時此檢驗常稱為球性檢驗.利用似然比原則來導出檢驗統(tǒng)計量λ3:當σ2給定時,似然函數(shù)L(μ,σ2Σ0)在μ=X達最大值,且37第37頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

可得出

38第38頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--單個p元正態(tài)總體

所以似然比統(tǒng)計量或等價于當樣本容量n很大,在H0為真時有以下近似分布:39第39頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體

設有k個總體Np(μ(t),Σt)(t=1,…,k),X(α)(t)(t=1,…,k;α=1,…,n

t)來自第t個總體Np(μ(t),Σt)的隨機樣本,記n=n1+n2+…+nk.檢驗H0:Σ1=Σ2=…=Σk≡Σ,H1:

Σ1,Σ2,…,Σk不全相等.樣本{X(α)(t)}的似然函數(shù)為似然比統(tǒng)計量λ4為40第40頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體

41第41頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體

則似然比檢驗統(tǒng)計量為(其中A=A1+…+Ak)42第42頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體

根據無偏性的要求進行修正,將λ4中的ni用ni

-1替代,n用n-k替代.然后對λ4取對數(shù),可得到統(tǒng)計量:當樣本容量n很大時,在H0為真時M有以下近似分布:(1-d)M=-2(1-d)lnλ4*~χ2(f)其中f=p(p+1)(k-1)/2,43第43頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體(例)

例3.4.1

對例3.3.2表3.3中給出的身體指標化驗數(shù)據,試判斷三個組(即三個總體)的協(xié)差陣是否相等(α=0.10)

解這是三個4維正態(tài)總體的協(xié)差陣是否相等的檢驗問題.設第i組為4維總體N4(μ(i),Σi)(i=1,2,3).來自三個總體的樣本容量n1=n2=n3=20.檢驗H0:Σ1=Σ2=Σ3,H1:Σ1,Σ2,Σ3至少有一對不相等.在H0成立時,取近似檢驗統(tǒng)計量為χ2(f)統(tǒng)計量:由樣本值計算三個總體的樣本協(xié)差陣:44第44頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體(例)

45第45頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體(例)

46第46頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體(例)

進一步計算可得47第47頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4協(xié)差陣的檢驗--多個p元正態(tài)總體(例)

對給定α=0.10,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗統(tǒng)計量ξ~χ2(20)):p=P{ξ≥20.331621}=0.4373646.因p值=0.4373646>0.10=α,故H0相容,這表明三個組的協(xié)差陣之間沒有顯著的差異.48第48頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

設有k個總體Np(μ(t),Σt)(t=1,…,k),X(α)(t)(t=1,…,k;

α=1,…,nt)來自第t個總體Np(μt,Σt)的隨機樣本,記n=n1+n2+…+nk.檢驗

H0:μ(1)=μ(2)

=…=μ(k)

=μ,Σ1=Σ2=…=Σk

=

Σ,H1:

μ(1)

,μ(2)

,…,μ(k)

或Σ1,Σ2,…,Σk不全相等.記49第49頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

似然比統(tǒng)計量λ5為50第50頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

則檢驗以上假設H0的樣本{X(t)(α)}似然函數(shù)為51第51頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

若用Λ表示當協(xié)差陣均相同時檢驗k個總體均值向量是否相等的似然比統(tǒng)計量,將發(fā)現(xiàn)這里的檢驗統(tǒng)計量λ5=Λ·λ4.在實際應用中我們采用類似的修正方法,在λ5中用nt-1替代nt,用n-k替代n.修正后的統(tǒng)計量記為λ5*:52第52頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

當樣本容量n很大,在H0為真時λ5*有以下近似分布:其中53第53頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

例3.4.2

對例3.3.2表3.3給出的身體指標化驗數(shù)據,試判斷三個組(即三個總體)的均值向量和協(xié)差陣是否全都相等(α=0.05)?

解這是三個4維正態(tài)總體的均值向量和協(xié)差陣是否同時相等的檢驗問題.取近似檢驗統(tǒng)計量為近似χ2統(tǒng)計量:ξ==-2(1-b)lnλ5*

~χ2(f).由樣本值計算三個總體的樣本協(xié)差陣見例3.4.1,所有樣本的總離差陣T見例3.3.2.進一步計算可得54第54頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.4--多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗

對給定α=0.05,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗統(tǒng)計量ξ~χ2(28)):p=P{ξ≥43.1408}=0.03373.因p值=0.03373<0.05=α,故否定H0,這表明三個組的均值向量和協(xié)差陣之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率0.05.55第55頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗

設總體X~Np(μ,Σ),將X剖分為k個子向量,而μ和Σ也相應剖分為其中p=p1+…+pk,且知pt維子向量X(t)~Npt(μ(t),Σtt)(t=1,…,k).若k個隨機子向量相互獨立,把p維(高維)隨機向量的問題化為k個低維隨機向量的問題來處理,在處理多元統(tǒng)計分析的許多問題中將帶來極大的方便.56第56頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗

在第二章我們已介紹過若X(1),…,X(k)相互獨立,則有Σij

=O(對一切i≠j).因此檢驗X(1),…,X(k)是否相互獨立的問題等價于檢驗對任二個子向量,其協(xié)差陣Σij

是否等于O(對一切i≠j).

在正態(tài)總體下,獨立性檢驗可化為檢驗H0:Σij

=O(一切i≠j),H1:Σij≠O,至少有一對i≠j.設X(t)(t=1,…,n,n>p)為來自總體X的隨機樣本.將樣品X(t)

,樣本均值X和樣本離差陣A作相應剖分為57第57頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗

用似然比原理,在H0成立時,X(t)(α)

Npt(μ(t),Σtt)(t=1,…,k;α=1,…,n)且相互獨立,故樣本的似然函數(shù)為所以似然比統(tǒng)計量的分子為58第58頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗

似然比統(tǒng)計量為Box證明了,在H0成立下當n→∞時,-blnV~χ2(f),其中59第59頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗--例

例3.4.1試檢驗例3.2.1女性汗液數(shù)據中隨機向量X的三個分量是否相互獨立(α=0.05).

解記隨機向量X=(X1,X2,X3)′,假定X~N3(μ,Σ),且記Σ=(σij).檢驗

H0:σ12=0,σ13=0,σ23=0,H1:σ12,σ13,σ23不全為0.取檢驗統(tǒng)計量為當X的三個分量相互獨立,且樣本容量n很大時,ξ近似于χ2(f).60第60頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗--例

由表3.1的樣本值計算樣本離差陣A,可得:此例中n=20,p=3,p1=p2=p3=1,k=3.進一步計算可得:b=17.1667,f=3,61第61頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.5獨立性檢驗--例

對給定顯著性水平α=0.05,用統(tǒng)計軟件SAS系統(tǒng)計算時,通過計算p值進行檢驗:p=P{ξ≥9.7555}=0.02076.因p值=0.02076<0.05=α,故否定H0,即隨機向量的三個分量不相互獨立.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率為0.05.62第62頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗

在均值和協(xié)差陣的檢驗中,以及以后將介紹的一些統(tǒng)計方法中都是假定樣本來自p元正態(tài)總體.所作統(tǒng)計推斷的結論是否正確,在某種意義上取決于實際總體與正態(tài)總體接近的程度如何?因此建立一些方法來檢驗多元觀測數(shù)據與多元正態(tài)數(shù)據的差異是否顯著是十分必要的.

設X(α)=(Xα1,

…,Xαp)′(α=1,…,n)是來自p元總體X的樣本,試問總體X是否服從Np(μ,Σ)分布?若總體X=(X1,…,Xp)′~Np(μ,Σ),利用多元正態(tài)分布的一些性質可知(記μ=(μ1,…,μp)′,Σ=(σij)p×p):63第63頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗

①每個分量Xi~N(μi,σii)(i=1,…,p).②任二個分量(Xi

,Xj)~二元正態(tài)分布.③設l=(l1,…,lp)′為任給的p維常向量,令ξ=l′X,則ξ~N1(l′μ,l′Σl).④令η=(X-μ)′Σ-1(X-μ),則η~χ2(p).⑤正態(tài)隨機向量X的概率密度等高線為橢球.若總體X為多元正態(tài)總體,必具有以上所列的幾條性質.如果X具有以上這些性質,也不一定能得出X為p元正態(tài)分布.但如果經過檢驗,比如發(fā)現(xiàn)某個分量Xi與正態(tài)分布有顯著差異,即可得出p元總體X與p元正態(tài)分布也有顯著差異.利用以上性質,要來構造出好的滿意的多元正態(tài)的整體性檢驗十分困難.64第64頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--一維邊緣分布的正態(tài)性檢驗在實際應用中如果經過從多方面得到的檢驗結果與正態(tài)分布均無顯著性差異,也就認為該總體X與p元正態(tài)無顯著差異.

設p維隨機向量X=(X1,…,Xp)′,檢驗分量Xi~N(μi,σ2)(i=1,…,p),把p維正態(tài)性檢驗化為p個一維數(shù)據的正態(tài)性檢驗.常用的檢驗方法有以下幾種.

1.χ2檢驗法

這是適用于連續(xù)型或離散型隨機變量分布的擬合優(yōu)度檢驗方法,也稱為Pearsonχ2

檢驗法.

2.柯氏(Kolmogorov,A.N.)檢驗法

這是適用于連續(xù)型分布的擬合優(yōu)度檢驗方法.65第65頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--一維邊緣分布的正態(tài)性檢驗

3.偏峰檢驗法

4.W(Wilks)檢驗和D檢驗

5.Q-Q(QuantileQuantile)圖檢驗法

6.P-P(ProbabilityProbability)圖檢驗法

7.“3σ”原則檢驗法

8.A2和W2統(tǒng)計量檢驗法方法3至方法8都是只適用于正態(tài)分布的檢驗法.66第66頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--二維數(shù)據的正態(tài)性檢驗設X=(X1,…,Xp)′為p維隨機向量,X的任二個分量的n次觀測數(shù)據記為X(i)=(Xi1,Xi2)′(i=1,…,n).下面介紹檢驗二維觀測數(shù)據是否來自二元正態(tài)分布的方法.

1.等概橢圓檢驗法

若二維隨機向量X=(X1,X2)′~N2(μ,Σ),則X的概率密度函數(shù)等高線f(x1,x2)=a

(X-μ)′Σ-1(X-μ)=b2右邊是中心在(μ1,μ2)由(X-μ)′Σ-1(X-μ)=b2決定的橢圓.由本章§3.1的介紹的知識可知

D2=(X-μ)′Σ-1(X-μ)~χ2(2).對給定p0∈(0,1),則存在d0使P{D2≤d0}=p0注:此檢驗法較粗糙,詳見教材P99例3.6.167第67頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--二維數(shù)據的正態(tài)性檢驗

2.二維數(shù)據的χ2圖檢驗法

因二維數(shù)據的χ2圖檢驗法與p維數(shù)據的χ2圖檢驗法原理完全相同.故關于二維數(shù)據的χ2

圖檢驗方法請參閱下面p維數(shù)據的χ2圖檢驗方法.68第68頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據的正態(tài)性檢驗設X(α)=(Xα1,

…,Xαp)′(α=1,…,n)是來自p元總體X的樣本,檢驗H0:X~Np(μ,Σ),H1:X不服從Np(μ,Σ).

1.χ2統(tǒng)計量的Q-Q圖檢驗法(或P-P圖檢驗法)

這是由正態(tài)分布的性質④構造的檢驗法.在H0下,樣品X到總體中心μ的廣義平方距離(或稱馬氏距離)D2(X,μ)記為D2,則有D2=(X-μ)′Σ-1(X-μ)~χ2(p)以下構造的檢驗方法就是檢驗統(tǒng)計量D2是否~χ2(p).直觀的想法是:由樣品X(α)計算D2α(α=1,…,n),對D2α排序:69第69頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據的正態(tài)性檢驗

D2(1)≤D2(2)≤…≤D2(n).

統(tǒng)計量

D2

的經驗分布函數(shù)取為其中H(D2(t)|p)表示χ2(p)的分布函數(shù)在D2(t)的值.設χ2分布的pt分位數(shù)為χt2,顯然χt2滿足:H(χt2|p)=pt.即χ2分布的pt分位數(shù)χt2=H-1(pt|p).由經驗分布得到樣本的pt分位數(shù)D2(t)=Fn-1(pt).若H(x|p)

≈Fn(x),應有D2(t)≈χt2

,繪制點(D2(t),χt2

)的散布圖,當X為正態(tài)總體時,這些點應散布在一條直線上.70第70頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據的正態(tài)性檢驗這種檢驗法其實就是卡方分布的Q-Q圖檢驗法.類似地也可以繪制點(pt,H(D2(t)

|p))的散布圖,當X為正態(tài)總體時,這些點也應散布在一條直線上.這種檢驗法其實就是卡方分布的P-P圖檢驗法.具體檢驗步驟如下:(1)由n個p維樣本點X(α)(α=1,…,n)計算樣本均值X,樣本協(xié)差陣S:71第71頁,課件共83頁,創(chuàng)作于2023年2月第三章多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據的正態(tài)性檢驗(2)計算樣品點X(t)到X的廣義平方距離(即馬氏距離)(3)對廣義平方距離D2t

按從小到大的次序排序

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論