多元第三章 精品課件_第1頁
多元第三章 精品課件_第2頁
多元第三章 精品課件_第3頁
多元第三章 精品課件_第4頁
多元第三章 精品課件_第5頁
已閱讀5頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多元課件第三章 第1頁,共83頁,2022年,5月20日,13點40分,星期二1第三章 多元正態(tài)總體參數(shù)的假設檢驗目 錄(二)3.3 多總體均值向量的檢驗3.4 協(xié)差陣的檢驗3.5 獨立性檢驗3.6 正態(tài)性檢驗 第三章所涉及的最大似然估計量小結 第2頁,共83頁,2022年,5月20日,13點40分,星期二2第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 當p1時,因 且相互獨立,故有 1. 兩總體協(xié)差陣相等(但未知)時均值向量的檢驗 設X()(1,n)為來自總體XNp(1),)的隨機樣本;Y()(1,m)為來自總體Y Np(2),)的隨機樣本,且相互獨立,未

2、知.檢驗第3頁,共83頁,2022年,5月20日,13點40分,星期二3第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 取檢驗統(tǒng)計量為 t (n+m-2) (在H0成立時) ,即 第4頁,共83頁,2022年,5月20日,13點40分,星期二4第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 推廣到p元總體,檢驗統(tǒng)計量的形式類似,可考慮以下檢驗統(tǒng)計量T2: 其中A1和A2是兩總體的樣本離差陣.它們是一元統(tǒng)計中的偏差平方和(X(i)-X)2在p元情況下的推廣.以下來證明統(tǒng)計量T 2 T 2 (p,n+m-2). 因 第5頁,共83

3、頁,2022年,5月20日,13點40分,星期二5第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 由Wishart分布的可加性知 A1+ A2Wp(n+m-2,),由T2統(tǒng)計量的定義3.1.5可知 第6頁,共83頁,2022年,5月20日,13點40分,星期二6第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 利用T2與F的關系,檢驗統(tǒng)計量取為 可以證明T2 (或F)統(tǒng)計量是檢驗以上假設H0的似然比統(tǒng)計量.(見習題3-10)第7頁,共83頁,2022年,5月20日,13點40分,星期二7第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3

4、多總體均值向量的檢驗-兩總體均值檢驗例子 為了研究日、美兩國在華投資企業(yè)對中國經營環(huán)境的評價是否存在差異,今從兩國在華投資企業(yè)中各抽出10家,讓其對中國的政治、經濟、法律、文化環(huán)境進行打分,評分結果見表3.2(表中1至10號為美國在華投資企業(yè)的代號,11至20號為日本在華投資企業(yè)的代號.數(shù)據來源于:國務院發(fā)展研究中心APEC在華投資企業(yè)情況調查). 解 比較日、美兩國在華投資企業(yè)對中國多方面的經營環(huán)境的評價是否有差異問題,就是兩總體均值向量是否相等的檢驗問題.(見yydy331a.sas或yydy331b.sas)第8頁,共83頁,2022年,5月20日,13點40分,星期二8第三章 多元正態(tài)

5、總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩總體均值檢驗例子 第9頁,共83頁,2022年,5月20日,13點40分,星期二9第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩總體均值檢驗例子 記美國在華投資企業(yè)對中國4個方面的經營環(huán)境的評價為4維總體X,并設XN4(1),).日本在華投資企業(yè)對中國經營環(huán)境的評價為4維總體Y,并設YN4(2),). 來自兩總體的樣本容量n=m=10.檢驗取檢驗統(tǒng)計量為 由樣本值計算得:X(64, 43, 30.5, 63), Y(51.5, 51, 40, 70.5),第10頁,共83頁,2022年,5月20日,13點40分,星期二10第

6、三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩總體均值檢驗例子進一步計算可得: 第11頁,共83頁,2022年,5月20日,13點40分,星期二11第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩總體均值檢驗例子對給定顯著性水平=0.01,利用統(tǒng)計軟件進行檢驗時,首先計算p值(此時檢驗統(tǒng)計量FF(4,15): p=PF6.2214=0.0037 .因p值=0.00370.01=,故否定H0,即日、美兩國在華投資企業(yè)對中國經營環(huán)境的評價存在顯著性差異.在這種情況下,可能犯第一類錯誤,且犯第一類錯誤的概率為0.01.第12頁,共83頁,2022年,5月20日,1

7、3點40分,星期二12第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體 2. 兩總體協(xié)差陣不等時均值向量的檢驗 在一元統(tǒng)計中(p=1時),當12 22時,檢驗H0:(1)(2)也沒有很好的方法,以下介紹實用中的幾種方法. 當n=m時,作為成對數(shù)據進行處理.令Z(i)=X(i) -Y(i) (i=1,n),化為單個p元總體Z的均值檢驗問題 H0:(1)(2) H0: Z0 利用前面介紹的方法進行檢驗. 注意:在這里兩組樣本相互獨立的信息沒有利用.第13頁,共83頁,2022年,5月20日,13點40分,星期二13第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值

8、向量的檢驗-兩個p元正態(tài)總體 當nm時(不妨設nm):想法也是化為單個p元新總體的均值檢驗問題.若只取n對數(shù)據按方法處理,又將損失一些信息.改進的辦法是利用X(i) (i=1,n)和Y(j) (j=1,m),構造新總體Z的樣本Z(i) ,令可以證明: 第14頁,共83頁,2022年,5月20日,13點40分,星期二14第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-兩個p元正態(tài)總體所以Z(i) N p(1)-(2),Z) (i1,n),且相互獨立.利用前面介紹的單個正態(tài)總體均值向量的檢驗方法進行檢驗. 當1 , 2相差甚大時, 可構造近似檢驗統(tǒng)計量進行檢驗(見參考文獻1). 其

9、中第15頁,共83頁,2022年,5月20日,13點40分,星期二15第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析 多個正態(tài)總體均值向量的檢驗問題也稱為多元方差分析 . 設有k個p元正態(tài)總體Np(t),) (t1,k),樣品 (t1,k,1,nt )是來自Np(t),)的隨機樣本,檢驗 H0:(1)(k),H1:至少存在ij使得(i)(j) (即(1),(k)中至少有一對不等). 當p=1時,此檢驗問題就是一元方差分析問題,比如比較k個不同品牌的同類產品中一個質量指標X(如耐磨度)有無顯著差異的問題,我們把不同品牌對應不同總體(假定為正態(tài)總體),這種多組比較問題就

10、是檢驗問題.第16頁,共83頁,2022年,5月20日,13點40分,星期二16第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析 從第i個總體抽取容量為ni的隨機樣本如下(i=1,k;記n=n1+n2+nk): 第17頁,共83頁,2022年,5月20日,13點40分,星期二17第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析(p=1) 當p=1時,利用一元方差分析的思想來構造檢驗統(tǒng)計量.記 則有平方和分解公式: SSTSSA+SSE 第18頁,共83頁,2022年,5月20日,13點40分,星期二18第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3

11、 多總體均值向量的檢驗多元方差分析(p=1) 直觀考察,若H0成立(即k個總體均值無顯著差異),當總偏差平方和SST固定不變時,應有組間偏差平方和 SSA小,而組內偏差平方和 SSE大,因而比值SSA/SSE應很小. 檢驗統(tǒng)計量取為 給定顯著性水平,按傳統(tǒng)檢驗方法,查F分布臨界值表得F滿足: PFF,否定域WFF .第19頁,共83頁,2022年,5月20日,13點40分,星期二19第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析 推廣到k個p元總體Np(t,) (假定k個總體的協(xié)差陣相等,且記為),記第i個p元總體的數(shù)據陣為對總離差陣進行分解: 第20頁,共83頁,

12、2022年,5月20日,13點40分,星期二20第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析 其中 稱為組間離差陣. 故交叉項=O稱為組內離差陣. 第21頁,共83頁,2022年,5月20日,13點40分,星期二21第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析 根據直觀想法及用似然比原理得到檢驗H0的統(tǒng)計量為 由Wishart分布的定義容易得出: 因 Ai Wp(ni-1,)且相互獨立(i1,k),由可加性可得AA1+AkWp(n-k,) (n=n1+nk). 在H0下,TWp (n-1,). 還可以證明在H0下,BWp(k-1,),

13、且B與A相互獨立.第22頁,共83頁,2022年,5月20日,13點40分,星期二22第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析根據分布的定義,可知 給定顯著性水平,查Wilks分布臨界值表,可得,使 P,故否定域W . 當手頭沒有Wilks臨界值表時,可用2分布或F分布來近似,即由的函數(shù)的近似分布進行檢驗(見參考文獻1或2).第23頁,共83頁,2022年,5月20日,13點40分,星期二23第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗多元方差分析的例子 為了研究某種疾病,對一批人同時測量了四個指標:脂蛋白(X1),甘油三酯(X2),脂蛋白(

14、X3),前脂蛋白(X4).按不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性),數(shù)據見書中表3.3.試問這三組的四項指標間有無顯著性差異? 解 比較三個組(k=3)的4項指標(p=4)間是否有差異問題,就是多總體均值向量是否相等的檢驗問題.設第i組為4維總體N4(i),)(i=1,2,3).來自3個總體的樣本容量n1=n2=n3=20.檢驗 H0: (1)(2)(3) H1:(1),(2),(3)至少有一對不相等. ( 見yydy332?.sas )第24頁,共83頁,2022年,5月20日,13點40分,星期二24第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3

15、 多總體均值向量的檢驗-兩總體均值檢驗例子 第25頁,共83頁,2022年,5月20日,13點40分,星期二25第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-多元方差分析的例子 因似然比統(tǒng)計量(p,n-k,k-1),此例中k-1=2,可以利用統(tǒng)計量與F統(tǒng)計量的關系,取檢驗統(tǒng)計量為F統(tǒng)計量:由樣本值計算得:X=(259.08, 84.12, 32.37, 17.8), 第26頁,共83頁,2022年,5月20日,13點40分,星期二26第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-多元方差分析的例子第27頁,共83頁,2022年,5月20日,13點40分,星期

16、二27第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-多元方差分析的例子進一步計算可得對給定=0.01,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(此時檢驗統(tǒng)計量FF(8,108): p=PF3.09007=0.003538.因p值=0.0035380.01=,故否定H0,這表明三個組的指標之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率為0.01.第28頁,共83頁,2022年,5月20日,13點40分,星期二28第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-多元方差分析的例子 進一步地若還想了解三個組指標間的差異究竟是哪幾項指標引起的,

17、可以對4項指標逐項用一元方差分析方法進行檢驗,我們將發(fā)現(xiàn)三組指標間只有第一項指標X1有顯著差異. 事實上,用一元方差分析檢驗第一項指標X1在三個組中是否有顯著差異時,因 第29頁,共83頁,2022年,5月20日,13點40分,星期二29第三章 多元正態(tài)總體參數(shù)的假設檢驗3.3 多總體均值向量的檢驗-多元方差分析的例子其中t11和a11分別是T和A中的第一個對角元素. p1=PF18.8780=0.0004401(檢驗統(tǒng)計量F1F(2,57)p值=0.0004401顯著地小于0.01,故第一項指標X1在三個組中有顯著差異. 第30頁,共83頁,2022年,5月20日,13點40分,星期二30第

18、三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 設X()(=1,n)為來自p元正態(tài)總體Np(,)(0未知)的隨機樣本,檢驗 H0: 0(00為已知陣),H1:0 1. 當0 Ip時檢驗H0:Ip,H1:Ip 利用似然比原則來導出檢驗統(tǒng)計量1 當Ip成立時,似然函數(shù)L(,Ip)在X達最大值.第31頁,共83頁,2022年,5月20日,13點40分,星期二31第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 所以似然比統(tǒng)計量 其中 第32頁,共83頁,2022年,5月20日,13點40分,星期二32第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢

19、驗-單個p元正態(tài)總體 利用定理3.2.1可知,當n很大且H0成立時, =-2ln1的近似分布為2(p(p+1)/2),參數(shù)空間的維數(shù)為p+p(p+1)/2,而0的維數(shù)為p,故卡方分布的自由度為p(p+1)/2. 取作為檢驗統(tǒng)計量,按傳統(tǒng)檢驗方法,對給定顯著性水平,否定域為 2,其中2 滿足:P 2 =.第33頁,共83頁,2022年,5月20日,13點40分,星期二33第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 2. 當0 I p時檢驗H0 :0 ,H1 :0 因00,存在p階非退化陣D,使D0DI p, 令 Y()=DX ()(1,n),則Y()N p(D,DD

20、)=N p(*,*)檢驗H 0 :0 H0 :* I p 從新樣本Y()(=1,n)出發(fā),檢驗H0:*Ip的檢驗統(tǒng)計量取為記為第34頁,共83頁,2022年,5月20日,13點40分,星期二34第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 其中 若注意到D0DI p ,即第35頁,共83頁,2022年,5月20日,13點40分,星期二35第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 研究似然比統(tǒng)計量2的抽樣分布是很困難的.通常根據定理3.2.1由2的近似分布來構造檢驗法. 當樣本容量n很大,在H0成立時,-2ln2 的極限分布為2(p(p

21、+1)/2). 除此外在不同適用范圍下還有其它近似分布可用來構造檢驗法.則似然比統(tǒng)計量2還可以表示為 第36頁,共83頁,2022年,5月20日,13點40分,星期二36第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 3. 檢驗H0:20 (2 未知) 當0 Ip 時此檢驗常稱為球性檢驗.利用似然比原則來導出檢驗統(tǒng)計量3: 當2給定時,似然函數(shù)L(,20)在=X達最大值,且第37頁,共83頁,2022年,5月20日,13點40分,星期二37第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 可得出 第38頁,共83頁,2022年,5月20日,13

22、點40分,星期二38第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-單個p元正態(tài)總體 所以似然比統(tǒng)計量 或等價于 當樣本容量n很大,在H0為真時有以下近似分布: 第39頁,共83頁,2022年,5月20日,13點40分,星期二39第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體 設有k個總體Np(t),t)(t=1,k),X()(t)(t1,k;1,n t)來自第t個總體Np(t) ,t )的隨機樣本,記nn1+n2+nk. 檢驗H0 :1=2=k,H1 : 1, 2,k不全相等. 樣本 X()(t)的似然函數(shù)為似然比統(tǒng)計量4為 第40頁,共83頁,2022年,

23、5月20日,13點40分,星期二40第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體 第41頁,共83頁,2022年,5月20日,13點40分,星期二41第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體 則似然比檢驗統(tǒng)計量為( 其中 A=A1+Ak)第42頁,共83頁,2022年,5月20日,13點40分,星期二42第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體 根據無偏性的要求進行修正,將4中的ni用ni -1替代,n用n-k替代.然后對4取對數(shù),可得到統(tǒng)計量: 當樣本容量n很大時,在H0為真時M有以下近似分布: (1

24、-d)M=-2(1-d)ln4*2(f)其中 f=p(p+1)(k-1) /2,第43頁,共83頁,2022年,5月20日,13點40分,星期二43第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體(例) 例3.4.1 對例3.3.2表3.3中給出的身體指標化驗數(shù)據,試判斷三個組(即三個總體)的協(xié)差陣是否相等(=0.10) 解 這是三個4維正態(tài)總體的協(xié)差陣是否相等的檢驗問題.設第i組為4維總體N4(i),i)(i=1,2,3).來自三個總體的樣本容量n1=n2=n3=20.檢驗H0:123,H1:1,2,3至少有一對不相等.在H0成立時,取近似檢驗統(tǒng)計量為2(f)統(tǒng)計量:

25、由樣本值計算三個總體的樣本協(xié)差陣: 第44頁,共83頁,2022年,5月20日,13點40分,星期二44第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體(例) 第45頁,共83頁,2022年,5月20日,13點40分,星期二45第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體(例) 第46頁,共83頁,2022年,5月20日,13點40分,星期二46第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 協(xié)差陣的檢驗-多個p元正態(tài)總體(例) 進一步計算可得 第47頁,共83頁,2022年,5月20日,13點40分,星期二47第三章 多元正態(tài)總體參數(shù)的假設檢驗3

26、.4 協(xié)差陣的檢驗-多個p元正態(tài)總體(例) 對給定=0.10,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗統(tǒng)計量2(20):p=P 20.331621=0.4373646.因p值=0.43736460.10=,故H0相容,這表明三個組的協(xié)差陣之間沒有顯著的差異.第48頁,共83頁,2022年,5月20日,13點40分,星期二48第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 設有k個總體Np(t),t)(t=1,k), X()(t)(t1,k; 1,nt)來自第t個總體Np(t ,t )的隨機樣本,記nn1+n2+nk. 檢驗 H0 : (1) = (

27、2) = =(k) =, 1=2=k = , H1 : (1) , (2) , ,(k) 或1, 2,k不全相等.記 第49頁,共83頁,2022年,5月20日,13點40分,星期二49第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 似然比統(tǒng)計量5為 第50頁,共83頁,2022年,5月20日,13點40分,星期二50第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 則檢驗以上假設H0的樣本 X(t)() 似然函數(shù)為第51頁,共83頁,2022年,5月20日,13點40分,星期二51第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4

28、-多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 若用表示當協(xié)差陣均相同時檢驗k個總體均值向量是否相等的似然比統(tǒng)計量,將發(fā)現(xiàn)這里的檢驗統(tǒng)計量5=4 . 在實際應用中我們采用類似的修正方法,在5中用nt-1替代nt,用n-k替代n.修正后的統(tǒng)計量記為5*:第52頁,共83頁,2022年,5月20日,13點40分,星期二52第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 當樣本容量n很大,在H0為真時5*有以下近似分布: 其中 第53頁,共83頁,2022年,5月20日,13點40分,星期二53第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同

29、時檢驗 例3.4.2 對例3.3.2表3.3給出的身體指標化驗數(shù)據,試判斷三個組(即三個總體)的均值向量和協(xié)差陣是否全都相等(=0.05)? 解 這是三個4維正態(tài)總體的均值向量和協(xié)差陣是否同時相等的檢驗問題.取近似檢驗統(tǒng)計量為近似2統(tǒng)計量: =-2(1-b)ln5* 2( f ).由樣本值計算三個總體的樣本協(xié)差陣見例3.4.1,所有樣本的總離差陣T見例3.3.2.進一步計算可得第54頁,共83頁,2022年,5月20日,13點40分,星期二54第三章 多元正態(tài)總體參數(shù)的假設檢驗3.4 -多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗 對給定=0.05,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗

30、統(tǒng)計量 2(28): p=P 43.1408= 0.03373.因p值=0.033730.05=,故否定H0,這表明三個組的均值向量和協(xié)差陣之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率0.05.第55頁,共83頁,2022年,5月20日,13點40分,星期二55第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗 設總體XNp(,),將X剖分為k個子向量,而和也相應剖分為其中p= p1+ pk,且知pt維子向量X(t)Npt(t),tt) (t1,k). 若k個隨機子向量相互獨立,把p維(高維)隨機向量的問題化為k個低維隨機向量的問題來處理,在處理多元統(tǒng)計分析的許多問題

31、中將帶來極大的方便.第56頁,共83頁,2022年,5月20日,13點40分,星期二56第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗 在第二章我們已介紹過若X(1),X(k)相互獨立,則有ij O(對一切ij).因此檢驗X(1),X(k)是否相互獨立的問題等價于檢驗對任二個子向量,其協(xié)差陣ij 是否等于O(對一切ij). 在正態(tài)總體下,獨立性檢驗可化為檢驗H0: ij O(一切ij),H1: ij O,至少有一對ij. 設X(t)(t1,n,np)為來自總體X的隨機樣本.將樣品X(t) ,樣本均值X和樣本離差陣A作相應剖分為第57頁,共83頁,2022年,5月20日,13點40分,星期

32、二57第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗 用似然比原理,在H0成立時, X(t)() Npt(t),tt )(t1,k; 1,n) 且相互獨立,故樣本的似然函數(shù)為 所以似然比統(tǒng)計量的分子為第58頁,共83頁,2022年,5月20日,13點40分,星期二58第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗 似然比統(tǒng)計量為Box證明了,在H0成立下當n時,-blnV2(f),其中 第59頁,共83頁,2022年,5月20日,13點40分,星期二59第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗-例 例3.4.1 試檢驗例3.2.1女性汗液數(shù)據中隨機向量X的三個分量是否相

33、互獨立(=0.05). 解 記隨機向量X=(X1,X2,X3),假定XN3(,),且記=(ij).檢驗 H0:12=0,13=0,230, H1: 12,13,23不全為0. 取檢驗統(tǒng)計量為 當X的三個分量相互獨立,且樣本容量n很大時,近似于2(f) . 第60頁,共83頁,2022年,5月20日,13點40分,星期二60第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗-例 由表3.1的樣本值計算樣本離差陣A,可得: 此例中n=20, p=3, p1=p2=p3=1, k=3.進一步計算可得: b=17.1667, f=3,第61頁,共83頁,2022年,5月20日,13點40分,星期二6

34、1第三章 多元正態(tài)總體參數(shù)的假設檢驗3.5 獨立性檢驗-例 對給定顯著性水平=0.05,用統(tǒng)計軟件SAS系統(tǒng)計算時,通過計算p值進行檢驗: p=P9.7555=0.02076.因p值=0.020760.05=,故否定H0,即隨機向量的三個分量不相互獨立.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率為0.05.第62頁,共83頁,2022年,5月20日,13點40分,星期二62第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6 正態(tài)性檢驗 在均值和協(xié)差陣的檢驗中,以及以后將介紹的一些統(tǒng)計方法中都是假定樣本來自p元正態(tài)總體.所作統(tǒng)計推斷的結論是否正確,在某種意義上取決于實際總體與正態(tài)總體接近的程度如何

35、?因此建立一些方法來檢驗多元觀測數(shù)據與多元正態(tài)數(shù)據的差異是否顯著是十分必要的.設X()(X1 , , Xp) (1,n)是來自p元總體X的樣本,試問總體X是否服從Np(,)分布? 若總體X(X1,Xp)Np(,),利用多元正態(tài)分布的一些性質可知(記=(1,p),=(ij)pp ): 第63頁,共83頁,2022年,5月20日,13點40分,星期二63第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6 正態(tài)性檢驗 每個分量XiN(i,ii) (i1,p). 任二個分量(Xi , Xj )二元正態(tài)分布. 設l=(l1,lp)為任給的p維常向量,令lX,則N1( l,ll ). 令=(X-)-1(X-),則2

36、(p). 正態(tài)隨機向量X的概率密度等高線為橢球. 若總體X為多元正態(tài)總體,必具有以上所列的幾條性質.如果X具有以上這些性質,也不一定能得出X為p元正態(tài)分布.但如果經過檢驗,比如發(fā)現(xiàn)某個分量Xi與正態(tài)分布有顯著差異,即可得出p元總體X與p元正態(tài)分布也有顯著差異.利用以上性質,要來構造出好的滿意的多元正態(tài)的整體性檢驗十分困難.第64頁,共83頁,2022年,5月20日,13點40分,星期二64第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-一維邊緣分布的正態(tài)性檢驗 在實際應用中如果經過從多方面得到的檢驗結果與正態(tài)分布均無顯著性差異,也就認為該總體X與p元正態(tài)無顯著差異. 設p維隨機向量X(X1

37、,Xp),檢驗分量XiN(i,2) (i1,p) ,把p維正態(tài)性檢驗化為p個一維數(shù)據的正態(tài)性檢驗.常用的檢驗方法有以下幾種. 1. 2檢驗法 這是適用于連續(xù)型或離散型隨機變量分布的擬合優(yōu)度檢驗方法,也稱為Pearson 2 檢驗法. 2. 柯氏(Kolmogorov,A.N.)檢驗法 這是適用于連續(xù)型分布的擬合優(yōu)度檢驗方法.第65頁,共83頁,2022年,5月20日,13點40分,星期二65第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-一維邊緣分布的正態(tài)性檢驗 3. 偏峰檢驗法 4. W (Wilks)檢驗和D檢驗 5. Q-Q (QuantileQuantile)圖檢驗法 6. P-P

38、 (ProbabilityProbability )圖檢驗法 7. “3”原則檢驗法 8. A2和W2統(tǒng)計量檢驗法 方法3至方法8都是只適用于正態(tài)分布的檢驗法.第66頁,共83頁,2022年,5月20日,13點40分,星期二66第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-二維數(shù)據的正態(tài)性檢驗 設X(X1,Xp) 為p維隨機向量,X的任二個分量的n次觀測數(shù)據記為X(i)=(Xi1,Xi2)(i=1,n).下面介紹檢驗二維觀測數(shù)據是否來自二元正態(tài)分布的方法. 1. 等概橢圓檢驗法 若二維隨機向量X=(X1,X2)N2(,),則X的概率密度函數(shù)等高線 f(x1,x2)a (X-)-1(X-)

39、b2右邊是中心在(1,2)由(X-)-1(X-)b2決定的橢圓.由本章3.1的介紹的知識可知 D2(X-)-1(X-)2 (2).對給定p0(0,1),則存在d0使 P D2 d0p0 注:此檢驗法較粗糙,詳見教材P99例第67頁,共83頁,2022年,5月20日,13點40分,星期二67第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-二維數(shù)據的正態(tài)性檢驗 2. 二維數(shù)據的2圖檢驗法 因二維數(shù)據的2圖檢驗法與p維數(shù)據的2圖檢驗法原理完全相同.故關于二維數(shù)據的2 圖檢驗方法請參閱下面p維數(shù)據的2圖檢驗方法.第68頁,共83頁,2022年,5月20日,13點40分,星期二68第三章 多元正態(tài)總

40、體參數(shù)的假設檢驗3.6正態(tài)性檢驗-p維數(shù)據的正態(tài)性檢驗 設X()(X1 , , Xp) (1,n)是來自p元總體X的樣本, 檢驗H0: XNp(,),H1:X不服從Np (,). 1. 2統(tǒng)計量的Q-Q圖檢驗法(或P-P圖檢驗法) 這是由正態(tài)分布的性質構造的檢驗法. 在H0下,樣品X到總體中心的廣義平方距離(或稱馬氏距離)D2(X,)記為D2 ,則有 D2 (X-)-1(X-)2(p)以下構造的檢驗方法就是檢驗統(tǒng)計量D2是否2(p).直觀的想法是:由樣品X()計算D2(1,n),對D2排序: 第69頁,共83頁,2022年,5月20日,13點40分,星期二69第三章 多元正態(tài)總體參數(shù)的假設檢驗

41、3.6正態(tài)性檢驗-p維數(shù)據的正態(tài)性檢驗 D2(1) D2(2) D2(n) .統(tǒng)計量 D2 的經驗分布函數(shù)取為 其中H(D2(t) |p)表示2 (p)的分布函數(shù)在D2(t)的值. 設2 分布的pt分位數(shù)為t2 ,顯然t2滿足: H(t 2 |p)= pt.即2 分布的pt 分位數(shù)t2 H-1(pt |p). 由經驗分布得到樣本的pt 分位數(shù)D2(t)=Fn-1(pt ).若H(x|p) Fn(x),應有D2(t) t2 ,繪制點(D2(t) , t2 )的散布圖,當X為正態(tài)總體時,這些點應散布在一條直線上. 第70頁,共83頁,2022年,5月20日,13點40分,星期二70第三章 多元正態(tài)

42、總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-p維數(shù)據的正態(tài)性檢驗 這種檢驗法其實就是卡方分布的Q-Q圖檢驗法. 類似地也可以繪制點(pt , H(D2(t) |p)的散布圖,當X為正態(tài)總體時,這些點也應散布在一條直線上.這種檢驗法其實就是卡方分布的P-P圖檢驗法. 具體檢驗步驟如下: (1) 由n個p維樣本點X() (1,n)計算樣本均值X,樣本協(xié)差陣S:第71頁,共83頁,2022年,5月20日,13點40分,星期二71第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-p維數(shù)據的正態(tài)性檢驗 (2) 計算樣品點X(t)到X的廣義平方距離(即馬氏距離) (3) 對廣義平方距離D2t 按從小到大的次序排序 (4) 計算pt(t-0.5)/n (t=1, 2,n) ,t2 ,其中t2滿足: H(t2 |p)= pt (或計算H(D2(t)|p)的值).第72頁,共83頁,2022年,5月20日,13點40分,星期二72第三章 多元正態(tài)總體參數(shù)的假設檢驗3.6正態(tài)性檢驗-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論