《應(yīng)用多元分析》第四章_第1頁
《應(yīng)用多元分析》第四章_第2頁
《應(yīng)用多元分析》第四章_第3頁
《應(yīng)用多元分析》第四章_第4頁
《應(yīng)用多元分析》第四章_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章 多元正態(tài)總體的統(tǒng)計推斷v4.1 一元情形的回顧v4.2 單個總體均值的推斷v4.3 單個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗v4.4 兩個總體均值的比較推斷v4.5 兩個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗v4.6 多個總體均值的比較檢驗(多元方差分析) v4.7 總體相關(guān)系數(shù)的推斷4.2 單個總體均值的推斷v一、均值向量的檢驗v二、置信區(qū)域v三、聯(lián)合置信區(qū)間一、均值向量的檢驗v設(shè)x1,x2, ,xn是取自總體xNp (, )的一個樣本,這里0,np,欲檢驗H0:=0,H1:0v1.已知 檢驗統(tǒng)計量為 拒絕規(guī)則為:若 ,則拒絕H021000Tnxx 220Tpv2. 未知 檢驗統(tǒng)計量為 稱之為霍特林(

2、Hotelling)T2 統(tǒng)計量。當(dāng) H0 為真時 服從F(p,np) ,對給定的顯著性水平,拒絕規(guī)則為: 若 ,則拒絕H0 其中。2100TnxSx21,p nTFp npnp21npTp n22TTv例4.2.1 對某地區(qū)農(nóng)村的6名2周歲男嬰的身高、胸圍、上半臂圍進行測量,得樣本數(shù)據(jù)如表4.2.1所示。根據(jù)以往資料,該地區(qū)城市2周歲男嬰的這三個指標(biāo)的均值0=(90,58,16),現(xiàn)欲在多元正態(tài)性假定下檢驗該地區(qū)農(nóng)村男嬰是否與城市男嬰有相同的均值。這是假設(shè)檢驗問題:H0:=0,H1:0表4.2.1 某地區(qū)農(nóng)村男嬰的體格測量數(shù)據(jù)編 號身高(cm)胸圍(cm)上半臂圍(cm)17860.616.

3、527658.112.539263.214.548159.014.058160.815.568459.514.0查表得F0.01(3,3)=29.5,于是故在顯著性水平=0.01下,拒絕原假設(shè)H0,即認(rèn)為農(nóng)村與城市的2周歲男嬰上述三個指標(biāo)的均值有顯著差異(p=0.002)。011282.08.060.2 ,2.214.51.531.6008.0400.5008.0403.1721.3100.5001.3101.9004.310714.62108.946423.1384814.621059.790037.37608.946437.376035.5936TxxSS1006 70.0741420.4

4、45nxSx20.010.013 53,3147.53TF二、置信區(qū)域212212,1,111TnnpTF p npp nnpPTFp npp nP nT xSxxSxv的置信度為1的置信區(qū)域為 當(dāng)p=1時,它是一個區(qū)間;當(dāng)p=2時,它是一個橢圓,這時可將其在坐標(biāo)平面上畫出;當(dāng)p=3時,它是一個橢球;當(dāng)p3時,它是一個超橢球;它們均以 為中心。v同置信區(qū)間與假設(shè)檢驗的關(guān)系一樣,置信區(qū)域與假設(shè)檢驗之間也有著同樣的密切關(guān)系。一般來說,0包含在上述置信區(qū)域內(nèi),當(dāng)且僅當(dāng)原假設(shè) H0:=0在顯著性水平下被接受。因此,可以通過構(gòu)造的置信區(qū)域的方法來進行假設(shè)檢驗。12:nTxSxx三、聯(lián)合置信區(qū)間即以1的概

5、率對一切aRp成立,稱它為一切線性組合a,aRp的置信度為1的聯(lián)合置信區(qū)間(simultaneous confidence intervals)。v對k個線性組合ai,i=1,2, ,k,有TnTn a xa Saa a xa Sa1PTnTn aa xa Saa a xa Sa11kiiiiiiiiPTnTn a xa Saa a xa Sav當(dāng)k很小時,聯(lián)合T2置信區(qū)間的置信度一般會明顯地大于1,因而上述區(qū)間會顯得過寬,即精確度明顯偏低。這時,我們可以考慮采用邦弗倫尼 (Bonferroni)聯(lián)合置信區(qū)間:它的置信度至少為1。v若t/2k(n1)T ,則邦弗倫尼區(qū)間比T2區(qū)間要窄,這時宜采

6、用前者作為聯(lián)合置信區(qū)間;反之,若t/2k(n1)T,則邦弗倫尼區(qū)間比T2 區(qū)間寬,宜采用后者作為聯(lián)合置信區(qū)間。v當(dāng)k=p時,邦弗倫尼區(qū)間要比T2 區(qū)間窄。故在求的所有p個分量1, 2, , p的聯(lián)合置信區(qū)間時,應(yīng)采用邦弗倫尼區(qū)間。,1,2,iiiiiiiTnTnika xa Saa a xa Sa/2/2111,2,ikiiiikiitnntnnika xa Saa a xa Sav例4.2.2 為評估某職業(yè)培訓(xùn)中心的教學(xué)效果,隨機抽取8名受訓(xùn)者,進行甲和乙兩個項目的測試,其數(shù)據(jù)列于表4.2.2。假定x=(x1,x2)服從二元正態(tài)分布。n=8,p=2,取1=0.90,F(xiàn)0.10(2,6)=3.

7、46,于是,T0.10=2.841。表4.2.2 兩個項目的測試成績編 號12345678甲項成績x16280668475805479乙項成績x27077758787916184172.5112.571496.1429,7996.1429103.14290.04360.04060.04060.0475xSS的0.90置信區(qū)域為即 0.0436(172.5)20.0812(172.5)(279)+0.0475(279)21.009這是一個橢圓區(qū)域。1和2的0.90聯(lián)合T2置信區(qū)間為即61.84183.16,68.80289.20這兩個區(qū)間分別正是橢圓在1軸和2軸上的投影。112272.50.04

8、360.0406872.5,798.073790.04060.04751272.52.841112.5714/872.52.841112.5714/8792.841103.1429/8792.841103.1429/81和2的0.90邦弗倫尼聯(lián)合置信區(qū)間為(t0.025(7)=2.3646)即63.63181.37,70.51287.49這個聯(lián)合置信區(qū)間在精確度方面要好于T2聯(lián)合置信區(qū)間。由該聯(lián)合置信區(qū)間可得到置信度至少為0.90的矩形置信區(qū)域(見圖4.2.1中的實線矩形),但其矩形面積要大于橢圓面積。1272.52.3646112.5714/872.52.3646112.5714/8792.

9、3646103.1429/8792.3646103.1429/8圖4.2.1 置信橢圓和聯(lián)合置信區(qū)間利用置信區(qū)域進行假設(shè)檢驗v在例4.2.2中,如果在 =0.10下對假設(shè) H0:=0,H1:0 進行檢驗,其中=(1,2),0=(01,02) ,則我們?nèi)菀桌脠D4.2.1中的橢圓得出檢驗的結(jié)果。若被檢驗值0位于圖4.2.1中的橢圓外,則拒絕;反之,則接受。v圖4.2.1中的虛線矩形在1和2軸上的區(qū)間范圍分別是1和2的0.90置信區(qū)間。當(dāng)0位于橢圓外虛線矩形內(nèi)的位置(如圖中A點)時,檢驗結(jié)果雖拒絕H0,但如在=0.10下分別檢驗H01:1=01,H11:101 和 H02:2=02,H12:202

10、則檢驗結(jié)果都將接受原假設(shè);當(dāng)0位于橢圓內(nèi)虛線矩形外的位置(如圖中B點)時,檢驗結(jié)果雖接受H0,但H01:1=01和H02:2=02都將會被拒絕。4.3 單個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗v設(shè)x1,x2, ,xn是取自多元正態(tài)總體Np(,)的一個樣本,0,np,欲檢驗H0:C=,H1:C其中C為一已知的kp矩陣,kp,rank(C)=k,為已知的k維向量。v根據(jù)多元正態(tài)分布的性質(zhì)知CxNk(C,CC)由于 111222rankrankrankrankk CCCCCC故CC0。故我們可以用上一節(jié)檢驗假設(shè)H0:=0的方法來檢驗上述假設(shè)。檢驗統(tǒng)計量為當(dāng)原假設(shè)H0:C=為真時,對于給定的顯著性水平,拒絕規(guī)

11、則為:若 ,則拒絕H0其中 。v特別地,若欲檢驗H0:C=0,H1:C0則T2可簡化為 12TnCxCSCCx2,1nkTF k nkk n22TT21,k nTFk nknk12Tn x C CSCCxv例4.3.1 設(shè)xNp(,),=(1,2, ,p),0,x1,x2, ,xn是取自該總體的一個樣本,欲檢驗H0:1=2= =p,H1:ij,至少存在一對ij令則上面的假設(shè)可表達(dá)為H0:C=0,H1:C0檢驗統(tǒng)計量為110010101001C12Tn x C CSCCx對于給定的顯著性水平,拒絕規(guī)則為:若 ,則拒絕H0其中由于C是行滿秩的,且每行均為對比向量(即有一個1和一個1,其余皆為0),

12、故稱C為對比矩陣。該例中對比矩陣C的選擇不是惟一的,比如也可以選取對比矩陣為22TT2111,11pnTFpnpnp*110001100001Cv例4.3.2 在例4.2.1中,假定人類有這樣一個一般規(guī)律:身高、胸圍和上半臂圍的平均尺寸比例為6:4:1,我們希望檢驗表4.2.1中的數(shù)據(jù)是否符合這一規(guī)律,也就是欲檢驗H0:1/6=2/4=3,H1:1/6, 2/4, 3至少有兩個不等令則上面假設(shè)可表達(dá)為H0:C=0,H1:C0經(jīng)計算從而230106C16.658.46856.660,4.056.66094.000 CxCSC故又因所以拒絕原假設(shè)H0,即認(rèn)為這組數(shù)據(jù)與人類的一般規(guī)律不一致(p=0.

13、008)。上述的C也可以選擇為檢驗的結(jié)果是不變的。1194.00056.6602285.636456.66058.468CSC126 8.45050.700Tn x C CSCCx220.010.0112 5,18.0454k nTFk nkTnk*014106C4.4 兩個總體均值的比較推斷v一、兩個獨立樣本的情形v二、成對試驗的T2統(tǒng)計量一、兩個獨立樣本的情形v設(shè)從兩個總體Np(1,)和Np(2,)中各自獨立地抽取一個樣本 和 ,0,欲檢驗H0:1=2,H1:121,2的無偏估計的聯(lián)合無偏估計其中12111211,nniiiinnxxyy112,nx xx212,ny yy11221211

14、2pnnnnSSS1212111211,11nniiiiiinnSxxxxSyyyy為兩個樣本協(xié)方差矩陣?;籼亓諸2檢驗統(tǒng)計量當(dāng)原假設(shè)H0為真時,對給定的,拒絕規(guī)則為:若 ,則拒絕H0其中121112121211ppn nTnnnnxySxyxySxy21212121,12nnpTF p nnpp nn22TT12212122(1)1p nnTFpnnpnnp,v在實際應(yīng)用中,一旦H0:1=2被拒絕了,則可以考慮對所有的i(1ip),在相同的顯著性水平下再進一步檢驗H0i:1i=2i,以判斷是否有分量及(若有)具體是哪些分量對拒絕H0:1=2起了較大作用,這樣做常常是有益的。va(12),aR

15、p的1聯(lián)合置信區(qū)間為v當(dāng)k很小時,可采用邦弗倫尼不等式給出ai(12),i=1,2, ,k的1聯(lián)合置信區(qū)間1212121212ppnnnnTTn nn n axya S aa axya S a12/212121212/2121222ikipiiikipinntnnn nnntnnn naxya S aaaxya S av例4.4.1(例4.2.1續(xù)) 表4.4.1給出了相應(yīng)于表4.2.1的9名2周歲女嬰的數(shù)據(jù)。我們欲在多元正態(tài)性假定下檢驗2周歲的男嬰與女嬰的均值向量有無顯著差異。表4.4.1 某地區(qū)農(nóng)村女嬰的體格測量數(shù)據(jù)編 號身高(cm)胸圍(cm)上半臂圍(cm)18058.414.0275

16、59.215.037860.315.047557.413.057959.514.067858.114.577558.012.586455.511.098059.212.5從例4.2.1得從表4.4.1計算得1116,82.0, 60.2,14.5158.0040.202.50140.2015.866.552.506.559.50nnxS222976.0,58.4,13.5196.0045.1034.50145.1015.7611.6534.5011.6514.50nnyS,所以因,故不能拒絕原假設(shè)H0,即認(rèn)為兩個均值向量無顯著差異(p=0.27)。1122122112126.0,1.8,1.0

17、27.23086.56152.8462116.56152.43231.400022.84621.40001.84625.312ppnnnnn nTnnxySSSxySxy1220.050.0512120.052(1)13 133 133,113.5912.7281111p nnTFp nnpnnpF,220.05TT二、成對試驗的T2統(tǒng)計量v設(shè)(xi,yi),i=1,2, ,n(np)是成對試驗的數(shù)據(jù),令di=xiyi,i=1,2, ,n又設(shè)d1,d2, ,dn獨立同分布于Np(,),其中0,=12,1和2分別是總體x和總體y的均值向量。希望檢驗H0:1=2,H1:12等價于H0:=0,H1:

18、0這樣,兩個總體的均值比較檢驗問題就可以化為一個總體的情形。檢驗統(tǒng)計量為21Tndd S d其中當(dāng)原假設(shè)H0:=0為真時,統(tǒng)計量對給定的顯著性水平,拒絕規(guī)則為:若 ,則拒絕H0其中111niiinddxySdddd2,1npTF p npp n22TT21,p nTFp npnp4.5 兩個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗v設(shè)兩個獨立的樣本 和 分別取自總體Np(1,)和總體Np(2,),0,n1+n22p,我們希望檢驗H0:C(12)=,H1:C(12)其中C為一已知的kp矩陣,kp,rank(C)=k,為一已知的k維向量。檢驗統(tǒng)計量為其中Sp是的聯(lián)合無偏估計。當(dāng)原假設(shè)H0為真時,112,nx

19、xx212,ny yy121212pn nTnnC xyCS CC xy21212121,12nnkTF k nnkk nn拒絕規(guī)則為:若 ,則拒絕H0其中v例4.5.1 某種產(chǎn)品有甲、乙兩種品牌,從甲產(chǎn)品批和乙產(chǎn)品批中分別隨機地抽取5個樣品,測量相同的5個指標(biāo),數(shù)據(jù)列于表4.5.1。在多元正態(tài)性假定下,試問甲、乙兩種品牌產(chǎn)品的每個指標(biāo)間的差異是否有顯著的不同。該題就是要檢驗H0:C(乙甲)=0,H1:C(乙甲)0其中22TT12212122,11k nnTFk nnknnk11000011000011000011C表4.5.1 甲、乙兩種品牌產(chǎn)品的指標(biāo)值指標(biāo)12345樣品甲111181518

20、152332731211732028272319418261818952223221610均 值20.824.422.619.214.0乙1181720181823124312620314161720174252431261853628242629均 值24.821.824.623.220.4檢驗統(tǒng)計量為經(jīng)計算121212pn nTnnxxCS Cxx乙甲乙甲4.0,2.6, 2.0, 4.0, 6.472.70033.02541.65018.67522.30033.02521.25021.30012.72511.92541.65021.30041.30016.3509.85018.67512

21、.72516.35011.45010.20022.30011.9259.85010.20021.650p xxS乙甲16.6,4.6,2.0,2.427.9008.57514.4004.4258.57519.95016.3755.75014.40016.37520.0505.2504.4255.7505.25012.7000.09180.03100.10760.06250.03100.16670.15890.0017pp C xxCS CCS C乙甲0.10760.15890.27820.08120.06250.00170.08120.1334所以由于 ,所以在=0.05下拒絕原假設(shè)H0(p=

22、0.044)。10.8136,1.2855,1.8028, 0.262814.2582pyCS CC xxxxC y乙甲乙甲21220.0512120.055 514.258235.645552,1145524,56.4 5.1933.216554 1Tk nnTFk nnknnkF 4.6 多個總體均值的比較檢驗(多元方差分析)v設(shè)有k個總體1,2, ,k,它們的分布分別是Np(1,),Np(2,), ,Np(k,),今從這k個總體中各自獨立地抽取一個樣本,取自總體i的樣本為 ,i=1,2, ,k?,F(xiàn)欲檢驗H0:1=2= =k,H1:ij,至少存在一對ij記12,iiiinxxx11111i

23、inkijijijnkijiijiijkiiiinSSTxxxxSSExxxxSSTRxxxx則SST=SSE+SSTR稱SST、SSE和SSTR分別為總平方和及交叉乘積和、誤差(或組內(nèi))平方和及交叉乘積和和處理(或組間)平方和及交叉乘積和,它們分別具有自由度(n1)、(nk)和(k1)。采用似然比方法可以得到威爾克斯(Wilks)統(tǒng)計量對給定的顯著性水平,拒絕規(guī)則為:若p,k1,nkp,k1,nk,,則拒絕H0其中臨界值p,k1,nk,滿足:當(dāng)原假設(shè)H0為真時,P(p,k1,nkp,k1,nk,)=p,m,r,常通過查F分布(或卡方分布)表得到(或近似得到)。,1,p kn kSSESSES

24、SESSTRSSTv例4.6.1 為了研究銷售方式對商品銷售額的影響,選擇四種商品(甲、乙、丙和?。┌慈N不同的銷售方式(、和)進行銷售。這四種商品的銷售額分別為x1,x2,x3,x4,其數(shù)據(jù)見表4.6.1。表4.6.1 銷售額數(shù)據(jù)編 號銷售方式銷售方式銷售方式x1x2x3x4x1x2x3x4x1x2x3x41125603382106654455310653348026021198023333082454032101003446829536351260203656531228065634162654655142915040514772801174846825051306540320567544

25、812931146339538066945350190385046821055305462357466058520042453511906451507320814666273250113403903101109044222598754585240805552020060624402481011077507270766050718911069377260111076036420094332602808878299360121306139120060514291907363390320138045429270554039029511455494240146050442190654848117710

26、3544163101581542602806948442225100332733121613587507260125633122701406131234517574840028512056416280803628625018755252026070454683701355446834519766540325062664162241306932536020554241117069603772806057273260v該題中,我們需要檢驗H0:1=2=3,H1:1,2,3中至少有兩個不相等其中1,2,3分別為銷售方式、和的總體均值向量假定這三個總體均為多元正態(tài)總體,且它們的協(xié)差陣相同。p=4,k=

27、3,n1=n2=n3=20,n=n1+n2+n3=60123331190.8072.9094.1558.6551.4555.15,404.50417.75403.75230.65253.15292.0085.950055.083311408.66673258.6000iiiiinnxxxxxx313115221.301305.203581.254188.901305.20518.53963.831553.203581.25963.832480.831945.254188.901553.201945.2538529.3049290.858992.25364iiiiinijijijnnnSSTRx

28、 xxxSSTx xxx44.0028906.808992.259666.584658.334859.0036444.004658.33429509.3358114.0028906.804859.0058114.00175644.4044069.557687.0532862.7524717.907687.059148.053694.506412.20328SSESSTSSTR62.753694.50427028.5056168.7524717.906412.2056168.75137115.10于是由附錄43中的(43.4)式可得查F分布表得,F(xiàn)0.01(8,108)=2.683.039,從而

29、在=0.01的水平下拒絕原假設(shè)H0,因此可認(rèn)為三種銷售方式的銷售額有十分顯著的差異(p=0.004)。194,2,57191.64640.66632.4708SSESST1010574 1 1 0.66633.03940.6663F為了解這三種銷售方式的顯著差異究竟是由哪些商品引起的,我們對這四種商品分別用一元方差分析方法進行檢驗分析。利用SSTR和SSE這兩個矩陣對角線上的元素有查表得,F(xiàn)0.05(2,57)=3.16,F(xiàn)0.01(2,57)=5.01,故甲商品有顯著差異(p=0.041),丁商品有十分顯著的差異(p=0.001),而乙和丙商品無顯著差異(p=0.208和p=0.848)。12345221.30 23.377,44069.55 57518.53 21.6159148.05 572480.83 20.166,427028.50 5738529.30 28.008137115.10 57FFFF如果剔除丁商品,然后再對其他三種商品用統(tǒng)計量進行檢驗,則有F0.05(6,110)=2.181.328,不顯著,因此說明對甲、乙、丙這三種商品,銷售方式、和的總體均值向量之間無顯著

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論