多元統(tǒng)計(jì)分析第三章課件_第1頁(yè)
多元統(tǒng)計(jì)分析第三章課件_第2頁(yè)
多元統(tǒng)計(jì)分析第三章課件_第3頁(yè)
多元統(tǒng)計(jì)分析第三章課件_第4頁(yè)
多元統(tǒng)計(jì)分析第三章課件_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章多元正態(tài)總體的統(tǒng)計(jì)推斷§3.1引言§3.2單個(gè)總體均值的推斷§3.3單個(gè)總體均值分量間結(jié)構(gòu)關(guān)系的檢驗(yàn)§3.4兩個(gè)總體均值的比較推斷§3.5兩個(gè)總體均值分量間結(jié)構(gòu)關(guān)系的檢驗(yàn)§3.6多個(gè)總體均值的比較檢驗(yàn)(多元方差分析)§3.7協(xié)方差陣的檢驗(yàn)§3.1引言在單一變量的統(tǒng)計(jì)分析中,已經(jīng)給出了正態(tài)總體N(,2)

的均值和方差2的各種檢驗(yàn)。對(duì)于多變量的正態(tài)總體Np(,∑

,各種實(shí)際問題同樣要求對(duì)和∑進(jìn)行統(tǒng)計(jì)推斷。本章類似單一變量統(tǒng)計(jì)分析中的各種均值和方差的檢驗(yàn),相應(yīng)地給出多元統(tǒng)計(jì)分析中的各種均值向量的檢驗(yàn)。其基本思想和步驟均可歸納為:第一,提出待檢驗(yàn)的假設(shè)H0和H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界值,從而得到否定域;第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入拒絕域中,以便對(duì)待判假設(shè)做出決策(拒絕或接受)。一、單一變量檢驗(yàn)的回顧及HOTELLINGT2分布為了對(duì)多元正態(tài)總體均值向量作檢驗(yàn),首先需要給HotellingT2分布的定義。

查表得F0.01(3,3)=29.5,于是

故在顯著性水平α=0.01下,拒絕原假設(shè)H0,即認(rèn)為農(nóng)村與城市的2周歲男嬰上述三個(gè)指標(biāo)的均值有顯著差異(p=0.002)。三、置信區(qū)域μ的置信度為1?α的置信區(qū)域?yàn)楫?dāng)p=1時(shí),它是一個(gè)區(qū)間;當(dāng)p=2時(shí),它是一個(gè)橢圓,這時(shí)可將其在坐標(biāo)平面上畫出;當(dāng)p=3時(shí),它是一個(gè)橢球;當(dāng)p>3時(shí),它是一個(gè)超橢球;它們均以為中心。同置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系一樣,置信區(qū)域與假設(shè)檢驗(yàn)之間也有著同樣的密切關(guān)系。一般來(lái)說(shuō),μ0包含在上述置信區(qū)域內(nèi),當(dāng)且僅當(dāng)原假設(shè)H0:μ=μ0在顯著性水平α下被接受。因此,可以通過(guò)構(gòu)造的置信區(qū)域的方法來(lái)進(jìn)行假設(shè)檢驗(yàn)。四、聯(lián)合置信區(qū)間即

以1?α的概率對(duì)一切a∈Rp成立,稱它為一切線性組合{a′μ,a∈Rp}的置信度為1?α的聯(lián)合置信區(qū)間(simultaneousconfidenceintervals)。對(duì)k個(gè)線性組合{ai′μ,i=1,2,?,k},有當(dāng)k很小時(shí),聯(lián)合T2置信區(qū)間的置信度一般會(huì)明顯地大于1?α,因而上述區(qū)間會(huì)顯得過(guò)寬,即精確度明顯偏低。這時(shí),考慮采用龐弗倫尼(Bonferroni)聯(lián)合置信區(qū)間(p177):它的置信度至少為1?α。若tα/2k(n?1)≤Tα,則邦弗倫尼區(qū)間比T2區(qū)間要窄,這時(shí)宜采用前者作為聯(lián)合置信區(qū)間;反之,若tα/2k(n?1)>Tα,則邦弗倫尼區(qū)間比T2

區(qū)間寬,宜采用后者作為聯(lián)合置信區(qū)間。當(dāng)k=p時(shí),邦弗倫尼區(qū)間要比T2

區(qū)間窄。故在求μ的所有p個(gè)分量μ1,μ2,?,μp的聯(lián)合置信區(qū)間時(shí),應(yīng)采用邦弗倫尼區(qū)間。μ的0.90置信區(qū)域?yàn)?即 0.0436×(μ1?72.5)2?0.0812×(μ1?72.5)(μ2?79) +0.0475×(μ2?79)2≤1.009這是一個(gè)橢圓區(qū)域。μ1和μ2的0.90聯(lián)合T2置信區(qū)間為即61.84≤μ1≤83.16,68.80≤μ2≤89.20這兩個(gè)區(qū)間分別正是橢圓在μ1軸和μ2軸上的投影。μ1和μ2的0.90邦弗倫尼聯(lián)合置信區(qū)間為(t0.025(7)=2.3646)

即63.63≤μ1≤81.37,70.51≤μ2≤87.49這個(gè)聯(lián)合置信區(qū)間在精確度方面要好于T2聯(lián)合置信區(qū)間。由該聯(lián)合置信區(qū)間可得到置信度至少為0.90的矩形置信區(qū)域(見圖1中的實(shí)線矩形),但其矩形面積要大于橢圓面積。利用置信區(qū)域進(jìn)行假設(shè)檢驗(yàn)在例2中,如果在α=0.10下對(duì)假設(shè)

H0:μ=μ0,H1:μ≠μ0進(jìn)行檢驗(yàn),其中μ=(μ1,μ2)′,μ0=(μ01,μ02)′,則我們?nèi)菀桌脠D1中的橢圓得出檢驗(yàn)的結(jié)果。若被檢驗(yàn)值μ0位于圖1中的橢圓外,則拒絕;反之,則接受。圖1中的虛線矩形在μ1和μ2軸上的區(qū)間范圍分別是μ1和μ2的0.90置信區(qū)間。當(dāng)μ0位于橢圓外實(shí)線矩形內(nèi)的位置(如圖中A點(diǎn))時(shí),檢驗(yàn)結(jié)果雖拒絕H0,但如在α=0.10下分別檢驗(yàn)H01:μ1=μ01,H11:μ1≠μ01和H02:μ2=μ02,H12:μ2≠μ02則檢驗(yàn)結(jié)果都將接受原假設(shè);當(dāng)μ0位于橢圓內(nèi)實(shí)線矩形外的位置(如圖中B點(diǎn))時(shí),檢驗(yàn)結(jié)果雖接受H0,但H01:μ1=μ01和H02:μ2=μ02都將會(huì)被拒絕?!?.3單個(gè)總體均值分量間結(jié)構(gòu)關(guān)系的檢驗(yàn)設(shè)X1,X2,?,Xn是取自多元正態(tài)總體Np(μ,Σ)的一個(gè)樣本,Σ>0,n>p,欲檢驗(yàn)H0:Cμ=φ,H1:Cμ≠φ其中C為一已知的k×p矩陣,k<p,rank(C)=k,φ為已知的k維向量。根據(jù)多元正態(tài)分布的性質(zhì)知CX~Nk(Cμ,CΣC′) 由于例3

設(shè)X~Np(μ,Σ),μ=(μ1,μ2,?,μp)′,Σ>0,X1,X2,?,Xn是取自該總體的一個(gè)樣本,欲檢驗(yàn)H0:μ1=μ2=?=μp,H1:μi≠μj,至少存在一對(duì)i≠j

則上面的假設(shè)可表達(dá)為:H0:Cμ=0,H1:Cμ≠0

檢驗(yàn)統(tǒng)計(jì)量為:

對(duì)于給定的顯著性水平α,拒絕規(guī)則為:

,則拒絕H0

其中由于C是行滿秩的,且每行均為對(duì)比向量(即有一個(gè)1和一個(gè)?1,其余皆為0),故稱C為對(duì)比矩陣。該例中對(duì)比矩陣C的選擇不是惟一的,比如也可以選取對(duì)比矩陣為:例4

在例1中,假定人類有這樣一個(gè)一般規(guī)律:身高、胸圍和上半臂圍的平均尺寸比例為6:4:1,我們希望檢驗(yàn)表1中的數(shù)據(jù)是否符合這一規(guī)律,也就是欲檢驗(yàn)H0:μ1/6=μ2/4=μ3,H1:μ1/6,μ2/4,μ3至少有兩個(gè)不等.

則上面假設(shè)可表達(dá)為H0:Cμ=0,H1:Cμ≠0

經(jīng)計(jì)算§3.4兩個(gè)總體均值的比較推斷一、兩個(gè)獨(dú)立樣本的情形二、成對(duì)試驗(yàn)的T2統(tǒng)計(jì)量一、兩個(gè)獨(dú)立樣本的情形設(shè)從兩個(gè)總體Np(μ1,Σ)和Np(μ2,Σ)中各自獨(dú)立地抽取一個(gè)樣本

,Σ>0,欲檢驗(yàn)H0:μ1=μ2,H1:μ1≠μ2μ1,μ2的無(wú)偏估計(jì)Σ的聯(lián)合無(wú)偏估計(jì)其中為兩個(gè)樣本協(xié)方差矩陣。

霍特林T2檢驗(yàn)統(tǒng)計(jì)量

當(dāng)原假設(shè)H0為真時(shí),

對(duì)給定的α,拒絕規(guī)則為:

,則拒絕H0.

其中在實(shí)際應(yīng)用中,一旦H0:μ1=μ2被拒絕了,則可以考慮對(duì)所有的i(1≤i≤p),在相同的顯著性水平下再進(jìn)一步檢驗(yàn)H0i:μ1i=μ2i,以判斷是否有分量及(若有)具體是哪些分量對(duì)拒絕H0:μ1=μ2起了較大作用,這樣做常常是有益的。{a′(μ1?μ2),a∈Rp}的1?α聯(lián)合置信區(qū)間為當(dāng)k很小時(shí),可用邦弗倫尼不等式給出{ai′(μ1?μ2),i=1,2,?,k}的1?α聯(lián)合置信區(qū)間例5(例1續(xù))

表3給出了相應(yīng)于表1的9名2周歲女嬰的數(shù)據(jù)。我們欲在多元正態(tài)性假定下檢驗(yàn)2周歲的男嬰與女嬰的均值向量有無(wú)顯著差異。表3 某地區(qū)農(nóng)村女嬰的體格測(cè)量數(shù)據(jù)編號(hào)身高(cm)胸圍(cm)上半臂圍(cm)18058.414.027559.215.037860.315.047557.413.057959.514.067858.114.577558.012.586455.511.098059.212.5從例1得從表3計(jì)算得

所以

,故不能拒絕原假設(shè)H0,即認(rèn)為兩個(gè)均值向量無(wú)顯著差異(p=0.27)。二、成對(duì)試驗(yàn)的T2統(tǒng)計(jì)量設(shè)(Xi,Yi),i=1,2,?,n(n>p)是成對(duì)試驗(yàn)的數(shù)據(jù),令di=Xi?Yi,i=1,2,?,n又設(shè)d1,d2,?,dn獨(dú)立同分布于Np(δ,Σ),其中Σ>0,δ=μ1?μ2,μ1和μ2分別是總體X和總體Y的均值向量。希望檢驗(yàn)H0:μ1=μ2,H1:μ1≠μ2等價(jià)于H0:δ=0,H1:δ≠0這樣,兩個(gè)總體的均值比較檢驗(yàn)問題就可以化為一個(gè)總體的情形。檢驗(yàn)統(tǒng)計(jì)量為

其中

當(dāng)原假設(shè)H0:δ=0為真時(shí),統(tǒng)計(jì)量

對(duì)給定的顯著性水平α,拒絕規(guī)則為:

,則拒絕H0

其中§3.5兩個(gè)總體均值分量間結(jié)構(gòu)關(guān)系的檢驗(yàn)設(shè)兩個(gè)獨(dú)立的樣本

分別取自總體Np(μ1,Σ)和總體Np(μ2,Σ),Σ>0,n1+n2?2≥p,我們希望檢驗(yàn)

H0:C(μ1?μ2)=φ,H1:C(μ1?μ2)≠φ其中C為一已知的k×p矩陣,k<p,rank(C)=k,φ為一已知的k維向量。檢驗(yàn)統(tǒng)計(jì)量為其中Sp是Σ的聯(lián)合無(wú)偏估計(jì)。當(dāng)原假設(shè)H0為真時(shí),拒絕規(guī)則為:若

,則拒絕H0

其中例6

某種產(chǎn)品有甲、乙兩種品牌,從甲產(chǎn)品批和乙產(chǎn)品批中分別隨機(jī)地抽取5個(gè)樣品,測(cè)量相同的5個(gè)指標(biāo),數(shù)據(jù)列于表4。在多元正態(tài)性假定下,試問甲、乙兩種品牌產(chǎn)品的每個(gè)指標(biāo)間的差異是否有顯著的不同。該題就是要檢驗(yàn)H0:C(μ乙?μ甲)=0,H1:C(μ乙?μ甲)≠0

其中表4 甲、乙兩種品牌產(chǎn)品的指標(biāo)值指標(biāo)12345樣品甲111181518152332731211732028272319418261818952223221610均值20.824.422.619.214.0乙1181720181823124312620314161720174252431261853628242629均值24.821.824.623.220.4

檢驗(yàn)統(tǒng)計(jì)量為

經(jīng)計(jì)算所以

因此,在α=0.05下拒絕原假設(shè)H0(p=0.044)?!?.6多個(gè)總體均值的比較檢驗(yàn)(多元方差分析)設(shè)有k個(gè)總體π1,π2,?,πk,它們的分布分別是Np(μ1,Σ),Np(μ2,Σ),?,Np(μk,Σ),今從這k個(gè)總體中各自獨(dú)立地抽取一個(gè)樣本,取自總體πi的樣本為

,i=1,2,?,k?,F(xiàn)欲檢驗(yàn)H0:μ1=μ2=?=μk,H1:μi≠μj,至少存在一對(duì)i≠j

則SST=SSE+SSTR

稱SST、SSE和SSTR分別為總平方和及交叉乘積和、誤差(或組內(nèi))平方和及交叉乘積和和處理(或組間)平方和及交叉乘積和,它們分別具有自由度(n?1)、(n?k)和(k?1)。采用似然比方法可以得到威爾克斯(Wilks)Λ統(tǒng)計(jì)量

對(duì)給定的顯著性水平α,拒絕規(guī)則為:若Λp,k?1,n?k≤Λp,k?1,n?k,α,則拒絕H0。

其中臨界值Λp,k?1,n?k,α滿足:當(dāng)原假設(shè)H0為真時(shí),P(Λp,k?1,n?k≤Λp,k?1,n?k,α)=α。 Λp,m,r,α常通過(guò)查F分布(或卡方分布)表得到(或近似得到)。例7

為了研究銷售方式對(duì)商品銷售額的影響,選擇四種商品(甲、乙、丙和?。┌慈N不同的銷售方式(Ⅰ、Ⅱ和Ⅲ)進(jìn)行銷售。這四種商品的銷售額分別為x1,x2,x3,x4,其數(shù)據(jù)見表5。表5 銷售額數(shù)據(jù)編號(hào)銷售方式Ⅰ銷售方式Ⅱ銷售方式Ⅲx1x2x3x4x1x2x3x4x1x2x3x411256033821066544553106533480260211980233330824540321010034468295363512602036565312280656341626546551429150405147728011748468250513065403205675448129311463395380669453501903850468210553054623574660585200424535119064515073208146662732501134039031011090442225987545852408055520200606244024810110775072707660507189110693772601110760364200943326028088782993601213061391200605142919073633903201380454292705540390295114554942401460504421906548481177103544163101581542602806948442225100332733121613587507260125633122701406131234517574840028512056416280803628625018755252026070454683701355446834519766540325062664162241306932536020554241117069603772806057273

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論