第三章 多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第1頁
第三章 多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第2頁
第三章 多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第3頁
第三章 多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第4頁
第三章 多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗2023/10/171內(nèi)容第一節(jié)

單個總體均值向量的推斷第二節(jié)

單個總體均值分量間結構關系的檢驗第三節(jié)

兩個總體均值的檢驗第四節(jié)

兩個總體均值分量間結構關系的檢驗第五節(jié)

多個總體均值的比較檢驗(多元方差分析)第六節(jié)

正態(tài)總體協(xié)方差矩陣的檢驗第七節(jié)

在SAS多元假設檢驗過程2023/10/172一、均值向量的檢驗

設是取自多元正態(tài)總體的一個樣本,,現(xiàn)欲檢驗

由于總體的協(xié)方差矩陣可能未知或已知,所以在檢驗時必須采用有不同的的統(tǒng)計量,所以我們分成兩種情況來討論。第一節(jié)單個總體均值向量的推斷2023/10/173

由于是來自多元正態(tài)總體的簡單隨機樣本1、總體協(xié)方差矩陣已知時2023/10/1742023/10/175

由于樣本均值,所以有

服從自由度為p的卡方分布。當原假設為真時,服從自由度為p的中心卡方分布。所以,我們用作為檢驗的統(tǒng)計量,對顯著性水平

,檢驗的規(guī)則為:2023/10/1762023/10/1772、總體協(xié)方差矩陣未知時

總體的協(xié)方差矩陣未知,用樣本的協(xié)方差矩陣

替代中的總體協(xié)方差

,得霍特林(Hotelling)統(tǒng)計量2023/10/178

在原假設為真時對顯著性水平,檢驗的規(guī)則為:當,拒絕原假設;當,接受原假設。2023/10/179【例】人的出汗多少與人體內(nèi)的鈉和鉀的含量有一定的關系,今測量了20位成年女性的出汗量、鈉含量和鉀含量。試檢驗:2023/10/1710

例在企業(yè)市場結構研究中,起決定作用的指標有市場份額X1,企業(yè)規(guī)模(資產(chǎn)凈值總額的自然對數(shù))X2,資本收益率X3和總收益增長率X4。為了研究美國市場的變動,夏菲爾德抽取了美國231個大型企業(yè),調(diào)查這些企業(yè)某十年的資料。假設以前企業(yè)市場結構的均值向量為(20,7.5,10,2)’,該調(diào)查所得的樣本均值向量和樣本協(xié)方差矩陣如下。2023/10/1711

試問企業(yè)的市場結構是否發(fā)生了變化?2023/10/1712注:似然比統(tǒng)計量

在數(shù)理統(tǒng)計中關于總體參數(shù)的假設檢驗,通常還可以利用最大似然原理導出似然比統(tǒng)計量進行檢驗。

設p維總體的密度函數(shù)為其中是未知參數(shù),參數(shù)空間。2023/10/1713有如下假設:現(xiàn)在從總體中抽出容量為n的樣本樣本的聯(lián)合密度函數(shù)為2023/10/1714引入似然比統(tǒng)計量由于,所以統(tǒng)計量取值在0到1之間。

2023/10/1715

由極大似然比原理,如果取值太小,說明H0為真的時觀測到此樣本的概率要小得多,故有理由認為假設H0不成立。

可以證明當樣本容量很大時

近似服從自由度為f的卡方分布,其中自由度為的維數(shù)減0的維數(shù)。2023/10/1716

下面我們討論

的似然比檢驗。

其中2023/10/1717原假設成立時,有

其中2023/10/1718我們來討論一下,似然比檢驗的統(tǒng)計量和霍特林的T平方統(tǒng)計量的關系。2023/10/1719有2023/10/1720三個統(tǒng)計量是等價的,有2023/10/1721

例設x1,x2,

…,xn取自該總體Np(,)的樣本,

=(1,2,…

p),檢驗H0:

1=2=…=

p=

H1:至少存在一對i和j,使

i

j第二節(jié)單個總體均值分量間結構關系的檢驗

2023/10/1722

則與上面的原假設等價的假設為

例假定人類的體形有這樣的一般規(guī)律:身高、胸圍和上臂圍平均尺寸比例為6:4:1。檢驗身高、胸圍和上臂圍平均尺寸比例是否符合這一規(guī)律。2023/10/1723則上面的假設可以表達為

2023/10/1724

設取自多元正態(tài)總體的一個樣本。前面,我們已經(jīng)利用樣本,檢驗均值向量是否等于一個指定的向量。在實際問題中,我們也需要檢驗均值向量的分量之間是否存在某一指定的結構關系,即檢驗

其中C為一已知的k

p階矩陣,k<p,rank(C)=k,

為已知的k維向量。根據(jù)多元正態(tài)分布的性質(zhì)可知2023/10/17252023/10/1726

為了檢驗H0:C=

,可以用統(tǒng)計量

當為真時H0:C=

時對給定的顯著性水平

,檢驗的規(guī)則當時,拒絕原假設;當時,接受原假設。2023/10/1727

特別當

=0

,即檢驗H0:C=0

,H1:C0,則2023/10/1728

在例中,假定人類的體形有這樣一個一般規(guī)律的身高、胸圍和上臂圍平均尺寸比例為6:4:1。檢驗比例是否符合這一規(guī)律。檢驗:

2023/10/1729某地區(qū)農(nóng)村男嬰的體格測量數(shù)據(jù)如下編號身高(cm)胸圍(cm)上半臂長(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0檢驗三個指標的均值是否有關系2023/10/17302023/10/1731第三節(jié)兩個總體均值的檢驗

一、兩個獨立樣本的情形

與一元隨機變量的情形相同,常常我們需要檢驗兩個總體的均值是否相等。

設從總體和中各自獨立地抽取樣本

考慮假設2023/10/1732根據(jù)兩個樣本可得

1和

2的無偏估計量為2023/10/1733

因為兩個總體的協(xié)方差矩陣

相等,所以我們可以用樣本的聯(lián)合協(xié)方差矩陣來估計

2023/10/1734霍特林(Hotelling)統(tǒng)計量為:當原假設為真的條件下,統(tǒng)計量

檢驗的規(guī)則為:當時,拒絕原假設;當時,接受原假設。2023/10/1735

二、成對試驗的統(tǒng)計量

前面我們討論的是兩個獨立樣本的檢驗問題,但是不少的實際問題中,兩個樣本的數(shù)據(jù)是成對出現(xiàn)的。例如檢驗男女職工的工資收入是否存在差異;一種新藥的療效等。

設(xi,yi),i=1,2,3,…,n(n>p),是成對的試驗數(shù)據(jù),總體X和y均服從p維正態(tài)分布,且協(xié)方差相等。令di=xi-yi,則di=xi-yi服從正態(tài)分布,。

檢驗假設2023/10/1736

其中

當原假設為真時,統(tǒng)計量服從自由度為和的分布。

檢驗規(guī)則為:

當時,拒絕原假設,否則接受原假設。

2023/10/1737

中小企業(yè)的破產(chǎn)模型為了研究中小企業(yè)的破產(chǎn)模型,首先選定了X1總負債率(現(xiàn)金收益/總負債),X2收益性指標(純收入/總財產(chǎn)),X3短期支付能力(流動資產(chǎn)/流動負債)和X4生產(chǎn)效率性指標(流動資產(chǎn)/純銷售額)4個經(jīng)濟指標,對17個破產(chǎn)企業(yè)為“1”和正常運行企業(yè)“2”進行了調(diào)查,得資料如下。如果這些指標是用來做判別分析和聚類分析的變量,他們之間沒有顯著性差異是不恰當?shù)?,所以檢驗所選擇的指標在不同類型企業(yè)之間是否有顯著的差異。

2023/10/1738x1,x2,x3,x4均為判別變量2023/10/1739x1,x3為判別變量2023/10/1740DependentVariable:x1(對X1進行的檢驗)

SumofSourceDFSquaresMeanSquareFValuePr>F

Model10.874667910.8746679116.900.0002

Error361.863008400.05175023

CorrectedTotal372.73767632

X1在類間有顯著性差異。DependentVariable:x2(對X2進行的檢驗)

SumofSourceDFSquaresMeanSquareFValuePr>F

Model10.083120770.083120771.950.1710

Error361.533700280.04260279

CorrectedTotal371.61682105X2在類間沒有顯著性差異。2023/10/1741DependentVariable:x3(對X3進行的檢驗)

SumofSourceDFSquaresMeanSquareFValuePr>F

Model116.4695844316.4695844321.45<.0001

Error3627.640805040.76780014

CorrectedTotal3744.11038947X3在類間有顯著性差異。DependentVariable:x4(對X4進行的檢驗)

SumofSourceDFSquaresMeanSquareFValuePr>F

Model10.001126940.001126940.030.8643

Error361.369780950.03804947

CorrectedTotal371.37090789X4在類間沒有顯著性差異。2023/10/1742

多元假設檢驗

StatisticValueFValueNumDFDenDFPr>F

Wilks'Lambda0.545616206.874330.0004Pillai'sTrace0.454383806.874330.0004Hotelling-LawleyTrace0.832790156.874330.0004Roy'sGreatestRoot0.832790156.874330.0004

從SAS的輸出可以看出應該拒絕原假設,即類間的有顯著性差異。2023/10/1743第四節(jié)兩個總體均值分量間結構關系的檢驗

一、問題提出

設從總體,中各自獨立地抽取樣本和,。他們的均值向量差為:2023/10/1744

例在愛情和婚姻的調(diào)查中,對一個由若干名丈夫和妻子組成的樣本進行了問卷調(diào)查,請他們回答以下幾個問題:(1)你對伴侶的愛情的“熱度”感覺如何?(2)伴侶對你的愛情的“熱度”感覺如何?(3)你對伴侶的愛情的“可結伴”水平感覺如何?(4)伴侶對你的愛情的“可結伴”水平感覺如何?回答采用沒有、很小、有些、很大和非常大5個等級,得到結果如表。

2023/10/1745丈夫?qū)ζ拮悠拮訉φ煞騒1X2X3X4X1X2X3X42355445555444555455544554344455533554455334533443444435444553455455544544433344444554555554455552023/10/1746

現(xiàn)在我們關心均值分量間的差異是否滿足某種結構關系。比如每個指標均值間的差異是否相等。

1、丈夫?qū)ζ拮右约捌拮訉φ煞虻幕卮鹪讦粒?.05顯著水平上沒有差異。

2、在四個指標上他們是否會有相同的分數(shù)。即檢驗四個分數(shù)的平均值是否相等。

2023/10/1747二、統(tǒng)計量與檢驗

檢驗

在原假設為真的條件下,檢驗的統(tǒng)計量為:2023/10/1748dataa;inputx1x2x3x4class;cards;數(shù)據(jù)行省略;run;proc

anova;classclass;modelx1-x4=class;manovah=classm=(1-1

0

0,

1

0-1

0,

1

0

0-1);run;2023/10/1749H=AnovaSSCPMatrixforclassE=ErrorSSCPMatrixS=1M=0.5N=27StatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.878572612.583560.0626Pillai'sTrace0.121427392.583560.0626Hotelling-LawleyTrace0.138209852.583560.0626Roy'sGreatestRoot0.138209852.583560.06262023/10/1750

例某種產(chǎn)品有甲乙兩個品牌,其質(zhì)量指標有5個,從兩種品牌的產(chǎn)品中分別抽出5個,有如下的數(shù)據(jù),

序號X1X2X3X4X51111815181523327312117320282723194182618189522232216102023/10/1751序號X1X2X3X4X51181720181823124312620314161720174252431261853628242629檢驗兩種品牌的質(zhì)量指標差異有顯著不同。2023/10/1752s1={63.7021.3546.407.558.00,21.3516.3019.957.154.25,46.4019.9542.3012.1016.25,7.557.1512.107.7010.50,8.004.2516.2510.5019.00};s2={81.7044.7036.9029.8036.60,44.7026.2022.6518.3019.60,36.9022.6540.3020.603.45,29.8018.3020.6015.209.90,36.6019.603.459.9024.30};2023/10/1753mu1={20.80,24.40,22.60,19.20,14.00};mu2={24.80,21.80,24.60,23.20,20.40};2023/10/1754sp=(4#s1+4#s2)/8;C={1-1000,01-100,001-10,0001-1};T=5#(t(mu1-mu2)*t(C)*inv(C*sp*t(c))*C*(mu1-mu2))/2;

T=35.645395

2023/10/17552023/10/1756dataa1;inputx1-x5class$@@;cards;1118151815133273121171202827231911826181891222322161011817201818231243126202141617201722524312618236282426292;procanova;classclass;modelx1-x5=class;manovah=classm=(-11000,01-100,001-10,000-11);run;2023/10/1757第五節(jié)多個總體均值的比較檢驗(多元方差分析)

前面我們已經(jīng)對單個總體和兩個總體的均值向量進行了檢驗。但常常還需要檢驗三個或三個以上總體的均值向量是否相等。

一、方差分析的回顧

某工廠實行早、中、晚三班工作制。工廠管理部門想了解不同班次工人勞動效率是否存在明顯的差異。每個班次隨機抽出了7個工人,得工人的勞動效率(件/班)資料如表。分析不同班次工人的勞動效率是否有顯著性差異。

=0.05,0.01。2023/10/1758早班中班晚班3449393747403551423348393350413551423651402023/10/1759

為什么各值會有差異?可能的原因有兩個。

一是,各個班次工人的勞動效率可能有差異,從而導致了不同水平下的觀察值之間差異,即存在條件誤差。

二是,隨機誤差的存在。

如何衡量兩種原因所引起的觀察值的差異?總平均勞動效率為:2023/10/1760三個班次工人的平均勞動效率分別為:總離差平方和ss組間離差平方和(條件誤差)ssA2023/10/1761組內(nèi)離差平方和(隨機誤差)sse

統(tǒng)計量F2023/10/1762查F分布表得臨界值因為故應拒絕原假設,即不同班次工人的勞動效率有顯著的差異。

方差分析:比較3個或3個以上的總體均值是否有顯著性差異。用組間的方差與組內(nèi)方差相比,據(jù)以判別誤差主要源于組間的方差(不同組工人的產(chǎn)量,條件誤差),還是源于組內(nèi)方差(隨機誤差)。2023/10/1763

方差分析的任務是:尋找適當?shù)慕y(tǒng)計量,檢驗諸效應是否相等。亦即檢驗

原假設Ho:a1=a2=…=ak,即諸效應均為零;備擇假設H0:諸ai不全相等.總離差平方和反映了全部觀察值相對于總平均數(shù)的離散程度。隨機波動所引起的離差平方和反映了各相同水平下觀察值之間的分散程度,稱為誤差平方和或組內(nèi)平方和。2023/10/1764由各水平的效應不同引起的離差平方和

可以證明

在原假設成立的條件下,統(tǒng)計量F服從第一自由度為k-1,第二自由度為n-k的F分布,對于給定的顯著性水平

,可以查表確定臨界值滿足P{F>F

(k-1,n-k)}=。2023/10/1765把計算的F值與臨界值比較,當F

F

時,拒絕原假設,不同水平下的效應有顯著性差異;當F<F

時,接受原假設。方差來源離差平方和自由度方差F值

組間A

組內(nèi)E

總和

——NEXT2023/10/1766

二、多元方差分析中的假設

設有個總體,他們的分布分別今從這個總體中抽出樣本,,為第個總體的樣本容量,樣本容量為。

三、多元方差分析的叉積矩陣的分解2023/10/1767交叉乘積項2023/10/1768SSE為組內(nèi)叉積矩陣,反映隨機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論