第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件_第1頁
第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件_第2頁
第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件_第3頁
第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件_第4頁
第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷1優(yōu)選第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷優(yōu)選第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷2三多組比較1多變量方差分析通過g個均數(shù)向量推斷是否成立。其備擇假設(shè)H1g個組中至少有兩個均向量不相等。三多組比較1多變量方差分析3

方差分析單變量分析

方差分析單變量分析4兩兩比較:LSD\SNK\兩兩比較:5描述固定與隨機效應(yīng)方差齊性檢驗BF檢驗Welch檢驗描述6第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件7第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件8正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法資料轉(zhuǎn)換秩和檢驗穩(wěn)健估計Welch(F’)BrownForsythe正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法資料轉(zhuǎn)換9多變量方差分析的主要思想將實驗結(jié)果的總離差平方和SS總分解為SS組間和SS組內(nèi)兩部分,其中SS總,SS組間和SS組內(nèi)矩陣表示。求得WilksLambda統(tǒng)計量計算F值,作出統(tǒng)計推斷。多變量方差分析的主要思想10理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗,即三組藥物對T細胞免疫功能的影響是相等的。圖14-210名肥胖患者服藥前后體重的變化趨勢若數(shù)據(jù)服從“球?qū)ΨQ”(sphericalsymmetricalproblem)時,就是通常的隨機區(qū)組ANOVA。計算總離均差平方和矩陣圖143不同麻醉誘導(dǎo)時相的平均收縮壓1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。Roy'sGreatestRoot本例中n=10,m=5。H--groupSSCPE—Residual(error)SSCP不能認為兩個總體的輪廓相互平行。例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。求得WilksLambda統(tǒng)計量在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量間的差別都作F檢驗,可作k!/2!(k2)!次比較,每個樣本均數(shù)向量都重復(fù)比較了k1次,如果仍以為臨界值,其Ⅰ型錯誤的概率會遠遠超過0.表144多變量方差分析表例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。表145是其中部分兒童的T細胞免疫功能的測量結(jié)果。試比較三組慢性胃炎兒童T細胞免疫功能是否存在差異?理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗例144將患慢11編號治療I組編號治療II組編號對照組T3T4T8T3T4T8T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.032.036.4572.836.733.1表14-5三組慢性胃炎兒童的T細胞免疫攻能(%)編治療I組編號治療II組編號對照組T3T4T8T3T4T8T121作出檢驗假設(shè),確定檢驗水準(zhǔn),即三組藥物對T細胞免疫功能的影響是相等的。H1三個均向量不都相等。1作出檢驗假設(shè),確定檢驗水準(zhǔn)13表144多變量方差分析表變異來源自由度離均差平和矩陣總變異H+E組間g-1組內(nèi)2計算統(tǒng)計量Λ*及FH--groupSSCPE—Residual(error)SSCP表144多變量方差分析表變異來源自由度離均差平和矩陣總變異14計算均數(shù):計算均數(shù):15求得組間離均差平方和矩陣H:求得組間離均差平方和矩陣H:16H1三個均向量不都相等。表1410兩組研究生健康問卷的平均得分結(jié)論:尚不能拒絕H0,可認不兩個總體的輪廓重合不能認為兩個總體的輪廓相互平行。1272.Roy'sGreatestRootelseif_n_<8thenc=2;表145是其中部分兒童的T細胞免疫功能的測量結(jié)果。試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。BrownForsytheif_n_<4thenc=1;例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。,即三組藥物對T細胞免疫功能的影響是相等的。表14-5三組慢性胃炎兒童的T細胞免疫攻能(%)例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)3確定P值,作出結(jié)論求得組間離均差平方和矩陣H:計算組內(nèi)離均差平方和計算總離均差平方和矩陣H1三個均向量不都相等。計算組內(nèi)離均差平方和計算總離均差平方17變異來源自由度離均差平方和矩陣總變質(zhì)11組間2組內(nèi)9表14-6多變量方差分析表變異來源自由度離均差平方和矩陣總變質(zhì)11組間2組18計算統(tǒng)計量Λ*計算統(tǒng)計量Λ*19表147常見情況下與F值的關(guān)系反應(yīng)變量數(shù)組數(shù)轉(zhuǎn)換關(guān)系F分布自由度m=1g≥2M=2g≥2m≥1G=2m≥1G=3表147常見情況下與F值的關(guān)系反應(yīng)變量數(shù)組數(shù)轉(zhuǎn)換關(guān)系20

由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除HotellingT2外,還可用多變量方差分析。

m=3,g=3,代入表14-7的第四個公式得:由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除H213確定P值,作出結(jié)論查F值表,拒絕H0,接受H1.認為三個組慢性胃炎兒童T細胞免疫功能有差別。從三組的均數(shù)向量可看出,兩個治療組的T細胞免疫功能均比對照組低。3確定P值,作出結(jié)論22SPSS操作SPSS操作23dataex14_5;if_n_<4thenc=1;elseif_n_<8thenc=2;elsec=3;inputidT3T4T8@@;cards;163.630.231.2260.030.033.4……1272.836.733.1;procglm;classc;modelT3T4T8=c;manovaH=c/printeprinth;lsmeansc/stderrpdiff;Run;dataex14_5;24拒絕H0,接受H1.試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。若不服從“球?qū)ΨQ”時,須校正自由度。1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。對自已健康狀況的滿意程序(X1)Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與m次單變量假設(shè)檢驗的結(jié)論是一致的。求得組間離均差平方和矩陣H:dataex14_5;elsec=3;表12-1高血壓患者治療前后的舒張壓(mmHg)試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。表1410兩組研究生健康問卷的平均得分Hotelling-LawleyTrace1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。拒絕H0,即認為合并后總體的輪廓不是一條水平線。多變量方差分析的主要思想其備擇假設(shè)H1g個組中至少有兩個均向量不相等。表1410兩組研究生健康問卷的平均得分H1三個均向量不都相等。統(tǒng)計量Wilks=det(E)/det(H+E)Pilai跡=trace(H(H+E)-1)Hotelling-Lawley跡=trace(E-1H)R最大特征根=E-1H的最大特征根MANOVATestCriteriaandFApproximationsfortheHypothesisofNoOverallcEffect

H=TypeIIISSCPMatrixforc

E=ErrorSSCPMatrix

S=2M=0N=2.5StatisticValueFValueNum

DFDenDFPr

>

FWilks'Lambda0.088735385.506140.0041Pillai'sTrace1.049164542.946160.0394Hotelling-LawleyTrace8.715404369.7767.78950.0028Roy'sGreatestRoot8.5332872122.76380.0003拒絕H0,接受H1.統(tǒng)計量MANOVATestCrite25四多變量與單變量分析

多變量與對m個反應(yīng)變量進行一次假設(shè)檢驗,對組間的差別作出推論。在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與m次單變量假設(shè)檢驗的結(jié)論是一致的。即多變量假設(shè)檢驗拒絕H0,m次單變量假設(shè)檢驗至少有一次拒絕H0。四多變量與單變量分析多變量與對m個反應(yīng)變量26(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量間的差別都作F檢驗,可作k!/2!(k2)!次比較,每個樣本均數(shù)向量都重復(fù)比較了k1次,如果仍以為臨界值,其Ⅰ型錯誤的概率會遠遠超過0.05。理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量27

若有3個樣本均數(shù)向量的比較,共作3次F檢驗,若每次比較的檢驗水準(zhǔn)=0.05,則每次不犯第一類錯誤的概率為(10.05)=0.95,則正確接受全部3次無效假設(shè)的概率為0.953=0.857,這時犯第一類錯誤的概率為10.857=0.143。因此,兩兩比較時,不宜用前面所述的F檢驗。

28(2)單變量假設(shè)檢驗只能說明某一變量在數(shù)軸分布上的組間差別,不能反應(yīng)多個變量在平面或空間上的差別,兩者的意義不同。(2)單變量假設(shè)檢驗只能說明某一變量在數(shù)軸分布上的組間差別,29表148兩組新生兒出生時的體重與身長數(shù)據(jù)編號A組編號B組體重(Kg)身長(Cm)體重(Kg)身長(Cm)13.104614.106023.205023.504833.506233.355043.004643.354953.856753.204863.154863.555073.004673.506083.505583.6056均數(shù)3.2952.503.5252.63方差0.308.110.275.21P(t檢驗)1.62(0.13)0.04(0.97)HotellingT2T2=9.87,F=4.58,P=0.03表148兩組新生兒出生時的體重與身長數(shù)據(jù)編號A組編號B組30第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件31第三節(jié)重復(fù)測量資料的多變量分析Ch12介紹了重復(fù)測量資料的單變量ANOVA分析方法。若數(shù)據(jù)服從“球?qū)ΨQ”(sphericalsymmetricalproblem)時,就是通常的隨機區(qū)組ANOVA。若不服從“球?qū)ΨQ”時,須校正自由度。多變量分析的優(yōu)點不須考慮數(shù)據(jù)的“球?qū)ΨQ”,直接利用HotellingT2檢驗。

第三節(jié)重復(fù)測量資料的多變量分析Ch1232編號服藥前體重值服藥前后四周體重值第1周第2周第3周第4周1131.5128.4127.4125.3124.92154.7152.9150.7148.2145.93146.7145.5143.6140.5139.84163.2161.6158.4154.2153.45128.6125.3124.1122.8120.96134.2132.6130.4129.4124.87126.8125.7123.9123.5121.68119.5118.1115.6114.3112.19112.4108.6104.7102.6101.410121.3120.1118.5116.9114.2133.9131.9129.7127.8125.9S16.216.616.615.916.1表12-1高血壓患者治療前后的舒張壓(mmHg)編號服藥前服藥前后四周體重值第1周第2周第3周第4周1131331建立檢驗假設(shè)

Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)1建立檢驗假設(shè)Cμ為初始時間為基線的重復(fù)測量對比矩陣(Re342計算HotellingT2與F統(tǒng)計量2計算HotellingT2與F統(tǒng)計量35本例中n=10,m=5。本例中n=10,m=5。363確定P值,作出檢驗結(jié)論查表3.1得拒絕H0,接受H1,即認為服藥后1-4周的體重比服藥前有所降低。3確定P值,作出檢驗結(jié)論查表3.1得拒絕H0,接受H1,即37圖14-210名肥胖患者服藥前后體重的變化趨勢分析服藥后1-4周的體重降低的變化趨勢圖14-210名肥胖患者服藥前后體重的變化趨勢分析服藥后138

將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的39SPSS操作SPSS操作40第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件41結(jié)果結(jié)果42第四節(jié)輪廓分析

輪廓(profile)分析是比較兩組或多組多變量均數(shù)向量的輪廓是否相等。輪廓是指各組均數(shù)所連成的折線。輪廓分析通常進行組間輪廓相似性或平行性(parallel)

、組間平均水平差異顯著性和組內(nèi)條件(如時間或各反應(yīng)變量間)變異顯著性三個方面的假設(shè)檢驗。第四節(jié)輪廓分析輪廓(profile)分析是43圖143不同麻醉誘導(dǎo)時相的平均收縮壓圖143不同麻醉誘導(dǎo)時相的平均收縮壓44由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除HotellingT2外,還可用多變量方差分析。拒絕H0,即認為合并后總體的輪廓不是一條水平線。modelT3T4T8=c;若有3個樣本均數(shù)向量的比較,共作3次F檢驗,若每次比較的檢驗水準(zhǔn)=0.H1三個均向量不都相等。輪廓(profile)分析是比較兩組或多組多變量均數(shù)向量的輪廓是否相等。晚間休息感到不能很快入睡(X6)正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。R最大特征根=E-1H的最大特征根例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。通過g個均數(shù)向量推斷,即三組藥物對T細胞免疫功能的影響是相等的。HotellingT2T2=9.吃飯有時覺得胃口不好(X7)在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為(parallelcontrasts)1272.if_n_<4thenc=1;表1410兩組研究生健康問卷的平均得分分析思路如果組間輪廓相似,可進一步分析其他的變異,即了解組間輪廓是否完全一致(即重合)以及各組的輪廓圖是否與水平軸(表示組內(nèi)因素水平間差異,如時間上的差別)平行,因此,輪廓分析首先進行的是輪廓相似性檢。由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除Hotelli45例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。調(diào)查問題設(shè)計如下7個問題對自已健康狀況的滿意程序(X1)是否需要調(diào)養(yǎng)身體(X2)身體胡不適或不舒服的感覺(X3)有生病的感覺(X4)有緊張情緒和壓力感(X5)晚間休息感到不能很快入睡(X6)吃飯有時覺得胃口不好(X7)例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)46圖14-4調(diào)查問卷7個問題的平均得分圖14-4調(diào)查問卷7個問題的平均得分47表1410兩組研究生健康問卷的平均得分問題1問題2問題3問題4問題5問題6問題7碩士生均數(shù)2.022.322.181.982.442.062.16n=50S0.430.710.480.510.840.840.84博士生均數(shù)2.032.302.271.902.271.902.13n=30S0.490.650.520.550.910.760.86合計均數(shù)2.032.312.211.952.382.002.15n=80S0.450.690.500.530.860.810.84表1410兩組研究生健康問卷的平均得分問題1問題2問題3481平行檢驗輪廓對比矩陣(parallelcontrasts)

1平行檢驗49計算統(tǒng)計量HotellingT2與F統(tǒng)計量計算統(tǒng)計量HotellingT2與F統(tǒng)計量50研究P值,作出統(tǒng)計推斷不能認為兩個總體的輪廓相互平行。研究P值,作出統(tǒng)計推斷512相合檢驗(coincident)目的:檢驗兩個總體的輪廓是否重合。如果兩個總體的輪廓相互平行,且時兩個總體的輪廓重合。2相合檢驗(coincident)目的:檢驗兩個總體的52檢驗假設(shè):統(tǒng)計量

結(jié)論:尚不能拒絕H0,可認不兩個總體的輪廓重合檢驗假設(shè):結(jié)論:尚不能拒絕H0,可認不兩個總體的輪廓重合533水平輪廓檢驗

檢驗兩個總體的輪廓是否為水平直線平行。若兩個總體的輪廓相等,則多變量數(shù)據(jù)的各變量的均數(shù)是相等的。在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為若有則為直線輪廓。3水平輪廓檢驗檢驗兩個總體的輪廓是否為水平直542計算統(tǒng)計量3確定P值,作出結(jié)論

拒絕H0,即認為合并后總體的輪廓不是一條水平線。即7個問題的得分有高有低,其中第5個問題(有緊張情緒和壓力感)的平均得分最高,第4個問題(有生病的感覺)平均分最低。2計算統(tǒng)計量3確定P值,作出結(jié)論55在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為1272.理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗1272.身體胡不適或不舒服的感覺(X3)2計算HotellingT2與F統(tǒng)計量圖14-210名肥胖患者服藥前后體重的變化趨勢計算F值,作出統(tǒng)計推斷。表12-1高血壓患者治療前后的舒張壓(mmHg)若數(shù)據(jù)服從“球?qū)ΨQ”(sphericalsymmetricalproblem)時,就是通常的隨機區(qū)組ANOVA。不須考慮數(shù)據(jù)的“球?qū)ΨQ”,直接利用HotellingT2檢驗。拒絕H0,接受H1.四多變量與單變量分析圖143不同麻醉誘導(dǎo)時相的平均收縮壓2計算統(tǒng)計量Λ*及F求得組間離均差平方和矩陣H:晚間休息感到不能很快入睡(X6)對自已健康狀況的滿意程序(X1)拒絕H0,即認為合并后總體的輪廓不是一條水平線。本例中n=10,m=5。表148兩組新生兒出生時的體重與身長數(shù)據(jù)研究P值,作出統(tǒng)計推斷BrownForsythe四多變量與單變量分析吃飯有時覺得胃口不好(X7)四多變量與單變量分析即多變量假設(shè)檢驗拒絕H0,m次單變量假設(shè)檢驗至少有一次拒絕H0。多變量方差分析的主要思想不能認為兩個總體的輪廓相互平行。Roy'sGreatestRoot即7個問題的得分有高有低,其中第5個問題(有緊張情緒和壓力感)的平均得分最高,第4個問題(有生病的感覺)平均分最低。計算統(tǒng)計量HotellingT2與F統(tǒng)計量1272.不能認為兩個總體的輪廓相互平行。例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。試比較三組慢性胃炎兒童T細胞免疫功能是否存在差異?計算總離均差平方和矩陣lsmeansc/stderrpdiff;若有3個樣本均數(shù)向量的比較,共作3次F檢驗,若每次比較的檢驗水準(zhǔn)=0.1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。注意點1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。重復(fù)觀測輪廓分析可以檢驗組間輪廓相似性、重合性以及與水平軸的平行性。在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為研56第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷57優(yōu)選第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷優(yōu)選第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷58三多組比較1多變量方差分析通過g個均數(shù)向量推斷是否成立。其備擇假設(shè)H1g個組中至少有兩個均向量不相等。三多組比較1多變量方差分析59

方差分析單變量分析

方差分析單變量分析60兩兩比較:LSD\SNK\兩兩比較:61描述固定與隨機效應(yīng)方差齊性檢驗BF檢驗Welch檢驗描述62第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件63第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件64正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法資料轉(zhuǎn)換秩和檢驗穩(wěn)健估計Welch(F’)BrownForsythe正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法資料轉(zhuǎn)換65多變量方差分析的主要思想將實驗結(jié)果的總離差平方和SS總分解為SS組間和SS組內(nèi)兩部分,其中SS總,SS組間和SS組內(nèi)矩陣表示。求得WilksLambda統(tǒng)計量計算F值,作出統(tǒng)計推斷。多變量方差分析的主要思想66理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗,即三組藥物對T細胞免疫功能的影響是相等的。圖14-210名肥胖患者服藥前后體重的變化趨勢若數(shù)據(jù)服從“球?qū)ΨQ”(sphericalsymmetricalproblem)時,就是通常的隨機區(qū)組ANOVA。計算總離均差平方和矩陣圖143不同麻醉誘導(dǎo)時相的平均收縮壓1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。Roy'sGreatestRoot本例中n=10,m=5。H--groupSSCPE—Residual(error)SSCP不能認為兩個總體的輪廓相互平行。例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。求得WilksLambda統(tǒng)計量在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量間的差別都作F檢驗,可作k!/2!(k2)!次比較,每個樣本均數(shù)向量都重復(fù)比較了k1次,如果仍以為臨界值,其Ⅰ型錯誤的概率會遠遠超過0.表144多變量方差分析表例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。表145是其中部分兒童的T細胞免疫功能的測量結(jié)果。試比較三組慢性胃炎兒童T細胞免疫功能是否存在差異?理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗例144將患慢67編號治療I組編號治療II組編號對照組T3T4T8T3T4T8T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.032.036.4572.836.733.1表14-5三組慢性胃炎兒童的T細胞免疫攻能(%)編治療I組編號治療II組編號對照組T3T4T8T3T4T8T681作出檢驗假設(shè),確定檢驗水準(zhǔn),即三組藥物對T細胞免疫功能的影響是相等的。H1三個均向量不都相等。1作出檢驗假設(shè),確定檢驗水準(zhǔn)69表144多變量方差分析表變異來源自由度離均差平和矩陣總變異H+E組間g-1組內(nèi)2計算統(tǒng)計量Λ*及FH--groupSSCPE—Residual(error)SSCP表144多變量方差分析表變異來源自由度離均差平和矩陣總變異70計算均數(shù):計算均數(shù):71求得組間離均差平方和矩陣H:求得組間離均差平方和矩陣H:72H1三個均向量不都相等。表1410兩組研究生健康問卷的平均得分結(jié)論:尚不能拒絕H0,可認不兩個總體的輪廓重合不能認為兩個總體的輪廓相互平行。1272.Roy'sGreatestRootelseif_n_<8thenc=2;表145是其中部分兒童的T細胞免疫功能的測量結(jié)果。試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。BrownForsytheif_n_<4thenc=1;例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。,即三組藥物對T細胞免疫功能的影響是相等的。表14-5三組慢性胃炎兒童的T細胞免疫攻能(%)例144將患慢性胃炎的兒童隨機分為3組,其中I組、II組為治療組,另一組為對照組。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)3確定P值,作出結(jié)論求得組間離均差平方和矩陣H:計算組內(nèi)離均差平方和計算總離均差平方和矩陣H1三個均向量不都相等。計算組內(nèi)離均差平方和計算總離均差平方73變異來源自由度離均差平方和矩陣總變質(zhì)11組間2組內(nèi)9表14-6多變量方差分析表變異來源自由度離均差平方和矩陣總變質(zhì)11組間2組74計算統(tǒng)計量Λ*計算統(tǒng)計量Λ*75表147常見情況下與F值的關(guān)系反應(yīng)變量數(shù)組數(shù)轉(zhuǎn)換關(guān)系F分布自由度m=1g≥2M=2g≥2m≥1G=2m≥1G=3表147常見情況下與F值的關(guān)系反應(yīng)變量數(shù)組數(shù)轉(zhuǎn)換關(guān)系76

由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除HotellingT2外,還可用多變量方差分析。

m=3,g=3,代入表14-7的第四個公式得:由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除H773確定P值,作出結(jié)論查F值表,拒絕H0,接受H1.認為三個組慢性胃炎兒童T細胞免疫功能有差別。從三組的均數(shù)向量可看出,兩個治療組的T細胞免疫功能均比對照組低。3確定P值,作出結(jié)論78SPSS操作SPSS操作79dataex14_5;if_n_<4thenc=1;elseif_n_<8thenc=2;elsec=3;inputidT3T4T8@@;cards;163.630.231.2260.030.033.4……1272.836.733.1;procglm;classc;modelT3T4T8=c;manovaH=c/printeprinth;lsmeansc/stderrpdiff;Run;dataex14_5;80拒絕H0,接受H1.試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。若不服從“球?qū)ΨQ”時,須校正自由度。1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。對自已健康狀況的滿意程序(X1)Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與m次單變量假設(shè)檢驗的結(jié)論是一致的。求得組間離均差平方和矩陣H:dataex14_5;elsec=3;表12-1高血壓患者治療前后的舒張壓(mmHg)試比較治療藥T細胞免疫功能(外周血T3,T4,T8細胞百分比)的影響。表1410兩組研究生健康問卷的平均得分Hotelling-LawleyTrace1輪廓分析是一種的多元分析方法,用來檢驗組間平均水平趨勢的一致性,當(dāng)組間輪廓相似(平行)時,它比一般組間均值向量相等的假設(shè)檢驗更為有力。拒絕H0,即認為合并后總體的輪廓不是一條水平線。多變量方差分析的主要思想其備擇假設(shè)H1g個組中至少有兩個均向量不相等。表1410兩組研究生健康問卷的平均得分H1三個均向量不都相等。統(tǒng)計量Wilks=det(E)/det(H+E)Pilai跡=trace(H(H+E)-1)Hotelling-Lawley跡=trace(E-1H)R最大特征根=E-1H的最大特征根MANOVATestCriteriaandFApproximationsfortheHypothesisofNoOverallcEffect

H=TypeIIISSCPMatrixforc

E=ErrorSSCPMatrix

S=2M=0N=2.5StatisticValueFValueNum

DFDenDFPr

>

FWilks'Lambda0.088735385.506140.0041Pillai'sTrace1.049164542.946160.0394Hotelling-LawleyTrace8.715404369.7767.78950.0028Roy'sGreatestRoot8.5332872122.76380.0003拒絕H0,接受H1.統(tǒng)計量MANOVATestCrite81四多變量與單變量分析

多變量與對m個反應(yīng)變量進行一次假設(shè)檢驗,對組間的差別作出推論。在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與m次單變量假設(shè)檢驗的結(jié)論是一致的。即多變量假設(shè)檢驗拒絕H0,m次單變量假設(shè)檢驗至少有一次拒絕H0。四多變量與單變量分析多變量與對m個反應(yīng)變量82(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量間的差別都作F檢驗,可作k!/2!(k2)!次比較,每個樣本均數(shù)向量都重復(fù)比較了k1次,如果仍以為臨界值,其Ⅰ型錯誤的概率會遠遠超過0.05。理論上,單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗(1)假定有k個樣本均數(shù)向量,對每兩個樣本均數(shù)向量83

若有3個樣本均數(shù)向量的比較,共作3次F檢驗,若每次比較的檢驗水準(zhǔn)=0.05,則每次不犯第一類錯誤的概率為(10.05)=0.95,則正確接受全部3次無效假設(shè)的概率為0.953=0.857,這時犯第一類錯誤的概率為10.857=0.143。因此,兩兩比較時,不宜用前面所述的F檢驗。

84(2)單變量假設(shè)檢驗只能說明某一變量在數(shù)軸分布上的組間差別,不能反應(yīng)多個變量在平面或空間上的差別,兩者的意義不同。(2)單變量假設(shè)檢驗只能說明某一變量在數(shù)軸分布上的組間差別,85表148兩組新生兒出生時的體重與身長數(shù)據(jù)編號A組編號B組體重(Kg)身長(Cm)體重(Kg)身長(Cm)13.104614.106023.205023.504833.506233.355043.004643.354953.856753.204863.154863.555073.004673.506083.505583.6056均數(shù)3.2952.503.5252.63方差0.308.110.275.21P(t檢驗)1.62(0.13)0.04(0.97)HotellingT2T2=9.87,F=4.58,P=0.03表148兩組新生兒出生時的體重與身長數(shù)據(jù)編號A組編號B組86第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件87第三節(jié)重復(fù)測量資料的多變量分析Ch12介紹了重復(fù)測量資料的單變量ANOVA分析方法。若數(shù)據(jù)服從“球?qū)ΨQ”(sphericalsymmetricalproblem)時,就是通常的隨機區(qū)組ANOVA。若不服從“球?qū)ΨQ”時,須校正自由度。多變量分析的優(yōu)點不須考慮數(shù)據(jù)的“球?qū)ΨQ”,直接利用HotellingT2檢驗。

第三節(jié)重復(fù)測量資料的多變量分析Ch1288編號服藥前體重值服藥前后四周體重值第1周第2周第3周第4周1131.5128.4127.4125.3124.92154.7152.9150.7148.2145.93146.7145.5143.6140.5139.84163.2161.6158.4154.2153.45128.6125.3124.1122.8120.96134.2132.6130.4129.4124.87126.8125.7123.9123.5121.68119.5118.1115.6114.3112.19112.4108.6104.7102.6101.410121.3120.1118.5116.9114.2133.9131.9129.7127.8125.9S16.216.616.615.916.1表12-1高血壓患者治療前后的舒張壓(mmHg)編號服藥前服藥前后四周體重值第1周第2周第3周第4周1131891建立檢驗假設(shè)

Cμ為初始時間為基線的重復(fù)測量對比矩陣(Repeatedconstrasts)1建立檢驗假設(shè)Cμ為初始時間為基線的重復(fù)測量對比矩陣(Re902計算HotellingT2與F統(tǒng)計量2計算HotellingT2與F統(tǒng)計量91本例中n=10,m=5。本例中n=10,m=5。923確定P值,作出檢驗結(jié)論查表3.1得拒絕H0,接受H1,即認為服藥后1-4周的體重比服藥前有所降低。3確定P值,作出檢驗結(jié)論查表3.1得拒絕H0,接受H1,即93圖14-210名肥胖患者服藥前后體重的變化趨勢分析服藥后1-4周的體重降低的變化趨勢圖14-210名肥胖患者服藥前后體重的變化趨勢分析服藥后194

將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的1次項、2次項、3次項、4次項,描述體重隨時間變化的曲線趨勢。將10名患者組內(nèi)變異SS組內(nèi)(v=4)分解為多項式的95SPSS操作SPSS操作96第十四章多變量數(shù)據(jù)的統(tǒng)計描述與推斷精選課件97結(jié)果結(jié)果98第四節(jié)輪廓分析

輪廓(profile)分析是比較兩組或多組多變量均數(shù)向量的輪廓是否相等。輪廓是指各組均數(shù)所連成的折線。輪廓分析通常進行組間輪廓相似性或平行性(parallel)

、組間平均水平差異顯著性和組內(nèi)條件(如時間或各反應(yīng)變量間)變異顯著性三個方面的假設(shè)檢驗。第四節(jié)輪廓分析輪廓(profile)分析是99圖143不同麻醉誘導(dǎo)時相的平均收縮壓圖143不同麻醉誘導(dǎo)時相的平均收縮壓100由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除HotellingT2外,還可用多變量方差分析。拒絕H0,即認為合并后總體的輪廓不是一條水平線。modelT3T4T8=c;若有3個樣本均數(shù)向量的比較,共作3次F檢驗,若每次比較的檢驗水準(zhǔn)=0.H1三個均向量不都相等。輪廓(profile)分析是比較兩組或多組多變量均數(shù)向量的輪廓是否相等。晚間休息感到不能很快入睡(X6)正態(tài)性、方差不齊

時對應(yīng)的統(tǒng)計分析方法例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。R最大特征根=E-1H的最大特征根例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。通過g個均數(shù)向量推斷,即三組藥物對T細胞免疫功能的影響是相等的。HotellingT2T2=9.吃飯有時覺得胃口不好(X7)在兩組數(shù)據(jù)重合的情況下,可視為一個總體,合并后的總體均數(shù)為(parallelcontrasts)1272.if_n_<4thenc=1;表1410兩組研究生健康問卷的平均得分分析思路如果組間輪廓相似,可進一步分析其他的變異,即了解組間輪廓是否完全一致(即重合)以及各組的輪廓圖是否與水平軸(表示組內(nèi)因素水平間差異,如時間上的差別)平行,因此,輪廓分析首先進行的是輪廓相似性檢。由表14-7可知,兩組均數(shù)向量作假設(shè)檢驗時,除Hotelli101例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)查。調(diào)查問題設(shè)計如下7個問題對自已健康狀況的滿意程序(X1)是否需要調(diào)養(yǎng)身體(X2)身體胡不適或不舒服的感覺(X3)有生病的感覺(X4)有緊張情緒和壓力感(X5)晚間休息感到不能很快入睡(X6)吃飯有時覺得胃口不好(X7)例147分別對50名碩士生和30名博士生進行健康狀況抽樣調(diào)102圖14-4調(diào)查問卷7個問題的平均得分圖14-4調(diào)查問卷7個問題的平均得分103表1410兩組研究生健康問卷的平均得分問題1問題2問題3問題4問題5問題6問題7碩士生均數(shù)2.022.322.181.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論