多變量數(shù)據(jù)統(tǒng)計描述和推斷I_第1頁
多變量數(shù)據(jù)統(tǒng)計描述和推斷I_第2頁
多變量數(shù)據(jù)統(tǒng)計描述和推斷I_第3頁
多變量數(shù)據(jù)統(tǒng)計描述和推斷I_第4頁
多變量數(shù)據(jù)統(tǒng)計描述和推斷I_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、多變量數(shù)據(jù)統(tǒng)計描述和推斷I2022-3-6統(tǒng)計分析有哪些應用? 比較(Compare: mean, rate, distribution) (Relation: correlation, linear, nolinear,etc.) 預測(forecast: ARIMA, etc.) 分類(classify: Discrimant, cluster ) 評價(Evaluation: Synthetic)2022-3-6比較(Comparsion) 比較兩組*指標的比較(univariate)比較不同地區(qū)兒童生長發(fā)育( Growth and development: height, weight

2、, bust,etc.)情況不同組別的IgG,IgM,IgA,IgE2022-3-6關系(Relation) 探索病因(relation) 高血壓與年齡、體重、吸煙量、飲酒量、工齡、遺傳等 校正混雜因素(confound) 探討巰基丁氨酸(homocysteine)與血壓(BP)、冠心病(CoronaryHeartDisease)的關系,需調(diào)整年齡、性別、種族等因素。2022-3-6預測(Forcasting) 門診量(Outpatient)的預測 胎兒(Fetus)的體重2022-3-6分類(classification) 臨床診斷(Clinical diagnosis) 病毒鑒別(Viru

3、s classification)胸痛患者如何快速診斷(是否急性心肌缺血?)根據(jù)醫(yī)療水平、設備、工作效率等對醫(yī)院分級氣相色譜法分析細菌全細胞脂肪的含量來研究細菌的分類或鑒定。2022-3-6評價(Evaluation) 綜合評價(Synthetic evaluation)成本效益評價(Cost-effectiveness)衛(wèi)生投入產(chǎn)出評價 健康狀況評價假設檢驗方法小結如果P |r| under H0: Rho=0 x1x2x3x11.00000 0.455630.08790.284090.3048x20.455630.08791.00000 0.621060.0135x30.284090.30

4、480.621060.01351.00000 Covariance Matrix, DF = 14 x1x2x3x10.00575714290.01029285710.0093071429x20.01029285710.08864095240.0798395238x30.00930714290.07983952380多元正態(tài)分布(Multi normal dist.) 多變量統(tǒng)計描述和推斷中,通常假定數(shù)據(jù)服從多元正態(tài)分布。設為m個反應變量的總體均數(shù)向量,jk為第j個反應變量與第k個反應變量的總體協(xié)方差, jk 構成了mm的總體協(xié)方差矩陣。則分布函數(shù)如下:X服從 的分布

5、。2022-3-6二元正態(tài)分布曲面 Surface(11=1,22=1,12=0) 2022-3-6二元正態(tài)分布曲面(11=2,22=4,12=0.75)2022-3-6二元正態(tài)分布曲面剖面 profile (11=1,22=1/2,12=0.75)2022-3-6m元正態(tài)分布(normal)的性質(zhì)每一個變量均服從正態(tài)分布。變量的線性組合(Y=a1x1+a2x2+apXp)服從正態(tài)分布。m 元正態(tài)分布中的任意 k (0k= 3 samples 三組及以上第二節(jié)第二節(jié) 組間差別比較組間差別比較2022-3-61 單變量(univariate)資料統(tǒng)計分析(student t ) 檢驗某一樣本是否

6、來自已知總體,其假設檢驗為: ,求其統(tǒng)計量: 2022-3-6利用逐一單變量方法的缺點: (1) 兩組的各指標差別雖有統(tǒng)計學意義,但趨勢不一。 (2) 兩組間有些指標差別有統(tǒng)計學意義,有些指標差別無統(tǒng)計學意義。(3)沒有全面利用多個反應變量的信息。2022-3-6Hotelling T22022-3-6例14-2 隨機抽取某單位5名懷疑有冠心病的成年男性,測量其甘三油酯(mmol/L)、總膽固醇(mmol/L)和高密度脂白膽固醇(mmol/L)含量。根據(jù)例14-1已知,該單位正常成年男性的甘三油酯、總膽固醇和高密度脂白膽固醇均數(shù)分別為1.02、2.73、2.04 mmol/L。問該單位懷疑冠心

7、病成年男性的血脂與正常成年男性有無差別?觀察對象序號甘油三酯 TC(X1-1.02)總膽固醇 CHOL(X1-2.73)高密度脂蛋白膽固醇HDL (X3-2.04)11.780.83-1.0120.670.96-0.8430.560.83-0.3940.661.12-1.0350.210.160.40表14-2 懷疑冠心病成年男性與正常成年男性的血脂差別(mmol/L)2022-3-61 建立檢驗假設 2022-3-62 計算統(tǒng)計量F2022-3-6利用公式(14-9)、(14-10)計算Hotelling T2統(tǒng)計量和F值2022-3-6查F界值表,F(xiàn)0.05(3,2)=19.16, F0.

8、01(3,2)=99.17 0.01P FWilks Lambda0.0133447549.29320.0200Pillais Trace0.9866552549.29320.0200Hotelling-Lawley Trace73.935837249.29320.0200Roys Greatest Root73.935837249.29320.02002022-3-6二 兩組比較 (Two sample) 檢驗兩個樣本是否來自同一總體。如果兩組樣本觀察值分別來自正態(tài)總體N(1,2)及N(2,2)。兩樣本均數(shù) 和 分別服從 和 的正態(tài)分布。其檢驗假設為:2022-3-62022-3-6把單變量

9、的公式推廣到多變量,其式子如下:把單變量的公式推廣到多變量,其式子如下:2022-3-6210:H在假定在假定 成立的情況下,成立的情況下,當當n1,n2較大時,較大時,F(xiàn)值近似地服從自由度為值近似地服從自由度為m的卡方分的卡方分布。布。2022-3-6例 14-3 某婦幼保健院將孕婦隨機分成兩組,一組接受孕期保健教育,另一組作為對照。表14-3是同一日出生的13名順產(chǎn)嬰兒的體重和身長,問孕期保健教育對嬰兒生長發(fā)育有無促進作用?嬰兒編號保健教育組嬰兒編號對照組體重(kg)身長(cm)體重(kg)身長(cm)13.055073.205024.105083.004633.505393.004543.6450103.354753.6052112.605064.0055123.5552133.3450表14-3 13名嬰兒出生的生長以育狀況2022-3-6P0.052022-3-61 作檢驗假設,確定檢驗水準 即兩組嬰兒的生長發(fā)育狀況一致2 計算統(tǒng)計量計算統(tǒng)計量F值值2022-3-6用公式(用公式(14-14)、公式()、公式(14-15)可求得)可求得2022-3-63 確定P值,作出結論 查F值表, F=4.32, 0.01P6 then c=2;else c=1;input id weight high;cards;1 3.05 502 4.10 5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論