分類變量的重復(fù)測量_第1頁
分類變量的重復(fù)測量_第2頁
分類變量的重復(fù)測量_第3頁
分類變量的重復(fù)測量_第4頁
分類變量的重復(fù)測量_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

分類變量的重復(fù)測量第一頁,共五十一頁,2022年,8月28日

分類變量(categoricalvariable)又稱為定性變量(qualitativevariable),在工作中應(yīng)用甚廣。根據(jù)其不同的取值性質(zhì),又可分為3種類型:第一種是名義刻度(nominalscale)的分類變量,它是按事物屬性分類的變量,如性別、職業(yè)等。在統(tǒng)計學(xué)上為了計算方便,將這些不同的屬性進(jìn)行數(shù)量化處理,如男性賦值為1,女性賦值為2。這種數(shù)值只是作為屬性的代碼,其間并無大小之分。第二種為有序刻度(ordinalscale)的分類變量,它是根據(jù)事物呈現(xiàn)出的程度或水平不同進(jìn)行賦值。如臨床化驗結(jié)果用符號“-、+、++、+++”,文化程度用“文盲、小學(xué)、中學(xué)、大學(xué)、研究生”來劃分等級,在進(jìn)行數(shù)量化處理時賦值1、2、3、…。這里需要注意的是,1與2之差不一定等于2與3之差。第三種是區(qū)間刻度(intervalscale),如人口學(xué)統(tǒng)計中的年齡分組,“0-,10-,20-,…”就是典型的例子。根據(jù)資料的性質(zhì),區(qū)間跨度有等距的,也有不等距的。第二頁,共五十一頁,2022年,8月28日把分類變量作為反應(yīng)變量進(jìn)行重復(fù)觀察的情形在工作中應(yīng)用較廣。在本書第九章第五節(jié)中介紹了二分類反應(yīng)變量的重復(fù)測量資料分析方法。本章將介紹分類反應(yīng)變量重復(fù)測量資料的一般分析方法。主要介紹加權(quán)最小二乘法分析方法。第一節(jié)一個總體的二分類反應(yīng)重復(fù)測量資料的分析。第三頁,共五十一頁,2022年,8月28日第一節(jié)二分類反應(yīng)重復(fù)測量

資料的分析一、資料結(jié)構(gòu)設(shè)有n例受試者,反應(yīng)變量y,分為r水平(當(dāng)r=2時稱y為二分類反應(yīng)變量),有p個觀測時間點,每一受試者可能出現(xiàn)的結(jié)果共有rp種。當(dāng)r=2、p=3時的所有可能結(jié)果共有8種。當(dāng)對y用(0,1)賦值方法時,n例受試者在這8種組合情況下出現(xiàn)的邊際合計數(shù)為n000至n111。詳細(xì)分配情況見下面示意圖圖11.1。第四頁,共五十一頁,2022年,8月28日邊際合計數(shù)n000至n111是每種可能取值結(jié)果組合情況下的觀察例數(shù)??偫龜?shù)n為邊際合計數(shù)之和。如果將上述示意圖資料按獨立觀察資料整理各時間點的頻數(shù)分布時(表11.1),每一時間點的合計數(shù)都為n=n1+=n2+=n3+,總例數(shù)變成了3n而不是n。但實際是觀察例數(shù)為n,觀察次數(shù)為3n。一般統(tǒng)計學(xué)方法是以表11.1的資料類型為出發(fā)點進(jìn)行分析的。而本章介紹的方法是以圖11.1的邊際合計數(shù)為出發(fā)點進(jìn)行分析的。第五頁,共五十一頁,2022年,8月28日二、模型結(jié)構(gòu)受試者i在時間點j的反應(yīng)變量為yij

,其取值概率為pj,(j=1,…,p)。單總體重復(fù)測量資料的任務(wù)為是要分析這p個概率p1,…,pp,是否相等。令反應(yīng)頻數(shù)的某種函數(shù)即反應(yīng)函數(shù)(responsefunction)F=f(m),建立的線性模型為:式中X為d×q維的設(shè)計矩陣,d=(r-1)p,為反應(yīng)函數(shù)。B為q維未知參數(shù)。第六頁,共五十一頁,2022年,8月28日由于每一個體在不同時間點的反應(yīng)變量的取值是相關(guān)的,因此,在配合模型時應(yīng)將這種相關(guān)性納入模型中。對式(11.1)求參數(shù)估計值的加權(quán)最小二乘解法就是在考慮到這種相關(guān)性的基礎(chǔ)上建立起來的。模型(11.1)的加權(quán)最小二乘解法求參數(shù)?的估計值的計算公式為第七頁,共五十一頁,2022年,8月28日例11.1一項藥物對風(fēng)濕性關(guān)節(jié)炎的治療效果觀察。用一種藥物對46名患風(fēng)濕性關(guān)節(jié)炎的病人進(jìn)行治療,共三個療程。每個療程結(jié)束后評價其治療效果。有效者記為yij=1,否則yij=0i=1,…,46;j=1,2,3。資料列于表11.2中。表中的T1,T2,T3分別代表三個療程。本項研究的目的是探討不同療程的療差別。第八頁,共五十一頁,2022年,8月28日三、配合線性模型的步驟

表11.2為資料的原始記錄形式,需要將其整理成邊際頻數(shù)表的格式后再配合模型。計算步驟介紹如下。

1.首先用下列SAS程序計算邊際合計數(shù)程序中的subj為受試者號,time1、time2、time3代表3個療程。第九頁,共五十一頁,2022年,8月28日第十頁,共五十一頁,2022年,8月28日計算出的邊際頻數(shù)列于表11.3中。從而得到邊際頻數(shù)向量n及其函數(shù)邊際頻率向量m為:

n=(616242466)’M=(6/460.34780.04350.08700.04350.08700.13040.1304)’

用nj及mj表示向量n及m中的元素。

2.給出轉(zhuǎn)換矩陣A本例的轉(zhuǎn)換矩陣A的結(jié)構(gòu)為

A的作用是將反應(yīng)頻率M轉(zhuǎn)換成反應(yīng)函數(shù)F。第十一頁,共五十一頁,2022年,8月28日

3.求出反應(yīng)函數(shù)F它是每一時間點反應(yīng)變量各個水平的邊際概率。但它不包含該反應(yīng)變量最后一個水平的反應(yīng)概率。本例有3個時間點(time1time2time3),每個時間點的反應(yīng)變量為r=2水平,故每一時間點只有一個反應(yīng)函數(shù)。共有3個反應(yīng)函數(shù)為:如f1=0.6086957=0.1304348+0.3478261+0.0434783+0.0869565第十二頁,共五十一頁,2022年,8月28日第十三頁,共五十一頁,2022年,8月28日第十四頁,共五十一頁,2022年,8月28日第十五頁,共五十一頁,2022年,8月28日第十六頁,共五十一頁,2022年,8月28日以上分析可用SAS的CATMOD過程。程序如下:

PROCCATMODDATA=exmp11_1order=DATA;RESPONSEMARGINALS;MODELtime1*time2*time3=_RESPONSE_/ONEWAYCOV;REPEATEDtime3/_RESPONSE_=time;RUN;

程序中的RESPONSEMARGINALS語句是指定反應(yīng)函數(shù)為在MODEL中規(guī)定的反應(yīng)變量的邊際概率。輸出結(jié)果見表11.5、表11.6、表11.7。第十七頁,共五十一頁,2022年,8月28日

從輸出的表11.5反應(yīng)函數(shù)和協(xié)方差矩陣中看出,第一和第二療程的有效率都為0.6087(60.87%),第三療程的有效率為0.3478(34.78%)。從表11.6方差分析看,標(biāo)記‘time’的有效率分析,第三療程的效果顯著低于前兩個療程。對各療程療效一致性的假設(shè)檢驗可用下列公式計算。令對比矩陣C為:

第十八頁,共五十一頁,2022年,8月28日從表11.7加權(quán)最小二乘估計值分析可見,有關(guān)TIME的兩個參數(shù)估計值都為正值,反映藥物在療程1、2期的效果優(yōu)于第3期的效果。第十九頁,共五十一頁,2022年,8月28日在程序中的REPEATED語句的下面加入CONTRAST語句:CONTRAST‘time1VStime3’_RESPONSE_21;

或CONTRAST‘time1VStime3’ALL_PARMS021;為了檢驗第一療程與第三療程療效的相等性,所用的檢驗假設(shè)為:Ho:2=-2-3或Ho:22+3=0;H1:22+30這是因為在參數(shù)化時用了關(guān)系式4=-2-3(4代表第三療程療效),故有2=4等價于2=-2-3第二十頁,共五十一頁,2022年,8月28日

上述SAS程序是用每個病例的記錄建立數(shù)據(jù)集配合模型用的,也可以用頻數(shù)表資料(表11.3)配合模型。所用SAS程序為:得到輸出結(jié)果見表11.8。從表11.8對比分析看出,第一期的療效與第三期療效間有顯著差異(P=0.0161)。第二十一頁,共五十一頁,2022年,8月28日DATAexmpl1_1;INPUTtime1time2time3count;CARDS;111611016101210040112010400160006;PROCCATMODDATA=exmpl1_1ORDER=DATA;RESPONSEMARGINALS;WEIGHTcount;MODELtime1*time2*time3=_RESPONSE_/ONEWAYCOV;REPEATEDtime3/_RESPONSE_=time;RUN;第二十二頁,共五十一頁,2022年,8月28日第二節(jié)多組資料的分析方法

當(dāng)有多組資料時,統(tǒng)計分析所要回答的問題有三點:①資料是否存在組間差異。②反應(yīng)是否隨時間變化。③是否存在處理組與時間之間的交互效應(yīng)。分析所用公式以及計算步驟與單總體的情形基本一致。下面用一個具有二分類反應(yīng)變量的2組重復(fù)測量資料為例加以介紹。第二十三頁,共五十一頁,2022年,8月28日例11.2對65歲及以上老年人參與某項社會活動的6年追蹤調(diào)查。樣本量為男性662人,女性1311人,分別在當(dāng)年、第3年和第6年調(diào)查他們參與社會活動的情況。反應(yīng)變量y的賦值規(guī)則為:

y=1經(jīng)常參加該項社會活動

0不經(jīng)常參加該項社會活動資料列于表11.9中。本例的分組變量為性別,分組數(shù)a=2。反應(yīng)變量y的分類數(shù):r=2。重復(fù)測量時間點數(shù)p=3。計算步驟如下。第二十四頁,共五十一頁,2022年,8月28日第二十五頁,共五十一頁,2022年,8月28日

1.列出邊際頻數(shù)矩陣N及相應(yīng)的邊際頻率矩陣M每一組的邊際頻數(shù)占一列,即N=(n1’,n2)。與之對應(yīng),每一組的邊際頻率也占頻率矩陣中的一列,即M=(ml’,m2’)。第二十六頁,共五十一頁,2022年,8月28日同時可以建立一個16×1維的邊際頻率向量L為:

L=(0.690.070.020.040.030.020.020.120.590.050.020.040.020.030.030.22)’

2.建立轉(zhuǎn)換矩陣A由于每一組都是3個反應(yīng)變量,每一反應(yīng)變量具有2個水平,所以所建立的轉(zhuǎn)換矩陣A與例11.1的A完全相同。即第二十七頁,共五十一頁,2022年,8月28日3.計算反應(yīng)函數(shù)F第二十八頁,共五十一頁,2022年,8月28日

4.分組計算邊際頻率mg(g=1,2)的協(xié)方差矩陣V(ml)和V(m2)5.兩組反應(yīng)頻率的協(xié)方差矩陣V(M)本例的V(M)為16×16維矩陣,對角元素為V(mg),非主對角元素為0。第二十九頁,共五十一頁,2022年,8月28日

6.求F的協(xié)方差矩陣V(F)本例的V(F)為6×6維矩陣:7.定設(shè)計矩陣X例11.2資料的設(shè)計矩陣(含交互效應(yīng))見表11.11.第三十頁,共五十一頁,2022年,8月28日故本例含有交互作用項的設(shè)計矩陣為:第三十一頁,共五十一頁,2022年,8月28日

8.用式(11.2)計算參數(shù)估計值(表11.12)第三十二頁,共五十一頁,2022年,8月28日9.用對比矩陣C作兩組比較的假設(shè)檢驗C的結(jié)構(gòu)為:利用式(11.6)得到2=31.38,自由度=3,查附表3:2界值表,有20.05(3)=7.81,反映兩組間的差異有統(tǒng)計學(xué)意義。以上計算過程所用SAS程序如下:第三十三頁,共五十一頁,2022年,8月28日DATAexmpl1_2;inputgender$year0year3year6count@@;CARDS;f111904f11088f10125f10051f01133f01022f00130f000158m111391m11036m10112m100143m01115m01021m00118m000143;PROCCATMODORDER=DATA;WEIGHTcount;RESPONSEmarginals;MODELyear0*year3*year6=gender|_RESPONSE_/PRED=FREQCOV;REPEATEDyear;RUN;第三十四頁,共五十一頁,2022年,8月28日輸出結(jié)果見表11.13-表11.17。第三十五頁,共五十一頁,2022年,8月28日第三十六頁,共五十一頁,2022年,8月28日第三十七頁,共五十一頁,2022年,8月28日第三十八頁,共五十一頁,2022年,8月28日第三十九頁,共五十一頁,2022年,8月28日

從輸出表11.17方差分析結(jié)果看,性別(gender)和年份(year)都有顯著的統(tǒng)計學(xué)意義(P<0.0001);但性別*年份(gender*year)間交互作用無顯著的統(tǒng)計學(xué)意義(P=0.6476)。因此,在模型中剔除交互作用項后從新配合下列模型:

MODELyear0*year3*year6=gender_RESPONSE_/FRED=FREQCOV;

得到輸出結(jié)果見表11.18,表11.19。第四十頁,共五十一頁,2022年,8月28日第四十一頁,共五十一頁,2022年,8月28日第四十二頁,共五十一頁,2022年,8月28日

輸出結(jié)果表11.19表明,性別間的差異和年份間的差異都具有統(tǒng)計學(xué)意義。由于無性別關(guān)年份交互作用,所以不同性別受試者對參與某項社會活動的時間趨勢是類似的。為進(jìn)一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論