分類變量資料的統(tǒng)計(jì)分析_第1頁(yè)
分類變量資料的統(tǒng)計(jì)分析_第2頁(yè)
分類變量資料的統(tǒng)計(jì)分析_第3頁(yè)
分類變量資料的統(tǒng)計(jì)分析_第4頁(yè)
分類變量資料的統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分類變量資料的統(tǒng)計(jì)分析1 率(rate):說(shuō)明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。 率=(實(shí)際發(fā)生數(shù)/可能發(fā)生總數(shù))比例基數(shù) 比例基數(shù):100%、1000、10000/萬(wàn)、100000(1/10萬(wàn)) 如:發(fā)病率、死亡率、發(fā)生率、陽(yáng)性率、患病率等分類變量資料的統(tǒng)計(jì)描述 構(gòu)成比(proportion):說(shuō)明某一事物內(nèi)部,各組成部分所占的比重。也叫百分比。 構(gòu)成比=(某部分觀察單位數(shù)/各組成部分觀察單位總數(shù))100% 如:教研室16人中高級(jí)職稱有4人,占202 相對(duì)比(relative ratio):是A、B兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明A是B的若干倍或百分之幾,通常用倍數(shù)或分?jǐn)?shù)表示。 如:男:女、醫(yī)生:護(hù)士、

2、教師:學(xué)生3分類變量資料的統(tǒng)計(jì)推斷4率的抽樣誤差與標(biāo)準(zhǔn)誤 樣本率(p)和總體率()的差異稱為率的抽樣誤差,用率的標(biāo)準(zhǔn)誤表示如果總體率未知,用樣本率p估計(jì)5標(biāo)準(zhǔn)誤的計(jì)算6總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interval of rate):根據(jù)樣本率推算總體率可能所在的范圍1. 查表法:樣本含量較小(如n50),np或n(1-p)510卡方檢驗(yàn) 檢驗(yàn)(Chi-square test)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,英國(guó)人K . Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法??捎糜趦蓚€(gè)或多個(gè)率間的比較,計(jì)數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗(yàn)等。11

3、 檢驗(yàn)的基本公式121.四格表形式 組別 陽(yáng)性數(shù) 陰性數(shù) 合計(jì) 甲組 a b a+b 乙組 c d c+d 合計(jì) a+c b+d N2.四格表專用公式四格表專用公式13 舉例14連續(xù)性校正公式 檢驗(yàn)的應(yīng)用條件:當(dāng)n40,T5時(shí),用專用公式當(dāng)n40,而1T5時(shí),用連續(xù)性校正公式當(dāng)n40或T1時(shí),用Fisher精確檢驗(yàn)(Fisher exact test )校正公式:15配對(duì)四格表資料的 檢驗(yàn)表516 計(jì)算公式17H0:b,c來(lái)自同一個(gè)實(shí)驗(yàn)總體(兩種劑量的毒性無(wú)差異)H1:b,c來(lái)自不同的實(shí)驗(yàn)總體(兩種劑量的毒性有差別)=0.05。 舉例18行列(RC)表資料的 檢驗(yàn) 四格表是指只有2行2列的表格

4、,當(dāng)行數(shù)或列 數(shù)超過(guò)2時(shí),統(tǒng)稱為行 列表。行列表的 檢驗(yàn)是對(duì)多個(gè)樣本率(或構(gòu)成比)的檢驗(yàn)。 適用條件:表中不宜有1/5以上格子的理論頻數(shù)小于5,或有一個(gè)格子的理論頻數(shù)小于1。19兩個(gè)(多個(gè))率或構(gòu)成比的比較推斷兩個(gè)或多個(gè)分類變量是否相關(guān)聯(lián)或相互獨(dú)立兩個(gè)或多個(gè)發(fā)生率或構(gòu)成比是否相同20一致性檢驗(yàn)與配對(duì)卡方檢驗(yàn)配對(duì)設(shè)計(jì)包括 同一樣本接受不同處理的比較 配對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理21一致性檢驗(yàn)與配對(duì)卡方檢驗(yàn)資料為配對(duì)資料 結(jié)果是否基本一致 * Kappa 0.75一致性好 * 0.75Kappa0.4一致性一般 * Kappa 0.4一致性較差結(jié)果有無(wú)差別:配對(duì)卡方檢驗(yàn)22freq過(guò)程功能:

5、描述性統(tǒng)計(jì)以及假設(shè)檢驗(yàn)的功能對(duì)分類變量計(jì)算頻數(shù)分布,產(chǎn)生頻數(shù)表和列聯(lián)表;對(duì)于列聯(lián)表資料(兩個(gè)或更多因素),對(duì)兩因素間的關(guān)系進(jìn)行統(tǒng)計(jì)學(xué)推斷;對(duì)于三維表,可作Mentel-Hanszel分層分析。23freq過(guò)程表 freq過(guò)程的功能卡方檢驗(yàn)關(guān)聯(lián)性的推斷及其強(qiáng)度測(cè)量22表資料危險(xiǎn)度計(jì)算以及危險(xiǎn)度差別的檢驗(yàn)22表資料OR值以及相對(duì)危險(xiǎn)度的計(jì)算趨勢(shì)檢驗(yàn)一致性檢驗(yàn)Cochran-Mantel-Haenszel 統(tǒng)計(jì)量計(jì)算24freq過(guò)程的一般格式 25freq過(guò)程的一般格式 PROC FREQ; TABLES A;產(chǎn)生變量A的一維頻數(shù)表 PROC FREQ; TABLES A*B;產(chǎn)生A、B兩個(gè)變量的列

6、聯(lián)表,*前為行變量,*后為列變量TABLES語(yǔ)句:26freq過(guò)程的一般格式 在TABLES語(yǔ)句中用*號(hào)連接三個(gè)或n個(gè)變量名,可得到三維或n維列聯(lián)表,最后一個(gè)變量各水平形成表的列,倒數(shù)第二個(gè)變量各水平形成表的行,其它變量的每一級(jí)水平(或水平組合)形成一層,且每一層都形成分離的列聯(lián)表。如:PROC FREQ; TABLES A*B*C*D;列聯(lián)表的數(shù)量為A、B不同水平的組合數(shù),每個(gè)表的上部為D的各水平,左側(cè)為C的各水平。27freq過(guò)程的一般格式 表 多表格表達(dá)式示例表達(dá)式等同表達(dá)式tables a*(b c); tables a*b a*c; tables (a b)*(c d); table

7、s a*c b*c a*d b*d; tables (a b c)*d; tables a*d b*d c*d; tables a-c; tables a b c; tables (a-c)*d; tables a*d b*d c*d; 28freq過(guò)程的一般格式 TABLES語(yǔ)句中“/” 后面的選項(xiàng):1、統(tǒng)計(jì)分析選項(xiàng) CHISQ:對(duì)每層作 檢驗(yàn),包括Pearson 、似然比 和Mantel-Haenszel 。此外還給出與 檢驗(yàn)有關(guān)的關(guān)聯(lián)指標(biāo)包括Phi系數(shù)、列聯(lián)系數(shù)和Cramers V。對(duì)于22表,給出Fisher精確概率。 AGREE:進(jìn)行配對(duì) 檢驗(yàn)。 EXACT :對(duì)大于22的列聯(lián)表計(jì)算

8、Fisher精確概率。同時(shí)也給出CHISQ選項(xiàng)的全部統(tǒng)計(jì)量。 29freq過(guò)程的一般格式 TABLES語(yǔ)句中“/” 后面的選項(xiàng): MEASURES :對(duì)每層的二維表計(jì)算一系列關(guān)聯(lián)指標(biāo)及相應(yīng)的標(biāo)準(zhǔn)誤,包括Pearson和Spearman相關(guān)系數(shù),以及Gamma和Kendall系數(shù)等。對(duì)于22表,還給出常用的危險(xiǎn)度指標(biāo)及其標(biāo)準(zhǔn)誤。 ALPHAp :給出檢驗(yàn)水準(zhǔn)。缺省為0.05。30freq過(guò)程的一般格式 TABLES語(yǔ)句中“/” 后面的選項(xiàng): CMH: 給出Cochran-Mantel-Haenszel統(tǒng)計(jì)量,可檢驗(yàn)在調(diào)整了TABLES語(yǔ)句中其它變量后,行變量與列變量之間的關(guān)聯(lián)程度。對(duì)于22表,F(xiàn)

9、REQ過(guò)程給出相對(duì)危險(xiǎn)度估計(jì)及其可信區(qū)間,還給出各層關(guān)聯(lián)度指標(biāo)是否齊性的Breslow檢驗(yàn)。 ALL :給出CHISQ、MEASURES、CMH所請(qǐng)求的全部統(tǒng)計(jì)量。31freq過(guò)程的一般格式 TABLES語(yǔ)句中“/” 后面的選項(xiàng):2、有關(guān)表格信息選項(xiàng) EXPECTED: 給出期望頻數(shù) DEVIATION :給出每格的實(shí)際頻數(shù)與期望頻數(shù)的差值 CELLCHISQ:給出每格對(duì)總c 2的貢獻(xiàn),即計(jì)算每格的(實(shí)際頻數(shù)-期望頻數(shù))2/期望頻數(shù)。 CUMCOL: 給出累積列百分?jǐn)?shù)32freq過(guò)程的一般格式 TABLES語(yǔ)句中“/” 后面的選項(xiàng):3、禁止輸出選項(xiàng) NOFREQ:不給出列聯(lián)表中的格頻數(shù) NOP

10、ERCENT:不給出列聯(lián)表中的格百分?jǐn)?shù) NOROW:不給出列聯(lián)表中各格的行百分?jǐn)?shù) NOCOL:不給出列聯(lián)表中各格的列百分?jǐn)?shù) NOCUM:不給出頻數(shù)表的累積頻數(shù)和累積百分?jǐn)?shù) NOPRINT: 不給出表格,但給出CHISQ、MEASURES 或CMH等語(yǔ)句所指定的統(tǒng)計(jì)量。33freq過(guò)程的一般格式 WEIGHT 語(yǔ)句: 通常每個(gè)觀察值提供數(shù)值1給頻數(shù)計(jì)數(shù),當(dāng)WEIGHT語(yǔ)句出現(xiàn)時(shí),每個(gè)觀察值提供的是該觀察值的加權(quán)變量值。該值必須非負(fù),但可不必為整數(shù)。 只能使用一個(gè)WEIGHT語(yǔ)句,且該語(yǔ)句作用于所有的表。34例1:兩獨(dú)立樣本率的比較 在研究糖尿病的臨床試驗(yàn)中,將258名患者隨機(jī)分為兩組,一組204

11、人服用鹽酸苯乙雙胍藥,死于心血管病的26人,另一組64人服安慰劑,死于心血管病2人,問(wèn)兩種藥物心血管病死率有無(wú)差別?35表 兩種療法心血管病病死率比較 療法 死亡人數(shù) 生存數(shù) 合計(jì) 病死率% 苯乙雙胍 26 178 204 12.75 安慰劑 2 62 64 3.13 合計(jì) 28 240 268 10.45問(wèn):兩組病死率差別是否是抽樣誤差或是用苯乙雙胍藥物的作用?26 1782 62四格表的數(shù)字組別 + 甲乙36SAS程序Data a1; input treat outcome f; cards; 1 1 178 1 2 26 2 1 62 2 2 2;Proc freq; weight f;

12、 tables treat*outcome/chisq;Run;37SAS結(jié)果3839例2:多個(gè)獨(dú)立樣本率的比較將做了手術(shù)的761例皮膚黑色瘤患者分為4組。1組:術(shù)后不接受治療2組:術(shù)后接受化療3組:術(shù)后接受免疫療法4組:術(shù)后接受化療和免疫療法問(wèn):不同療法患者3年生存率有無(wú)差別?40表 黑色素瘤患者隨訪3年生存情況治療組 生存人數(shù) 死亡人數(shù) 合計(jì) 生存率% 77 108 185 41.6 89 103 192 46.4 99 104 203 48.8 90 91 181 50.0合計(jì) 355 406 761 46.61.假設(shè):H0; 1= 2 = 3= c=355/761=46.6 H1:四組總體生存率不等或不全等 2. =0.05(差別顯著的水準(zhǔn)) 41SAS程序Data a2; do a=1 to 4; do b=1 to 2; input f ; output; end; end;cards; 77 108 89 103 99 104 90 91 ;Proc freq; weight f; tab

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論