分類變量資料的統(tǒng)計分析秩和檢驗_第1頁
分類變量資料的統(tǒng)計分析秩和檢驗_第2頁
分類變量資料的統(tǒng)計分析秩和檢驗_第3頁
分類變量資料的統(tǒng)計分析秩和檢驗_第4頁
分類變量資料的統(tǒng)計分析秩和檢驗_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計資料的類型數(shù)值變量:定量資料分類變量:定性資料有序分類:變量之間有程度的差別,且排列有序.(等級資料)無序分類:(計數(shù)資料)

二項分類多項分類變量的轉(zhuǎn)換:定量定性連續(xù)型計量資料離散型計量資料分類變量資料的統(tǒng)計分析第一節(jié)統(tǒng)計描述一.描述指標(biāo)(相對數(shù))1.

率(rate)

:說明一定時間內(nèi)某事件發(fā)生的頻率或強(qiáng)度單位:%,‰,1/萬,1/10萬2.

構(gòu)成比(constituentratio)

:說明事物內(nèi)部構(gòu)成,或各部分所占百分比,單位%3.

相對比(relativeratio):說明兩個指標(biāo)的比例關(guān)系

常用率比例11-1

某研究者2000年對某校的初中生進(jìn)行了近視患病情況調(diào)查,試計算各年級近視患病率和構(gòu)成比及三年級和一年級患病率的相對比.年級檢查人數(shù)患病人數(shù)

患病率構(gòu)成比相對比一年級44267二年級42868三年級40574合計127520916.39100.015.1632.0615.8932.5318.2735.411.2二.應(yīng)用相對數(shù)時注意事項1.

分母不宜太小2.

率和構(gòu)成比的區(qū)別3.樣本含量不等的幾個率的平均值不等于幾個率的算數(shù)平均值4.對率或構(gòu)成比進(jìn)行比較時,應(yīng)注意資料的可比性5.

率的標(biāo)準(zhǔn)化6.兩樣本率進(jìn)行比較時應(yīng)進(jìn)行假設(shè)檢驗三.率的標(biāo)準(zhǔn)化1.基本思想:為消除內(nèi)部構(gòu)成不同對指標(biāo)的影響,采用統(tǒng)一的內(nèi)部構(gòu)成計算標(biāo)準(zhǔn)化率,使得出的標(biāo)準(zhǔn)化率具有可比性.2.計算方法:

直接法:已知各年齡組的實際發(fā)病率,用標(biāo)準(zhǔn)人口數(shù)或標(biāo)準(zhǔn)人口構(gòu)成進(jìn)行計算間接法:標(biāo)準(zhǔn)化死亡比(SMR),實際死亡數(shù)與預(yù)期死亡數(shù)的比

3.

率的標(biāo)準(zhǔn)化應(yīng)注意的問題第二節(jié)計數(shù)資料統(tǒng)計推斷一.率的抽樣誤差和標(biāo)準(zhǔn)誤

樣本率和總體率或樣本率之間存在的差異,稱抽樣誤差.率的抽樣誤差用率的標(biāo)準(zhǔn)誤表示.(porSp).(p=陽性率,1-p=陰性率)二.總體率的區(qū)間估計查表法:

當(dāng)n≤50,樣本率p接近于0或1時,該資料服從二項分布,用查表法估計總體率可信區(qū)間pu

×

Sp1.正態(tài)近似法:np和n(1-p)>5條件:n足夠大,樣本率p或1-p均不太小時,即例11-2

為了解某地乙肝表面抗原攜帶情況,某研究者在該地人群中隨機(jī)檢測了該地200人,乙肝表面抗原陽性7人,乙肝表面抗原攜帶率為3.5%,試計算標(biāo)準(zhǔn)誤并估計95%和99%可信區(qū)間.95%可信區(qū)間:3.5%

1.96

Sp

99%可信區(qū)間:3.5%

2.58

Spn=200X=7,P=3.5%例11-3

某醫(yī)生用A,B兩種藥物治療急性下呼吸道感染.A藥治療74例,有效68例;B藥治療63例,有效52例.問兩種藥物的有效率是否有差別?處理有效無效合計有效率(%)A藥6867491.89B藥52116382.54合計1201713787.59H0:

1=2H1:1≠2=0.05三.兩個率比較的u檢驗當(dāng)np和n(1-p)≧5

樣本率的分布近似正態(tài)分布—u檢驗(一)

檢驗步驟:

1.建立假設(shè),確定檢驗水準(zhǔn)αH0:

1=2H1:

1≠

2α=0.052.選擇檢驗方法,計算u值

3.確定P值,判斷結(jié)果(二)資料設(shè)計類型樣本率與總體率的比較計算公式:2.兩個樣本率的比較

計算公式:例11-3

某醫(yī)生用A,B兩種藥物治療急性下呼吸道感染.A藥治療74例,有效68例;B藥治療63例,有效52例.問兩種藥物的有效率是否有差別?處理有效無效合計有效率(%)A藥68(64.82)6(9.18)7491.89B藥52(55.18)11(7.82)6382.54合計1201713787.59H0:

1=2H1:1≠2=0.05第三節(jié)X2檢驗

(chi-squaretest)基本思想

檢驗實際頻數(shù)與理論頻數(shù)的吻合程度,實際頻數(shù)與理論頻數(shù)越相近,X2

值越小;反之,實際數(shù)與理論數(shù)相差越大,X2值越大.計算公式:理論頻數(shù)的計算:TRC=nRnC/n

df=(行數(shù)-1)(列數(shù)-1)例11-3

某醫(yī)生用A,B兩種藥物治療急性下呼吸道感染.A藥治療74例,有效68例;B藥治療63例,有效52例.問兩種藥物的有效率是否有差別?處理有效無效合計有效率(%)A藥68(64.82)6(9.18)7491.89B藥52(55.18)11(7.82)6382.54合計1201713787.59二.Χ2檢驗的基本步驟建立檢驗假設(shè),確定檢驗水準(zhǔn)

H0:

1=

2

H1:

1

2

=0.052.計算Χ2值

資料設(shè)計類型不同,計算公式不同3.確定P值,判斷結(jié)果

根據(jù)查Χ2界值表,確定P值三.四格表資料的Χ2檢驗

1.四格表資料的Χ2

檢驗的專用公式

df=(R-1)(C-1)=1四格表資料的Χ2

檢驗的校正

--

Yates連續(xù)校正校正公式:校正的目的:

英國統(tǒng)計學(xué)家(Yates)認(rèn)為

2分布是一種連續(xù)性分布,而四格表中的資料屬離散性分布,得到的2統(tǒng)計量的抽樣分布也是離散的.因此,為改善2統(tǒng)計量分布的連續(xù)性,建議進(jìn)行校正.

連續(xù)性校正應(yīng)遵循的條件:1.T5,且N40時,用非校正的公式2.1T<5,且N40時,用連續(xù)性校正公式3.T<1或N<40,用Fisher精確概率法例11-4

某醫(yī)生收集到兩種藥物治療白色葡萄球菌敗血癥療效的資料,結(jié)果見下表,問兩種藥物療效之間的差別有無統(tǒng)計學(xué)意義?處理有效無效合計甲藥28(26.09)2(3.91)30乙藥12(13.91)4(2.09)16合計40646例11-5用兩種不同的方法對53例肺癌患者進(jìn)行診斷,資料見下表.問兩種檢測結(jié)果有無差別?甲法

+-乙法合計+25(a)2(b)27-11(c)15(d)26合計3617533.配對設(shè)計資料的

2檢驗b+c>40:當(dāng)b+c<40時,用校正公式.(McNemar檢驗)例隨機(jī)選擇239例胃、十二指腸疾病患者和187名健康輸血員,其血型分布見下表,問胃、十二指腸疾病患者和健康輸血員血型分布有無差別?胃十二指腸疾病患者與健康輸血員的血型分布分組ABABO合計胃十二指腸疾病健康輸血員662010623952541962187合計9912039168426檢驗步驟:1.建立檢驗假設(shè),確定檢驗水準(zhǔn)2.計算

2值3.確定概率P值,判斷結(jié)果4.行×列表資料的

2檢驗

(R×C表資料)基本公式:A—每個格子的實際頻數(shù)nR–A所對應(yīng)的行合計nC–A所對應(yīng)的列合計例表甲、乙兩城市空氣質(zhì)量狀況比較組空氣質(zhì)量類別別優(yōu)良輕度污染中度污染重度污染合計甲193672875300乙1549428186300合計347161562511600檢驗步驟:1.建立檢驗假設(shè),確定檢驗水準(zhǔn)2.計算

2值3.確定概率P值,判斷結(jié)果行列表資料2檢驗應(yīng)注意事項

1.行列表資料2檢驗公式的應(yīng)用條件:

不能有1/5以上的格子的理論數(shù)<5,

或者,不能有1個格子的理論數(shù)<1

2.如果資料不能滿足上述條件,則可以通過

(1)在可能的情況下再增加樣本量;(2)專業(yè)上允許的情況下,合并相鄰的行或列;(3)刪去理論數(shù)太小的行和列

3.假設(shè)檢驗結(jié)果有差別,只能認(rèn)為總的率或構(gòu)成比有差別小結(jié)

分類變量資料的統(tǒng)計描述

指標(biāo):率、構(gòu)成比、相對比分類變量資料的統(tǒng)計推斷

總體參數(shù)估計:P±uα*Sp

率的假設(shè)檢驗:樣本率與總體率的比較--u檢驗兩個大樣本率的比較--u檢驗兩個小樣本率的比較--χ2檢驗

配對設(shè)計資料的兩個率比較--

χ2檢驗

多個樣本率的比較--R×C表的χ2檢驗

假設(shè)檢驗的基本步驟完全相同統(tǒng)計資料處理的基本思路

資料的整理:統(tǒng)計圖,統(tǒng)計表統(tǒng)計資料的描述(描述指標(biāo))統(tǒng)計學(xué)推斷總體參數(shù)的估計(可信區(qū)間)假設(shè)檢驗統(tǒng)計資料類型的判斷例1.

某研究者欲比較甲乙兩藥治療高血壓的效果,進(jìn)行了隨機(jī)對照試驗.甲乙藥組各選擇了50名病人,甲藥組血壓平均下降了2.67mmHg,標(biāo)準(zhǔn)差是0.27mmHg,乙藥組平均下降了3.20mmHg,標(biāo)準(zhǔn)差是0.33mmHg.問兩藥降壓效果是否不同?例2.

為調(diào)查2型糖尿病發(fā)病易感因素,某研究者進(jìn)行了一項以醫(yī)院為基礎(chǔ)的病例對照研究.結(jié)果發(fā)現(xiàn),在200名糖尿病病例中,100人有糖尿病遺傳家族史;而200名對照者中只有50人有糖尿病家族史.問糖尿病家族史是否在兩組中分布不同?例3.

為比較A,B,C,D四種藥物治療小細(xì)胞肺癌的效果,將160人隨機(jī)分配進(jìn)入四個治療組.每組40人.治療結(jié)果見下表,試比較四種藥物治療效果有無差別?處理組有效無效合計A藥152540B藥103040C藥132740D藥83240合計46114160例4.

為研究鉛作業(yè)與工人尿鉛含量的關(guān)系,隨機(jī)抽查了3種作業(yè)工人的尿鉛結(jié)果,見下表.問3種作業(yè)工人的尿鉛含量是否不同?鉛作業(yè)組調(diào)離鉛作業(yè)組非鉛作業(yè)組0.010.110.090

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論