分類變量的統(tǒng)計推斷_第1頁
分類變量的統(tǒng)計推斷_第2頁
分類變量的統(tǒng)計推斷_第3頁
分類變量的統(tǒng)計推斷_第4頁
分類變量的統(tǒng)計推斷_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

分類變量的統(tǒng)計推斷第一頁,共五十八頁,編輯于2023年,星期日教學要求掌握率的抽樣誤差計算公式掌握四格表χ2檢驗第二頁,共五十八頁,編輯于2023年,星期日3第一節(jié)

率的抽樣誤差一、二項分布的概念例:假設注射某種免疫疫苗會有10%的人出現不適反應。問3人接種后各種可能后果的概率是多少?第三頁,共五十八頁,編輯于2023年,星期日4第四頁,共五十八頁,編輯于2023年,星期日5貝努利試驗:n次獨立、重復試驗(每次試驗只出現A和之一,每次概率都是和)。貝努利試驗中,事件A可能發(fā)生0,1,2,…,n次,A恰好發(fā)生k次的概率為第五頁,共五十八頁,編輯于2023年,星期日6若隨機變量X只能在中取值,各種可能值的概率滿足前式,我們就說X服從參數為n和π的二項分布,記為第六頁,共五十八頁,編輯于2023年,星期日7已知:①π=0.5,n=10;②π=0.3,n=5;③π=0.3,n=10;④π=0.3,n=15。根據上式,求各陽性數事件的概率并作概率分布圖。第七頁,共五十八頁,編輯于2023年,星期日8率的抽樣分布特征:1.為離散型分布;2.當π=1-π時,呈對稱分布;3.當n增大時,逐漸逼近正態(tài)分布。一般認為,當nπ和n(1-π)≥5時,可近似看作正態(tài)分布。第八頁,共五十八頁,編輯于2023年,星期日9二、率的抽樣誤差和標準誤由于抽樣所引起的樣本率和總體率或各樣本率之間存在著差異,這種差異稱為率的抽樣誤差。用率的標準誤表示。第九頁,共五十八頁,編輯于2023年,星期日10例:為了解某地人群結核菌素試驗陽性率情況,某醫(yī)療機構在該地人群中隨機檢測了1773人,結核菌素試驗陽性有682人,試計算其標準誤。第十頁,共五十八頁,編輯于2023年,星期日11第二節(jié)總體率的估計總體率的估計:點估計區(qū)間估計正態(tài)近似法第十一頁,共五十八頁,編輯于2023年,星期日12當樣本含量n足夠大,樣本率p或1-p均不太小時(如np和n(1-p)均大于5),樣本率的分布近似正態(tài)分布。第十二頁,共五十八頁,編輯于2023年,星期日1395%的置信區(qū)間:

38.47%1.961.16%=36.20%~40.74%99%的置信區(qū)間:

38.47%2.581.16%=35.48%~41.46%上例中該地人群中結核菌素試驗陽性率95%和99%的置信區(qū)間為:第十三頁,共五十八頁,編輯于2023年,星期日14第三節(jié)率的U檢驗

當樣本含量n足夠大,樣本率p或1-p均不太小時,如np和n(1-p)均大于5,樣本率的分布近似正態(tài)分布。樣本率和總體率之間、兩個樣本率之間的比較可用Z檢驗。第十四頁,共五十八頁,編輯于2023年,星期日15一、樣本率與總體率的比較

第十五頁,共五十八頁,編輯于2023年,星期日16例:一般情況下,直腸癌圍術期并發(fā)癥發(fā)生率為30%,現某醫(yī)院手術治療了385例直腸癌患者,圍術期出現并發(fā)癥有100例,并發(fā)癥發(fā)生率為26%,問該院直腸癌患者圍術期并發(fā)癥發(fā)生率與一般情況比較有無統(tǒng)計學差異。分析:本例,n=385,屬于大樣本,同時樣本率為26%,np和n(1-p)均大于5,可采用Z檢驗。第十六頁,共五十八頁,編輯于2023年,星期日17建立檢驗假設

H0:=0,H1:0,=0.052.計算Z值3.確定P值,判斷結果本題Z=1.713<1.96,P>0.05,按=0.05的水準不拒絕H0,差異沒有統(tǒng)計學意義,故尚不能認為該院直腸癌患者圍術期并發(fā)癥發(fā)生率與一般情況不同。第十七頁,共五十八頁,編輯于2023年,星期日18二、兩個樣本率的比較第十八頁,共五十八頁,編輯于2023年,星期日19例:為了解某地小學生蛔蟲感染率的城鄉(xiāng)差異,抽樣調查了該地小學生22792人,其中城鎮(zhèn)小學生8207人,糞檢蛔蟲卵陽性數為701人,蛔蟲感染率為8.54%,鄉(xiāng)村小學生14585人,糞檢蛔蟲卵陽性數為2167人,蛔蟲感染率為14.86%,試比較該地小學生蛔蟲感染率城鄉(xiāng)差異有無統(tǒng)計學意義。第十九頁,共五十八頁,編輯于2023年,星期日20本題=13.739>2.58,P<0.01,按=0.05的水準拒絕H0,接受H1,差異有統(tǒng)計學意義,認為該地鄉(xiāng)村小學生蛔蟲感染率高于城鎮(zhèn)。

3.確定P值,判斷結果建立檢驗假設

H0:1=2,H1:12,=0.052.計算Z值第二十頁,共五十八頁,編輯于2023年,星期日不同自由度的分布曲線圖自由度一定時,P值越小,χ2界值越大P值一定時,自由度越大,χ2界值越大當自由度為1時,χ2=u2第二十一頁,共五十八頁,編輯于2023年,星期日例:某醫(yī)院欲比較異梨醇口服液(試驗組)和氫氯噻嗪+地塞米松(對照組)降低顱內壓的療效。問兩組降低顱內壓的總體有效率有無差別?第二節(jié)卡方檢驗一、四格表資料卡方檢驗第二十二頁,共五十八頁,編輯于2023年,星期日200例顱內壓增高癥患者隨機分為兩組1試驗組有效2試驗組無效3對照組無效……200試驗組有效第二十三頁,共五十八頁,編輯于2023年,星期日組別有效無效試驗組

對照組

兩組降低顱內壓療效的比較兩種可能性:兩組總體有效率確實不同兩組總體有效率相同,兩組樣本率的差異僅僅是由于抽樣誤差造成。9957521合計10496有效率(%)95.2078.13第二十四頁,共五十八頁,編輯于2023年,星期日

1、建立檢驗假設,確定檢驗水準,兩組降低顱內壓總體有效率相等,兩組降低顱內壓總體有效率不等第二十五頁,共五十八頁,編輯于2023年,星期日(83.52)(理論頻數T12?)(90.48)實際頻數A(13.52)(理論頻數T22?)(理論頻數T21?)(理論頻數T11?)組別有效無效合計有效率(%)試驗組995

10495.20對照組7521

9678.13合計

表7-1兩組降低顱內壓有效率的比較17487.0020026(12.48)理論頻數

是在

成立的前提下計算的第二十六頁,共五十八頁,編輯于2023年,星期日A:實際頻數(Actualfrequency)

T:理論頻數(Theoreticalfrequency)英國統(tǒng)計學家KarlPearson首次提出,故被稱為Pearson

。第二十七頁,共五十八頁,編輯于2023年,星期日2、求檢驗統(tǒng)計量和自由度99(90.48)5(13.52)75(83.52)21(12.48)第二十八頁,共五十八頁,編輯于2023年,星期日3、查表,求

值,下結論。

以查附表8界值表得。按檢驗水準拒絕,接受,認為兩組總體有效率不等。P第二十九頁,共五十八頁,編輯于2023年,星期日A與T相差不大A與T相差太大第三十頁,共五十八頁,編輯于2023年,星期日第三十一頁,共五十八頁,編輯于2023年,星期日第三十二頁,共五十八頁,編輯于2023年,星期日

基本公式或專用公式;校正公式;Fisher確切概率法。四格表資料檢驗公式選擇第三十三頁,共五十八頁,編輯于2023年,星期日校正公式(Yates校正)第三十四頁,共五十八頁,編輯于2023年,星期日兩種藥物治療腦血管疾病有效率的比較

(4.67)組別有效無效

合計有效率(%)胞磷膽堿組4665288.46神經節(jié)苷酯組1882669.23合計64147882.05第三十五頁,共五十八頁,編輯于2023年,星期日

(兩種藥物治療腦血管疾病的有效率相等)(兩種藥物治療腦血管疾病的有效率不等)

第三十六頁,共五十八頁,編輯于2023年,星期日二、配對四格表資料的檢驗(McNemar檢驗)配對設計是指將實驗單位按一定條件配成對子,再將每對中的兩個實驗單位隨機分配到兩個處理組。②同一個體同時分別接受兩種不同處理①配成對子的兩個個體分別給予兩種不同的處理第三十七頁,共五十八頁,編輯于2023年,星期日例:某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進行測定。目的是推斷兩種方法的檢測結果有無差別。第三十八頁,共五十八頁,編輯于2023年,星期日成組設計1乳膠凝集法+2免疫熒光法-58乳膠凝集法+……組別+-乳膠凝集法免疫熒光法第三十九頁,共五十八頁,編輯于2023年,星期日配對設計第1人乳膠凝集法+第2人免疫熒光法-第3人+……+--第58人-+第四十頁,共五十八頁,編輯于2023年,星期日免疫熒光法乳膠凝集法合計+-+-合計11(a)1223233(d)3513(c)(b)(b)(c)4558兩種方法的檢測結果

B=C?第四十一頁,共五十八頁,編輯于2023年,星期日在檢驗假設H0為總體對子數B=C的條件下:(+,-)和(-,+)兩個格子的理論頻數為第四十二頁,共五十八頁,編輯于2023年,星期日第四十三頁,共五十八頁,編輯于2023年,星期日本例

(b+c)=14<40,應采用校正公式P<0.05,拒絕H0,接受H1,可以認為兩種方法的檢測結果不同,免疫熒光法的陽性檢測率較高。H0:B=C,即兩種方法的總體檢測結果相同H1:B≠C,即兩種方法的總體檢測結果不同假設檢驗第四十四頁,共五十八頁,編輯于2023年,星期日第五節(jié)R×C列聯表的χ2檢驗第四十五頁,共五十八頁,編輯于2023年,星期日46行×列表資料①

多個樣本率比較時,有R行2列,稱為R×2表;②

兩個樣本的構成比比較時,有2行C列,稱2×C表;③

多個樣本的構成比比較,以及雙向無序分類資料關聯性檢驗時,有行列,稱為R×C表。第四十六頁,共五十八頁,編輯于2023年,星期日甲、乙、丙三家醫(yī)院住院病人院內感染率比較第四十七頁,共五十八頁,編輯于2023年,星期日第四十八頁,共五十八頁,編輯于2023年,星期日49檢驗統(tǒng)計量

=(R-1)(C-1)第四十九頁,共五十八頁,編輯于2023年,星期日甲、乙、丙三家醫(yī)院住院病人院內感染率比較第五十頁,共五十八頁,編輯于2023年,星期日51H0

:三家醫(yī)院院內感染率相同H1

:三家醫(yī)院院內感染率不同或不全相同=0.05=(3-1)(2-1)=2,查2值表,20.01(2)=9.21,

2>20.01(2),

P<0.01,按=0.05的檢驗水準,拒絕H0,接受H1,故可認為甲、乙、丙三家醫(yī)院院內感染率總體有差別。第五十一頁,共五十八頁,編輯于2023年,星期日一般要求:增大樣本含量刪去理論頻數太小的行或列將理論頻數太小的行或列與性質相近的鄰行或鄰列合并改用Fisher確切概率法處理方法:1、行×列表中各格理論頻數不宜過小且1≤T<5的格子數不宜超過1/5格子總數

各格T≥1第五十二頁,共五十八頁,編輯于2023年,星期日5215214935493549355212、對于有序的表資料不宜用檢驗組別痊愈顯效無效試驗組50對照組40兩組降低顱內壓療效的比較

單向有序(指標有序)第五十三頁,共五十八頁,編輯于2023年,星期日不同年齡組某藥降壓效果

年齡組合計有效無效20~22426

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論