方積乾統(tǒng)計(jì)基礎(chǔ)_第1頁(yè)
方積乾統(tǒng)計(jì)基礎(chǔ)_第2頁(yè)
方積乾統(tǒng)計(jì)基礎(chǔ)_第3頁(yè)
方積乾統(tǒng)計(jì)基礎(chǔ)_第4頁(yè)
方積乾統(tǒng)計(jì)基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

方積乾統(tǒng)計(jì)基礎(chǔ)第一頁(yè),共一百頁(yè),編輯于2023年,星期日衛(wèi)生統(tǒng)計(jì)學(xué)第一章緒論第二頁(yè),共一百頁(yè),編輯于2023年,星期日什么是統(tǒng)計(jì)學(xué)(statistics)?“Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata”(Webster'sInternationalDictionary)。“Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults”(JohnM.Last,ADictionaryofEpidemiology)第三頁(yè),共一百頁(yè),編輯于2023年,星期日什么是統(tǒng)計(jì)學(xué)(statistics)??jī)?nèi)容:收集、分析、解釋和表達(dá)數(shù)據(jù)統(tǒng)計(jì)學(xué):處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)目的:求得可靠的結(jié)果統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)地位:合作、審稿、基金申請(qǐng)(NIH)、藥物開(kāi)發(fā)與申報(bào)(FDA)、衛(wèi)生決策第四頁(yè),共一百頁(yè),編輯于2023年,星期日

統(tǒng)計(jì)學(xué)的若干概念1.總體與樣本總體(population):大同小異的對(duì)象全體。目標(biāo)總體(targetpopulation):試圖下結(jié)論的某個(gè)總體.例如,英國(guó)成年男子為目標(biāo)總體研究總體(studypopulation):資料來(lái)源的較小的總體.例如,1951年英國(guó)全部注冊(cè)醫(yī)生需要謹(jǐn)慎:就研究總體所下的結(jié)論未必適用于目標(biāo)總體。第五頁(yè),共一百頁(yè),編輯于2023年,星期日抽樣(sampling):從研究總體抽取部分個(gè)體樣本(sample):抽取的部分個(gè)體數(shù)據(jù)(data):觀察所得資料推斷(inference):分析樣本數(shù)據(jù),獲得關(guān)于總體的知識(shí)數(shù)據(jù)信息信息知識(shí)統(tǒng)計(jì)推斷的工具:有關(guān)概率的理論。

推斷的結(jié)論從來(lái)不是完全肯定或完全否定的。

關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷的方法

第六頁(yè),共一百頁(yè),編輯于2023年,星期日2.同質(zhì)與變異同質(zhì)性(homogeneity)共性,大同小異

變異(variation)個(gè)體間差異,多樣性

沒(méi)有同質(zhì)性就構(gòu)不成一個(gè)總體;

總體內(nèi)沒(méi)有變異性就無(wú)需統(tǒng)計(jì)學(xué)。

統(tǒng)計(jì)學(xué)的任務(wù):

在變異的背景上

描述同一總體的同質(zhì)性,

揭示不同總體的異質(zhì)性(heterogeneity)。

第七頁(yè),共一百頁(yè),編輯于2023年,星期日3.變量的類型變量(variable):個(gè)體特性的數(shù)量描述(1)定性變量

(i)分類變量(categoricalvariable)或名義變量(nominativevariable)。分類變量的水平(level)代碼(code)用1、2、3、4、5等來(lái)表示各個(gè)水平。二分類變量(binaryvariable),也稱0-1變量或假變量(dummyvariable)(ii)有序變量(ordinalvariable)

種種可能的“取值”中自然地存在著次序。

第八頁(yè),共一百頁(yè),編輯于2023年,星期日(2)定量變量

(i)離散型變量只能取整數(shù)值。例如,手術(shù)病人數(shù);新生兒數(shù)

(ii)連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值。由測(cè)量而得到的大多屬于連續(xù)型變量例如,血壓、身高、體重等“連續(xù)”:指該變量可以在實(shí)數(shù)軸上連續(xù)變動(dòng)。變通:紅細(xì)胞記數(shù)也視為連續(xù)型變量。(一個(gè)、兩個(gè)、三個(gè)之間的差別并不重要)第九頁(yè),共一百頁(yè),編輯于2023年,星期日變量類型的轉(zhuǎn)化:只能由高級(jí)向低級(jí)轉(zhuǎn)化,

不能作相反方向的轉(zhuǎn)化

連續(xù)型→有序→分類→二值離散型變量常常通過(guò)適當(dāng)?shù)淖儞Q或連續(xù)性校正后借用連續(xù)型變量或有序變量的方法來(lái)分析。第十頁(yè),共一百頁(yè),編輯于2023年,星期日4.因果與聯(lián)系公共衛(wèi)生領(lǐng)域常常要探究危險(xiǎn)因素與疾病之間的因果關(guān)系(causation)。首先應(yīng)當(dāng)問(wèn)存在不存在聯(lián)系(association)然而,存在聯(lián)系未必有因果關(guān)系在解釋統(tǒng)計(jì)分析的結(jié)果以及下結(jié)論時(shí),

務(wù)必對(duì)“因果”二字慎之又慎。第十一頁(yè),共一百頁(yè),編輯于2023年,星期日第二章定量資料的統(tǒng)計(jì)描述

第十二頁(yè),共一百頁(yè),編輯于2023年,星期日

把握資料的基本特征為統(tǒng)計(jì)分析打下基礎(chǔ)統(tǒng)計(jì)表描述性統(tǒng)計(jì)量統(tǒng)計(jì)圖統(tǒng)計(jì)描述

----從資料中獲取信息最基本的方法第十三頁(yè),共一百頁(yè),編輯于2023年,星期日第一節(jié)頻數(shù)與頻數(shù)分布

頻數(shù)分布表(frequencydistributiontable),又稱頻數(shù)表

一、

離散型定量變量的頻數(shù)分布例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7第十四頁(yè),共一百頁(yè),編輯于2023年,星期日第十五頁(yè),共一百頁(yè),編輯于2023年,星期日直條圖(barchart)橫坐標(biāo):產(chǎn)前檢查次數(shù);縱坐標(biāo):頻率,檢查k次的婦女所占的比例(%)等寬矩形長(zhǎng)條:高度相當(dāng)于檢查次數(shù)的頻率第十六頁(yè),共一百頁(yè),編輯于2023年,星期日二、連續(xù)型定量變量的頻數(shù)分布

例2-2抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),數(shù)據(jù)如下:第十七頁(yè),共一百頁(yè),編輯于2023年,星期日第十八頁(yè),共一百頁(yè),編輯于2023年,星期日直方圖(頻率直方圖)橫軸:血清鐵含量縱軸:頻率密度

=頻率/組距面積=頻率注:組距相等時(shí),矩形直條的高度與相應(yīng)組段的頻率成正比。

第十九頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D2-2120例健康成年男子血清鐵含量分布

單峰、對(duì)稱-----對(duì)稱分布第二十頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D2-3某地居民238人發(fā)汞含量(μmol/kg)分布單峰,不對(duì)稱-----偏峰分布正偏峰分布:峰偏向左側(cè)負(fù)偏峰分布:峰偏向右側(cè)第二十一頁(yè),共一百頁(yè),編輯于2023年,星期日第二節(jié)定量變量的特征數(shù)

定量地描述集中趨勢(shì)與離中趨勢(shì)是統(tǒng)計(jì)描述的重要內(nèi)容一、

描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)

對(duì)于連續(xù)型定量變量,描述集中趨勢(shì)常用的統(tǒng)計(jì)量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。第二十二頁(yè),共一百頁(yè),編輯于2023年,星期日1.算術(shù)均數(shù)簡(jiǎn)稱均數(shù)(mean,),適合描述對(duì)稱分布資料的集中位置(也稱為平均水平)。其計(jì)算公式為

n:樣本含量

X1,X2,…,Xn:觀察值或:觀察值之和例2-3測(cè)得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。按式(2-1),算術(shù)均數(shù)為

第二十三頁(yè),共一百頁(yè),編輯于2023年,星期日2.幾何均數(shù)(geometricmean,G)

適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料

頻數(shù)圖一般呈正偏峰分布

例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。試計(jì)算其幾何均數(shù)。第二十四頁(yè),共一百頁(yè),編輯于2023年,星期日3.中位數(shù)(median,M)可用于各種分布的定量資料總體中有一半個(gè)體的數(shù)值低于這個(gè)數(shù),一半個(gè)體的數(shù)值高于這個(gè)數(shù)。

基于樣本資料將n例數(shù)據(jù)按升序排列,第i個(gè)數(shù)據(jù)記為

n為奇數(shù)時(shí)

n為偶數(shù)時(shí)

例2-7某藥廠觀察9只小鼠口服高山紅景天醇提取物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。第二十五頁(yè),共一百頁(yè),編輯于2023年,星期日百分位數(shù)(percentile)總體中,數(shù)值小于它的個(gè)體恰有X%,大于它的個(gè)體恰有1-X%樣本估計(jì):按照升序排列的數(shù)列里,其左側(cè)(即小于它)的個(gè)體數(shù)在整個(gè)樣本中所占百分比為X%。第二十六頁(yè),共一百頁(yè),編輯于2023年,星期日4.眾數(shù)(mode)總體中出現(xiàn)機(jī)會(huì)最高的數(shù)值。樣本估計(jì):在樣本中出現(xiàn)次數(shù)最多的數(shù)值。例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7

眾數(shù)為4(次)第二十七頁(yè),共一百頁(yè),編輯于2023年,星期日二、描述離散趨勢(shì)的特征數(shù)同一總體中不同個(gè)體之間的離散趨勢(shì)又稱為變異(variation)。

例2-11試觀察三組數(shù)據(jù)的離散狀況。(均數(shù)都是30)

A組:26,28,30,32,34

B組:24,27,30,33,36

C組:26,29,30,31,34第二十八頁(yè),共一百頁(yè),編輯于2023年,星期日1.極差(range,R)R=最大值-最小值計(jì)算簡(jiǎn)便,但僅利用了兩個(gè)數(shù)據(jù)的信息一般,樣本量n越大R也往往會(huì)越大,不夠穩(wěn)定

例2-12計(jì)算上述三組數(shù)據(jù)的極差A(yù)組R=34-26=8B組R=36-24=12C組R=34-26=8第二十九頁(yè),共一百頁(yè),編輯于2023年,星期日2.四分位數(shù)間距(quartilerange,Q)

Q=P75-P25

P25與P75之間恰好包含50%的個(gè)體四分位數(shù)間距Q是總體中數(shù)值居中的50%個(gè)體散布的范圍Q越大意味著數(shù)據(jù)間變異越大第三十頁(yè),共一百頁(yè),編輯于2023年,星期日3.方差(variance)

又稱均方差(meansquaredeviation)μ:總體均數(shù)

N:總體中個(gè)體的總數(shù)

分母:離均差平方和方差越大意味著數(shù)據(jù)間變異越大樣本方差:

n-1稱為自由度(degreesoffreedom):總體方差:第三十一頁(yè),共一百頁(yè),編輯于2023年,星期日4.標(biāo)準(zhǔn)差(standarddeviation,S)

標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差的量綱與原變量一致。標(biāo)準(zhǔn)差越大意味著個(gè)體間變異越大。標(biāo)準(zhǔn)差適合用來(lái)表達(dá)對(duì)稱分布的離散趨勢(shì)。第三十二頁(yè),共一百頁(yè),編輯于2023年,星期日例2-14分別計(jì)算例2-11中三組數(shù)據(jù)的標(biāo)準(zhǔn)差。按照公式(2-11)與標(biāo)準(zhǔn)差的定義

A組

B組

C組C組數(shù)據(jù)的離散趨勢(shì)最小,B組的最大第三十三頁(yè),共一百頁(yè),編輯于2023年,星期日5.變異系數(shù)(coefficientofvariation,CV)

例2-161985年通過(guò)十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為0.98kg;身高均數(shù)為72.4cm,標(biāo)準(zhǔn)差為3.0cm。體重的變異大還是身高的變異大?體重的變異系數(shù)身高的變異系數(shù)

用于量綱不同的變量間變異程度的比較或均數(shù)差別較大的變量間變異程度的比較第三十四頁(yè),共一百頁(yè),編輯于2023年,星期日小結(jié)1.頻數(shù)表、頻率分布圖:描述資料的分布特征(集中趨勢(shì)與離散趨勢(shì))分布類型(對(duì)稱或偏峰)2.描述性統(tǒng)計(jì)量:定量地刻畫(huà)統(tǒng)計(jì)分布的特征。(1)集中趨勢(shì):算術(shù)均數(shù)、幾何均數(shù)、中位數(shù);(2)離散趨勢(shì):極差、四分位數(shù)間距、方差(標(biāo)準(zhǔn)差)和變異系數(shù);3.百分位數(shù)是一種位置參數(shù)描述集中趨勢(shì):P50;描述離散趨勢(shì)P75-P25第三十五頁(yè),共一百頁(yè),編輯于2023年,星期日第三章定性資料的統(tǒng)計(jì)描述第三十六頁(yè),共一百頁(yè),編輯于2023年,星期日常用的相對(duì)數(shù)指標(biāo)除了用頻率分布全面反映一個(gè)定性變量外,有時(shí),也可用其它相對(duì)數(shù)指標(biāo)從某個(gè)側(cè)面來(lái)描述定性變量。相對(duì)數(shù)指標(biāo)大致有三種類型:

頻率(Frequency)有的書(shū)稱比率(Proportion)

強(qiáng)度(intensity)有的書(shū)稱速率(rate)

相對(duì)比(ratio)第三十七頁(yè),共一百頁(yè),編輯于2023年,星期日(一)頻率型指標(biāo)頻率型指標(biāo):最常見(jiàn),近似地反映某一事件出現(xiàn)的機(jī)會(huì)大小,如患病概率、病`死概率等。

K是比例基數(shù),取100%、1000‰、1萬(wàn)/1萬(wàn)和10萬(wàn)/10萬(wàn)特點(diǎn):分子是分母的一部分;無(wú)量綱,在0~1范圍內(nèi)取值

第三十八頁(yè),共一百頁(yè),編輯于2023年,星期日(二)強(qiáng)度型指標(biāo)“強(qiáng)度”是流行病學(xué)、統(tǒng)計(jì)學(xué)術(shù)語(yǔ)

----單位時(shí)段內(nèi)某現(xiàn)象發(fā)生的頻率。如第三十九頁(yè),共一百頁(yè),編輯于2023年,星期日例3-3在某醫(yī)院的院內(nèi)感染調(diào)查中,5031個(gè)病人共觀察了127859人日(相當(dāng)于127859人觀察1日),其中有596人在醫(yī)院發(fā)生感染。

觀察人年數(shù)=10日×120人+9日×240人+8日×380人+…+3日×890人+2日×920人+1日×1200人=127859人日

平均每天有0.47%的病人將在醫(yī)院發(fā)生感染。

第四十頁(yè),共一百頁(yè),編輯于2023年,星期日一般地,其中比例基數(shù)K同上。

分母含有“時(shí)間”,并不是一般的速率,而是單位時(shí)間內(nèi)的頻率。

統(tǒng)計(jì)學(xué)和流行病學(xué)本質(zhì):頻率強(qiáng)度或概率強(qiáng)度的近似值。第四十一頁(yè),共一百頁(yè),編輯于2023年,星期日(三)相對(duì)比型指標(biāo)任何兩個(gè)相關(guān)聯(lián)的變量A與B之比

相對(duì)于B的一個(gè)(或十個(gè)、百個(gè)、千個(gè)等)單位,A有多少個(gè)單位A和B可以是絕對(duì)數(shù),也可是相對(duì)數(shù)A和B的量綱可以不同,也可相同,但A和B互不包含第四十二頁(yè),共一百頁(yè),編輯于2023年,星期日(四)應(yīng)用相對(duì)數(shù)應(yīng)注意的事項(xiàng)1.防止概念混淆

不少指標(biāo)命名混亂:“某某率”滿天飛!

某些指標(biāo),實(shí)質(zhì)上只是相對(duì)比,其名稱卻是某某率;更多指標(biāo)以某某率的模式命名,籠統(tǒng)地稱它們?yōu)椤奥省?/p>

----分不清究竟是頻率還是強(qiáng)度第四十三頁(yè),共一百頁(yè),編輯于2023年,星期日人口構(gòu)成及其統(tǒng)計(jì)指標(biāo)第四十四頁(yè),共一百頁(yè),編輯于2023年,星期日發(fā)病率(incidencerate,IR):“時(shí)期”通常用年或月。發(fā)病率的分母泛指一般的觀察人年數(shù),可由平均人口數(shù)×1年來(lái)近似。新發(fā)病例數(shù):新發(fā)生某種疾病,以第一次就診為準(zhǔn)。用于探討疾病的危險(xiǎn)因素,評(píng)價(jià)疾病防治效果。

第四十五頁(yè),共一百頁(yè),編輯于2023年,星期日2.計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠數(shù)量

例甲醫(yī)院治療某類患者100人,40人有效;乙醫(yī)院治療同類患者5人,2人有效有效頻率均為40%!?如果資料的總例數(shù)過(guò)少,計(jì)算得到的相對(duì)數(shù)偏差可能會(huì)很大,直接報(bào)告原始數(shù)據(jù)更為可取:甲醫(yī)院有效率40%

乙醫(yī)院有效2/5第四十六頁(yè),共一百頁(yè),編輯于2023年,星期日3.正確地合并估計(jì)例甲醫(yī)院治療某類患者100人,40人有效;乙醫(yī)院治療同類患者90人,30人有效如果兩醫(yī)院總體有效率的確相等,合并估計(jì):不可將兩個(gè)頻率相加除以2:第四十七頁(yè),共一百頁(yè),編輯于2023年,星期日4.相對(duì)數(shù)間的比較要具備可比性

注意以下幾個(gè)方面:觀察對(duì)象同質(zhì)?研究方法相同?觀察時(shí)間一致?

第四十八頁(yè),共一百頁(yè),編輯于2023年,星期日粗死亡率的定義式近似地寫(xiě)成以上說(shuō)明同樣適用于年齡組死亡率、粗出生率和粗發(fā)病率等,不再贅述。比較不同時(shí)期或不同地區(qū)的粗死亡率,如人口的年齡及性別分布不一致,應(yīng)按性別、年齡標(biāo)準(zhǔn)化后作比較(見(jiàn)第14章)。第四十九頁(yè),共一百頁(yè),編輯于2023年,星期日第四節(jié)動(dòng)態(tài)數(shù)列及其分析指標(biāo)表3-10某大學(xué)1992-2002年本科專業(yè)招生動(dòng)態(tài)變化

第五十頁(yè),共一百頁(yè),編輯于2023年,星期日

一、

絕對(duì)增長(zhǎng)量二、發(fā)展速度與增長(zhǎng)速度三、平均發(fā)展速度和平均增長(zhǎng)速度平均發(fā)展速度=環(huán)比的幾何均數(shù)=

平均增長(zhǎng)速度=平均發(fā)展速度

1

第五十一頁(yè),共一百頁(yè),編輯于2023年,星期日預(yù)測(cè)2004年

前提:平均發(fā)展速度保持不變a12滿足

a12=1.04124200=6724人根據(jù)該大學(xué)1992-2002年的平均發(fā)展速度,如果今后保持這個(gè)速度,預(yù)計(jì)到2004年末學(xué)生人數(shù)可達(dá)6724人。預(yù)測(cè)2040年?第五十二頁(yè),共一百頁(yè),編輯于2023年,星期日小結(jié)1.描述定性資料的相對(duì)數(shù)大致有三種類型:頻率型、強(qiáng)度型和相對(duì)比型

2.實(shí)踐中許多指標(biāo)都稱為XX率,要注意每個(gè)指標(biāo)的定義和性質(zhì),不可簡(jiǎn)單地望文生義。3.動(dòng)態(tài)數(shù)列指標(biāo)如發(fā)展速度和增長(zhǎng)速度可描述事物在不同時(shí)期的發(fā)展水平和趨勢(shì)。要注意:預(yù)測(cè)的前提條件是“平均發(fā)展速度保持不變”。

第五十三頁(yè),共一百頁(yè),編輯于2023年,星期日第四章常用概率分布第五十四頁(yè),共一百頁(yè),編輯于2023年,星期日第一節(jié)二項(xiàng)分布一、二項(xiàng)分布的概念與特征第五十五頁(yè),共一百頁(yè),編輯于2023年,星期日摸球模型

一個(gè)袋子里有5個(gè)乒乓球,其中2個(gè)黃球,3個(gè)白球,我們進(jìn)行摸球游戲,每次摸1球,然后放回再摸。先后摸100次,請(qǐng)問(wèn)100次都摸到白球的概率有多大?(1)每次摸到白球的概率=0.6(2)第1次摸到白球的概率=0.6

第2次摸到白球的概率=0.6

……

第100次摸到白球的概率=0.6(3)100次都摸到白球的概率=(0.6)(0.6)…(0.6)=(0.6)100第一節(jié)二項(xiàng)分布第五十六頁(yè),共一百頁(yè),編輯于2023年,星期日摸球模型先后100次,摸到3次黃球的概率有多大?(1)每次摸到黃球的概率=0.4(2)黃黃黃白白白白白白…白概率=(0.4)3(0.6)97

黃白黃黃白白白白白…白概率=(0.4)3(0.6)97

黃白黃白黃白白白白…白概率=(0.4)3(0.6)97

……(3)100次摸到3次黃球的概率

=(0.4)3(0.6)97+(0.4)3(0.6)97+…

=(0.4)3(0.6)97

先后100次,摸到x次黃球的概率

=第五十七頁(yè),共一百頁(yè),編輯于2023年,星期日先后n次,摸到x

次二分類:每次摸球只有二種可能的結(jié)果,或黃球或白球;獨(dú)立:各次摸球是彼此獨(dú)立的;重復(fù):每次摸到黃球或白球的概率是和1-

先后n次,摸到x

次黃球的概率=第五十八頁(yè),共一百頁(yè),編輯于2023年,星期日一般地,若隨機(jī)變量取值x的概率為其中,則稱此隨機(jī)變量服從二項(xiàng)分布。稱為二項(xiàng)分布的概率函數(shù)。

二分類、獨(dú)立、重復(fù)試驗(yàn),若每次出現(xiàn)某事物的概率為,則

n

次中有X

次出現(xiàn)該事物的概率服從二項(xiàng)分布。二項(xiàng)分布第五十九頁(yè),共一百頁(yè),編輯于2023年,星期日例4-2臨床上用針灸治療某型頭痛,有效的概率為60%,現(xiàn)以該法治療3例,其中2例有效的概率是多大?

第六十頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D4-1π=0.5時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布圖4-2π=0.3時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布

第六十一頁(yè),共一百頁(yè),編輯于2023年,星期日二項(xiàng)分布的特征1.二項(xiàng)分布的圖形特征:取決于與n

均數(shù)在=n處接近0.5時(shí),圖形是對(duì)稱的;

離0.5愈遠(yuǎn),對(duì)稱性愈差隨著n的增大,分布趨于對(duì)稱

n→∞時(shí),只要不太靠近0或1,二項(xiàng)分布近似于正態(tài)分布(n和n(1-)都大于5時(shí))第六十二頁(yè),共一百頁(yè),編輯于2023年,星期日2.二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差B(n,π)

出現(xiàn)陽(yáng)性結(jié)果的次數(shù)X

總體均數(shù)總體方差總體標(biāo)準(zhǔn)差出現(xiàn)陽(yáng)性結(jié)果的頻率總體均數(shù)

總體標(biāo)準(zhǔn)差第六十三頁(yè),共一百頁(yè),編輯于2023年,星期日(一)概率估計(jì)例4-5如果某地鉤蟲(chóng)感染率為13%,隨機(jī)觀察當(dāng)?shù)?50人,其中有10人感染鉤蟲(chóng)的概率有多大?分析:二分類

(感染、不感染)

獨(dú)立

(假定互不影響)

重復(fù)(n=150人),每人鉤蟲(chóng)感染率均為

(π=13%)

感染鉤蟲(chóng)的人數(shù)X服從二項(xiàng)分布B(150,0.13)

二、二項(xiàng)分布的應(yīng)用第六十四頁(yè),共一百頁(yè),編輯于2023年,星期日(二)單側(cè)累積概率計(jì)算經(jīng)常需要計(jì)算的是二項(xiàng)分布的累積概率第六十五頁(yè),共一百頁(yè),編輯于2023年,星期日

例4-6某地鉤蟲(chóng)感染率為13%,隨機(jī)抽查當(dāng)?shù)?50人,

其中至多有2名感染鉤蟲(chóng)的概率有多大?

至少有2名感染鉤蟲(chóng)的概率有多大?至少有20名感染鉤蟲(chóng)的概率有多大?第六十六頁(yè),共一百頁(yè),編輯于2023年,星期日

第二節(jié)Poisson分布的概念與特征

一、Poisson分布的概念Poisson分布:描述罕見(jiàn)事件發(fā)生次數(shù)的概率分布。例:出生缺陷、多胞胎、染色體異常、癌癥患病數(shù)或死亡數(shù)的分布。Poisson分布可以看作是二項(xiàng)分布的特例:

獨(dú)立、重復(fù)的次數(shù)n很大很大每次出現(xiàn)某事件的概率很小

(或未出現(xiàn)某事件的概率1-

很小)第六十七頁(yè),共一百頁(yè),編輯于2023年,星期日可以證明當(dāng),(浪打)時(shí),若隨機(jī)變量X的的概率函數(shù)為則稱此變量服從Poisson分布,記為,其中參數(shù)是總體均數(shù)。第六十八頁(yè),共一百頁(yè),編輯于2023年,星期日例:

1毫升水樣品中大腸桿菌數(shù)目X的分布.

將1毫升水等分為n

個(gè)微小體積,這里n

很大;每一個(gè)微小體積中大腸桿菌是否出現(xiàn),互相獨(dú)立;每一個(gè)微小體積中大腸桿菌出現(xiàn)的概率都是,且很小每毫升水中大腸桿菌數(shù)目的分布服從Poisson分布

第六十九頁(yè),共一百頁(yè),編輯于2023年,星期日例:放射性物質(zhì)一定時(shí)間內(nèi)放射出質(zhì)點(diǎn)數(shù)的分布

時(shí)間

“n很大、獨(dú)立、概率都是

且很小”的二項(xiàng)分布-----Poisson分布

第七十頁(yè),共一百頁(yè),編輯于2023年,星期日若每次觀察互不獨(dú)立、發(fā)生概率不等,則不能看作Poisson分布

?。?/p>

觀察結(jié)果不獨(dú)立:例如,傳染性疾病首例出現(xiàn)后便成為傳染源,會(huì)增加后續(xù)病例出現(xiàn)的概率;又如,污染的牛奶中細(xì)菌成集落存在、釘螺在繁殖期一窩一窩地散布等等這些現(xiàn)象均不能用Poisson分布處理。第七十一頁(yè),共一百頁(yè),編輯于2023年,星期日例:某地20年間共出生肢短畸形兒10名,平均每年0.5名。請(qǐng)估計(jì)該地每年出生此類畸形人數(shù)為0,1,2,…的概率P(X)(見(jiàn)表4-2):

用Poisson分布的概率函數(shù)式來(lái)計(jì)算第七十二頁(yè),共一百頁(yè),編輯于2023年,星期日二、Poisson分布的特征圖4-3取不同值時(shí)的Poisson分布圖第七十三頁(yè),共一百頁(yè),編輯于2023年,星期日Poisson分布有以下特性:(1)總體均數(shù)=總體方差=(2)觀察結(jié)果有可加性若X1服從總體均數(shù)為1的Poisson分布

X2服從總體均數(shù)為2

的Poisson分布則

T=X1+X2

服從總體均數(shù)為1+2

的Poisson分布第七十四頁(yè),共一百頁(yè),編輯于2023年,星期日例:

從同一水源獨(dú)立地取水樣5次,進(jìn)行細(xì)菌培養(yǎng)。第一次水樣中的菌落數(shù)X1

~(1)第二次水樣中的菌落數(shù)X2

~(2)…………….第五次水樣中的菌落數(shù)X5

~(5)把5份水樣混合,合計(jì)菌落數(shù)也服從Poisson分布

X1+X2+…+X5

~(1+2+…+5)醫(yī)學(xué)研究中常利用其可加性,將小的觀察單位合并,來(lái)增大發(fā)生次數(shù)X,以便用后面講到的正態(tài)近似法作統(tǒng)計(jì)推斷。

第七十五頁(yè),共一百頁(yè),編輯于2023年,星期日三、Poisson分布的應(yīng)用例4-7如果某地新生兒先天性心臟病的發(fā)病概率為8‰,那么該地120名新生兒中有4人患先天性心臟病的概率有多大?發(fā)病概率

=8‰,人數(shù)n=120,是否患先天性心臟病互相獨(dú)立----患先天性心臟病的人數(shù)服從二項(xiàng)分布。因?yàn)?‰較小,120較大,可以認(rèn)為患先天性心臟病的人數(shù)近似地服從Poisson分布,λ=n=120×0.008=0.96

第七十六頁(yè),共一百頁(yè),編輯于2023年,星期日例4-9實(shí)驗(yàn)顯示某100cm2的培養(yǎng)皿平均菌落數(shù)為6個(gè),試估計(jì)該培養(yǎng)皿菌落數(shù)小于3個(gè)的概率;大于1個(gè)的概率。該培養(yǎng)皿菌落數(shù)小于3個(gè)的概率為菌落數(shù)大于1個(gè)的概率為第七十七頁(yè),共一百頁(yè),編輯于2023年,星期日第三節(jié)正態(tài)分布一、正態(tài)分布的概念正態(tài)分布是自然界最常見(jiàn)的一種分布測(cè)量的誤差、人體的尺寸、許多生化指標(biāo)等等都近似服從正態(tài)分布。許多其它分布可用正態(tài)分布近似共同點(diǎn):變量的數(shù)值,中間多,兩邊漸少,近似對(duì)稱。

第七十八頁(yè),共一百頁(yè),編輯于2023年,星期日第七十九頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D4-4體模“骨密度”測(cè)量值的分布

----接近正態(tài)分布(頻率密度=頻率/組距)正態(tài)分布概率密度函數(shù)頻率密度第八十頁(yè),共一百頁(yè),編輯于2023年,星期日μ1μ2μ3第八十一頁(yè),共一百頁(yè),編輯于2023年,星期日正態(tài)概率密度曲線的位置與形狀具有如下特點(diǎn):

(1)關(guān)于X=μ對(duì)稱。

(2)鐘形曲線,X=μ處最大值

X

處有拐點(diǎn)

(3)曲線下面積為1。

(4)μ決定曲線在橫軸上的位置

(5)

決定曲線的形狀

N(μ,2)

表示均數(shù)為μ

、標(biāo)準(zhǔn)差為的正態(tài)分布。

第八十二頁(yè),共一百頁(yè),編輯于2023年,星期日68.27%95.44%99.74%μ-3σμ-2σμ-σμμ-σμ-2σμ-3σ圖4-6正態(tài)分布曲線下的面積分布二、

正態(tài)曲線下面積的分布規(guī)律二、

正態(tài)曲線下面積的分布規(guī)律二、

正態(tài)曲線下面積的分布規(guī)律第八十三頁(yè),共一百頁(yè),編輯于2023年,星期日若X服從正態(tài)分布,可作如下的標(biāo)準(zhǔn)化變換(稱Z變換)

則Z服從正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)學(xué)家編制了標(biāo)準(zhǔn)正態(tài)分布曲線下面積表(附表1)。標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)第八十四頁(yè),共一百頁(yè),編輯于2023年,星期日z0-1.961.960.0250.0250第八十五頁(yè),共一百頁(yè),編輯于2023年,星期日例4-10某地1986年120名8歲男孩身高

均數(shù)=123.02cm,標(biāo)準(zhǔn)差=4.79cm

試估計(jì)

(1)該地8歲男孩身高在130cm以上者占該地8歲男孩總數(shù)的百分比;

(2)身高在120cm~128cm者占該地8歲男孩總數(shù)的百分比;

(3)該地80%的男孩身高集中在哪個(gè)范圍?

(1)計(jì)算130對(duì)應(yīng)的Z值1.46-1.460.070.07圖4-9例4-10示意圖第八十六頁(yè),共一百頁(yè),編輯于2023年,星期日(2)身高在120cm~128cm者的百分比:

先計(jì)算120和128所對(duì)應(yīng)的Z值:120對(duì)應(yīng)的Z值為

128對(duì)應(yīng)的Z值為

正態(tài)曲線下區(qū)間(-0.63,1.04)上的面積等于(3)80%的身高集中在哪個(gè)范圍?標(biāo)準(zhǔn)正態(tài)分布曲線下左側(cè)面積為0.10所對(duì)應(yīng)的Z值為-1.28,所以80%的身高集中在第八十七頁(yè),共一百頁(yè),編輯于2023年,星期日三、正態(tài)變量的和與差的分布

不論X1和X2是否獨(dú)立,X1+X2

仍服從正態(tài)分布當(dāng)X1和X2獨(dú)立時(shí)

第八十八頁(yè),共一百頁(yè),編輯于2023年,星期日四、正態(tài)分布的應(yīng)用(一)確定醫(yī)學(xué)參考值范圍(referenceranges)

特定的“正?!比巳褐写蠖鄶?shù)個(gè)體的取值范圍“大多數(shù)個(gè)體”:習(xí)慣上指95%的個(gè)體正態(tài)分布法(若X服從正態(tài)分布)正態(tài)分布變量X在區(qū)間上取值的概率為0.95

第八十九頁(yè),共一百頁(yè),編輯于2023年,星期日例4-11調(diào)查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,

試估計(jì)該地健康女性血紅蛋白的95%參考值范圍。

雙側(cè)95%參考值范圍:

第九十頁(yè),共一百頁(yè),編輯于2023年,星期日必須注意:1)醫(yī)學(xué)參考值范圍在臨床上只能作為參考。2)若變量X的分布是正偏倚的,可經(jīng)對(duì)數(shù)變換變成近似正態(tài)分布,先求lnX的參考值范圍,再求反對(duì)數(shù),即得原變量X的參考值范圍。3)確定醫(yī)學(xué)參考值范圍必須抽取足夠例數(shù)的樣本。4)若測(cè)定值在性別間或年齡組間差別明顯,應(yīng)分“層”確定參考值范圍。5)若X不服從正態(tài)分布,用百分位數(shù)法

第九十一頁(yè),共一百頁(yè),編輯于2023年,星期日(二)質(zhì)量控制圖

控制圖:質(zhì)量控制的一個(gè)重要工具

基本原理:如果某一波動(dòng)僅僅由個(gè)體差異或隨機(jī)測(cè)量誤差所致,那么觀察結(jié)果服從正態(tài)分布。第九十二頁(yè),共一百頁(yè),編輯于2023年,星期日例4-12骨密度測(cè)量的質(zhì)量控制。

通常在每天開(kāi)機(jī)后首先對(duì)固定在機(jī)器內(nèi)的“體?!边M(jìn)行測(cè)量,將每天的“體?!睖y(cè)定值點(diǎn)在控制圖上,一旦出現(xiàn)8種情形之一:

(1)有一個(gè)點(diǎn)距中心線的距離超過(guò)3個(gè)標(biāo)準(zhǔn)差(位于控制限以外)。

(2)在中心線的一側(cè)連續(xù)有9個(gè)點(diǎn)。

(3)連續(xù)6個(gè)點(diǎn)穩(wěn)定地增

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論