




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
方積乾統(tǒng)計(jì)基礎(chǔ)第一頁(yè),共一百頁(yè),編輯于2023年,星期日衛(wèi)生統(tǒng)計(jì)學(xué)第一章緒論第二頁(yè),共一百頁(yè),編輯于2023年,星期日什么是統(tǒng)計(jì)學(xué)(statistics)?“Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata”(Webster'sInternationalDictionary)。“Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults”(JohnM.Last,ADictionaryofEpidemiology)第三頁(yè),共一百頁(yè),編輯于2023年,星期日什么是統(tǒng)計(jì)學(xué)(statistics)??jī)?nèi)容:收集、分析、解釋和表達(dá)數(shù)據(jù)統(tǒng)計(jì)學(xué):處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)目的:求得可靠的結(jié)果統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)地位:合作、審稿、基金申請(qǐng)(NIH)、藥物開(kāi)發(fā)與申報(bào)(FDA)、衛(wèi)生決策第四頁(yè),共一百頁(yè),編輯于2023年,星期日
統(tǒng)計(jì)學(xué)的若干概念1.總體與樣本總體(population):大同小異的對(duì)象全體。目標(biāo)總體(targetpopulation):試圖下結(jié)論的某個(gè)總體.例如,英國(guó)成年男子為目標(biāo)總體研究總體(studypopulation):資料來(lái)源的較小的總體.例如,1951年英國(guó)全部注冊(cè)醫(yī)生需要謹(jǐn)慎:就研究總體所下的結(jié)論未必適用于目標(biāo)總體。第五頁(yè),共一百頁(yè),編輯于2023年,星期日抽樣(sampling):從研究總體抽取部分個(gè)體樣本(sample):抽取的部分個(gè)體數(shù)據(jù)(data):觀察所得資料推斷(inference):分析樣本數(shù)據(jù),獲得關(guān)于總體的知識(shí)數(shù)據(jù)信息信息知識(shí)統(tǒng)計(jì)推斷的工具:有關(guān)概率的理論。
推斷的結(jié)論從來(lái)不是完全肯定或完全否定的。
關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷的方法
第六頁(yè),共一百頁(yè),編輯于2023年,星期日2.同質(zhì)與變異同質(zhì)性(homogeneity)共性,大同小異
變異(variation)個(gè)體間差異,多樣性
沒(méi)有同質(zhì)性就構(gòu)不成一個(gè)總體;
總體內(nèi)沒(méi)有變異性就無(wú)需統(tǒng)計(jì)學(xué)。
統(tǒng)計(jì)學(xué)的任務(wù):
在變異的背景上
描述同一總體的同質(zhì)性,
揭示不同總體的異質(zhì)性(heterogeneity)。
第七頁(yè),共一百頁(yè),編輯于2023年,星期日3.變量的類型變量(variable):個(gè)體特性的數(shù)量描述(1)定性變量
(i)分類變量(categoricalvariable)或名義變量(nominativevariable)。分類變量的水平(level)代碼(code)用1、2、3、4、5等來(lái)表示各個(gè)水平。二分類變量(binaryvariable),也稱0-1變量或假變量(dummyvariable)(ii)有序變量(ordinalvariable)
種種可能的“取值”中自然地存在著次序。
第八頁(yè),共一百頁(yè),編輯于2023年,星期日(2)定量變量
(i)離散型變量只能取整數(shù)值。例如,手術(shù)病人數(shù);新生兒數(shù)
(ii)連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值。由測(cè)量而得到的大多屬于連續(xù)型變量例如,血壓、身高、體重等“連續(xù)”:指該變量可以在實(shí)數(shù)軸上連續(xù)變動(dòng)。變通:紅細(xì)胞記數(shù)也視為連續(xù)型變量。(一個(gè)、兩個(gè)、三個(gè)之間的差別并不重要)第九頁(yè),共一百頁(yè),編輯于2023年,星期日變量類型的轉(zhuǎn)化:只能由高級(jí)向低級(jí)轉(zhuǎn)化,
不能作相反方向的轉(zhuǎn)化
連續(xù)型→有序→分類→二值離散型變量常常通過(guò)適當(dāng)?shù)淖儞Q或連續(xù)性校正后借用連續(xù)型變量或有序變量的方法來(lái)分析。第十頁(yè),共一百頁(yè),編輯于2023年,星期日4.因果與聯(lián)系公共衛(wèi)生領(lǐng)域常常要探究危險(xiǎn)因素與疾病之間的因果關(guān)系(causation)。首先應(yīng)當(dāng)問(wèn)存在不存在聯(lián)系(association)然而,存在聯(lián)系未必有因果關(guān)系在解釋統(tǒng)計(jì)分析的結(jié)果以及下結(jié)論時(shí),
務(wù)必對(duì)“因果”二字慎之又慎。第十一頁(yè),共一百頁(yè),編輯于2023年,星期日第二章定量資料的統(tǒng)計(jì)描述
第十二頁(yè),共一百頁(yè),編輯于2023年,星期日
把握資料的基本特征為統(tǒng)計(jì)分析打下基礎(chǔ)統(tǒng)計(jì)表描述性統(tǒng)計(jì)量統(tǒng)計(jì)圖統(tǒng)計(jì)描述
----從資料中獲取信息最基本的方法第十三頁(yè),共一百頁(yè),編輯于2023年,星期日第一節(jié)頻數(shù)與頻數(shù)分布
頻數(shù)分布表(frequencydistributiontable),又稱頻數(shù)表
一、
離散型定量變量的頻數(shù)分布例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7第十四頁(yè),共一百頁(yè),編輯于2023年,星期日第十五頁(yè),共一百頁(yè),編輯于2023年,星期日直條圖(barchart)橫坐標(biāo):產(chǎn)前檢查次數(shù);縱坐標(biāo):頻率,檢查k次的婦女所占的比例(%)等寬矩形長(zhǎng)條:高度相當(dāng)于檢查次數(shù)的頻率第十六頁(yè),共一百頁(yè),編輯于2023年,星期日二、連續(xù)型定量變量的頻數(shù)分布
例2-2抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),數(shù)據(jù)如下:第十七頁(yè),共一百頁(yè),編輯于2023年,星期日第十八頁(yè),共一百頁(yè),編輯于2023年,星期日直方圖(頻率直方圖)橫軸:血清鐵含量縱軸:頻率密度
=頻率/組距面積=頻率注:組距相等時(shí),矩形直條的高度與相應(yīng)組段的頻率成正比。
第十九頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D2-2120例健康成年男子血清鐵含量分布
單峰、對(duì)稱-----對(duì)稱分布第二十頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D2-3某地居民238人發(fā)汞含量(μmol/kg)分布單峰,不對(duì)稱-----偏峰分布正偏峰分布:峰偏向左側(cè)負(fù)偏峰分布:峰偏向右側(cè)第二十一頁(yè),共一百頁(yè),編輯于2023年,星期日第二節(jié)定量變量的特征數(shù)
定量地描述集中趨勢(shì)與離中趨勢(shì)是統(tǒng)計(jì)描述的重要內(nèi)容一、
描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)
對(duì)于連續(xù)型定量變量,描述集中趨勢(shì)常用的統(tǒng)計(jì)量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。第二十二頁(yè),共一百頁(yè),編輯于2023年,星期日1.算術(shù)均數(shù)簡(jiǎn)稱均數(shù)(mean,),適合描述對(duì)稱分布資料的集中位置(也稱為平均水平)。其計(jì)算公式為
n:樣本含量
X1,X2,…,Xn:觀察值或:觀察值之和例2-3測(cè)得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。按式(2-1),算術(shù)均數(shù)為
第二十三頁(yè),共一百頁(yè),編輯于2023年,星期日2.幾何均數(shù)(geometricmean,G)
適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料
頻數(shù)圖一般呈正偏峰分布
例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。試計(jì)算其幾何均數(shù)。第二十四頁(yè),共一百頁(yè),編輯于2023年,星期日3.中位數(shù)(median,M)可用于各種分布的定量資料總體中有一半個(gè)體的數(shù)值低于這個(gè)數(shù),一半個(gè)體的數(shù)值高于這個(gè)數(shù)。
基于樣本資料將n例數(shù)據(jù)按升序排列,第i個(gè)數(shù)據(jù)記為
n為奇數(shù)時(shí)
n為偶數(shù)時(shí)
例2-7某藥廠觀察9只小鼠口服高山紅景天醇提取物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。第二十五頁(yè),共一百頁(yè),編輯于2023年,星期日百分位數(shù)(percentile)總體中,數(shù)值小于它的個(gè)體恰有X%,大于它的個(gè)體恰有1-X%樣本估計(jì):按照升序排列的數(shù)列里,其左側(cè)(即小于它)的個(gè)體數(shù)在整個(gè)樣本中所占百分比為X%。第二十六頁(yè),共一百頁(yè),編輯于2023年,星期日4.眾數(shù)(mode)總體中出現(xiàn)機(jī)會(huì)最高的數(shù)值。樣本估計(jì):在樣本中出現(xiàn)次數(shù)最多的數(shù)值。例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7
眾數(shù)為4(次)第二十七頁(yè),共一百頁(yè),編輯于2023年,星期日二、描述離散趨勢(shì)的特征數(shù)同一總體中不同個(gè)體之間的離散趨勢(shì)又稱為變異(variation)。
例2-11試觀察三組數(shù)據(jù)的離散狀況。(均數(shù)都是30)
A組:26,28,30,32,34
B組:24,27,30,33,36
C組:26,29,30,31,34第二十八頁(yè),共一百頁(yè),編輯于2023年,星期日1.極差(range,R)R=最大值-最小值計(jì)算簡(jiǎn)便,但僅利用了兩個(gè)數(shù)據(jù)的信息一般,樣本量n越大R也往往會(huì)越大,不夠穩(wěn)定
例2-12計(jì)算上述三組數(shù)據(jù)的極差A(yù)組R=34-26=8B組R=36-24=12C組R=34-26=8第二十九頁(yè),共一百頁(yè),編輯于2023年,星期日2.四分位數(shù)間距(quartilerange,Q)
Q=P75-P25
P25與P75之間恰好包含50%的個(gè)體四分位數(shù)間距Q是總體中數(shù)值居中的50%個(gè)體散布的范圍Q越大意味著數(shù)據(jù)間變異越大第三十頁(yè),共一百頁(yè),編輯于2023年,星期日3.方差(variance)
又稱均方差(meansquaredeviation)μ:總體均數(shù)
N:總體中個(gè)體的總數(shù)
分母:離均差平方和方差越大意味著數(shù)據(jù)間變異越大樣本方差:
或
n-1稱為自由度(degreesoffreedom):總體方差:第三十一頁(yè),共一百頁(yè),編輯于2023年,星期日4.標(biāo)準(zhǔn)差(standarddeviation,S)
標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差的量綱與原變量一致。標(biāo)準(zhǔn)差越大意味著個(gè)體間變異越大。標(biāo)準(zhǔn)差適合用來(lái)表達(dá)對(duì)稱分布的離散趨勢(shì)。第三十二頁(yè),共一百頁(yè),編輯于2023年,星期日例2-14分別計(jì)算例2-11中三組數(shù)據(jù)的標(biāo)準(zhǔn)差。按照公式(2-11)與標(biāo)準(zhǔn)差的定義
A組
B組
C組C組數(shù)據(jù)的離散趨勢(shì)最小,B組的最大第三十三頁(yè),共一百頁(yè),編輯于2023年,星期日5.變異系數(shù)(coefficientofvariation,CV)
例2-161985年通過(guò)十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為0.98kg;身高均數(shù)為72.4cm,標(biāo)準(zhǔn)差為3.0cm。體重的變異大還是身高的變異大?體重的變異系數(shù)身高的變異系數(shù)
用于量綱不同的變量間變異程度的比較或均數(shù)差別較大的變量間變異程度的比較第三十四頁(yè),共一百頁(yè),編輯于2023年,星期日小結(jié)1.頻數(shù)表、頻率分布圖:描述資料的分布特征(集中趨勢(shì)與離散趨勢(shì))分布類型(對(duì)稱或偏峰)2.描述性統(tǒng)計(jì)量:定量地刻畫(huà)統(tǒng)計(jì)分布的特征。(1)集中趨勢(shì):算術(shù)均數(shù)、幾何均數(shù)、中位數(shù);(2)離散趨勢(shì):極差、四分位數(shù)間距、方差(標(biāo)準(zhǔn)差)和變異系數(shù);3.百分位數(shù)是一種位置參數(shù)描述集中趨勢(shì):P50;描述離散趨勢(shì)P75-P25第三十五頁(yè),共一百頁(yè),編輯于2023年,星期日第三章定性資料的統(tǒng)計(jì)描述第三十六頁(yè),共一百頁(yè),編輯于2023年,星期日常用的相對(duì)數(shù)指標(biāo)除了用頻率分布全面反映一個(gè)定性變量外,有時(shí),也可用其它相對(duì)數(shù)指標(biāo)從某個(gè)側(cè)面來(lái)描述定性變量。相對(duì)數(shù)指標(biāo)大致有三種類型:
頻率(Frequency)有的書(shū)稱比率(Proportion)
強(qiáng)度(intensity)有的書(shū)稱速率(rate)
相對(duì)比(ratio)第三十七頁(yè),共一百頁(yè),編輯于2023年,星期日(一)頻率型指標(biāo)頻率型指標(biāo):最常見(jiàn),近似地反映某一事件出現(xiàn)的機(jī)會(huì)大小,如患病概率、病`死概率等。
K是比例基數(shù),取100%、1000‰、1萬(wàn)/1萬(wàn)和10萬(wàn)/10萬(wàn)特點(diǎn):分子是分母的一部分;無(wú)量綱,在0~1范圍內(nèi)取值
第三十八頁(yè),共一百頁(yè),編輯于2023年,星期日(二)強(qiáng)度型指標(biāo)“強(qiáng)度”是流行病學(xué)、統(tǒng)計(jì)學(xué)術(shù)語(yǔ)
----單位時(shí)段內(nèi)某現(xiàn)象發(fā)生的頻率。如第三十九頁(yè),共一百頁(yè),編輯于2023年,星期日例3-3在某醫(yī)院的院內(nèi)感染調(diào)查中,5031個(gè)病人共觀察了127859人日(相當(dāng)于127859人觀察1日),其中有596人在醫(yī)院發(fā)生感染。
觀察人年數(shù)=10日×120人+9日×240人+8日×380人+…+3日×890人+2日×920人+1日×1200人=127859人日
平均每天有0.47%的病人將在醫(yī)院發(fā)生感染。
第四十頁(yè),共一百頁(yè),編輯于2023年,星期日一般地,其中比例基數(shù)K同上。
分母含有“時(shí)間”,并不是一般的速率,而是單位時(shí)間內(nèi)的頻率。
統(tǒng)計(jì)學(xué)和流行病學(xué)本質(zhì):頻率強(qiáng)度或概率強(qiáng)度的近似值。第四十一頁(yè),共一百頁(yè),編輯于2023年,星期日(三)相對(duì)比型指標(biāo)任何兩個(gè)相關(guān)聯(lián)的變量A與B之比
相對(duì)于B的一個(gè)(或十個(gè)、百個(gè)、千個(gè)等)單位,A有多少個(gè)單位A和B可以是絕對(duì)數(shù),也可是相對(duì)數(shù)A和B的量綱可以不同,也可相同,但A和B互不包含第四十二頁(yè),共一百頁(yè),編輯于2023年,星期日(四)應(yīng)用相對(duì)數(shù)應(yīng)注意的事項(xiàng)1.防止概念混淆
不少指標(biāo)命名混亂:“某某率”滿天飛!
某些指標(biāo),實(shí)質(zhì)上只是相對(duì)比,其名稱卻是某某率;更多指標(biāo)以某某率的模式命名,籠統(tǒng)地稱它們?yōu)椤奥省?/p>
----分不清究竟是頻率還是強(qiáng)度第四十三頁(yè),共一百頁(yè),編輯于2023年,星期日人口構(gòu)成及其統(tǒng)計(jì)指標(biāo)第四十四頁(yè),共一百頁(yè),編輯于2023年,星期日發(fā)病率(incidencerate,IR):“時(shí)期”通常用年或月。發(fā)病率的分母泛指一般的觀察人年數(shù),可由平均人口數(shù)×1年來(lái)近似。新發(fā)病例數(shù):新發(fā)生某種疾病,以第一次就診為準(zhǔn)。用于探討疾病的危險(xiǎn)因素,評(píng)價(jià)疾病防治效果。
第四十五頁(yè),共一百頁(yè),編輯于2023年,星期日2.計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠數(shù)量
例甲醫(yī)院治療某類患者100人,40人有效;乙醫(yī)院治療同類患者5人,2人有效有效頻率均為40%!?如果資料的總例數(shù)過(guò)少,計(jì)算得到的相對(duì)數(shù)偏差可能會(huì)很大,直接報(bào)告原始數(shù)據(jù)更為可取:甲醫(yī)院有效率40%
乙醫(yī)院有效2/5第四十六頁(yè),共一百頁(yè),編輯于2023年,星期日3.正確地合并估計(jì)例甲醫(yī)院治療某類患者100人,40人有效;乙醫(yī)院治療同類患者90人,30人有效如果兩醫(yī)院總體有效率的確相等,合并估計(jì):不可將兩個(gè)頻率相加除以2:第四十七頁(yè),共一百頁(yè),編輯于2023年,星期日4.相對(duì)數(shù)間的比較要具備可比性
注意以下幾個(gè)方面:觀察對(duì)象同質(zhì)?研究方法相同?觀察時(shí)間一致?
第四十八頁(yè),共一百頁(yè),編輯于2023年,星期日粗死亡率的定義式近似地寫(xiě)成以上說(shuō)明同樣適用于年齡組死亡率、粗出生率和粗發(fā)病率等,不再贅述。比較不同時(shí)期或不同地區(qū)的粗死亡率,如人口的年齡及性別分布不一致,應(yīng)按性別、年齡標(biāo)準(zhǔn)化后作比較(見(jiàn)第14章)。第四十九頁(yè),共一百頁(yè),編輯于2023年,星期日第四節(jié)動(dòng)態(tài)數(shù)列及其分析指標(biāo)表3-10某大學(xué)1992-2002年本科專業(yè)招生動(dòng)態(tài)變化
第五十頁(yè),共一百頁(yè),編輯于2023年,星期日
一、
絕對(duì)增長(zhǎng)量二、發(fā)展速度與增長(zhǎng)速度三、平均發(fā)展速度和平均增長(zhǎng)速度平均發(fā)展速度=環(huán)比的幾何均數(shù)=
平均增長(zhǎng)速度=平均發(fā)展速度
1
第五十一頁(yè),共一百頁(yè),編輯于2023年,星期日預(yù)測(cè)2004年
前提:平均發(fā)展速度保持不變a12滿足
a12=1.04124200=6724人根據(jù)該大學(xué)1992-2002年的平均發(fā)展速度,如果今后保持這個(gè)速度,預(yù)計(jì)到2004年末學(xué)生人數(shù)可達(dá)6724人。預(yù)測(cè)2040年?第五十二頁(yè),共一百頁(yè),編輯于2023年,星期日小結(jié)1.描述定性資料的相對(duì)數(shù)大致有三種類型:頻率型、強(qiáng)度型和相對(duì)比型
2.實(shí)踐中許多指標(biāo)都稱為XX率,要注意每個(gè)指標(biāo)的定義和性質(zhì),不可簡(jiǎn)單地望文生義。3.動(dòng)態(tài)數(shù)列指標(biāo)如發(fā)展速度和增長(zhǎng)速度可描述事物在不同時(shí)期的發(fā)展水平和趨勢(shì)。要注意:預(yù)測(cè)的前提條件是“平均發(fā)展速度保持不變”。
第五十三頁(yè),共一百頁(yè),編輯于2023年,星期日第四章常用概率分布第五十四頁(yè),共一百頁(yè),編輯于2023年,星期日第一節(jié)二項(xiàng)分布一、二項(xiàng)分布的概念與特征第五十五頁(yè),共一百頁(yè),編輯于2023年,星期日摸球模型
一個(gè)袋子里有5個(gè)乒乓球,其中2個(gè)黃球,3個(gè)白球,我們進(jìn)行摸球游戲,每次摸1球,然后放回再摸。先后摸100次,請(qǐng)問(wèn)100次都摸到白球的概率有多大?(1)每次摸到白球的概率=0.6(2)第1次摸到白球的概率=0.6
第2次摸到白球的概率=0.6
……
第100次摸到白球的概率=0.6(3)100次都摸到白球的概率=(0.6)(0.6)…(0.6)=(0.6)100第一節(jié)二項(xiàng)分布第五十六頁(yè),共一百頁(yè),編輯于2023年,星期日摸球模型先后100次,摸到3次黃球的概率有多大?(1)每次摸到黃球的概率=0.4(2)黃黃黃白白白白白白…白概率=(0.4)3(0.6)97
黃白黃黃白白白白白…白概率=(0.4)3(0.6)97
黃白黃白黃白白白白…白概率=(0.4)3(0.6)97
……(3)100次摸到3次黃球的概率
=(0.4)3(0.6)97+(0.4)3(0.6)97+…
=(0.4)3(0.6)97
先后100次,摸到x次黃球的概率
=第五十七頁(yè),共一百頁(yè),編輯于2023年,星期日先后n次,摸到x
次二分類:每次摸球只有二種可能的結(jié)果,或黃球或白球;獨(dú)立:各次摸球是彼此獨(dú)立的;重復(fù):每次摸到黃球或白球的概率是和1-
先后n次,摸到x
次黃球的概率=第五十八頁(yè),共一百頁(yè),編輯于2023年,星期日一般地,若隨機(jī)變量取值x的概率為其中,則稱此隨機(jī)變量服從二項(xiàng)分布。稱為二項(xiàng)分布的概率函數(shù)。
二分類、獨(dú)立、重復(fù)試驗(yàn),若每次出現(xiàn)某事物的概率為,則
n
次中有X
次出現(xiàn)該事物的概率服從二項(xiàng)分布。二項(xiàng)分布第五十九頁(yè),共一百頁(yè),編輯于2023年,星期日例4-2臨床上用針灸治療某型頭痛,有效的概率為60%,現(xiàn)以該法治療3例,其中2例有效的概率是多大?
第六十頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D4-1π=0.5時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布圖4-2π=0.3時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布
第六十一頁(yè),共一百頁(yè),編輯于2023年,星期日二項(xiàng)分布的特征1.二項(xiàng)分布的圖形特征:取決于與n
均數(shù)在=n處接近0.5時(shí),圖形是對(duì)稱的;
離0.5愈遠(yuǎn),對(duì)稱性愈差隨著n的增大,分布趨于對(duì)稱
n→∞時(shí),只要不太靠近0或1,二項(xiàng)分布近似于正態(tài)分布(n和n(1-)都大于5時(shí))第六十二頁(yè),共一百頁(yè),編輯于2023年,星期日2.二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差B(n,π)
出現(xiàn)陽(yáng)性結(jié)果的次數(shù)X
總體均數(shù)總體方差總體標(biāo)準(zhǔn)差出現(xiàn)陽(yáng)性結(jié)果的頻率總體均數(shù)
總體標(biāo)準(zhǔn)差第六十三頁(yè),共一百頁(yè),編輯于2023年,星期日(一)概率估計(jì)例4-5如果某地鉤蟲(chóng)感染率為13%,隨機(jī)觀察當(dāng)?shù)?50人,其中有10人感染鉤蟲(chóng)的概率有多大?分析:二分類
(感染、不感染)
獨(dú)立
(假定互不影響)
重復(fù)(n=150人),每人鉤蟲(chóng)感染率均為
(π=13%)
感染鉤蟲(chóng)的人數(shù)X服從二項(xiàng)分布B(150,0.13)
二、二項(xiàng)分布的應(yīng)用第六十四頁(yè),共一百頁(yè),編輯于2023年,星期日(二)單側(cè)累積概率計(jì)算經(jīng)常需要計(jì)算的是二項(xiàng)分布的累積概率第六十五頁(yè),共一百頁(yè),編輯于2023年,星期日
例4-6某地鉤蟲(chóng)感染率為13%,隨機(jī)抽查當(dāng)?shù)?50人,
其中至多有2名感染鉤蟲(chóng)的概率有多大?
至少有2名感染鉤蟲(chóng)的概率有多大?至少有20名感染鉤蟲(chóng)的概率有多大?第六十六頁(yè),共一百頁(yè),編輯于2023年,星期日
第二節(jié)Poisson分布的概念與特征
一、Poisson分布的概念Poisson分布:描述罕見(jiàn)事件發(fā)生次數(shù)的概率分布。例:出生缺陷、多胞胎、染色體異常、癌癥患病數(shù)或死亡數(shù)的分布。Poisson分布可以看作是二項(xiàng)分布的特例:
獨(dú)立、重復(fù)的次數(shù)n很大很大每次出現(xiàn)某事件的概率很小
(或未出現(xiàn)某事件的概率1-
很小)第六十七頁(yè),共一百頁(yè),編輯于2023年,星期日可以證明當(dāng),(浪打)時(shí),若隨機(jī)變量X的的概率函數(shù)為則稱此變量服從Poisson分布,記為,其中參數(shù)是總體均數(shù)。第六十八頁(yè),共一百頁(yè),編輯于2023年,星期日例:
1毫升水樣品中大腸桿菌數(shù)目X的分布.
將1毫升水等分為n
個(gè)微小體積,這里n
很大;每一個(gè)微小體積中大腸桿菌是否出現(xiàn),互相獨(dú)立;每一個(gè)微小體積中大腸桿菌出現(xiàn)的概率都是,且很小每毫升水中大腸桿菌數(shù)目的分布服從Poisson分布
第六十九頁(yè),共一百頁(yè),編輯于2023年,星期日例:放射性物質(zhì)一定時(shí)間內(nèi)放射出質(zhì)點(diǎn)數(shù)的分布
時(shí)間
“n很大、獨(dú)立、概率都是
且很小”的二項(xiàng)分布-----Poisson分布
第七十頁(yè),共一百頁(yè),編輯于2023年,星期日若每次觀察互不獨(dú)立、發(fā)生概率不等,則不能看作Poisson分布
?。?/p>
觀察結(jié)果不獨(dú)立:例如,傳染性疾病首例出現(xiàn)后便成為傳染源,會(huì)增加后續(xù)病例出現(xiàn)的概率;又如,污染的牛奶中細(xì)菌成集落存在、釘螺在繁殖期一窩一窩地散布等等這些現(xiàn)象均不能用Poisson分布處理。第七十一頁(yè),共一百頁(yè),編輯于2023年,星期日例:某地20年間共出生肢短畸形兒10名,平均每年0.5名。請(qǐng)估計(jì)該地每年出生此類畸形人數(shù)為0,1,2,…的概率P(X)(見(jiàn)表4-2):
用Poisson分布的概率函數(shù)式來(lái)計(jì)算第七十二頁(yè),共一百頁(yè),編輯于2023年,星期日二、Poisson分布的特征圖4-3取不同值時(shí)的Poisson分布圖第七十三頁(yè),共一百頁(yè),編輯于2023年,星期日Poisson分布有以下特性:(1)總體均數(shù)=總體方差=(2)觀察結(jié)果有可加性若X1服從總體均數(shù)為1的Poisson分布
X2服從總體均數(shù)為2
的Poisson分布則
T=X1+X2
服從總體均數(shù)為1+2
的Poisson分布第七十四頁(yè),共一百頁(yè),編輯于2023年,星期日例:
從同一水源獨(dú)立地取水樣5次,進(jìn)行細(xì)菌培養(yǎng)。第一次水樣中的菌落數(shù)X1
~(1)第二次水樣中的菌落數(shù)X2
~(2)…………….第五次水樣中的菌落數(shù)X5
~(5)把5份水樣混合,合計(jì)菌落數(shù)也服從Poisson分布
X1+X2+…+X5
~(1+2+…+5)醫(yī)學(xué)研究中常利用其可加性,將小的觀察單位合并,來(lái)增大發(fā)生次數(shù)X,以便用后面講到的正態(tài)近似法作統(tǒng)計(jì)推斷。
第七十五頁(yè),共一百頁(yè),編輯于2023年,星期日三、Poisson分布的應(yīng)用例4-7如果某地新生兒先天性心臟病的發(fā)病概率為8‰,那么該地120名新生兒中有4人患先天性心臟病的概率有多大?發(fā)病概率
=8‰,人數(shù)n=120,是否患先天性心臟病互相獨(dú)立----患先天性心臟病的人數(shù)服從二項(xiàng)分布。因?yàn)?‰較小,120較大,可以認(rèn)為患先天性心臟病的人數(shù)近似地服從Poisson分布,λ=n=120×0.008=0.96
第七十六頁(yè),共一百頁(yè),編輯于2023年,星期日例4-9實(shí)驗(yàn)顯示某100cm2的培養(yǎng)皿平均菌落數(shù)為6個(gè),試估計(jì)該培養(yǎng)皿菌落數(shù)小于3個(gè)的概率;大于1個(gè)的概率。該培養(yǎng)皿菌落數(shù)小于3個(gè)的概率為菌落數(shù)大于1個(gè)的概率為第七十七頁(yè),共一百頁(yè),編輯于2023年,星期日第三節(jié)正態(tài)分布一、正態(tài)分布的概念正態(tài)分布是自然界最常見(jiàn)的一種分布測(cè)量的誤差、人體的尺寸、許多生化指標(biāo)等等都近似服從正態(tài)分布。許多其它分布可用正態(tài)分布近似共同點(diǎn):變量的數(shù)值,中間多,兩邊漸少,近似對(duì)稱。
第七十八頁(yè),共一百頁(yè),編輯于2023年,星期日第七十九頁(yè),共一百頁(yè),編輯于2023年,星期日?qǐng)D4-4體模“骨密度”測(cè)量值的分布
----接近正態(tài)分布(頻率密度=頻率/組距)正態(tài)分布概率密度函數(shù)頻率密度第八十頁(yè),共一百頁(yè),編輯于2023年,星期日μ1μ2μ3第八十一頁(yè),共一百頁(yè),編輯于2023年,星期日正態(tài)概率密度曲線的位置與形狀具有如下特點(diǎn):
(1)關(guān)于X=μ對(duì)稱。
(2)鐘形曲線,X=μ處最大值
X
處有拐點(diǎn)
(3)曲線下面積為1。
(4)μ決定曲線在橫軸上的位置
(5)
決定曲線的形狀
N(μ,2)
表示均數(shù)為μ
、標(biāo)準(zhǔn)差為的正態(tài)分布。
第八十二頁(yè),共一百頁(yè),編輯于2023年,星期日68.27%95.44%99.74%μ-3σμ-2σμ-σμμ-σμ-2σμ-3σ圖4-6正態(tài)分布曲線下的面積分布二、
正態(tài)曲線下面積的分布規(guī)律二、
正態(tài)曲線下面積的分布規(guī)律二、
正態(tài)曲線下面積的分布規(guī)律第八十三頁(yè),共一百頁(yè),編輯于2023年,星期日若X服從正態(tài)分布,可作如下的標(biāo)準(zhǔn)化變換(稱Z變換)
則Z服從正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)學(xué)家編制了標(biāo)準(zhǔn)正態(tài)分布曲線下面積表(附表1)。標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)第八十四頁(yè),共一百頁(yè),編輯于2023年,星期日z0-1.961.960.0250.0250第八十五頁(yè),共一百頁(yè),編輯于2023年,星期日例4-10某地1986年120名8歲男孩身高
均數(shù)=123.02cm,標(biāo)準(zhǔn)差=4.79cm
試估計(jì)
(1)該地8歲男孩身高在130cm以上者占該地8歲男孩總數(shù)的百分比;
(2)身高在120cm~128cm者占該地8歲男孩總數(shù)的百分比;
(3)該地80%的男孩身高集中在哪個(gè)范圍?
(1)計(jì)算130對(duì)應(yīng)的Z值1.46-1.460.070.07圖4-9例4-10示意圖第八十六頁(yè),共一百頁(yè),編輯于2023年,星期日(2)身高在120cm~128cm者的百分比:
先計(jì)算120和128所對(duì)應(yīng)的Z值:120對(duì)應(yīng)的Z值為
128對(duì)應(yīng)的Z值為
正態(tài)曲線下區(qū)間(-0.63,1.04)上的面積等于(3)80%的身高集中在哪個(gè)范圍?標(biāo)準(zhǔn)正態(tài)分布曲線下左側(cè)面積為0.10所對(duì)應(yīng)的Z值為-1.28,所以80%的身高集中在第八十七頁(yè),共一百頁(yè),編輯于2023年,星期日三、正態(tài)變量的和與差的分布
不論X1和X2是否獨(dú)立,X1+X2
仍服從正態(tài)分布當(dāng)X1和X2獨(dú)立時(shí)
第八十八頁(yè),共一百頁(yè),編輯于2023年,星期日四、正態(tài)分布的應(yīng)用(一)確定醫(yī)學(xué)參考值范圍(referenceranges)
特定的“正?!比巳褐写蠖鄶?shù)個(gè)體的取值范圍“大多數(shù)個(gè)體”:習(xí)慣上指95%的個(gè)體正態(tài)分布法(若X服從正態(tài)分布)正態(tài)分布變量X在區(qū)間上取值的概率為0.95
第八十九頁(yè),共一百頁(yè),編輯于2023年,星期日例4-11調(diào)查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,
試估計(jì)該地健康女性血紅蛋白的95%參考值范圍。
雙側(cè)95%參考值范圍:
第九十頁(yè),共一百頁(yè),編輯于2023年,星期日必須注意:1)醫(yī)學(xué)參考值范圍在臨床上只能作為參考。2)若變量X的分布是正偏倚的,可經(jīng)對(duì)數(shù)變換變成近似正態(tài)分布,先求lnX的參考值范圍,再求反對(duì)數(shù),即得原變量X的參考值范圍。3)確定醫(yī)學(xué)參考值范圍必須抽取足夠例數(shù)的樣本。4)若測(cè)定值在性別間或年齡組間差別明顯,應(yīng)分“層”確定參考值范圍。5)若X不服從正態(tài)分布,用百分位數(shù)法
第九十一頁(yè),共一百頁(yè),編輯于2023年,星期日(二)質(zhì)量控制圖
控制圖:質(zhì)量控制的一個(gè)重要工具
基本原理:如果某一波動(dòng)僅僅由個(gè)體差異或隨機(jī)測(cè)量誤差所致,那么觀察結(jié)果服從正態(tài)分布。第九十二頁(yè),共一百頁(yè),編輯于2023年,星期日例4-12骨密度測(cè)量的質(zhì)量控制。
通常在每天開(kāi)機(jī)后首先對(duì)固定在機(jī)器內(nèi)的“體?!边M(jìn)行測(cè)量,將每天的“體?!睖y(cè)定值點(diǎn)在控制圖上,一旦出現(xiàn)8種情形之一:
(1)有一個(gè)點(diǎn)距中心線的距離超過(guò)3個(gè)標(biāo)準(zhǔn)差(位于控制限以外)。
(2)在中心線的一側(cè)連續(xù)有9個(gè)點(diǎn)。
(3)連續(xù)6個(gè)點(diǎn)穩(wěn)定地增
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 功能性電刺激儀系列相關(guān)行業(yè)投資方案范本
- 房屋買(mǎi)賣中介租賃合同
- 智慧城市規(guī)劃實(shí)施合同
- 腦卒中病人中醫(yī)護(hù)理方案
- 海洋服務(wù)相關(guān)行業(yè)投資規(guī)劃報(bào)告
- 2025年環(huán)氧塑封料合作協(xié)議書(shū)
- 工程地暖施工合同
- 借款借條合同的
- 軟件開(kāi)發(fā)過(guò)程與項(xiàng)目管理測(cè)試
- 2022年公共營(yíng)養(yǎng)師《國(guó)家職業(yè)資格三級(jí)(技能操作)》試題真題及答案
- 安全生產(chǎn)承包的合同
- 8.3 摩擦力(共28張) 2024-2025學(xué)年人教版物理八年級(jí)下冊(cè)
- 2025年陜西延長(zhǎng)石油物流集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025屆高考作文素材積累專題(春晚、哪吒2、deepseek)課件
- 2025年部編版語(yǔ)文三年級(jí)下冊(cè)全冊(cè)單元測(cè)試題附答案(共8個(gè)單元)
- 兒童腺樣體肥大治療方案-深度研究
- 2025年合肥經(jīng)濟(jì)技術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)帶答案
- 2025年懷化職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)必考題
- 2025年中國(guó)床墊機(jī)械行業(yè)市場(chǎng)發(fā)展監(jiān)測(cè)及投資戰(zhàn)略咨詢報(bào)告
- C小學(xué)一起諾如病毒胃腸炎疫情的調(diào)查與處置課件
- 2025年鎵礦采選項(xiàng)目投資可行性研究分析報(bào)告
評(píng)論
0/150
提交評(píng)論