寫出假設(shè)檢驗的基本步驟課件_第1頁
寫出假設(shè)檢驗的基本步驟課件_第2頁
寫出假設(shè)檢驗的基本步驟課件_第3頁
寫出假設(shè)檢驗的基本步驟課件_第4頁
寫出假設(shè)檢驗的基本步驟課件_第5頁
已閱讀5頁,還剩193頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

預防醫(yī)學基礎(chǔ)課件(第二版)制作:太原市衛(wèi)生學校石海蘭預防醫(yī)學基礎(chǔ)課件(第二版)制作:太原市衛(wèi)生學校石海1學習目標1.說出統(tǒng)計中幾個基本概念和統(tǒng)計工作的基本步驟2.學會根據(jù)不同的資料選擇適宜的集中趨勢和離散趨勢指標,并會進行計算。3.寫出假設(shè)檢驗的基本步驟,會作常用的t檢驗4.簡述常用相對數(shù)的種類及應(yīng)用時的注意事項5.能夠根據(jù)資料的性質(zhì)正確選擇檢驗方法,會作常用的檢驗6.統(tǒng)計表和統(tǒng)計圖的意義和制作方法,會根據(jù)不同資料選擇合適的統(tǒng)計圖第4章人群健康研究的統(tǒng)計方法學習目標第4章人群健康研究的統(tǒng)計方法2一、統(tǒng)計中的基本概念(一)同質(zhì)和變異

同質(zhì)(homogeneity)是指事物的性質(zhì)、影響條件或背景相同或相近。例如,研究兒童生長發(fā)育情況,應(yīng)選取同性別、同年齡兒童進行觀察。同質(zhì)個體間的差異,稱為變異(variation)。如研究兒童的身體發(fā)育,即使同質(zhì)(同性別、同年齡)兒童的身高,也有高有低,各不相同,稱為身高的變異。同一種藥物,同樣的劑量治療同樣病種的病人,其療效亦不一樣。同質(zhì)觀察單位之間的個體變異,是生物的重要特征。統(tǒng)計的任務(wù)就是在同質(zhì)分組的基礎(chǔ)上,通過對個體變異的研究,透過偶然現(xiàn)象,反映同質(zhì)事物的本質(zhì)特征和規(guī)律。第1節(jié)衛(wèi)生統(tǒng)計的基本概念和步驟一、統(tǒng)計中的基本概念第1節(jié)衛(wèi)生統(tǒng)計的基本概念和步驟3總體(population)是根據(jù)研究目的所確定的同質(zhì)的觀察單位的全體。樣本(sample)是從總體中隨機抽出的部分有代表性的個體。所謂隨機,即總體中的每一個個體均有同等的機會被抽取。這種從總體中抽取部分個體的過程稱為抽樣(sampling)。樣本所包含的個體數(shù)目,稱為樣本含量或樣本大小,用n表示。(二)總體和樣本總體(population)是根據(jù)研究目的所確定的同質(zhì)的4(三)抽樣誤差由于總體中各觀察單位間存在個體差異,抽樣研究中抽取的樣本,只包含總體的一部分觀察單位,因而,樣本指標不可能恰好等于相應(yīng)的總體指標。這種由于抽樣而引起的樣本指標與總體指標、樣本指標與樣本指標之間的差異,統(tǒng)計學上稱為抽樣誤差(samplingerror)。一般說來,樣本越大,則抽樣誤差越小,越和總體的情況相接近,用樣本推斷總體的精確度越高,反之亦然。由于個體變異是客觀存在的,因而抽樣誤差是不可避免的,但可以通過增加樣本含量來減小抽樣誤差。(三)抽樣誤差由于總體中各觀察單位間存在個體差異,抽樣研究5(四)資料的類型1.數(shù)值變量資料對每個觀察單位用定量方法測定某項指標的數(shù)值大小,所得的資料稱為數(shù)值變量資料,亦稱為計量資料(measurementdata)。2.分類變量資料將觀察單位按某種屬性或類別不同進行分類計數(shù)所得的資料,稱為分類變量資料。分類變量資料分為無序分類變量即計數(shù)資料(enumerationdata)和有序分類變量即等級資料(rankeddata)。(四)資料的類型1.數(shù)值變量資料6實際上,資料的類型可以根據(jù)研究分析的需要進行相互轉(zhuǎn)化。例如,觀察每個人的血紅蛋白含量(g/L),屬計量資料;若按血紅蛋白正常與異常分為兩組,清點各組人數(shù),則為計數(shù)資料;若將血紅蛋白含量(g/L)的多少分為五個等級:重度貧血、中度貧血、較度貧血、正常、血紅蛋白增高,清點各等級人數(shù),則成為等級資料。3.資料的轉(zhuǎn)化實際上,資料的類型可以根據(jù)研究分析的需要進行7概率(probability)是描述某事件或某現(xiàn)象發(fā)生的可能性大小的一個度量,用符號P來表示。根據(jù)事件發(fā)生可能性的大小,將所有事件分為三類:在一定條件下,肯定發(fā)生的事件稱為必然事件,肯定不發(fā)生的事件稱為不可能事件,可能發(fā)生也可能不發(fā)生的事件,稱為隨機事件或偶然事件。必然事件的概率等于1,不可能事件的概率等于0,隨機事件的概率介于0與1之間。(五)概率概率(probability)是描述某事8二、統(tǒng)計工作的基本步驟統(tǒng)計工作一般分四個步驟,即先有一個周密的設(shè)計、然后根據(jù)設(shè)計的要求搜集資料、整理資料和分析資料。這四個步驟是相互聯(lián)系、前后呼應(yīng)、不可分割的整體。(一)統(tǒng)計設(shè)計設(shè)計是統(tǒng)計工作的第一步,也是最關(guān)鍵的一步,是對統(tǒng)計工作全過程的設(shè)想和計劃,是今后研究工作應(yīng)遵循的依據(jù)。二、統(tǒng)計工作的基本步驟統(tǒng)計工作一般分四個步驟,即先有一個周9(二)搜集資料搜集資料(collectionofdata)是根據(jù)統(tǒng)計設(shè)計的要求,及時取得完整、準確的原始數(shù)據(jù)的過程。1.醫(yī)學研究資料的來源(1)日常醫(yī)療衛(wèi)生工作記錄(2)統(tǒng)計報表與報告卡(3)專題調(diào)查和實(試)驗資料2.搜集資料的注意事項搜集資料時應(yīng)注意資料的完整、準確、及時。(二)搜集資料搜集資料(collectionof10(三)整理資料整理資料(sortingdata)是根據(jù)設(shè)計的要求,對原始資料進行科學的加工、整理,使其條理化、系統(tǒng)化,以便進一步進行統(tǒng)計分析的過程。一般來說,整理資料首先應(yīng)檢查核對資料,檢查核對資料要注意以下幾點:1.資料的邏輯檢查2.從專業(yè)角度對資料的合理性進行檢查3.從專業(yè)角度對資料的一致性進行檢查(三)整理資料整理資料(sortingdata)是根據(jù)設(shè)計的11(四)分析資料分析資料(analysisofdata),就是將整理好的資料,按照設(shè)計的要求,進行統(tǒng)計描述和統(tǒng)計推斷,闡明事物的內(nèi)在規(guī)律。統(tǒng)計描述(descriptivestatistics)是將計算得到的統(tǒng)計指標與統(tǒng)計圖表結(jié)合,來描述數(shù)據(jù)的分布特征、變化趨勢等,為進一步進行統(tǒng)計推斷奠定基礎(chǔ)。統(tǒng)計推斷(inferentialstatistics)是根據(jù)研究目的和資料性質(zhì),利用樣本信息對總體特征進行估計和推斷的統(tǒng)計方法,包括參數(shù)估計和假設(shè)檢驗。分析資料時應(yīng)注意,不同資料類型,不同分析目的,使用的統(tǒng)計分析方法不同,本章后幾節(jié)將作詳細介紹。(四)分析資料分析資料(analysisofdata),就是12第2節(jié)數(shù)值變量資料的統(tǒng)計計量資料經(jīng)過整理后,可以計算一系列統(tǒng)計指標,以說明資料的特征,便于對資料作進一步的統(tǒng)計分析。平均數(shù)描述其集中趨勢或平均水平,標準差描述其離散程度或變異程度。當例數(shù)較多時,可先編制成頻數(shù)表,了解變量值的分布情況,然后再計算其統(tǒng)計指標。第2節(jié)數(shù)值變量資料的統(tǒng)計計量資料經(jīng)過整理后,可以計算一系13一、數(shù)值變量資料的頻數(shù)分布所謂頻數(shù)就是觀察值的個數(shù)。頻數(shù)表(frequencytable),即同時列出觀察值在其取值范圍內(nèi),于各組段中頻數(shù)分布情況的表格。1.頻數(shù)表的編制現(xiàn)舉例說明數(shù)值變量資料的頻數(shù)表編制方法。例4-1某年某市100名成年男子血清總膽固醇測定結(jié)果如表4-1,試編制頻數(shù)表。一、數(shù)值變量資料的頻數(shù)分布所謂頻數(shù)就是觀察值的個數(shù)。頻數(shù)表14表4-1某年某市100名成年男子血清

總膽固醇(mmol/L)測定結(jié)果3.374.795.104.775.324.505.104.704.445.164.376.255.554.563.354.084.633.614.974.175.775.094.385.184.795.154.795.304.774.404.895.863.403.384.555.154.244.325.853.245.853.043.896.164.585.724.875.174.614.124.434.316.144.882.704.606.554.764.486.515.183.915.394.524.473.644.095.966.144.696.364.605.094.473.564.234.345.185.694.256.303.954.035.385.217.224.314.715.213.975.124.554.903.055.204.745.543.933.506.38表4-1某年某市100名成年男子血清

總膽固醇(mmol/L15(1)求全距:全距(range)又稱極差,是觀察值中最大值與最小值之差,用R表示。即:R=Xmax-Xmin(公式4-1)式中:R—全距Xmax—最大值Xmin—最小值本例最大值Xmax=7.22mmol/L,最小值Xmin=2.70mmol/L,R=7.22-2.70=4.52(mmol/L)。(2)定組段數(shù)、組距:組段數(shù)一般分8~15個組為宜,根據(jù)全距和組段數(shù)確定組距(i)。組距可用公式4-2進行估算。i=R/k(公式4-2)本例i=4.52/10=0.452(mmol/L),為方便計算,取0.5mmol/L作為組距。(1)求全距:16

(3)劃分組段:各組段的界限應(yīng)清晰分明,第一組段應(yīng)包括最小值,最后一組段應(yīng)包括最大值。每一組段的起始值稱下限,終止值稱上限。為了避免交叉,各組段從下限開始(不包括下限),到本組段上限為止(包括上限),各組段上限、下限之間用“~”連接。注意:最后一組段應(yīng)同時寫出上下限。本例第一組段可為2.50~開始,包括最小值,第二組段3.00~,第三組段3.50~,……第十組段7.00~7.50

(3)劃分組段:17(4)歸組匯總:將原始數(shù)據(jù)進行歸納計數(shù),可用劃“正”字的方式(見表4-2第2列),并給出各組段的頻數(shù)f(見表4-2第3列),頻數(shù)表的編制即完成。(4)歸組匯總:18表4-2某年某地100名成年男子血清

總膽固醇(mmol/L)頻數(shù)表表4-2某年某地100名成年男子血清

總膽固醇(mmo19頻數(shù)表的用途

1.揭示變量值的頻數(shù)分布類型2.確定變量值的兩個重要特征3.便于發(fā)現(xiàn)某些特大和特小的可疑值4.便于進一步進行統(tǒng)計分析和處理頻數(shù)表的用途1.揭示變量值的頻數(shù)分布類型20二、集中趨勢指標集中趨勢指標又稱平均數(shù)(average),它反映一組觀察值的集中位置和平均水平,常作為一組資料平均水平的代表值,可用于不同組間的分析比較。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。應(yīng)用中要根據(jù)不同的資料分布類型選擇合適的平均數(shù)指標。二、集中趨勢指標集中趨勢指標又稱平均數(shù)(average),它21(一)算術(shù)均數(shù)1.適用條件:適用于頻數(shù)分布呈對稱分布資料,特別正態(tài)分布資料。2.計算方法①直接法②加權(quán)法(一)算術(shù)均數(shù)1.適用條件:適用22直接法

直接法23加權(quán)法

加權(quán)法24(二)幾何均數(shù)1.適用條件:適用于等比數(shù)列資料、對數(shù)正態(tài)分布資料(即原始數(shù)據(jù)呈偏態(tài)分布,但經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布的資料)及近似對數(shù)正態(tài)分布資料。2.計算方法①直接法②加權(quán)法(二)幾何均數(shù)1.適用條件:適用于等比數(shù)列資料、25直接法直接法26加權(quán)法加權(quán)法27(三)中位數(shù)1.適用條件中位數(shù)表示平均水平,不受資料分布類型的影響,因此應(yīng)用范圍較廣。常用于:(1)偏態(tài)分布資料;(2)數(shù)據(jù)的一端或兩端無明確界值的資料,即開口資料;(3)分布類型不清楚的資料。2.計算方法①直接法②頻數(shù)表法

(三)中位數(shù)1.適用條件中位數(shù)表示平均水平28直接法將觀察值按大小排序,當觀察值例數(shù)為奇數(shù)時,中位數(shù)就是位次居中的那個數(shù),即位次為(n+1)/2的那個數(shù);當觀察值例數(shù)為偶數(shù)時,中位數(shù)就是中間兩個數(shù)相加再除以2,即位次為n/2和(n/2+1)的兩個數(shù)的均數(shù)。直接法將觀察值按大小排序,當觀察值例數(shù)為奇數(shù)時,中位數(shù)就29頻數(shù)表法當為頻數(shù)表資料時,可先分別計算累計頻數(shù)和累計頻率(表4-4第3列、第4列),然后按公式4-8計算中位數(shù)。頻數(shù)表法當為頻數(shù)表資料時,可先分別計算累計頻數(shù)和30三、離散趨勢指標集中趨勢是數(shù)值變量資料的一個重要特征,但僅有集中趨勢指標還不能很好地描述數(shù)值變量資料的分布規(guī)律,還要有離散趨勢指標。為了比較全面地描述數(shù)值變量資料的分布規(guī)律,除了需要有描述集中趨勢的指標外,還需要有描述離散趨勢的指標。離散趨勢又稱離散程度、變異程度。常用的離散趨勢指標有全距、方差、標準差、變異系數(shù)等。三、離散趨勢指標集中趨勢是數(shù)值變量資料的一個重要特征,但僅有31(一)全距全距又稱極差,用符號R表示,是觀察值中最大值與最小值的差值。如例4-9中,R甲=4,R乙和R丙均=8,甲組的全距小,乙、丙兩組的全距大,說明甲組的離散程度小,乙、丙兩組的離散程度大。全距的優(yōu)點是計算方便,容易理解;缺點是其大小僅與最大值、最小值有關(guān),不能客觀地反映其它觀察值的變異情況。如本例,乙、丙兩組資料的離散程度何者更大,全距無法反映。(一)全距全距又稱極差,用符號R表示,是觀察值中最大值與最小32(二)方差為了克服全距的缺陷,必須考慮每一個觀察值對離散程度的影響。方差(variance)是常用的離散趨勢指標,用σ2表示,計算公式為:(二)方差為了克服全距的缺陷,必須考慮每一個觀察33由于醫(yī)學研究中常用抽樣研究,總體方差往往是未知的,常用樣本方差來估計,樣本方差用s2表示。統(tǒng)計研究發(fā)現(xiàn),用樣本資料計算出的樣本方差往往比總體方差偏小,為了得到較為準確的結(jié)果,將樣本方差分母中n減去1,則計算公式為:由于醫(yī)學研究中常用抽樣研究,總體方差往往是未知的,常用樣本34(三)標準差方差因計算方便的原因,原有的計量單位被平方,這不利于進一步統(tǒng)計處理,因此人們常用方差的平方根——標準差(standarddeviation)替代方差描述資料的離散程度??傮w標準差(用σ表示)、樣本標準差(用s表示)計算公式分別為:(三)標準差方差因計算方便的原因,原有的計量單位被平方,這不351.標準差的計算直接法未分組的資料,可用公式4-12直接計算。但此公式計算先得求出均數(shù),在實際工作中這樣運算很不方便,經(jīng)數(shù)學推導,公式4-12可轉(zhuǎn)變?yōu)椋?.標準差的計算直接法未分組的資料,可用公式4-12直接36加權(quán)法與加權(quán)法計算均數(shù)一樣,當相同觀察值較多或頻數(shù)表資料時,可按公式4-14計算:

加權(quán)法與加權(quán)法計算均數(shù)一樣,當相同觀察值較多或頻數(shù)表資料372.標準差的應(yīng)用

表示變量值的離散程度標準差表示變量值的變異程度時,要求單位相同,均數(shù)相近。標準越大,表示變量值的變異程度越大;反之標準差越小,表示變量值的變異程度越小。根據(jù)正態(tài)分布原理,應(yīng)用于概括估計觀察值的頻數(shù)分布和醫(yī)學參考值范圍。可以計算變異系數(shù)和標準誤。2.標準差的應(yīng)用表示變量值的離散程度標準差表示38(四)變異系數(shù)當所比較的兩組或多組資料的單位不同或均數(shù)相差懸殊時,不能用標準差直接比較其離散程度,而應(yīng)用變異系數(shù)(coefficientofvariation,用CV表示)。變異系數(shù)又稱離散系數(shù),是標準差與均數(shù)的比值,常用百分數(shù)表示,計算公式為:(四)變異系數(shù)當所比較的兩組或多組資料的單位不同或均數(shù)相差懸39變異系數(shù)沒有單位,常用于:

①計量單位不同的資料間的比較②均數(shù)相差懸殊資料間的比較變異系數(shù)沒有單位,常用于:①計量單40四、假設(shè)檢驗—t檢驗(一)假設(shè)檢驗的概念假設(shè)檢驗(hypothesistest)是統(tǒng)計推斷的另一重要內(nèi)容,亦稱顯著性檢驗(significanttest)。假設(shè)檢驗是對所檢驗的總體先提出一個假設(shè),然后通過統(tǒng)計分析去推斷是否拒絕這一假設(shè)。如兩組1歲嬰兒的頭圍均數(shù),甲組為45cm,乙組為42cm,這兩組均數(shù)不同可能是抽樣誤差引起,也可能是本質(zhì)不同。在下結(jié)論前首先要區(qū)別兩組均數(shù)間差異的性質(zhì)和來源。若是由于抽樣誤差引起的差異,統(tǒng)計上認為無顯著意義,如果這種差異超出了抽樣誤差的范圍,那么很可能是本質(zhì)原因引起的差異,統(tǒng)計上稱這種差異有顯著意義。判斷兩個均數(shù)之差有無顯著意義的假設(shè)檢驗,常用t檢驗。四、假設(shè)檢驗—t檢驗(一)假設(shè)檢驗的概念41(二)假設(shè)檢驗的基本步聚1.建立假設(shè)和確定檢驗水準2.選定檢驗方法并計算統(tǒng)計量3.確定P值4.判斷結(jié)果(二)假設(shè)檢驗的基本步聚1.建立假設(shè)和確定檢42(三)常用的t檢驗假設(shè)檢驗的具體方法,通常用檢驗統(tǒng)計量來命名。如檢驗統(tǒng)計量為t則稱t檢驗,檢驗統(tǒng)計量為u則稱u檢驗。實際應(yīng)用時應(yīng)注意各種檢驗方法的用途、適用條件和注意事項。常用的兩均數(shù)假設(shè)檢驗的方法有:(三)常用的t檢驗假設(shè)檢驗的具體方法,通常用檢驗統(tǒng)計量來命名431.樣本均數(shù)與總體均數(shù)比較的t檢驗

一般把標準值、理論值或經(jīng)大量調(diào)查所得的穩(wěn)定值作為已知的總體均數(shù)μ0。樣本均數(shù)與總體均數(shù)比較的目的是推斷樣本所代表的總體均數(shù)(未知的)與已知總體均數(shù)μ0有無差別。t值計算公式如下:1.樣本均數(shù)與總體均數(shù)比較的t檢驗一般把標準值、理論值或經(jīng)442.配對計量資料比較的t檢驗

在醫(yī)學研究中,為了減少誤差,提高檢驗效率,常采用配對設(shè)計(paireddesign)。配對設(shè)計主要有:①將試驗對象按照一定的條件配成若干對,然后隨機將每對中的兩個觀察單位分配到實驗組和對照組中去,給以不同的處理,觀察某種指標的變化;②同一組試驗對象在處理前后觀察某種指標的變化;③對同一樣品用兩種方法檢測結(jié)果的比較等。其假設(shè)檢驗的目的是推斷兩種處理或處理前后的結(jié)果有無差別。計算公式如下:2.配對計量資料比較的t檢驗在醫(yī)學研究中,為了減少誤差,提45寫出假設(shè)檢驗的基本步驟課件463.兩個小樣本均數(shù)比較的t檢驗

在醫(yī)學研究中,能夠進行配對比較的資料較少,更多的是兩組資料的比較。目的是推斷兩樣本各自代表的總體均數(shù)μ1與μ2是否相等。當兩個樣本含量較小時,n1+n2<100,用t檢驗,t值的計算公式如下:3.兩個小樣本均數(shù)比較的t檢驗在醫(yī)學研究中,能夠進行配對比47寫出假設(shè)檢驗的基本步驟課件484.假設(shè)檢驗的注意事項

要注意用單側(cè)還是雙側(cè)檢驗要注意每種方法的應(yīng)用條件要注意資料的可比性要注意判斷結(jié)果不能絕對化要注意實際差別大小與統(tǒng)計意義的區(qū)別4.假設(shè)檢驗的注意事項要注意用單側(cè)還是雙側(cè)檢驗49第3節(jié)分類變量資料的統(tǒng)計在醫(yī)療衛(wèi)生工作中,通過日常醫(yī)療衛(wèi)生工作記錄、統(tǒng)計報表、現(xiàn)場調(diào)查、實驗研究所搜集來的一些數(shù)據(jù),如人口數(shù)、出生數(shù)、治愈數(shù)、陽性數(shù)、陰性數(shù)等都是絕對數(shù)。絕對數(shù)可以反映事物在某時某地出現(xiàn)的實際情況,是統(tǒng)計分析和制訂計劃的基礎(chǔ)。但絕對數(shù)的大小,常受基數(shù)多少的影響,不便于進行深入的分析比較。要比較資料的情況,必須計算相對數(shù),再進行比較,才能得出正確的結(jié)論。一、相對數(shù)常用指標第3節(jié)分類變量資料的統(tǒng)計在醫(yī)療衛(wèi)生工作中,通過日常醫(yī)療衛(wèi)501.相對數(shù)的概念

相對數(shù)(relativenumber)是兩個有聯(lián)系指標的比值,常用于分類變量即計數(shù)資料的統(tǒng)計分析。1.相對數(shù)的概念相對數(shù)(rela512.相對數(shù)的種類及計算方法(1)率(rate):又稱頻率指標,說明某現(xiàn)象發(fā)生的頻率或強度。常以百分率(%)、千分率(‰)、萬分率(1/萬)、10萬分率(1/10萬)等表示。計算公式為:2.相對數(shù)的種類及計算方法(1)率(rate):又稱頻率指標52計算時比例基數(shù)的選擇,主要依據(jù)習慣用法或使算得的率至少保留一位整數(shù),以便于閱讀、比較。如有效率、治愈率,習慣上用百分率;出生率、死亡率、人口自然增長率,習慣上用千分率;某病死亡專率、惡性腫瘤發(fā)病率,習慣上用萬分率、10萬分率等。計算時比例基數(shù)的選擇,主要依據(jù)習慣用法或使算得的率至少保留53(2)構(gòu)成比(proportion)

又稱構(gòu)成指標,它表示某一事物內(nèi)部各組成部分所占的比重或分布。常用100為基數(shù),以百分比表示,計算公式為:(2)構(gòu)成比(proportion)54

一般來說,構(gòu)成比的總和為100%(亦可表示為1),但有時由于計算尾數(shù)取舍的關(guān)系,其總和不一定恰好等于100%,需對各構(gòu)成比的尾數(shù)作適當調(diào)整,使構(gòu)成比的總和等于100%。事物各構(gòu)成部分構(gòu)成比的大小,受兩方面因素的影響,一是該部分自身數(shù)值變化的影響,這一影響易被人們所察覺;二是其它部分數(shù)值變化的影響,這一影響往往被人們所忽視。一般來說,構(gòu)成比的總和為100%(亦55(3)相對比(relativeratio)

相對比是兩個有關(guān)指標之比。例如,不同地區(qū)、不同單位或不同時期的兩個有關(guān)指標(可以是絕對數(shù)、相對數(shù)或平均數(shù))之比,可反映兩者之間的差別變化情況。相對比通常用百分數(shù)(%)或倍數(shù)表示。其計算公式為:(3)相對比(relativeratio)563.醫(yī)療衛(wèi)生工作中常用相對數(shù)指標1.死亡率或稱粗死亡率2.病死率:3.發(fā)病率:4.患病率(或稱現(xiàn)患率)3.醫(yī)療衛(wèi)生工作中常用相對數(shù)指標1.死亡率或稱粗死亡率57死亡率或稱粗死亡率死亡率或稱粗死亡率:表示某地某年每千人口中的死亡人數(shù)。常受各地人口、年齡、性別等構(gòu)成因素的影響,需進行標準化后才能進行相互比較。同年平均人口數(shù)以上年末人口數(shù)加本年末人口數(shù)除以2。死亡率或稱粗死亡率死亡率或稱粗死亡率:表示某地某58病死率指在觀察期內(nèi),某病患者中因該病而死亡的頻率。應(yīng)與死亡率相區(qū)別。兩者分母不同,計算結(jié)果的意義也不同。病死率指在觀察期內(nèi),某病患者中因59發(fā)病率

表示一定時期(通常為1年)內(nèi)某人群發(fā)生某病新病例的頻率。所謂新病例指每發(fā)生一種病算一種新病例,如某病治愈后再次發(fā)作,算兩個新病例。發(fā)病率表示一定時期(通常為1年)60患病率(或稱現(xiàn)患率)表示某一時點(一般不超過一個月)某人群中患某病的頻率。一般用于表示病程長的慢性病存在或流行的頻率?;疾÷剩ɑ蚍Q現(xiàn)患率)表示某一時點(一般不超過一個614.應(yīng)用相對數(shù)的注意事項

不要混淆率與構(gòu)成比。計算相對數(shù)時分母不宜過小。要注意平均率的計算。兩個率或構(gòu)成比比較時應(yīng)作假設(shè)檢驗。要注意資料的可比性。4.應(yīng)用相對數(shù)的注意事項不要混淆率與構(gòu)成比。62

構(gòu)成比說明某部分占全體的比重,率說明事物發(fā)生的概率,兩者計算不同,說明的問題也不同,但由于兩指標同屬于相對數(shù)范疇,有時又都用100作基數(shù),所以易于混淆。常見的錯誤是把構(gòu)成比當作率來應(yīng)用。構(gòu)成比說明某部分占全體的比重,率說明事63一般說來,調(diào)查和實驗觀察單位應(yīng)有足夠的數(shù)量。觀察單位足夠時,計算的相對數(shù)比較穩(wěn)定,能夠正確反映實際情況。如果觀察例數(shù)過少,計算的相對數(shù)可靠性較差,此時應(yīng)以絕對數(shù)直接表示為好。例如4名患者2名治愈,最好用絕對數(shù)表示。一般說來,調(diào)查和實驗觀察單位應(yīng)有足夠64計算率的平均值時,不能將各組率相加,然后除以組數(shù)。如計算表4-8資料各年齡組人群平均患病率時,不能將各年齡組患病率相加后求平均率,而應(yīng)該將各年齡組檢查人數(shù)與病人數(shù)分別相加,然后以總病人數(shù)除以總檢查人數(shù)。計算率的平均值時,不能將各組率相加,65兩個率或構(gòu)成比比較時應(yīng)作假設(shè)檢驗在抽樣研究中,率和構(gòu)成比也存在抽樣誤差,所以比較構(gòu)成比或率時,不能僅憑表面數(shù)據(jù)直接下結(jié)論,應(yīng)進行差別的顯著性檢驗。兩個率或構(gòu)成比比較時應(yīng)作假設(shè)檢驗66

所謂可比性,即除了兩者被比較的因素不同以外,其余可能影響結(jié)果的因素應(yīng)盡可能相同或相近。一般應(yīng)注意:①所要比較資料的時間、地點、方法等是否相同;②所要比較對象的年齡、性別等因素的構(gòu)成是否相同,如果要比較組的年齡、性別等構(gòu)成不同,應(yīng)計算分年齡組、分性別的率,或者計算標準化率。所謂可比性,即除了兩者被比較的因素不同以67二、檢驗

x2檢驗是一種用途較廣的假設(shè)檢驗方法,常用于計數(shù)資料的統(tǒng)計分析。x2檢驗最常用于比較兩個或多個率(或構(gòu)成比)差別有無顯著性。按照設(shè)計類型不同,可將x2檢驗分為四格表資料x2檢驗、配對資料x2檢驗等。二、檢驗x2檢驗是一種用途較廣68(一)四格表資料檢驗

比較2個樣本率之間差別有無統(tǒng)計意義,除了可以用率的u檢驗外,還可以用四格表資料x2檢驗。四格表指2行2列組成的的表格,其基本數(shù)據(jù)只有4個。(一)四格表資料檢驗比較2691.檢驗公式1.檢驗公式702.應(yīng)用范圍和注意事項

2.應(yīng)用范圍和注意事項71表4-10界值表自由度ν概率P0.050.0113.846.6325.999.2137.8111.3449.4913.28511.0715.09612.5916.81714.0718.48815.5120.09916.9221.671018.3123.21表4-10界值表自由度ν概率P0.050.01172寫出假設(shè)檢驗的基本步驟課件73(二)配對資料的檢驗

配對計數(shù)資料的兩個樣本中,實驗單位一一配對,或同一實驗單位先后給以兩種不同處理。1.配對x2檢驗公式(二)配對資料的檢驗配對計數(shù)資料的兩個樣本中,實742.應(yīng)用范圍和注意事項2.應(yīng)用范圍和注意事項75第4節(jié)統(tǒng)計表與統(tǒng)計圖一、統(tǒng)計表統(tǒng)計表(statisticaltable)是用表格的形式來表達統(tǒng)計分析的事物及其指標。廣義的統(tǒng)計表包括調(diào)查資料所用的調(diào)查表、整理資料所用的整理匯總表以及分析資料所用的統(tǒng)計分析表等;狹義的統(tǒng)計表僅指統(tǒng)計分析表。第4節(jié)統(tǒng)計表與統(tǒng)計圖一、統(tǒng)計表76(一)統(tǒng)計表的結(jié)構(gòu)

一張統(tǒng)計表的必備部分通常包括標題、標目、數(shù)字和線條,基本格式如下所示:(一)統(tǒng)計表的結(jié)構(gòu)一張統(tǒng)計表的必備部分77(二)制表的基本要求1.標題(title)標題位于表格的上方中央,標題要求簡明扼要地說明表的中心內(nèi)容,必要時注明資料的時間和地點。標題不能過于簡略,也不能過于繁瑣,更不能無標題或標題不確切。若有兩個以上的統(tǒng)計表,在標題的前面應(yīng)有表序,以備查找。2.標目(heading)標目是說明表中數(shù)字含義的部分,分橫標目和縱標目。橫標目是用來說明表中被研究事物或?qū)ο蟮闹饕獦酥?,是表的主語,列在表的左側(cè),說明表內(nèi)同一橫行的含義;縱標目用來說明橫標目各種統(tǒng)計指標結(jié)果,是表的謂語,列在表的右側(cè)上方,說明表內(nèi)同一縱列數(shù)字的含義。標目不能過多,層次一定要清楚。(二)制表的基本要求1.標題(783.線條(line)表內(nèi)只有橫線,豎線和斜線一律不要。橫線也不宜過多,常用三條基本線表示,即頂線和底線,以及隔開縱標目和數(shù)字的一條橫線。如有合計,再加一條隔開合計與數(shù)字的線。通常頂線和底線略粗一點,另兩條線可略細一點。4.數(shù)字(figure)表內(nèi)數(shù)字必須準確,一律用阿拉伯數(shù)字來表示,所有數(shù)字位次對齊,同一指標的小數(shù)位數(shù)應(yīng)一致,表內(nèi)不得留有空格。資料暫缺或未記錄用“…”表示,未調(diào)查、無數(shù)字用“―”表示,數(shù)字若為“0”,則寫“0”。5.備注(footnate)不是表的必備部分,當有需要說明的問題時,用“*”號標出,列在表的下方。3.線條(line)表內(nèi)79(三)統(tǒng)計表的種類

1.簡單表(simpletable)按一種特征或標志分組,即由一組橫標目和一組縱標目組成的統(tǒng)計表。如表4-14。2.復合表(combinativetable)按兩種或兩種以上特征或標志分組,即由兩組及兩組以上的橫標目和縱標目組成的統(tǒng)計表。(三)統(tǒng)計表的種類180(四)統(tǒng)計表的修改

完整的統(tǒng)計表要從表達資料的目的、標題、縱橫標目、線條、數(shù)字等方面來評價,力求做到簡明、直觀,便于比較。(四)統(tǒng)計表的修改完整的統(tǒng)計表要從表達資料81二、統(tǒng)計圖

統(tǒng)計圖(statisticalchart)是用點的位置、線段升降、直條長短、面積大小等形式來表達統(tǒng)計分析的結(jié)果,反映事物及其指標間的數(shù)量關(guān)系。統(tǒng)計圖比較形象、直觀,使讀者一目了然,印象清晰。但統(tǒng)計圖只能給出概括的印象,不能非常準確地表達數(shù)據(jù),一般需要結(jié)合文字進行描述。醫(yī)學統(tǒng)計中常用的有條圖、百分條圖、圓圖、線圖、半對數(shù)線圖、直方圖、散點圖和統(tǒng)計地圖等。二、統(tǒng)計圖統(tǒng)計圖(statisticalc82(一)制作統(tǒng)計圖的基本要求

1.選圖根據(jù)資料的性質(zhì)和分析目的選擇合適的圖形。2.標題要簡明扼要,概括說明資料的主要內(nèi)容,必要時注明時間、地點;有兩個以上圖時,標題前面加上圖號,編號一般用圖加阿拉伯數(shù)字表示,標題及圖號寫在圖的正下方。3.標目縱橫兩軸應(yīng)有標目,并應(yīng)注明標目單位。(一)制作統(tǒng)計圖的基本要求1.選圖根據(jù)資834.尺度橫軸尺度自左而右,縱軸尺度自下而上,數(shù)值一律由小到大,等距或有一定的規(guī)律性地標明。5.比例除圓形圖外,圖形的縱橫軸比例一般以5:7為宜,過大或過小易造成錯覺。6.圖例當比較不同地區(qū)或同一地區(qū)不同時間某一事物的變化情況時,須用不同的線條或顏色表示,并附圖例說明。4.尺度橫軸尺度自左而右,縱軸尺度自下而上,84(二)常用統(tǒng)計圖的種類和繪制方法1.直條圖(barchart)簡稱條圖,是用等寬直條的長短來表示相互獨立的各指標的數(shù)值大小。如不同的地區(qū)、不同的病種、不同的科室、不同的疾病名稱等。分單式條圖(圖4-1)和復式條圖(圖4-2)兩種。(二)常用統(tǒng)計圖的種類和繪制方法1.直條圖(barchar85圖4-1某年某地五種惡性腫瘤的死亡專率

圖4-1某年某地五種惡性腫瘤的死亡專率86圖4-2某醫(yī)院用兩種中藥治療不同類型慢性氣管炎的療效

圖4-2某醫(yī)院用兩種中藥治療不同類型慢性氣管炎的療效87繪制要點如下①坐標軸:橫軸為觀察項目,縱軸為數(shù)值,縱軸坐標一定要從0開始。②直條的寬度:各直條應(yīng)等寬,等間距,間距寬度和直條相等或為其一半。復式直條圖在同一觀察項目的各組之間無間距。③排列順序:可以根據(jù)數(shù)值從大到小,從小到大,或按時間順序排列。

繪制要點如下①坐標軸:橫軸為觀察項目,縱軸為882.百分條圖(percentagebarchart)

適用于構(gòu)成比資料,用來表示全體中各部分所占的比重。繪制要點如下:①標尺:一定要有標尺,畫在圖的上方或下方,起始的位置、總長度和百分條圖一致,并和百分條圖平行。全長為100%,分成10格,每格10%。②分段:按各部分所占百分比的大小排列,可以在圖上用數(shù)字標出百分比。③圖例:在圖外用附圖例說明。④多組比較:若要比較的事物不止一個時,可以畫幾個平行的百分條圖,以利于比較。各條圖的排列順序相同,圖例相同。2.百分條圖(percentagebarcha89圖4-3某地1995年五種主要死因構(gòu)成圖4-3某地1995年五種主要死因構(gòu)成903.圓形圖(piechart)

適用的資料、用途和百分直條圖相同。以圓形的面積為100%,將百分比轉(zhuǎn)化為角度,把圓形的面積按比例分成若干部分,以角度大小來表示各部分所占的比重。繪制要點如下:①由于圓周為360度,以每1%相當于3.6度的圓周角,將百分比乘3.6度即為所占扇形的度數(shù)。用量角器畫出。②從相當于時鐘12點或9點的位置開始順時針方向繪圖。③每部分用不同線條或顏色表示,并在圖上標出百分比,并附圖例說明。④當比較不同資料的百分構(gòu)成時,可以畫兩個相等大小的圓,在每個圓的下面寫明標題,并用相同的圖例表示同一構(gòu)成部分。3.圓形圖(piechart)適用的資料、91圖4-4某地1995年五種主要死因構(gòu)成

圖4-4某地1995年五種主要死因構(gòu)成924.線圖(linediagram)

以線段的上升或下降來表示事物在時間上的發(fā)展變化或一種現(xiàn)象隨另一種現(xiàn)象變遷的情況,適用于連續(xù)性資料。繪制要點如下:①橫軸表示某一連續(xù)變量(時間或年齡),縱軸表示某種率或頻數(shù)。②數(shù)據(jù)點畫在組段中間位置。相鄰的點用直線連接,不能任意改為光滑曲線。③同一張圖不要畫太多條線,否則不易分清。當有兩條或兩條以上曲線在同一張線圖上時,須用不同顏色或不同的圖形形式加以區(qū)分,并附圖例加以說明。圖4-5按表4-21資料繪制。4.線圖(linediagram)93圖4-5某地1981-1990年某傳染病病死率

圖4-5某地1981-1990年某傳染病病死率945.直方圖(histogram)

以各矩形的面積來代表各組頻數(shù)的多少,適用于連續(xù)變量的頻數(shù)分布。繪制要點如下:①坐標軸:橫軸代表變量值,要用相等的距離表示相等的數(shù)量??v軸坐標要從0開始。②各矩形間不留空隙。③對于組距相等的資料可以直接作圖;組距不等的資料先進行換算,全部轉(zhuǎn)化為組距相等的頻數(shù),用轉(zhuǎn)化后的頻數(shù)作圖。5.直方圖(histogram)以各95圖4-6某年某地100名成年男子血清總膽固醇頻數(shù)分布圖

圖4-6某年某地100名成年男子血清總膽固醇頻數(shù)分布圖96小結(jié)

本章主要介紹了人群健康研究的統(tǒng)計方法。具體內(nèi)容包括統(tǒng)計工作的四大基本步驟,即統(tǒng)計設(shè)計、搜集資料、整理資料和分析資料;統(tǒng)計中關(guān)于總體和樣本、抽樣誤差、資料的類型、概率等基本概念,數(shù)值變量資料表示集中趨勢的指標:算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)的計算及應(yīng)用;表示離散趨勢的指標:全距、方差、標準差和變異系數(shù);兩均數(shù)比較常用的假設(shè)檢驗方法:t檢驗;分類變量資料常用統(tǒng)計指標:率、構(gòu)成比、相對比的意義和計算;小結(jié)本章主要介紹了人群健康研究的統(tǒng)計方法。具體內(nèi)97

醫(yī)療衛(wèi)生工作常用相對數(shù)指標:發(fā)病率和患病率,病死率和死亡率。分類變量資料常用的統(tǒng)計分析方法:四格表資料檢驗和配對資料檢驗;統(tǒng)計表的編制要求及常用統(tǒng)計圖中直條圖、構(gòu)成圖、線圖、直方圖等的繪制。對應(yīng)于本章的內(nèi)容,編制了三個實習,供學生選擇練習,以加深對本章內(nèi)容的理解和掌握。

醫(yī)療衛(wèi)生工作常用相對數(shù)指標:發(fā)病率和患病率,病死率98思考題統(tǒng)計資料的類型分哪幾種?請舉例說明資料的性質(zhì)。結(jié)合生活實際,正確理解“小概率事件”概念。區(qū)別三種均數(shù)的適用范圍。說出標準差和變異系數(shù)的區(qū)別。試述t檢驗的適用范圍及其注意事項。說出常用相對數(shù)的種類和應(yīng)用注意事項。區(qū)別一般四格表和配對四格表。什么是統(tǒng)計表?其基本格式與要求有哪些?如何根據(jù)資料的性質(zhì)和分析目的選擇合適的統(tǒng)計圖?思考題統(tǒng)計資料的類型分哪幾種?請舉例說明資料的性質(zhì)。99預防醫(yī)學基礎(chǔ)課件(第二版)制作:太原市衛(wèi)生學校石海蘭預防醫(yī)學基礎(chǔ)課件(第二版)制作:太原市衛(wèi)生學校石海100學習目標1.說出統(tǒng)計中幾個基本概念和統(tǒng)計工作的基本步驟2.學會根據(jù)不同的資料選擇適宜的集中趨勢和離散趨勢指標,并會進行計算。3.寫出假設(shè)檢驗的基本步驟,會作常用的t檢驗4.簡述常用相對數(shù)的種類及應(yīng)用時的注意事項5.能夠根據(jù)資料的性質(zhì)正確選擇檢驗方法,會作常用的檢驗6.統(tǒng)計表和統(tǒng)計圖的意義和制作方法,會根據(jù)不同資料選擇合適的統(tǒng)計圖第4章人群健康研究的統(tǒng)計方法學習目標第4章人群健康研究的統(tǒng)計方法101一、統(tǒng)計中的基本概念(一)同質(zhì)和變異

同質(zhì)(homogeneity)是指事物的性質(zhì)、影響條件或背景相同或相近。例如,研究兒童生長發(fā)育情況,應(yīng)選取同性別、同年齡兒童進行觀察。同質(zhì)個體間的差異,稱為變異(variation)。如研究兒童的身體發(fā)育,即使同質(zhì)(同性別、同年齡)兒童的身高,也有高有低,各不相同,稱為身高的變異。同一種藥物,同樣的劑量治療同樣病種的病人,其療效亦不一樣。同質(zhì)觀察單位之間的個體變異,是生物的重要特征。統(tǒng)計的任務(wù)就是在同質(zhì)分組的基礎(chǔ)上,通過對個體變異的研究,透過偶然現(xiàn)象,反映同質(zhì)事物的本質(zhì)特征和規(guī)律。第1節(jié)衛(wèi)生統(tǒng)計的基本概念和步驟一、統(tǒng)計中的基本概念第1節(jié)衛(wèi)生統(tǒng)計的基本概念和步驟102總體(population)是根據(jù)研究目的所確定的同質(zhì)的觀察單位的全體。樣本(sample)是從總體中隨機抽出的部分有代表性的個體。所謂隨機,即總體中的每一個個體均有同等的機會被抽取。這種從總體中抽取部分個體的過程稱為抽樣(sampling)。樣本所包含的個體數(shù)目,稱為樣本含量或樣本大小,用n表示。(二)總體和樣本總體(population)是根據(jù)研究目的所確定的同質(zhì)的103(三)抽樣誤差由于總體中各觀察單位間存在個體差異,抽樣研究中抽取的樣本,只包含總體的一部分觀察單位,因而,樣本指標不可能恰好等于相應(yīng)的總體指標。這種由于抽樣而引起的樣本指標與總體指標、樣本指標與樣本指標之間的差異,統(tǒng)計學上稱為抽樣誤差(samplingerror)。一般說來,樣本越大,則抽樣誤差越小,越和總體的情況相接近,用樣本推斷總體的精確度越高,反之亦然。由于個體變異是客觀存在的,因而抽樣誤差是不可避免的,但可以通過增加樣本含量來減小抽樣誤差。(三)抽樣誤差由于總體中各觀察單位間存在個體差異,抽樣研究104(四)資料的類型1.數(shù)值變量資料對每個觀察單位用定量方法測定某項指標的數(shù)值大小,所得的資料稱為數(shù)值變量資料,亦稱為計量資料(measurementdata)。2.分類變量資料將觀察單位按某種屬性或類別不同進行分類計數(shù)所得的資料,稱為分類變量資料。分類變量資料分為無序分類變量即計數(shù)資料(enumerationdata)和有序分類變量即等級資料(rankeddata)。(四)資料的類型1.數(shù)值變量資料105實際上,資料的類型可以根據(jù)研究分析的需要進行相互轉(zhuǎn)化。例如,觀察每個人的血紅蛋白含量(g/L),屬計量資料;若按血紅蛋白正常與異常分為兩組,清點各組人數(shù),則為計數(shù)資料;若將血紅蛋白含量(g/L)的多少分為五個等級:重度貧血、中度貧血、較度貧血、正常、血紅蛋白增高,清點各等級人數(shù),則成為等級資料。3.資料的轉(zhuǎn)化實際上,資料的類型可以根據(jù)研究分析的需要進行106概率(probability)是描述某事件或某現(xiàn)象發(fā)生的可能性大小的一個度量,用符號P來表示。根據(jù)事件發(fā)生可能性的大小,將所有事件分為三類:在一定條件下,肯定發(fā)生的事件稱為必然事件,肯定不發(fā)生的事件稱為不可能事件,可能發(fā)生也可能不發(fā)生的事件,稱為隨機事件或偶然事件。必然事件的概率等于1,不可能事件的概率等于0,隨機事件的概率介于0與1之間。(五)概率概率(probability)是描述某事107二、統(tǒng)計工作的基本步驟統(tǒng)計工作一般分四個步驟,即先有一個周密的設(shè)計、然后根據(jù)設(shè)計的要求搜集資料、整理資料和分析資料。這四個步驟是相互聯(lián)系、前后呼應(yīng)、不可分割的整體。(一)統(tǒng)計設(shè)計設(shè)計是統(tǒng)計工作的第一步,也是最關(guān)鍵的一步,是對統(tǒng)計工作全過程的設(shè)想和計劃,是今后研究工作應(yīng)遵循的依據(jù)。二、統(tǒng)計工作的基本步驟統(tǒng)計工作一般分四個步驟,即先有一個周108(二)搜集資料搜集資料(collectionofdata)是根據(jù)統(tǒng)計設(shè)計的要求,及時取得完整、準確的原始數(shù)據(jù)的過程。1.醫(yī)學研究資料的來源(1)日常醫(yī)療衛(wèi)生工作記錄(2)統(tǒng)計報表與報告卡(3)專題調(diào)查和實(試)驗資料2.搜集資料的注意事項搜集資料時應(yīng)注意資料的完整、準確、及時。(二)搜集資料搜集資料(collectionof109(三)整理資料整理資料(sortingdata)是根據(jù)設(shè)計的要求,對原始資料進行科學的加工、整理,使其條理化、系統(tǒng)化,以便進一步進行統(tǒng)計分析的過程。一般來說,整理資料首先應(yīng)檢查核對資料,檢查核對資料要注意以下幾點:1.資料的邏輯檢查2.從專業(yè)角度對資料的合理性進行檢查3.從專業(yè)角度對資料的一致性進行檢查(三)整理資料整理資料(sortingdata)是根據(jù)設(shè)計的110(四)分析資料分析資料(analysisofdata),就是將整理好的資料,按照設(shè)計的要求,進行統(tǒng)計描述和統(tǒng)計推斷,闡明事物的內(nèi)在規(guī)律。統(tǒng)計描述(descriptivestatistics)是將計算得到的統(tǒng)計指標與統(tǒng)計圖表結(jié)合,來描述數(shù)據(jù)的分布特征、變化趨勢等,為進一步進行統(tǒng)計推斷奠定基礎(chǔ)。統(tǒng)計推斷(inferentialstatistics)是根據(jù)研究目的和資料性質(zhì),利用樣本信息對總體特征進行估計和推斷的統(tǒng)計方法,包括參數(shù)估計和假設(shè)檢驗。分析資料時應(yīng)注意,不同資料類型,不同分析目的,使用的統(tǒng)計分析方法不同,本章后幾節(jié)將作詳細介紹。(四)分析資料分析資料(analysisofdata),就是111第2節(jié)數(shù)值變量資料的統(tǒng)計計量資料經(jīng)過整理后,可以計算一系列統(tǒng)計指標,以說明資料的特征,便于對資料作進一步的統(tǒng)計分析。平均數(shù)描述其集中趨勢或平均水平,標準差描述其離散程度或變異程度。當例數(shù)較多時,可先編制成頻數(shù)表,了解變量值的分布情況,然后再計算其統(tǒng)計指標。第2節(jié)數(shù)值變量資料的統(tǒng)計計量資料經(jīng)過整理后,可以計算一系112一、數(shù)值變量資料的頻數(shù)分布所謂頻數(shù)就是觀察值的個數(shù)。頻數(shù)表(frequencytable),即同時列出觀察值在其取值范圍內(nèi),于各組段中頻數(shù)分布情況的表格。1.頻數(shù)表的編制現(xiàn)舉例說明數(shù)值變量資料的頻數(shù)表編制方法。例4-1某年某市100名成年男子血清總膽固醇測定結(jié)果如表4-1,試編制頻數(shù)表。一、數(shù)值變量資料的頻數(shù)分布所謂頻數(shù)就是觀察值的個數(shù)。頻數(shù)表113表4-1某年某市100名成年男子血清

總膽固醇(mmol/L)測定結(jié)果3.374.795.104.775.324.505.104.704.445.164.376.255.554.563.354.084.633.614.974.175.775.094.385.184.795.154.795.304.774.404.895.863.403.384.555.154.244.325.853.245.853.043.896.164.585.724.875.174.614.124.434.316.144.882.704.606.554.764.486.515.183.915.394.524.473.644.095.966.144.696.364.605.094.473.564.234.345.185.694.256.303.954.035.385.217.224.314.715.213.975.124.554.903.055.204.745.543.933.506.38表4-1某年某市100名成年男子血清

總膽固醇(mmol/L114(1)求全距:全距(range)又稱極差,是觀察值中最大值與最小值之差,用R表示。即:R=Xmax-Xmin(公式4-1)式中:R—全距Xmax—最大值Xmin—最小值本例最大值Xmax=7.22mmol/L,最小值Xmin=2.70mmol/L,R=7.22-2.70=4.52(mmol/L)。(2)定組段數(shù)、組距:組段數(shù)一般分8~15個組為宜,根據(jù)全距和組段數(shù)確定組距(i)。組距可用公式4-2進行估算。i=R/k(公式4-2)本例i=4.52/10=0.452(mmol/L),為方便計算,取0.5mmol/L作為組距。(1)求全距:115

(3)劃分組段:各組段的界限應(yīng)清晰分明,第一組段應(yīng)包括最小值,最后一組段應(yīng)包括最大值。每一組段的起始值稱下限,終止值稱上限。為了避免交叉,各組段從下限開始(不包括下限),到本組段上限為止(包括上限),各組段上限、下限之間用“~”連接。注意:最后一組段應(yīng)同時寫出上下限。本例第一組段可為2.50~開始,包括最小值,第二組段3.00~,第三組段3.50~,……第十組段7.00~7.50

(3)劃分組段:116(4)歸組匯總:將原始數(shù)據(jù)進行歸納計數(shù),可用劃“正”字的方式(見表4-2第2列),并給出各組段的頻數(shù)f(見表4-2第3列),頻數(shù)表的編制即完成。(4)歸組匯總:117表4-2某年某地100名成年男子血清

總膽固醇(mmol/L)頻數(shù)表表4-2某年某地100名成年男子血清

總膽固醇(mmo118頻數(shù)表的用途

1.揭示變量值的頻數(shù)分布類型2.確定變量值的兩個重要特征3.便于發(fā)現(xiàn)某些特大和特小的可疑值4.便于進一步進行統(tǒng)計分析和處理頻數(shù)表的用途1.揭示變量值的頻數(shù)分布類型119二、集中趨勢指標集中趨勢指標又稱平均數(shù)(average),它反映一組觀察值的集中位置和平均水平,常作為一組資料平均水平的代表值,可用于不同組間的分析比較。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。應(yīng)用中要根據(jù)不同的資料分布類型選擇合適的平均數(shù)指標。二、集中趨勢指標集中趨勢指標又稱平均數(shù)(average),它120(一)算術(shù)均數(shù)1.適用條件:適用于頻數(shù)分布呈對稱分布資料,特別正態(tài)分布資料。2.計算方法①直接法②加權(quán)法(一)算術(shù)均數(shù)1.適用條件:適用121直接法

直接法122加權(quán)法

加權(quán)法123(二)幾何均數(shù)1.適用條件:適用于等比數(shù)列資料、對數(shù)正態(tài)分布資料(即原始數(shù)據(jù)呈偏態(tài)分布,但經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布的資料)及近似對數(shù)正態(tài)分布資料。2.計算方法①直接法②加權(quán)法(二)幾何均數(shù)1.適用條件:適用于等比數(shù)列資料、124直接法直接法125加權(quán)法加權(quán)法126(三)中位數(shù)1.適用條件中位數(shù)表示平均水平,不受資料分布類型的影響,因此應(yīng)用范圍較廣。常用于:(1)偏態(tài)分布資料;(2)數(shù)據(jù)的一端或兩端無明確界值的資料,即開口資料;(3)分布類型不清楚的資料。2.計算方法①直接法②頻數(shù)表法

(三)中位數(shù)1.適用條件中位數(shù)表示平均水平127直接法將觀察值按大小排序,當觀察值例數(shù)為奇數(shù)時,中位數(shù)就是位次居中的那個數(shù),即位次為(n+1)/2的那個數(shù);當觀察值例數(shù)為偶數(shù)時,中位數(shù)就是中間兩個數(shù)相加再除以2,即位次為n/2和(n/2+1)的兩個數(shù)的均數(shù)。直接法將觀察值按大小排序,當觀察值例數(shù)為奇數(shù)時,中位數(shù)就128頻數(shù)表法當為頻數(shù)表資料時,可先分別計算累計頻數(shù)和累計頻率(表4-4第3列、第4列),然后按公式4-8計算中位數(shù)。頻數(shù)表法當為頻數(shù)表資料時,可先分別計算累計頻數(shù)和129三、離散趨勢指標集中趨勢是數(shù)值變量資料的一個重要特征,但僅有集中趨勢指標還不能很好地描述數(shù)值變量資料的分布規(guī)律,還要有離散趨勢指標。為了比較全面地描述數(shù)值變量資料的分布規(guī)律,除了需要有描述集中趨勢的指標外,還需要有描述離散趨勢的指標。離散趨勢又稱離散程度、變異程度。常用的離散趨勢指標有全距、方差、標準差、變異系數(shù)等。三、離散趨勢指標集中趨勢是數(shù)值變量資料的一個重要特征,但僅有130(一)全距全距又稱極差,用符號R表示,是觀察值中最大值與最小值的差值。如例4-9中,R甲=4,R乙和R丙均=8,甲組的全距小,乙、丙兩組的全距大,說明甲組的離散程度小,乙、丙兩組的離散程度大。全距的優(yōu)點是計算方便,容易理解;缺點是其大小僅與最大值、最小值有關(guān),不能客觀地反映其它觀察值的變異情況。如本例,乙、丙兩組資料的離散程度何者更大,全距無法反映。(一)全距全距又稱極差,用符號R表示,是觀察值中最大值與最小131(二)方差為了克服全距的缺陷,必須考慮每一個觀察值對離散程度的影響。方差(variance)是常用的離散趨勢指標,用σ2表示,計算公式為:(二)方差為了克服全距的缺陷,必須考慮每一個觀察132由于醫(yī)學研究中常用抽樣研究,總體方差往往是未知的,常用樣本方差來估計,樣本方差用s2表示。統(tǒng)計研究發(fā)現(xiàn),用樣本資料計算出的樣本方差往往比總體方差偏小,為了得到較為準確的結(jié)果,將樣本方差分母中n減去1,則計算公式為:由于醫(yī)學研究中常用抽樣研究,總體方差往往是未知的,常用樣本133(三)標準差方差因計算方便的原因,原有的計量單位被平方,這不利于進一步統(tǒng)計處理,因此人們常用方差的平方根——標準差(standarddeviation)替代方差描述資料的離散程度。總體標準差(用σ表示)、樣本標準差(用s表示)計算公式分別為:(三)標準差方差因計算方便的原因,原有的計量單位被平方,這不1341.標準差的計算直接法未分組的資料,可用公式4-12直接計算。但此公式計算先得求出均數(shù),在實際工作中這樣運算很不方便,經(jīng)數(shù)學推導,公式4-12可轉(zhuǎn)變?yōu)椋?.標準差的計算直接法未分組的資料,可用公式4-12直接135加權(quán)法與加權(quán)法計算均數(shù)一樣,當相同觀察值較多或頻數(shù)表資料時,可按公式4-14計算:

加權(quán)法與加權(quán)法計算均數(shù)一樣,當相同觀察值較多或頻數(shù)表資料1362.標準差的應(yīng)用

表示變量值的離散程度標準差表示變量值的變異程度時,要求單位相同,均數(shù)相近。標準越大,表示變量值的變異程度越大;反之標準差越小,表示變量值的變異程度越小。根據(jù)正態(tài)分布原理,應(yīng)用于概括估計觀察值的頻數(shù)分布和醫(yī)學參考值范圍。可以計算變異系數(shù)和標準誤。2.標準差的應(yīng)用表示變量值的離散程度標準差表示137(四)變異系數(shù)當所比較的兩組或多組資料的單位不同或均數(shù)相差懸殊時,不能用標準差直接比較其離散程度,而應(yīng)用變異系數(shù)(coefficientofvariation,用CV表示)。變異系數(shù)又稱離散系數(shù),是標準差與均數(shù)的比值,常用百分數(shù)表示,計算公式為:(四)變異系數(shù)當所比較的兩組或多組資料的單位不同或均數(shù)相差懸138變異系數(shù)沒有單位,常用于:

①計量單位不同的資料間的比較②均數(shù)相差懸殊資料間的比較變異系數(shù)沒有單位,常用于:①計量單139四、假設(shè)檢驗—t檢驗(一)假設(shè)檢驗的概念假設(shè)檢驗(hypothesistest)是統(tǒng)計推斷的另一重要內(nèi)容,亦稱顯著性檢驗(significanttest)。假設(shè)檢驗是對所檢驗的總體先提出一個假設(shè),然后通過統(tǒng)計分析去推斷是否拒絕這一假設(shè)。如兩組1歲嬰兒的頭圍均數(shù),甲組為45cm,乙組為42cm,這兩組均數(shù)不同可能是抽樣誤差引起,也可能是本質(zhì)不同。在下結(jié)論前首先要區(qū)別兩組均數(shù)間差異的性質(zhì)和來源。若是由于抽樣誤差引起的差異,統(tǒng)計上認為無顯著意義,如果這種差異超出了抽樣誤差的范圍,那么很可能是本質(zhì)原因引起的差異,統(tǒng)計上稱這種差異有顯著意義。判斷兩個均數(shù)之差有無顯著意義的假設(shè)檢驗,常用t檢驗。四、假設(shè)檢驗—t檢驗(一)假設(shè)檢驗的概念140(二)假設(shè)檢驗的基本步聚1.建立假設(shè)和確定檢驗水準2.選定檢驗方法并計算統(tǒng)計量3.確定P值4.判斷結(jié)果(二)假設(shè)檢驗的基本步聚1.建立假設(shè)和確定檢141(三)常用的t檢驗假設(shè)檢驗的具體方法,通常用檢驗統(tǒng)計量來命名。如檢驗統(tǒng)計量為t則稱t檢驗,檢驗統(tǒng)計量為u則稱u檢驗。實際應(yīng)用時應(yīng)注意各種檢驗方法的用途、適用條件和注意事項。常用的兩均數(shù)假設(shè)檢驗的方法有:(三)常用的t檢驗假設(shè)檢驗的具體方法,通常用檢驗統(tǒng)計量來命名1421.樣本均數(shù)與總體均數(shù)比較的t檢驗

一般把標準值、理論值或經(jīng)大量調(diào)查所得的穩(wěn)定值作為已知的總體均數(shù)μ0。樣本均數(shù)與總體均數(shù)比較的目的是推斷樣本所代表的總體均數(shù)(未知的)與已知總體均數(shù)μ0有無差別。t值計算公式如下:1.樣本均數(shù)與總體均數(shù)比較的t檢驗一般把標準值、理論值或經(jīng)1432.配對計量資料比較的t檢驗

在醫(yī)學研究中,為了減少誤差,提高檢驗效率,常采用配對設(shè)計(paireddesign)。配對設(shè)計主要有:①將試驗對象按照一定的條件配成若干對,然后隨機將每對中的兩個觀察單位分配到實驗組和對照組中去,給以不同的處理,觀察某種指標的變化;②同一組試驗對象在處理前后觀察某種指標的變化;③對同一樣品用兩種方法檢測結(jié)果的比較等。其假設(shè)檢驗的目的是推斷兩種處理或處理前后的結(jié)果有無差別。計算公式如下:2.配對計量資料比較的t檢驗在醫(yī)學研究中,為了減少誤差,提144寫出假設(shè)檢驗的基本步驟課件1453.兩個小樣本均數(shù)比較的t檢驗

在醫(yī)學研究中,能夠進行配對比較的資料較少,更多的是兩組資料的比較。目的是推斷兩樣本各自代表的總體均數(shù)μ1與μ2是否相等。當兩個樣本含量較小時,n1+n2<100,用t檢驗,t值的計算公式如下:3.兩個小樣本均數(shù)比較的t檢驗在醫(yī)學研究中,能夠進行配對比146寫出假設(shè)檢驗的基本步驟課件1474.假設(shè)檢驗的注意事項

要注意用單側(cè)還是雙側(cè)檢驗要注意每種方法的應(yīng)用條件要注意資料的可比性要注意判斷結(jié)果不能絕對化要注意實際差別大小與統(tǒng)計意義的區(qū)別4.假設(shè)檢驗的注意事項要注意用單側(cè)還是雙側(cè)檢驗148第3節(jié)分類變量資料的統(tǒng)計在醫(yī)療衛(wèi)生工作中,通過日常醫(yī)療衛(wèi)生工作記錄、統(tǒng)計報表、現(xiàn)場調(diào)查、實驗研究所搜集來的一些數(shù)據(jù),如人口數(shù)、出生數(shù)、治愈數(shù)、陽性數(shù)、陰性數(shù)等都是絕對數(shù)。絕對數(shù)可以反映事物在某時某地出現(xiàn)的實際情況,是統(tǒng)計分析和制訂計劃的基礎(chǔ)。但絕對數(shù)的大小,常受基數(shù)多少的影響,不便于進行深入的分析比較。要比較資料的情況,必須計算相對數(shù),再進行比較,才能得出正確的結(jié)論。一、相對數(shù)常用指標第3節(jié)分類變量資料的統(tǒng)計在醫(yī)療衛(wèi)生工作中,通過日常醫(yī)療衛(wèi)1491.相對數(shù)的概念

相對數(shù)(relativenumber)是兩個有聯(lián)系指標的比值,常用于分類變量即計數(shù)資料的統(tǒng)計分析。1.相對數(shù)的概念相對數(shù)(rela1502.相對數(shù)的種類及計算方法(1)率(rate):又稱頻率指標,說明某現(xiàn)象發(fā)生的頻率或強度。常以百分率(%)、千分率(‰)、萬分率(1/萬)、10萬分率(1/10萬)等表示。計算公式為:2.相對數(shù)的種類及計算方法(1)率(rate):又稱頻率指標151計算時比例基數(shù)的選擇,主要依據(jù)習慣用法或使算得的率至少保留一位整數(shù),以便于閱讀、比較。如有效率、治愈率,習慣上用百分率;出生率、死亡率、人口自然增長率,習慣上用千分率;某病死亡專率、惡性腫瘤發(fā)病率,習慣上用萬分率、10萬分率等。計算時比例基數(shù)的選擇,主要依據(jù)習慣用法或使算得的率至少保留152(2)構(gòu)成比(proportion)

又稱構(gòu)成指標,它表示某一事物內(nèi)部各組成部分所占的比重或分布。常用100為基數(shù),以百分比表示,計算公式為:(2)構(gòu)成比(proportion)153

一般來說,構(gòu)成比的總和為100%(亦可表示為1),但有時由于計算尾數(shù)取舍的關(guān)系,其總和不一定恰好等于100%,需對各構(gòu)成比的尾數(shù)作適當調(diào)整,使構(gòu)成比的總和等于100%。事物各構(gòu)成部分構(gòu)成比的大小,受兩方面因素的影響,一是該部分自身數(shù)值變化的影響,這一影響易被人們所察覺;二是其它部分數(shù)值變化的影響,這一影響往往被人們所忽視。一般來說,構(gòu)成比的總和為100%(亦154(3)相對比(relativeratio)

相對比是兩個有關(guān)指標之比。例如,不同地區(qū)、不同單位或不同時期的兩個有關(guān)指標(可以是絕對數(shù)、相對數(shù)或平均數(shù))之比,可反映兩者之間的差別變化情況。相對比通常用百分數(shù)(%)或倍數(shù)表示。其計算公式為:(3)相對比(relativeratio)1553.醫(yī)療衛(wèi)生工作中常用相對數(shù)指標1.死亡率或稱粗死亡率2.病死率:3.發(fā)病率:4.患病率(或稱現(xiàn)患率)3.醫(yī)療衛(wèi)生工作中常用相對數(shù)指標1.死亡率或稱粗死亡率156死亡率或稱粗死亡率死亡率或稱粗死亡率:表示某地某年每千人口中的死亡人數(shù)。常受各地人口、年齡、性別等構(gòu)成因素的影響,需進行標準化后才能進行相互比較。同年平均人口數(shù)以上年末人口數(shù)加本年末人口數(shù)除以2。死亡率或稱粗死亡率死亡率或稱粗死亡率:表示某地某157病死率指在觀察期內(nèi),某病患者中因該病而死亡的頻率。應(yīng)與死亡率相區(qū)別。兩者分母不同,計算結(jié)果的意義也不同。病死率指在觀察期內(nèi),某病患者中因158發(fā)病率

表示一定時期(通常為1年)內(nèi)某人群發(fā)生某病新病例的頻率。所謂新病例指每發(fā)生一種病算一種新病例,如某病治愈后再次發(fā)作,算兩個新病例。發(fā)病率表示一定時期(通常為1年)159患病率(或稱現(xiàn)患率)表示某一時點(一般不超過一個月)某人群中患某病的頻率。一般用于表示病程長的慢性病存在或流行的頻率?;疾÷剩ɑ蚍Q現(xiàn)患率)表示某一時點(一般不超過一個1604.應(yīng)用相對數(shù)的注意事項

不要混淆率與構(gòu)成比。計算相對數(shù)時分母不宜過小。要注意平均率的計算。兩個率或構(gòu)成比比較時應(yīng)作假設(shè)檢驗。要注意資料的可比性。4.應(yīng)用相對數(shù)的注意事項不要混淆率與構(gòu)成比。161

構(gòu)成比說明某部分占全體的比重,率說明事物發(fā)生的概率,兩者計算不同,說明的問題也不同,但由于兩指標同屬于相對數(shù)范疇,有時又都用100作基數(shù),所以易于混淆。常見的錯誤是把構(gòu)成比當作率來應(yīng)用。構(gòu)成比說明某部分占全體的比重,率說明事162一般說來,調(diào)查和實驗觀察單位應(yīng)有足夠的數(shù)量。觀察單位足夠時,計算的相對數(shù)比較穩(wěn)定,能夠正確反映實際情況。如果觀察例數(shù)過少,計算的相對數(shù)可靠性較差,此時應(yīng)以絕對數(shù)直接表示為好。例如4名患者2名治愈,最好用絕對數(shù)表示。一般說來,調(diào)查和實驗觀察單位應(yīng)有足夠163計算率的平均值時,不能將各組率相加,然后除以組數(shù)。如計算表4-8資料各年齡組人群平均患病率時,不能將各年齡組患病率相加后求平均率,而應(yīng)該將各年齡組檢查人數(shù)與病人數(shù)分別相加,然后以總病人數(shù)除以總檢查人數(shù)。計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論