醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩596頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1

第一章緒論

2第一節(jié)統(tǒng)計(jì)學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)

3一.統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)的定義

一.統(tǒng)計(jì)、統(tǒng)計(jì)學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義

41.統(tǒng)計(jì)

是一種對(duì)客觀現(xiàn)象數(shù)量方面進(jìn)行的調(diào)查研究活動(dòng);是收集、整理、分析、推斷、判斷等認(rèn)識(shí)活動(dòng)的總稱(chēng)。數(shù)據(jù)匯總僅僅是統(tǒng)計(jì)工作的一小部分內(nèi)容。

52.統(tǒng)計(jì)學(xué)作為一門(mén)學(xué)科的定義是:關(guān)于數(shù)據(jù)收集、表達(dá)和分析的普遍原理和方法。

63.醫(yī)學(xué)統(tǒng)計(jì)學(xué)

是用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)問(wèn)題的一門(mén)學(xué)科。醫(yī)學(xué)統(tǒng)計(jì)方法在醫(yī)學(xué)研究中的運(yùn)用主要有三個(gè)方面:7①以正確的方式收集數(shù)據(jù),如實(shí)驗(yàn)設(shè)計(jì)、調(diào)查設(shè)計(jì)等。②描述數(shù)據(jù)的統(tǒng)計(jì)特征,如數(shù)據(jù)化簡(jiǎn)、統(tǒng)計(jì)指標(biāo)的選擇與計(jì)算、統(tǒng)計(jì)結(jié)果的表達(dá)等。③統(tǒng)計(jì)分析及得出正確結(jié)論,如根據(jù)概率分布,對(duì)實(shí)驗(yàn)和觀察結(jié)果存在的差異和關(guān)聯(lián)作出統(tǒng)計(jì)推斷。

8工作生活中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題如何判斷藥物的療效?(假設(shè)檢驗(yàn))明天是否下雨?體育彩票能否中獎(jiǎng)?(概率論)子女為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)美國(guó)的民意測(cè)驗(yàn)是如何進(jìn)行的?(設(shè)計(jì),抽樣)中國(guó)的市場(chǎng)調(diào)查的可信性有多大?(現(xiàn)場(chǎng)調(diào)查)

統(tǒng)計(jì)學(xué)是對(duì)令人困惑費(fèi)解的數(shù)字問(wèn)題做出設(shè)想的藝術(shù)。9二.統(tǒng)計(jì)學(xué)的發(fā)展簡(jiǎn)史

101.早期

公元前3050年古埃及人為修建金字塔籌集建筑費(fèi),對(duì)全國(guó)的人口和財(cái)產(chǎn)進(jìn)行了普查。

11

2.近代

19世紀(jì),應(yīng)用數(shù)學(xué)家為解決賭徒們?cè)诓┎手谐霈F(xiàn)的輸贏概率問(wèn)題逐漸形成和發(fā)展了概率論,從而為統(tǒng)計(jì)學(xué)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。12

實(shí)例(觀察對(duì)比)(P5)1853-1854年倫敦霍亂死亡率與飲水水

用戶(hù)數(shù)死亡人數(shù)死亡率(1/萬(wàn)戶(hù))重污染

(Southwark和Vauxhall公司)

40046

1263315.4輕污染

(Lambeth公司)

26107

9837.5倫敦其它地區(qū)256423

1422

55.5合

計(jì)322576

278386.313實(shí)例(實(shí)驗(yàn)性研究)(P6~8)1747年,英國(guó)Lind醫(yī)生對(duì)壞血病的干預(yù)研究。1835年,法國(guó)醫(yī)生Louis對(duì)“放血”療法治療肺炎的效果評(píng)價(jià)。

1948年,英國(guó)發(fā)表了評(píng)價(jià)鏈霉素治療肺結(jié)核療效的隨機(jī)對(duì)照的臨床試驗(yàn)報(bào)告,第一次采用生物統(tǒng)計(jì)方法進(jìn)行臨床干預(yù)試驗(yàn)。1960年英國(guó)醫(yī)生Doll,Hill等發(fā)現(xiàn)吸煙與肺癌有關(guān)。相對(duì)危險(xiǎn)度RR=1.66/0.07=23.71948年,郭祖超教授(1912~1999)編著的《醫(yī)學(xué)與生物統(tǒng)計(jì)方法》,是我國(guó)第一部醫(yī)學(xué)統(tǒng)計(jì)方法的教科書(shū)。15

3.現(xiàn)代

計(jì)算機(jī)和統(tǒng)計(jì)軟件如SAS、SPSS的出現(xiàn)使統(tǒng)計(jì)學(xué)得到了突飛猛進(jìn)的發(fā)展。16

統(tǒng)計(jì)方法是建立在現(xiàn)代科學(xué)方法之上,由統(tǒng)計(jì)學(xué)理論指導(dǎo)的數(shù)據(jù)收集、表達(dá)和分析的方法,現(xiàn)代科學(xué)方法可以概括為以下幾點(diǎn):17問(wèn)題的識(shí)別與表達(dá)(發(fā)現(xiàn)問(wèn)題、提出問(wèn)題)。搜集有關(guān)資料。通過(guò)歸納得出假說(shuō):因果聯(lián)系及重要的模式。從假說(shuō)作出演繹:進(jìn)行實(shí)驗(yàn)或收集更多的資料。推理:結(jié)果與演繹相符,假說(shuō)得到加強(qiáng),但不是被證明(例某地區(qū)食鹽與高血壓的關(guān)系)。2.醫(yī)學(xué)論文中的統(tǒng)計(jì)學(xué)問(wèn)題60年代到80年代,國(guó)外醫(yī)學(xué)雜志調(diào)查結(jié)果:有統(tǒng)計(jì)錯(cuò)誤的論文20%~72%。1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。19

60年代到80年代,國(guó)外醫(yī)學(xué)雜志調(diào)查表明:20%~72%的論文有統(tǒng)計(jì)錯(cuò)誤。

1984年對(duì)《中華醫(yī)學(xué)雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果為:相對(duì)數(shù)誤用占11.2%,抽樣方法誤用占15.9%,統(tǒng)計(jì)圖表誤用占11.7%1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。

2001年《中華預(yù)防醫(yī)學(xué)雜志》:中華醫(yī)學(xué)會(huì)系列雜志誤用約54%(1995)。1996年,有機(jī)構(gòu)對(duì)申報(bào)科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76%。醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用錯(cuò)誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問(wèn)題。

3.偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德1976年NewScience雜志關(guān)于科研舞弊行為的調(diào)查(1)74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況(2)17%拼湊實(shí)驗(yàn)結(jié)果(3)7%憑空捏造數(shù)據(jù)(4)2%故意曲解結(jié)果FancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!22三.統(tǒng)計(jì)學(xué)的特點(diǎn)

醫(yī)學(xué)+數(shù)學(xué),側(cè)重醫(yī)學(xué),淡化數(shù)學(xué)。用數(shù)量反映質(zhì)量,如平均期望壽命,解放前為35歲,現(xiàn)在70歲,可反映國(guó)家醫(yī)療衛(wèi)生服務(wù)總體水平的提高。大量觀察+實(shí)驗(yàn)數(shù)據(jù)分析→可以揭示醫(yī)學(xué)規(guī)律。

23

第二節(jié)

統(tǒng)計(jì)工作的基本步驟241.專(zhuān)業(yè)設(shè)計(jì):選題、建立假說(shuō)、確定研究對(duì)象和技術(shù)方法等→個(gè)性

2.統(tǒng)計(jì)設(shè)計(jì):圍繞專(zhuān)業(yè)設(shè)計(jì)確定統(tǒng)計(jì)設(shè)類(lèi)型、樣本大小、分組方法、統(tǒng)計(jì)分析指標(biāo)及統(tǒng)計(jì)分析方法。

一、設(shè)計(jì)

25二、收集資料

(一)資料來(lái)源第一手資料

經(jīng)常性:統(tǒng)計(jì)報(bào)表(死亡登記、疫情報(bào)告等),工作記錄(病歷、化驗(yàn));②一時(shí)性:專(zhuān)題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國(guó)、全省衛(wèi)生統(tǒng)計(jì)資料。

26(二)資料要求

1.完整:觀察單位及觀察項(xiàng)目完整。

觀察單位:最基本的獲取數(shù)據(jù)的單元??梢允且粋€(gè)體,亦可以是一個(gè)單位、家庭、地區(qū),一批樣品,一個(gè)采樣點(diǎn)。

27

2.準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂。

3.及時(shí):即時(shí)限性。如人口普查規(guī)定調(diào)查開(kāi)始日期和截止日期。28三.整理資料

整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過(guò)程。所采取的手段→合理化分組,目的→實(shí)現(xiàn)專(zhuān)業(yè)目標(biāo)。質(zhì)分組:按事物的屬性或性質(zhì)分組→分類(lèi)變量;量分組:按數(shù)據(jù)的大小→數(shù)值變量。29四.分析資料

1.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行測(cè)定和描述。

2.統(tǒng)計(jì)推斷:用樣本信息推斷總體特征:①參數(shù)估計(jì),②假設(shè)檢驗(yàn)。30

第三節(jié)統(tǒng)計(jì)資料的類(lèi)型(P25)

有三種類(lèi)型的資料:計(jì)量資料,計(jì)數(shù)資料,等級(jí)資料

基本概念:變量及變量值,研究者對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行觀察和測(cè)量,這種特征稱(chēng)為變量,變量的測(cè)得值叫變量值(也叫觀察值),稱(chēng)為資料。按變量值的性質(zhì)可將資料分為定量資料和定性資料。311.計(jì)量資料定義:通過(guò)度量衡的方法,測(cè)量每一個(gè)觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):有度量衡單位多為連續(xù)性資料(通過(guò)測(cè)量得到)如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012/L)32定義:將全體觀測(cè)單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個(gè)數(shù)。特點(diǎn):沒(méi)有度量衡單位

多為間斷性資料(通過(guò)枚舉或記數(shù)得來(lái))如膚色(黑、白)、血型(ABO)、職業(yè)(工農(nóng)兵)、性別(男女)

2.計(jì)數(shù)資料33

定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過(guò)半定量方法測(cè)量得到。特點(diǎn):每一個(gè)觀察單位沒(méi)有確切值各組之間有性質(zhì)上的差別或程度上的不同。

①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無(wú)效、死亡。

③尿蛋白:

,,,++,+++及以上3.等級(jí)資料34(三)資料的轉(zhuǎn)化(變量類(lèi)型的轉(zhuǎn)化)

數(shù)值變量分類(lèi)變量

35例如:測(cè)得5人的WBC(個(gè)/m3)數(shù)如下:

300060005000800012000數(shù)值變量過(guò)低正常正常正常異常分類(lèi)變量若按正常3人,異常2人分組→二分類(lèi)變量若按過(guò)低1人,正常3人,過(guò)高1人分組→等級(jí)資料36

*提示:

①多途徑;②盡量用定量指標(biāo),否則損失信息量;③定性指標(biāo)可轉(zhuǎn)化為定量指標(biāo),但較粗糙。37第四節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念1、變異2、總體與樣本3、參數(shù)與統(tǒng)計(jì)量

4、誤差5、頻率

381.變異(P3~4)

同質(zhì)事物個(gè)體間的差異。來(lái)源于一些未加控制或無(wú)法控制的甚至不明原因的因素。是統(tǒng)計(jì)學(xué)存在的基礎(chǔ),從本質(zhì)上說(shuō),統(tǒng)計(jì)學(xué)就是研究變異的科學(xué)。

39對(duì)變異的認(rèn)識(shí):

(1)自然變異的范圍是有限的,可以度量;參差不齊的測(cè)量值,通過(guò)大量重復(fù)觀測(cè)可以顯現(xiàn)出統(tǒng)計(jì)分布規(guī)律,如表1-1(P4)數(shù)據(jù)的變異特征至少有以下兩點(diǎn):40①變異的范圍在3.29~6.18;②有明顯的統(tǒng)計(jì)分布規(guī)律,4.7~5.0的人數(shù)最多。根據(jù)表1-1的數(shù)據(jù),統(tǒng)計(jì)上還可以進(jìn)一步推論出正常成年男子紅細(xì)胞計(jì)數(shù)的正常值參考范圍。41表1-1120名正常成年男子紅細(xì)胞計(jì)數(shù)值

5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89。算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.574243

(2)用統(tǒng)計(jì)的方法可以確定出所有研究對(duì)象的變異范圍,如正常成年男性的細(xì)胞數(shù)的范圍。身高范圍等等。

(3)沒(méi)有變異就沒(méi)有統(tǒng)計(jì),變異使統(tǒng)計(jì)有了用武之地。44總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí),總體是指該項(xiàng)變量植的全體。樣本:從總體中隨機(jī)抽取的有代表性的一部分。觀察單位(個(gè)體):最基本的研究單位分為有限總體和無(wú)限總體。由于調(diào)查總體的不可能性、巨大性和沒(méi)必要。對(duì)其中的一部分對(duì)象進(jìn)行調(diào)查----樣本(總體與樣本的關(guān)系。舉例。)樣本選擇的原則--??樣本量(samplesize)2.總體與樣本

(populationandsample)(P31)populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象的全體(集合)。分有限總體與無(wú)限總體樣本:從總體中隨機(jī)抽取的部分觀察單位

隨機(jī)抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機(jī)的抽樣方法(在總體中每個(gè)個(gè)體具有相同的機(jī)會(huì)被抽到)。47對(duì)樣本數(shù)據(jù)進(jìn)行觀察或計(jì)算統(tǒng)計(jì)指標(biāo),目的是推論總體。483.參數(shù)與統(tǒng)計(jì)量

(P31)parameterandstatistic參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù),采用希臘字母記為μ。固定的常數(shù)

總體樣本抽取部分觀察單位

μ?

推斷inference統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù),采用拉丁字母分別記為。統(tǒng)計(jì)量是參數(shù)附近波動(dòng)的隨機(jī)變量。494.誤差誤差:統(tǒng)計(jì)上所說(shuō)的誤差泛指測(cè)量值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。主要有以下二種:系統(tǒng)誤差和隨機(jī)誤差(隨機(jī)測(cè)量誤差,抽樣誤差)。

(1)系統(tǒng)誤差:指數(shù)據(jù)搜集和測(cè)量過(guò)程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱(chēng)為系統(tǒng)誤差。特點(diǎn):具有累加性(2).隨機(jī)誤差:由于一些非人為的偶然因素使得結(jié)果或大或小,是不確定、不可預(yù)知的。特點(diǎn):隨測(cè)量次數(shù)增加而減小。50

在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對(duì)于同一樣本多次測(cè)定結(jié)果不完全一樣,結(jié)果有時(shí)偏大有時(shí)偏小,沒(méi)有傾向性,這種誤差叫隨機(jī)測(cè)量誤差。特點(diǎn):沒(méi)有傾向性,多次測(cè)量計(jì)算平均值可以減小甚至消除隨機(jī)測(cè)量誤差。A、隨機(jī)測(cè)量誤差51

這類(lèi)誤差可以通過(guò)實(shí)驗(yàn)設(shè)計(jì)和技術(shù)措施來(lái)消除或使之減少。

觀察性研究由于組間不可比性產(chǎn)生的系統(tǒng)誤差稱(chēng)為偏倚(bias),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。52

由于抽樣原因造成的樣本指標(biāo)與總體指標(biāo)之間的差別。特點(diǎn):有抽樣抽樣誤差就不可避免。統(tǒng)計(jì)上可以計(jì)算并在一定范圍內(nèi)控制抽樣誤差。B、抽樣誤差(P32)53

(1)改進(jìn)抽樣方法,增加樣本的代表性。樣本量n相等的情況下:整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標(biāo)減少抽樣誤差的方法:545.概率probability

確定性現(xiàn)象:在一定條件下,一定會(huì)發(fā)生或一定不會(huì)發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。

隨機(jī)現(xiàn)象:在同樣條件下可能會(huì)出現(xiàn)兩種或多種結(jié)果,究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱(chēng)為隨機(jī)事件。隨機(jī)事件的特征:①隨機(jī)性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,用大寫(xiě)的P表示;取值[0,1]。55必然事件P=1不可能事件P=0隨機(jī)事件0<P<1

P≤0.05(5%)或P≤0.01(1%)稱(chēng)為小概率事件(習(xí)慣),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。小概率事件56如何學(xué)習(xí)統(tǒng)計(jì)學(xué)

(特點(diǎn):靈活、抽象)理解基本的統(tǒng)計(jì)原理培養(yǎng)統(tǒng)計(jì)思維能力:抽象的,邏輯推理多練習(xí):課堂練習(xí),課下做習(xí)題

聯(lián)系實(shí)際:閱讀文獻(xiàn)工作和生活實(shí)際第一節(jié)頻數(shù)分布表與頻數(shù)分布圖

一、頻數(shù)分布表(frequencytable)

用途:用于描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱(chēng)為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.191.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱(chēng)為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8三、頻數(shù)分布圖

P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱(chēng)分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(chēng)(總體則完全對(duì)稱(chēng)),就認(rèn)為該資料是對(duì)稱(chēng)分布(圖4-2)(2)偏態(tài)分布:右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。

表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):

左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對(duì)稱(chēng)?!儺愃街笜?biāo)

3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:

X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱(chēng)為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù)

(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本

適用條件:資料呈對(duì)稱(chēng)分布,尤其是正態(tài)或近似正態(tài)。

計(jì)算:

(1)直接法(2)頻數(shù)表法p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.003.中位數(shù)(median)

意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md

適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]

=13.5(h)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)小結(jié):

集中趨勢(shì)的描述——平均數(shù)

平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。

不同的分布使用不同的指標(biāo)

(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料

幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料

中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指標(biāo))

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)

1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。

優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。

缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:

(定義:P53)Q=P75-P25

四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差

方差(variance)也稱(chēng)均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。分母為n-1,稱(chēng)為自由度(能自由取值的變量的個(gè)數(shù))。4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.85.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-13變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距練習(xí)題p67.第1題。p68.第3題。第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)

計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合計(jì)2071411022085372061401二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。但絕對(duì)數(shù)通常不具有可比性:

1.如甲、乙兩個(gè)醫(yī)院某病出院人數(shù)不同時(shí),比較兩醫(yī)院該病的死亡人數(shù)沒(méi)有意義

2.如2002級(jí)附二院五年制一、二大班學(xué)生人數(shù)不同時(shí),比較兩班醫(yī)學(xué)統(tǒng)計(jì)學(xué)的及格人數(shù)沒(méi)有意義,因此需要在絕對(duì)數(shù)的基礎(chǔ)上計(jì)算相對(duì)數(shù)。相對(duì)數(shù):兩個(gè)有聯(lián)系的指標(biāo)之比,常用的相對(duì)數(shù)有:一、比二、比率三、速率相對(duì)比簡(jiǎn)稱(chēng)比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。計(jì)算公式為式中兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。(一)比(ratio)

(一)兩個(gè)絕對(duì)數(shù)之比:

如某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100=103,說(shuō)明該醫(yī)院該年每出生100名女?huà)雰?,就?03名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對(duì)比水平。

(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。

例如某地某年齡組男性吸煙和非吸煙的冠心病死亡資料如表7-2,試分析其相對(duì)危害度。

說(shuō)明男性吸煙組的冠心病死亡率是非吸煙組的2.139倍。表7-2

某地某年齡組男性吸煙和非吸煙的冠心病死亡資料

(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。

例服用反應(yīng)停與肢體缺陷關(guān)系病例對(duì)照研究資料如表所示:

比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部分。無(wú)量綱,[0,1]

。1.率(rate)(強(qiáng)度相對(duì)數(shù))說(shuō)明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。

率=(實(shí)際發(fā)生數(shù)/可能發(fā)生總數(shù))×比例基數(shù)如:治愈率、病死率、陽(yáng)性率、人群患病率等比例基數(shù):100%、1000‰、10000/萬(wàn)、100000(1/10萬(wàn))等(按習(xí)慣,使結(jié)果保留1-2位小數(shù))例如:患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬(wàn)分率表示。(二)比率(proportion)2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來(lái)說(shuō)明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計(jì)算公式為

如:教研室16人高級(jí)職稱(chēng)有4人,占25%;中級(jí)職稱(chēng)有8人,占50%;初級(jí)職稱(chēng)有4人,占25%。(三)速率(rate):分母中含有時(shí)間量綱。P58例4-14是反映單位時(shí)間內(nèi)某事件出現(xiàn)的可能性大小,多用于面向人群的出生、死亡和發(fā)病資料的統(tǒng)計(jì).

人口出生率=(某年中活產(chǎn)總數(shù)/該年平均人口數(shù))×100%三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。率與構(gòu)成比容易誤用

年齡組⑴

受檢人數(shù)⑵白內(nèi)障例數(shù)⑶

患者年齡構(gòu)成比(%)⑷患病率(%)⑸=(3)/(2)40~50~60~70~≥80合計(jì)5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.361468448100.0030.522、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。3、進(jìn)行率的對(duì)比分析時(shí),應(yīng)注意資料可比性。如比較療效時(shí),比較組間應(yīng)病情輕重相同,性別影響,應(yīng)按性別分組后再作比較。(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,以及地區(qū)、周?chē)h(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件是否一致或相近等。(2)觀察對(duì)象內(nèi)部結(jié)構(gòu)是否相同,若兩組資料的年齡、性別等構(gòu)成不同,可以分別進(jìn)行同年齡別、同性別的小組率比較或?qū)偮剩ê嫌?jì)率)進(jìn)行標(biāo)準(zhǔn)化后再作比較。

4、正確求平均率。例:若P1=x1/n1,P2=x2/n2

P3=x3/n3

P=(x1+x2+x3)/n1+n2+n3)(正確)

P=(P1+P2+P3)/3(錯(cuò)誤)5.樣本率(或構(gòu)成比)同樣存在抽樣誤差,故應(yīng)進(jìn)行樣本率(或構(gòu)成比)差別的假設(shè)檢驗(yàn)。第四節(jié)統(tǒng)計(jì)圖表

統(tǒng)計(jì)表(statisticaltable)——數(shù)據(jù)代替文字描述,便于統(tǒng)計(jì)結(jié)果的精確、簡(jiǎn)潔的表達(dá)和對(duì)比分析

統(tǒng)計(jì)圖(statisticalchart)——用圖形代替數(shù)據(jù),獲得直觀、形象的效果一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)

2.統(tǒng)計(jì)表的種類(lèi)

標(biāo)題:標(biāo)目:線條:數(shù)字:無(wú)數(shù)字用“—”表示,缺失數(shù)字用“

”表示,數(shù)值為0者記為“0”,不要留空項(xiàng)。備注:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)

頂線底線表名標(biāo)題

表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTT

GPT

5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),

:GPT(谷丙轉(zhuǎn)氨酶)。2.統(tǒng)計(jì)表的種類(lèi)

根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)表可大致分為簡(jiǎn)單表和復(fù)合表。

簡(jiǎn)單表(simpletable):只按一個(gè)特征或標(biāo)志分組。如表4-1。

組合表(combinativetable):按兩個(gè)或兩個(gè)以上特征或標(biāo)志結(jié)合起來(lái)分組。如表4-8。簡(jiǎn)單表示例分組標(biāo)志為矯治方法

表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTT

GPT

5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),

:GPT(谷丙轉(zhuǎn)氨酶)。

(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)復(fù)合表示例

分組標(biāo)志:不同年份不同檢測(cè)指標(biāo)例下表是復(fù)方豬膽膠囊治療兩型老年性慢性支氣管炎的療效比較,請(qǐng)對(duì)該表的繪制進(jìn)行評(píng)價(jià),并指出所存在的問(wèn)題。表

兩個(gè)組的療效觀察

分型及療效

單純型慢性支氣管炎

喘息型慢性支氣管炎

指標(biāo)

治愈

顯效

好轉(zhuǎn)

無(wú)效

治愈

顯效

好轉(zhuǎn)

無(wú)效

例數(shù)

60

98

51

12

23

83

65

11

合計(jì)

209

12

171

11

療效

94.6

94.0

表復(fù)方豬膽膠囊治療兩型老年慢性支氣管炎患者的療效比較一、統(tǒng)計(jì)圖

統(tǒng)計(jì)圖(statisticalchart或statisticalgraph)是用點(diǎn)、線、面等幾何圖形,直觀形象地表達(dá)、描述數(shù)據(jù)或結(jié)果。

1.統(tǒng)計(jì)圖的結(jié)構(gòu)

2.

統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)1、統(tǒng)計(jì)圖的結(jié)構(gòu)標(biāo)題:用于簡(jiǎn)明扼要地說(shuō)明資料的內(nèi)容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個(gè)統(tǒng)計(jì)圖的視覺(jué)中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。圖例:用于識(shí)別比較的統(tǒng)計(jì)圖中各種圖形所代表的含義。刻度:即縱軸和橫軸上的坐標(biāo)??潭葦?shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。2.統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)直條圖百分條圖圓圖線圖與半對(duì)數(shù)線圖直方圖箱圖散點(diǎn)圖統(tǒng)計(jì)地圖

(1)條圖(bargraph)

1.概念

條圖用等寬長(zhǎng)條的高度表示按性質(zhì)分類(lèi)資料各類(lèi)別的數(shù)值大小,用于表示他們之間的對(duì)比關(guān)系。

2.適用資料:相互獨(dú)立的資料(資料有明確分

組,不連續(xù))。

3.分類(lèi)

(1)單式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),一個(gè)分組因素。

(2)復(fù)式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),兩個(gè)分組因素。

條圖表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTT

GPT

5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),

:GPT(谷丙轉(zhuǎn)氨酶)。

(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)條圖條圖繪制條圖注意事項(xiàng)

⑴縱軸的刻度必須從“0”開(kāi)始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

(2)圓圖(piegraph)

1.概念

以圓形的總面積代表100%,把面積按比例分成若干部分,以角度大小來(lái)表示各部分所占的比重。

2.適用資料:構(gòu)成比資料2002年某醫(yī)院1402例孕婦分娩結(jié)果分娩結(jié)果例數(shù)構(gòu)成比(%)過(guò)期產(chǎn)211死產(chǎn)211早產(chǎn)21215足月114883總計(jì)1402100(3)百分條圖(percentagechart)

百分條圖的作用與圓圖相同。但更適用于多組百分比的比較。020406080100呼吸系統(tǒng)病腦血管病惡性腫瘤損傷與中毒心臟疾病其它圖2-18我國(guó)部分縣1988年的死因構(gòu)成比不同性別某癌三種類(lèi)型的構(gòu)成

分化型癌低分化腺癌未分化型合計(jì)男52.327.819.9100女30.218.151.7100(4)線圖一、普通線圖(線圖)1.概念線圖(linegraph)是用線段的升降來(lái)表示統(tǒng)計(jì)指標(biāo)的變化趨勢(shì)。如某事物隨時(shí)間的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)象變遷的情況。2.適用資料適用于隨時(shí)間變化的連續(xù)性資料。3.分析目的:用線段的升降表示某事物在時(shí)間上的發(fā)展變化趨勢(shì)。二、半對(duì)數(shù)線圖1.概念是一種特殊的線圖,其坐標(biāo)縱軸是對(duì)數(shù)尺度,特別適宜作不同指標(biāo)變化速度的比較。

2.適用資料適用于隨時(shí)間變化的連續(xù)性資料,尤其比較數(shù)值相差懸殊的多組資料時(shí)采用。3.分析目的:半對(duì)數(shù)線圖中線段的升降是用來(lái)表示某事物發(fā)展速度(或者說(shuō)是相對(duì)比)。普通線圖(線圖):縱橫軸均為算術(shù)尺度,半對(duì)數(shù)圖:縱軸為對(duì)數(shù)尺度,橫軸為算術(shù)尺度。注意:在普通線圖中,結(jié)核病死亡率線條的坡度比白喉死亡率線條下降的陡峭,只能說(shuō)明兩種疾病的死亡率逐年變化幅度不同,不能錯(cuò)認(rèn)為結(jié)核病死亡率的下降速度比白喉死亡率的下降速度快。在半對(duì)數(shù)線圖中就不會(huì)出現(xiàn)這種錯(cuò)覺(jué)。在比較事物間的變化速度時(shí),應(yīng)選擇半對(duì)數(shù)線圖。

(5)直方圖1.概念是以直方面積描述各組頻數(shù)的多少,面積的總和相當(dāng)于各組頻數(shù)之和。2.適用資料:直方圖用于表達(dá)連續(xù)性資料的頻數(shù)分布。3.制圖要求:(1)一般縱軸表示被觀察現(xiàn)象的頻數(shù)(或頻率),橫軸表示連續(xù)變量,以各矩形(寬為組距)的面積表示各組段頻數(shù)。(2)直方圖的各直條間不留空隙;各直條間可用直線分隔,但也可不用直線分隔。(3)組距不等時(shí),橫軸仍表示連續(xù)變量,但縱軸是每個(gè)橫軸單位的頻數(shù)。(6)箱式圖箱式圖:使用5個(gè)統(tǒng)計(jì)量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。

箱式圖的箱子兩端分別是上四分位數(shù)(P75)和下四分位數(shù)(P25),中間橫線是中位數(shù)(P50)兩端連線分別是除異常值外的最小值和最大值。另外標(biāo)記可能的異常值。顯然箱子越長(zhǎng),數(shù)據(jù)變異程度越大。中間橫線在箱子中點(diǎn)表明分布對(duì)稱(chēng),否則不對(duì)稱(chēng)。例某地調(diào)查不同類(lèi)型化妝品廠車(chē)間內(nèi)粉塵數(shù),結(jié)果繪制成圖2-20。圖中顯示粉塵數(shù)的分布呈偏態(tài)分布,凈化廠粉塵數(shù)較少,非凈化廠粉塵數(shù)較多。(7)散點(diǎn)圖1.概念

散點(diǎn)圖以直角坐標(biāo)系中各點(diǎn)的密集程度和趨勢(shì)來(lái)表示兩現(xiàn)象間的關(guān)系。常在對(duì)資料進(jìn)行相關(guān)分析之前使用。

2.適用資料:雙變量資料。12名女大學(xué)生身高與體重散點(diǎn)圖(8)統(tǒng)計(jì)地圖統(tǒng)計(jì)地圖(statisticalmap):是用不同的顏色和花紋表示統(tǒng)計(jì)量的值在地理分布上的變化,適宜描述研究指標(biāo)的地理分布。第一節(jié)頻數(shù)分布表與頻數(shù)分布圖

一、頻數(shù)分布表(frequencytable)

用途:用于描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱(chēng)為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.191.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱(chēng)為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8三、頻數(shù)分布圖

P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱(chēng)分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(chēng)(總體則完全對(duì)稱(chēng)),就認(rèn)為該資料是對(duì)稱(chēng)分布(圖4-2)(2)偏態(tài)分布:右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。

表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):

左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對(duì)稱(chēng)。——變異水平指標(biāo)

3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:

X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱(chēng)為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù)

(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本

適用條件:資料呈對(duì)稱(chēng)分布,尤其是正態(tài)或近似正態(tài)。

計(jì)算:

(1)直接法(2)頻數(shù)表法p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.003.中位數(shù)(median)

意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md

適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]

=13.5(h)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)小結(jié):

集中趨勢(shì)的描述——平均數(shù)

平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。

不同的分布使用不同的指標(biāo)

(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料

幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料

中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指標(biāo))

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)

1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。

優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。

缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:

(定義:P53)Q=P75-P25

四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差

方差(variance)也稱(chēng)均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。分母為n-1,稱(chēng)為自由度(能自由取值的變量的個(gè)數(shù))。4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.85.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-13變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距練習(xí)題p67.第1題。p68.第3題。第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)

計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論