




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1
第一章緒論
2第一節(jié)統(tǒng)計(jì)學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)
3一.統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)的定義
一.統(tǒng)計(jì)、統(tǒng)計(jì)學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義
41.統(tǒng)計(jì)
是一種對(duì)客觀現(xiàn)象數(shù)量方面進(jìn)行的調(diào)查研究活動(dòng);是收集、整理、分析、推斷、判斷等認(rèn)識(shí)活動(dòng)的總稱(chēng)。數(shù)據(jù)匯總僅僅是統(tǒng)計(jì)工作的一小部分內(nèi)容。
52.統(tǒng)計(jì)學(xué)作為一門(mén)學(xué)科的定義是:關(guān)于數(shù)據(jù)收集、表達(dá)和分析的普遍原理和方法。
63.醫(yī)學(xué)統(tǒng)計(jì)學(xué)
是用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)問(wèn)題的一門(mén)學(xué)科。醫(yī)學(xué)統(tǒng)計(jì)方法在醫(yī)學(xué)研究中的運(yùn)用主要有三個(gè)方面:7①以正確的方式收集數(shù)據(jù),如實(shí)驗(yàn)設(shè)計(jì)、調(diào)查設(shè)計(jì)等。②描述數(shù)據(jù)的統(tǒng)計(jì)特征,如數(shù)據(jù)化簡(jiǎn)、統(tǒng)計(jì)指標(biāo)的選擇與計(jì)算、統(tǒng)計(jì)結(jié)果的表達(dá)等。③統(tǒng)計(jì)分析及得出正確結(jié)論,如根據(jù)概率分布,對(duì)實(shí)驗(yàn)和觀察結(jié)果存在的差異和關(guān)聯(lián)作出統(tǒng)計(jì)推斷。
8工作生活中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題如何判斷藥物的療效?(假設(shè)檢驗(yàn))明天是否下雨?體育彩票能否中獎(jiǎng)?(概率論)子女為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)美國(guó)的民意測(cè)驗(yàn)是如何進(jìn)行的?(設(shè)計(jì),抽樣)中國(guó)的市場(chǎng)調(diào)查的可信性有多大?(現(xiàn)場(chǎng)調(diào)查)
統(tǒng)計(jì)學(xué)是對(duì)令人困惑費(fèi)解的數(shù)字問(wèn)題做出設(shè)想的藝術(shù)。9二.統(tǒng)計(jì)學(xué)的發(fā)展簡(jiǎn)史
101.早期
公元前3050年古埃及人為修建金字塔籌集建筑費(fèi),對(duì)全國(guó)的人口和財(cái)產(chǎn)進(jìn)行了普查。
11
2.近代
19世紀(jì),應(yīng)用數(shù)學(xué)家為解決賭徒們?cè)诓┎手谐霈F(xiàn)的輸贏概率問(wèn)題逐漸形成和發(fā)展了概率論,從而為統(tǒng)計(jì)學(xué)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。12
實(shí)例(觀察對(duì)比)(P5)1853-1854年倫敦霍亂死亡率與飲水水
源
用戶(hù)數(shù)死亡人數(shù)死亡率(1/萬(wàn)戶(hù))重污染
(Southwark和Vauxhall公司)
40046
1263315.4輕污染
(Lambeth公司)
26107
9837.5倫敦其它地區(qū)256423
1422
55.5合
計(jì)322576
278386.313實(shí)例(實(shí)驗(yàn)性研究)(P6~8)1747年,英國(guó)Lind醫(yī)生對(duì)壞血病的干預(yù)研究。1835年,法國(guó)醫(yī)生Louis對(duì)“放血”療法治療肺炎的效果評(píng)價(jià)。
1948年,英國(guó)發(fā)表了評(píng)價(jià)鏈霉素治療肺結(jié)核療效的隨機(jī)對(duì)照的臨床試驗(yàn)報(bào)告,第一次采用生物統(tǒng)計(jì)方法進(jìn)行臨床干預(yù)試驗(yàn)。1960年英國(guó)醫(yī)生Doll,Hill等發(fā)現(xiàn)吸煙與肺癌有關(guān)。相對(duì)危險(xiǎn)度RR=1.66/0.07=23.71948年,郭祖超教授(1912~1999)編著的《醫(yī)學(xué)與生物統(tǒng)計(jì)方法》,是我國(guó)第一部醫(yī)學(xué)統(tǒng)計(jì)方法的教科書(shū)。15
3.現(xiàn)代
計(jì)算機(jī)和統(tǒng)計(jì)軟件如SAS、SPSS的出現(xiàn)使統(tǒng)計(jì)學(xué)得到了突飛猛進(jìn)的發(fā)展。16
統(tǒng)計(jì)方法是建立在現(xiàn)代科學(xué)方法之上,由統(tǒng)計(jì)學(xué)理論指導(dǎo)的數(shù)據(jù)收集、表達(dá)和分析的方法,現(xiàn)代科學(xué)方法可以概括為以下幾點(diǎn):17問(wèn)題的識(shí)別與表達(dá)(發(fā)現(xiàn)問(wèn)題、提出問(wèn)題)。搜集有關(guān)資料。通過(guò)歸納得出假說(shuō):因果聯(lián)系及重要的模式。從假說(shuō)作出演繹:進(jìn)行實(shí)驗(yàn)或收集更多的資料。推理:結(jié)果與演繹相符,假說(shuō)得到加強(qiáng),但不是被證明(例某地區(qū)食鹽與高血壓的關(guān)系)。2.醫(yī)學(xué)論文中的統(tǒng)計(jì)學(xué)問(wèn)題60年代到80年代,國(guó)外醫(yī)學(xué)雜志調(diào)查結(jié)果:有統(tǒng)計(jì)錯(cuò)誤的論文20%~72%。1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。19
60年代到80年代,國(guó)外醫(yī)學(xué)雜志調(diào)查表明:20%~72%的論文有統(tǒng)計(jì)錯(cuò)誤。
1984年對(duì)《中華醫(yī)學(xué)雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果為:相對(duì)數(shù)誤用占11.2%,抽樣方法誤用占15.9%,統(tǒng)計(jì)圖表誤用占11.7%1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。
2001年《中華預(yù)防醫(yī)學(xué)雜志》:中華醫(yī)學(xué)會(huì)系列雜志誤用約54%(1995)。1996年,有機(jī)構(gòu)對(duì)申報(bào)科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76%。醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用錯(cuò)誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問(wèn)題。
3.偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德1976年NewScience雜志關(guān)于科研舞弊行為的調(diào)查(1)74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況(2)17%拼湊實(shí)驗(yàn)結(jié)果(3)7%憑空捏造數(shù)據(jù)(4)2%故意曲解結(jié)果FancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!22三.統(tǒng)計(jì)學(xué)的特點(diǎn)
醫(yī)學(xué)+數(shù)學(xué),側(cè)重醫(yī)學(xué),淡化數(shù)學(xué)。用數(shù)量反映質(zhì)量,如平均期望壽命,解放前為35歲,現(xiàn)在70歲,可反映國(guó)家醫(yī)療衛(wèi)生服務(wù)總體水平的提高。大量觀察+實(shí)驗(yàn)數(shù)據(jù)分析→可以揭示醫(yī)學(xué)規(guī)律。
23
第二節(jié)
統(tǒng)計(jì)工作的基本步驟241.專(zhuān)業(yè)設(shè)計(jì):選題、建立假說(shuō)、確定研究對(duì)象和技術(shù)方法等→個(gè)性
2.統(tǒng)計(jì)設(shè)計(jì):圍繞專(zhuān)業(yè)設(shè)計(jì)確定統(tǒng)計(jì)設(shè)類(lèi)型、樣本大小、分組方法、統(tǒng)計(jì)分析指標(biāo)及統(tǒng)計(jì)分析方法。
一、設(shè)計(jì)
25二、收集資料
(一)資料來(lái)源第一手資料
①
經(jīng)常性:統(tǒng)計(jì)報(bào)表(死亡登記、疫情報(bào)告等),工作記錄(病歷、化驗(yàn));②一時(shí)性:專(zhuān)題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國(guó)、全省衛(wèi)生統(tǒng)計(jì)資料。
26(二)資料要求
1.完整:觀察單位及觀察項(xiàng)目完整。
觀察單位:最基本的獲取數(shù)據(jù)的單元??梢允且粋€(gè)體,亦可以是一個(gè)單位、家庭、地區(qū),一批樣品,一個(gè)采樣點(diǎn)。
27
2.準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂。
3.及時(shí):即時(shí)限性。如人口普查規(guī)定調(diào)查開(kāi)始日期和截止日期。28三.整理資料
整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過(guò)程。所采取的手段→合理化分組,目的→實(shí)現(xiàn)專(zhuān)業(yè)目標(biāo)。質(zhì)分組:按事物的屬性或性質(zhì)分組→分類(lèi)變量;量分組:按數(shù)據(jù)的大小→數(shù)值變量。29四.分析資料
1.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行測(cè)定和描述。
2.統(tǒng)計(jì)推斷:用樣本信息推斷總體特征:①參數(shù)估計(jì),②假設(shè)檢驗(yàn)。30
第三節(jié)統(tǒng)計(jì)資料的類(lèi)型(P25)
有三種類(lèi)型的資料:計(jì)量資料,計(jì)數(shù)資料,等級(jí)資料
基本概念:變量及變量值,研究者對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行觀察和測(cè)量,這種特征稱(chēng)為變量,變量的測(cè)得值叫變量值(也叫觀察值),稱(chēng)為資料。按變量值的性質(zhì)可將資料分為定量資料和定性資料。311.計(jì)量資料定義:通過(guò)度量衡的方法,測(cè)量每一個(gè)觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):有度量衡單位多為連續(xù)性資料(通過(guò)測(cè)量得到)如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012/L)32定義:將全體觀測(cè)單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個(gè)數(shù)。特點(diǎn):沒(méi)有度量衡單位
多為間斷性資料(通過(guò)枚舉或記數(shù)得來(lái))如膚色(黑、白)、血型(ABO)、職業(yè)(工農(nóng)兵)、性別(男女)
2.計(jì)數(shù)資料33
定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過(guò)半定量方法測(cè)量得到。特點(diǎn):每一個(gè)觀察單位沒(méi)有確切值各組之間有性質(zhì)上的差別或程度上的不同。
①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無(wú)效、死亡。
③尿蛋白:
,,,++,+++及以上3.等級(jí)資料34(三)資料的轉(zhuǎn)化(變量類(lèi)型的轉(zhuǎn)化)
數(shù)值變量分類(lèi)變量
35例如:測(cè)得5人的WBC(個(gè)/m3)數(shù)如下:
300060005000800012000數(shù)值變量過(guò)低正常正常正常異常分類(lèi)變量若按正常3人,異常2人分組→二分類(lèi)變量若按過(guò)低1人,正常3人,過(guò)高1人分組→等級(jí)資料36
*提示:
①多途徑;②盡量用定量指標(biāo),否則損失信息量;③定性指標(biāo)可轉(zhuǎn)化為定量指標(biāo),但較粗糙。37第四節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念1、變異2、總體與樣本3、參數(shù)與統(tǒng)計(jì)量
4、誤差5、頻率
381.變異(P3~4)
同質(zhì)事物個(gè)體間的差異。來(lái)源于一些未加控制或無(wú)法控制的甚至不明原因的因素。是統(tǒng)計(jì)學(xué)存在的基礎(chǔ),從本質(zhì)上說(shuō),統(tǒng)計(jì)學(xué)就是研究變異的科學(xué)。
39對(duì)變異的認(rèn)識(shí):
(1)自然變異的范圍是有限的,可以度量;參差不齊的測(cè)量值,通過(guò)大量重復(fù)觀測(cè)可以顯現(xiàn)出統(tǒng)計(jì)分布規(guī)律,如表1-1(P4)數(shù)據(jù)的變異特征至少有以下兩點(diǎn):40①變異的范圍在3.29~6.18;②有明顯的統(tǒng)計(jì)分布規(guī)律,4.7~5.0的人數(shù)最多。根據(jù)表1-1的數(shù)據(jù),統(tǒng)計(jì)上還可以進(jìn)一步推論出正常成年男子紅細(xì)胞計(jì)數(shù)的正常值參考范圍。41表1-1120名正常成年男子紅細(xì)胞計(jì)數(shù)值
5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89。算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.574243
(2)用統(tǒng)計(jì)的方法可以確定出所有研究對(duì)象的變異范圍,如正常成年男性的細(xì)胞數(shù)的范圍。身高范圍等等。
(3)沒(méi)有變異就沒(méi)有統(tǒng)計(jì),變異使統(tǒng)計(jì)有了用武之地。44總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí),總體是指該項(xiàng)變量植的全體。樣本:從總體中隨機(jī)抽取的有代表性的一部分。觀察單位(個(gè)體):最基本的研究單位分為有限總體和無(wú)限總體。由于調(diào)查總體的不可能性、巨大性和沒(méi)必要。對(duì)其中的一部分對(duì)象進(jìn)行調(diào)查----樣本(總體與樣本的關(guān)系。舉例。)樣本選擇的原則--??樣本量(samplesize)2.總體與樣本
(populationandsample)(P31)populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象的全體(集合)。分有限總體與無(wú)限總體樣本:從總體中隨機(jī)抽取的部分觀察單位
隨機(jī)抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機(jī)的抽樣方法(在總體中每個(gè)個(gè)體具有相同的機(jī)會(huì)被抽到)。47對(duì)樣本數(shù)據(jù)進(jìn)行觀察或計(jì)算統(tǒng)計(jì)指標(biāo),目的是推論總體。483.參數(shù)與統(tǒng)計(jì)量
(P31)parameterandstatistic參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù),采用希臘字母記為μ。固定的常數(shù)
總體樣本抽取部分觀察單位
μ?
推斷inference統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù),采用拉丁字母分別記為。統(tǒng)計(jì)量是參數(shù)附近波動(dòng)的隨機(jī)變量。494.誤差誤差:統(tǒng)計(jì)上所說(shuō)的誤差泛指測(cè)量值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。主要有以下二種:系統(tǒng)誤差和隨機(jī)誤差(隨機(jī)測(cè)量誤差,抽樣誤差)。
(1)系統(tǒng)誤差:指數(shù)據(jù)搜集和測(cè)量過(guò)程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱(chēng)為系統(tǒng)誤差。特點(diǎn):具有累加性(2).隨機(jī)誤差:由于一些非人為的偶然因素使得結(jié)果或大或小,是不確定、不可預(yù)知的。特點(diǎn):隨測(cè)量次數(shù)增加而減小。50
在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對(duì)于同一樣本多次測(cè)定結(jié)果不完全一樣,結(jié)果有時(shí)偏大有時(shí)偏小,沒(méi)有傾向性,這種誤差叫隨機(jī)測(cè)量誤差。特點(diǎn):沒(méi)有傾向性,多次測(cè)量計(jì)算平均值可以減小甚至消除隨機(jī)測(cè)量誤差。A、隨機(jī)測(cè)量誤差51
這類(lèi)誤差可以通過(guò)實(shí)驗(yàn)設(shè)計(jì)和技術(shù)措施來(lái)消除或使之減少。
觀察性研究由于組間不可比性產(chǎn)生的系統(tǒng)誤差稱(chēng)為偏倚(bias),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。52
由于抽樣原因造成的樣本指標(biāo)與總體指標(biāo)之間的差別。特點(diǎn):有抽樣抽樣誤差就不可避免。統(tǒng)計(jì)上可以計(jì)算并在一定范圍內(nèi)控制抽樣誤差。B、抽樣誤差(P32)53
(1)改進(jìn)抽樣方法,增加樣本的代表性。樣本量n相等的情況下:整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標(biāo)減少抽樣誤差的方法:545.概率probability
確定性現(xiàn)象:在一定條件下,一定會(huì)發(fā)生或一定不會(huì)發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。
隨機(jī)現(xiàn)象:在同樣條件下可能會(huì)出現(xiàn)兩種或多種結(jié)果,究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱(chēng)為隨機(jī)事件。隨機(jī)事件的特征:①隨機(jī)性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,用大寫(xiě)的P表示;取值[0,1]。55必然事件P=1不可能事件P=0隨機(jī)事件0<P<1
P≤0.05(5%)或P≤0.01(1%)稱(chēng)為小概率事件(習(xí)慣),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。小概率事件56如何學(xué)習(xí)統(tǒng)計(jì)學(xué)
(特點(diǎn):靈活、抽象)理解基本的統(tǒng)計(jì)原理培養(yǎng)統(tǒng)計(jì)思維能力:抽象的,邏輯推理多練習(xí):課堂練習(xí),課下做習(xí)題
聯(lián)系實(shí)際:閱讀文獻(xiàn)工作和生活實(shí)際第一節(jié)頻數(shù)分布表與頻數(shù)分布圖
一、頻數(shù)分布表(frequencytable)
用途:用于描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱(chēng)為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)
編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.191.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱(chēng)為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計(jì)15.85.8150719.8三、頻數(shù)分布圖
P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱(chēng)分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(chēng)(總體則完全對(duì)稱(chēng)),就認(rèn)為該資料是對(duì)稱(chēng)分布(圖4-2)(2)偏態(tài)分布:右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。
表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):
左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布2.描述計(jì)量資料分布的
集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對(duì)稱(chēng)?!儺愃街笜?biāo)
3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:
X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱(chēng)為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency
)。常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù)
(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本
適用條件:資料呈對(duì)稱(chēng)分布,尤其是正態(tài)或近似正態(tài)。
計(jì)算:
(1)直接法(2)頻數(shù)表法p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。
幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴
人數(shù),f⑵
滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:4
1:81:161:32┇1:512
合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.003.中位數(shù)(median)
意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md
適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。
中位數(shù)計(jì)算公式與實(shí)例
先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md
潛伏期/h
(1)
頻數(shù),f(2)
累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48
合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]
=13.5(h)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)小結(jié):
集中趨勢(shì)的描述——平均數(shù)
平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。
不同的分布使用不同的指標(biāo)
(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料
幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料
中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)二、描述離散趨勢(shì)的特征數(shù)
(變異(variation)指標(biāo))
反映數(shù)據(jù)的離散度(Dispersion
)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
3.方差
Variance
4.標(biāo)準(zhǔn)差StandardDeviation
5.變異系數(shù)
CoefficientofVariation
盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500
例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)
1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。
優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。
缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)2.百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:
(定義:P53)Q=P75-P25
四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)
潛伏期/h
(1)
頻數(shù),f(2)
累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48
合計(jì)2145145百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差
方差(variance)也稱(chēng)均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。分母為n-1,稱(chēng)為自由度(能自由取值的變量的個(gè)數(shù))。4.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計(jì)15.85.8150719.85.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)
標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%
意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-13變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;
偏態(tài)分布:中位數(shù)、四分位半間距練習(xí)題p67.第1題。p68.第3題。第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)
計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)一、計(jì)數(shù)資料的數(shù)據(jù)整理
計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合計(jì)2071411022085372061401二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。但絕對(duì)數(shù)通常不具有可比性:
1.如甲、乙兩個(gè)醫(yī)院某病出院人數(shù)不同時(shí),比較兩醫(yī)院該病的死亡人數(shù)沒(méi)有意義
2.如2002級(jí)附二院五年制一、二大班學(xué)生人數(shù)不同時(shí),比較兩班醫(yī)學(xué)統(tǒng)計(jì)學(xué)的及格人數(shù)沒(méi)有意義,因此需要在絕對(duì)數(shù)的基礎(chǔ)上計(jì)算相對(duì)數(shù)。相對(duì)數(shù):兩個(gè)有聯(lián)系的指標(biāo)之比,常用的相對(duì)數(shù)有:一、比二、比率三、速率相對(duì)比簡(jiǎn)稱(chēng)比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。計(jì)算公式為式中兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。(一)比(ratio)
(一)兩個(gè)絕對(duì)數(shù)之比:
如某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100=103,說(shuō)明該醫(yī)院該年每出生100名女?huà)雰?,就?03名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對(duì)比水平。
(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。
例如某地某年齡組男性吸煙和非吸煙的冠心病死亡資料如表7-2,試分析其相對(duì)危害度。
說(shuō)明男性吸煙組的冠心病死亡率是非吸煙組的2.139倍。表7-2
某地某年齡組男性吸煙和非吸煙的冠心病死亡資料
(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。
例服用反應(yīng)停與肢體缺陷關(guān)系病例對(duì)照研究資料如表所示:
比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部分。無(wú)量綱,[0,1]
。1.率(rate)(強(qiáng)度相對(duì)數(shù))說(shuō)明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。
率=(實(shí)際發(fā)生數(shù)/可能發(fā)生總數(shù))×比例基數(shù)如:治愈率、病死率、陽(yáng)性率、人群患病率等比例基數(shù):100%、1000‰、10000/萬(wàn)、100000(1/10萬(wàn))等(按習(xí)慣,使結(jié)果保留1-2位小數(shù))例如:患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬(wàn)分率表示。(二)比率(proportion)2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來(lái)說(shuō)明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計(jì)算公式為
如:教研室16人高級(jí)職稱(chēng)有4人,占25%;中級(jí)職稱(chēng)有8人,占50%;初級(jí)職稱(chēng)有4人,占25%。(三)速率(rate):分母中含有時(shí)間量綱。P58例4-14是反映單位時(shí)間內(nèi)某事件出現(xiàn)的可能性大小,多用于面向人群的出生、死亡和發(fā)病資料的統(tǒng)計(jì).
人口出生率=(某年中活產(chǎn)總數(shù)/該年平均人口數(shù))×100%三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。率與構(gòu)成比容易誤用
年齡組⑴
受檢人數(shù)⑵白內(nèi)障例數(shù)⑶
患者年齡構(gòu)成比(%)⑷患病率(%)⑸=(3)/(2)40~50~60~70~≥80合計(jì)5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.361468448100.0030.522、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。3、進(jìn)行率的對(duì)比分析時(shí),應(yīng)注意資料可比性。如比較療效時(shí),比較組間應(yīng)病情輕重相同,性別影響,應(yīng)按性別分組后再作比較。(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,以及地區(qū)、周?chē)h(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件是否一致或相近等。(2)觀察對(duì)象內(nèi)部結(jié)構(gòu)是否相同,若兩組資料的年齡、性別等構(gòu)成不同,可以分別進(jìn)行同年齡別、同性別的小組率比較或?qū)偮剩ê嫌?jì)率)進(jìn)行標(biāo)準(zhǔn)化后再作比較。
4、正確求平均率。例:若P1=x1/n1,P2=x2/n2
P3=x3/n3
P=(x1+x2+x3)/n1+n2+n3)(正確)
P=(P1+P2+P3)/3(錯(cuò)誤)5.樣本率(或構(gòu)成比)同樣存在抽樣誤差,故應(yīng)進(jìn)行樣本率(或構(gòu)成比)差別的假設(shè)檢驗(yàn)。第四節(jié)統(tǒng)計(jì)圖表
統(tǒng)計(jì)表(statisticaltable)——數(shù)據(jù)代替文字描述,便于統(tǒng)計(jì)結(jié)果的精確、簡(jiǎn)潔的表達(dá)和對(duì)比分析
統(tǒng)計(jì)圖(statisticalchart)——用圖形代替數(shù)據(jù),獲得直觀、形象的效果一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)
2.統(tǒng)計(jì)表的種類(lèi)
標(biāo)題:標(biāo)目:線條:數(shù)字:無(wú)數(shù)字用“—”表示,缺失數(shù)字用“
”表示,數(shù)值為0者記為“0”,不要留空項(xiàng)。備注:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)
頂線底線表名標(biāo)題
表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)
受檢人數(shù)異常人數(shù)檢出率(%)
血壓心率
TTT
GPT
5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75
:TTT(麝香草酚濁度試驗(yàn)),
:GPT(谷丙轉(zhuǎn)氨酶)。2.統(tǒng)計(jì)表的種類(lèi)
根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)表可大致分為簡(jiǎn)單表和復(fù)合表。
簡(jiǎn)單表(simpletable):只按一個(gè)特征或標(biāo)志分組。如表4-1。
組合表(combinativetable):按兩個(gè)或兩個(gè)以上特征或標(biāo)志結(jié)合起來(lái)分組。如表4-8。簡(jiǎn)單表示例分組標(biāo)志為矯治方法
表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)
受檢人數(shù)異常人數(shù)檢出率(%)
血壓心率
TTT
GPT
5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75
:TTT(麝香草酚濁度試驗(yàn)),
:GPT(谷丙轉(zhuǎn)氨酶)。
(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)復(fù)合表示例
分組標(biāo)志:不同年份不同檢測(cè)指標(biāo)例下表是復(fù)方豬膽膠囊治療兩型老年性慢性支氣管炎的療效比較,請(qǐng)對(duì)該表的繪制進(jìn)行評(píng)價(jià),并指出所存在的問(wèn)題。表
兩個(gè)組的療效觀察
分型及療效
單純型慢性支氣管炎
喘息型慢性支氣管炎
指標(biāo)
治愈
顯效
好轉(zhuǎn)
無(wú)效
治愈
顯效
好轉(zhuǎn)
無(wú)效
例數(shù)
60
98
51
12
23
83
65
11
合計(jì)
209
12
171
11
療效
%
94.6
94.0
表復(fù)方豬膽膠囊治療兩型老年慢性支氣管炎患者的療效比較一、統(tǒng)計(jì)圖
統(tǒng)計(jì)圖(statisticalchart或statisticalgraph)是用點(diǎn)、線、面等幾何圖形,直觀形象地表達(dá)、描述數(shù)據(jù)或結(jié)果。
1.統(tǒng)計(jì)圖的結(jié)構(gòu)
2.
統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)1、統(tǒng)計(jì)圖的結(jié)構(gòu)標(biāo)題:用于簡(jiǎn)明扼要地說(shuō)明資料的內(nèi)容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個(gè)統(tǒng)計(jì)圖的視覺(jué)中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。圖例:用于識(shí)別比較的統(tǒng)計(jì)圖中各種圖形所代表的含義。刻度:即縱軸和橫軸上的坐標(biāo)??潭葦?shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。2.統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)直條圖百分條圖圓圖線圖與半對(duì)數(shù)線圖直方圖箱圖散點(diǎn)圖統(tǒng)計(jì)地圖
(1)條圖(bargraph)
1.概念
條圖用等寬長(zhǎng)條的高度表示按性質(zhì)分類(lèi)資料各類(lèi)別的數(shù)值大小,用于表示他們之間的對(duì)比關(guān)系。
2.適用資料:相互獨(dú)立的資料(資料有明確分
組,不連續(xù))。
3.分類(lèi)
(1)單式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),一個(gè)分組因素。
(2)復(fù)式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),兩個(gè)分組因素。
條圖表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)
受檢人數(shù)異常人數(shù)檢出率(%)
血壓心率
TTT
GPT
5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75
:TTT(麝香草酚濁度試驗(yàn)),
:GPT(谷丙轉(zhuǎn)氨酶)。
(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)條圖條圖繪制條圖注意事項(xiàng)
⑴縱軸的刻度必須從“0”開(kāi)始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。
(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。
(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。
(2)圓圖(piegraph)
1.概念
以圓形的總面積代表100%,把面積按比例分成若干部分,以角度大小來(lái)表示各部分所占的比重。
2.適用資料:構(gòu)成比資料2002年某醫(yī)院1402例孕婦分娩結(jié)果分娩結(jié)果例數(shù)構(gòu)成比(%)過(guò)期產(chǎn)211死產(chǎn)211早產(chǎn)21215足月114883總計(jì)1402100(3)百分條圖(percentagechart)
百分條圖的作用與圓圖相同。但更適用于多組百分比的比較。020406080100呼吸系統(tǒng)病腦血管病惡性腫瘤損傷與中毒心臟疾病其它圖2-18我國(guó)部分縣1988年的死因構(gòu)成比不同性別某癌三種類(lèi)型的構(gòu)成
分化型癌低分化腺癌未分化型合計(jì)男52.327.819.9100女30.218.151.7100(4)線圖一、普通線圖(線圖)1.概念線圖(linegraph)是用線段的升降來(lái)表示統(tǒng)計(jì)指標(biāo)的變化趨勢(shì)。如某事物隨時(shí)間的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)象變遷的情況。2.適用資料適用于隨時(shí)間變化的連續(xù)性資料。3.分析目的:用線段的升降表示某事物在時(shí)間上的發(fā)展變化趨勢(shì)。二、半對(duì)數(shù)線圖1.概念是一種特殊的線圖,其坐標(biāo)縱軸是對(duì)數(shù)尺度,特別適宜作不同指標(biāo)變化速度的比較。
2.適用資料適用于隨時(shí)間變化的連續(xù)性資料,尤其比較數(shù)值相差懸殊的多組資料時(shí)采用。3.分析目的:半對(duì)數(shù)線圖中線段的升降是用來(lái)表示某事物發(fā)展速度(或者說(shuō)是相對(duì)比)。普通線圖(線圖):縱橫軸均為算術(shù)尺度,半對(duì)數(shù)圖:縱軸為對(duì)數(shù)尺度,橫軸為算術(shù)尺度。注意:在普通線圖中,結(jié)核病死亡率線條的坡度比白喉死亡率線條下降的陡峭,只能說(shuō)明兩種疾病的死亡率逐年變化幅度不同,不能錯(cuò)認(rèn)為結(jié)核病死亡率的下降速度比白喉死亡率的下降速度快。在半對(duì)數(shù)線圖中就不會(huì)出現(xiàn)這種錯(cuò)覺(jué)。在比較事物間的變化速度時(shí),應(yīng)選擇半對(duì)數(shù)線圖。
(5)直方圖1.概念是以直方面積描述各組頻數(shù)的多少,面積的總和相當(dāng)于各組頻數(shù)之和。2.適用資料:直方圖用于表達(dá)連續(xù)性資料的頻數(shù)分布。3.制圖要求:(1)一般縱軸表示被觀察現(xiàn)象的頻數(shù)(或頻率),橫軸表示連續(xù)變量,以各矩形(寬為組距)的面積表示各組段頻數(shù)。(2)直方圖的各直條間不留空隙;各直條間可用直線分隔,但也可不用直線分隔。(3)組距不等時(shí),橫軸仍表示連續(xù)變量,但縱軸是每個(gè)橫軸單位的頻數(shù)。(6)箱式圖箱式圖:使用5個(gè)統(tǒng)計(jì)量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。
箱式圖的箱子兩端分別是上四分位數(shù)(P75)和下四分位數(shù)(P25),中間橫線是中位數(shù)(P50)兩端連線分別是除異常值外的最小值和最大值。另外標(biāo)記可能的異常值。顯然箱子越長(zhǎng),數(shù)據(jù)變異程度越大。中間橫線在箱子中點(diǎn)表明分布對(duì)稱(chēng),否則不對(duì)稱(chēng)。例某地調(diào)查不同類(lèi)型化妝品廠車(chē)間內(nèi)粉塵數(shù),結(jié)果繪制成圖2-20。圖中顯示粉塵數(shù)的分布呈偏態(tài)分布,凈化廠粉塵數(shù)較少,非凈化廠粉塵數(shù)較多。(7)散點(diǎn)圖1.概念
散點(diǎn)圖以直角坐標(biāo)系中各點(diǎn)的密集程度和趨勢(shì)來(lái)表示兩現(xiàn)象間的關(guān)系。常在對(duì)資料進(jìn)行相關(guān)分析之前使用。
2.適用資料:雙變量資料。12名女大學(xué)生身高與體重散點(diǎn)圖(8)統(tǒng)計(jì)地圖統(tǒng)計(jì)地圖(statisticalmap):是用不同的顏色和花紋表示統(tǒng)計(jì)量的值在地理分布上的變化,適宜描述研究指標(biāo)的地理分布。第一節(jié)頻數(shù)分布表與頻數(shù)分布圖
一、頻數(shù)分布表(frequencytable)
用途:用于描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱(chēng)為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)
編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.191.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱(chēng)為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計(jì)15.85.8150719.8三、頻數(shù)分布圖
P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱(chēng)分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(chēng)(總體則完全對(duì)稱(chēng)),就認(rèn)為該資料是對(duì)稱(chēng)分布(圖4-2)(2)偏態(tài)分布:右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。
表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):
左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布2.描述計(jì)量資料分布的
集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對(duì)稱(chēng)。——變異水平指標(biāo)
3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:
X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱(chēng)為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency
)。常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù)
(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本
適用條件:資料呈對(duì)稱(chēng)分布,尤其是正態(tài)或近似正態(tài)。
計(jì)算:
(1)直接法(2)頻數(shù)表法p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。
幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴
人數(shù),f⑵
滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:4
1:81:161:32┇1:512
合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.003.中位數(shù)(median)
意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md
適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。
中位數(shù)計(jì)算公式與實(shí)例
先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md
潛伏期/h
(1)
頻數(shù),f(2)
累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48
合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]
=13.5(h)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)小結(jié):
集中趨勢(shì)的描述——平均數(shù)
平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。
不同的分布使用不同的指標(biāo)
(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料
幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料
中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)二、描述離散趨勢(shì)的特征數(shù)
(變異(variation)指標(biāo))
反映數(shù)據(jù)的離散度(Dispersion
)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
3.方差
Variance
4.標(biāo)準(zhǔn)差StandardDeviation
5.變異系數(shù)
CoefficientofVariation
盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500
例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)
1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。
優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。
缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)2.百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:
(定義:P53)Q=P75-P25
四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)
潛伏期/h
(1)
頻數(shù),f(2)
累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48
合計(jì)2145145百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差
方差(variance)也稱(chēng)均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。分母為n-1,稱(chēng)為自由度(能自由取值的變量的個(gè)數(shù))。4.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計(jì)15.85.8150719.85.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)
標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%
意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-13變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;
偏態(tài)分布:中位數(shù)、四分位半間距練習(xí)題p67.第1題。p68.第3題。第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)
計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)一、計(jì)數(shù)資料的數(shù)據(jù)整理
計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第2課《 走月亮》(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版語(yǔ)文四年級(jí)上冊(cè)
- 第一章 第一節(jié)地球的宇宙環(huán)境 教學(xué)設(shè)計(jì) 2024-2025學(xué)年七年級(jí)上冊(cè)地理人教版
- 12 古詩(shī)三首 己亥雜詩(shī) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年語(yǔ)文五年級(jí)上冊(cè)統(tǒng)編版
- 2025年公租房申請(qǐng)資料勞動(dòng)合同7篇
- 第2課 西方國(guó)家古代和近代政治制度的演變(課時(shí)教學(xué)設(shè)計(jì))高二歷史同步備課系列(統(tǒng)編版選擇性必修一)
- Unit 6 Useful numbers (教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教PEP版(2024)英語(yǔ)三年級(jí)上冊(cè)
- Lesson 6 I can see with my eyes. Period 1 (教學(xué)設(shè)計(jì))-2024-2025學(xué)年接力版英語(yǔ)四年級(jí)上冊(cè)
- 熱電廠項(xiàng)目經(jīng)濟(jì)分析
- 快遞安全保障合同6篇
- 中式餐飲市場(chǎng)規(guī)模與增長(zhǎng)趨勢(shì)
- 2024年中儲(chǔ)糧油脂有限公司招聘考試真題
- 新版人教版七年級(jí)下冊(cè)數(shù)學(xué)全冊(cè)教案教學(xué)設(shè)計(jì)含教學(xué)反思
- 平面設(shè)計(jì)創(chuàng)意與制作課件
- 化學(xué)專(zhuān)業(yè)英語(yǔ)元素周期表
- 新湘版小學(xué)科學(xué)四年級(jí)下冊(cè)教案(全冊(cè))
- 實(shí)驗(yàn)心理學(xué)課件(周愛(ài)保博士版)
- 04 第三章 環(huán)境污染物的生物轉(zhuǎn)運(yùn)和生物轉(zhuǎn)化 -毒物動(dòng)力學(xué)
- ic半導(dǎo)體測(cè)試基礎(chǔ)(中文版)參考范本
- 公司員工工資表(簡(jiǎn)單)
- 殺蟲(chóng)雙(單)合成反應(yīng)的研究及其工藝條件的優(yōu)化
- CorelDraw常用快捷鍵
評(píng)論
0/150
提交評(píng)論