研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述_第1頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述_第2頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述_第3頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述_第4頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

研究生醫(yī)學(xué)統(tǒng)計學(xué)定性資料統(tǒng)計描述相關(guān)概念定性資料是指將觀察單位按照某種屬性或類別進(jìn)行分組,然后計數(shù)各組的觀察單位個數(shù)所收集的資料。根據(jù)變量類別之間是否有順序、等級、大小關(guān)系,分為無序分類變量資料和有序分類變量資料。定性資料常見的數(shù)據(jù)形式是絕對數(shù)絕對數(shù):調(diào)查研究和實驗研究得到的定性資料經(jīng)過整理,清點數(shù)目得到的數(shù)值。如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。絕對數(shù)反映一定條件下某種事物的規(guī)?;蛩?是計劃或總結(jié)工作的依據(jù)。絕對數(shù)通常不具有可比性。因此需要在絕對數(shù)的基礎(chǔ)上計算相對數(shù)。例:調(diào)查得,某年小學(xué)生中流腦發(fā)?。?/p>

甲地區(qū)63例,乙地區(qū)35例。

甲地區(qū)流腦流行比乙地區(qū)嚴(yán)重×√

如已知小學(xué)生總?cè)藬?shù):甲地區(qū)50051人,乙地區(qū)14338人,可算出兩個發(fā)病率:

甲地區(qū)流腦發(fā)病率:63/50051×1000‰=1.26‰乙地區(qū)流腦發(fā)病率:35/14338×1000‰=2.44‰

乙地區(qū)流腦流行比甲地區(qū)嚴(yán)重一、定性資料的頻數(shù)分布

某醫(yī)院2001年住院病人5類疾病的死亡情況疾病種類死亡人數(shù)百分比(%)惡性腫瘤5033.33呼吸系統(tǒng)疾病3020.00消化系統(tǒng)疾病2013.33循環(huán)系統(tǒng)疾病4026.67傳染病106.67合計150100.00針刺合谷治療胃痛的效果療效例數(shù)百分比(%)治愈5960.82有效2323.71無效1515.46合計97100.00

二、定性資料的描述指標(biāo)——相對數(shù)(Relativenumber)相對數(shù):兩個有聯(lián)系的指標(biāo)(數(shù)值)之比常用的相對數(shù)指標(biāo)大致有三種類型:頻率(relativefrequencyorproportion)強度(intensityorrate)相對比(relativeratio)1.分類資料的描述—頻率和頻率分布2.人時資料的描述—強度3.復(fù)合指標(biāo)—相對比4.相對數(shù)應(yīng)用中需注意的問題*注意指標(biāo)計算中的分子和分母的含義1.分類資料的描述—頻率和頻率分布1.1二分類資料的描述—頻率當(dāng)事物只有兩種可能的結(jié)局時,如存活與死亡、患病與未患病等,常用一個頻率來描述結(jié)局的規(guī)律性。頻率型指標(biāo)是最常見的,通常近似地反映某一事件出現(xiàn)的機(jī)會大小,如發(fā)病概率、死亡概率等分子是分母的一部分分子分母量綱相同比例無量綱,取值在[0,1]K是比例基數(shù),如100%,也可取為1000‰、1萬/1萬和10萬/10萬等,

例:某婦產(chǎn)科醫(yī)生記錄了1402名臨產(chǎn)母親的妊娠情況,結(jié)果足月產(chǎn)者1148例。足月產(chǎn)率=1148/1402=81.9%proportion陽性率的本質(zhì)是頻率,它是對總體中陽性事件發(fā)生概率的估計。1.2多分類資料的描述—頻率分布當(dāng)事物有多于兩種可能的結(jié)局時,常用頻率分布(構(gòu)成比)來描述結(jié)局的規(guī)律性。各結(jié)局頻率總和必為100%。某一結(jié)局的頻率變化必然導(dǎo)致其他部分的變化。設(shè)某事物結(jié)局?jǐn)?shù)的合計由n1,n2,···,nk個部分組成,某一結(jié)局的頻率(構(gòu)成比)的計算為:…..…….

某醫(yī)院2001年住院病人5類疾病的死亡情況疾病種類死亡人數(shù)頻率(%)惡性腫瘤5033.33呼吸系統(tǒng)疾病3020.00消化系統(tǒng)疾病2013.33循環(huán)系統(tǒng)疾病4026.67傳染病106.67合計150100.002.人時資料的描述—強度在流行病學(xué)隨訪中,不同個體被觀察的事件長度各不相同,常用人時總和表示被觀察的人和事件的總和。“強度”是流行病學(xué)、統(tǒng)計學(xué)術(shù)語——單位時間內(nèi)某現(xiàn)象發(fā)生的頻率。強度型指標(biāo)通常是指一段時間內(nèi)的平均概率。如人時發(fā)病率的分子是新發(fā)生的事件數(shù),分母是人時數(shù)(觀察人數(shù)乘以時間)的總和,多用于大人群長時間隨訪的資料。例1在某醫(yī)院的院內(nèi)感染調(diào)查中,5031名病人共觀察了127859人日(例均25.4日),其中有596人在醫(yī)院發(fā)生感染,請計算院內(nèi)感染率。平均每天有0.47%的病人在醫(yī)院發(fā)生感染。例2某醫(yī)院對同一疾病開展甲、乙兩種手術(shù)治療,分別隨機(jī)抽取100名患者評價復(fù)發(fā)率。已知手術(shù)完成時間各不相同,而未復(fù)發(fā)患者的最后隨訪時間均為2006年1月1日。限于篇幅,在下表中僅給出部分?jǐn)?shù)據(jù),以說明此類資料的統(tǒng)計描述方法。兩種手術(shù)方案的復(fù)發(fā)率比較(部分?jǐn)?shù)據(jù))手術(shù)方案手術(shù)完成時間復(fù)發(fā)情況復(fù)發(fā)前被觀察人年數(shù)甲1990-1-12005-1-1復(fù)發(fā)15.01991-7-1未復(fù)發(fā)14.51996-1-1未復(fù)發(fā)10.0合計——39.5乙1994-1-11995-1-1復(fù)發(fā)1.02004-1-1未復(fù)發(fā)2.02004-7-1未復(fù)發(fā)1.5合計——4.5甲方案:1/39.5×100%=2.53%/年,乙方案:1/4.5×100%=22.22%/年3.復(fù)合指標(biāo)—相對比(ratio)概念:是兩個有關(guān)聯(lián)的變量A與B之比,它表示相對于B的一個(或十個、百個、千個等)單位,A有多少個單位?;駻是B的若干倍或幾分之幾。ratioA和B可以是絕對數(shù)、平均數(shù),也可以是相對數(shù)A和B的量綱可以相同,也可以不同A和B彼此分離,互不重疊或包含如:人口出生性別比;每千人口的醫(yī)生數(shù)、每千人口的病床數(shù)、每醫(yī)生的門診工作量、變異系數(shù)等。人口出生性別比國際上一般以每出生100個女性人口相對應(yīng)出生的男性人口的數(shù)值來表示。一般在102~107之間。

我國1981年第3次人口普查是108;1989年第4次人口普查是112;2000年第5次人口普查高達(dá)116,遠(yuǎn)超國際認(rèn)同的可以容忍的最高警戒線107。

2.2.4相對數(shù)應(yīng)用中需注意的問題1)分母數(shù)據(jù)一般不宜過小2)防止概念混淆3)正確合并估計頻率(或強度)型指標(biāo)4)相對數(shù)進(jìn)行比較應(yīng)注意可比性請問該說法是否正確?

例:某醫(yī)生治療了4例支氣管哮喘病患者,其中3例有效,即報告有效率為75。goback某醫(yī)院統(tǒng)計1985-1990年兒科住院病人疾病種類分布情況見表:疾病種類病人數(shù)%先天性心臟病25023.8風(fēng)濕性心臟病75071.4其它504.7表某醫(yī)院兒科住院病人疾病種類分布情況結(jié)論:我國少年兒童(18歲以下)的風(fēng)濕性心臟病發(fā)病率約為71.4%。表某社區(qū)高血壓防治干預(yù)試驗(5年)前后死亡原因變化表死亡原因干預(yù)前干預(yù)后充血性心力衰竭23.24.3腦血管病39.623.2尿毒癥12.29.8冠狀動脈病和心臟病猝死17.148.7其它死因7.914.0合計100.0100.0有人據(jù)此提出干預(yù)試驗雖然可以降低充血性心力衰竭等的死亡率,但卻增高了冠狀動脈病和心臟病猝死的死亡率。表某市1980年和1990年五種傳染病發(fā)病情況病種1980年1990年病例數(shù)構(gòu)成比(%)病例數(shù)構(gòu)成比(%)痢疾360449.39203237.92肝炎120316.49114321.33流腦6989.5654210.11麻疹89012.2076714.31腮腺炎90212.3687516.33合計7297100.005359100.00有人據(jù)此得出1990年和1980年相比,痢疾發(fā)病下降,肝炎發(fā)病上升最明顯的結(jié)論。goback例某病兩種療法的治愈率(%)比較的資料如表表某病兩種療法的治愈率(%)的比較西醫(yī)療法組中西醫(yī)結(jié)合療法組病例數(shù)治愈數(shù)治愈率(%)病例數(shù)治愈數(shù)治愈率(%)普通型603660201365重型20840602745爆發(fā)型2042020525合計10048481004545goback()()例:某班有男生50人,女生20人,男生英語四級通過率為80%,女生四級通過率為100%,請問該班四級通過率為多少?答案1:90%。答案2:85.7%goback1.觀察對象是否同質(zhì),研究方法(如檢測手段、抽樣方法)是否相同,觀察的時間是否一致等。2.其他在專業(yè)上認(rèn)為有意義的影響因素應(yīng)接近均衡。相對數(shù)進(jìn)行比較應(yīng)注意可比性例某病兩種療法的治愈率(%)比較的資料如表表某病兩種療法的治愈率(%)的比較西醫(yī)療法組中西醫(yī)結(jié)合療法組病例數(shù)治愈數(shù)治愈率(%)病例數(shù)治愈數(shù)治愈率(%)普通型603660201365重型20840602745爆發(fā)型2042020525合計10048481004545一、醫(yī)學(xué)人口統(tǒng)計常用指標(biāo)頻率型指標(biāo)相對比型指標(biāo)實踐中,因為一年中不斷有人去世,又不斷有人出生,分母的精確值很難得到。假定當(dāng)年每位去世者平均活了半年,每位出生者也平均活了半年,則粗死亡率可近似地寫成強度型指標(biāo)(近似)頻率型指標(biāo)近似相對比型指標(biāo)強度型指標(biāo)(近似)頻率型指標(biāo)二、疾病統(tǒng)計常用指標(biāo)頻率型指標(biāo)頻率型指標(biāo)強度型指標(biāo)(近似)發(fā)病率(incidencerate,IR)表示一定時期內(nèi),在可能發(fā)生某病的一定人群中新發(fā)生某病的強度。患病率(prevalencerate,PR)又稱為現(xiàn)患率,指某時點上受檢人數(shù)中現(xiàn)患某種疾病的頻率,患病率分為時點患病率(pointprevalencerate)和期間患病率(periodprevalencerate)。治愈率(curerate)表示受治病人中治愈的頻率。有效率表示受治病人中治療有效的頻率。生存率(survivalrate):指病人能活到某一時點的概率。疾病統(tǒng)計常用指標(biāo)指標(biāo)分子分母基數(shù)類型某病發(fā)病率時期內(nèi)新發(fā)生的某病病例數(shù)年平均人口數(shù)×1年10萬/10萬強度型(近似)時點患病率時點現(xiàn)患疾病人數(shù)檢查人口數(shù)10萬/10萬頻率型期間患病率時期現(xiàn)患疾病人數(shù)檢查人口數(shù)10萬/10萬頻率型治愈率治愈人數(shù)接受治療人數(shù)100%頻率型生存率活滿特定時期的人數(shù)期初存活的人數(shù)100%頻率型殘疾患病率殘疾患者人數(shù)檢查人數(shù)100%頻率型三、動態(tài)數(shù)列

動態(tài)數(shù)列,按照一定的時間順序,將一系列描述某事物的統(tǒng)計指標(biāo)依次排列起來,就可以觀察和比較事物在時間上的變化和發(fā)展趨勢,這些統(tǒng)計指標(biāo)可以為絕對數(shù)、相對數(shù)或平均數(shù)。相對比指標(biāo)(一)、絕對增長量1、累計增長量,即報告年的指標(biāo)與某一固定水平(基期水平)指標(biāo)值差。2、逐年增長量,即報告年的指標(biāo)與前一年指標(biāo)之差年份指標(biāo)符號年末床位數(shù)絕對增長量發(fā)展速度%增長速度%累計逐年定基環(huán)比定基環(huán)比1990a05420——————1991a15608188188103.4103.43.43.41992a25766346158106.4102.96.42.91993a35886466120108.6102.18.62.11994a45991571105110.5101.710.51.71995a56284864293115.9104.915.94.91996a666091189325121.9105.221.95.21997a769551535346128.3105.328.35.31998a873521932397135.6105.735.65.7表某地1990~1998年床位發(fā)展動態(tài)(二)、發(fā)展速度與增長速度1、定基發(fā)展速度,即用報告期的指標(biāo)與某一時期(固定為基期)指標(biāo)之比。2、環(huán)比發(fā)展速度,即用報告期的指標(biāo)與其上一期指標(biāo)之比。年份指標(biāo)符號年末床位數(shù)絕對增長量發(fā)展速度%增長速度%累計逐年定基環(huán)比定基環(huán)比1990a05420——————1991a15608188188103.4103.43.43.41992a25766346158106.4102.96.42.91993a35886466120108.6102.18.62.11994a45991571105110.5101.710.51.71995a56284864293115.9104.915.94.91996a666091189325121.9105.221.95.21997a769551535346128.3105.328.35.31998a873521932397135.6105.735.65.7表某地1990~1998年床位發(fā)展動態(tài)(三)、平均發(fā)展速度和平均增長速度平均發(fā)展速度是各環(huán)比增長速度的幾何平均數(shù),說明某事物在一個較長的時期中逐年平均增長的程度。1、某醫(yī)院某年住院病人中胃癌患者占5%,則_______。A.5%是強度指標(biāo)B.5%是頻率指標(biāo)C.5%是相對比指標(biāo)D.5%是絕對數(shù)2、計算麻疹疫苗接種后血清檢查的陽性率,分母為_______。A.麻疹易感人群B.麻疹患者數(shù)C.麻疹疫苗接種人數(shù)D.麻疹疫苗接種后的陰性人數(shù)3、某病患者120人,其中男性114人,女性6人,分別占95%與5%,則結(jié)論為_________。A.該病男性易得B.該病女性易得C.根據(jù)該資料可計算出男女性的發(fā)病人數(shù)D.尚不能得出結(jié)論4、定基比與環(huán)比的指標(biāo)是_______。A.構(gòu)成比B.平均數(shù)C.頻率D.相對比5、一項新的治療方法可延長病人的生命,但不能治愈該病,則最有可能發(fā)生的情況是_______。A.該病的患病率增加B.該病的患病率減少C.該病的發(fā)病率增加D.該病的發(fā)病率減少常用統(tǒng)計圖表統(tǒng)計表(statisticaltable)是把統(tǒng)計分析結(jié)果中數(shù)據(jù)和統(tǒng)計指標(biāo)用表格列出。統(tǒng)計圖(statisticalgraph)

統(tǒng)計圖是用點的位置、線段的升降、直條的長短或面積的大小等來表達(dá)統(tǒng)計資料的一種形式。統(tǒng)計表一、統(tǒng)計表的意義與制作原則1.統(tǒng)計表的意義

統(tǒng)計表用簡明的表格形式,替代某些文字?jǐn)⑹?,便于計算和分析?.制表原則:重點突出、層次清楚3.統(tǒng)計表的結(jié)構(gòu)標(biāo)題標(biāo)目線條數(shù)字注釋或備注

某醫(yī)院2001年住院病人5類疾病的死亡情況疾病種類死亡人數(shù)頻率(%)惡性腫瘤5033.33呼吸系統(tǒng)疾病3020.00消化系統(tǒng)疾病2013.33循環(huán)系統(tǒng)疾病4026.67傳染病106.67合計150100.00標(biāo)題橫標(biāo)目縱標(biāo)目4.制表的基本要求(1)標(biāo)題:概括表的主要內(nèi)容,包括研究的時間、地點和研究內(nèi)容,放在表的上方。(2)標(biāo)目:分別用橫標(biāo)目和縱標(biāo)目說明表格每行和每列數(shù)字的意義,注意標(biāo)明指標(biāo)的單位。橫標(biāo)目相當(dāng)于句子的主語部分:被說明的對象,列在表的左側(cè)??v標(biāo)目相當(dāng)于句子的謂語部分:用以闡述主語具備的特征。列在表的右側(cè)。(3)線條:至少用三條線,表格的頂線和底線將表格與文章的其它部分分隔開來,縱標(biāo)目下橫線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)分隔開來。部分表格可再用橫線將合計分隔開,或用橫線將兩重縱標(biāo)目分割開。其它豎線和斜線一概省去。(4)數(shù)字:用阿拉伯?dāng)?shù)字表示。無數(shù)字用“—”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”,不要留空項。數(shù)字按小數(shù)位對齊。(5)備注:表中數(shù)字區(qū)不要插入文字,也不列備注項。必須說明者標(biāo)“*”號,在表下方說明。二、統(tǒng)計表的分類簡單表:按研究對象的單一特征分組。復(fù)合表:按研究對象的兩個或以上特征結(jié)合起來分組。

某醫(yī)院2001年住院病人5類疾病的死亡情況疾病種類死亡人數(shù)頻率(%)惡性腫瘤5033.33呼吸系統(tǒng)疾病3020.00消化系統(tǒng)疾病2013.33循環(huán)系統(tǒng)疾病4026.67傳染病106.67合計150100.00簡單表例某病兩種療法的治愈率(%)比較的資料如表表某病兩種療法的治愈率(%)的比較西醫(yī)療法組中西醫(yī)結(jié)合療法組病例數(shù)治愈數(shù)治愈率(%)病例數(shù)治愈數(shù)治愈率(%)普通型603660201365重型20840602745爆發(fā)型2042020525合計10048481004545復(fù)合表是將疾病類型和治療方法結(jié)合起來分組。統(tǒng)計圖1.統(tǒng)計圖的意義:將統(tǒng)計數(shù)據(jù)形象化,把資料所反映的趨勢、多少、分布、動態(tài)和現(xiàn)象之間的數(shù)量關(guān)系等形象地表現(xiàn)出來,易于做分析比較。2.統(tǒng)計圖的種類:根據(jù)資料類型和統(tǒng)計分析目的不同,需要用不同的統(tǒng)計圖表達(dá)數(shù)據(jù)和統(tǒng)計指標(biāo)值。常用的統(tǒng)計圖有直條圖、直方圖、百分比條圖和圓圖、線圖、散點圖和統(tǒng)計地圖等,還有在數(shù)據(jù)探索性分析中應(yīng)用的莖葉圖、殘差圖、箱式圖,序貫分析的檢驗區(qū)域圖,判別分析的類別分布圖,聚類分析的譜系圖等特殊分析圖等。3.統(tǒng)計圖制作的一般原則

(1)根據(jù)資料性質(zhì)和分析目的正確選用適當(dāng)?shù)慕y(tǒng)計圖。(2)必須有標(biāo)題,概括統(tǒng)計圖資料的時間、地點和主要內(nèi)容。統(tǒng)計圖的標(biāo)題一般放在圖的下方。(3)統(tǒng)計圖一般有橫軸和縱軸,并分別用橫標(biāo)目和縱標(biāo)目說明橫軸和縱軸代表的指標(biāo)和單位。一般將兩軸的相交點即原點處定為0??v橫軸的比例一般以5:7為宜。(4)統(tǒng)計圖用不同線條和顏色表達(dá)不同事物和對象的統(tǒng)計量,需要附圖例加以說明。圖例可放在圖的右上角空隙處或下方中間位置。二、常用統(tǒng)計圖

1.直條圖(barchart)

2.圓圖(piechart)和百分比條圖(percentbarchart)

3.線圖(linegraph)

4.直方圖(histogram)

5.統(tǒng)計地圖(statisticalmap)

6.其他特殊分析圖

箱式圖(boxplot)

莖葉圖(stem-leafplot)1.直條圖(barchart)用相同寬度的直條長短表示相互獨立的某統(tǒng)計指標(biāo)值的大小。直條圖按對象的分組分單式和復(fù)式兩種。

例圖1顯示某地某年主要死因死亡率資料,不同死因是相互獨立的不連續(xù)指標(biāo),因此用直條圖。該圖只按死因分類,為單式直條圖。圖1某年某地主要死因的死亡率(/10萬)直條圖的縱軸尺度起點必須為零示意圖2.圓圖和百分比條圖適合于描述定性變量的頻率分布資料。圓圖(piechart)是以圓形總面積作為100%,將其分割成若干個扇面表示事物各類別的頻率。百分比條圖(percentbarchart)是以矩形總長度作為100%,將其分割成不同長度的段表示各類別的頻率。

例某年某地進(jìn)行嬰兒死亡原因的調(diào)查,根據(jù)城市嬰兒死因的構(gòu)成資料繪制成圖3。

從圖3可見出生窒息是嬰兒死亡的首位死因,出生窒息、早產(chǎn)和肺炎頭三位死因占總死亡的60.3%,是嬰兒死亡防治的重點。

圖3

某年某地城市嬰兒死因構(gòu)成比

例圖4是根據(jù)某地20世紀(jì)70年代和80年代惡性腫瘤發(fā)病登記資料繪制成的百分比條圖。由圖4可見不同年代主要惡性腫瘤頻率分布中,鼻咽癌和肝癌頻率減少,肺癌明顯增加。百分比條圖特別適合作多個頻率分布的比較,將不同組別,不同時間或不同地區(qū)的某分類指標(biāo)的頻率分布平行地繪制成多個百分比條圖,可以方便地比較其各部分的頻率的差異。圖420世紀(jì)70年代和80年代某地7常見惡性腫瘤發(fā)病構(gòu)成比較

3.線圖(linegraph)線圖是用線段的升降來表示數(shù)值的變化,適合于描述某變量隨另一連續(xù)性數(shù)值變量變化的趨勢,最常用于描述變量隨時間而變化的趨勢。

普通線圖:橫軸和縱軸都是算術(shù)尺度。

半對數(shù)線圖:橫軸是算術(shù)尺度,縱軸是對數(shù)尺度,特別適宜作不同指標(biāo)變化速度的比較。

例圖5是根據(jù)1990~2000年某沿海城市甲狀腺功能亢進(jìn)(甲亢)發(fā)病率資料繪制的普通線圖。圖5可看出在1995年開始食鹽加碘后,甲亢發(fā)病率有一突增高峰,1999年以后又逐漸下降的趨勢。圖51990~2000年某沿海城市甲狀腺功能亢進(jìn)發(fā)病率變化趨勢

0123lgY

例調(diào)查某地1997年~2001年兩種與性傳播有關(guān)疾病—艾滋病和梅毒的發(fā)病率變化趨勢,資料分別繪制成普通線圖和半對數(shù)線圖。

普通線圖顯示梅毒的增長幅度較大,但半對數(shù)線圖則顯示艾滋病的增長速度更快。圖61997~2001年某地艾滋病和梅毒發(fā)病率的變化趨勢(a)縱軸為算術(shù)尺度;(b)縱軸為對數(shù)尺度。兩者的區(qū)別:普通線圖的橫、縱坐標(biāo)均為算術(shù)尺度,在某兩個不同的時間段上,如果終點相對于起點的“絕對改變量”相同,將在圖形上表現(xiàn)為相同的增幅(或減幅),直觀呈現(xiàn)的是數(shù)量變化的態(tài)勢;半對數(shù)線圖的橫坐標(biāo)仍為算術(shù)尺度(如時間),縱坐標(biāo)的觀察指標(biāo)(如發(fā)病率、病死率等)則進(jìn)行了對數(shù)轉(zhuǎn)換——即對數(shù)尺度,在某兩個不同時間段上,如果終點相對于起點的“相對改變量”相同,將在半對數(shù)線圖上表現(xiàn)為相同的增幅(或減幅),所以半對數(shù)線圖適用于呈現(xiàn)事物發(fā)展變化的速度。如:以兩個觀察指標(biāo)A和B變化速度的比較為例,在某一時間段當(dāng)指標(biāo)A發(fā)生10→100的變化、指標(biāo)B發(fā)生100→1000的變化時,“絕對增長量”分別是90和900,相差較遠(yuǎn);“相對增長量”卻都是10倍于起點水平。顯然,變化速度的比較所注重的正是“相對增長量”,注意:普通線圖的縱軸一般以0點作起點,否則需作特殊標(biāo)記或說明,以防給讀者錯誤印象。標(biāo)記直線的連接點時要注意,如測定值是在某時間段或數(shù)值段的,應(yīng)標(biāo)記在段的中點;如測定值是在某時點或確定值的,標(biāo)記在相應(yīng)時點或數(shù)值上。

4.直方圖(histogram)適合表示定量變量的頻數(shù)分布。以直方面積描述各組頻數(shù)的多少,面積的總和相當(dāng)于各組頻數(shù)之和。直方圖的橫軸是定量變量,縱軸是頻數(shù)(或頻率)。注意如各組的組距不等時,要折合成等距后再繪圖,即將頻數(shù)除以組距得到單位組距的頻數(shù)作為直方的高度,組距為直方的寬度。另一種表示數(shù)值變量資料頻數(shù)分布的方式是將各組段觀察頻數(shù)除以總觀察頻數(shù)得到各組段的頻率,以各組段頻率除以組距得到的頻率密度作為直方圖高度,繪制的直方圖稱為頻率直方圖,它以各直方面積表示各組頻率,其面積的總和為1。

例1997年某地共報告乙型病毒性腦炎104例,其年齡分布如圖7。圖71997年某地乙型病毒性腦膜炎病例的年齡分布

5.統(tǒng)計地圖(statisticalmap)

統(tǒng)計地圖是用不同的顏色和花紋表示統(tǒng)計量的值在地理分布上的變化,適宜描述研究指標(biāo)的地理分布。例2003年廣東省發(fā)生了某急性傳染病的流行,下圖描述了該急性傳染病發(fā)病數(shù)在廣東省的分布情況。圖8 2003年廣東省某急性傳染病發(fā)病數(shù)的地理分布圖例中括號內(nèi)是發(fā)生相同病例數(shù)的行政區(qū)頻數(shù),其余指數(shù)據(jù)缺失的行政區(qū)6.其他特殊分析圖

在探索性數(shù)據(jù)分析中,一些特殊的統(tǒng)計圖對于發(fā)現(xiàn)數(shù)據(jù)分布特征有著重要的意義。這里介紹常用的箱式圖、莖葉圖。箱式圖(boxplot)

使用5個統(tǒng)計量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。箱式圖的箱子兩端分別是上四分位數(shù)和下四分位數(shù),中間橫線是中位數(shù),兩端連線分別是除異常值外的最小值和最大值。另外標(biāo)記可能的異常值。顯然箱子越長,數(shù)據(jù)變異程度越大。中間橫線在箱子中點表明分布對稱,否則不對稱。

四分位數(shù)間距IQRP75P25P50本體最大值本體最小值離群值(>P75+1.5IQR)極值(>P75+3IQR)箱圖boxplot

例某地調(diào)查不同類型化妝品廠車間內(nèi)粉塵數(shù),結(jié)果繪制成圖9。圖中顯示粉塵數(shù)的分布呈偏態(tài)分布,凈化廠粉塵數(shù)較少,非凈化廠粉塵數(shù)較多。圖9某地不同類型化妝品廠車間粉塵數(shù)分布箱式圖

莖葉圖(stem-leafplot)將數(shù)據(jù)分離成兩部分:整數(shù)部分和尾數(shù)部分,整數(shù)部分形成圖的莖,尾數(shù)部分形成圖的葉。莖葉圖的排列方式與頻數(shù)表有些相似,每行由一個整數(shù)的莖和若干葉構(gòu)成。左邊是莖的數(shù)值,莖寬一般標(biāo)在圖的下方。右邊是葉,圖顯示每個葉的尾數(shù)數(shù)值,同樣在圖的下方標(biāo)示每個葉代表幾個實際觀察值。莖葉圖可以非常直觀地顯示數(shù)據(jù)的分布范圍和形態(tài),近年非常流行。例

繪制莖葉圖10。圖中莖的寬度為1,即觀察值的整數(shù)位。每個葉代表1個觀察值,顯示的尾數(shù)即觀察值的第一位小數(shù)。從圖可以看出血清總膽固醇的分布范圍從2.3到5.7,基本近似正態(tài)分布。而且可以查看每個觀察值的取值情況。Stem:實際觀察值除以莖寬后的整數(shù)部分。Leaf:實際觀察值除以莖寬后的小數(shù)部分。&:殘葉

Stem:實際觀察值除以莖寬后的整數(shù)部分。Leaf:實際觀察值除以莖寬后的小數(shù)部分。&:殘葉Extremes:極端值,計算方式同箱圖

常用統(tǒng)計圖適用資料及實施方法圖形適用資料實施方法條圖組間數(shù)量對比直條高度表示數(shù)量大小直方圖定量資料的頻數(shù)分布直條的面積表示各組段的頻率百分條圖頻率分布直條分段的長度表示各部分的頻率餅圖頻率分布圓餅的扇形面積(或其張角)表示各部分的頻率線圖定量資料變動的增量采用橫坐標(biāo)和縱坐標(biāo)均為算術(shù)尺度的坐標(biāo)系半對數(shù)線圖定量資料變動的倍數(shù)采用橫坐標(biāo)為算術(shù)尺度、縱坐標(biāo)為對數(shù)尺度的坐標(biāo)系箱式圖定量資料的分布用箱體、線條標(biāo)志

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論