




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)值變量資料的統(tǒng)計描述山東大學(xué)公共衛(wèi)生學(xué)院劉云霞山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia2統(tǒng)計分析StatisticalAnalysis統(tǒng)計描述StatisticalDescription統(tǒng)計推斷StatisticalInference指用統(tǒng)計指標(biāo)、統(tǒng)計表或統(tǒng)計圖等方法對資料的分布規(guī)律及其數(shù)量特征進行描述。指由樣本信息推斷總體特征,包括總體參數(shù)的估計和假設(shè)檢驗。變量類型(復(fù)習(xí))數(shù)值變量(numericalvariable)其變量值是定量的,表現(xiàn)為數(shù)值大小,多有度量單位。如身高(cm)、體重(kg)等。由數(shù)值變量的測定值構(gòu)成的資料稱為數(shù)值變量資料或計量資料。分類變量(categoricalvariable)亦稱定性變量,表現(xiàn)為互不相容的類別或?qū)傩?。無序分類變量(unorderedcategoricalvariable):所分類別或?qū)傩灾g無程度或順序上的差別。如性別、血型等。有序分類變量(ordinalcategoricalvariable):所分類別或?qū)傩灾g有程度或順序上的差別。如尿蛋白化驗結(jié)果等。變量類型可根據(jù)統(tǒng)計分析的需要進行轉(zhuǎn)化。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia3山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia4內(nèi)容提綱§2.1頻數(shù)分布頻數(shù)表的概念頻數(shù)表的編制方法頻數(shù)表的用途
※
頻數(shù)分布的特征
※
頻數(shù)分布的類型山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia5一、頻數(shù)分布表的概念當(dāng)樣本含量n較大時,為了解樣本中觀察值的分布規(guī)律和便于指標(biāo)計算,可編制頻數(shù)分布表,簡稱頻數(shù)表(frequencytable)。頻數(shù):對某一隨機現(xiàn)象進行重復(fù)觀察,或測量大量個體的某項特征,其中某個或某一組變量值出現(xiàn)的次數(shù)。頻數(shù)表:將各變量值與其相應(yīng)的頻數(shù)列成表格形式即為頻數(shù)表。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia6二、頻數(shù)表的編制數(shù)值變量資料的頻數(shù)分布
變量的取值為正整數(shù)時,如軋鋼工人白細胞中的大單核細胞數(shù):384510135347
……山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia7二、頻數(shù)表的編制數(shù)值變量資料的頻數(shù)分布
山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia8變量的取值是連續(xù)的,如身高、體重、血壓等。編制頻數(shù)表時需要根據(jù)變量的取值范圍將變量值劃分為若干組段,然后再匯總各組段的頻數(shù)。具體步驟通過例子加以說明9例2.1某地2004年抽樣調(diào)查100名男大學(xué)生的身高(cm)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia頻數(shù)表的編制步驟1.找出觀察值中的最大值和最小值,求全距(極差,range)。
本例最大值為183.5,最小值為162.9,全距R=183.5-162.9=20.6(cm)。2.確定組段數(shù)和組距,劃分組段。組段數(shù):根據(jù)樣本量大小,一般劃分8~15個組段。組距:即每一組段上、下限之差。一般取等距分組,組距取極差的1/10(取整或四舍五入)。劃分組段:各組段是連續(xù)的,但不能有交叉和重疊,應(yīng)使觀察單位分組時“不重不漏”,第一個組段包含最小值,最后一個組段包含最大值。本例取組距(cm),第1個組段下限從162cm開始,第2個組段下限為164cm,……,依次類推,最后一個組段為182~184cm。3.列頻數(shù)表,匯總頻數(shù)。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia10山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia11山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia12直方圖(histogram)注意:有些資料因為數(shù)據(jù)中有特大或特小的數(shù)值也可以采用不等組距,如某些食物中毒的潛伏期,大部分在短時間內(nèi)出現(xiàn)癥狀,只有極少部分的人經(jīng)過較長的時間后才有反應(yīng),這種情況可將后面的一些組段作適當(dāng)?shù)暮喜?,并可以將最后一個組段以大于某個值表示,以避免出現(xiàn)一些組段頻數(shù)為零的情況。對于不等距資料繪制直方圖時,應(yīng)先將不等距的各組頻數(shù)折算成等距頻數(shù),然后再做圖。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia13三、頻數(shù)表的用途頻數(shù)表可以揭示資料分布類型和分布特征;便于發(fā)現(xiàn)資料中的某些遠離群體的特大或特小值。當(dāng)樣本含量比較大時,可以各組段的頻率估計概率。作為資料的陳述形式,可代替原始資料,直觀地反映被研究事物的分布特征,又便于作進一步的分析研究。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia14山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia15圖2-1某地100名18歲男大學(xué)生身高的頻數(shù)分布山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia16頻數(shù)分布的類型對稱分布:指頻數(shù)分布的集中位置在中間,左右兩側(cè)大致對稱。偏態(tài)分布:指頻數(shù)分布不對稱,集中位置偏向一側(cè)。
集中位置偏向數(shù)值小的一側(cè),稱為正偏態(tài)分布;集中位置偏向數(shù)值大的一側(cè),稱為負偏態(tài)分布。
如有害化學(xué)物質(zhì)在正常人體內(nèi)的分布為正偏態(tài)分布;冠心病、大多數(shù)惡性腫瘤等慢性病患者的年齡分布為負偏態(tài)分布。不同的分布類型應(yīng)選用不同的統(tǒng)計分析方法。
山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia17對于數(shù)值變量資料,應(yīng)將集中趨勢和離散程度二者結(jié)合起來分析其分布規(guī)律。
集中趨勢(centraltendency):即身高向中央部分集中,以中等身高居多(172cm
組段),此為集中趨勢。反映集中位置或平均水平。離散趨勢(tendencyofdispersion):由中等身高到較矮或較高的頻數(shù)分布逐漸減少,反映了身高的離散程度。頻數(shù)分布的特征山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia18山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia1920山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia21該地18歲男大學(xué)生身高值出現(xiàn)在172~組段的概率為0.24。集中趨勢的描述
集中趨勢指標(biāo)反映一組同質(zhì)觀察值的集中位置或平均水平,常作為一組數(shù)據(jù)的代表值用于分析和進行組間的比較。
常用指標(biāo)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)等,統(tǒng)稱為平均數(shù)(average)。離散趨勢的描述
離散趨勢指標(biāo)反映一組同質(zhì)觀察值的變異程度。常用指標(biāo)有全距、四分位數(shù)間距、方差和標(biāo)準(zhǔn)差、變異系數(shù)。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia22§2.2數(shù)值變量資料的描述性指標(biāo)一、集中趨勢的描述1.算術(shù)均數(shù)(arithmeticmean)2.幾何均數(shù)(geometricmean)3.中位數(shù)(median)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia231.算術(shù)均數(shù)算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)(mean)。定義:指所有觀察值的代數(shù)和除以觀察值的個數(shù)。符號:樣本均數(shù)用表示,總體均數(shù)用(miu)表示。計算方法:直接法加權(quán)法山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia24適用于樣本含量n較小時。
式中,希臘字母(sigma)表示求和;
為各觀察值;n為樣本含量,即觀察值的個數(shù)。
均數(shù)---直接法山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia25例2.1某地隨機抽取100名18歲健康男大學(xué)生身高(cm)分別為173.6165.8
168.7
173.6
173.7
177.8
180.3
173.1
173.0
172.6……175.5175.9,求平均身高。
適用于頻數(shù)表資料或樣本中相同觀察值較多時。
均數(shù)---加權(quán)法該100名18歲健康男大學(xué)生身高的均數(shù)為172.70cm。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia26例2.3計算上例表2-1資料100名男大學(xué)生的平均身高。
可見,樣本例數(shù)比較多的情況下,加權(quán)法與直接法的計算結(jié)果相差不大。均數(shù)的應(yīng)用均數(shù)用于反映一組同質(zhì)觀察值的平均水平,應(yīng)用甚廣。主要適用于對稱分布或偏度不大,特別是正態(tài)分布的數(shù)值變量資料。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia27均數(shù)的兩個重要特征(1)各離均差的總和等于0,即;(2)離均差平方和小于各觀察值x與任何其它實數(shù)a
()之差的平方和,即。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia28附:公式推導(dǎo)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia29定義:幾何均數(shù)(geometricmean)是指一組觀察值的乘積,再被觀察值個數(shù)開方。符號:用G
表示。計算方法:直接法加權(quán)法2.幾何均數(shù)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia30幾何均數(shù)---計算公式或山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia31直接法:用于樣本含量n較小時。加權(quán)法:適用于頻數(shù)表資料或樣本中相同觀察值較多時。附:公式推導(dǎo)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia32附:公式推導(dǎo)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia33幾何均數(shù)的應(yīng)用幾何均數(shù)在醫(yī)學(xué)研究領(lǐng)域多用于血清學(xué)和微生物學(xué)中。適用于:
①對數(shù)正態(tài)分布資料:對數(shù)正態(tài)分布即變量值的對數(shù)呈正態(tài)分布,而原始變量為右(正)偏態(tài)分布。如健康人群的血鉛含量、發(fā)汞含量等。②等比級數(shù)資料:觀察值之間呈倍數(shù)或近似倍數(shù)變化的資料。如醫(yī)學(xué)實踐中的抗體滴度、平均效價等。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia34例2.4有6份血清的抗體效價為1:10,1:20,1:40,1:80,1:80,1:160,求其平均效價。幾何均數(shù)---直接法該6份血清的平均抗體效價為1:45。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia35幾何均數(shù)---加權(quán)法山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia例2.5某地區(qū)50名麻疹易感兒童接種麻疹疫苗1個月后,測其血凝抑制抗體滴度,如表2-2中(1)、(2)欄,求平均抗體滴度。36注意:計算幾何均數(shù)時觀察值中不能有0;一組觀察值中不能同時有正值和負值。幾何均數(shù)---加權(quán)法即其血凝抗體滴度的平均滴度為1:57。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia37定義:中位數(shù)(median)是一種位置指標(biāo),即將一組觀察值按由小到大的順序排列后位次居中的數(shù)值。在全部觀察值中,小于和大于中位數(shù)的觀察值個數(shù)相等。符號:用M表示。計算方法:直接法頻數(shù)表法3.中位數(shù)50%50%M山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia38直接法:適用于樣本含量n較小的資料。
n為奇數(shù)時,n為偶數(shù)時,例2.6某病患者9名,其發(fā)病的潛伏期(d)分別為:2,3,3,3,4,5,6,9,16,求發(fā)病潛伏期的中位數(shù)。
本例n=9,為奇數(shù),故(d)。
中位數(shù)---直接法山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia39頻數(shù)表法:適用于樣本含量n較大的資料。
計算步驟如下:(1)按所分組段由小到大計算累計頻數(shù)和累計頻率;(2)確定中位數(shù)所在組段,即累計頻率包含50%的組段;(3)求中位數(shù)。
式中,分別為中位數(shù)所在組段的下限、組距和頻數(shù);
為小于L的各組段的累計頻數(shù)。中位數(shù)---頻數(shù)表法適用于n較大時山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia40山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia41Mn*50%n*50%iLii中位數(shù)頻數(shù)表法計算公式圖解fM例2.7某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期(表2-3),計算平均發(fā)病潛伏期。中位數(shù)---頻數(shù)表法山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia42中位數(shù)的應(yīng)用中位數(shù)不受少數(shù)特大或特小值的影響,這一點優(yōu)于均數(shù)。適用于:①偏態(tài)分布資料;②頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料;③分布類型未知或不明的資料。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia43山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia44均數(shù)與中位數(shù)的關(guān)系山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia45均數(shù)與中位數(shù)的關(guān)系正偏態(tài)分布:均數(shù)>中位數(shù)對稱分布:
均數(shù)=中位數(shù)負偏態(tài)分布:均數(shù)<中位數(shù)負偏態(tài)分布左偏態(tài)分布均數(shù)<中位數(shù)
對稱分布
正偏態(tài)分布
均數(shù)中位數(shù)均數(shù)=中位數(shù)正偏態(tài)分布
均數(shù)中位數(shù)正偏態(tài)分布
均數(shù)中位數(shù)<正偏態(tài)分布右偏態(tài)分布
均數(shù)附:百分位數(shù)百分位數(shù)(percentile)用Px表示,0<x<100,是描述一組數(shù)據(jù)某百分位的位置指標(biāo)。
Px將全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。最常用的百分位數(shù)是P50,即中位數(shù)。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia46*百分位數(shù)(percentile)應(yīng)用①與中位數(shù)結(jié)合應(yīng)用,描述一組資料在某百分位置上的水平,也可以描述資料的分布特征。如:
M-P5=P95–M時,近似對稱;M-P5<P95–M時,正偏態(tài);
M-P5>P95–M時,負偏態(tài)②可用多個百分位數(shù)的結(jié)合來描述一組觀察值的分布特征,如P25和P75合用時,反映中間50%觀察值的分布情況;③可用于確定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。注意:應(yīng)用百分位數(shù),樣本含量要足夠大,否則不宜取靠近兩端的百分位數(shù)。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia47設(shè)有n個原始數(shù)據(jù)從小到大排列,第x百分位數(shù)的計算公式為:當(dāng)nx%帶有小數(shù)位時:
當(dāng)nx%為整數(shù)時:*百分位數(shù)—直接法例對某醫(yī)院細菌性痢疾治愈者的住院天數(shù)統(tǒng)計,120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)。
*百分位數(shù)—直接法患者:123456789…117118119120住院天數(shù):122233445…40404245(1)n=120,120*5%=6為整數(shù)(2)n=120,120*99%=118.8帶有小數(shù),故取整trunc(118.8)=118*百分位數(shù)—頻數(shù)表法計算公式:
分別為Px所在組段的下限、組距和頻數(shù);
為小于L的各組段的累計頻數(shù)。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia50山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia51例:分別取甲、乙、丙三人每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結(jié)果如下(萬/mm3)二、離散趨勢甲乙丙山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia52離散趨勢山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia53離散趨勢的描述1.全距(range)2.四分位數(shù)間距(quartileinterval)3.方差(variance)4.標(biāo)準(zhǔn)差(standarddeviation)5.變異系數(shù)(coefficientofvariation)山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia54定義:全距(range,R),亦稱極差。指一組同質(zhì)觀察值中最大值與最小值之差。反映了個體差異的范圍。
全距大,變異度大;反之,全距小,變異度小。應(yīng)用:簡單明了。常用于說明傳染病、食物中毒等的最短及最長潛伏期。公式:R=xmax-xmin不足:①僅考慮了最大值與最小值之差
,不能反映組內(nèi)其它觀察值的變異度;②樣本含量越大,抽到較大或較小觀察值的可能性越大,故全距可能越大。故樣本含量相差懸殊時不宜用全距比較。
1.全距山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia55定義:四分位數(shù)間距(quartileinterval,Q)為上四分位數(shù)與下四分位數(shù)之差(或P75與P25之差)。計算公式:應(yīng)用:用于描述偏態(tài)分布以及分布的一端或兩端無確切數(shù)值資料或分布類型未知資料的離散程度。2.四分位數(shù)間距QLQMQU25%25%25%25%山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia56意義:Q越大,變異度越大;Q越小,變異度越小。
【四分位數(shù)間距包括了一組觀察值的一半,故可把四分位數(shù)間距看成是中間50%觀察值的極差?!刻攸c:由于四分位數(shù)間距不受兩端個別極大值或極小值的影響,因而較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。
四分位數(shù)間距山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia57離均差:總體中每個觀察值X與總體均數(shù)μ的差值離均差之和
離均差平方和
離均差平方和的大小除與變異度有關(guān)外,還與變量值的個數(shù)N有關(guān)。為了消除這一影響,取離均差平方和的均數(shù),稱方差(variance)或均方(meanofsquares)。3.方差山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia58計算公式:總體方差樣本方差n-1為自由度(degreeoffreedom),一般用ν(niu)表示。因方差的度量單位是原度量單位的平方,故計算結(jié)果難以解釋。離散程度的描述指標(biāo)---方差樣本方差用自由度n-1去除!山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia59計算公式:總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差4.標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差用自由度n-1去除!山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia60樣本標(biāo)準(zhǔn)差離均差平方和常用SS或lXX
表示。直接法:加權(quán)法:求表2-1中100名18歲男大學(xué)生身高的標(biāo)準(zhǔn)差。山東大學(xué)公共衛(wèi)生學(xué)院LiuYunxia61意義:標(biāo)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工工藝安全與環(huán)保要求測試卷
- 我的未來之旅想象作文4篇范文
- 未來的科技幻想想象作文(8篇)
- 家用電器銷售平臺合作協(xié)議
- 跨境貿(mào)易合作協(xié)議之國際貿(mào)易業(yè)務(wù)合作細節(jié)
- go與become的區(qū)別與用法:初中語法課教案
- 解除勞動關(guān)系正式離職證明(5篇)
- 環(huán)境科學(xué)水污染治理技術(shù)知識梳理
- 中醫(yī)館與健康管理體系的融合發(fā)展模式
- 高管綠色經(jīng)歷對企業(yè)ESG表現(xiàn)的影響
- (正式版)JBT 14449-2024 起重機械焊接工藝評定
- GB/T 42791-2024航空用鋁合金鍛件通用技術(shù)規(guī)范
- 侵犯公民個人信息諒解書模板
- 國家電網(wǎng)培訓(xùn)課件
- 西安幸駕坡城改方案
- 東方市生活垃圾焚燒爐渣綜合利用項目 環(huán)評報告
- 不寐患者的護理查房
- 污水處理廠工程投標(biāo)方案技術(shù)標(biāo)
- 2023Vayo-DFX設(shè)計執(zhí)行系統(tǒng)軟件操作說明
- 《電力機車制動機》課件 7-01 制動缸壓力計算
- 基于人工智能的智慧農(nóng)業(yè)應(yīng)用案例
評論
0/150
提交評論