版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
宋曼殳首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系醫(yī)學(xué)科研中的統(tǒng)計(jì)學(xué)方法統(tǒng)計(jì)描述
統(tǒng)計(jì)分析統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖、表對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行測(cè)定和描述統(tǒng)計(jì)推斷:用樣本信息推斷總體特征:①參數(shù)估計(jì),②假設(shè)檢驗(yàn)多因素分析:多重線(xiàn)性回歸、logistic回歸、Cox模型、對(duì)數(shù)線(xiàn)性模型等
變量類(lèi)型
變量值表現(xiàn)
實(shí)例資料類(lèi)型
數(shù)值變量定量(具體數(shù)值)身高(cm)計(jì)量資料分類(lèi)變量無(wú)序二分類(lèi)對(duì)立的兩類(lèi)屬性性別(男,女)計(jì)數(shù)資料多分類(lèi)不相容的多類(lèi)屬性血型(A,B,O,AB)有序多分類(lèi)類(lèi)間有程度差異的屬性文化程度(初中、高中、大學(xué)...)等級(jí)資料統(tǒng)計(jì)資料的類(lèi)型統(tǒng)計(jì)資料的類(lèi)型定量資料(計(jì)量資料)定性資料(計(jì)數(shù)資料、等級(jí)資料)統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述定性資料的統(tǒng)計(jì)描述常用統(tǒng)計(jì)圖表定量資料定義:通過(guò)度量衡的方法,測(cè)量每個(gè)觀察單位的某項(xiàng)研究指標(biāo)的量的大小所得的一系列數(shù)據(jù)資料特點(diǎn):有度量衡單位(通過(guò)測(cè)量得到)多為連續(xù)性資料(可在某一區(qū)間取任何值)例如患者的身高(cm)、體重(kg)血壓(mmHg)、脈搏(次/分)紅細(xì)胞計(jì)數(shù)(1012/L)第一節(jié)定量資料的統(tǒng)計(jì)描述對(duì)于一個(gè)需要研究的問(wèn)題,收集到數(shù)據(jù)后,首先要了解數(shù)據(jù)的分布范圍、集中位置以及分布形態(tài)等特征。一、定量資料的頻率(頻數(shù))分布表、頻率直方圖二、定量資料的統(tǒng)計(jì)描述指標(biāo)集中趨勢(shì)的描述;離散程度的描述
定量資料的頻數(shù)分布表例2-1某婦產(chǎn)科醫(yī)生觀察1402名臨產(chǎn)母親的體重(kg)資料如下:一、頻數(shù)與頻數(shù)分布76.060.064.068.068.066.568.070.571.570.057.068.065.558.063.050.0
71.549.0
56.548.560.064.568.065.068.065.063.062.061.066.070.068.068.065.051.570.068.048.0
73.060.067.071.0……59.562.076.561.075.050.5
73.069.053.565.060.069.065.066.072.055.088.0
頻數(shù)分布表的編制步驟一、頻數(shù)與頻數(shù)分布組段(1)組中值Xi(2)頻數(shù)(3)頻率fi(%)(4)累計(jì)頻率(%)(5)48~5060.40.452~54543.84.256~5816211.615.860~6229320.936.764~6635925.662.368~7029821.383.672~7414010.093.676~78705.098.680~82171.299.884~888630.2100.0合計(jì)-1402100.0-表2-11402名臨產(chǎn)母親的體重(kg)頻率表
頻數(shù)分布表的編制步驟*1)計(jì)算全距(range,R
):一組資料(數(shù)據(jù))的最大值(Max)與最小值(Min)之差R=88-48=402)確定組段數(shù)與組距:根據(jù)樣本數(shù)多少,選擇適當(dāng)?shù)慕M段數(shù)。若樣本量n≈100,通常取8~15組為宜,
組距≈全距/組段數(shù)=40/10=43)確定組段的上、下限:每一個(gè)組段的起點(diǎn)和終點(diǎn),分別稱(chēng)為該組段的下限和上限第一組段必須包括最小值,最后一組段必須包括最大值前一組段上限亦為后一組段的下限分組應(yīng)盡量采用等組距最后一組段一般應(yīng)包含該組段的上限,其余各組段區(qū)間左閉右開(kāi),“[X,Y)”,即包含下限,不包含上限一、頻數(shù)與頻數(shù)分布
頻數(shù)分布表的編制步驟*第1列把數(shù)據(jù)所在范圍分成若干組段(通常取10~15個(gè)組段),第1個(gè)組段要包括最小值,最后一個(gè)組段要包括最大值,習(xí)慣上將各組段設(shè)為左閉右開(kāi)的半開(kāi)區(qū)間,如第一個(gè)組段[48,52)第2列組中值是各組段的代表值,由本組段的上、下限相加除以2得到第3和4列是頻數(shù)和頻率,頻數(shù)是落在各組段內(nèi)的個(gè)體數(shù),頻率是頻數(shù)在個(gè)體總數(shù)中所占的百分比,又稱(chēng)相對(duì)頻數(shù)第5列是累計(jì)頻率,是否需要該列,則視情況而定一、頻數(shù)與頻數(shù)分布圖2-11402名臨產(chǎn)母親體重(kg)的頻率分布圖頻率直方圖每一直條的面積就是相應(yīng)各組段的頻率,所有組段的頻率之和就是相應(yīng)各直條的面積之和,整個(gè)直方圖面積之和為1。頻率密度=頻率/組距矩形面積=長(zhǎng)(縱坐標(biāo))×寬(橫坐標(biāo))=頻率密度×組距=頻率/組距×組距=頻率PeopleHistogram*頻率(數(shù))分布的特征
從頻率表和頻率分布圖可看出頻數(shù)分布的兩個(gè)重要特性集中趨勢(shì)(centraltendency)離中(散)趨勢(shì)
(tendencyofdispersion)
一、頻數(shù)與頻數(shù)分布觀察值有高有低,但服從一定的分布規(guī)律:①越靠近中央部分,頻率越高——集中趨勢(shì);②絕大多數(shù)個(gè)體值并不與平均水平完全重合,而是不同程度地偏離平均水平——離中趨勢(shì)是頻數(shù)分布的兩個(gè)重要側(cè)面,較全面地概括定量資料蘊(yùn)涵的信息頻率分布圖
頻率分布圖可以比頻數(shù)分布表更直觀地揭示數(shù)據(jù)分布類(lèi)型數(shù)據(jù)的分布類(lèi)型可分為:對(duì)稱(chēng)分布(symmetricdistribution)偏態(tài)分布(skeweddistribution)一、頻數(shù)與頻數(shù)分布幾種不同類(lèi)型的頻數(shù)分布示意圖頻數(shù)分布類(lèi)型
對(duì)稱(chēng)分布偏態(tài)分布右(正)偏態(tài)分布左(負(fù))偏態(tài)分布一、頻數(shù)與頻數(shù)分布頻數(shù)分布類(lèi)型1、對(duì)稱(chēng)分布頻率分布中間高,兩端低有一個(gè)對(duì)稱(chēng)軸,左右對(duì)稱(chēng)用兩個(gè)參數(shù)描述平均水平:均數(shù)
變異程度:標(biāo)準(zhǔn)差一、頻數(shù)與頻數(shù)分布2、偏態(tài)分布頻數(shù)分布高的偏向一端沒(méi)有一個(gè)對(duì)稱(chēng)軸用兩個(gè)參數(shù)描述平均水平:中位數(shù)
變異程度:四分位數(shù)間距頻數(shù)分布類(lèi)型一、頻數(shù)與頻數(shù)分布頻數(shù)分布類(lèi)型
偏態(tài)分布(skeweddistribution)右(正)偏態(tài)分布:即頻數(shù)集中位置偏向數(shù)值小的一側(cè)左(負(fù))偏態(tài)分布:即頻數(shù)集中位置偏向數(shù)值大的一側(cè)一、頻數(shù)與頻數(shù)分布右(正)偏態(tài)分布左(負(fù))偏態(tài)分布資料的分布類(lèi)型:對(duì)稱(chēng)分布或正態(tài)分布;2.偏態(tài)分布:高峰在左側(cè)或右側(cè);3.不規(guī)則分布:分布很散,無(wú)明顯高峰二、集中趨勢(shì)的描述
反映一組同質(zhì)觀察值的平均水平或一個(gè)分布的中心位置常用的描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo):算術(shù)均數(shù)(簡(jiǎn)稱(chēng)均數(shù))幾何均數(shù)中位數(shù)
眾數(shù)調(diào)和均數(shù)1)
算術(shù)均數(shù)(arithmeticmean)
簡(jiǎn)稱(chēng)均數(shù):反映一組分布呈對(duì)稱(chēng)的觀察值在數(shù)量上的平均水平表示符號(hào):總體均數(shù)(),樣本均數(shù)()計(jì)算方法:
1.直接法:將所有觀察值X1,X2,……Xn直接相加,再除以觀察值的個(gè)數(shù)n,計(jì)算公式為:二、集中趨勢(shì)的描述1)
算術(shù)均數(shù)(arithmeticmean)
計(jì)算方法:2.加權(quán)法:用于頻表資料或樣本中相同觀察值較多時(shí)。其計(jì)算公式為:式中,X1,X2,,Xk為相應(yīng)組段的組中值=(上限+下限)/2;f1,f2,,fk為頻數(shù)表資料中各組段的頻率;這里的f起了“權(quán)重”的作用,體現(xiàn)了相應(yīng)的組中值對(duì)均數(shù)產(chǎn)生的影響,故本法稱(chēng)為加權(quán)法。
二、集中趨勢(shì)的描述1)
算術(shù)均數(shù)(arithmeticmean)例:對(duì)表2-1資料用加權(quán)法求平均體重應(yīng)用:頻數(shù)分布對(duì)稱(chēng)的數(shù)據(jù),尤其正態(tài)分布資料。大數(shù)正常人的生理、生化指標(biāo),如身高、體重、血紅蛋白含量、白細(xì)胞計(jì)數(shù)等都適用偏態(tài)分布資料不適用(中位數(shù))這批臨產(chǎn)母親的平均體重為66.19kg。二、集中趨勢(shì)的描述2)幾何均數(shù)(geometricmean,G)計(jì)算方法:將n個(gè)觀察值X1,X2,……Xn的乘積開(kāi)n次方,計(jì)算公式為:幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù),要求各觀察值X>0二、集中趨勢(shì)的描述2)幾何均數(shù)(geometricmean,G)例:5個(gè)人的血清滴度如下,求:平均滴度
1:21:41:81:161:32受最大值的影響,其算術(shù)均數(shù)為12.4,不能代表這5個(gè)觀察值的平均水平。其幾何均數(shù)為或故平均滴度為1:8。二、集中趨勢(shì)的描述2)幾何均數(shù)(geometricmean,G)計(jì)算方法:若數(shù)據(jù)以頻數(shù)表給出,可按加權(quán)公式計(jì)算:二、集中趨勢(shì)的描述2)幾何均數(shù)(geometricmean,G)例2-7用反射免疫自顯影法測(cè)定100名鼻咽癌患者唾液中EB病毒IgA/VCA抗體滴度,結(jié)果見(jiàn)表2-3第(1)、(2)列,求平均抗體滴度。二、集中趨勢(shì)的描述抗體滴度(1)頻率,fi(2)滴度倒數(shù),Xi(3)lgXi(4)fi·lgXi(5)1:2.50.192.50.39790.0756010.25101.00000.2500000.31401.60210.4966511:1600.171602.20410.3746971:6400.086402.80620.224496合計(jì)1————1.421445表2-3100名鼻咽癌患者唾液中EB病毒IgA/VCA抗體的平均滴度100名鼻咽癌患者唾液中EB病毒IgA/VCA抗體的平均滴度約為1:26.42)幾何均數(shù)(geometricmean,G)應(yīng)用:取對(duì)數(shù)后資料近似呈對(duì)稱(chēng)(正態(tài))分布的資料或觀察值之間呈倍數(shù)或近似倍數(shù)變化資料。只有右偏態(tài)數(shù)據(jù)經(jīng)對(duì)數(shù)轉(zhuǎn)換后才近似對(duì)稱(chēng)分布,所以幾何均數(shù)僅可能適用于右偏態(tài)分布數(shù)據(jù)醫(yī)學(xué)實(shí)踐中經(jīng)常遇到呈比例的數(shù)據(jù),如抗體滴度、細(xì)菌的計(jì)數(shù)、某些疾病的潛伏期、平均效價(jià)等均大于0,其頻率分布明顯為非對(duì)稱(chēng)分布,但對(duì)觀察值取對(duì)數(shù)后的數(shù)據(jù)近似一個(gè)對(duì)稱(chēng)分布,可采用幾何均數(shù)描述其集中趨勢(shì)二、集中趨勢(shì)的描述3)中位數(shù)(median)用M表示,是將一組觀察值從小到大按順序排列,位次居中的那個(gè)觀察值,小于和大于中位數(shù)的個(gè)體數(shù)相等,反映一組觀察值的平均位置應(yīng)用:適合各種類(lèi)型的資料。特別是①大樣本偏態(tài)分布的資料②資料有不確定數(shù)值③資料分布不規(guī)則(分布很散,無(wú)明顯高峰)等二、集中趨勢(shì)的描述3)中位數(shù)(median)統(tǒng)計(jì)學(xué)中有一個(gè)常用的位置指標(biāo)百分位數(shù)(percentile),以Px表示(讀作第x百分位數(shù))Px將總體(或樣本)的全部觀察值分為兩部分,有x%的觀察值比它小,其余(100-x)%的觀察值比它大據(jù)此,P50就是中位數(shù),即中位數(shù)乃是一個(gè)特殊的百分位數(shù)二、集中趨勢(shì)的描述3)中位數(shù)(median)1.直接計(jì)算法:當(dāng)樣本量較小(如n<30)時(shí),先將觀察值按從小到大順序排列,再按以下公式計(jì)算:式中,n為樣本含量,下標(biāo)(n+1)/2,(n/2),(n/2+1)為有序數(shù)列的位次,式中各項(xiàng)為相應(yīng)位次上對(duì)應(yīng)的觀察值n為奇數(shù)時(shí),n為偶數(shù)時(shí),二、集中趨勢(shì)的描述3)中位數(shù)(median)例:某病患者5人,住院天數(shù)分別為7,9,12,16,20,求其中位數(shù)。本例n=5,為奇數(shù),觀察值已按大小順序排列。按式計(jì)算二、集中趨勢(shì)的描述3)中位數(shù)(median)例:10名感染甲型肝炎病毒(HAV)的患者,其發(fā)病的潛伏期(天)按小至大順序排列為:
16,18,20,20,29,31,33,33,39,40,試求其中位數(shù)本例n=10,為偶數(shù),按式計(jì)算:二、集中趨勢(shì)的描述3)中位數(shù)(median)2.頻率表計(jì)算法:當(dāng)樣本量較大(如n≥30)時(shí),一般需將其整理為頻率表再按以下公式計(jì)算:二、集中趨勢(shì)的描述式中:fx為Px所在組段的頻率,i為該組段的組距,L為其下限,
為取值小于L各組段的累計(jì)頻率。在求中位數(shù)時(shí),x%=50%,fx為中位數(shù)所在組段的頻率,
x%為0.5,i為中位數(shù)所在組段的組距,L為該組段的下限。191名正常人尿氟含量的中位數(shù)計(jì)算表尿氟(mg/L)頻數(shù)累計(jì)頻數(shù)累計(jì)頻率(%)
⑴⑵⑶⑷
0.2~14147.30.4~4155
28.80.6~4710253.40.8~4014274.31.0~1715983.21.2~1217189.51.4~617792.71.6~618395.81.8~418797.92.0~218998.92.2~018998.92.4~119099.52.6~2.81191100.0
合計(jì)1910.6~4710253.40.6
47
55191例:現(xiàn)有275例某種沙門(mén)氏菌食物中毒患者的潛伏期(h),其頻率分布見(jiàn)下表,分別求第5、第95百分位數(shù)和中位數(shù)
潛伏期(h)(1)頻率,fi(%)(2)累計(jì)頻率(%)(3)0~14.9114.9112~36.7351.6424~23.2774.9136~14.1889.0948~6.9196.0060~3.2799.2772~0.73100.00表2-2食物中毒患者潛伏期的頻率分布*RelationshipamongMeanandMedian
Ifadistributionissymmetrical,themeanandmediancoincide.
Ifadistributionisasymmetrical,andskewedtotheleftortotheright,thetwomeasuresdiffer.Apositivelyskeweddistribution(“skewedtotheright”)MeanMedianIfadistributionissymmetrical,themeanandmediancoincideIfadistributionisnonsymmetrical,andskewedtotheleftortotheright,thetwomeasuresdiffer.Apositivelyskeweddistribution(“skewedtotheright”)MeanMedianMeanMedianAnegativelyskeweddistribution(“skewedtotheleft”)RelationshipamongMeanandMedian小結(jié)中位數(shù)具有的重要作用:適合各種類(lèi)型的資料。特別是①數(shù)據(jù)中有極端值、資料有不確定數(shù)值、數(shù)據(jù)呈偏態(tài)分布、資料分布類(lèi)型未知②當(dāng)數(shù)據(jù)呈對(duì)稱(chēng)分布時(shí),均數(shù)和中位數(shù)接近;③當(dāng)數(shù)據(jù)呈右偏態(tài)分布時(shí),均數(shù)大于中位數(shù);④當(dāng)數(shù)據(jù)呈左偏態(tài)分布時(shí),均數(shù)小于中位數(shù);可以根據(jù)中位數(shù)和均數(shù)的差別大小,粗略判斷數(shù)據(jù)的分布類(lèi)型二、集中趨勢(shì)的描述三種平均數(shù)比較二、集中趨勢(shì)的描述算術(shù)均數(shù)
幾何均數(shù)中位數(shù)符號(hào)GM含義各觀察值相加除以觀察值的個(gè)數(shù)所得之商N(yùn)各觀察值的乘積開(kāi)n次方所得之根一組觀察值按順序排列,居中者應(yīng)用條件正態(tài)或近似正態(tài)分布右偏態(tài)或?qū)?shù)正態(tài)分布偏態(tài)或分布類(lèi)型未知的資料計(jì)算公式說(shuō)明加權(quán)法計(jì)算中X值的含義不能有0和負(fù)值的數(shù)據(jù)中位數(shù)為百分位數(shù)的特例習(xí)題表3-5列出的是101名正常人的血清肌紅蛋白含量(μg/ml)的觀察值的頻數(shù)分布表。計(jì)算其算術(shù)均數(shù)、幾何均數(shù)和中位數(shù),并分析哪一個(gè)指標(biāo)能夠最好地描述該數(shù)據(jù)的集中趨勢(shì)。表3-5101名正常人的血清肌紅蛋白含量的頻數(shù)分布表肌紅蛋白含量(μg/ml)組中值頻數(shù)累計(jì)頻數(shù)0~2.5115~7.52310~12.54715~17.561320~22.572025~27.592930~32.5134235~37.5236540~42.5349945~5047.52101
變異程度?
現(xiàn)有甲、乙、丙三組數(shù)據(jù)甲組60708090100乙組7075808590丙組60758085100如果我們用均數(shù)來(lái)描寫(xiě)上述資料特征,則:三、離散趨勢(shì)的描述
定量描述離散趨勢(shì)的指標(biāo),稱(chēng)為變異指標(biāo)反映一組同質(zhì)的計(jì)量資料觀察值之間變異程度或離開(kāi)平均水平的趨勢(shì)描述離散趨勢(shì)的指標(biāo)
全距(極差)range(R)四分位數(shù)間距interquartilerange(Q)方差variance標(biāo)準(zhǔn)差standarddeviation(SD)變異系數(shù)coefficientvariation(CV)三、離散趨勢(shì)的描述應(yīng)用:反映個(gè)體變異的范圍(任何分布)R越大變異度越大優(yōu)點(diǎn):計(jì)算簡(jiǎn)單缺點(diǎn):1)沒(méi)有利用觀察值的全部信息2)受極端值和樣本量的影響大僅用于粗略地描述觀察值的離散趨勢(shì)1)全距(極差)(Range,R)含義:一組觀察值中最大值與最小值之差R=Max-Min1)全距(極差)(Range,R)所有觀察值是如何分布的?最小值最大值全距無(wú)法回答Range變異程度?1)全距(極差)(Range)
R=最大值-最小值
R甲=100-60=40
R乙=
90-70=20
R丙=100-60=40三、離散趨勢(shì)的描述四分位數(shù)(quartile)是兩個(gè)特定的百分位數(shù):P25(下四分位數(shù)):第25%分位數(shù),記為QL,表示全部觀察值中有四分之一的個(gè)體取值比它小P75
(上四分位數(shù)):第75%分位數(shù),記為QU,表示全部觀察值中有四分之一的個(gè)體取值比它大2)四分位數(shù)間距
(interquartilerange,Q)
三、離散趨勢(shì)的描述是一組數(shù)值變量值中,上四分位數(shù)(P75)與下四分位數(shù)(P25)之差P75
:第75%分位數(shù),記為QU,表示全部觀察值中有四分之一的個(gè)體取值比它大P25:第25%分位數(shù),記為QL,表示全部觀察值中有四分之一的個(gè)體取值比它小2)四分位數(shù)間距(interquartilerange,Q)
四分位數(shù)間距:QU
-QL=P75
-P25
即中間一半觀察值的極差較全距穩(wěn)定,常與中位數(shù)一起,是描述非對(duì)稱(chēng)分布資料變異程度的最常用指標(biāo)僅使用了原變量中部分信息,即指包含了50%數(shù)據(jù)的分布范圍類(lèi)似地也可以取其它百分位數(shù)間距,如P97.5-P2.5、P95-P5或P90-P10等適用于非正態(tài)分布
?。?)四分位數(shù)間距
interquartilerange(Q)
三、離散趨勢(shì)的描述計(jì)算公式:Q=QU
-QL=P75
-P25
P0P25P50P75P100|Q|
048.1569.21100.0175.0
~X1…Xn尿鉛值Q=100.0-48.15=51.85(mmol/L)2)四分位數(shù)間距
interquartilerange(Q)
三、離散趨勢(shì)的描述描述一個(gè)變量所有觀察值(Xi)與總體均數(shù)(μ)的平均離散程度的指標(biāo)反映個(gè)體偏離總體平均水平的程度,如用每個(gè)觀察值與均數(shù)之差,即
離均差=
理想的變異指標(biāo):總體方差
(populationvariance):樣本方差(Samplevariance)
3)方差(variance)
總體方差
(populationvariance):
將離均差平方的平均值作為總體中個(gè)體值偏離平均水平的概括性指標(biāo)
3)方差(variance)
為什么不用“離均差之和”?10987410111213168-10=-29-10=-111-10=+112-10=+24-10=-67-10=-313-10=+316-10=+6Sum=0Sum=0離散程度:B>AABμA=μB=10個(gè)體偏離總體平均水平的程度
就是所謂的離均差(deviationfromaverage)但是
的平均水平不能反映總體中個(gè)體值的變異程度,因?yàn)?/p>
有正有負(fù),總和為0。而離均差平方
可以同等對(duì)待正的和負(fù)的離中情形3)方差(variance)
三、離散趨勢(shì)的描述58“方差”定義為“離均差平方的平均值”?而不是“離均差平方和”?3)方差(variance)
哪組數(shù)據(jù)的離散程度更大?131325ABB組數(shù)據(jù)離散程度更大3)方差(variance)
131325ABSumA=(1-2)2+…+(1-2)2+(3-2)2+…+(3-2)2=10SumB=(1-3)2+(5-3)2=8SumA>SumB
,與“B組數(shù)據(jù)離散度更大”的事實(shí)不符
3)方差(variance)
131325AB但是,若以離均差平方的平均值來(lái)計(jì)算,結(jié)果(方差)便與實(shí)際的離散度相符sA2=SumA/N=10/10=1sB2=SumB/N=8/2=43)方差(variance)
樣本方差
(Samplevariance):
樣本中的個(gè)體偏離的程度比其偏離的程度縮小一些,以致離均差平方的平均值也縮小一些
英國(guó)統(tǒng)計(jì)學(xué)家Gosset提出用n-1代替N,來(lái)計(jì)算樣本中離均差平方的平均水平,即樣本方差S2
實(shí)際工作中用樣本均數(shù)代替總體均數(shù)
3)方差(variance)
4)標(biāo)準(zhǔn)差(standarddeviation,SD)
總體標(biāo)準(zhǔn)差(Population
SD):是總體方差的算術(shù)平方根,記為為用原始度量衡單位表示變異程度標(biāo)準(zhǔn)差越大,個(gè)體變異越大4)標(biāo)準(zhǔn)差(standarddeviation,SD)
樣本標(biāo)準(zhǔn)差(Sample
SD):是樣本方差的算術(shù)平方根,記為為用原始度量衡單位表示變異程度標(biāo)準(zhǔn)差越大,個(gè)體變異越大現(xiàn)計(jì)算上述甲、乙、丙三組的標(biāo)準(zhǔn)差,可得:同樣是S甲>S丙>S乙
三、離散趨勢(shì)的描述4)標(biāo)準(zhǔn)差
(standarddeviation)
優(yōu)點(diǎn):是方差的算術(shù)平方根,具有方差的優(yōu)點(diǎn)單位與原變量的單位一致,使用方便應(yīng)用:是描述對(duì)稱(chēng)分布計(jì)量資料離散程度的最常用的統(tǒng)計(jì)指標(biāo)表示觀察值變異程度(離散趨勢(shì)),當(dāng)兩組(或幾組)資料均數(shù)相近、度量單位相同的條件下,標(biāo)準(zhǔn)差較大變異程度較大4)標(biāo)準(zhǔn)差(standarddeviation,SD)
平均數(shù)與變異度的關(guān)系均數(shù)的代表性較好數(shù)據(jù)變異程度較小數(shù)據(jù)變成…均數(shù)的代表性較好均數(shù)的代表性較差數(shù)據(jù)變異程度較小數(shù)據(jù)變異程度較大平均數(shù)與變異度的關(guān)系平均數(shù)與變異度的關(guān)系
平均數(shù)表示的集中性與變異度表示的離散性,是從兩個(gè)不同的角度闡明計(jì)量資料的特征變異度越小,平均數(shù)對(duì)各變量值的代表性越好變異度越大,平均數(shù)對(duì)各變量值的代表性越差
標(biāo)準(zhǔn)差的應(yīng)用1.表示觀察值變異程度(離散程度),當(dāng)兩組(或幾組)資料均數(shù)相近、度量單位相同的條件下,標(biāo)準(zhǔn)差較大,說(shuō)明觀察值的變異程度較大,即各觀察值離均數(shù)較遠(yuǎn),因而均數(shù)的代表性較差;反之,標(biāo)準(zhǔn)差較小,均數(shù)的代表性較好2.標(biāo)準(zhǔn)差結(jié)合均數(shù)可計(jì)算變異系數(shù)3.結(jié)合均數(shù)描述正態(tài)分布的特征和估計(jì)醫(yī)學(xué)參考值范圍4.結(jié)合樣本含量n計(jì)算標(biāo)準(zhǔn)誤三、離散趨勢(shì)的描述4)標(biāo)準(zhǔn)差
(standarddeviation)
5)變異系數(shù)
(coefficientofvariation)
變異系數(shù)也稱(chēng)離散系數(shù),用CV表示,是標(biāo)準(zhǔn)差與均數(shù)之比,即:CV
值越大,離散程度越大三、離散趨勢(shì)的描述
特點(diǎn)標(biāo)準(zhǔn)差、四分位數(shù)間距和全距都是有量綱的指標(biāo),量綱與原始觀察值相同而變異系數(shù)是相對(duì)數(shù),沒(méi)有量綱三、離散趨勢(shì)的描述5)變異系數(shù)
(coefficientofvariation)
用途:①比較幾個(gè)量綱不同的變量之間的變異程度。
例:某地20歲男子100人,試比較身高和體重的變異?
身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.98cm;
體重均數(shù)為53.7kg,標(biāo)準(zhǔn)差為4
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版高科技創(chuàng)業(yè)企業(yè)合伙人利益共享協(xié)議3篇
- 二零二五年度出租車(chē)行業(yè)數(shù)據(jù)共享與司機(jī)權(quán)益保護(hù)合同3篇
- 2025年分公司設(shè)立及業(yè)務(wù)培訓(xùn)合作協(xié)議書(shū)4篇
- 二零二五年度臨時(shí)職工技能提升培訓(xùn)合同
- 2025年度陶瓷設(shè)計(jì)工作室設(shè)計(jì)師勞動(dòng)合同樣本
- 萬(wàn)科星辰大廈2024年施工總承包合同版
- 二零二五年度城市地下空間開(kāi)發(fā)土石方運(yùn)輸與管網(wǎng)鋪設(shè)合同3篇
- 二零二五年度廠房租賃合同附安全風(fēng)險(xiǎn)評(píng)估協(xié)議3篇
- 二手房定金合同參考模板(2024版)
- 2025年門(mén)窗行業(yè)供應(yīng)鏈戰(zhàn)略合作框架協(xié)議
- 南安市第三次全國(guó)文物普查不可移動(dòng)文物-各鄉(xiāng)鎮(zhèn)、街道分布情況登記清單(表五)
- 選煤廠安全知識(shí)培訓(xùn)課件
- 項(xiàng)目前期選址分析報(bào)告
- 急性肺栓塞搶救流程
- 《統(tǒng)計(jì)學(xué)-基于Python》 課件全套 第1-11章 數(shù)據(jù)與Python語(yǔ)言-時(shí)間序列分析和預(yù)測(cè)
- 《形象價(jià)值百萬(wàn)》課件
- 紅色文化教育國(guó)內(nèi)外研究現(xiàn)狀范文十
- 中醫(yī)基礎(chǔ)理論-肝
- 小學(xué)外來(lái)人員出入校門(mén)登記表
- 《土地利用規(guī)劃學(xué)》完整課件
- GB/T 25283-2023礦產(chǎn)資源綜合勘查評(píng)價(jià)規(guī)范
評(píng)論
0/150
提交評(píng)論