醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)個(gè)體變異第一頁,共七十一頁,編輯于2023年,星期二研究數(shù)據(jù)的收集、整理、分析的一門學(xué)科。

Statisticsisthesciencedealingwiththecollections,analysis,interpretationandpresentationofmassesofnumericaldata.(Webster國際大詞典)Statisticsisthescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresult.統(tǒng)計(jì)學(xué)是什么?

WhatisStatistics?2第二頁,共七十一頁,編輯于2023年,星期二醫(yī)學(xué)統(tǒng)計(jì)學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)是以醫(yī)學(xué)理論為指導(dǎo),應(yīng)用概率論與數(shù)理統(tǒng)計(jì)的有關(guān)原理和方法,研究醫(yī)學(xué)資料的搜集、整理、分析和推斷的一門科學(xué)。3第三頁,共七十一頁,編輯于2023年,星期二醫(yī)學(xué)研究的三個(gè)步驟1.研究設(shè)計(jì)3.結(jié)論2.資料分析統(tǒng)計(jì)學(xué)推斷專業(yè)推斷結(jié)合假設(shè)實(shí)驗(yàn)或調(diào)查獲得數(shù)據(jù)運(yùn)用醫(yī)學(xué)統(tǒng)計(jì)學(xué)的起點(diǎn),也是高質(zhì)量地完成整個(gè)研究的重要基礎(chǔ)。在數(shù)據(jù)分析的基礎(chǔ)上,應(yīng)用統(tǒng)計(jì)學(xué)處理的結(jié)果,進(jìn)行統(tǒng)計(jì)學(xué)推斷;同時(shí),依據(jù)相應(yīng)的專業(yè)知識(shí),作出專業(yè)性的結(jié)論。在研究設(shè)計(jì)基礎(chǔ)上,通過實(shí)驗(yàn)(試驗(yàn))或調(diào)查,將所得數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理的過程。4第四頁,共七十一頁,編輯于2023年,星期二第一種分類(三類資料)(1)定量資料(quantitativedata)(2)定性資料(qualitativedata)(3)等級(jí)資料(rankeddata,ordinaldata)

5第五頁,共七十一頁,編輯于2023年,星期二

數(shù)值變量資料(numericalvariable)

分類資料(categoricalvariable)

第二種分類(兩類資料)6第六頁,共七十一頁,編輯于2023年,星期二數(shù)學(xué)上的分類連續(xù)性資料(continuousdata)離散型資料(discretedata)

7第七頁,共七十一頁,編輯于2023年,星期二一些重要的基本概念

1.同質(zhì)和異質(zhì)2.變異3.總體與樣本4.隨機(jī)5.參數(shù)和統(tǒng)計(jì)量6.頻率和概率7.抽樣誤差8第八頁,共七十一頁,編輯于2023年,星期二醫(yī)學(xué)統(tǒng)計(jì)學(xué)思維歸納型思維推理型思維從樣本到總體從個(gè)別到一般9第九頁,共七十一頁,編輯于2023年,星期二個(gè)體變異(individualvariation)因?yàn)樽儺?,世界才變得如此豐富多彩!第十頁,共七十一頁,編輯于2023年,星期二Outline個(gè)體變異頻數(shù)分布表和頻數(shù)分布圖頻數(shù)圖和頻數(shù)表的信息資料的統(tǒng)計(jì)描述描述集中趨勢(shì)的指標(biāo):平均數(shù)描述離散趨勢(shì)的指標(biāo):變異度正確應(yīng)用總結(jié)11第十一頁,共七十一頁,編輯于2023年,星期二個(gè)體變異個(gè)體變異(individualvariation)是同質(zhì)觀察對(duì)象間表現(xiàn)出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產(chǎn)生的綜合反映。就每個(gè)觀察單位而言,其觀察指標(biāo)的變異是不可預(yù)測(cè)的,或者說是隨機(jī)的(random)。就總體而言,個(gè)體變異是有規(guī)律的。12第十二頁,共七十一頁,編輯于2023年,星期二個(gè)體變異是統(tǒng)計(jì)學(xué)應(yīng)用的前提個(gè)體變異抽樣誤差統(tǒng)計(jì)推斷13第十三頁,共七十一頁,編輯于2023年,星期二例1:個(gè)體變異的表現(xiàn)某地所有20歲健康男生的血紅蛋白某地所有20歲健康男生和女生的血紅蛋白江蘇和西藏所有20歲健康男生的血紅蛋白

某地所有20歲健康男生和女生的白細(xì)胞計(jì)數(shù)√√ΧΧ14第十四頁,共七十一頁,編輯于2023年,星期二個(gè)體變異生物體的變異是普遍存在的,是客觀事實(shí),無法準(zhǔn)確預(yù)測(cè)。這種變異是有規(guī)律的,是可以認(rèn)識(shí)的。15第十五頁,共七十一頁,編輯于2023年,星期二HeterogeneityorIndividualvariation?Thereare1.23%differentchromosomesbetweenhumanandjocko.(Science,2002)16第十六頁,共七十一頁,編輯于2023年,星期二例2:亂七八糟的原始數(shù)據(jù)某市1997年12歲男童120人的身高(cm)資料如下。

142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.917第十七頁,共七十一頁,編輯于2023年,星期二頻數(shù)分布原因:由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。現(xiàn)狀:醫(yī)學(xué)研究得到的原始數(shù)據(jù)(rawdata)往往是龐大的、混亂的。解決:頻數(shù)分布的基本思想:將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計(jì)各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。18第十八頁,共七十一頁,編輯于2023年,星期二頻數(shù)表的編制①找出極大值和極小值,并計(jì)算極差R

此例R=160.9-125.9=35②依R分組,確定組數(shù)組距組段,常取8-15組,用1/10R取整作組距。這里取4③計(jì)算頻數(shù)19第十九頁,共七十一頁,編輯于2023年,星期二計(jì)量資料的頻數(shù)、頻率分布組段頻數(shù)頻率

124~ 1 0.0083128~ 2 0.0167132~ 10 0.0833136~ 22 0.1834140~ 37

0.3083144~ 26 0.2167148~ 15 0.1250152~ 4 0.0333156~ 2 0.0167160~ 1 0.0083合計(jì) 120 1.000020第二十頁,共七十一頁,編輯于2023年,星期二計(jì)量資料的頻數(shù)分布

xFreq.124~1*128~2**132~10**********136~22**********************140~37*************************************144~26**************************148~15***************152~4****156~2**160~1*Total12021第二十一頁,共七十一頁,編輯于2023年,星期二124~128~132~136~140~144~148~152~156~160~################################################################################################################?!纭纭纭纾##S?jì)量資料的頻數(shù)分布22第二十二頁,共七十一頁,編輯于2023年,星期二計(jì)量資料的頻數(shù)分布圖23第二十三頁,共七十一頁,編輯于2023年,星期二計(jì)量資料的頻數(shù)分布圖圖某市120名12歲男童身高的頻數(shù)分布124132140148156164010203040人數(shù)身高(cm)24第二十四頁,共七十一頁,編輯于2023年,星期二定性資料的頻數(shù)分布血型 頻數(shù) 頻率(%)O 205 40.43A 112 22.09B 150 29.59AB 40 7.89合計(jì) 507 100.00表507名傣族人血型的頻數(shù)分布25第二十五頁,共七十一頁,編輯于2023年,星期二分類資料的頻數(shù)分布圖OABAB26第二十六頁,共七十一頁,編輯于2023年,星期二EXCEL制作的頻數(shù)圖血型人數(shù)圖507名傣族人血型的頻數(shù)分布27第二十七頁,共七十一頁,編輯于2023年,星期二EXCEL制作的頻率圖血型比例圖507名傣族人血型的頻率分布28第二十八頁,共七十一頁,編輯于2023年,星期二頻數(shù)分布與頻率分布頻數(shù)(率)分布用于表達(dá)觀察指標(biāo)的分布規(guī)律。分布規(guī)律:變異規(guī)律。29第二十九頁,共七十一頁,編輯于2023年,星期二頻數(shù)分布所提供的信息頻數(shù)分布圖用以表示數(shù)據(jù)的分布規(guī)律考察分布的類型對(duì)稱分布非對(duì)稱分布skewness

(偏態(tài)分布)左偏態(tài)(負(fù)偏態(tài))右偏態(tài)(正偏態(tài))“偏”是偏離的意思,表示個(gè)別觀察值偏離均數(shù)較遠(yuǎn),而不是“集中位置偏”;“正偏”是指?jìng)€(gè)別數(shù)據(jù)偏在均數(shù)右側(cè),其與均數(shù)之差為“正”;“負(fù)偏”是指?jìng)€(gè)別數(shù)據(jù)偏在均數(shù)左側(cè),其與均數(shù)之差為“負(fù)”;正偏分布的偏度系數(shù)為正,負(fù)偏分布的偏度系數(shù)為負(fù)。30第三十頁,共七十一頁,編輯于2023年,星期二124132140148156164010203040人數(shù)身高(cm)頻數(shù)(率)分布實(shí)例(對(duì)稱分布)31第三十一頁,共七十一頁,編輯于2023年,星期二圖239人發(fā)汞含量的頻數(shù)分布13579111315171921發(fā)汞含量(umol/kg)706050403020100人數(shù)頻數(shù)(率)分布實(shí)例(偏態(tài)分布1)正(右)偏態(tài)分布32第三十二頁,共七十一頁,編輯于2023年,星期二圖某城市892名老年人生存質(zhì)量自評(píng)分的頻數(shù)分布0102030405060708090100自評(píng)分4003002001000人數(shù)頻數(shù)(率)分布實(shí)例(偏態(tài)分布2)負(fù)(左)偏態(tài)分布33第三十三頁,共七十一頁,編輯于2023年,星期二圖102名黑色數(shù)瘤患者的生存時(shí)間頻數(shù)分布151015202530354045生存時(shí)間(月)403020100人數(shù)頻數(shù)(率)分布實(shí)例(偏態(tài)分布3)正(右)偏態(tài)分布34第三十四頁,共七十一頁,編輯于2023年,星期二圖某地1990~1992年男性死亡年齡分布

0510152025

303540

455055606570758085死亡年齡(歲)25002000150010005000頻數(shù)(率)分布實(shí)例(偏態(tài)分布4)35第三十五頁,共七十一頁,編輯于2023年,星期二偏態(tài),正偏態(tài)和負(fù)偏態(tài)分布不對(duì)稱者稱為偏態(tài)分布。偏態(tài)分布又分為正偏分布和負(fù)偏分布。所謂正偏分布是指分布的長尾在峰的右側(cè),又稱右偏分布;所謂負(fù)偏分布是指分布的長尾在峰的左側(cè),又稱左偏分布。36第三十六頁,共七十一頁,編輯于2023年,星期二定量資料的描述圖形描述 頻數(shù)(率)分布圖趨勢(shì)圖……定量資料的統(tǒng)計(jì)指標(biāo)描述

集中位置:算術(shù)均數(shù)、加權(quán)平均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)離散程度:極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、方差、變異系數(shù)37第三十七頁,共七十一頁,編輯于2023年,星期二描述集中位置的指標(biāo)平均數(shù)(Average)算術(shù)均數(shù)和加權(quán)均數(shù)(MeanandWeightedMean)幾何均數(shù)(GeometricMean)中位數(shù)和百分位數(shù)

(MedianandPercentile)38第三十八頁,共七十一頁,編輯于2023年,星期二集中位置的描述----平均數(shù)(1)算術(shù)均數(shù)(arithmeticmean,mean)

簡(jiǎn)稱均數(shù)(mean),是用得最多的統(tǒng)計(jì)描述指標(biāo)。39第三十九頁,共七十一頁,編輯于2023年,星期二總體均數(shù)thepopulationmean樣本均數(shù)thesamplemeanμ40第四十頁,共七十一頁,編輯于2023年,星期二例:11名五歲女童身高值(cm)分別為:112.9,99.5,100.7,101.0,112.1,118.7,107.9,108.1,99.1,104.8,116.5,求平均身高。41第四十一頁,共七十一頁,編輯于2023年,星期二加權(quán)均數(shù)(weightedmean)

均數(shù)是加權(quán)均數(shù)的一個(gè)特例加權(quán)均數(shù)42第四十二頁,共七十一頁,編輯于2023年,星期二均數(shù)的應(yīng)用:1、均數(shù)能全面反映全部觀察值的平均數(shù)量水平,應(yīng)用甚廣。2、最適于對(duì)稱分布資料,對(duì)于偏態(tài)資料,均數(shù)不能較好地反映其集中趨勢(shì)。3、在描述正態(tài)分布資料方面有重要意義43第四十三頁,共七十一頁,編輯于2023年,星期二平均數(shù)(2)幾何均數(shù)(geometricmean,G)44第四十四頁,共七十一頁,編輯于2023年,星期二幾何均數(shù)例1:10,1:20,1:40,1:80,1:16045第四十五頁,共七十一頁,編輯于2023年,星期二幾何均數(shù)的應(yīng)用:1.等比資料,如抗體平均滴度2.對(duì)數(shù)正態(tài)分布資料Remember!46第四十六頁,共七十一頁,編輯于2023年,星期二使用幾何均數(shù)時(shí)的注意點(diǎn):1)觀察值不能有0。2)觀察值不能同時(shí)有正值和負(fù)值。若全為負(fù)值,在計(jì)算時(shí)先把負(fù)號(hào)去掉,得出結(jié)果再加上負(fù)號(hào)。Becareful!47第四十七頁,共七十一頁,編輯于2023年,星期二平均數(shù)(3)中位數(shù)(median,M)指將一組觀察值從小到大按順序排列,位次居中的觀察值,常用M表示。中位數(shù)計(jì)算方法:48第四十八頁,共七十一頁,編輯于2023年,星期二例:某病患者5人,其潛伏期分別為2,3,5,8,20,求中位數(shù)?n=5,M=x3=5(天)例:8名新生兒身長(cm)依次為50,51,52,53,54,55,58,求中位數(shù)?n=8,M=(x4+x5)/2=(53+54)/2=53.5(cm)中位數(shù)例49第四十九頁,共七十一頁,編輯于2023年,星期二中位數(shù)例9例正常人的發(fā)汞值:

1.1,1.83.54.24.8

5.65.97.110.5

9例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.1>16

10例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5>16

M=4.8

M=4.8

M=(4.8+5.6)/2=5.250第五十頁,共七十一頁,編輯于2023年,星期二中位數(shù)例對(duì)于某項(xiàng)風(fēng)險(xiǎn)較高的新手術(shù)術(shù)后的生存時(shí)間進(jìn)行跟蹤,共調(diào)查了7人,6人死亡之前分別生存了5天、6天、10天、16天、25天、29天,還有一人術(shù)后30天隨訪時(shí)仍存活。本資料屬于“開口”資料。本例數(shù)據(jù)已經(jīng)按從小到大的升序排列,n=7,為奇數(shù),其中位數(shù)為16天。51第五十一頁,共七十一頁,編輯于2023年,星期二平均數(shù)(3)百分位數(shù)(percentile)是一個(gè)位置單位,以Px表示,一個(gè)Px將總體或樣本的全部觀察值分為兩部分。理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大.X%

PX(100-X)%50%分位數(shù)就是中位數(shù)25%,75%分位數(shù)稱四分位數(shù)(quartile)

52第五十二頁,共七十一頁,編輯于2023年,星期二中位數(shù)和百分位數(shù)的應(yīng)用1、中位數(shù)和百分位數(shù)的計(jì)算對(duì)資料分布沒有特殊要求。偏態(tài)分布;分布不規(guī)則或未知分布;一端或兩端有不確定數(shù)據(jù)(開口資料)

2、樣本含量較少時(shí)不宜用靠近兩端的百分位數(shù)來估計(jì)頻數(shù)分布范圍;因?yàn)樵诶龜?shù)較少時(shí),靠近兩端的百分?jǐn)?shù)不夠穩(wěn)定。3、中位數(shù)比均數(shù)具有較好的穩(wěn)定性。但是,由于只采納了數(shù)據(jù)的相對(duì)大小的信息,不夠精確。53第五十三頁,共七十一頁,編輯于2023年,星期二平均數(shù)應(yīng)用的注意事項(xiàng)同質(zhì)的資料計(jì)算平均數(shù)才有意義。算術(shù)均數(shù)適用于:?jiǎn)畏鍖?duì)稱分布的資料幾何均數(shù)適用于:對(duì)數(shù)變換后單峰對(duì)稱的資料中位數(shù)和百分位數(shù)適用于:偏態(tài)分布資料,分布類型未知的資料,有極端值和不確定值的資料54第五十四頁,共七十一頁,編輯于2023年,星期二例3只用平均數(shù)描述資料的弊病甲組2629303134乙組2427303336丙組2628303234丙乙甲三組兒童體重的離散程度均數(shù)30kg55第五十五頁,共七十一頁,編輯于2023年,星期二描述離散趨勢(shì)的指標(biāo)變異度極差(Range)四分位數(shù)間距(interquartilerange)方差(Variance)標(biāo)準(zhǔn)差(StandardDeviation)變異系數(shù)(

coefficientofvariation)56第五十六頁,共七十一頁,編輯于2023年,星期二全距(range),極差R=max-min優(yōu)點(diǎn):簡(jiǎn)單方便缺點(diǎn):不靈敏

除了最大、最小值,不能反應(yīng)組內(nèi)其他數(shù)據(jù)的變異。

不穩(wěn)定

兩樣本例數(shù)相差旋殊,不適用全距比較變異度。離散程度的描述指標(biāo)(1)57第五十七頁,共七十一頁,編輯于2023年,星期二四分位數(shù)間距:quartileP75上四分位數(shù)P25

下四分位數(shù)QUQL離散程度的描述指標(biāo)(2)58第五十八頁,共七十一頁,編輯于2023年,星期二MinQLMQUMax極差四分位數(shù)間距59第五十九頁,共七十一頁,編輯于2023年,星期二

總體方差σ2=

在樣本中,μ未知,常用替代,

S2=方差(variance)離散程度的描述指標(biāo)(3)60第六十頁,共七十一頁,編輯于2023年,星期二總體標(biāo)準(zhǔn)差σ=樣本標(biāo)準(zhǔn)差

n-1:自由度(degreeoffreedom)任何統(tǒng)計(jì)量的自由度

=變量數(shù)-限制條件的個(gè)數(shù)離散程度的描述指標(biāo)(4)標(biāo)準(zhǔn)差(standarddeviation)61第六十一頁,共七十一頁,編輯于2023年,星期二甲組2629303134乙組2427303336丙組2628303234

極差方差標(biāo)準(zhǔn)差甲組88.50 2.92乙組1222.50 4.74丙組810.00 3.16離散度比較62第六十二頁,共七十一頁,編輯于2023年,星期二排除了平均水平的影響,并取消了單位。因此變異系數(shù)常用于:比較度量衡單位不同的兩組或多組資料的變異度比較均數(shù)相差懸殊的兩組或多組資料的變異度離散程度的描述指標(biāo)(5)變異系數(shù)(coefficientofvariation,CV)63第六十三頁,共七十一頁,編輯于2023年,星期二某地100名20歲男子身高:平均=166.06cm, 標(biāo)準(zhǔn)差=4.95cm體重:平均=53.72k

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論