基本流行病統(tǒng)計分析方法及SPSS統(tǒng)計分析軟件的應(yīng)用_第1頁
基本流行病統(tǒng)計分析方法及SPSS統(tǒng)計分析軟件的應(yīng)用_第2頁
基本流行病統(tǒng)計分析方法及SPSS統(tǒng)計分析軟件的應(yīng)用_第3頁
基本流行病統(tǒng)計分析方法及SPSS統(tǒng)計分析軟件的應(yīng)用_第4頁
基本流行病統(tǒng)計分析方法及SPSS統(tǒng)計分析軟件的應(yīng)用_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、流行病統(tǒng)計分析基礎(chǔ)及SPSS統(tǒng)計分析軟件的應(yīng)用安徽省疾病預(yù)防控制中心衛(wèi)生防病信息科趙玉秋課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part73變量的分類及其統(tǒng)計描述變量(variable)觀察單位的某項特征稱為變量。變量值(value of variable)變量的觀察結(jié)果(測得值)稱為變量值。 概念身高、體重、血型4變量的分類及其統(tǒng)計描述 變量的分類(一)定量變量(quantitative variable) 也稱為數(shù)值變量,其變量值是定量的,所獲資料為計量資料。即對每一個觀察對象用定量的方法測定某項指標(biāo)量的大小。有度量衡單位。1.連續(xù)型變量(continuous variable)

2、:即連續(xù)變化的變量,其取值是數(shù)軸上某一區(qū)間內(nèi)的一切數(shù)值,理論上它們是無限可分的。如身高、體重。2.離散型變量(discrete variable) :其取值是0,1,2等不連續(xù)的量,是數(shù)軸上有限或無限的可數(shù)的值,兩個數(shù)之間沒有小數(shù)。如年新生兒數(shù)、家庭人口數(shù)。5變量的分類及其統(tǒng)計描述(一)定性變量(qualitative variable)1.分類變量(categorical variable):也稱為計數(shù)資料,將觀察單位按某種屬性或類別分組,然后清點數(shù)目所得各組的觀察單位數(shù)。可分為:二項分類:兩類觀察結(jié)果互相對立。(性別:男、女) 多項分類:觀察結(jié)果表現(xiàn)為互不相容的多個屬性或類別。(血型:A、

3、B、O、AB)2.有序變量(ordinal variable): 也稱為等級資料,將觀察單位按某種屬性的不同程度分組,然后清點各組數(shù)目,但所分各組之間有等級順序。如滿意程度(極不滿意、有點滿意、中度滿意、很滿意、級滿意)、實驗室檢驗結(jié)果(-、+、+、+)。 變量的分類6變量的分類及其統(tǒng)計描述 變量的分類變量間的轉(zhuǎn)化 血紅蛋白量血紅蛋白量 (計量資料計量資料)60 (重度貧血)(重度貧血)60 (中度貧血)(中度貧血)90 (輕度貧血)(輕度貧血)120 160 (正常)(正常)160 (增高)(增高)等級資料正常正常異常異常計數(shù)資料連續(xù)型資料有序資料分類資料7變量的分類及其統(tǒng)計描述定量變量定性

4、變量(分類變量)二分類:性別多分類:血型無序分類有序分類(等級變量):下等 、中下等、一般、中上等、上等變量類型連續(xù)型變量:體重、身高離散型變量:家庭人口數(shù)無序分類-二分類 有序分類(等級)定量-離散型定量-連續(xù)型精確程度性別:男健康狀況:良好家庭人口數(shù):3身高:226cm無序分類-多分類血型:A型定性變量定量變量81.1.下面的變量中,屬于分類變量的是(下面的變量中,屬于分類變量的是( )A A 脈搏脈搏 B B 血型血型 C C 肺活量肺活量 D D 紅細(xì)胞計數(shù)紅細(xì)胞計數(shù)2.2.下面的變量中,屬于定量變量的是(下面的變量中,屬于定量變量的是( )A A 性別性別 B B 體重體重 C C

5、血型血型 D D 職業(yè)職業(yè)3.3.某人記錄了某人記錄了5050名病人體重的測定結(jié)果:小于名病人體重的測定結(jié)果:小于50Kg50Kg的的1313人,介人,介于于50Kg50Kg和和70Kg70Kg間的間的2020人,大于人,大于70Kg70Kg的的1717人,此時資料屬于(人,此時資料屬于( )A A 定量資料定量資料 B B 分類資料分類資料 C C 有序資料有序資料 D D 二分類資料二分類資料變量的分類及其統(tǒng)計描述9變量的分類及其統(tǒng)計描述 定量資料的統(tǒng)計描述定量資料的定量資料的統(tǒng)計描述統(tǒng)計描述統(tǒng)計圖表:頻數(shù)分布表(圖)統(tǒng)計圖表:頻數(shù)分布表(圖)統(tǒng)計指標(biāo):統(tǒng)計指標(biāo):集中趨勢指標(biāo)集中趨勢指標(biāo)離

6、散趨勢指標(biāo)離散趨勢指標(biāo)統(tǒng)計表:對數(shù)據(jù)進(jìn)行概括;統(tǒng)計圖:對分布形態(tài)及分布間的關(guān)系做直觀的表達(dá)。10變量的分類及其統(tǒng)計描述11變量的分類及其統(tǒng)計描述12變量的分類及其統(tǒng)計描述 離散型變量的頻數(shù)(率)分布圖離散型變量的頻數(shù)(率)分布圖 直條圖直條圖 橫坐標(biāo)為產(chǎn)前檢查次數(shù);縱坐標(biāo)為 頻率,即產(chǎn)前檢查K次的婦女在被統(tǒng)計婦女中所占的比例%。圖中等寬矩形長條的高度與相應(yīng)檢查次數(shù)的頻率呈正比。13變量的分類及其統(tǒng)計描述 連續(xù)型變量的頻數(shù)(率)分布圖連續(xù)型變量的頻數(shù)(率)分布圖 直方圖直方圖 等距分組。以橫軸表示被觀察變量,縱軸表示頻率密度(頻率/組距),以各矩形(寬度為組距)的面積代表各組段的頻率。頻率直方圖

7、的縱坐標(biāo)為頻率密度,所以直方圖的總面積是100%。若以頻數(shù)為縱坐標(biāo),直方圖面積不等于1。14變量的分類及其統(tǒng)計描述 集中趨勢:血清鐵含量向中央部分集中,即中等含量者居多,集中在18mol/L這個組段,這種現(xiàn)象為集中趨勢。離散趨勢:從中央部分到兩側(cè)的頻數(shù)分布逐漸減少,而且血清鐵含量的值參差不齊,最低的接近6mol/L,最高的接近30mol/L,這種現(xiàn)象稱為離散趨勢。 頻數(shù)分布的兩個特征:頻數(shù)分布的兩個特征:由于同質(zhì)性,所有實測值趨向同一數(shù)值的趨勢稱為集中趨勢。離散趨勢或變異程度是指觀察值之間參差不齊的程度。15變量的分類及其統(tǒng)計描述一、描述集中趨勢的統(tǒng)計指標(biāo)(一)算術(shù)平局?jǐn)?shù)(mean) 總體均數(shù)

8、用希臘字母表示,樣本均數(shù)用拉丁字母 表示。XnXnX.XXXn21 nfxffxX00 直接法:加權(quán)法:16變量的分類及其統(tǒng)計描述一、描述集中趨勢的統(tǒng)計指標(biāo)(二)算術(shù)平均數(shù)(geometric mean) 也稱為倍數(shù)均數(shù),用G表示。直接法:加權(quán)法:nnXXXG.21nnnfffXfXfXfG.lg.lglglg2122111fXf lglg117變量的分類及其統(tǒng)計描述一、描述集中趨勢的統(tǒng)計指標(biāo)(三)中位數(shù)和百分位數(shù) 中位數(shù)(median,M):將一組變量值從小到大按順序排列,位次居中的那個變量值就是中位數(shù)。 n為奇數(shù): n為偶數(shù):百分位數(shù)(percentile, Px):指把數(shù)據(jù)從小到大排列后

9、位于第X%位置的數(shù)值。有n個觀察值X1,X2Xn,把他們由小到大按順序排列成X1X2X3Xn,將這n個觀察值平均的分為100等份,對應(yīng)于每一等份的數(shù)值就是一個百分位數(shù),對應(yīng)于前面X%個位置的數(shù)值稱為第X百分位數(shù),用Px表示。 一個百分位數(shù)Px將總體或樣本的全部觀察值分為兩部分,理論上,在不包括Px的全部數(shù)據(jù)中有X%的觀察值比它小,有(100-X)%的觀察值比它大。LxxfnXfiLP10021nXM 2/XXM12n2n 18變量的分類及其統(tǒng)計描述二、描述離散趨勢的統(tǒng)計指標(biāo)(一)極差(range ,R) 也稱為全距,用R表示,即一組資料中,最大值與最小值之差。(二)四分位數(shù)間距(quartil

10、e range ,Q)P25表示全部觀察值中有25%(1/4)的觀察值比它小,記為下四分位數(shù)QL;P75表示全部觀察值中有25%(1/4)的觀察值比它大,記為上四分位數(shù)QU。Q適用于各種類型的連續(xù)型變量,特別是偏態(tài)分布的資料。LUQQQ19變量的分類及其統(tǒng)計描述二、描述離散趨勢的統(tǒng)計指標(biāo)(三)方差和標(biāo)準(zhǔn)差 方差只取正值。同類資料比較時,方差越大意味著數(shù)據(jù)間變異越大。(四)變異系數(shù)(coefficient of variation ,CV)1)比較度量衡單位不同的多組資料的變異度。2) 比較均數(shù)相差懸殊的幾組資料的變異度。 NX22 N/X2 %100XSCV 201.1.反映定量變量觀察數(shù)據(jù)集

11、中位置的指標(biāo)是(反映定量變量觀察數(shù)據(jù)集中位置的指標(biāo)是( )A A 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 B B 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 C C 頻率頻率 D D均數(shù)均數(shù)2.2.在正態(tài)分布條件下,表示變量值變異情況的指標(biāo)最常用的是在正態(tài)分布條件下,表示變量值變異情況的指標(biāo)最常用的是( )A A 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 B B 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 C C 變異系數(shù)變異系數(shù) D D 百分位數(shù)百分位數(shù)3.3.變異系數(shù)越大說明(變異系數(shù)越大說明( )A A 標(biāo)準(zhǔn)差越大標(biāo)準(zhǔn)差越大 B B 標(biāo)準(zhǔn)差、平均數(shù)都大標(biāo)準(zhǔn)差、平均數(shù)都大 C C 以均數(shù)為準(zhǔn)變異程度大以均數(shù)為準(zhǔn)變異程度大 D D 平均數(shù)小平均數(shù)小4.4.已知某疾病患者已知某疾病患者1010人的潛伏期(

12、天)分別為:人的潛伏期(天)分別為:6 6,1313,5 5,9 9,1212,1010,8 8,1111,8 8,1212,其潛伏期的平均水平約為(,其潛伏期的平均水平約為( )A 9A 9天天 B 9.5B 9.5天天 C 10C 10天天 D 11D 11天天變量的分類及其統(tǒng)計描述21變量的分類及其統(tǒng)計描述 定性資料的統(tǒng)計描述一、定性資料的頻數(shù)分布構(gòu)成比:說明一事物內(nèi)部各組成部分在總體中所占的比重或分布,常用百分?jǐn)?shù)表示。構(gòu)成比構(gòu)成比= 某一組成部分的觀察單位數(shù)某一組成部分的觀察單位數(shù)同一事物內(nèi)部各組成部分的觀察單位總數(shù)同一事物內(nèi)部各組成部分的觀察單位總數(shù)100%常用來表示疾病或死亡的順位

13、、位次或所占比重。 22變量的分類及其統(tǒng)計描述 定性資料的統(tǒng)計描述二、常用相對數(shù)指標(biāo)(一)頻率型指標(biāo):近似的反映某一事件出現(xiàn)的機(jī)會大小,如發(fā)病概率、死亡概率。 某事件發(fā)生的個體數(shù) 可能發(fā)生某事件的個體數(shù)頻率 =KK:比例基數(shù)選擇K的原則:使算得的率至少保留12位整數(shù)。23變量的分類及其統(tǒng)計描述 定性資料的統(tǒng)計描述二、常用相對數(shù)指標(biāo)(二)強(qiáng)度型指標(biāo):指一段時間內(nèi)的平均概率。多用于大人群、長時間隨訪的資料。強(qiáng)度是單位時間段內(nèi)某現(xiàn)象發(fā)生的頻率。如發(fā)病率、死亡率。 K 時時間間數(shù)數(shù)可可能能發(fā)發(fā)生生某某事事件件的的個個體體某某事事件件發(fā)發(fā)生生的的個個體體數(shù)數(shù)強(qiáng)強(qiáng)度度型型指指標(biāo)標(biāo)K:比例基數(shù)選擇K的原則:

14、使算得的率至少保留12位整數(shù)。24變量的分類及其統(tǒng)計描述 定性資料的統(tǒng)計描述二、常用相對數(shù)指標(biāo)(三)相對比型指標(biāo) 相對比型指標(biāo)是A、B兩個有聯(lián)系的指標(biāo)之比。對比的兩個指標(biāo)可以性質(zhì)相同,也可以性質(zhì)不同。 公式為:相對比型指標(biāo)=A指標(biāo)/B指標(biāo) 注意:在計算相對比中,甲、乙兩個指標(biāo)可以是絕對數(shù),也可以是相對數(shù)或平均數(shù)。25變量的分類及其統(tǒng)計描述1.1.某醫(yī)院某年住院病人中胃癌患者占某醫(yī)院某年住院病人中胃癌患者占5%5%,則(),則()A 5%A 5%是強(qiáng)度指標(biāo)是強(qiáng)度指標(biāo) B 5%B 5%是頻率指標(biāo)是頻率指標(biāo)C 5%C 5%是相對比指標(biāo)是相對比指標(biāo) D 5%D 5%說明胃癌在人群中的嚴(yán)重性說明胃癌在人

15、群中的嚴(yán)重性2. 2. 計算麻疹疫苗接種后血清檢查的陽轉(zhuǎn)率,分母為(計算麻疹疫苗接種后血清檢查的陽轉(zhuǎn)率,分母為( )A A 麻疹易感人群麻疹易感人群 B B 麻疹患者數(shù)麻疹患者數(shù) C C 麻疹疫苗接種人數(shù)麻疹疫苗接種人數(shù) D D 麻疹疫苗接種后的陽轉(zhuǎn)人數(shù)麻疹疫苗接種后的陽轉(zhuǎn)人數(shù)26課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part727常用概率分布 正態(tài)分布 二項分布 Poisson分布28常用概率分布 正態(tài)分布 正態(tài)分布是自然界最常見的一種分布,若指標(biāo)X的頻率分布曲線對應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線,則稱該指標(biāo)服從正態(tài)分布。29常用概率分布30常用概率分布31常用概率分布32常用概率分布均

16、數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,這種正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布。對于任意一個服從正態(tài)分布N(,2)的隨機(jī)變量,可作如下的標(biāo)準(zhǔn)化變換,也稱Z變換:XZ 正態(tài)分布33常用概率分布 正態(tài)分布應(yīng)用:1.制定醫(yī)學(xué)參考值范圍2.質(zhì)量控制34常用概率分布 二項分布是指在只能產(chǎn)生兩種可能結(jié)果(如“陽性”或“陰性”)之一的n次獨立重復(fù)實驗中,當(dāng)每次試驗的“陽性”概率保持不變時,出現(xiàn)“陽性”的次數(shù)X=0,1,2,n的一種概率分布。 若從陽性率為的總體中隨機(jī)抽取大小為n的樣本,則出現(xiàn)“陽性”數(shù)為X的概率分布即呈現(xiàn)二項分布,記作 B(X;n,)或B(n,)。 二項分布35常用概率分布 Poisson分布 Poisson分

17、布也是一種離散型分布,用以描述罕見事件發(fā)生次數(shù)的概率分布。Poisson分布也可用于研究單位時間內(nèi)(或單位空間、容積內(nèi))某罕見事件發(fā)生次數(shù)的分布,如分析在單位面積或容積內(nèi)細(xì)菌數(shù)的分布,在單位空間中某種昆蟲或野生動物數(shù)的分布,粉塵在觀察容積內(nèi)的分布,放射性物質(zhì)在單位時間內(nèi)放射出質(zhì)點數(shù)的分布等。36常用概率分布1.1.標(biāo)準(zhǔn)正態(tài)分布的均數(shù)與標(biāo)準(zhǔn)差是(標(biāo)準(zhǔn)正態(tài)分布的均數(shù)與標(biāo)準(zhǔn)差是( )A 0A 0,1 B 11 B 1,0 C 00 C 0,0 D 10 D 1,1 12.2.正態(tài)分布的兩個參數(shù)正態(tài)分布的兩個參數(shù)與與 ,(,( )對應(yīng)的正態(tài)曲)對應(yīng)的正態(tài)曲線愈趨扁平。線愈趨扁平。A A 愈大愈大 B

18、B 愈小愈小 C C 愈大愈大 D D 愈小愈小 37課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part738參數(shù)估計和假設(shè)檢驗 參數(shù)估計 概念:參數(shù)估計就是用樣本指標(biāo)(統(tǒng)計量)來估計總體指標(biāo)(參數(shù))。參數(shù)估計參數(shù)估計點估計點估計(point estimation)區(qū)間估計區(qū)間估計(interval estimation)39參數(shù)估計和假設(shè)檢驗 參數(shù)估計點估計:用樣本統(tǒng)計量直接作為總體參數(shù)的估計值。 例如 于2000年測得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L,試估計其總體均數(shù)。 即認(rèn)為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L 。X40參數(shù)估計

19、和假設(shè)檢驗 參數(shù)估計區(qū)間估計:按預(yù)先給定的概率(1)估計總體參數(shù)的可能范圍,該范圍就稱為總體參數(shù)的1置信區(qū)間(confidence interval CI)。預(yù)先給定的概率(1)稱為置信度,常取95%或99%。如無特別說明,一般取雙側(cè)95%。41參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗 概念:假設(shè)檢驗亦稱為顯著性檢驗,是判斷樣本指標(biāo)與總體指標(biāo)或樣本指標(biāo)與樣本指標(biāo)之間的差異有無顯著性意義的一種統(tǒng)計方法。預(yù)先給定的概率(1)稱為置信度,常取95%或99%。如無特別說明,一般取雙側(cè)95%。42 p假設(shè)檢驗的原理: 假設(shè)檢驗的基本思想是反證法和小概率的思想。p反證法思想:首先提出假設(shè)(由于未經(jīng)檢驗是否成立,所以稱

20、為無效假設(shè)),用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如果可能性小,則認(rèn)為假設(shè)不成立,拒絕它;如果可能性大,還不能認(rèn)為它不成立。p小概率思想:是指小概率事件在一次隨機(jī)試驗中認(rèn)為基本上不會發(fā)生。 概率小于多少算小概率是相對的,在進(jìn)行統(tǒng)計分析時要事先規(guī)定,即檢驗水準(zhǔn)。參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗43參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗例1:已知北方農(nóng)村兒童前囟門閉合月齡為14.1月。某研究人員從東北某縣抽取36名兒童,得囟門閉合月齡均值為14.3月,標(biāo)準(zhǔn)差為5.08月。問該縣兒童前囟門閉合月齡的均數(shù)是否大于一般兒童?3608. 53 .141 .140 nsX 已已知知:從統(tǒng)計學(xué)角度考慮東北某縣與北方兒

21、童前囟門閉合月齡有差別有兩種可能:1.差別是由于抽樣誤差引起的,統(tǒng)計學(xué)上稱為差異無顯著性。2.差異是本質(zhì)上的差異,即二者來自不同總體。統(tǒng)計學(xué)上稱為差異有顯著性。44參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗3608. 53 .141 .140 nsX 已已知知:0 0 造成兩者不等的原因:同一總體,即 但有抽樣誤差存在;非同一總體,即 存在本質(zhì)上的差別,同時有抽樣誤差存在。0 0 X45參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗的步驟1.建立檢驗假設(shè)與單雙側(cè)05. 0(:1 .140100 檢驗水準(zhǔn):檢驗水準(zhǔn):單側(cè))單側(cè))備擇假設(shè)備擇假設(shè):原假設(shè)原假設(shè)HH單雙側(cè)的確定:1.根據(jù)專業(yè)知識,已知東北某縣囪門月齡閉合值不會低于

22、一般值;2.研究者只關(guān)心東北某縣值是否高于一般人群值,應(yīng)當(dāng)用單側(cè)檢驗。3.一般認(rèn)為雙側(cè)檢驗較為穩(wěn)妥,故較為常用。46參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗的步驟2.確定檢驗水準(zhǔn) 亦稱為顯著性水準(zhǔn),符號為,是預(yù)先給定的概率值。常取0.05。 可根據(jù)不同的研究目的給予不同的設(shè)置,如方差齊性檢驗,正態(tài)性檢驗常取0.1或0.2。3.選擇檢驗方法并計算統(tǒng)計量 根據(jù)所分析資料的類型和統(tǒng)計推斷的目的要求選用不同的檢驗方法。單樣本t檢驗351361236. 03608. 51 .143 .140 nnsXt 47參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗的步驟4.確定P值 P值的意義:指從H0規(guī)定的總體中隨機(jī)抽得等于及大于(或等于及

23、小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率。 如果總體狀況和H0一致,統(tǒng)計量獲得現(xiàn)有數(shù)值以及更不利于H0的數(shù)值的可能性(概率)有多大。25. 0682. 0)35(25. 0)35(25. 0 Pttt得得48參數(shù)估計和假設(shè)檢驗 假設(shè)檢驗的步驟5.做推斷結(jié)論(包括統(tǒng)計結(jié)論和專業(yè)結(jié)論) 按=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計學(xué)意義,故還不能認(rèn)為該縣兒童前囟門閉合月齡的均數(shù)大于一般兒童。49參數(shù)估計和假設(shè)檢驗 兩組獨立樣本資料的t檢驗例2:某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下, 問該地急性克山病患者與健康人的血磷值是否不同?患 者: 0.84、1.05、1.20、

24、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人: 0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87 適用條件p 兩樣本相互獨立p 樣本來自的兩個總體服從正態(tài)分布p 方差齊性50參數(shù)估計和假設(shè)檢驗)(:2121211210?HH 兩組獨立樣本資料的t檢驗當(dāng)H0成立時,檢驗統(tǒng)計量: 2,112121221 nntnnSXXtc t=-2.524,P=0.0190.05,按=0.05檢驗水平,拒絕H0,可以認(rèn)為兩組血磷值不同,從描述性結(jié)果看,患者血磷值高于健康人。51課程提綱 SPS

25、S統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part752卡方檢驗主要應(yīng)用:1.推斷兩個或多個樣本率及構(gòu)成比之間有無差別;2.分類變量配對設(shè)計下的卡方檢驗;3.頻數(shù)分布的擬合優(yōu)度檢驗。53完全隨機(jī)設(shè)計下兩組頻數(shù)分布的2檢驗卡方檢驗例3:監(jiān)測發(fā)現(xiàn)某學(xué)校發(fā)生甲型肝炎暴發(fā),經(jīng)現(xiàn)場調(diào)查,共發(fā)現(xiàn)19例甲肝確診病例。開展以下病例對照研究:以19例甲肝確診病例為病例組,選取該校53名無任何臨床癥狀且HAV IgM抗體陰性的學(xué)生作為對照組,比較兩組飲水類型和洗手習(xí)慣有無差異?兩組飲水類型比較兩組飲水類型比較組別是否飲用過某井生水合計飲用未飲用病例組14519對照組213153合計363672兩組洗手習(xí)慣比較兩組洗手習(xí)慣

26、比較組別是否經(jīng)常洗手(3次/d)合計飲用未飲用病例組14519對照組401353合計54367254卡方檢驗完全隨機(jī)設(shè)計下兩組頻數(shù)分布的2檢驗1.建立檢驗假設(shè)并確定檢驗水準(zhǔn)H0:兩組飲水類型構(gòu)成相同,1=2H1:兩組飲水類型構(gòu)成不同,12 =0.052.計算檢驗統(tǒng)計量四格表專用公式(T5,且n40):校正公式(1T5,且n40):dbcadcbanbcad22dbcadcbannbcad2223.確定P值4.做統(tǒng)計推斷55課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part756單因素方差分析 適用條件p 多組間(3組)均數(shù)比較p 各樣本相互獨立p 樣本來自的總體均服從正態(tài)分布p 方差齊

27、性57課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part758兩獨立樣本非參數(shù)檢驗如果兩樣本是非正態(tài)分布,該如何分析?59兩獨立樣本非參數(shù)檢驗例41. 比較2014年六安市金安區(qū)和裕安區(qū)在流行性腮腺炎報卡審核時間(從報告到審核)上有無差異?2. 比較2014年六安市縣級以上綜合醫(yī)院與鄉(xiāng)鎮(zhèn)衛(wèi)生院在流行性腮腺炎報卡報告時間(從診斷到報告)上有無差異?60兩獨立樣本非參數(shù)檢驗 適用條件p 非參數(shù)檢驗p 不依賴于總體的分布形式p 對兩個分布進(jìn)行比較p 對兩組間參數(shù)進(jìn)行比較時,不服從正態(tài)分布偏態(tài)分布(M,Q)61課程提綱 SPSS統(tǒng)計分析軟件應(yīng)用統(tǒng)計分析軟件應(yīng)用Part762 世界上最早的統(tǒng)計分

28、析軟件 1968年斯坦福大學(xué)三位研究生創(chuàng)建 世界公認(rèn)的三大數(shù)據(jù)分析軟件之一 SAS(Statistical Analysis System) S+ (Splus) 最高版本已達(dá)21.0SPSS統(tǒng)計分析軟件應(yīng)用63 發(fā)展史 美國斯坦福大學(xué)三位研究生(Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent)創(chuàng)建SPSS“Statistical Package for the Social Sciences”。 在芝加哥成立SPSS總部 推出Windows版本,同時全球自SPSS 11.0起,SPSS全稱為“Statistical Product and

29、Service Solutions”,即“統(tǒng)計產(chǎn)品和服務(wù)解決方案”。( 11.0+ ) SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為“預(yù)測統(tǒng)計分析軟件”(Predictive Analytics Software)PASW。 (17.0+) SPSS公司被IBM公司并購,各子產(chǎn)品家族名稱前面不再以PASW為名,修改為統(tǒng)一加上IBM SPSS字樣。(19.0+)19681975199220092010SPSS統(tǒng)計分析軟件應(yīng)用64應(yīng)用領(lǐng)域廣泛 通信、醫(yī)療、銀行、證券、保險、制造、商業(yè)目前已推出9個語種版本 國內(nèi)外著名大學(xué)一般把SPSS統(tǒng)計軟件應(yīng)用作為學(xué)生的公共必修課SPSS統(tǒng)計分析軟件應(yīng)用

30、65引例:某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下, 問該地克山病患者與健康人的血磷值是否不同?患 者: 0.84、1.05、1.20、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人: 0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87工作流程:一、將數(shù)據(jù)輸入SPSS,并存盤。二、進(jìn)行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等), 以確定應(yīng)采用的檢驗方法。三、按題目要求進(jìn)行統(tǒng)計分析。四、保存和導(dǎo)出分析結(jié)果。SPSS統(tǒng)計分析軟件應(yīng)用66u 打開SPSS

31、19.0軟件步驟:開始所有程序IBM SPSS Statistics IBM SPSS statistics 19.0,或在破解后的軟件包里直接打開stats.exe選中,點擊確定或直接點擊取消SPSS統(tǒng)計分析軟件應(yīng)用67u SPSS19.0主界面標(biāo)題欄菜單欄工具欄數(shù)據(jù)輸入欄變量名欄數(shù)據(jù)編輯區(qū)數(shù)據(jù)編輯區(qū)窗口切換標(biāo)簽狀態(tài)欄觀測序號當(dāng)前數(shù)據(jù)欄SPSS統(tǒng)計分析軟件應(yīng)用68u 變量視圖窗口變量名變量名命名規(guī)則命名規(guī)則u變量名必須以字母、漢字或字符變量名必須以字母、漢字或字符 開頭,其他字符可以是任何字開頭,其他字符可以是任何字母、數(shù)字或母、數(shù)字或_ _、 、# #、$ $等符號。等符號。u變量最后一個

32、字符不能是句號。變量最后一個字符不能是句號。u變量名總長度不能超過變量名總長度不能超過6464個字符(即個字符(即3232個漢字)。個漢字)。u不能使用空白字符或其他特殊字符(如不能使用空白字符或其他特殊字符(如“!”、“?”等)。等)。u變量命名必須唯一,不能有兩個相同的變量名。變量命名必須唯一,不能有兩個相同的變量名。u在在SPSSSPSS中變量名不區(qū)分大小寫。中變量名不區(qū)分大小寫。uSPSSSPSS的保留字的保留字 (Reserved KeywordsReserved Keywords)不能作為變量的名稱,)不能作為變量的名稱,如如ALLALL、ANDAND、WITHWITH、OROR等

33、。等。一行表示一個變量一行表示一個變量中英文變量名都行中英文變量名都行SPSS統(tǒng)計分析軟件應(yīng)用69u 變量視圖窗口兩種常見變量類型數(shù)值型(Numeric),如身高、體重字符串型(String),如家庭住址SPSS統(tǒng)計分析軟件應(yīng)用70 變量視圖窗口寬度:默認(rèn)為8,可根據(jù)自己的需要調(diào)整。小數(shù):默認(rèn)為2,可根據(jù)自己的需要調(diào)整。便于在結(jié)果中展示SPSS統(tǒng)計分析軟件應(yīng)用71u 數(shù)據(jù)導(dǎo)入方式 手工錄入 外部文件導(dǎo)入 Excel文件 EpiData文件 TXT文件 SPSS統(tǒng)計分析軟件應(yīng)用72u 定義變量點擊數(shù)據(jù)視圖,切換為數(shù)據(jù)視圖點擊數(shù)據(jù)視圖,切換為數(shù)據(jù)視圖SPSS統(tǒng)計分析軟件應(yīng)用73u 錄入和保存數(shù)據(jù)數(shù)

34、據(jù)錄入數(shù)據(jù)保存文件-保存SPSS統(tǒng)計分析軟件應(yīng)用74再看引例引例:某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下, 問該地急性克山病患者與健康人的血磷值是否不同?患 者: 0.84、1.05、1.20、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人: 0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87 數(shù)據(jù)類型:定量數(shù)據(jù)(血磷值) 設(shè)計類型:兩樣本(克山病患者和健康人)均數(shù)比較可供參考的檢驗方法有哪些呢?SPSS統(tǒng)計分析軟件應(yīng)用t檢驗75u檢驗秩和檢驗t

35、檢驗用于總體標(biāo)準(zhǔn)差已知或未知但n足夠大(n30,實際操作中多采用n100)。非參數(shù)檢驗,不依賴于總體分布形式,不是參數(shù)間的比較,是用于分布間的比較。主要用于樣本量較?。╪30)總體標(biāo)準(zhǔn)差未知的正態(tài)分布。樣本量過小檢驗效能低注意:在大樣本情況下檢驗和檢驗結(jié)果基本一致。SPSS統(tǒng)計分析軟件應(yīng)用t檢驗76 預(yù)分析正態(tài)性檢驗操作步驟:分析描述統(tǒng)計P-P圖預(yù)測點和實際的點(直線)重合或基本重合可以說明服從正態(tài)分布或近似正態(tài)分布。SPSS統(tǒng)計分析軟件應(yīng)用t檢驗77 兩樣本均數(shù)t檢驗操作步驟:分析比較均值獨立樣本t檢驗SPSS統(tǒng)計分析軟件應(yīng)用t檢驗78 結(jié)果兩組描述性結(jié)果若P0.05,方差齊若P0.05,方

36、差不齊P0.05,方差齊,看第一行結(jié)果P0.05,差異有統(tǒng)計學(xué)意義結(jié)果解釋:1. 方差齊性檢驗結(jié)果P=0.8600.05,說明方差是齊的,看第一行結(jié)果。2. t檢驗結(jié)果P=0.0190.05,按=0.05檢驗水平,可以認(rèn)為兩組血磷值不 同,從描述性結(jié)果看,患者血磷值高于健康人。SPSS統(tǒng)計分析軟件應(yīng)用t檢驗79 均值比較的其它分析方法及適用條件樣本均值與已知總體均數(shù)( )進(jìn)行比較用于配對設(shè)計資料,檢驗配對樣本差值的總體均數(shù)與0是否有顯著性差異用于多組(3組)間均值的比較,獨立、正態(tài)、方差齊SPSS統(tǒng)計分析軟件應(yīng)用t檢驗80例題1某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進(jìn)行

37、了用力肺活量(L)測定,結(jié)果見表1,問三組石棉肺礦工的用力肺活量有無差異?SPSS統(tǒng)計分析軟件應(yīng)用方差分析81表1 三組石棉礦工的用力肺活量石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.81.92.62.71.72.53.01.82.33.41.92.43.01.82.43.41.83.32.03.5SPSS統(tǒng)計分析軟件應(yīng)用方差分析82 適用條件p 多組間(3組)均數(shù)比較p 各樣本相互獨立p 樣本來自的總體均服從正態(tài)分布p 方差齊性SPSS統(tǒng)計分析軟件應(yīng)用方差分析83 第一步:建立數(shù)據(jù)庫(石棉肺.sav)變量視圖數(shù)據(jù)視圖SPSS統(tǒng)計分析軟件應(yīng)用方

38、差分析84操作步驟:分析描述統(tǒng)計P-P圖 第二步:預(yù)分析正態(tài)性檢驗SPSS統(tǒng)計分析軟件應(yīng)用方差分析85 第三步:單因素方差分析操作步驟:分析比較均值單因素ANOVASPSS統(tǒng)計分析軟件應(yīng)用方差分析86 結(jié)果結(jié)果解釋:F=84.544,P0.001,拒絕H0(三組均數(shù)無差異),可以認(rèn)為三組肺活量是不相同的。SPSS統(tǒng)計分析軟件應(yīng)用方差分析87 組間兩兩比較操作步驟:分析比較均值單因素ANOVA 兩兩比較SPSS統(tǒng)計分析軟件應(yīng)用方差分析88 組間兩兩比較結(jié)果子集間差異有統(tǒng)計學(xué)意義,子集內(nèi)差異無統(tǒng)計學(xué)意義。(也有可能只有兩個子集)SPSS統(tǒng)計分析軟件應(yīng)用方差分析89例題2監(jiān)測發(fā)現(xiàn)某學(xué)校發(fā)生甲型肝炎暴發(fā),經(jīng)現(xiàn)場調(diào)查,共發(fā)現(xiàn)19例甲肝確診病例。開展以下病例對照研究:以19例甲肝確診病例為病例組,選取該校53名無任何臨床癥狀且HAV IgM抗體陰性的學(xué)生作為對照組,比較兩組飲水類型和洗手習(xí)慣有無差異?兩組飲水類型比較兩組飲水類型比較組別是否飲用過某井生水合計飲用未飲用病例組14519對照組213153合計363672兩組洗手習(xí)慣比較兩組洗手習(xí)慣比較組別是否經(jīng)常洗手(3次/d)合計飲用未飲用病例組14519對照組401353合計543672SPSS統(tǒng)計分析軟件應(yīng)用卡方檢驗90 數(shù)據(jù)類型:定性數(shù)據(jù)(分類數(shù)據(jù))(飲用和未飲用) 設(shè)計類型:兩樣本(病例組和對照組)率的比較可供參考的檢驗方法: 四

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論