常用統(tǒng)計(jì)分析方法介紹與實(shí)例_第1頁
常用統(tǒng)計(jì)分析方法介紹與實(shí)例_第2頁
常用統(tǒng)計(jì)分析方法介紹與實(shí)例_第3頁
常用統(tǒng)計(jì)分析方法介紹與實(shí)例_第4頁
常用統(tǒng)計(jì)分析方法介紹與實(shí)例_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

常用推斷性統(tǒng)計(jì)分析方法介紹

及其實(shí)例解析浙江省疾病預(yù)防控制中心何凡Tel13777843290Email:zjhefan@126.com12基本概念——變量類型常用推斷性統(tǒng)計(jì)分析1.兩組之間比較—定性資料2.兩組之間比較—等級(jí)資料3.兩組之間比較—定量資料4.兩組以上資料(無序多分類)的比較—定性資料5.兩組以上資料(無序多分類)的比較—等級(jí)資料6.兩組以上資料(無序多分類)的比較—定量資料7.兩等級(jí)變量關(guān)系的分析8.等級(jí)變量與定量變量之間的關(guān)系分析9.兩定量變量關(guān)系的分析10.多選題分析11.Logisitic回歸分析目錄基本概念——變量類型1、定性變量:最常見的是分類變量或名義變量;如職業(yè):工人、農(nóng)民、民工、商人、學(xué)生等,此為多分類變量;最簡(jiǎn)單和最常用的分類變量是二分類變量,如性別:男、女,某種疾病:有、無,某種結(jié)局:出現(xiàn)、未出現(xiàn)等。3有序變量或等級(jí)變量與分類變量不同,各種可能的“取值”中自然地存在著次序,如問卷調(diào)查中對(duì)某件事情的滿意程度:非常不滿意、有點(diǎn)滿意、滿意、很滿意、非常滿意;臨床體檢或?qū)嶒?yàn)室檢驗(yàn)常用-、±、+、++、+++來表示測(cè)量結(jié)果;再如《護(hù)理與康復(fù)》,2004,3(1):54-55,臨床教學(xué)中培養(yǎng)護(hù)生觀察能力的方法探討,作者選用了講座、教學(xué)查房和案例教學(xué)三種方法,提高護(hù)生觀察能力的作用變量為:很有幫助、有幫助、一般。42、定量變量:分兩種→離散型和連續(xù)型離散型:只能取整數(shù)值,如一年中的手術(shù)病人數(shù),一年里的新生兒數(shù),細(xì)菌菌落數(shù)等;連續(xù)型:可以取實(shí)數(shù)中的任何數(shù)值,如血壓、身高、體重等,可以在實(shí)數(shù)的一定范圍內(nèi)連續(xù)取值;有一些測(cè)量值,如紅細(xì)胞計(jì)數(shù),雖然以“個(gè)”為單位時(shí)只能取連續(xù)值,但其數(shù)值很大,當(dāng)以“千”或“萬”為單位時(shí),卻可取小數(shù)值,故通常把這類變量也作為連續(xù)型變量處理。5有時(shí)為了數(shù)據(jù)分析的方便,可以將一種類型的變量轉(zhuǎn)化為另一種類型。但只能由高級(jí)向低級(jí)轉(zhuǎn)化,即連續(xù)型→有序→分類→二分類。

實(shí)例:如《護(hù)理與康復(fù)》2004,3(1):3-4,全子宮切除術(shù)后最佳下床活動(dòng)時(shí)間與肛門排氣時(shí)間關(guān)系的探討,作者把肛門排氣時(shí)間分為三個(gè)等級(jí)(<=24h,25~30h,>30h),然后再進(jìn)行分析。6常用推斷性統(tǒng)計(jì)分析方法7

兩組之間比較——定性資料(1)二分類資料

I成組設(shè)計(jì):所用統(tǒng)計(jì)方法為四格表χ2

檢驗(yàn)。8

9

10II配對(duì)設(shè)計(jì):對(duì)一組樣品同時(shí)用兩種檢測(cè)方法對(duì)其進(jìn)行檢測(cè),每種檢測(cè)方法檢測(cè)結(jié)果都分為陽性和陰性,數(shù)出兩種檢測(cè)方法同時(shí)判定為陽性、陰性的樣品數(shù)以及它們檢測(cè)結(jié)果不一致的樣品數(shù),將結(jié)果表示成配對(duì)四格表的資料格式。所用統(tǒng)計(jì)方法為配對(duì)四格表χ2

檢驗(yàn)。11

實(shí)例1中,兩種檢測(cè)方法不知何者為優(yōu),任何一種方法檢測(cè)的結(jié)果都有假陽性和假陰性,比較它們檢測(cè)結(jié)果不一致的兩個(gè)頻數(shù),無論差別有無統(tǒng)計(jì)學(xué)意義,都不能說明兩種檢測(cè)方法何者為優(yōu),缺乏“金標(biāo)準(zhǔn)”,因而沒有必要做統(tǒng)計(jì)分析。

實(shí)例2屬于隱含金標(biāo)準(zhǔn)的配對(duì)四格表資料,若甲培養(yǎng)基培養(yǎng)出陽性結(jié)果,而乙卻培養(yǎng)出陰性結(jié)果,表明甲優(yōu)于乙,這種陽性結(jié)果為真陽性,此時(shí)值得做統(tǒng)計(jì)分析。實(shí)例3則可以明確地判定試驗(yàn)檢測(cè)方法的優(yōu)劣。配對(duì)四格表的χ2檢驗(yàn)可用McNemarχ2

檢驗(yàn),以檢測(cè)結(jié)果不一致部分差別是否具有統(tǒng)計(jì)學(xué)意義。當(dāng)然也可用Kappa檢驗(yàn)法檢驗(yàn)兩種檢測(cè)方法的檢測(cè)結(jié)果是否具有一致性。12

估計(jì)值P值卡方34.00005.51121E-09校正卡方32.02941.51856E-08

估計(jì)值P值卡方0.14290.705457校正卡方0.00001.000000結(jié)果結(jié)果

13(2)無序多分類資料:所用方法為2×C表的χ2檢驗(yàn)。

14

SPSS數(shù)據(jù)格式可以采用兩組有序變量資料的Wilcoxon秩和檢驗(yàn)15

兩組之間比較——等級(jí)資料干預(yù)過去三個(gè)月您抽煙嗎UValuePValue從不很少有時(shí)經(jīng)常前4648461345291-2.88510.0039后3163297181164合計(jì)7811758526455

16

17可以選用的方法有成組設(shè)計(jì)的t檢驗(yàn)、u檢驗(yàn)、單樣本t檢驗(yàn)(與總體作比較,實(shí)際上此時(shí)因素也為二分類)、配對(duì)t檢驗(yàn)、非參數(shù)Wilcoxon檢驗(yàn)、符號(hào)檢驗(yàn)、符號(hào)秩和檢驗(yàn)等。18

參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)的區(qū)別?通常參數(shù)檢驗(yàn)的檢驗(yàn)效能要高于非參數(shù)檢驗(yàn),但當(dāng)參數(shù)檢驗(yàn)的條件(正態(tài)性、方差齊性)得不到滿足、開口資料、等級(jí)資料或資料的總體分布未知時(shí),可以使用非參數(shù)檢驗(yàn)的方法進(jìn)行分析。成組設(shè)計(jì)和配對(duì)設(shè)計(jì)的區(qū)別?配對(duì)設(shè)計(jì)是按照一些非實(shí)驗(yàn)因素將受試對(duì)象配成對(duì)子,給予每對(duì)中的個(gè)體以不同的處理,配對(duì)的條件一般為年齡、性別、體重……。其優(yōu)點(diǎn)是在同一對(duì)的試驗(yàn)對(duì)象間取得均衡,從而提高試驗(yàn)的效率。通常分為自身配對(duì)設(shè)計(jì)(某中措施作用于同一個(gè)體或兩種措施作用于同一個(gè)體)和非自身配對(duì)設(shè)計(jì)兩種。

兩組之間比較——定量資料

(1)成組設(shè)計(jì)的t檢驗(yàn),設(shè)計(jì)類型為成組設(shè)計(jì),且因素變量為二分類變量,分析前需要先對(duì)資料的正態(tài)性和方差齊性進(jìn)行檢驗(yàn)(這是很多參數(shù)檢驗(yàn)的前提條件)。19

例:兩組雌鼠,分別飼以高蛋白和低蛋白飼料,8周后記錄各鼠體重增加量(克),問兩組動(dòng)物的增重是否有差別?(此處正態(tài)性和方差齊性檢驗(yàn)略)。利用SPSS進(jìn)行分析,數(shù)據(jù)文件及格式見“成組設(shè)計(jì)t檢驗(yàn).sav”,SPSS菜單操作為:分析→比較均值→獨(dú)立樣本T檢驗(yàn)

結(jié)果見下頁

方差齊性檢驗(yàn)的分析結(jié)果,P值(Sig)=0.905>0.05,表明方差齊性t檢驗(yàn)分析結(jié)果,P值(Sig)=0.076>0.05,表明兩組動(dòng)物增加的重量無差異(無統(tǒng)計(jì)學(xué)意義)。當(dāng)方差齊性時(shí),看第一行的結(jié)果(t=1.891,P=0.076),當(dāng)方差不齊時(shí),看第二行的結(jié)果(t=1.911,P=0.078)20

(2)成組設(shè)計(jì)的u檢驗(yàn),當(dāng)樣本量較大時(shí),兩組之間均數(shù)的比較可以用u檢驗(yàn),其在SPSS中的實(shí)現(xiàn)過程同t檢驗(yàn),此處略。(3)單樣本t檢驗(yàn);21

例:通過以往大規(guī)模調(diào)查,已知某地嬰兒出生體重均數(shù)為3.30kg,今測(cè)得某地一組嬰兒的出生體重,問該地嬰兒出生體重是否與一般嬰兒出生體重不同?利用SPSS進(jìn)行分析,數(shù)據(jù)文件及格式見“單樣本t檢驗(yàn).sav”,SPSS菜單操作為:分析→比較均值→單樣本T檢驗(yàn)

(4)配對(duì)t檢驗(yàn)22

例:用某藥治療10例高血壓病人,測(cè)得治療前后各病人的舒張壓,問該藥是否有降低舒張壓的作用?利用SPSS進(jìn)行分析,數(shù)據(jù)文件及格式見“配對(duì)t檢驗(yàn).sav”,SPSS菜單操作為:分析→比較均值→配對(duì)樣本T檢驗(yàn)結(jié)果見下頁

23

(5)非參數(shù)Wilcoxon秩和檢驗(yàn),適用于成組設(shè)計(jì)資料。24

例:測(cè)得某病的健康人12人和患者10人的某指標(biāo)值,問兩組之間該指標(biāo)值是否有差異?

25(1)二分類:所用方法為R×2表的χ2檢驗(yàn)。如幾種藥物的療效(有效、無效)比較;不同職業(yè)人群某病發(fā)生率的比較等等。26

兩組以上資料(無序多分類)的比較——定性資料

27(2)多分類:所用方法為R×C表的χ2檢驗(yàn)。28

實(shí)例2中小于5的理論頻數(shù)的格子數(shù)超過了總格子數(shù)的1/5,若選用一般的χ2檢驗(yàn)公式計(jì)算,將增大犯假陽性錯(cuò)誤的概率,故此處應(yīng)選用Fisher’s精確檢驗(yàn)法。293031此時(shí)資料屬于單向有序的R×C表資料,可以使用秩和檢驗(yàn)、Ridit分析和Logistic回歸的方法分析。32

兩組以上資料(無序多分類)的比較——等級(jí)資料

Kruskal-WallisTest:使用SPSS分析實(shí)例2資料,數(shù)據(jù)格式見右側(cè)截圖。菜單操作為:分析→非參數(shù)檢驗(yàn)→舊對(duì)話框→K個(gè)獨(dú)立樣本注意:例數(shù)必須先進(jìn)行加權(quán)操作33當(dāng)多組之間比較時(shí),可以選用的方法有單因素方差分析、配伍組設(shè)計(jì)的方差分析(屬兩因素方差分析,其與二分類的配對(duì)t檢驗(yàn)相對(duì)應(yīng))、非參數(shù)Kruskal-Wallis檢驗(yàn)及非參數(shù)Friedman檢驗(yàn)等。34

(1)單因素方差分析

例:某醫(yī)生為研究一種四類降糖新藥的療效,以統(tǒng)一的納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)選擇了60名2型糖尿病患者,按完全隨機(jī)設(shè)計(jì)方案將患者分為三組進(jìn)行雙盲臨床試驗(yàn)。其中,將糖新藥高劑量組21人、低劑量組19人、對(duì)照組20人。對(duì)照組用公認(rèn)的降糖藥物,治療4周后測(cè)得其餐后2小時(shí)血糖的下降值。問治療4周后,餐后2小時(shí)血糖下降值的三組總體平均水平是否不同?(此處正態(tài)性和方差齊性檢驗(yàn)略)。利用SPSS進(jìn)行分析,數(shù)據(jù)文件及格式見“單因素方差分析.sav”,SPSS菜單操作為:分析→比較均值→單因素Anova兩組以上資料(無序多分類)的比較——定量資料

截圖二:兩兩比較對(duì)話框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法。35截圖一:方差同質(zhì)性檢驗(yàn)

方差齊性檢驗(yàn)結(jié)果:P>0.05,方差齊方差分析結(jié)果,F(xiàn)=5.537,P=0.006<0.05,說明三組之間總體平均水平不同。因而進(jìn)一步用Dunnett法作多個(gè)試驗(yàn)組與一個(gè)對(duì)照組間的比較(見下頁)。36

37

(2)非參數(shù)Kruskal-Wallis檢驗(yàn)

例:仍以上述資料為例,假設(shè)此時(shí)資料不符合正態(tài)性或方差齊性的要求,我們使用非參數(shù)Kruskal-Wallis檢驗(yàn)進(jìn)行分析。SPSS菜單操作為:分析→非參數(shù)檢驗(yàn)→舊對(duì)話框→K個(gè)獨(dú)立樣本38I當(dāng)兩變量屬性不同時(shí),稱這樣的列聯(lián)表資料為雙向有序且屬性不同的R×C列聯(lián)表資料。39兩等級(jí)變量關(guān)系的分析

此時(shí),根據(jù)分析目的的不同,可以選用不同的分析方法。40

(1)只關(guān)心各年齡組患者治療結(jié)果之間的差別是否有統(tǒng)計(jì)學(xué)意義,此時(shí)可將其視為單向有序的R×C列聯(lián)表資料,可以選用的統(tǒng)計(jì)方法有秩和檢驗(yàn)、Ridit分析或Logistic回歸分析等。(2)希望考察年齡與療效之間是否存在線性相關(guān)關(guān)系,此時(shí)可以選用處理定性資料的相關(guān)分析方法,通常采用Spearman秩相關(guān)分析方法(見下頁)。(3)若兩個(gè)有序變量之間的相關(guān)關(guān)系有統(tǒng)計(jì)學(xué)意義,希望進(jìn)一步知道兩者之間的變化關(guān)系是呈直線關(guān)系還是呈某種曲線關(guān)系,此時(shí)宜選用線性趨勢(shì)檢驗(yàn)。(4)若僅希望考察R×C表各行上頻數(shù)分布是否相同,此時(shí)可以選用一般的卡方檢驗(yàn)或Fisher‘s精確檢驗(yàn)法。

利用SPSS進(jìn)行Spearman相關(guān)分析,分析→相關(guān)→雙變量…41數(shù)據(jù)格式分析結(jié)果相關(guān)分析對(duì)話框II當(dāng)兩變量屬性相同時(shí),稱這樣的列聯(lián)表資料為雙向有序且屬性相同的R×C列聯(lián)表資料。42

左側(cè)兩組資料都希望回答兩種方法結(jié)果是否具有一致性的問題,這其實(shí)是配對(duì)四格表資料的擴(kuò)展,只不過,在處理配對(duì)四格表資料時(shí),人們更關(guān)心兩種檢測(cè)方法的檢測(cè)結(jié)果不一致部分的數(shù)量之間的差別是否具有統(tǒng)計(jì)學(xué)意義,而在處理此類資料時(shí),更關(guān)心的是兩種檢測(cè)方法檢測(cè)結(jié)果之間是否具有一致性,常用一致性檢驗(yàn)(或稱Kappa檢驗(yàn))方法。4344此時(shí)可以使用Spearman相關(guān)分析或用有序變量的Logistic回歸分析方法進(jìn)行分析。如研究收入水平對(duì)一個(gè)人自感健康狀況(很好、好、一般、不好、很不好)的影響。在SPSS中的分析過程同上,此處不再詳細(xì)介紹。45等級(jí)變量與定量變量之間的關(guān)系分析

兩定量變量之間的關(guān)系分析可以做相關(guān)分析或回歸分析,分析兩個(gè)變量之間的相關(guān)性或依賴性。小結(jié)資料類型:

定性(無序多分類、二分類)

等級(jí)(有序)

定量

分析方法:

卡方檢驗(yàn):定性T檢驗(yàn):兩組,定量

方差分析:>=三組,定量Wilcoxon:兩組,等級(jí)、定量Kruskal-wallis:>=三組,等級(jí)、定量

相關(guān)分析:等級(jí)(kendall),非正態(tài)、定量(spearman)

正態(tài)、定量:pearson相關(guān)分析46多選題的兩種形式:47多選題分析

第一種形式:

您認(rèn)為健康的生活方式包括哪些內(nèi)容:

a.戒煙、限酒b.平衡膳食c.心胸開闊

d.多吃保健品、營養(yǎng)品e.控制體重f.多吃多睡

g.經(jīng)常運(yùn)動(dòng)h.不知道第二種形式:

對(duì)公眾進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論