橫斷面研究的數(shù)據(jù)分析策略與技巧_第1頁
橫斷面研究的數(shù)據(jù)分析策略與技巧_第2頁
橫斷面研究的數(shù)據(jù)分析策略與技巧_第3頁
橫斷面研究的數(shù)據(jù)分析策略與技巧_第4頁
橫斷面研究的數(shù)據(jù)分析策略與技巧_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

杜佳敏北京大學護理學碩士 荷蘭格羅寧根大學博士橫斷面研究的數(shù)據(jù)分析策略與技巧目錄臨床研究分類數(shù)據(jù)預處理描述性分析單因素分析——相關分析——T檢驗——單因素方差分析——卡方檢驗多因素分析臨床研究量性研究觀察性研究橫斷面研究病例對照研究隊列研究暴露和結(jié)局信息采集順序?qū)嶒炐匝芯侩S機對照實驗RCT類實驗研究隨機分組;對照組是否干預質(zhì)性研究臨床研究分類橫斷面研究一個時間截面,暴露和結(jié)局都包含(不能斷定因果關系)病例對照研究先有結(jié)局,回溯暴露隊列研究先有暴露,追蹤結(jié)局臨床研究分類數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)清洗:高質(zhì)量數(shù)據(jù)邏輯排查缺失值異常值刪除不相關變量SPSS變量視圖Type類型Values數(shù)值Measure測量數(shù)據(jù)變換反向計分題:重新計分計算新變量:量表總分變量類型變換:連續(xù)變量——分類變量轉(zhuǎn)換數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)清洗判斷問卷質(zhì)量(反向計分題、答題時間、固定答案)題目前后矛盾邏輯排查刪除存在缺失值的個案(缺失題項過多15%~20%)缺失值插補(僅計量資料)缺失值與原始問卷核對當作缺失值處理異常值問卷編號不相關量表刪除不相關變量數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理SPSS變量視圖數(shù)值(N)字符串(R)Type類型分類變量賦值:1=女;2=男Values數(shù)值變量類型:度量Scale、名義Nominal、有序OrdinalMeasure測量數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理SPSS變量視圖數(shù)值(N)字符串(R)Type類型分類變量賦值:1=女;2=男Values數(shù)值變量類型:度量Scale、名義Nominal、有序OrdinalMeasure測量數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理SPSS變量視圖數(shù)值(N)字符串(R)Type類型分類變量賦值:1=女;2=男Values數(shù)值變量類型:度量Scale、名義Nominal、有序OrdinalMeasure測量數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理SPSS變量視圖數(shù)值(N)字符串(R)Type類型分類變量賦值:1=女;2=男Values數(shù)值變量類型:度量Scale、名義Nominal、有序OrdinalMeasure測量數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理SPSS變量視圖數(shù)值(N)字符串(R)Type類型分類變量賦值:1=女;2=男Values數(shù)值變量類型:度量Scale、名義Nominal、有序OrdinalMeasure測量數(shù)據(jù)分析-變量類型變量類型計量資料/連續(xù)變量連續(xù)變量身高、體重離散變量接診人數(shù)計數(shù)資料/分類變量有序分類變量疾病嚴重程度:輕、中、重無序分類變量血型:A、B、O、AB數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)變換重新計分[轉(zhuǎn)換(T)]—[重新編碼為不同變量(R)]反向計分題量表總分[轉(zhuǎn)換(T)]—[計算變量(C)]計算新變量連續(xù)變量 分類變量轉(zhuǎn)換操作類似“重新計分”變量類型變換數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)變換重新計分[轉(zhuǎn)換(T)]—[重新編碼為不同變量(R)]反向計分題量表總分[轉(zhuǎn)換(T)]—[計算變量(C)]計算新變量連續(xù)變量 分類變量轉(zhuǎn)換操作類似“重新計分”變量類型變換數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)變換重新計分[轉(zhuǎn)換(T)]—[重新編碼為不同變量(R)]反向計分題量表總分[轉(zhuǎn)換(T)]—[計算變量(C)]計算新變量連續(xù)變量 分類變量轉(zhuǎn)換操作類似“重新計分”變量類型變換數(shù)據(jù)分析-數(shù)據(jù)清洗與預處理數(shù)據(jù)變換重新計分[轉(zhuǎn)換(T)]—[重新編碼為不同變量(R)]反向計分題量表總分[轉(zhuǎn)換(T)]—[計算變量(C)]計算新變量連續(xù)變量 分類變量轉(zhuǎn)換操作類似“重新計分”變量類型變換數(shù)據(jù)分析-分析順序統(tǒng)計描述:集中趨勢離散趨勢描述性分析統(tǒng)計推斷:假設H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;H1:樣本與總體或樣本與樣本間存在本質(zhì)差異統(tǒng)計指標顯著性檢驗

P值;顯著性水平

0.05或0.01單因素分析 多因素分析兩變量多變量數(shù)據(jù)分析-描述性分析集中趨勢:平均值、中位數(shù)和眾數(shù)離散趨勢:全距、方差(離均差)、標準差、四分位數(shù)、四分位數(shù)間距、變異系數(shù)正態(tài)分布:峰度、偏度;直方圖、P-P圖、Q-Q圖;正態(tài)性檢驗連續(xù)變量頻數(shù),百分比分類變量集中趨勢離散趨勢正態(tài)均數(shù)標準差偏態(tài)中位數(shù)四分位數(shù)(P25,

P75)數(shù)據(jù)分析-描述性分析-分類變量數(shù)據(jù)分析-描述性分析-連續(xù)變量數(shù)據(jù)分析-描述性分析-連續(xù)變量平均值中位數(shù)標準差偏度峰度四分位數(shù)數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布偏度峰度圖片引自“醫(yī)咖會”當偏度≈0時,可認為分布是對稱的,服從正態(tài)分布;當偏度>0時,為正偏態(tài),拖尾在右邊,分布為右偏;當偏度<0時,稱為負偏態(tài),拖尾在左邊,分布為左偏。Tip:

數(shù)據(jù)分布的左偏或右偏,指的是數(shù)值拖尾的方向,而不是峰的位置。數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布偏度峰度圖片引自“醫(yī)咖會”當峰度≈0時,可認為分布的峰態(tài)合適,服從正態(tài)分布(不胖不瘦);當峰度>0時,分布的峰態(tài)陡峭(高尖)

,尖峭峰;當峰度<0時,分布的峰態(tài)平緩(矮胖),平闊峰。數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布偏度峰度適用于小樣本量數(shù)據(jù)的正態(tài)性判斷正態(tài)性檢驗1.計算偏度和峰度的Z評分(Z-score)偏度Z-score

=

偏度值/偏度值的標準誤峰度Z-score

=

峰度值

/峰度值的標準誤2.兩個Z-score均在±1.96之間,則數(shù)據(jù)服從正態(tài)分布數(shù)據(jù)分析-描述性分析-連續(xù)變量偏度峰度平均值中位數(shù)標準差四分位數(shù)=11.065正態(tài)分布直方圖+正態(tài)分布曲線P-P圖Q-Q圖正態(tài)性檢驗性質(zhì)為“非參數(shù)檢驗”H0=為“樣本來自的總體與正態(tài)分布無顯著性差異,即符合正態(tài)分布”,接受H0

假設則數(shù)據(jù)符合正態(tài)分布,所以P>0.05。Shapiro-Wilk檢驗,樣本量≤5000Kolmogorov–Smirnov檢驗,樣本量>5000數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布輸出:年齡的統(tǒng)計描述指標(峰度偏度信息),正態(tài)性檢驗,直方圖,Q-Q圖數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布輸出:年齡的統(tǒng)計描述指標(峰度偏度信息),正態(tài)性檢驗,直方圖,Q-Q圖數(shù)據(jù)分析-描述性分析-連續(xù)變量正態(tài)分布P-P

圖數(shù)據(jù)分析-描述性分析-連續(xù)變量數(shù)據(jù)分析-分析順序統(tǒng)計推斷:假設H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;H1:樣本與總體或樣本與樣本間存在本質(zhì)差異統(tǒng)計指標顯著性檢驗

P值;顯著性水平

0.05或0.01描述性分析多因素分析多變量單因素分析兩變量數(shù)據(jù)分析-單因素分析1.幾個變量?2.各變量的變量類型?連續(xù)變量二分類變量無序多分類變量有序多分類變量連續(xù)變量二分類變量無序多分類變量有序多分類變量連續(xù)變量Pearson相關分析Spearman相關分析*獨立樣本T檢驗方差分析Kendall’stau-b相關分析二分類變量獨立樣本T檢驗卡方檢驗Fisher精確檢驗卡方檢驗Fisher精確檢驗Mann-Whitney

U檢驗無序多分類變量單因素方差分析卡方檢驗Fisher精確檢驗卡方檢驗Fisher精確檢驗Kruskal-WallisH

檢驗有序多分類變量Kendall’s

tau-b相關分析Mann-Whitney

U檢驗Kruskal-WallisH

檢驗Kendall’stau-b相關分析滿足:1.

各組具有獨立性;2.

*連續(xù)變量不滿足正態(tài)分布時在SPSS中[分析]中的位置:描述分析:列聯(lián)表(卡方檢驗,F(xiàn)isher精確檢驗)比較均值:3種T檢驗,單因素方差分析相關性-兩因素相關分析:Pearson,

Spearman,

Kendall’s

tau-b非參數(shù)檢驗-舊對話框:2獨立樣本(2組):Mann-Whitney

U

檢驗k獨立樣本(多組)

:Kruskal-Wallis

H

檢驗數(shù)據(jù)分析-單因素分析:相關分析Kendall等級相關系數(shù)反映分類變量相關性適用于兩個變量均為有序分類變量的情況Spearman秩相關系數(shù)變量間存在單調(diào)關系對原始變量的分布不做要求,屬于非參數(shù)統(tǒng)計檢驗效能較Pearson系數(shù)低Pearson積差相關系數(shù)線性相關(散點圖)兩變量均為連續(xù)變量,且滿足正態(tài)分布數(shù)據(jù)分析-單因素分析:積差相關分析適用條件兩變量線性相關;自變量和結(jié)局變量均為正態(tài)分布的連續(xù)變量統(tǒng)計量

P值3.SPSS操作程序與結(jié)果解讀P值差異是否達到顯著?P?0.05

表示兩變量的相關達到顯著,即不是偶然造成的,具有統(tǒng)計學意義統(tǒng)計量相關系數(shù)

r取值范圍-1至+1正負:相關性的方向,正為正相關,負為負相關絕對值大?。悍磻P聯(lián)程度強弱相關系數(shù)絕對值|r|關聯(lián)程度決定系數(shù)

R2r?

0.04弱相關R2?

0.040.04≤r

≤0.07中度相關0.04≤R2

≤0.07r

?0.07強相關R2

?0.07Tip:

Y

的總變異量中可以被

X解釋的變異量的百分比數(shù)據(jù)分析-單因素分析:積差相關分析SPSS操作程序與結(jié)果解讀膽固醇濃度(mmol/L)與久坐時間((mins/day))是否有關?檢測兩變量是否符合正態(tài)分布檢測兩變量是否為線性關系(散點圖)積差相關分析數(shù)據(jù)分析-單因素分析:積差相關分析SPSS操作程序與結(jié)果解讀膽固醇濃度(mmol/L)與久坐時間((mins/day))是否有關?檢測兩變量是否符合正態(tài)分布檢測兩變量是否為線性關系(散點圖)積差相關分析數(shù)據(jù)分析-單因素分析:積差相關分析SPSS操作程序與結(jié)果解讀膽固醇濃度(mmol/L)與久坐時間((mins/day))是否有關?檢測兩變量是否符合正態(tài)分布檢測兩變量是否為線性關系(散點圖)積差相關分析數(shù)據(jù)分析-單因素分析:積差相關分析SPSS操作程序與結(jié)果解讀膽固醇濃度(mmol/L)與久坐時間((mins/day))是否有關?檢測兩變量是否符合正態(tài)分布檢測兩變量是否為線性關系(散點圖)積差相關分析數(shù)據(jù)分析-單因素分析:積差相關分析久坐時間和膽固醇濃度兩變量呈顯著正相關關系,Pearson相關系數(shù)r=0.791,P<0.001,兩者關聯(lián)程度為強相關。R2為0.626,表示久坐時間可以解釋膽固醇濃度總變異的62.6。SPSS操作程序與結(jié)果解讀膽固醇濃度(mmol/L)與久坐時間((mins/day))是否有關?檢測兩變量是否符合正態(tài)分布檢測兩變量是否為線性關系(散點圖)積差相關分析數(shù)據(jù)分析-單因素分析:T檢驗單樣本T檢驗比較樣本均數(shù)μ和已知總體均數(shù)μ0配對樣本T檢驗配對配對資料的差值基本符合正態(tài)分布獨立樣本T檢驗組間獨立兩組均符合正態(tài)分布兩組數(shù)據(jù)方差齊數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗適用條件組間獨立兩組數(shù)據(jù)均為正態(tài)分布兩組樣本均數(shù)方差齊統(tǒng)計量

P值統(tǒng)計量

t值P值SPSS操作程序與結(jié)果解讀3.SPSS操作程序與結(jié)果解讀——不同性別運動員感受到的社會支持力度是否存在顯著性差異?組間獨立:根據(jù)研究設計判斷正態(tài)分布:正態(tài)性檢驗數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗3.SPSS操作程序與結(jié)果解讀——不同性別運動員感受到的社會支持力度是否存在顯著性差異?數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗方差同質(zhì)性檢驗:P?0.05

方差齊,看第一行;P≤0.05方差不齊,看第二行t值和

P值3.SPSS操作程序與結(jié)果解讀——不同性別運動員感受到的社會支持力度是否存在顯著性差異?數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗方差同質(zhì)性檢驗:P?0.05

方差齊,看第一行;P≤0.05方差不齊,看第二行t值和

P值3.SPSS操作程序與結(jié)果解讀——不同性別運動員感受到的社會支持力度是否存在顯著性差異?數(shù)據(jù)分析-單因素分析:獨立樣本T檢驗不同性別群體中“社會支持”差異比較,t值為2.368,P=0.025?0.05。表示男性和女性的社會支持存在顯著性差異,男性的社會支持感受顯著高于女性的社會支持感受。3.SPSS操作程序與結(jié)果解讀——不同性別運動員感受到的社會支持力度是否存在顯著性差異?數(shù)據(jù)分析-單因素分析:單因素方差分析適用條件組間獨立各組數(shù)據(jù)均為正態(tài)分布各組樣本均數(shù)方差齊兩兩間差異比較需要通過“多重兩兩比較”統(tǒng)計量

P值統(tǒng)計量

F值P值SPSS操作程序與結(jié)果解讀數(shù)據(jù)分析-單因素分析:方差分析3.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?在本案例中,年齡段為三分類變量25歲以下=1;26-30歲=231歲以上=3數(shù)據(jù)分析-單因素分析:方差分析3.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?在本案例中,年齡段為三分類變量25歲以下=1;26-30歲=231歲以上=3事后多重比較數(shù)據(jù)分析-單因素分析:方差分析3.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?在本案例中,年齡段為三分類變量25歲以下=1;26-30歲=231歲以上=33.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?數(shù)據(jù)分析-單因素分析:單因素方差分析3.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?數(shù)據(jù)分析-單因素分析:單因素方差分析方差同質(zhì)性檢驗P=0.405>

0.05不能拒絕H0假設,方差齊3.SPSS操作程序與結(jié)果解讀——不同年齡段的運動員的生活壓力是否不同?數(shù)據(jù)分析-單因素分析:單因素方差分析平均差異值-8.429,

表示25歲以下年齡段運動員的生活壓力得分比26-30歲年齡段運動員的低。(第一組

第二組)P=0.024

?0.05

差異具有顯著性,*也反應差異具有顯著性。數(shù)據(jù)分析-單因素分析:卡方檢驗χ2檢驗是基于χ2分布的一種假設檢驗,實際觀測數(shù)和理論頻數(shù)偏離程度。適用條件兩變量均為分類變量(二分類/無序多分類)兩變量具有獨立性樣本量要求,任一單元格期望頻數(shù)?5統(tǒng)計量

P值交叉表格統(tǒng)計量

χ2值P值SPSS操作程序與結(jié)果解讀——血型與職業(yè)類型的關系?血型:A、B、AB、O,共4種職業(yè):律師、醫(yī)生、教師、工人,共4種此案例引自“醫(yī)咖會”數(shù)據(jù)分析-單因素分析:卡方檢驗3.SPSS操作程序與結(jié)果解讀——血型與職業(yè)類型的關系?數(shù)據(jù)分析-單因素分析:卡方檢驗3.SPSS操作程序與結(jié)果解讀——血型與職業(yè)類型的關系?本研究最小的期望頻數(shù)是8.4,大于5。說明具有足夠的樣本量,可以進行卡方檢驗。數(shù)據(jù)分析-單因素分析:卡方檢驗3.SPSS操作程序與結(jié)果解讀——血型與職業(yè)類型的關系?0個表格的期望頻數(shù)小于5,最小期望頻數(shù)為8.43卡方檢驗(R×C)結(jié)果顯示χ2=42.959,P<

0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論