版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
描述性統(tǒng)計分析與t檢驗流行病與衛(wèi)生統(tǒng)計學系教研室研究生:周洋1A教學目的掌握各集中趨勢指標與離散趨勢指標的意義和應(yīng)用;掌握在SPSS上對資料進行描述性統(tǒng)計分析;掌握在SPSS上對資料進行正態(tài)性檢驗和方差齊性檢驗;
掌握t檢驗的應(yīng)用條件及常用的檢驗方法。2A統(tǒng)計描述
統(tǒng)計學分析主要有兩個方面,一方面是統(tǒng)計描述,另一方面是統(tǒng)計推斷。統(tǒng)計描述是指用統(tǒng)計指標和適當?shù)慕y(tǒng)計圖表來描述資料的分布規(guī)律及其數(shù)量特征。通過描述性統(tǒng)計分析可以初步掌握數(shù)據(jù)的基本統(tǒng)計學特征,為采用其他統(tǒng)計學分析方法打下基礎(chǔ),為進一步進行統(tǒng)計學分析提供依據(jù)。
統(tǒng)計學描述的基本方法有數(shù)據(jù)頻數(shù)分布特征描述、集中趨勢值和離散趨勢值的計算等。3A資料分類
針對不同的資料類型,采用的統(tǒng)計學描述方法也不同。
那么,常見的資料類型有哪些呢?
資料類型計量資料計數(shù)資料等級資料4A資料分類計量資料:可分為連續(xù)型和離散型,是指對每個觀察對象的觀察指標用定量方法測定其數(shù)值大小所得,一般帶有度量衡單位。例如:血壓值、身高、體重等。
計數(shù)資料:可分為二分類和多分類,是指將觀察對象的觀察指標按性質(zhì)或類別進行分組,然后計數(shù)各組的數(shù)目所得。(注意:二分類變量兩個分類之間相互對立,互不相容;而多分類變量是互不相容的幾個類別。)例如:某種疾病在個體中,發(fā)病或者不發(fā)病。
等級資料:是指按照觀察對象的某種屬性或者特征進行分類,但是這些分類之間本身具有強弱、輕重、大小程度的區(qū)分。例如:某治療方法療效,可以是治愈、顯效、好轉(zhuǎn)和無效。5A頻率分布表與頻率分布圖頻率表和頻率分布圖是常用的綜合描述樣本資料的方式。頻率分布圖能夠直觀地以圖形的方式顯示樣本數(shù)據(jù)的分布情況。對于計量資料,頻率表可以提示資料的分布特征,描述資料的集中趨勢和離散趨勢,便于發(fā)現(xiàn)特大或特小的可疑值。對于計數(shù)資料,頻率表可以清楚的顯示各個分類的數(shù)量或頻率;6A
算術(shù)均數(shù)(Mean)
幾何均數(shù)(GeometricMean)
中位數(shù)(Median)眾數(shù)(Mode)
計量資料的統(tǒng)計描述集中趨勢統(tǒng)計指標7A
極差(Range)
四分位數(shù)間距(Quartilerange)
方差(Variance)
標準差(StandardDeviation)
變異系數(shù)(Coefficientofvariation)
計量資料的統(tǒng)計描述離散趨勢統(tǒng)計指標8Aspss操作過程在spss中,統(tǒng)計學描述主要采用AnalyzeDescriptiveStatistic菜單完成,該菜單下的子菜單對應(yīng)于不同的統(tǒng)計學描述過程。Analyze
DescriptiveStatisticDescriptivesExploreFrequencies
9AFrequencies操作過程
Frequencies:頻數(shù)表過程的主要功能是編制頻數(shù)表,計算描述統(tǒng)計量包含的百分位數(shù),統(tǒng)計圖。利用它能產(chǎn)生原始數(shù)據(jù)的詳細頻數(shù),取值結(jié)果還能用于數(shù)據(jù)清理。10AFrequencies操作過程實例1:某年抽樣調(diào)查某地120名18--35歲健康男性居民血清鐵含量(umol/L),請大家利用spss軟件進行統(tǒng)計性描述。11AFrequencies操作過程統(tǒng)計量統(tǒng)計圖輸入格式可選變量表分析變量表輸出頻數(shù)表一種抽樣填補缺失值的方法,暫時不用。12AFrequencies操作過程
Statistics:設(shè)定要分析的統(tǒng)計量百分位數(shù)集中趨勢統(tǒng)計量離散統(tǒng)計量分布參數(shù)13AFrequencies操作過程
Charts:設(shè)定要繪制的統(tǒng)計圖14AFrequencies結(jié)果分析15AFrequencies結(jié)果分析Distribution計算分布參數(shù)Skewness偏度系數(shù):理論上偏度系數(shù)為0時對稱分布,取正值為正偏峰,取負值為負偏峰。Kurtosis峰度系數(shù):正態(tài)分布峰度系數(shù)為0;取正值時分布峰尖陡峭,取負值時峰平闊。
由偏度系數(shù)與峰度系數(shù)來判斷資料是否屬于正態(tài)分布。大家都知道,標準正態(tài)分布曲線下Z值在(-1.96,+1.96)之間的時候,曲線下面積為0.95。對于偏度系數(shù),Z=偏度系數(shù)/偏態(tài)系數(shù)的標準誤;峰度系數(shù)Z=峰度系數(shù)/峰度系數(shù)的標準誤。由此結(jié)果得知,偏度系數(shù)=-0.194,偏度系數(shù)標準誤=0.221,Z=-0.194/0.221=-0.878(P=0.3788);峰度系數(shù)=-0.018,峰度系數(shù)標準誤=0.438,Z=-0.018/0.438=-0.041(P=0.968)。結(jié)合兩個結(jié)果,可以認為該資料服從正態(tài)分布。16AFrequencies結(jié)果分析Frequency:頻數(shù)Percent:百分比=當前頻數(shù)/總數(shù)(包括缺失值)ValidPercent:有效百分比=當前頻數(shù)/有效總數(shù)(不包括缺失值)CumulativePercent:累積百分比=累積頻數(shù)/有效總數(shù)(不包括缺失值)17AFrequencies結(jié)果分析18AFrequencies實戰(zhàn)演練試分析實例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習1.sav)。19ADescriptives操作過程
Descriptives:主要用于描述統(tǒng)計量計算和變量標準化,與Frequencies過程相比,其統(tǒng)計量不能計算百分位數(shù),也不能繪制統(tǒng)計圖。20ADescriptives操作過程實例1:某年抽樣調(diào)查某地120名18--35歲健康男性居民血清鐵含量(umol/L),請大家利用spss軟件進行統(tǒng)計性描述。21ADescriptives操作過程該界面類似于Frequencies的界面,其中Savestandardizedvaluesasvariables是指將標準化得分另存為變量(Z)。22ADescriptives操作過程選項說明DisplayOrder定義頻數(shù)表中值的排列順序Variablelist按變量表中的順序輸出結(jié)果,默認Alphabetic按字母順序排列變量的輸出順序Ascendingmeans按均數(shù)從小到大排列變量的輸出順序Descendingmeans按均數(shù)從大到小排列變量的輸出順序23ADescriptives結(jié)果分析該資料一共120個有效數(shù)據(jù),無缺失值。血清含量的最小值為7.42,最大值為29.64,均數(shù)18.6136,標準差4.3432,方差為18.863,偏度系數(shù)=-0.194,偏度系數(shù)標準誤=0.221,Z=-0.194/0.221=-0.878(P=0.3788);峰度系數(shù)=-0.018,峰度系數(shù)標準誤=0.438,Z=-0.018/0.438=0.041(P=0.968)。結(jié)合兩個結(jié)果,可以認為該資料服從正態(tài)分布。24ADescriptives實戰(zhàn)演練試分析實例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習1.sav)。25AExplore操作過程Explore:探索性分析使用圖形、描述統(tǒng)計量的方法來探索數(shù)據(jù)的分布特征,主要適用于連續(xù)性資料。主要功能有:分離特異值、離群值;繪制多種統(tǒng)計分布圖,觀察其分布特征;描述統(tǒng)計量的計算,包括文件統(tǒng)計量的估計;特定分布特征的假設(shè)檢驗;百分位數(shù)的估算。26AExplore操作過程實例2,對照資料中不同性別(XB)的身高(SG)進行分別描述。27AExplore操作過程要進行分析的應(yīng)變量:身高分類變量:性別28AExplore操作過程選項說明Descriptives輸出描述統(tǒng)計量,默認ConfidenceintervalforMean:95%計算均數(shù)的95%置信區(qū)間,默認M-estimators描述平均水平,其意義同均數(shù)和中位數(shù)Outliers列出極端值,即最大和最小的各五個數(shù)據(jù)Percentiles輸出5%、10%、25%、50%、75%、90%、95%的百分位數(shù)29AExplore操作過程箱式圖以分組變量繪圖分析變量一起繪圖莖葉圖直方圖正態(tài)概率圖和正態(tài)性檢驗離散水平圖,Levene方差齊性檢驗不繪圖冪轉(zhuǎn)換不轉(zhuǎn)換用冪轉(zhuǎn)換進行數(shù)據(jù)轉(zhuǎn)換30AExplore操作過程缺失值設(shè)置,一般選擇默認。按觀察個體排除缺失值將缺失值單獨列成一組成對排除缺失值31AExplore結(jié)果分析缺失值報告:本例沒有缺失值,男性有效人數(shù)為29人,女性有效人數(shù)為77人。32AExplore結(jié)果分析探索性分析的統(tǒng)計描述跟前面兩種分析的統(tǒng)計描述相似,需要注意的是95%ConfidenceintervalforMean(LowerRound/UpperRound)指的是95%可信區(qū)間上限/下限;5%TrimmedMean指的是5%調(diào)整均數(shù),去掉最大和最小各5%的數(shù)據(jù)后的均數(shù);InterquartileRange指的是四分位數(shù)間距。33AExplore結(jié)果分析極端值列表:分別列出男性女性的最高與最低的五組數(shù)據(jù),其中CaseNumber指的是極端值所在的編碼,Value指的是具體的數(shù)值34AExplore結(jié)果分析上圖是按性別不同對身高進行的正態(tài)性檢驗,給出兩種方法的結(jié)果:Kolmogorov-Smirnov檢驗和Shapiro-Wilk檢驗。其中,Statistic為統(tǒng)計量;df為自由度;sig.為P值。經(jīng)檢驗,男組兩組P值均小于0.05,所以拒絕正態(tài)分析的假設(shè),尚不能認為男組呈正態(tài)分布。而女組Kolmogorov-Smirnov檢驗中p值小于0.05,Shapiro-Wilk檢驗p值大于0.05,應(yīng)該再參考別的方法判定女組是否呈正態(tài)分布。35AExplore結(jié)果分析上圖是對按性別不同對身高進行的方差齊性檢驗,采用了四種方法計算統(tǒng)計量:BasedonMean(基于均數(shù)的統(tǒng)計量)、BasedonMedian(基于中位數(shù)的統(tǒng)計量)、BasedonMedianandwithadjusteddf(基于中位數(shù)并調(diào)整自由度的統(tǒng)計量)、BasedontrimmedMean(基于調(diào)整均數(shù)的統(tǒng)計量)。Df1是分子自由度、df2為分母自由度。經(jīng)檢驗,上述四種方法的計算出的P值均大于0.05,不拒絕零假設(shè),可以認為兩組總體方差相同。36AExplore結(jié)果分析由上直方圖可以看出,男組明顯不是正態(tài)分布,女組與正態(tài)分布相近。37A正態(tài)性檢驗
圖示法主要采用概率圖(Probability-probabilityPlot,P-P圖)和分位數(shù)圖(Quantile-quantilePlot,Q-Q圖)。其中,P-P圖是以樣本的累計頻率作為橫坐標,以按照正態(tài)分布計算的相應(yīng)累計概率作為縱坐標,把樣本值表現(xiàn)為直角坐標系中的散點。如果資料服從正態(tài)分布,則樣本點應(yīng)該圍繞第一象限的對角線分布。Q-Q圖則是以樣本的分位數(shù)作為橫坐標,以按照正態(tài)分布計算的相應(yīng)分位數(shù)作為縱坐標,把樣本表現(xiàn)為直角坐標系的散點。如果資料服從正態(tài)分布,則樣本點應(yīng)該呈一條圍繞第一象限對角線的直線。這兩種方法中,以Q-Q圖法的效率較高。38A圖中的直線是正態(tài)分布的標準參考線,散點越接近這條直線,則該變量的分布越接近正態(tài)分布。本例中可以看出女生的散點更接近標準參考線,說明女性更接近于正態(tài)分布。39AExplore結(jié)果分析莖葉圖40AExplore結(jié)果分析莖葉圖結(jié)果分析:兩莖葉圖的莖寬(StemWidth)是10,莖葉圖從左至右分別為頻數(shù)(Frequency)、莖(Stem)及葉(Leaf):莖表示變量值的整數(shù)部分,葉表示變量值的小數(shù)部分,每行的莖和每一個葉組成的數(shù)值相加后再乘以莖寬,就是莖葉所表示的實際數(shù)據(jù)的近似值。例如:性別為1的第三行,在這個變量值下頻數(shù)為4,莖為11,這行葉的組成是6789,它表示在這一行的六個變量值大約是116,117,118,119.41AExplore結(jié)果分析42AExplore結(jié)果分析箱式圖結(jié)果分析:男女生箱式圖中中間長方形的底部與頂部分別表示下四分位數(shù)(p25)和上四分位數(shù)(p75),中間的橫線代表它們各自的中位數(shù),箱式圖的上下柄分別代表最大值跟最小值。由上圖結(jié)果可以看出,女生組的最大值、上四分位數(shù)和下四分位數(shù)分別大于男生組,而中位數(shù)與最小值均小于男生組。43A對練習實例3中危重病人的APACHE評分及其預(yù)后情況進行探索性分析,了解不同預(yù)后情況的APACHE評分情況。(數(shù)據(jù)見練習.sav)。Explore實戰(zhàn)演練44A(1)隨機樣本;(2)來自正態(tài)分布總體;(3)兩小樣本均數(shù)比較時,要求兩總體方差相等(方差齊性)t檢驗應(yīng)用條件45A幾種不同資料的t檢驗1.單樣本t檢驗2.配對樣本t檢驗3.兩獨立樣本t檢驗46A單樣本t檢驗?zāi)康?推斷該樣本來自的總體均數(shù)與已知的某一總體均數(shù)有無差別。單樣本資料t檢驗實例:根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機調(diào)查了25名健康成年男子,其脈搏數(shù)分別為:73,76,71,64,68,69,66,73,72,71,70,70,72,66,69,67,67,70,72,71,73,74,73,72,76問該山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)?47A單樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準αH0:μ=μ0,即該山區(qū)成年男子的脈搏總體均數(shù)μ與一般成年男子脈搏總體均數(shù)μ0相等;H1:μ≠μ0(包括μ>μ0與μ<μ0);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量48A單樣本t檢驗AnalyzeCompareMeans
One-sampleTTest49A單樣本t檢驗50A
NMeanStd.DeviationStd.ErrorMean脈搏2570.60003.06866.61373單樣本t檢驗One-SampleStatistics由上表知,樣本量為25,樣本均數(shù)為70.6000,標準差為3.06866,標準誤為0.6137351A單樣本t檢驗
One-SampleTest
TestValue=72tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper脈搏-2.28124.032-1.4000-2.6667-.1333
由上表可知,已知檢驗值為72.t值=-2.281,df=24,P=0.032(雙側(cè)),差異有統(tǒng)計學意義,可認為該山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)。樣本均數(shù)與總體均數(shù)之差為-1.4000,差值的95%可信區(qū)間為(-2.6667,-0.0.1333),不包含0,亦說明兩者間差異有統(tǒng)計學意義52A配對樣本t檢驗配對t檢驗適用于配對設(shè)計的計量資料。配對設(shè)計是將受試對象按照某些重要特征(可疑混雜因素)配成對子,每對的兩個受試對象隨機分配到兩處理組。配對設(shè)計類型:①兩同質(zhì)受試對象分別接受兩種不同的處理;②同一受試對象分別接受兩種不同處理;③同一受試對象(一種)處理前后的數(shù)據(jù)。53A配對樣本t檢驗例6-2為了研究孿生兄弟的出生體重是否與其出生順序有關(guān),共收集了15對孿生兄弟的出生順序和出生體重,見表6-2。試問孿生兄弟中先出生者的出生體重與后出生者的出生體重是否相同?54A配對樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準αH0:μd=0,即每對孿生兄弟體重差值d所對應(yīng)的總體均數(shù)μd來自均數(shù)為0的正態(tài)總體;H1:μd≠0(包括μd>0與μd<0
);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量55A配對樣本t檢驗編號先出生者體重后出生者體重差值12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50—0.0263.232.930.3072.272.240.0382.482.55—0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20—0.11142.982.920.06152.652.600.0556A配對樣本t檢驗Analyze
CompareMeans
Paired-SamplesTTest57A配對樣本t檢驗58A配對樣本t檢驗PairedSamplesStatistics
MeanNStd.DeviationStd.ErrorMeanPair1先出生者2.945315.40516.10461后出生者2.882715.40922.10566
PairedSamplesCorrelations
NCorrelationSig.Pair1先出生者&后出生者15.967.00059A配對樣本t檢驗PairedSamplesTest
PairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1先出生者-后出生者.0627.10430.02693.0049.12042.32714.035先出生者與后出生者的體重有顯著差異(t=2.327,df=14,P=0.035),其差值的均數(shù)為0.0627,標準差為0.10420,標準誤為0.02693。60A兩獨立樣本t檢驗適用于完全隨機設(shè)計兩樣本均數(shù)的比較,通過樣本信息推斷所屬的兩總體均數(shù)是否相等。兩組完全隨機設(shè)計是將同質(zhì)的受試對象完全隨機分配到兩個不同處理組。當兩樣本含量較小時,且均來自正態(tài)總體時,要根據(jù)兩總體方差是否相等而采用不同的檢驗方法。61A兩獨立樣本t檢驗
兩獨立樣本資料的t檢驗實例:采用完全隨機設(shè)計的方法,將19只體重、出生日期等相仿的小白鼠隨機分為兩組,其中一組喂養(yǎng)高蛋白飼料,另一組喂養(yǎng)低蛋白飼料,然后觀察喂養(yǎng)8周后各小白鼠所增加體重(mg)情況,問兩組膳食對小白鼠增加體重有無不同?(數(shù)據(jù)見兩獨立樣本資料實例)62A兩獨立樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準αH0:μ1=μ2,即高蛋白組與低蛋白組所增體重的總體均數(shù)相同;H1:μ≠μ0,即高蛋白組與低蛋白組所增體重的總體均數(shù)不同(包括μ1>μ2與μ1<μ2);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量63A兩獨立樣本t檢驗經(jīng)檢驗,兩種檢驗方法兩組的P值均大于0.05,所以認為兩組均呈正態(tài)分布。64A兩獨立樣本t檢驗Analyze
Compa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024城市軌道交通建設(shè)投資合同
- 2024年專業(yè)四合院買賣雙方代理合同
- 2024年廣告投放合同 具體廣告內(nèi)容與投放渠道
- 2024年工程專業(yè)混凝土供應(yīng)與施工合同
- 2024年公司借入個人款項合同
- 2024年工程勞務(wù)分包總合同
- 2024年東莞市醫(yī)療健康服務(wù)合同
- 2024年多媒體平臺搭建與維護合同
- 2024勞動合同的解除與辭職規(guī)定合同
- 2024醫(yī)院藥品供應(yīng)鏈金融服務(wù)合同
- 高低壓電力系統(tǒng)預(yù)試驗及維保服務(wù)方案
- 濾波電路課件講解
- 2024-2030年國內(nèi)鋁合金鎖行業(yè)市場發(fā)展分析及發(fā)展前景與投資機會研究報告
- 冶金企業(yè)的冶煉生產(chǎn)計劃三篇
- 課題論文:推動發(fā)展培育新質(zhì)生產(chǎn)力
- 12G614-1 砌體填充墻結(jié)構(gòu)構(gòu)造
- 燃氣經(jīng)營安全重大隱患判定標準課件
- 小學一年級數(shù)學兩位數(shù)加減一位數(shù)競賽監(jiān)控模擬題
- CHT 8023-2011 機載激光雷達數(shù)據(jù)處理技術(shù)規(guī)范(正式版)
- 檢驗科進修匯報課件
- 年產(chǎn)10萬套新能源車電池托盤和儲能箱體項目可行性研究報告
評論
0/150
提交評論