統(tǒng)計描述與t檢驗SPSS應(yīng)用_第1頁
統(tǒng)計描述與t檢驗SPSS應(yīng)用_第2頁
統(tǒng)計描述與t檢驗SPSS應(yīng)用_第3頁
統(tǒng)計描述與t檢驗SPSS應(yīng)用_第4頁
統(tǒng)計描述與t檢驗SPSS應(yīng)用_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計描述與t檢驗SPSS應(yīng)用第1頁/共71頁描述性統(tǒng)計分析與t檢驗2第2頁/共71頁教學(xué)目的掌握各集中趨勢指標(biāo)與離散趨勢指標(biāo)的意義和應(yīng)用;掌握在SPSS上對資料進行描述性統(tǒng)計分析;掌握在SPSS上對資料進行正態(tài)性檢驗和方差齊性檢驗;

掌握t檢驗的應(yīng)用條件及常用的檢驗方法。3第3頁/共71頁統(tǒng)計描述

統(tǒng)計學(xué)分析主要有兩個方面,一方面是統(tǒng)計描述,另一方面是統(tǒng)計推斷。統(tǒng)計描述是指用統(tǒng)計指標(biāo)和適當(dāng)?shù)慕y(tǒng)計圖表來描述資料的分布規(guī)律及其數(shù)量特征。通過描述性統(tǒng)計分析可以初步掌握數(shù)據(jù)的基本統(tǒng)計學(xué)特征,為采用其他統(tǒng)計學(xué)分析方法打下基礎(chǔ),為進一步進行統(tǒng)計學(xué)分析提供依據(jù)。

統(tǒng)計學(xué)描述的基本方法有數(shù)據(jù)頻數(shù)分布特征描述、集中趨勢值和離散趨勢值的計算等。4第4頁/共71頁資料分類

針對不同的資料類型,采用的統(tǒng)計學(xué)描述方法也不同。

那么,常見的資料類型有哪些呢?

資料類型計量資料計數(shù)資料等級資料5第5頁/共71頁資料分類計量資料:可分為連續(xù)型和離散型,是指對每個觀察對象的觀察指標(biāo)用定量方法測定其數(shù)值大小所得,一般帶有度量衡單位。例如:血壓值、身高、體重等。

計數(shù)資料:可分為二分類和多分類,是指將觀察對象的觀察指標(biāo)按性質(zhì)或類別進行分組,然后計數(shù)各組的數(shù)目所得。(注意:二分類變量兩個分類之間相互對立,互不相容;而多分類變量是互不相容的幾個類別。)例如:某種疾病在個體中,發(fā)病或者不發(fā)病。

等級資料:是指按照觀察對象的某種屬性或者特征進行分類,但是這些分類之間本身具有強弱、輕重、大小程度的區(qū)分。例如:某治療方法療效,可以是治愈、顯效、好轉(zhuǎn)和無效。6第6頁/共71頁頻率分布表與頻率分布圖頻率表和頻率分布圖是常用的綜合描述樣本資料的方式。頻率分布圖能夠直觀地以圖形的方式顯示樣本數(shù)據(jù)的分布情況。對于計量資料,頻率表可以提示資料的分布特征,描述資料的集中趨勢和離散趨勢,便于發(fā)現(xiàn)特大或特小的可疑值。對于計數(shù)資料,頻率表可以清楚的顯示各個分類的數(shù)量或頻率;7第7頁/共71頁

算術(shù)均數(shù)(Mean)

幾何均數(shù)(GeometricMean)

中位數(shù)(Median)眾數(shù)(Mode)

計量資料的統(tǒng)計描述集中趨勢統(tǒng)計指標(biāo)8第8頁/共71頁

極差(Range)

四分位數(shù)間距(Quartilerange)

方差(Variance)

標(biāo)準(zhǔn)差(StandardDeviation)

變異系數(shù)(Coefficientofvariation)

計量資料的統(tǒng)計描述離散趨勢統(tǒng)計指標(biāo)9第9頁/共71頁spss操作過程在spss中,統(tǒng)計學(xué)描述主要采用AnalyzeDescriptiveStatistic菜單完成,該菜單下的子菜單對應(yīng)于不同的統(tǒng)計學(xué)描述過程。Analyze

DescriptiveStatisticDescriptivesExploreFrequencies

10第10頁/共71頁Frequencies操作過程

Frequencies:頻數(shù)表過程的主要功能是編制頻數(shù)表,計算描述統(tǒng)計量包含的百分位數(shù),統(tǒng)計圖。利用它能產(chǎn)生原始數(shù)據(jù)的詳細(xì)頻數(shù),取值結(jié)果還能用于數(shù)據(jù)清理。11第11頁/共71頁Frequencies操作過程實例1:某年抽樣調(diào)查某地120名18--35歲健康男性居民血清鐵含量(umol/L),請大家利用spss軟件進行統(tǒng)計性描述。12第12頁/共71頁Frequencies操作過程統(tǒng)計量統(tǒng)計圖輸入格式可選變量表分析變量表輸出頻數(shù)表一種抽樣填補缺失值的方法,暫時不用。13第13頁/共71頁Frequencies操作過程

Statistics:設(shè)定要分析的統(tǒng)計量百分位數(shù)集中趨勢統(tǒng)計量離散統(tǒng)計量分布參數(shù)14第14頁/共71頁Frequencies操作過程

Charts:設(shè)定要繪制的統(tǒng)計圖15第15頁/共71頁Frequencies結(jié)果分析16第16頁/共71頁Frequencies結(jié)果分析Distribution計算分布參數(shù)Skewness偏度系數(shù):理論上偏度系數(shù)為0時對稱分布,取正值為正偏峰,取負(fù)值為負(fù)偏峰。Kurtosis峰度系數(shù):正態(tài)分布峰度系數(shù)為0;取正值時分布峰尖陡峭,取負(fù)值時峰平闊。

由偏度系數(shù)與峰度系數(shù)來判斷資料是否屬于正態(tài)分布。大家都知道,標(biāo)準(zhǔn)正態(tài)分布曲線下Z值在(-1.96,+1.96)之間的時候,曲線下面積為0.95。對于偏度系數(shù),Z=偏度系數(shù)/偏態(tài)系數(shù)的標(biāo)準(zhǔn)誤;峰度系數(shù)Z=峰度系數(shù)/峰度系數(shù)的標(biāo)準(zhǔn)誤。由此結(jié)果得知,偏度系數(shù)=-0.194,偏度系數(shù)標(biāo)準(zhǔn)誤=0.221,Z=-0.194/0.221=-0.878(P=0.3788);峰度系數(shù)=-0.018,峰度系數(shù)標(biāo)準(zhǔn)誤=0.438,Z=-0.018/0.438=-0.041(P=0.968)。結(jié)合兩個結(jié)果,可以認(rèn)為該資料服從正態(tài)分布。17第17頁/共71頁Frequencies結(jié)果分析Frequency:頻數(shù)Percent:百分比=當(dāng)前頻數(shù)/總數(shù)(包括缺失值)ValidPercent:有效百分比=當(dāng)前頻數(shù)/有效總數(shù)(不包括缺失值)CumulativePercent:累積百分比=累積頻數(shù)/有效總數(shù)(不包括缺失值)18第18頁/共71頁Frequencies結(jié)果分析19第19頁/共71頁Frequencies實戰(zhàn)演練試分析實例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習(xí)1.sav)。20第20頁/共71頁Descriptives操作過程

Descriptives:主要用于描述統(tǒng)計量計算和變量標(biāo)準(zhǔn)化,與Frequencies過程相比,其統(tǒng)計量不能計算百分位數(shù),也不能繪制統(tǒng)計圖。21第21頁/共71頁Descriptives操作過程實例1:某年抽樣調(diào)查某地120名18--35歲健康男性居民血清鐵含量(umol/L),請大家利用spss軟件進行統(tǒng)計性描述。22第22頁/共71頁Descriptives操作過程該界面類似于Frequencies的界面,其中Savestandardizedvaluesasvariables是指將標(biāo)準(zhǔn)化得分另存為變量(Z)。23第23頁/共71頁Descriptives操作過程選項說明DisplayOrder定義頻數(shù)表中值的排列順序Variablelist按變量表中的順序輸出結(jié)果,默認(rèn)Alphabetic按字母順序排列變量的輸出順序Ascendingmeans按均數(shù)從小到大排列變量的輸出順序Descendingmeans按均數(shù)從大到小排列變量的輸出順序24第24頁/共71頁Descriptives結(jié)果分析該資料一共120個有效數(shù)據(jù),無缺失值。血清含量的最小值為7.42,最大值為29.64,均數(shù)18.6136,標(biāo)準(zhǔn)差4.3432,方差為18.863,偏度系數(shù)=-0.194,偏度系數(shù)標(biāo)準(zhǔn)誤=0.221,Z=-0.194/0.221=-0.878(P=0.3788);峰度系數(shù)=-0.018,峰度系數(shù)標(biāo)準(zhǔn)誤=0.438,Z=-0.018/0.438=0.041(P=0.968)。結(jié)合兩個結(jié)果,可以認(rèn)為該資料服從正態(tài)分布。25第25頁/共71頁Descriptives實戰(zhàn)演練試分析實例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習(xí)1.sav)。26第26頁/共71頁Explore操作過程Explore:探索性分析使用圖形、描述統(tǒng)計量的方法來探索數(shù)據(jù)的分布特征,主要適用于連續(xù)性資料。主要功能有:分離特異值、離群值;繪制多種統(tǒng)計分布圖,觀察其分布特征;描述統(tǒng)計量的計算,包括文件統(tǒng)計量的估計;特定分布特征的假設(shè)檢驗;百分位數(shù)的估算。27第27頁/共71頁Explore操作過程實例2,對照資料中不同性別(XB)的身高(SG)進行分別描述。28第28頁/共71頁Explore操作過程要進行分析的應(yīng)變量:身高分類變量:性別29第29頁/共71頁Explore操作過程選項說明Descriptives輸出描述統(tǒng)計量,默認(rèn)ConfidenceintervalforMean:95%計算均數(shù)的95%置信區(qū)間,默認(rèn)M-estimators描述平均水平,其意義同均數(shù)和中位數(shù)Outliers列出極端值,即最大和最小的各五個數(shù)據(jù)Percentiles輸出5%、10%、25%、50%、75%、90%、95%的百分位數(shù)30第30頁/共71頁Explore操作過程箱式圖以分組變量繪圖分析變量一起繪圖莖葉圖直方圖正態(tài)概率圖和正態(tài)性檢驗離散水平圖,Levene方差齊性檢驗不繪圖冪轉(zhuǎn)換不轉(zhuǎn)換用冪轉(zhuǎn)換進行數(shù)據(jù)轉(zhuǎn)換31第31頁/共71頁Explore操作過程缺失值設(shè)置,一般選擇默認(rèn)。按觀察個體排除缺失值將缺失值單獨列成一組成對排除缺失值32第32頁/共71頁Explore結(jié)果分析缺失值報告:本例沒有缺失值,男性有效人數(shù)為29人,女性有效人數(shù)為77人。33第33頁/共71頁Explore結(jié)果分析探索性分析的統(tǒng)計描述跟前面兩種分析的統(tǒng)計描述相似,需要注意的是95%ConfidenceintervalforMean(LowerRound/UpperRound)指的是95%可信區(qū)間上限/下限;5%TrimmedMean指的是5%調(diào)整均數(shù),去掉最大和最小各5%的數(shù)據(jù)后的均數(shù);InterquartileRange指的是四分位數(shù)間距。34第34頁/共71頁Explore結(jié)果分析極端值列表:分別列出男性女性的最高與最低的五組數(shù)據(jù),其中CaseNumber指的是極端值所在的編碼,Value指的是具體的數(shù)值35第35頁/共71頁Explore結(jié)果分析上圖是按性別不同對身高進行的正態(tài)性檢驗,給出兩種方法的結(jié)果:Kolmogorov-Smirnov檢驗和Shapiro-Wilk檢驗。其中,Statistic為統(tǒng)計量;df為自由度;sig.為P值。經(jīng)檢驗,男組兩組P值均小于0.05,所以拒絕正態(tài)分析的假設(shè),尚不能認(rèn)為男組呈正態(tài)分布。而女組Kolmogorov-Smirnov檢驗中p值小于0.05,Shapiro-Wilk檢驗p值大于0.05,應(yīng)該再參考別的方法判定女組是否呈正態(tài)分布。36第36頁/共71頁Explore結(jié)果分析上圖是對按性別不同對身高進行的方差齊性檢驗,采用了四種方法計算統(tǒng)計量:BasedonMean(基于均數(shù)的統(tǒng)計量)、BasedonMedian(基于中位數(shù)的統(tǒng)計量)、BasedonMedianandwithadjusteddf(基于中位數(shù)并調(diào)整自由度的統(tǒng)計量)、BasedontrimmedMean(基于調(diào)整均數(shù)的統(tǒng)計量)。Df1是分子自由度、df2為分母自由度。經(jīng)檢驗,上述四種方法的計算出的P值均大于0.05,不拒絕零假設(shè),可以認(rèn)為兩組總體方差相同。37第37頁/共71頁Explore結(jié)果分析由上直方圖可以看出,男組明顯不是正態(tài)分布,女組與正態(tài)分布相近。38第38頁/共71頁正態(tài)性檢驗

圖示法主要采用概率圖(Probability-probabilityPlot,P-P圖)和分位數(shù)圖(Quantile-quantilePlot,Q-Q圖)。其中,P-P圖是以樣本的累計頻率作為橫坐標(biāo),以按照正態(tài)分布計算的相應(yīng)累計概率作為縱坐標(biāo),把樣本值表現(xiàn)為直角坐標(biāo)系中的散點。如果資料服從正態(tài)分布,則樣本點應(yīng)該圍繞第一象限的對角線分布。Q-Q圖則是以樣本的分位數(shù)作為橫坐標(biāo),以按照正態(tài)分布計算的相應(yīng)分位數(shù)作為縱坐標(biāo),把樣本表現(xiàn)為直角坐標(biāo)系的散點。如果資料服從正態(tài)分布,則樣本點應(yīng)該呈一條圍繞第一象限對角線的直線。這兩種方法中,以Q-Q圖法的效率較高。39第39頁/共71頁圖中的直線是正態(tài)分布的標(biāo)準(zhǔn)參考線,散點越接近這條直線,則該變量的分布越接近正態(tài)分布。本例中可以看出女生的散點更接近標(biāo)準(zhǔn)參考線,說明女性更接近于正態(tài)分布。40第40頁/共71頁Explore結(jié)果分析莖葉圖41第41頁/共71頁Explore結(jié)果分析莖葉圖結(jié)果分析:兩莖葉圖的莖寬(StemWidth)是10,莖葉圖從左至右分別為頻數(shù)(Frequency)、莖(Stem)及葉(Leaf):莖表示變量值的整數(shù)部分,葉表示變量值的小數(shù)部分,每行的莖和每一個葉組成的數(shù)值相加后再乘以莖寬,就是莖葉所表示的實際數(shù)據(jù)的近似值。例如:性別為1的第三行,在這個變量值下頻數(shù)為4,莖為11,這行葉的組成是6789,它表示在這一行的六個變量值大約是116,117,118,119.42第42頁/共71頁Explore結(jié)果分析43第43頁/共71頁Explore結(jié)果分析箱式圖結(jié)果分析:男女生箱式圖中中間長方形的底部與頂部分別表示下四分位數(shù)(p25)和上四分位數(shù)(p75),中間的橫線代表它們各自的中位數(shù),箱式圖的上下柄分別代表最大值跟最小值。由上圖結(jié)果可以看出,女生組的最大值、上四分位數(shù)和下四分位數(shù)分別大于男生組,而中位數(shù)與最小值均小于男生組。44第44頁/共71頁對練習(xí)實例3中危重病人的APACHE評分及其預(yù)后情況進行探索性分析,了解不同預(yù)后情況的APACHE評分情況。(數(shù)據(jù)見練習(xí).sav)。Explore實戰(zhàn)演練45第45頁/共71頁(1)隨機樣本;(2)來自正態(tài)分布總體;(3)兩小樣本均數(shù)比較時,要求兩總體方差相等(方差齊性)t檢驗應(yīng)用條件46第46頁/共71頁幾種不同資料的t檢驗1.單樣本t檢驗2.配對樣本t檢驗3.兩獨立樣本t檢驗47第47頁/共71頁單樣本t檢驗?zāi)康?推斷該樣本來自的總體均數(shù)與已知的某一總體均數(shù)有無差別。單樣本資料t檢驗實例:根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機調(diào)查了25名健康成年男子,其脈搏數(shù)分別為:73,76,71,64,68,69,66,73,72,71,70,70,72,66,69,67,67,70,72,71,73,74,73,72,76問該山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)?48第48頁/共71頁單樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:μ=μ0,即該山區(qū)成年男子的脈搏總體均數(shù)μ與一般成年男子脈搏總體均數(shù)μ0相等;H1:μ≠μ0(包括μ>μ0與μ<μ0);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量49第49頁/共71頁單樣本t檢驗AnalyzeCompareMeans

One-sampleTTest50第50頁/共71頁單樣本t檢驗51第51頁/共71頁

NMeanStd.DeviationStd.ErrorMean脈搏2570.60003.06866.61373單樣本t檢驗One-SampleStatistics由上表知,樣本量為25,樣本均數(shù)為70.6000,標(biāo)準(zhǔn)差為3.06866,標(biāo)準(zhǔn)誤為0.6137352第52頁/共71頁單樣本t檢驗

One-SampleTest

TestValue=72tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper脈搏-2.28124.032-1.4000-2.6667-.1333

由上表可知,已知檢驗值為72.t值=-2.281,df=24,P=0.032(雙側(cè)),差異有統(tǒng)計學(xué)意義,可認(rèn)為該山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)。樣本均數(shù)與總體均數(shù)之差為-1.4000,差值的95%可信區(qū)間為(-2.6667,-0.0.1333),不包含0,亦說明兩者間差異有統(tǒng)計學(xué)意義53第53頁/共71頁配對樣本t檢驗配對t檢驗適用于配對設(shè)計的計量資料。配對設(shè)計是將受試對象按照某些重要特征(可疑混雜因素)配成對子,每對的兩個受試對象隨機分配到兩處理組。配對設(shè)計類型:①兩同質(zhì)受試對象分別接受兩種不同的處理;②同一受試對象分別接受兩種不同處理;③同一受試對象(一種)處理前后的數(shù)據(jù)。54第54頁/共71頁配對樣本t檢驗例6-2為了研究孿生兄弟的出生體重是否與其出生順序有關(guān),共收集了15對孿生兄弟的出生順序和出生體重,見表6-2。試問孿生兄弟中先出生者的出生體重與后出生者的出生體重是否相同?55第55頁/共71頁配對樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:μd=0,即每對孿生兄弟體重差值d所對應(yīng)的總體均數(shù)μd來自均數(shù)為0的正態(tài)總體;H1:μd≠0(包括μd>0與μd<0

);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量56第56頁/共71頁配對樣本t檢驗編號先出生者體重后出生者體重差值12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50—0.0263.232.930.3072.272.240.0382.482.55—0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20—0.11142.982.920.06152.652.600.0557第57頁/共71頁配對樣本t檢驗Analyze

CompareMeans

Paired-SamplesTTest58第58頁/共71頁配對樣本t檢驗59第59頁/共71頁配對樣本t檢驗PairedSamplesStatistics

MeanNStd.DeviationStd.ErrorMeanPair1先出生者2.945315.40516.10461后出生者2.882715.40922.10566

PairedSamplesCorrelations

NCorrelationSig.Pair1先出生者&后出生者15.967.00060第60頁/共71頁配對樣本t檢驗PairedSamplesTest

PairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1先出生者-后出生者.0627.10430.02693.0049.12042.32714.035先出生者與后出生者的體重有顯著差異(t=2.327,df=14,P=0.035),其差值的均數(shù)為0.0627,標(biāo)準(zhǔn)差為0.10420,標(biāo)準(zhǔn)誤為0.02693。61第61頁/共71頁兩獨立樣本t檢驗適用于完全隨機設(shè)計兩樣本均數(shù)的比較,通過樣本信息推斷所屬的兩總體均數(shù)是否相等。兩組完全隨機設(shè)計是將同質(zhì)的受試對象完全隨機分配到兩個不同處理組。當(dāng)兩樣本含量較小時,且均來自正態(tài)總體時,要根據(jù)兩總體方差是否相等而采用不同的檢驗方法。62第62頁/共71頁兩獨立樣本t檢驗

兩獨立樣本資料的t檢驗實例:采用完全隨機設(shè)計的方法,將19只體重、出生日期等相仿的小白鼠隨機分為兩組,其中一組喂養(yǎng)高蛋白飼料,另一組喂養(yǎng)低蛋白飼料,然后觀察喂養(yǎng)8周后各小白鼠所增加體重(mg)情況,問兩組膳食對小白鼠增加體重有無不同?(數(shù)據(jù)見兩獨立樣本資料實例)63第63頁/共71頁兩獨立樣本t檢驗1.建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:μ1=μ2,即高蛋白組與低蛋白組所增體重的總體均數(shù)相同;H1:μ≠μ0,即高蛋白組與低蛋白組所增體重的總體均數(shù)不同(包括μ1>μ2與μ1<μ2);α=0.05。2.在SPSS中選擇檢驗方法和計算檢驗統(tǒng)計量64第64頁/共71頁兩獨立樣本t檢驗經(jīng)檢驗,兩種檢驗方法兩組的P值均大于0.05,所以認(rèn)為兩組均呈正態(tài)分布。65第65頁/共71頁兩獨立樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論