均值比較與T檢驗chap5_第1頁
均值比較與T檢驗chap5_第2頁
均值比較與T檢驗chap5_第3頁
均值比較與T檢驗chap5_第4頁
均值比較與T檢驗chap5_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五章第五章 均值比較與均值比較與T檢驗檢驗 統(tǒng)計分析常常采取抽樣研究的方法。即從總體中隨機抽取一定數(shù)量的樣本進行研究來推論總體的特性。由于總體中的每個個體間均存在差異,即使嚴(yán)格遵守隨機抽樣原則也會由于多抽到一些數(shù)值較大或較小的個體致使樣本統(tǒng)計量與總體參數(shù)之間有所不同。由此可以得出這樣的認(rèn)識:均值不相等的兩個樣本不一定來自均值不同的總體。 能否用樣本均數(shù)估計總體均數(shù),兩個變量均數(shù)接近的樣本是否來自均值相同的總體?換句話說,兩個樣本某變量均值不同,其差異是否具有統(tǒng)計意義,能否說明總體差異?這是各種研究工作中經(jīng)常提出的問題。這就要進行均值比較。對來自正態(tài)總體的兩個樣本進行均值比較常使用T檢驗的方法

2、。T檢驗要求兩個被比較的樣本來自正態(tài)總體。兩個樣本方差相等與不等時使用的計算t值的公式不同。 進行方差齊次性檢驗使用F檢驗。對應(yīng)的零假設(shè)是:兩組樣本方差相等。p值小于0.05說明在該水平上否定原假設(shè),方差不齊;否則兩組方差無顯著性差異。F值的計算公式是:FS12(較大)/S22(較小)進行均值比較及檢驗的過程進行均值比較及檢驗的過程 lMEANS 過程過程lT test 過程過程 單一樣本單一樣本T檢驗檢驗 獨立樣本的獨立樣本的T檢驗檢驗 配對樣本的配對樣本的T檢驗檢驗l單因素方差分析單因素方差分析SPSSSPSS的均值過程是的均值過程是描述和分析尺度變量描述和分析尺度變量(ScaleScal

3、e)的一種有用的方法,可以獲得需)的一種有用的方法,可以獲得需要要分析變量分析變量的許多中心趨勢和離散趨勢的的許多中心趨勢和離散趨勢的統(tǒng)計指標(biāo),同時它可以對統(tǒng)計指標(biāo),同時它可以對不同的組別不同的組別或者或者交叉組別交叉組別進行比較。進行比較。當(dāng)觀測量按一個分類變量分組時,均值過程可以進行分組計算。例如:要計算學(xué)生的平均身高,SEX變量把學(xué)生按性別分為男、女生兩組,均值過程可以分別計算男、女生平均身高。注意用于形成分組的變量應(yīng)該是其值數(shù)量少且能明確表明其特征的變量。 一、一、MEANS過程過程 使用均值過程求若干組的描述統(tǒng)計量,目的在于比較比較。因此必須分組求均值。這是與Descriptives

4、過程不同之處。 MEANS過程的基本功能是分組計算指定變量的描述統(tǒng)計量。包括均值、標(biāo)準(zhǔn)差、總和、觀測量數(shù)、方差等一系列單變量描述統(tǒng)計量。也可以從該過程獲得也可以從該過程獲得單因素方差分析、單因素方差分析、eta eta 和線性相關(guān)檢驗。和線性相關(guān)檢驗。Mean過程的數(shù)據(jù)文件要求:至少有一個連續(xù)變量、一個分類變量(離散變量)。對連續(xù)變量求其基本描述統(tǒng)計量。分類變量用來分組。以30個學(xué)生的身高為例說明操作步驟(學(xué)生身高體重數(shù)據(jù).sav)變量number編號,sex性別,age年齡,height身高,weight體重。相同年齡的男孩和女孩是否身高有所不同相同年齡的男孩和女孩是否身高有所不同?是否身高

5、隨年齡?是否身高隨年齡的增長呈線性關(guān)系?如果解決這樣的問題,只建立一個控制的增長呈線性關(guān)系?如果解決這樣的問題,只建立一個控制層就不夠了。應(yīng)該考慮,選擇身高作為因變量,分類變量年層就不夠了。應(yīng)該考慮,選擇身高作為因變量,分類變量年齡作為第一層控制變量,性別為第二層控制變量。兩個分類齡作為第一層控制變量,性別為第二層控制變量。兩個分類變量分別放在兩層中,且使用選擇項。變量分別放在兩層中,且使用選擇項。ANOVA table and eta:輸出第一層控制變量給出的方差分析表輸出第一層控制變量給出的方差分析表和和eta統(tǒng)計值統(tǒng)計值和和2 。 統(tǒng)計量表明因變量和自變量之間聯(lián)系的強度。統(tǒng)計量表明因變量

6、和自變量之間聯(lián)系的強度。 2 是組間平方和與總平方和之比。是組間平方和與總平方和之比。Test for linearity:線性檢驗,輸出線性檢驗,輸出R和和R2,只有在控制變量有基,只有在控制變量有基本的控制級,且本的控制級,且自變量有三個水平以上自變量有三個水平以上時才能選用。時才能選用。對第一層變量的方差分析結(jié)果對第一層變量的方差分析結(jié)果身高身高*年齡(方差分析的變量信息)年齡(方差分析的變量信息) :分析不同年齡的身高均值間是:分析不同年齡的身高均值間是否存在顯著性差異;否存在顯著性差異;Sum of Squares(偏差平方和偏差平方和);df(自由度自由度);Mean square

7、(均方均方);F(方差值方差值);sig(P值值);Between Groups(組間偏差平方和組間偏差平方和):由兩部分組成:由兩部分組成:Linearity是由是由因變量與控制變量之間的線性關(guān)系引起的;因變量與控制變量之間的線性關(guān)系引起的;Deviation from linearity不是由因變量與控制變量之間的線性關(guān)系引起的;不是由因變量與控制變量之間的線性關(guān)系引起的;Within Groups(組內(nèi)偏差平方和組內(nèi)偏差平方和):各組內(nèi)的變異相對于組均值的變異;各組內(nèi)的變異相對于組均值的變異;Total(偏差平方和的總和偏差平方和的總和):為組間偏差平方和與組內(nèi)偏差平方和之和。為組間偏差

8、平方和與組內(nèi)偏差平方和之和。線性檢驗結(jié)果線性檢驗結(jié)果lR R是因變量身高的觀測值與預(yù)測值之間的的相是因變量身高的觀測值與預(yù)測值之間的的相 關(guān)系數(shù),關(guān)系數(shù),R R值越接近值越接近1 1 表明回歸方程的預(yù)測性表明回歸方程的預(yù)測性 越好;越好;lEtaEta:即:即值(值(0 01 1)說明因變量與自變量之)說明因變量與自變量之 間的聯(lián)系程度間的聯(lián)系程度; ;lEta SquaredEta Squared:22為組間偏差平方和與偏差為組間偏差平方和與偏差 平方和總和之比。平方和總和之比。練習(xí)題練習(xí)題試按性別、年齡對體重做平均數(shù)分析。單樣本單樣本T檢驗檢驗 單樣本單樣本T T檢驗即檢驗?zāi)硞€變量的樣本均

9、值和某指檢驗即檢驗?zāi)硞€變量的樣本均值和某指定值(總體均值)之間是否存在著顯著性差異。定值(總體均值)之間是否存在著顯著性差異。如果是如果是大樣本大樣本的單樣本檢驗,統(tǒng)計教科書上稱為的單樣本檢驗,統(tǒng)計教科書上稱為U U檢驗,它采用檢驗,它采用服從正態(tài)分布服從正態(tài)分布的的U U統(tǒng)計量作為檢驗統(tǒng)計量作為檢驗統(tǒng)計量;如果是統(tǒng)計量;如果是小樣本小樣本并且樣本服從正態(tài)分布,并且樣本服從正態(tài)分布,則采用則采用服從服從t t分布分布的的t t統(tǒng)計量進行單樣本統(tǒng)計量進行單樣本T T檢驗;檢驗;否則,采取非參數(shù)檢驗。否則,采取非參數(shù)檢驗。T T檢驗穩(wěn)健性(檢驗穩(wěn)健性(RobustRobust)較好,如果樣本分布偏

10、離正態(tài)分布不太嚴(yán)重,也較好,如果樣本分布偏離正態(tài)分布不太嚴(yán)重,也可采用可采用T T檢驗。檢驗。二、二、T test過程過程 1、單一樣本、單一樣本T檢驗檢驗(One-sample T Test) 檢驗單個變量的均值是否與給定的常數(shù)(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值等)之間存在差異。樣本均數(shù)樣本均數(shù)與與總體均數(shù)總體均數(shù)之間的差異顯著性檢之間的差異顯著性檢驗屬于單一樣本驗屬于單一樣本T檢驗。檢驗。如某廠的燈泡壽命的平均值為1500小時,后采用新工藝組織生產(chǎn),要想了解燈泡壽命是否提高?方法:從新工藝下生產(chǎn)的燈泡中隨機抽查若干只燈泡,測得壽命,并計算平均壽命,再與1500小時進行比較,判

11、斷是否有顯著差異?如果是大樣本的單樣本檢驗,統(tǒng)計教科書上稱如果是大樣本的單樣本檢驗,統(tǒng)計教科書上稱為為U U檢驗,它采用服從正態(tài)分布的檢驗,它采用服從正態(tài)分布的U U統(tǒng)計量作為統(tǒng)計量作為檢驗統(tǒng)計量;檢驗統(tǒng)計量;如果是小樣本并且樣本服從正態(tài)分布,則采用如果是小樣本并且樣本服從正態(tài)分布,則采用服從服從t t分布的分布的t t統(tǒng)計量進行單樣本統(tǒng)計量進行單樣本T T檢驗;檢驗;否則,采取非參數(shù)檢驗。否則,采取非參數(shù)檢驗。T T檢驗穩(wěn)健性(檢驗穩(wěn)健性(RobustRobust)較好,如果樣本分布偏離正態(tài)分布不太嚴(yán)重,較好,如果樣本分布偏離正態(tài)分布不太嚴(yán)重,也可采用也可采用T T檢驗。檢驗。例:收集例:收

12、集26家保險公司人員構(gòu)成數(shù)據(jù),希家保險公司人員構(gòu)成數(shù)據(jù),希望對目前保險公司從業(yè)人員受高等教育程望對目前保險公司從業(yè)人員受高等教育程度和年輕化程度進行推斷。度和年輕化程度進行推斷。具體而言,就是推斷具有高等教育水平的具體而言,就是推斷具有高等教育水平的員工平均比例是否不低于員工平均比例是否不低于0.8,年輕人的,年輕人的平均比例是否為平均比例是否為0.5,具體數(shù)據(jù)文件名為,具體數(shù)據(jù)文件名為保險公司人員構(gòu)成情況保險公司人員構(gòu)成情況.sav提出原假設(shè):保險公司具有高等教育水平的員工比例的平均值不低于0.8,即 H0:u=(u0=0.8)年輕人比例的平均值與0.5無顯著差異,即: H0:u=u0=0.

13、5分析過程:計算具有高等教育水平的員工數(shù),35歲以下員工數(shù)占總員工數(shù)的比例。(利用轉(zhuǎn)換菜單計算)進行單樣本t檢驗分析:由于調(diào)查的26家公司,有7家在文化程度變量上有缺失值,因此在選項窗口中選擇【按分析順序排除個案】進行缺失值處理。Confidence interval:95%:置信區(qū)間項,可以自定義。:置信區(qū)間項,可以自定義。Missing Values:選擇對缺失值的處理方法:選擇對缺失值的處理方法 Exclude cases analysis by analysis:帶有缺失值的觀測帶有缺失值的觀測值當(dāng)它與分析有關(guān)時才被剔除;值當(dāng)它與分析有關(guān)時才被剔除; Exclude cases lis

14、twise:剔除所有列在:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項矩形框中的變量帶缺失值的項受高等教育比例的基本描述統(tǒng)計量被調(diào)查的被調(diào)查的2626家保險公司有效的家保險公司有效的1919家,其中家,其中具有高等教育水平員工比例的平均數(shù)是具有高等教育水平員工比例的平均數(shù)是0.7450.745,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為0.1670.167,標(biāo)準(zhǔn)誤為,標(biāo)準(zhǔn)誤為0.0380.038單樣本單樣本T檢驗分析結(jié)果檢驗分析結(jié)果9595 Confidence Interval of the DifferenceConfidence Interval of the Difference(差值的(

15、差值的95%95%置信區(qū)間)置信區(qū)間):9595的置信區(qū)間均值的置信區(qū)間均值1.961.96標(biāo)準(zhǔn)誤。根據(jù)上標(biāo)準(zhǔn)誤。根據(jù)上表比例總體均值的表比例總體均值的9595置信區(qū)間是置信區(qū)間是0.745 0.745 1.96 1.960.0380.038即即(0.6640.664,0.82550.8255)。由此推出,該范圍與總體均數(shù)之差為)。由此推出,該范圍與總體均數(shù)之差為0.664-0.80.664-0.80.8255-0.80.8255-0.8,即表中,即表中-0.1358-0.1358和和0.02550.0255的含義。的含義。單樣本單樣本t t檢驗中檢驗中t t統(tǒng)計量的雙尾概率統(tǒng)計量的雙尾概率p

16、-p-為為0.1680.168,若顯著性水平,若顯著性水平a a為為0.050.05,則,則pa,pa,由此接受原假設(shè),也就是保險公司員工受高由此接受原假設(shè),也就是保險公司員工受高等教育比例顯著高于等教育比例顯著高于0.80.8。(。(0.80.8大于大于9595的置信區(qū)間下限)的置信區(qū)間下限)練習(xí):年輕人比例t檢驗操作年輕人比例的基本描述統(tǒng)計量年輕人比例的基本描述統(tǒng)計量調(diào)查的調(diào)查的2626家保險公司,年輕人比例的平均家保險公司,年輕人比例的平均數(shù)是數(shù)是0.71390.7139,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為0.1510.151,標(biāo)準(zhǔn)誤為,標(biāo)準(zhǔn)誤為0.030.03單樣本單樣本T檢驗分析結(jié)果檢驗分析結(jié)果95

17、95 Confidence Interval of the DifferenceConfidence Interval of the Difference(差值的(差值的95%95%置信區(qū)間)置信區(qū)間):9595的置信區(qū)間均值的置信區(qū)間均值1.961.96標(biāo)準(zhǔn)誤。根據(jù)上標(biāo)準(zhǔn)誤。根據(jù)上表比例總體均值的表比例總體均值的9595置信區(qū)間是置信區(qū)間是0.7139 0.7139 1.96 1.960.030.03即即(0.6550.655,0.7730.773)。由此推出,該范圍與總體均數(shù)之差為)。由此推出,該范圍與總體均數(shù)之差為0.655-0.50.655-0.50.773-0.50.773-0.5,

18、即表中,即表中0.15300.1530和和0.27470.2747的含義。單的含義。單樣本樣本t t檢驗中檢驗中t t統(tǒng)計量的雙尾概率統(tǒng)計量的雙尾概率p-p-為為0 0,若顯著性水平,若顯著性水平a a為為0.050.05,則,則pa,p0.05,接受原假設(shè)即方差相等。t-test for Equality of Means為為T檢驗結(jié)果欄檢驗結(jié)果欄t: t值;值;df:自由度;:自由度;Sig:顯著性概率即:顯著性概率即P值值=00.05,拒絕拒絕原假設(shè)原假設(shè)u1-u2=0;Mean Difference:兩組均值之差。表現(xiàn)培訓(xùn)方法兩組均值之差。表現(xiàn)培訓(xùn)方法A學(xué)生平學(xué)生平均測試成績低于培訓(xùn)方

19、法均測試成績低于培訓(xùn)方法B學(xué)生成績學(xué)生成績8.767;Std. Error Difference:差值的標(biāo)準(zhǔn)誤為:差值的標(biāo)準(zhǔn)誤為1.686;95 Confidence Interval of the Difference:差值的:差值的95%置信區(qū)間。在置信區(qū)間。在-12.24-5.294之間,不包括之間,不包括0即兩組均即兩組均值之差與值之差與0有顯著性差異。有顯著性差異。例題二例題二有29名13歲男生的身高、體重、肺活量數(shù)據(jù)(學(xué)生肺活量數(shù)據(jù).sav),試分析大于等于155cm的與身高小于155cm的兩組男生的肺活量均值是否有顯著差異。分析:155以下和155以上身高的男生平均肺活量顯著性檢

20、驗例題二例題二身高大于等于155cm與身高小于155cm的兩組男生的肺活量平均值在95%水平上顯著存在差異。練習(xí)題練習(xí)題某克山病區(qū)測得11例急性克山病患者與13名健康人的血磷值如下:患者:2.60, 3.24, 3.73, 3.73, 4.32, 5.18, 4.73, 5.58, 5.78, 6.40, 6.53健康人:1.67, 1.98, 1.98, 2.33, 2.34, 2.50, 3.60,3.73, 4.14, 4.17, 4.57, 4.82,5.78問該地區(qū)急性克山病患者與健康人的血鱗值是否不同?三、配對樣本三、配對樣本T檢驗檢驗 配對樣本T檢驗(Paired Sample

21、T test)用于檢驗兩個相關(guān)的樣本是否來自具有相同均值的總體。這種相關(guān)的或配對的樣本常常來自這樣的實驗結(jié)果,在實驗中被觀測對象在實驗前后均被觀測。兩個變量可以是before after,配對分析的測度也不是必須來自同一個觀測對象。一對可以兩者組合而成。 進行配對樣本的T檢驗要求被比較的兩個樣本有配對關(guān)系。要求兩個樣本均來自正態(tài)總體。而且均值是對于檢驗有意義的描述統(tǒng)計量。均值的配對比較是比較常見(見以下幾個例子)。同一窩實驗用白鼠按性別、體重相同的配對,再隨機分到實驗組和對照組,分別喂加入海藻的飼料和普通飼料,三個月后,分別將每對白鼠置于水中,測量其到溺死前的游泳時間。比較兩組白鼠游泳時間均值

22、,從而比較兩種飼料對抗疲勞的作用。在研究人體各部位體溫是否有差別,一個人的兩個部位的溫度構(gòu)成一對數(shù)據(jù)。測量若干人的同樣兩個部位的溫度數(shù)據(jù),可以比較這兩個部位平均溫度是否有顯著性差異。使用配對t檢驗。 同一組高血壓病人在進行體育療法前后,測量其血壓。每個病人在體育療法前后的血壓測量值構(gòu)成觀測量對??梢郧筮@組病人體育療法前后血壓平均值。進行配對T檢驗,分析體育療法對降血壓的療效。 配對樣本配對樣本T T檢驗檢驗實際上實際上是先求出是先求出每對測量值之差值每對測量值之差值,對對差值求均值,差值求均值,檢驗配對變量均值之間差異是否檢驗配對變量均值之間差異是否顯著。顯著。其其實質(zhì)實質(zhì)檢驗的假設(shè)實際上是差

23、值的均值與檢驗的假設(shè)實際上是差值的均值與零均值之間差異的顯著性零均值之間差異的顯著性。如果差值均值與零均。如果差值均值與零均值無顯著性差異說明配對變量均值之間無顯著性值無顯著性差異說明配對變量均值之間無顯著性差異。差異。 配對樣本配對樣本T T檢驗與獨立樣本檢驗與獨立樣本T T檢驗均使用檢驗均使用T-TESTT-TEST過過程,但調(diào)用該過程的菜單不同,對數(shù)據(jù)文件結(jié)構(gòu)程,但調(diào)用該過程的菜單不同,對數(shù)據(jù)文件結(jié)構(gòu)的要求不同和所使用的命令語句也有區(qū)別。進行的要求不同和所使用的命令語句也有區(qū)別。進行配對樣本配對樣本T T檢驗的數(shù)據(jù)文件中檢驗的數(shù)據(jù)文件中一對數(shù)據(jù)必須作為同一對數(shù)據(jù)必須作為同一個觀測量中兩個

24、變量值一個觀測量中兩個變量值。 例題一例題一以體育療法治療高血壓的數(shù)據(jù)以體育療法治療高血壓的數(shù)據(jù) ( (體育療法體育療法檢驗檢驗.SAV).SAV),pretreatpretreat:治療前舒張壓:治療前舒張壓(mmHgmmHg),posttreat,posttreat:治療后舒張壓:治療后舒張壓(mmHgmmHg)。要求判斷體育療法對降低血壓)。要求判斷體育療法對降低血壓是否有療效?是否有療效?Spss操作步驟操作步驟治療前后舒張壓的單變量描述統(tǒng)計量治療前后舒張壓的單變量描述統(tǒng)計量變量名標(biāo)簽:列出配對變量的變量標(biāo)簽,對數(shù)為1;均值:分別給出治療前后的舒張壓均值;119.50,102.50觀察量數(shù)目標(biāo)準(zhǔn)差:10.069,11.1118標(biāo)準(zhǔn)誤:3.184,3.516Paired Samples Statistics119.501010.0693.184102.501011.1183.516治療前舒張壓治療后舒張壓Pair 1MeanNStd.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論