SPSS之平均數(shù)比較與T檢驗(yàn).ppt_第1頁(yè)
SPSS之平均數(shù)比較與T檢驗(yàn).ppt_第2頁(yè)
SPSS之平均數(shù)比較與T檢驗(yàn).ppt_第3頁(yè)
SPSS之平均數(shù)比較與T檢驗(yàn).ppt_第4頁(yè)
SPSS之平均數(shù)比較與T檢驗(yàn).ppt_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)統(tǒng)計(jì)分析軟件SPSS,五、平均數(shù)比較與T檢驗(yàn),假設(shè)檢驗(yàn)是非常重要的一類統(tǒng)計(jì)推斷問(wèn)題。假設(shè)檢驗(yàn)技術(shù)不僅可以對(duì)總體分布的某些參數(shù),而且也可以對(duì)總體本身的分布做出假設(shè),通過(guò)對(duì)樣本的統(tǒng)計(jì)分析來(lái)判定該假設(shè)是否成立,從而對(duì)總體分布給以進(jìn)一步的確認(rèn)。 如:已知樣本來(lái)自正態(tài)總體,是否有理由說(shuō)它是來(lái)自均值為 的正態(tài)總體;再如,已知兩個(gè)相互獨(dú)立的樣本,分別來(lái)自兩個(gè)正態(tài)總體,能否說(shuō)這兩個(gè)總體均值相同或方差相同。,假設(shè)檢驗(yàn)中的幾個(gè)基本概念,1.原假設(shè)與備擇假設(shè) 2.兩類錯(cuò)誤 3.檢驗(yàn)統(tǒng)計(jì)量 4.拒絕域與臨界值 5.顯著性水平,例:一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加

2、工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和備擇假設(shè)。 解:建立的原假設(shè)和備擇假設(shè)為 H0 : u=10cm H1 : u10cm,1.第類錯(cuò)誤(棄真錯(cuò)誤) 原假設(shè)為真時(shí)拒絕原假設(shè) 第類錯(cuò)誤的概率記為 被稱為顯著性水平 2.第類錯(cuò)誤(取偽錯(cuò)誤) 原假設(shè)為假時(shí)未拒絕原假設(shè) 第類錯(cuò)誤的概率記為,假設(shè)檢驗(yàn)中的兩類錯(cuò)誤,兩類 錯(cuò)誤的關(guān)系,拒絕域與臨界值,假設(shè)檢驗(yàn)的目的在于判斷樣本統(tǒng)計(jì)量與假設(shè)的總體參數(shù)之間的差異。不同的抽樣方法對(duì)應(yīng)著不同的標(biāo)準(zhǔn)。顯著性水平就是用來(lái)判斷接受和拒絕原假設(shè)

3、的標(biāo)準(zhǔn),通常用 表示。 1. 在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率為零。 2. 在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。 3. 由研究者事先確定。,假設(shè)檢驗(yàn)的步驟,1根據(jù)具體問(wèn)題的要求,建立原假設(shè)和備擇假設(shè)H。 2選擇一個(gè)合適的檢驗(yàn)統(tǒng)計(jì)量,它應(yīng)與原假設(shè)有關(guān),而且當(dāng)原假設(shè)為真時(shí)統(tǒng)計(jì)量的分布已知。 3給定顯著性水平 ,當(dāng)原假設(shè)為真的,求出臨界值。 4由樣本觀測(cè)值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,按檢驗(yàn)規(guī)則,對(duì)原假設(shè)作出拒絕或接受的判斷。 注:當(dāng)總體標(biāo)準(zhǔn)差未知時(shí)一般采用T分布檢驗(yàn);當(dāng)總體標(biāo)準(zhǔn)差已知時(shí)一般采用正態(tài)分布檢驗(yàn)。,SPSS 的輸出結(jié)果中給出了相應(yīng)檢驗(yàn)統(tǒng)計(jì)量的實(shí)際取值,但由于顯

4、著性水平根據(jù)不同要求而有所不同,SPSS 并不給出臨界值。如果不查概率表,就無(wú)法直接采用上面的步驟進(jìn)行檢驗(yàn)。 SPSS 給出了檢驗(yàn)統(tǒng)計(jì)量的概值即文獻(xiàn)中常見(jiàn)的p 值(p-value),或稱為相伴概率。利用p 值就可以直接進(jìn)行檢驗(yàn)。p 值是在零假設(shè)成立的情況下,檢驗(yàn)統(tǒng)計(jì)量的取值等于或超過(guò)檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值的概率,從而p 值即為否定零假設(shè)的最低顯著性水平。p 值經(jīng)常被稱為實(shí)際顯著性水平,以區(qū)別于給定的顯著性水平,當(dāng)p 時(shí),意味著如果給定一個(gè)真實(shí)的零假設(shè),那么檢驗(yàn)統(tǒng)計(jì)量的取值等于或超過(guò)實(shí)際觀察到的極端值的概率為 。大多數(shù)學(xué)者都把這一結(jié)果解釋為支持你否定零假設(shè)而接受替代假設(shè)的證據(jù)。有學(xué)者稱p值為“實(shí)驗(yàn)使

5、零假設(shè)相信者感到吃驚的程度的度量”。 p值越小,零假設(shè)相信者吃驚的程度越高。 為了便于記憶,我們可以把p 值理解為零假設(shè)的支持率或可信程度。當(dāng)p 時(shí), 我們拒絕零假設(shè),如在0.05的顯著水平下,如果p 0.05,我們就可以否定零假設(shè)。 在進(jìn)行單側(cè)檢驗(yàn)時(shí),需要比較 和 的大小。,SPSS 提供了計(jì)算指定變量的綜合描述統(tǒng)計(jì)量的過(guò)程和對(duì)均值進(jìn)行比較檢驗(yàn)的過(guò)程:(1)用于計(jì)算變量的綜合統(tǒng)計(jì)量的Means 過(guò)程 Analyze=Compare Means=Means (2)用于單獨(dú)樣本的t 檢驗(yàn)過(guò)程 Analyze=Compare Means=One-Sample T Test,(3)用于獨(dú)立樣本的t

6、檢驗(yàn)過(guò)程 Analyze= Compare Means =Independent-Samples T Test 用于檢驗(yàn)是否兩個(gè)不相關(guān)的樣本來(lái)自具有相同均值的總體。 (4)用于配對(duì)樣本的t 檢驗(yàn)過(guò)程 Analyze= Compare Means=Paired-Samples T Test 用于檢驗(yàn)兩個(gè)相關(guān)的樣本是否來(lái)自具有相同均值的總體。,1、分組平均數(shù)的比較,“Dependent List”選項(xiàng)框中選入的是因變量,可直接用來(lái)計(jì)算各級(jí)平均數(shù)。 “Independent List”選項(xiàng)框中入選的是獨(dú)立變量,即 “分組變量”,此時(shí)要清楚是平行的分組變量還是層疊分組變量。 如:若同時(shí)按照年齡、性別分

7、組情況下的年經(jīng)濟(jì)收入是平行分組;先按不同性別分組,再按年齡分組情況下的年經(jīng)濟(jì)收入是層疊分組。 并行分組時(shí)同時(shí)輸入性別和年齡變量;而層疊分組應(yīng)先輸入性別變量,單擊“Next”按鈕,再輸入年齡變量。,2、單一樣本T檢驗(yàn),單樣本T檢驗(yàn)是指樣本平均與總體平均數(shù)的差異檢驗(yàn)。樣本平均數(shù)( )與總體平均數(shù)往往大小不一,這差異是由于抽樣誤差造成,還是本質(zhì)性誤差樣本根本不是來(lái)源于該總體。如果差異顯著,則認(rèn)為樣本平均數(shù)與總體平均數(shù)的差異已不能完全認(rèn)為是抽樣誤差了。,對(duì)于單個(gè)正態(tài)總體,常用T統(tǒng)計(jì)量來(lái)檢驗(yàn)樣本均數(shù) 是否等于總體平均數(shù) 即 若計(jì)算的T統(tǒng)計(jì)量大于等于 ,或相伴概 率小于 ,則認(rèn)為在顯著性水平 下, 樣本統(tǒng)

8、計(jì)量落入拒絕域,所以拒絕原假設(shè); 反之,則不能拒絕原假設(shè)。,Analyze Compare Means One Sample T test,在“Test Variables”選項(xiàng)框中輸入需要檢驗(yàn)的變量。 在“Test Value”輸入一個(gè)值作為假設(shè)檢驗(yàn)值。 在“Options”對(duì)話框中,還可以輸出置信區(qū)間,一般取為90%,95%,99%等。以及缺失值的處置方式。,例1、以“Employee data.sav”為資料,計(jì)算公司職工的平均受教育年數(shù),假定該地區(qū)人口平均受教育年數(shù)為13年,現(xiàn)問(wèn),公司職工文化程度是否等同于居民文化程度?其中,顯著性水平為 =0.05,統(tǒng)計(jì)量觀測(cè)值為t=3.71,自由度

9、為df=473,雙尾概率P值為Sig=0.000 ,拒絕原假設(shè),平均受教育年數(shù)不等于13年。 實(shí)際上,樣本平均數(shù)與總體平均數(shù)的差異為0.492,以95%的可靠性估計(jì)平均數(shù)在(13.23,13.75)之間,確實(shí)不包含13。,例2、某省大學(xué)英語(yǔ)四級(jí)考試的平均成績(jī)?yōu)?5分,現(xiàn)從某校隨機(jī)抽取20份試卷,其分?jǐn)?shù)為:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。問(wèn)該校英語(yǔ)水平與全區(qū)是否基本一致。其中,顯著性水平為 =0.05 。,例3、某企業(yè)生產(chǎn)的零件直徑服從正態(tài)分布,從中抽取5件測(cè)得直徑分別為:22.3,21.5,22.0,21.

10、8,21.4。問(wèn)零件的平均直徑是否為21。其中,顯著性水平為 =0.05 。,練習(xí)題,利用住房狀況調(diào)查數(shù)據(jù),推斷家庭人均住房面積的平均值是否為20平方米。其中,顯著性水平為 =0.05。 利用保險(xiǎn)公司人員構(gòu)成的數(shù)據(jù),推斷35歲以下年輕人所占比例的平均值與0.5有無(wú)顯著差異。推斷具有大專及其以上教育水平的員工的平均比例是否不低于0.8。其中,顯著性水平為 =0.05。,3、兩獨(dú)立樣本平均數(shù)差異T 檢驗(yàn),獨(dú)立樣本(Independent Sample)是指兩個(gè)樣本彼此獨(dú)立,沒(méi)有任何關(guān)聯(lián)。例如實(shí)驗(yàn)組與控制組、男生組與女生組、高收入組與低收入組、大學(xué)數(shù)學(xué)系與物理系等。利用來(lái)自兩個(gè)總體的獨(dú)立樣本,推斷兩

11、個(gè)總體的均值是否存在顯著差異。 兩個(gè)獨(dú)立樣本均值之間差異用T 統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。,Analyze Compare Means Independent Sample T test,例4、,例4:用 “Employee data.sav”資料,問(wèn):清潔工(jobcat=1)的受教育年數(shù)與保管員(jobcat=2)和經(jīng)理(jobcat=3)的受教育年數(shù)是否有顯著差異?其中,顯著性水平為 =0.05 。,在“Test Variables”選項(xiàng)框中加入要檢驗(yàn)的變量。 在“Grouping Variable”選項(xiàng)框中輸入分組變量,此時(shí)可以通過(guò)“Define Groups”定義分組值,其中, “Use spe

12、cified values”是選擇合適的第一組、第二組分組變量值。 “Cut point”是輸入一個(gè)臨界點(diǎn)值,將數(shù)據(jù)分為兩組,大于等于該分組值的case屬于同一個(gè)組,其余的為另外一個(gè)組。,結(jié)果分析: 1、由上表中可以看出前者為111人,平均受教育年數(shù)分別為15.53,后者363人,平均受教育年數(shù)為12.87,有一定差異。 2、第一步:F統(tǒng)計(jì)量的觀測(cè)值為20.93,由于對(duì)應(yīng)的概率P值Sig=0.000.05,所以認(rèn)為清潔工與保管員和經(jīng)理之間的受教育年數(shù)兩總體方差有顯著差異。由于兩總體方差有差異,所以應(yīng)看第二行(Equal variances not assumed) t檢驗(yàn)的結(jié)果,對(duì)應(yīng)的 t 觀

13、測(cè)值為7.484,對(duì)應(yīng)的概率P值Sig=0.000.05,所以認(rèn)為兩總體的均值有顯著差異。,練習(xí)題,利用住房狀況調(diào)查數(shù)據(jù),推斷本市戶口總體和外地戶口總體的家庭人均住房面積的平均值是否有顯著差異。 利用保險(xiǎn)公司人員構(gòu)成數(shù)據(jù),分析全國(guó)性保險(xiǎn)公司與外資合資保險(xiǎn)公司的人員構(gòu)成中具有大專及其以上學(xué)歷的員工比例的均值是否有顯著差異。,4、兩配對(duì)樣本平均數(shù)差異T檢驗(yàn),配對(duì)樣本(Paired Sample)或相關(guān)樣本(Correlated Sample),指兩個(gè)樣本的觀測(cè)值之間彼此有關(guān)聯(lián),如實(shí)驗(yàn)前和實(shí)驗(yàn)后的測(cè)量,研究者感興趣的是二次測(cè)量之間是否存在差異。 如為研究某種減肥茶是否有顯著的減肥效果,對(duì)肥胖人群喝茶前后的體重進(jìn)行分析,看均值有無(wú)顯著差異。,兩個(gè)配對(duì)樣本均值之間差異用T 統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。 配對(duì)樣本檢驗(yàn)就是根據(jù)配對(duì)樣本均值之間的差異,檢驗(yàn)兩個(gè)總體均值是否相等。,在“Paired-Samples T Test”對(duì)話框中定義要比較的變量對(duì),如,員工的目前工資與起始工資。,Analyze Compare Means Paired-Samples T test,例5、,例5、用 “Employee data.sav”資料,分析美國(guó)企業(yè)現(xiàn)在工資與過(guò)去工資是否有明顯差

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論