版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數據統(tǒng)計分析軟件SPSS,五、平均數比較與T檢驗,假設檢驗是非常重要的一類統(tǒng)計推斷問題。假設檢驗技術不僅可以對總體分布的某些參數,而且也可以對總體本身的分布做出假設,通過對樣本的統(tǒng)計分析來判定該假設是否成立,從而對總體分布給以進一步的確認。 如:已知樣本來自正態(tài)總體,是否有理由說它是來自均值為 的正態(tài)總體;再如,已知兩個相互獨立的樣本,分別來自兩個正態(tài)總體,能否說這兩個總體均值相同或方差相同。,假設檢驗中的幾個基本概念,1.原假設與備擇假設 2.兩類錯誤 3.檢驗統(tǒng)計量 4.拒絕域與臨界值 5.顯著性水平,例:一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監(jiān)測人員定期對一臺加
2、工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和備擇假設。 解:建立的原假設和備擇假設為 H0 : u=10cm H1 : u10cm,1.第類錯誤(棄真錯誤) 原假設為真時拒絕原假設 第類錯誤的概率記為 被稱為顯著性水平 2.第類錯誤(取偽錯誤) 原假設為假時未拒絕原假設 第類錯誤的概率記為,假設檢驗中的兩類錯誤,兩類 錯誤的關系,拒絕域與臨界值,假設檢驗的目的在于判斷樣本統(tǒng)計量與假設的總體參數之間的差異。不同的抽樣方法對應著不同的標準。顯著性水平就是用來判斷接受和拒絕原假設
3、的標準,通常用 表示。 1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率為零。 2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設。 3. 由研究者事先確定。,假設檢驗的步驟,1根據具體問題的要求,建立原假設和備擇假設H。 2選擇一個合適的檢驗統(tǒng)計量,它應與原假設有關,而且當原假設為真時統(tǒng)計量的分布已知。 3給定顯著性水平 ,當原假設為真的,求出臨界值。 4由樣本觀測值計算檢驗統(tǒng)計量的數值,按檢驗規(guī)則,對原假設作出拒絕或接受的判斷。 注:當總體標準差未知時一般采用T分布檢驗;當總體標準差已知時一般采用正態(tài)分布檢驗。,SPSS 的輸出結果中給出了相應檢驗統(tǒng)計量的實際取值,但由于顯
4、著性水平根據不同要求而有所不同,SPSS 并不給出臨界值。如果不查概率表,就無法直接采用上面的步驟進行檢驗。 SPSS 給出了檢驗統(tǒng)計量的概值即文獻中常見的p 值(p-value),或稱為相伴概率。利用p 值就可以直接進行檢驗。p 值是在零假設成立的情況下,檢驗統(tǒng)計量的取值等于或超過檢驗統(tǒng)計量的實際值的概率,從而p 值即為否定零假設的最低顯著性水平。p 值經常被稱為實際顯著性水平,以區(qū)別于給定的顯著性水平,當p 時,意味著如果給定一個真實的零假設,那么檢驗統(tǒng)計量的取值等于或超過實際觀察到的極端值的概率為 。大多數學者都把這一結果解釋為支持你否定零假設而接受替代假設的證據。有學者稱p值為“實驗使
5、零假設相信者感到吃驚的程度的度量”。 p值越小,零假設相信者吃驚的程度越高。 為了便于記憶,我們可以把p 值理解為零假設的支持率或可信程度。當p 時, 我們拒絕零假設,如在0.05的顯著水平下,如果p 0.05,我們就可以否定零假設。 在進行單側檢驗時,需要比較 和 的大小。,SPSS 提供了計算指定變量的綜合描述統(tǒng)計量的過程和對均值進行比較檢驗的過程:(1)用于計算變量的綜合統(tǒng)計量的Means 過程 Analyze=Compare Means=Means (2)用于單獨樣本的t 檢驗過程 Analyze=Compare Means=One-Sample T Test,(3)用于獨立樣本的t
6、檢驗過程 Analyze= Compare Means =Independent-Samples T Test 用于檢驗是否兩個不相關的樣本來自具有相同均值的總體。 (4)用于配對樣本的t 檢驗過程 Analyze= Compare Means=Paired-Samples T Test 用于檢驗兩個相關的樣本是否來自具有相同均值的總體。,1、分組平均數的比較,“Dependent List”選項框中選入的是因變量,可直接用來計算各級平均數。 “Independent List”選項框中入選的是獨立變量,即 “分組變量”,此時要清楚是平行的分組變量還是層疊分組變量。 如:若同時按照年齡、性別分
7、組情況下的年經濟收入是平行分組;先按不同性別分組,再按年齡分組情況下的年經濟收入是層疊分組。 并行分組時同時輸入性別和年齡變量;而層疊分組應先輸入性別變量,單擊“Next”按鈕,再輸入年齡變量。,2、單一樣本T檢驗,單樣本T檢驗是指樣本平均與總體平均數的差異檢驗。樣本平均數( )與總體平均數往往大小不一,這差異是由于抽樣誤差造成,還是本質性誤差樣本根本不是來源于該總體。如果差異顯著,則認為樣本平均數與總體平均數的差異已不能完全認為是抽樣誤差了。,對于單個正態(tài)總體,常用T統(tǒng)計量來檢驗樣本均數 是否等于總體平均數 即 若計算的T統(tǒng)計量大于等于 ,或相伴概 率小于 ,則認為在顯著性水平 下, 樣本統(tǒng)
8、計量落入拒絕域,所以拒絕原假設; 反之,則不能拒絕原假設。,Analyze Compare Means One Sample T test,在“Test Variables”選項框中輸入需要檢驗的變量。 在“Test Value”輸入一個值作為假設檢驗值。 在“Options”對話框中,還可以輸出置信區(qū)間,一般取為90%,95%,99%等。以及缺失值的處置方式。,例1、以“Employee data.sav”為資料,計算公司職工的平均受教育年數,假定該地區(qū)人口平均受教育年數為13年,現問,公司職工文化程度是否等同于居民文化程度?其中,顯著性水平為 =0.05,統(tǒng)計量觀測值為t=3.71,自由度
9、為df=473,雙尾概率P值為Sig=0.000 ,拒絕原假設,平均受教育年數不等于13年。 實際上,樣本平均數與總體平均數的差異為0.492,以95%的可靠性估計平均數在(13.23,13.75)之間,確實不包含13。,例2、某省大學英語四級考試的平均成績?yōu)?5分,現從某校隨機抽取20份試卷,其分數為:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。問該校英語水平與全區(qū)是否基本一致。其中,顯著性水平為 =0.05 。,例3、某企業(yè)生產的零件直徑服從正態(tài)分布,從中抽取5件測得直徑分別為:22.3,21.5,22.0,21.
10、8,21.4。問零件的平均直徑是否為21。其中,顯著性水平為 =0.05 。,練習題,利用住房狀況調查數據,推斷家庭人均住房面積的平均值是否為20平方米。其中,顯著性水平為 =0.05。 利用保險公司人員構成的數據,推斷35歲以下年輕人所占比例的平均值與0.5有無顯著差異。推斷具有大專及其以上教育水平的員工的平均比例是否不低于0.8。其中,顯著性水平為 =0.05。,3、兩獨立樣本平均數差異T 檢驗,獨立樣本(Independent Sample)是指兩個樣本彼此獨立,沒有任何關聯。例如實驗組與控制組、男生組與女生組、高收入組與低收入組、大學數學系與物理系等。利用來自兩個總體的獨立樣本,推斷兩
11、個總體的均值是否存在顯著差異。 兩個獨立樣本均值之間差異用T 統(tǒng)計量進行檢驗。,Analyze Compare Means Independent Sample T test,例4、,例4:用 “Employee data.sav”資料,問:清潔工(jobcat=1)的受教育年數與保管員(jobcat=2)和經理(jobcat=3)的受教育年數是否有顯著差異?其中,顯著性水平為 =0.05 。,在“Test Variables”選項框中加入要檢驗的變量。 在“Grouping Variable”選項框中輸入分組變量,此時可以通過“Define Groups”定義分組值,其中, “Use spe
12、cified values”是選擇合適的第一組、第二組分組變量值。 “Cut point”是輸入一個臨界點值,將數據分為兩組,大于等于該分組值的case屬于同一個組,其余的為另外一個組。,結果分析: 1、由上表中可以看出前者為111人,平均受教育年數分別為15.53,后者363人,平均受教育年數為12.87,有一定差異。 2、第一步:F統(tǒng)計量的觀測值為20.93,由于對應的概率P值Sig=0.000.05,所以認為清潔工與保管員和經理之間的受教育年數兩總體方差有顯著差異。由于兩總體方差有差異,所以應看第二行(Equal variances not assumed) t檢驗的結果,對應的 t 觀
13、測值為7.484,對應的概率P值Sig=0.000.05,所以認為兩總體的均值有顯著差異。,練習題,利用住房狀況調查數據,推斷本市戶口總體和外地戶口總體的家庭人均住房面積的平均值是否有顯著差異。 利用保險公司人員構成數據,分析全國性保險公司與外資合資保險公司的人員構成中具有大專及其以上學歷的員工比例的均值是否有顯著差異。,4、兩配對樣本平均數差異T檢驗,配對樣本(Paired Sample)或相關樣本(Correlated Sample),指兩個樣本的觀測值之間彼此有關聯,如實驗前和實驗后的測量,研究者感興趣的是二次測量之間是否存在差異。 如為研究某種減肥茶是否有顯著的減肥效果,對肥胖人群喝茶前后的體重進行分析,看均值有無顯著差異。,兩個配對樣本均值之間差異用T 統(tǒng)計量進行檢驗。 配對樣本檢驗就是根據配對樣本均值之間的差異,檢驗兩個總體均值是否相等。,在“Paired-Samples T Test”對話框中定義要比較的變量對,如,員工的目前工資與起始工資。,Analyze Compare Means Paired-Samples T test,例5、,例5、用 “Employee data.sav”資料,分析美國企業(yè)現在工資與過去工資是否有明顯差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 園林綠化服務合同樣本
- 工礦企業(yè)采購合同范本
- 批量物料采購合同格式
- 招標文件中的摩托車選購指南
- 焊接作業(yè)人員安全保證書
- 法律服務建議書撰寫要點
- 藥品物流跟蹤與監(jiān)控協議
- 寫出明了的保證書
- 換熱機組招標項目招標報名條件
- 標準建筑工程項目勞務
- 《大學物理學》精美課件(全)
- 規(guī)范權力運行方面存在問題及整改措施范文(五篇)
- 減壓孔板計算
- 博物館學概論課件:博物館與觀眾
- 著色滲透探傷檢測報告
- 反恐培訓內容
- 配套課件-計算機網絡技術實踐教程-王秋華
- 農產品質量安全檢測機構考核評審細則
- 裝修申請審批表
- 建筑施工安全檢查標準jgj59-2023
- GB/T 3098.1-2010緊固件機械性能螺栓、螺釘和螺柱
評論
0/150
提交評論