第7章 不同群體的差異比較抽樣調(diào)查課件_第1頁
第7章 不同群體的差異比較抽樣調(diào)查課件_第2頁
第7章 不同群體的差異比較抽樣調(diào)查課件_第3頁
第7章 不同群體的差異比較抽樣調(diào)查課件_第4頁
第7章 不同群體的差異比較抽樣調(diào)查課件_第5頁
已閱讀5頁,還剩168頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第7章不同群體的差異比較第一節(jié)假設檢驗概述主要內(nèi)容掌握假設檢驗的概念、基本思想和步驟;熟悉假設檢驗的分類;假設檢驗的兩類錯誤和注意事項;正態(tài)性檢驗的原理和方法;了解假設檢驗的思維方法和數(shù)據(jù)轉(zhuǎn)換的方法。7.1.1假設檢驗的概念、基本思想和步驟1、假設檢驗的原因由于個體差異的存在,即使從同一總體中嚴格的隨機抽樣,X1、X2、X3、X4、、、,不同。 因此,X1、X2不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。(2)分別所代表的總體均數(shù)不同。2、假設檢驗的目的判斷是由于何種原因造成的不同,以做出決策。3.假設檢驗的思想方法假設檢驗是用小概率事件原理做邏輯判斷的一種思想方法:通過統(tǒng)計學的計算分析,在某個假設(H0)條件下,發(fā)生事件A的可能性不到0.05,而在實際的研究中,一次抽樣就發(fā)生了事件A,那么研究者就認為所做假設(H0)不成立。4.假設檢驗思想的剖析

假設檢驗的基本思想類似于邏輯論證的反證法。它的程序是在檢驗一個假設是否成立時,先假定這個假設成立,如果由此導出一個不合理的現(xiàn)象(出理了小概率事件),就拒絕這個假設;如果沒有導出不合理的現(xiàn)象(未出理小概率事件),則不能拒絕原來假設。數(shù)學中邏輯論的反證法是由假設推導出與公理、定理或已知條件相矛盾的結(jié)論。從而推翻假設。統(tǒng)計中的假設檢驗則是由假設推出一個概率事件(并不是絕對矛盾)而拒絕假設。從這里也看拒絕假設還是一個犯錯誤的概率。只是這個概率很小而已。5.假設檢驗的一般步驟一、建立假設二、確定檢驗水準三、選擇統(tǒng)計分析方法及計算統(tǒng)計量四、求p值五、做統(tǒng)計結(jié)論一、建立假設假設有兩種:1.檢驗假設或無效假設,記做H0(假設比較的樣本來自相同的總體,它們的差別僅是由于抽樣誤差引起)2.備擇假設,記做H1,即假設比較的樣本的差別不是抽樣誤差引起的,而是來自不同的總體。如:

H0:

H1:二、確定檢驗水準檢驗水準,用希臘字母α表示。顯著性水平(

)就是我們用來區(qū)分大概率事件和小概率事件的標準,是人為規(guī)定的。當某事件發(fā)生的概率小于

時,則認為該事件為小概率事件,是不太可能發(fā)生的事件。通常

取0.05或0.01。α為犯第一類錯誤的概率,第一類錯誤即為拒絕了實際上成立的H0。

三、選擇統(tǒng)計方法和計算統(tǒng)計量根據(jù)資料的類型選擇選擇不同的統(tǒng)計方法,并計算不同的統(tǒng)計量。如兩個樣本均數(shù)的假設檢驗,樣本均數(shù)與總體均數(shù)的假設檢驗選用t檢驗法,計算t值多個均數(shù)的假設檢驗,選用方差分析,計算F值四、求p值意義:如果總體狀況和H0一致,樣本信息支持H0的概率。具體來說:如果H0成立,抽得現(xiàn)有樣本差別的概率P,亦就是現(xiàn)有樣本差別是由于抽樣原因引起的概率P。將計算得到的u值或t值與查表得到u

或t,ν,比較,得到P值的大小。如果|u|>u

或|t|>u

,則P<

;如果|u|<u

或|t|<u

,則P>

。五、推斷結(jié)果(1)如果p>

,認為在檢驗假設H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計量u值或t值的可能性大于

,不屬于小概率事件,則不拒絕H0,差別無統(tǒng)計學意義,結(jié)論是不認為兩總體均數(shù)不相等。

(2)如果p<

,我們認為在檢驗假設H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計量u值或t值的可能性小于

,可判斷為小概率事件,則拒絕H0,接受H1,差別有統(tǒng)計意義,結(jié)論是兩總體均數(shù)不相等,或者某一總體均數(shù)大于(或小于)另一總體均數(shù)。假設檢驗的結(jié)果α為0.05或0.01作為檢驗水準是人為的,可根據(jù)需要選擇。接受檢驗假設拒絕檢驗假設正確理解結(jié)論的概率性(都隱含著犯錯誤的可能性):(1)接受H0,拒絕H1,并非H1絕對不成立,只是H1成立的機會較??;(2)拒絕H0,接受H1,也并非絕對H0絕對不成立,也只是成立的概率較小。7.1.2假設檢驗的兩類錯誤不拒絕H0拒絕H0

推斷結(jié)論和兩類錯誤實際情況

檢驗結(jié)果H0真

第類錯誤

結(jié)論正確(1—)

H0不真

結(jié)論正確(1—)第Ⅱ類錯誤

型錯誤:拒絕了實際上成立的H0,這類“棄真”錯誤稱為

型錯誤,其概率大小用表示。Ⅱ

型錯誤:“接受”了實際上不成立的H0

,這類“存?zhèn)巍卞e誤稱為Ⅱ

型錯誤,其概率大小用表示通常情況下Ⅱ型錯誤未知對于一般的假設檢驗:

定為0.05(或0.01),

的大小取決于H1。通常情況下,比較總體間有無差異并不知道,即H1不明確,

值的大小無法確定,也就是說,對于一般的假設檢驗,我們并不知道犯Ⅱ型錯誤的概率

有多大。

當樣本容量n一定時,越小,越大;越大,越小。在實際工作中,往往通過去控制。I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗為例)

間的關系減少(增加)I型錯誤(),將會增加(減少)II型錯誤(),增大n同時降低

ab檢驗效能(powerofatest)1–

稱為假設檢驗功效,也稱把握度。意義:兩總體確有差別,被檢出有差別的能力如:1–=0.90,則意味著當H0不成立時,理論上在每100次抽樣中,在檢驗水準上平均有90次能拒絕H0

假設檢驗的注意事項一、事先進行嚴密的統(tǒng)計學設計基本原則:對照、隨機、重復、均衡。沒有對照就沒有鑒別。隨機:就是總體中的同質(zhì)單位,都有同等機會被抽到,隨機可以保證樣本對總體有代表性,避免主管偏向性。重復:就是適當?shù)臉颖竞?,樣本含量過少不能發(fā)現(xiàn)規(guī)律性,過多造成浪費,樣本含量根據(jù)實驗或抽樣調(diào)查要求,可查表或按公式計算求得。均衡:亦就是除處理因素外,其他因素都應保持基本相同。單側(cè)檢驗和雙側(cè)檢驗兩者是研究者根據(jù)分析目的和專業(yè)知識等信息采用的兩種不同檢驗形式。如:要了解新研制的某中藥對肝炎的治療效果。如果試驗組是在西藥治療的基礎上加新研制的中藥,中西藥的療效不會低于西藥組,就可以用單側(cè)檢驗,雙側(cè)檢驗特別適用于對預試驗結(jié)果進行分析。在同一檢驗水準下,單側(cè)檢驗比雙側(cè)檢驗的界值小,單側(cè)拒絕域比雙側(cè)的拒絕域大,比雙側(cè)檢驗更易得出拒絕H0,從而得出差別有統(tǒng)計學意義。靈活確定

水準一般取=0.05對于組間方差齊性檢驗或資料的正態(tài)性檢驗,研究者期望得到陰性結(jié)果,為了減少假陰性結(jié)果二類錯誤,由于一類錯誤和二類錯誤呈反比關系,取0.10,0.20或更大較為適宜。根據(jù)樣本特點,選用不同假設檢驗方法(1)計量資料的兩均數(shù)進行比較時,一般可選用t檢驗和u檢驗。對兩小樣本均數(shù)比較必須滿足兩個條件:正態(tài)性和方差齊性。(2)計數(shù)資料的率或構成比比較可選用檢驗(3)等級資料可選用秩和檢驗正確理解統(tǒng)計推斷的意義統(tǒng)計推斷的結(jié)論是依據(jù)現(xiàn)有的設計、現(xiàn)有的研究方法與條件、現(xiàn)有的資料及其分析目的和要求,所取的檢驗水準,所采用的統(tǒng)計分析方法等所做出的具有相應概率意義的解釋,不宜將結(jié)論的意義擴展或縮小。假設檢驗的結(jié)論不能絕對化統(tǒng)計結(jié)論是具有概率性質(zhì)的推論,不能使用“證明”、“肯定”、“一定”、“說明”等詞。有統(tǒng)計學意義時不一定有專業(yè)意義。若樣本足夠大或標準差特別小,即使兩均數(shù)間相差很小,也可能得出P≤0.05的結(jié)果。結(jié)合專業(yè)知識作出推論假設檢驗能夠幫助研究者做出較合理的推斷,但不能代替研究者做出專業(yè)結(jié)論。CI與假設檢驗的區(qū)別和聯(lián)系CI推斷參數(shù)值的范圍;由于CI給出了具體的數(shù)量范圍,即可回答差別有無顯著的統(tǒng)計學意義,還可提示差別有無實際意義。.假設檢驗判斷各參數(shù)間有無質(zhì)的不同,可以獲得較為確切的概率值。7.1.3正態(tài)性檢驗與數(shù)據(jù)轉(zhuǎn)換對數(shù)值變量進行假設檢驗時應先進行正態(tài)性檢驗和方差齊性檢驗,必要時還需要對資料進行數(shù)據(jù)轉(zhuǎn)換,已使資料滿足數(shù)值變量資料統(tǒng)計方法的應用條件——正態(tài)性和方差齊性。第二節(jié)統(tǒng)計檢驗的前期工作——對數(shù)據(jù)分布特征的檢驗7.2.1正態(tài)性檢驗矩法D檢驗法Jarque-Bera檢驗圖方法非參數(shù)檢驗方法矩法偏度系數(shù)和峰度系數(shù)偏度系數(shù)g1表示分布的對稱性g1=0:對稱g1>0:正偏態(tài)g1<0:負偏態(tài)峰度系數(shù)g2表示峰型g2=0:正態(tài)峰g2>0:尖峭峰g2<0:平闊峰若g1=0且g2=0則為正態(tài)分布D檢驗法計算步驟(頻數(shù)表資料)無效假設H0:總體服從正態(tài)分布計算統(tǒng)計量D值其中,x

為各組組中值,f為各組頻數(shù),T

為各組平均秩次,n

為總例數(shù)查D界限值表,做出結(jié)論Jarque-Bera檢驗(偏度和峰度的聯(lián)合分布檢驗法)檢驗統(tǒng)計量為JB=JB過大或過小時,拒絕原假設。圖方法1、P-P圖以樣本的累計頻率作為橫坐標,以按照正態(tài)分布計算的相應累計概率作為縱坐標,做散點圖。如果資料服從整體分布,則樣本點應圍繞第一象限的對角線分布。

2、Q-Q圖以樣本的分位數(shù)作為橫坐標,以按照正態(tài)分布計算的相應分位點作為縱坐標,把樣本表現(xiàn)為直角坐標系的散點。如果資料服從正態(tài)分布,則樣本點應該呈一條圍繞第一象限對角線的直線。以上兩種方法以Q-Q圖為佳,效率較高。3、直方圖,是否以鐘形分布。4、箱式圖,觀測離群值和中位數(shù)。5、莖葉圖,類似與直方圖,但實質(zhì)不同。7.2.2軟件操作Descriptive–Explore考察“統(tǒng)計分析案例”的“男、女”“環(huán)境分數(shù)”的正態(tài)分布Analyze-NonparametricTest-K-s考察“統(tǒng)計分析案例”的“男、女”“環(huán)境分數(shù)”的正態(tài)分布,分組用Split–FileGraph-Legacy“環(huán)境分數(shù)”的正態(tài)分布,”“性別”分類,”年級聚類“第三節(jié)兩個獨立樣本差異的顯著性檢驗——兩個群體差異的比較之一平均數(shù)差異的顯著性檢驗方差齊性條件下,平均數(shù)差異顯著性檢驗方差不齊性獨立小樣本平均數(shù)差異的顯著性檢驗假設檢驗方差齊性檢驗總體方差未知,獨立樣本t檢驗的完整過程方差齊性條件下,平均數(shù)差異顯著性檢驗的統(tǒng)計量及計算公式平均數(shù)差異的顯著性檢驗時,統(tǒng)計量的基本計算公式為:H0:μ1=μ2

表示之差的標準差⑴兩樣本相關⑵兩樣本獨立1.兩總體正態(tài),總體標準差已知總體標準差已知條件下,平均數(shù)之差的抽樣分布服從正態(tài)分布2兩總體正態(tài),標準差未知,方差齊性,n1或n2小于30總體標準差未知條件下,平均數(shù)之差的抽樣分布服從t分布。計算公式為:(1)兩樣本相關

還可以計算為:(2)兩樣本獨立總體標準差未知條件下,平均數(shù)之差的抽樣分布服從t分布,但樣本容量較大,t分布接近于正態(tài)分布,可以以Z近似處理,因此以Z′作為檢驗統(tǒng)計量,計算公式為:

3.兩總體非正態(tài),n1和n2大于30(或50)

(1)兩樣本相關(2)兩樣本獨立不能對平均數(shù)差異進行顯著性檢驗。4.兩總體非正態(tài),小樣本

方差不齊性獨立小樣本平均數(shù)差異的顯著性檢驗

對于方差不齊性的獨立小樣本,平均數(shù)差異的顯著性可能由兩方面的原因造成:一是兩平均數(shù)確實存在顯著差異;二是兩總體方差之間存在顯著差異。當兩總體的方差之間差異顯著時,運用一般的t檢驗不準確,需要進行特別的檢驗。1.統(tǒng)計量及計算公式

總體方差不齊性的兩個獨立樣本平均數(shù)之差的標準誤,可用兩個樣本方差分別估計出的兩個平均數(shù)標準誤平方之和再開方來表示。這時樣本平均數(shù)之差與相應總體平均數(shù)之差的離差統(tǒng)計量,既不是Z分布,也不是t分布,而是與t分布相近似的t′分布。

這種檢驗方法被稱為柯克蘭—柯克斯t檢(Cochran

-Cox),其統(tǒng)計量的計算公式為:

2.t′臨界值的計算公式方差齊性檢驗

方差齊性檢驗是對兩總體方差是否齊性(即是否一致或是否存在顯著性差異)進行的檢驗。方差齊性檢驗的統(tǒng)計量是F,其概率分布遵循F分布。

當總體方差未知時,對獨立小樣本進行t檢驗的完整過程有兩種方式:總體方差未知,獨立樣本t檢驗的完整過程1.先做方差齊性檢驗方差齊性檢驗方差齊性方差不齊性t檢驗t′檢驗2.先按方差齊性進行差異檢驗方差齊性獨立樣本t檢驗差異不顯著接受差異不顯著的檢驗結(jié)論差異顯著方差齊性檢驗方差齊性方差不齊性t′檢驗接受差異顯著的檢驗結(jié)論非參數(shù)檢驗方法Kolmogorov-Smirnov檢驗(D檢驗)Shapiro-Wilk(W檢驗)Mann-WhitneyutestWald-WolfowitzrunTestMosesextremereactionstestIndependent–SampleTtest”男、女””環(huán)境變量“,演示“學習狀態(tài)”cutpoint男女”環(huán)境變量‘兩獨立樣本K-S檢驗,Transform-RankcasesTesttype選項應用第四節(jié)兩個配對樣本差異的顯著性檢驗——兩個群體差異的比較之二配對資料t檢驗(Paired-SamplesTTest)資料類型:兩個同質(zhì)對象接受不同處理;同一受試對象分別接受不同的處理,同一受試對象處理前后。條件:差值d服從正態(tài)分布。一般的,配對樣本T檢驗用于檢驗兩個相關的樣本是否來自具有相同均值的總體,實質(zhì)是檢驗差值變量的均值與0之間差異的顯著性。計算公式Spss操作:在菜單欄中Analyze|CompareMeans|Paired-SamplesTTest非參數(shù)檢驗兩個非正態(tài)總體的差異SigntestWilcoxonSigned-ranktestMcNemartestMarginalHomogeneitytest操作途徑Analyze-NonparametricTests-2Related-Samples例子“技術培訓效果比較”,前后考評分數(shù)案例11、學生對教學改革態(tài)度的分析(onesample)某校在對實行掛牌上課教學改革措施的效果評價中,隨機抽選了60位學生進行態(tài)度調(diào)查,他們的10項態(tài)度量表的態(tài)度反映資料如下:掛牌上課態(tài)度反映得分(X)人數(shù)(f)10—2020—3030—4040—5050—6060—702610122010合計60案例1

(1分表示“很不同意”,7分表示“很同意”,將10項態(tài)度分累加后得一總態(tài)度分,這種量叫7級李克累加量表):試計算:(1)學生態(tài)度得分的平均值和標準差;(2)構造學生態(tài)度得分平均值的98%置信區(qū)間。操作步驟:(1)定義變量X(轉(zhuǎn)換-計算變量,表達式…)和f,X為組中值,輸入數(shù)據(jù)資料;(2)選擇DataWeightCases,加權個案,頻率變量,確定。(3)選擇AnalyzeComparemeansone-sampleTTest(4)將變量X放入Test欄中(5)激活子對話框,置信度為98%,單擊按鈕,返回one-sampleTTest主對話框;(6)單擊按鈕執(zhí)行。Options…ContinueOKT-Test

結(jié)論:表1:學生態(tài)度得分的平均值為47分,標準差為13.6295分.表2:以98%的置信區(qū)間估計學生總體態(tài)度得分平均值的置信區(qū)間為(42.7925,51.2075)從中可以反映出學生對掛牌上課這一教改措施普遍贊成,但并不十分擁護,可見還需進一步改進和完善.案例2___電視廣告平均受益量的估計2、某電視臺廣告部想要估計一下各企業(yè)在該電臺的黃金時間播放電視廣告后的一個月內(nèi)的平均受益量.為此他們抽取了33家播放廣告的同類企業(yè)的隨機樣本,資料如下:該電視臺想以95%的置信度宣布平均受益量(平均利潤增長量),試構造適當?shù)闹眯艆^(qū)間.案例2數(shù)據(jù)企業(yè)序號1234567891011利潤增量(萬元)7.38.67.76.59.48.37.110.25.49.28.8企業(yè)序號1213131415161718192021利潤增量(萬元)9.76.94.311.28.28.77.69.16.68.58.9企業(yè)序號2324252627282930313233利潤增量(萬元)10.412.814.67.511.76.013.213.69.05.99.6解:該電視臺宣布的平均受益量應是最小受益量,故構造置信下限.設X為企業(yè)利潤增量.操作步驟:

(1)定義變量X輸入數(shù)據(jù)資料;(2)選擇AnalyzeComparemeansone-sampleTTest(3)將變量X放入Test欄中(4)激活子對話框,置信度改為90%,單擊按鈕,返回one-sampleTTest主對話框;(5)單擊OK按鈕執(zhí)行Options…ContinueT-Test結(jié)論:表1:33家平均受益量為8.8636萬元,標準差為2.4027萬元.表2:該項電視臺可以95%的置信度宣布在該電臺黃金時間做廣告給企業(yè)帶來的平均受益量至少在8.1552萬元以上.注意:此題是作業(yè)。實例分析3___新舊電池使用壽命比較(Independent)

某一個新的制造過程可以增加電池的使用壽命,假設電池使用壽命服從正態(tài)分布.在新電池中隨機抽取15個,而在舊電中隨機抽取12個同時測試其使用壽命,資料如下:新舊兩種電池平均使用壽命之差95%的置信區(qū)間.新電池(日):18.2\10.4\12.6\18.0\11.7\15.0\24.0\17.6\23.6\24.8\19.3\20.5\19.8\17.1\16.3舊電池(日):12.1\17.5\8.6\13.9\7.8\15.1\17.9\10.6\13.8\14.2\15.3\11.6解:已知的原始數(shù)據(jù)是總體服從正態(tài)分布的兩個獨立樣本。設X代表電池使用壽命,g代表分組號操作步驟:(1)定義變量X和g,輸入數(shù)據(jù)資料,新舊電池壽命數(shù)據(jù)全部輸入X同一列中,g分別取1和2,新電池組號為1,舊電池組號為2(2)選擇AnalyzeCompareMeansIndependent-SamplesTTest,打開Independent-SamplesTTest對話框(3)將變量X放入Test欄中(4)激活DefineGroups按鈕,打開該對話框Groups1中輸入1Groups2中輸入2,單擊Continue返回主對話框;(5)單擊OK按鈕執(zhí)行T-Test結(jié)論:表1:得出兩個獨立樣本各自的均值,標準差以及平均標準誤差.新電池的平均使用壽命明顯長于舊電池。表2:可以看出新舊電池平均使用壽命之差的95%的置信區(qū)間為:若兩個樣本方差相等則為(2.4454,8.6746);若兩個樣本方差不等則為(2.5437,8.5763)實例分析4___吸煙有害廣告作用的分析(Paired)

形形色色的廣告已深入到社會各個方面,與人民生活密不可分.成功的廣告將留給人們較深的印象,并帶給企業(yè)豐厚的回報,如何鑒定廣告的效果,如何選擇最佳的廣告制作,對此西方國家更多地采用統(tǒng)計方法來判斷,舉例如下:為了研究吸煙有害廣告對吸煙者減少吸煙量甚至戒煙是否有作用,從某吸煙者中隨機抽取33位吸煙者,調(diào)查他們在觀看廣告前后的每天吸煙量(支)數(shù)據(jù)如下表.試問影片對他們的吸煙量有無產(chǎn)生作用?為了支持你的答案,請構造一個99%的置信區(qū)間.吸煙者編號1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸煙者編號1213141516171819202122看前X1(支)看后X2(支)1710333425208441401910263016163120271862吸煙者編號2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821解:配對樣本的試驗,比較觀看前后平均數(shù)的大小可解決第一個問題,求出兩平均數(shù)之差的99%的雙側(cè)置信區(qū)間可解答第二個問題.操作步驟:1)定義變量X1和X2,輸入數(shù)據(jù);(2)選擇AnalyzeComparemeansPaired-samplesTTest(3)將變量X1和X2放入Test欄中(4)激活Options…子對話框,置信度改為99%,單擊Continue按鈕,返回Paired-samplesTTest主對話框;(5)單擊OK按鈕執(zhí)行T-Test結(jié)論:表1:顯示觀看影片前的平均每日吸煙量約為21.5758支.觀看影片后的平均每日吸煙量約為17.5758支,說明該影片發(fā)生了作用.表2:反映了影片觀看前與后存在著顯著相關關系,相關系數(shù)為0.878.表3:顯示了前后兩個總體平均每日吸煙量之差的99%置信區(qū)間為(1.4888,6.5112),這意味著不管隨機抽到哪幾對樣本單位做調(diào)查,均有99%的把握保證,觀看影片前的平均每日吸煙量大于觀看影片后的平均每日吸煙量之差在(1.4888支至6.5112支之間,即大約在2—7支之間.第五節(jié)單因素方差分析—多個群體差異的比較之一7.5.1一個完整的單因素方差分析實例Step1正態(tài)性檢驗Step2方差齊性檢驗Step3方差檢驗(方差分析表)Step4追蹤分析:多重比較Step5區(qū)間估計理論準備方差齊性檢驗:理論準備方差齊性檢驗:理論準備方差齊性檢驗:“統(tǒng)計案例”不同年級“環(huán)境利用水平”的方差分析書本,注意“對比”contrast提高:單因素重復測量案例假設你是某個企業(yè)的HR,你觀察到員工似乎在周一的情緒比較糟糕,而到了周五(周末前)則明顯好轉(zhuǎn)。員工私下里也會討論什么“星期一綜合癥”之類的話題,于是,你找到一個調(diào)查員工快樂水平的包含20個項目(均為“是”或“否”選項)測量表,選擇“是”越多表示快樂水平越高。在這個準實驗設計中,自變量包含三個水平(k=3):1)星期一;2)星期三;3)星期五。你隨機從公司里抽取了6(n=6)名員工來完成這個研究,最后,收集到的數(shù)據(jù)如下表所示:案例數(shù)據(jù)假設設置虛無假設表述的是工作周不同的時間點對員工心情沒有影響,亦即不管在星期幾,員工的心情都是一樣開心的。對應的備擇假設表述的是,員工的心情受到所處的工作周的時間點的影響,即H0:μ1=μ2=μ3H1:以上三個均值不全相等。下面是計算步驟:第一步:總變異分解SST=∑Xij2-(∑Xij)2/N =247.11SSBG=∑X*j2/nj-(∑Xij)2/N=31.44SSwg=SST-SSBG =215.67公式1公式2公式3第二步:移除個別差異導致的變異計算被試間的平方和。將數(shù)據(jù)中每個被試當做是一個處理,那么每個“處理”(被試)下面有三個分數(shù),然后同樣使用ANOVA中計算處理間變異的公式(在這里k=6,而每組內(nèi)n=3)這個平方和提供了對個別差異的一個量度,將個別差異的變異從處理內(nèi)變異中減去,就得到F比率分母部分的誤差(殘差)平方和。 =36.67-31.44=5.23(SSerror=SSwithin-SSbetweensubjects)各個平方和對應的自由度第一步:dft=N-1=18-1=17dfbg=k-1=3-1=2dfwg=N-k=18-3=15第二步:dfsubject=n-1=6-1=5dferror=dfwithin-dfsubject=15-5=-10計算對應的均方和F比率247.11215.6731.445.23210.440.52315.7230.06方差分析表多重比較法拒絕H0,接受H1,表示總體均數(shù)不全相等哪兩兩均數(shù)之間相等?哪兩兩均數(shù)之間不等?————>需要進一步作多重比較。方差分析結(jié)果不拒絕H0,表示拒絕總體均數(shù)相等的證據(jù)不足,

————>分析終止。

常用多重比較法

最小顯著差數(shù)法(Leastsignificantdifference,簡稱LSD法)

水平數(shù),每個樣本的容量,都相等。

q法(又稱SNK(student-Newman-Keuls)檢驗法)q測驗方法是將r個平均數(shù)由大到小排列后,根據(jù)所比較的兩個處理平均數(shù)的差數(shù)是幾個平均數(shù)間的極差分別確定最小顯著極差LSRα值的。下面介紹2個改進的最小顯著極差法

級極差的檢驗

Tukey法(又稱honestlysignificantdifference,簡稱HSD

)這里顯然指兩個均值差異的比較,Tukey對法似乎有不同的版本。

Bonferroni法Bonferroni法是根據(jù)所比較的兩個處理平均數(shù)的個數(shù)k,將檢驗水平縮小k倍成為真實比較水平,確定是幾個平均數(shù)間的極差分別確定最小顯著差數(shù)LSDα值的。由“2”知,這里顯然指兩個均值差異的比較。

多重比較法選擇1.試驗事先確定比較的標準,凡是與對照相比較,或與預定要比較的對象比較,一般可選用最小顯著差數(shù)法LSDa法;2.根據(jù)否定一個正確的H0和接受一個不正確的H0的相對重要性來決定。參考以下觀點:根據(jù)試驗的側(cè)重點選擇。三種方法的顯著尺度不相同,LSD法最低,HSD法次之,SNK法最高。故對于試驗結(jié)論事關重大或有嚴格要求時,用SNK法,一般試驗可采用HSD法。當比較次數(shù)不多時,Bonferroni法的效果較好;但當比較次數(shù)較多(例如在10次以上)時,則由于其檢驗水準選擇得過低,結(jié)論偏于保守。第六節(jié)多個樣本的非參數(shù)檢驗——多個群體差異的比較之二

6.0什么是非參數(shù)檢驗?和數(shù)據(jù)本身的總體分布無關的檢驗稱為非參數(shù)檢驗--不假定總體的具體背景分布形式;--多根據(jù)數(shù)據(jù)觀測值的相對大小建立檢驗統(tǒng)計量,然后找到在零假設下這些統(tǒng)計量的分布,看這些統(tǒng)計量的數(shù)據(jù)實現(xiàn)是否在零假設下屬于小概率事件。t-檢驗、方差分析、相關、回歸的顯著性檢驗,都需要利用總體分布的信息,因此這些檢驗都稱為參數(shù)檢驗而非參數(shù)檢驗由于不涉及總體參數(shù),也不依賴于總體分布的形式,因此它與總體分布狀況無關,因此非參數(shù)檢驗又稱為無分布檢驗(distribution-freetest)非參數(shù)檢驗是利用樣本數(shù)據(jù)之間的大小比較以及大小順序,對2個或多個樣本所屬總體是否相同進行檢驗非參數(shù)檢驗常用在以下情況:(1)樣本所在總體的分布狀況未知,或知之甚少無法肯定總體分布的性質(zhì)(2)樣本觀測值明顯偏離正態(tài)分布,因而不具備參數(shù)檢驗的應用條件非參數(shù)檢驗具有以下優(yōu)點:計算簡便、直觀、易于掌握、檢驗速度快非參數(shù)檢驗的效率在資料符合參數(shù)檢驗的條件時,非參數(shù)檢驗的效率始終低于參數(shù)檢驗法,這是因為:非參數(shù)檢驗法沒有充分利用已知的總體分布信息也沒有充分利用樣本提供的信息,因而非參數(shù)檢驗的功效較低,犯Ⅱ型錯誤的可能性較大6.1多個樣本的非參數(shù)檢驗的統(tǒng)計學定義和計算公式定義:多獨立樣本非參數(shù)檢驗分析樣本數(shù)據(jù)是推斷樣本來自的多個獨立總體分布是否存在顯著差異。SPSS多獨立樣本非參數(shù)檢驗一般推斷多個獨立總體的均值或中位數(shù)是否存在顯著差異。多獨立樣本的簡判:在一個總體中抽取樣本對其他總體中抽取樣本沒有影響。1.多獨立樣本的中位數(shù)檢驗(Median)多獨立樣本的中位數(shù)檢驗通過對多組數(shù)據(jù)的分析推斷多個獨立總體分布是否存在顯著差異。原假設H0:樣本來自的多個獨立總體的中位數(shù)無顯著差異。

SPSS中有3種多獨立樣本非參數(shù)檢驗方法基本思想:如果各組樣本的測定數(shù)據(jù)的分布無差異,那么各組獨立樣本的中位數(shù)無顯著差異,也就是可以說各組樣本擁有共同的中位數(shù)。這個共同的中位數(shù)在每組樣本中都應該處于中間位置。故可檢驗其中位數(shù)上下各有觀察值數(shù)目的差異在各組之間是否有統(tǒng)計意義,從而作出統(tǒng)計推斷。檢驗計算步驟以及檢驗統(tǒng)計量:1.將各組樣本(A、B…)資料混合由小到大排列。求混合資料的中位數(shù)md。2.對每一樣本分別計數(shù)超過共同中位數(shù)以及小于等于共同中位數(shù)的數(shù)據(jù)個數(shù)。列成表格。4.用卡方檢驗法或精確概率法(理論頻數(shù)小于5時)進行檢驗。第1組樣本第2組樣本…第k組樣本混合樣本>md的個數(shù)O11(E11)O12(E12)O1k(E1k)N1≤md的個數(shù)O21(E21)O22(E22)O2k(E2k)N2O1i(O2i):第i組樣本中,觀測到>(≤)md的個案數(shù)。N1(N2):混合樣本中,>(≤)md的個案數(shù)。N=N1+N2E1i(E2i):第i組樣本中,>(≤)md的期望個案數(shù)。ni:第i組樣本的樣本容量。(各個子樣遵從兩項分布,其中的參數(shù)估計有混合樣本獲得。)

當Eij都大于5時,構造卡方統(tǒng)計量給出檢驗:2.多獨立樣本的K-W檢驗多獨立樣本的Kruskal-Waillis檢驗,是一種推廣的平均秩檢驗。原假設H0:樣本來自的多個獨立總體的分布(的位置參數(shù))無顯著差異?;痉椒ǎ菏紫葘⒍嘟M樣本數(shù)混合按升序排列,并求出每個觀察值的秩,然后對各組樣本的秩分別求出平均值。如果各組樣本的平均秩大致相等,則可以認為多個獨立總體的分布沒有顯著差異。如果各樣本的平均秩相差很大,則不能認為多個獨立總體的分布無顯著差異??疾焯幚黹g平方和占總方差的比重:K-W檢驗統(tǒng)計量:K-W檢驗統(tǒng)計量:ni:第i組樣本的樣本容量。N:混合樣本的總樣本容量。:第i組樣本的平均秩。:平均秩(N+1)/2。SPSS編秩的方法:Transform/rankcases此過程可以進行樣本編秩,秩的累計頻率等數(shù)值計算。3.多獨立樣本的Jonkheere-Terpstra檢驗多獨立樣本的Jonkheere-Terpstra檢驗用于分析樣本來自的多個獨立總體分布(的位置參數(shù)是否具有方向性)是否存在顯著差異。原假設H0:樣本來自的多個獨立總體的分布無顯著差異。備擇假設是呈某種方向性的,要求樣本的變化按此方向性進行,例如通過觀察,按大小順序編號。檢驗統(tǒng)計量:Uij:第i組樣本觀察值小于第j組樣本觀察值的個數(shù)。(從后半部分顯示這里是針對可能有結(jié)的情形的。)其實,這里計算的J-T統(tǒng)計量是按照組號(1,2,3)。按照組序號的不同順序可以計算出所有的J-T值,進而可以得到J-T的均值E(J)和方差D(J),于是自然的想利用漸近正態(tài)性。研究問題隨機抽取3個班級的學生,得到21個學生成績樣本,如表6.2所示,問3個班級學生總體成績是否存在顯著差異?6.2SPSS中實現(xiàn)過程舉例表6.2 3個班級學生成績學生成績所屬班級學生成績所屬班級60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002spss實現(xiàn)步驟圖6.2-1在菜單中選擇“KIndependentSamples”命令圖6.2-2“TestsforSeveralIndependentSamples”對話框設置分組變量及其取值范圍。定義檢驗變量三種可選的檢驗方法同前。注意小樣本情況下選擇精確檢驗圖6.2-3“SeveralIndependentSamples:DefineRange”對話框定義最小組序號和最大組序號6.3結(jié)果和討論(1)多獨立樣本K-W檢驗結(jié)果如下兩表所示。(2)多獨立樣本中位數(shù)檢驗結(jié)果如下兩表所示。Oij值列表。作業(yè)中需要按照第8頁ppt的表格那樣注明Eij的值此時不宜參看正態(tài)近似檢驗。需要選擇精確檢驗。(3)多獨立樣本Jonckheere-Terpstra檢驗結(jié)果

KindependentSamples分析“統(tǒng)計案例”不同年級學生的“環(huán)境利用”KRelatedSamples分析“專家組對學習教學評價”不同年級學生的“環(huán)境利用”KRelatedSamplesCochranQ“學生對教師評價”多個相關樣本的非參數(shù)檢驗Friedman秩和檢驗Kruskal-Wallis檢驗是針對完全隨機試驗數(shù)據(jù)的非參數(shù)分析方法,在隨機區(qū)組情形下,可以用類似的兩因素秩方差分析法。Friedman秩和檢驗假定這些樣本有連續(xù)分布F1,…,Fk,F(xiàn)為某連續(xù)分布函數(shù),形式上,零假設為H0:F1=…=Fk,備選假設為Ha:Fi(x)=F(x+qi),i=1,…,k,諸參數(shù)qi并不相等(實質(zhì)是關于位置qi的檢驗。)由于區(qū)組的影響,要首先在每一個區(qū)組中計算各個處理的秩;再把每一個處理在各區(qū)組中的秩相加.如果Rij表示在j個區(qū)組中第i個處理的秩。則秩按照處理而求得的和為

這樣做的目的是在每個區(qū)組內(nèi)比較處理。例如,同個年齡段中比較藥品的療效比不分年齡來比較療效要合理;在同一個部位比較不同的材料要比混合起來比較要合理等等。Friedman秩和檢驗

Friedman統(tǒng)計量定義為第一個式子表明,如果各個處理(水平)很不一樣,和的平方就會很大,結(jié)果就顯著。第二個公式是為了計算方便而導出的。它有近似的(有k-1個自由度的)c2分布。

注意:當區(qū)組數(shù)較大或處理組數(shù)較小時,效果不好,需要用aligned-rankstestorHodges-_lehmmann檢驗。(處理間平方和出于總方差的估計值,再乘上一個校正系數(shù)(k-1)/k)Kendall協(xié)同系數(shù)檢驗在實踐中,常需要按照某些特定的性質(zhì)來多次對一些個體進行評估或排序;比如幾個(m個)評估機構對一些(n個)學校進行排序。人們想要知道,這些機構的不同結(jié)果是否一致。如果很不一致,則該評估多少有些隨機,意義不大。換句話說,這里想要檢驗的零假設是:這些對于不同學校的排序是不相關的或者是隨機的;而備選假設為:這些對不同學校的排序是正相關的或者是多少一致的。Kendall協(xié)同系數(shù)檢驗正式提法假設k個變量,每個變量對應n個觀測值,即為在中的秩。假設檢驗問題:Kendall協(xié)同系數(shù)檢驗思路一個機構對n個體的秩和為1+2+…+n=n(n+1)/2;所有m個機構對所有個體評估的總秩為mn(n+1)/2;于是每個個體的平均秩為m(n+1)/2。如果記第i個個體的m個秩和為Ri(i=1,…,n),那么,如果評估是隨機的,這些Ri與平均秩的差別不會很大,反之差別會很大,也就是說下面的個體的總秩與平均秩的偏差的平方和S很大。S定義為S與Kendall協(xié)同系數(shù)(Kendall’sCoefficientofConcordance)W是成比例的(Friedman檢驗統(tǒng)計量的標準化)實際檢驗時,可以查零分布表在n固定,時:可以利用漸進性進行檢驗,對于有打結(jié)情況的數(shù)據(jù),需要用調(diào)整公式計算。當各個個體顯著不同時,若他們的秩不存在顯著差異,則意味著評委的打分存在隨意性,評分標準不一致(如果各個評委的評判標準是一致的,那么某個個體將獲得一致的分數(shù),也就是說,評委給出的若干個評分的秩應完全相同,這就必然會導致各個體得分的秩有較大的差異。關于二元響應的Cochran檢驗

前面討論了兩因子方差分析問題的Friedman秩和檢驗。但是當觀測值只取諸如0或1兩個可能值時,由于有太多同樣的數(shù)目(只有0和1),排序的意義就很成問題了。Cochran1950年提出Cochran檢驗。零假設:各個總體分布相同(或各個處理發(fā)生概率相等)。實例:關于瓶裝飲用水的調(diào)查20名顧客對4種瓶裝飲用水進行了認可(記為1)和不認可(記為0)的表態(tài)。問這幾種瓶裝水在顧客眼中是否有區(qū)別?這里的零假設是這些瓶裝水(作為處理)在(作為區(qū)組的)顧客眼中沒有區(qū)別。下表是數(shù)據(jù),每一行為20個顧客對某一飲料的20個觀點(0或1)。最后一列中Ni為認可總數(shù),而最后一行為每個顧客給出的4個觀點中認可數(shù)的總和Li。最后一行的最后的元素為總認可數(shù)N。如果Ni和這些Ni的均值的差距很大,那么這些處理(水平)就很不一樣了。用Ni

表示第i個處理所得到的“1”的個數(shù),而Lj為第j個區(qū)組(第j個顧客)所給的“1”的個數(shù),所有“1”的總數(shù)記為N。

二元響應的Cochran檢驗思路Cochran檢驗統(tǒng)計量(Cochran’sQ)假定有k個處理和b個區(qū)組,零假設下各處理發(fā)生的概率相等,則Ni為兩項分布,大樣本下,Ni近似為正態(tài)分布,

則近似卡方分布,經(jīng)過一系列推理與最后的系數(shù)修正,得到Cochran’sQ:當k固定時,Q在b很大時有近似的自由度為k-1的c2分布。

Spearman秩相關檢驗檢驗問題設樣本來自總體:

設是在中的秩,是在中的秩。秩的簡單相關系數(shù):

秩相關系數(shù)可簡化為:檢驗在零假設成立時,服從自由度為的t分布。時表示正相關。在存在重復數(shù)據(jù)的時候,可以采用平均秩,節(jié)不多的時候,T仍然可以采用。在大樣本情況下,可以采用正態(tài)近似進行檢驗:在出現(xiàn)打結(jié)的時候,需要使用修正公式計算。當相關檢驗Kendall(1938)提出一種類似于Spearman秩相關的檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論