試驗數(shù)據(jù)的正態(tài)性檢驗、數(shù)據(jù)的轉(zhuǎn)換及卡方檢驗_第1頁
試驗數(shù)據(jù)的正態(tài)性檢驗、數(shù)據(jù)的轉(zhuǎn)換及卡方檢驗_第2頁
試驗數(shù)據(jù)的正態(tài)性檢驗、數(shù)據(jù)的轉(zhuǎn)換及卡方檢驗_第3頁
試驗數(shù)據(jù)的正態(tài)性檢驗、數(shù)據(jù)的轉(zhuǎn)換及卡方檢驗_第4頁
試驗數(shù)據(jù)的正態(tài)性檢驗、數(shù)據(jù)的轉(zhuǎn)換及卡方檢驗_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試驗數(shù)據(jù)的正態(tài)檢驗、數(shù)據(jù)的轉(zhuǎn)換和卡方檢驗

目錄

一、符合正態(tài)分布的例子..............................................................1

二、不符合正態(tài)分布的例子...........................................................6

三、不符合正態(tài)分布數(shù)據(jù)的轉(zhuǎn)換及轉(zhuǎn)換后數(shù)據(jù)的方差分析...............................11

四、次數(shù)分布資料的卡方檢驗........................................................14

在對試驗數(shù)據(jù)進行方差分析前,應對數(shù)據(jù)的三性(即同質(zhì)性、獨立性和正態(tài)性)進行檢驗。本

文介紹對資料的正態(tài)性進行檢驗的方法,主要介紹3種檢驗方法:(1)頻數(shù)檢驗一一作頻率分布圖、

看偏度系數(shù)和峰度系數(shù),(2)作Q-Q圖檢驗,(3)非參數(shù)檢驗——單個樣本K-S檢驗。

下面以兩個試驗數(shù)據(jù)為例,例1為84頭育肥豬的體重數(shù)據(jù),通常符合正態(tài)分布。例2為生長育

肥豬7個試驗處理組的腹瀉率(百分數(shù)資料)統(tǒng)計結(jié)果,這類資料往往不符合正態(tài),而大多數(shù)人以

為是符合正態(tài)分布,進行方差分析的,因而不能得出正確的結(jié)論,卻可能得出錯誤結(jié)論。

一、符合正態(tài)分布的例子

【例1】84頭生長育肥豬的“體重”數(shù)據(jù)如表1-1,檢驗該數(shù)據(jù)是否呈正態(tài)分布。

表84頭育肥豬的“體重"數(shù)據(jù)(排序后)

No.體重No.體重No.體重No.體重No.體重No.體重No.體重No.體重No.體重

155.31171.62178.33181.24184.65188.66192.07199.481107.4

258.21272.12278.73282.24284.75288.86292.072100.782109.0

360.21372.82378.83382.44384.75389.26392.273102.483112.8

464.81473.62479.13482.84485.05489.96493.074103.084113.2

565.81575.92579.33582.84585.35590.46594.275105.4

666.71676.12679.73682.84685.75690.96695.376105.4

767.91777.02780.23783.54786.45791.06797.077105.4

868.41877.12880.63883.74886.85891.16897.878106.0

970.11977.22981.13984.34987.35991.26998.479106.2

1070.82078.13081.14084.45087.46091.47098.580107.3

檢驗方法一:頻數(shù)檢驗一一作頻率分布圖、看偏度系數(shù)和峰度系數(shù)

步驟1:數(shù)據(jù)錄入SPSS中,如圖1-1。

NO體重變量變量]

1155.30

2258.20

3360.20

446480

5565.80

6666.70

7767.90

8868.40

997010

10107080

111171.60

121272.10

圖1-1體重數(shù)據(jù)錄入SPSS中

步驟2:在SPSS里執(zhí)行“分析一>描述統(tǒng)計一>頻率”,然后彈出“頻率”對話框(圖l-2a),變

量選擇“體重”;再點右邊的“統(tǒng)計量”按鈕,彈出圖“頻率:統(tǒng)計量”對話框(圖l-2b),選

擇“偏度”和“豐度”(圖l-2b);再點右邊的“圖表”按鈕,彈出圖“頻率:圖表”對話框(圖

l-2c),選擇“直方圖”,并選中“在直方圖顯示正態(tài)曲線”

圖l-2a“頻率”對話框

集中趨勢

均值圖)

□中位數(shù)

□眾數(shù)(2)

口合計

值為組的中點也)

「分布?

囹偏度

囹蟾度

[繼續(xù)]取消j幫助

圖l-2b“頻率:統(tǒng)計量”對話框圖l-2c"頻率:圖表”對話框

設(shè)置完后點“確定”后,就會出來一系列結(jié)果,包括2個表格和一個圖,我們先來看看“統(tǒng)計

量”表,如下:

統(tǒng)計量

體重

N有效84

缺失0

偏度.040

偏度的標準誤.263

峰度-.202

峰度的標準誤.520

偏度系數(shù)=0.040,峰度系數(shù)-0.202;兩個系數(shù)都小于1,可認為近似于正態(tài)分布。再看直方圖(圖

1-3),如下:

體重

圖1-384頭育肥豬體重的頻數(shù)分布直方圖

圖1-3中橫坐標為“增重”,縱坐標為增重出現(xiàn)的“頻數(shù)”。根據(jù)直方圖及繪出的曲線,可以

認為該數(shù)據(jù)近似正態(tài)分布。

檢驗方法二:Q-Q圖檢驗

步驟1:數(shù)據(jù)錄入SPSS中,如圖1-1。

步驟2:在SPSS里執(zhí)行“描述統(tǒng)計一>Q-Q圖”,彈出“Q-Q圖”對話框,變量選擇“體重”,檢

驗分布選擇“正態(tài)”(見圖1-4),其他選擇默認,然后“確定”。

Q-Q圖

,變量在):檢臉分布CD

夕NO夕體重

df-

分布參數(shù)

囹從數(shù)據(jù)中估計(巨)

位留.I0

刻度:;1

-轉(zhuǎn)換

比例估計公式

□自然對數(shù)轉(zhuǎn)換(N)

@BlomCRankit?Tukey

口標準值g)

OVanderWaerden

0差分但)

為結(jié)指定的秩

IH季節(jié)性差分@):1

@均值(M)c高但)o低也)

當前周期:無

。強制打開結(jié)(K)

[確定[粘貼(g)重置回[取消幫助,

圖1-4“Q-Q圖”對話框

最后可以得到Q-Q圖檢驗結(jié)果,結(jié)果很多,我們只需要看最后一個圖,見圖1-5o所有數(shù)據(jù)

幾乎在一條直線上,表明近似正態(tài)分布。

體重的正態(tài)Q-Q圖

120-

望110-

100-

正90-

態(tài)80-

值70-

60-

圖1-584頭生長育肥豬的正態(tài)Q-Q圖

檢驗方法三:非參數(shù)檢驗——單個樣本K-S檢驗

步驟1:數(shù)據(jù)錄入SPSS中,如圖1-1。

步驟2:在SPSS里執(zhí)行“分析一>非參數(shù)檢驗一>舊對話框一〉單個樣本K-S檢驗”,彈出對話框,

檢驗變量選擇“期初平均分”,檢驗分布選擇“常規(guī)”(即正態(tài)分布),然后點“確定”(圖1-6)0

圖1一6單樣本K-S檢驗對話框

從以下結(jié)果可以看出,K-S檢驗中,Z值為0.563,漸近顯著性(雙側(cè))(即P值)=0.909>0.05,

因此數(shù)據(jù)呈近似正態(tài)分布。

單樣本Kolmogorov-Smirnov檢驗

體重

N84

正態(tài)參數(shù)”均值85.9654

標準差12.67824

最極端差別絕對值,061

正,061

負-.056

Kolmogorov-SmirnovZ.563

漸近顯著性(雙側(cè)).909

a.檢驗分布為正態(tài)分布。

b.根據(jù)數(shù)據(jù)計算得到。

二、不符合正態(tài)分布的例子

【例2】7個處理組,每個處理4個重復,每重復3頭生長育肥豬全期(98天)的腹瀉次數(shù)統(tǒng)計結(jié)

果見表1-2。“腹瀉率”統(tǒng)計結(jié)果,檢驗其是否符合正態(tài)分布?(腹瀉指數(shù)為每天有1頭豬發(fā)生腹

瀉,記為1頭次)。

表2-1生長育肥豬全期98天腹瀉次數(shù)統(tǒng)計及腹瀉率計算表

總指數(shù)(總頭數(shù))全期腹瀉率“

分組重復(頭數(shù))飼養(yǎng)天數(shù)腹瀉指數(shù)(腹瀉頭次)

(=3*98)(二腹瀉頭次/總頭次)

139832941.02

1398112943.74

139822940.68

139852941.70

2

2398102943.40

239862942.04

239862942.04

3398122944.08

339872942.38

33985529418.71

3398122944.08

4398232947.82

439812940.34

439822940.68

4398112943.74

53987429425.17

53984529415.31

53988329428.23

539842941.36

639872942.38

6398142944.76

639862942.04

6398222947.48

73987329424.83

739832941.02

739842941.36

73983629412.24

檢驗方法一:頻數(shù)檢驗一一作頻率分布圖、看偏度系數(shù)和峰度系數(shù)

步驟1:數(shù)據(jù)錄入SPSS中,如圖2-1。

分組重復飼養(yǎng)天數(shù)腹瀉指數(shù)總指數(shù)腹瀉率自然對數(shù)轉(zhuǎn)

后的腹瀉率

1139832941.02.02

21398112943.741.32

313982294.68-.39

4139852941.70.53

52

62398102943.401.22

7239862942.04.71

8239862942.04.71

93398122944.081.41

10339872942.3887

1133985529418.712.93

圖2-1腹瀉率數(shù)據(jù)錄入SPSS中

步驟2:在SPSS里執(zhí)行“分析一>描述統(tǒng)計一>頻率”,然后彈出“頻率”對話框(圖2-2a),變

量選擇“腹瀉率”;再點右邊的“統(tǒng)計量”按鈕,彈出圖“頻率:統(tǒng)計量”對話框(圖2-2b),

選擇“偏度”和“豐度”(圖2?2b);再點右邊的“圖表”按鈕,彈出圖”頻率:圖表”對話框(圖

2-2c),選擇“直方圖”,并選中“在直方圖顯示正態(tài)曲線”

回頻率(F)a

變量(丫):統(tǒng)計量@).j

夕分組6腹瀉率

,圖表?|

夕重復

,飼養(yǎng)天數(shù)?格式(£)—j

夕腹'瀉指數(shù)Bootstrap(B)...)

夕總指數(shù)

囹顯示頻率表格Q)

[確定]拈貼(E)J重置(E)[取消幫助

圖2-2a“頻率”對話框

B頻率:統(tǒng)計量

百分位值集中趨勢一

四分位數(shù)(2)均值(M)

害9點相等組中位數(shù)

百分位數(shù)宅):二眾數(shù)(9)

|添加(&匚合計

【更逅

;剜除(艮)

值為組的中點?)

高敬分布

標準差Q)「最小值9偏度

U方差£最大值,峰度

范圍均值的標準誤(£)

[繼續(xù)I取消幫助I

圖2-2b“頻率:統(tǒng)計量”對話框圖2-2c"頻率:圖表”對話框

設(shè)置完后點“確定”,就后會出來一系列結(jié)果,包括2個表格和一個圖,我們先來看看“統(tǒng)計

量”表,如下:

統(tǒng)計量

腹瀉率

N有效27

缺失1

偏度1.623

偏度的標準誤.448

峰度1.433

峰度的標準誤.872

偏度系數(shù)=1.623,峰度系數(shù)1.433;兩個系數(shù)都大于1,可認為不服從正態(tài)分布。再看直方圖(圖

2-3),如下:

圖2-3腹瀉率的頻數(shù)分布直方圖

圖2-3中橫坐標為“腹瀉率”,縱坐標為增重出現(xiàn)的“頻數(shù)”。根據(jù)直方圖可以看出,分布顯

然是偏態(tài)的,與正態(tài)分布曲線相差甚遠。

檢驗方法二:Q-Q圖檢驗

步驟1:數(shù)據(jù)錄入SPSS中,如圖2-1。

步驟2:在SPSS里執(zhí)行“描述統(tǒng)計一>Q-Q圖”,彈出“Q-Q圖”對話框,變量選擇“腹瀉率”,

檢驗分布選擇“正態(tài)”(見圖2-4),其他選擇默認,然后“確定”。

Q-Q圖

一檢蛤分布(I)一

8分組正哀▼

“重復

df

6飼養(yǎng)天數(shù)

岑腹瀉指數(shù)分布參數(shù)

6總指數(shù)

SI從數(shù)據(jù)中估計(£)

位置0

刻度|7

比例估計公式

?BlomORankitOTukey

?VanderWaerden

「為結(jié)指定的秩一

@均值(M)?*(H)?低&)

o強制打開結(jié)(K)

[確F]fcfe(p)]重麗,|飛歪:癡助

圖2-4“Q-Q圖”對話框

最后可以得到Q-Q圖檢驗結(jié)果,結(jié)果很多,我們只需要看最后一個圖,見圖2-5。腹瀉率數(shù)

據(jù)不在一條直線上,表明不符合正態(tài)分布。

腹巧率的出態(tài)Q?Q圖

態(tài)

'1%06102030

觀測值

圖2-5腹瀉率的正態(tài)Q-Q圖

檢驗方法三:非參數(shù)檢驗一一單個樣本K-S檢驗

步驟1:數(shù)據(jù)錄入SPSS中,如圖2?1。

步驟2:在SPSS里執(zhí)行“分析一>非參數(shù)檢驗一>舊對話框一〉單個樣本K-S檢驗”,彈出對話框,

檢驗變量選擇“腹瀉率”,檢驗分布選擇“常規(guī)”(即正態(tài)分布),然后點“確定”(圖2-6)。

圖2-6單樣本K-S檢驗對話框

檢驗結(jié)果為從結(jié)果可以看出,K-S檢驗中,Z值=1.544,漸近顯著性(雙側(cè))(即P值)=0.016<0.05,

因此數(shù)據(jù)分布不符合正態(tài)分布。

單樣本Kolmogorov-Smirnov檢驗

腹瀉率

N27

正態(tài)參數(shù)""均值6.7641

標準差8.30213

最極端差別絕對值.299

正.299

負-.220

Kolmogorov-SmirnovZ1.554

漸近顯著性(雙側(cè)).016

a.檢驗分布為正態(tài)分布。

b,根據(jù)數(shù)據(jù)計算得到。

后記:對于以上腹瀉率百分數(shù)資料的正態(tài)性檢驗,結(jié)果表明不符合正

態(tài)分布,因此不能用方差分析進行檢驗??蛇M行數(shù)據(jù)轉(zhuǎn)換(對數(shù)轉(zhuǎn)換等),

然后再對轉(zhuǎn)換后的數(shù)據(jù)進行正態(tài)性檢驗,或采用其他檢驗方法(如卡方檢

驗)。

數(shù)據(jù)的轉(zhuǎn)換和卡方檢驗方法介紹如下:

三、不符合正態(tài)分布數(shù)據(jù)的轉(zhuǎn)換及轉(zhuǎn)換后數(shù)據(jù)的方差分析

3.1“自然對數(shù)轉(zhuǎn)換”后的Q-Q圖

對于以上【例2】的腹瀉率數(shù)據(jù)進行自然對數(shù)轉(zhuǎn)換,可在Q-Q圖檢驗時,選擇“自然對

數(shù)轉(zhuǎn)換”,步驟如下:

在SPSS里執(zhí)行“描述統(tǒng)計一>Q-Q圖”,彈出“Q-Q圖”對話框,變量選擇“腹瀉率”,檢

驗分布選擇“正態(tài)”,在轉(zhuǎn)換中選擇“自然對數(shù)轉(zhuǎn)換”(見圖3-1),其他選擇默認,然后“確定”。

Q-Q圖

變量(Y):檢險分布CD—

夕分組夕腹瀉率正態(tài)

夕重復

df:

,飼養(yǎng)天數(shù)

,腹瀉指數(shù)分布參數(shù)

,總指數(shù)

畫從數(shù)據(jù)中估計(目

夕VAR00015

位匿叵二

刻度匚

-轉(zhuǎn)換

比例估計公式

M自然對數(shù)轉(zhuǎn)換型)

⑥Blom?Rankit?Tukey

0標準值?

◎VanderWaerden

0差分但):

-為結(jié)指定的秩一

目季節(jié)性差分(§):

◎均值(M)◎寓電)o低&)

當前周期:無。強制打開結(jié)(9

[確定]|粘貼也)||重力坦)j[取藪j|幫助j

圖3-1腹瀉率自然對換轉(zhuǎn)換后的“Q-Q圖”對話框

輸出結(jié)果見圖3-2??梢娝袛?shù)據(jù)幾乎在一條直線上,可認為近似正態(tài)分布。

腹瀉率的正態(tài)Q-Q圖

A

2-L

態(tài)

值0-

o12

觀測值

轉(zhuǎn)換:自然對數(shù)

圖3-2腹瀉率自然對換轉(zhuǎn)換后的“Q-Q圖”

3.2對自然對數(shù)轉(zhuǎn)換后的數(shù)據(jù)作頻率分布圖、看偏度系數(shù)和峰度系數(shù)

將以上【例2】的腹瀉率數(shù)據(jù)時行自然對數(shù)轉(zhuǎn)換,結(jié)果如下表。

腹瀉指數(shù)總指數(shù)自然對數(shù)轉(zhuǎn)換后的

分組重復(頭數(shù))飼養(yǎng)天數(shù)全期腹瀉率

(腹瀉頭次)(總頭數(shù))腹瀉率

139832941.020.02

1398112943.741.32

139822940.68-0.39

139852941.700.53

2

2398102943.401.22

239862942.040.71

239862942.040.71

3398122944.081.41

339872942.380.87

33985529418.712.93

3398122944.081.41

4398232947.822.06

439812940.34-1.08

439822940.68-0.39

4398112943.741.32

53987429425.173.23

53984529415.312.73

53988329428.233.34

539842941.360.31

639872940.024-3.738

6398142940.048-3.045

639862940.020-3.892

6398222940.075-2.593

7398732940.248-1.393

739832940.010-4.585

739842940.014-4.297

7398362940.122-2.100

自然對數(shù)轉(zhuǎn)換后腹瀉率的頻率分布圖(直方圖)、偏度系數(shù)和峰度系數(shù)如下:

圖3-3自然對數(shù)轉(zhuǎn)換后的腹瀉率的直方圖(近似正態(tài)分布)

統(tǒng)計量

自然對數(shù)轉(zhuǎn)后的腹瀉率

N有效27

缺失57

偏度.212

偏度的標準誤.448

峰度-.656

峰度的標準誤.872

自然對數(shù)轉(zhuǎn)換后的腹瀉率的偏度系數(shù)=0.213,峰度系數(shù)=-。656,均小于1。表明符合正態(tài)分

布。

3.3數(shù)據(jù)轉(zhuǎn)換前后的方差分析結(jié)果的比較

腹瀉率數(shù)據(jù)轉(zhuǎn)換前與轉(zhuǎn)換后的各組平均數(shù)如下:

描述性統(tǒng)計量

分組均值標準偏差N

腹瀉率11.78501.370584

22.4933,785203

37.31257.640484

43.14503.471504

517.517512.100364

64.16502.519604

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論