正態(tài)性檢驗(yàn)和正態(tài)轉(zhuǎn)換的方法以與在SPSS中的實(shí)現(xiàn)_第1頁
正態(tài)性檢驗(yàn)和正態(tài)轉(zhuǎn)換的方法以與在SPSS中的實(shí)現(xiàn)_第2頁
正態(tài)性檢驗(yàn)和正態(tài)轉(zhuǎn)換的方法以與在SPSS中的實(shí)現(xiàn)_第3頁
正態(tài)性檢驗(yàn)和正態(tài)轉(zhuǎn)換的方法以與在SPSS中的實(shí)現(xiàn)_第4頁
正態(tài)性檢驗(yàn)和正態(tài)轉(zhuǎn)換的方法以與在SPSS中的實(shí)現(xiàn)_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、正態(tài)性檢驗(yàn)的方法以及在 SPSS中的實(shí)現(xiàn)SPSS中的實(shí)現(xiàn),此外,還將本文將匯總正態(tài)檢驗(yàn)常用的方法以及各種方法的適用條件和在提及將非正態(tài)分布轉(zhuǎn)化為正態(tài)分布的方法,以及選擇轉(zhuǎn)化方法的依據(jù)。正態(tài)檢驗(yàn)方法1.1 觀察分布,預(yù)先判斷先做直方圖看看是否大概符合正態(tài)分布,Graph-legacy dialogs-histogram- 選入變量 - OK.如果距離正態(tài)分布的樣子太遠(yuǎn)了,就不要做以下工作了。1.2 計(jì)算偏度 (Skewness) 和峰度 (Kurtosis) ,當(dāng)它們接近 0 時(shí),為正態(tài) 這是一種比較直觀的方法,用于初步判斷。1) 在 SPSS用菜單欄 AnalyzeReportsCase Su

2、mmaries分析過程 Statistics 的選擇項(xiàng)中計(jì)算偏度 (Skewness)和峰度 (Kurtosis) ;2) 通過 Analyze Reports Report Summaies in Row s 分析過程 Report 的 Summary 的選擇項(xiàng) 計(jì)算偏度、峰度;或者通過Reprts Report Summaries in Columns 分析過程的 Summary 選擇項(xiàng)計(jì)算偏度和峰度 ;3) 通過 Analyze Descriptive Statistics Frequencies 分析過程的 Statistics 的選擇項(xiàng) Distribution 中計(jì)算偏度、峰度 ;

3、4) 通過 Analyze Descriptive Statist ics Descr iptives 分析過程的 Opt ions 的選擇項(xiàng) Distribution 中計(jì)算偏度、峰度 ;5) 通過 AnalyzeCompare means means 分析過程的 Options 的選擇項(xiàng) Statistics 中選擇統(tǒng)計(jì) 量 Skewness (偏度 )、 Kurto sis (峰度 )來對數(shù)據(jù)資料進(jìn)行正態(tài)性檢驗(yàn)。附偏度和峰度統(tǒng)計(jì)意義 :偏度主要是研究分布形狀是否對稱 :約等于 0 則可以認(rèn)為分布是對稱的; 0 則可以認(rèn)為右偏態(tài),此時(shí)在均值右邊的數(shù)據(jù)更為 分散; 0 此說明該變量的分布 峰

4、態(tài)太陡峭(瘦高個(gè)) ;反之,如果 Kurtosis 為負(fù)值,該變量的分布峰態(tài)太平緩(矮胖子) 。1.3 用正態(tài)概率圖的 P-P 或 Q-Q 法對數(shù)據(jù)資料進(jìn)行正態(tài)性檢驗(yàn)。P-P 圖和 QQ 圖可以判斷的分布很多,對于正態(tài)分布的檢驗(yàn)也不僅限于標(biāo)準(zhǔn)正態(tài)分布。 P-P 圖是根據(jù)變量的累積概率對應(yīng)于所指定的理論分布累積概率繪制的散點(diǎn)圖, 用于直觀地檢測樣本則代表樣本數(shù)據(jù)的 點(diǎn)應(yīng)當(dāng)基數(shù)據(jù)是否符合某一概率分布。 如果被檢驗(yàn)的數(shù)據(jù)符合所指定的分布, 本在對角線上 。Q-Q圖的結(jié)果與 P-P圖非常相似,只是 P-P圖是用分布的累計(jì)比, 而 Q-Q 圖用的是分布的分 位數(shù)來做檢驗(yàn)。和 P-P圖一樣,如果數(shù)據(jù)為正態(tài)

5、分布,則在Q-Q 正態(tài)分布圖中,數(shù)據(jù)點(diǎn)應(yīng)基本在圖中的對角線上。1.4 用非參數(shù)分析方法 (Nonparametr ic Tests) 對數(shù)據(jù)資料進(jìn)行正態(tài)性檢驗(yàn)正態(tài)檢驗(yàn)屬于非參數(shù)檢驗(yàn)(分布類型未知的檢驗(yàn)),原假設(shè)是“樣本來自的總體與正態(tài)分 布無顯著性差異,即樣本符合正態(tài)分布”。正態(tài)分布的非參數(shù)檢驗(yàn)具體方法有兩種, 依據(jù)樣本大 小選擇合適的檢驗(yàn): 大樣本( 50 個(gè)樣本以上) 用 K-S檢驗(yàn),小樣本( 50 個(gè)樣本以下) 用 Shapiro-Wilk 檢驗(yàn)。在 SPSS中的實(shí)現(xiàn)有兩處,一處是使用Descriptive Statistics-Explore ( Shapiro-Wilk 檢驗(yàn)只在這里

6、),點(diǎn) Plot 按鈕, 選中 Normal plot with test 這樣就可以對選擇的變量進(jìn)行正態(tài)性檢驗(yàn)了,讀取結(jié)果時(shí), sig.0.05(0.01,0.1) 時(shí)說明顯著,即符合正態(tài)分布;一種是使用 Non-parametic Test-1 Sample K-S Tes。t注意以上兩處進(jìn)行 K-S檢驗(yàn)的區(qū)別 :在 Explore 里出現(xiàn)的 Kolmogorov-Smirnov 檢驗(yàn),它 的右上角有一個(gè) a 的注釋號,下面的介紹表明它是經(jīng)過 Lilliefors 改進(jìn)或糾正的結(jié)果,它將Kolmogorov-Smirnov 檢 驗(yàn) 改 進(jìn) 用 于 一 般 的 正 態(tài) 性 檢 驗(yàn) ; 而 在

7、 非 參 數(shù) 檢 驗(yàn) 里 出 現(xiàn) 的 Kolmogorov-Smirnov 檢驗(yàn),是沒有經(jīng)過糾正或改進(jìn)的,該正態(tài)性檢驗(yàn)只能做標(biāo)準(zhǔn)正態(tài)檢驗(yàn)。由以 上區(qū)別的本質(zhì)原因是: Kolmogorov-Smirnov 檢驗(yàn)是通過樣本的經(jīng)驗(yàn)分布函數(shù)與給定分布函數(shù)的比 較,推斷該樣本是否來自給定分布函數(shù)的總體。 由于需要給定分布函數(shù), 所以當(dāng)用于正態(tài)性檢驗(yàn) 時(shí)只能做標(biāo)準(zhǔn)正態(tài)檢驗(yàn)。下面說明在非參數(shù)檢驗(yàn)中進(jìn)行K-S檢驗(yàn)的步驟:1) 步驟 1:在 spss 中打開數(shù)據(jù), 怎么打開就不介紹了, 打開數(shù)據(jù)以后, 在菜單欄上執(zhí)行: analyze- 非參檢驗(yàn) -legacy disalogs-1 sample k-s 。2

8、)將你要檢驗(yàn)正態(tài)的變量放到 test variables list,勾選下面的 normal,這是標(biāo)準(zhǔn)正態(tài)分布的意思。3) 步驟 3:點(diǎn)擊 exact,進(jìn)入選擇檢驗(yàn)方法的對話框,4) 步驟 4:這里有三個(gè)選項(xiàng)可以選擇, 第一個(gè) asymptotic 的意思是基于漸進(jìn)分布的顯著性水平 的檢驗(yàn)指標(biāo),適于大樣本,如果樣本過小或者分布不好, 就會(huì)影響檢驗(yàn)的效力; monte carlo 適用于精確顯著性水平的無偏估計(jì),如果樣本過大,數(shù)據(jù)處理過程太長,就應(yīng)該使用這個(gè) 選項(xiàng); exact 精確計(jì)算概率值,可以設(shè)定數(shù)據(jù)處理的時(shí)間,如果數(shù)據(jù)處理時(shí)間超過了你設(shè)定 時(shí)間 30 分鐘,就應(yīng)該使用 monte car

9、lo 。5) 回到 k-s 檢驗(yàn)對話框,點(diǎn)擊 options 按鈕,設(shè)置輸出的參數(shù)6) 步驟 6:勾選 descriptive 和 quartiles ,這兩個(gè)的意思分別是輸出描述性統(tǒng)計(jì)和四分位數(shù),點(diǎn)擊 continue 按鈕。0.000 ,小于顯著性水平7)步驟 7:我們可以看到對數(shù)據(jù)的檢驗(yàn)結(jié)果,最后的顯著性檢驗(yàn)值為0.05,所以不能接受原假設(shè),即不符合正態(tài)分布。正態(tài)轉(zhuǎn)換方法如果需要將變量轉(zhuǎn)化為正態(tài)分布,需要根據(jù)變量的分布形狀確定相應(yīng)的轉(zhuǎn)換公式。? 如果是中度偏態(tài)(如 Skewness 為其標(biāo)準(zhǔn)誤差的 2-3 倍),可以考慮取根號值來轉(zhuǎn)換,以下是 SPSS的指令(其中” nx ”是原始變量

10、x 的轉(zhuǎn)換值): COMPUTE nx = SQRT(x).? 如果高度偏態(tài)(如 Skewness 為其標(biāo)準(zhǔn)誤差的 3 倍以上),則可以取對數(shù),其中又可分為自 然對數(shù)和以 10 為基數(shù)的對數(shù)。如以下是轉(zhuǎn)換自然對數(shù)的指令: COMPUTE nx = LN(x);以下 是轉(zhuǎn)換成以 10 為基數(shù)的對數(shù) (其糾偏力度最強(qiáng), 有時(shí)會(huì)矯枉過正, 將正偏態(tài)轉(zhuǎn)換成負(fù)偏態(tài)) COMPUTE nx = LG10(x).上述公式只能減輕或消除變量的正偏態(tài) (positive skewed) ,但如果不分青紅皂白(即不觀察 偏態(tài)和峰度)地用于負(fù)偏態(tài)( negative skewed )的變量,則會(huì)使負(fù)偏態(tài)變得更加嚴(yán)重

11、。如果是負(fù) 偏態(tài)的分布,則需要先對原始變量做 reflection (反向轉(zhuǎn)換),即將所有的值反過來,如將最大 值變成最小值、最小值變成最大值、等等。如果變量的取值很多或有小數(shù)、分?jǐn)?shù),上述方法幾乎 不可能,則需要寫如下的指令: COMPUTE nx = max x + 1.其中 max是 x的最大值。轉(zhuǎn)化結(jié)束后要重復(fù)第一部分提到的方法,觀察變量是否被轉(zhuǎn)化成功??偨Y(jié)一下,常用的變量正態(tài)變換方法有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正玄 變換等,應(yīng)根據(jù)資料性質(zhì)選擇適當(dāng)?shù)淖兞孔儞Q方法。? 對數(shù)變換 即將原始數(shù)據(jù) X 的對數(shù)值作為新的分布數(shù)據(jù):X =lgX當(dāng)原始數(shù)據(jù)中有小值及零時(shí),亦可取X=lg(

12、X+1)還可根據(jù)需要選用 X =lg( X+k)或 X =lg( k-X)對數(shù)變換常用于( 1)使服從對數(shù)正態(tài)分布的數(shù)據(jù)正態(tài)化。如環(huán)境中某些污染物的分布,人 體中某些微量元素的分布等, 可用對數(shù)正態(tài)分布改善其正態(tài)性。 ( 2)使數(shù)據(jù)達(dá)到方差齊性, 特別是各樣本的標(biāo)準(zhǔn)差與均數(shù)成比例或變異系數(shù)CV 接近于一個(gè)常數(shù)時(shí)。? 平方根變換 即將原始數(shù)據(jù) X 的平方根作為新的分布數(shù)據(jù)。X =sqrt (X)平方根變換常用于: 1 )使服從 Poission 分布的計(jì)數(shù)資料或輕度偏態(tài)資料正態(tài)化,可用平方 根變換使其正態(tài)化。 2 )當(dāng)各樣本的方差與均數(shù)呈正相關(guān)時(shí),可使資料達(dá)到方差齊性。? 倒數(shù)變換 即將原始數(shù)據(jù) X 的倒數(shù)作為新的分析數(shù)據(jù)。X =1/X常用于資料兩端波動(dòng)較大的資料,可使極

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論