非正態(tài)數據轉化成正態(tài)數據_第1頁
非正態(tài)數據轉化成正態(tài)數據_第2頁
非正態(tài)數據轉化成正態(tài)數據_第3頁
非正態(tài)數據轉化成正態(tài)數據_第4頁
非正態(tài)數據轉化成正態(tài)數據_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據分析方法 非正態(tài)數據轉化成正態(tài)數據 原創(chuàng) 東山草堂來自SPSS生活統計學 前言 大部分的數據分析都希望原始數據是滿足正態(tài)分布的定距變量 然而 顯示是殘酷的 在各種研究中 常常需要面對非正態(tài)分布的定距數據 為了解決數據的正態(tài)性問題 數學家們總結了很多轉化方法 但是沒有萬能神藥 都需要對癥下藥 根據數據的實際分布情況 選擇合適的轉化方法 下面不會介紹具體的轉化方法 只是幫助大家理順正態(tài)轉化的思路 明白正態(tài)轉化的邏輯 不至于將正態(tài)轉化看做神秘領域 高不可攀 正態(tài)轉化四步驟 第一步 計算數據的分布狀況及兩個參數 偏度 Skewness 和峰度 Kurtosis 第二步 根據變量的分布形狀和參數 決定是否做轉換 1 對稱判斷看Skewness 偏差度 的取值 如果偏度為0 則是完全對稱 但罕見 如果偏度為正值 則說明該變量的分布為正偏態(tài) 如果偏度為負值 則說明該變量的分布為負偏態(tài) 然而 偏度值還不能完全判斷偏態(tài)的分布是否與正態(tài)分布有顯著差別 所以還需要做顯著性檢驗 如果檢驗結果顯著 我們可能 注意是 可能 可以通過轉換來達到或接近對稱 2 峰度檢驗Kurtosis 峰度 是判斷曲線陡峭和平緩的指標 如果峰度為0 說明該變量分布合適 但罕見 如果峰度為正值 說明該變量的分布陡峭 反之 如果峰度為負值 說明變量的分布平緩 峰度也需要通過顯著檢驗來判斷與正態(tài)分布是否有顯著差別 我們可能可以通過轉換來達到或接近正態(tài)分布 第三步 如果需要做正態(tài)轉換 根據變量的分布形狀 確定相應的轉換公式 下面簡單介紹3種常見的正態(tài)轉換方法 1 如果是中度偏態(tài)如果偏度為其標準誤差的2 3倍 可以考慮取根號值來轉換 2 如果高度偏態(tài)如果偏度為其標準誤差的3倍以上 則可以取對數 其中又可分為自然對數和以10為基數的對數 3 對于雙峰或多峰數據秩分的正態(tài)得分的轉化方法 SPSS軟件中常用 請關注SPSS視頻教程 第四步 再次檢驗轉換后變量的分布形狀 如果沒有解決問題 或者甚至惡化 需要再從第二或第三步重新做起 然后再回到第一步的檢驗 直至達到比較令人滿意的結果 數據正態(tài)化注意點 1 偏度和峰度的標準誤差與樣本量直接有關 具體說來 偏度的標準誤差約等于6除以n后的開方 而峰度的標準誤差約等于24除以n后的開方 n為樣本量 由此可見 樣本量越大 標準誤差越小 2 數據的正態(tài)轉化方法不是通用的 要根據不同的數據分布情況 選擇合適的或創(chuàng)造合適的轉化公式 轉化后必須驗證轉化效果 最終達到轉化的目的 3 不是所有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論