單樣本K-S檢驗_第1頁
單樣本K-S檢驗_第2頁
單樣本K-S檢驗_第3頁
單樣本K-S檢驗_第4頁
單樣本K-S檢驗_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS 16實用教程第第10章章 非參數檢驗非參數檢驗10.4.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式定義:定義:K-SK-S(Kolmogorov-SmirnovKolmogorov-Smirnov)檢驗)檢驗它是檢驗單一樣本是否來自某一特定分布的方它是檢驗單一樣本是否來自某一特定分布的方法。法。它的檢驗方法它的檢驗方法是以樣本數據的累計頻數分布與是以樣本數據的累計頻數分布與特定理論分布比較,若兩者間的差距很小,則特定理論分布比較,若兩者間的差距很小,則推論該樣本取自某特定分布族。推論該樣本取自某特定分布族。假設檢驗問題:假設檢驗問題:H0:樣本所來自的總體分布服從某特定分布

2、樣本所來自的總體分布服從某特定分布H1:樣本所來自的總體分布不服從某特定分布樣本所來自的總體分布不服從某特定分布F0(x)表示理論分布的分布函數,表示理論分布的分布函數,F(xiàn)n(x)表示表示一組隨機樣本的累計頻率函數。一組隨機樣本的累計頻率函數。設設D為為F0(x)與與Fn(x)差距的最大值,定義如下差距的最大值,定義如下式:式:D=max|Fn(x)-F0(x)|結論:結論:當實際觀測當實際觀測DD(n,)(D(n,)是顯著是顯著水平為水平為樣本容量為樣本容量為n時,時,D的拒絕臨界值),的拒絕臨界值),則拒絕則拒絕H0,反之則接受反之則接受H0假設。假設。D(n, )的簡略表的簡略表以以Ko

3、lmogorov-Smirnov正態(tài)性檢驗為例介正態(tài)性檢驗為例介紹它的統(tǒng)計原理。紹它的統(tǒng)計原理。例例1:35位健康男性在未進食前的血糖濃度如位健康男性在未進食前的血糖濃度如表所示,試測驗這組數據是否來自正態(tài)分布表所示,試測驗這組數據是否來自正態(tài)分布87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 72 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35檢驗過程如下:檢驗過程如下:H0:健康成人男性血糖濃度服從正態(tài)分布健康成人男性血糖濃度服從正態(tài)分布H1: 健康成人男性血糖濃度不服從正

4、態(tài)分布健康成人男性血糖濃度不服從正態(tài)分布經計算,樣本的均值經計算,樣本的均值=80,標準差,標準差=6,這,這便可以作為對原假設,正態(tài)分布的參數估計便可以作為對原假設,正態(tài)分布的參數估計值,運用于檢驗計算中。值,運用于檢驗計算中。D值序列的計算結果值序列的計算結果得到得到D統(tǒng)計統(tǒng)計量的值為量的值為0.1754.然然后查表判斷后查表判斷是否拒絕原是否拒絕原假設假設2檢驗與Kolmogorov-Smirnov檢驗的區(qū)別2檢驗與檢驗與Kolmogorov-Smirnov檢驗都采用檢驗都采用實際頻數和期望頻數進行檢驗。它們之間最實際頻數和期望頻數進行檢驗。它們之間最大的區(qū)別在于前者主要用于類別數據,而

5、后大的區(qū)別在于前者主要用于類別數據,而后者主要用于有單位的數量數據,有時前者也者主要用于有單位的數量數據,有時前者也可以用于數量數據但必須將數據分組得到實可以用于數量數據但必須將數據分組得到實際觀測頻數,并要求多變量之間獨立,而后際觀測頻數,并要求多變量之間獨立,而后者可以不分組直接把原始數據進行檢驗因此者可以不分組直接把原始數據進行檢驗因此k-s檢驗對數據的應用較完整。檢驗對數據的應用較完整。 SPSS SPSS在統(tǒng)計中將計算在統(tǒng)計中將計算K-SK-S的的Z Z統(tǒng)計量,并統(tǒng)計量,并依據依據K-SK-S分布表(小樣本)或正態(tài)分布表(大分布表(小樣本)或正態(tài)分布表(大樣本)給出對應的相伴概率值。

6、如果相伴概率樣本)給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平小于或等于用戶的顯著性水平,則應拒絕零,則應拒絕零假設假設H0H0,認為樣本來自的總體與指定的分布有,認為樣本來自的總體與指定的分布有顯著差異;如果相伴概率值大于顯著性水平,顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設則不能拒絕零假設H0H0,認為樣本來自的總體與,認為樣本來自的總體與指定的分布無顯著差異。指定的分布無顯著差異。單樣本單樣本K-SK-S檢驗可以將一個變量的實際頻數分檢驗可以將一個變量的實際頻數分布與正態(tài)分布(布與正態(tài)分布(NormalNormal)、均勻分布)、均勻分布(UniformUn

7、iform)、泊松分布()、泊松分布(PoissonPoisson)、指數)、指數(ExponentialExponential)分布進行比較。)分布進行比較。10.4.2 SPSS中實現(xiàn)過程中實現(xiàn)過程 研究問題研究問題 某地某地144144個周歲兒童身高數據如表個周歲兒童身高數據如表10-410-4所所示,問該地區(qū)周歲兒童身高頻數是否呈正態(tài)分示,問該地區(qū)周歲兒童身高頻數是否呈正態(tài)分布?布? 身身 高高 區(qū)區(qū) 間間人人 數數642684697701671207225732474227616782796831 實現(xiàn)步驟實現(xiàn)步驟有四種可有四種可作為原假作為原假設中理論設中理論分布的分分布的分布類型

8、布類型Options選項和精選項和精確檢驗選確檢驗選項。項。10.4.3 結果和討論結果和討論(1 1)本例輸出結果如下表所示。)本例輸出結果如下表所示。D統(tǒng)計量的數值統(tǒng)計量的數值Z值等于值等于D*sqrt(n)近似近似相伴概率值等于相伴概率值等于0.681大于我們一般的大于我們一般的顯著水平顯著水平0.05,則接受,則接受原假設,認為學生身高原假設,認為學生身高頻數服從正態(tài)分布。頻數服從正態(tài)分布。注意:在樣本注意:在樣本數少于數少于50時,時,要求使用精確要求使用精確檢驗概率值。檢驗概率值。作業(yè)!要求作業(yè)中,在進行要求作業(yè)中,在進行K-S檢驗時,結果中需要含有檢驗時,結果中需要含有表明值計算

9、過程的表格(包括累積頻率,理論累表明值計算過程的表格(包括累積頻率,理論累積分布函數,值序列并指明積分布函數,值序列并指明D 統(tǒng)計量的值),最統(tǒng)計量的值),最后運用后運用spss計算的相伴概率值,給出檢驗結果。計算的相伴概率值,給出檢驗結果。1.對于例一的正態(tài)性檢驗問題,運用對于例一的正態(tài)性檢驗問題,運用k-s檢驗的方法檢驗的方法進行檢驗。進行檢驗。2.運用運用k-s檢驗方法檢驗研究問題中,兒童的身高檢驗方法檢驗研究問題中,兒童的身高(不是身高頻數不是身高頻數,處理數據時,如:處理數據時,如:“64”按按“64”處理處理)是否服從正態(tài)分布。)是否服從正態(tài)分布。3.據一家商場的調查報告記載了該商場一位售貨員據一家商場的調查報告記載了該商場一位售貨員在一個工作日內接待的在一個工作日內接待的110位顧客中花費在每一位位顧客中花費在每一位顧客的服務時間(單位:秒),如下表所示。根據數顧客的服務時間(單位:秒),如下表所示。根據數據據分別用卡方檢驗和分別用卡方檢驗和K-S檢驗,卡方檢驗檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論