非參數(shù)統(tǒng)計講義一緒論

上傳人：兒*** IP屬地：廣東上傳時間：2022-03-16 格式：PPT 頁數(shù)：87 大小：3.28MB 積分：30 舉報 版權申訴

已閱讀5頁，還剩82頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、. 本課程的目的是使學生認識到非參數(shù)統(tǒng)計方法是本課程的目的是使學生認識到非參數(shù)統(tǒng)計方法是統(tǒng)計中最常用的推斷方法之一，理解非參數(shù)統(tǒng)計統(tǒng)計中最常用的推斷方法之一，理解非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別，理解非參數(shù)統(tǒng)計的方法和參數(shù)統(tǒng)計方法的區(qū)別，理解非參數(shù)統(tǒng)計的基本概念，掌握非參數(shù)統(tǒng)計的基本理論和計算，基本概念，掌握非參數(shù)統(tǒng)計的基本理論和計算，能應用統(tǒng)計軟件和非參數(shù)統(tǒng)計方法分析解決實際能應用統(tǒng)計軟件和非參數(shù)統(tǒng)計方法分析解決實際問題。問題。.統(tǒng)計是分析數(shù)據(jù)信息的科學統(tǒng)計是分析數(shù)據(jù)信息的科學這個定義決定了統(tǒng)計的命運：這個定義決定了統(tǒng)計的命運：和數(shù)學不同和數(shù)學不同, 統(tǒng)計不能欣賞自己統(tǒng)計不能欣賞自己,

2、它不為實際服務它不為實際服務就就沒有存在必要沒有存在必要統(tǒng)計必須統(tǒng)計必須為各個領域服務為各個領域服務統(tǒng)計必須和統(tǒng)計必須和數(shù)據(jù)數(shù)據(jù)打交道打交道因此因此,統(tǒng)計必須和統(tǒng)計必須和計算機計算機結合結合.學生請假與星期幾有關嗎？學生請假與星期幾有關嗎？股票漲跌與星期幾有關嗎？股票漲跌與星期幾有關嗎？夫妻的審美觀有差異嗎？夫妻的審美觀有差異嗎？廣告的播出時間與電腦銷量有關嗎？廣告的播出時間與電腦銷量有關嗎？嬰兒出生數(shù)白天與晚上有明顯差異嗎嬰兒出生數(shù)白天與晚上有明顯差異嗎. 用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別，使學生認識到學習非參數(shù)計方法的區(qū)別，使學生認識到學習

3、非參數(shù)統(tǒng)計方法的必要性。統(tǒng)計方法的必要性。.經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背景分布。經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背景分布。分布由參數(shù)決定的，期望與方差分布由參數(shù)決定的，期望與方差總體的分布形式或分布族往往是給定的或者是總體的分布形式或分布族往往是給定的或者是假定了的，所不知道的僅僅是一些參數(shù)得知或假定了的，所不知道的僅僅是一些參數(shù)得知或它們的范圍。人們的主要任務就是對一些參數(shù)，它們的范圍。人們的主要任務就是對一些參數(shù)，比如均值和方差（或標準差）進行估計或檢驗。比如均值和方差（或標準差）進行估計或檢驗。 .非參數(shù)統(tǒng)計方法（非參數(shù)統(tǒng)計方法（Nonparametric Statistical

4、method)對對總體的概率分布假定以及測量尺度的要求即使總體的概率分布假定以及測量尺度的要求即使有也很有也很少的統(tǒng)計方法。當能夠得到分類數(shù)據(jù)和順序數(shù)據(jù)時可少的統(tǒng)計方法。當能夠得到分類數(shù)據(jù)和順序數(shù)據(jù)時可以使用的方法。以使用的方法。也稱為無分布方法（也稱為無分布方法（Distribution-free Statistics methods),也也稱自由分布統(tǒng)計學。表示無需對總體概率分布做出假稱自由分布統(tǒng)計學。表示無需對總體概率分布做出假定。定。因常因常按大小或出現(xiàn)先后次序排列資料進行分析，按大小或出現(xiàn)先后次序排列資料進行分析，故又稱次序統(tǒng)計學（故又稱次序統(tǒng)計學（Order Statistic

5、s).什么是非參數(shù)檢驗？什么是非參數(shù)檢驗？不假定了總體的具體背景分布形式。這些檢驗多根據(jù)數(shù)據(jù)觀測值的相對大小建立檢驗統(tǒng)計量，然后找到在零假設下這些統(tǒng)計量的分布。看這些統(tǒng)計量的數(shù)據(jù)實現(xiàn)是否在零假設下屬于小概率事件。這種和數(shù)據(jù)本身的總體分布無關的檢驗稱為非參數(shù)檢驗。.非參數(shù)檢驗有什么優(yōu)越性？非參數(shù)檢驗有什么優(yōu)越性？在總體分布未知時，如果還假定總體有諸如正態(tài)分布那樣的已知分布，在進行統(tǒng)計推斷就可能產生錯誤甚至災難。非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。但是在總體分布形式已知時，非參數(shù)檢驗就不如傳統(tǒng)方法效率高。但非參數(shù)統(tǒng)計在總體分布未知時效率要比假定了錯誤總體分布時的傳統(tǒng)方法要高，有時要高很多。.

6、哪個好？. 選擇飛機與選擇用參數(shù)與非參數(shù)方法的思路相同。大型飛機很好，但對機場的要求很高。參數(shù)統(tǒng)計對數(shù)據(jù)要求很高。小型飛機不一定舒適，但起降時對機場的要求很低。同理非參數(shù)統(tǒng)計對數(shù)據(jù)要求較低。.統(tǒng)計方法的選擇統(tǒng)計方法的選擇：用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)：用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)計方法計方法1、考慮對總體的假定。對總體有假定時用參數(shù)，、考慮對總體的假定。對總體有假定時用參數(shù)，已具備使用參數(shù)統(tǒng)計方法時一般不用非參數(shù)統(tǒng)已具備使用參數(shù)統(tǒng)計方法時一般不用非參數(shù)統(tǒng)計。計。2、數(shù)據(jù)的度量尺度。定距與定比可以用參數(shù)。、數(shù)據(jù)的度量尺度。定距與定比可以用參數(shù)。非參數(shù)統(tǒng)計方法的應用條件非參數(shù)統(tǒng)計方法的應用條件：1、用

7、于分析定類數(shù)據(jù)、用于分析定類數(shù)據(jù)2、用于分析定序數(shù)據(jù)、用于分析定序數(shù)據(jù)3、用于分析定距、定比數(shù)據(jù)時總體分布未做假定。、用于分析定距、定比數(shù)據(jù)時總體分布未做假定。.參數(shù)統(tǒng)計（參數(shù)統(tǒng)計（Parametric Statistical method)有兩有兩個特點：個特點：1、以推斷某特定參數(shù)為對象。如總體均值、以推斷某特定參數(shù)為對象。如總體均值，總體比例總體比例P，總體方差，兩個總體殫值，總體方差，兩個總體殫值的差等。的差等。2、常需要假定總體的分布是已知的，有的要、常需要假定總體的分布是已知的，有的要假設總體是服從正態(tài)分布的，才能作出推斷。假設總體是服從正態(tài)分布的，才能作出推斷。.數(shù)據(jù)的四種尺度

8、：數(shù)據(jù)的四種尺度：定類、定類、定序、定序、定距、定距、定比定比對定類和定序的只能用非參數(shù)統(tǒng)計分析方法對定類和定序的只能用非參數(shù)統(tǒng)計分析方法.非參數(shù)檢驗的特點非參數(shù)檢驗的特點1、非參數(shù)統(tǒng)計方法應用廣泛。、非參數(shù)統(tǒng)計方法應用廣泛。2、它對資料的要求易于得到滿足。、它對資料的要求易于得到滿足。3、當總體分布有具體形式未知，而且樣本容、當總體分布有具體形式未知，而且樣本容量很小時，無法用參數(shù)統(tǒng)計方法，只能用非參量很小時，無法用參數(shù)統(tǒng)計方法，只能用非參數(shù)方法。數(shù)方法。4、大多數(shù)非參數(shù)統(tǒng)計方法簡單、直觀、易于、大多數(shù)非參數(shù)統(tǒng)計方法簡單、直觀、易于掌握和應用。掌握和應用。5、總體分布形式已知時，非參數(shù)統(tǒng)計的

9、方法、總體分布形式已知時，非參數(shù)統(tǒng)計的方法的檢驗功效不如假定總體已知的各種參數(shù)統(tǒng)計的檢驗功效不如假定總體已知的各種參數(shù)統(tǒng)計方法。方法。.6、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參數(shù)數(shù)7、其通常按大小或出現(xiàn)先后順序排列的資料、其通常按大小或出現(xiàn)先后順序排列的資料進行分析。進行分析。8、通常以中位數(shù)代表分布的中心，以極差代、通常以中位數(shù)代表分布的中心，以極差代表離散程度。表離散程度。.非參數(shù)統(tǒng)計的主要內容非參數(shù)統(tǒng)計的主要內容內容內容非參數(shù)檢驗非參數(shù)檢驗相應的參數(shù)檢相應的參數(shù)檢驗驗2獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2 配對樣本/單一樣本符號檢驗Wilcox

10、on 檢驗成對樣本 t-檢驗2獨立樣本Kruskal-Wallis 檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關性檢驗Spearman秩相關Pearson相關性檢驗分布的檢驗Kolmogorov-Smirnov.Level ofMeasurementNonparametric TestNonparametricCorrelationOne SampleTwo SamplesK SamplesRelatedUnrelatedRelatedUnrelatedNominalBinomial TestChi-Square TestMcNemar Change TestFish

11、er Exact Test for 2x2 TablesChi-Square Test for rx2 TablesCochran Q TestChi-Square Test for rxk TablesCramer CoefficientPhi CoefficientKappa CoefficientAsymmetrical Lambda StatisticOrdinalKolmogorov-Smirnov One- Sample TestOne-Sample Runs TestChange-Point TestSign TestWilcoxon Signed Ranks TestMedia

12、n TestMann-Whitney U TestRobust Rank- Order TestKolmogorov-Smirnov Two- Sample TestSiegel-Tukey Test for Scale DifferencesFriedman Two- Way ANOVA by RanksPage Test for Ordered AlternativesExtension of the Median TestKruskal-Wallis One-Way ANOVAJonckheere Test for Ordered AlternativesSpearman Rank-Or

13、der CoefficientKendall Rank-Order CoefficientKendall Partial Rank-Order CoefficientKendall Coefficient of ConcordanceKendall Coefficient of AgreementCorrelation Between k Judges and a Criterion TestGamma StatisticSomers Index of Asymmetric Association.非參數(shù)統(tǒng)計的歷史非參數(shù)統(tǒng)計的歷史非參數(shù)統(tǒng)計的形成主要歸功于非參數(shù)統(tǒng)計的形成主要歸功于20世紀世紀

14、40年代年代50年代化學家年代化學家F.Wilcoxon等人的工作。等人的工作。Wilcoxon于于1945年提出兩樣本秩和檢驗，年提出兩樣本秩和檢驗，1947年年Mann和和Whitney二人將結果推廣到兩組樣本二人將結果推廣到兩組樣本量不等的一般情況；量不等的一般情況；Pitman于于1948年回答了非參數(shù)統(tǒng)計方法相對于年回答了非參數(shù)統(tǒng)計方法相對于參數(shù)方法來說的相對效率方面的問題；參數(shù)方法來說的相對效率方面的問題；.60年代中后期，年代中后期，Cox和和Ferguson最早將非參數(shù)最早將非參數(shù)方法應用于生存分析。方法應用于生存分析。70年代到年代到80年代，非參數(shù)統(tǒng)計借助計算機技術年代，非

15、參數(shù)統(tǒng)計借助計算機技術和大量計算獲得更穩(wěn)健的估計和預測，以和大量計算獲得更穩(wěn)健的估計和預測，以P.J.Huber以及以及 F.Hampel為代表的統(tǒng)計學家從為代表的統(tǒng)計學家從計算技術的實現(xiàn)角度，為衡量估計量的穩(wěn)定性計算技術的實現(xiàn)角度，為衡量估計量的穩(wěn)定性提出了新準則。提出了新準則。.90年代有關非參數(shù)統(tǒng)計的研究和應用主要集中年代有關非參數(shù)統(tǒng)計的研究和應用主要集中在非參數(shù)回歸和非參數(shù)密度估計領域，其中較在非參數(shù)回歸和非參數(shù)密度估計領域，其中較有代表性的人物是有代表性的人物是Silverman和和J. Fan。非參數(shù)統(tǒng)計分為廣義的和狹義的兩種非參數(shù)統(tǒng)計分為廣義的和狹義的兩種狹義的非參數(shù)統(tǒng)計主要研

16、究假設檢驗，本課程狹義的非參數(shù)統(tǒng)計主要研究假設檢驗，本課程研究狹義的。研究狹義的。廣義的非參數(shù)統(tǒng)計只要不考慮總體的分布的統(tǒng)廣義的非參數(shù)統(tǒng)計只要不考慮總體的分布的統(tǒng)計分析方法計分析方法.但是在總體分布形式已知時，非參數(shù)檢驗但是在總體分布形式已知時，非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這是因為非參數(shù)就不如傳統(tǒng)方法效率高。這是因為非參數(shù)方法利用的信息要少些。往往在傳統(tǒng)方法方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設的情況，非參數(shù)檢驗無法可以拒絕零假設的情況，非參數(shù)檢驗無法拒絕。拒絕。但非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)但非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高，有時要高很多。是否用非參數(shù)方法要高

17、，有時要高很多。是否用非參數(shù)統(tǒng)計方法，要根據(jù)對總體分布的了解程度統(tǒng)計方法，要根據(jù)對總體分布的了解程度來確定。來確定。 . 因為非參數(shù)統(tǒng)計方法不利用關于總體分因為非參數(shù)統(tǒng)計方法不利用關于總體分布的知識，所以，就是在對總體的任何知布的知識，所以，就是在對總體的任何知識都沒有的情況下，它也能很容易而又很識都沒有的情況下，它也能很容易而又很可靠地獲得結論?？煽康孬@得結論。這時非參數(shù)方法往往優(yōu)于參數(shù)方法，并這時非參數(shù)方法往往優(yōu)于參數(shù)方法，并且非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。且非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。.秩（秩（rank）利用秩的大小進行推斷就避免利用秩的大小進行推斷就避免了不知道背景分布的困難。這也

18、是大多數(shù)了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗的優(yōu)點。非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質；但也有一些非參數(shù)方法沒有涉及的性質；但也有一些非參數(shù)方法沒有涉及秩的性質。秩的性質。 .非參數(shù)檢驗中秩是最常使用的概念。什么是非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢？一般來說，秩就是該數(shù)據(jù)一個數(shù)據(jù)的秩呢？一般來說，秩就是該數(shù)據(jù)按照升冪排列之后，每個觀測值的位置。按照升冪排列之后，每個觀測值的位置。 .秩（秩（rank）非參數(shù)檢驗中秩是最常使用的概非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢？一念。什么是一個數(shù)據(jù)的

19、秩呢？一般來說，秩就是該數(shù)據(jù)按照升冪般來說，秩就是該數(shù)據(jù)按照升冪排列之后，每個觀測值的位置。排列之后，每個觀測值的位置。例如我們有下面數(shù)據(jù)例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行（記為這下面一行（記為Ri）就是上面一）就是上面一行數(shù)據(jù)行數(shù)據(jù)Xi的秩。的秩。 .159183178513719數(shù)據(jù)輸入數(shù)據(jù)輸入SPSS.例題：某學院本科三年級有例題：某學院本科三年級有9個專業(yè)組成，統(tǒng)計個專業(yè)組成，統(tǒng)計每個專業(yè)學生每月消費數(shù)據(jù)如下，用每個專業(yè)學生每月消費數(shù)據(jù)如下，用SPSS求消求消費數(shù)據(jù)的秩和順序統(tǒng)計量的現(xiàn)值：費數(shù)據(jù)的秩和順序統(tǒng)計量的現(xiàn)值： 300 23

20、0 208 580 690 200 263 215 520.2.有結數(shù)據(jù)的秩有結數(shù)據(jù)的秩設樣本設樣本X1，X2，XN 取自總體取自總體X的簡單隨的簡單隨機抽樣，將數(shù)據(jù)排序后機抽樣，將數(shù)據(jù)排序后,相同的數(shù)據(jù)點組成一相同的數(shù)據(jù)點組成一個個“結結”，稱重復數(shù)據(jù)的個數(shù)為結長。，稱重復數(shù)據(jù)的個數(shù)為結長。例例1：3.8 3.2 1.2 1.2 3.4 3.2 3.2解：結長為解：結長為3。.假設檢驗：假設檢驗：假設檢驗是指我們可以對某一參數(shù)的假定值進假設檢驗是指我們可以對某一參數(shù)的假定值進行行先驗判斷或預期先驗判斷或預期，然后利用小概率原理對其進行，然后利用小概率原理對其進行檢驗，得到接受或拒絕原假設的

21、結論。檢驗，得到接受或拒絕原假設的結論。小概率原理：小概率原理：我們認為小概率事件由于發(fā)生的可能性很小，我們認為小概率事件由于發(fā)生的可能性很小，在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了，在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了，說明我們的假設有問題，所以我們將拒絕原來的假說明我們的假設有問題，所以我們將拒絕原來的假設。設。.參數(shù)統(tǒng)計的假設檢驗如：檢驗正態(tài)分布的均值是否相等檢驗正態(tài)分布的均值是否相等 H0：u1=u2; H1:u1u2 檢驗均值是否檢驗均值是否等于零 H0：u=0; H1:u0 .例例85 用自動裝袋機裝葡萄糖，每袋標準重500克，每隔一定時間需檢查機器工作是否正常. 現(xiàn)

22、抽得10袋，測得其重量為（單位：克）495，510，505，498，503，492，502 ,512, 497, 506, 假定重量服從正態(tài)分布，問機器是否正常？解解由于2未知，所以用T檢驗法提出假設0100: , 500:HH1(495510506)50210 x .9380)502506()502510()502495(11012222S所以應接受H0，可以認為，機器工作正常. 9733. 0386103/380500502/0nSXT05. 02622. 2)9() 1(025. 02tnt對拒絕域2.2622T P值，由T0.9733，df=9,可得（EXCEL函數(shù)=TDIST(0

23、.9733,9,2)0.35583559.假定甲、乙兩機床截下的長度方差相等，問長度的期望值是否一樣？例例88從兩臺切斷機所截下的坯料（長度按正態(tài)分布）中，分別抽取個和個產品，測得長度如下（單位：mm）：甲：150， 145， 152， 155， 148， 151， 152， 148乙：152， 150， 148， 152， 150， 150， 148， 151， 148.設甲床截下的長度為X；乙床截下的長度為Y，由假定知21=22=2012112. .Hvs H檢驗假設1(150 145148)150.125150.18x 9 .149889.149)148150152(91Y822221

24、()(150 150.1)(145 150.1)(148 150.1)66.88iiXX解.91222289.20)9 .149148()9 .149150()9 .149152()(iiYY150.1 149.9(892)0.210800.17021/8 1/987.771766.8820.89T (2)11wXYTt nmSnm2) 1() 1(2221mnSmSnSw.05. 02120.025(2)(15)2.1315tnnt0.1702TW0.H對查表得拒絕域為/ 2|(15)|2.1315WTtT所以應接受.參數(shù)方法定義：樣本被視為從分布族的某個參數(shù)族抽取出來的定義：樣本被視為從

25、分布族的某個參數(shù)族抽取出來的總體的代表，而未知的僅僅是總體分布具體的參數(shù)值，總體的代表，而未知的僅僅是總體分布具體的參數(shù)值，推斷問題就轉化為對分布族的若干個未知參數(shù)的估計推斷問題就轉化為對分布族的若干個未知參數(shù)的估計問題，用樣本對這些參數(shù)做出估計或者進行某種形式問題，用樣本對這些參數(shù)做出估計或者進行某種形式的假設檢驗，這類推斷方法稱為的假設檢驗，這類推斷方法稱為。比如：比如：（1）研究保險公司的索賠請求數(shù)時，可能假定索賠請）研究保險公司的索賠請求數(shù)時，可能假定索賠請求數(shù)來自泊松分布求數(shù)來自泊松分布P(a);（2）研究化肥對農作物產量的影響效果時，平均意義）研究化肥對農作物產量的影響效果時，平

26、均意義之下，每測量單元（可能是）產量服從正態(tài)分布之下，每測量單元（可能是）產量服從正態(tài)分布N(a,b).接受域置信區(qū)間1假設檢驗區(qū)間估計統(tǒng)計量樞軸量對偶關系同一函數(shù)假設檢驗與區(qū)間估計的聯(lián)系假設檢驗與區(qū)間估計的聯(lián)系.假設檢驗的基本概念若對參數(shù)有所了解但有猜測懷疑,需要證實之時用假設檢驗的方法來處理若對參數(shù)若對參數(shù)一無所知一無所知用參數(shù)估計用參數(shù)估計的方法處理的方法處理.接受域置信區(qū)間檢驗統(tǒng)計量及其在H0為真時的分布樞軸量及其分布原假設 H0備擇假設 H1待估參數(shù) 0 0（ 2未知）) 1(0nTnSXT（ 2未知）) 1(0nTnSXT)2nstx20tnsx,(2nstx.一個典型的參數(shù)檢

27、驗過程1. 總體參數(shù)總體參數(shù)Example: Population Mean2. 假定數(shù)據(jù)的形態(tài)為假定數(shù)據(jù)的形態(tài)為 Whole Numbers or Fractions Example: Height in Inches (72, 60.5, 54.7)3. 有很強的假定有很強的假定Example: 正態(tài)分布正態(tài)分布4. 例子例子: Z Test, t Test, 2 Test.一個例子一個例子：對兩組學生進行語法測試，如何比較兩對兩組學生進行語法測試，如何比較兩組學生的成績是否存在差異？組學生的成績是否存在差異？組組1組組24425333022298344724312540133032332

28、435301832213735.G Gr ro ou up p S St ta at ti is st ti ic cs s1529.800010.331642.667621227.91676.273441.81099G1.002.00XNMeanStd. DeviationStd. ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t2.448.130.55425.5851.883333.40057-5.120288.88695.58423.520.5651.883333.22426-4.7

29、78418.54508Equal variancesassumedEqual variancesnot assumedXFSig.Levenes Test forEquality of VariancestdfSig. (2-tailed)MeanDifferenceStd. ErrorDifferenceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means.RANK of SCORE25.020.015.010.05.00.0HistogramFor GROUP= Group1Frequen

30、cy6543210Std. Dev = 6.28 Mean = 13.0N = 12.00原始數(shù)據(jù)原始數(shù)據(jù)秩秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5RANK of SCORE25.020.015.010.05.00.0HistogramFor GROUP= Group2Frequency6543210Std. Dev = 9.17 M

31、ean = 14.8N = 15.00.RanksRanks1514.80222.001213.00156.0027G1.002.00TotalXNMean RankSum of RanksT Te es st t S St ta at ti is st ti ic cs sb b78.000156.000-.586.558.581aMann-Whitney UWilcoxon WZAsymp. Sig. (2-tailed)Exact Sig. 2*(1-tailedSig.)XNot corrected for ties.a. Grouping Variable: Gb. .假設檢驗的基本

32、思想 = 50.01010100:uuHuuHuuHuuHXXXX備擇假設零假設單邊備擇單邊備擇單邊備擇單邊備擇雙邊備擇雙邊備擇零假設零假設 (原假設原假設)與備擇假設：與備擇假設：例：例：010001000100:uuHuuHuuHuuHuuHuuHxxxxxx備擇假設零假設備擇假設零假設備擇假設零假設.假設檢驗的方法假設檢驗的方法1.1.置信區(qū)間法置信區(qū)間法置信區(qū)間提供了在某一置信度置信區(qū)間提供了在某一置信度(例如例如95)下真實參下真實參數(shù)值的取值范圍。數(shù)值的取值范圍。如果零假設中的值未落入該區(qū)間，也就是說小概率如果零假設中的值未落入該區(qū)間，也就是說小概率事件發(fā)生了，我們認為小概率事

33、件由于發(fā)生的可能性很事件發(fā)生了，我們認為小概率事件由于發(fā)生的可能性很小，在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了，小，在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了，說明我們的假設有問題，所以我們將拒絕該零假設。說明我們的假設有問題，所以我們將拒絕該零假設。概念：概念：接受域（置信區(qū)間）接受域（置信區(qū)間）、拒絕域、臨界值、拒絕域、臨界值 .第一類錯誤和第二類錯誤：一個偏離第一類錯誤和第二類錯誤：一個偏離由小概率原理我們可以看出，我們的這種判斷是由小概率原理我們可以看出，我們的這種判斷是有可能犯錯誤的。我們把可能犯的錯誤分為兩類：有可能犯錯誤的。我們把可能犯的錯誤分為兩類：第第一類錯誤和第

34、二類錯誤一類錯誤和第二類錯誤。第一類錯誤：第一類錯誤：零假設是正確的，卻做出拒絕零假零假設是正確的，卻做出拒絕零假設的判斷，此為設的判斷，此為棄真棄真錯誤。錯誤。第二類錯誤：第二類錯誤：零假設是錯誤的，卻做出接受零假零假設是錯誤的，卻做出接受零假設的判斷，此為設的判斷，此為取偽取偽錯誤。錯誤。 .假設檢驗不可能完全避免這兩類錯誤，我們只能假設檢驗不可能完全避免這兩類錯誤，我們只能想辦法使犯錯誤的想辦法使犯錯誤的概率概率盡量減小。盡量減小。1-置信水平，也稱顯著性水平置信水平，也稱顯著性水平犯第一類錯誤的概率犯第一類錯誤的概率 =犯棄真錯誤的概率犯棄真錯誤的概率犯第二類錯誤的概率犯第二類錯誤

35、的概率 =犯取偽錯誤的概率犯取偽錯誤的概率. 兩類錯誤兩類錯誤假設檢驗存在著接受錯誤的假設和拒絕正確假設檢驗存在著接受錯誤的假設和拒絕正確假設的可能性假設的可能性. 正正確確拒絕拒絕 H0正正確確接受接受 H0決決策策行行動動 H0 為非真為非真H0 為真為真假設的真實狀態(tài)假設的真實狀態(tài)檢驗結果檢驗結果誤誤錯錯誤誤錯錯假設檢驗的各種可能結果假設檢驗的各種可能結果1-a1-.陪審團審判陪審團審判裁決裁決實際情況實際情況無罪無罪有罪有罪無罪無罪正確正確錯誤錯誤有罪有罪錯誤錯誤正確正確H0 檢驗檢驗決策決策實際情況實際情況H0為真為真H0為假為假接受接受H01 - 第二類錯第二類錯誤誤(

36、()拒絕拒絕H0第一類錯第一類錯誤誤( ()功效功效(1-(1-). 錯誤和錯誤的關系你不能同時減你不能同時減少兩類錯誤少兩類錯誤!.2.2.顯著性檢驗顯著性檢驗顯著性檢驗：在給定顯著性水平下，為考察樣本顯著性檢驗：在給定顯著性水平下，為考察樣本值的顯著性而進行的假設檢驗。值的顯著性而進行的假設檢驗。檢驗是統(tǒng)計顯著的：能夠拒絕零假設，即觀察到檢驗是統(tǒng)計顯著的：能夠拒絕零假設，即觀察到的樣本值落入拒絕域。的樣本值落入拒絕域。檢驗是統(tǒng)計不顯著的：不能夠拒絕零假設，即觀檢驗是統(tǒng)計不顯著的：不能夠拒絕零假設，即觀察到的樣本值落入接受域。察到的樣本值落入接受域。 . 確定確定顯著性水平顯著性水平

37、 , 求臨界值求臨界值. 在假設檢驗中在假設檢驗中, 認為認為零假設代表的事件概率零假設代表的事件概率很大很大, , 備擇假設代表的對立事件概率很小備擇假設代表的對立事件概率很小. . 根據(jù)根據(jù)實際推斷原理實際推斷原理 (小概率原理小概率原理) , 規(guī)定一個規(guī)定一個界限界限 , 當某事件的概率當某事件的概率 , 就認就認為該事件是實際不可能事件為該事件是實際不可能事件. )10( p為為稱稱顯著性水平顯著性水平. 001. 0,01. 0,05. 0 通通常常規(guī)規(guī)定定如果如果在一次檢驗中在一次檢驗中, 備擇假設代表的小概率事件居然備擇假設代表的小概率事件居然發(fā)生了發(fā)生了, , 就有理由懷疑零假設的正確性就有理由懷疑零假設的正確性. . 這就是假設檢驗的基本原理這就是假設檢驗的基本原理 . .顯著水平顯著水平的選擇與的選擇與P P值值 P值值（概率值）也稱為統(tǒng)計量的精確顯著性水平。（概率值）也稱為統(tǒng)計量的精確顯著性水平。它可定義為它可定義為拒絕零假設的最小的顯著性水平拒絕零假設的最小的顯著性水平。一般規(guī)律：一般規(guī)律： P值越小，越能拒絕零假設值越小，越能拒絕零假設。某一點對應的某

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

非參數(shù)統(tǒng)計講義一緒論

文檔簡介

溫馨提示

最新文檔

評論

非參數(shù)統(tǒng)計講義一緒論

文檔簡介

溫馨提示

最新文檔

評論

相關文檔