非參數(shù)統(tǒng)計講義(課堂)課件_第1頁
非參數(shù)統(tǒng)計講義(課堂)課件_第2頁
非參數(shù)統(tǒng)計講義(課堂)課件_第3頁
非參數(shù)統(tǒng)計講義(課堂)課件_第4頁
非參數(shù)統(tǒng)計講義(課堂)課件_第5頁
已閱讀5頁,還剩167頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計教學(xué)要求

本課程的目的是使學(xué)生認(rèn)識到非參數(shù)統(tǒng)計方法是統(tǒng)計中最常用的推斷方法之一,理解非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,理解非參數(shù)統(tǒng)計的基本概念,掌握非參數(shù)統(tǒng)計的基本理論和計算,能應(yīng)用統(tǒng)計軟件和非參數(shù)統(tǒng)計方法分析解決實際問題。教學(xué)要求本課程的目的是使學(xué)生認(rèn)識到非參數(shù)統(tǒng)計方法是統(tǒng)計中最統(tǒng)計是分析數(shù)據(jù)信息的科學(xué)

這個定義決定了統(tǒng)計的命運:和數(shù)學(xué)不同,統(tǒng)計不能欣賞自己,它不為實際服務(wù)就沒有存在必要統(tǒng)計必須為各個領(lǐng)域服務(wù)統(tǒng)計必須和數(shù)據(jù)打交道因此,統(tǒng)計必須和計算機結(jié)合統(tǒng)計是分析數(shù)據(jù)信息的科學(xué)

這個定義決定了統(tǒng)計的命運:和數(shù)學(xué)不非參數(shù)統(tǒng)計產(chǎn)生的背景問題學(xué)生請假與星期幾有關(guān)嗎?股票漲跌與星期幾有關(guān)嗎?夫妻的審美觀有差異嗎?廣告的播出時間與電腦銷量有關(guān)嗎?嬰兒出生數(shù)白天與晚上有明顯差異嗎非參數(shù)統(tǒng)計產(chǎn)生的背景問題學(xué)生請假與星期幾有關(guān)嗎?

用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,使學(xué)生認(rèn)識到學(xué)習(xí)非參數(shù)統(tǒng)計方法的必要性。第一講非參數(shù)統(tǒng)計概論用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,使參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背景分布。分布由參數(shù)決定的,期望與方差總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)得知或它們的范圍。人們的主要任務(wù)就是對一些參數(shù),比如均值和方差(或標(biāo)準(zhǔn)差)進行估計或檢驗。參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計方法(NonparametricStatisticalmethod)對總體的概率分布假定以及測量尺度的要求即使有也很少的統(tǒng)計方法。當(dāng)能夠得到分類數(shù)據(jù)和順序數(shù)據(jù)時可以使用的方法。也稱為無分布方法(Distribution-freeStatisticsmethods),也稱自由分布統(tǒng)計學(xué)。表示無需對總體概率分布做出假定。因常按大小或出現(xiàn)先后次序排列資料進行分析,故又稱次序統(tǒng)計學(xué)(OrderStatistics)非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計方法(NonparametricSta什么是非參數(shù)檢驗?不假定了總體的具體背景分布形式。這些檢驗多根據(jù)數(shù)據(jù)觀測值的相對大小建立檢驗統(tǒng)計量,然后找到在零假設(shè)下這些統(tǒng)計量的分布??催@些統(tǒng)計量的數(shù)據(jù)實現(xiàn)是否在零假設(shè)下屬于小概率事件。這種和數(shù)據(jù)本身的總體分布無關(guān)的檢驗稱為非參數(shù)檢驗。什么是非參數(shù)檢驗?不假定了總體的具體背景分布形式。非參數(shù)檢驗有什么優(yōu)越性?在總體分布未知時,如果還假定總體有諸如正態(tài)分布那樣的已知分布,在進行統(tǒng)計推斷就可能產(chǎn)生錯誤甚至災(zāi)難。非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。但非參數(shù)統(tǒng)計在總體分布未知時效率要比假定了錯誤總體分布時的傳統(tǒng)方法要高,有時要高很多。非參數(shù)檢驗有什么優(yōu)越性?在總體分布未知時,如果還假定總體有諸哪個好?哪個好?選擇飛機與選擇用參數(shù)與非參數(shù)方法的思路相同。大型飛機很好,但對機場的要求很高。參數(shù)統(tǒng)計對數(shù)據(jù)要求很高。小型飛機不一定舒適,但起降時對機場的要求很低。同理非參數(shù)統(tǒng)計對數(shù)據(jù)要求較低。選擇飛機與選擇用參數(shù)與非參數(shù)方法的思路相同。統(tǒng)計方法的選擇:用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)計方法1、考慮對總體的假定。對總體有假定時用參數(shù),已具備使用參數(shù)統(tǒng)計方法時一般不用非參數(shù)統(tǒng)計。2、數(shù)據(jù)的度量尺度。定距與定比可以用參數(shù)。非參數(shù)統(tǒng)計方法的應(yīng)用條件:1、用于分析定類數(shù)據(jù)2、用于分析定序數(shù)據(jù)3、用于分析定距、定比數(shù)據(jù)時總體分布未做假定。統(tǒng)計方法的選擇:用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法參數(shù)統(tǒng)計(ParametricStatisticalmethod)有兩個特點:1、以推斷某特定參數(shù)為對象。如總體均值μ,總體比例P,總體方差,兩個總體殫值的差等。2、常需要假定總體的分布是已知的,有的要假設(shè)總體是服從正態(tài)分布的,才能作出推斷。參數(shù)統(tǒng)計(ParametricStatisticalme數(shù)據(jù)的四種尺度:定類、定序、定距、定比對定類和定序的只能用非參數(shù)統(tǒng)計分析方法數(shù)據(jù)的四種尺度:對定類和定序的只能用非參數(shù)統(tǒng)計分析方法非參數(shù)檢驗的特點1、非參數(shù)統(tǒng)計方法應(yīng)用廣泛。2、它對資料的要求易于得到滿足。3、當(dāng)總體分布有具體形式未知,而且樣本容量很小時,無法用參數(shù)統(tǒng)計方法,只能用非參數(shù)方法。4、大多數(shù)非參數(shù)統(tǒng)計方法簡單、直觀、易于掌握和應(yīng)用。5、總體分布形式已知時,非參數(shù)統(tǒng)計的方法的檢驗功效不如假定總體已知的各種參數(shù)統(tǒng)計方法。非參數(shù)檢驗的特點6、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參數(shù)7、其通常按大小或出現(xiàn)先后順序排列的資料進行分析。8、通常以中位數(shù)代表分布的中心,以極差代表離散程度。6、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參數(shù)非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應(yīng)的參數(shù)檢驗2獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2配對樣本/單一樣本符號檢驗Wilcoxon檢驗成對樣本t-檢驗>2獨立樣本Kruskal-Wallis檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關(guān)性檢驗Spearman秩相關(guān)Pearson相關(guān)性檢驗分布的檢驗Kolmogorov-Smirnov非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應(yīng)的參數(shù)檢驗2獨立樣本中MatrixofNonparametricStatisticsLevelofMeasurementNonparametricTestNonparametricCorrelationOneSampleTwoSamplesKSamplesRelatedUnrelatedRelatedUnrelatedNominalBinomialTestChi-SquareTestMcNemarChangeTestFisherExactTestfor2x2TablesChi-SquareTestforrx2TablesCochranQTestChi-SquareTestforrxkTablesCramerCoefficientPhiCoefficientKappaCoefficientAsymmetricalLambdaStatisticOrdinalKolmogorov-SmirnovOne-SampleTestOne-SampleRunsTestChange-PointTestSignTestWilcoxonSignedRanksTestMedianTestMann-WhitneyUTestRobustRank-OrderTestKolmogorov-SmirnovTwo-SampleTestSiegel-TukeyTestforScaleDifferencesFriedmanTwo-WayANOVAbyRanksPageTestforOrderedAlternativesExtensionoftheMedianTestKruskal-WallisOne-WayANOVAJonckheereTestforOrderedAlternativesSpearmanRank-OrderCoefficientKendallRank-OrderCoefficientKendallPartialRank-OrderCoefficientKendallCoefficientofConcordanceKendallCoefficientofAgreementCorrelationBetweenkJudgesandaCriterionTestGammaStatisticSomer’sIndexofAsymmetricAssociationMatrixofNonparametricStatis非參數(shù)統(tǒng)計的歷史非參數(shù)統(tǒng)計的形成主要歸功于20世紀(jì)40年代~50年代化學(xué)家F.Wilcoxon等人的工作。Wilcoxon于1945年提出兩樣本秩和檢驗,1947年Mann和Whitney二人將結(jié)果推廣到兩組樣本量不等的一般情況;Pitman于1948年回答了非參數(shù)統(tǒng)計方法相對于參數(shù)方法來說的相對效率方面的問題;非參數(shù)統(tǒng)計的歷史60年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用于生存分析。70年代到80年代,非參數(shù)統(tǒng)計借助計算機技術(shù)和大量計算獲得更穩(wěn)健的估計和預(yù)測,以P.J.Huber以及F.Hampel為代表的統(tǒng)計學(xué)家從計算技術(shù)的實現(xiàn)角度,為衡量估計量的穩(wěn)定性提出了新準(zhǔn)則。60年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用90年代有關(guān)非參數(shù)統(tǒng)計的研究和應(yīng)用主要集中在非參數(shù)回歸和非參數(shù)密度估計領(lǐng)域,其中較有代表性的人物是Silverman和J.Fan。非參數(shù)統(tǒng)計分為廣義的和狹義的兩種狹義的非參數(shù)統(tǒng)計主要研究假設(shè)檢驗,本課程研究狹義的。廣義的非參數(shù)統(tǒng)計只要不考慮總體的分布的統(tǒng)計分析方法90年代有關(guān)非參數(shù)統(tǒng)計的研究和應(yīng)用主要集中在非參數(shù)回歸和非參但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這是因為非參數(shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗無法拒絕。但非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高,有時要高很多。是否用非參數(shù)統(tǒng)計方法,要根據(jù)對總體分布的了解程度來確定。

但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這

因為非參數(shù)統(tǒng)計方法不利用關(guān)于總體分布的知識,所以,就是在對總體的任何知識都沒有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時非參數(shù)方法往往優(yōu)于參數(shù)方法,并且非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。因為非參數(shù)統(tǒng)計方法不利用關(guān)于總體分布的知識,所以,非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件數(shù)據(jù)的秩秩(rank)利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。數(shù)據(jù)的秩秩(rank)利用秩的大小進行推斷就避免了不知道背景非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置。

非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來非參數(shù)統(tǒng)計講義(課堂)課件秩(rank)

非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置。例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。

秩(rank)非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)159183178513719數(shù)據(jù)輸入SPSS159183178513719數(shù)據(jù)輸入SPSS非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件例題:某學(xué)院本科三年級有9個專業(yè)組成,統(tǒng)計每個專業(yè)學(xué)生每月消費數(shù)據(jù)如下,用SPSS求消費數(shù)據(jù)的秩和順序統(tǒng)計量的現(xiàn)值:

300230208580690200263215520例題:某學(xué)院本科三年級有9個專業(yè)組成,統(tǒng)計每個專業(yè)學(xué)生每月消2.有結(jié)數(shù)據(jù)的秩設(shè)樣本X1,X2,…,XN取自總體X的簡單隨機抽樣,將數(shù)據(jù)排序后,相同的數(shù)據(jù)點組成一個“結(jié)”,稱重復(fù)數(shù)據(jù)的個數(shù)為結(jié)長。例1:3.83.21.21.23.43.23.2解:結(jié)長為3。2.有結(jié)數(shù)據(jù)的秩統(tǒng)計推斷:假設(shè)檢驗假設(shè)檢驗:假設(shè)檢驗是指我們可以對某一參數(shù)的假定值進行先驗判斷或預(yù)期,然后利用小概率原理對其進行檢驗,得到接受或拒絕原假設(shè)的結(jié)論。小概率原理:我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了,說明我們的假設(shè)有問題,所以我們將拒絕原來的假設(shè)。統(tǒng)計推斷:假設(shè)檢驗假設(shè)檢驗:小概率原理:非參數(shù)統(tǒng)計講義(課堂)課件參數(shù)統(tǒng)計的假設(shè)檢驗如:檢驗正態(tài)分布的均值是否相等H0:u1=u2;H1:u1≠u2檢驗均值是否等于零H0:u=0;H1:u≠0

參數(shù)統(tǒng)計的假設(shè)檢驗如:檢驗正態(tài)分布的均值是否相等例8-5

用自動裝袋機裝葡萄糖,每袋標(biāo)準(zhǔn)重500克,每隔一定時間需檢查機器工作是否正常.現(xiàn)抽得10袋,測得其重量為(單位:克)495,510,505,498,503,492,502,512,497,506,假定重量服從正態(tài)分布,問機器是否正常?解由于2未知,所以用T檢驗法提出假設(shè)例8-5用自動裝袋機裝葡萄糖,每袋標(biāo)準(zhǔn)重500克,每隔一定所以應(yīng)接受H0,可以認(rèn)為,機器工作正常.對拒絕域P值,由T=0.9733,df=9,可得(EXCEL函數(shù)=TDIST(0.9733,9,2)=0.35583559所以應(yīng)接受H0,可以認(rèn)為,機器工作正常.對拒絕域P值,由T假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?例8-8從兩臺切斷機所截下的坯料(長度按正態(tài)分布)中,分別抽?。競€和9個產(chǎn)品,測得長度如下(單位:mm):甲:150,145,152,155,148,151,

152,148乙:152,150,148,152,150,150,

148,151,148假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知21=22=2檢驗假設(shè)

解設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知21=非參數(shù)統(tǒng)計講義(課堂)課件對查表得拒絕域為所以應(yīng)接受對查表得拒絕域為所以應(yīng)接受參數(shù)方法定義:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值,推斷問題就轉(zhuǎn)化為對分布族的若干個未知參數(shù)的估計問題,用樣本對這些參數(shù)做出估計或者進行某種形式的假設(shè)檢驗,這類推斷方法稱為參數(shù)方法。比如:(1)研究保險公司的索賠請求數(shù)時,可能假定索賠請求數(shù)來自泊松分布P(a);(2)研究化肥對農(nóng)作物產(chǎn)量的影響效果時,平均意義之下,每測量單元(可能是)產(chǎn)量服從正態(tài)分布N(a,b).參數(shù)方法定義:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的接受域置信區(qū)間假設(shè)檢驗區(qū)間估計統(tǒng)計量

樞軸量對偶關(guān)系同一函數(shù)假設(shè)檢驗與區(qū)間估計的聯(lián)系接受域置信區(qū)間假區(qū)統(tǒng)計量樞軸量對偶關(guān)系同一函數(shù)假設(shè)檢驗與區(qū)假設(shè)檢驗的基本概念若對參數(shù)有所了解但有猜測懷疑,需要證實之時用假設(shè)檢驗的方法來處理若對參數(shù)一無所知用參數(shù)估計的方法處理假設(shè)檢驗的基本概念若對但有猜測懷疑,用假設(shè)若對參數(shù)用參數(shù)估計接受域置信區(qū)間檢驗統(tǒng)計量及其在H0為真時的分布樞軸量及其分布原假設(shè)

H0備擇假設(shè)

H1待估參數(shù)

0

0(

2未知)(

2未知)接受域置信區(qū)間檢驗統(tǒng)計量及其在樞軸量及其分布原假設(shè)備擇假設(shè)待一個典型的參數(shù)檢驗過程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為

WholeNumbersorFractions

Example:HeightinInches(72,60.5,54.7)3.有很強的假定Example:正態(tài)分布4.例子:ZTest,tTest,2Test一個典型的參數(shù)檢驗過程1.總體參數(shù)一個例子:對兩組學(xué)生進行語法測試,如何比較兩組學(xué)生的成績是否存在差異?組1組244253330222983447243125401330323324353018322137352822一個例子:對兩組學(xué)生進行語法測試,如何比較兩組學(xué)生的成績是否非參數(shù)統(tǒng)計講義(課堂)課件原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5原始數(shù)據(jù)秩259.54426.0非參數(shù)統(tǒng)計講義(課堂)課件假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)=50..單邊備擇單邊備擇雙邊備擇零假設(shè)(原假設(shè))與備擇假設(shè):例:單邊備擇零假設(shè)(原假設(shè))與備擇假設(shè):例:假設(shè)檢驗的方法1.置信區(qū)間法

置信區(qū)間提供了在某一置信度(例如95%)下真實參數(shù)值的取值范圍。

如果零假設(shè)中的值未落入該區(qū)間,也就是說小概率事件發(fā)生了,我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了,說明我們的假設(shè)有問題,所以我們將拒絕該零假設(shè)。概念:接受域(置信區(qū)間)、拒絕域、臨界值

假設(shè)檢驗的方法置信區(qū)間提供了在某一置信度(例第一類錯誤和第二類錯誤:一個偏離

由小概率原理我們可以看出,我們的這種判斷是有可能犯錯誤的。我們把可能犯的錯誤分為兩類:第一類錯誤和第二類錯誤。第一類錯誤:零假設(shè)是正確的,卻做出拒絕零假設(shè)的判斷,此為棄真錯誤。第二類錯誤:零假設(shè)是錯誤的,卻做出接受零假設(shè)的判斷,此為取偽錯誤。第一類錯誤和第二類錯誤:一個偏離由小概率原理假設(shè)檢驗不可能完全避免這兩類錯誤,我們只能想辦法使犯錯誤的概率盡量減小。1-置信水平,也稱顯著性水平犯第一類錯誤的概率=犯棄真錯誤的概率犯第二類錯誤的概率=犯取偽錯誤的概率假設(shè)檢驗不可能完全避免這兩類錯誤,我們只能想辦法使犯錯誤的概

兩類錯誤

假設(shè)檢驗存在著接受錯誤的假設(shè)和拒絕正確假設(shè)的可能性.正確拒絕H0正確接受H0決策行動H0

為非真H0為真假設(shè)的真實狀態(tài)檢驗結(jié)果假設(shè)檢驗的各種可能結(jié)果1-a1-β兩類錯誤假設(shè)檢驗存在著接受錯H0:無罪假設(shè)檢驗中的兩類錯誤(決策結(jié)果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假接受H01-a第二類錯誤(b)拒絕H0第一類錯誤(a)功效(1-b)假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程H0:無罪假設(shè)檢驗中的兩類錯誤陪審團審判裁決實際情況無罪有

錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和非參數(shù)統(tǒng)計講義(課堂)課件2.顯著性檢驗

顯著性檢驗:在給定顯著性水平下,為考察樣本值的顯著性而進行的假設(shè)檢驗。檢驗是統(tǒng)計顯著的:能夠拒絕零假設(shè),即觀察到的樣本值落入拒絕域。檢驗是統(tǒng)計不顯著的:不能夠拒絕零假設(shè),即觀察到的樣本值落入接受域。2.顯著性檢驗

確定顯著性水平,求臨界值.

在假設(shè)檢驗中,認(rèn)為零假設(shè)代表的事件概率很大,備擇假設(shè)代表的對立事件概率很小.

根據(jù)實際推斷原理(小概率原理),規(guī)定一個界限,當(dāng)某事件的概率,就認(rèn)為該事件是實際不可能事件.顯著性水平.

如果在一次檢驗中,備擇假設(shè)代表的小概率事件居然發(fā)生了,就有理由懷疑零假設(shè)的正確性.

這就是假設(shè)檢驗的基本原理.確定顯著性水平,求臨界值.顯著水平的選擇與P值P值(概率值)也稱為統(tǒng)計量的精確顯著性水平。它可定義為拒絕零假設(shè)的最小的顯著性水平。一般規(guī)律:

P值越小,越能拒絕零假設(shè)。某一點對應(yīng)的p值指的是以該值為臨界點確定的拒絕域的概率。顯著水平的選擇與P值P值(概率值)也稱為統(tǒng)統(tǒng)計檢驗的步驟總結(jié):第一步:表述零假設(shè)H0和備擇假設(shè)H1;第二步:選擇檢驗統(tǒng)計量;第三步:確定檢驗統(tǒng)計量的概率分布;第四步:選擇顯著性水平,即犯第一類錯誤的概率;第五步:選擇置信區(qū)間法或顯著檢驗方法。統(tǒng)計檢驗的步驟總結(jié):置信區(qū)間法:根據(jù)檢驗統(tǒng)計量的概率分布,建立一個置信區(qū)間(也即接受域),如果該區(qū)間包括零假設(shè)值,則接受零假設(shè),否則拒絕零假設(shè)。顯著檢驗法:在零假設(shè)下,得到相關(guān)統(tǒng)計量,并根據(jù)相應(yīng)的概率分布及事先給定的顯著性水平計算相應(yīng)的接受域(拒絕域),根據(jù)計算得到的值是否落入接受域(拒絕域)來決定是否接受(拒絕)零假設(shè)。如果不想事先選擇顯著性水平,則可依據(jù)該統(tǒng)計量的p值進行判斷。計算該統(tǒng)計量取某一特殊值的概率。如果這一概率值較小,則拒絕零假設(shè),否則,接受零假設(shè)。置信區(qū)間法:根據(jù)檢驗統(tǒng)計量的概率分布,建立一個置信區(qū)間(也即什么是P值?

(P-Value)是一個概率值如果我們假設(shè)原假設(shè)為真,P-值是觀測到的樣本均值不同于(<或>實測值的概率左側(cè)檢驗時,P-值為曲線上方小于等于檢驗統(tǒng)計量部分的面積右側(cè)檢驗時,P-值為曲線上方大于等于檢驗統(tǒng)計量部分的面積被稱為觀察到的(或?qū)崪y的)顯著性水平H0

能被拒絕的的最小值什么是P值?

(P-Value)是一個概率值利用P值進行決策單側(cè)檢驗若p-值

,不能拒絕H0若p-值<,拒絕H0雙側(cè)檢驗若p-值

/2,不能拒絕H0若p-值</2,拒絕H0利用P值進行決策單側(cè)檢驗雙尾Z檢驗

(P-值計算實例)

【例】欣欣兒童食品廠生產(chǎn)的盒裝兒童食品每盒的標(biāo)準(zhǔn)重量為368克?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取25盒進行檢查,測得每盒的平均重量為x=372.5克。企業(yè)規(guī)定每盒重量的標(biāo)準(zhǔn)差為15克。確定P-值。368克欣欣兒童食品廠雙尾Z檢驗

(P-值計算實例)【例】欣欣兒童食品廠雙尾Z檢驗

(P-值計算結(jié)果)樣本統(tǒng)計量的Z值(觀察到的)計算的檢驗統(tǒng)計量為:01.50-1.50Z雙尾Z檢驗

(P-值計算結(jié)果)樣本統(tǒng)計量的Z值計算的雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-1.50或Z1.50)樣本統(tǒng)計量的Z值(觀察到的)01.50-1.50Z雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-1.50或Z1.50)樣本統(tǒng)計量的Z值(觀察到的)01.50-1.50Z1/2p-值1/2p-值雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-1.50或Z1.50)從Z分布表查找1.50樣本統(tǒng)計量的Z值(觀察到的)01.50-1.50Z1/2p-值1/2p-值.4332雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-1.50或Z1.50)從Z分布表查找1.50樣本統(tǒng)計量的Z值(觀察到的)0.5-0.4332

=0.066801.50-1.50Z1/2p-值1/2p-值.4332雙尾Z檢驗

(P-值計算結(jié)果)p-值為P(Z-雙尾Z檢驗

(P-值計算結(jié)果)01.50-1.50Z1/2p-值=.06681/2p-值=.06681/2=.0251/2=.025拒絕拒絕雙尾Z檢驗

(P-值計算結(jié)果)01.50-1.50Z1雙尾Z檢驗

(P-值計算結(jié)果)2p=0.1336>

=0.05,不能拒絕H0檢驗統(tǒng)計量未在拒絕區(qū)域01.50-1.50Z1/2p-值=.06681/2p-值=.06681/2=.0251/2=.025拒絕拒絕雙尾Z檢驗

(P-值計算結(jié)果)2p=0.1336非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計教學(xué)要求

本課程的目的是使學(xué)生認(rèn)識到非參數(shù)統(tǒng)計方法是統(tǒng)計中最常用的推斷方法之一,理解非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,理解非參數(shù)統(tǒng)計的基本概念,掌握非參數(shù)統(tǒng)計的基本理論和計算,能應(yīng)用統(tǒng)計軟件和非參數(shù)統(tǒng)計方法分析解決實際問題。教學(xué)要求本課程的目的是使學(xué)生認(rèn)識到非參數(shù)統(tǒng)計方法是統(tǒng)計中最統(tǒng)計是分析數(shù)據(jù)信息的科學(xué)

這個定義決定了統(tǒng)計的命運:和數(shù)學(xué)不同,統(tǒng)計不能欣賞自己,它不為實際服務(wù)就沒有存在必要統(tǒng)計必須為各個領(lǐng)域服務(wù)統(tǒng)計必須和數(shù)據(jù)打交道因此,統(tǒng)計必須和計算機結(jié)合統(tǒng)計是分析數(shù)據(jù)信息的科學(xué)

這個定義決定了統(tǒng)計的命運:和數(shù)學(xué)不非參數(shù)統(tǒng)計產(chǎn)生的背景問題學(xué)生請假與星期幾有關(guān)嗎?股票漲跌與星期幾有關(guān)嗎?夫妻的審美觀有差異嗎?廣告的播出時間與電腦銷量有關(guān)嗎?嬰兒出生數(shù)白天與晚上有明顯差異嗎非參數(shù)統(tǒng)計產(chǎn)生的背景問題學(xué)生請假與星期幾有關(guān)嗎?

用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,使學(xué)生認(rèn)識到學(xué)習(xí)非參數(shù)統(tǒng)計方法的必要性。第一講非參數(shù)統(tǒng)計概論用實例說明非參數(shù)統(tǒng)計方法和參數(shù)統(tǒng)計方法的區(qū)別,使參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背景分布。分布由參數(shù)決定的,期望與方差總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)得知或它們的范圍。人們的主要任務(wù)就是對一些參數(shù),比如均值和方差(或標(biāo)準(zhǔn)差)進行估計或檢驗。參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計方法(NonparametricStatisticalmethod)對總體的概率分布假定以及測量尺度的要求即使有也很少的統(tǒng)計方法。當(dāng)能夠得到分類數(shù)據(jù)和順序數(shù)據(jù)時可以使用的方法。也稱為無分布方法(Distribution-freeStatisticsmethods),也稱自由分布統(tǒng)計學(xué)。表示無需對總體概率分布做出假定。因常按大小或出現(xiàn)先后次序排列資料進行分析,故又稱次序統(tǒng)計學(xué)(OrderStatistics)非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計方法(NonparametricSta什么是非參數(shù)檢驗?不假定了總體的具體背景分布形式。這些檢驗多根據(jù)數(shù)據(jù)觀測值的相對大小建立檢驗統(tǒng)計量,然后找到在零假設(shè)下這些統(tǒng)計量的分布??催@些統(tǒng)計量的數(shù)據(jù)實現(xiàn)是否在零假設(shè)下屬于小概率事件。這種和數(shù)據(jù)本身的總體分布無關(guān)的檢驗稱為非參數(shù)檢驗。什么是非參數(shù)檢驗?不假定了總體的具體背景分布形式。非參數(shù)檢驗有什么優(yōu)越性?在總體分布未知時,如果還假定總體有諸如正態(tài)分布那樣的已知分布,在進行統(tǒng)計推斷就可能產(chǎn)生錯誤甚至災(zāi)難。非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。但非參數(shù)統(tǒng)計在總體分布未知時效率要比假定了錯誤總體分布時的傳統(tǒng)方法要高,有時要高很多。非參數(shù)檢驗有什么優(yōu)越性?在總體分布未知時,如果還假定總體有諸哪個好?哪個好?選擇飛機與選擇用參數(shù)與非參數(shù)方法的思路相同。大型飛機很好,但對機場的要求很高。參數(shù)統(tǒng)計對數(shù)據(jù)要求很高。小型飛機不一定舒適,但起降時對機場的要求很低。同理非參數(shù)統(tǒng)計對數(shù)據(jù)要求較低。選擇飛機與選擇用參數(shù)與非參數(shù)方法的思路相同。統(tǒng)計方法的選擇:用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)計方法1、考慮對總體的假定。對總體有假定時用參數(shù),已具備使用參數(shù)統(tǒng)計方法時一般不用非參數(shù)統(tǒng)計。2、數(shù)據(jù)的度量尺度。定距與定比可以用參數(shù)。非參數(shù)統(tǒng)計方法的應(yīng)用條件:1、用于分析定類數(shù)據(jù)2、用于分析定序數(shù)據(jù)3、用于分析定距、定比數(shù)據(jù)時總體分布未做假定。統(tǒng)計方法的選擇:用參數(shù)統(tǒng)計方法與非參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法參數(shù)統(tǒng)計(ParametricStatisticalmethod)有兩個特點:1、以推斷某特定參數(shù)為對象。如總體均值μ,總體比例P,總體方差,兩個總體殫值的差等。2、常需要假定總體的分布是已知的,有的要假設(shè)總體是服從正態(tài)分布的,才能作出推斷。參數(shù)統(tǒng)計(ParametricStatisticalme數(shù)據(jù)的四種尺度:定類、定序、定距、定比對定類和定序的只能用非參數(shù)統(tǒng)計分析方法數(shù)據(jù)的四種尺度:對定類和定序的只能用非參數(shù)統(tǒng)計分析方法非參數(shù)檢驗的特點1、非參數(shù)統(tǒng)計方法應(yīng)用廣泛。2、它對資料的要求易于得到滿足。3、當(dāng)總體分布有具體形式未知,而且樣本容量很小時,無法用參數(shù)統(tǒng)計方法,只能用非參數(shù)方法。4、大多數(shù)非參數(shù)統(tǒng)計方法簡單、直觀、易于掌握和應(yīng)用。5、總體分布形式已知時,非參數(shù)統(tǒng)計的方法的檢驗功效不如假定總體已知的各種參數(shù)統(tǒng)計方法。非參數(shù)檢驗的特點6、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參數(shù)7、其通常按大小或出現(xiàn)先后順序排列的資料進行分析。8、通常以中位數(shù)代表分布的中心,以極差代表離散程度。6、非參數(shù)統(tǒng)計方法所推斷的通常不是總體參數(shù)非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應(yīng)的參數(shù)檢驗2獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2配對樣本/單一樣本符號檢驗Wilcoxon檢驗成對樣本t-檢驗>2獨立樣本Kruskal-Wallis檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關(guān)性檢驗Spearman秩相關(guān)Pearson相關(guān)性檢驗分布的檢驗Kolmogorov-Smirnov非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應(yīng)的參數(shù)檢驗2獨立樣本中MatrixofNonparametricStatisticsLevelofMeasurementNonparametricTestNonparametricCorrelationOneSampleTwoSamplesKSamplesRelatedUnrelatedRelatedUnrelatedNominalBinomialTestChi-SquareTestMcNemarChangeTestFisherExactTestfor2x2TablesChi-SquareTestforrx2TablesCochranQTestChi-SquareTestforrxkTablesCramerCoefficientPhiCoefficientKappaCoefficientAsymmetricalLambdaStatisticOrdinalKolmogorov-SmirnovOne-SampleTestOne-SampleRunsTestChange-PointTestSignTestWilcoxonSignedRanksTestMedianTestMann-WhitneyUTestRobustRank-OrderTestKolmogorov-SmirnovTwo-SampleTestSiegel-TukeyTestforScaleDifferencesFriedmanTwo-WayANOVAbyRanksPageTestforOrderedAlternativesExtensionoftheMedianTestKruskal-WallisOne-WayANOVAJonckheereTestforOrderedAlternativesSpearmanRank-OrderCoefficientKendallRank-OrderCoefficientKendallPartialRank-OrderCoefficientKendallCoefficientofConcordanceKendallCoefficientofAgreementCorrelationBetweenkJudgesandaCriterionTestGammaStatisticSomer’sIndexofAsymmetricAssociationMatrixofNonparametricStatis非參數(shù)統(tǒng)計的歷史非參數(shù)統(tǒng)計的形成主要歸功于20世紀(jì)40年代~50年代化學(xué)家F.Wilcoxon等人的工作。Wilcoxon于1945年提出兩樣本秩和檢驗,1947年Mann和Whitney二人將結(jié)果推廣到兩組樣本量不等的一般情況;Pitman于1948年回答了非參數(shù)統(tǒng)計方法相對于參數(shù)方法來說的相對效率方面的問題;非參數(shù)統(tǒng)計的歷史60年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用于生存分析。70年代到80年代,非參數(shù)統(tǒng)計借助計算機技術(shù)和大量計算獲得更穩(wěn)健的估計和預(yù)測,以P.J.Huber以及F.Hampel為代表的統(tǒng)計學(xué)家從計算技術(shù)的實現(xiàn)角度,為衡量估計量的穩(wěn)定性提出了新準(zhǔn)則。60年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用90年代有關(guān)非參數(shù)統(tǒng)計的研究和應(yīng)用主要集中在非參數(shù)回歸和非參數(shù)密度估計領(lǐng)域,其中較有代表性的人物是Silverman和J.Fan。非參數(shù)統(tǒng)計分為廣義的和狹義的兩種狹義的非參數(shù)統(tǒng)計主要研究假設(shè)檢驗,本課程研究狹義的。廣義的非參數(shù)統(tǒng)計只要不考慮總體的分布的統(tǒng)計分析方法90年代有關(guān)非參數(shù)統(tǒng)計的研究和應(yīng)用主要集中在非參數(shù)回歸和非參但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這是因為非參數(shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗無法拒絕。但非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高,有時要高很多。是否用非參數(shù)統(tǒng)計方法,要根據(jù)對總體分布的了解程度來確定。

但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這

因為非參數(shù)統(tǒng)計方法不利用關(guān)于總體分布的知識,所以,就是在對總體的任何知識都沒有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時非參數(shù)方法往往優(yōu)于參數(shù)方法,并且非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。因為非參數(shù)統(tǒng)計方法不利用關(guān)于總體分布的知識,所以,非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件數(shù)據(jù)的秩秩(rank)利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。數(shù)據(jù)的秩秩(rank)利用秩的大小進行推斷就避免了不知道背景非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置。

非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來非參數(shù)統(tǒng)計講義(課堂)課件秩(rank)

非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置。例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。

秩(rank)非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)159183178513719數(shù)據(jù)輸入SPSS159183178513719數(shù)據(jù)輸入SPSS非參數(shù)統(tǒng)計講義(課堂)課件非參數(shù)統(tǒng)計講義(課堂)課件例題:某學(xué)院本科三年級有9個專業(yè)組成,統(tǒng)計每個專業(yè)學(xué)生每月消費數(shù)據(jù)如下,用SPSS求消費數(shù)據(jù)的秩和順序統(tǒng)計量的現(xiàn)值:

300230208580690200263215520例題:某學(xué)院本科三年級有9個專業(yè)組成,統(tǒng)計每個專業(yè)學(xué)生每月消2.有結(jié)數(shù)據(jù)的秩設(shè)樣本X1,X2,…,XN取自總體X的簡單隨機抽樣,將數(shù)據(jù)排序后,相同的數(shù)據(jù)點組成一個“結(jié)”,稱重復(fù)數(shù)據(jù)的個數(shù)為結(jié)長。例1:3.83.21.21.23.43.23.2解:結(jié)長為3。2.有結(jié)數(shù)據(jù)的秩統(tǒng)計推斷:假設(shè)檢驗假設(shè)檢驗:假設(shè)檢驗是指我們可以對某一參數(shù)的假定值進行先驗判斷或預(yù)期,然后利用小概率原理對其進行檢驗,得到接受或拒絕原假設(shè)的結(jié)論。小概率原理:我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了,說明我們的假設(shè)有問題,所以我們將拒絕原來的假設(shè)。統(tǒng)計推斷:假設(shè)檢驗假設(shè)檢驗:小概率原理:非參數(shù)統(tǒng)計講義(課堂)課件參數(shù)統(tǒng)計的假設(shè)檢驗如:檢驗正態(tài)分布的均值是否相等H0:u1=u2;H1:u1≠u2檢驗均值是否等于零H0:u=0;H1:u≠0

參數(shù)統(tǒng)計的假設(shè)檢驗如:檢驗正態(tài)分布的均值是否相等例8-5

用自動裝袋機裝葡萄糖,每袋標(biāo)準(zhǔn)重500克,每隔一定時間需檢查機器工作是否正常.現(xiàn)抽得10袋,測得其重量為(單位:克)495,510,505,498,503,492,502,512,497,506,假定重量服從正態(tài)分布,問機器是否正常?解由于2未知,所以用T檢驗法提出假設(shè)例8-5用自動裝袋機裝葡萄糖,每袋標(biāo)準(zhǔn)重500克,每隔一定所以應(yīng)接受H0,可以認(rèn)為,機器工作正常.對拒絕域P值,由T=0.9733,df=9,可得(EXCEL函數(shù)=TDIST(0.9733,9,2)=0.35583559所以應(yīng)接受H0,可以認(rèn)為,機器工作正常.對拒絕域P值,由T假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?例8-8從兩臺切斷機所截下的坯料(長度按正態(tài)分布)中,分別抽?。競€和9個產(chǎn)品,測得長度如下(單位:mm):甲:150,145,152,155,148,151,

152,148乙:152,150,148,152,150,150,

148,151,148假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知21=22=2檢驗假設(shè)

解設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知21=非參數(shù)統(tǒng)計講義(課堂)課件對查表得拒絕域為所以應(yīng)接受對查表得拒絕域為所以應(yīng)接受參數(shù)方法定義:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值,推斷問題就轉(zhuǎn)化為對分布族的若干個未知參數(shù)的估計問題,用樣本對這些參數(shù)做出估計或者進行某種形式的假設(shè)檢驗,這類推斷方法稱為參數(shù)方法。比如:(1)研究保險公司的索賠請求數(shù)時,可能假定索賠請求數(shù)來自泊松分布P(a);(2)研究化肥對農(nóng)作物產(chǎn)量的影響效果時,平均意義之下,每測量單元(可能是)產(chǎn)量服從正態(tài)分布N(a,b).參數(shù)方法定義:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的接受域置信區(qū)間假設(shè)檢驗區(qū)間估計統(tǒng)計量

樞軸量對偶關(guān)系同一函數(shù)假設(shè)檢驗與區(qū)間估計的聯(lián)系接受域置信區(qū)間假區(qū)統(tǒng)計量樞軸量對偶關(guān)系同一函數(shù)假設(shè)檢驗與區(qū)假設(shè)檢驗的基本概念若對參數(shù)有所了解但有猜測懷疑,需要證實之時用假設(shè)檢驗的方法來處理若對參數(shù)一無所知用參數(shù)估計的方法處理假設(shè)檢驗的基本概念若對但有猜測懷疑,用假設(shè)若對參數(shù)用參數(shù)估計接受域置信區(qū)間檢驗統(tǒng)計量及其在H0為真時的分布樞軸量及其分布原假設(shè)

H0備擇假設(shè)

H1待估參數(shù)

0

0(

2未知)(

2未知)接受域置信區(qū)間檢驗統(tǒng)計量及其在樞軸量及其分布原假設(shè)備擇假設(shè)待一個典型的參數(shù)檢驗過程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為

WholeNumbersorFractions

Example:HeightinInches(72,60.5,54.7)3.有很強的假定Example:正態(tài)分布4.例子:ZTest,tTest,2Test一個典型的參數(shù)檢驗過程1.總體參數(shù)一個例子:對兩組學(xué)生進行語法測試,如何比較兩組學(xué)生的成績是否存在差異?組1組244253330222983447243125401330323324353018322137352822一個例子:對兩組學(xué)生進行語法測試,如何比較兩組學(xué)生的成績是否非參數(shù)統(tǒng)計講義(課堂)課件原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5原始數(shù)據(jù)秩259.54426.0非參數(shù)統(tǒng)計講義(課堂)課件假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)=50..單邊備擇單邊備擇雙邊備擇零假設(shè)(原假設(shè))與備擇假設(shè):例:單邊備擇零假設(shè)(原假設(shè))與備擇假設(shè):例:假設(shè)檢驗的方法1.置信區(qū)間法

置信區(qū)間提供了在某一置信度(例如95%)下真實參數(shù)值的取值范圍。

如果零假設(shè)中的值未落入該區(qū)間,也就是說小概率事件發(fā)生了,我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗中它幾乎是不會發(fā)生的。如果發(fā)生了,說明我們的假設(shè)有問題,所以我們將拒絕該零假設(shè)。概念:接受域(置信區(qū)間)、拒絕域、臨界值

假設(shè)檢驗的方法置信區(qū)間提供了在某一置信度(例第一類錯誤和第二類錯誤:一個偏離

由小概率原理我們可以看出,我們的這種判斷是有可能犯錯誤的。我們把可能犯的錯誤分為兩類:第一類錯誤和第二類錯誤。第一類錯誤:零假設(shè)是正確的,卻做出拒絕零假設(shè)的判斷,此為棄真錯誤。第二類錯誤:零假設(shè)是錯誤的,卻做出接受零假設(shè)的判斷,此為取偽錯誤。第一類錯誤和第二類錯誤:一個偏離由小概率原理假設(shè)檢驗不可能完全避免這兩類錯誤,我們只能想辦法使犯錯誤的概率盡量減小。1-置信水平,也稱顯著性水平犯第一類錯誤的概率=犯棄真錯誤的概率犯第二類錯誤的概率=犯取偽錯誤的概率假設(shè)檢驗不可能完全避免這兩類錯誤,我們只能想辦法使犯錯誤的概

兩類錯誤

假設(shè)檢驗存在著接受錯誤的假設(shè)和拒絕正確假設(shè)的可能性.正確拒絕H0正確接受H0決策行動H0

為非真H0為真假設(shè)的真實狀態(tài)檢驗結(jié)果假設(shè)檢驗的各種可能結(jié)果1-a1-β兩類錯誤假設(shè)檢驗存在著接受錯H0:無罪假設(shè)檢驗中的兩類錯誤(決策結(jié)果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假接受H01-a第二類錯誤(b)拒絕H0第一類錯誤(a)功效(1-b)假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程H0:無罪假設(shè)檢驗中的兩類錯誤陪審團審判裁決實際情況無罪有

錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和非參數(shù)統(tǒng)計講義(課堂)課件2.顯著性檢驗

顯著性檢驗:在給定顯著性水平下,為考察樣本值的顯著性而進行的假設(shè)檢驗。檢驗是統(tǒng)計顯著的:能夠拒絕零假設(shè),即觀察到的樣本值落入拒絕域。檢驗是統(tǒng)計不顯著的:不能夠拒絕零假設(shè),即觀察到的樣本值落入接受域。2.顯著性檢驗

確定顯著性水平,求臨界值.

在假設(shè)檢驗中,認(rèn)為零假設(shè)代表的事件概率很大,備擇假設(shè)代表的對立事件概率很小.

根據(jù)實際推斷原理(小概率原理),規(guī)定一個界限,當(dāng)某事件的概率,就認(rèn)為該事件是實際不可能事件.顯著性水平.

如果在一次檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論