




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
分布類型的檢驗第1頁/共52頁第10章分布類型的檢驗10.1假設(shè)檢驗的基本思想10.2正態(tài)分布檢驗10.3二項分布檢驗10.4游程檢驗10.5本章小結(jié)第2頁/共52頁第11章連續(xù)變量的統(tǒng)計推斷(一)——t檢驗
11.1
t檢驗基礎(chǔ)
11.2樣本均數(shù)與總體均數(shù)的比較
11.3成組設(shè)計兩樣本均數(shù)的比較
11.4配對設(shè)計樣本均數(shù)的比較
11.5本章小結(jié)第3頁/共52頁10.1假設(shè)檢驗的基本思想10.1.1問題的提出10.1.2假設(shè)檢驗的基本思想10.1.3假設(shè)檢驗的兩類錯誤10.1.4假設(shè)檢驗中的其他問題第4頁/共52頁10.1.1問題的提出在總體的分布函數(shù)完全未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服正態(tài)分布的假設(shè);對正態(tài)總體提出均值等于a0的假設(shè)等等。假設(shè)檢驗就是根據(jù)樣本對所提出的假設(shè)作出判斷:是接受,還是拒絕。第5頁/共52頁10.1.1問題的提出假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。第6頁/共52頁10.1.2假設(shè)檢驗的基本思想如何利用樣本值對一個具體的假設(shè)進行檢驗?通常借助于直觀分析和理論分析相結(jié)合的做法,其基本原理就是人們在實際問題中經(jīng)常采用的所謂小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發(fā)生。第7頁/共52頁10.1.2假設(shè)檢驗的基本思想反證法思想是先提出假設(shè)(檢驗假設(shè)H0),再用適當?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如可能性小,則認為假設(shè)不成立,若可能性大,則還不能認為假設(shè)不成立。第8頁/共52頁10.1.2假設(shè)檢驗的基本思想先要根據(jù)問題的題意或者對總體分布的未知參數(shù)提出個原假設(shè),比如某正態(tài)總體的均值等于5(a=5)。這種原假設(shè)也稱為零假設(shè)(nullhypothesis),記為H0。或者對總體分布的形式做出假設(shè),例如總體服從正態(tài)分布。前者屬于參數(shù)假設(shè)檢驗,后者屬于非參數(shù)假設(shè)檢驗。第9頁/共52頁10.1.2假設(shè)檢驗的基本思想與此同時必須提出備選假設(shè)(或稱為備擇假設(shè),alternativehypothesis),比如總體均值大于5(a>5)。備選假設(shè)記為H1a。備選假設(shè)應(yīng)該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實。比如上面的H1為a>5;這意味著,至少樣本均值應(yīng)該大于5;第10頁/共52頁10.1.2假設(shè)檢驗的基本思想至于是否顯著,依檢驗結(jié)果而定。檢驗結(jié)果顯著(significant)意味著有理由拒絕零假設(shè)。因此,假設(shè)檢驗也被稱為顯著性檢驗(significanttest)。第11頁/共52頁10.1.2假設(shè)檢驗的基本思想有了兩個假設(shè),就要根據(jù)數(shù)據(jù)來對它們進行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計量;它在檢驗中被稱為檢驗統(tǒng)計量(teststatistic)。根據(jù)零假設(shè)(不是備選假設(shè)?。?,可得到該檢驗統(tǒng)計量的分布;再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值(realization)屬不屬于小概率事件。第12頁/共52頁10.1.2假設(shè)檢驗的基本思想也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設(shè)下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說“該檢驗顯著。”否則說“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗不顯著?!钡?3頁/共52頁10.1.2假設(shè)檢驗的基本思想在零假設(shè)下,檢驗統(tǒng)計量取其實現(xiàn)值及(沿著備選假設(shè)的方向)更加極端值的概率稱為p-值(p-value)。如果得到很小的p-值,就意味著在零假設(shè)下小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當然多半是相信數(shù)據(jù),拒絕零假設(shè)。第14頁/共52頁10.1.2假設(shè)檢驗的基本思想但小概率并不能說明不會發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯誤常被稱為第一類錯誤(typeIerror)。在備選假設(shè)正確時反而說零假設(shè)正確的錯誤,稱為第二類錯誤(typeIIerror)。第15頁/共52頁10.1.2假設(shè)檢驗的基本思想零假設(shè)和備選假設(shè)哪一個正確,是確定性的,沒有概率可言。而可能犯錯誤的是人。涉及假設(shè)檢驗的犯錯誤的概率就是犯第一類錯誤的概率和犯第二類錯誤的概率。負責任的態(tài)度是無論做出什么決策,都應(yīng)該給出該決策可能犯錯誤的概率。第16頁/共52頁10.1.2假設(shè)檢驗的基本思想到底p-值是多小時才能夠拒絕零假設(shè)呢?也就是說,需要有什么是小概率的標準。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計書和軟件中,使用最多的標準是在零假設(shè)下(或零假設(shè)正確時)根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設(shè)的概率應(yīng)小于0.05,當然也可能是0.01,0.005,0.001等等。第17頁/共52頁10.1.2假設(shè)檢驗的基本思想這種事先規(guī)定的概率稱為顯著性水平(significantlevel),用字母alpha來表示。alpha并不一定越小越好,因為這很可能導(dǎo)致不容易拒絕零假設(shè),使得犯第二類錯誤的概率增大。第18頁/共52頁10.1.2假設(shè)檢驗的基本思想當p-值小于或等于alpha時,就拒絕零假設(shè)。所以,alpha是所允許的犯第一類錯誤概率的最大值。當p-值小于或等于alpha時,拒絕原假設(shè)H0,就說這個檢驗是顯著的。無論統(tǒng)計學家用多大的alpha作為顯著性水平都不能脫離實際問題的背景。統(tǒng)計顯著不一定等價于實際顯著。反過來也一樣。第19頁/共52頁10.1.2假設(shè)檢驗的基本思想實際上,多數(shù)計算機軟件僅僅給出p-值,這有很多方便之處。比如alpha=0.05,而假定所得到的p-值等于0.001。這時如果采用p-值作為新的顯著性水平,即新的alpha=0.001,于是就可以說,在顯著性水平為0.001時,拒絕零假設(shè)。第20頁/共52頁10.1.2假設(shè)檢驗的基本思想這樣,拒絕零假設(shè)時犯錯誤的概率實際只是千分之一而不是舊的alpha所表明的百分之五。在這個意義上,p-值又稱為觀測的顯著性水平(observedsignificantlevel)。在統(tǒng)計軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫“Sig”就是這個道理。第21頁/共52頁10.1.2假設(shè)檢驗的基本思想歸納起來,假設(shè)檢驗的一般步驟為:1.寫出零假設(shè)和備選假設(shè);2.確定檢驗統(tǒng)計量;3.確定顯著性水平;4.根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;5.根據(jù)這個實現(xiàn)值計算p-值;第22頁/共52頁10.1.2假設(shè)檢驗的基本思想6.進行判斷:如果p-值小于或等于alpha,就拒絕零假設(shè),這時犯(第一類)錯誤的概率最多為alpha;如果p-值大于alpha,就不拒絕零假設(shè),因為證據(jù)不足。第23頁/共52頁10.1.4假設(shè)檢驗中的其他問題(1)做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。(2)當差別有統(tǒng)計學意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。(3)根據(jù)資料類型和特點選用正確的假設(shè)檢驗方法。(4)根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。第24頁/共52頁10.1.4假設(shè)檢驗中的其他問題(5)當檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的可能性預(yù)先是知道的,即檢驗水準那么大;當檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。第25頁/共52頁10.1.4假設(shè)檢驗中的其他問題(6)判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性。(7)報告結(jié)論時是應(yīng)注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。第26頁/共52頁10.2正態(tài)分布檢驗
10.2.1
K-S檢驗的原理
10.2.2分析實例第27頁/共52頁10.2.1
K-S檢驗的原理單樣本的Kolmogorov-Smirnov檢驗(K-S檢驗,柯爾莫哥諾夫-斯米爾諾夫檢驗)是用來檢驗一個數(shù)據(jù)的觀測累積分布是否是已知的理論分布。設(shè)總體X~F(x),F(xiàn)(x)是未知的,F(xiàn)0(x)是一個給定的分布函數(shù),欲檢驗H0:F(x)=F0(x)第28頁/共52頁10.2.1
K-S檢驗的原理由于當n較大時,理論上有經(jīng)驗分布函數(shù)Fn(x)是F(x)的良好近似。構(gòu)造Kolmogorov–Smirnov統(tǒng)計量來反映F(x)和F0(x)之間的差異,若D較小,表明二者間沒有顯著差異,否則有顯著差異。第29頁/共52頁10.2.1
K-S檢驗的原理Kolmogorov–Smirnov證明了統(tǒng)計量D的極限分布為Q()分布,計算出記為Z值,并根據(jù)極限分布計算出相應(yīng)的顯著性概率若Sig.小于給點的顯著性水平alpha,則拒絕H0,否則,接受H0.第30頁/共52頁10.2.2分析實例例12.1請判斷SPSS自帶數(shù)據(jù)集anxity.sav中score的分布是否服從正態(tài)分布。操作如下:AnalyzeNonparametictest1-sampleK-STestvariablelist框:選入scoreTestdistribution復(fù)選框組:選中normal復(fù)選框單擊OK鈕系統(tǒng)給出的統(tǒng)計分析結(jié)果,具體如下:第31頁/共52頁數(shù)據(jù)文件第32頁/共52頁操作過程第33頁/共52頁由于p=Sig.=0.652>0.05,故接受原假設(shè),認為score服從正態(tài)分布。第34頁/共52頁
變量名Score樣本量
48正態(tài)分布參數(shù)均數(shù)10.00
標準差5.17最極端的差異絕對值.106
正值.088
負值-.106K-S檢驗的統(tǒng)計量Z值
.735近似P值(雙側(cè))
.652第35頁/共52頁注意K-S檢驗可以檢驗正態(tài)分布,均勻分布,泊松分布,指數(shù)分布。第36頁/共52頁10.3二項分布檢驗10.3.1二項分布檢驗的原理10.3.2分析實例第37頁/共52頁10.3.1二項分布檢驗的原理當一個變量只取0,1值時,稱為二分值變量。當一個問題只有兩種可能結(jié)果時,稱為二分值問題。二分值問題的一種結(jié)果稱為“成功”,另一種稱為“失敗”。二項分布檢驗(BinomialTest)就是對二分值問題的成功概率進行檢驗。第38頁/共52頁10.3.1二項分布檢驗的原理設(shè)S+表示對二分值問題進行n次試驗中成功的次數(shù)。例如用同樣的方法擲一枚硬幣100次,出現(xiàn)正面44次,出現(xiàn)反面56次,問該硬幣是否均勻?該例中S+=44,S-=56,檢驗假設(shè)為:H0:p=p0=0.5當H0為真時,S+服從參數(shù)為P0的二項分布。第39頁/共52頁10.3.1二項分布檢驗的原理計算S+的值,并根據(jù)二項分布計算相應(yīng)的顯著性概率Sig.,若Sig.小于給定的顯著性水平alpha,則拒絕H0,否則接受拒絕H0。因為是基于二項分布的概率進行判斷,所以此種檢驗法稱為二項分布檢驗法。當試驗總次數(shù)n較大時,S+近似服從正態(tài)分布。所以往往根據(jù)正態(tài)分布計算Sig.的近似值。第40頁/共52頁10.3.2分析實例例10.6根據(jù)以往經(jīng)驗,新生兒染色體異常率一般為1%,現(xiàn)某醫(yī)院觀察了當?shù)毓?00名新生兒,只發(fā)現(xiàn)一例染色體異常。數(shù)據(jù)見binominal.sav,該地新生兒染色體異常率是否低于一般?第41頁/共52頁10.3.2分析實例原假設(shè):H0:p=0.01,異常率并無不同備擇假設(shè):H1:p<0.01,異常率低于一般加權(quán):DataWeightCases:頻數(shù)numAnalyzeNonparametricTests->BinomialTestVariable:染色體異常率illTestProportion:0.01第42頁/共52頁10.3.2分析實例Sig=.090(按正態(tài)分布近似計算)>0.05,不能拒絕原假設(shè),尚不能認為異常率低于一般。第43頁/共52頁10.4游程檢驗10.4.1游程檢驗的原理10.4.2分析實例第44頁/共52頁10.4.1游程檢驗的原理游程檢驗(Runstest)與二項分布檢驗都是對二分值問題進行檢驗,但它不是對“成功”概率進行檢驗,而是檢驗多個二分值問題之間是否相互獨立?原假設(shè)H0:多個二分值問題之間獨立游程檢驗是基于游程數(shù)的多少來檢驗,那么什么是游程呢?第45頁/共52頁10.4.1游程檢驗的原理游程就是0,1序列中0或者1的連續(xù)段,即0或1的每個連續(xù)段稱為一個游程。設(shè)天氣預(yù)報記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對以后天氣是否下雨有無影響?易知該記錄總游程數(shù)U=11。第46頁/共52頁10.4.1游程檢驗的原理如果原假設(shè)H0成立,則0,1序列交替均勻,從而總游程數(shù)U較大,否則U較小。所以,我們可以通過總游程數(shù)U的大小來判斷H0是否成立。選擇U為檢驗統(tǒng)計量,當樣本數(shù)n較大時,U近似服從正態(tài)分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國隧道工程行業(yè)發(fā)展趨勢規(guī)劃研究報告
- 2025-2030年中國鍛壓機械制造行業(yè)運行現(xiàn)狀及未來投資發(fā)展研究報告
- 2025-2030年中國金屬鎂產(chǎn)業(yè)十三五規(guī)劃及發(fā)展趨勢分析報告
- 2025-2030年中國金屬天花產(chǎn)業(yè)運營趨勢及投資戰(zhàn)略研究報告
- 2025-2030年中國醋酸仲丁酯市場十三五規(guī)劃與投資風險評估報告
- 2025-2030年中國裙帶菜行業(yè)市場運行態(tài)勢及發(fā)展戰(zhàn)略分析報告
- 2025-2030年中國蔬菜飲料市場運行動態(tài)與營銷策略研究報告
- 2025-2030年中國花園式住宅行業(yè)競爭格局及發(fā)展可行性分析報告
- 2025-2030年中國職業(yè)裝市場十三五規(guī)劃與未來發(fā)展前景預(yù)測報告
- 2025-2030年中國磚瓦行業(yè)競爭態(tài)勢與營銷策略研究報告
- 病原生物與免疫學-課件
- 初中語文期末考試試卷分析
- 聽胎心音操作評分標準
- HWSD數(shù)據(jù)庫土壤中文名稱
- 地產(chǎn)集團地產(chǎn)體系員工職業(yè)序列及職業(yè)等級管理規(guī)定
- 安徽華星化工有限公司殺蟲單廢鹽資源化處理項目環(huán)境影響報告書
- 平安健康文明主題班會
- 消防工程管理辦法附流程圖
- 雨水管道中粗砂回填
- 金庸群俠傳x最完整攻略(實用排版)
- 團意操作流程詳解課件
評論
0/150
提交評論