版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
應(yīng)用數(shù)理統(tǒng)計假設(shè)檢驗非參數(shù)檢驗1第一頁,共五十五頁,2022年,8月28日(b)原假設(shè)與備擇假設(shè)的地位是不對稱的,當(dāng)“小概率事件”未發(fā)生時,就不能拒絕原假設(shè)但不等于邏輯上證明了成立,只能說沒有充分的證據(jù)拒絕。即受保護(hù).都成立。例3.11
(P92)設(shè)總體X~N(,1),
又設(shè)X1,X2,...,Xn為總體X的樣本,樣本均值=X1=0.5
,樣本容量n=1,α=0.05,提出兩種假設(shè)的方法,分別如下:第二頁,共五十五頁,2022年,8月28日
實際中,一般提出原假設(shè)要慎重,傾向于不輕易否定,而受保護(hù)的程度為α。其越小,小概率事件就越難發(fā)生,H0就越難被否定。(c)從另一角度看,既然原假設(shè)H0受保護(hù),則對其的肯定相對來說是缺乏說服力的,反之對其的否定則是有力的,且α越小,小概率事件就越難發(fā)生,一旦發(fā)生了,這種否定就越有力。第三頁,共五十五頁,2022年,8月28日3.4.2檢驗中的兩類錯誤
所謂犯錯誤是指檢驗的結(jié)論與實際情況不符。兩類錯誤:(1)H0
成立,而檢驗結(jié)果表明其不成立——“棄真”;(2)H0不成立,而檢驗結(jié)果表明其成立——“取偽”。記:=P{第一類錯誤}=P{拒絕H0|H0真}
=P{第二類錯誤}=P{接受H0|H0偽}檢驗的本質(zhì)是構(gòu)造否定域V,在看樣本點是否落入V中。
當(dāng)然,我們希望犯兩類錯誤的概率都盡可能的小,最好都為零.但當(dāng)樣本容量固定時,是不可能的.在實際問題中,通常的做法是:先限制犯第一類錯誤的概率,即根據(jù)實際情況,指定一個較小的數(shù)(如0.05,0.01等),有了的值,從而可確定拒絕域.第四頁,共五十五頁,2022年,8月28日例3.12
(P94)設(shè)總體X~N(,02),02已知,又設(shè)X1,X2,...,Xn為總體X的樣本,x1,x2,…,xn為X的一組樣本觀測值,試求對問題:的檢驗的兩類錯誤的概率。拒絕域:單側(cè)檢驗第五頁,共五十五頁,2022年,8月28日3.4.3樣本容量確定問題從例3.12看出,當(dāng)樣本容量固定時,若要控制第一類錯誤的概率,就不能使第二類錯誤的概率任意小。但從(3.10)式看出,固定α,使n增大,可使β任意小。但實際中,樣本的采集是有成本的,或根本無法獲得大樣本。引出問題:能否確定一個最小的n使得兩類錯誤的概率都在控制的范圍。第六頁,共五十五頁,2022年,8月28日(一)正態(tài)總體,已知;的u檢驗。當(dāng)?shù)仁接叶瞬皇钦麛?shù)時,取不小于右端的最小的整數(shù)第七頁,共五十五頁,2022年,8月28日(二)正態(tài)總體,未知,考慮的檢驗。隱式解,通過給定的α和β試算確定n.第八頁,共五十五頁,2022年,8月28日例3.13一門炮需通過發(fā)射試驗來進(jìn)行精度驗收,假設(shè)命中誤差是純隨機的,又橫向(或縱向)誤差容許的標(biāo)準(zhǔn)差為σ0,制造方要求采用的檢驗方法要求保證:如果產(chǎn)品合格而被拒絕的概率不大于5%;使用方要求保證,若產(chǎn)品不合格且標(biāo)準(zhǔn)差超過√2σ0而被接受的概率小于10%,試問至少應(yīng)發(fā)射多少發(fā)炮彈進(jìn)行試驗,才能滿足雙方的要求。解:設(shè)炮彈落點的橫向(或縱向)偏差服從正態(tài)分布,利用上式,通過給定的α=0.05和β=0.1,查表進(jìn)行試算,最后確定n=37.第九頁,共五十五頁,2022年,8月28日SPSS
軟件:參數(shù)檢驗之均值檢驗Means過程對準(zhǔn)備比較的各組計算描述指標(biāo),進(jìn)行預(yù)分析,也可直接比較。One-SamplesTTest過程進(jìn)行樣本均數(shù)與已知總體均數(shù)的比較。Independent-SamplesTTest過程進(jìn)行兩樣本均數(shù)差別的比較,即通常所說的兩組資料的t檢驗。Paired-SamplesTTest過程進(jìn)行配對資料的顯著性檢驗,即配對t檢驗。One-WayANOVA過程進(jìn)行兩組及多組樣本均數(shù)的比較,即成組設(shè)計的方差分析,還可進(jìn)行隨后的兩兩比較。第十頁,共五十五頁,2022年,8月28日再通過轉(zhuǎn)換:
將u通過轉(zhuǎn)換為y以后,留下x和y的刻度就是正態(tài)概率紙,是非均勻刻度。若是一般正態(tài)分布總體,則分布函數(shù)的圖形,在x-u平面上是一條直線。即:x=σu+μ.
σ不同表示斜率不同,μ不同表示在x軸上的截距不同。(二)檢驗方法
若假設(shè)H0為真,則在概率紙上的坐標(biāo)點(xi’,Fn
(xi’)(i=1,2,…,m)在一條直線上。若在(近似)一條直線上,就接受假設(shè),否則拒絕。一般中間點靠近即可。第十一頁,共五十五頁,2022年,8月28日§3.5非參數(shù)假設(shè)檢驗
總體的分布類型不知道,僅知是連續(xù)或離散型(一)正態(tài)概率紙的構(gòu)造
首先建立一直角坐標(biāo)系,橫軸上刻度為x軸,縱軸上刻度為u值,都為均勻刻度。其中:3.5.1正態(tài)概率紙檢驗工程上常用的簡單但粗糙方法,用以判斷是否正態(tài)分布以及相應(yīng)的均值和方差估計。
非參數(shù)檢驗隨機變量之間的獨立性檢驗總體分布函數(shù)的擬合檢驗{第十二頁,共五十五頁,2022年,8月28日
基本方法是首先將容量為n的樣本從小到大排序得到
,則樣本的經(jīng)驗分布函數(shù)可表示為當(dāng)
時,實際上取
,相應(yīng)的
是N(0,1)的
分位點,此時點
應(yīng)該近似在直線
上。如果由樣本計算出的n個點近似在直線上,則可認(rèn)為它來自正態(tài)分布。一般地,中間的點的位置離直線的偏差不能太大,兩頭的離直線位置的偏差可以大一些.否則拒絕原假設(shè).講解P99-101(例3.14)第十三頁,共五十五頁,2022年,8月28日表3.3編號分組區(qū)間組中值頻數(shù)累積頻數(shù)累積頻率(%)1(-∞,198]196.56652(198,201]199.571310.833(201,204]202.5142722.504(204,207]205.5204739.175(207,210]208.5237058.336(210,213]211.5229276.667(213,216]214.51410688.338(216,219]217.58114959(219,+∞)220.56120100以分組區(qū)間的中點(組中值)為橫坐標(biāo),累積頻率為縱坐標(biāo),在正態(tài)概率紙上描出9個點(如圖3-6,見書上P101)第十四頁,共五十五頁,2022年,8月28日由圖形檢驗大致地判斷出總體是服從正態(tài)分布后,由于由與直線交點的橫坐標(biāo)即為;又由于,則與直線的交點的橫坐標(biāo)為得到。
除此之外,還有對數(shù)正態(tài)概率紙,威布Weibull概率紙等來研究相應(yīng)的分布——定性的方法。(三)未知參數(shù)μ,σ2的估計以下介紹數(shù)值檢驗方法(定量方法)。第十五頁,共五十五頁,2022年,8月28日SPSS
軟件:非參數(shù)檢驗之正態(tài)概率紙輸入數(shù)據(jù):確定變量,輸入樣本.若是分組資料,樣本值輸入組中值,再加權(quán)(DATAWeighBy頻數(shù))Q-Q圖——一種正態(tài)概率紙,檢驗的命令在GRAPHS菜單,由得到的圖形是否為一條直線,可以大致地判斷總體是否服從正態(tài)分布。P99-101(例3.14)第十六頁,共五十五頁,2022年,8月28日3.5.2皮爾遜擬合檢驗擬合檢驗:H0:X的分布函數(shù)為F0(X)
為理論分布,用其去擬合樣本值。擬合優(yōu)度:擬合好壞的標(biāo)準(zhǔn),即擬合的優(yōu)良程度。設(shè)總體X(一維或多維)的分布完全已知或分布中含有未知參數(shù)。為樣本值。一般原則:構(gòu)造檢驗統(tǒng)計量(樣本X與總體分布F0的偏差的度量)及界限D(zhuǎn)0
。若D超過了D0,就否定,否則接受原假設(shè)。對于D的不同定義可以得到不同的檢驗方法。第十七頁,共五十五頁,2022年,8月28日(一)理論分布完全已知的情況1設(shè)總體X是離散型,取有限值理論分布律F0
:
原假設(shè)
記ni為中等于ai的個數(shù),
(ni稱為ai的觀察頻數(shù)),Xa1a2…akPp1p2…pk第十八頁,共五十五頁,2022年,8月28日而npi稱作ai的理論頻數(shù)。當(dāng)X的分布為F0,,由大數(shù)定理,H0成立時,與相差不大。1900年,皮爾遜建立了統(tǒng)計量
用來衡量理論分布{p1,p2,…,pk}與實際數(shù)據(jù)的偏差.(相對差異的總和)。第十九頁,共五十五頁,2022年,8月28日得到了:當(dāng)為真時,當(dāng)為假時,皮爾遜還證明了,時,統(tǒng)計量的極限分布為第二十頁,共五十五頁,2022年,8月28日因此,給定檢驗水平α上述檢驗問題的否定域為:
(單側(cè)檢驗問題)此時,時,
——皮爾遜檢驗法。講解例3.15(P104)第二十一頁,共五十五頁,2022年,8月28日Sig.P值>α=0.05,接受H0SPSS輸入變量值及頻數(shù),給變量加權(quán)選ANALYZE菜單非參數(shù)檢驗二項分布檢驗,輸入檢驗參數(shù)值.第二十二頁,共五十五頁,2022年,8月28日(2)為一般(連續(xù))的完全已知分布
化作離散型處理(設(shè)一維的情況)選取常數(shù),將分成k個互不相交的區(qū)間,記作。記為X落入?yún)^(qū)間的概率.第二十三頁,共五十五頁,2022年,8月28日記為樣本落入?yún)^(qū)間的頻數(shù),理論頻數(shù)為。皮爾遜檢驗統(tǒng)計量為在為真時,其極限分布為其余方法與前(1)相同。第二十四頁,共五十五頁,2022年,8月28日
在許多實際問題中,理論分布類型已知,但其中含有若干未知參數(shù).如:
此時,檢驗先求下,未知參數(shù)的點估計(最大似然估計),記作,再計算(二)理論分布帶參數(shù)的情況第二十五頁,共五十五頁,2022年,8月28日用此代替前述的,得到統(tǒng)計量為
Fisher證明了滿足一定條件下的點估計,其極限分布為于是,否定域為具體過程見P106,例3.16。第二十六頁,共五十五頁,2022年,8月28日SPSS輸入變量值及頻數(shù),給變量加權(quán),選ANALYZE菜單非參數(shù)檢驗中卡方檢驗,輸入檢驗參數(shù)值(Pi).第二十七頁,共五十五頁,2022年,8月28日(三)方法用于檢驗獨立性如“服新藥”與“痊愈”,“吸煙”與“患肺癌”等關(guān)系問題。模型:設(shè)X的可能取值是1,2,…,r
Y的可能取值是1,2,…,s。對隨機向量(X,Y)進(jìn)行了n次觀察,發(fā)現(xiàn)出現(xiàn)的次數(shù)為(頻數(shù))。檢驗假設(shè)
H0:X與Y相互獨立。第二十八頁,共五十五頁,2022年,8月28日當(dāng)假設(shè)為真時,研究問題的數(shù)據(jù)常排列為“列聯(lián)表”(見P108)。設(shè):于是檢驗問題為:第二十九頁,共五十五頁,2022年,8月28日若分布已知,即已知,構(gòu)造統(tǒng)計量
但此時分布未知,用極大似然估計量代替得到得到否定域第三十頁,共五十五頁,2022年,8月28日SPSS講解例3.17(P110)
輸入變量值及頻數(shù),給變量加權(quán),選ANALYZE菜單描述性統(tǒng)計中列聯(lián)表,輸入行和列,點復(fù)選框中卡方檢驗進(jìn)行獨立性檢驗.第三十一頁,共五十五頁,2022年,8月28日若(X,Y)為連續(xù)型隨機向量時,作離散化處理。小結(jié)
皮爾遜方法使用范圍廣,對于一維、多維、離散、連續(xù)、參數(shù)已知、未知、全樣本、截尾樣本等均適用;但分組處理樣本值時,雖然假設(shè)分布不成立,但可能劃分方式不同,特別對于截尾樣本,影響統(tǒng)計量的取值,容易導(dǎo)致犯第二類錯誤(取偽)的概率增加。第三十二頁,共五十五頁,2022年,8月28日經(jīng)驗分布函數(shù)將觀察值排序(非降):定義Fn(x)一致地收斂于F(x).3.5.3柯爾莫哥洛夫檢驗(一)一般情形第三十三頁,共五十五頁,2022年,8月28日柯氏提出的檢驗統(tǒng)計量為其精確分布為已知(P112)??聽柛缒宸驒z驗假設(shè):H0:F(x)=F0
(x)其中F0
(x)為完全已知的連續(xù)型分布函數(shù).第三十四頁,共五十五頁,2022年,8月28日因為分布函數(shù)Fn
(x)
與F0(x)均為X的單調(diào)非減函數(shù),所以二者偏差的上確界在n個點X(i)處取得。先求偏差則。若Fn
(x)
與F0
(x)
擬合得好,則Dn的值應(yīng)比較小,反之,Dn的值較大時,擬合得不好??率蠙z驗規(guī)則:給定顯著性水平α,原假設(shè)的拒絕域為即(臨界值Dn,α可查附表6得到)。第三十五頁,共五十五頁,2022年,8月28日例3.18(P114)
對一臺設(shè)備進(jìn)行壽命試驗,記錄了10個數(shù)據(jù),從小到大排列為420,500,920,…,2350(小時)。問此種設(shè)備的壽命X的分布是否服從θ=1500的指數(shù)分布?解:由下表計算可得Dn=0.30,取α=0.05,查表得,D10,0.05=0.40925,即使取α=0.20,D10,0.20=0.32都比Dn大,故接受H0,認(rèn)為壽命X的分布是否服從θ=1500的指數(shù)分布.第三十六頁,共五十五頁,2022年,8月28日計算結(jié)果列表如下:第三十七頁,共五十五頁,2022年,8月28日SPSS講解例3.18輸入變量值,選ANALYZE菜單非參數(shù)檢驗NParTests,進(jìn)入One-SampleKolmogorov-SmirnovTest,點復(fù)選框中指數(shù)分布,進(jìn)行理論分布含有未知參數(shù)的檢驗.第三十八頁,共五十五頁,2022年,8月28日(二)正態(tài)性檢驗正態(tài)分布未知參數(shù)值使用它們的無偏估計值柯氏檢驗規(guī)則:給定顯著性水平α,原假設(shè)的拒絕域為(臨界值可查附表8得到)。第三十九頁,共五十五頁,2022年,8月28日例3.19對8個產(chǎn)品進(jìn)行強度試驗,所得強度取自然對數(shù)后為:0.25,0.53,0.88,1.22,1.76,2.44,3.41,4.90問這批強度數(shù)據(jù)是否來自對數(shù)正態(tài)分布?由上表得,查臨界值,因,故接受原假設(shè),即認(rèn)為這批強度數(shù)據(jù)來自對數(shù)正態(tài)分布。第四十頁,共五十五頁,2022年,8月28日(三)指數(shù)分布的檢驗指數(shù)分布未知參數(shù)的極大似然估計檢驗規(guī)則:給定顯著性水平α,原假設(shè)的拒絕域為,(臨界值可查附表8得到)。第四十一頁,共五十五頁,2022年,8月28日例3.21記錄一臺計算機的無故障工作時間七次,數(shù)據(jù)如下:530,450,120,530,600,650,460。問此臺計算機的無故障工作時間是否服從指數(shù)分布?由上表得,查臨界值,因,故拒絕原假設(shè),即不能認(rèn)為此臺計算機的無故障工作時間服從指數(shù)分布。第四十二頁,共五十五頁,2022年,8月28日3.5.4斯米爾諾夫檢驗設(shè)有連續(xù)型總體X,分布函數(shù)F(x),樣本,經(jīng)驗分布函數(shù)Fn1(x)
;有連續(xù)型總體
Y,分布函數(shù)G(x),樣本,經(jīng)驗分布函數(shù)Gn2(x)。假定兩樣本相互獨立。相應(yīng)的經(jīng)驗分布函數(shù)為。問題背景:柯爾哥莫洛夫檢驗實際上是對單樣本的分布擬合問題的檢驗。而在實際中,經(jīng)常需要對兩個總體分布函數(shù)進(jìn)行比較,斯米爾諾夫檢驗借助于經(jīng)驗分布函數(shù)給出了與柯爾哥莫洛夫檢驗相類似的檢驗統(tǒng)計量。第四十三頁,共五十五頁,2022年,8月28日提出假設(shè):斯米爾諾夫提出的檢驗統(tǒng)計量是:并且證明了,當(dāng)為真時,有。
第四十四頁,共五十五頁,2022年,8月28日當(dāng)H0為真時,D應(yīng)該比較小,因此斯米爾諾夫檢驗的規(guī)則是:
給定顯著性水平α,若時,拒絕H0,否則接受H0
。分位點查柯爾哥莫洛夫檢驗的臨界值表(見附表6),n取不超過其表達(dá)式的最大整數(shù).當(dāng)n很大時(如100),由柯爾哥莫洛夫檢驗統(tǒng)計量的極限分布可得,其中,臨界值柯爾哥莫洛夫檢驗的極限分布表(見附表7)。即:第四十五頁,共五十五頁,2022年,8月28日解:檢驗統(tǒng)計量Dn的觀測值為,查附表6臨界值,因,故拒絕原假設(shè),即認(rèn)為這兩批零件尺寸分布不相同。例3.22某自動車床加工一種零件,一位工人剛接班時,抽取n1=150只零件作為第一個樣本.在自動車床工作了4小時后,他又抽取了n2=100只零件作為第二個樣本.測定每個零件的尺寸與標(biāo)準(zhǔn)尺寸的偏差(單位:μm)范圍如表3-10(P122)所示,試問在顯著性水平α=0.01下,能否認(rèn)為這批零件尺寸的分布相同?第四十六頁,共五十五頁,2022年,8月28日計算結(jié)果列表如下:偏差范圍組中值ni1ni2Fn1(x)Gn2(x)|Fn1(x)-Gn2(x)|[-12.5,-7.5]-101000.0000.0000.000[-7.5,-2.5]-52770.0670.0000.067[-2.5,2.5]043170.2470.0700.177[2.5,7.5]538300.5330.2400.293[7.5,12.5]1023290.7870.5400.247[12.5,17.5]158150.9400.8300.110[17.5,22.5]20110.9930.9800.013[22.5,27.5]25011.0000.9900.010第四十七頁,共五十五頁,2022年,8月28日
SPSS講解例3.22
輸入變量值,選ANALYZE菜單非參數(shù)檢驗NParTests,進(jìn)入2-IndependentKolmogorov-SmirnovTest,對指標(biāo)值加權(quán),點復(fù)選框中樣本類別且定義組別,進(jìn)行兩獨立總體是否同分布的檢驗.第四十八頁,共五十五頁,2022年,8月28日3.5.5Shapiro-WilkW檢驗和D’AgostinoD檢驗
二者均為正態(tài)性檢驗,利用W和D檢驗可以檢驗一批觀測值或一批隨機數(shù)是否來自同一正態(tài)分布。H0:總體服從正態(tài)分布.(一)W檢驗()檢驗步驟:(1)將觀測值(樣本值)按非降序排列:;(2)計算統(tǒng)計量W的值第四十九頁,共五十五頁,2022年,8月28日
其中查附表10。(3)對給定的顯著性水平α和樣本容量n,由附表11查得;(4)作出判斷:若,則拒絕原假設(shè),認(rèn)為樣本不服從正態(tài)分布。(W≤1)檢驗原理(略)P124W檢驗優(yōu)點:小樣本判斷總體是否服從正態(tài)分布.例3.23抽查用克矽平治療矽肺患者10名,得他們治療前后血紅蛋白的差(g%)如下:2.7,-1.2,-1.0,0,0.7,2.0,3.7,-0.6,0.8,-0.3試檢驗治療前后血紅蛋白的差是否服從正態(tài)分布(α=0.05)第五十頁,共五十五頁,2022年,8月28日(二)D檢驗(50<n<1000)將觀測值(樣本值)按非降序排列:定義檢驗統(tǒng)計量D在H0成立之下,有第五十一頁,共五十五頁,2022年,8月28日近似標(biāo)準(zhǔn)化后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廚房員工服務(wù)協(xié)議書
- 招生咨詢合同范例
- 屋頂補漏工程合同書
- 2024年車輛損害賠償協(xié)議書范本
- 技術(shù)服務(wù)聘用協(xié)議范本
- 最標(biāo)準(zhǔn)版商鋪租賃合同
- 2024收養(yǎng)人員入院協(xié)議書樣本
- 倉房租賃協(xié)議
- 定制外教聘請協(xié)議書
- 商標(biāo)設(shè)計協(xié)議書
- 【物理】萬有引力定律的應(yīng)用、人類對太空的不懈探索課件-2023-2024學(xué)年高一下魯科版(2019)必修第二冊
- 做改革創(chuàng)新生力軍
- 員工法律意識培訓(xùn)課件
- 精神科風(fēng)險評估
- 創(chuàng)建紅旗班組總結(jié)匯報
- 模板工程質(zhì)量檢驗與質(zhì)量目標(biāo)
- 家政技能服務(wù)流程培訓(xùn)方案
- 泌尿系統(tǒng)感染的預(yù)防與處理
- 素質(zhì)教肓可行性報告
- 人教版五年級數(shù)學(xué)上冊專項計算題12套(每日一練)
- 皮疹的分級及護(hù)理課件
評論
0/150
提交評論