假設(shè)檢驗(yàn)(hypothesistesting)_第1頁(yè)
假設(shè)檢驗(yàn)(hypothesistesting)_第2頁(yè)
假設(shè)檢驗(yàn)(hypothesistesting)_第3頁(yè)
假設(shè)檢驗(yàn)(hypothesistesting)_第4頁(yè)
假設(shè)檢驗(yàn)(hypothesistesting)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 也假設(shè)檢驗(yàn)(hypothesistesting)轄囑第、方法演變:t檢驗(yàn)、z檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn),方差分析(ANOVA)概述假設(shè)檢驗(yàn)是分析數(shù)據(jù)的一種方法?;卮鸫祟悊栴}:“隨機(jī)發(fā)生的事件的概率是多少?”另一方面的問題是:“我們從數(shù)據(jù)中發(fā)現(xiàn)的結(jié)果是真的嗎?”當(dāng)問題是有關(guān)大的總體而只能得到總體的一個(gè)樣本時(shí)用假設(shè)檢驗(yàn)。這種方法被用來(lái)回答在質(zhì)量改進(jìn)中一系列重要的問題,如“我們?cè)谶^程中所做的改變對(duì)產(chǎn)出創(chuàng)造了有意義的差別嗎?”或”顧客對(duì)場(chǎng)地A的滿意度是不是比其他場(chǎng)地高?”最常用的檢驗(yàn)是:z檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)、卡方(2)檢驗(yàn)和方差分析。這些檢驗(yàn)和其他的檢驗(yàn)都是基于均值、方差、比例及其他統(tǒng)計(jì)量所形成的具有

2、常見模式的頻率分布。最有名的分布就是正態(tài)分布,它是:檢驗(yàn)的基礎(chǔ)。t檢驗(yàn)、F檢驗(yàn)和卡方(2)檢驗(yàn)是基于t分布、F分布和卡方分布。適用場(chǎng)合想知道一組或更多組數(shù)據(jù)的平均值、比例、方差或其他特征時(shí);當(dāng)結(jié)論是基于更大總體中所取得的樣本時(shí)。例如:想確定一個(gè)過程的均值或方差有否改變;想確定很多數(shù)據(jù)集的均值或方差是否不同:想確定兩組不同的數(shù)據(jù)集的比例是否不同;想確定真正的比例、均值或方差是否和一個(gè)定值相等(或大于或小于)。實(shí)施步驟假設(shè)檢驗(yàn)的步驟由三部分組成:理解要解決的問題并安排檢驗(yàn)(以下步驟13);數(shù)字計(jì)算通常由計(jì)算機(jī)完成(步驟4和步驟5);應(yīng)用數(shù)值結(jié)果到實(shí)際問題中(步驟6)。雖然計(jì)算機(jī)能處理數(shù)字,但理解假

3、沒檢驗(yàn)隱含的觀念對(duì)第1部分和第3部分至關(guān)重要。如果第一次接觸假設(shè)檢驗(yàn),那么從看“注意事項(xiàng)”中的術(shù)語(yǔ)和定義開始。這些定義解釋了假設(shè)檢驗(yàn)的慨念,然后再回來(lái)看這個(gè)步驟。本書不可能詳細(xì)地涉及假設(shè)檢驗(yàn)。這個(gè)步驟是個(gè)綜述和快速參考。要得到更多的信息,查閱統(tǒng)計(jì)學(xué)參考書或請(qǐng)教統(tǒng)計(jì)學(xué)家。1確定要從數(shù)據(jù)中獲得的結(jié)論。選擇適當(dāng)?shù)臋z驗(yàn)方法。用哪種檢驗(yàn)取決于檢驗(yàn)的目的和數(shù)據(jù)的種類??梢杂帽?.7和表5.8概括的常用的假設(shè)檢驗(yàn),或者請(qǐng)教統(tǒng)計(jì)學(xué)家以得到幫助。2建立零假設(shè)和備擇假設(shè)。確定問題是屬于雙尾檢驗(yàn)、左尾檢驗(yàn)還是右尾檢驗(yàn)。選擇顯著性水平。計(jì)算檢驗(yàn)統(tǒng)計(jì)量,可借助計(jì)算機(jī)軟件。5用統(tǒng)計(jì)分布的統(tǒng)計(jì)表或計(jì)算機(jī)程序等來(lái)確定檢驗(yàn)統(tǒng)計(jì)

4、量的P值。對(duì)于z檢驗(yàn)可用表A.1正態(tài)曲線以下的曲線。6把P值與左尾或右尾檢驗(yàn)的或者雙尾檢驗(yàn)的/2作比較,如果P值較小,那么拒絕零假設(shè)并會(huì)得到備擇假設(shè)可能正確的結(jié)論。否則,不能拒絕零假設(shè),并得出沒有足夠證據(jù)支持備擇假設(shè)的結(jié)論。備擇步驟步驟14同上。然后:用統(tǒng)計(jì)表或計(jì)算機(jī)程序確定如下所示的檢驗(yàn)統(tǒng)計(jì)量的臨界值和拒絕域。以z檢驗(yàn)作為示例,對(duì)t檢驗(yàn)、F檢驗(yàn)或卡方檢驗(yàn),用統(tǒng)計(jì)量f、F或2來(lái)替換z。比較檢驗(yàn)統(tǒng)計(jì)量和拒絕域。如果檢驗(yàn)統(tǒng)計(jì)量值落在拒絕域內(nèi),拒絕零假設(shè),結(jié)論是備擇假已知樣本成對(duì)且樣本屋30樣本成對(duì)且樣本筮C30未知,樣本址n30寸(7:/沖1)丄(.扇呢、1較比例與給定值列方差分析(AOVA):咨

5、詢統(tǒng)計(jì)學(xué)家或查詢統(tǒng)計(jì)文獻(xiàn)旳和住已知,且樣本獨(dú)立比較二個(gè)或三午以上的均值。H.,4P2工檢驗(yàn)土公式復(fù)雜、取決于與和比姥否相等用計(jì)算機(jī)軌件樣本獨(dú)立數(shù)據(jù)服從止態(tài)分布且6=cz=小和氐未知樣本雖?il或施VB0數(shù)據(jù)服從止態(tài)分布且樣本獨(dú)必m和匪未知樣本能如和住都婁3d,耳樣本獨(dú)立F=f/或分于自由度為i-l分母自由度為常一1遁k丘容=”lx/Csi/叭+Is表57均值、方差和比例的假設(shè)檢驗(yàn)比較標(biāo)準(zhǔn)差與給定值6Hy70F-總體的實(shí)際均值朋假設(shè)的均值X樣本均值&總體的標(biāo)椎方差S樣本的爵準(zhǔn)差用樣本雖M自由度7!一總體的比例叭假設(shè)的比例價(jià)P樣本的比例2樣本量p扔和自的抑權(quán)平覽數(shù)據(jù)服從止態(tài)分布df=n1仃-恵體的

6、標(biāo)準(zhǔn)差甌假設(shè)的標(biāo)準(zhǔn)差s樣本茁標(biāo)準(zhǔn)差“樣本量df自由度/=跆矢d處的均值di的標(biāo)準(zhǔn)差-H樣本對(duì)的個(gè)數(shù)比較兩個(gè)標(biāo)準(zhǔn)差。耳6=化比較均值與給定的啓。且,中=輕疚未知樣本訊30,且數(shù)據(jù)服從正態(tài)分布2心一1比較兩個(gè)比例H,::mn對(duì)于其他情況或條件不瀚足以上所述的可咨詢統(tǒng)計(jì)專家或參考統(tǒng)計(jì)學(xué)書。比較兩者的剤值口樺本獨(dú)遼旦期望的頻率值說和?:一一VTTu(L樣本獨(dú)立且心和330數(shù)據(jù)服從正態(tài)分布狀1+?/也(1/0(-/乳1+1/也)71卩14?iptP= #a5.8分類數(shù)據(jù)的卡方假設(shè)檢驗(yàn)卡方檢驗(yàn)當(dāng)數(shù)據(jù)是計(jì)數(shù)值(頻數(shù))且所有的024至少80%的折有這些檢驗(yàn)都是右是檢驗(yàn)比較不同組的不同種類的頻率分布(比例)各組

7、分布C比例)相同。確宦質(zhì)個(gè)變就相互獨(dú)立H):變星1和變量2相互獨(dú)立a,仝G_Ef另E所有單元格的相加首先構(gòu)建關(guān)聯(lián)表:變量1放于$行,變僮2放于&列。每個(gè)單元格:O單元格的寞際(觀測(cè))值?C列的所有值:栢加的和扌R行的所有值相加的和;-V所有觀測(cè)僅的總和;E期望的單元格值,E=Cs比較応個(gè)比例H山嚴(yán)氏這是上面檢驗(yàn)的特例,其中r=2且芒=2結(jié)果和兩個(gè)比例的宅檢臉相同擬合優(yōu)度:比較觀測(cè)的額率分布與期望的或理論上的分右觀測(cè)的分布和期望的分布相同?.(QFAX2=S瓦齦屋檢驗(yàn)卷血和gV比罰或z-fl;2示例:t檢驗(yàn)一家食品雜貨店從一供應(yīng)商處購(gòu)買幾箱蘋果,每箱質(zhì)量為50磅(llb=0.455kg),固定價(jià)

8、格。供應(yīng)商保證每箱的平均質(zhì)量確實(shí)是50磅。產(chǎn)品小組隨機(jī)抽取10箱稱量。質(zhì)量分別為:50.l49.650.349.949.549.750.049.649.750.2雜貨店受騙沒有?統(tǒng)計(jì)上講,產(chǎn)品小組的問題是:“我們接受的蘋果箱的平均質(zhì)量少于50磅嗎?”零假設(shè)是“蘋果箱的平均質(zhì)量等于50磅”,備擇假設(shè)是“蘋果箱的平均質(zhì)量小于50磅”計(jì)劃用5%的顯著性水平。在表5.7中找均值與給定的值作比較的檢驗(yàn)。s未知,樣本容量小于30個(gè),假設(shè)箱子的質(zhì)量服從正態(tài)分布。因此用t檢驗(yàn)。因?yàn)閭鋼窦僭O(shè)是“小于”所以需要左尾檢驗(yàn)。向在線計(jì)算器中輸入數(shù)據(jù)得到以下結(jié)果:樣本均值=49.86標(biāo)準(zhǔn)方差=0.28t=1.583P=0

9、.07因?yàn)镻值大于0.05,所以不能拒絕零假設(shè),沒證據(jù)表明他們受騙。圖表5.99顯示了t分布,檢驗(yàn)統(tǒng)計(jì)量t=1.583,曲線下這個(gè)值以外的區(qū)域是P=0.07。用備擇步驟,從t表中確定a=0.05,自由度為9,臨界值為ta=1.833。因?yàn)槭亲笪矙z驗(yàn),a拒絕域是任何小于一1.833的z值。檢驗(yàn)統(tǒng)計(jì)量為一1.583,沒有落在拒絕城,所以不拒絕零假設(shè)。圖表5.100顯示了t分面、臨界值、拒絕域和曲線下相等于a=0.05的區(qū)域。兩幅圖的比較表明兩個(gè)實(shí)施步驟如何以不同方式得到相同結(jié)論的過程。對(duì)左尾情況,只要檢驗(yàn)統(tǒng)計(jì)量t大于臨界值t,曲線下t值左邊的區(qū)域即P值就比a大,a就是曲線下t左邊的區(qū)域。aa一家服

10、裝零售商想了解其提議的生產(chǎn)線的變化是否會(huì)在不同地區(qū)被同樣地接受。他們隨機(jī)挑選了750名顧客,描述了提議的新產(chǎn)品,然后讓顧客估計(jì)購(gòu)買的可能性。他們按地理位置對(duì)數(shù)據(jù)分組,建立了五行、四列的關(guān)聯(lián)表,見圖表5.17的關(guān)聯(lián)表。布有差異”。選擇顯著性水平為5%,計(jì)算出自由度為df=12。大多卡方表按備擇步驟設(shè)計(jì),可以查詢a或la,讀取臨界值。對(duì)a=0.05和df=12來(lái)說,2臨界值為21.026。如果檢驗(yàn)統(tǒng)計(jì)量大于它就拒絕零假設(shè)。用電子制表軟件計(jì)算每一單元的E。E代表著零假設(shè)為真時(shí)的期望值,也就是每個(gè)地區(qū)的購(gòu)買可能性分布和整體分布一樣時(shí)的期望值。接著計(jì)算每單元的(OE)2FE,加起來(lái)得到檢驗(yàn)統(tǒng)計(jì)量2=22

11、.53,比臨界值21.026大,所以拒絕零假設(shè)。購(gòu)買可能性分布隨區(qū)域而不同。這個(gè)檢驗(yàn)等同于檢驗(yàn)兩個(gè)變量是否獨(dú)立。結(jié)果表明地理區(qū)域和購(gòu)買可能性兩個(gè)變量不獨(dú)立。已知顧客所在的地區(qū)就能預(yù)測(cè)他是否更有可能購(gòu)買新生產(chǎn)線。A另一示例:卡方檢驗(yàn)2相同的零售商計(jì)劃改變產(chǎn)品目錄的格式和風(fēng)格并想了解新的格式是否會(huì)有效提高訂單。作為測(cè)試,他們隨機(jī)挑選顧客送出去200000本新春裝目錄冊(cè),另外1800000本目錄冊(cè)是傳統(tǒng)版本。參考關(guān)聯(lián)表例子,用圖表5.18的2X2的關(guān)聯(lián)表來(lái)組織數(shù)據(jù)??ǚ綑z驗(yàn)比較兩者的比例。零假設(shè)是“顧客從測(cè)試目錄和從標(biāo)準(zhǔn)目錄購(gòu)買的比例相同。”標(biāo)準(zhǔn)目錄測(cè)試目錄總計(jì)買34852497239824不買17

12、65148195028.1960176總計(jì)1S000002000002000000圉表5門82X21#形分析表示例選用5%的顯著性水平。比較比例,自由度就是1。a=0.05和df=1時(shí),2臨界值為3.841,檢驗(yàn)統(tǒng)計(jì)量2=278。因此拒絕零假設(shè),結(jié)論是顧客從新格式目錄和從舊目錄購(gòu)買的比例顯著不同。注意事項(xiàng)和許多學(xué)科一樣,統(tǒng)計(jì)學(xué)有自己專門的語(yǔ)言表達(dá)常用的概念。以下是在實(shí)施步驟中常用的定義術(shù)語(yǔ):檢驗(yàn):一種統(tǒng)計(jì)檢驗(yàn),如z檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)或卡方檢驗(yàn)。要知道選用哪種檢驗(yàn)是實(shí)施步驟中最難的一部分,取決于數(shù)據(jù)的種類以及想從數(shù)據(jù)中得出結(jié)論的種類。假設(shè):陳述一事實(shí),由檢驗(yàn)證明或反駁。零假設(shè),H0:是想檢驗(yàn)的

13、假?zèng)],數(shù)據(jù)是隨機(jī)的。稱為“零”是因?yàn)橥ǔ#ú豢偸牵┝慵僭O(shè)意味著兩組數(shù)據(jù)中或從數(shù)據(jù)中計(jì)算的參數(shù)與給定的值之間沒有差異。備擇假設(shè),H。:如果零假設(shè)為假,備擇假設(shè)肯定為真。通常備擇假設(shè)暗含數(shù)據(jù)來(lái)自真實(shí)的影響而非隨機(jī)的。統(tǒng)計(jì)量:表征樣本數(shù)據(jù)某些方面的變量。平均數(shù)、均值、方差和比例都是統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量:用來(lái)檢驗(yàn)零假設(shè)的統(tǒng)計(jì)量。對(duì)每種檢驗(yàn)都有一個(gè)公式表達(dá)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量。這樣做如果零假設(shè)是真(數(shù)據(jù)隨機(jī)),統(tǒng)計(jì)量就來(lái)自一有名分布,如z檢驗(yàn)的正態(tài)分布。雙尾、右尾、左尾:描述檢驗(yàn)是否涉及頻率分布的雙側(cè)(雙尾)或只是單側(cè)。如果備擇假設(shè)表達(dá)式中包合工(不等于),需要雙尾檢驗(yàn)。如果包含(小于)需要左尾檢差驗(yàn),包含(

14、大于),需要右尾檢驗(yàn)。卡方檢驗(yàn)通常是雙尾檢驗(yàn)。P值:檢驗(yàn)統(tǒng)計(jì)量在已知分布下隨機(jī)發(fā)生的概率。P值等于曲線下檢驗(yàn)統(tǒng)計(jì)量以外的那個(gè)區(qū)域(見圖表5.99)。P值越小,越能肯定結(jié)果是真的,不只是隨機(jī)的。由于各種檢驗(yàn)分布都很有名,這些概率能在表中或計(jì)算機(jī)程序中得到。顯著性水平,a:能確定結(jié)果是真的以前反映我們能多大程度確信結(jié)果不是隨機(jī)產(chǎn)生的數(shù)值。通常取1%、5%、10%(a=0.01、0.05、0.10)。例如:?jiǎn)蝹?cè)檢驗(yàn)a=0.05,只要隨機(jī)得到的結(jié)果小于5%即PV0.05則可斷定結(jié)果為真。臨界值:概率正好等于a時(shí)的檢驗(yàn)統(tǒng)計(jì)量的值。曲線尾部臨界值以外的區(qū)域面積等于a。對(duì)雙尾檢驗(yàn)來(lái)說有兩個(gè)臨界值(見圖表5.

15、100),每一尾部一個(gè),每個(gè)臨界值以外的區(qū)域都等于a/2。臨界值由表或計(jì)算機(jī)程序確定,記為土za或土za/2o拒絕域:如果檢驗(yàn)統(tǒng)計(jì)量落在這個(gè)區(qū)域,零假設(shè)就被拒絕的頻率分布區(qū)域。對(duì)左尾檢驗(yàn)來(lái)說,這些值位于小于臨界值的分布曲線尾部。對(duì)右尾檢驗(yàn)而言,則位于大于臨界值的曲線尾部雙尾檢驗(yàn)拒絕域包含兩頭。置信水平,(1a)。置信區(qū)間:事件隨機(jī)發(fā)生時(shí)以很大概率包含檢驗(yàn)統(tǒng)計(jì)量的區(qū)間范圍。拒絕域是置信區(qū)間以外的區(qū)域。顯著水平、置信水平、置信區(qū)間之間的關(guān)系為:a=0.05,置信水平等于95%,則認(rèn)為落在95%置信區(qū)間的值是最有可能單獨(dú)地隨機(jī)發(fā)生的,不能拒絕零假設(shè)。置信區(qū)間的定義講究技巧。95%置信區(qū)間不是分布所有

16、值的95%落在這一區(qū)間而是當(dāng)一個(gè)值屬于這個(gè)分布時(shí),基于樣本數(shù)據(jù)建立的所有區(qū)間95%地包含這個(gè)值。假設(shè)檢驗(yàn)中,觀察檢驗(yàn)分布曲線,計(jì)算位于圖形水平軸某處的檢驗(yàn)統(tǒng)計(jì)量。如果曲線下檢驗(yàn)統(tǒng)計(jì)量以外的區(qū)域P足夠?。ㄐ∮陲@著水平a),則此統(tǒng)計(jì)檢驗(yàn)量可能就不服從這個(gè)分布。因?yàn)榍€是頻率分布,曲線任何部分以下的區(qū)域就是事件發(fā)生可能性的度量,標(biāo)在水平軸上。這就是在曲線下區(qū)域能找到a和P值的原因。由于假設(shè)檢驗(yàn)涉及樣本和概率,所以有可能得到錯(cuò)誤的結(jié)論。第一類錯(cuò)誤就是零假設(shè)為真而被拒絕(見圖表5.101)。第一類錯(cuò)誤的概率是:顯著性水平a。在第二個(gè)例子中,有5%的可能性就是區(qū)域間分布差異確實(shí)是隨機(jī)的。第二類錯(cuò)誤是零假設(shè)為假而沒有被拒絕。如果食品雜貨店真的在蘋果箱的重量上被欺騙則第二類錯(cuò)誤發(fā)生。第二類錯(cuò)誤的概率0的計(jì)算更復(fù)雜,超出本書討論范圍。不幸的是,“a越小,0越大。但是給定a,增加樣本容量,0將變小。因?yàn)榈诙愬e(cuò)誤概率的存在,當(dāng)零假設(shè)沒被拒絕時(shí),不能得出備擇假設(shè)是錯(cuò)的結(jié)論,只能說數(shù)據(jù)很多網(wǎng)站上有計(jì)算器,可以計(jì)算檢驗(yàn)統(tǒng)計(jì)量和統(tǒng)計(jì)量、概率和臨界值。但是要知道采用哪種檢驗(yàn)以治真正確馳第一類艇第二類錯(cuò)俁正確躋論辭W#真民假支持圖何5釋結(jié),這類很重要類第誤例如:處理前、丿口相同樣

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論