統(tǒng)計學--假設檢驗課件_第1頁
統(tǒng)計學--假設檢驗課件_第2頁
統(tǒng)計學--假設檢驗課件_第3頁
統(tǒng)計學--假設檢驗課件_第4頁
統(tǒng)計學--假設檢驗課件_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、統(tǒng)計學第7章 假設檢驗 正如一個法庭宣告某一判決為“無罪(not guilty)”而不為“清白(innocent)”,統(tǒng)計檢驗的結論也應為“不拒絕”而不為“接受”。 Jan Kmenta統(tǒng)計名言案例辛普森殺妻案辛普森案 (英語:O. J. Simpson murder case,又稱加利福尼亞人民訴辛普森案,英語:People v.Simpson)是美國加利福尼亞州最高法院對前美式橄欖球明星、演員OJ辛普森進行的刑事訴訟,在該案中,辛普森被指控于1994年犯下兩宗謀殺罪,受害人為其前妻妮克爾布朗辛普森及其好友羅納德高曼。該案被稱為是美國歷史上最受公眾關注的刑事審判案件。案發(fā)時間,1994年6月

2、12日深夜案發(fā)后凌晨,辛普森門外有血跡現(xiàn)場滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的臟衣服都有被害人的血法庭戰(zhàn)爭檢方的“鐵證如山”與“夢幻律師團”在檢方看來,本案可謂是“鐵證如山”,本案中無論是證據(jù)數(shù)量,還是證據(jù)的可信程度,在檢方看來,都達到了很高的標準??剞q雙方幾個關鍵的地方控方:檢方在審判的最初幾周出示證據(jù),證明辛普森曾有對妮可爾的家庭暴力史。辯方:時遭受丈夫家庭暴力中,遭受丈夫傷害的概率為1%控方:鞋碼與辛普森的相似,辛普森手上有劃痕辯方:世界上與辛普森鞋碼一樣的人數(shù)不勝數(shù),在左手有傷痕的人也不盡其數(shù),所以這樣的證據(jù)對案件的判斷是沒有任何價值的。控方:在犯罪現(xiàn)場發(fā)現(xiàn)的血液,DN

3、A鑒定發(fā)現(xiàn)與辛普森是完全一致的,而DNA鑒定兩個人一致的可能性只有萬分之。辯方:在洛杉磯300萬人口中,就有300個人DAN一致,辛普森是洛杉磯人口的1人,所以,辛普森是殺人兇手的概率只有0.03%。如果認為新浦森有罪的話,那么誤判的概率將高達99.97%.最終無罪釋放??胤剑浩綍r遭受丈夫家庭暴力中,非正常死亡的,其兇手為丈夫的概率為80%??胤剑嚎赡軙泻芏嗯c辛普森鞋碼一樣的人,但也會有很多左手有劃痕的人,但辛普森是一個嫌疑犯, 不能把他放在所有的人當中去進行歸類,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋碼吻合的人的概率非常之小法庭宣判過程法官假定辛普森無罪控方搜集證據(jù)證明他有罪,只有當

4、證據(jù)充足的時候才能宣判有罪,否則要接受法官的假定。辛浦森(Simpsons Paradox)悖論案例1: 是否存在種族歧視被告種族受害者種族死刑判決是否白人白人19132黑人09黑人白人1152黑人697160166 36290 326 總的看, 白人有19/160=12% 的被告被判處死刑, 與之對應, 黑人只有17/166=10% 的被告被判死刑, 白人死刑率要高一些. 但如果考慮受害者的種族, 結論就相反了. 當受害者是白人時, 有11/63=17.5% 的黑人被告被判死刑, 而只有 19/151=12.6% 的白人被告被判死刑. 當受害者是黑人時, 白人被告沒一個人( 0%)被判死刑,

5、 而黑人被告確有 6/103=5.8% 的被判死刑. 控方:DNA鑒定辯方:把辛普森至于300萬人群當中,但新浦是是嫌疑犯,所以應把他放在嫌疑犯這個人群中,那么樣本與他一致的也就他一個人綜上,只有辛普森一個人符合三個條件第 7 章 假設檢驗7.1 假設檢驗的基本問題 7.2 一個總體參數(shù)的檢驗學習目標 1.理解假設檢驗的基本思想和基本步驟 ; 2.理解假設檢驗的兩類錯誤及其關系; 3.熟練掌握一個總體平均數(shù)、總體成數(shù)各種假設檢驗方法; 4.利用P - 值進行假設檢驗。用Excel進行檢驗假設檢驗知識結構總體參數(shù)檢驗一個總體兩個總體均值比例方差均值差比例差方差比獨立樣本匹配樣本大樣本F檢驗Z檢驗

6、大樣本小樣本Z檢驗1222已知1222未知Z檢驗t檢驗大樣本小樣本Z檢驗2已知Z檢驗2未知t檢驗Z檢驗卡方檢驗7.1 假設檢驗的基本原理 7.1.1 怎樣提出假設? 7.1.2 怎樣做出決策? 7.1.3 怎樣表述決策結果?第 7 章 假設檢驗7.1.1 怎樣提出假設?7.1 假設檢驗的基本原理1.什么是假設?假設:定義為一個調研者或管理者對被調查總體的某些特征所做的一種假定或猜想。是對總體參數(shù)的一種假設。常見的是對總體均值或比例和方差的檢驗;在分析之前,被檢驗的參數(shù)將被假定取一確定值。我認為到KFC消費的人平均花費2.5美元!2、市場調研中常見的假設檢驗問題一項跟蹤調查的結果表明,顧客對產(chǎn)品

7、的了解程度比6個月前所做的類似調查中的顯示要低。結果是否明顯降低?是否低到需要改變廣告策略的程度? 一位產(chǎn)品經(jīng)理認為其產(chǎn)品購買者的平均年齡為35歲。為檢驗其假設,他進行了一項調查,調查表明購買者平均年齡為38.5歲。調查結果與其觀點的差別是夠足以說明此經(jīng)理里的觀點是不正確的?3、問題在哪里? 某廣告商宣稱其代理的A產(chǎn)品的合格率達到99%,質檢人員為了驗證,隨機抽取了一件產(chǎn)品,發(fā)現(xiàn)是一件次品。質檢人員會是什么反應呢?什么是假設檢驗? (hypothesis test)先對總體的參數(shù)(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的統(tǒng)計方法有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上

8、依據(jù)小概率原理小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設原假設(null hypothesis)又稱“0假設”,研究者想收集證據(jù)予以反對的假設,用H0表示所表達的含義總是指參數(shù)沒有變化或變量之間沒有關系 最初被假設是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它 總是有符號 , 或H0 : = 某一數(shù)值H0 : 某一數(shù)值H0 : 某一數(shù)值例如, H0 : 10cmnull也稱“研究假設”,研究者想收集證據(jù)予以支持的假設,用H1或Ha表示所表達的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關系備擇假設通常用于表達研究者自己傾向于

9、支持的看法,然后就是想辦法收集證據(jù)拒絕原假設,以支持備擇假設 總是有符號 , 或 H1 : 某一數(shù)值H1 : 某一數(shù)值H1 : 某一數(shù)值備擇假設(alternative hypothesis)【例】一種零件的生產(chǎn)標準是直徑應為10cm,為對生產(chǎn)過程進行控制,質量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設和被擇假設提出假設(例題分析)解:研究者想收集證據(jù)予以證明的假設應該是“生產(chǎn)過程不正常”。建立的原假設和備擇假設為 H0 : 10cm H1 : 10cm

10、 【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述 。建立的原假設和備擇假設為 H0 : 500 H1 : 500【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者想收集證據(jù)予以支持的假設是“該城市中家庭擁有汽車的比例超過30

11、%”。建立的原假設和備擇假設為 H0 : 30% H1 : 30%提出假設 總結H0: 通常是將研究者不愿相信的、不認可的、想拒絕的結論H0 : = 某一數(shù)值H0 : 某一數(shù)值H0 : 某一數(shù)值H1:與原假設是對立的,通常是研究者想要支持的、愿意相信的結果H1 : 某一數(shù)值H1 : 某一數(shù)值H1 : ”或“”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailed test)備擇假設的方向為“”,稱為右側檢驗 雙側檢驗與單側檢驗雙側檢驗與單側檢驗 (假設的形式)假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0 : m =m0H0 : m m0H0 : m m0備擇假設H1 : m m0H1 :

12、m m0以總體均值的檢驗為例7.1.2 怎樣做出決策?7.1 假設檢驗的基本原理假設檢驗的步驟1.提出原假設H0和備擇假設H12.構造適當?shù)臋z驗統(tǒng)計量3.給定顯著性水平 0.01, 0.05, 0.104.計算檢驗統(tǒng)計量的值5.做出判斷假設檢驗的基本思想. 因此我們拒絕假設 = 50. 如果這是總體的假設均值樣本均值m = 50抽樣分布H0這個值不像我們應該得到的樣本均值 .20兩類錯誤與顯著性水平(了解)研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎之上,而樣本又是隨機的,因而就有可能犯錯誤原假設和備擇假設不能同時成立,決策的結果要么拒絕H0,要么不拒絕H0。決策時總是希望

13、當原假設正確時沒有拒絕它,當原假設不正確時拒絕它,但實際上很難保證不犯錯誤 第類錯誤(錯誤)原假設為正確時拒絕原假設第類錯誤的概率記為,被稱為顯著性水平2.第類錯誤(錯誤)原假設為錯誤時未拒絕原假設第類錯誤的概率記為(Beta)顯著性水平 (significant level)事先確定的用于拒絕原假設H0時所必須的證據(jù)能夠容忍的犯第類錯誤的最大概率(上限值)2.原假設為真時,拒絕原假設的概率 抽樣分布的拒絕域3.表示為 (alpha) 常用的 值有0.01, 0.05, 0.104.由研究者事先確定 錯誤和 錯誤的關系你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大, 大就小依據(jù)什么做出決策

14、?若假設為H0=500, H1 臨界值,拒絕H0抽樣分布H0臨界值臨界值a/2 a/2 拒絕H0拒絕H01 - 置信水平Region of RejectionRegion of NonrejectionRegion of Rejection用統(tǒng)計量決策(左側檢驗 )H1 : m m0,統(tǒng)計量 m0,統(tǒng)計量 臨界值,拒絕H0抽樣分布H0臨界值 拒絕H01 - 置信水平Region of NonrejectionRegion of Rejectiona統(tǒng)計量決策規(guī)則給定顯著性水平,查表得出相應的臨界值z或z/2, t或t/2將檢驗統(tǒng)計量的值與 水平的臨界值進行比較作出決策雙側檢驗:H1 : m m

15、0,I統(tǒng)計量I 臨界值,拒絕H0, 31.96,拒絕左側檢驗:H1 : m m0,統(tǒng)計量 -臨界值,拒絕H0, -3m0,統(tǒng)計量 臨界值,拒絕H0, 31.96,拒絕當單側檢驗時,只要統(tǒng)計量與z或 t大小比較方向與備擇假設符合一致時,拒絕不過,總而言之,無論是哪一種檢驗形式,只要I統(tǒng)計量I 臨界值,拒絕H0用P 值決策 軟件操作中的sig.即為P值 (P-value)如果原假設為真,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率,也就是我們拒絕原假設面臨的風險P值告訴我們:如果原假設是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應該拒絕原假設 被稱為觀察

16、到的(或實測的)顯著性水平?jīng)Q策規(guī)則:若p值臨界值,拒絕原假設,說明在統(tǒng)計上是顯著的總體均值的檢驗( 2 已知)(例題分析大樣本)H0 : = 255H1 : 255 = 0.05n = 40臨界值(c):檢驗統(tǒng)計量:決策:結論:不拒絕原假設 用Excel中的【NORMSDIST】函數(shù)得到的雙尾檢驗P=0.312945不拒絕H0沒有證據(jù)表明該天生產(chǎn)的飲料不符合標準要求 z01.96-1.960.005拒絕 H0拒絕 H00.005總體均值的檢驗(z檢驗) (P 值的計算與應用)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名 菜單下選擇【NORMSDI

17、ST】,然后【確定】第3步:將 z 的絕對值1.01錄入,得到的函數(shù)值為 0.843752345 P值=2(1-0.843752345)=0.312495 P值遠遠大于,故不拒絕H0總體均值的檢驗( 2 未知) (例題分析大樣本)【例】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低? (=0.01) 樣本均值為1.3152左側檢驗50個零件尺寸的誤差數(shù)據(jù) (mm

18、)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(例題分析大樣本)H0 : 1.35H1 : 1.35 = 0.01n = 50臨界值(c):檢驗統(tǒng)計量: -2.6061-1.96,于是 拒絕H0新機床加工的零件尺寸的平均誤差與舊機

19、床相比有顯著降低決策:結論:-2.33z0拒絕H00.01總體均值的檢驗 (P 值的計算與應用大樣本)第1步:進入Excel表格界面,直接點擊【f(x)】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選 擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對話框【Array】框中,輸入原始數(shù)據(jù)所 在區(qū)域 ;在【X】后輸入?yún)?shù)的某一假定值(這里為 1.35);在【Sigma】后輸入已知的總體標準差(若總 體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本 標準差代替) 第4步:用1減去得到的函數(shù)值0.995421023 即為P值 P值=1-0.995421023=0.004579 P值5200 =

20、0.05n = 36臨界值(c):檢驗統(tǒng)計量: 拒絕H0因為3.751.65,或者(P = 0.000088 = 0.05)改良后的新品種產(chǎn)量有顯著提高 決策:結論:z0拒絕H00.051.645總體均值的檢驗(z檢驗) (P 值的圖示)抽樣分布P = 0.000088 01.645a =0.05拒絕H01 - 計算出的樣本統(tǒng)計量=3.75P 值總體均值的檢驗 (小樣本)1.假定條件總體服從正態(tài)分布小樣本(n 30)檢驗統(tǒng)計量 2 已知: 2 未知: 例7-2某市歷年來對7歲男孩的統(tǒng)計資料表明,他們的身高服從均值為1.32米、標準差為0.12米的正態(tài)分布?,F(xiàn)從各個學校隨機抽取25個7歲男學生,

21、測得他們平均身高1.36米,若已知今年全市7歲男孩身高的標準差仍為0.12米,問與歷年7歲男孩的身高相比是否有顯著差異(取 0.05)。解:從題意可知, 1.36米, 1. 32米, 0.12米。 (1)建立假設:H0: 1.32, H1: 1.32 (2)確定統(tǒng)計量: 方差已知(3)Z的分布:ZN(0,1)(4)對給定的 0.05確定臨界值。因為是雙側備擇假設所以查表時要注意。因概率表是按雙側排列的,所以應查1-0.050.95的值,查得臨界值 1.96。(5)檢驗準則。|Z|=0.05,故不拒絕H0 一個總體均值的檢驗(作出判斷) 是否已知小樣本量n大 是否已知否 t 檢驗否z 檢驗是z

22、檢驗 是z 檢驗7.2.1 總體比例的檢驗7.3 一個總體參數(shù)的檢驗總體比例檢驗假定條件總體服從二項分布可用正態(tài)分布來近似(大樣本)檢驗的 z 統(tǒng)計量 0為假設的總體比例總體比例的檢驗 (例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平 =0.05和=0.01 ,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?總體比例的檢驗 (例題分析)H0 : = 80%H1 : 80% = 0.05n = 200臨界值(c):檢驗統(tǒng)計量:拒絕H0

23、 (P = 0.013328 = 0.01)沒有證據(jù)表明“該雜志聲稱讀者群中有80%為女性”的看法不正確 決策:結論:z02.58-2.580.005拒絕 H0拒絕 H00.005 例7-7某企業(yè)的產(chǎn)品暢銷國內(nèi)市場。據(jù)以往調查,購買該產(chǎn)品的顧客有50是30歲以上的男子。該企業(yè)負責人關心這個比例是否發(fā)生了變化,而無論是增加還是減少。于是,該企業(yè)委托了一家咨詢機構進行調查,這家咨詢機構從眾多的購買者中隨機抽選了400名進行調查,結果有210名為30歲以上的男子。該廠負責人希望在顯著性水平0.05下檢驗“50的顧客是30歲以上的男子”這個假設。解:(1)建立假設由題意可知,這是雙側檢驗,故建立假設

24、H0: 50H1: 50(2)計算統(tǒng)計量由于樣本容量 40030, 40050200, 200,皆大于5,所以可以使用正態(tài)分布進行檢驗。(3)ZN(0,1)(4)對應于0.05的顯著性水平,雙側檢驗臨界值為1.96。(5)若Z值不大于1.96,則接受原假設,否則,拒絕之。(6)本例中,Z=1,處于接受域,故接受“50的顧客是30歲以上的男子”這個假設。7.4.1 總體方差的檢驗7.4 一個總體參數(shù)的檢驗(選學)總體方差的檢驗 ( 2檢驗) 檢驗一個總體的方差或標準差假設總體近似服從正態(tài)分布使用 2分布檢驗統(tǒng)計量假設的總體方差自學總體方差的檢驗(例題分析)【例】啤酒生產(chǎn)企業(yè)采用自動生產(chǎn)線灌裝啤酒,每瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。此時,不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費者不滿意。假定生產(chǎn)標準規(guī)定每瓶裝填量的標準差不應超過4ml。企業(yè)質檢部門

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論