版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、假設(shè)檢驗(yàn)完全第1頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)是在兩種互相對(duì)立的行動(dòng)之間,通過(guò)對(duì)樣本的試驗(yàn),在一定的保證條件下進(jìn)行決策的統(tǒng)計(jì)分析方法。 第2頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)第3頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一例子:1.康涅狄格州高速公路巡警對(duì)超速駕駛者實(shí)施嚴(yán)厲制裁后高速公路交通事故死亡人數(shù)下降。懷俄明州杰克遜谷地公共衛(wèi)生工程隊(duì)的垃圾處理量是平均每周247噸。傳統(tǒng)上,假設(shè)檢驗(yàn)都是以否定句的形式表示。以否定句的形式表述的假設(shè)為原假設(shè)(假設(shè)什么也未
2、發(fā)生)第4頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一(一)假設(shè)檢驗(yàn)的意義和程序1.設(shè)立假設(shè)。2.作檢驗(yàn)統(tǒng)計(jì)量。3.確定顯著性水平及相應(yīng)的t值。 4.確定拒絕域。5.作出決策。(二)假設(shè)檢驗(yàn)的內(nèi)容1.雙側(cè)檢驗(yàn)2.單側(cè)檢驗(yàn)第5頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一(一)假設(shè)檢驗(yàn)的意義假設(shè)檢驗(yàn)是抽樣推斷中的一項(xiàng)重要內(nèi)容。它是根據(jù)原資料作出一個(gè)總體指標(biāo)是否等于某一個(gè)數(shù)值,某一隨機(jī)變量是否服從某種概率分布的假設(shè),然后利用樣本資料采用一定的統(tǒng)計(jì)方法計(jì)算出有關(guān)檢驗(yàn)的統(tǒng)計(jì)量,依據(jù)一定的概率原則,以較小的風(fēng)險(xiǎn)來(lái)判斷估計(jì)數(shù)值與總體數(shù)值(或者估計(jì)分布與實(shí)際分布)是否存在顯著差異,
3、是否應(yīng)當(dāng)接受原假設(shè)選擇的一種檢驗(yàn)方法。 第6頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一(二)假設(shè)檢驗(yàn)的步驟1.問(wèn)題的提出:對(duì)問(wèn)題詳加調(diào)查研究之后,根據(jù)試驗(yàn)或觀察數(shù)據(jù)來(lái)選擇一個(gè)適宜的概率模型2.假設(shè)的設(shè)立:陳述假設(shè),即提出一個(gè)零假設(shè)和一個(gè)備擇假設(shè)3.確定檢驗(yàn)統(tǒng)計(jì)量:識(shí)別被檢驗(yàn)的統(tǒng)計(jì)量及其分布4.確定顯著性水平5.作出判斷:計(jì)算被檢驗(yàn)的實(shí)際統(tǒng)計(jì)量之值,用實(shí)際統(tǒng)計(jì)量之值與臨界值比較,以確定接受或拒絕第7頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一1.什么是假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是推論統(tǒng)計(jì)的重要內(nèi)容,是先對(duì)總體的未知數(shù)量特征作出某種假設(shè),然后抽取樣本,利用樣本信息對(duì)假設(shè)的正確性
4、進(jìn)行判斷的過(guò)程。統(tǒng)計(jì)假設(shè)有參數(shù)假設(shè)、總體分布假設(shè)、相互關(guān)系假設(shè)(兩個(gè)變量是否獨(dú)立,兩個(gè)分布是否相同)等。參數(shù)假設(shè)是對(duì)總體參數(shù)的一種看法??傮w參數(shù)包括總體均值、總體比例、總體方差等。分析之前必需陳述。我認(rèn)為該企業(yè)生產(chǎn)的零件的平均長(zhǎng)度為4厘米!第8頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一參數(shù)假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn)是通過(guò)樣本信息對(duì)關(guān)于總體參數(shù)的某種假設(shè)合理與否進(jìn)行檢驗(yàn)的過(guò)程。即先對(duì)未知的總體參數(shù)的取值提出某種假設(shè),然后抽取樣本,利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。如果成立就接受這個(gè)假設(shè),如果不成立就放棄這個(gè)假設(shè)。下面主要討論參數(shù)假設(shè)檢驗(yàn)的問(wèn)題。參數(shù)假設(shè)檢驗(yàn)舉例:第9頁(yè),共125頁(yè),2
5、022年,5月20日,1點(diǎn)44分,星期一例1:根據(jù)1989年的統(tǒng)計(jì)資料,某地女性新生兒的平均體重 為3190克。為判斷該地1990年的女性新生兒體重與1989年相比有無(wú)顯著差異,從該地1990年的女性新生兒中隨機(jī)抽取30人,測(cè)得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比1989年略高,但這種差異可能是由于抽樣的隨機(jī)性帶來(lái)的,也許這兩年新生兒的體重并沒(méi)有顯著差異。究竟是否存在顯著差異?可以先假設(shè)這兩年新生兒的體重沒(méi)有顯著差異,然后利用樣本信息檢驗(yàn)這個(gè)假設(shè)能否成立。 這是一個(gè)關(guān)于總體均值的假設(shè)檢驗(yàn)問(wèn)題。第10頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一例2:某種大
6、量生產(chǎn)的袋裝食品,按規(guī)定每袋重量不得少于250克,現(xiàn)從一批該種食品中任意抽取50袋,發(fā)現(xiàn)有6袋重量低于250克。若規(guī)定食品不符合標(biāo)準(zhǔn)的比例達(dá)到5就不得出廠,問(wèn)該批食品能否出廠。可以先假設(shè)該批食品的不合格率不超過(guò)5,然后用樣本不合格率來(lái)檢驗(yàn)假設(shè)是否正確。這是一個(gè)關(guān)于總體比例的假設(shè)檢驗(yàn)問(wèn)題。第11頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一2.假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)所依據(jù)的基本原理是小概率原理。什么是小概率?概率是01之間的一個(gè)數(shù),因此小概率就是接近0的一個(gè)數(shù)著名的英國(guó)統(tǒng)計(jì)家Ronald Fisher 把20分之1作為標(biāo)準(zhǔn),也就是0.05,從此0.05或比0.05小的概率都被認(rèn)為
7、是小概率Fisher沒(méi)有任何深?yuàn)W的理由解釋他為什么選擇0.05,只是說(shuō)他忽然想起來(lái)的第12頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一什么是小概率原理?小概率原理發(fā)生概率很小的隨機(jī)事件(小概率事件)在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的。根據(jù)這一原理,可以先假設(shè)總體參數(shù)的某項(xiàng)取值為真,也就是假設(shè)其發(fā)生的可能性很大,然后抽取一個(gè)樣本進(jìn)行觀察,如果樣本信息顯示出現(xiàn)了與事先假設(shè)相反的結(jié)果且與原假設(shè)差別很大,則說(shuō)明原來(lái)假定的小概率事件在一次實(shí)驗(yàn)中發(fā)生了,這是一個(gè)違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設(shè);否則不能拒絕原假設(shè)。檢驗(yàn)中使用的小概率是檢驗(yàn)前人為指定的。第13頁(yè),共125頁(yè),
8、2022年,5月20日,1點(diǎn)44分,星期一下面我們用一例說(shuō)明這個(gè)原則.小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.這里有兩個(gè)盒子,各裝有100個(gè)球.一盒中的白球和紅球數(shù)99個(gè)紅球一個(gè)白球99個(gè)另一盒中的白球和紅球數(shù)99個(gè)白球一個(gè)紅球99個(gè)第14頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問(wèn)這個(gè)盒子里是白球99個(gè)還是紅球99個(gè)?第15頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.現(xiàn)在我們從中隨機(jī)摸出一個(gè)球,發(fā)現(xiàn)是此時(shí)你如何判斷這個(gè)假設(shè)
9、是否成立呢?第16頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小概率事件.這個(gè)例子中所使用的推理方法,可以稱(chēng)為小概率事件在一次試驗(yàn)中竟然發(fā)生了,不能不使人懷疑所作的假設(shè).帶概率性質(zhì)的反證法不妨稱(chēng)為概率反證法.小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.第17頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一它不同于一般的反證法 概率反證法的邏輯是:如果小概率事件在一次試驗(yàn)中居然發(fā)生,我們就以很大的把握否定原假設(shè). 一般的反證法要求在原假設(shè)成立的條件下導(dǎo)出的結(jié)論是絕對(duì)成立的,如果事實(shí)與之矛盾,則完全絕對(duì)地否定原假設(shè).第18
10、頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一在假設(shè)檢驗(yàn)中,我們稱(chēng)這個(gè)小概率為顯著性水平(Level of significance) ,用 表示.常取 簡(jiǎn)而言之,我們確定拒絕原假設(shè)時(shí)究竟需要多大的把握性,取決于我們所涉及問(wèn)題的重要性。 的選擇要根據(jù)實(shí)際情況而定.第19頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一社會(huì)學(xué)家慣用0.05的概率作為拒絕原假設(shè)的依據(jù)。但對(duì)許多管理問(wèn)題而言,0.05的概率所隱藏的風(fēng)險(xiǎn)可能太大。如120急救中心可以確認(rèn),一個(gè)員工在任意一天不能夠處理所有可能求援電話的概率是0.05,這就意味著每隔20天就有一天,或每3星期就有一次無(wú)法對(duì)病人進(jìn)行援助
11、,這個(gè)場(chǎng)合中,0.05的水平包含風(fēng)險(xiǎn)太大,0.001的水平,或說(shuō)3年失敗一次的風(fēng)險(xiǎn),可能更容易被接受。對(duì)于警察局,一輛警車(chē)的出警概率為0.05是可以接受的。但對(duì)于消防隊(duì)而言,必須確保自己的消防水管失靈的概率不超過(guò)0.0001。 的選擇要根據(jù)實(shí)際情況而定.第20頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的基本思想. 因此我們拒絕假設(shè) = 50. 如果這是總體的真實(shí)均值樣本均值m = 50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值 .20第21頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的兩個(gè)特點(diǎn):第一,假設(shè)檢驗(yàn)采用邏輯上的反證法,即為了檢驗(yàn)一個(gè)假設(shè)
12、是否成立,首先假設(shè)它是真的,然后對(duì)樣本進(jìn)行觀察,如果發(fā)現(xiàn)出現(xiàn)了不合理現(xiàn)象,則可以認(rèn)為假設(shè)是不合理的,拒絕假設(shè)。否則可以認(rèn)為假設(shè)是合理的,接受假設(shè)。第二,假設(shè)檢驗(yàn)采用的反證法帶有概率性質(zhì)。所謂假設(shè)的不合理不是絕對(duì)的,而是基于實(shí)踐中廣泛采用的小概率事件幾乎不可能發(fā)生的原則。至于事件的概率小到什么程度才算是小概率事件,并沒(méi)有統(tǒng)一的界定標(biāo)準(zhǔn),而是必須根據(jù)具體問(wèn)題而定。第22頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的兩個(gè)特點(diǎn): 如果一旦判斷失誤,錯(cuò)誤地拒絕原假設(shè)會(huì)造成巨大損失,那么拒絕原假設(shè)的概率就應(yīng)定的小一些;如果一旦判斷失誤,錯(cuò)誤地接受原假設(shè)會(huì)造成巨大損失,那么拒絕原假設(shè)的
13、概率就應(yīng)定的大一些。小概率通常用 表示,又稱(chēng)為檢驗(yàn)的顯著性水平。通常取0.05或0.01,即把概率不超過(guò)0.05或0.01的事件當(dāng)作小概率事件。第23頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一3.假設(shè)的設(shè)立:原假設(shè)和備擇假設(shè)假設(shè)檢驗(yàn)中,我們稱(chēng)作為檢驗(yàn)對(duì)象的待檢驗(yàn)假設(shè)為原假設(shè)或零假設(shè),用H0表示。原假設(shè)的對(duì)立假設(shè)稱(chēng)為備擇假設(shè)或備選假設(shè),用H1表示。例如,設(shè)0為總體均值的某一確定值。例1.對(duì)于總體均值是否等于某一確定值0的原假設(shè)可以表示為: H0:0(如H0: 3190克) 其對(duì)應(yīng)的 備擇假設(shè)則表示為: H1:0(如H1:3190克)第24頁(yè),共125頁(yè),2022年,5月20日,1
14、點(diǎn)44分,星期一原假設(shè)和備擇假設(shè)例2.對(duì)于總體均值是否小于某一確定值0的原假設(shè)可以表示為: H0:0 (如H0: 5) 其對(duì)應(yīng)的備擇假設(shè)則表示為: H1:0 (如H1:5)注意:原假設(shè)總是有等號(hào):= 或 或 第25頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一4.假設(shè)檢驗(yàn):雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)根據(jù)假設(shè)的形式不同,假設(shè)檢驗(yàn)可以分為雙側(cè)假設(shè)檢驗(yàn)和單側(cè)假設(shè)檢驗(yàn)。若原假設(shè)是總體參數(shù)等于某一數(shù)值,如H0:0 ,即備擇假設(shè)H1:0,那么只要0和0 二者中有一個(gè)成立,就可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱(chēng)為雙側(cè)檢驗(yàn)。第26頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一4.假設(shè)檢驗(yàn):雙側(cè)檢驗(yàn)和
15、單側(cè)檢驗(yàn)(續(xù))若原假設(shè)是總體參數(shù)大于等于或小于等于某一數(shù)值,如H0:0 (即H1:0);或H0 :0 (即H1:0),那么對(duì)于前者當(dāng)0時(shí),對(duì)于后者當(dāng)0 時(shí),可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱(chēng)為單側(cè)檢驗(yàn)??梢苑譃樽髠?cè)檢驗(yàn)和右側(cè)檢驗(yàn)。第27頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式)假設(shè)研究的問(wèn)題(總體均值檢驗(yàn))雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0m = m0m m0m m0H1m m0m m0第28頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一5.假設(shè)檢驗(yàn)中的拒絕域和接受域在規(guī)定了檢驗(yàn)的顯著性水平后,根據(jù)容量為n的樣本,按照統(tǒng)計(jì)量的理論概率分布規(guī)律
16、,可以確定據(jù)以判斷拒絕和接受原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的臨界值。臨界值將統(tǒng)計(jì)量的所有可能取值區(qū)間分為兩個(gè)互不相交的部分,即原假設(shè)的拒絕域和接受域。對(duì)于正態(tài)總體,總體均值的假設(shè)檢驗(yàn)可有如下圖示:第29頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一正態(tài)總體,總體均值假設(shè)檢驗(yàn)圖示:(1)雙側(cè)檢驗(yàn)設(shè)H0:0 , H1:0,有兩個(gè)臨界值,兩個(gè)拒絕域,每個(gè)拒絕域的面積為/2。也稱(chēng)雙尾檢驗(yàn)。雙側(cè)檢驗(yàn)示意圖0第30頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) 抽樣分布H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受域1 - 置信水平第31頁(yè),
17、共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域) H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受域抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計(jì)量第32頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) H0值臨界值臨界值 a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受域抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計(jì)量第33頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域) H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受域抽樣分布1 - 置信水平觀察到
18、的樣本統(tǒng)計(jì)量第34頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一(2)單側(cè)檢驗(yàn)有一個(gè)臨界值,一個(gè)拒絕域,拒絕域的面積為。分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)兩種情況。 單側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域) H0值臨界值a樣本統(tǒng)計(jì)量拒絕域接受域抽樣分布1 - 置信水平第35頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一1)左側(cè)檢驗(yàn)設(shè)H0:0 ,H1:0;臨界值和拒絕域均在左側(cè)。也稱(chēng)下限檢驗(yàn)。0第36頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) H0值臨界值a樣本統(tǒng)計(jì)量拒絕域接受域抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計(jì)量第37頁(yè),共1
19、25頁(yè),2022年,5月20日,1點(diǎn)44分,星期一左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域) H0值臨界值a樣本統(tǒng)計(jì)量拒絕域接受域抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計(jì)量第38頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一2)右側(cè)檢驗(yàn)設(shè)H0 :0 ,H1:0; 臨界值和拒絕域均在右側(cè)。也稱(chēng)上限檢驗(yàn)。0第39頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) H0值臨界值a樣本統(tǒng)計(jì)量拒絕域接受域抽樣分布1 - 置信水平觀察到的樣本統(tǒng)計(jì)量第40頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) H0
20、值臨界值a樣本統(tǒng)計(jì)量接受域抽樣分布1 - 置信水平拒絕域觀察到的樣本統(tǒng)計(jì)量第41頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一6.假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤根據(jù)假設(shè)檢驗(yàn)做出判斷無(wú)非下述四種情況:原假設(shè)真實(shí),并接受原假設(shè),判斷正確原假設(shè)不真實(shí),且拒絕原假設(shè),判斷正確原假設(shè)真實(shí), 但拒絕原假設(shè),判斷錯(cuò)誤原假設(shè)不真實(shí),卻接受原假設(shè),判斷錯(cuò)誤第42頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一6.假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行判斷,有犯錯(cuò)誤的可能。所犯錯(cuò)誤有兩種類(lèi)型:第一類(lèi)錯(cuò)誤是原假設(shè)H0為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成不真而拒絕了。犯這種錯(cuò)誤的概率用表示,也稱(chēng)作錯(cuò)誤(er
21、ror)或棄真錯(cuò)誤。第二類(lèi)錯(cuò)誤是原假設(shè)H0不為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成真而接受了。犯這種錯(cuò)誤的概率用表示,也稱(chēng)作錯(cuò)誤(error)或取偽錯(cuò)誤。第43頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤正確決策和犯錯(cuò)誤的概率可以歸納為下表:假設(shè)檢驗(yàn)中各種可能結(jié)果的概率接受H0拒絕H0,接受H1H0 為真1-(正確決策)(棄真錯(cuò)誤)H0 為偽(取偽錯(cuò)誤)1-(正確決策)第44頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)兩類(lèi)錯(cuò)誤關(guān)系的圖示以單側(cè)上限檢驗(yàn)為例,設(shè)H0 :0 ,H1:0棄真錯(cuò)誤區(qū) 取偽錯(cuò)誤區(qū) 從上圖可以看出,如果臨界值沿水平方向右移,將變小而變
22、大,即若減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);如果臨界值沿水平方向左移,將變大而變小,即若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。圖(a) 0H0為真圖(b)10H0為偽第45頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 錯(cuò)誤和 錯(cuò)誤的關(guān)系你不能同時(shí)減少兩類(lèi)錯(cuò)誤!和的關(guān)系就像翹翹板,小就大, 大就小在樣本容量n一定的情況下,假設(shè)檢驗(yàn)不能同時(shí)做到犯和兩類(lèi)錯(cuò)誤的概率都很小。若減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。要使和同時(shí)變小只有增大樣本容量。但樣本容量增加要受人力、經(jīng)費(fèi)、時(shí)間等很多因素的限制,無(wú)限制增加樣本容量就會(huì)使抽樣調(diào)查失去意義。因此假設(shè)檢驗(yàn)需要慎重考慮對(duì)兩類(lèi)錯(cuò)誤
23、進(jìn)行控制的問(wèn)題。第46頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一7.假設(shè)檢驗(yàn)中的P值(P-value)P值是用于確定是否拒絕原假設(shè)的另一重要工具,是現(xiàn)代統(tǒng)計(jì)檢驗(yàn)中常用的檢驗(yàn)統(tǒng)計(jì)量。傳統(tǒng)的統(tǒng)計(jì)量檢驗(yàn)方法是事先確定檢驗(yàn)的顯著性水平,明確拒絕域,檢驗(yàn)時(shí)只要檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域就拒絕原假設(shè)。 但只給出檢驗(yàn)結(jié)論可靠性(或犯棄真錯(cuò)誤)的大致范圍,無(wú)法給出某一樣本觀測(cè)結(jié)果與原假設(shè)不一致程度的精確度量。P值是當(dāng)原假設(shè)為真時(shí),得到特定樣本觀測(cè)結(jié)果及更極端結(jié)果的概率,其具體取值可以用計(jì)算機(jī)統(tǒng)計(jì)軟件計(jì)算出來(lái)。如果P值很小,說(shuō)明這種樣本觀測(cè)結(jié)果出現(xiàn)的可能性很小,有理由拒絕原假設(shè)。 P值越小,拒絕原
24、假設(shè)的理由就越充分。第47頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一影響P值的因素:樣本數(shù)據(jù)與原假設(shè)值之間的差異樣本量的大小被假設(shè)參數(shù)的總體分布利用P值進(jìn)行假設(shè)檢驗(yàn)的準(zhǔn)則:將P值與事先確定的檢驗(yàn)顯著性水平進(jìn)行比較,若P值小于,說(shuō)明小概率事件發(fā)生,則拒絕原假設(shè);若P值大于,說(shuō)明小概率事件沒(méi)有發(fā)生,則不能拒絕原假設(shè)。第48頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)的P 值圖示/ 2 / 2 樣本統(tǒng)計(jì)量拒絕拒絕H0值臨界值計(jì)算出的統(tǒng)計(jì)量值計(jì)算出的統(tǒng)計(jì)量值臨界值1/2 P 值1/2 P 值抽樣分布圖第49頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一
25、左側(cè)檢驗(yàn)的P 值圖示H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布圖1 - 置信水平計(jì)算出的統(tǒng)計(jì)量值P 值第50頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一右側(cè)檢驗(yàn)的P 值圖示H0值臨界值a拒絕域抽樣分布圖1 - 置信水平計(jì)算出的統(tǒng)計(jì)量值P 值樣本統(tǒng)計(jì)量第51頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一8.假設(shè)檢驗(yàn)的步驟1.問(wèn)題的提出2.根據(jù)研究需要提出原假設(shè)H0和備擇假設(shè)H13.確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量4.確定顯著性水平和臨界值及拒絕域5.作出拒絕或接受原假設(shè)的決策第52頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一8.假設(shè)檢驗(yàn)的步驟(續(xù)1)(一)根據(jù)研究需要提出
26、原假設(shè)H0和備擇假設(shè)H1應(yīng)該注意: 對(duì)任一假設(shè)檢驗(yàn)問(wèn)題,其所有可能結(jié)果均應(yīng)包括在所提出的兩個(gè)對(duì)立假設(shè)中,原假設(shè)與對(duì)立假設(shè)總有一個(gè)、也只能有一個(gè)成立。 原假設(shè)一定要有等號(hào): 或 或。 原假設(shè)不是隨意提出的,應(yīng)該本著“不輕易拒絕原假設(shè)”的原則。第53頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一雙側(cè)檢驗(yàn)原假設(shè)與備擇假設(shè)的確定雙側(cè)檢驗(yàn)屬于決策中的假設(shè)檢驗(yàn)。即不論是拒絕H0還是接受H0,都必需采取相應(yīng)的行動(dòng)措施。例如,某種零件的尺寸,要求其平均長(zhǎng)度為10厘米,大于或小于10厘米均屬于不合格。待檢驗(yàn)問(wèn)題是該企業(yè)生產(chǎn)的零件平均長(zhǎng)度是10厘米嗎?(屬于決策中的假設(shè))則建立的原假設(shè)與備擇假設(shè)應(yīng)為
27、H0: = 10 H1: 10第54頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一單側(cè)檢驗(yàn)原假設(shè)與備擇假設(shè)的確定應(yīng)區(qū)別不同情況采取不同的建立假設(shè)方法。對(duì)于檢驗(yàn)?zāi)稠?xiàng)研究是否達(dá)到了預(yù)期效果一般是將研究的預(yù)期效果(希望、想要證明的假設(shè))作為備擇假設(shè)H1,將認(rèn)為研究結(jié)果無(wú)效作為原假設(shè)H0。先確立備擇假設(shè)H1。因?yàn)橹挥挟?dāng)檢驗(yàn)結(jié)果與原假設(shè)有明顯差別時(shí)才能拒絕原假設(shè)而接受備擇假設(shè),原假設(shè)不會(huì)輕易被拒絕,就使得希望得到的結(jié)論不會(huì)輕易被接受,從而減少結(jié)論錯(cuò)誤。第55頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一單側(cè)檢驗(yàn)原假設(shè)與備擇假設(shè)的確定例1,有研究預(yù)計(jì),采用新技術(shù)生產(chǎn)后將會(huì)使某產(chǎn)品的
28、使用壽命明顯延長(zhǎng)到1500小時(shí)以上。則建立的原假設(shè)與備擇假設(shè)應(yīng)為: H0: 1500 H1: 1500例2,有研究預(yù)計(jì),改進(jìn)生產(chǎn)工藝后會(huì)使某產(chǎn)品的廢品率降低到2%以下。則建立的原假設(shè)與備擇假設(shè)應(yīng)為: H0: 2% H1: 2%第56頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一單側(cè)檢驗(yàn)原假設(shè)與備擇假設(shè)的確定對(duì)于檢驗(yàn)?zāi)稠?xiàng)聲明的有效性一般可將所作的聲明作為原假設(shè)。將對(duì)該聲明的質(zhì)疑作為備擇假設(shè)。先確立原假設(shè)H0。因?yàn)槌怯凶C據(jù)表明“聲明”無(wú)效,否則就應(yīng)認(rèn)為該“聲明”是有效的。例1,某燈泡制造商聲稱(chēng),該企業(yè)生產(chǎn)的燈泡平均使用壽命在1000小時(shí)以上。通常除非樣本能提供證據(jù)表明使用壽命在100
29、0小時(shí)以下,否則就應(yīng)認(rèn)為廠商的聲稱(chēng)是正確的。建立的原假設(shè)與備擇假設(shè)應(yīng)為: H0: 1000 H1: 1000第57頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一單側(cè)檢驗(yàn)原假設(shè)與備擇假設(shè)的確定對(duì)于上述問(wèn)題還可以結(jié)合不同背景建立假設(shè)。同樣的問(wèn)題背景不同可以采用不同的原假設(shè)。例如,一商店經(jīng)常從某工廠購(gòu)進(jìn)某種商品,該商品質(zhì)量指標(biāo)為,值愈大商品質(zhì)量愈好。商店提出的進(jìn)貨條件是按批驗(yàn)收,只有通過(guò)假設(shè)“0 ”檢驗(yàn)的批次才能接受。有兩種可能情況:如果根據(jù)過(guò)去較長(zhǎng)時(shí)間購(gòu)貨記錄,商店相信該廠產(chǎn)品質(zhì)量好,于是同意把原假設(shè)定為0 ,而且選擇較低的檢驗(yàn)顯著性水平。這對(duì)工廠是有利的,使得達(dá)到質(zhì)量標(biāo)準(zhǔn)的產(chǎn)品以很小
30、的概率被拒收。雖然這會(huì)使商店面臨接受不合標(biāo)準(zhǔn)產(chǎn)品的風(fēng)險(xiǎn),但歷史記錄顯示出現(xiàn)這種情況的可能性很小,而且商店也可因此獲得較好的貨源。如果過(guò)去一段時(shí)期的記錄表明,該廠產(chǎn)品質(zhì)量并不理想,商店則會(huì)堅(jiān)持以0為原假設(shè),并選定較小的檢驗(yàn)顯著性水平。這對(duì)商店是有利的,不會(huì)輕易地拒絕原假設(shè),有 1的可能把劣質(zhì)產(chǎn)品拒之門(mén)外。第58頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量假設(shè)檢驗(yàn)根據(jù)檢驗(yàn)內(nèi)容和條件不同需要采用不同的檢驗(yàn)統(tǒng)計(jì)量。在一個(gè)正態(tài)總體的參數(shù)檢驗(yàn)中,Z統(tǒng)計(jì)量和t統(tǒng)計(jì)量常用于均值和比例的檢驗(yàn),2統(tǒng)計(jì)量用于方差的檢驗(yàn)。選擇統(tǒng)計(jì)量需考慮的因素有被檢驗(yàn)的參數(shù)類(lèi)型、總體方差是否已知、用
31、于檢驗(yàn)的樣本量大小等。Z 檢驗(yàn)(單尾和雙尾) t 檢驗(yàn)(單尾和雙尾)Z 檢驗(yàn)(單尾和雙尾) 2檢驗(yàn)(單尾和雙尾)均值一個(gè)總體比例方差第59頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量假設(shè)檢驗(yàn)根據(jù)檢驗(yàn)內(nèi)容和條件不同需要采用不同的檢驗(yàn)統(tǒng)計(jì)量。在一個(gè)正態(tài)總體的參數(shù)檢驗(yàn)中,Z統(tǒng)計(jì)量和t統(tǒng)計(jì)量常用于均值和比例的檢驗(yàn),2統(tǒng)計(jì)量用于方差的檢驗(yàn)。選擇統(tǒng)計(jì)量需考慮的因素有被檢驗(yàn)的參數(shù)類(lèi)型、總體方差是否已知、用于檢驗(yàn)的樣本量大小等。Z 檢驗(yàn)(單尾和雙尾) t 檢驗(yàn)(單尾和雙尾)Z 檢驗(yàn)(單尾和雙尾) 2檢驗(yàn)(單尾和雙尾)均值一個(gè)總體比例方差第60頁(yè),共125頁(yè),2022年,5月2
32、0日,1點(diǎn)44分,星期一8.總體均值的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量的確定總體標(biāo)準(zhǔn)差 是否已知?樣本容量n否是z 檢驗(yàn) t 檢驗(yàn)小用樣本標(biāo)準(zhǔn)差S代替z 檢驗(yàn)大第61頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一幾種主要類(lèi)型的假設(shè)檢驗(yàn)實(shí)例1.總體方差2已知時(shí)均值的檢驗(yàn)(歸納)假定條件總體服從正態(tài)分布若總體不服從正態(tài)分布, 可用正態(tài)分布來(lái)近似(要求n30)使用Z統(tǒng)計(jì)量第62頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一1.1 總體方差2 已知時(shí)均值的雙側(cè)檢驗(yàn)?zāi)硻C(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,以前加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為=0.025
33、。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度均值為0.076mm。試問(wèn)新機(jī)床加工零件的橢圓度均值與以前有無(wú)顯著差異?(0.05)屬于決策中的假設(shè)!第63頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:已知:0=0.081mm,=0.025,n=200, 提出假設(shè):假定橢圓度與以前無(wú)顯著差異 H0: = 0.081 H1: 0.081=0.05雙側(cè)檢驗(yàn)/2=0.025 查表得臨界值:Z0.025=1.96Z01.96-1.960.025拒絕 H0拒絕 H00.025決策:Z值落入拒絕域,在=0.05的水平上拒絕H0結(jié)論:有證據(jù)表明新機(jī)床加工的零件的橢圓度與以
34、前有顯著差異得兩個(gè)拒絕域: (-,-1.96)和(1.96,)計(jì)算檢驗(yàn)統(tǒng)計(jì)量值:第64頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一總體方差2 已知均值的檢驗(yàn) (P 值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點(diǎn)擊第3步:在函數(shù)分類(lèi)中點(diǎn)擊“統(tǒng)計(jì)”,在函數(shù)名的菜單下選擇字符“NORMSDIST”然后確定第4步:將Z的絕對(duì)值2.83錄入,得到的函數(shù)值為 0.9976726。表示標(biāo)準(zhǔn)正態(tài)分布曲線下Z值2.83左側(cè)的面積為0.9976726。雙側(cè)檢驗(yàn)計(jì)算P值:2(10.9976726)=0.0046548 P值遠(yuǎn)小于=0.05 ,故拒絕H0第65
35、頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一1.2總體方差2 已知時(shí)均值的單側(cè)檢驗(yàn)(歸納)左側(cè):H0: 0 H1: 0統(tǒng)計(jì)量值必須顯著地大于0才能拒絕H0 ,小于0的值滿足 H0 ,不能拒絕H0Z0拒絕 H0第66頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一1.2總體方差2已知時(shí)均值的單側(cè)檢驗(yàn)(左檢驗(yàn)舉例)某批發(fā)商欲從生產(chǎn)廠家購(gòu)進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時(shí)。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時(shí)。在總體中隨機(jī)抽取100只燈泡,測(cè)得樣本均值為960小時(shí)。批發(fā)商是否應(yīng)該購(gòu)買(mǎi)這批燈泡? (0.05)屬于檢驗(yàn)聲明的有效性!第67頁(yè)
36、,共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:已知:0=1000小時(shí),=20,n=100, 提出假設(shè):假定使用壽命平均不低于1000小時(shí) H0: 1000 H1: 1020 = 0.05 右檢驗(yàn)臨界值為正得臨界值:Z0.05=1.645計(jì)算檢驗(yàn)統(tǒng)計(jì)量值: Z值落入拒絕域,在=0.05的顯著性水平上拒絕H0,接受H1有證據(jù)表明這批燈泡的使用壽命有顯著提高決策:結(jié)論:Z0拒絕域0.051.645得拒絕域:(1.645, )第70頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一2.1 總體方差2 未知時(shí)均值的雙側(cè)檢驗(yàn)?zāi)硰S采用自動(dòng)包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,
37、每包標(biāo)準(zhǔn)重量為1000克。某日隨機(jī)抽查9包,測(cè)得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差為24克。試問(wèn)在0.05的顯著性水平上,能否認(rèn)為這天自動(dòng)包裝機(jī)工作正常?屬于決策中的假設(shè)!第71頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:已知:0=1000克,s=24,n=9,提出假設(shè):假定每包產(chǎn)品的重量與標(biāo)準(zhǔn)重量無(wú)顯著差異 H0: =1000 H1: 1000=0.05雙側(cè)檢驗(yàn)/2=0.025df =9-1=8 得臨界值:t0.025(8)=2.306計(jì)算檢驗(yàn)統(tǒng)計(jì)量值: t值落入接受域,在=0.05的顯著性水平上接受H0有證據(jù)表明這天自動(dòng)包裝機(jī)工作正常決策:結(jié)論:t02.306-2.306
38、0.025拒絕 H0拒絕 H00.025得兩個(gè)拒絕域: (-,-2.306)和(2.306,)第72頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一總體方差2 未知小樣本均值的檢驗(yàn) (P 值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點(diǎn)擊第3步:在函數(shù)分類(lèi)中點(diǎn)擊“統(tǒng)計(jì)”,在函數(shù)名的菜單中選擇字符“TDIST”,然后確定第4步:在彈出的對(duì)話框錄入:在X欄中錄入計(jì)算出的t的絕對(duì)值1.75 在自由度(Deg-freedom)欄中錄入8在Tails欄中錄入2,表明是雙側(cè)檢驗(yàn)(單測(cè)檢驗(yàn)則在該欄內(nèi)錄入1)顯示計(jì)算結(jié)果P值為0.118232783P值大于/
39、2=0.025, 故接受H0第73頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一2.2 總體方差2 未知時(shí)均值的單側(cè)檢驗(yàn)一個(gè)汽車(chē)輪胎制造商聲稱(chēng),某一等級(jí)的輪胎的平均壽命在一定的汽車(chē)重量和正常行駛條件下大于40000公里,對(duì)一個(gè)由20個(gè)輪胎組成的隨機(jī)樣本作了試驗(yàn),測(cè)得平均值為41000公里,標(biāo)準(zhǔn)差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結(jié)論,該制造商的產(chǎn)品同他所說(shuō)的標(biāo)準(zhǔn)相符?(=0.05)屬于檢驗(yàn)聲明有效性的假設(shè)!第74頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:已知:0=40000公里,s=5000,n=20, 提出假設(shè):假定平均
40、壽命不低于40000公里 H0: 40000 H1: 40000=0.05 左檢驗(yàn)臨界值為負(fù)df=20-1=19得臨界值: -t0.05(19)=-1.7291計(jì)算檢驗(yàn)統(tǒng)計(jì)量值:t值落入接受域,在=0.05的顯著性水平上接受H0結(jié)論: 有證據(jù)表明輪胎使用壽命顯著地大于40000公里,可以認(rèn)為該制造商的聲稱(chēng)是可信的。決策: -1.7291t0拒絕域0.05得拒絕域:(-,-1.7291)第75頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一3.總體均值與樣本均值間差異的檢驗(yàn)例如,一個(gè)由50名學(xué)生組成的樣本其平均身高為174.94cm,標(biāo)準(zhǔn)差為6.42cm,假設(shè)樣本是抽自平均身高為172
41、.50cm的總體,這樣樣本的值與總體均值間的誤差為: 屬于抽樣誤差?假定顯著性水平為0.05。第76頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:1陳述假設(shè):2識(shí)別檢驗(yàn)統(tǒng)計(jì)量并計(jì)算3規(guī)定顯著性水平:,則拒絕零假設(shè)。4雙側(cè)檢驗(yàn)如果第77頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一這就是說(shuō),在0.05顯著性水平下,由平均身高174.94cm的50個(gè)學(xué)生所抽成的樣本,不是抽自平均身高為172.50cm的總體。也就是所觀察到的兩者的誤差,不是抽樣誤差。 5因?yàn)?,所以?yīng)拒絕零假設(shè)。第78頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一4.用置信區(qū)間進(jìn)行檢驗(yàn)一種袋裝
42、食品每包的標(biāo)準(zhǔn)重量應(yīng)為1000克?,F(xiàn)從生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16袋,測(cè)得其平均重量為991克。已知這種產(chǎn)品重量服從標(biāo)準(zhǔn)差為50克的正態(tài)分布。試確定這批產(chǎn)品的包裝重量是否合格?(= 0.05)雙側(cè)檢驗(yàn)第79頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:提出假設(shè): H0: = 1000 H1: 1000已知:n = 16,=50,=0.05雙側(cè)檢驗(yàn)/2=0.025 臨界值: Z0.025=1.96置信區(qū)間為決策:結(jié)論: 在置信區(qū)間內(nèi),不拒絕H0可以認(rèn)為這批產(chǎn)品的包裝重量合格Z01.96-1.960.025拒絕 H0拒絕 H00.025第80頁(yè),共125頁(yè),2022年,5月20日,
43、1點(diǎn)44分,星期一習(xí)題1:有科學(xué)家提出,如果人們?cè)谠绮椭惺秤酶呃w維的谷物,那么平均而言,與早餐沒(méi)有食用谷物的人群相比,食用谷物者在午餐中攝取的熱量(大卡)將會(huì)減少. 為了驗(yàn)證這個(gè)假設(shè),隨機(jī)抽取了35人,詢問(wèn)他們?cè)绮秃臀绮偷耐ǔJ匙V,根據(jù)他們的食譜,將其分為二類(lèi),一類(lèi)為經(jīng)常的谷類(lèi)食用者(總體1),一類(lèi)為非經(jīng)常谷類(lèi)食用者(總體2). 然后測(cè)定每人午餐的大卡攝取量. 經(jīng)過(guò)一段時(shí)間的實(shí)驗(yàn),得到如下結(jié)果.試檢驗(yàn)該假設(shè).第81頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一35人大卡攝取量 總體1568681636607555496540539519562589646596617584總體265
44、0569622630596637628706617624563580711480688723651669709632第82頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:所以拒絕 ,可以認(rèn)為經(jīng)常的谷類(lèi)食用者攝取的熱量少于不經(jīng)常食用者.t-檢驗(yàn):雙樣本異方差假設(shè).xls 規(guī)定,查表得 ,由于第83頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一兩個(gè)總體均值之差的檢驗(yàn)用Excel進(jìn)行檢驗(yàn) 第1步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng) 第2步:選擇【t 檢驗(yàn),雙樣本異方差假設(shè)】 第3步:當(dāng)出現(xiàn)對(duì)話框后 在【變量1的區(qū)域】方框內(nèi)輸入數(shù)據(jù)A1:A15 在【變量2的區(qū)域】方
45、框內(nèi)輸入數(shù)據(jù)B1:B20 在【假設(shè)平均差】的方框內(nèi)輸入“0” 在【】框內(nèi)鍵入“0.05” 在【輸出選項(xiàng)】中選擇輸出區(qū)域 選擇【確定】 第84頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一表: 兩個(gè)總體均值之差的檢驗(yàn)第85頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一習(xí)題2一個(gè)以減肥為主要目標(biāo)的健美俱樂(lè)部聲稱(chēng),參加其訓(xùn)練班至少可以使肥胖者平均體重減輕8.5kg以上. 為了驗(yàn)證該宣稱(chēng)是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如表1. 在 的水平下,調(diào)查結(jié)果是否支持該俱樂(lè)部的聲稱(chēng)?表1 訓(xùn)練前后的體重記錄 單位:kg第86頁(yè),共125頁(yè),2022年,5月20
46、日,1點(diǎn)44分,星期一表 2:差值樣本構(gòu)造表單位:kg 第87頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一解:根據(jù)表2的差值,求得所以拒絕 ,可以認(rèn)為該俱樂(lè)部的宣稱(chēng)成立.t-檢驗(yàn):成對(duì)雙樣本均值分析.xls規(guī)定 ,查表得 ,由于從而第88頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一案例:圣經(jīng)里真有密碼嗎?1994年8月,魏茨滕 、芮普斯及羅森博格在期刊Statistical Science中發(fā)表了一篇名為圣經(jīng)創(chuàng)世記里的等距字母序列的論文(以下簡(jiǎn)稱(chēng)魏文)?!癊quidistant Letter Sequences in the Book of Genesis”, St
47、atistical Science, 429-438第89頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一第90頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一等距字母序列(ELS)早期的ELSSTSFGLOHAKEROLTOEIOPNOUAHEIVLSDOTNKEHALOMPHKEROFHARTRNYPMNALEONDDJGALF第91頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一等距字母序列(ELS) (續(xù))“創(chuàng)世紀(jì)”第三十一章第二十八節(jié)為例子And hast not suffered me to kiss my sons and my daughters?
48、Thou hast now done foolishly in so doing.(又不容我與外孫和女兒告別,你所行的真是愚昧!)我們先把空格和標(biāo)點(diǎn)符號(hào)去掉,合并成字符串:AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoing物理學(xué)家托馬斯(David Thomas)以英王欽定版(King James Version) 第92頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一等距字母序列(ELS) (續(xù))Andhastnotsufferedmetokissmysonsandmydau
49、ghtersThouhastnowdonefoolishlyinsodoingROSWELL從 ”daughters” 的r 開(kāi)始,跳過(guò)三個(gè)字母AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoingUFO第93頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一提出假設(shè)思考題:魏茨滕 、芮普斯及羅森博格應(yīng)該如何設(shè)置他們的假設(shè)?第94頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一HO:三十二位教士的名字與他們出生死亡日期的 排列是偶然的H1:三十二位教士的名字與他們出生死亡日
50、期的排列并不是偶然的第95頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一魏文的拉比(Rabbi)實(shí)驗(yàn) (A)選取樣本將希伯來(lái)文的創(chuàng)世紀(jì)排成無(wú)空隙的一長(zhǎng)串 L=78,064 字 G=g1gL 從 Encyclopaedia of Great Men in Israel (9世紀(jì)至18世紀(jì)末)選出32位 Rabbi 定義:xi=名字;yi=出生、死亡日期取整數(shù)d (skip) 及等距字母序列 (ELS) gn, gn+d,.,gn+(k-1)d, 1n, n+(k-1)d L如果有多對(duì)相同,取距離最短的那對(duì) 這樣的配對(duì)如此靠近純屬運(yùn)氣嗎?第96頁(yè),共125頁(yè),2022年,5月20日,1
51、點(diǎn)44分,星期一魏文的拉比(Rabbi)實(shí)驗(yàn) (B)定義距離設(shè)置檢驗(yàn)統(tǒng)計(jì)量對(duì)一個(gè)二維度的字符串(xi , yi)定義一個(gè)距離c (xi , yi),目的在于將資料定量化魏文找到了一個(gè)距離,但是公式復(fù)雜、抽象,用一個(gè)類(lèi)似的例子來(lái)說(shuō)明假設(shè)現(xiàn)在有8對(duì)夫婦共16個(gè)人,我們姑且用數(shù)學(xué)上的數(shù)對(duì)符號(hào)(X1,Y1),(X2,Y2),(X3,Y3),-,(X8,Y8)來(lái)稱(chēng)呼他們,亦即,X1 和Y1 是夫婦,X2 和Y2 是夫婦,以此類(lèi)推,排成兩排吃飯。其中第一排坐先生,第二排坐太太,且假定先生的位置依次坐下,而太太們的作為可以改變。假設(shè)他們的排列次序(P1)如下第97頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)
52、44分,星期一我們就可以定義這個(gè)特定排列P1的距離為:D(P1) | 1-7| + | 2-4| + |3-2| + |4-8| + |5-6| + |6 -3| + |7-5| + |8-1| = 2612345678X1X2X3X4X5X6X7X8Y7Y4Y2Y8Y6Y3Y5Y1固定第98頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一共有 8! = 40320 種方法,距離的可能值為: 0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32共有17種,這些距離值在 8! 中出現(xiàn)的次數(shù)分別為1, 7, 33, 1
53、15, 327, 765, 1523, 2553, 3696, 4852, 5708, 5892, 5452, 4212, 2844, 764, 576 。所以可以算出得到某一距離值的頻率,例如距離值為 2 的頻率是 7/40320 = 0.000173611,距離值為 32 的頻率是 576/40320 = 0.0142857。也可以畫(huà)出其分布圖。第99頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一分布圖第100頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一魏文中拉比實(shí)驗(yàn)的距離試驗(yàn)(1)魏文一共選擇了32位拉比,那么其排列方式就有 32! 種,32!1030。如果用世
54、界上最快的計(jì)算機(jī)(每秒萬(wàn)億次)來(lái)計(jì)算,需要年不可能完成,如何辦?第101頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一拉比實(shí)驗(yàn)的距離試驗(yàn)(2)利用統(tǒng)計(jì)學(xué)的抽樣。利用電腦通過(guò)“簡(jiǎn)單隨機(jī)抽樣”方式進(jìn)行,分別抽取2萬(wàn),10萬(wàn),100萬(wàn)個(gè)樣本。將樣本中的距離值用條形圖的方式表示出來(lái)。就得到后面的三個(gè)圖第102頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一【圖1】樣本數(shù)為2萬(wàn)個(gè)的條形圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值404,99%的位置為距離值428,99.95%的位置為距離值452 1%5%99.95%第
55、103頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一【圖2】樣本數(shù)為10萬(wàn)個(gè)的長(zhǎng)條圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值402,99%的位置為距離值426,99.95%的位置為距離值454。第104頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一【圖3】樣本數(shù)為100萬(wàn)個(gè)的長(zhǎng)條圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值402,99%的位置為距離值426,99.95%的位置為距離值454。第105頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)
56、44分,星期一從【圖1】至【圖3】可以看出95%以上的距離小于 402,99%以上的距離小于 426,而距離超過(guò) 454的機(jī)率不會(huì)大于0.0005。魏茨滕等人的文章中說(shuō)明,若以他們所定義的距離去計(jì)算那三十二位猶太教士,有關(guān)名字和生日的相關(guān)排列位置,其結(jié)果是應(yīng)該拒絕 H0,而且其 P 值均遠(yuǎn)低于0.05(實(shí)際上為0.00002),也就是說(shuō),那三十二位猶太教士的名字及生日的排列,鐵定是不尋常的。 第106頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一戰(zhàn)爭(zhēng)與和平(War and Peace)對(duì)照實(shí)驗(yàn)實(shí)驗(yàn)結(jié)果不顯著Leo Tolstoy第107頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)4
57、4分,星期一1997年5月28日,The New York Times 全頁(yè)廣告The Bible Code (圣經(jīng)密碼)作者:Michael Drosnin (卓思寧)(前華盛頓郵報(bào),華爾街日?qǐng)?bào)記者)“根據(jù)密碼顯示,拉賓的名字和暗殺連在一起” (1994年9月給拉賓信,1995年11月拉賓死于刺客之下)期刊、數(shù)學(xué)家證明了密碼的存在。(同行審核的)摩西五經(jīng)(創(chuàng)世記、出埃及記、利未記、民數(shù)記、申命記)都發(fā)現(xiàn)藏有圣經(jīng)密碼第108頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一是有東西在,可是是密碼嗎?對(duì)立假設(shè)是什么呢?( H1:三十二位教士的名字與他們出生死亡日期的排列并不是偶然的)批評(píng)
58、:(1)Rips 認(rèn)為數(shù)學(xué)家的反應(yīng): F.P. Ramsey定理-宴會(huì)問(wèn)題,完全的無(wú)秩序是不可能的戰(zhàn)爭(zhēng)與和平、白鯨記用相同的方法也藏有密碼第109頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一批評(píng)(1)同門(mén)相殘不能預(yù)測(cè),有些“翻譯”的密碼統(tǒng)計(jì)意義不顯著第110頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一數(shù)學(xué)家的反應(yīng)Ramsey定理Frank Plumpton Ramsey(19031930)Paul Erds(1913-1996)第111頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一Ramsey定理說(shuō) ,“世界上的事物不可能完全無(wú)序”。意思就是說(shuō),只要點(diǎn)數(shù)
59、夠多,我們就可以在里面“看出”你要的任何圖像,所以你可以在夜空中看到各種星座;同理,叫一只猩猩在打字機(jī)上亂打,只要字母夠長(zhǎng),你可以找到你要的任意有意義的句子,Drosnin用計(jì)算機(jī)做所謂等距密碼,其實(shí)道理是一樣的. 第112頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一第113頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一5.3.3 對(duì)照實(shí)驗(yàn)戰(zhàn)爭(zhēng)與和平、白鯨中的密碼Michael Drosnin反駁道:“你只要在白鯨(Moby Dick) 中找到密碼,I就服了U”第114頁(yè),共125頁(yè),2022年,5月20日,1點(diǎn)44分,星期一澳大利亞國(guó)立大學(xué)的一位計(jì)算機(jī)教授-Bren
60、dan McKay,找到了印度總理甘地被刺的“信息”:O R W I T H A W H I T E P N A H A B Y O U N G M A NK L E S H I S G R A N D D D S Y E T I N G E N E R A T H E B L O O D Y D E E D E R M W H A L E S H E A DT T O I M P O S S I B L E Indian Prime Minister Indira Gandhi was killed on Oct 31, 1984O R W I T H A W H I T E P N A H
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO 4254-20:2025 EN Agricultural machinery - Safety - Part 20: Grape,olives and coffee harvesters
- 2024年租賃合同中的維修責(zé)任
- 研究生復(fù)試課程設(shè)計(jì)問(wèn)題
- 紅色課程設(shè)計(jì)思
- 幼兒園青蛙課程設(shè)計(jì)
- 步進(jìn)式運(yùn)輸機(jī)課程設(shè)計(jì)
- 舞蹈身材訓(xùn)練課程設(shè)計(jì)
- 班主任工作中的困惑與解決之道
- 電子心率計(jì)數(shù)器課程設(shè)計(jì)
- 硬件課程設(shè)計(jì) 函數(shù)
- 《業(yè)務(wù)員銷(xiāo)售技巧》課件
- 期末卷(一)-2023-2024學(xué)年高一年級(jí)地理上學(xué)期高頻考題期末測(cè)試卷(江蘇專(zhuān)用)(原卷版)
- 山東師范大學(xué)《古代文學(xué)專(zhuān)題(一)》期末復(fù)習(xí)題
- 注塑操作員作業(yè)指導(dǎo)書(shū)
- 四年級(jí)心理健康 12.我也能當(dāng)家 課件(7張ppt)
- 10kV架空線路工程初步設(shè)計(jì)說(shuō)明書(shū)模板
- 鍋爐汽包水位控制系統(tǒng)設(shè)計(jì)[1]
- 政務(wù)禮儀培訓(xùn)課件(PPT66頁(yè))rar
- 水土保持常用監(jiān)測(cè)手段及方法
- 片石擋土墻砌筑施工方案及工藝方法
- 分析刑法中認(rèn)識(shí)因素和意志因素的關(guān)系
評(píng)論
0/150
提交評(píng)論