數(shù)據(jù)、模型與決策課件:第四章 差異性分析_第1頁
數(shù)據(jù)、模型與決策課件:第四章 差異性分析_第2頁
數(shù)據(jù)、模型與決策課件:第四章 差異性分析_第3頁
數(shù)據(jù)、模型與決策課件:第四章 差異性分析_第4頁
數(shù)據(jù)、模型與決策課件:第四章 差異性分析_第5頁
已閱讀5頁,還剩110頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章差異性分析授課目的:了解掌握單一總體、兩總體以及多總體 的差異性分析要求:1.如何判定差異是否存在問題 2.掌握假設(shè)檢驗(yàn)的方法原理 3. 對不同類型總體的參數(shù)與特定值差異的檢 驗(yàn)方法熟悉使用本章要點(diǎn)假設(shè)檢驗(yàn)原理總體平均數(shù)與特定值差異的檢驗(yàn)總體其他參數(shù)與特定值差異的檢驗(yàn)兩總體平均數(shù)的差異性檢驗(yàn)兩總體的差異性檢驗(yàn)多總體平均數(shù)齊一性檢驗(yàn)本章要點(diǎn)聯(lián)系圖單一總體總體平均數(shù)與特定值差異的檢驗(yàn)(方差已知VS方差未知)總體比率/方差與特定值差異的檢驗(yàn)兩總體兩總體平均數(shù)的差異性檢驗(yàn)(配對樣本VS獨(dú)立樣本)兩總體比率/方差間的差異性檢驗(yàn)多總體多總體平均數(shù)齊一性檢驗(yàn)方差分析表假設(shè)檢驗(yàn)第一節(jié) 差異性分析概述假設(shè)

2、檢驗(yàn)的提出假設(shè)檢驗(yàn)的解決之道是:先假設(shè)總體上變量間不存在差異,然后判別樣本數(shù)據(jù)與假設(shè)的總體狀態(tài)呈現(xiàn)的差異是隨機(jī)誤差還是顯著差別。如果是后者,則否定原來的假設(shè),承認(rèn)總體上變量間存在差異;如果是前者,則不能否定原來的假設(shè),還是得承認(rèn)總體上變量間不存在差異。從第三章闡述的樣本統(tǒng)計(jì)量分布原理可知,自同一個總體進(jìn)行隨機(jī)抽樣,所得樣本平均數(shù)與總體平均數(shù)不相等是正??善诘?,而兩者相等的概率為零。將事情倒過來看,對于一個隨機(jī)樣本,它有可能來自符合設(shè)定平均數(shù)特定值的總體,在此種情況下,樣本平均數(shù)與設(shè)定的總體平均數(shù)特定值會有一定差異,但是不顯著;當(dāng)然也可能來自另外其平均數(shù)與設(shè)定平均數(shù)特定值不同的總體,在此種情況下

3、,樣本平均數(shù)與設(shè)定的總體平均數(shù)特定值會有顯著差異。問題的關(guān)鍵是如何判定樣本平均數(shù)與設(shè)定的總體平均數(shù)之間的差異是否顯著。 1.總體平均數(shù)與特定值差異的檢驗(yàn)( 已知) 2.假設(shè)檢驗(yàn)中的雙向風(fēng)險(xiǎn)和兩類錯誤 3.P值決策法 4.總體平均數(shù)特定值的檢驗(yàn)( 未知)第二節(jié) 假設(shè)檢驗(yàn)的原理 從總體平均數(shù)特定值檢驗(yàn)切入總體平均數(shù)與特定值差異的檢驗(yàn)( 已知)假設(shè)檢驗(yàn)的基本邏輯:小概率事件在一次觀察中幾乎不可能發(fā)生。如果一旦發(fā)生,就反過來否定關(guān)于總體狀況的假設(shè)??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)假設(shè)檢驗(yàn)中,關(guān)于總體上變量間不存在差異的初始陳述,稱為零假設(shè)(null hypothesis)。本節(jié)考察的是總體平均數(shù)

4、 是否與特定值 存在差異,零假設(shè)記作把與零假設(shè)的表述相對立的假設(shè)稱為備擇假設(shè)(alternate hypothesis),記作總體平均數(shù)與特定值差異的檢驗(yàn)( 已知)因?yàn)樾「怕时环峙湓谡龖B(tài)曲線兩尾,使得劃分隨機(jī)差異和顯著差異的數(shù)值有左右對稱的兩個,這種類型的假設(shè)檢驗(yàn)稱為雙尾檢驗(yàn)(two-tailed test)。臨界值(critical value)顯著水平(significant level)總體平均數(shù)與特定值差異的檢驗(yàn)( 已知)單一總體平均數(shù)檢驗(yàn)雙尾檢驗(yàn)的判定法則是:若 或者 ,就拒絕 (反之則接受 )??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知) 落入 區(qū)間之內(nèi), 導(dǎo)致接受 ,稱該區(qū)間為接受域(

5、acceptance region)。 落入該區(qū)間之外的兩側(cè)導(dǎo)致拒絕 ,稱其為拒絕域(rejection region)??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)判定法則也可以圍繞標(biāo)準(zhǔn)正態(tài)單位的形式提出計(jì)算檢驗(yàn)統(tǒng)計(jì)量,即將 標(biāo)準(zhǔn)化若 ,就拒絕 (反之則接受 )??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)Z檢驗(yàn)的標(biāo)準(zhǔn)表達(dá)形式以例4-1為例例4-1接續(xù)例3-4的調(diào)料包重量問題。廠家保證每包凈重的總體平均數(shù)是160克,有人對此提出質(zhì)疑,認(rèn)為重量不準(zhǔn)。面對此爭議,采用隨機(jī)抽樣60包檢測的辦法給予評判??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)解:本題為總體特定值差異性雙尾檢驗(yàn)(大樣本視同無限總體)。 ; 。已知

6、 =2, n=60。指定 =0.05,查標(biāo)準(zhǔn)正態(tài)分布表有 =1.96。判定法則是 :若 , 就拒絕 。由 =160.33,得 。因?yàn)?,所以接受 。結(jié)論:不能認(rèn)為調(diào)料凈重總體平均數(shù)不是160克??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)某些場合要判斷的是總體平均數(shù)是否超過某特定值。這種類型的假設(shè)檢驗(yàn)就是右尾檢驗(yàn)(right-tailed test),其一對假設(shè)是從零假設(shè)成立出發(fā),確定一次抽樣幾乎不可能發(fā)生的小概率事件在以 為期望值的正態(tài)曲線右尾下面。如果 落入小概率事件范圍,則反過來認(rèn)定零假設(shè)不成立。總體平均數(shù)與特定值差異的檢驗(yàn)( 已知)另外一些場合要判斷的是總體平均數(shù)是否不及某特定值。這種類型的

7、假設(shè)檢驗(yàn)就是左尾檢驗(yàn)(left-tailed test),其一對假設(shè)是從零假設(shè)成立出發(fā),確定一次抽樣幾乎不可能發(fā)生的小概率事件在以 為期望值的正態(tài)曲線左尾下面。如果 落入小概率事件范圍,則反過來認(rèn)定零假設(shè)不成立??傮w平均數(shù)與特定值差異的檢驗(yàn)( 已知)左尾檢驗(yàn)和右尾檢驗(yàn)合稱單尾檢驗(yàn)(one-tailed test)。下圖分別展示左尾檢驗(yàn)和右尾檢驗(yàn)的臨界值、拒絕域和接受域。左尾檢驗(yàn)圖右尾檢驗(yàn)圖左尾檢驗(yàn)的判定法則是:若 ,就拒絕 。右尾檢驗(yàn)的判定法則是: 若 ,就拒絕 。例42一制造商從供應(yīng)商那兒采購超薄金屬板,該供應(yīng)商長期以來所供產(chǎn)品總體平均厚度不低于15密爾,標(biāo)準(zhǔn)差1密爾。作為例行檢驗(yàn),制造商從

8、來貨中隨機(jī)抽取50張構(gòu)成樣本,進(jìn)行檢驗(yàn),以此判斷來貨總體平均厚度是否不低于15密爾(取顯著系數(shù)0.05)。要求寫出一對假設(shè),確立判定規(guī)則。若測得樣本平均厚度是14.982密爾,制造商當(dāng)作何結(jié)論?例43一家具制造商委托物流公司給客戶交運(yùn)所訂購的家具。物流公司長期確保運(yùn)達(dá)時間平均為14天,標(biāo)準(zhǔn)差4天。近來有的客戶向家具制造商抱怨不能按時收到貨物。制造商決定進(jìn)行檢測,于是從眾多運(yùn)送記錄中隨機(jī)抽取40票,看客戶抱怨是極偶然情況還是物流公司操作發(fā)生了問題(取顯著系數(shù)0.05)。要求寫出一對假設(shè),確立判定規(guī)則。若測得40票送貨平均時間是16天,制造商當(dāng)作出什么結(jié)論?假設(shè)檢驗(yàn)中的雙向風(fēng)險(xiǎn)和兩類錯誤假設(shè)檢驗(yàn)的

9、邏輯是:在零假設(shè)成立的前提下,樣本平均數(shù)落入臨界值之外是小概率事件(例如5%),在一次實(shí)驗(yàn)中幾乎不可能發(fā)生。如果一旦發(fā)生,就拒絕零假設(shè)。假設(shè)檢驗(yàn)中的雙向風(fēng)險(xiǎn)和兩類錯誤但是,“幾乎”不等于“絕對”。在零假設(shè)成立的前提下,樣本平均數(shù)仍然有5%的概率落入臨界值之外。即是說,當(dāng)依據(jù)判斷法則拒絕零假設(shè)時,決策者冒有犯否定真實(shí)零假設(shè)的風(fēng)險(xiǎn),其概率最多為5%。反之,若決策者依據(jù)判斷法則接受零假設(shè),也會冒肯定虛偽零假設(shè)的風(fēng)險(xiǎn)。于是,由零假設(shè)的自然狀態(tài)和決策者的判斷交叉,構(gòu)成了4種后果(見表4-1)。表41假設(shè)檢驗(yàn)的4種后果的自然狀態(tài)真?zhèn)螞Q策者的判斷拒絕 第種錯誤正確判斷接受 正確判斷第種錯誤假設(shè)檢驗(yàn)中的雙向風(fēng)

10、險(xiǎn)和兩類錯誤第種錯誤,即拒真錯誤,是 真前提下的拒絕它的錯誤。第種錯誤,即取偽錯誤,是 偽前提下的接受它的錯誤。由于 的自然狀態(tài)不為決策者所知,決策者無論做出何種判斷,都冒有犯錯誤的風(fēng)險(xiǎn)。顯著水平 規(guī)定了臨界值和拒絕域,因而也就是犯拒真錯誤的最大概率,因此在這個意義上 又稱為第種錯誤風(fēng)險(xiǎn)系數(shù),即假設(shè)檢驗(yàn)中的雙向風(fēng)險(xiǎn)和兩類錯誤取偽錯誤的概率在總體平均數(shù)真值 明確時可以計(jì)算出來。以 表示取偽錯誤的概率,則有在決策中總是先指定 ,即指定甘冒的拒真風(fēng)險(xiǎn)的概率。假設(shè)檢驗(yàn)中的雙向風(fēng)險(xiǎn)和兩類錯誤假設(shè)檢驗(yàn)的出發(fā)點(diǎn)是提出一對假設(shè)。對于是否存在差異的問題,總是把無差異設(shè)為零假設(shè),使其處于無據(jù)而立的位置。如果樣本數(shù)

11、據(jù)提供足夠的信息質(zhì)疑,則拒絕零假設(shè)。對于單尾檢驗(yàn),通常的掌握原則是不輕易懷疑一種常態(tài),亦不輕易肯定一種新論。如例4-2那樣,將供貨商來貨的合規(guī)性設(shè)為零假設(shè)。P值決策法P值檢驗(yàn)法從另外一個角度看待零假設(shè)是否可以被拒絕。以右尾檢驗(yàn)為例來說(見圖4.5),算得檢驗(yàn)統(tǒng)計(jì)量 ,可以進(jìn)一步求出概率 ,這就是任何一次抽樣中 不小于本次抽樣實(shí)際 的概率。此概率稱為P值。P值決策法如果P值小于指定的 ,即小于事先給定的小概率,那么就意味著在零假設(shè)為真的前提下發(fā)生了一個比事先給定的小概率還小的小概率事件,這當(dāng)然是不可能的,因此就可以拒絕 。反之,如果P值不小于指定的 ,則不能拒絕 。圖 右尾檢驗(yàn)的P值及其意義P值

12、決策法以上關(guān)于右尾檢驗(yàn)中P值運(yùn)用的邏輯也適用于左尾檢驗(yàn)和雙尾檢驗(yàn)。三種不同情況下P值的計(jì)算方法如下:左尾檢驗(yàn):P值=P (Z )右尾檢驗(yàn):P值=P (Z )雙尾檢驗(yàn):P值=2P (Z )P值決策法總之,一個小的P值,表明該樣本統(tǒng)計(jì)量提供足夠的信息支持備擇假設(shè);而一個大的P值,表明該樣本統(tǒng)計(jì)量不能提供足夠的信息支持備擇假設(shè);P值越小,則支持備擇假設(shè)的信心越強(qiáng)。至于所說P值的“小”和“大”,要和決策者愿意指定的 相比較。統(tǒng)計(jì)軟件只給出一個假設(shè)檢驗(yàn)?zāi)P偷腜值,拒絕還是接受 ,留待決策者判定??傮w平均數(shù)特定值的檢驗(yàn)( 未知)當(dāng)總體服從正態(tài)分布且總體方差未知時,若以樣本標(biāo)準(zhǔn)差代替未知的總體標(biāo)準(zhǔn)差計(jì)算抽樣

13、標(biāo)準(zhǔn)誤,則樣本平均數(shù)的標(biāo)準(zhǔn)化單位服從自由度為n-1的t分布。于是,在假設(shè)檢驗(yàn)中,檢驗(yàn)統(tǒng)計(jì)量按下式計(jì)算:在t分布下,也同樣有臨界值決策法和P值決策法兩種方法。例44一項(xiàng)用于招聘的智力測驗(yàn)被設(shè)計(jì)成使一般應(yīng)聘者所得分?jǐn)?shù)服從以100分為期望值的正態(tài)分布。20名應(yīng)聘者組成隨機(jī)樣本,經(jīng)測驗(yàn),平均分是121分,標(biāo)準(zhǔn)差是14分。按0.05顯著水平,這是否意味這些人來自一個非尋常的群體?例45電視機(jī)顯像管制造商長期以來采用的工藝生產(chǎn)的顯像管平均壽命值是4700小時。開發(fā)出了新工藝以期提高顯像管壽命,隨機(jī)抽取新產(chǎn)品100只,測得平均壽命是5000小時,標(biāo)準(zhǔn)差1460小時。問:在1%的顯著水平上可否得出新工藝優(yōu)于原

14、工藝的結(jié)論?又問:在5%的顯著水平上可否得出新工藝優(yōu)于原工藝的結(jié)論?總體平均數(shù)特定值的檢驗(yàn)( 未知)如果增大拒真風(fēng)險(xiǎn)概率,意味著將臨界值向靠近零假設(shè)值方向移動,就有可能改變對問題的判斷。這就是說:基于同樣的樣本信息,的變化可能導(dǎo)致結(jié)論的逆轉(zhuǎn)。1.總體比率與特定值差異的檢驗(yàn)2.總體方差與特定值差異的檢驗(yàn)第三節(jié) 其他關(guān)于參數(shù)特定值的檢驗(yàn)比率檢驗(yàn)和方差檢驗(yàn)總體比率與特定值差異的檢驗(yàn)與前述其他模型一樣,單一總體比率的檢驗(yàn)也有三種假設(shè)對子,分別是總體比率與特定值差異的檢驗(yàn)當(dāng)樣本足夠大n 5且n(1- )5時,樣本比率p服從正態(tài)分布 。由此可得出單一總體比率檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量標(biāo)準(zhǔn)化公式:例46中國移動通信集

15、團(tuán)北京有限公司在迅速提高網(wǎng)絡(luò)能力的同時,針對北京移動通信市場的特點(diǎn)和客戶的需要,建立了面向市場的營銷體系和售后服務(wù)體系。目前,“全球通”、“神州行”和“M-ZONE”已成為全國知名品牌。為了進(jìn)一步提高客戶對其提供的各項(xiàng)服務(wù)的滿意程度,中國移動展開了一系列的調(diào)研工作,旨在通過相關(guān)數(shù)據(jù)的統(tǒng)計(jì)分析了解影響客戶滿意程度的因素。從而采取針對性的措施改進(jìn)服務(wù),提高客戶滿意度。例46采用計(jì)算機(jī)輔助電話調(diào)查(CATI),以每家營業(yè)廳掌握的號碼作為抽樣框,提取最近1個月到訪100個營業(yè)廳辦理業(yè)務(wù)的用戶,隨即撥打,平均每家營業(yè)廳成功樣本約20個,共回收2000份有效問卷。問卷詢問影響客戶滿意度的營業(yè)廳地點(diǎn)方便與否

16、、排隊(duì)/排號等候時間、業(yè)務(wù)辦理快捷與否、營業(yè)時間方便與否、營業(yè)廳環(huán)境、營業(yè)員的整體表現(xiàn)等六大因素,測算與營業(yè)廳總體滿意度。2000個用戶的滿意率為91.3%。問:這一數(shù)據(jù)是否表明在總體上高于上年的90%滿意率?(顯著水平取0.05)總體方差與特定值差異的檢驗(yàn)樣本方差的抽樣分布如果從一個方差為 的正態(tài)總體中進(jìn)行相等容量的反復(fù)抽樣,樣本方差 這個隨機(jī)變量,按公式 處理后,就是 統(tǒng)計(jì)量,服從自由度為(n-1 )的 分布。即圖 分布總體方差與特定值差異的檢驗(yàn)樣本方差的抽樣分布 為非負(fù)變量,因此曲線只出現(xiàn)在第一象限。 分布是一族右偏分布,它的分布形狀和位置僅決定于唯一的參數(shù)自由度 ( =n-1)。在通常

17、情況下( 3),曲線自圓點(diǎn)開始上升,在 -2處達(dá)到高峰,然后逐漸下降,趨近于橫軸。隨著自由度的增大,偏斜度減緩,逐漸趨向正態(tài)分布。 函數(shù)自無窮大向左累計(jì)計(jì)算,如果給出 變量的具體取值,有唯一的概率值與之對應(yīng),這個概率值表現(xiàn)為曲線下自右側(cè)向左方向截取的面積??傮w方差與特定值差異的檢驗(yàn)樣本方差的抽樣分布EXCEL的CHIINV函數(shù)可以查取任意自由度的 曲線下截掉右尾面積為的值。查取 曲線下截掉左尾面積為的 值,相當(dāng)于查取同曲線下截掉自右累積面積為(1-)的 值。EXCEL的CHIDIST函數(shù)則可以查取任意自由度的 曲線下 值截掉的右尾面積??傮w方差與特定值差異的檢驗(yàn)總體方差的假設(shè)檢驗(yàn)關(guān)于 的假設(shè)檢

18、驗(yàn),其方法與關(guān)于 的假設(shè)檢驗(yàn)相似,如果用 表示總體方差的假設(shè)值,那么適用于本檢驗(yàn)的卡方檢驗(yàn)統(tǒng)計(jì)量是總體方差與特定值差異的檢驗(yàn)總體方差的假設(shè)檢驗(yàn)如欲用樣本信息支持總體方差小于 的陳述,則使用左尾檢驗(yàn),所提出的一對假設(shè)為相應(yīng)的判定法則是: 若 , 則拒絕 。總體方差與特定值差異的檢驗(yàn)總體方差的假設(shè)檢驗(yàn)如欲用樣本信息支持總體方差大于 的陳述,則使用右尾檢驗(yàn),應(yīng)提出的一對假設(shè)是相應(yīng)的決策規(guī)則是: 若 , 則拒絕 ??傮w方差與特定值差異的檢驗(yàn)總體方差的假設(shè)檢驗(yàn)如欲用樣本信息支持總體方差有別于 的陳述,則使用雙尾檢驗(yàn),應(yīng)提出的一對假設(shè)是相應(yīng)的決策規(guī)則是: 若 或 , 則拒絕 。例47對于某設(shè)備上的許多同種

19、易損件,已算出若其使用壽命的標(biāo)準(zhǔn)差在6天以內(nèi),定期一次全部更換較為經(jīng)濟(jì);否則還是隨壞隨換較為經(jīng)濟(jì)。對這些易損件進(jìn)行抽樣調(diào)查,樣本容量為71,測得使用壽命標(biāo)準(zhǔn)差是4.2天。試以1%的顯著水平進(jìn)行假設(shè)檢驗(yàn),看看一次全部更換這些易損件是否更經(jīng)濟(jì)?例48存貨控制中一個需要考慮的重要因素就是日需求量的方差。經(jīng)理們相信某商品的需求量服從方差為250(箱)的正態(tài)分布。為了檢驗(yàn)這一想法是否正確,對25天的日需求量進(jìn)行了分析,得到下述結(jié)論: =1265 =76010問上述數(shù)據(jù)是否能提供足夠的跡象來支持經(jīng)理們對日需求量方差的陳述?(取 =0.01)1.兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)2.兩總體平均數(shù)間差異的檢

20、驗(yàn)(獨(dú)立樣本)第四節(jié) 兩總體平均數(shù)的差異性檢驗(yàn)兩總體平均數(shù)之間是否存在差異的檢驗(yàn),需要通過兩總體中分布抽取隨機(jī)樣本來做。根據(jù)檢驗(yàn)?zāi)康模瑑蓸颖究梢允桥鋵?,也可以是相互?dú)立的。相互獨(dú)立的兩樣本又分為幾種情況。不同的樣本關(guān)系和不同的檢驗(yàn)前設(shè),其具體檢驗(yàn)?zāi)P鸵膊煌?。下圖給出本節(jié)問題的展開路徑。圖 雙樣本檢驗(yàn)路徑兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)本小節(jié)的檢驗(yàn)方法,通過對研究對象進(jìn)行配對,事前對可能干擾實(shí)驗(yàn)手段效果的各種因素加以控制,專門測定作用于實(shí)驗(yàn)對象的兩種不同處置類型或級次能否產(chǎn)生不同的效果。兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)配對有兩種設(shè)計(jì):一種是橫向配對,即按著多項(xiàng)因素基本相同的原則將樣本單元

21、分成相匹配的兩個子樣本,然后對它們施以不同的處置,檢驗(yàn)兩個子樣本的受刺激變量的平均數(shù)是否存在顯著差別,以此判斷處置的有效性。此種情況下,我們把兩個子樣本看作是分別抽自兩個接受不同處置的次總體。另一種是縱向配對,即比較樣本平均數(shù)在處置前后是否存在顯著差別。此種情況下,我們把處置前后的樣本看作是分別抽自沒接受和接受處置的兩個次總體。兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)配對檢驗(yàn)的思路是先求出各對觀察值之差 。記 ( i1,2,n )分別表示成對的觀察值,一共有 n對。則 。將d 視為一個新的隨機(jī)變量,檢驗(yàn) d的總體平均數(shù) 是否為0。兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)配對檢驗(yàn)雙尾模型的一對假設(shè)是配對

22、檢驗(yàn)單尾模型的一對假設(shè)是兩總體平均數(shù)間差異的檢驗(yàn)(配對樣本)配對檢驗(yàn)的具體方法還是比較樣本統(tǒng)計(jì)量與零假設(shè)參數(shù)值是否存在顯著差異。在這當(dāng)中需要用 d的樣本標(biāo)準(zhǔn)差作為其總體標(biāo)準(zhǔn)差的無偏估計(jì)量。d的平均數(shù) 和標(biāo)準(zhǔn)差 分別由下面兩式算出配對檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量(自由度為 1)例48題目略.例題數(shù)據(jù)例4-8.xlsEXCEL的“數(shù)據(jù)分析”工具條中有“t-檢驗(yàn): 成對雙樣本均值分析”工具,可以支持這樣的檢驗(yàn)。兩總體平均數(shù)間差異的檢驗(yàn)(獨(dú)立樣本)本小節(jié)面對的是樣本數(shù)據(jù)獨(dú)立抽自兩個平均數(shù)分別為 的分布總體。根據(jù)檢驗(yàn)?zāi)康模謩e有下面三種假設(shè)對子:兩總體平均數(shù)間差異的檢驗(yàn)(獨(dú)立樣本)分別從具有參數(shù) 、 和 、 的兩總

23、體中抽取樣本量為 和 的所有可窮盡樣本。如果兩總體服從正態(tài)分布,或者分布形態(tài)雖不明確但樣本容量足夠大,則 分別服從正態(tài)分布 和 。兩總體平均數(shù)間差異的檢驗(yàn)(獨(dú)立樣本)如果兩樣本彼此獨(dú)立,則合成隨機(jī)變量 服從一個新的正態(tài)分布,其期望值和方差分別由下面兩式確定兩總體平均數(shù)間差異的檢驗(yàn)(獨(dú)立樣本)兩總體方差已知或方差未知大樣本兩總體方差未知小樣本(同方差)兩總體方差未知小樣本(異方差)兩總體方差已知或方差未知大樣本如果兩總體方差已知,檢驗(yàn)統(tǒng)計(jì)量是若兩總體方差未知,只要兩個樣本容量都足夠大,這種情況下, 的抽樣分布服從(或近似服從)正態(tài)分布,可以用樣本方差計(jì)算檢驗(yàn)統(tǒng)計(jì)量例410為了判定兩個社會培訓(xùn)機(jī)構(gòu)

24、舉辦同樣培訓(xùn)項(xiàng)目的教學(xué)效果是否存有差別,從一個標(biāo)準(zhǔn)考試的成績中分別抽取一部分學(xué)員的成績作為樣本。甲機(jī)構(gòu)抽取了30名,乙機(jī)構(gòu)抽取了40名,具體分?jǐn)?shù)如下:.例題數(shù)據(jù)例4-10.xls根據(jù)以上數(shù)據(jù),是否可以認(rèn)為兩機(jī)構(gòu)教學(xué)效果存有差別?(取顯著水平0.05)EXCEL的“數(shù)據(jù)分析”工具條中有“z-檢驗(yàn):雙樣本平均差檢驗(yàn)”工具,可以支持這一檢驗(yàn)。如果需要用兩樣本方差替代兩總體方差,就在對話框中提問總體方差處輸入樣本方差。兩總體平均數(shù)間差量的估計(jì)(方差已知或方差未知大樣本)根據(jù)上面闡述的隨機(jī)變量 的分布規(guī)律和公式,可以對兩總體平均數(shù)間差異進(jìn)行參數(shù)估計(jì)。直接以 作為 的點(diǎn)估計(jì)量,而用下式確定它的置信下限和和

25、上限:兩總體平均數(shù)間差量的估計(jì)(方差已知或方差未知大樣本)在方差未知大樣本情況下,可以用兩樣本方差分別代替以上兩式中的總體方差。兩總體平均數(shù)差量置信區(qū)間既可以為估計(jì)參數(shù)而用,也可以作為假設(shè)檢驗(yàn)的替代方法。若所得置信下限和置信上限在數(shù)軸0點(diǎn)的同一側(cè),就應(yīng)拒絕兩總體平均數(shù)無差異的零假設(shè);反之,若所構(gòu)建的置信區(qū)間包含0點(diǎn),則不能拒絕兩總體平均數(shù)無差異的零假設(shè)。兩總體方差未知小樣本(同方差)如果樣本來自的兩個總體都服從正態(tài)分布,且兩總體方差未知,分別以相應(yīng)的兩個樣本方差代替它們計(jì)算檢驗(yàn)統(tǒng)計(jì)量,在小樣本情況下,該檢驗(yàn)統(tǒng)計(jì)量服從 t分布,即 兩總體方差未知小樣本(同方差)如果有信息表明兩未知總體方差相等,

26、其無偏估計(jì)量 可以通過對兩樣本方差加權(quán)平均取得 稱 為合并估計(jì)量(pooled estimator)。則有檢驗(yàn)中以( )為自由度。例411對美國紐約股票交易所和納斯達(dá)克股票交易所某日分別進(jìn)行隨機(jī)抽樣,記錄其個股的收益率。.例題數(shù)據(jù)例4-11.xls取顯著水平0.05,能否認(rèn)為兩個股票交易所收益率平均數(shù)在總體上相等?EXCEL的“數(shù)據(jù)分析”工具條中有“t-檢驗(yàn):雙樣本等方差假設(shè)”工具,可以支持這一檢驗(yàn)。兩總體方差未知小樣本(異方差)異方差情況下不再計(jì)算合并估計(jì)量 ,直接使用公式 ,但自由度需要按下式求出EXCEL的“數(shù)據(jù)分析”工具條中有“t-檢驗(yàn):雙樣本異方差假設(shè)”工具,可以支持這一檢驗(yàn)。兩總體

27、平均數(shù)間差異的檢驗(yàn)(獨(dú)立樣本)截止到此,本章講述的兩總體平均數(shù)間差異檢驗(yàn)方法,所提出零假設(shè)都是兩者無差別( ),其實(shí)這個平均數(shù)差量也可以假設(shè)為0以外的任何特定值( )。EXCEL的“數(shù)據(jù)分析”工具條中的四個工具的對話框內(nèi)都有“假設(shè)平均差”一欄待回答,它可以是0,也可以輸入0以外的任何特定值。例411為了展示0以外的任何特定值的檢驗(yàn),我們審視例4-11的樣本平均數(shù):從樣本數(shù)據(jù)來看,甲機(jī)構(gòu)的平均分?jǐn)?shù)至少比乙機(jī)構(gòu)高出4分。那么我們提出新的問題是:在0.05的顯著水平上可否認(rèn)為甲機(jī)構(gòu)的總體平均分?jǐn)?shù)比乙機(jī)構(gòu)高出2分?.例題數(shù)據(jù)例4-11.xls1.兩總體比率間差異的檢驗(yàn)2.兩總體方差間差異的檢驗(yàn)第五節(jié)

28、其他關(guān)于兩總體的差異性檢驗(yàn)比率差和方差比檢驗(yàn)兩總體比率間差異的檢驗(yàn)兩總體比率間差異的檢驗(yàn)( - )的期望值是它的方差是兩個樣本比率的差幅按下述公式化成標(biāo)準(zhǔn)正態(tài)單位:兩總體比率間差異的檢驗(yàn)通常情況下,我們希望判定 與 是否相等或它們中某一個是否大于另一個,其假設(shè)分別有下述三種形式:雙尾檢驗(yàn)左尾檢驗(yàn)右尾檢驗(yàn)兩總體比率間差異的檢驗(yàn)無論是哪種形式,在零假設(shè)中都有 = 的含義。于是,我們就用一個協(xié)同的比率估計(jì)值取代公式中的 和 。這個協(xié)同的比率估計(jì)值用 表示。它的計(jì)算方法和兩總體平均數(shù)間差異檢驗(yàn)所用的協(xié)同的方差估計(jì)值一樣,用的是加權(quán)平均法,具體公式如下:兩總體比率間差異的檢驗(yàn)檢驗(yàn)估計(jì)量的公式就化成:例4

29、12中國移動通信集團(tuán)北京有限公司的營業(yè)廳滿意率調(diào)查還取得了分年齡段的數(shù)據(jù)。其中共調(diào)查887人,滿意率為91.3%;2634歲共調(diào)查634人,滿意率為90.7%。 問:在5%顯著水平上可否認(rèn)為1525歲滿意率在總體上高于2634歲的滿意率?兩總體比率差幅的區(qū)間估計(jì)(大樣本)直接以 作為 的點(diǎn)估計(jì)量,而用下式確定它的置信下限和和上限:兩總體比率差幅的區(qū)間估計(jì)(大樣本)兩總體比率差幅置信區(qū)間既可以為估計(jì)參數(shù)而用,也可以作為假設(shè)檢驗(yàn)的替代方法。若所得置信下限和置信上限在數(shù)軸0點(diǎn)的同一側(cè),就應(yīng)拒絕兩總體比率無差異的零假設(shè);反之,若所構(gòu)建的置信區(qū)間包含0點(diǎn),則不能拒絕兩總體比率無差異的零假設(shè)。兩總體方差間

30、差異的檢驗(yàn)F分布兩總體方差間差異的檢驗(yàn)兩總體方差間差異的單尾檢驗(yàn)F分布兩總體方差之間差異的推斷與關(guān)注的是兩者比值 。兩者無差異,則比值為1;否則或大于或小于1。F分布若兩總體都服從正態(tài)分布,從中抽取容量分別為 的兩個獨(dú)立樣本,則樣本方差比值 與總體方差比值 的關(guān)系可以用F統(tǒng)計(jì)量刻畫,具體如下F分布F分布具有兩個參數(shù): 是分子的自由度, 是分母的自由度。隨 和 分別取不同數(shù)值,F(xiàn)分布構(gòu)成了一個曲線族。當(dāng) 和 較小時,F(xiàn)分布向右偏斜。隨著 和 自由度的增大,F(xiàn)分布逼近正態(tài)分布。不同自由度的F曲線圖F曲線兩尾面積及對應(yīng)的F值圖F分布EXCEL的FINV函數(shù)可以查取任意 和 自由度組合的F曲線下截掉右

31、尾面積為的F值。查取F曲線下截掉左尾面積為的F值,相當(dāng)于查取同曲線下截掉自右累積面積為1-的F值。EXCEL的FDIST函數(shù)則可以查取任意 和 自由度組合的F曲線下F值截掉的右尾面積。兩總體方差間差異的檢驗(yàn)兩總體方差間差異檢驗(yàn)也有雙尾、左尾和右尾之分。假設(shè)對子分別表述為雙尾檢驗(yàn)左尾檢驗(yàn)右尾檢驗(yàn)兩總體方差間差異的檢驗(yàn)因?yàn)榱慵僭O(shè)中都含有 的表述,所以檢驗(yàn)統(tǒng)計(jì)量 就簡化成 ,簡寫 為 。雙尾檢驗(yàn)拒絕 。例413恒昌機(jī)械廠制作電動腳踏車,所用馬達(dá)歷來從甲廠購入?,F(xiàn)有乙廠向恒昌推出其馬達(dá),稱質(zhì)量與甲廠相同但是價(jià)格低于甲廠。恒昌考慮兩廠產(chǎn)品的使用壽命如果一樣長,即可購買乙廠產(chǎn)品。為檢測兩廠馬達(dá)的使用壽命,

32、恒昌從兩廠馬達(dá)中各隨機(jī)抽取30臺,進(jìn)行實(shí)驗(yàn)檢測: 按0.05是顯著水平,根據(jù)抽樣檢測數(shù)據(jù)能否得出兩廠馬達(dá)的使用壽命方差相等的結(jié)論? 又問:根據(jù)上述結(jié)論,我們可以進(jìn)一步檢驗(yàn)兩廠馬達(dá)使用壽命平均數(shù)是否相等(仍按0.05顯著系數(shù))。兩總體方差間差異的單尾檢驗(yàn)關(guān)于兩總體方差間差異的假設(shè)檢驗(yàn)的模型還有右尾檢驗(yàn)和左尾檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量仍是 。右尾檢驗(yàn)拒絕 。在實(shí)際問題中,總是用較大的樣本方差去除以較小的樣本方差得到方差比,所以只使用右尾檢驗(yàn)。左尾檢驗(yàn)的道理同此,但多不使用。第六節(jié) 多總體平均數(shù)齊一性檢驗(yàn):方差分析多總體平均數(shù)齊一性檢驗(yàn):方差分析多總體平均數(shù)齊一性檢驗(yàn):方差分析本檢驗(yàn)的意義在于,判定一種作用于

33、受試對象的因素對各個總體的集中趨勢是否有顯著影響。這個因素具有不同的狀態(tài)水平表現(xiàn)為定名數(shù)據(jù)或定秩數(shù)據(jù)稱為處置(treatment)。“處置”一詞,泛指作用于被研究對象,為研究者感興趣的外界可控因素。換言之,多總體平均數(shù)齊一性檢驗(yàn)就是判定不同的處置是否會產(chǎn)生不同的結(jié)果。例414 一調(diào)查公司欲比較三家航空公司的服務(wù)滿意情況。它對積分達(dá)到一定點(diǎn)數(shù)的老客戶進(jìn)行抽樣調(diào)查,請他們?yōu)槿液娇展径即蚍郑?=最不滿意,100=最滿意),打分結(jié)果記入表7.2 。若取 =0.05,試檢驗(yàn)三家航空公司服務(wù)滿意得分在總體上是否不同。.例題數(shù)據(jù)例4-14.xls多總體平均數(shù)齊一性檢驗(yàn):方差分析用樣本間方差來描述樣本平均

34、數(shù)間的變異程度。這一方差的分子部分稱作列間平方和(between-column sum of squares),又叫處置平方和(treatment sum of squares),其計(jì)算公式是: SSC=多總體平均數(shù)齊一性檢驗(yàn):方差分析處置間方差在方差分析中的正式名稱是列間均方和(between-column mean squares)或處置均方和(treatment mean squares),其計(jì)算公式是: MSC=多總體平均數(shù)齊一性檢驗(yàn):方差分析測定處置內(nèi)差異的量數(shù)是樣本內(nèi)方差。它的分子部分是列內(nèi)平方和(within-column sum of squares),或者叫誤差平方和(error sum of squares),公式是: 多總體平均數(shù)齊一性檢驗(yàn):方差分析處置內(nèi)方差在方差分析中的正式名稱是列間均方和(within -column mean squares)或誤差均方和(error mean squares),其計(jì)算公式是:多總體平均數(shù)齊一性檢驗(yàn):方差分析用MSC對MSE的比值來判定零假設(shè)是否成立。這個比率作為隨機(jī)變量,服從以(k-1)為分子自由度,以(n-k)為分母自由度的F分布。即多總體平均數(shù)齊一性檢驗(yàn)原理多總體平均數(shù)齊一性檢驗(yàn)的一般假設(shè)是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論