




已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
作業(yè)中的一些錯(cuò)誤情況1:解題過(guò)程不完整,沒(méi)有明確指出所檢驗(yàn)的假設(shè)和檢驗(yàn)統(tǒng)計(jì)量。2:算錯(cuò)檢驗(yàn)統(tǒng)計(jì)量的值,或算錯(cuò)檢驗(yàn)的p值。(P27Ex2)解法一:總體總共分3類(lèi),要檢驗(yàn)顧客是否對(duì)這三種肉食的喜好程度相同,這是一個(gè)分布的擬合優(yōu)度檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為 :顧客對(duì)這三種肉食的喜好程度相同,即要檢驗(yàn):顧客對(duì)這三種肉食的喜好程度的分布為,(2)取檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為; (3)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)(4)計(jì)算P值為: ,故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該均勻分布.解法二(采用似然比檢驗(yàn)+p值形式)(1)要檢驗(yàn)的原假設(shè)為 :顧客對(duì)這三種肉食的喜好程度相同,即要檢驗(yàn):顧客對(duì)這三種肉食的喜好程度的分布為,(2)選取似然比檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為;(3)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)(4)計(jì)算P值為: ,故在水平下拒絕,即顧客對(duì)這三種肉食的喜好程度的分布不是均勻分布.注:若顯著性水平取,則臨界值為。(P27Ex3)解法一:總體總共分10類(lèi),這是一個(gè)分布的擬合優(yōu)度檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為:學(xué)生對(duì)這十門(mén)課的選擇沒(méi)有傾向性,即要檢驗(yàn):學(xué)生選擇這十門(mén)課的人數(shù)分布為,(2)取檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為; (3)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)(4)計(jì)算P值為: ,故在水平下不能拒絕,即認(rèn)為學(xué)生對(duì)這十門(mén)課的選擇沒(méi)有傾向性.解法二(采用似然比檢驗(yàn)+ p值形式)(1)要檢驗(yàn)的原假設(shè)為:學(xué)生對(duì)這十門(mén)課的選擇沒(méi)有傾向性,即要檢驗(yàn):學(xué)生選擇這十門(mén)課的人數(shù)分布為。(2)選取似然比檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為; (3)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)(4)計(jì)算P值為: ,故在水平下不能拒絕,即認(rèn)為學(xué)生對(duì)這十門(mén)課的選擇沒(méi)有傾向性.注:若采用拒絕域法,臨界值為。(P27Ex4)解法一:(采用卡方擬合優(yōu)度檢驗(yàn)法+拒絕域形式)(一)總體總共分3類(lèi),這是一個(gè)不含未知參數(shù)的分布檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為:股票投資的盈虧分布為,統(tǒng)計(jì)得到的頻數(shù)分別為1697,1780,2129。(2)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值為,(4)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.(二)總體總共分3類(lèi),這是一個(gè)不含未知參數(shù)的分布檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)仍為:股票投資的盈虧分布為,統(tǒng)計(jì)得到的頻數(shù)分別為151+122,240,517+240。(2)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值為,(4)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.解法二:(采用似然比檢驗(yàn)法+拒絕域形式) (一)總體總共分3類(lèi),這是一個(gè)不含未知參數(shù)的分布檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為:股票投資的盈虧分布為,統(tǒng)計(jì)得到的頻數(shù)分別為1697,1780,2129。(2)選取似然比檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值為,(4)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.(二)總體總共分3類(lèi),這是一個(gè)不含未知參數(shù)的分布檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)仍為:股票投資的盈虧分布為,統(tǒng)計(jì)得到的頻數(shù)分別為273,240,757。(2)選取似然比檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值為,(4)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即調(diào)查數(shù)據(jù)不符合該偏好分布.注1:有同學(xué)混淆了兩種解法(卡方擬合優(yōu)度檢驗(yàn)法與似然比檢驗(yàn)法)的記號(hào)與稱呼。注2:本題中兩種方法得到的檢驗(yàn)統(tǒng)計(jì)量的值相差很大。(P28Ex5)解法一:(卡方擬合優(yōu)度檢驗(yàn))總體總共分3類(lèi),分布中有1個(gè)未知參數(shù),這是一個(gè)含參數(shù)的分布檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為:紅、白、粉紅色花的分布為,其中。(2)先在為真時(shí),似然函數(shù)為取對(duì)數(shù)得求關(guān)于的導(dǎo)數(shù),并令之為0得對(duì)數(shù)似然方程為:解得的極大似然估計(jì)值為(3)算出的分布列中的極大似然估計(jì)值;。(4)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值為,(6)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注:有同學(xué)誤認(rèn)為檢驗(yàn)的臨界值為。解法二:(采用似然比檢驗(yàn))(1) (2) (3)步驟同上。(4)算出無(wú)假定條件下諸的極大似然估計(jì):,(5)選取似然比檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?6)對(duì)顯著性水平,臨界值為,(7)則檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注:p值(P28Ex6)解法一:(卡方擬合優(yōu)度檢驗(yàn))總體總共分4類(lèi),分布中有2個(gè)參數(shù),這是一個(gè)含參數(shù)的分布擬合檢驗(yàn)問(wèn)題。(1)要檢驗(yàn)的原假設(shè)為:人的血型分布為,其中(2)先在為真時(shí),算出似然函數(shù)在約束條件下,取,化似然函數(shù)為無(wú)約束二元函數(shù):取對(duì)數(shù)得注意到用微分法很難求出極大似然估計(jì)值的精確解,我們考慮近似計(jì)算。首先由“O”型和“B”型兩類(lèi)的矩估計(jì)算出參數(shù)向量的初始估計(jì):然后參照課本25頁(yè)利用EXCEL算得的極大似然估計(jì)值(3)算出諸的極大似然估計(jì)值;且在為真時(shí),對(duì)數(shù)似然函數(shù)的最大值為。(4)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值為,(6)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.解法二:(采用似然比檢驗(yàn))(1) (2) (3)步驟同上。(4)算出無(wú)假定條件下諸的極大似然估計(jì):,(5)選取似然比檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?6)對(duì)顯著性水平,臨界值為,(7)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為(計(jì)算過(guò)程略)故在水平下不能拒絕,即調(diào)查數(shù)據(jù)符合該偏好分布.注1:本題中極大似然估計(jì)值的精確解很難得到,采用迭代法進(jìn)行近似計(jì)算,計(jì)算量大,要使用軟件進(jìn)行計(jì)算,而且要確定未知參數(shù)向量的迭代初始值。由于實(shí)際未知參數(shù)只有兩個(gè),需要建立兩個(gè)方程用于給出迭代初始值。一個(gè)很自然的考慮是利用諸的矩估計(jì)(也就是無(wú)假定條件下諸的極大似然估計(jì))可建立四個(gè)方程:為方便,關(guān)鍵是選擇哪兩個(gè)變量,和選擇哪兩個(gè)方程來(lái)建立方程組,計(jì)算用于迭代的初始值。本題中,我們選擇了變量,選擇了方程。注2: 無(wú)假定條件下似然函數(shù)對(duì)數(shù)似然函數(shù)的最大值為注:p值(P68Ex1)解:(本題是單邊檢驗(yàn),采用四格表的U檢驗(yàn)法)(1)建立四格表正常數(shù)病例數(shù)合計(jì)人數(shù)處理組20068857200745對(duì)照組201087142201229合計(jì)401775199401974(2)記概率P(正常|處理組),P(正常|對(duì)照組),疫苗有效是指,所以本題是要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即疫苗有效.注1:假設(shè)檢驗(yàn)的第一步是建立假設(shè),要正確建立原假設(shè),并且要正確建立備擇假設(shè)!對(duì)于備擇假設(shè),具體場(chǎng)合下要能正確區(qū)分 “雙邊檢驗(yàn)”與“單邊檢驗(yàn)”。(P68Ex3)解法一:(本題是單邊檢驗(yàn),采用四格表的U檢驗(yàn)法)(1)建立四格表長(zhǎng)勢(shì)良好長(zhǎng)勢(shì)不好合計(jì)A種肥料5347100B種肥料783117900合計(jì)8361641000(2)記概率P(長(zhǎng)勢(shì)良好|施A種肥料), P(長(zhǎng)勢(shì)良好|施B種肥料),B種肥料效果顯著的好是指,所以本題是要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即B種肥料效果顯著的好.解法二:(本題是單邊檢驗(yàn),采用修正的四格表的U檢驗(yàn)法)(1)建立四格表長(zhǎng)勢(shì)良好長(zhǎng)勢(shì)不好合計(jì)A種肥料5347100B種肥料783117900合計(jì)8361641000(2)記概率P(長(zhǎng)勢(shì)良好|施A種肥料), P(長(zhǎng)勢(shì)良好|施B種肥料),B種肥料效果顯著的好是指,所以本題是要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即B種肥料效果顯著的好.注1:本題中的樣本量比較大,故是否使用連續(xù)性修正,和似乎差異不大。一般樣本容量比較大時(shí)不必使用連續(xù)性修正。注2:本題應(yīng)采用單邊檢驗(yàn),所以不能使用卡方檢驗(yàn)!(P68Ex4)解法一:(本題是雙邊檢驗(yàn),采用四格表的U檢驗(yàn)法)(1)建立四格表有自殺情緒無(wú)自殺情緒合計(jì)精神病患者32225神經(jīng)病患者91625合計(jì)123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為因?yàn)椋试谒较戮芙^,即兩比例不相等.解法二:(本題是雙邊檢驗(yàn),采用四格表的卡方檢驗(yàn)法)(1)建立四格表有自殺情緒無(wú)自殺情緒合計(jì)精神病患者32225神經(jīng)病患者91625合計(jì)123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即兩比例不相等.解法三:(本題是雙邊檢驗(yàn),采用四格表的似然比檢驗(yàn)法)(1)建立四格表有自殺情緒無(wú)自殺情緒合計(jì)精神病患者32225神經(jīng)病患者91625合計(jì)123850(2)記精神病患者有自殺情緒的比例,神經(jīng)病患者有自殺情緒的比例,本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即兩比例不相等.注1:拒絕域要與假設(shè)配套,主要看備擇假設(shè)!本題是雙邊檢驗(yàn),U檢驗(yàn)的拒絕域也應(yīng)是雙邊形式的,不能再象P68ex1那樣用單邊形式的拒絕域!具體場(chǎng)合下要能正確區(qū)分 “雙邊檢驗(yàn)”與“單邊檢驗(yàn)”。注2:考慮到本題中的樣本量比較小,特別有的格子里的值為3(都小于5了?。适褂眠B續(xù)性修正似乎更好些。采用四格表的修正的卡方檢驗(yàn)法(解法四),則(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下不能拒絕,即兩比例相等.有意思的是,這時(shí)候得出了相反的結(jié)論!注3:SPSS軟件能很方便地計(jì)算四格表獨(dú)立性雙邊檢驗(yàn)的幾種檢驗(yàn)統(tǒng)計(jì)量和p值,下列為本題的SPSS卡方檢驗(yàn)的程序輸出??ǚ綑z驗(yàn)值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方3.947a1.047連續(xù)校正b2.7411.098似然比4.0911.043Fisher 的精確檢驗(yàn).095.048有效案例中的 N50a. 0 單元格(.0%) 的期望計(jì)數(shù)少于 5。最小期望計(jì)數(shù)為 6.00。b. 僅對(duì) 2x2 表計(jì)算(P71Ex12)本題是一個(gè)著名的心理學(xué)實(shí)驗(yàn)。解:(本題不妨取單邊檢驗(yàn),采用四格表的U檢驗(yàn)法)分兩方面進(jìn)行分析:種口味是否比6種口味更能吸引顧客試吃?種口味是否比6種口味更能吸引顧客購(gòu)買(mǎi)?另外,數(shù)據(jù)計(jì)算上注意到:,。(一)種口味是否比6種口味更能吸引顧客試吃?(1)建立四格表顧客試吃顧客未試吃合計(jì)種口味145972426種口味104156260合計(jì)249253502(2)記概率P(顧客試吃|種口味),P(顧客試吃|6種口味),現(xiàn)在要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即種口味比6種口味更能吸引顧客試吃.(二)種口味是否比6種口味更能吸引顧客購(gòu)買(mǎi)?(1)建立四格表顧客購(gòu)買(mǎi)顧客未購(gòu)買(mǎi)合計(jì)種口味42382426種口味31229260合計(jì)35467502(2)記概率P(顧客購(gòu)買(mǎi)|種口味),P(顧客購(gòu)買(mǎi)|6種口味),現(xiàn)在要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下接受,即種口味沒(méi)能比6種口味更能吸引顧客購(gòu)買(mǎi).(三)進(jìn)一步考察種口味是否比6種口味更能吸引顧客購(gòu)買(mǎi)?考慮改成要檢驗(yàn)假設(shè) ,(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即種口味吸引顧客購(gòu)買(mǎi)的比例竟然顯著低于6種口味吸引顧客購(gòu)買(mǎi)的比例.這似乎有點(diǎn)奇怪,不過(guò)仔細(xì)想來(lái),符合生活中的實(shí)際情況。注1:關(guān)于本題的背景:果醬實(shí)驗(yàn)選擇不是越多越好?有選擇比沒(méi)選擇好,選擇多比選擇少好,這幾乎成了人們生活中的常識(shí)。但實(shí)際情況并非如此。紐約哥倫比亞大學(xué)的研究人員希娜延加開(kāi)展自己的實(shí)驗(yàn),研究發(fā)現(xiàn),如果讓消費(fèi)者選擇在6種還是24種果醬中挑選一種時(shí),人們都愿意有更多的選擇??墒钦嬲龥Q定購(gòu)買(mǎi)的時(shí)候,在6種果醬中選擇的人們作出的購(gòu)買(mǎi)決定,是在24種果醬中選擇的人作出購(gòu)買(mǎi)決定的10倍。實(shí)驗(yàn)是在加州斯坦福大學(xué)附近的一個(gè)以食品種類(lèi)繁多而聞名的超市中進(jìn)行的。工作人員在超市里設(shè)置了兩個(gè)試吃攤位,一個(gè)有種口味的果醬,另一個(gè)有種口味的果醬。結(jié)果顯示有種口味的攤位吸引的顧客較多:242位經(jīng)過(guò)的客人中,60會(huì)停下來(lái)試吃,而260個(gè)經(jīng)過(guò)種口味的攤位的客人中,停下來(lái)試吃的只有40。不過(guò)最終的結(jié)果卻出乎人們的意料:在有種口味的攤位前停下的顧客中有30的人都至少買(mǎi)了一瓶果醬,而在有種口味的攤位前停下試吃者中只有3的人購(gòu)買(mǎi)了果醬。看來(lái)過(guò)多選項(xiàng)也不見(jiàn)得是一件好事,它會(huì)使人們陷入游移不定的狀態(tài)。注2:考察種口味是否比6種口味更能吸引顧客購(gòu)買(mǎi)時(shí),有同學(xué)采用的假設(shè)檢驗(yàn)如下:記概率P(顧客購(gòu)買(mǎi)|試吃種口味),P(顧客購(gòu)買(mǎi)|試吃6種口味),現(xiàn)在要檢驗(yàn)假設(shè) (P69Ex5)分析:記左半球中有良性腫瘤的比例,右半球中有良性腫瘤的比例,本題要檢驗(yàn)假設(shè)注意到四個(gè)格子中有三個(gè)格子的頻數(shù)小于5,顯然這是一個(gè)小樣本的場(chǎng)合,所以題目要求采用Fisher精確檢驗(yàn)法進(jìn)行檢驗(yàn)。解:(Fisher精確檢驗(yàn)法)(1)記左半球中有良性腫瘤的比例,右半球中有良性腫瘤的比例,本題要檢驗(yàn)假設(shè)(2)采用Fisher精確檢驗(yàn)法,即取超幾何分布為檢驗(yàn)分布,檢驗(yàn)的p值為,(3)題中,并注意到題中,故檢驗(yàn)的p值為因?yàn)?,故在水平下不能拒絕,即認(rèn)為兩比例相等.注1:有同學(xué)未按照題目要求解題,題目要求采用Fisher精確檢驗(yàn)法,但仍有同學(xué)采用單邊的U檢驗(yàn)法甚至采用雙邊的卡方檢驗(yàn)。注2:在計(jì)算出p值后,有不少同學(xué)給出的檢驗(yàn)結(jié)論是錯(cuò)誤的。P值是要和檢驗(yàn)水平比較的:當(dāng)P值小時(shí),不能拒絕原假設(shè),即認(rèn)為兩比例相等.注3:計(jì)算P(HG(N,M,n)=k),可調(diào)用Excel中的函數(shù)HYPGEOMDIST(sample_s,number_sample,population_s,number_population)=HYPGEOMDIST(k;n,M,N)注4:下表中有其他幾種方法的檢驗(yàn)結(jié)果,由于是小樣本,可以看到,連續(xù)性校正的效果與精確檢驗(yàn)一致。又問(wèn)為何下表中精確檢驗(yàn)的雙側(cè)p值與單側(cè)p值差不多? 卡方檢驗(yàn)值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方3.200a1.074連續(xù)校正b1.4221.233似然比3.1751.075Fisher 的精確檢驗(yàn).118.118有效案例中的 N16a. 3 單元格(75.0%) 的期望計(jì)數(shù)少于 5。最小期望計(jì)數(shù)為 1.50。b. 僅對(duì) 2x2 表計(jì)算(P69Ex7)解法一:(Fisher精確檢驗(yàn)法)(1)將這個(gè)人隨機(jī)猜測(cè)作為原假設(shè),將有品酒能力作為備擇假設(shè)。即記,本題要檢驗(yàn)假設(shè)(2)采用Fisher精確檢驗(yàn)法,即取超幾何分布為檢驗(yàn)分布,檢驗(yàn)的p值為,(3)題中,并注意到題中,故檢驗(yàn)的p值為因?yàn)椋试谒较戮芙^,即認(rèn)為這個(gè)人不是隨機(jī)猜測(cè),而是有品酒能力的.注1:不少同學(xué)在如何建立原假設(shè)時(shí)有問(wèn)題,首先應(yīng)該選擇“沒(méi)有品酒能力”為原假設(shè)。注2:如何具體表示“沒(méi)有品酒能力為原假設(shè)”,將其數(shù)學(xué)化,也存在不同的想法,這個(gè)問(wèn)題的確值得進(jìn)一步探討。聯(lián)系Ex8,大家可以討論下如何建立假設(shè)的問(wèn)題,這應(yīng)該是一個(gè)沒(méi)有絕對(duì)正確答案的問(wèn)題,應(yīng)該有一定主觀性。注3:下表中有其他幾種方法的檢驗(yàn)結(jié)果,由于是小樣本,可以看到,連續(xù)性校正的效果與精確檢驗(yàn)一致??ǚ綑z驗(yàn)值df漸進(jìn) Sig. (雙側(cè))精確 Sig.(雙側(cè))精確 Sig.(單側(cè))Pearson 卡方6.533a1.011連續(xù)校正b4.8001.028似然比6.7941.009Fisher 的精確檢驗(yàn).027.013有效案例中的 N30a. 0 單元格(.0%) 的期望計(jì)數(shù)少于 5。最小期望計(jì)數(shù)為 7.50。b. 僅對(duì) 2x2 表計(jì)算(P70Ex9)解:(本題應(yīng)該仿照例3.9進(jìn)行統(tǒng)計(jì)分析)方法一:采用McNemar檢驗(yàn)記,(1)要進(jìn)行邊緣齊性檢驗(yàn),即檢驗(yàn)假設(shè) 也就是要進(jìn)行對(duì)稱性檢驗(yàn) ,(2)采用McNemar卡方檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下不能拒絕,即認(rèn)為檢測(cè)方法1檢驗(yàn)為陽(yáng)性的比例與檢測(cè)方法2檢驗(yàn)為陽(yáng)性的比例相等.方法二:采用似然比檢驗(yàn)(1)要進(jìn)行邊緣齊性檢驗(yàn),即檢驗(yàn)假設(shè) 也就是要進(jìn)行對(duì)稱性檢驗(yàn) ,(2)采用似然比檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下不能拒絕,即認(rèn)為檢測(cè)方法1檢驗(yàn)為陽(yáng)性的比例與檢測(cè)方法2檢驗(yàn)為陽(yáng)性的比例相等.(P71Ex11)分析:很多同學(xué)對(duì)本題也仿照例3.9進(jìn)行統(tǒng)計(jì)分析,但也有少數(shù)同學(xué)注意到本題處于Ex10之后,似乎按照Ex10進(jìn)行統(tǒng)計(jì)分析更為合理。關(guān)鍵是對(duì)文字“競(jìng)選初期支持民主黨的選民后來(lái)支持共和黨的比例”的解讀產(chǎn)生的歧義,究竟是理解成:“選民在競(jìng)選初期支持民主黨且后來(lái)支持共和黨的比例”,還是“在競(jìng)選初期支持民主黨的選民中后來(lái)支持共和黨的比例”。即究竟是積事件的概率,還是條件概率?以下我把兩種分析結(jié)果都羅列出來(lái):理解一:理解為積事件的概率相等:采用McNemar檢驗(yàn)(1)要進(jìn)行對(duì)稱性檢驗(yàn),即檢驗(yàn)假設(shè) (2)采用McNemar卡方檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椤#?)題中,則檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下不能拒絕,即認(rèn)為競(jìng)選初期支持民主黨且后來(lái)支持共和黨的比例與競(jìng)選初期支持共和黨且后來(lái)支持民主黨的比例相等.理解二:理解為兩條件概率的相等:采用Ex10的檢驗(yàn)方法記(1)要檢驗(yàn)假設(shè) (考慮交換頻數(shù)與的位置,形成新的四格表,再用U檢驗(yàn))(2)采用檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)算得檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下拒絕,即認(rèn)為“在競(jìng)選初期支持民主黨的選民中后來(lái)支持共和黨的比例”顯著“小于競(jìng)選初期支持共和黨的選民中后來(lái)支持民主黨的比例”.(P71Ex13)解:由題意知:,。則相對(duì)危險(xiǎn)度為:。又因?yàn)?,所以?yōu)比為:。注1:有些同學(xué)在解題時(shí),設(shè)法還原出概率四格表,甚至還原出頻率四格表。但這些表格都是錯(cuò)的。因?yàn)閮H根據(jù)題中的已知條件是無(wú)法還原出四格表的!由題意可知條件概率,但不知道或的值,所以無(wú)法知道積事件的概率:,所以無(wú)法還原出概率四格表,更無(wú)法知道頻率四格表。注2:本題未要求進(jìn)行顯著性檢驗(yàn)。(P108Ex1)解:(本題是關(guān)于分布齊性的檢驗(yàn),也可以看作是獨(dú)立性檢驗(yàn),應(yīng)該采用二維列聯(lián)表的卡方檢驗(yàn)或似然比檢驗(yàn),具體可以寫(xiě)成如下四種不同的解法)(1)要檢驗(yàn)假設(shè)供應(yīng)商與零件質(zhì)量獨(dú)立供應(yīng)商與零件質(zhì)量不相互獨(dú)立。(也就是要進(jìn)行齊性檢驗(yàn)各供應(yīng)商的零件質(zhì)量分布相同供應(yīng)商的零件質(zhì)量分布不全相同)方法一:卡方檢驗(yàn)+臨界值檢驗(yàn)法(2)采用卡方檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)題中,臨界值為,(4)檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法二:似然比檢驗(yàn)+臨界值檢驗(yàn)法(2)采用似然比檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椤#?)題中,臨界值為,(4)檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法三:卡方檢驗(yàn)+p值檢驗(yàn)法(2)采用卡方檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為,且拒絕域形式為。(3)檢驗(yàn)統(tǒng)計(jì)量的值為,(4)檢驗(yàn)的p值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立,即各供應(yīng)商的零件的質(zhì)量分布都相同.方法四:似然比檢驗(yàn)+p值檢驗(yàn)法(2)采用似然比檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)分布為,且拒絕域形式為。(3)檢驗(yàn)統(tǒng)計(jì)量的值為,(4)檢驗(yàn)的p值為,故在水平下不能拒絕,即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立,即各供應(yīng)商的零件的質(zhì)量分布都相同.(P109Ex7)(方表的一致性問(wèn)題)兩個(gè)中醫(yī)對(duì)一批病人的診斷結(jié)果如下:醫(yī)生A醫(yī)生B陽(yáng)虛陰虛陰陽(yáng)兩虛陽(yáng)虛2531陰虛190陰陽(yáng)兩虛1215試計(jì)算一致性度量的估計(jì)值。(一)一致性度量的計(jì)算要檢驗(yàn)醫(yī)生A與醫(yī)生B的診斷是否真的一致.(1)要檢驗(yàn)假設(shè)醫(yī)生A與B的診斷偶然一致醫(yī)生A與B的診斷不是偶然一致。(2)采用檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)取,臨界值為,拒絕域?yàn)椋?)檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下拒絕,即認(rèn)為醫(yī)生A與B的診斷不是偶然一致。對(duì)稱度量值漸進(jìn)標(biāo)準(zhǔn)誤差a近似值 Tb近似值 Sig.一致性度量Kappa.776.0728.142.000有效案例中的 N57a. 不假定零假設(shè)。b. 使用漸進(jìn)標(biāo)準(zhǔn)誤差假定零假設(shè)。(P110Ex8)(聯(lián)系附錄7)解法一:邊際和都給定時(shí),我們按如下方式理解需要解決的問(wèn)題。個(gè)單元中有個(gè)單元屬于,記非隨機(jī)示性變量 ()個(gè)單元的屬性B看成等可能的隨機(jī)分配,屬于的有個(gè)單元,。記隨機(jī)變量 ()則,且01P的分布列為時(shí),的聯(lián)合分布列 010*1從而有,則 所以解法二:給定,將表格壓縮為四格表,;利用超幾何分布處理。 BABj非Bj合計(jì)Ai*非Ai*合計(jì)則隨機(jī)變量,由課本62頁(yè)公式因此(P159Ex1)分析:要確定別嘌呤醇會(huì)不會(huì)引起皮疹,數(shù)據(jù)是的三維列聯(lián)表的分析,還涉及性別,一個(gè)基本思路是如何降維成二維列聯(lián)表的卡方檢驗(yàn)或似然比檢驗(yàn)。解:記條件概率P(皮疹|使用別嘌呤醇),P(皮疹|不使用別嘌呤醇),“別嘌呤醇會(huì)引起皮疹”是指。(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表引起皮疹未引起皮疹合計(jì)使用別嘌呤醇155267未使用別嘌呤醇9411631257合計(jì)10912151324(2)要檢驗(yàn)假設(shè)別嘌呤醇與皮疹無(wú)關(guān)別嘌呤醇會(huì)引起皮疹。即要檢驗(yàn)假設(shè) ,(右側(cè)檢驗(yàn))(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即別嘌呤醇會(huì)引起皮疹.(二)將三維列聯(lián)表按照性別變量分層,分別對(duì)兩個(gè)四格表分析(1)分層后得 “是否使用別嘌呤醇是否引起皮疹”(男性)四格表引起皮疹未引起皮疹合計(jì)使用別嘌呤醇53338未使用別嘌呤醇36645681合計(jì)41678719“是否使用別嘌呤醇是否引起皮疹”(女性)四格表引起皮疹未引起皮疹合計(jì)使用別嘌呤醇101929未使用別嘌呤醇58518576合計(jì)68537605(2)要分別檢驗(yàn)假設(shè):(對(duì)于男性)別嘌呤醇與皮疹無(wú)關(guān)別嘌呤醇會(huì)引起皮疹。(對(duì)于女性)別嘌呤醇與皮疹無(wú)關(guān)別嘌呤醇會(huì)引起皮疹。(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)分別算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下都拒絕,即對(duì)于男性和女性,別嘌呤醇都會(huì)引起皮疹.(三)上述壓縮和分層兩方面的分析結(jié)果是一致的,綜合來(lái)看,可以認(rèn)為別嘌呤醇會(huì)引起皮疹。(四)(補(bǔ)充:條件獨(dú)立性檢驗(yàn))(1)要檢驗(yàn)假設(shè):性別給定后別嘌呤醇與皮疹條件獨(dú)立,性別給定后別嘌呤醇與皮疹不條件獨(dú)立。(2)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)對(duì)顯著性水平,臨界值,(4)由題中數(shù)據(jù)分別算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下都拒絕,即性別給定時(shí),別嘌呤醇與皮疹不條件獨(dú)立,是有關(guān)系的.注1:由于涉及小樣本,特別要注意對(duì)于男性的分層檢驗(yàn),連續(xù)性校正應(yīng)該更為合理。注2:可以發(fā)現(xiàn),男性與女性的P值有差異。原因是什么?(P159Ex2)解:(解題思路同Ex1)記條件概率P(死亡|護(hù)理較少),P(死亡|護(hù)理較多),題中關(guān)注的是是否成立。(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表死亡存活合計(jì)較少20373393較多6316322合計(jì)26689715(2)要檢驗(yàn)假設(shè)護(hù)理多少與嬰兒死亡無(wú)關(guān)護(hù)理少會(huì)引起嬰兒死亡多。即要檢驗(yàn)假設(shè) ,(右側(cè)檢驗(yàn))(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即護(hù)理少會(huì)引起嬰兒死亡多.(二)將三維列聯(lián)表分層為兩個(gè)四格表的分析(1)分層后得 “護(hù)理嬰兒生存情況”(A醫(yī)院)四格表死亡存活合計(jì)較少3176179較多4293297合計(jì)7469476“護(hù)理嬰兒生存情況”(B醫(yī)院)四格表死亡存活合計(jì)較少17197214較多22325合計(jì)19220239(2)要分別檢驗(yàn)假設(shè):(對(duì)于A醫(yī)院)護(hù)理多少與嬰兒死亡無(wú)關(guān)護(hù)理少會(huì)引起嬰兒死亡多。(對(duì)于B醫(yī)院)護(hù)理多少與嬰兒死亡無(wú)關(guān)護(hù)理少會(huì)引起嬰兒死亡多。(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)分別算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下都不能拒絕,即對(duì)于A醫(yī)院和B醫(yī)院,護(hù)理多少與嬰兒死亡無(wú)關(guān).(三)上述壓縮和分層兩方面的分析結(jié)果不一致,由于壓縮會(huì)受到混雜因素的干擾,分層分析的結(jié)論是可靠的,所以認(rèn)為護(hù)理多少與嬰兒死亡無(wú)顯著關(guān)系。注:本題類(lèi)似例5.2,和“Simpson悖論”的例子相似。醫(yī)院是混雜因素,兩醫(yī)院中的護(hù)理多與護(hù)理少的嬰兒比例差異很大?!白o(hù)理嬰兒生存情況”(A醫(yī)院)條件分布列死亡存活較少0.016760.98324死亡存活較多0.0134680.986532“護(hù)理嬰兒生存情況”(B醫(yī)院)條件分布列死亡存活較少0.0794390.920561死亡存活較多0.080.92B醫(yī)院的死亡率高于A醫(yī)院,兩個(gè)死亡率的差異主要是醫(yī)院因素造成的。壓縮后的四格表中其中,但(P160Ex3)分析:先將屬性B和C合并成一個(gè)屬性變量,再采用二維列聯(lián)表的卡方檢驗(yàn)或似然比檢驗(yàn)(見(jiàn)教材129-130頁(yè))。解:(1)合并數(shù)據(jù)得城市* 文化程度和看法 交叉表城市1234文化程度和看法1(小學(xué)不同意)23188122(小學(xué)不表態(tài))76693(小學(xué)同意)21314(初中不同意)1061225(初中不表態(tài))23184156(初中同意)52437(高中不同意)52238(高中不表態(tài))20131189(高中同意)131361410(大學(xué)不同意)624611(大學(xué)不表態(tài))1097412(大學(xué)同意)2415713(2)要檢驗(yàn)假設(shè)城市間文化程度與看法沒(méi)有差別 城市間文化程度與看法有差別。即要檢驗(yàn)假設(shè)屬性A與(B,C)獨(dú)立 屬性A與(B,C)不獨(dú)立。(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椋?)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下不能拒絕,即認(rèn)為城市間文化程度與看法沒(méi)有差別.(P160Ex4)分析:參考教材例5.3的解法,建立表格,匯總各獨(dú)立性檢驗(yàn)的結(jié)果。解:用A表示年齡,B表示治療效果,C表示治療方法,獨(dú)立性檢驗(yàn)結(jié)果如下:原假設(shè)自由度臨界值P值(A,B,C)36.45738.372714.0670.000(A,BC)(B,AC)(C, AB)34.29136.4573.80835.57538.3723.78256511.0712.59211.070.0000.0000.577(AB,AC)(BA,BC)(CA, CB)3.8081.64334.2913.7811.64635.5754349.4887.8159.4880.4330.6500.000綜上,治療方法與(年齡,治療效果)相互獨(dú)立,即治療方法之間沒(méi)有顯著差異。年齡與治療效果之間不獨(dú)立,有顯著關(guān)系。接下來(lái)可以合并數(shù)據(jù)分析年齡與治療效果之間的關(guān)系。注:相互獨(dú)立意味著數(shù)據(jù)合起來(lái)看與分開(kāi)來(lái)是一致的,因此合并各層數(shù)據(jù),同一層的兩個(gè)變量間的關(guān)系可以看得更為清楚穩(wěn)定。(P160Ex6)(分開(kāi)看與合起來(lái)看)分析:綜合分層分析與壓縮合并數(shù)據(jù)分析,得出合理的結(jié)論。解:記條件概率P(偏好飲料A|男性),P(偏好飲料B|女性),(一)將三維列聯(lián)表壓縮成四格表的分析(1)壓縮后得四格表偏好飲料A偏好飲料B合計(jì)男性6769136女性423476合計(jì)109103212(2)要檢驗(yàn)假設(shè)性別與飲料偏好沒(méi)有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗(yàn)假設(shè) ,(雙側(cè)檢驗(yàn))(3)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下不能拒絕,即性別與飲料偏好沒(méi)有關(guān)系.(二)將三維列聯(lián)表按照年齡變量分層,分別對(duì)兩個(gè)四格表分析分層后得 “性別飲料偏好”(年輕人)四格表偏好飲料A偏好飲料B合計(jì)男性372663女性112334合計(jì)484997“性別飲料偏好”(老年人)四格表偏好飲料A偏好飲料B合計(jì)男性304373女性311142合計(jì)6154115對(duì)于年輕人,檢驗(yàn)性別與飲料偏好是否有關(guān)系:(1)性別與飲料偏好沒(méi)有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗(yàn)假設(shè) ,(雙側(cè)檢驗(yàn))(2)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(4)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即對(duì)于年輕人,性別與飲料偏好是有關(guān)系的.對(duì)于老年人,檢驗(yàn)性別與飲料偏好是否有關(guān)系:(1)性別與飲料偏好沒(méi)有關(guān)系性別與飲料偏好有關(guān)系。即要檢驗(yàn)假設(shè) ,(雙側(cè)檢驗(yàn))(2)取檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?,?)對(duì)顯著性水平,臨界值,(4)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計(jì)量的值為故在水平下拒絕,即對(duì)于老年人,性別與飲料偏好是有關(guān)系的.(三)上述壓縮和分層兩方面的分析結(jié)果是不一致的,應(yīng)該采信分層的結(jié)論。以下分層進(jìn)行相合性檢驗(yàn)。對(duì)于年輕人,計(jì)算相合系數(shù),并檢驗(yàn)性別與飲料偏好是否有相合關(guān)系。(1)要檢驗(yàn)假設(shè):性別與飲料偏好不相合性別與飲料偏有相合關(guān)系。(2)采用檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)?。?)取,拒絕域?yàn)椋?)根據(jù)SPSS軟件的計(jì)算輸出可知,檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下拒絕,即對(duì)于年輕人,性別與飲料偏好有相合關(guān)系。對(duì)于老年人,計(jì)算相合系數(shù),并檢驗(yàn)性別與飲料偏好是否有相合關(guān)系。(1)要檢驗(yàn)假設(shè):性別與飲料偏好不相合性別與飲料偏有相合關(guān)系。(2)采用檢驗(yàn)統(tǒng)計(jì)量,拒絕域?yàn)椤#?)取,拒絕域?yàn)椋?)根據(jù)SPSS軟件的計(jì)算輸出可知,檢驗(yàn)統(tǒng)計(jì)量的值為,故在水平下拒絕,即對(duì)于老年人,性別與飲料偏好有相合關(guān)系。注1:由于對(duì)于年輕人,性別與飲料偏好有正相合關(guān)系,即年輕女性比年輕男性更喜歡飲料B。而對(duì)于老年人,性別與飲料偏好有負(fù)相合關(guān)系,即老年女性比老年男性更喜歡飲料A。一正一負(fù),數(shù)據(jù)合并后沒(méi)有顯著相合性了。注2:記號(hào)與稱呼上,要能區(qū)分U檢驗(yàn)統(tǒng)計(jì)量與檢驗(yàn)統(tǒng)計(jì)量:注3:p值的概念要清楚,要能正確地表示與計(jì)算p值:首先要明確檢驗(yàn)分布與拒絕域的形式;然后計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀察值;最后,以檢驗(yàn)統(tǒng)計(jì)量的值為臨界值定出拒絕域,計(jì)算檢驗(yàn)分布在此區(qū)域的概率。例如本題中,采用檢驗(yàn)統(tǒng)計(jì)量,則檢驗(yàn)分布為,拒絕域形式為;算出檢驗(yàn)統(tǒng)計(jì)量的觀察值;考慮拒絕域形式為:;基于檢驗(yàn)分布,計(jì)算p值:注4:記號(hào)上注意區(qū)分卡方分布與分卡方分布的分位數(shù)。(P161Ex7)分析:聯(lián)系教材例5.6,例5.7。比較“分開(kāi)來(lái)看”與“合起來(lái)看”的結(jié)果是否一致。倘若不一致,則是有偏比較。解:將外銷(xiāo)與內(nèi)銷(xiāo)產(chǎn)品合起來(lái)看不合格品率:車(chē)間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王27032120.078431張17982580.143493李753870.115538王的車(chē)間的產(chǎn)品不合格品率最低,其次是李的車(chē)間,最高的是張的車(chē)間。再分內(nèi)銷(xiāo)產(chǎn)品與外銷(xiāo)產(chǎn)品分別看不合格品率。從內(nèi)銷(xiāo)產(chǎn)品看不合格品率:車(chē)間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王23681310.055321張29330.010239李307120.039088王的車(chē)間的產(chǎn)品不合格品率最高,其次是李的車(chē)間,最低的是張的車(chē)間。從外銷(xiāo)產(chǎn)品看不合格品率:車(chē)間主任產(chǎn)品總數(shù)不合格品總數(shù)不合格品率王123810.658537張12472550.204491李359750.208914王的車(chē)間的產(chǎn)品不合格品率最高,其次是李的車(chē)間,最低的是張的車(chē)間。綜上,“分開(kāi)來(lái)看”與“合起來(lái)看”的結(jié)果不一致,因此是有偏比較。有偏的原因是各車(chē)間的內(nèi)銷(xiāo)與外銷(xiāo)的比重不一致,而且總體上內(nèi)銷(xiāo)產(chǎn)品的不合格品率低于外銷(xiāo)產(chǎn)品的不合格品率。無(wú)論內(nèi)銷(xiāo)產(chǎn)品還是外銷(xiāo)產(chǎn)品,王的車(chē)間產(chǎn)品不合格品率都是最高的,但由于產(chǎn)品大多是內(nèi)銷(xiāo)產(chǎn)品,所以總的不合格品率卻是最低的。因此產(chǎn)品類(lèi)型(內(nèi)銷(xiāo)還是外銷(xiāo))是產(chǎn)生偏差的原因,是混雜因素。(P183Ex1)分析:將年齡與體質(zhì)指數(shù)都作為定量變量,用SPSS建立Logistic線性回歸模型。解:要建立Logistic線性回歸模型(1)將原來(lái)的三維列聯(lián)表拉直,建立含四個(gè)變量的數(shù)據(jù)集,四個(gè)變量分別為年齡,體質(zhì)指數(shù),是否患心血管病,人數(shù)。(2)將數(shù)據(jù)集導(dǎo)入SPSS;(3)數(shù)據(jù)=加權(quán)個(gè)案=將人數(shù)設(shè)置為頻數(shù);(4)分析=回歸=二元Logistic,用二元Logistic過(guò)程建立Logistic線性回歸模型,將是否患心血管病設(shè)置為因變量,將年齡和體質(zhì)指數(shù)設(shè)置為協(xié)變量,其他采用默認(rèn)方式,點(diǎn)選確定,輸出模型擬合結(jié)果:方程中的變量BS.E,WalsdfSig.Exp (B)步驟 1a年齡.054.01026.4201.0001.055體質(zhì)指數(shù).238.0828.4701.0041.269常量-8.2932.23413.7771.000.000a. 在步驟 1 中輸入的變量: 年齡, 體質(zhì)指數(shù).即擬合的Logistic線性回歸方程為由系數(shù)都為正可知:年齡越大越容易患心血管病,體質(zhì)指數(shù)越大也越容易患心血管病。(P184Ex2)分析:將年齡(A)作為定量變量,婚姻狀況作為定性名義變量,包含3個(gè)啞變量(M1, M2, M3),以及3個(gè)與年齡的交互作用變量(AM1, AM2, AM3),用SPSS建立Logistic線性回歸模型。解:要建立Logistic線性回歸
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 沙湖小學(xué)考試試題及答案
- 電解制氫試題及答案
- 彩陶鑒賞試題及答案
- 崇文今年考試題及答案
- 初中特色考試題及答案
- 如何利用年度工作計(jì)劃激發(fā)創(chuàng)意
- 優(yōu)化產(chǎn)品開(kāi)發(fā)的工作總結(jié)與計(jì)劃
- 提升大型展會(huì)安全管理的工作策略計(jì)劃
- 投資價(jià)值評(píng)估的試題及答案
- 用戶旅程與品牌接觸點(diǎn)的優(yōu)化計(jì)劃
- 【市場(chǎng)營(yíng)銷(xiāo)(實(shí)踐)調(diào)查報(bào)告:蜜雪冰城XX市場(chǎng)的調(diào)查報(bào)告(論文)2700字】
- 退休延期協(xié)議書(shū)
- 人教版七年級(jí)數(shù)學(xué)下冊(cè)舉一反三專題11.6期末復(fù)習(xí)之填空壓軸題十大題型總結(jié)(學(xué)生版+解析)(七年級(jí)下冊(cè))
- 火龍罐綜合灸技術(shù)
- 質(zhì)量保修卡格式范文
- 【單元專題卷】2024年春季小學(xué)測(cè)試卷人教版數(shù)學(xué)5年級(jí)下冊(cè)第1章·專題01 觀察物體(三)
- 員工勞務(wù)合同書(shū)
- 當(dāng)代世界經(jīng)濟(jì)與政治 第八版 課件 第六章 轉(zhuǎn)型國(guó)家的經(jīng)濟(jì)與政治
- 人教版數(shù)學(xué)四年級(jí)下冊(cè)第七單元知識(shí)與回顧檢測(cè)
- 海洋能發(fā)電投資項(xiàng)目可行性報(bào)告
- 中考物理總復(fù)習(xí)第十一章功和機(jī)械能市賽課公開(kāi)課一等獎(jiǎng)省名師獲獎(jiǎng)?wù)n件
評(píng)論
0/150
提交評(píng)論