




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
.3.2獨(dú)立性檢驗(yàn)教學(xué)設(shè)計(jì)課時(shí)教學(xué)內(nèi)容 (1)統(tǒng)計(jì)最基本的思想:用樣本推斷總體,而估計(jì)和假設(shè)檢驗(yàn)是兩種基本而重要的推斷方法.在前面的學(xué)習(xí)中,主要學(xué)習(xí)了統(tǒng)計(jì)估計(jì)的推斷方法.例如,用樣本數(shù)據(jù)的均值和方差分別估計(jì)總體的均值和方差;用樣本相關(guān)系數(shù)估計(jì)兩個(gè)數(shù)值變量的相關(guān)系數(shù),從而推斷這兩個(gè)變量線性關(guān)系的密切程度;利用最小二乘思想估計(jì)一元線性回歸模型中的參數(shù)等. (2)假設(shè)檢驗(yàn):統(tǒng)計(jì)推斷的一種基本形式,其基本思想是根據(jù)觀察或試驗(yàn)的結(jié)果去檢驗(yàn)一個(gè)假設(shè)(零假設(shè))是否成立,即通過(guò)樣本的某個(gè)指標(biāo)對(duì)總體的某種屬性進(jìn)行推斷,推斷的結(jié)果是拒絕或接受零假設(shè).獨(dú)立性檢驗(yàn)是假設(shè)檢驗(yàn)的一個(gè)特例. (3)獨(dú)立性檢驗(yàn)的基本原理:根據(jù)觀測(cè)值與期望值的差異的大小作出推斷,這種差異由卡方統(tǒng)計(jì)量進(jìn)行刻畫(huà),其大小的標(biāo)準(zhǔn)根據(jù)推理有關(guān)聯(lián)時(shí)犯錯(cuò)誤的概率確定. (4)獨(dú)立性檢驗(yàn)的依據(jù)是小概率原理:即小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生.在零假設(shè)成立的條件下,若一個(gè)不利于零假設(shè)的小概率事件在一次試驗(yàn)中發(fā)生了,則有理由拒絕零假設(shè);若在一次試驗(yàn)中,此小概率事件沒(méi)有發(fā)生,則沒(méi)有充足的理由拒絕零假設(shè),通常會(huì)接受零假設(shè).課時(shí)教學(xué)目標(biāo)1.通過(guò)實(shí)例,理解2×2的統(tǒng)計(jì)意義;2.通過(guò)實(shí)例了解2×2列聯(lián)表與獨(dú)立性檢驗(yàn)及其應(yīng)用;3.會(huì)根據(jù)χ2的值判斷兩個(gè)分類(lèi)變量之間關(guān)系的強(qiáng)弱教學(xué)重點(diǎn)、難點(diǎn)重點(diǎn):2×2列聯(lián)表,獨(dú)立性檢驗(yàn)的思想和方法.難點(diǎn):卡方統(tǒng)計(jì)量的導(dǎo)出和意義,獨(dú)立性檢驗(yàn)的思想和方法.教學(xué)過(guò)程設(shè)計(jì)環(huán)節(jié)一創(chuàng)設(shè)情境,引入課題 (1)舊知回顧:在上一節(jié)課,我們學(xué)習(xí)了列聯(lián)表,由隨機(jī)事件的穩(wěn)定性,了解并作出判斷兩個(gè)分類(lèi)變量是否有關(guān)聯(lián),請(qǐng)同學(xué)們思考:用頻率推斷兩個(gè)分類(lèi)變量是否獨(dú)立有什么缺點(diǎn)? 前面我們通過(guò)列聯(lián)表整理成對(duì)分類(lèi)變量的樣本觀測(cè)數(shù)據(jù),并根據(jù)隨機(jī)事件頻率的穩(wěn)定性推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián).引導(dǎo)學(xué)生對(duì)頻率與概率的比較,由頻率具有隨機(jī)性,與概率之間存在差異;通過(guò)數(shù)據(jù)改變,由樣本容量較小時(shí),犯錯(cuò)誤的概率較大.(2)問(wèn)題激發(fā):有沒(méi)有更合理的推斷方法,同時(shí)也希望對(duì)出現(xiàn)的錯(cuò)誤推斷的概率一定的控制或估算?由概率知識(shí)分析,如果兩個(gè)事件的獨(dú)立,它們的充要條件是什么? 我們需要更好的方法彌補(bǔ)因頻率的隨機(jī)性帶來(lái)判斷兩個(gè)分類(lèi)變量的不可靠性,改進(jìn)提高判斷的結(jié)論科學(xué)性與穩(wěn)定性.如何改進(jìn)提高,先回頭看獨(dú)立事件,我們已知道,事件與事件獨(dú)立的充要條件是,這與兩個(gè)分類(lèi)變量的頻率之間又有什么樣的聯(lián)系呢?對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.考慮以為樣本空間的古典概型.我們將兩個(gè)分類(lèi)變量的列聯(lián)表抽象簡(jiǎn)化,以0,1分別表示事件發(fā)生的兩種結(jié)果,如下表所示,獨(dú)立的另一層含義,即我們需要了解事件與是否存在關(guān)聯(lián)? 我們知道與不獨(dú)立,互為對(duì)立事件,與不獨(dú)立,互為對(duì)立事件. 我們需要判斷下面的假定關(guān)系:是否成立?設(shè)和為定義在上,取值于的成對(duì)分類(lèi)變量.我們希望判斷事件和之間是否有關(guān)聯(lián).注意到和,和都是互為對(duì)立事件,與前面的討論類(lèi)似,我們需要判斷下面的假定關(guān)系是否成立,通常稱(chēng)為零假設(shè)或原假設(shè).這里,表示從中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于的概率,而表示從中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于的概率.由條件概率的定義可知,零假設(shè)等價(jià)于或①注意到和為對(duì)立事件,于是,再由概率的性質(zhì),我們有.由此推得①式等價(jià)于.因此,零假設(shè)等價(jià)于與獨(dú)立.根據(jù)已經(jīng)學(xué)過(guò)的概率知識(shí),下面的四條性質(zhì)彼此等價(jià):與獨(dú)立;與獨(dú)立;與獨(dú)立;與獨(dú)立.如果這些性質(zhì)成立,我們就稱(chēng)分類(lèi)變量和獨(dú)立,這相當(dāng)于下面四個(gè)等式成立:;;;.因此,我們可以用概率語(yǔ)言,將零假設(shè)改述為::分類(lèi)變量和獨(dú)立.根據(jù)我們通過(guò)簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如表8.3-3所示.表8.3-3合計(jì)合計(jì)8.3-3是關(guān)于分類(lèi)變量和的抽樣數(shù)據(jù)的列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件和的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件和的頻數(shù);中間的四個(gè)數(shù)是事件的頻數(shù);右下角格中的數(shù)是樣本容量.對(duì)于隨機(jī)樣本,表8.3-3中的頻數(shù)a,b,c,d都是隨機(jī)變量,而表8.3-2中的響應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測(cè)結(jié)果.環(huán)節(jié)二觀察分析,感知概念思考:如何基于②中的四個(gè)等式及列聯(lián)表8.3-3中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)的分類(lèi)變量X和Y是否相互獨(dú)立作出推斷?在零假設(shè)成立的條件下,根據(jù)頻率穩(wěn)定于概率的原理,由②中的第一個(gè)等式,我們可以用概率和對(duì)應(yīng)的頻率的乘積估計(jì)概率,而把視為事件發(fā)生的頻數(shù)的期望值(或預(yù)期值).這樣,該頻數(shù)的觀測(cè)值和應(yīng)該比較接近.綜合②中的四個(gè)式子,如果零假設(shè)成立,下面四個(gè)量的取值都不應(yīng)該太大:,,,.③反之,當(dāng)這些量的取值較大時(shí),就可以推斷不成立.顯然,分別考慮③中的四個(gè)差的絕對(duì)值很困難.我們需要找到一個(gè)既合理又能夠計(jì)算分布的統(tǒng)計(jì)量,來(lái)推斷是否成立.一般來(lái)說(shuō),若頻數(shù)的期望值較大,則③中相應(yīng)的差的絕對(duì)值也會(huì)較大;而若頻數(shù)的期望值較小,則③中相應(yīng)的差的絕對(duì)值也會(huì)較小.疑問(wèn):有沒(méi)有更好的方式一次性將4個(gè)量全部考慮包含? 于是,1900年,英國(guó)數(shù)學(xué)家卡方·皮爾遜在研究的基礎(chǔ)上,提出了如下統(tǒng)計(jì)量:為了合理地平衡這種影響,我們將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計(jì)量:.該表達(dá)式可化簡(jiǎn)為.(1)問(wèn)題4:那么,究竟χ2大到什么程度,可以推斷H0不成立呢?或者說(shuō),怎樣確定判斷χ2統(tǒng)計(jì)學(xué)家建議,用隨機(jī)變量取值的大小作為判斷零假設(shè)是否成立的依據(jù),當(dāng)它比較大時(shí)推斷不成立,否則認(rèn)為成立.那么,究竟大到什么程度,可以推斷不成立呢?或者說(shuō),怎樣確定判斷大小的標(biāo)準(zhǔn)呢?環(huán)節(jié)三抽象概括,形成概念 連續(xù)疑問(wèn):卡方統(tǒng)計(jì)量有什么用呢? 統(tǒng)計(jì)學(xué)家建議,用卡方的大小作為判斷零假設(shè)是否成立的依據(jù),當(dāng)它比較大時(shí)推斷不成立,否則認(rèn)為成立.那么,究竟大到什么程度,可以推斷不成立呢?或者說(shuō),怎樣確定判斷卡方大小的標(biāo)準(zhǔn)呢?根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,上面的想法可以通過(guò)確定一個(gè)與相矛盾的小概率事件來(lái)實(shí)現(xiàn).在假定的條件下,對(duì)于有放回簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本容量充分大時(shí),統(tǒng)計(jì)學(xué)家得到了的近似分布.忽略的實(shí)際分布與該近似分布的誤差后,對(duì)于任何小概率值,可以找到相應(yīng)的正實(shí)數(shù),使得下面關(guān)系成立:.我們稱(chēng)為的臨界值,這個(gè)臨界值就可作為判斷大小的標(biāo)準(zhǔn).概率值越小,臨界值越大.當(dāng)總體很大時(shí),抽樣有、無(wú)放回對(duì)的分布影響較?。虼?,在應(yīng)用中往往不嚴(yán)格要求抽樣必須是有放回的.由④式可知,只要把概率值取得充分小,在假設(shè)成立的情況下,事件是不大可能發(fā)生的.根據(jù)這個(gè)規(guī)律,如果該事件發(fā)生,我們就可以推斷不成立.不過(guò)這個(gè)推斷有可能犯錯(cuò)誤,但犯錯(cuò)誤的概率不會(huì)超過(guò).基于小概率值的檢驗(yàn)規(guī)則是:當(dāng)時(shí),我們就推斷不成立,即認(rèn)為和不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò);當(dāng)時(shí),我們沒(méi)有充分證據(jù)推斷不成立,可以認(rèn)為和獨(dú)立.這種利用的取值推斷分類(lèi)變量和是否獨(dú)立的方法稱(chēng)為獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱(chēng)獨(dú)立性檢驗(yàn)(testofindependence).表8.3-4給出了獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.表8.3-40.10.050.010.0050.0012.7063.8416.6357.87910.828例如,對(duì)于小概率值,我們有如下的具體檢驗(yàn)規(guī)則:(1)當(dāng)時(shí),我們推斷不成立,即認(rèn)為和不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)時(shí),我們沒(méi)有充分證據(jù)推斷不成立,即認(rèn)為和獨(dú)立.環(huán)節(jié)四辨析理解深化概念例2依據(jù)小概率值的獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異?解:零假設(shè)為:分類(lèi)變量和相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.根據(jù)表8.3-2中的數(shù)據(jù),計(jì)算得到.根據(jù)小概率值的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷不成立,因此可以認(rèn)為成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異.思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎?事實(shí)上,如前所述,例1只是根據(jù)一個(gè)樣本的兩個(gè)頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論,并沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以那里的推斷依據(jù)不太充分.在例2中,我們用獨(dú)立性檢驗(yàn)對(duì)零假設(shè)進(jìn)行了檢驗(yàn).通過(guò)計(jì)算,發(fā)現(xiàn)小于所對(duì)應(yīng)的臨界值2.706,因此認(rèn)為沒(méi)有充分證據(jù)推斷不成立,所以接受,推斷出兩校學(xué)生的數(shù)學(xué)優(yōu)秀率沒(méi)有顯著差異的結(jié)論.這個(gè)檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個(gè)頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的.因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論是不可靠的.由此可見(jiàn),相對(duì)于簡(jiǎn)單比較兩個(gè)頻率的推斷,用獨(dú)立性檢驗(yàn)得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.當(dāng)我們接受零假設(shè)時(shí),也可能犯錯(cuò)誤.我們不知道犯錯(cuò)誤這類(lèi)錯(cuò)誤的概率的大小,但是知道,若越大,則越?。?某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,如表8.3-5所示.表8.3-5單位:人療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)小概率值的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷不成立,因此可以認(rèn)為成立,即認(rèn)為兩種療法效果沒(méi)有差異.觀察:在表8.3-5中,若對(duì)調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,則表達(dá)式(1)中a,b,c,d的賦值都會(huì)相應(yīng)地改變.這樣做會(huì)影響取值的計(jì)算結(jié)果嗎?環(huán)節(jié)五概念應(yīng)用,鞏固內(nèi)化例4為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡(jiǎn)單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對(duì)樣本觀測(cè)數(shù)據(jù)的分類(lèi)統(tǒng)計(jì)結(jié)果,如表8.3-6所示.依據(jù)小概率值的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).表8.3-6單位:人吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965解:零假設(shè)為:吸煙與患肺癌之間無(wú)關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)小概率值的獨(dú)立性檢驗(yàn),我們推斷不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001.根據(jù)表8.3-6中的數(shù)據(jù)計(jì)算,不吸煙者中不患肺癌和患肺癌的頻率分別為和;吸煙者中不患肺癌和患肺癌的頻率分別為和.由可見(jiàn),在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上.于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌的概率,即吸煙更容易引發(fā)肺癌.總結(jié)上面的例子,應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):(1)提出零假設(shè):和相互獨(dú)立,并給出在問(wèn)題中的解釋?zhuān)?)根據(jù)抽樣數(shù)據(jù)整理出列聯(lián)表,計(jì)算的值,并與臨界值比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在和不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析和間的影響規(guī)律.注意,上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整例如,在有些時(shí)候,分類(lèi)變量的抽樣數(shù)據(jù)列聯(lián)表是問(wèn)題中給定的.思考:獨(dú)立性檢驗(yàn)的思想類(lèi)似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?簡(jiǎn)單地說(shuō),反證法是在某種假設(shè)之下,推出一個(gè)矛盾結(jié)論,從而證明不成立;而獨(dú)立性檢驗(yàn)是在零假設(shè)之下,如果出現(xiàn)一個(gè)與相矛盾的小概率事件,就推斷不成立,且該推斷犯錯(cuò)誤的概率不大于這個(gè)小概率.另外,在全部邏輯推理正確的情況下,反證法不會(huì)犯錯(cuò)誤,但獨(dú)立性檢驗(yàn)會(huì)犯隨機(jī)性錯(cuò)誤.獨(dú)立性檢驗(yàn)的本質(zhì)是比較觀測(cè)值與期望值之間的差異,由所代表的這種差異的大小是通過(guò)確定適當(dāng)?shù)男「怕手颠M(jìn)行判斷的.這是一種非常重要的推斷方法,不僅有相當(dāng)廣泛的應(yīng)用,也開(kāi)啟了人類(lèi)認(rèn)識(shí)世界的一種新的思維方式.環(huán)節(jié)六歸納總結(jié),反思提升1.本節(jié)課學(xué)習(xí)的概念有哪些?(1)獨(dú)立性檢驗(yàn)的基本原理,小概率事件;(2)列聯(lián)表,卡方統(tǒng)計(jì)量,臨界值表;(3)獨(dú)立性檢驗(yàn)的基本步驟:假設(shè)、計(jì)算、查表、下結(jié)論(4)知識(shí)清單:分類(lèi)變量.2×2列聯(lián)表.等高堆積條形圖.獨(dú)立性檢驗(yàn),χ2公式.2.在解決問(wèn)題時(shí),用到了哪些數(shù)學(xué)思想?(1)反證法思想.(2)常見(jiàn)誤區(qū):對(duì)獨(dú)立性檢驗(yàn)的原理不理解,導(dǎo)致不會(huì)用χ2分析問(wèn)題.環(huán)節(jié)七 目標(biāo)檢測(cè),作業(yè)布置完成教材: 課本P135習(xí)題8.38題 通過(guò)課本例3的學(xué)習(xí),了解到兩個(gè)分類(lèi)變量卡方統(tǒng)計(jì)量偏小的情況,對(duì)于原假設(shè)如何下結(jié)論.練習(xí)(第134頁(yè))1.對(duì)于例3中的抽樣數(shù)據(jù),采用小概率值的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.1.【解析】根據(jù)題意,.依據(jù)小概率值的獨(dú)立性檢驗(yàn),我們推斷不成立,即可以認(rèn)為兩種療法的效果有差異,該推斷犯錯(cuò)誤的概率不超過(guò)0.05.甲種療法未治愈和治愈的頻率分別是和,乙種療法未治愈和治愈的頻率分別是和,因此可以推斷乙種療法的效果比甲種療法好.2.根據(jù)同一抽查數(shù)據(jù)推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián),應(yīng)用不同的小概率值,是否會(huì)得出不同的結(jié)論?為什么?2.【解析】可能會(huì)得出不同的結(jié)論.對(duì)同一抽樣數(shù)據(jù),計(jì)算出來(lái)的的值是確定的.在獨(dú)立性檢驗(yàn)中,基于不同的小概率值的檢驗(yàn)規(guī)則,對(duì)應(yīng)不同的臨界值,其與的大小關(guān)系可能不同,相當(dāng)于檢驗(yàn)的標(biāo)準(zhǔn)發(fā)生變化,因此結(jié)論可能會(huì)不同.3.為考察某種藥物A對(duì)預(yù)防疾病B的效果,進(jìn)行了動(dòng)物試驗(yàn),根據(jù)105個(gè)有放回簡(jiǎn)單隨機(jī)樣本的數(shù)據(jù),得到如下列聯(lián)表:?jiǎn)挝唬褐凰幬顰疾病B合計(jì)未患病患病未服用291544服用471461合計(jì)7629105依據(jù)的獨(dú)立性檢驗(yàn),分析藥物對(duì)預(yù)防疾病的有效性.3.【解析】零假設(shè)為:藥物A與預(yù)防疾病B無(wú)關(guān)聯(lián),即藥物A對(duì)預(yù)防疾病B沒(méi)有效果.根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷不成立.因此可以認(rèn)為藥物A對(duì)預(yù)防疾病B沒(méi)有效果.4.從某學(xué)校獲取了容量為400的有放回簡(jiǎn)單隨機(jī)樣本,將所得數(shù)學(xué)和語(yǔ)文期末考試成績(jī)的樣本觀測(cè)數(shù)據(jù)整理如下:?jiǎn)挝唬喝藬?shù)學(xué)成績(jī)語(yǔ)文成績(jī)合計(jì)不優(yōu)秀優(yōu)秀不優(yōu)秀21261273優(yōu)秀5473127合計(jì)266134400依據(jù)的獨(dú)立性檢驗(yàn),能否認(rèn)為數(shù)學(xué)成績(jī)與語(yǔ)文成績(jī)有關(guān)聯(lián)?4.【解析】零假設(shè)為:數(shù)學(xué)成績(jī)與語(yǔ)文成績(jī)獨(dú)立,即數(shù)學(xué)成績(jī)與語(yǔ)文成績(jī)沒(méi)有關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)的獨(dú)立性檢驗(yàn),我們可以推斷不成立,即認(rèn)為數(shù)學(xué)成績(jī)與語(yǔ)文成績(jī)有關(guān)聯(lián),該推斷犯錯(cuò)誤的概率不超過(guò)0.05.?dāng)?shù)學(xué)成績(jī)不優(yōu)秀的人中語(yǔ)文成績(jī)不優(yōu)秀和優(yōu)秀的頻率分別為和;數(shù)學(xué)成績(jī)優(yōu)秀的人中語(yǔ)文成績(jī)不優(yōu)秀和優(yōu)秀的頻率分別為和.由此可以看出,數(shù)學(xué)成績(jī)優(yōu)秀的人中語(yǔ)文成績(jī)優(yōu)秀的頻率明顯高于數(shù)學(xué)成績(jī)不優(yōu)秀的人中語(yǔ)文成績(jī)優(yōu)秀的頻率.根據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷,數(shù)學(xué)成績(jī)優(yōu)秀的人其語(yǔ)文成績(jī)優(yōu)秀的概率較大.習(xí)題8.3(第135頁(yè))復(fù)習(xí)鞏固1.為什么必須基于成對(duì)樣本數(shù)據(jù)推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián)?1.【解析】我們要研究的問(wèn)題是同一個(gè)總體的兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián),成對(duì)樣本觀測(cè)數(shù)據(jù)是來(lái)自于對(duì)同一個(gè)總體的兩個(gè)分類(lèi)變量的觀測(cè),只有成對(duì)樣本數(shù)據(jù)才能反映兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián),以及關(guān)聯(lián)的方式和程度.2.為什么獨(dú)立性檢驗(yàn)方法不適用于普查數(shù)據(jù)?2.【解析】利用普查數(shù)據(jù)可以準(zhǔn)確地判斷兩個(gè)變量之間是否有關(guān)聯(lián),不需要進(jìn)行獨(dú)立性檢驗(yàn).3.等高堆積條形圖在兩個(gè)分類(lèi)變量之間關(guān)聯(lián)性的研究中能夠起到什么作用?3.【解析】可以更加直觀地反映兩個(gè)分類(lèi)變量之間是否具有關(guān)聯(lián)性.4.對(duì)于已經(jīng)獲取的成對(duì)樣本數(shù)據(jù),檢驗(yàn)結(jié)論“兩個(gè)變量之間有關(guān)聯(lián)”的實(shí)際含義是什么?檢驗(yàn)結(jié)論“兩個(gè)變量之間沒(méi)有關(guān)聯(lián)”的實(shí)際含義又是什么?4.【解析】檢驗(yàn)結(jié)論“兩個(gè)變量之間有關(guān)聯(lián)”是“兩個(gè)變量不獨(dú)立”的另一種說(shuō)法,指在零假設(shè)“兩個(gè)變量獨(dú)立”之下,成對(duì)樣本數(shù)據(jù)顯示在一次試驗(yàn)中某個(gè)不利于這個(gè)假設(shè)的小概率事件發(fā)生了,由此推斷零假設(shè)不成立,從而得出“兩個(gè)變量不獨(dú)立”的檢驗(yàn)結(jié)論.檢驗(yàn)結(jié)論“兩個(gè)變量之間沒(méi)有關(guān)聯(lián)”是“兩個(gè)變量獨(dú)立”的另一種說(shuō)法,指在零假設(shè)“兩個(gè)變量獨(dú)立”之下,成對(duì)樣本數(shù)據(jù)顯示在一次試驗(yàn)中某個(gè)不利于這個(gè)假設(shè)的小概率事件沒(méi)有發(fā)生,因此不能推斷零假設(shè)不成立,按照通常的習(xí)慣接受零假設(shè),即得出“兩個(gè)變量獨(dú)立”的檢驗(yàn)結(jié)論.5.為了研究高三年級(jí)學(xué)生的性別和身高是否大于170cm的關(guān)聯(lián)性,調(diào)查了某中學(xué)所有高三年級(jí)的學(xué)生,整理得到如下列聯(lián)表:?jiǎn)挝唬喝诵詣e身高合計(jì)低于170cm不低于170cm女811697男2875103合計(jì)10991200請(qǐng)畫(huà)出列聯(lián)表的等高堆積條形圖,判斷該中學(xué)高三年級(jí)學(xué)生的性別和身高是否有關(guān)聯(lián).如果結(jié)論是性別與身高有關(guān)聯(lián),請(qǐng)解釋它們之間如何相互影響.5.【解析】根據(jù)列聯(lián)表中的數(shù)據(jù),女生中身高低于170cm與不低于170cm的比率分別為和,男生中身高低于170cm與不低于170cm的比率分別為和,等高堆積條形圖如圖所示.可以發(fā)現(xiàn)在男生和女生中,身高低于170cm和不低于170cm的比率存在明顯差異,可以判斷該中學(xué)高三年級(jí)學(xué)生的性別與身高有關(guān)聯(lián),而且男生高于女生.6.第5題中的身高變量是數(shù)值型變量還是分類(lèi)變量?為什么?6.【解析】分類(lèi)變量.因?yàn)榈?題中的身高變量只有兩個(gè)不同的取值(低于170cm和不低于170cm),用于區(qū)分兩類(lèi)不同的身高現(xiàn)象.7.從第5題的高三學(xué)生中獲取容量為40的有放回簡(jiǎn)單隨機(jī)樣本,由樣本數(shù)據(jù)整理得到如下列聯(lián)表:?jiǎn)挝唬喝诵詣e身高合計(jì)低于170cm不低于170cm女14721男81119合計(jì)221840(1)依據(jù)的獨(dú)立性檢驗(yàn),能否認(rèn)為該中學(xué)高三年級(jí)學(xué)生的性別與身高有關(guān)聯(lián)?解釋所得結(jié)論的實(shí)際含義.(2)得到的結(jié)論與第5題的一致嗎?如果不一致,你認(rèn)為原因是什么.7.【解析】(1)零假設(shè)為:性別與身高沒(méi)有關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷不成立,因此可以認(rèn)為成立,即該中學(xué)高三年級(jí)學(xué)生的性別與身高沒(méi)有關(guān)聯(lián).(2)不一致.原因是根據(jù)全面調(diào)查數(shù)據(jù)作判斷,其結(jié)論是確定且準(zhǔn)確的.而根據(jù)樣本數(shù)據(jù)作推斷,會(huì)因?yàn)殡S機(jī)性導(dǎo)致樣本數(shù)據(jù)不具代表性,從而不能得出和全面調(diào)查一致的結(jié)論.8.調(diào)查某醫(yī)院一段時(shí)間內(nèi)嬰兒出生的時(shí)間和性別的關(guān)聯(lián)性,得到如下的列聯(lián)表:?jiǎn)挝唬喝诵詣e出生時(shí)間合計(jì)晚上白天女243155男82634合計(jì)325789依據(jù)的獨(dú)立性檢驗(yàn),能否認(rèn)為性別與出生時(shí)間有關(guān)聯(lián)?解釋所得結(jié)論的實(shí)際含義.8.【解析】零假設(shè)為:性別與出生時(shí)間沒(méi)有關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到.根據(jù)的獨(dú)立性檢驗(yàn),我們可以推斷不成立,即認(rèn)為性別與出生時(shí)間有關(guān)聯(lián),該推斷犯錯(cuò)誤的概率不超過(guò)0.1.女?huà)氤錾跁娚虾桶滋斓念l率分別為和;男嬰出生在晩上和白天的頻率分別為和.由此可見(jiàn)男嬰出生在白天的頻率明顯高于女?huà)氤錾诎滋斓念l率.根據(jù)頻率穩(wěn)定于概率的原理,可以推斷男嬰出生在白天的概率比女?huà)氤錾诎滋斓母怕蚀螅?.對(duì)例1列聯(lián)表8.3-2中的數(shù)據(jù),依據(jù)的獨(dú)立性檢驗(yàn),我們已經(jīng)知道獨(dú)立性檢驗(yàn)的結(jié)論是學(xué)校和成績(jī)無(wú)關(guān).如果表8.3-2中所有數(shù)據(jù)都擴(kuò)大為原來(lái)的10倍,在相同的檢驗(yàn)標(biāo)準(zhǔn)下,再用獨(dú)立性檢驗(yàn)推斷學(xué)校和數(shù)學(xué)成績(jī)之間的關(guān)聯(lián)性,結(jié)論還一樣嗎?請(qǐng)你試著解釋其中的原因.9.【解析】在例1中將表8.3-2中所有的數(shù)據(jù)都擴(kuò)大為原來(lái)的10倍,根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得.依據(jù)的獨(dú)立性檢驗(yàn),可以推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率之間存在差異.與例2中的結(jié)論不一樣,原因是每個(gè)數(shù)據(jù)都擴(kuò)大為原來(lái)的10倍,相當(dāng)于樣本量變大為原來(lái)的10倍,導(dǎo)致推斷結(jié)論發(fā)生了變化.復(fù)習(xí)參考題8(第138頁(yè))1.變量x與y的觀測(cè)數(shù)據(jù)的散點(diǎn)圖如圖所示,據(jù)此可以判斷變量x與y之間()A.很可能存在負(fù)相關(guān) B.一定存在正相關(guān)C.很可能存在正相關(guān) D.一定不存在負(fù)相關(guān)1.【答案】C【解析】由散點(diǎn)圖知,以后的函數(shù)值,隨著x的變大而變大,所以呈正相關(guān)性;而的函數(shù)值增加緩慢,或者數(shù)據(jù)不足以說(shuō)明一定是增加的,故x與y的關(guān)系是很可能存在正相關(guān).故選:C2.對(duì)于變量Y和變量x的成對(duì)樣本觀測(cè)數(shù)據(jù),用一元線性回歸模型得到經(jīng)驗(yàn)回歸模型,對(duì)應(yīng)的殘差如下圖所示,模型誤差()A.滿足一元線性回歸模型的所有假設(shè)B.不滿足一元線性回歸模型的的假設(shè)C.不滿足一元線性回歸模型的假設(shè)D.不滿足一元線性回歸模型的和的假設(shè)【答案】C【解析】用一元線性回歸模型得到經(jīng)驗(yàn)回歸模型,根據(jù)對(duì)應(yīng)的殘差圖,殘差的均值可能成立,但明顯殘差的軸上方的數(shù)據(jù)更分散,不滿足一元線性回歸模型,正確的只有C.故選:C.3.根據(jù)分類(lèi)變量x與y的觀測(cè)數(shù)據(jù),計(jì)算得到.依據(jù)的獨(dú)立性檢驗(yàn),結(jié)論為()A.變量x與y不獨(dú)立B.變量x與y不獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過(guò)0.05C.變量x與y獨(dú)立D.變量x與y獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過(guò)0.053.【答案】D【解析】時(shí),,所以在犯錯(cuò)概率不超過(guò)0.05時(shí)變量x與獨(dú)立.故選:D0.10.050.010.0050.0012.7063.8416.6357.87910.8284.8.3節(jié)例4中推斷吸煙與患肺癌是有關(guān)聯(lián)的,能用一元線性回歸模型建立它們之間的關(guān)系嗎?為什么?4.【解析】不能.因?yàn)槲鼰熀突挤伟┦欠诸?lèi)變量,一元線性回歸模型主要是刻畫(huà)數(shù)值變量之間的關(guān)系.觀察吸煙和患肺癌的散點(diǎn)圖可以發(fā)現(xiàn),無(wú)論有多少個(gè)觀測(cè),在圖中最多只有4個(gè)點(diǎn),沒(méi)有線性趨勢(shì).5.根據(jù)8.1.2節(jié)例3中的數(shù)據(jù),建立臂展關(guān)于身高的經(jīng)驗(yàn)回歸模型,畫(huà)出殘差圖,描述殘差圖的特點(diǎn).5.由例3知臂展與身高正線性相關(guān),因此可以用一元線性回歸模型刻畫(huà).用表示臂展,表示身高,利用統(tǒng)計(jì)軟件計(jì)算,可得臂展關(guān)于身高的經(jīng)驗(yàn)回歸模型為.殘差圖如圖所示.身高/cm臂展/cm預(yù)測(cè)值/cm殘差/cm身高/cm臂展/cm預(yù)測(cè)值/cm殘差/cm173169167.831800.20179170173.86-3.86176166170.85-4.85175172169.842.16176165170.85-5.85179177173.863843.16182174176.87-2.87169162163.81-1.81173166167.83-1.83184189178.8810.12180174174.87-0.86169164163.810.19170169164.82487-6.87169166163.812.19171164165.82-1.82177176171.85485185-1.85173165167.83-2.83178174172.861831841.16殘差圖中除身高為184cm的觀測(cè)(第19個(gè)觀測(cè)),其他點(diǎn)大致均勻分布在橫軸兩側(cè),說(shuō)明模型擬合較好.第19個(gè)觀測(cè)的殘差比較大,建議檢查一下該數(shù)據(jù)在測(cè)量和記錄過(guò)程中是否有誤.6.下表是1896~2016年男子三級(jí)跳遠(yuǎn)奧運(yùn)會(huì)冠軍的成績(jī),請(qǐng)分析這組數(shù)據(jù),能用一元線性回歸模型刻畫(huà)這組數(shù)據(jù)嗎?年份成績(jī)/m年份成績(jī)/m年份成績(jī)/m年份成績(jī)/m189613.71192815.21196416.85199218.17190014.47193215.72196817.39199618.09190414.35193616.00197217.35200017.71190814.92194815.40197617.29200417.79191214.64195216.22198017.35200817.67192014.50195616.35198417.25201217.81192415.53196016.81198817.61201617.866.【解析】先畫(huà)三級(jí)跳遠(yuǎn)成績(jī)與年份之間的散點(diǎn)圖,如圖(1)所示.觀察散點(diǎn)圖,可以看到隨著年份的增大,成績(jī)有增加的趨勢(shì),因此可以考慮用一元線性回歸模型刻畫(huà).利用統(tǒng)計(jì)軟件計(jì)算,可得成績(jī)關(guān)于年份的經(jīng)驗(yàn)回歸模型為,擬合圖見(jiàn)圖(2).殘差圖如圖(3)所示.殘差圖中的點(diǎn)大致均勻分布在軸兩側(cè),且決定系數(shù),說(shuō)明模型擬合較好,因此能使用一元線性回歸模型刻畫(huà)這組數(shù)據(jù).年份成績(jī)/m預(yù)測(cè)值/m殘差/m年份成績(jī)/m預(yù)測(cè)值/m殘差/m189613.7114.27-0.56196416.8516.640.21190014.4714.410.06196817.3916.780.61190414.3514.55-0.20197217.3516.920.43190814.9214.690.23197617.2917.060.23191214.6414.83-0.19198017.3517.200.15192014.515.11-0.61198417.2517.34-0.09192415.5315.250.28198817.6117.480.13192815.2115.39-0.18199218.1717.620.55193215.7215.530.19199618.0917.760.3319361615.670.33200017.7117.90-0.19194815.416.09-0.69200417.7918.04-0.25195216.2216.220.00200817.6718.18-0.51195616.3516.36-0.01201217.8118.32-0.51196016.8116.500.31201617.8618.46-0.607.車(chē)胎凹槽深度是影響汽車(chē)剎車(chē)的因素,汽車(chē)行駛會(huì)導(dǎo)致輪胎胎面磨損.某實(shí)驗(yàn)室通過(guò)試驗(yàn)測(cè)得行駛里程與某品牌輪胎凹槽深度的數(shù)據(jù),請(qǐng)根據(jù)數(shù)據(jù)建立車(chē)胎凹槽深度和汽車(chē)行駛里程的關(guān)系,并解釋模型的含義.行駛里程/萬(wàn)km0.000.641.291.932.573.223.864.515.15輪胎凹槽深度/mm10.028.377.396.485.825.204.554.163.827.先畫(huà)輪胎凹槽深度與行駛里程之間的散點(diǎn)圖,如圖(1)所示.觀察散點(diǎn)圖,可以看到隨著行駛里程的增加,輪胎凹橧深度有減小的趨勢(shì),因此可以考慮用一元線性回歸模型建模.利用統(tǒng)計(jì)軟件計(jì)算,可得輪胎凹槽深度關(guān)于行駛里程的經(jīng)驗(yàn)回歸模型為,擬合圖如圖(2)所示.該模型的決定系數(shù)為0.952,殘差圖如圖(3)所示.從殘差圖可以看到,殘差與行駛里程有非線性關(guān)系,因此考慮在模型中引入行駛里程的非線性變換.考慮對(duì)行駛里程作對(duì)數(shù)變換,引入中間值m,令
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥卷錨桿施工方案
- 產(chǎn)品訂購(gòu)運(yùn)輸合同范例
- 做生意合租合同范例
- 農(nóng)場(chǎng)店面轉(zhuǎn)讓合同范例
- 個(gè)人普通住宅出售合同范例
- 云臺(tái)山旅游合同范例
- 充氣泳池采購(gòu)合同范例
- 個(gè)人廣告合同范例
- 剪輯工作合同范例
- 個(gè)人外墻粉刷合同范本
- 化工原理完整(天大版)課件
- 2025年陜西延長(zhǎng)石油有限責(zé)任公司招聘筆試參考題庫(kù)含答案解析
- 《淞滬會(huì)戰(zhàn)》課件
- Excel辦公技巧培訓(xùn)
- 《信息論緒論》課件
- 新時(shí)代大學(xué)生勞動(dòng)教育 課件 第5章 勞動(dòng)素養(yǎng)及其養(yǎng)成
- 2024年度英語(yǔ)課件容貌焦慮
- 初一家長(zhǎng)會(huì)課件96108
- 《企業(yè)文化概述》課件
- 卵巢囊腫中醫(yī)治療
- 廉政教育培訓(xùn)
評(píng)論
0/150
提交評(píng)論