8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

上節(jié)課例1

為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.881771合計(jì)45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計(jì)數(shù)學(xué)成績(jī)學(xué)校

溫故知新

依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷甲校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率,進(jìn)而可以推斷兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間存在差異.【思考】你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?

這一結(jié)論有可能是錯(cuò)誤的.對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.

因此,需要找到一種更為合理的推斷方法判斷兩變量之間有無關(guān)系,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.8.3.2 獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)是假設(shè)檢驗(yàn)中的一種方法,所謂假設(shè)檢驗(yàn),即建立某個(gè)假設(shè),通過樣本數(shù)據(jù)分析,進(jìn)而接受原假設(shè)或者拒絕原假設(shè),從而得出結(jié)論。小概率事件原理:小概率事件是發(fā)生概率一般不超過5%的事件,即小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生.【思考】在原假設(shè)H0成立基礎(chǔ)上小概率事件幾乎不可能發(fā)生,但若通過數(shù)據(jù)分析,發(fā)現(xiàn)小概率事件發(fā)生了,這說明什么問題?【探究】一個(gè)囚犯正在接受法官審判,你是法官.法官的任務(wù)是假定囚犯無罪,但是假如有足夠證據(jù)證明囚犯有罪,則需審判囚犯有罪.1.原假設(shè)是什么?2.備擇(對(duì)立)假設(shè)是什么?3.在什么情況下,法官會(huì)做出正確判決?4.在什么情況下,法官會(huì)做出錯(cuò)誤判決?原假設(shè)是無罪,記為H0.備擇假設(shè)是有罪,記為H1.在無罪的情況下判決無罪,在有罪的情況下判決有罪.在無罪的情況下判決有罪,在有罪的情況下判決無罪.創(chuàng)設(shè)情境假設(shè)檢驗(yàn)就好像一場(chǎng)審判過程,有兩類錯(cuò)誤:陪審團(tuán)審判裁決實(shí)際情況無罪有罪無罪正確錯(cuò)誤有罪錯(cuò)誤正確結(jié)論H0實(shí)際為真H0實(shí)際為假判斷接受H0正確判斷“取偽”錯(cuò)誤判斷拒絕H0“棄真”錯(cuò)誤正確判斷第一類錯(cuò)誤,發(fā)生概率為α第二類錯(cuò)誤,發(fā)生概率為βα與β呈反比關(guān)系假設(shè)檢驗(yàn)可能犯錯(cuò),但犯錯(cuò)概率可控,下面探究如何進(jìn)行假設(shè)檢驗(yàn)(獨(dú)立性檢驗(yàn))。探究新知

考慮以Ω為樣本空間的古典概型.設(shè)X和Y定義在Ω上,取值于{0,1}的成對(duì)分類變量.我們希望判斷變量X和Y之間是否有關(guān)聯(lián),即X對(duì)Y是否有影響(或Y對(duì)X是否有影響).我們需要判斷下面的假定關(guān)系是否成立,通常稱H0為零假設(shè)或原假設(shè).什么叫做分類變量X和Y獨(dú)立?{X=0}與{Y=0}獨(dú)立{X=0}與{Y=1}獨(dú)立{X=1}與{Y=0}獨(dú)立{X=1}與{Y=1}獨(dú)立如果這些性質(zhì)成立,我們就稱分類變量X和Y獨(dú)立.假定我們通過簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表如下:n=a+b+c+db+da+c合計(jì)c+ddcX=1a+bbaX=0Y=1Y=0合計(jì)YX

P(X=0)和P(Y=0)對(duì)應(yīng)的頻率的乘積為{X=0,Y=0}發(fā)生的頻數(shù)的期望值為原假設(shè)成立,下面四個(gè)量值不應(yīng)該太大構(gòu)造一個(gè)合理科學(xué)的統(tǒng)計(jì)量卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量有什么用呢?思考:那么,究竟

χ2大到什么程度,可以推斷H0不成立呢?

統(tǒng)計(jì)學(xué)家建議,用隨機(jī)變量

χ2取值

的大小作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時(shí)推斷H0不成立,否則認(rèn)為H0成立.

根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,上面的想法可以通過確定一個(gè)與H0相矛盾的小概率事件來實(shí)現(xiàn).α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值:例如,對(duì)于一個(gè)小概率值α=0.05,有如下的具體檢驗(yàn)規(guī)則:(1)當(dāng)時(shí),我們推斷H0不成立,即認(rèn)為X與Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過0.05;

(2)當(dāng)時(shí),我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X與Y獨(dú)立.基于小概率值α的檢驗(yàn)規(guī)則:

這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).典例分析:思考:依據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異?881771合計(jì)45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計(jì)數(shù)學(xué)成績(jī)學(xué)校

解:零假設(shè)為H0:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無差異根據(jù)表中的數(shù)據(jù),計(jì)算得到根據(jù)小概率值α=0.1的卡方獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立.因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒有差異.思考:為何基于同一組數(shù)據(jù)的分析,卻得出了不同的結(jié)論,你能說明其中的原因嗎?事實(shí)上,如前所述,法一只是根據(jù)一個(gè)樣本的兩個(gè)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異的結(jié)論,并沒有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以那里的推斷依據(jù)不太充分.探究新知在法二中,我們用χ2獨(dú)立性檢驗(yàn)對(duì)零假設(shè)H0進(jìn)行了檢驗(yàn).通過計(jì)算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對(duì)應(yīng)的臨界值2.706,因此認(rèn)為沒有充分證據(jù)推斷H0不成立,所以接受H0,推斷出校的數(shù)學(xué)成績(jī)優(yōu)秀率沒有差異的結(jié)論.這個(gè)檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個(gè)頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的.因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異的結(jié)論是不可靠的.【例1】第24屆冬季奧林匹克運(yùn)動(dòng)會(huì)于2022年在北京舉辦,為了解某城市居民對(duì)冰雪運(yùn)動(dòng)的關(guān)注情況,隨機(jī)抽取了該市100人進(jìn)行調(diào)查統(tǒng)計(jì),得到如下2×2列聯(lián)表:

關(guān)注冰雪運(yùn)動(dòng)不關(guān)注冰雪運(yùn)動(dòng)合計(jì)男451055女252045合計(jì)7030100下列說法正確的是參考公式:χ2=

,其中n=a+b+c+d.典例分析附表:α0.1000.0500.0100.001xα2.7063.8416.63510.828A.依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),認(rèn)為“關(guān)注冰雪運(yùn)動(dòng)與性別有關(guān)”B.依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),認(rèn)為“關(guān)注冰雪運(yùn)動(dòng)與性別無關(guān)”C.在犯錯(cuò)誤的概率不超過1%的前提下,認(rèn)為“關(guān)注冰雪運(yùn)動(dòng)與性別無關(guān)”D.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“關(guān)注冰雪運(yùn)動(dòng)與性別有關(guān)”√【練】(1)(多選)某機(jī)構(gòu)通過抽樣調(diào)查,利用2×2列聯(lián)表和χ2統(tǒng)計(jì)量研究患肺病是否與吸煙有關(guān),計(jì)算得χ2=3.305,經(jīng)查對(duì)臨界值表知P(χ2≥2.706)≈0.10,P(χ2≥3.841)≈0.05,現(xiàn)給出四個(gè)結(jié)論,其中正確的是A.因?yàn)棣?>2.706,故依據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),我們認(rèn)為“患肺

病與吸煙有關(guān)”B.因?yàn)棣?<3.841,故依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),認(rèn)為“患肺病

與吸煙有關(guān)”C.因?yàn)棣?>2.706,故依據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),我們認(rèn)為“患肺

病與吸煙無關(guān)”D.因?yàn)棣?<3.841,故依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),認(rèn)為“患肺病

與吸煙無關(guān)”√√(2)(多選)某研究所為了檢驗(yàn)新開發(fā)的疫苗的預(yù)防作用,對(duì)1000名注射了疫苗的人與另外1000名未注射疫苗的人的一年的健康記錄進(jìn)行比較,并提出假設(shè):這種疫苗不能起到預(yù)防該疾病的作用,并計(jì)算出P(χ2≥6.635)≈0.01,則下列說法不正確的是A.這種疫苗能起到預(yù)防該疾病的作用的有效率為1%B.若某人未使用該疫苗,則他在半年內(nèi)有99%的可能性得該疾病C.依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),認(rèn)為這種疫苗能起到預(yù)防該疾病

的作用D.在犯錯(cuò)誤的概率不超過0.01的前提下,認(rèn)為這種疫苗能起到預(yù)防該疾

病的作用√√【例2】某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表.1361152169636675215治愈未治愈合計(jì)療效合計(jì)乙甲療法

根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值α=0.005的χ2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩種療法效果沒有差異.

療法療效合計(jì)未治愈治愈乙66369甲155267合計(jì)21115136療法療效合計(jì)治愈未治愈甲521567乙63669合計(jì)11521136

典例分析吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965【練】為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡(jiǎn)單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對(duì)樣本觀測(cè)數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如下表所示.依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).解:零假設(shè)H0:吸煙與患肺癌之間無關(guān)聯(lián)根據(jù)小概率值α=0.001的卡方獨(dú)立性檢驗(yàn),推斷H0不成立,因此可以吸煙與患肺癌之間有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001.根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到用頻率計(jì)算再次進(jìn)行比較:典例分析不吸煙者中患肺癌的頻率為吸煙者中患肺癌的頻率為兩者的比值為可見,在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上.于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者中患肺癌的概率明顯大于不吸煙者中患肺癌的概率,即吸煙更容易引發(fā)肺癌.(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.歸納總結(jié)應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題主要環(huán)節(jié):注意,上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同的情況進(jìn)行調(diào)整.例如,在有些時(shí)候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.思考:獨(dú)立性檢驗(yàn)的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?概率辨析反證法獨(dú)立性檢驗(yàn)在某種假設(shè)H0下,如果推出一個(gè)矛盾,則證明H0不成立;若未能推出矛盾,不能對(duì)H0下任何結(jié)論,即反證法不成功在零假設(shè)H0下,如果出現(xiàn)一個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論