高中數(shù)學(xué)《列聯(lián)表與獨(dú)立性檢驗(yàn)》教案_第1頁
高中數(shù)學(xué)《列聯(lián)表與獨(dú)立性檢驗(yàn)》教案_第2頁
高中數(shù)學(xué)《列聯(lián)表與獨(dú)立性檢驗(yàn)》教案_第3頁
高中數(shù)學(xué)《列聯(lián)表與獨(dú)立性檢驗(yàn)》教案_第4頁
高中數(shù)學(xué)《列聯(lián)表與獨(dú)立性檢驗(yàn)》教案_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

8.3列聯(lián)表與獨(dú)立性檢驗(yàn)

(第一課時分類變量與列聯(lián)表)

課標(biāo)要求素養(yǎng)要求

1.通過實(shí)例,理解2X2列聯(lián)表的統(tǒng)計(jì)意義.通過學(xué)習(xí)2X2列聯(lián)表,提升

2.理解判斷兩個分類變量是否有關(guān)系的常用數(shù)學(xué)抽象、直觀想象及數(shù)據(jù)分

方法.析素養(yǎng).

【課前預(yù)習(xí)】

新知探究

A情境引入

飲用水的質(zhì)量是人類普遍關(guān)心的問題,根據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518人中,身

體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.

問題人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?

提示我們可以根據(jù)2X2列聯(lián)表找到人的身體健康與飲用水之間的關(guān)系,也就

是本節(jié)課所要學(xué)習(xí)的內(nèi)容.

上知識梳理

1.分類變量

這里所說的變量和值不一定是具體的數(shù)值,例如:性別變量,其取值為男和女

兩種

我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變

量稱為分類變量,分類變量的取值可以用實(shí)數(shù)表示.

2.2X2列聯(lián)表

在實(shí)踐中,由于保存原始數(shù)據(jù)的成本較高,人們經(jīng)常按研究問題的需要,將數(shù)

據(jù)分類統(tǒng)計(jì),并做成表格加以保存,我們將這類數(shù)據(jù)統(tǒng)計(jì)表稱為2X2列聯(lián)表,

2X2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).

一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{xi,x』和{山,y2},

其2X2列聯(lián)表為

yiY2合計(jì)

Xiaba+b

x2cdc+d

合計(jì)a+cb+da+b+c+d

3.等高堆積條形圖

等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常

用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征,依據(jù)頻率穩(wěn)定于概率的原理,我們

可以推斷結(jié)果.

拓展深化

[微判斷]

1.分類變量中的變量與函數(shù)中的變量是同一概念.(X)

提示分類變量中的變量是指一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì),與函數(shù)中的變量

不是同一概念.

2,列聯(lián)表中的數(shù)據(jù)是兩個分類變量的頻數(shù).(J)

3.列聯(lián)表、頻率分析法、等高條形圖都可初步分析兩分類變量是否有關(guān)

系.(V)

[微訓(xùn)練]

1.下列不是分類變量的是()

A.近視B.成績

C.血壓D.飲酒

解析近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,

飲酒變量有飲酒與不飲酒兩種類別.故選B.

答案B

2.某校為了檢驗(yàn)高中數(shù)學(xué)新課程改革的成果,在兩個班進(jìn)行教學(xué)方式的對比試

驗(yàn),兩個月后進(jìn)行了一次檢測,試驗(yàn)班與對照班成績統(tǒng)計(jì)如2X2列聯(lián)表所示

(單位:人),則其中m=,n=.

80分及80分以

80分以下合計(jì)

試驗(yàn)班321850

對照班24m50

合計(jì)5644n

24+m=50,

解析由題意得,

56+44=n,

m=26,

解得

,n=100.

答案26100

[微思考]

1.是否吸煙、是否患肺癌是什么變量?

提示分類變量.

2.吸煙與患肺癌之間的關(guān)系還是前面我們研究的線性相關(guān)關(guān)系嗎?

提示不是.

【課堂互動】

題型一用2X2列聯(lián)表分析兩分類變量間的關(guān)系

【例1】在對人們飲食習(xí)慣的一次調(diào)查中,共調(diào)查了124人,其中六十歲以

上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為

主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另

外33人則以肉類為主.請根據(jù)以上數(shù)據(jù)作出飲食習(xí)慣與年齡的列聯(lián)表,并利用

率與黑判斷二者是否有關(guān)系?

解2X2列聯(lián)表如下:

年齡在六十歲年齡在六十

合計(jì)

以上歲以下

飲食以蔬菜為主432164

飲食以肉類為主273360

合計(jì)7054124

將表中數(shù)據(jù)代入公式得

a43c27

—□7=77=0-671875.~r;=—=0.45.

a+b64c+d60

顯然二者數(shù)據(jù)具有較為明顯的差距,據(jù)此可以在某種程度上認(rèn)為飲食習(xí)慣與年

齡有關(guān)系.

規(guī)律方法(1)作2X2列聯(lián)表時,關(guān)鍵是對涉及的變量分清類別.計(jì)算時要準(zhǔn)

確無誤.

(2)利用2X2列聯(lián)表分析兩個分類變量間的關(guān)系時,首先要根據(jù)題中數(shù)據(jù)獲得

2X2列聯(lián)表,然后根據(jù)頻率特征,即將品;與島島與人的值相比,直

觀地反映出兩個分類變量間是否相互影響,但方法較粗劣.

【訓(xùn)練1】假設(shè)有兩個分類變量X與Y,它們的可能取值分別為{x“xj和

{y”yj,其2X2列聯(lián)表為:

□in

tn

則當(dāng)m取下面何值時,X與Y的關(guān)系最弱()

A.8B.9

C.14D.19

解析由10X26g18nb解得所以當(dāng)m=14時,X與Y的關(guān)系最弱.

答案C

題型二用等高堆積條形圖分析兩分類變量間的關(guān)系

【例2】某學(xué)校對高三學(xué)生作了一項(xiàng)調(diào)查發(fā)現(xiàn):在平時的模擬考試中,性格

內(nèi)向的學(xué)生426人中有332人在考前心情緊張,性格外向的學(xué)生594人中有

213人在考前心情緊張,作出等高條形圖,利用圖形判斷考前心情緊張與性格

類型是否有關(guān)系.

解作列聯(lián)表如下:

性格內(nèi)向性格外向合計(jì)

考前心情緊張332213545

考前心情不緊張94381475

合計(jì)4265941020

相應(yīng)的等高堆積條形圖如圖所示:

1=]性格外向

(=3性格內(nèi)向

考前心情緊張考前心情不緊張

圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的人數(shù)的比例,

從圖中可以看出考前心情緊張的樣本中性格內(nèi)向的人數(shù)占的比例比考前心情不

緊張樣本中性格內(nèi)向的人數(shù)占的比例高,可以認(rèn)為考前心情緊張與性格類型有

關(guān).

規(guī)律方法利用等高堆積條形圖判斷兩個分類變量是否相關(guān)的步驟:

【訓(xùn)練2】在調(diào)查的480名男人中有38人患色盲,520名女人中有6名患色

盲,試?yán)脠D形來判斷色盲與性別是否有關(guān)?

解根據(jù)題目給出的數(shù)據(jù)作出如下的列聯(lián)表:

根據(jù)列聯(lián)表作出相應(yīng)的等高堆積條形圖:

不色自

色甘

從等高堆積條形圖來看,在男人中患色盲的比例要比在女人中患色盲的比例大

得多,因此,我們認(rèn)為患色盲與性別是有關(guān)系的.

【素養(yǎng)達(dá)成】

一、素養(yǎng)落地

1.通過本節(jié)課的學(xué)習(xí),進(jìn)一步提升數(shù)學(xué)抽象、直觀想象及數(shù)據(jù)分析素養(yǎng).

2.列聯(lián)表與等高堆積條形圖

列聯(lián)表由兩個分類變量之間頻率大小的差異說明這兩個變量之間是否有相關(guān)關(guān)

系,而利用等高堆積條形圖能形象直觀地反映它們之間的差異,進(jìn)而推斷它們

之間是否具有相關(guān)關(guān)系.

二、素養(yǎng)訓(xùn)練

1.與表格相比,能更直觀地反映出相關(guān)數(shù)據(jù)總體狀況的是()

A.列聯(lián)表B.散點(diǎn)圖

C.殘差圖D.等高堆積條形圖

答案D

2.在一項(xiàng)有關(guān)醫(yī)療保健的社會調(diào)查中,發(fā)現(xiàn)調(diào)查的男性為530人,女性為670

人,其中男性中喜歡吃甜食的為117人,女性中喜歡吃甜食的為492人,則性

別與喜歡吃甜食的2X2列聯(lián)表為_______.

答案

喜歡吃甜食不喜歡吃甜食合計(jì)

男117413530

女492178670

合計(jì)6095911200

3.根據(jù)如圖所示的等高堆積條形圖可知吸煙與患肺病關(guān)系(填“有”或

“沒有”).

0.8

().7

().6□不患肺病

().5口患肺病

().1

0.3

0.2

不吸煙吸煙

解析從等高條形圖上可以明顯地看出吸煙患肺病的頻率遠(yuǎn)遠(yuǎn)大于不吸煙患肺

病的頻率.

答案有

4.(多空題)下面是一個2X2列聯(lián)表:

yiY2合計(jì)

X1a2173

X222527

合計(jì)b46100

則表中a=,b=

a+21=73,a=52,

解析由題意得解得

a+2=b,b=54.

答案5254

5.為考察某種藥物預(yù)防疾病的效果進(jìn)行動物試驗(yàn),得到如下列聯(lián)表:

患病未患病合計(jì)

服用藥104555

未服用藥203050

合計(jì)3075105

試用等高條形圖分析服用藥和患病之間是否有關(guān)系.

解根據(jù)列聯(lián)表所給的數(shù)據(jù)可得出服用藥患病的頻率為二比0.18,未服用藥患

病的頻率為*=0.4,兩者的差距是10.18—0.41=0.22,兩者相差很大,作出

等高條形圖如圖所示,因此服用藥與患病有關(guān)系.

【課后作業(yè)】

基礎(chǔ)達(dá)標(biāo)

一、選擇題

1.觀察下列各圖,其中兩個分類變量X,y之間關(guān)系最強(qiáng)的是()

解析觀察等高條形圖發(fā)現(xiàn)■^和相差越大,就判斷兩個分類變量之間

Xi-rYiX2?72

關(guān)系越強(qiáng).

答案D

2.可以粗略地判斷兩個分類變量是否有關(guān)系的是()

A.散點(diǎn)圖B.等高堆積條形圖

C.殘差圖D.以上都不對

解析用等高堆積條形圖可以粗略地判斷兩個分類變量是否有關(guān)系,體現(xiàn)了數(shù)

形結(jié)合思想,但是無法給出結(jié)論的可信程度,故選B.

答案B

3.(多選題)分類變量X和Y的列聯(lián)表如下:

合計(jì)

yiy2

X1aba+b

Cdc+d

X2

合計(jì)a+cb+da+b+c+d

則下列說法不正確的是()

A.ad-be越小,說明X與Y關(guān)系越弱

B.ad-bc越大,說明X與Y關(guān)系越強(qiáng)

C.(ad—beT越大,說明X與Y關(guān)系越強(qiáng)

D.(ad—be)?越接近于0,說明X與Y關(guān)系越強(qiáng)

解析|ad—bc|越小,說明X與Y關(guān)系越弱,|ad—bc|越大,說明X與Y關(guān)系

越強(qiáng).

答案ABD

4.己知兩分類變量的列聯(lián)表如下:

AA合計(jì)

B2008001000

B180a180+a

合計(jì)380800+a1180+a

最后發(fā)現(xiàn),這兩個分類變量沒有任何關(guān)系,則a的值可能是])

A.200B.720

C.100D.180

解析由于A和B沒有任何關(guān)系,根據(jù)列聯(lián)表可知片;和盛一基本相等,檢

驗(yàn)可知,B滿足條件,故選B.

答案B

5.(多選題)如圖是調(diào)查某地區(qū)男、女中學(xué)生喜歡理科的等高條形圖,陰影部分

表示喜歡理科的百分比,從圖可以看出()

A.性別與喜歡理科無關(guān)

B.女生中喜歡理科的百分比為80%

C.男生比女生喜歡理科的可能性大些

D.男生不喜歡理科的百分比為40%

解析由題圖知女生中喜歡理科的百分比為20%,男生不喜歡理科的百分比為

40%,男生比女生喜歡理科的可能性大些,故A,B不正確,C,D正確.

答案CD

二、填空題

6.某大學(xué)在研究性別與職稱(分正教授、副教授)之間是否有關(guān)系,你認(rèn)為應(yīng)該

收集的數(shù)據(jù)是.

答案男正教授人數(shù),男副教授人數(shù);女正教授人數(shù),女副教授人數(shù)

7.2013年6月11日,中國的“神舟十號”發(fā)射成功,由此許多人認(rèn)為中國進(jìn)

入了航天強(qiáng)國之列,也有許多人持反對意見,為此進(jìn)行了調(diào)查.在參加調(diào)查的

3648名男性公民與3432名女性公民中,持反對意見的男性有1843人、女

性有1672人,在運(yùn)用這些數(shù)據(jù)說明中國“神十”發(fā)射成功是否與中國進(jìn)入航

天強(qiáng)國有關(guān)系時,用下列給出的最具說服力(填序號).

①回歸直線方程;②平均數(shù)與方差;③等高堆積條形圖.

解析由于參加調(diào)查的公民按性別被分成兩組,而且每一組又被分成兩種情

況:認(rèn)為有關(guān)與無關(guān),故該資料取自完全隨機(jī)統(tǒng)計(jì),符合2X2列聯(lián)表的要求,

應(yīng)用等高堆積條形圖最具說服力.

答案③

8.某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機(jī)抽取了

100名電視觀眾,相關(guān)的數(shù)據(jù)如下表所示:

文藝節(jié)目新聞節(jié)目合計(jì)

20至40歲401858

大于40歲152742

合計(jì)5545100

由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關(guān):(填

“是”或“否”).

解析因?yàn)樵?0至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而大于40

歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即占=卷,三=篇兩者相

a十b58c+d42

差較大,所以經(jīng)直觀分析,收看新聞節(jié)目的觀眾與年齡是有關(guān)的.

答案是

三、解答題

9.為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對病人組和對照組的

尿液作尿棕色素定性檢查,結(jié)果如下:

組別陽性數(shù)陰性數(shù)合計(jì)

鉛中毒病人29736

對照組92837

合計(jì)383573

試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數(shù)有無

差別,鉛中毒病人與尿棕色素為陽性是否有關(guān)系?

解等高條形圖如圖所示:

其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻

率.

由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明

顯,因此鉛中毒病人與尿棕色素為陽性有關(guān)系.

10.當(dāng)某礦石粉廠生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)就有部分工人患職業(yè)性皮膚

炎.在生產(chǎn)季節(jié)期間,隨機(jī)抽取車間工人抽血化驗(yàn),75名穿新防護(hù)服的車間工

人中5例陽性,70例陰性,28名穿舊防護(hù)服的中間工人中10例陽性,18例陰

性,請用圖形判定這種新防護(hù)服對預(yù)防工人職業(yè)性皮膚炎是否有效.(注:顯陰

性即未患皮膚炎)

解由題目所給的數(shù)據(jù)得2義2列聯(lián)表:

陽性例數(shù)陰性例數(shù)合計(jì)

穿新防護(hù)服57075

穿舊防護(hù)服101828

合計(jì)1588103

相應(yīng)的等高條形圖如圖所示.

圖中兩個深色條的高分別表示穿新、舊防護(hù)服樣本中呈陽性的頻率,從圖中可

以看出,穿舊防護(hù)服呈陽性的頻率高于穿新防護(hù)服呈陽性的頻率.因此,可以

認(rèn)為新防護(hù)服比舊防護(hù)服對預(yù)防這種皮膚炎有效.

能力提升

11.在2X2列聯(lián)表中,兩個比值相差越大,兩個分類變量有關(guān)系的可能性就越

大,那么這兩個比值為()

A,a+b與c+dB.二^與

c+da+b

廠a」ca.c

D.與二^

a十db+cb十da+c

acac+ad_ac-bead—be

解析由題意,——

a+bc+d(a+b)(c+d)(a+b)(c+d)

因?yàn)閘ad—bc|的值越大,兩個分類變量有關(guān)系的可能性就越大,故選A.

答案A

12.為了研究子女吸煙與父母吸煙的關(guān)系,調(diào)查了一千多名青少年及其家長,

數(shù)據(jù)如下:

子女吸煙子女不吸煙合計(jì)

父母吸煙237678915

父母不吸煙83522605

合計(jì)32012001520

利用等高條形圖判斷父母吸煙對子女吸煙是否有影響?

由圖形觀察可以看出父母吸煙者中子女吸煙的比例要比父母不吸煙者中子女吸

煙的比例高,因此可以在某種程度上認(rèn)為“子女吸煙與父母吸煙有關(guān)系”.

創(chuàng)新猜想

13.(多選題)已知兩個分類變量X,Y,它們的取值分別為反,xj和{y”y2},

ac

B---------------

a+bc+d

C—也—心—也—

*a+b+c+da+b+c+d

D—也—%—山—

'a+b+c+da+b+c+d

解析因?yàn)榉诸愖兞縓,Y沒有關(guān)系,所以米化簡得ad-bc,所以

A,B正確,C,D顯然不正確.

答案AB

14.(多空題)下表是關(guān)于男嬰與女嬰出生時間調(diào)查的列聯(lián)表:

晚上白天合計(jì)

男嬰45AB

女嬰E35C

合計(jì)98D180

那么,A=,B=,C=,D=E=

'45+E=98,,A=47,

98+D=180,B=92,

解析由列聯(lián)表知識得<A+35=D,解得vC=88,

E+35=C,D=82,

<B+C=180,、E=53.

答案4792888253

8.3列聯(lián)表與獨(dú)立性檢驗(yàn)

(第二課時獨(dú)立性檢驗(yàn))

課標(biāo)要求素養(yǎng)要求

了解隨機(jī)變量Xz的意義,通過對典型

通過運(yùn)用列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn),

案例分析,了解獨(dú)立性檢驗(yàn)的基本思想

提升數(shù)學(xué)抽象及數(shù)據(jù)分析素養(yǎng).

和方法.

【課前預(yù)習(xí)】

新知探究

A情境引入

山東省教育廳大力推行素質(zhì)教育,增加了高中生的課外活動時間,某校調(diào)查了

學(xué)生的課外活動方式,結(jié)果整理成下表:

體育文娛合計(jì)

男生210230440

女生60290350

合計(jì)270520790

問題如何判定“喜歡體育還是文娛與性別是否有聯(lián)系”?

提示可通過表格與圖形進(jìn)行直觀分析,也可通過統(tǒng)計(jì)分析定量判斷.

,知識梳理

1.臨界值

X2統(tǒng)計(jì)量也可以用來作相關(guān)性的度量.X2越小說明變量之間越獨(dú)立,X2越

大說明變量之間越相關(guān)

X=<…忽略X2的實(shí)際分布與該近似分布的

(a-rb)(c十d)(a+c)(b十d)

誤差后,對于任何小概率值可以找到相應(yīng)的正實(shí)數(shù)心,使得P(x2,xa)=

a成立.我們稱r為a的臨界值,這個臨界值就可作為判斷X?大小的標(biāo)

準(zhǔn).

2.獨(dú)立性檢驗(yàn)

基于小概率值a的檢驗(yàn)規(guī)則是:

當(dāng)x22x。時,我們就推斷H。不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的

概率不超過a;

當(dāng)x2〈xu時,我們沒有充分證據(jù)推斷H。不成立,可以認(rèn)為X和Y獨(dú)立.

這種利用x2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為x2獨(dú)立性檢驗(yàn),

讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn)(testofindependence).

下表給出了乂2獨(dú)立性檢驗(yàn)中幾個常用的小概率值和相應(yīng)的臨界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

3.應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題的大致步驟

(1)提出零假設(shè)H。:X和Y相互獨(dú)立,并給出在問題中的解釋;

⑵根據(jù)抽樣數(shù)據(jù)整理出2X2列聯(lián)表,計(jì)算乂?的值,并與臨界值人比較;

⑶根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論;

⑷在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y問

的影響規(guī)律.

拓展深化

[微判斷]

1.概率值。越小,臨界值Xu越大.(J)

2.獨(dú)立性檢驗(yàn)的思想類似于反證法.(J)

3.獨(dú)立性檢驗(yàn)的結(jié)論是有多大的把握認(rèn)為兩個分類變量有關(guān)系.(J)

[微訓(xùn)練]

1.如果根據(jù)小概率a=0.01的乂2檢測試驗(yàn),認(rèn)為H。成立,那么具體算出的

數(shù)據(jù)滿足()

附表:

a0.050.0250.0100.0050.001

Xa3.8415.0246.6357.87910.828

A.X2>6.635B.X2>5.024

C.X2>7.879D.X2>3.841

答案A

2.某校為了研究“學(xué)生的性別”和“對待某一活動的態(tài)度”是否有關(guān),運(yùn)用

2X2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn),經(jīng)計(jì)算X2=7.069,則認(rèn)為“學(xué)生性別與支持某

項(xiàng)活動有關(guān)系”的犯錯誤的概率不超過()

A.0.1%B.1%

C.99%D.99.9%

解析VX2=7.069>6.635=x。?!???認(rèn)為“學(xué)生性別與支持某項(xiàng)活動有關(guān)系”

的犯錯誤的概率不超過1%.

答案B

[微思考]

1.有人說:“在犯錯誤的概率不超過0.01的前提下認(rèn)為吸煙和患肺病有關(guān),

是指每100個吸煙者中就會有99個患肺病的.”你認(rèn)為這種觀點(diǎn)正確嗎?為什

么?

提示觀點(diǎn)不正確.犯錯誤的概率不超過0.01說明的是吸煙與患肺病有關(guān)的程

度,不是患肺病的百分?jǐn)?shù).

2,應(yīng)用獨(dú)立性檢驗(yàn)的基本思想對兩個變量間的關(guān)系作出的推斷一定是正確的

嗎?

提示不一定.所有的推斷只代表一種可能性,不代表具體情況.

【課堂互動】

題型一有關(guān)“相關(guān)的檢驗(yàn)”

【例1】某校對學(xué)生課外活動進(jìn)行調(diào)查,結(jié)果整理成下表,用你所學(xué)過的知

識進(jìn)行分析,能否在犯錯誤的概率不超過0.005的前提下,認(rèn)為“喜歡體育還

是文娛與性別有關(guān)系”?

體育文娛合計(jì)

男生212344

女生62935

合計(jì)275279

解零假設(shè)為H。:喜歡體育還是喜歡文娛與性別沒有關(guān)系

a=21>b=23,c=6,d=29,n=79,

n(ad-be)?

(a+b)(c+d)(a+c)(b+d)

79X⑵X29—23X6)2

(

44X35X27X52~-^8.106>7.879=X0.K>5.

根據(jù)小概率值Q=0.005的xz獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為喜歡

體育還是喜歡文娛與性別有關(guān)系,此推斷犯錯誤的概率不大于0.005.

規(guī)律方法獨(dú)立性檢驗(yàn)的具體做法

①根據(jù)實(shí)際問題的需要確定允許推斷“兩個分類變量有關(guān)系”犯錯誤的概率的

上界a,然后查表確定臨界值Xa.

②利用公式x=(a+b)(b+d)計(jì)算上

2

③如果x>Xfl,則“X與Y有關(guān)系”這種推斷犯錯誤的概率不超過a;否則,

就認(rèn)為在犯錯誤的概率不超過a的前提下不能推斷“X與Y有關(guān)系”,或者在

樣木數(shù)據(jù)中沒有發(fā)現(xiàn)足夠的證據(jù)支持結(jié)論“X與Y有關(guān)系”.

【訓(xùn)練1】打鼾不僅影響別人休息,而且可能與患某種疾病有關(guān).下表是一

次調(diào)查所得的數(shù)據(jù):

患心臟病未患心臟病合計(jì)

每一晚都打鼾30224254

不打鼾2413551S79

合計(jì)5415791633

根據(jù)獨(dú)立性檢驗(yàn),能否在犯錯誤的概率不超過0.001的前提下認(rèn)為每一晚都打

鼾與患心臟病有關(guān)系?

解零假設(shè)為Ho:打鼾與患心臟病無關(guān)系

由列聯(lián)表中的數(shù)據(jù),得

21633X(30義1355—224X24)'

254X1379X54X1579

268.033>10.828=Xo.ooi?

根據(jù)小概率值Q=0.001的x2獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為打鼾

與患心臟病有關(guān)系,此推斷犯錯誤的概率不大于0.00L

題型二有關(guān)“無關(guān)的檢驗(yàn)”

【例2】為了探究學(xué)生選報(bào)文、理科是否與對外語的興趣有關(guān),某同學(xué)調(diào)查

了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對外語有興趣的有138人,無

興趣的有98人,文科生對外語有興趣的有73人,無興趣的有52人.試分析學(xué)

生選報(bào)文、理科與對外語的興趣是否有關(guān)?

解零假設(shè)為乩:選報(bào)文、理科與對外語的興趣無關(guān).

列出2X2列聯(lián)表

理文合計(jì)

有興趣13873211

無興趣9852150

合計(jì)236125361

代入公式得x2的觀測值

2361X(138X52-73X98)2?八

x-=--------------------------------------871X101

236X125X211X150,

V1.871X10'J,<2.706=x(n,

根據(jù)小概率值Q=0.1的x2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H。不成立,即選

報(bào)文、理科與對外語的興趣無關(guān).

規(guī)律方法獨(dú)立性檢驗(yàn)的關(guān)注點(diǎn)

在2X2列聯(lián)表中,如果兩個分類變量沒有關(guān)系,則應(yīng)滿足ad—bcgO,因此

|ad-bc|越小,關(guān)系越弱;|ad—bc|越大,關(guān)系越強(qiáng).

【訓(xùn)練2】某教育機(jī)構(gòu)為了研究成年人具有大學(xué)??埔陨蠈W(xué)歷(包括大學(xué)專

科)和對待教育改革態(tài)度的關(guān)系,隨機(jī)抽取了392名成年人進(jìn)行調(diào)查,所得數(shù)據(jù)

如下表所示:

積極支持不太贊成教

合計(jì)

教育改革育改革

大學(xué)??埔陨蠈W(xué)歷39157196

大學(xué)??埔韵聦W(xué)歷29167196

合計(jì)68324392

對于教育機(jī)構(gòu)的研究項(xiàng)目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?

解零假設(shè)為H。:成年人具有大學(xué)??埔陨蠈W(xué)歷(包括大學(xué)??疲┖蛯Υ逃?/p>

革態(tài)度無關(guān).

根據(jù)表中數(shù)據(jù),計(jì)算得

2392X(39X167-157X29)2

x=---------------------------------------78

196X196X68X324

因?yàn)?.78<2.7O6=xo.I,

根據(jù)小概率值a=0.1的x2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H。不成立,所以

我們沒有理由說成年人具有大學(xué)專科以上學(xué)歷(包括大學(xué)??疲┖蛯Υ逃母?/p>

態(tài)度有關(guān).

題型三獨(dú)立性檢驗(yàn)的綜合應(yīng)用

【例3】某高校共有學(xué)生15000人,其中男生10500人,女生4500

人.為調(diào)查該校學(xué)生每周平均體育運(yùn)動時間的情況,采用分層隨機(jī)抽樣的方

法,收集300位學(xué)生每周平均體育運(yùn)動時間(單位:時)的樣本數(shù)據(jù).

(1)應(yīng)收集多少位女生的樣木數(shù)據(jù)?

(2)根據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動時間的頻率分布直方圖

(如圖),其中樣本數(shù)據(jù)的分組區(qū)間為[0,2],(2,4],(4,6],(6,8],(8,

10],(10,12].估計(jì)該校學(xué)生每周平均體育運(yùn)動時間超過4小時的概率.

⑶在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動時間超過4小時,請完成

每周平均體育運(yùn)動時間與性別的列聯(lián)表,并判斷是否認(rèn)為“該校學(xué)生的每周平

均體育運(yùn)動時間與性別有關(guān)”.

附:

a0.1000.0500.0100.005

xu2.7063.8416.6357.879

n(ad-be)2__________

(a+b)(c+d)(a+c)(b+d),

4500

解(D由分層隨機(jī)抽樣可得300X=7肅=90,所以應(yīng)收集90位女生的樣本

10UUU

數(shù)據(jù).

(2)由頻率分布直方圖得學(xué)生每周平均體育運(yùn)動時間超過4小時的頻率為1—

2X(0.100+0.025)=0.75,所以該校學(xué)生每周平均體育運(yùn)動時間超過4小時的

概率的估計(jì)值為0.75.

⑶由(2)知,300位學(xué)生中有300X0.75=225(人)的每周平均體育運(yùn)動時間超

過4小時,75人的每周平均體育運(yùn)動時間不超過4小時.樣本數(shù)據(jù)中有210份

是關(guān)于男生的,90份是關(guān)于女生的,可得每周平均體育運(yùn)動時間與性別的列聯(lián)

表如下:

男生女生合計(jì)

每周平均體育運(yùn)動時453075

間不超過4小時

每周平均體育運(yùn)動時

16560225

間超過4小時

合計(jì)21090300

零假設(shè)為Ho:該校學(xué)生的每周平均體育運(yùn)動時間與性別無關(guān).

結(jié)合列聯(lián)表可算得

2300X(45X60-30X165)2,、

x=75X225X210X90七4.762>3.841=xo.o5.

根據(jù)小概率值Q=0.1的x2獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為“該校

學(xué)生的每周平均體育運(yùn)動時間與性別有關(guān)”,此推斷犯錯誤的概率不大于

0.05.

規(guī)律方法(1)解答此類題目的關(guān)鍵在于正確利用x2=

(a+b)篙7:;;)(b+d)計(jì)算x,的值,再用它與臨界值x.的大小

作比較來判斷假設(shè)檢驗(yàn)是否成立,從而使問題得到解決.

⑵此類題目規(guī)律性強(qiáng),解題比較格式化,填表計(jì)算分析比較即可,要熟悉其計(jì)

算流程,不難理解掌握.

【訓(xùn)練3】某校高三年級在一次全年級的大型考試中,數(shù)學(xué)成績優(yōu)秀和非優(yōu)

秀的學(xué)生中,物理、化學(xué)、總分成績優(yōu)秀的人數(shù)如下表所示,能否在犯錯誤的

概率不超過0.001的前提下認(rèn)為數(shù)學(xué)成績優(yōu)秀與物理、化學(xué)、總分成績優(yōu)秀有

關(guān)系?

物理優(yōu)秀化學(xué)優(yōu)秀總分優(yōu)秀

數(shù)學(xué)優(yōu)秀228225267

數(shù)學(xué)非優(yōu)秀14315699

注:該年級在此次考試中數(shù)學(xué)成績優(yōu)秀的有360人,非優(yōu)秀的有880人.

解零假設(shè)為H。:數(shù)學(xué)成績優(yōu)秀與物理、化學(xué)、總分成績優(yōu)秀都無關(guān)系.

列出數(shù)學(xué)成績與物理成績的2X2列聯(lián)表如下:

物理優(yōu)秀物理非優(yōu)秀合計(jì)

數(shù)學(xué)優(yōu)秀228132360

數(shù)學(xué)非優(yōu)秀143737880

合計(jì)3718691240

將表中數(shù)據(jù)代入公式,得

2

1240X(228X737—132X143)

-^270.l>10.828=x,o)i.

360X880X371X8690

列出數(shù)學(xué)成績與化學(xué)成績的2X2列聯(lián)表如下:

化學(xué)優(yōu)秀化學(xué)非優(yōu)秀合計(jì)

數(shù)學(xué)優(yōu)秀225135360

數(shù)學(xué)非優(yōu)秀156724880

合計(jì)3818591240

將表中數(shù)據(jù)代入公式,得

1240X(225X724-156X135)

2生240.6>10,828

360X880X381X859

=Xo.ooi-

列出數(shù)學(xué)成績與總分成績的2X2列聯(lián)表如下:

總分優(yōu)秀總分非優(yōu)秀合計(jì)

數(shù)學(xué)優(yōu)秀26793360

數(shù)學(xué)非優(yōu)秀99781880

合計(jì)3668741240

將表中數(shù)據(jù)代入公式,得

21240X(267X781—93X99)、…八…

x尸360X880X366X874心486.l>10.828=xo.(wi.

根據(jù)小概率值a=0.001的x2獨(dú)立性檢驗(yàn),我們推斷不成立,即認(rèn)為數(shù)學(xué)

成績優(yōu)秀與物理、化學(xué)、總分成績優(yōu)秀都有關(guān)系,此推斷犯錯誤的概率不大于

0.001.

【素養(yǎng)達(dá)成】

一、素養(yǎng)落地

1.通過本節(jié)課的學(xué)習(xí),提升數(shù)學(xué)抽象及數(shù)據(jù)分析素養(yǎng).

2.對獨(dú)立性檢驗(yàn)思想的理解

獨(dú)立性檢驗(yàn)的基木思想類似于數(shù)學(xué)中的反證法.先假設(shè)“兩個分類變量沒有關(guān)

系”成立,計(jì)算x?的值,如果X?值很大,說明假設(shè)不合理,乂2越大,兩個

分類變量有關(guān)系的可能性越大.

二、素養(yǎng)訓(xùn)練

1.對兩個分類變量A,B的下列說法中正確的個數(shù)為()

①A與B無關(guān),即A與B互不影響;

②A與B關(guān)系越密切,則x2的值就越大;

③X?的大小是判定A與B是否相關(guān)的唯一依據(jù)

A.0B.1

C.2D.3

解析①正確,A與B無關(guān)即A與B相互獨(dú)立;②不正確,乂?的值的大小只是

用來檢驗(yàn)A與B是否相互獨(dú)立;③不正確,例如借助三維柱形圖、二維條形圖

等.故選B.

答案B

2.高二第二學(xué)期期中考試,按照甲、乙兩個班學(xué)生的數(shù)學(xué)成績優(yōu)秀和及格統(tǒng)計(jì)

人數(shù)后,得到如下列聯(lián)表:

優(yōu)秀及格合計(jì)

甲班113445

乙班83745

合計(jì)197190

則x2的觀測值約為()

A.0.600B.0.828

C.2.712D.6.004

義(11X—R4XR)2

解析根據(jù)列聯(lián)表中的數(shù)據(jù),可得.45X45X19X71一皿.故選

A.

答案A

3.考察棉花種子經(jīng)過處理跟生病之間的關(guān)系得到下表數(shù)據(jù):

種子處理種子未處理合計(jì)

得病32101133

不得病61213274

合計(jì)93314407

根據(jù)以上數(shù)據(jù),可得出()

A.種子是否經(jīng)過處理跟是否生病有關(guān)

B.種子是否經(jīng)過處理跟是否生病無關(guān)

C.種子是否經(jīng)過處理決定是否生病

D.以上都是錯誤的

q2407X(32X213-61X101)2

解析由X-=QQYQl/IV1QQV07/1^0.164X2.706—Xo.i>故沒有把握

yd入JJL4入1OO入//4

認(rèn)為種子是否經(jīng)過處理跟是否生病有關(guān).

答案B

4.(多選題)對于分類變量X與Y的隨機(jī)變量x2的值,下列說法正確的是

()

A.X?越大,"X與Y有關(guān)系”的可信程度越小

B.x?越小,"X與Y有關(guān)系”的可信程度越小

C.x?越接近于0,“X與Y沒有關(guān)系”的可信程度越小

D.X?越大,“X與Y沒有關(guān)系”的可信程度越小

解析x?越大,“X與Y沒有關(guān)系”的可信程度越小,則“K與Y有關(guān)系”的

可信程度越大,X」越小,“X與Y有關(guān)系”的可信程度越小.

答案BD

5.高中流行這樣一句話“文科就怕數(shù)學(xué)不好,理科就怕英語不好”.下表是一

次針對高三文科學(xué)生的調(diào)查所得的數(shù)據(jù).

總成績好總成績不好合計(jì)

數(shù)學(xué)成績好478a490

數(shù)學(xué)成績不好39924423

合計(jì)bC913

(1)計(jì)算a,b,c的值;

(2)文科學(xué)生總成績不好與數(shù)學(xué)成績不好有關(guān)系嗎?

解(1)由478+a=490,得a=12.

由a+24=c,得c=12+24=36.

b=478+399=877.

(2)零假設(shè)為lb文科學(xué)生總成績不好與數(shù)學(xué)成績不好沒有關(guān)系.計(jì)算得

2913X(478X24-399X12)2八…

x=490X423X877X36=a233>5.024=x°g

根據(jù)小概率值Q=0.05的x2獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為文科學(xué)

生總成績不好與數(shù)學(xué)成績不好有關(guān)系,此推斷犯錯誤的概率不大于0.05.

【課后作業(yè)】

基礎(chǔ)達(dá)標(biāo)

一、選擇題

1.想要檢驗(yàn)是否喜歡參加體育活動是不是與性別有關(guān),應(yīng)該檢驗(yàn)()

A.零假設(shè)H。:男性喜歡參加體育活動

B.零假設(shè)H。:女性不喜歡參加體育活動

C,零假設(shè)H。:喜歡參加體育活動與性別有關(guān)

D.零假設(shè)H。:喜歡參加體育活動與性別無關(guān)

解析獨(dú)立性檢驗(yàn)假設(shè)有反證法的意味,應(yīng)假設(shè)兩類變量(而非變量的屬性)無

關(guān),這時的X?應(yīng)該很小,如果/很大,則可以否定假設(shè),如果X2很小,則

不能夠肯定或者否定假設(shè).

答案D

2.某市政府調(diào)查市民收入增減與旅游愿望的關(guān)系時,采用獨(dú)立性檢驗(yàn)法抽查了

3000人,計(jì)算得x2=6.023,則市政府?dāng)嘌允忻袷杖朐鰷p與旅游愿望有關(guān)系

的可信程度是()

A.90%B.95%

C.99%D.99.5%

解析由臨界值表,得6.023>3.841=X°.°5,所以可斷言市民收入增減與旅游

愿望有關(guān)系的可信程度為95%.

答案B

3.為了研究高中學(xué)生對鄉(xiāng)村音樂的態(tài)度(喜歡和不喜歡兩種杰度)與性別的關(guān)

系,運(yùn)用2X2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn),經(jīng)計(jì)算得乂2=7.01,則認(rèn)為“喜歡鄉(xiāng)

村音樂與性別有關(guān)系”的把握約為()

A.0.1%B.1%

C.99%D.99.9%

解析易知x=7.01>6.635=xo.ou對照臨界值表知,有99舟的把握認(rèn)為喜歡鄉(xiāng)

村音樂與性別有關(guān)系.

答案C

4.在獨(dú)立性檢驗(yàn)中,兩個分類變量“X與Y有關(guān)系”的可信度為99樂則隨機(jī)

變量X,的取值范圍是()

A.[2.706,3.841)B.[3.841,6.635)

C.[6.635,7.879)D.[7.879,10.828)

解析對照臨界值表可知選C.

答案C

5.某班主任對全班50名學(xué)生進(jìn)行了作業(yè)量的調(diào)查,數(shù)據(jù)如下表:

認(rèn)為作業(yè)量大認(rèn)為作業(yè)量不大合計(jì)

男生18927

女生81523

合計(jì)262450

則推斷“學(xué)生的性別與認(rèn)為作業(yè)量大有關(guān)”這種推斷犯錯誤的概率不超過

()

A.0.01B.0.025

C.0.05D.0.001

解析由公式得一二50X,黑受篇)「5.059>3.841=X°.°5.,犯錯誤的

概率不超過0.05.

答案C

二、填空題

6.在研究性別與吃零食這兩個分類變量是否有關(guān)系時,下列說法中正確的是

(填序號).

①若x2=6.635,則我們在犯錯誤的概率不超過0.01的前提下認(rèn)為吃零食與性

別有關(guān)系,那么在100個吃零食的人中必有99人是女性;

②由獨(dú)立性檢驗(yàn)可知在犯錯誤的概率不超過0.01的前提下認(rèn)為吃零食與性別有

關(guān)系時,如果某人吃零食,那么此人是女性的可能性為99%;

③由獨(dú)立性檢驗(yàn)可知在犯錯誤的概率不超過0.01的前提下認(rèn)為吃零食與性別有

關(guān)系時,是指每進(jìn)行100次這樣的推斷,平均有1次推斷錯誤.

解析x2的觀測值是支持確定有多大把握認(rèn)為“兩個分類變量吃零食與性別有

關(guān)系”的隨機(jī)變量值,所以由獨(dú)立性檢驗(yàn)可知在犯錯誤的概率不超過0.01的前

提下認(rèn)為吃零食與性別有關(guān)系時,是指每進(jìn)行100次這樣的推斷,平均有1次

推斷錯誤,故填③.

答案③

7.某高?!敖y(tǒng)計(jì)初步”課程的教師隨機(jī)調(diào)查了選該課的一些學(xué)生的情況,具體

數(shù)據(jù)如下表:

非統(tǒng)計(jì)專業(yè)統(tǒng)計(jì)專業(yè)

性別

男1310

女720

為了判斷主修統(tǒng)計(jì)專業(yè)是否與性別有關(guān)系,根據(jù)表中的數(shù)據(jù),得到乂2=

50X(13X20-10X7)

比4.844>3.O所以判定主修統(tǒng)計(jì)專業(yè)與性別

23X27X20X30841=X.05,

有關(guān)系,那么這種判斷出錯的可能性最大為.

解析因?yàn)閄2>3.841=X°.05,所以有95%的把握認(rèn)為主修統(tǒng)計(jì)專業(yè)與性別有

關(guān),出錯的可能性不超過5%.

答案5%

8.世界杯期間,某一電視臺對年齡高于40歲和不高于40歲的人是否喜歡西班

牙隊(duì)進(jìn)行調(diào)查,對高于40歲的調(diào)查了50人,不高于40歲的調(diào)查了50人,所

得數(shù)據(jù)制成如下列聯(lián)表:

不喜歡西班牙隊(duì)喜歡西班牙隊(duì)合計(jì)

高于40歲Pq50

不高于40歲153550

合計(jì)ab100

3

若工作人員從所有統(tǒng)計(jì)結(jié)果中任取一個,取到喜歡西班牙隊(duì)的人的概率為4則

在犯錯誤的概率不超過下認(rèn)為年齡與西班牙隊(duì)的被喜歡程度有關(guān).

--------n(ad—be):--------

叫?(a+b)(c+d)(a+c)(b+d).

a0.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論