新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表8.3.2獨立性檢驗學生用書新人教A版選擇性必修第三冊_第1頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表8.3.2獨立性檢驗學生用書新人教A版選擇性必修第三冊_第2頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表8.3.2獨立性檢驗學生用書新人教A版選擇性必修第三冊_第3頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表8.3.2獨立性檢驗學生用書新人教A版選擇性必修第三冊_第4頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表8.3.2獨立性檢驗學生用書新人教A版選擇性必修第三冊_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.3.1分類變量與列聯表8.3.2獨立性檢驗學習任務1.了解2×2列聯表、隨機變量χ2的意義.(數學抽象)2.理解獨立性檢驗中P(χ2≥xα)的具體含義.(數學抽象)3.掌握獨立性檢驗的方法和步驟.(數據分析)4.通過典型案例,學習統(tǒng)計方法,并能用這些方法解決一些實際問題.(數學建模、數據分析)任意抽取某市的一名學生,記A:喜歡長跑;B:是女生.(1)你能得出P(A),P(B),P(AB)這三者的準確值嗎?(2)如果要判斷A與B是否獨立,該怎么辦?知識點1數值變量與分類變量數值變量:數值變量的取值為________,其大小和運算都有實際含義.分類變量:這里所說的變量和值不一定是具體的數值,例如:性別變量,其取值為男和女兩種,我們經常會使用一種特殊的隨機變量,以區(qū)別不同的現象或性質,這類隨機變量稱為________,分類變量的取值可以用________表示.知識點2列聯表與等高堆積條形圖(1)2×2列聯表①定義:列出的兩個分類變量的________,稱為列聯表.②2×2列聯表,一般地,假設有兩個分類變量X和Y,它們的取值分別為{0,1},其樣本頻數列聯表為:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d最后一行的前兩個數分別是事件{Y=0}和{Y=1}的頻數;最后一列的前兩個數分別是事件{X=0}和{X=1}的頻數;中間的四個數a,b,c,d是事件{X=x,Y=y(tǒng)}(x,y=0,1)的頻數;右下角格中的數n為樣本容量.(2)等高堆積條形圖等高堆積條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高堆積條形圖展示列聯表數據的________特征,依據________的原理,我們可以推斷結果.2×2列聯表用于研究兩類變量之間是否相互獨立,它適用于分析兩類變量之間的關系,是對兩類變量進行獨立性檢驗的基礎.知識點3獨立性檢驗(1)零假設:設X和Y為定義在Ω上,取值于{0,1}的成對分類變量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互為對立事件,故要判斷事件{X=1}和{Y=1)之間是否有關聯,需要判斷假定關系H0:________是否成立.(2)獨立性檢驗的公式χ2=________________,其中n=________,用隨機變量χ2取值的大小作為判斷零假設H0是否成立的依據,當它比較大時推斷H0不成立,否則認為H0成立.(3)臨界值:對任何小概率值α,可以找到相應的正實數xα,使P(χ2≥xα)=α.稱xα為α的臨界值.臨界值可作為判斷χ2大小的標準.概率值α越小,臨界值xα越大.(4)小概率值α的檢驗規(guī)則:當χ2≥xα時,推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α.當χ2<xα時,沒有充分證據推斷H0不成立,可以認為X和Y獨立.利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.(5)χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.思考辨析(正確的畫“√”,錯誤的畫“×”)(1)分類變量中的變量與函數中的變量是同一概念. ()(2)列聯表中的數據是兩個分類變量的頻數. ()(3)列聯表、頻率分析法、等高堆積條形圖都可初步分析兩個分類變量是否有關系. ()(4)在獨立性檢驗中,若χ2越大,則兩個分類變量有關系的可能性越大. ()(5)2×2列聯表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關聯關系. ()(6)應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的. ()2.某校為了檢驗高中數學新課程改革的成果,在兩個班進行教學方式的對比試驗,兩個月后進行了一次檢測,試驗班與對照班的成績統(tǒng)計如2×2列聯表所示(單位:人),則其中m=________,n=________.班級成績合計80分及80分以上80分以下試驗班321850對照班24m50合計5644n3.根據表格計算:性別不看電視看電視男3785女35143χ2≈________(保留3位小數).類型1列聯表與等高堆積條形圖【例1】(1)根據如圖所示的等高堆積條形圖可知喝酒與患胃病________關系.(填“有”或“沒有”)(2)網絡對現代人的生活影響較大,尤其是對青少年,為了解網絡對中學生學習成績的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機抽取了1000人調查,發(fā)現其中經常上網的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用等高堆積條形圖判斷,學生學習成績與經常上網有關嗎?[嘗試解答]1.利用2×2列聯表分析兩變量間關系的步驟(1)根據題中數據獲得2×2列聯表;(2)根據頻率特征,即將aa+b與c2.利用等高堆積條形圖判斷兩個分類變量是否相關的步驟:[跟進訓練]1.某學校對高三學生作了一項調查,發(fā)現:在平時的模擬考試中,性格內向的學生426人中有332人在考前心情緊張,性格外向的學生594人中有213人在考前心情緊張.作出等高堆積條形圖,利用圖形判斷考前心情緊張與性格類別是否有關系.[嘗試解答]類型2由χ2進行獨立性檢驗分類變量“相關的檢驗”【例2】(源自湘教版教材)為了考察某種新疫苗預防疾病的作用,科學家對動物進行試驗,所得數據(單位:只)如下表所示:是否接種疫苗發(fā)病沒發(fā)病合計接種疫苗81523沒接種疫苗18927合計262450能否作出接種疫苗與預防疾病有關的結論?[嘗試解答]用χ2進行“相關的檢驗”步驟(1)零假設:即先假設兩變量間沒關系.(2)計算χ2:套用χ2的公式求得χ2值.(3)查臨界值:結合所給小概率值α查得相應的臨界值xα.(4)下結論:比較χ2與xα的大小,并作出結論.[跟進訓練]2.在某醫(yī)院,因為患心臟病而住院的600名男性病人中,有200人禿頂,而另外750名不是因為患心臟病而住院的男性病人中有150人禿頂.(1)填寫下列禿頂與患心臟病列聯表:是否禿頂患病合計患心臟病患其他病禿頂不禿頂合計據表中數據估計禿頂病患中患心臟病的概率P1和不禿頂病患中患心臟病的概率P2,并用兩個估計概率判斷禿頂與患心臟病是否有關;(2)依據α=0.001的獨立性檢驗,分析禿頂與患心臟病有關嗎?請說明理由.注:χ2=nadα0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828[嘗試解答]分類變量“無關的檢驗”【例3】某省進行高中新課程改革,為了解教師對新課程教學模式的使用情況,某教育機構對某學校的教師關于新課程教學模式的使用情況進行了問卷調查,共調查了50人,其中有老教師20人,青年教師30人.老教師對新課程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同的有24人,不贊同的有6人.(1)根據以上數據建立一個2×2列聯表;(2)試根據小概率值α=0.01的獨立性檢驗,分析對新課程教學模式的贊同情況與教師年齡是否有關系.附:χ2=nα0.0250.010.005xα5.0246.6357.879[嘗試解答]獨立性檢驗的關注點(1)χ2計算公式較復雜,一是公式要清楚;二是代入數值時不能張冠李戴;三是計算時要細心.(2)判斷時把計算結果與臨界值比較,其值越大,有關的可信度越高.[跟進訓練]3.為了解某挑戰(zhàn)賽中是否接受挑戰(zhàn)與受邀者的性別是否有關系(假設每個人是否接受挑戰(zhàn)互不影響),某機構進行了隨機抽樣調查,得到如下調查數據(單位:人):性別挑戰(zhàn)合計接受挑戰(zhàn)不接受挑戰(zhàn)男性451560女性251540合計7030100試根據小概率值α=0.1的獨立性檢驗,分析比賽中是否接受挑戰(zhàn)與受邀者的性別是否有關.附:χ2=nadα0.10.050.010.0050.001xα2.7063.8416.6357.87910.828類型3獨立性檢驗的綜合應用【例4】第24屆冬奧會已于2022年2月4日至2月22日在北京市和河北省張家口市聯合舉行,這是中國歷史上第一次舉辦冬季奧運會.為了宣傳冬奧會,讓更多的人了解喜愛冰雪項目,某校高三年級舉辦了冬奧會知識競賽(總分:100分),并隨機抽取了n名中學生的成績,繪制成如圖所示的頻率分布直方圖.已知前三組的頻率成等差數列,第一組和第五組的頻率相同.(1)求實數a,b的值,并估計這n名中學生的成績的平均值x;(同一組中的數據用該組區(qū)間的中點值作代表)(2)已知抽取的n名中學生中,男、女生人數相等,男生喜歡花樣滑冰的人數占男生人數的14,女生喜歡花樣滑冰的人數占女生人數的12,且在犯錯誤的概率不大于0.05的前提下,認為中學生喜歡花樣滑冰與性別有關,求參考數據及公式如下:α0.050.010.001xα3.8416.63510.828χ2=nad-bc2a+bc+da+cb+d,n=[思路導引](1)頻率分布直(2)列聯表—計算[嘗試解答]獨立性檢驗綜合應用的方法策略(1)獨立性檢驗在實際中有著廣泛的應用,是對實際生活中數據進行分析的一種方法,通過這種分析得出的結論對實際生活有著重要的指導作用.(2)近幾年高考中較少單獨考查獨立性檢驗,經常與統(tǒng)計、概率、頻率分布表、頻率分布直方圖等知識融合在一起考查.一般需要根據條件列出2×2列聯表,計算χ2值,從而解決問題.[跟進訓練]4.某學校研究性學習小組對該校高三學生視力情況進行調查,在高三的全體1000名學生中隨機抽取了100名學生的體檢表,并得到如圖所示的頻率分布直方圖.(1)若頻率分布直方圖中后四組的頻數成等差數列,試估計全年級視力在5.0以下的人數;(2)學習小組成員發(fā)現,學習成績突出的學生,近視的比較多,為了研究學生的視力與學習成績是否有關系,對年級名次在1~50名和951~1000名的學生進行了調查,得到下面的2×2列聯表,根據小概率值α=0.05的獨立性檢驗,能否認為視力與學習成績有關聯?視力學習成績合計名次在1~50名名次在951~1000名近視413273不近視91827合計5050100(3)在(2)中調查的100名學生中,按照分層抽樣在不近視的學生中抽取了6人,進一步調查他們良好的護眼習慣,并且在這6人中任取2人,求抽取的2人中,恰有1人年級名次在1~50名的概率.附:χ2=nadα0.050.010.0050.001xα3.8416.6357.87910.828[嘗試解答]1.下列不是分類變量的是()A.近視B.成績C.血壓D.飲酒2.假設有兩個分類變量X與Y,它們的可能取值分別為{0,1},其2×2列聯表為XY合計Y=0Y=1X=0101828X=1m26m+26合計10+m4454+m當m取下面何值時,X與Y的關系最弱()A.8 B.9C.14 D.193.某校期中考試后,按照甲、乙兩個班學生的數學成績優(yōu)秀和良好統(tǒng)計人數后,得到如下列聯表:班級成績合計優(yōu)秀良好甲班113445乙班83745合計197190則χ2約為()A.0.600 B.0.828C.2.712 D.6.0044.下表是某校某屆本科志愿報名時,對其中304名學生進入高校時是否知道想學專業(yè)的調查表:性別想學專業(yè)合計知道想學專業(yè)不知道想學專業(yè)男生63117180女生4282124合計105199304根據表中數據,則下列說法正確的是_______________.(填序號)①性別與知道想學專業(yè)有關;②性別與知道想學專業(yè)無關;③女生比男生更易知道想學專業(yè).回顧本節(jié)知識,自主完成以下問題:1.在χ2運算后,得到χ2的值為29.78,在判斷變量相關時,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪種說法是正確的?2.利用小概率值α獨立性檢驗的依據是什么?8.3.1分類變量與列聯表8.3.2獨立性檢驗[必備知識·情境導學探新知]知識點1實數分類變量實數知識點2(1)頻數表(2)頻率頻率穩(wěn)定于概率知識點3(1)P(Y=1|X=0)=P(Y=1|X=1)(2)n(ad-bc)2(a課前自主體驗1.(1)×(2)√(3)√(4)√(5)√(6)×2.26100[由題意得24+m=50,56+44=n3.4.514[χ2=300×(37×143[關鍵能力·合作探究釋疑難]例1(1)有[從等高堆積條形圖上可以明顯地看出喝酒患胃病的頻率遠遠大于不喝酒患胃病的頻率,所以由所給等高堆積條形圖可知,喝酒與患胃病有關系.](2)解:根據題目所給的數據得到如下2×2列聯表:學習成績上網合計經常不經常不及格80120200及格120680800合計2008001000得出等高堆積條形圖如圖所示:比較圖中陰影部分高可以發(fā)現經常上網不及格的頻率明顯高于經常上網及格的頻率,因此可以認為學習成績與經常上網有關.跟進訓練1.解:作列聯表如下:考前心情性格合計內向外內緊張332213545不緊張94381475合計4265941020相應的等高堆積條形圖如圖所示.圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內向的比例.從圖中可以看出考前心情緊張的樣本中性格內向占的比例比考前心情不緊張樣本中性格內向占的比例高,可以認為考前心情緊張與性格類別有關.例2解:提出統(tǒng)計假設H0:接種疫苗與預防疾病無關.根據列聯表中的數據,可以求得χ2=50×(8×由于5.024<5.059<6.635,查臨界值表可知,我們至少有97.5%的把握認為接種疫苗與預防疾病有關,即疫苗有效.跟進訓練2.解:(1)是否禿頂患病合計患心臟病患其他病禿頂200150350不禿頂4006001000合計6007501350P1=200350=47,P由于P1遠大于P2,所以判斷禿頂與患心臟病有關.(2)零假設為H0:禿頂與患心臟病無關.由題可知χ2=1350×(200×600-150×400所以依據小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,即認為禿頂與患心臟病有關.例3解:(1)2×2列聯表如表所示:教師年齡對新課程教學模式合計贊同不贊同老教師101020青年教師24630合計341650(2)零假設為H0:對新課程教學模式的贊同情況與教師年齡無關.由題可知χ2=50×(10×6-24根據小概率值α=0.01的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以以為H0成立,即認為對新課程教學模式的贊同情況與教師年齡無關.跟進訓練3.解:零假設H0:是否接受挑戰(zhàn)與受邀者的性別無關.根據列聯表中的數據,可以求得χ2=100×(45×因為1.786<2.706,所以沒有充分的證據顯示比賽中是否接受挑戰(zhàn)與受邀者的性別有關.例4解:(1)由題意知a+0.045則各組頻率依次為0.05,0.25,0.45,0.2,0.05.∴x=0.05×50+0.25×60+0.45×70+0.2×80+0.05×90=69.5(分).(2)設男生人數為x,依

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論