




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.3.1分類變量與列聯(lián)表
8.3列聯(lián)表與獨立性檢驗
吸煙已成為全球范圍內(nèi)嚴重危害健康、危害人類生存環(huán)境、降低人們的生活質(zhì)量、縮短人類壽命的緊迫問題.為此,聯(lián)合國固定每年5月31日為全球戒煙日.導學【情景一】吸煙是否會增加患肺癌的風險?
【情景二】吃零食是否與性別有關(guān)?
【問題】如何有效地解決上述情景中的問題?【情景三】肥胖與高血壓、糖尿病是否有關(guān)?
基本概念——1、分類變量:一種特殊的隨機變量,以區(qū)別不同的現(xiàn)象或性質(zhì)例如:對于性別變量,其取值為男和女兩種.♂♀這種變量的不同“值”表示個體所屬的不同類別.性別、是否吸煙、是否患肺癌、宗教信仰、國籍等等都屬于分類變量體重、身高、溫度、考試成績等等這些變量屬于數(shù)值變量基本概念——變量數(shù)值變量分類變量分類變量與數(shù)值變量之間的區(qū)別是什么?例:體重、身高、溫度、考試成績等數(shù)值變量的取值為實數(shù).其大小和運算都有實際含義.兩個數(shù)值變量之間的關(guān)系:回歸分析法;由一個變量的變化去推測另一個變量的變化例:性別、是否吸煙、是否患肺癌、國籍等分類變量的取值可以用實數(shù)來表示;這些數(shù)值只作為編號使用,用來表示不同的類別;并沒有通常的大小和運算意義。例如,學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示本節(jié)我們主要討論取值是{0,1}的分類變量的關(guān)聯(lián)性問題.變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.概念辨析1.是否吸煙、是否患肺癌是什么變量?
2.下列不是分類變量的是(
) A.近視B.成績C.血壓 D.飲酒
解析近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,飲酒變量有飲酒與不飲酒兩種類別.故選B.
答案B分類變量.如何利用統(tǒng)計數(shù)據(jù)判斷一對分類變量之間是否具有關(guān)聯(lián)性呢?對于這樣的統(tǒng)計問題,有時可以利用普查數(shù)據(jù),通過比較相關(guān)的比率給出問題的準確回答,但在大多數(shù)情況下,需要借助概率的觀點和方法.我們先看下面的具體問題.
問題
:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經(jīng)常性有影響,為此對學生是否經(jīng)常鍛煉的情況進行了普查.全校學生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉.你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?那么,只要求出f0和f1的值,通過比較這兩個值的大小,就可以知道女生和男生在鍛煉的經(jīng)常性方面是否有差異,由所給的數(shù)據(jù),經(jīng)計算得到這是一個簡單的統(tǒng)計問題.最直接的解答方法是,比較經(jīng)常鍛煉的學生在女生和男生中的比率.為了方便,我們設(shè)方法1——由頻率估計概率
上面的問題還可以通過建立一個古典概型,使用條件概率的語言,給出另外一種解答方法.用Ω表示該校全體學生構(gòu)成的集合,這是我們所關(guān)心的對象的總體.考慮以Ω為樣本空間的古典概型,并定義一對分類變量X和Y如下:對于Ω中的每一名學生,分別令方法2——借助條件概率方法2——借助條件概率為了清楚起見,我們用表格整理數(shù)據(jù),如表8.3-1所示.
表8.3-1單位:人性別鍛煉合計不經(jīng)常(Y=0)經(jīng)常(Y=1)女生(X=0)192331523男生(X=1)128473601合計3208041124分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:
以上表為例,2×2列聯(lián)包含了X和Y的如下信息:最后一行的前兩個數(shù)分別是事件{Y=0}和{Y=1}中樣本點的個數(shù);
最后一列的前兩個數(shù)分別是事件{X=0}和{X=1}中樣本點的個數(shù);中間的四個格中的數(shù)是表格的核心部分,給出了事件{X=x,Y=y}(x,y=0,1)中樣本點的個數(shù);右下角格中的數(shù)是樣本空間中樣本點的總數(shù).
合計7817212533合計106.96,94.60,52.52,54.50,522.某校為了檢驗高中數(shù)學新課程改革的成果,在兩個班進行教學方式的對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統(tǒng)計如2×2列聯(lián)表所示(單位:人),則其中m=________,n=________.班級成績合計80分及80分以上80分以下試驗班321850對照班24m50合計5644n26100
[解]
2×2列聯(lián)表如下:飲食習慣年齡合計六十歲以上六十歲以下以蔬菜為主432164以肉類為主273360合計7054124方法3——借助等高堆積條形圖性別鍛煉合計不經(jīng)常(Y=0)經(jīng)常(Y=1)女生(X=0)192331523男生(X=1)128473601合計3208041124
利用等高堆積條形圖判斷兩個分類變量是否相關(guān)的步驟4.下列關(guān)于等高條形圖的敘述正確的是(
)A.從等高條形圖中可以精確地判斷兩個分類變量是否有關(guān)系B.從等高條形圖中可以看出兩個變量頻數(shù)的相對大小C.從等高條形圖中可以粗略地看出兩個分類變量是否有關(guān)系D.以上說法都不對
牛刀小試:5.如圖是調(diào)查某地區(qū)男女中學生是否喜歡理科的等高條形圖,從圖中可以看出該地區(qū)的中學生(
)A.性別與是否喜歡理科無關(guān)B.女生中喜歡理科的比例為80%C.男生比女生喜歡理科的可能性大D.男生中喜歡理科的比例為80%
1.2×2列聯(lián)表——給出了兩個分類變量數(shù)據(jù)的交叉分類頻數(shù)2.判斷兩個分類變量之間是否具有關(guān)聯(lián)性的三種方法圖形分析法頻率分析法條件概率法這樣得出的結(jié)論是否會出現(xiàn)錯誤呢?是由什么引起的?課堂小結(jié):頻率具有隨機性,與概率之間存在差異樣本容量較小時,犯錯誤的概率較大1.成語“名師出高徒”可以解釋為“知名老師指導出高水平學生的概率較大”,即老師的名聲與學生的水平之間有關(guān)聯(lián).你能舉出更多的描述生活中兩種屬性或現(xiàn)象之間關(guān)聯(lián)的成語嗎解:例如水漲船高、登高望遠等.2.例1中的隨機抽樣數(shù)據(jù)是否足夠確定與X和Y有關(guān)的所有概率和條件概率為什么解:不能.因為隨機抽樣得到的樣本具有隨機性,根據(jù)樣本數(shù)據(jù)計算出來的頻率也具有隨機性.在統(tǒng)計推斷中,依據(jù)頻率穩(wěn)定于概率的原理,可以利用頻率推斷與X和Y有關(guān)的概率和條件概率,但由于頻率具有隨機性,這種推斷可能犯錯誤.因此,隨機抽樣數(shù)據(jù)不足以確定與X和Y有關(guān)的所有概率和條件概率.3.根據(jù)有關(guān)規(guī)定,香煙盒上必須印上“吸煙有害健康”的警示語.那么(1)吸煙是否對每位煙民一定會引發(fā)健康問題(2)有人說吸煙不一定引起健康問題,因此可以吸煙.這種說法對嗎解:(1)從已掌握的知識來看,吸煙會損害身體的健康.但除了吸煙之外,身體的健康還受許多其他隨機因素的影響,它是很多因素共同作用的結(jié)果.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 IEC 62909-1:2025 EN Bi-directional grid-connected power converters - Part 1: General and safety requirements
- 肺結(jié)核胸痛護理措施
- 槐蔭區(qū)面試數(shù)學試卷
- 湖北省孝感數(shù)學試卷
- 黑龍江期末聯(lián)考數(shù)學試卷
- 2025年中國河南商業(yè)地產(chǎn)行業(yè)發(fā)展監(jiān)測及市場發(fā)展?jié)摿︻A測報告
- 中國整體軟裝行業(yè)市場運行現(xiàn)狀及投資戰(zhàn)略研究報告
- 上海市浦東新區(qū)南匯中學2025屆物理高二下期末經(jīng)典模擬試題含解析
- 健康知識講座結(jié)核課件
- 健康的蔬菜試講課件
- 第38屆中國化學奧林匹克(決賽)第二場參考案
- 生態(tài)水利工程學的研究范式創(chuàng)新與實踐需求分析
- SJG 130 – 2023《混凝土模塊化建筑技術(shù)規(guī)程》
- DB37-T5321-2025 居住建筑裝配式內(nèi)裝修技術(shù)標準
- 《視網(wǎng)膜色素變性》課件示例
- 2025-2030中國火箭發(fā)動機行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析研究報告
- T-CHSA 090-2024 年輕恒牙根尖誘導成形術(shù)操作專家共識
- 區(qū)塊鏈在虛擬電廠分布式能源管理中的應用-全面剖析
- 防性侵教師安全培訓
- 污水處理設(shè)備驗收方案
- 貴州企業(yè)招聘2025貴州貴旅國際旅行服務有限公司招聘筆試參考題庫附帶答案詳解
評論
0/150
提交評論