版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.3.1分類變量與列聯表
8.3列聯表與獨立性檢驗
吸煙已成為全球范圍內嚴重危害健康、危害人類生存環(huán)境、降低人們的生活質量、縮短人類壽命的緊迫問題.為此,聯合國固定每年5月31日為全球戒煙日.導學【情景一】吸煙是否會增加患肺癌的風險?
【情景二】吃零食是否與性別有關?
【問題】如何有效地解決上述情景中的問題?【情景三】肥胖與高血壓、糖尿病是否有關?
基本概念——1、分類變量:一種特殊的隨機變量,以區(qū)別不同的現象或性質例如:對于性別變量,其取值為男和女兩種.♂♀這種變量的不同“值”表示個體所屬的不同類別.性別、是否吸煙、是否患肺癌、宗教信仰、國籍等等都屬于分類變量體重、身高、溫度、考試成績等等這些變量屬于數值變量基本概念——變量數值變量分類變量分類變量與數值變量之間的區(qū)別是什么?例:體重、身高、溫度、考試成績等數值變量的取值為實數.其大小和運算都有實際含義.兩個數值變量之間的關系:回歸分析法;由一個變量的變化去推測另一個變量的變化例:性別、是否吸煙、是否患肺癌、國籍等分類變量的取值可以用實數來表示;這些數值只作為編號使用,用來表示不同的類別;并沒有通常的大小和運算意義。例如,學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示本節(jié)我們主要討論取值是{0,1}的分類變量的關聯性問題.變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.概念辨析1.是否吸煙、是否患肺癌是什么變量?
2.下列不是分類變量的是(
) A.近視B.成績C.血壓 D.飲酒
解析近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,飲酒變量有飲酒與不飲酒兩種類別.故選B.
答案B分類變量.如何利用統計數據判斷一對分類變量之間是否具有關聯性呢?對于這樣的統計問題,有時可以利用普查數據,通過比較相關的比率給出問題的準確回答,但在大多數情況下,需要借助概率的觀點和方法.我們先看下面的具體問題.
問題
:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了普查.全校學生的普查數據如下:523名女生中有331名經常鍛煉;601名男生中有473名經常鍛煉.你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎?那么,只要求出f0和f1的值,通過比較這兩個值的大小,就可以知道女生和男生在鍛煉的經常性方面是否有差異,由所給的數據,經計算得到這是一個簡單的統計問題.最直接的解答方法是,比較經常鍛煉的學生在女生和男生中的比率.為了方便,我們設方法1——由頻率估計概率
上面的問題還可以通過建立一個古典概型,使用條件概率的語言,給出另外一種解答方法.用Ω表示該校全體學生構成的集合,這是我們所關心的對象的總體.考慮以Ω為樣本空間的古典概型,并定義一對分類變量X和Y如下:對于Ω中的每一名學生,分別令方法2——借助條件概率方法2——借助條件概率為了清楚起見,我們用表格整理數據,如表8.3-1所示.
表8.3-1單位:人性別鍛煉合計不經常(Y=0)經常(Y=1)女生(X=0)192331523男生(X=1)128473601合計3208041124分類變量X和Y的抽樣數據的2×2列聯表:
以上表為例,2×2列聯包含了X和Y的如下信息:最后一行的前兩個數分別是事件{Y=0}和{Y=1}中樣本點的個數;
最后一列的前兩個數分別是事件{X=0}和{X=1}中樣本點的個數;中間的四個格中的數是表格的核心部分,給出了事件{X=x,Y=y}(x,y=0,1)中樣本點的個數;右下角格中的數是樣本空間中樣本點的總數.
合計7817212533合計106.96,94.60,52.52,54.50,522.某校為了檢驗高中數學新課程改革的成果,在兩個班進行教學方式的對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統計如2×2列聯表所示(單位:人),則其中m=________,n=________.班級成績合計80分及80分以上80分以下試驗班321850對照班24m50合計5644n26100
[解]
2×2列聯表如下:飲食習慣年齡合計六十歲以上六十歲以下以蔬菜為主432164以肉類為主273360合計7054124方法3——借助等高堆積條形圖性別鍛煉合計不經常(Y=0)經常(Y=1)女生(X=0)192331523男生(X=1)128473601合計3208041124
利用等高堆積條形圖判斷兩個分類變量是否相關的步驟4.下列關于等高條形圖的敘述正確的是(
)A.從等高條形圖中可以精確地判斷兩個分類變量是否有關系B.從等高條形圖中可以看出兩個變量頻數的相對大小C.從等高條形圖中可以粗略地看出兩個分類變量是否有關系D.以上說法都不對
牛刀小試:5.如圖是調查某地區(qū)男女中學生是否喜歡理科的等高條形圖,從圖中可以看出該地區(qū)的中學生(
)A.性別與是否喜歡理科無關B.女生中喜歡理科的比例為80%C.男生比女生喜歡理科的可能性大D.男生中喜歡理科的比例為80%
1.2×2列聯表——給出了兩個分類變量數據的交叉分類頻數2.判斷兩個分類變量之間是否具有關聯性的三種方法圖形分析法頻率分析法條件概率法這樣得出的結論是否會出現錯誤呢?是由什么引起的?課堂小結:頻率具有隨機性,與概率之間存在差異樣本容量較小時,犯錯誤的概率較大1.成語“名師出高徒”可以解釋為“知名老師指導出高水平學生的概率較大”,即老師的名聲與學生的水平之間有關聯.你能舉出更多的描述生活中兩種屬性或現象之間關聯的成語嗎解:例如水漲船高、登高望遠等.2.例1中的隨機抽樣數據是否足夠確定與X和Y有關的所有概率和條件概率為什么解:不能.因為隨機抽樣得到的樣本具有隨機性,根據樣本數據計算出來的頻率也具有隨機性.在統計推斷中,依據頻率穩(wěn)定于概率的原理,可以利用頻率推斷與X和Y有關的概率和條件概率,但由于頻率具有隨機性,這種推斷可能犯錯誤.因此,隨機抽樣數據不足以確定與X和Y有關的所有概率和條件概率.3.根據有關規(guī)定,香煙盒上必須印上“吸煙有害健康”的警示語.那么(1)吸煙是否對每位煙民一定會引發(fā)健康問題(2)有人說吸煙不一定引起健康問題,因此可以吸煙.這種說法對嗎解:(1)從已掌握的知識來看,吸煙會損害身體的健康.但除了吸煙之外,身體的健康還受許多其他隨機因素的影響,它是很多因素共同作用的結果.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度養(yǎng)老護理服務個人眾籌投資協議3篇
- 二零二五年度廣告投放合同:品牌宣傳廣告投放與效果評估協議
- 智能物流信息平臺建設項目可行性研究報告
- 二零二五年度合同貨物交期變更及風險評估協議3篇
- 港口項目建議書
- 二零二五年度安全生產責任書(電力企業(yè))2篇
- 2025版智慧城市科技公司股權轉讓與項目實施協議3篇
- 二零二五年度二手摩托車購置與售后維護服務合同2篇
- 2025年中國電子標簽行業(yè)發(fā)展現狀及市場前景分析預測報告
- 物業(yè)充電樁合作加盟協議書范文
- 機械工安全操作規(guī)程有哪些(11篇)
- 2024年執(zhí)業(yè)醫(yī)師考試-中醫(yī)執(zhí)業(yè)醫(yī)師考試近5年真題集錦(頻考類試題)帶答案
- 2024-2030年中國真空滅弧室行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 全國計算機一級考試題庫(附答案)
- 【飛科電器公司基于杜邦分析法的財務分析案例(7700字論文)】
- 廣東省深圳市(2024年-2025年小學四年級語文)統編版期末考試(上學期)試卷及答案
- 兒童呼吸道合胞病毒感染臨床診治試題
- 2021-2022學年廣東省廣州市花都區(qū)六年級(上)期末英語試卷
- 服務基層行資料(藥品管理)
- 安徽省2023-2024學年七年級上學期期末數學試題(原卷版)
評論
0/150
提交評論