變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(教師版).docx_第1頁(yè)
變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(教師版).docx_第2頁(yè)
變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(教師版).docx_第3頁(yè)
變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(教師版).docx_第4頁(yè)
變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(教師版).docx_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例【知識(shí)要點(diǎn)】1.相關(guān)關(guān)系的判斷(1)如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線的附近,我們說(shuō)變量和具有線性相關(guān)關(guān)系(2)樣本數(shù)據(jù)(i1,2,n)的相關(guān)系數(shù) 當(dāng)時(shí),兩變量正相關(guān),當(dāng)時(shí),兩變量負(fù)相關(guān),當(dāng)且越接近于,相關(guān)程度越高,當(dāng)且越接近于,相關(guān)程度越低 2.回歸方程的求法求回歸方程的方法是最小二乘法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小若變量x與y具有線性相關(guān)關(guān)系,有n個(gè)樣本數(shù)據(jù)(i1,2,n),則回歸方程中斜率和截距的最小二乘估計(jì)公式分別為: 其中,稱為樣本點(diǎn)的中心【重點(diǎn)】 回歸直線必過(guò)樣本點(diǎn)的中心,這個(gè)結(jié)論既是檢驗(yàn)所求回歸直線方程是否準(zhǔn)確的依據(jù),也是求參數(shù)的一個(gè)依據(jù)3獨(dú)立性檢驗(yàn)0050001000013841663510828設(shè)X,Y為兩個(gè)變量,它們的取值分別為和,其樣本頻數(shù)列聯(lián)表(22列聯(lián)表)如下:y1y2總計(jì)x1ababx2cdcd總計(jì)acbdabcd利用隨機(jī)變量(其中為樣本容量)來(lái)判斷“兩個(gè)變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn)【例題解析】題型一變量間的相關(guān)關(guān)系【例1】對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3解析:選A易知題中圖(1)與圖(3)是正相關(guān),圖(2)與圖(4)是負(fù)相關(guān),且圖(1)與圖(2)中的樣本點(diǎn)集中分布在一條直線附近,則r2r40r3r1.【變式1】四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得回歸直線方程,分別得到以下四個(gè)結(jié)論:y與x負(fù)相關(guān)且2.347x6.423;y與x負(fù)相關(guān)且3.476x5.648;y與x正相關(guān)且5.437x8.493;y與x正相關(guān)且4.326x4.578.其中一定不正確的結(jié)論的序號(hào)是()A B C D解析:選D正相關(guān)指的是y隨x的增大而增大,負(fù)相關(guān)指的是y隨x的增大而減小,故不正確的為,故選D.相關(guān)關(guān)系的直觀判斷方法就是作出散點(diǎn)圖,若散點(diǎn)圖呈帶狀且區(qū)域較窄,說(shuō)明兩個(gè)變量有一定的線性相關(guān)性,若呈曲線型也是有相關(guān)性,若呈圖形區(qū)域且分布較亂則不具備相關(guān)性【例2】(2014湖北高考)根據(jù)如下樣本數(shù)據(jù)x345678y4.02.50.50.52.03.0得到的回歸方程為bxa,則()Aa0,b0 Ba0,b0 Ca0 Da0,b0解析:選B由表中數(shù)據(jù)畫出散點(diǎn)圖,如圖,由散點(diǎn)圖可知b0,選B.【例3】對(duì)于下列表格所示五個(gè)散點(diǎn),已知求得的線性回歸方程為0.8x155,則實(shí)數(shù)m的值為()x196197200203204y1367mA.8 B8.2 C8.4 D8.5解析:選A200,.樣本中心點(diǎn)為,將樣本中心點(diǎn)代入0.8x155,可得m8.故A正確題型二回歸方程的求法【例4】某城市理論預(yù)測(cè)2011年到2015年人口總數(shù)與年份的關(guān)系如下表所示請(qǐng)根據(jù)上表提供的數(shù)據(jù),求最小二乘法求出關(guān)于的線性回歸方程;據(jù)此估計(jì)2016年該城市人口總數(shù).參考公式: 解:(1), 2分 = 05+17+28+311+419=132,= 故y關(guān)于x的線性回歸方程為=3.2x+3.6 (2)當(dāng)x=5時(shí),=3.2*5+3.6即=19.6 據(jù)此估計(jì)2016年該城市人口總數(shù)約為196萬(wàn). 【例5】某保險(xiǎn)公司有一款保險(xiǎn)產(chǎn)品的歷史戶獲益率(獲益率=獲益保費(fèi)收入)的頻率分布直方圖如圖所示:()試估計(jì)平均獲益率;()根據(jù)經(jīng)驗(yàn)若每份保單的保費(fèi)在元的基礎(chǔ)上每增加元,對(duì)應(yīng)的銷量(萬(wàn)份)與(元)有較強(qiáng)線性相關(guān)關(guān)系,從歷史銷售記錄中抽樣得到如下組與的對(duì)應(yīng)數(shù)據(jù):(元)銷量(萬(wàn)份)()根據(jù)數(shù)據(jù)計(jì)算出銷量(萬(wàn)份)與(元)的回歸方程為;()若把回歸方程當(dāng)作與的線性關(guān)系,用()中求出的平均獲益率估計(jì)此產(chǎn)品的獲益率,每份保單的保費(fèi)定為多少元時(shí)此產(chǎn)品可獲得最大獲益,并求出該最大獲益.參考公示: 解析:()區(qū)間中值依次為:0.05,0.15,0.25,0.35,0.45,0.55,取值概率依次為:0.1,0.2,0.25,0.3,0.1,0.05,平均獲益率為()(i)則即(ii)設(shè)每份保單的保費(fèi)為元,則銷量為,則保費(fèi)獲益為萬(wàn)元, 當(dāng)元時(shí),保費(fèi)收入最大為萬(wàn)元,保險(xiǎn)公司預(yù)計(jì)獲益為萬(wàn)元.題型三獨(dú)立性檢驗(yàn)【例6】為考察棉花種子經(jīng)過(guò)處理跟生病之間的關(guān)系得到下表數(shù)據(jù):種子處理種子未處理總計(jì)得病32101133不得病61213274總計(jì)93314407根據(jù)以上數(shù)據(jù),則種子經(jīng)過(guò)處理與是否生病_(填“有”或“無(wú)”)關(guān)解析:在假設(shè)無(wú)關(guān)的情況下,根據(jù)題意K20.16,可以得到無(wú)關(guān)的概率大于50%,所以種子經(jīng)過(guò)處理跟是否生病有關(guān)的概率小于50%,所以可以認(rèn)為種子經(jīng)過(guò)處理與是否生病無(wú)關(guān)答案:無(wú)【例7】某高校為調(diào)查學(xué)生喜歡“應(yīng)用統(tǒng)計(jì)”課程是否與性別有關(guān),隨機(jī)抽取了選修課程的55名學(xué)生,得到數(shù)據(jù)如下表:喜歡“應(yīng)用統(tǒng)計(jì)”課程不喜歡“應(yīng)用統(tǒng)計(jì)”課程總計(jì)男生20525女生102030總計(jì)302555(1)判斷是否有99.5%的把握認(rèn)為喜歡“應(yīng)用統(tǒng)計(jì)”課程與性別有關(guān)?(2)用分層抽樣的方法從喜歡統(tǒng)計(jì)課程的學(xué)生中抽取6名學(xué)生做進(jìn)一步調(diào)查,將這6名學(xué)生作為一個(gè)樣本,從中任選2人,求恰有1個(gè)男生和1個(gè)女生的概率下面的臨界值表供參考:P(K2k)0.150.100.050.250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(參考公式:K2,其中nabcd)解:(1)由公式K211.9787.879,所以有99.5%的把握認(rèn)為喜歡“應(yīng)用統(tǒng)計(jì)”課程與性別有關(guān)(2)設(shè)所抽樣本中有m個(gè)男生,則,得m4,所以樣本中有4個(gè)男生,2個(gè)女生,分別記作B1,B2,B3,B4,G1,G2.從中任選2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15個(gè),其中恰有1個(gè)男生和1個(gè)女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8個(gè)所以恰有1個(gè)男生和1個(gè)女生的概率為.【變式1】經(jīng)過(guò)對(duì)計(jì)量的研究,得到了若干個(gè)臨界值如下:當(dāng)?shù)挠^測(cè)值時(shí),我們( A )A. 在犯錯(cuò)誤的概率不超過(guò)0.05的前提可認(rèn)為A與B有關(guān) B. 在犯錯(cuò)誤的概率不超過(guò)0.05的前提可認(rèn)為A與B無(wú)關(guān) C. 在犯錯(cuò)誤的概率不超過(guò)0.01的前提可認(rèn)為A與B有關(guān) D. 沒有充分理由說(shuō)明事件A與B有關(guān)系 【變式2】某校高三子啊一次模擬考試后,為了解數(shù)學(xué)成績(jī)是否與班級(jí)有關(guān),對(duì)甲乙兩個(gè)班數(shù)學(xué)成績(jī)(滿分150分)進(jìn)行分析,按照不小于120分為優(yōu)秀,120分以下為非優(yōu)秀的標(biāo)準(zhǔn)統(tǒng)計(jì)成績(jī),已知從全班100人中隨機(jī)抽取1人數(shù)學(xué)成績(jī)優(yōu)秀的概率為,調(diào)查結(jié)果如下表所示.(1)請(qǐng)完成上面的列聯(lián)表; (2)根據(jù)列聯(lián)表的數(shù)據(jù),問(wèn)是否有95%的把握認(rèn)為“數(shù)學(xué)成績(jī)與班級(jí)有關(guān)系”;(3)若按下面的方法從甲班數(shù)學(xué)成績(jī)優(yōu)秀的學(xué)生中抽取1人:把甲班數(shù)學(xué)成績(jī)優(yōu)秀的10名學(xué)生從2到11進(jìn)行編號(hào),先后兩次拋擲一枚均勻的骰子,出現(xiàn)的點(diǎn)數(shù)和被記為抽取人的編號(hào),求抽到的編號(hào)為6或10的概率.【變式3】為了解人們對(duì)新頒布的“生育二孩放開”政策的熱度,現(xiàn)在某市進(jìn)行調(diào)查對(duì)歲的人群隨機(jī)抽取了人,得到如下統(tǒng)計(jì)表和各年齡段抽取人數(shù)的頻率分布直方圖:()求,的值,并由頻率分布直方圖估計(jì)被調(diào)查人群的平均年齡;()根據(jù)以上統(tǒng)計(jì)數(shù)據(jù)填下面22列聯(lián)表,并根據(jù)列聯(lián)表的獨(dú)立性檢驗(yàn),判斷能否有99%的把握認(rèn)為以45歲為分界點(diǎn)的不同人群對(duì)“生育二孩放開”政策的支持度有關(guān)系?年齡不低于45歲的人數(shù)年齡低于45歲的人數(shù)合計(jì)支持不支持合計(jì)0050001000013841663510828參考數(shù)據(jù):,其中解:()從歲這一年齡組中抽取的人數(shù)為,且頻率為, ; 2分又第二組的頻率為,則第二組人數(shù)為10人, 4分平均數(shù)(歲) 6分() 列聯(lián)表如下:年齡不低于45歲的人數(shù)年齡低于45歲的人數(shù)合計(jì)支持32932不支持71118合計(jì)104050,沒有99%的把握認(rèn)為以45歲為分界點(diǎn)的不同人群對(duì)“生育二孩放開”政策的支持度有關(guān)系。【例8】為研究患肺癌與是否吸煙有關(guān),做了一次相關(guān)調(diào)查,其中部分?jǐn)?shù)據(jù)丟失,但可以確定的是不吸煙人數(shù)與吸煙人數(shù)相同,吸煙患肺癌人數(shù)占吸煙總?cè)藬?shù)的;不吸煙的人數(shù)中,患肺癌與不患肺癌的比為(1) 若吸煙不患肺癌的有人,現(xiàn)從患肺癌的人中用分層抽樣的方法抽取人,再?gòu)倪@人中隨機(jī)抽取人進(jìn)行調(diào)查,求這兩人都是吸煙患肺癌的概率;(2)若研究得到在犯錯(cuò)誤概率不超過(guò)的前提下,認(rèn)為患肺癌與吸煙有關(guān),則吸煙的人數(shù)至少有多少?附:,其中解:(1)設(shè)吸煙人數(shù)為,依題意有,所以吸煙的人有人,故有吸煙患肺癌的有人,不患肺癌的有人用分層抽樣的方法抽取人,則應(yīng)抽取吸煙患肺癌的人,記為,不吸煙患肺癌的人,記為從人中隨機(jī)抽取人,所有可能的結(jié)果有,共種,則這兩人都是吸煙患肺癌的情形共有種,即這兩人都是吸煙患肺癌的概率為 .6分 (2)方法一:設(shè)吸煙人數(shù)為,由題意可得列聯(lián)表如下:患肺癌不患肺癌合計(jì)吸煙不吸煙總計(jì)由表得,由題意,為整數(shù),的最小值為則,即吸煙人數(shù)至少為人方法二:設(shè)吸煙人數(shù)為,由題意可得列聯(lián)表如下:患肺癌不患肺癌合計(jì)吸煙不吸煙總計(jì)由表得,由題意,為整數(shù)且為的倍數(shù),的最小值為即吸煙人數(shù)至少為人 【高考真題】【1】【2017課標(biāo)1,文19】為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過(guò)程,檢驗(yàn)員每隔30 min從該生產(chǎn)線上隨機(jī)抽取一個(gè)零件,并測(cè)量其尺寸(單位:cm)下面是檢驗(yàn)員在一天內(nèi)依次抽取的16個(gè)零件的尺寸:抽取次序12345678零件尺寸995101299699610019929981004抽取次序910111213141516零件尺寸10269911013100292210041005995經(jīng)計(jì)算得,其中為抽取的第個(gè)零件的尺寸,(1)求的相關(guān)系數(shù),并回答是否可以認(rèn)為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過(guò)程的進(jìn)行而系統(tǒng)地變大或變?。ㄈ?,則可以認(rèn)為零件的尺寸不隨生產(chǎn)過(guò)程的進(jìn)行而系統(tǒng)地變大或變?。?)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在之外的零件,就認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過(guò)程可能出現(xiàn)了異常情況,需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查()從這一天抽檢的結(jié)果看,是否需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查?()在之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計(jì)這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值與標(biāo)準(zhǔn)差(精確到001)附:樣本的相關(guān)系數(shù),【答案】(1),可以;(2)()需要;()均值與標(biāo)準(zhǔn)差估計(jì)值分別為1002,009【解析】試題分析:(1)依公式求;(2)(i)由,得抽取的第13個(gè)零件的尺寸在以外,因此需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查;(ii)剔除第13個(gè)數(shù)據(jù),則均值的估計(jì)值為1002,方差為009(ii)剔除離群值,即第13個(gè)數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為,這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值的估計(jì)值為1002,剔除第13個(gè)數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為,這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的標(biāo)準(zhǔn)差的估計(jì)值為【2】【2017課標(biāo)II,文19】海水養(yǎng)殖場(chǎng)進(jìn)行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對(duì)比,收獲時(shí)各隨機(jī)抽取了100個(gè)網(wǎng)箱,測(cè)量各箱水產(chǎn)品的產(chǎn)量(單位:kg), 其頻率分布直方圖如下:(1) 記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,估計(jì)A的概率;(2) 填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān):箱產(chǎn)量50kg箱產(chǎn)量50kg舊養(yǎng)殖法新養(yǎng)殖法(3) 根據(jù)箱產(chǎn)量的頻率分布直方圖,對(duì)兩種養(yǎng)殖方法的優(yōu)劣進(jìn)行較。附:P()0.0500.0100.001k3.8416.63510.828 【答案】(1)0.62.(2)有把握(3)新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法【解析】(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表箱產(chǎn)量50kg箱產(chǎn)量50kg舊養(yǎng)殖法6238新養(yǎng)殖法3466K2= 由于15.7056.635,故有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān).(3)箱產(chǎn)量的頻率分布直方圖平均值(或中位數(shù))在45kg到50kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高,因此,可以認(rèn)為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.【3】(2016年全國(guó)III卷高考)下圖是我國(guó)2008年至2014年生活垃圾無(wú)害化處理量(單位:億噸)的折線圖()由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明;()建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測(cè)2016年我國(guó)生活垃圾無(wú)害化處理量.附注:參考數(shù)據(jù):,2.646.參考公式:相關(guān)系數(shù) 回歸方程 中斜率和截距的最小二乘估計(jì)公式分別為:()由及()得,所以,關(guān)于的回歸方程為:. .10分將2016年對(duì)應(yīng)的代入回歸方程得:.所以預(yù)測(cè)2016年我國(guó)生活垃圾無(wú)害化處理量將約1.82億噸. .12分【4】【2015高考新課標(biāo)1,文19】某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響,對(duì)近8年的宣傳費(fèi)和年銷售量數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.46.656.36.8289.81.61469108.8表中= , =(I)根據(jù)散點(diǎn)圖判斷,與,哪一個(gè)適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的回歸方程類型(給出判斷即可,不必說(shuō)明理由);(II)根據(jù)(I)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(III)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為 ,根據(jù)(II)的結(jié)果回答下列問(wèn)題:(i)當(dāng)年宣傳費(fèi)時(shí),年銷售量及年利潤(rùn)的預(yù)報(bào)值時(shí)多少?(ii)當(dāng)年宣

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論