版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第六單元第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例(3課時(shí))一基礎(chǔ)知識(shí)1相關(guān)關(guān)系的分類從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān);點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān)2線性相關(guān)從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線3回歸方程(1)最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離平方和最小的方法叫最小二乘法(2)回歸方程:兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù): (x1,y1),(x2,y2),(xn,yn),其回歸方程為x,則其中,b是回歸方程的斜率,a
2、是在y軸上的截距4樣本相關(guān)系數(shù)r,用它來衡量兩個(gè)變量間的線性相關(guān)關(guān)系(1)當(dāng)r0時(shí),表明兩個(gè)變量正相關(guān);(2)當(dāng)r0時(shí),表明兩個(gè)變量負(fù)相關(guān);(3)r的絕對值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系(4)相關(guān)性檢驗(yàn)的步驟: 作統(tǒng)計(jì)假設(shè) 根據(jù)小概率0.05與n-2在附表中找出r的一個(gè)臨界值r0.05 根據(jù)樣本相關(guān)系數(shù)計(jì)算公式算出r值 用統(tǒng)計(jì)判斷,如果,那么可以認(rèn)為y與x之間的線性相關(guān)關(guān)系不顯著,從而接受統(tǒng)計(jì)假設(shè). 如果,表明一個(gè)發(fā)生的概率不到5%的事件在一次試驗(yàn)中竟發(fā)生了.這個(gè)小概率事件的發(fā)生使我們有理由認(rèn)為y與x之間不具有線性相關(guān)關(guān)系的
3、假設(shè)是不成立的,拒絕這一統(tǒng)計(jì)假設(shè)也就是表明可以認(rèn)為y與x之間具有線性相關(guān)關(guān)系.5線性回歸模型(1)ybxae中,a、b稱為模型的未知參數(shù);e稱為隨機(jī)誤差(2)相關(guān)指數(shù)用相關(guān)指數(shù)R2來刻畫回歸的效果,其計(jì)算公式是: ,的值越大(接近1),R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好在線性回歸模型中,R2表示解釋變量對預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸效果越好 (2) r具有以下性質(zhì):(1)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān);(2)當(dāng)|r|1,并且|r|越接近1時(shí),兩個(gè)變量的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時(shí),兩個(gè)變量的線性相關(guān)
4、程度越弱; (3)相關(guān)性檢驗(yàn)的步驟: 作統(tǒng)計(jì)假設(shè) 根據(jù)小概率0.05與n-2在附表中找出r的一個(gè)臨界值r0.05 根據(jù)樣本相關(guān)系數(shù)計(jì)算公式算出r值 用統(tǒng)計(jì)判斷,如果,那么可以認(rèn)為y與x之間的線性相關(guān)關(guān)系不顯著,從而接受統(tǒng)計(jì)假設(shè). 如果,表明一個(gè)發(fā)生的概率不到5%的事件在一次試驗(yàn)中竟發(fā)生了.這個(gè)小概率事件的發(fā)生使我們有理由認(rèn)為y與x之間不具有線性相關(guān)關(guān)系的假設(shè)是不成立的,拒絕這一統(tǒng)計(jì)假設(shè)也就是表明可以認(rèn)為y與x之間具有線性相關(guān)關(guān)系.6獨(dú)立性檢驗(yàn)(1)用變量的不同“值”表示個(gè)體所屬的不同類別,這種變量稱為分類變量例如:是否吸煙,宗教信仰,國籍等(2)列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表(3)一般
5、地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:2×2列聯(lián)表y1y2總計(jì)x1ababx2cdcd總計(jì)acbdabcdK2(其中nabcd為樣本容量),可利用獨(dú)立性檢驗(yàn)判斷表來判斷“x與y的關(guān)系”這種利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)當(dāng)K23.841時(shí),則有95%的把握說事A與B有關(guān);當(dāng)K26.635時(shí),則有99%的把握說事件A與B有關(guān);當(dāng)K22.706時(shí),則認(rèn)為事件A與B無關(guān)三.題型分析題型1相關(guān)關(guān)系的判斷題1.某棉業(yè)公司的科研人員在7塊并排、形狀大
6、小相同的試驗(yàn)田上對某棉花新品種進(jìn)行施化肥量x對產(chǎn)量y影響的試驗(yàn),得到如下表所示的一組數(shù)據(jù)(單位:kg):施化肥量x15202530354045棉花產(chǎn)量y330345365405445450455(1)畫出散點(diǎn)圖;(2)判斷是否具有相關(guān)關(guān)系審題視點(diǎn) (1)用x軸表示化肥施用量,y軸表示棉花產(chǎn)量,逐一畫點(diǎn)(2)根據(jù)散點(diǎn)圖,分析兩個(gè)變量是否存在相關(guān)關(guān)系解(1)散點(diǎn)圖如圖所示(2)由散點(diǎn)圖知,各組數(shù)據(jù)對應(yīng)點(diǎn)大致都在一條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關(guān)關(guān)系 利用散點(diǎn)圖判斷兩個(gè)變量是否有相關(guān)關(guān)系是比較簡便的方法在散點(diǎn)圖中如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系即變
7、量之間具有函數(shù)關(guān)系如果所有的樣本點(diǎn)落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系;如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系題2. 根據(jù)兩個(gè)變量x,y之間的觀測數(shù)據(jù)畫成散點(diǎn)圖如圖所示,這兩個(gè)變量是否具有線性相關(guān)關(guān)系_(填“是”與“否”)解析從散點(diǎn)圖看,散點(diǎn)圖的分布成團(tuán)狀,無任何規(guī)律,所以兩個(gè)變量不具有線性相關(guān)關(guān)系答案否題型2.獨(dú)立性檢驗(yàn)題3為調(diào)查某地區(qū)老人是否需要志愿者提供幫助,用簡單隨機(jī)抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下:是否需要志愿 性別男女需要4030不需要160270(1) 估計(jì)該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例;(2) 能否有99的把握認(rèn)為該
8、地區(qū)的老年人是否需要志愿者提供幫助與性別有關(guān)?(3) 根據(jù)(2)的結(jié)論,能否提供更好的調(diào)查方法來估計(jì)該地區(qū)老年人,需要志愿幫助的老年人的比例?說明理由審題視點(diǎn) 第(2)問由a40,b30,c160,d270,代入公式可求K2,由K2的值與6.635比較斷定第(3)問從抽樣方法說明解(1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例的估計(jì)值為14%.(2)K29.967.由于9.9676.635,所以有99%的把握認(rèn)為該地區(qū)老年人是否需要幫助與性別有關(guān)(3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男
9、性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時(shí),先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層,采用分層抽樣方法,這要比采用簡單隨機(jī)抽樣方法更好 獨(dú)立性檢驗(yàn)的步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;(2)根據(jù)公式K2計(jì)算K2的觀測值;(3)比較K2與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷題4. 甲乙兩個(gè)學(xué)校高三年級(jí)分別有1100人和1000人,為了了解這兩個(gè)學(xué)校全體高三年級(jí)學(xué)生在該地區(qū)二模考試中的數(shù)學(xué)成績情況,采用分層抽樣方法從兩個(gè)學(xué)校一共抽取了105名學(xué)生的數(shù)學(xué)成績,并作出了如下的頻數(shù)分布統(tǒng)汁表,規(guī)定考試成績在120,150內(nèi)為優(yōu)秀 (I)試求x,y的值; (II)
10、由以上統(tǒng)計(jì)數(shù)據(jù)填寫右面2×2列聯(lián)表,若按是否優(yōu)秀來判斷,是否有97.5%的把握認(rèn)為兩個(gè)學(xué)校的數(shù)學(xué)成績有差異。 (III)根據(jù)抽樣結(jié)果分別估計(jì)甲校和乙校的優(yōu)秀率,若把頻率視為概率,現(xiàn)從乙校學(xué)生中任取3人,求優(yōu)秀學(xué)生人數(shù)的分布列和數(shù)學(xué)期望。題型3.線性回歸方程題5(2012·菏澤模擬)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù).x3456y2.5344.5(1)請畫出上表數(shù)據(jù)的散點(diǎn)圖;(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程x;(3)已知該廠技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)
11、準(zhǔn)煤試根據(jù)(2)求出的線性回歸方程預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤?(參考數(shù)值:3×2.54×35×46×4.566.5)審題視點(diǎn) (2)問利用公式求、,即可求出線性回歸方程(3)問將x100代入回歸直線方程即可解(1)由題設(shè)所給數(shù)據(jù),可得散點(diǎn)圖如圖所示(2)由對照數(shù)據(jù),計(jì)算得:86,4.5(噸),3.5(噸)已知iyi66.5,所以,由最小二乘法確定的回歸方程的系數(shù)為:0.7,3.50.7×4.50.35.因此,所求的線性回歸方程為0.7x0.35.(3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的
12、生產(chǎn)能耗為:90(0.7×1000.35)19.65(噸標(biāo)準(zhǔn)煤) 在解決具體問題時(shí),要先進(jìn)行相關(guān)性檢驗(yàn),通過檢驗(yàn)確認(rèn)兩個(gè)變量是否具有線性相關(guān)關(guān)系,若它們之間有線性相關(guān)關(guān)系,再求回歸直線方程題6. 有10名同學(xué)高一(x)和高二(y)的數(shù)學(xué)成績?nèi)缦拢焊咭怀煽儀74717268767367706574高二成績y76757170767965776272(1)y與x是否具有相關(guān)關(guān)系?(2)如果y與x具有相關(guān)關(guān)系,求回歸直線方程參考數(shù)據(jù):分析:判斷兩變量之間是否具有相關(guān)關(guān)系,首先要求出其相關(guān)系數(shù)r,然后根據(jù)顯著性水平及自由度查相關(guān)系數(shù)臨界值表找臨界值,當(dāng)時(shí)認(rèn)為不具有相關(guān)關(guān)系;當(dāng)時(shí)認(rèn)為具有相關(guān)關(guān)系
13、,求回歸直線方程則比較簡單,只要求出a與b的值即可解:(1):由已知表格中所給數(shù)據(jù)進(jìn)行計(jì)算,得:于是又查得附表3中相應(yīng)在于顯著性水平0.05和的相關(guān)系數(shù)臨界值由知,y與x具有相關(guān)關(guān)系說明:這類問題思路一般不是很復(fù)雜,掌握比較容易,但往往運(yùn)算量較大,很容易出現(xiàn)計(jì)算錯(cuò)誤,這就需要在計(jì)算時(shí)仔細(xì)準(zhǔn)確,還要能熟練地使用科學(xué)計(jì)算器,從而解題速度和準(zhǔn)確性第六單元第3講作業(yè)1(人教A版教材習(xí)題改編)下面哪些變量是相關(guān)關(guān)系()A出租車車費(fèi)與行駛的里程 B房屋面積與房屋價(jià)格C身高與體重 D鐵塊的大小與質(zhì)量解析A,B,D都是函數(shù)關(guān)系,其中A一般是分段函數(shù),只有C是相關(guān)關(guān)系答案C2對變量x,y有觀測數(shù)據(jù)(xi,yi)
14、(i1,2,10),得散點(diǎn)圖(1);對變量u,v有觀測數(shù)據(jù)(ui、vi)(i1,2,10),得散點(diǎn)圖(2)由這兩個(gè)散點(diǎn)圖可以判斷()A變量x與y正相關(guān),u與v正相關(guān)B變量x與y正相關(guān),u與v負(fù)相關(guān)C變量x與y負(fù)相關(guān),u與v正相關(guān)D變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析由題圖(1)可知,各點(diǎn)整體呈遞減趨勢,x與y負(fù)相關(guān);由題圖(2)可知,各點(diǎn)整體呈遞增趨勢,u與v正相關(guān)答案C3(2012·南昌模擬)某商品銷售量y(件)與銷售價(jià)格x(元/件)負(fù)相關(guān),則其回歸方程可能是()A.10x200 B.10x200C.10x200 D.10x200解析因?yàn)殇N量與價(jià)格負(fù)相關(guān),由函數(shù)關(guān)系考慮為減函數(shù),又因
15、為x,y不能為負(fù)數(shù),再排除C,故選A.答案A4(2012·棗莊模擬)下面是2×2列聯(lián)表:y1y2合計(jì)x1a2173x2222547合計(jì)b46120則表中a,b的值分別為()A94,72 B52,50 C52,74 D74,52解析a2173,a52,又a22b,b74.答案C5在一項(xiàng)打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過計(jì)算K2的觀測值k27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是_的(有關(guān),無關(guān))解析由觀測值k27.63與臨界值比較,我們有99%的把握說打鼾與患心臟病有關(guān)答案有關(guān)6. 某興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們
16、分別到氣象局與某醫(yī)院抄錄了1至6月份每月10號(hào)的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:日 期1月10日2月10日3月10日4月10日5月10日6月10日晝夜溫差x(°C)1011131286就診人數(shù)y(個(gè))222529261612 該興趣小組確定的研究方案是:先從這六組數(shù)據(jù)中選取2組,用剩下的4組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進(jìn)行檢驗(yàn). () 求選取的2組數(shù)據(jù)恰好是相鄰兩個(gè)月的概率; ()若選取的是1月與6月的兩組數(shù)據(jù),請根據(jù)2至5月份的數(shù)據(jù),求出y關(guān)于x的線性回歸方程; ()若由線性回歸方程得到的估計(jì)數(shù)據(jù)與所選出的檢驗(yàn)數(shù)據(jù)的誤差均不超過2人,則認(rèn)為得到的線性回
17、歸方程是理想的,試問該小組所得線性回歸方程是否理想? (參考公式: )解:()設(shè)抽到相鄰兩個(gè)月的數(shù)據(jù)為事件A.因?yàn)閺?組數(shù)據(jù)中選取2組數(shù)據(jù)共有15種情況,每種情況都是等可能出現(xiàn)的,其中,抽到相鄰兩個(gè)月的數(shù)據(jù)的情況有5種 ,所以()由數(shù)據(jù)求得由公式求得再由所以關(guān)于的線性回歸方程為()當(dāng)時(shí), ;同樣, 當(dāng)時(shí), 所以,該小組所得線性回歸方程是理想的.7.某食品廠為了檢查甲乙兩條自動(dòng)包裝流水線的生產(chǎn)情況,隨即在這兩條流水線上各抽取件產(chǎn)品作為樣本稱出它們的重量(單位:克),重量值落在的產(chǎn)品為合格品,否則為不合格品圖是甲流水線樣本的頻率分布直方圖,表是乙流水線樣本頻數(shù)分布表 () 若以頻率作為概率,試估計(jì)
18、從甲流水線上任取件產(chǎn)品,求其中合格品的件數(shù)的數(shù)學(xué)期望; ()從乙流水線樣本的不合格品中任意取件,求其中超過合格品重量的件數(shù)的分布列;()由以上統(tǒng)計(jì)數(shù)據(jù)完成下面列聯(lián)表,并回答有多大的把握認(rèn)為“產(chǎn)品的包裝質(zhì)量與兩條自動(dòng)包裝流水線的選擇有關(guān)” 甲流水線乙流水線 合計(jì)合格品不合格品合計(jì)50.0250.0100.0050.0012.0722.7063.8415.024來源:Zxxk.Com6.6357.87910.828附:下面的臨界值表供參考: (參考公式:,其中)解:()由圖知,甲樣本中合格品數(shù)為, 則的取值為;且,于是有:012來源:Z_xx_k.Com的分布列為 10分()列聯(lián)表如下: 有90的把握認(rèn)為產(chǎn)品的包裝質(zhì)量與兩條自動(dòng)包裝流水線的選擇有關(guān)13分補(bǔ)例. 為了解某班學(xué)生喜愛打籃球是否與性別有關(guān),對本班50人進(jìn)行了問卷調(diào)查得到了如下的列聯(lián)表:喜愛打籃球不喜愛打籃球合計(jì)男生5女生10合計(jì)50已知在全部50人中隨機(jī)抽取1人抽到喜愛打籃球的學(xué)生的概率為(1)請將上面的列聯(lián)表補(bǔ)充完整(不用寫計(jì)算過程);(2)能否在犯錯(cuò)誤的概率不超過0.005的前提下認(rèn)為喜愛打籃球與性別有關(guān)?說明你的理由;(3)現(xiàn)從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沈陽理工大學(xué)《傳感與測試技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 國有土地委托經(jīng)營管理合同
- 合同編504條與民法典61條
- 大班音樂課件P《春雨沙沙》
- 2024年六盤水客運(yùn)從業(yè)資格證考試一點(diǎn)通
- 2024個(gè)人短期借款合同書
- 會(huì)議備忘錄范文6篇-20220308150300
- 2024中國工商銀行借貸合同范本
- 2024版家政服務(wù)合同樣本
- 2024個(gè)人小額貸款合同書范本
- (完整版)新概念英語第一冊單詞表(打印版)
- 美食行業(yè)外賣平臺(tái)配送效率提升方案
- 中國民用航空局信息中心招聘筆試題庫2024
- 芯片設(shè)計(jì)基礎(chǔ)知識(shí)題庫100道及答案(完整版)
- 2025屆高考語文一輪復(fù)習(xí):文言文概括和分析 課件
- 年產(chǎn)10萬套新能源車電池托盤項(xiàng)目可行性研究報(bào)告寫作模板-申批備案
- 《大學(xué)美育》 課件 4.模塊五 第二十四章 時(shí)空綜合的影視藝術(shù)之美
- 2022-2023學(xué)年廣東省廣州市天河區(qū)六年級(jí)(上)期末數(shù)學(xué)試卷(含答案)
- 2024年全國職業(yè)院校技能大賽高職組(智慧物流賽項(xiàng))考試題庫(含答案)
- 2024年新人教版七年級(jí)上冊歷史 第11課 西漢建立和“文景之治”
- 北師大版(三起)(2024)三年級(jí)上冊英語Unit 1 Family單元測試卷(含答案)
評(píng)論
0/150
提交評(píng)論