線性回歸和獨(dú)立檢驗(yàn)_第1頁(yè)
線性回歸和獨(dú)立檢驗(yàn)_第2頁(yè)
線性回歸和獨(dú)立檢驗(yàn)_第3頁(yè)
線性回歸和獨(dú)立檢驗(yàn)_第4頁(yè)
線性回歸和獨(dú)立檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、選修1-2 第一章 線性回歸和獨(dú)立檢驗(yàn)1下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y454325由散點(diǎn)圖可知,用水量與月份之間有較好的線性相關(guān)關(guān)系,其線性回歸方程為( )07xa,則a等于( )A105 B515 C52 D525日期12月1日12月2日12月3日溫差x(0C)111312發(fā)芽數(shù)y(顆)2530262某農(nóng)科所對(duì)冬季晝夜溫差大小與某反季節(jié)大豆新品種發(fā)芽多少之間的關(guān)系進(jìn)行分析研究,他們分別記錄了12月1日到3日的每天晝夜溫差與實(shí)驗(yàn)室每天每100顆種子發(fā)芽數(shù),得到如下資料:該農(nóng)科所確定的研究方案是:先從這3組數(shù)據(jù)求出線性回歸方程,再對(duì)12月4日的數(shù)據(jù)進(jìn)行推

2、測(cè)和檢驗(yàn).則根據(jù)以上3天的數(shù)據(jù),求出y關(guān)于x的線性回歸方程是( )A. B. C. D. 5下列說(shuō)法正確的有( )個(gè) 在回歸分析中,用指數(shù)系數(shù)的值判斷模型的擬合效果,越大,模型的擬合效果越好在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,擬合效果越好在回歸分析中,可用相關(guān)系數(shù)的值判斷模型的擬合效果,越大,模型的擬合效果越好在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明這樣的模型比較合適帶狀區(qū)域的寬度越窄,說(shuō)明模型的擬合精度越高 A1 B2 C3 D46相關(guān)系數(shù)是度量 ( )A兩個(gè)變量之間線性相關(guān)關(guān)系的強(qiáng)度 B散點(diǎn)圖是否顯示有意義的模型C兩

3、個(gè)變量之間是否存在因果關(guān)系 D兩個(gè)變量之間是否存在關(guān)系7統(tǒng)計(jì)中有一個(gè)非常有用的統(tǒng)計(jì)量,用它的大小可以確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”,下表是反映甲、乙兩個(gè)平行班(甲班A老師教, 乙班B老師教)進(jìn)行某次數(shù)學(xué)考試,按學(xué)生考試及格與不及格統(tǒng)計(jì)成績(jī)后的2×2列聯(lián)表.不及格及格總計(jì)甲班(A教)43640乙班(B教)162440總計(jì)206080根據(jù)的值,你認(rèn)為不及格人數(shù)的多少與不同老師執(zhí)教有關(guān)系的把握大約為( )A99.5% B99.9% C95% D無(wú)充分依據(jù).8給出如下列聯(lián)表患心臟病患其它病合 計(jì)高血壓201030不高血壓305080合 計(jì)5060110,,參照公式,得到的正確

4、結(jié)論是( )A有99%以上的把握認(rèn)為“高血壓與患心臟病無(wú)關(guān)”B有99%以上的把握認(rèn)為“高血壓與患心臟病有關(guān)”C在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“高血壓與患心臟病無(wú)關(guān)” D在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“高血壓與患心臟病有關(guān)” 10已知x與y之間的一組數(shù)據(jù):x0123y1357則y與x的線性回歸方程為必過(guò)點(diǎn)( )A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2)11設(shè)(x1,y1),(x2,y2),(xn,yn)是變量x和y的n次方個(gè)樣本點(diǎn),直線l是由這些樣本點(diǎn)通過(guò)最小二乘法得到的線性回歸直線,以下結(jié)論正確的是( )A.直線l過(guò)點(diǎn)B.x和y的相關(guān)系

5、數(shù)為直線l的斜率C.x和y的相關(guān)系數(shù)在0到1之間D.當(dāng)n為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)一定相同12利用獨(dú)立性檢驗(yàn)來(lái)考慮兩個(gè)分類變量與是否有關(guān)系時(shí),通過(guò)查閱下表來(lái)確定“和有關(guān)系”的可信度。如果,那么就有把握認(rèn)為“和有關(guān)系”的百分比為( )A25% B95% C5% D97.5%13下面關(guān)于卡方說(shuō)法正確的是( )A.K2在任何相互獨(dú)立的問(wèn)題中都可以用于檢驗(yàn)有關(guān)還是無(wú)關(guān)B.K2的值越大,兩個(gè)事件的相關(guān)性就越大C.K2是用來(lái)判斷兩個(gè)分類變量是否相關(guān)的隨機(jī)變量,當(dāng)K2的值很小時(shí)可以推定兩類變量不相關(guān)D.K2的觀測(cè)值的計(jì)算公式是男女總計(jì)喜歡吃零食51217不喜歡吃零食402868合計(jì)45408515

6、吃零食是中學(xué)生中普遍存在的現(xiàn)象吃零食對(duì)學(xué)生身體發(fā)育有諸多不利影響,影響學(xué)生的健康成長(zhǎng)下表給出性別與吃零食的列聯(lián)表:試回答吃零食與性別有關(guān)系嗎?(答有或沒(méi)有)_ 16若由一個(gè)2*2列聯(lián)表中的數(shù)據(jù)計(jì)算得k2=4.013,那么有_把握認(rèn)為兩個(gè)變量有關(guān)系?17給出下列四個(gè)結(jié)論:在畫兩個(gè)變量的散點(diǎn)圖時(shí),預(yù)報(bào)變量在軸上,解釋變量在軸上; 線性相關(guān)系數(shù)r越大,兩個(gè)變量的線性相關(guān)性越強(qiáng);反之,線性相關(guān)性越??;用獨(dú)立性檢驗(yàn)(22列聯(lián)表法)來(lái)考察兩個(gè)分類變量是否有關(guān)系時(shí),算出的隨機(jī)變量k2的值越大,說(shuō)明“x與y有關(guān)系”成立的可能性越大;殘差平方和越小的模型,擬合的效果越好;其中結(jié)論正確的序號(hào)為 。18某城市理論預(yù)

7、測(cè)2000年到2004年人口總數(shù)與年份的關(guān)系如下表所示年份200x(年)01234人口數(shù) y (十萬(wàn))5781119根據(jù)表格和線性回歸方程,可預(yù)報(bào)在2005年,該城市人口總數(shù)是_19 對(duì)于回歸直線方程,當(dāng)時(shí),的估計(jì)值為20對(duì)具有線性相關(guān)關(guān)系的變量x和y,由測(cè)得的一組數(shù)據(jù)已求得回歸直線的斜率為6.5,且恒過(guò)(2,3)點(diǎn),則這條回歸直線的方程為_22如果發(fā)現(xiàn)散點(diǎn)圖中所有的樣本點(diǎn)都在一條直線上,則殘差平方和等于_,解釋變量和預(yù)報(bào)變量之間的相關(guān)系數(shù)等于_。23下表是種產(chǎn)品銷售收入與銷售量之間的一組數(shù)據(jù):銷售量x(噸)2356銷售收入y(千元)78912(1)畫出散點(diǎn)圖;(2)求出回歸方程;(3)根據(jù)回

8、歸方程估計(jì)銷售量為9噸時(shí)銷售收入。24甲乙兩車間生產(chǎn)同一種產(chǎn)品,各生產(chǎn)40個(gè)后,按產(chǎn)品合格與不合格進(jìn)行統(tǒng)計(jì),甲車間生產(chǎn)的產(chǎn)品合格數(shù)為36個(gè),乙車間生產(chǎn)的產(chǎn)品合格數(shù)為24個(gè)(1)根據(jù)以上數(shù)據(jù)完成列聯(lián)表:(2)試判斷是否產(chǎn)品合格與生產(chǎn)車間是否有關(guān)?25某種產(chǎn)品的廣告費(fèi)用支出與銷售額之間有如下的對(duì)應(yīng)數(shù)據(jù):245683040605070(1)畫出散點(diǎn)圖;并說(shuō)明銷售額y與廣告費(fèi)用支出x之間是正 相關(guān)還是負(fù)相關(guān)?(2)用最小二乘法求出關(guān)于的線性回歸方程;(3)據(jù)此估計(jì)廣告費(fèi)用為10時(shí),銷售收入的值.26某學(xué)校為調(diào)查高三年學(xué)生的身高情況,按隨機(jī)抽樣的方法抽取80名學(xué)生,得到男生身高情況的頻率分布直方圖(圖(

9、1)和女生身高情況的頻率分布直方圖(圖(2)已知圖(1)中身高在170175cm的男生人數(shù)有16人。80及80分以上80分以下合計(jì)試驗(yàn)班351550對(duì)照班2050合計(jì)5545(I)試問(wèn)在抽取的學(xué)生中,男、女生各有多少人?(II)根據(jù)頻率分布直方圖,完成下列的2×2列聯(lián)表,并判斷能有多大(百分幾)的把握認(rèn)為“身高與性別有關(guān)”?()在上述80名學(xué)生中,從身高在170175cm之間的學(xué)生按男、女性別分層抽樣的方法,抽出5人,從這5人中選派3人當(dāng)旗手,求3人中恰好有一名女生的概率。第5頁(yè) 共6頁(yè) 第6頁(yè) 共6頁(yè)本卷由系統(tǒng)自動(dòng)生成,請(qǐng)仔細(xì)校對(duì)后使用,答案僅供參考。參考答案1D【解析】試題分析:

10、因?yàn)榛貧w直線方程過(guò)樣本中心點(diǎn),而此題的樣本中心點(diǎn)為即,將樣本中心點(diǎn)代入回歸直線方程得考點(diǎn):回歸分析的基本思想及應(yīng)用2C【解析】3C【解析】,故選C4A【解析】,故選A。5B 【解析】用系數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好,故(1)正確,可用殘差平方和判斷模型的擬合效果,殘差平方和越小,模型的擬合效果越好,故(2)不正確可用相關(guān)系數(shù)r的值判斷模型的擬合效果,|r|越大,模型的擬合效果越好,故(3)正確,一般不能用殘差圖判斷模型的擬合效果,故(4)不正確,綜上可知有2個(gè)命題正確,故選B6A【解析】解:相關(guān)系數(shù)是度量?jī)蓚€(gè)變量相關(guān)性關(guān)系強(qiáng)弱的一個(gè)量,當(dāng)r的絕對(duì)值越接近于1,相關(guān)

11、性越強(qiáng)。反之,相關(guān)性越弱。7A【解析】解:k2= =80(4×24-16×36) 2/ 20×60×40×40 =9.67.879不及格人數(shù)的多少與不同老師執(zhí)教有關(guān)系的把握大約為99.5%故選A8B【解析】因?yàn)?所以,因而有99%以上的把握認(rèn)為“高血壓與患心臟病有關(guān)”.9B【解析】試題分析:,故線性回歸所表示的直線必經(jīng)過(guò),故選B.考點(diǎn):線性回歸方程點(diǎn)評(píng):解決線性回歸直線的方程,利用最小二乘法求出直線的截距和斜率,注意由公式判斷出回歸直線一定過(guò)樣本中心點(diǎn)10B【解析】試題分析:由數(shù)據(jù)可知,線性回歸方程為必過(guò)點(diǎn)(1.5,4)考點(diǎn):本題考查了線性回歸

12、直線方程的性質(zhì)點(diǎn)評(píng):解決此類問(wèn)題常常用到線性回歸直線方程恒過(guò)定點(diǎn)這一結(jié)論,屬基礎(chǔ)題11A【解析】試題分析:回歸直線一定過(guò)這組數(shù)據(jù)的樣本中心點(diǎn),兩個(gè)變量的相關(guān)系數(shù)不是直線的斜率,兩個(gè)變量的相關(guān)系數(shù)的絕對(duì)值是小于1的,是在1與1之間,所有的樣本點(diǎn)集中在回歸直線附近,沒(méi)有特殊的限制解:回歸直線一定過(guò)這組數(shù)據(jù)的樣本中心點(diǎn),故A正確,兩個(gè)變量的相關(guān)系數(shù)不是直線的斜率,而是需要用公式做出,故B不正確,兩個(gè)變量的相關(guān)系數(shù)的絕對(duì)值是小于1的,故C不正確,所有的樣本點(diǎn)集中在回歸直線附近,不一定兩側(cè)一樣多,故D不正確,故選A點(diǎn)評(píng):本題考查線性回歸方程,考查樣本中心點(diǎn)的性質(zhì),考查相關(guān)系數(shù)的做法,考查樣本點(diǎn)的分布特點(diǎn)

13、,是一個(gè)基礎(chǔ)題12B【解析】試題分析:解:k5、024,而在觀測(cè)值表中對(duì)應(yīng)于5.024的是0.025,有1-0.025=97.5%的把握認(rèn)為“X和Y有關(guān)系”,故選D.考點(diǎn):獨(dú)立性檢驗(yàn)的應(yīng)用.13B【解析】只適用于2×2型列聯(lián)表問(wèn)題,且只能推定兩個(gè)分類變量相關(guān)的大小,所以A錯(cuò);的值很小時(shí),只能說(shuō)兩個(gè)變量的相關(guān)程度低,不能推定兩個(gè)變量不相關(guān)所以C錯(cuò);選項(xiàng)D中,所以D錯(cuò)。故選B1424.68【解析】略15有【解析】,則吃零食和性別有關(guān)系的概率為95%,所以兩者有關(guān)系1695%【解析】解:一個(gè)2*2列聯(lián)表中的數(shù)據(jù)計(jì)算得2=4.013,4.0133.841,有95%的把握說(shuō)這兩個(gè)變量有關(guān)系,答

14、案為:95%17 、【解析】解:中預(yù)報(bào)變量和解釋變量位置反了,線性相關(guān)系數(shù)|r|越大,相關(guān)性越強(qiáng)。用獨(dú)立性檢驗(yàn)(22列聯(lián)表法)來(lái)考察兩個(gè)分類變量是否有關(guān)系時(shí),算出的隨機(jī)變量k2的值越大,說(shuō)明“x與y有關(guān)系”成立的可能性越大;符合定義。殘差平方和越小的模型,擬合的效果越好,成立。18196萬(wàn)【解析】,當(dāng)x=5時(shí),y=196(萬(wàn)).19390【解析】解:因?yàn)楦鶕?jù)回歸直線方程,將x=28代入到方程中,可知y的估計(jì)值為257+4.5728=390.20【解析】試題分析:回歸直線方程設(shè)為,恒過(guò)點(diǎn)代入,所以回歸方程為.考點(diǎn):線性回歸方程211.39【解析】考查公式獨(dú)立性檢驗(yàn)的公式,;此題中:,代入上式即可

15、求出220,1或-1【解析】設(shè)樣本點(diǎn)為,回歸直線為;若散點(diǎn)圖中所有的樣本點(diǎn)都在一條直線上,則此直線方程就是回歸直線方程。所以有;殘差平方和;解釋變量和預(yù)報(bào)變量之間的相關(guān)系數(shù)R滿足23解:(1)圖略 (4分) (2)解:由題, . . .8分; . . .10分(3)解:由題,x=9時(shí),=9.9+4.6=14.5答:根據(jù)回歸方程,銷售量為9噸時(shí),銷售收入約為14.5千元。. . .12分【解析】略【答案】a=4,b=36,c=16,d=24,n=80 k=9.6在犯錯(cuò)誤的概率不超過(guò)0.5%的前提下,認(rèn)為產(chǎn)品合格與生產(chǎn)車間是有關(guān)的?!窘馕觥柯?5(1)見解析;(2);(3).【解析】(1)在坐標(biāo)系

16、內(nèi)把對(duì)應(yīng)的點(diǎn)描出即得散點(diǎn)圖,有圖可得y與x之間是正相關(guān);(2)利用公式, 求出a,b.再求出樣本點(diǎn)中心(5,50),寫出回歸直線方程為;(3)把代入得,就是銷售收入的值估計(jì).解:(1)作出散點(diǎn)圖如下圖所示: -3分銷售額y與廣告費(fèi)用支出x之間是正相關(guān);(2), ,因此回歸直線方程為;-6分(3)時(shí),估計(jì)的值為-8分26(1)40,40;(2)能有999的把握認(rèn)為身高與性別有關(guān);(3).【解析】(1)由頻率分布直方圖先得身高在170 175cm的男生的頻率為;(2);(3)古典概型.解:()直方圖中,因?yàn)樯砀咴?70 175cm的男生的頻率為,設(shè)男生數(shù)為,則,得4分由男生的人數(shù)為40,得女生的人

17、數(shù)為80-40=40()男生身高的人數(shù),女生身高的人數(shù),所以可得到下列二列聯(lián)表:170cm<170cm總計(jì)男生身高301040女生身高43640總計(jì)3446806分,7分所以能有999的把握認(rèn)為身高與性別有關(guān); 8分()在170175cm之間的男生有16人,女生人數(shù)有人按分層抽樣的方法抽出5人,則男生占4人,女生占1人 9分設(shè)男生為,女生為從5人任選3名有:,共10種可能, 10分3人中恰好有一名女生有:共6種可能, 11分故所求概率為 12分【答案】解:()如下表:會(huì)俄語(yǔ)不會(huì)俄語(yǔ)總計(jì)男10616女6814總計(jì)161430 3分假設(shè):是否會(huì)俄語(yǔ)與性別無(wú)關(guān).由已知數(shù)據(jù)可求得 .所以在犯錯(cuò)的

18、概率不超過(guò)0.10的前提下不能判斷會(huì)俄語(yǔ)與性別有關(guān). 6分()會(huì)俄語(yǔ)的6名女記者,分別設(shè)為A,B,C,D,E,F,其中A,B,C,D曾在俄羅斯工作過(guò). 則從這6人中任取2人有AB,AC,AD,AE,AF,BC,BD, BE,BF,CD,CE, CF,DE,DF,EF 共15種, 9分 其中2人都在俄羅斯工作過(guò)的是AB,AC,AD,BC,BD,CD共6種, 11分所以抽出的女記者中,2人都在俄羅斯工作過(guò)的概率是P=. 12分【解析】略【答案】【解析】略29(1)男生女生總計(jì)報(bào)考理科10313報(bào)考文科257總計(jì)12820(2),所以我們有把握認(rèn)為該中學(xué)的高三學(xué)生選報(bào)文理科與性別有關(guān)【解析】(I)寫列聯(lián)表要注意格式,是列聯(lián)表.(2)利用公式,然后與提供的數(shù)據(jù)表對(duì)照估計(jì)出把文理科與性別存在相關(guān)關(guān)系的可信度.解:(1)男生女生總計(jì)報(bào)考理科10313報(bào)考文科257總計(jì)12820(2) 假設(shè):報(bào)考文理科與性別無(wú)關(guān). 則的估計(jì)值因?yàn)?,所以我們有把握認(rèn)為該中學(xué)的高三學(xué)生選報(bào)文理科與性別有關(guān)30(1)見解析.(2) y = 3.2 x + 3.6 (3)2005年該城市人口總數(shù)為196萬(wàn)?!窘馕觥浚?)利用公式求線性回歸方程即可。(3)根據(jù)(2)的結(jié)果,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論