版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、_3.1回歸分析的基本思想及其初步應用回歸直線方程提出問題必修3中,求出回歸直線方程x.問題1:回歸直線方程準確的反映了x,y之間的關系嗎?提示:不是問題2:所有的兩個相關變量都可以求回歸方程嗎?提示:可以,但擬合程度很差導入新知1回歸分析回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法2回歸直線方程方程x是兩個具有線性相關關系的變量的一組數(shù)據(jù)(x1,y1)(x2,y2),(xn,yn)的回歸方程,其中,是待定參數(shù),其最小二乘估計分別為:其中i,i,(,)稱為樣本點的中心化解疑難線性回歸方程中系數(shù)的含義(1)是回歸直線的斜率的估計值,表示x每增加一個單位,y的平均增加單位數(shù),而不是
2、增加單位數(shù)(2)當0時,變量y與x具有正的線性相關關系;當0時,變量y與x具有負的線性相關關系線性回歸分析提出問題具有相關關系的兩個變量的回歸直線方程x.問題1:預報變量與真實值y一樣嗎?提示:不一定問題2:預報值與真實值y之間誤差大了好還是小了好?提示:越小越好導入新知1殘差平方和法(1)iyiiyixi(i1,2,n),稱為相應于點(xi,yi)的殘差(2)殘差平方和(yii)2越小,模型擬合效果越好2殘差圖法殘差點比較均勻地落在水平的帶狀區(qū)域內,說明選用的模型比較合適,其中這樣的帶狀區(qū)域寬度越窄,說明模型的精確度越高3利用相關指數(shù)r2刻畫回歸效果其計算公式為:r21,其幾何意義:r2越接
3、近于1,表示回歸效果越好化解疑難1在線性回歸模型中,因為e是一個隨機變量,所以可以通過其數(shù)字特征來刻畫它的一些總體特征2在線性回歸模型中,r2表示解釋變量對于預報變量變化的貢獻率,r2越接近于1,表示回歸的效果越好求線性回歸方程例1某種產(chǎn)品的廣告費用支出x與銷售額y(單位:百萬元)之間有如下的對應數(shù)據(jù):x/百萬元24568y/百萬元3040605070(1)畫出散點圖;(2)求線性回歸方程;(3)試預測廣告費用支出為10百萬元時,銷售額多大?解(1)散點圖如圖所示:(2)列出下表,并用科學計算器進行有關計算:i12345合計xi2456825yi3040605070250xiyi6016030
4、03005601 380x416253664145所以,5,50,145,iyi1 380.于是可得6.5, 506.5517.5.所以所求的線性回歸方程為6.5x17.5.(3)根據(jù)上面求得的線性回歸方程,當廣告費用支出為10百萬元時,6.51017.582.5(百萬元),即廣告費用支出為10百萬元時,銷售額大約為82.5百萬元類題通法求線性回歸方程的步驟(1)列表表示xi,yi,xiyi,x;(2)計算,iyi;(3)代入公式計算,的值;(4)寫出線性回歸方程活學活用為了估計山上積雪融化后對下游灌溉的影響,在山下建立了一個觀測站,測量了最大積雪深度x(尺)與當年灌溉面積y(千畝),得到連續(xù)
5、10年的數(shù)據(jù)于下表:年序最大積雪深度x/尺灌溉面積y/千畝115.228.6210.419.3321.240.5418.635.6526.448.9623.445.0713.529.2816.734.1924.046.71019.137.4(1)試根據(jù)散點圖判斷變量y與x是否相關?(2)若y與x相關,求出回歸直線方程解:為了研究這些數(shù)據(jù)中所蘊含的規(guī)律性,我們把各年最大積雪深度作為橫坐標,相應的灌溉面積作為縱坐標,將這些數(shù)據(jù)點標在平面直角坐標系中,如下圖所示從上圖可以看到,數(shù)據(jù)點大致落在一條直線附近,這告訴我們變量x與y之間的關系大致可看作是線性關系,從上圖還可以看到,這些點又不都在一條直線上,
6、這表明x與y的關系并沒有確切到給定x就可以唯一地確定y的程度,事實上,還有許多其他因素對y產(chǎn)生影響,如當年的平均氣溫,當年的降雨量等等,這些都是影響y取什么值的隨機因素,研究x與y的關系,利用公式得,(15.210.419.1)18.85,(28.619.337.4)36.53,x10 2227.845,xiyi10 413.065,1.813,36.531.81318.852.355.從而回歸直線方程為1.813x2.355.線性回歸分析例2已知某種商品的價格x(元)與需求量y(件)之間的關系有如下一組數(shù)據(jù):x(元)1416182022y(件)1210753求y對x的回歸直線方程,并說明回歸
7、模型擬合效果的好壞解(1416182022)18,(1210753)7.4,1421621822022221 660,122102725232327,iyi14121610187205223620,1.15. 7.41.151828.1,所求回歸直線方程為1.15x28.1.列出殘差表:yii00.30.40.10.2yi4.62.60.42.44.4(yii)20.3,(yi)253.2,r210.994,故回歸模型的擬合效果很好類題通法在進行線性回歸分析時,要按線性回歸分析步驟進行在求r2時,通常采用分步計算的方法,r2越大,模型的擬合效果越好活學活用關于x與y有如下數(shù)據(jù):x24568y3
8、040605070有如下的兩個線性模型:(1)6.5x17.5;(2)7x17.試比較哪一個擬合效果更好解:由(1)可得yii與yi的關系如下表:yii0.53.5106.50.5yi201010020(yii)2(0.5)2(3.5)2102(6.5)20.52155,(yi)2(20)2(10)2102022021 000.r110.845.由(2)可得yii與yi的關系如下表:yii15893yi201010020 (yii)2(1)2(5)282(9)2(3)2180,(yi)2(20)2(10)2021022021 000.r110.82.由于r0.845,r0.82,0.8450.
9、82,rr.(1)的擬合效果好于(2)的擬合效果.非線性回歸分析例3在一次抽樣調查中測得樣本的5個樣本點,數(shù)值如下表:x0.250.5124y1612521試建立y與x之間的回歸方程解作出變量y與x之間的散點圖,如圖所示由圖可知變量y與x近似地呈反比例函數(shù)關系設y,令t,則ykt.由y與x的數(shù)據(jù)表可得y與t的數(shù)據(jù)表:t4210.50.25y1612521作出y與t的散點圖,如圖所示:由圖可知y與t近似地呈線性相關關系又1.55,7.2,iyi94.25,21.312 5,4.134 4, 7.24.134 41.550.8,4.134 4t0.8.所以y與x的回歸方程是0.8.類題通法非線性回
10、歸分析的步驟非線性回歸問題有時并不給出經(jīng)驗公式這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后采用適當?shù)淖兞孔儞Q,把問題化為線性回歸分析問題,使之得到解決其一般步驟為:活學活用3某電容器充電后,電壓達到100 v,然后開始放電,由經(jīng)驗知道,此后電壓u隨時間t變化的規(guī)律用公式uaebt(b0)表示,現(xiàn)測得時間t(s)時的電壓u(v)如下表:t/s012345678910u/v100755540302015101055試求:電壓u對時間t的回歸方程(提示:對公式兩邊取自然對數(shù),把問題轉化為線性回歸分析問題)解
11、:對uaebt兩邊取對數(shù)得ln uln abt,令yln u,aln a,xt,則yabx,y與x的數(shù)據(jù)如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根據(jù)表中數(shù)據(jù)畫出散點圖,如圖所示,從圖中可以看出,y與x具有較好的線性相關關系,由表中數(shù)據(jù)求得5,3.045,由公式計算得0.313, 4.61,所以y對x的線性回歸方程為0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此電壓u對時間t的回歸方程為e0.313te4.61.典例下列現(xiàn)象的線性相關程度最高的是()a某商店的職工人數(shù)與商品
12、銷售額之間的相關系數(shù)為0.87b流通費用率與商業(yè)利潤率之間的相關系數(shù)為0.94c商品銷售額與商業(yè)利潤率之間的相關系數(shù)為0.51d商品銷售額與流通費用率之間的相關系數(shù)為0.81解析|r|越接近于1,相關程度越高答案b易錯防范1解題誤認為r越近于1,相關程度越高,從而誤選a.2|r|值越大,變量之間的線性相關程度越高;|r|值越接近0,變量之間的線性相關程度越低成功破障變量x與y相對應的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量u與v相對應的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示變量y
13、與x之間的線性相關系數(shù),r2表示變量v與u之間的線性相關系數(shù),則()ar2r10b0r2r1cr20r1 dr2r1解析:選c對于變量x與y而言,y隨x的增大而增大,故變量y與x正相關,即r10;對于變量u與v而言,v隨u的增大而減小,故變量v與u負相關,即r10.故r20r1.隨堂即時演練1關于回歸分析,下列說法錯誤的是()a在回歸分析中,變量間的關系若是非確定性關系,那么因變量不能由自變量唯一確定b線性相關系數(shù)可以是正的也可以是負的c在回歸分析中,如果r21或r1,說明x與y之間完全線性相關d樣本相關系數(shù)r(1,1)解析:選d樣本的相關系數(shù)應滿足1r1.2若某地財政收入x與支出y滿足回歸方
14、程bxaei(單位:億元)(i1,2,),其中0.8,2,|ei|0.5,如果今年該地區(qū)財政收入10億元,年支出預計不會超過()a10億元b9億元c10.5億元 d9.5億元解析:選c0.8102ei10ei,|ei|0.5,10.5.3在研究氣溫和熱茶銷售杯數(shù)的關系時,若求得相關指數(shù)r20.85,則表明氣溫解釋了_的熱茶銷售杯數(shù)變化,而隨機誤差貢獻了剩余的_,所以氣溫對熱茶銷售杯數(shù)的效應比隨機誤差的效應大得多解析:由相關指數(shù)r2的意義可知,r20.85表明氣溫解釋了85%,而隨機誤差貢獻了剩余的15%.答案:85%15%4若施肥量x(kg)與小麥產(chǎn)量y(kg)之間的回歸直線方程為2504x,
15、當施肥量為50 kg時,預計小麥產(chǎn)量為_解析:把x50代入2504x,可求得450.答案:450 kg5某工廠為了對新研發(fā)的一種產(chǎn)品進行合理定價,將該產(chǎn)品按事先擬定的價格進行試銷,得到如下數(shù)據(jù):單價x(元)88.28.48.68.89銷量y(件)908483807568(1)求回歸直線方程x,其中b20,;(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產(chǎn)品的成本是4元/件,為使工廠獲得最大利潤,該產(chǎn)品的單價應定為多少元?(利潤銷售收入成本)解:(1)因為(88.28.48.68.89)8.5,(908483807568)80.從而2080208.5250,故20x250.(2
16、)由題意知,工廠獲得利潤z(x4)y20x2330x1 00020(x)2361.25,所以當x8.25時,zmax361.25(元)即當該產(chǎn)品的單價定為8.25元時,工廠獲得最大利潤課時達標檢測一、選擇題1為了研究變量x和y的線性相關性,甲、乙兩人分別利用線性回歸方法得到回歸直線l1和l2,已知兩人計算過程中,分別相同,則下列說法正確的是()al1與l2一定平行bl1與l2重合cl1與l2相交于點(,)d無法判斷l(xiāng)1和l2是否相交解析:選c回歸直線一定過樣本點的中心(,),故c正確2甲、乙、丙、丁四位同學在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的相關指數(shù)r2分別如下
17、表:甲乙丙丁r20.980.780.500.85哪位同學建立的回歸模型擬合效果最好?()a甲 b乙c丙 d丁解析:選a相關指數(shù)r2越大,表示回歸模型的擬合效果越好3對變量x,y進行回歸分析時,依據(jù)得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是()解析:選a用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高4設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i1,2,n),用最小二乘法建立的回歸方程為0.85x85.71,則下列結論中不正確的是()
18、ay與x具有正的線性相關關系b回歸直線過樣本點的中心(,)c若該大學某女生身高增加1 cm,則其體重約增加0.85 kgd若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg解析:選d回歸方程中x的系數(shù)為0.850,因此y與x具有正的線性相關關系,a正確;由回歸方程系數(shù)的意義可知回歸直線過樣本點的中心(,),b正確;依據(jù)回歸方程中的含義可知,x每變化1個單位,相應變化約0.85個單位,c正確;用回歸方程對總體進行估計不能得到肯定的結論,故d錯誤5某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如下表:廣告費用x(萬元)4235銷售額y(萬元)49263954根據(jù)上表可得回歸方程x中的為9
19、.4,據(jù)此模型預報廣告費用為6萬元時銷售額為()a63.6萬元 b65.5萬元c67.7萬元 d72.0萬元解析:選b樣本點的中心是(3.5,42),則429.43.59.1,所以回歸直線方程是9.4x9.1,把x6代入得65.5.二、填空題6在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i1,2,n)都在直線yx1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為_解析:根據(jù)樣本相關系數(shù)的定義可知,當所有樣本點都在直線上時,相關系數(shù)為1.答案:17若一個樣本的總偏差平方和為80,殘差平方和為60,則相關指數(shù)r2為_解析:
20、回歸平方和總偏差平方和殘差平方和 806020,故r20.25或r210.25答案:0.258面對競爭日益激烈的消費市場,眾多商家不斷擴大自己的銷售市場,以降低生產(chǎn)成本某白酒釀造企業(yè)市場部對該企業(yè)9月份的產(chǎn)品銷量(單位:千箱)與單位成本(單位:元)的資料進行線性回歸分析,結果如下:,71,79,iyi1 481.則銷量每增加1 000箱,單位成本下降_元解析:由題意知,1.818 2,71(1.818 2)77.36,1.818 2x77.36,銷量每增加1千箱,則單位成本下降1.818 2元答案:1.818 2三、解答題9某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額數(shù)據(jù)如下表:推銷員編
21、號12345工作年限x/年35679年推銷金額y/萬元23345(1)求年推銷金額y關于工作年限x的線性回歸方程;(2)若第6名推銷員的工作年限為11年,試估計他的年推銷金額解:(1)設所求的線性回歸方程為x,則0.5, 0.4.所以年推銷金額y關于工作年限x的線性回歸方程為0.5x0.4.(2)當x11時,0.5x0.40.5110.45.9(萬元)所以可以估計第6名推銷員的年推銷金額為5.9萬元10假設某農(nóng)作物基本苗數(shù)x與有效穗數(shù)y之間存在相關關系,今測得5組數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x為解釋變量,y為預報變量,畫
22、出散點圖;(2)求y與x之間的回歸方程,對于基本苗數(shù)56.7預報有效穗數(shù);(3)計算各組殘差解:(1)散點圖如圖所示(2)由圖看出,樣本點呈條狀分布,有比較好的線性相關關系,因此可以用線性回歸方程來建立兩個變量之間的關系設線性回歸方程為x,由表中數(shù)據(jù)可得0.29,34.66,故y與x之間的回歸方程為0.29x34.66.當x56.7時,0.2956.734.6651.103.故估計有效穗數(shù)為51.103.(3)各組數(shù)據(jù)的殘差分別為10.39,20.76,30.46,42.17,51.66.3.2獨立性檢驗的基本思想及其初步應用獨立性檢驗的有關概念提出問題某校高三模擬考試調查中,性格內向的426
23、人中有332人考前緊張,性格外向的594人中有213人考前緊張問題1:考前緊張與性格類別有關系嗎?提示:有問題2:通過怎樣比較看出有?提示:通過考前緊張的人數(shù)占性格類型的比例導入新知1分類變量變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量222列聯(lián)表假設有兩個分類變量x和y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(也稱為22列聯(lián)表)為:y1y2總計x1ababx2cdcd總計acbdabcd3k2統(tǒng)計量為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,我們構造一個隨機變量k2,其中nabcd為樣本容量4獨立性檢驗利用隨機變量k2來確定是否能以給定把握認為“兩個分類變
24、量有關系”的方法,稱為兩個分類變量獨立性檢驗化解疑難122列聯(lián)表的特征2在列聯(lián)表中,如果兩個分類變量沒有關系,則應滿足adbc0.因此|adbc|越小,說明兩個分類變量之間的關系越弱;|adbc|越大,說明兩個分類變量之間的關系越強.獨立性檢驗的思想提出問題吸煙與患肺癌“列聯(lián)表”中,事件a表示不吸煙,b表示不患肺癌問題1:事件a,b發(fā)生的頻率可求嗎?提示:可以問題2:通常情況下,為研究問題方便,常用什么近似于概率?提示:頻率問題3:事件a,b無關有怎樣的概率公式?提示:p(ab)p(a)p(b)導入新知獨立性檢驗的思想:要確定“兩個分類變量有關系”這一結論成立的可信程度,首先假設結論不成立,即
25、假設結論“兩個分類變量沒有關系”成立在該假設下我們構造的隨機變量k2應該很小,如果由觀測數(shù)據(jù)計算得到的k2觀測值k很大,那么在一定程度上說明假設不合理,根據(jù)隨機變量k2的含義,可以通過可信度表評價該假設不合理的程度,即“兩個分類變量有關系”的可信程度化解疑難1p(k26.635)0.01表明h0成立的概率很小,是小概率事件,可以判斷h0不成立,也就是“兩個分類變量之間沒有關系”錯誤地判斷為“兩個分類變量之間有關系”的概率不超過0.01,也可以理解為“有99%的把握認為兩個分類變量之間有關系”2利用獨立性檢驗解決問題的基本步驟:(1)根據(jù)相關數(shù)據(jù)作列聯(lián)表;(2)求k2的觀測值;(3)與臨界值作比
26、較,得出結論.列聯(lián)表和等高條形圖的應用例1某學校對高三學生作了一項調查,發(fā)現(xiàn):在平時的模擬考試中,性格內向的學生426人中有332人在考前心情緊張,性格外向的學生594人中有213人在考前心情緊張作出等高條形圖,利用圖形判斷考前心情緊張與性格類別是否有關系解作列聯(lián)表如下:性格內向性格外向總計考前心情緊張332213545考前心情不緊張94381475總計4265941 020相應的等高條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內向的比例從圖中可以看出考前心情緊張的樣本中性格內向占的比例比考前心情不緊張樣本中性格內向占的比例高,可以認為考前緊張與性格類型有關類題通法進行獨
27、立性檢驗的前提是根據(jù)題中數(shù)據(jù)獲得22列聯(lián)表,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征,即將與(或與)的值相比,由此能直觀地反映出兩個分類變量間是否相互影響,但是此方法較粗劣活學活用為了研究子女吸煙與父母吸煙的關系,調查了一千多名青少年及其家長,數(shù)據(jù)如下:父母吸煙父母不吸煙總計子女吸煙23783320子女不吸煙6785221 200總計9156051 520利用等高條形圖判斷父母吸煙對子女吸煙是否有影響?解:等高條形圖如下:由圖形觀察可以看出父母吸煙者中子女吸煙的比例要比父母不吸煙者中子女吸煙的比例高,因此可以在某種程度上認為“子女吸煙與父母吸煙有關系”.考查獨立性檢驗的原理例2研究人員選取170
28、名青年男女大學生為樣本,對他們進行一種心理測驗發(fā)現(xiàn)有60名女生對該心理測驗中的最后一個題目的反應是:作肯定的有22名,否定的有38名;男生110名在相同的項目上作肯定的有22名,否定的有88名問:性別與態(tài)度之間是否存在某種關系?用獨立性檢驗的方法判斷附:p(k2k0)0.100.050.025k02.7063.8415.024解根據(jù)題目所給數(shù)據(jù)建立如下22列聯(lián)表:肯定否定總計男生2288110女生223860總計44126170根據(jù)22列聯(lián)表中的數(shù)據(jù)得到:k5.6223.841.所以在犯錯誤的概率不超過0.05的前提下,認為“性別與態(tài)度有關系”類題通法根據(jù)題意列出22列聯(lián)表,計算k2的觀測值,
29、如果k2的觀測值很大,說明兩個分類變量有關系的可能性很大;如果k2的觀測值比較小,則認為沒有充分的證據(jù)顯示兩個分類變量有關系這需要給出正確的計算,避免計算失誤活學活用在一次天氣惡劣的飛機航程中,調查了男女乘客在飛機上暈機的情況:男乘客暈機的有24人,不暈機的有31人;女乘客暈機的有8人,不暈機的有26人請你根據(jù)所給數(shù)據(jù)判定:在天氣惡劣的飛機航程中,男乘客是否比女乘客更容易暈機?附:p(k2k0)0.100.05k02.7063.848解:根據(jù)題意,列出22列聯(lián)表如下:暈機不暈機總計男乘客243155女乘客82634總計325789假設在天氣惡劣的飛機航程中男乘客不比女乘客更容易暈機由公式可得k
30、2的觀測值k3.6892.706,故在犯錯誤的概率不超過0.10的前提下,認為“在天氣惡劣的飛機航程中男乘客比女乘客更容易暈機”典例(12分)某工廠有工人1 000名,其中250名工人參加過短期培訓(稱為a類工人),另外750名工人參加過長期培訓(稱為b類工人)現(xiàn)用分層抽樣的方法(按a類、b類分兩層)從該工廠的工人中抽取100名工人,調查他們的生產(chǎn)能力(此處生產(chǎn)能力指一天加工的零件數(shù)),結果如下表表1:a類工人生產(chǎn)能力的頻數(shù)分布表生產(chǎn)能力分組110,120)120,130)130,140)140,150)人數(shù)8x32表2:b類工人生產(chǎn)能力的頻數(shù)分布表生產(chǎn)能力分組110,120)120,130)
31、130,140)140,150)人數(shù)6y2718(1)確定x,y的值;(2)完成下面22列聯(lián)表,并回答能否在犯錯誤的概率不超過0.001的前提下認為工人的生產(chǎn)能力與工人的類別有關系?生產(chǎn)能力分組工人類別110,130)130,150)總計a類工人b類工人總計附:k2,p(k2k0)0.0500.0100.001k03.8416.63510.828解題流程 (2)根據(jù)所給的數(shù)據(jù)可以完成列聯(lián)表,如下表所示:生產(chǎn)能力分組工人類別110,130)130,150)總計a類工人20525b類工人304575總計5050100 (6分)由列聯(lián)表中的數(shù)據(jù),得k2的觀測值為活學活用(東北三校聯(lián)考)某學生對其親屬
32、30人的飲食進行了一次調查,并用下圖所示的莖葉圖表示30人的飲食指數(shù)(說明:圖中飲食指數(shù)低于70的人,飲食以蔬菜為主;飲食指數(shù)高于70的人,飲食以肉類為主)(1)根據(jù)以上數(shù)據(jù)完成下列22列聯(lián)表:主食蔬菜主食肉類總計50歲以下50歲以上總計(2)能否在犯錯誤的概率不超過0.01的前提下認為其親屬的飲食習慣與年齡有關?并寫出簡要分析解:(1)22列聯(lián)表如下:主食蔬菜主食肉類總計50歲以下481250歲以上16218總計201030(2)因為k2106.635,p(k26.635)0.01所以可以在犯錯誤的概率不超過0.01的前提下認為其親屬的飲食習慣與年齡有關隨堂即時演練1觀察下列各圖,其中兩個分
33、類變量x,y之間關系最強的是()解析:選d在四幅圖中,d圖中兩個深色條的高相差最明顯,說明兩個分類變量之間關系最強2下面是一個22列聯(lián)表:y1y2總計x1a2173x222527總計b46則表中a、b處的值分別為()a94,96b52,50c52,54 d54,52解析:選c由得3獨立性檢驗所采用的思路是:要研究a,b兩類型變量彼此相關,首先假設這兩類變量彼此_,在此假設下構造隨機變量k2,如果k2的觀測值較大,那么在一定程度上說明假設_答案:無關不成立4在吸煙與患肺病是否相關的判斷中,有下面的說法:若k2的觀測值k6.635,則在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系,那
34、么在100個吸煙的人中必有99人患有肺??;從獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系時,若某人吸煙,則他有99%的可能患有肺病;從獨立性檢驗可知在犯錯誤的概率不超過0.05的前提下,認為吸煙與患肺病有關系時,是指有5%的可能性使得推斷錯誤其中說法正確的是_解析:k2是檢驗吸煙與患肺病相關程度的量,是相關關系,而不是確定關系,是反映有關和無關的概率,故說法不正確;說法中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說法正確答案:5為了解決高二年級統(tǒng)計案例入門難的問題,某校在高一年級的數(shù)學教學中設有試驗班,著重加強統(tǒng)計思想的滲透,下面是高二年級統(tǒng)計案例的測驗成績統(tǒng)計
35、表(單位:分)的一部分,試分析實驗效果.70及70分以下70分以上總計對照班321850試驗班123850總計4456100附:p(k2k0)0.0250.0100.005k05.0246.6357.879解:根據(jù)列聯(lián)表中的數(shù)據(jù),由公式得k2的觀測值k16.234.因為16.2346.635,所以,在犯錯誤的概率不超過0.01的前提下認為高二年級統(tǒng)計案例的測試成績與高一年級數(shù)學教學中增加統(tǒng)計思想的滲透有聯(lián)系課時達標檢測一、選擇題1判斷兩個分類變量是彼此相關還是相互獨立的常用的方法中,最為精確的是()a22列聯(lián)表 b獨立性檢驗c等高條形圖 d其他解析:選ba、c只能直觀地看出兩個分類變量x與y是
36、否相關,但看不出相關的程度;獨立性檢驗通過計算得出相關的可能性,較為準確2假設有兩個分類變量x和y,它們的值域分別為x1,x2和y1,y2,其22列聯(lián)表為y xy1y2總計x1ababx2cdcd總計acbdabcd對同一樣本,以下數(shù)據(jù)能說明x與y有關的可能性最大的一組為()aa5,b4,c3,d2 ba5,b3,c4,d2ca2,b3,c4,d5 da3,b2,c4,d5解析:選d對于同一樣本,|adbc|越小,說明x與y相關性越弱,而|adbc|越大,說明x與y相關性越強,通過計算知,對于a,b,c都有|adbc|1012|2;對于選項d,有|adbc|158|7,顯然72.3對于分類變量
37、x與y的隨機變量k2的觀測值k,下列說法正確的是()ak越大,“x與y有關系”的可信程度越小bk越小,“x與y有關系”的可信程度越小ck越接近于0,“x與y沒有關系”的可信程度越小dk越大,“x與y沒有關系”的可信程度越大解析:選bk越大,“x與y沒有關系”的可信程度越小,則“x與y有關系”的可信程度越大即k越小,“x與y有關系”的可信程度越小4利用獨立性檢驗對兩個分類變量是否有關系進行研究時,若有99.5%的把握認為事件a和b有關系,則具體計算出的數(shù)據(jù)應該是()ak6.635 bk6.635ck7.879 dk7.879解析:選c有99.5%的把握認為事件a和b有關系,即犯錯誤的概率為0.5
38、%,對應的k0的值為7.879,由獨立性檢驗的思想可知應為k7.879.5通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯(lián)表:男女總計愛好402060不愛好203050總計6050110由k2算得,觀測值k7.8.附表:p(k2k0)0.0500.0100.001k03.8416.63510.828參照附表,得到的正確結論是()a有99%以上的把握認為“愛好該項運動與性別有關”b有99%以上的把握認為“愛好該項運動與性別無關”c在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”d在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”解析:選a
39、由k7.8及p(k26.635)0.010可知,在犯錯誤的概率不超過1%的前提下認為“愛好該項運動與性別有關”,也就是有99%以上的把握認為“愛好該項運動與性別有關”二、填空題6下列關于k2的說法中,正確的有_k2的值越大,兩個分類變量的相關性越大;k2的計算公式是k2;若求出k243.841,則有95%的把握認為兩個分類變量有關系,即有5%的可能性使得“兩個分類變量有關系”的推斷出現(xiàn)錯誤;獨立性檢驗就是選取一個假設h0條件下的小概率事件,若在一次試驗中該事件發(fā)生了,這是與實際推斷相抵觸的“不合理”現(xiàn)象,則作出拒絕h0的推斷解析:對于,k2的值越大,只能說明我們有更大的把握認為二者有關系,卻不
40、能判斷相關性大小,故錯;對于,(adbc)應為(adbc)2,故錯;對答案:7某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調查中,隨機抽取了100名電視觀眾,相關的數(shù)據(jù)如下表所示:文藝節(jié)目新聞節(jié)目總計20至40歲401858大于40歲152742總計5545100由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關:_(填“是”或“否”)解析:因為在20至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而在大于40歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即,兩者相差較大,所以經(jīng)直觀分析,收看新聞節(jié)目的觀眾與年齡是有關的答案:是8某工廠為了調查工人文化程度與月收入的關系,隨機抽取了部分工人,
41、得到如下列聯(lián)表(單位:人):月收入2 000元以下月收入2 000元及以上總計高中文化以上104555高中文化及以下203050總計3075105由上表中數(shù)據(jù)計算得k2的觀測值k6.109,請估計在犯錯誤的概率不超過_的情況下認為文化程度與月收入有關系解析:由于6.1095.024,所以在犯錯誤的概率不超過0.025的前提下認為文化程度與月收入有關系答案:0.025三、解答題9用兩種檢驗方法對某食品做沙門氏菌檢驗,結果如下表.陽性陰性總計熒光抗體法1605165常規(guī)培養(yǎng)法264874總計18653239附:p(k2k0)0.0100.0050.001k06.6357.87910.828(1)利
42、用圖形判斷采用熒光抗體法與檢驗結果呈陽性是否有關系;(2)能否在犯錯誤的概率不超過0.001的前體下認為采用熒光抗體法與檢驗結果呈陽性有關系?解:(1)作出等高條形圖如圖所示,由圖知采用熒光抗體法與檢驗結果呈陽性有關系(2)通過計算可知k2113.184 6.而查表可知,因為p(k210.828)0.001,而113.184 6遠大于10.828,所以在犯錯誤的概率不超過0.001的前提下認為采用熒光抗體法與檢驗結果呈陽性有關系10某校在兩個班進行教學方式對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統(tǒng)計如下表所示(單位:人):80及80分以上80分以下總計試驗班351550對照班20m
43、50總計5545n(1)求m,n;(2)能否在犯錯誤的概率不超過0.005的情況下認為教學方式與成績有關系?解:(1)m451530,n5050100.(2)由表中的數(shù)據(jù),得k2的觀測值為k9.091.因為9.0917.879,所以能在犯錯誤的概率不超過0.005的前提下認為教學方式與成績有關系統(tǒng)計案例一、選擇題(共10小題,每小題5分,共50分)1對于自變量x和因變量y,當x取值一定時,y的取值帶有一定的隨機性,x,y之間的這種非確定性關系叫()a函數(shù)關系b線性關系c相關關系 d回歸關系解析:選c由相關關系的概念可知,c正確2設兩個變量x和y之間具有線性相關關系,它們的相關系數(shù)是r,y關于x
44、的回歸直線的斜率是b,縱軸上的截距是a,那么必有()ab與r的符號相同 ba與r的符號相同cb與r的符號相反 da與r的符號相反解析:選a因為b0時,兩變量正相關,此時r0;b0時,兩變量負相關,此時r0.3下表顯示出樣本中變量y隨變量x變化的一組數(shù)據(jù),由此判斷它最可能是()x45678910y14181920232528a線性函數(shù)模型 b二次函數(shù)模型c指數(shù)函數(shù)模型 d對數(shù)函數(shù)模型解析:選a畫出散點圖(圖略)可以得到這些樣本點在某一條直線上或該直線附近,故最可能是線性函數(shù)模型4下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x
45、之間有較好的線性相關關系,其線性回歸方程是0.7x,則()a10.5 b5.15c5.2 d5.25解析:選d樣本點的中心為(2.5,3.5),將其代入線性回歸方程可解得5.25.5下面的等高條形圖可以說明的問題是()a“心臟搭橋”手術和“血管清障”手術對“誘發(fā)心臟病”的影響是絕對不同的b“心臟搭橋”手術和“血管清障”手術對“誘發(fā)心臟病”的影響沒有什么不同c此等高條形圖看不出兩種手術有什么不同的地方d“心臟搭橋”手術和“血管清障”手術對“誘發(fā)心臟病”的影響在某種程度上是不同的,但是沒有100%的把握解析:選d由等高條形圖可知選項d正確6根據(jù)一位母親記錄兒子39歲的身高數(shù)據(jù),建立兒子身高(單位:
46、cm)對年齡(單位:歲)的線性回歸方程為7.19x73.93,若用此方程預測兒子10歲時的身高,有關敘述正確的是()a身高一定為145.83 cm b身高大于145.83 cmc身高小于145.83 cm d身高在145.83 cm左右解析:選d用線性回歸方程預測的不是精確值,而是估計值當x10時,y145.83,只能說身高在145.83 cm左右7在22列聯(lián)表中,下列哪兩個比值相差越大,兩個分類變量有關系的可能性就越大()a.與 b.與c.與 d.與解析:選a當ad與bc相差越大,兩個分類變量有關系的可能性越大,此時與相差越大8如圖,5個(x,y)數(shù)據(jù),去掉d(3,10)后,下列說法錯誤的是
47、()a相關系數(shù)r變大b殘差平方和變大c相關指數(shù)r2變大d解釋變量x與預報變量y的相關性變強解析:選b由散點圖知,去掉d后,x與y的相關性變強,且為正相關,所以r變大,r2變大,殘差平方和變小9為了解高中生作文成績與課外閱讀量之間的關系,某研究機構隨機抽取了60名高中生,通過問卷調查,得到以下數(shù)據(jù):作文成績優(yōu)秀作文成績一般總計課外閱讀量較大221032課外閱讀量一般82028總計303060由以上數(shù)據(jù),計算得到k2的觀測值k9.643,根據(jù)臨界值表,以下說法正確的是()a沒有充足的理由認為課外閱讀量大與作文成績優(yōu)秀有關b有0.5%的把握認為課外閱讀量大與作文成績優(yōu)秀有關c有99.9%的把握認為課外閱讀量大與作文成績優(yōu)秀有關d有99.5%的把握認為課外閱讀量大與作文成績優(yōu)秀有關解析:選d根據(jù)臨界值表,9.6437.879,在犯錯誤的概率不超過0.005的前提下,認為課外閱讀量大與作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)村產(chǎn)業(yè)融合項目目標分析
- 果品綜合檢測風險應對策略
- 2024 年【數(shù)字素養(yǎng)】養(yǎng)考試題庫及答案 4
- 高中語文文言文閱讀典籍分類專訓選擇性必修中冊 過秦論(新教材課內必刷)
- 高中語法-句子結構和成分
- 高中英語語法系統(tǒng)講解之七非謂語動詞
- 《學前兒童衛(wèi)生保健》 課件 1.2.1 幼兒運動系統(tǒng)的特點及衛(wèi)生保健
- 第4章 圖象分割課件
- 吹泡泡課件教學課件
- 新生兒期臨床的主要問題課件
- 2025屆單一概念材料作文“被討厭的勇氣”審題指導高考語文寫作技巧實戰(zhàn)分析與素材運用
- 摩托車個人租車協(xié)議書模板
- 歷年中國農(nóng)業(yè)發(fā)展銀行秋季校園招聘筆試真題及答案
- 2024年統(tǒng)編版新教材語文小學一年級上冊第二單元測試題(有答案)
- 2024年山東省高考物理試卷(真題+答案)
- 漢語詞匯與文化智慧樹知到期末考試答案章節(jié)答案2024年浙江師范大學
- 2023-2024學年教科版三年級上學期科學期中檢測試卷(含答案)
- 三年級語文上冊第五單元【教材解讀】
- 中國歷史朝代順序表、年表(完整版)
- PFMEA(范本)
- 油茶營造林作業(yè)質量驗收標準及實施辦法
評論
0/150
提交評論