




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
3.1回歸分析的基本思想回歸分析(regressionanalysis)是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法。對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)xb其中x=1ni=1nxi,回歸方程:y線性回歸模型:y=bx+a+e其中a和b為模型的未知參數(shù),e是y與bx+a之間的誤差。通常e為隨機變量,稱為隨機誤差與函數(shù)關(guān)系不同,在回歸模型中,y的值由x和隨機因素e共同確定,即x只能解釋部分y的變化,因此我們把x稱為解釋變量,把y稱為預(yù)報變量。 隨機誤差e的方差σ2越小,用bx+a預(yù)報真實值y的精度越高。隨機誤差是引起預(yù)報值y與真實值y之間存在誤差的原因之一 另一方面,b和a為斜率和截距的估計值,它們與真實值a和b之間也存在誤差,這種誤差是引起預(yù)報值y與真實值y之間存在誤差的另一個原因。由于隨機誤差e=y-(bx+a),所以e=y-對于樣本點x它們的隨機誤差為e其估計值為eei稱為相應(yīng)于點xi,可以通過殘差發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),判斷所建立模型的擬合效果。以樣本編號為橫坐標,殘差為縱坐標,可作出殘差圖。檢查殘差較大的樣本點,確認采集該樣本點過程中是否有人為錯誤,如有,應(yīng)予以糾正,再重新利用線性回歸模型擬合數(shù)據(jù);如沒有,則需尋找其它原因。另外,對于已經(jīng)獲取的樣本數(shù)據(jù),R中的i=1n(yi-y)R2表示解釋變量對于預(yù)報變量變化的貢獻率,R一般地,建立回歸模型的基本步驟:確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;畫出解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)有經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù);得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應(yīng)殘差過大,殘差呈現(xiàn)不隨機的規(guī)律性等)。若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等?;貧w模型的適用范圍:回歸方程只適用于我們所研究的樣本的總體;我們所建立的回歸方程一般都有時間性;樣本取值的范圍會影響回歸方程的適用范圍;不能期望回歸方程得到的預(yù)報值就是預(yù)報變量的精確值。般地,比較兩個函數(shù)模型的擬合程度的步驟如下:分別建立對應(yīng)于兩個模型的回歸方程y1=f(x,a)與y分別計算兩個模型的R2值若R12>3.2獨立性檢驗的基本思想不同的“值”表示不同類別的變量叫做分類變量。列出兩個分類變量的頻數(shù)表稱為列聯(lián)表(contingencytable)。常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征。利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗(testofindependence)。反證法原理與獨立性檢驗原理的比較反證法原理在假設(shè)H0下,如果推出一個矛盾,就證明了H0不成立獨立性檢驗原理在假設(shè)H0下,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不超過這個小概率一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d假設(shè)H0:X與Y沒有關(guān)系,即X與Y獨立。則有P(XY)=P(X)P(Y);根據(jù)頻率近似于概率,故有a化簡得ad因此,|ad-bc|越小,兩者關(guān)系越弱;基于以上分析,構(gòu)造隨機變量K2=nK2的值越小則關(guān)系越小,K2的值越大則關(guān)系越大。(實際應(yīng)用中通常要求a,b,c,d都不小于5)計算K2的觀測值k并與K2作比較。統(tǒng)計學(xué)研究發(fā)現(xiàn),在H0成立的情況下,P即在H0成立的情況下,K2的觀測值超過6.635的概率非常小,近似為0.01,是一個小概率事件。若觀測值k大于6.635,則有理由判定H0不成立,即“X與Y有關(guān)系”。但這種判斷會犯錯誤,犯錯誤的概率不會超過0.01.*(這里概率計算的前提是H0成立,即H0:兩個分類變量沒有關(guān)系)若要推斷的論述為H1:“X與Y有關(guān)系”??梢酝ㄟ^頻率直觀地判斷兩個條件概率P(Y=y1|X=x1)和P(Y=y1|X=x2)是否相等。如果判斷它們相等,就意味著X和Y沒有關(guān)系;否則就認為它們有關(guān)系。由上表可知,在X=x1的情況下,Y=y1的頻率為aa+b;在X=x2的情況下,Y=y1的頻率為cc+d。因此,如果通過直接計算或等高條形圖發(fā)現(xiàn)aa+b利用獨立性檢驗原理可以進一步給出推斷“兩個分類變量有關(guān)系”犯錯誤的概率。具體做法是:根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關(guān)系”犯錯誤概率的上界α,然后查下表確定臨界值k0.P(0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828利用公式計算隨機變量K2的觀測值k.如果K2的觀測值k大于判斷規(guī)則的臨界值k0,即k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過α;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”。按照上述規(guī)則,把“兩個分類變量之間沒有關(guān)系”錯誤地判斷為“兩個分類變量之間有關(guān)系”的概率不超過PK定義:W=則K若“X和Y沒有關(guān)系”則有P有K2W≥即可取w于是有以下判斷規(guī)則:當W的觀測值w>w0時,就判斷“X和Y有關(guān)系”;否則,判斷“X和Y沒有關(guān)系”。這里w0為正實數(shù),且滿足在P隨堂練習(xí)1.(2010·寧夏銀川模擬)下表是某廠1~4月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是eq\o(y,\s\up6(^))=-0.7x+a,則a等于()A.10.5 B.5.15C.5.2 D.5.252.設(shè)兩個變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x的回歸直線的斜率是b,縱軸上的截距是a,那么必有()A.b與r的符號相同B.a(chǎn)與r的符號相同C.b與r的符號相反D.a(chǎn)與r的符號相反3.有下列說法:①隨機誤差是引起預(yù)報值與真實值之間的誤差的原因之一;②殘差平方和越小,預(yù)報精度越高;③在獨立性檢驗中,通過二維條形圖和三維柱形圖可以粗略判斷兩個分類變量是否有關(guān)系.其中真命題的個數(shù)是()A.0 B.1C.2 D.34.有甲、乙兩種鋼材,從中各取等量樣品檢驗它們的抗拉強度指標如下:甲X110120125130135P0.10.20.40.10.2乙X100115125130145P0.10.20.40.10.2現(xiàn)要比較兩種鋼材哪一種抗拉強度較好,應(yīng)考察哪項指標()A.期望與方差 B.正態(tài)分布C.卡方K2 D.概率5.為調(diào)查中學(xué)生近視情況,測得某校男生150名中有80名近視,女生140名中有70名近視.在檢驗這些中學(xué)生眼睛近視是否與性別有關(guān)時用什么方法最有說服力()A.期望與方差 B.排列與組合C.獨立性檢驗 D.概率6.(2009·海南寧夏理,3)對變量x,y觀測數(shù)據(jù)(x1,y1)(i=1,2,…,10),得散點圖1;對變量u,v有觀測數(shù)據(jù)(u1,v1)(i=1,2,…,10),得散點圖2.由這兩個散點圖可以判斷.()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負相關(guān)C.變量x與y負相關(guān),u與v正相關(guān)D.變量x與y負相關(guān),u與v負相關(guān)7.某地2010年第一季度應(yīng)聘和招聘人數(shù)排行榜前5個行業(yè)的情況列表如下:行業(yè)名稱計算機機械營銷物流貿(mào)易應(yīng)聘人數(shù)2158302002501546767457065280行業(yè)名稱計算機營銷機械建筑化工招聘人數(shù)124620102935891157651670436若用同一行業(yè)中應(yīng)聘人數(shù)與招聘人數(shù)比值的大小來衡量該行業(yè)的就業(yè)情況,則根據(jù)表中數(shù)據(jù),就業(yè)形勢一定是()A.計算機行業(yè)好于化工行業(yè)B.建筑行業(yè)好于物流行業(yè)C.機械行業(yè)最緊張D.營銷行業(yè)比貿(mào)易行業(yè)緊張8.工人月工資y(單位:元)關(guān)于勞動生產(chǎn)率x(單位:千元)的回歸方程為eq\o(y,\s\up6(^))=650+80x,下列說法中正確的個數(shù)是()①勞動生產(chǎn)率為1000元時,工資約為730元;②勞動生產(chǎn)率提高1000元時,則工資約提高80元;③勞動生產(chǎn)率提高1000元時,則工資約提高730元;④當月工資為810元時,勞動生產(chǎn)率約為2000元.A.1 B.2C.3 D.49.對兩個變量y和x進行回歸分析,得到一組樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),則下列說法中不正確的是()A.由樣本數(shù)據(jù)得到的回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.殘差平方和越小的模型,擬合的效果越好C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2的值越小,說明模型的擬合效果越好D.若變量y和x之間的相關(guān)系數(shù)r=-0.9362,則變量y和x之間具有線性相關(guān)關(guān)系10.判斷兩個分類變量是彼此相關(guān)還是相互獨立的常用方法中,最為精確的是()A.三維柱形圖 B.二維條形圖C.等高條形圖 D.獨立性檢驗11.在建立兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合得最好的模型為()A.模型1的相關(guān)指數(shù)R2為0.75B.模型2的相關(guān)指數(shù)R2為0.90C.模型3的相關(guān)指數(shù)R2為0.25D.模型4的相關(guān)指數(shù)R2為0.5512.下面是某市場農(nóng)產(chǎn)品的調(diào)查表.市場供應(yīng)量表:單價(元/千克)22.42.83.23.64供應(yīng)量(1000千克)506070758090市場需求量表:單價(元/千克)43.42.92.62.32供應(yīng)量(1000千克)506070758090根據(jù)以上信息,市場供需平衡點(即供應(yīng)量和需求量相等的單價)應(yīng)在區(qū)間()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)二、填空題(本大題共4個小題,每小題4分,共16分,將正確答案填在題中橫線上)13.當且僅當r滿足________時,數(shù)據(jù)點(xi,yi)(i=1,2,…,n)在一條直線上.14.已知一個回歸直線方程為eq\o(y,\s\up6(^))=1.5x+45,x∈{1,7,5,13,19},則eq\x\to(y)=__________.15.對具有線性相關(guān)關(guān)系的變量x和y,測得一組數(shù)據(jù)如下表.若已求得它們的回歸直線方程的斜率為6.5,則這條回歸直線的方程為________.x24568y304060507016.(2010·廣東文,12)某市居民2005~2009年家庭年平均收入x(單位:萬元)與年平均支出Y(單位:萬元)的統(tǒng)計資料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根據(jù)統(tǒng)計資料,居民家庭平均收入的中位數(shù)是__________,家庭年平均收入與年平均支出有__________線性相關(guān)關(guān)系.三、解答題(本大題共6個小題,共70分,解答應(yīng)寫出文字說明、證明過程或演算步驟)17.(本題滿分10分)為了調(diào)查胃病是否與生活規(guī)律有關(guān),調(diào)查某地540名40歲以上的人得結(jié)果如下:患胃病未患胃病合計生活不規(guī)律60260320生活有規(guī)律20200220合計80460540根據(jù)以上數(shù)據(jù)回答40歲以上的人患胃病與生活規(guī)律有關(guān)嗎?18.(本題滿分12分)一臺機器可以按各種不同的速度運轉(zhuǎn),其生產(chǎn)的物件有一些會有問題,每小時生產(chǎn)有問題物件的多寡,隨機器運轉(zhuǎn)的速度而變化,下面表格中的數(shù)據(jù)是幾次試驗的結(jié)果.速度(轉(zhuǎn)/秒)每小時生產(chǎn)有問題物件數(shù)851281491611(1)求出機器速度影響每小時生產(chǎn)有問題物件數(shù)的回歸直線方程;(2)若實際生產(chǎn)中所允許的每小時最大問題物件數(shù)為10,那么機器的速度不得超過多少轉(zhuǎn)/秒?19.(本題滿分12分)在從煙臺—大連的某次航運中,海上出現(xiàn)惡劣氣候.隨機調(diào)查男、女乘客在船上暈船的情況如下表所示:暈船不暈船合計男人325173女人82432合計4075115根據(jù)此資料你是否認為在惡劣氣候航行中,男人比女人更容易暈船?20.(本題滿分12分)有兩個分類變量X與Y,其一組觀測的2×2列聯(lián)表如下表.其中a,15-a均為大于5的整數(shù),則a取何值時有90%以上的把握認為“X與Y之間有關(guān)系”?y1y2x1a20-ax215-a30+a21.(本題滿分12分)某超市為了了解熱茶銷售與氣溫之間的關(guān)系,隨機統(tǒng)計并制作了某6天賣出熱茶的杯數(shù)與當天氣溫的對比表如下表:氣溫x(℃)261813104-1杯數(shù)y202434385064畫出散點圖并計算相關(guān)系數(shù)r,判斷熱茶銷售量與氣溫之間是否具有線性相關(guān)關(guān)系.22.(本題滿分14分)在一個文娛網(wǎng)絡(luò)中,點擊觀看某個節(jié)目的累積人次和播放天數(shù)如下表:播放天數(shù)12345點擊觀看的累積人次51134213235262播放天數(shù)678910點擊觀看的累積人次294330378457533(1)畫出散點圖;(2)判斷兩變量之間是否具有線性相關(guān)關(guān)系,求回歸直線方程是否有意義?
答案一、選擇題(本大題共12個小題,每小題5分,共60分,在每小題給出的四個選項中,只有一項是符合題目要求的)1.(2010·寧夏銀川模擬)下表是某廠1~4月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是eq\o(y,\s\up6(^))=-0.7x+a,則a等于()A.10.5 B.5.15C.5.2 D.5.25[答案]D[解析]eq\x\to(x)=2.5,eq\x\to(y)=3.5,∵回歸直線方程過定點(eq\x\to(x),eq\x\to(y)),∴3.5=-0.7×2.5+a,∴a=5.25.故選D.2.設(shè)兩個變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x的回歸直線的斜率是b,縱軸上的截距是a,那么必有()A.b與r的符號相同B.a(chǎn)與r的符號相同C.b與r的符號相反D.a(chǎn)與r的符號相反[答案]A[解析]因為b>0時,兩變量正相關(guān),此時,r>0;b<0時,兩變量負相關(guān),此時r<0.3.有下列說法:①隨機誤差是引起預(yù)報值與真實值之間的誤差的原因之一;②殘差平方和越小,預(yù)報精度越高;③在獨立性檢驗中,通過二維條形圖和三維柱形圖可以粗略判斷兩個分類變量是否有關(guān)系.其中真命題的個數(shù)是()A.0 B.1C.2 D.3[答案]D4.有甲、乙兩種鋼材,從中各取等量樣品檢驗它們的抗拉強度指標如下:甲X110120125130135P0.10.20.40.10.2乙X100115125130145P0.10.20.40.10.2現(xiàn)要比較兩種鋼材哪一種抗拉強度較好,應(yīng)考察哪項指標()A.期望與方差 B.正態(tài)分布C.卡方K2 D.概率[答案]A5.為調(diào)查中學(xué)生近視情況,測得某校男生150名中有80名近視,女生140名中有70名近視.在檢驗這些中學(xué)生眼睛近視是否與性別有關(guān)時用什么方法最有說服力()A.期望與方差 B.排列與組合C.獨立性檢驗 D.概率[答案]C6.(2009·海南寧夏理,3)對變量x,y觀測數(shù)據(jù)(x1,y1)(i=1,2,…,10),得散點圖1;對變量u,v有觀測數(shù)據(jù)(u1,v1)(i=1,2,…,10),得散點圖2.由這兩個散點圖可以判斷.()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負相關(guān)C.變量x與y負相關(guān),u與v正相關(guān)D.變量x與y負相關(guān),u與v負相關(guān)[答案]C[解析]本題主要考查了變量的相關(guān)知識,考查學(xué)生分析問題和解決問題的能力.用散點圖可以判斷變量x與y負相關(guān),u與v正相關(guān).7.某地2010年第一季度應(yīng)聘和招聘人數(shù)排行榜前5個行業(yè)的情況列表如下:行業(yè)名稱計算機機械營銷物流貿(mào)易應(yīng)聘人數(shù)2158302002501546767457065280行業(yè)名稱計算機營銷機械建筑化工招聘人數(shù)124620102935891157651670436若用同一行業(yè)中應(yīng)聘人數(shù)與招聘人數(shù)比值的大小來衡量該行業(yè)的就業(yè)情況,則根據(jù)表中數(shù)據(jù),就業(yè)形勢一定是()A.計算機行業(yè)好于化工行業(yè)B.建筑行業(yè)好于物流行業(yè)C.機械行業(yè)最緊張D.營銷行業(yè)比貿(mào)易行業(yè)緊張[答案]B[解析]建筑行業(yè)的比值小于eq\f(65280,76516),物流行業(yè)的比值大于eq\f(74570,70436),故建筑好于物流.8.工人月工資y(單位:元)關(guān)于勞動生產(chǎn)率x(單位:千元)的回歸方程為eq\o(y,\s\up6(^))=650+80x,下列說法中正確的個數(shù)是()①勞動生產(chǎn)率為1000元時,工資約為730元;②勞動生產(chǎn)率提高1000元時,則工資約提高80元;③勞動生產(chǎn)率提高1000元時,則工資約提高730元;④當月工資為810元時,勞動生產(chǎn)率約為2000元.A.1 B.2C.3 D.4[答案]C[解析]代入方程計算可判斷①②④正確.9.對兩個變量y和x進行回歸分析,得到一組樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),則下列說法中不正確的是()A.由樣本數(shù)據(jù)得到的回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.殘差平方和越小的模型,擬合的效果越好C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2的值越小,說明模型的擬合效果越好D.若變量y和x之間的相關(guān)系數(shù)r=-0.9362,則變量y和x之間具有線性相關(guān)關(guān)系[答案]C[解析]R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好,故選C.10.判斷兩個分類變量是彼此相關(guān)還是相互獨立的常用方法中,最為精確的是()A.三維柱形圖 B.二維條形圖C.等高條形圖 D.獨立性檢驗[答案]D[解析]前三種方法只能直觀地看出兩個分類變量x與y是否相關(guān),但看不出相關(guān)的程度.獨立性檢驗通過計算得出相關(guān)的可能性,較為準確.11.在建立兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合得最好的模型為()A.模型1的相關(guān)指數(shù)R2為0.75B.模型2的相關(guān)指數(shù)R2為0.90C.模型3的相關(guān)指數(shù)R2為0.25D.模型4的相關(guān)指數(shù)R2為0.55[答案]B[解析]相關(guān)指數(shù)R2的值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好,故選B.12.下面是某市場農(nóng)產(chǎn)品的調(diào)查表.市場供應(yīng)量表:單價(元/千克)22.42.83.23.64供應(yīng)量(1000千克)506070758090市場需求量表:單價(元/千克)43.42.92.62.32供應(yīng)量(1000千克)506070758090根據(jù)以上信息,市場供需平衡點(即供應(yīng)量和需求量相等的單價)應(yīng)在區(qū)間()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)[答案]C[解析]以橫軸為單價,縱軸為市場供、需量,在同一坐標系中描點,用近似曲線觀察可知選C.二、填空題(本大題共4個小題,每小題4分,共16分,將正確答案填在題中橫線上)13.當且僅當r滿足________時,數(shù)據(jù)點(xi,yi)(i=1,2,…,n)在一條直線上.[答案]|r|=1[解析]當數(shù)據(jù)點(xi,yi)在一條直線上時,y只受x的影響,即數(shù)據(jù)點完全線性相關(guān),此時|r|=1.14.已知一個回歸直線方程為eq\o(y,\s\up6(^))=1.5x+45,x∈{1,7,5,13,19},則eq\x\to(y)=__________.[答案]58.5[解析]因為eq\x\to(x)=eq\f(1,5)(1+7+5+13+19)=9,且eq\x\to(y)=1.5eq\x\to(x)+45,所以eq\x\to(y)=1.5×9+45=58.5.本題易錯之處是根據(jù)x的值及eq\o(y,\s\up6(^))=1.5x+45求出y的值再求eq\x\to(y),由eq\o(y,\s\up6(^))=1.5x+45求得的y值不是原始數(shù)據(jù),故錯誤.15.對具有線性相關(guān)關(guān)系的變量x和y,測得一組數(shù)據(jù)如下表.若已求得它們的回歸直線方程的斜率為6.5,則這條回歸直線的方程為________.x24568y3040605070[答案]eq\o(y,\s\up6(^))=17.5+6.5x[解析]由數(shù)據(jù)表得eq\x\to(x)=5,eq\x\to(y)=50,所以eq\o(a,\s\up6(^))=eq\x\to(y)-6.5eq\x\to(x)=17.5,即回歸直線方程為eq\o(y,\s\up6(^))=17.5+6.5x.16.(2010·廣東文,12)某市居民2005~2009年家庭年平均收入x(單位:萬元)與年平均支出Y(單位:萬元)的統(tǒng)計資料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根據(jù)統(tǒng)計資料,居民家庭平均收入的中位數(shù)是__________,家庭年平均收入與年平均支出有__________線性相關(guān)關(guān)系.[答案]13正[解析]中位數(shù)的定義的考查,奇數(shù)個時按大小順序排列后中間一個是中位數(shù),而偶數(shù)個時須取中間兩數(shù)的平均數(shù).由統(tǒng)計資料可以看出,當平均收入增多時,年平均支出也增多,因此兩者之間具有正線性相關(guān)關(guān)系.三、解答題(本大題共6個小題,共70分,解答應(yīng)寫出文字說明、證明過程或演算步驟)17.(本題滿分10分)為了調(diào)查胃病是否與生活規(guī)律有關(guān),調(diào)查某地540名40歲以上的人得結(jié)果如下:患胃病未患胃病合計生活不規(guī)律60260320生活有規(guī)律20200220合計80460540根據(jù)以上數(shù)據(jù)回答40歲以上的人患胃病與生活規(guī)律有關(guān)嗎?[解析]k=eq\f(540×(60×200-260×20)2,320×220×80×460)=eq\f(2496960,259072)≈9.638∵9.638>6.635∴40歲以上的人患胃病與生活是否有規(guī)律有關(guān),有99%的把握認為生活不規(guī)律的人易患胃?。?8.(本題滿分12分)一臺機器可以按各種不同的速度運轉(zhuǎn),其生產(chǎn)的物件有一些會有問題,每小時生產(chǎn)有問題物件的多寡,隨機器運轉(zhuǎn)的速度而變化,下面表格中的數(shù)據(jù)是幾次試驗的結(jié)果.速度(轉(zhuǎn)/秒)每小時生產(chǎn)有問題物件數(shù)851281491611(1)求出機器速度影響每小時生產(chǎn)有問題物件數(shù)的回歸直線方程;(2)若實際生產(chǎn)中所允許的每小時最大問題物件數(shù)為10,那么機器的速度不得超過多少轉(zhuǎn)/秒?[解析](1)用x表示機器速度,y表示每小時生產(chǎn)有問題物件數(shù),那么4個樣本數(shù)據(jù)為:(8,5)、(12,8)、(14,9)、(16,11),則eq\o(x,\s\up6(-))=12.5,eq\o(y,\s\up6(-))=8.25.于是回歸直線的斜率為eq\o(b,\s\up6(^))=eq\f(∑xiyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),∑x\o\al(2,i)-4\o(x,\s\up6(-))2)=eq\f(25.5,35)≈0.7286,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=-0.8575,所以所求的回歸直線方程為y=0.7286x-0.8575.(2)根據(jù)公式eq\o(y,\s\up6(^))=0.7286x-0.8575,要使y≤10,則就需要0.7286x-0.8575≤10,x≤14.9019,即機器的旋轉(zhuǎn)速度不能超過14.9019轉(zhuǎn)/秒.19.(本題滿分12分)在從煙臺—大連的某次航運中,海上出現(xiàn)惡劣氣候.隨機調(diào)查男、女乘客在船上暈船的情況如下表所示:暈船不暈船合計男人325173女人82432合計4075115根據(jù)此資料你是否認為在惡劣氣候航行中,男人比女人更容易暈船?[解析]男人暈船所占比例為eq\f(32,83)×100%=0.386,女人暈船所占比例為eq\f(8,32)×100%=0.25,雖然0.386遠大于0.25,但我們不能用此判斷在惡劣氣候中航行,男人比女人更容易暈船,而應(yīng)根據(jù)獨立性檢驗進行分析.由公式得:K2=eq\f(115×(32×24-51×8)2,83×32×40×75)≈1.870.因為1.870<2.706,所以我們沒有充分的證據(jù)說暈船跟男女性別有關(guān).20.(本題滿分12分)有兩個分類變量X與Y,其一組觀測的2×2列聯(lián)表如下表.其中a,15-a均為大于5的整數(shù),則a取何值時有90%以上的把握認為“X與Y之間有關(guān)系”?y1y2x1a20-ax215-a30+a[解析]查表可知,要使有90%以上的把握認為X與Y之間有關(guān)系,則K2>2.706,而其觀測值k=eq\f(65[a(30+a)-(20-a)(15-a)]2,20×45×15×50)=eq\f(13(65a-300)2,60×45×50)=eq\f(13(13a-60)2,60×90),解k>2.706得a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地質(zhì)勘查活動管理辦法
- 機電安裝發(fā)票管理辦法
- 梅山鎮(zhèn)村干部管理辦法
- 醫(yī)療健康基金管理辦法
- 數(shù)字時代電影本體論研究的新趨勢
- 杭州物業(yè)應(yīng)急管理辦法
- 中職新生場域轉(zhuǎn)換研究:背景、認識與學(xué)習(xí)期待的實證調(diào)查
- 情緒智力理論與實踐應(yīng)用綜述
- 奶牛飼養(yǎng)管理策略與實踐指南
- 數(shù)字化時代的企業(yè)管理模式與創(chuàng)新路徑研究
- ctcs-3級列控系統(tǒng)概述課件
- 2022年汕頭澄海區(qū)教師招聘考試真題
- 考研題土力學(xué)
- 雙向拉伸聚酯薄膜生產(chǎn)知識
- 綠山墻的安妮-練習(xí)答案(完整版)資料
- 2022年小學(xué)美術(shù)教師進城(選調(diào))招聘考試模擬試題(共五套)
- 貴陽小升初分班全真模擬測A卷
- GB/T 77-2007內(nèi)六角平端緊定螺釘
- 中華人民共和國安全生產(chǎn)法
- 九年一貫制學(xué)校教育教學(xué)管理制度匯編
- 鋼筋混凝土框架結(jié)構(gòu)設(shè)計講義
評論
0/150
提交評論