高二數(shù)學(xué)期末備考專題線性回歸新人教A版選修3_第1頁
高二數(shù)學(xué)期末備考專題線性回歸新人教A版選修3_第2頁
高二數(shù)學(xué)期末備考專題線性回歸新人教A版選修3_第3頁
高二數(shù)學(xué)期末備考專題線性回歸新人教A版選修3_第4頁
高二數(shù)學(xué)期末備考專題線性回歸新人教A版選修3_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2011屆高二數(shù)學(xué)期末備考專題線性回歸【重點難點講解】.回歸分析:就是對具有相關(guān)關(guān)系的兩個變量之間的關(guān)系形式進(jìn)行測定,確定一個相關(guān)的數(shù)學(xué)表達(dá)式,以便進(jìn)行估計預(yù)測的統(tǒng)計分析方法。根據(jù)回歸分析方法得出的數(shù)學(xué)表達(dá)式稱為回歸方程,它可能是直線,也可能是曲線。.線性回歸方程設(shè)x與y是具有相關(guān)關(guān)系的兩個變量,且相應(yīng)于n組觀測值的n個點(Xi, y)(i=1,n)A大致分布在一條直線的附近,則回歸直線的方程為以。.線性相關(guān)性檢驗線性相關(guān)性檢驗是一種假設(shè)檢驗,它給出了一個具體檢驗 y與x之間線性相關(guān)與否的辦法。在課本附表3中查出與顯著性水平 0.05與自由度n-2 (n為觀測值組數(shù))相應(yīng)的相關(guān) 系數(shù)臨界值 r

2、 0.05。& S w 一不r - 由公式 伯! 白 ,計算r的值。檢驗所得結(jié)果如果|r| Wr 0.05,可以認(rèn)為y與x之間的線性相關(guān)關(guān)系不顯著,接受統(tǒng)計假設(shè)。如果|r|r 0.05,可以認(rèn)為y與x之間不具有線性相關(guān)關(guān)系的假設(shè)是不成立的,即 y與x之間 具有線性相關(guān)關(guān)系?!镜湫屠}講解】例1.從某班50名學(xué)生中隨機(jī)抽取10名,測得其數(shù)學(xué)考試成績與物理考試成績資料如表:序號12345678910數(shù)學(xué)成績54666876788285879094物理成績61806286847685828896試建立該10名學(xué)生的物理成績對數(shù)學(xué)成績的線性回歸模型。AA解:設(shè)數(shù)學(xué)成績?yōu)閤,物理成績?yōu)閥,則可設(shè)所求線性

3、回歸模型為y=010101010Yx =780 Yv. =800yr2 =62210,7 = 63413,計算E國汽i=l,代入公式得國日=0.7394 * 0.74, a = -0.14 = 22.28.137001010所求線性回歸模型為=0.74x+22.28 。A說明:將自變量x的值分別代入上述回歸模型中,即可得到相應(yīng)的因變量的估計值y,由回歸模型知:數(shù)學(xué)成績每增加1分,物理成績平均增加 0.74分。大家可以在老師的幫助下對自己班的數(shù)學(xué)、化學(xué)成績進(jìn)行分析。例2.假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費用 y (萬元),有如下的統(tǒng)計資料:x23456y2.23.85.56.57.0若由

4、資料可知y對x成線性相關(guān)關(guān)系。試求:(1)線性回歸方程;(2)估計使用年限為10年時,維修費用是多少?分析:本題為了降低難度,告訴了 y與x間成線性相關(guān)關(guān)系,目的是訓(xùn)練公式的使用。 解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0 xiyi4.411.422.032.542.049162536112.3-5x4x590-5x42= 1.23文演乃-5個i-l1 5 -7 5 口 M糕-15尸)于是 b=a= 5-123x4 = 0.08,線性回歸方程為:A=bx+a=1.23x+0.08。(2)當(dāng)x=10時,=1.23X10+0.0 8=12.38(萬元)即估計

5、使用10年時維修費用是12.38萬元。說明:本題若沒有告訴我們 y與x間是線性相關(guān)的,應(yīng)首先進(jìn)行相關(guān)性檢驗。如果本身兩個變量不具備線性相關(guān)關(guān)系,或者說它們之間相關(guān)關(guān)系不顯著時,即使求出回歸方程也是沒有意義的,而且其估計與預(yù)測也是不可信的。例3.某省七年的國民生產(chǎn)總值及社會商品零售總額如下表所示:已知國民生產(chǎn)總值與 社會商品的零售總額之間存在線性關(guān)系,請建立回歸模型。年份國民生產(chǎn)總值(億元)社會商品零售總額(億元)1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.5437

6、5.111991858.47413.18合計4333.012194.24解:設(shè)國民生產(chǎn)總值為X,社會商品零售總額為 y,設(shè)線性回歸模型為y 山十九依上表計算有關(guān)數(shù)據(jù)后代入的表達(dá)式得:=0 4459577乂1440905854 433 01x2194,24 = 57g6724326 7x286751214-(433.01 - 1297595.838a = 2194 24 - 0.445957 ,= 37 4148.所求線性回歸模型為 y=0.445957x+37.4148,表明國民生產(chǎn)總值每增加1億元,社會商品零售總額將平均增加4459.57萬元。例4.已知某地每單位面積菜地年平均使用氮肥量xk

7、g與每單位面積蔬菜每年平均產(chǎn)量yt之間的關(guān)系有如下數(shù)據(jù):年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份 119931994199519961997199871999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x與y之間的相關(guān)系數(shù),并檢驗是否線性相關(guān);(2)若線性相關(guān),求蔬菜產(chǎn)量 y與使用氮肥量之間的回歸直線方程,并估計每單位面積施肥150kg時,每單位面積蔬菜的年平均產(chǎn)量。分析:(1)使用

8、樣本相關(guān)系數(shù)計算公式來完成;(2)查表得出顯著水平 0.05與自由度152相應(yīng)的相關(guān)系數(shù)臨界值0.05比較,若rr0.05,則線性相關(guān),否則不線性相關(guān)。解:(1)列出下表,并用科學(xué)計算器進(jìn)行有關(guān)計算:i123 456789101112131415xi707480788592909592108115123130138145yi5.1 6.06.87.89.0 10.210.012.011.511.0 11.812.2 12.5 1216258 13.0 xi yi357 44-4544608.4765938.4900 11401058118813571500.61766.41885 = 10;連

9、史2 = 101115152 = 161125,號丁; =n2&55,號彳必=16076.8 i-lt-1故蔬菜產(chǎn)量與施用氮肥量的相關(guān)系數(shù):16076.8-15x101x10 110.8643.由于n=15,故自由度15-2=13。由相關(guān)系數(shù)檢驗的臨界值表查出與顯著水平0.05及自由度13相關(guān)系數(shù)臨界值0.05=0.514,則rr0.05,從而說明蔬菜產(chǎn)量與氮肥量之間存在著線 性相關(guān)關(guān)系。A(2)設(shè)所求的回歸直線方程為 =bx+a,則15一_ 卒M 75生 _ 16076.8-15x101x10 1175r:-L161125-15x101電 0 093La =-ix= 10,11- 0.093

10、1x101 0,7102,A回歸直線方程為=0.0931x+0.7102 。當(dāng) x=150 時,y 的估值=0.0931 X 150+0.7102=14.675(t)。說明:求解兩個變量的相關(guān)系數(shù)及它們的回歸直線方程的計算量較大,需要細(xì)心謹(jǐn)慎計算,如果會使用含統(tǒng)計的科學(xué)計算器,能簡單得到 尸1諄1 *1*】,諄1這些量,也就無需有制表這一步,直接算出結(jié)果就行了。另外,利用計算機(jī)中有關(guān)應(yīng)用程序也 可以對這些數(shù)據(jù)進(jìn)行處理。x-9-6.99-5.01-2.98-554.9994y-9-7-5-3-5.024.9953.998【練習(xí)精選】一、選擇題1.觀測兩相關(guān)變量得如下數(shù)據(jù):則下列選項中最佳的回歸方

11、程為()1,A. y x 12B.y1C. y = 2x + D.y= 2x+13解析:對表格中的數(shù)據(jù)進(jìn)行適當(dāng)?shù)慕铺幚?,分別代入選項中進(jìn)行檢驗,每組數(shù)據(jù)都相差不多的直線模型為最佳回歸方程 .仔細(xì)觀察可以發(fā)現(xiàn),表格的每組數(shù)據(jù)的x和y都近似相等,所以回歸方程為y = x.答案:B2.下列兩個變量之間是相關(guān)關(guān)系的是()A.圓的面積與半徑B.球的體積與半徑C.角度與它的正弦值D.一個考生的數(shù)學(xué)成績與物理成績解析:相關(guān)關(guān)系不是確定的函數(shù)關(guān)系,這里A、B C都是確定的函數(shù)關(guān)系.答案:D3.想要檢驗是否喜歡參加體育活動是不是與性別有關(guān),應(yīng)該檢驗()A.H0:男性喜歡參加體育活動B.H0:女性不喜歡參加體育

12、活動C.H。:喜歡參加體育活動與性別有關(guān)D.H。:喜歡參加體育活動與性別無關(guān)解析:獨立性檢驗假設(shè)有反證法的意味,應(yīng)假設(shè)兩類變量(而非變量的屬性)無關(guān),這時的K2應(yīng)該很小,如果 K2很大,則可以否定假設(shè),如果K2很小,則不能夠肯定或者否定假設(shè).答案:D.已知一組觀測值具有線性相關(guān)關(guān)系,若對于 ?= &+J?,求得9=0.51 , x = 61.75, y= 38.14 ,則線性回歸方程為()A. ? = 0.51x+6.65B.y?= 6.65x+0.51C. ? = 0.51x+42.30D.y?= 42.30X+0.51解析:a = y -ibx = 38.14 0.51 X 61.75 =

13、42.30.答案:C.下面關(guān)于卡方說法正確的是()A.K2在任何相互獨立的問題中都可以用于檢驗有關(guān)還是無關(guān).K2的值越大,兩個事件的相關(guān)性就越大C.K2是用來判斷兩個分類變量是否相關(guān)的隨機(jī)變量,當(dāng)K2的值很小時可以推定兩類變量不相關(guān)D.K2的觀測值的計算公式是K2 =n(ad -bC)(a b)(c d )(a c)(b d)-.22解析:K只適用于2X2型列聯(lián)表問題,且K只能推定兩個分類變量相關(guān),但不能推定兩個變量不相關(guān).選項D中K2公式錯誤,分子上少了平方 .答案:B二、填空題n(ad - bc).根據(jù)下表,K2-.(保留兩位小數(shù))-一 一 - _又發(fā)病啟未移植手術(shù)Q40r未移植手術(shù)43P

14、2(a b)(c d)(a c)(b d)解析:把列聯(lián)表的行和列的合計補(bǔ)充完整,可利用公式k2 =接計算.答案:1.39.下列命題:用相關(guān)系數(shù)r來刻畫回歸的效果時,r的值越大,說明模型擬合的效果越好;對分類變量X與丫的隨機(jī)變量的K2觀測值來說,K2越小,“X與丫有關(guān)系”可信程度越大;兩個隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對值越接近1;其中正確命題的序號是 .(寫出所有正確命題的序號)解析:正確的是,是由于 r可能是負(fù)值,中K2越大,“X與Y有關(guān)系”可信程度越大答案:三、解答題.在7塊并排、形狀大小相同的試驗田上進(jìn)行施化肥量對水稻產(chǎn)量影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg).施化肥量X

15、15202530354045水稻廠量y330345365405445450455(1)畫出散點圖;(2)求y關(guān)于x的線性回歸方程;(3)若施化肥量為38 kg ,其他情況不變,請預(yù)測水稻的產(chǎn)量解:(1)根據(jù)題表中數(shù)據(jù)可得散點圖如下:,統(tǒng)計數(shù)據(jù)如下不太主動參加班級工作且學(xué)習(xí)積極性一般的學(xué)生有(2)根據(jù)回歸直線方程系數(shù)的公式計算可得回歸直線方程是? = 4.75X+257.把x = 38代入回歸直線方程得 y = 438,所以,可以預(yù)測,施化肥量為38 kg ,其他情況不變 時,水稻的產(chǎn)量是 438 kg.積極參加班級工作不太主動參加班級工 作合計學(xué)習(xí)積極性高18725學(xué)習(xí)積極性一般61925合計

16、2426509.某班主任對全班 50名學(xué)生學(xué)習(xí)積極性和對待班級工作的態(tài)度進(jìn)行了調(diào)查 表所示:(1)如果隨機(jī)抽查這個班的一名學(xué)生,那么抽到積極參加班級工作的學(xué)生的概率是多少?抽19人,概率為19 .50 TOC o 1-5 h z 一,一一 _、 2.一250(1819 -67)15011 5(2) K 二二11.5,24 25 24 26132.- K 6.635,有99%勺把握說學(xué)習(xí)積極性與對待班級工作的態(tài)度有關(guān)系10.下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù).x3456y2.5344.5(1)請畫出上表數(shù)據(jù)的散點圖;(2

17、)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程y= t?(+c?;(3)已知該廠技改前 100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線性回歸方程,預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤?(參考數(shù)值:3X 2.5+4 X3+5X 4+6X 4.5 = 66.5)解:(1)由題設(shè)所給數(shù)據(jù),可得散點圖如圖.能艷:晚標(biāo)準(zhǔn)煤)54 35 屯2.(2)由對照數(shù)據(jù),計算得4一 2Z Xj =86 ,i 12.5 3 4 4.544已知 xi yi = 66.5 , i 1所以,由最小二乘法確定的回歸方程的系數(shù)為4_ _: xi yi - 4x y12 T66.

18、5 -4 4.5 3.5 幻 一 ,b? = -4=2- =0.7 ,3=y 取=3.5 0.7 X 4.5 =0.35,x42286 -4 4.52xi - 4x i 1因此,所求的回歸方程為y=0.7x+0.35. 由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為90(0.7 X 100+0.35)= 19.65(噸標(biāo)準(zhǔn)煤).11.對某校學(xué)生進(jìn)行心理障礙測試得到如下列聯(lián)表:焦慮說謊懶惰合計女生5101530男生20105080合計252065110試說明在這三種心理障礙中哪一種與性別關(guān)系最大?解:由題設(shè)表格可得三個新的表格如下:關(guān)于是否得到焦慮的結(jié)論:焦慮不焦慮合計女生52530男生206080合計2585110關(guān)于是否說謊的結(jié)論:說謊不說謊合計女生102030男生10708

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論