




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
§8最小二乘估計知識點最小二乘法及回歸直線方程[填一填]1.最小二乘法設(shè)x、y的一組觀察值為(xi,yi),i=1,2,…,n,且回歸直線方程為eq\o(y,\s\up6(^))=a+bx,當x取值xi(i=1,2,…,n)時,eq\o(y,\s\up6(^))的觀察值為yi,差yi-eq\o(y,\s\up6(^))i(i=1,2,…,n)刻畫了實際觀察值yi與回歸直線上相應點縱坐標之間的偏離程度,通常是用離差的平方和,即Q=eq\a\vs4\al(\i\su(i=1,n,)yi-a-bxi2)作為總離差,并使之達到最?。@樣,回歸直線就是所有直線中Q取最小值的那一條,由于平方又叫二乘方,所以這種使“離差平方和為最小”的方法,叫作最小二乘法.2.回歸直線方程的系數(shù)計算公式[答一答]利用最小二乘法的思想求得線性回歸方程的步驟是什么?提示:第一步:先求eq\x\to(x),eq\x\to(y),eq\a\vs4\al(\x\to(x))2,eq\x\to(x)eq\x\to(y).第二步:求eq\i\su(i=1,n,x)eq\o\al(2,i),第三步:求eq\i\su(i=1,n,x)iyi.第四步:代入公式求b=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\a\vs4\al(\x\to(x))2).第五步:代入公式a=eq\x\to(y)-beq\x\to(x).代入直線方程得:y=bx+a.對回歸直線方程的幾點說明(1)(xi,yi)(i=1,2,…,n)的中心點(eq\x\to(x),eq\x\to(y))在回歸直線上.(2)由回歸直線方程知x處的估計值為y=a+bx.(3)回歸直線使得樣本數(shù)據(jù)中的點到它的距離的平方和最小.(4)求回歸直線方程,計算量大,一般應學會使用計算器求解.(5)利用回歸直線方程可以對總體進行估計.類型一最小二乘法與回歸直線方程的理解【例1】下列有關(guān)線性回歸方程的系數(shù)a,b的公式正確的是()【思路探究】符號eq\i\su(i=1,n,a)i表示n個實數(shù)a1,a2,…,an的和.【解析】由線性回歸方程的概念我們知道,線性回歸方程的系數(shù)公式b=eq\f(x1y1+x2y2+…+xnyn-n\o(x,\s\up6(-))\o(y,\s\up6(-)),x\o\al(2,1)+x\o\al(2,2)+…+x\o\al(2,n)-n\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),a=eq\x\to(y)-beq\x\to(x),易知A正確.【答案】A回歸直線方程的系數(shù)a,b,用最小二乘法估計a,b使函數(shù)Q(a,b)最小,Q(a,b)=(A)A.eq\i\su(i=1,n,)(yi-a-bxi)2 B.eq\i\su(i=1,n,|)yi-a-bxi|C.(yi-a-bxi)2 D.|yi-a-bxi|解析:由最小二乘法的定義知通過求Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2的最小值而得到回歸直線的方法,叫作最小二乘法,故Q(a,b)=eq\i\su(i=1,n,)(yi-bxi-a)2,故選A.類型二求回歸直線方程【例2】某市近5年的煤氣消耗量與使用煤氣戶數(shù)如下表:年份20142015201620172018x/萬戶11.11.51.61.8y/百萬立方米6791112(1)檢驗是否線性相關(guān);(2)求y對x的回歸直線方程.【思路探究】eq\x(根據(jù)表中的數(shù)據(jù))→eq\x(作出散點圖)→eq\x(判斷是否線性相關(guān))→eq\x(\a\al(若是,則根據(jù)公,式求得a,b))→eq\x(得回歸直線方程)【解】(1)作出散點圖,觀察呈線性相關(guān),如圖所示.(1)eq\x\to(x)=eq\f(1+1.1+1.5+1.6+1.8,5)=eq\f(7,5),eq\x\to(y)=eq\f(6+7+9+11+12,5)=9,eq\i\su(i=1,5,x)eq\o\al(2,i)=12+1.12+1.52+1.62+1.82=10.26,eq\i\su(i=1,5,x)iyi=1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4.∴b=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\a\vs4\al(\x\to(x))2)=eq\f(66.4-5×\f(7,5)×9,10.26-5×\f(49,25))=eq\f(170,23),a=eq\x\to(y)-beq\x\to(x)=9-eq\f(170,23)×eq\f(7,5)=-eq\f(31,23),∴y對x的回歸直線方程為y=eq\f(170,23)x-eq\f(31,23).規(guī)律方法求回歸直線方程的步驟:(1)先把數(shù)據(jù)制成表,從表中計算出eq\i\su(i=1,n,x)i,eq\i\su(i=1,n,y)i,eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi;(2)計算回歸系數(shù)a,b.公式為eq\b\lc\{\rc\(\a\vs4\al\co1(b=\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),,a=\x\to(y)-b\x\to(x);))(3)寫出回歸直線方程y=bx+a.某研究機構(gòu)對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,得下表數(shù)據(jù):x681012y2356已知記憶力x和判斷力y是線性相關(guān)的,求線性回歸方程.解:eq\x\to(x)=eq\f(6+8+10+12,4)=9,eq\x\to(y)=eq\f(2+3+5+6,4)=4,eq\i\su(i=1,4,x)eq\o\al(2,i)=62+82+102+122=344,eq\i\su(i=1,4,x)iyi=6×2+8×3+10×5+12×6=158,b=eq\f(158-4×9×4,344-4×92)=eq\f(14,20)=0.7,a=eq\x\to(y)-beq\x\to(x)=4-0.7×9=-2.3.則所求的線性回歸方程為y=0.7x-2.3.類型三回歸直線方程的應用【例3】假設(shè)關(guān)于某設(shè)備的使用年限x(年)和所支出的維修費用y(萬元)有如下的統(tǒng)計資料:使用年限x23456維修費用y2.23.85.56.57.0若由資料知y對x呈線性相關(guān)關(guān)系.試求:(1)回歸直線方程y=bx+a;(2)估計使用年限為10年時,維修費用是多少?【思路探究】先求回歸直線方程,若回歸直線方程為y=bx+a,則在x=x0處的估計值為y0=bx0+a.【解】(1)制表如下:于是有b=eq\f(112.3-5×4×5,90-5×42)=eq\f(12.3,10)=1.23.a=eq\x\to(y)-beq\x\to(x)=5-1.23×4=0.08.故回歸直線方程是y=1.23x+0.08.(2)根據(jù)回歸直線方程是y=1.23x+0.08,當x=10年時,y=1.23×10+0.08=12.38(萬元),即估計使用10年時,維修費用是12.38萬元.規(guī)律方法(1)知道x與y呈線性相關(guān)關(guān)系,無需進行相關(guān)性檢驗.否則,應首先進行相關(guān)性檢驗.如果本身兩個變量不具備相關(guān)關(guān)系,或者說,它們之間相關(guān)關(guān)系不顯著即使求出回歸直線方程也是毫無意義的,而且用其估計和預測的量也是不可信的.(2)在求方程時,由于一步代入很煩瑣,所以要分步求解,即分別求得eq\x\to(x),eq\x\to(y),eq\x\to(x)·eq\x\to(y),eq\a\vs4\al(\x\to(x))2,eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi,再代入公式求a,b.某種產(chǎn)品的廣告費支出x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下對應數(shù)據(jù):x24568y3040605070(1)畫出散點圖;(2)求線性回歸方程;(3)預測當廣告費支出為7百萬元時的銷售額.解:(1)(2)從散點圖可以發(fā)現(xiàn),y與x具有線性相關(guān)關(guān)系,利用計算器求得:eq\x\to(x)=5,eq\x\to(y)=50,eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\i\su(i=1,5,x)iyi=1380,設(shè)回歸方程為y=bx+a,則b=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(1380-5×5×50,145-5×52)=6.5,a=eq\x\to(y)-beq\x\to(x)=50-6.5×5=17.5,故所求線性回歸方程為y=6.5x+17.5.(3)當x=7時,y=6.5×7+17.5=63.所以,當廣告費支出為7百萬元時,銷售額約為6300萬元.——規(guī)范解答——數(shù)形結(jié)合在線性相關(guān)性中的應用【例4】(12分)下表數(shù)據(jù)是退水溫度x(℃)對黃硐延長性y(%)效應的試驗結(jié)果,y是以延長度計算的,且對于給定的x,y為正態(tài)變量,其方差與x無關(guān).x(℃)300400500600700800y(%)405055606770(1)畫出散點圖;(2)指出x,y是否線性相關(guān);(3)若線性相關(guān),求y關(guān)于x的線性回歸方程;(4)估計退水溫度是1000℃【思路點撥】根據(jù)所給數(shù)據(jù)畫出散點圖,然后可借助函數(shù)的思想分析.【滿分樣板】(1)散點圖如圖所示:4分(2)由散點圖可以看出樣本點分布在一條直線的附近,可見y與x線性相關(guān).5分(3)列出下表,并用科學計算器進行有關(guān)計算.于是可得:【思維啟迪】(1)在研究兩個變量是否存在某種關(guān)系時,必須從散點圖入手,對于散點圖,可以做出如下判斷:①如果所有的樣本點都落在某一函數(shù)曲線上,那么就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系;②如果所有的樣本點都落在某一函數(shù)曲線附近,那么變量之間具有相關(guān)關(guān)系;③如果所有的樣本點都落在某一直線附近,那么變量之間具有線性相關(guān)關(guān)系.(2)利用散點圖判斷兩個變量之間是否具有線性相關(guān)關(guān)系,體現(xiàn)了數(shù)形結(jié)合思想的作用,而用回歸直線方程進行估計又體現(xiàn)了函數(shù)與方程思想的應用.下表是某機構(gòu)記載的某市5月1號到5月12號每天某傳染病治愈者的數(shù)據(jù),并根據(jù)這些數(shù)據(jù)繪制了散點圖,如圖.下列說法正確的是①③(填序號).①根據(jù)此散點圖,可以判斷人數(shù)與日期具有線性相關(guān)關(guān)系;②根據(jù)此散點圖,可以判斷人數(shù)與日期具有一次函數(shù)關(guān)系;③后三天治愈者人數(shù)占這12天治愈者總?cè)藬?shù)的30%多;④后三天中每天治愈者人數(shù)均超過這12天內(nèi)治愈者總?cè)藬?shù)的20%.解析:由散點圖可以明顯看出日期與人數(shù)具有線性相關(guān)關(guān)系,故①正確,②不正確.這12天治愈者總?cè)藬?shù)為100+109+…+203=1722,而后三天治愈者人數(shù)為175+186+203=564,后三天治愈者人數(shù)占這12天治愈者總?cè)藬?shù)的30%還多,故③正確,④不正確.一、選擇題1.下列敘述中:①變量間關(guān)系有函數(shù)關(guān)系,又有相關(guān)關(guān)系;②回歸函數(shù)即用函數(shù)關(guān)系近似地描述相關(guān)關(guān)系;③eq\i\su(i=1,n,x)i=x1+x2+…+xn;④線性回歸方程y=bx+a中,b=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),a=eq\x\to(y)-beq\x\to(x);⑤線性回歸方程一定可以表示相關(guān)關(guān)系.其中正確的有(C)A.①②③ B.①②④⑤C.①②③④ D.③④⑤解析:線性回歸方程只能近似地表示線性相關(guān)關(guān)系.2.線性回歸方程y=bx+a必過(D)A.(0,0)點 B.(eq\x\to(x),0)點C.(0,eq\x\to(y))點 D.(eq\x\to(x),eq\x\to(y))點解析:回歸直線系數(shù)a、b有公式a=eq\x\to(y)-beq\x\to(x),所以eq\x\to(y)=a+beq\x\to(x),故直線必過定點(eq\x\to(x),eq\x\to(y)).3.實驗測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為(A)A.y=x+1 B.y=x+2C.y=2x+1 D.y=x-1解析:本題中x與y完全線性相關(guān).二、填空題4.用身高x(cm)預測體重y(kg)滿足y=0.849x-85.712,若要找到41.638kg的人,不一定是在150cm中.(填“一定”或“不一定”)解析:因為統(tǒng)計的方法是可能犯錯誤的.利用線性回歸方程預測變量的值不是精確值.但一般認為實際測量值應在預測值左右.5.某地區(qū)近10年居民的年收入x與支出y之間的關(guān)系大致符合y=0.8x+0.1(單位:億元),預計今年該地區(qū)居民收入為15億元,則年支出的估計是12.1億元.解析:因為居民年收
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡數(shù)據(jù)流去重技術(shù)-深度研究
- 質(zhì)量管理體系升級-深度研究
- 生物唯一標識應用-深度研究
- 虛擬現(xiàn)實交互技術(shù)-深度研究
- 評價體系與教育公平-深度研究
- 材料表面處理技術(shù)-深度研究
- 紡織品抗菌性能提升-深度研究
- 裝飾者模式與模塊化設(shè)計-深度研究
- 旅游市場供需關(guān)系定價-深度研究
- 融合圖的二分圖匹配方法-深度研究
- 蚌埠介紹-蚌埠簡介課件(經(jīng)典版)
- GB/T 15561-2024數(shù)字指示軌道衡
- 探究煙花爆竹知識產(chǎn)權(quán)-洞察分析
- 網(wǎng)絡保險風險評估-洞察分析
- 呼吸機濕化的護理
- 2025-2030年中國旅居康養(yǎng)行業(yè)全國市場開拓戰(zhàn)略制定與實施研究報告
- 2024“五史”全文課件
- 食品檢驗員聘用合同樣本
- 六年級信息技術(shù)下冊教學計劃
- 2025年九年級數(shù)學中考復習計劃
- 2024屆江西省南昌市高三一模英語試卷(解析版)
評論
0/150
提交評論