版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
3.1回歸分析的基本思想及其初步應用[教材研讀]預習教材P80~88,思考以下問題1.什么是回歸分析?2.什么是線性回歸模型?[要點梳理]1.回歸分析(1)回歸分析回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.(2)回歸方程的相關計算對于兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn).設其回歸直線方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定參數,由最小二乘法得eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).(3)線性回歸模型線性回歸模型eq\b\lc\{\rc\(\a\vs4\al\co1(y=bx+a+e,,Ee=0,De=σ2)),其中a,b為模型的未知參數,通常e為隨機變量,稱為隨機誤差.x稱為解釋變量,y稱為預報變量.2.線性回歸分析(1)殘差:對于樣本點(xi,yi)(i=1,2,…,n)的隨機誤差的估計值eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i稱為相應于點(xi,yi)的殘差,eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2稱為殘差平方和.(2)殘差圖:利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重的估計值等,這樣作出的圖形稱為殘差圖.(3)R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)越接近1,表示回歸的效果越好.[自我診斷]判斷(正確的打“√”,錯誤的打“×”)1.殘差平方和越小,線性回歸方程的擬合效果越好.()2.在畫兩個變量的散點圖時,預報變量在x軸上,解釋變量在y軸上.()3.R2越小,線性回歸方程的擬合效果越好.()[答案]1.√2.×3.×eq\a\vs4\al(題型一求線性回歸方程)思考:求線性回歸方程的步驟是什么?提示:①列表表示xi,yi,xiyi,xeq\o\al(2,i);②計算eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi;③代入公式計算eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))的值;④寫出線性回歸方程.某研究機構對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,得下表數據x681012y2356(1)請畫出上表數據的散點圖;(要求:點要描粗)(2)請根據上表提供的數據,用最小二乘法求出y關于x的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)試根據求出的線性回歸方程,預測記憶力為9的同學的判斷力.eq\b\lc\(\rc\)(\a\vs4\al\co1(相關公式:\o(b,\s\up6(^))=\f(\i\su(i=1,n,x)iyi-n\x\to(x)·\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x)))[思路導引]先畫散點圖,再求回歸系數eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))寫出方程.[解](1)如圖:(2)eq\i\su(i=1,n,x)iyi=6×2+8×3+10×5+12×6=158,eq\x\to(x)=eq\f(6+8+10+12,4)=9,eq\x\to(y)=eq\f(2+3+5+6,4)=4,eq\i\su(i=1,n,x)eq\o\al(2,i)=62+82+102+122=344,eq\o(b,\s\up6(^))=eq\f(158-4×9×4,344-4×92)=eq\f(14,20)=0.7,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)×9=-2.3,故線性回歸方程為eq\o(y,\s\up6(^))x-2.3.(3)由(2)中線性回歸方程當x=9時,eq\o(y,\s\up6(^))×9-2.3=4,預測記憶力為9的同學的判斷力約為4.求線性回歸方程的三個步驟(1)畫散點圖:由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關關系.(2)求回歸系數:若存在線性相關關系,則求回歸系數.(3)寫方程:寫出線性回歸方程,并利用線性回歸方程進行預測說明.【溫馨提示】對回歸直線的四點說明(1)回歸直線過點(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).(2)回歸直線的截距a和斜率b都是通過樣本估計而得的,存在著誤差,這種誤差可能導致預報結果的偏差.(3)線性回歸方程y=a+bx中的b表示x增加1個單位時,y的平均變化量為b,而a表示y不隨x的變化而變化的部分.(4)可以利用線性回歸方程y=a+bx預報在x取某個值時,y的估計值.[跟蹤訓練](鏈接教材P81—例1)某種產品的廣告費用支出x與銷售額y(單位:百萬元)之間有如下的對應數據:x/百萬元24568y/百萬元3040605070(1)畫出散點圖;(2)求線性回歸方程;(3)試預測廣告費用支出為10百萬元時的銷售額.[解](1)散點圖如圖所示:(2)列出下表,并用科學計算器進行有關計算:i12345合計xi2456825yi3040605070250xiyi601603003005601380xeq\o\al(2,i)416253664145所以,eq\o(x,\s\up6(-))=eq\f(25,5)=5,eq\o(y,\s\up6(-))=eq\f(250,5)=50,eq\a\vs4\al(\i\su(i=1,5,))xeq\o\al(2,i)=145,eq\a\vs4\al(\i\su(i=1,5,))xiyi=1380.于是可得eq\o(b,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,5,))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\a\vs4\al(\i\su(i=1,5,))x\o\al(2,i)-5\o(x,\s\up6(-))2)=eq\f(1380-5×5×50,145-5×52)=6.5,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))×5=17.5.所以所求的線性回歸方程為eq\o(y,\s\up6(^))x+17.5.(3)根據(2)中求得的線性回歸方程,當廣告費用支出為10百萬元時,eq\o(y,\s\up6(^))×10+17.5=82.5(百萬元),即廣告費用支出為10百萬元時,銷售額大約為82.5百萬元.題型二線性回歸分析思考:如何用殘差圖、殘差平方和、相關指數R2分析模型擬合效果?提示:殘差圖的帶狀區(qū)域的寬度越窄,模型擬合精度越高;殘差平方和越小,模型擬合效果越好;R2越接近于1,模型擬合效果越好.假定小麥基本苗數x與成熟期有效穗y之間存在相關關系,今測得5組數據如下:xy(1)以x為解釋變量,y為預報變量,作出散點圖;(2)求y與x之間的回歸方程,對于基本苗數56.7預報有效穗;(3)計算各組殘差,并計算殘差平方和;(4)求R2,并說明殘差變量對有效穗的影響占百分之幾?[解](1)散點圖如下.(2)由(1)中散點圖看出,樣本點大致分布在一條直線的附近,有比較好的線性相關關系,因此可以用線性回歸方程刻畫它們之間的關系.設回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),eq\o(x,\s\up6(-))=30.36,eq\o(y,\s\up6(-))=43.5,eq\a\vs4\al(\i\su(i=1,5,))xeq\o\al(2,i)=5101.56,eq\a\vs4\al(\i\su(i=1,5,))yeq\o\al(2,i)=9511.43.eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))=1320.66,eq\o(x,\s\up6(-))2=921.7296,eq\a\vs4\al(\i\su(i=1,5,))xiyi=6746.76.則eq\o(b,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,5,))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\a\vs4\al(\i\su(i=1,5,))x\o\al(2,i)-5\o(x,\s\up6(-))2)≈0.29,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))≈34.70.故所求的回歸直線方程為eq\o(y,\s\up6(^))x+34.70.當x=56.7時,eq\o(y,\s\up6(^))×56.7+34.70=51.143.估計成熟期有效穗為51.143.(3)由于eq\o(y,\s\up6(^))i=eq\o(b,\s\up6(^))xi+eq\o(a,\s\up6(^)),可以算得eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i分別為eq\o(e,\s\up6(^))1=0.35,eq\o(e,\s\up6(^))2=0.718,eq\o(e,\s\up6(^))3=-0.5,eq\o(e,\s\up6(^))4=-2.214,eq\o(e,\s\up6(^))5=1.624,殘差平方和:eq\a\vs4\al(\i\su(i=1,5,))eq\o(e,\s\up6(^))eq\o\al(2,i)≈8.43.(4)eq\a\vs4\al(\i\su(i=1,5,))(yi-eq\o(y,\s\up6(-)))2=50.18,故R2=1-,50.18)≈0.832.所以解釋變量小麥基本苗數對總效應約貢獻了83.2%,殘差變量貢獻了約1-83.2%=16.8%.(1)利用殘差分析研究兩個變量間的關系時,首先要根據散點圖來判斷它們是否線性相關,是否可以用線性回歸模型來擬合數據,然后通過殘差eq\o(e,\s\up6(^))1,eq\o(e,\s\up6(^))2,…,eq\o(e,\s\up6(^))n來判斷模型擬合的效果.(2)若殘差點比較均勻地分布在水平帶狀區(qū)域中,帶狀區(qū)域越窄,說明模型擬合度越高,回歸方程預報精確度越高.[跟蹤訓練]為研究質量x(單位:克)對彈簧長度y(單位:厘米)的影響,對不同質量的6個物體進行測量,數據如表所示:x51015202530y(1)作出散點圖并求線性回歸方程.(2)求出R2.(3)進行殘差分析.[解](1)作出散點圖如圖所示:eq\o(x,\s\up6(-))=eq\f(1,6)×(5+10+15+20+25+30)=17.5.eq\o(y,\s\up6(-))=eq\f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,eq\a\vs4\al(\i\su(i=1,6,))xeq\o\al(2,i)=2275,eq\a\vs4\al(\i\su(i=1,6,))xiyi=1076.2,計算得,eq\o(b,\s\up6(^))≈0.183,eq\o(a,\s\up6(^))≈6.285,所求回歸直線方程為eq\o(y,\s\up6(^))x.(2)列表如下:yi-eq\o(y,\s\up6(^))iyi-eq\o(y,\s\up6(-))所以eq\a\vs4\al(\i\su(i=1,6,))(yi-eq\o(y,\s\up6(^))i)2≈0.01318,eq\a\vs4\al(\i\su(i=1,6,))(yi-eq\o(y,\s\up6(-)))2=14.6784.所以,R2=1-,14.6784)≈0.9991.所以回歸模型的擬合效果較好.(3)由殘差表中的數值可以看出第3個樣本點的殘差比較大,需要確認在采集這個數據的時候是否有人為的錯誤,如果有的話,需要糾正數據,重新建立回歸模型;由表中數據可以看出殘差點比較均勻地落在不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長度與質量具有線性關系.eq\a\vs4\al(題型三非線性回歸分析)(鏈接教材P86—例2)某地區(qū)六年來輕工業(yè)產品利潤總額y與年次x的試驗數據如下表所示:年次x123456利潤總額y由經驗知,年次x與利潤總額y(單位:億元)近似有如下關系:y=abxe0.其中a,b均為正數,求y關于x的回歸方程.[思路導引]解答此題可根據散點圖選擇恰當的擬合函數,而本題已經給出,只需將其轉化為線性函數,利用最小二乘法求得回歸直線方程,再將其還原為非線性回歸方程即可.[解]對y=abxe0兩邊取自然對數,得lny=lnae0+xlnb,令z=lny,則z與x的數據如下表:x123456z由z=lnae0+xlnb及最小二乘法公式,得lnb≈0.0477,lnae0=2.378,即eq\o(z,\s\up6(^))x,故eq\o(y,\s\up6(^))×x.非線性回歸問題的處理方法一般地,有些非線性回歸模型通過變換可以轉化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關系的兩個變量之間的關系:(1)如果散點圖中的點分布在一個直線狀帶形區(qū)域,可以選用線性回歸模型來建模;(2)如果散點圖中的點分布在一個曲線狀帶形區(qū)域,要先對變量作適當的變換,再利用線性回歸模型來建模.(3)非線性回歸方程的求法:①根據原始數據(x,y)作出散點圖;②根據散點圖,選擇恰當的擬合函數;③作恰當的變換,將其轉化成線性函數,求線性回歸方程;④在③的基礎上通過相應的變換,即可得非線性回歸方程.(4)非線性相關問題常見的幾種線性變換:在實際問題中,常常要根據一批實驗數據繪出曲線,當曲線類型不具備線性相關關系時,可以根據散點分布的形狀與已知函數的圖象進行比較,確定曲線的類型,再作變量替換,將曲線改為直線.下面是幾種容易通過變量替換轉化為直線的函數模型:①y=a+eq\f(b,x),令y′=y(tǒng),x′=eq\f(1,x),則有y′=a+bx′;②y=axb,令y′=lny,x′=lnx,a′=lna,則有y′=a′+bx′;③y=aebx,令y′=lny,x′=x,a′=lna,則有y′=a′+bx′;④y=aeeq\s\up15(eq\f(b,x)),令y′=lny,x′=eq\f(1,x),a′=lna,則有y′=a′+bx′;⑤y=a+blnx,令y′=y(tǒng),x′=lnx,則有y′=a+bx′;⑥y=bx2+a,令y′=y(tǒng),x′=x2,則有y′=bx′+a.[跟蹤訓練]某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數據作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\o(w,\s\up6(-))eq\a\vs4\al(\i\su(i=1,8,))(xi-eq\o(x,\s\up6(-)))2eq\a\vs4\al(\i\su(i=1,8,))(wi-eq\o(w,\s\up6(-)))2eq\a\vs4\al(\i\su(i=1,8,))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))eq\a\vs4\al(\i\su(i=1,8,))(wi-eq\o(w,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))5631469表中wi=eq\r(xi),eq\o(w,\s\up6(-))=eq\f(1,8)eq\a\vs4\al(\i\su(i=1,8,))wi.(1)根據散點圖判斷,y=a+bx與y=c+deq\r(x)哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程.(3)已知這種產品的年利潤z與x,y的關系為zy-x.根據(2)的結果回答下列問題:①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?②年宣傳費x為何值時,年利潤的預報值最大?附:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其回歸線v=α+βu的斜率和截距的最小二乘估計分別為:eq\o(β,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,n,))ui-\o(u,\s\up6(-))vi-\o(v,\s\up6(-)),\a\vs4\al(\i\su(i=1,n,))ui-\o(u,\s\up6(-))2),eq\o(α,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).[解](1)由散點圖的變化趨勢可以判斷,y=c+deq\r(x)適宜作為年銷售量y關于年宣傳費x的回歸方程類型.(2)令w=eq\r(x),先建立y關于w的線性回歸方程.由于eq\o(d,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,8,))wi-\o(w,\s\up6(-))yi-\o(y,\s\up6(-)),\a\vs4\al(\i\su(i=1,8,))wi-\o(w,\s\up6(-))2)=,1.6)=68,eq\o(c,\s\up6(^))=eq\o(y,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 平板電腦產業(yè)鏈招商引資的調研報告
- 人教版小學語文四年級上冊《搭石》說課稿
- 抽油煙機清潔服務行業(yè)經營分析報告
- 職業(yè)教育新高考招生方案
- 學校操場不銹鋼護欄安裝與維護方案
- 書寫工具用筆尖產業(yè)深度調研及未來發(fā)展現狀趨勢
- 寵物用次性訓練尿墊產業(yè)鏈招商引資的調研報告
- 手印器具市場需求與消費特點分析
- 帆船運動用帆市場需求與消費特點分析
- 鋼鐵廠機電設備安裝施工方案
- 中心城排水管網改造三期工程有限空間作業(yè)專項方案
- 六十四卦圖文詳解
- 要事第一(課堂PPT)
- SDR特別提款權PPT課件
- 對排球大力跳發(fā)球失誤的技術原因分析
- 中藥飲片甲類
- SH/T3903-石油化工建設工程項目監(jiān)理規(guī)范(承包單位用表)
- 建筑垃圾綜合處理廠項目可行性研究報告(完整版)
- 《職工基本養(yǎng)老保險繳費流水情況范本表格》
- 醫(yī)院臨床帶教指導教師考核細則(完整版)
- 防靜電檢測方法
評論
0/150
提交評論