版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
n.第日章統計
DIYlZHANG§1.8最小二乘估計
課前新知預習
[航向標.學習目標]
i.在探索多種方法確定線性回歸直線的過程中,體會最小二乘的思想方法.
2.能根據給出的線性回歸方程系數公式建立線性回歸方程.
[讀教材?自主學習]
1.最小二乘法:如果有〃個點:(X1,yi),(X2,刈),…,(xn,%),可以用下
面的表達式來刻畫這些點與直線y=a+bx的接近程度:
回[丫1-(a+公])]2+卜2—(v+]2H----1-[%—(a+bx0]2.
使得上式達到最小值的直線y=a+bx就是我們所要求的直線,這種方法稱為
園最小二乘法.
,be—_____X1+X2+…+*"m.___Vl+V2+??,+¥?
2.線性回歸方程:如果用x表示工,用y表水~,
則可以求得8=
(X1二X)8二),)+&2-X)(),2-))H-----F(X?-X)(),"-y)=但
22
(X|-X)+(X2-X)+,,,+(xn-X)2
用+二十*,四-2九y.〃=歹一匕三.這樣得到的直線方程稱為線性回歸方
?4+於H—I-焉一〃x2
程,a,。是線性回歸方程的系數.
[看名師?疑難剖析]
1.求線性回歸方程的步驟
⑴列表X”M,孫.
__nn
⑵計算x,y,£4,以必
/=1/=1
Y^iy—nxy
i=\
(3)代入公式。=-----------,o=y—求出A,a.
x2
i=\
A
(4)寫出直線方程:y=hx+a.
2.線性回歸方程系數公式的推導過程
首先將S—(4+人為)]2+[竺一3+bx2)]2H-----(a+bx”)]?化成關于未知數
a的一元二次多項式形式:
na2+2n(bx-y)a+[(y-bx\)2+(y2—bx*。+…+(y?—Z?x?)2]=+(Z?x-
22-2
y)f—〃Sx—y)+[(yi-i)+(y2bx^H----F(y?—Z?x?)]
因此當時,上式取得最小值,將這個關系代入上式,整理成關于
未知數b的一元二次多項式的形式:
22
[yi—(?+Z?Xi)]+[y2—(?+bx2)]-\----FD”—(a+bx,^
22
=[(yi—y)-b(x\—x)]+[(j2-y)~bg~X)]4-----卜[(y?-y)~b(xn—
x)]2
222
=/?[(x|—Xy+(X2-X)H-----F(x?—X)]—2&[(X1—X)-1—y)+(丁一x)(y2
22
—y)H-----<-(%?—x)(yM—y)]+[(yi—y)+(y2—y)-l-----b(y“一yf],因此,當b
(xi一x)(yi—)')+。2―%)(m—y)H-----x)&"-y)
(X1-X)2+(X2—X)2+X)2
n_____
Xxiyi-nxy
i=\
Xiyi十彳2丁2~1----|-%,加|一〃九
時點(修,yD(X2,")…(X",%)與直線y
於+於H----1-焉一〃x2
i=l
=a+bx最接近(注意并不是點到直線距離之和最小).a,b的意義是:以。為基
數,x每增加一個單位,y相應的平均增加/?個單位.
課堂師生共研
考點一線性回歸方程的概念
例1設有一個線性回歸方程為y=4—2x,則變量x增加2個單位時()
A.y平均增加1.5個單位B.y平均減少1.5個單位
C.y平均增加4個單位D.y平均減少4個單位
[解析]該題考查線性回歸方程的兩個變量之間的線性關系問題.由回歸直
線方程y=4-2x,知斜率為一2,所以變量x每增加1個單位,y平均減少2個單
位,故當變量x增加2個單位時,)平均減少4個單位,所以選D.
[答案]D
類題通法
根據線性回歸方程可獲得對兩個變量之間整體關系的了解,對于已知的變量
x,可以相應估計出變量y的值.
[變式訓練1]工人月工資(元)依勞動生產率(千元)變化的線性回歸方程為y
=50+80x,下列判斷正確的是()
A.勞動生產率為1000元時,工資為130元
B.勞動生產率提高1000元時,工資平均提高80元
C.勞動生產率提高1000元時,工資平均提高130元
D.當月工資為210元時,勞動生產率為2000元
答案B
解析線性回歸方程中匕的意義是當x增加一個單位時,y的值平
均變化。個單位,這是一個平均變化率.線性回歸方程只能用于預測變量的值.
考點二求線性回歸方程
例2每立方米混凝土的水泥用量式單位:kg)與28天后混凝土的抗壓強度
y(單位:kg/cn?)之間的關系有如下數據:
X150160170180190200210220230240250260
y56.958.361.664.668.171.374.177.480.282.686.489.7
求兩變量間的回歸直線方程.
[分析]由題目可獲取以下主要信息:
①兩變量具有線性相關關系;
②由兩變量的對應數據求回歸直線方程.
解答本題要先列出相應的表格,有了表格中的那些相關數據,回歸方程中的
系數就都容易求出了.
[解]列表如下:
i123456
Xi150160170180190200
M56.958.361.664.668.171.3
孫8535932810472116281293914260
i789101112
Xi210220230240250260
yi74.177.480.282.686.489.7
孫155611702818446198242160023322
x=205,y=726
121212
Z>-=518600,2y=64572.94,力渺=182943
?=i/=iz=i
.182943—12X205X72.64347
"b=-518600-12X2052-=14300^0'304,
a=^-b~x=72.6-0.304X205=10.28.
A
于是所求的回歸方程是y=0.304x+10.28.
類題通法
用公式求回歸方程的一般步驟是:
①列表孫孫孫.
②計算x,y,ZAH£漱,以必
i=1i=1i=1
③代入公式計算力、a的值.
④寫出回歸直線方程.
[變式訓練2]為了解兒子身高與其父親身高的關系,隨機抽取5對父子的身
高數據如下:
父親身高x(cm)174176176176178
兒子身高>,(cm)175175176177177
則y對無的線性回歸方程為()
A.y=x-1B.y=x+l
C.y=88+5D.y=176
答案C
解析本題考查線性回歸方程的求法.設y對x的線性回歸方程為
-2X(—1)+OX(-1)+OXO+OX1+2X11
因為b=a=176—176=
(-2)2+2221
88,所以y對x的線性回歸方程為y=1x+88.選C.
規(guī)范答題思維
規(guī)范答題線性相關關系的判斷及線性回歸方程的求解
[例](12分)假設關于某設備使用年限x(年)和所支出的維修費用y(萬元)有如
下統計資料:
X23456
y2.23.85.56.57.0
(1)請畫出上表數據的散點圖,判斷它們是否具有線性相關關系;若線性相關,
用最小二乘法求出y關于x的線性回歸方程;
(2)試根據(1)求出的線性回歸方程,預測使用年限為10年時,維修費用是多
少?
(一)精妙思路點撥
(二)分層規(guī)范細解
(1)散點圖①如圖所示:
年
由散點圖可知,兩變量之間具有相關關系,且為線性相關關系.4分
下面用最小二乘法求線性回歸方程:
列表,計算
i12345
Xi23456
%2.23.85.56.57.0
孫4.411.422.032.542.0
49162536
弟=90,玄力=112.3②
x=4,y=5,
<=1/=1
設所求回歸方程為:y=bx+a,則由上表可得
5____
?以一5xy
___________112.3-5X4X512.3,田
b~5—90-5X42—10—L23
i=\
8分
■^―②
a=y=5-1.23X4=0.08.
二線性回歸方程為y=1.23x+0.08.10分
(2)把尤=10代入(1)中所求得的線性回歸方程得:
y=1.23X10+0.08=12.38,11分
即使用年限為10年時,維修費用約是12.38萬元③.12分
(三)來自一線的報告
通過閱卷后分析,對解答本題的失分警示和解題啟示總結如下:(注:此處的
①②③見分層規(guī)范細解過程)
在解答過程中,①處散點圖的畫法中,橫、縱
①坐標的刻度選取不當,不易觀察散點分布,
會丟失2分;或選取樣本數據出現描點錯
誤,也會失2分.
失
分在解答過程中,②處的計算都很復雜,易出
②
警錯,致使后面的解答也易出錯,若出錯,在考
示
試中最多得5分.
在解答過程中,由回歸方程計算得到的
12.38萬元只是一個預測值,是實際問題的
一個估計值,因此若最后③處回答中無“約”
字,則會失掉1分.
(1)在解題中注意運用數形結合法,正確地畫出圖形.
解
(2)求線性回歸方程時,注意數字的運算技巧,提高
題
啟運算能力.
示
(3)體會理解公式的作用,在記憶公式的同時,加深
理解公式的特點和規(guī)律.
(四)類題練筆掌握
以下是某地搜集到的新房屋的銷售價格y和房屋的面積x的數據:
房屋面積Mn?)80105110115135
銷售價格y(萬元)18.42221.624.829.2
(1)畫出數據對應的散點圖;
(2)求線性回歸方程,并在散點圖中加上回歸直線;
⑶試預測90m2的房屋,銷售價格是多少?(精確到0.01)
解(1)根據表中所列數據可得散點圖如下:
由圖可見兩者之間是線性相關的.
(2)列表,計算:
i12345
Xi80105110115135
18.42221.624.829.2
X〉i14722310237628523942
xi640011025121001322518225
__55
x=109,y=23.2,)=60975,12952
2=1/=1
故可求得:
5_____
xy
1=1
b=
ixi-572
7=1
12952—5X109X23,2_
=―60975-5XI092—2°1962'
a=y-Z?x=23.2-0.1962X109=1.8142,
所以,線性回歸方程為y=0196Zc+1.8142,回歸直線如(1)中圖.
(3)把x=90代入上述回歸方程y=0.1962x+1.8142,
即^=0.1962X90+1.8142^19.47,即這種90m2的房屋,銷售價格約是19.47
萬元.
(五)解題設問
畫出散點圖的作用是什么?.
答案判斷數據是否線性相關
檢測學業(yè)達標
1.設有一個回歸方程為y=2—1.5x,則變量光增加一個單位時()
A.y平均增加1.5個單位B.y平均增加2個單位
C.y平均減小1.5個單位D.y平均減少2個單位
答案C
解析由相關系數的意義可知C正確.
2.線性回歸方程表示的直線y=a+法必定過(
A.(0,0)點B.(x,0)點
C.(0,歹)點D.(x,
答案D
3.試驗測得四組(x,>)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的線
性回歸方程為()
A.y=x+lB.y=x+2
C.y=2x+\D.y=x—1
答案A
解析作散點圖,利用最小二乘法求線性回歸方程.
4.施化肥量xkg與水稻產量ykg在一定范圍內線性相關,若線性回歸方程
為y=5x+250,當施化肥量為80kg時,預計水稻的產量為.
答案650kg
解析將x的值代入線性回歸方程即可.
5.假設學生在七年級和八年級的數學成績是線性相關的,若10個學生七年
級㈤和八年級0)數學分數如下:
X74717268767367706574
y76757170767965776272
試求七年級和八年級數學分數間的回歸直線方程.
解因為三=71,£^=50520,
10
9=72.3,》科=51467,
51467—10X71X72.3
所以b=—50520-10X712=1.2182,
a=72.3—1.2182X71=—14.192.
A
回歸直線方程是y=1.2182x—14.192.
課后梯度測評
一'選擇題
1.過三點(3,10),(7,20),(11,24)的線性回歸直線方程是()
A.y=1.75-5.75%B.-1.75+5.75%
C.y=5.75+1.75xD.y=5.75—1.75x
答案C
解析根據求線性回歸方程的方法,利用公式可得到答案.
2.抽測10只某種白熾燈的使用壽命尤,結果如下(單位:力:1067,919,1196,785,
A936,918,1156,920,918,若4=997,則/大約是()
A.1120B.1124C.1155D.1128
答案C
3.在線性回歸方程中,b表示()
A.當x增加一個單位時,y增加a的數量
B.當y增加一個單位時,x增加b的數量
C.當x增加一個單位時,y的平均變化量
D.當y增加一個單位時,x的平均變化量
答案C
解析本題主要考查線性回歸方程中m。的含義.
4.由一組樣本數據8,yi),(%2,)2),…,(X”,%)得到線性回歸方程y=bx
+“,那么下列說法中錯誤的是()
A.直線y=b:+a必經過點(x,y)
B.直線y=/zr+a至少經過點(修,力),(物”),…,(尤"%)中的一個點
y
f=l
C.直線y=bx+a的斜率為b=-----------
2
<=1
n
D.直線y=bx+a和各點(xi,%),(檢,"),…,(x”,%)的偏差的平方和
i=i
兇一(如+喇2是該坐標平面上所有直線與這些點的偏差的平方和中最小的
答案B
解析理解線性回歸方程的真正含義.因為7=人工+。,其中三=/沏+%2
HFx?)?y=%i+y2Tl-yn),顯然回歸直線經過點(x,y).故A是正確的.回
歸直線最能近似刻畫點(汨,yi),(X2,"),…,(X”,y”)的變化趨勢,但并不一定
經過某些點.故B是錯誤的.對于C、D只需了解相應概念便會得出正確結論.
5.下列敘述中:
①變量間關系有函數關系,還有相關關系;
②回歸函數即用函數關系近似地描述相互關系;
n
③營商=修+尬+…
n__
"£(即一x)(y-y)__
④線性回歸方程y=/?x+a中,b=71二,a=y~bx;
石(x-x)2
⑤線性回歸方程一定可以近似地表示所有相關關系.
其中正確的有()
A.①②③B.①②④⑤
C.①②③④D.③④⑤
答案C
解析利用直接法逐個判斷可知,①②③④正確,而⑤線性回歸方程可以近
似地表示具有線性相關關系,而不能表示其他相關關系.
6.某化工廠為預測某產品的回收率y,需要研究它和原料有效成份含量x之
888
間的相關關系,現取了8對觀察值,計算得:石片=52,石%=228,,?肅=478,
8
X=RY=1849,則y與x的回歸方程是()
l1
AA
A.y=11.47+2.62rB.y=-11.47+2.62%
C.y=2.62+22.47xDj=11.47-2.62%
答案A
解析把題目所給的數據代入公式分別求系數。和人即可.
二、填空題
7.調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬
元),調查顯示年收入尤與年飲食支出y具有線性相關關系,并由調查數據得到y
對尤的回歸直線方程:;=0.254x+0.321.由回歸直線方程可知,家庭年收入每增
加1萬元,年飲食支出平均增加萬元.
答案0.254
解析本小題主要考查了利用回歸直線方程,對數據進行估計.以x+1代X,
得0.254(x+1)+0.321,與0.254x+0.321相減可得,年飲食支出平均增加0.254
萬元.
8.某商店統計了最近6個月某商品的進價x與售價y(單位:元)的對應數據
如下:
X3528912
y46391214
__66
則尤=,y=,耳6=,N項y尸,回歸
方程為.
A
答案6.58327396y=1.4x+0.571
6
解析根據公式代入即可求得,也可以利用計算器求得,7=6.5,7=8,
6A
焉=327,石x,y=396,回歸方程為y=1.4x+0.571.
9.假設學生在初中的英語成績和高一英語成績是線性相關的.現有10名學
解析求斜率即求回歸方程中的。,按照公式進行即可,即需要依次計算出工
10_1051467-10X71X72.3
-71,gx--50520,y—72.3,石1%-51467,所以b-
50520-10X712
^1.2182,所以斜率為1.2182.
三'解答題
10.在10年期間,一城市居民的年收入與某種商品的銷售額有如下數據:
第幾年12345678910
城市居
民年收入32.231.132.935.837.138.039.043.044.646.0
7(億元)
某種商品
銷售額25.030.031.037.039.041.042.044.048.051.0
y(萬元)
(1)畫出散點圖;
(2)如果散點圖中的各點大致分布在一條直線的附近,求y與x之間的線性回
歸方程.
解(1)散點圖如圖.
銷售額(萬元)
52
48
44
40
36
32
28
24
人人八人111111111___________-
0T303234363840424446年收入(億元)
(2)由圖可知,y與x線性相關,列表計算如下:
1乃y石”
132.225.0805
231.130.0933
332.934.01118.6
T=37.97,5=39.1
435.837.01324.69
10。
£—=14663.67,
537.139.01446.9r=1
10
638.041.01558=15202.9
/=1
739.042.01638
843.044.01892
944.648.02140.8
1046.051.02346
-X_____
心-15202.9-10X37.97X39.1
所以b=14663.67—10X37.972乂一,,=39.1-1.447X37.97--
15.843,因此,所求線性回歸方程為y=1.447x-15.843.
11.PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物(也稱可入肺顆粒物),
為了探究車流量與PM2.5的濃度是否相關,現采集到某城市周一至周五某時間段
車流量與PM2.5濃度的數據如下表:
時間周一周二周三周四周五
車流量M萬輛)100102108114116
濃度y(微克/立方米)7880848890
(1)根據上表數據,用最小二乘法求出y與x的線性回歸方程;
(2)若周六同一時段車流量是200萬輛,試根據⑴求出的線性回歸方程,預測
此時PM2.5的濃度為多少?
_15540
解(1)由條件可知,x產5=1。8,
/=1
-14200
5—84,
i=l
5__
z(即-X)(M-y)=(—8)義(-6)+(—6)X(—4)+0X0+6X4+8X6=144,
/=1
5_
Z(X/—x『=(—8)2+(—6)2+02+62+82=200,
/=!
5__
Z8-X)(y-y)
/=1144
b=—;2=200=°-72,
X(XLX)2
Z=1
a=y一〃x=84—0.72義108=6.24,
A
故y關于x的線性回歸方程為y=0.72x+6.24.
A
(2)當尤=200時,y=0.72X200+6.24=150.24.
所以可以預測此時PM2.5的濃度約為150.24微克/立方米.
12.某地最近十年糧食需求量逐年上升,下表是部分統計數據:
年份20102012201420162018
需求量(萬噸)236246257276286
(1)利用所給數據求年需求量與年份之間的回歸直線方程y=foc+a;
(2)利用(1)中所求出的直線方程預測該地2020年的糧食需求量.
解本題考查回歸分析的基本思想及其初步應用、回歸直線的意義和求法、
數據處理的基本方法和能力,考查運用統計知識解決簡單實際應用問題的能力.
(1)由所給數據看出,年需求量與年份之間是近似直線上升,下面來求回歸直
線方程.為此對數據預處理如下:
年份一2014-4-2024
需求量一257-21-1101929
對預處理后的數據,容易算得意=0,7=3.2,
(-4)X(-21)+(-2)X(-ll)+2X19+4X29
b=42+22+22+42
6z2—yhx=3.2.
由上述計算結果,知所求回歸直線方程為y—257=b(x—2014)+a=6.5(x—
2014)+3.2,
A
即產6.5?!?014)+2602①
(2)利用直線方程①,可預測2020年的糧食需求量為
6.5X(2020—2014)+260.2=6.5X6+260.2=299.2(萬噸)Q300(萬噸).(未寫
近似值不扣分)
13.日常生活中,某些東西所含的熱量比較高,對我們的身體有一定的影響,
下表給出了不同類型八種餅干的數據,第一列數據表示八種餅干各含熱量的百分
比,第二列數據表示顧客對八種餅干所給予分數(百分制).
品種所含熱量的百分比口味記錄
125
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國女長褲行業(yè)市場運營模式及未來發(fā)展動向預測報告
- 2024-2030年中國太陽能電池用EVA薄膜行業(yè)競爭格局及發(fā)展可行性研究報告版
- 2024-2030年中國天然蜂蜜市場競爭狀況與盈利前景預測報告
- 2024-2030年中國城建行業(yè)十三五規(guī)劃及投資商業(yè)模式分析報告版
- 2024-2030年中國土壤修復行業(yè)十三五規(guī)劃及發(fā)展前景展望報告
- 2024-2030年中國四甲基哌啶醇行業(yè)生產現狀及競爭前景預測報告
- 2024-2030年中國味精行業(yè)市場營銷策略及發(fā)展前景預測報告
- 2024-2030年中國臺裝式水龍頭市場銷售現狀與競爭前景預測報告
- 2024-2030年中國取暖貼行業(yè)十三五需求及投資潛力研究報告
- 2024年國家公務員考試行測真題卷行政執(zhí)法答案和解析
- 2023-2024學年北京市清華附中朝陽學校七年級(上)期中數學試卷【含解析】
- 2024年全國高考Ⅰ卷英語試題及答案
- 北京三甲中醫(yī)疼痛科合作方案
- 《夏天里的成長》語文教學PPT課件(6篇)
- 《駝鹿消防員的一天》課件
- 小學思政課《愛國主義教育》
- 外貿報關用發(fā)票、裝箱單、合同、報關單模板
- 新時代企業(yè)戰(zhàn)略管理制度轉變與創(chuàng)新
- (完整版)能源審計合同樣本
- 火鍋連鎖餐飲連鎖餐廳運營資料 海底撈 杯具清洗消毒流程P1
評論
0/150
提交評論