




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第三節(jié)成對數(shù)據(jù)的統(tǒng)計分析
第1課時變量間的相關(guān)關(guān)系及回歸模型
■課程標(biāo)準(zhǔn)
1.結(jié)合實例,了解樣本相關(guān)系數(shù)的統(tǒng)計含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)向量夾角的關(guān)系.
2.結(jié)合實例,會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.
3.結(jié)合具體實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線
性回歸模型參數(shù)的最小二乘估計方法.
4.針對實際問題,會用一元線性回歸模型進(jìn)行預(yù)測.
口----------必備知識系統(tǒng)梳理基礎(chǔ)重落實---------課前自修
I_____知___識___?__逐____點___夯____實_______________________________________________________________J__________
知識梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系:若兩個變量之間有關(guān)系,但又不是函數(shù)關(guān)系,這種關(guān)系稱為相關(guān)關(guān)系;
(2)相關(guān)關(guān)系的分類:①從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,就
稱這兩個變量________;
②當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變量_______;
提醒注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別:函數(shù)關(guān)系是一■種確定的關(guān)系,而相關(guān)關(guān)系是一■種非確定的關(guān)系.(3)
線性相關(guān):如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在附近,就稱這兩個變量線性
相關(guān).
2.樣本相關(guān)系數(shù)
對于變量X和變量》設(shè)經(jīng)過隨機抽樣獲得的成對樣本數(shù)據(jù)為(X1,%),(X2,>2),…,Cxn,yn)>若無
與y存在線性相關(guān)關(guān)系,可用樣本相關(guān)系數(shù)r定量分析它們的相關(guān)程度的強弱.
(1)樣本相關(guān)系數(shù)
n__
2(Xi-x)(yi-y)
r=,i=i,:
fn2fn2,
(2)樣本相關(guān)系數(shù)廠的性質(zhì)
①當(dāng)廠>0時,稱成對樣本數(shù)據(jù)相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)相關(guān);當(dāng)廠=0時,稱成對樣本
數(shù)據(jù)間沒有線性相關(guān)關(guān)系;
②樣本相關(guān)系數(shù)r的取值范圍為.當(dāng)IrI越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越;
當(dāng)I川越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越.
3.一元線性回歸模型
(1)經(jīng)驗回歸直線:從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱
兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做經(jīng)驗回歸直線;
n_n_
八-z(%i-x)(yi-y)Yxiyi-nxy4
(2)經(jīng)驗回歸方程為夕=bx+6,其中------——=嗎----—JS=y—hx;
X(%i-x)Xxf—rix
i=li=l
n
(3)通過求。=E(V—2的最小值而得到經(jīng)驗回歸直線的方法,即使得樣本數(shù)據(jù)的點到回歸直線的
i=l
距離的平方和最小,這一方法叫做最小二乘法.
4.判斷回歸模型的擬合效果
由成對樣本數(shù)據(jù)(尤"?)(i=l,2,…,w)按照最小二乘法得到經(jīng)驗回歸方程夕=6尤+4,其中y叫做觀測
值,夕叫做預(yù)測值,殘差2=y一夕.相對于樣本點(孫弘)的隨機誤差瓦=%—%=%—Cbxi+a).
(1)殘差分析法
①作殘差圖:作圖時縱坐標(biāo)為,橫坐標(biāo)可以選為樣本編號,或國數(shù)據(jù),或%數(shù)據(jù),這樣作出的圖形稱
為殘差圖;
②殘差分析:殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越
窄,說明模型擬合精度越高,經(jīng)驗回歸方程的預(yù)報精度越高.
n2
ccZ(力一%)/n\
(2)決定系數(shù)(爐)法:R2=IT-----J其中夕=工£%).爐的值越趨近于I,模型的擬合效果越好.
z(.yi-y)\ni=i'
i=l
對點自測
1.判斷正誤.(正確的畫r”,錯誤的畫“x”)
(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.()
(2)散點圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.()
(3)經(jīng)驗回歸直線夕=5尤+a至少經(jīng)過點(X1,力),(X2,>2),…,Cxn,yn)中的一個點.()
(4)樣本相關(guān)系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強.()
2.兩個變量的相關(guān)關(guān)系有①正相關(guān),②負(fù)相關(guān),③不相關(guān),則下列散點圖從左到右分別反映的變量間的相關(guān)關(guān)
系是()
A.①②③B.②③①
C.②①③D.①③②
3.對于尤,y兩變量,有四組成對樣本數(shù)據(jù),分別算出它們的樣本相關(guān)系數(shù)廠如下,則線性相關(guān)性最強的是
()
A.-0.82B.0.78
C.-0.69D.-0.87
4.在對兩個變量x,y進(jìn)行回歸分析時有下列步驟:①對所求出的經(jīng)驗回歸方程作出解釋;②收集數(shù)據(jù)(沏,
9),i=l,2,n;③求經(jīng)驗回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點圖.則下列操作順序正確的是
()
A.①②④③B.③②④①
C.②③①④D.②④③①
5.已知尤,y的取值如下表,已知y與x具有線性相關(guān)關(guān)系,且經(jīng)驗回歸方程為9=0.95戈+4,貝值=.
X0134
y2.24.34.86.7
尸考點?分類突破口----------精選考點典例研析技法重悟通---------T課堂演練
1—________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
變量間相關(guān)關(guān)系的判斷
(師生共研過關(guān)
【例1】(1)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表如下:
月份123456
人均銷售額658347
利潤率(%)12.610.418.53.08.116.3
根據(jù)表中數(shù)據(jù),下列說法正確的是()
A.利潤率與人均銷售額成正比例函數(shù)關(guān)系B.利潤率與人均銷售額成反比例函數(shù)關(guān)系
C.利潤率與人均銷售額成正相關(guān)關(guān)系D.利潤率與人均銷售額成負(fù)相關(guān)關(guān)系
(2)已知變量x和y滿足關(guān)系y=-0.卜+1,變量y與z正相關(guān).下列結(jié)論中正確的是()
A.x與y正相關(guān),%與z負(fù)相關(guān)B.尤與y正相關(guān),尤與z正相關(guān)
C.x與y負(fù)相關(guān),x與z負(fù)相關(guān)D.x與y負(fù)相關(guān),x與z正相關(guān)
聽課記錄_______________________________
解題技法
判定兩個變量相關(guān)性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負(fù)相
關(guān);
(2)樣本相關(guān)系數(shù):當(dāng)廠>0時,正相關(guān);當(dāng)r<0時,負(fù)相關(guān);|川越接近于1,相關(guān)性越強;
(3)經(jīng)驗回歸方程:當(dāng)時,正相關(guān);當(dāng)B<0時,負(fù)相關(guān).
E訓(xùn)練
1.下列關(guān)系不屬于相關(guān)關(guān)系的是()
A.森林中的同一類樹木,其橫截面直徑與高度之間的關(guān)系
B.球的體積與表面積的關(guān)系
C.父母的身高與子女身高的關(guān)系
D.人的身高與體重的關(guān)系
2.對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確的是()
3535
303()
2525
2020
1515
1()1()
5.3
00
51()1520253()355101520253035
樣本相關(guān)系數(shù)為。樣本相關(guān)系數(shù)為二
(1)(2)
3533
3()30
2525
2020
1515
1()1()
55
00
51()152025303551()1520253035
樣本相關(guān)系數(shù)為7樣本相關(guān)系數(shù)為。
(3)(4)
A.r2<^4<0<f3<riB.r4<^r2<0<ri<F3
C.r4<r2<0<r3<nD.r2<r4<0<ri<r3
1考點二
【例2】(2022?全國乙卷19題)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種
樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:
m3),得到如下數(shù)據(jù):
樣本號,12345678910總和
根部橫截
0.040.060.040.080.080.050.050.070.070.060.6
面積尤
材積量》0.250.400.220.540.510.340.360.460.420.403.9
101010
并計算得£婷=0.038,23^=1.6158,2%M=0.2474.
i=li=li=l
(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);
(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m2.已知
樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.
Z(xi-x)(yi-y)
附:相關(guān)系數(shù)i=l=,VL896=1.377.
r=In2n
2
z(咫一元)x(刃一歹)
i=li=i
解題技法
樣本相關(guān)系數(shù)廠的統(tǒng)計含義及應(yīng)用
(1)由r的正、負(fù)可判斷成對樣本數(shù)據(jù)中兩相關(guān)變量是正相關(guān)還是負(fù)相關(guān);
(2)可根據(jù)IrI的大小從量的角度判斷成對樣本數(shù)據(jù)是否具有線性相關(guān)性,進(jìn)而可知能否用經(jīng)驗回歸方程進(jìn)
行分析和預(yù)測;
(3)當(dāng)I*W0.25時,即便求得了經(jīng)驗回歸方程也沒有任何統(tǒng)計意義.
Q訓(xùn)練
某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,
將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)
據(jù)(尤,?,9)(/=1,2,…,20),其中即和9分別表示第,個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野
2020202020
生動物的數(shù)量,并計算得Z蒼=60,29=1200,Z(汨一元產(chǎn)=80,2(M—歹)2=9000,£(%,—%)(%
i=li=li=li=li=l
-y)=800.
(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)
乘以地塊數(shù));
(2)求樣本(xi,yi)(z=l,2,20)的相關(guān)系數(shù)(精確到0.01);
(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)
量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.
n__
Z(%i-x)(yi-y)
附:r=I匚1,V2-1.414.
n2n、2
Z(Xi-x)Z(”一歹)
Ji=ii=i
經(jīng)驗回歸模型
(定向精析突破
考向7線性經(jīng)驗回歸問題
【例3】某研究機構(gòu)為調(diào)查人的最大可視距離y(單位:米)和年齡無(單位:歲)之間的關(guān)系,對不同年
齡的志愿者進(jìn)行了研究,收集數(shù)據(jù)得到下表:
X2025303540
y167160150143130
(1)根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗回歸方程;
(2)根據(jù)(1)中求出的經(jīng)驗回歸方程,估計年齡為50歲的人的最大可視距離.
nn__
八I(芍一元)(“一?)Ixiyi-nxy
參考公式:經(jīng)驗回歸方程夕=以+6中斜率和截距的最小二乘估計公式分別為b=j----------------------
X(%i—x)Xxf—nx2
i=li=l
a=y-bx.
解題技法
線性回歸分析問題的解題策略
(1)利用公式,求出回歸系數(shù)有;
(2)利用經(jīng)驗回歸直線過樣本點的中心求系數(shù)式;
(3)利用經(jīng)驗回歸方程進(jìn)行預(yù)測,把回歸方程看作一次函數(shù),將解釋變量x的值代入,得到預(yù)測變量夕的值.
考向2非線性經(jīng)驗回歸問題
【例4】“綠水青山就是金山銀山”的理念推動了新能源汽車產(chǎn)業(yè)的迅速發(fā)展.以下表格和散點圖反映了近幾
年某新能源汽車的年銷售量情況.
年份20192020202120222023
年份代碼X12345
某新能源汽車年銷售量y/萬輛1.55.917.732.955.6
60:年銷售量y/萬輛
*
40■
*
20?
*
02345屋份代碼工
(1)請根據(jù)散點圖判斷,y^bx+a與中哪一個更適宜作為年銷售量y關(guān)于年份代碼x的回歸方程類
型;(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于尤的經(jīng)驗回歸方程,并預(yù)測2024年該新能源汽車的年銷
售量精確到0.1)
55
參考數(shù)據(jù):9=22.72,2(W,—iv)2=374,工(w,—w)(j,—y)=851.2(其中陰=婢).
i=li=l
解題技法
有些非線性回歸分析問題并不給出經(jīng)驗公式,這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學(xué)過的各種函
數(shù)(賽函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象進(jìn)行比較,挑選一種跟這些散點擬合得最好的函數(shù),用適當(dāng)?shù)淖?/p>
量進(jìn)行變換,如通過換元或取對數(shù)等方法,把問題化為線性回歸分析問題,使之得到解決.
q訓(xùn)練
1.已知變量X與》且觀測數(shù)據(jù)如下表(其中6.5>44>6>1,a+b=6),則由該觀測數(shù)據(jù)算得的經(jīng)驗回歸
方程可能是()
X12345
y6.5a4b1
A.y=0.4A-+2.3B.y=2x~2.4
C.y=-2x+9.5D.夕=-0.3尤+0.44
2.數(shù)獨是源自18世紀(jì)瑞士的一種數(shù)學(xué)游戲,玩家需要根據(jù)9義9盤面上的已知數(shù)字,推理出所有剩余空格的數(shù)
字,并滿足每一行、每一列、每一個粗線宮(3X3)內(nèi)的數(shù)字均含1?9,且不重復(fù).數(shù)獨愛好者小明打算報名
參加“絲路杯”全國數(shù)獨大賽初級組的比賽,賽前小明在某數(shù)獨APP上進(jìn)行一段時間的訓(xùn)練,每天的解題平
均速度y(秒)與訓(xùn)練天數(shù)無(天)有關(guān),經(jīng)統(tǒng)計得到如表的數(shù)據(jù):
X(天)1234567
y(秒)990990450320300240210
(1)現(xiàn)用y=a+2作為經(jīng)驗回歸模型,請利用表中數(shù)據(jù),求出該經(jīng)驗回歸方程;
(2)請用第(1)題的結(jié)論預(yù)測,小明經(jīng)過100天訓(xùn)練后,每天解題的平均速度約為多少秒?
77
笏考數(shù)據(jù)(其中ti=E):Z砂尸1845,£=0.37,2珞―7冒=0.55.
參考公式:對于一組數(shù)據(jù)(兩,VI),("2,V2),…,(說,%),其經(jīng)驗回歸直線。=2+6"的斜率和截距
n
XuiV[—nuv
的最小二乘估計公式分別為6=弓----一,a=v-pu.
Xuf—nu2
i=l
刻畫擬合效果
(師生共研過關(guān)
【例5】假定小麥基本苗數(shù)x與成熟期有效穗y之間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:
X15.025.830.036.644.4
y39.442.942.943.149.2
若由最小二乘法計算得經(jīng)驗回歸方程為y=0.29x+347
(1)計算各組殘差,并計算殘差平方和;
(2)求出,并說明回歸模型擬合效果的好壞.
5
參考數(shù)據(jù):20一歹)2=50.18.
i=l
解題技法
刻畫擬合效果的三種方法
(1)殘差圖法:殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適;
(2)殘差平方和法:殘差平方和£(%—%)之越小,模型的擬合效果越好;
i=l
n2
CI(月一9i)
(3)決定系數(shù)法:K=1一早-------越接近1,表明模型的擬合效果越好.
I(力一步)
i=l
E訓(xùn)練
1.在一元線性回歸模型¥=法+。+?中,下列說法正確的是()
A.Y=bx+a+e是一次函數(shù)
B.響應(yīng)變量y是由解釋變量尤唯一確定的
C.響應(yīng)變量y除了受解釋變量X的影響外,可能還受到其他因素的影響,這些因素會導(dǎo)致隨機誤差e的產(chǎn)生
D.隨機誤差e是由于計算不準(zhǔn)確造成的,可通過精確計算避免隨機誤差e的產(chǎn)生
2.現(xiàn)代物流成為繼勞動力、自然資源外影響企業(yè)生產(chǎn)成本及利潤的重要因素.某企業(yè)去年前八個月的物流成本和
企業(yè)利潤的數(shù)據(jù)(單位:萬元)如下表所示:
月份1234
物流成本尤83
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年山東省菏澤市單縣八校聯(lián)考中考語文一模試卷
- 2《祖父的園子》教學(xué)設(shè)計-2024-2025學(xué)年統(tǒng)編版語文五年級下冊
- 2024年八年級物理上冊 1.2 測量 實驗探究的重要環(huán)節(jié)教學(xué)實錄 (新版)教科版
- 農(nóng)村社會救助對象認(rèn)定與幫扶方案
- 2024-2025學(xué)年高中歷史 第1單元 古代中國的政治制度 第1課 夏、商、西周的政治制度教學(xué)實錄 新人教版必修1
- 8 科技發(fā)展 造福人類 第3課時 教學(xué)設(shè)計-2023-2024學(xué)年道德與法治六年級下冊統(tǒng)編版
- 2《丁香結(jié)》(教學(xué)設(shè)計)-2024-2025學(xué)年統(tǒng)編版語文六年級上冊
- 2024-2025學(xué)年新教材高中生物 第二章 組成細(xì)胞的分子 第2節(jié) 細(xì)胞中的無機物教學(xué)實錄 新人教版必修1
- 本科畢業(yè)論文完整范文(滿足查重要求)社會工作介入青少年犯罪的路徑探究
- 本科畢業(yè)論文完整范文(滿足查重要求)基層公務(wù)員績效考核改革的路徑探究
- 自考英語二詞匯表-4500個單詞(含音標(biāo))
- 《望海潮》 統(tǒng)編版高中語文選擇性必修下冊
- 《中國心力衰竭診斷和治療指南2024》解讀
- 四年級下冊數(shù)學(xué)簡便計算練習(xí)400題及答案
- 2016-2023年江西旅游商貿(mào)職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 協(xié)會換屆工作報告
- 《手術(shù)隔離技術(shù)》課件
- 《壓力性尿失禁》課件
- 拈花灣策劃方案
- 數(shù)據(jù)分析與應(yīng)用培訓(xùn)課件
- 機械制造基礎(chǔ)試題題庫及答案
評論
0/150
提交評論