版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
專題37成對數(shù)據(jù)的統(tǒng)計問題
【高考真題】
1.(2022.全國乙理)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總
材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:|蠟)和材積量(單位:m,得
到如下數(shù)據(jù):
樣本號i12345678910總和
根部橫截面積不0.040.060.040.080.080.050.050.070.070.060.6
材積量當(dāng)0.250.400.220.540.510.340.360.460.420.403.9
101010
并計算得工累=0038,Zy\=1-6158,Zx/=0.2474.
i=li=li=l
(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);
(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為
186m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材
積量的估計值.
附:相關(guān)系數(shù)1=,,頡,1.377.
、區(qū)(X「于之(y「寸
Vi=li=l
1.解析(1)樣本中10棵這種樹木的根部橫截面積的平均值彳=辭=0.06
樣本中10棵這種樹木的材積量的平均值尸=3轉(zhuǎn)9=0.39
據(jù)此可估計該林區(qū)這種樹木平均一棵的根部橫截面積為0.06m2,平均一棵的材積量為O.39m3
1010
⑵'g"用厝-。鏟?2")
0.2474-10x0.06x0.390.01340.01343
=―/=~/~-------~0.9/r??八Q7
7(0.038-10x0.062)(1.6158-10x0.392)V0.00018960.01377
(3)設(shè)該林區(qū)這種樹木的總材積量的估計值為yn?,
又已知樹木的材積量與其根部橫截面積近似成正比,可得黑=竿,解之得y=1209m3.
則該林區(qū)這種樹木的總材積量估計為1209m3.
2.(2022.新高考I)一醫(yī)療團隊為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好
和
不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機調(diào)查了100例(稱為病例組),同時在未患該疾病
的人群中隨機調(diào)查了100人(稱為對照組),得到如下數(shù)據(jù):
不夠良好良好
病例組4060
對照組1090
(1)能否有99%的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異?
(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習(xí)慣不夠良好”,B表示事件“選到的人患有該
?(B|A).P(B\A)
疾病-的比值是衛(wèi)生習(xí)慣不夠良好對患該疾病風(fēng)險程度的一項度量指標(biāo),記該指標(biāo)
?(B|A)P(B|A)
為R.
P(A\B)P(A\B)
(i)證明:K=---=--------------=-
P(A|B)P(A\B)
(ii)利用該調(diào)查數(shù)據(jù),給出P(AIB),P(A|豆)的估計值,并利用(i)的結(jié)果給出R的估計值.
n(ad-hc)2
附犬尸(心“)0.0500.0100.001
(a+b)(c4-d)(a+c)(b+d)'
2.解析(1)由已知k3.8416.63510.828
n(ad-bc)2_200(40x90-60x10)2
(〃+b)(c+d)(a+c)(b+d)50x150x100x100
又尸(片26.635)=0.01,24>6.635,
所以有99%的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異.
P(8|A)P(B\A)P(48)P(A)P(而)P(A)
(2)⑴因為R=
P(B\A)P(B\A)P(A)P(AB)P(A)P(AB)
P(AB)P(B)P(AB)P(B)所以R=.小40
所以R=(ii)由已知P(A|8)=而
P(B)P(AB)P(B)P(AB)P(A|B)P(A|B)
10-60--90
P(.A\B)=——,又尸(A|B)=——,P(A|B)=——,
100100100
P(A\B)P(^lg)_
所以R=6
P(A|8)P(A|B)~
【知識總結(jié)】
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)
系.
(2)相關(guān)關(guān)系的分類:正相關(guān)和負(fù)相關(guān).
(3)線性相關(guān)
一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附近,我們就稱這兩個變
量線性相關(guān).
一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相
關(guān).
2.樣本相關(guān)系數(shù)
(1)相關(guān)系數(shù)r的計算
變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:
n____
Z(X,—X)(y,—y)
i=l
二二二二
2
A/Z(XLX)X(y,—y)2
I=Iri
(2)相關(guān)系數(shù)r的性質(zhì)
①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)K0時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時,成對樣本數(shù)據(jù)間
沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)/?的取值范圍為[-1,1J.
當(dāng)K越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;
當(dāng)|r|越接近。時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
(1)經(jīng)驗回歸方程與最小二乘法
AAA
我們將稱為¥關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗
回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的2,1叫做6,。的最小二乘估計,
£(kx)Gi-y)ixiyi-nx~
=
A/=1l\A____A____
其中》==,a=y—bx
£(XT)2
i=li=\
(2)利用決定系數(shù)R?刻畫回歸效果
£(?-)j
/?2=1---------------,R2越大,即擬合效果越好,R2越小,模型擬合效果越差.
I(9-y)2
戶1
4.列聯(lián)表與獨立性檢驗
(1)2X2列聯(lián)表
一般地,假設(shè)有兩個分類變量X和匕它們的取值分別為{XI,洶}和{M,/},其2X2列聯(lián)表為
y
X合計
y=yiy=y2
X=X\aba+b
X=X2cdc+d
合計a+cb+dn=a+b+c+d
(2)臨界值
一=(°+份(;鬻%)(6+4忽略爐的實際分布與該近似分布的誤差后’對于任何小概率值a,可以
找到相應(yīng)的正實數(shù)X.,使得P仍落尸a成立.我們稱x.為a的臨界值,這個臨界值就可作為判斷x2大
小的標(biāo)準(zhǔn).
(3)獨立性檢驗
基于小概率值a的檢驗規(guī)則是:
當(dāng)X22/時,我們就推斷Ho不成立,即認(rèn)為X和Y不獨立,該推斷犯錯誤的概率不超過a;
當(dāng)/〈羽時,我們沒有充分證據(jù)推斷為不成立,可以認(rèn)為X和y獨立.
這種利用犬的取值推斷分類變量X和Y是否獨立的方法稱為爐獨立性檢驗,讀作“卡方獨立性檢驗”,
簡稱獨立性檢驗.
下表給出了/獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值
a0.10.050.010.0050.001
xa2.7063.8416.6357.87910.828
【題型突破】
考向一概率與回歸分析綜合問題
1.(2020?全國H)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)
某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20
個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(小y;)(i=l,2,…,20),其中x,,和y,?分別表示第i個樣區(qū)的植物覆蓋
202020_
面積(單位:公頃)和這種野生動物的數(shù)量,并計算得官=60,?產(chǎn)1200,Z(為一x)2=80,
1=1<=1i=i
20_20__
E(yi~y產(chǎn)=9000,z(Xi—X)(y,—y)=800.
I=Ii=i
(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平
均數(shù)乘以地塊數(shù));
(2)求樣本(知》)"=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);
(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大,為提高樣本的代表性以獲得該地區(qū)這種野生
動物數(shù)量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.
n____
E(Xi-X)(y,—y)
附:樣本相關(guān)系數(shù)r=-----/,也21.414.
A/X(?-x8-y)2
\1尸1<=1
-120
1.解析⑴由已知得樣本平均數(shù)為y==?產(chǎn)60,
%
從而該地區(qū)這種野生動物數(shù)量的估計值為60x200=12000.
20__
ZXLxy-y
⑵…"、.JLL2-一一一"_=瑞嬴/
”/£XLx2Xyi-y2
i=li=l
=0.94.
(3)分層隨機抽樣,根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層隨機抽樣.
理由如下:由(2)知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強的正相關(guān)關(guān)系.由于各地塊間植
物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異也很大,采用分層隨機抽樣的方法較好地
保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量
更準(zhǔn)確的估計.
2.如圖給出了根據(jù)我國2012年?2018年水果人均占有量y(單位:kg)和年份代碼x繪制的散點圖和經(jīng)驗
回歸方程的殘差圖(2012年?2018年的年份代碼x為1?7).
(8^-a我國2012年~2018年水果人均占有量散點圖
7u
elo-
6o-
il-我國2012年~2018年水果人均占有最殘差圖
^%lo
145o-
3o-
2o-車份
1234567年份代碼^0-2代碼x(l)根據(jù)散
77
點圖分析y與x之間的相關(guān)關(guān)系;(2)根據(jù)散點圖相應(yīng)數(shù)據(jù)計算得074,弘必=4517,求y關(guān)于
/=!;=1
x的經(jīng)驗回歸方程(精確到0.01);
(3)根據(jù)經(jīng)驗回歸方程的殘差圖,分析經(jīng)驗回歸方程的擬合效果.
n____
Ex)(y,—y)
附:經(jīng)驗回歸直線:=展+晨中斜率和截距的最小二乘估計公式分別為;=2---------------二=3-
Z(即一X)2
/=!
A__
hx.
2.解析(1)根據(jù)散點圖可知y與x呈正線性相關(guān).
(2)由所給數(shù)據(jù)計算得x=1x(l+2+…+7)=4,
7__7_____
Z(Xi-X)(>',—y)Hxtyi-nXy
"尸?Z=1221A—A—1074
b=---------------------------=---------------------=TTT^7.893,a—y~bx~~~z——7.893><4~121.86.
7—,7,287
Z(x,—x)2?x2
<=ii=i
故所求經(jīng)驗回歸方程為j=7.89x+121.86.
(3)由題中給出的殘差圖知歷年數(shù)據(jù)的殘差均在一2到2之間,說明經(jīng)驗回歸方程的擬合效果較好.
3.小區(qū)門口有一個熟食攤位,經(jīng)過一段時間的統(tǒng)計,發(fā)現(xiàn)菜品種類和日銷售收入之間有一定關(guān)系,具體
統(tǒng)計數(shù)據(jù)如下表:
菜品種類145678910
日銷售收入了147159171184197210221
(1)建立y關(guān)于i的線性回歸方程;(y保留整數(shù))
(2)根據(jù)所求線性回歸方程,預(yù)測如果希望日銷售收入超過300元,則菜品種類至少多少種?
X(。-t)8-y)
A尸1A—A—
附:線性回歸直線的斜率和截距的最小二乘估計公式分別為b=----------------,a=y—bt,
ZU—t)2
/=i
7__7_
參考數(shù)據(jù):z(ti—t)8—y)=350,Z(6—t)2=28.
i=li=l
..[目工土/口—4+5+6+7+8+9+10—147+159+171+184+197+210+221
3.解析(1)由磔意付=7,二184,
t—yy—7
E(ti-t)(v,—y)
A尸IA_A_
b=----------------=12.5,a=y—bt=184-12.5x7=96.5,
£(A-ty
尸1
所以線性回歸方程為f=12.5/+96.5.(2)由£=12.5f+96.5>300,解得/>16.28,所以菜品種類至少17種.
4.配速是馬拉松運動中常使用的一個概念,是速度的一種,是指每千米所需要的
時間,相比配速,把心率控制在一個合理水平是安全理性跑馬拉松的一個重要策略.圖①是一個馬拉
松跑者的心率y(單位:次/分鐘)和配速N單位:分鐘/千米)的散點圖,圖②是一次馬拉松比賽(全程約42
千米)前3000名跑者成績(單位:分鐘)的頻率分布直方圖.
(1)由散點圖看出,可用線性回歸模型擬合
y與x的關(guān)系,求y與x的線性回歸方程;
(2)該跑者如果參加本次比賽,將心率控制在160左右跑完全程,估計他跑完全程花費的時間,并估計
他能獲得的名次.
AAA"Zxiyi-nx-yI:(x,-x)(j,—y)
參考公式:用最小二乘法求線性回歸方程),=以+”的系數(shù):---------------------二----
£甫一〃X2£(為-x產(chǎn)
A——A——
a=y—bx.
參考數(shù)據(jù):y=135.
—45+5+6+7+75—
4.解析(1)由散點圖中數(shù)據(jù)和參考數(shù)據(jù)得x------=6,y=135,
5__
E(Xi-x)(y,—y)
A_________________一1.5x36+(-l)x30+0x(-5)+lx(-26)+1.5x(-35)
b=jZ=(-1.5)2+(-l)2+02+l2+1.52
E(XLX)2
a=y-^7=135-(-25)x6=285,
所以y與x的線性回歸方程為£=-25x4-285.
(2)將y=160代入回歸方程得x=5,所以該跑者跑完馬拉松全程所花的時間為42x5=210(分鐘).從馬拉
松比賽前3000名跑者成績的頻率分布直方圖可知成績好于210分鐘的累計頻率為0.0008x50
4-0.0024x(210-200)=0.064,有6.4%的跑者成績超過該跑者,
則該跑者在本次比賽獲得的名次大約是0.064x3000=192.
5.某機構(gòu)為研究某種圖書每冊的成本費M單位:元)與印刷數(shù)量M單位:千冊)的關(guān)系,收集了一些數(shù)據(jù)
并進(jìn)行了初步處理,得到了下面的散點圖及一些統(tǒng)計量的值.
20
15
10
O51()152()253(135404550
印刷數(shù)量X/千冊
8-8-
Z(XLX)y(出一
8―8-u)
£(Xi—X)21=1X(%—w)2產(chǎn)i
X)'U
i=\/=!
?(y)-y)?⑴-y)
15.253.630.2692085.5一230.30.7877.049
1—18
表中Ui——,U
XiV1
(1)根據(jù)散點圖判斷y=a+bx與),=c+j哪一個模型更適合作為該圖書每冊的成本費y(單位:元)與印
刷數(shù)量M單位:千冊)的經(jīng)驗回歸方程?(只要求給出判斷,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立),關(guān)于x的經(jīng)驗回歸方程(回歸系數(shù)的結(jié)果精確到0.01).
(3)若該圖書每冊的定價為10元,則至少應(yīng)該印刷多少冊才能使銷售利潤不低于78840元?(假設(shè)能夠
全部售出.結(jié)果精確到1)
附:對于一組數(shù)據(jù)(<01,D|),(<02,。2),…,(必,,"),其經(jīng)驗回歸直線t>=a+£<y的斜率和截距的最小
Z(co,—COV)
Al_\A____A______
二乘估計分別為/?=------------------,a=v一夕a>.
y.(@-co)2
產(chǎn)?
5.解析(1)由散點圖判斷,y=c+:更適合作為該圖書每冊的成本費y(單位:元)與刷數(shù)量x(單位:千
冊)的經(jīng)驗回歸方程.
⑵令”,先建立y關(guān)于〃的經(jīng)臉回歸方程,
X
8__
Z(Ui-u)8—y)
人尸]7()49a一A一
由于d=----------------=:擊心8.96,所以c=y-du=3.63—8.96X0.26921.22,所以y關(guān)于“
8___v./o/
E(小一w)2
(=i
A
的經(jīng)驗回歸方程為y=1.22+8.96“,
Aoqs
所以y關(guān)于x的非線性經(jīng)驗回歸方程為)=1.22+第.
⑶假設(shè)印刷x千冊,依題意得10x—(1.22+手%》78.840,所以應(yīng)10,所以至少印刷10000冊才能使
銷售利潤不低于78840元.
6.艾滋病是一種危害性極大的傳染病,由感染艾滋病病毒(HIV病毒)引起,它把人體免疫系統(tǒng)中最重要
的CD4-T淋巴細(xì)胞作為主要攻擊目標(biāo),使人體喪失免疫功能.下表是近八年來我國艾滋病病毒累計
(1)請根據(jù)該統(tǒng)計表,畫出這八年我國艾滋病病毒累計感染人數(shù)的折線圖;
(2)請用相關(guān)系數(shù)說明:能用線性回歸模型擬合y與x的關(guān)系;
(3)建立y關(guān)于x的回歸方程(系數(shù)精確到0.01),預(yù)測2024年我國艾滋病病毒累計感染人數(shù).
,-88/-8—.—fl—
2
參考數(shù)據(jù):45^6.48;區(qū)v=449.6,£孫=2319.5,\l(x,-x)=y/42f弋百⑴-y產(chǎn)=46.2,
n__n__
T.(Xi-x)(y,—j)AAAA石(XLX)8-y)A
參考公式:相關(guān)系數(shù)r=/“,回歸方程:y=%x+a中,h=——--------二----,a
(kx產(chǎn)£](yt-y)2,5,(XLx)2
——A—
=y—bx.
6.解析(I)所求折線圖如圖所示:
9
--8--8
56工XV
-y-XyI=
/A
2,2,te
8__
X(為一x)(y,—y)
說明y與x的線性相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合y與x的關(guān)系.
8__
zN(kx)(y,-y)2963A_A_
⑶---------------------=-^-^1.05,。=),~bx=56.2-7.05x4.5-24.48,
(?-x)2
AA
.??y=7.05x+24.48.當(dāng)x=ll時,y=7.05xl1+24.48=102.03.
預(yù)測2024年我國艾滋病累計感染人數(shù)為102.03萬人.
7.近年來,高鐵的發(fā)展逐漸改變了人們的出行方式,我國2016?2020年高鐵運營里程的數(shù)據(jù)如下表所
示.
年份20162017201820192020
年份代碼X12345
高鐵運營里程M萬千米)1.92.22.52.93.5
(1)若X與y具有線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程;
(2)每一年與前一年的高鐵運營里程之差即為該年新增的里程,根據(jù)這五年的數(shù)據(jù),若用2017?2020年
每年新增里程的頻率代替之后每年新增相應(yīng)里程的概率,求2024年中國高鐵運營里程大于或等于5萬
千米的概率.
n__
AAA-Y..xtyi-nxy
附:線性回歸方程中斜率和截距的最小二乘估計公式分別為:力=々-----
Ex?-nx2
Z=1
A—A一
a=y-bx.
7.解析(1)JC=|X(|+2+3+4+5)=3,y=1x(l.9+2.2+2.5+2.9+3.5)=2.6.
55
X孫?=1x1.9+2x2.2+3x2.5+4x2.9+5x3.5=42.9,萬=1+4+9+16+25=55,
「石孫―5xy42.9-5x3x2.6A
所以b=1------=刀—=0.39,4=2.6-0.39x3=1.43,
W755—5x3/
所以y關(guān)于x的線性回歸方程為;=0.39x+1.43.
相應(yīng)概率為自4+?(界4+3(凱凱=a,
所以2024年中國高鐵運營里程大于或等于5萬千米的概率為1—七=||.
8.每年春天,婺源的油菜花海吸引數(shù)十萬游客紛至沓來,油菜花成為“中國最美鄉(xiāng)村”的特色景觀,三
月,婺源篁嶺油菜花海進(jìn)入最佳觀賞期.現(xiàn)統(tǒng)計了近七年每年(2015年用x=l表示,2016年用x=2表
示)來篁嶺旅游的人次y(單位:萬人次)相關(guān)數(shù)據(jù),如下表所示:
Xi234567
y29333644485259
AAA
(1)若y關(guān)于x具有較強的線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程y=fcc+“,并預(yù)測2022年來篁嶺
旅游的人次;
(2)為維持旅游秩序,今需4,B,C,。四位公務(wù)員去各景區(qū)值班,已知A,B,C去篁嶺值班的概率均
為。去篁嶺值班的概率為小且每位公務(wù)員是否去篁嶺值班不受影響,用X表示此4人中去篁嶺值
班的人數(shù),求X的分布列與均值.
Z(X,-X)8—y)
八尸]A-----A-----
參考公式:b=-----------------,a=y-Z?x.
Z(XLx)2
i=\
77_—
參考數(shù)據(jù):Z>/=301,Z8-x)8—y)=140.
i=li=\
8.解析(1)由表知T=;X(1+2+3+4+5+6+7)=4,~=|x(29+33+36+44+48+52+59)=43,
7__
Z(Xi—x)8-y)
A產(chǎn)[140A—A——
則6=-----------------=9+4+1+0+1+4+9=5,a=y-"43—5x4=23,
7_
E(樂一X)2
所以f=5x+23,
A
因為2015年用x=l表示,所以2022年時x=8,得y=5x8+23=63(萬人次).
(2)X的可能取值是0,1,2,3,4,
尸(X=l)=c4x(l—§2號號+c5x(l—|)3x|=11,
P(X=2)=CML|X§2X,+CM1一|卜基=得=募
P(X=3)=CM|>號+0x(1_|乂|居=||,
P(X=4)=C§,x(<j2y\x§1=酉8.
則X的分布列為
X01234
21310288
P8787278?81
4c2,13,10,28,87
故E(X)=0x^-j-+lx^j-+2x—+3x—+4x—=-.
9.研究機構(gòu)對某校學(xué)生往返校時間的統(tǒng)計資料表明:該校學(xué)生居住地到學(xué)校的距離x(單位:千米)和學(xué)生
花費在上學(xué)路上的時間y(單位:分鐘)有如下的統(tǒng)計數(shù)據(jù):
到學(xué)校的距離x(千米)1.82.63.14.35.56.1
花費的時間M分鐘)17.819.627.531.336.043.2
由統(tǒng)計資料表明y與x具有線性相關(guān)關(guān)系.
(1)判斷y與x的相關(guān)程度;(相關(guān)系數(shù)r的絕對值大于0.75時,認(rèn)為兩個變量相關(guān)程度很強,精確到0.01)
AAA
⑵求線性回歸方程y=〃x+a(精確至IJ0.01);
AAA
(3)將),<27的時間數(shù)據(jù)v稱為美麗數(shù)據(jù),現(xiàn)從這6個時間數(shù)據(jù)M中任取2個,求抽取的2個數(shù)據(jù)全部為
美麗數(shù)據(jù)的概率.
n__n__
AAA“Lxiyt-nx-yE(為-x)(y<—y)
參考公式:用最小二乘法求線性回歸方程y=6x+a的系數(shù):b=一,---------------------二----
£甫一〃X2,£(XL%)2
A—A一
a=y-bx?
6-6-
Z(XLx)2=i4.3o,zu,—y)2
尸1i=l
9.
____166____6__
⑵由題意得x=3.9,y=7Xy^29.23,Z(x—x)(y,—y)=8030,Z(x—x)2=14.30,
I=I尸i尸i
6____
X(XLX)8-y)
“尸?8030A—A—
所以6=----------------=77^7=5.62,a=y~hx~29.23-5.62x3.9~7.31,
6__14.JU
E(.Xi—X)2
i=l
所以線性回歸方程為f=5.62x+7.31.
(3)由(2)可知,當(dāng)x=3.1時,)=24.732<27,當(dāng)x=4.3時,立=31.476>27,
所以滿足;<27的美麗數(shù)據(jù)共有3個.從這6個數(shù)據(jù)中任取2個共有CW=15(種)情況,其中,抽取的2
個數(shù)據(jù)全部為美麗數(shù)據(jù)的有0=3(種)情況,
所以從這6個數(shù)據(jù)£中任取2個,抽取的2個數(shù)據(jù)全部為美麗數(shù)據(jù)的概率為*
10.隨著中美貿(mào)易戰(zhàn)的不斷升級,越來越多的國家科技巨頭加大了科技研發(fā)投入的力度.中華技術(shù)有限公
司擬對“麒麟”手機芯片進(jìn)行科技升級,根據(jù)市場調(diào)研與模擬,得到科技升級投入M億元)與科技升級
直接收益),(億元)的數(shù)據(jù)統(tǒng)計如下:
序號123456789101112
X2346810132122232425
y1322314250565868.56867.56666
A八L
當(dāng)0<xW17時,建立了y與x的兩個回歸模型:模型①:y=4.1x+11.8;模型②:>-=21.3^—14.4;
AA
當(dāng)x>17時,確定y與x滿足的線性回歸方程為y=-0.7x+a.
⑴根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)04W17時模型①、②的相關(guān)指數(shù)R2的大小,并選擇擬合精度更
高、更可靠的模型,預(yù)測對“麒麟”手機芯片科技升級的投入為17億元時的直接收益
回歸模型模型①模型②
回歸方程y=4.1x+11.8>=21.3寸一14.4
7A
篙(yr)2182.479.2
nA
高(yi-y:)2
(附:刻畫回歸效果的相關(guān)指數(shù)------,4萬比4.1)
,5,8-y)2
(2)為鼓勵科技創(chuàng)新,當(dāng)科技升級的投入不少于20億元時,國家給予公司補貼5億元,以回歸方程為
預(yù)測依據(jù),比較科技升級投入17億元與20億元時公司實際收益的大??;
n__n__
AAA入Lxiyi-nx-ygx)&「y)
(附:用最小二乘法求線性回歸方程的系數(shù):6=號---------------------二——,
^xr-nx2玄(X)-x>
A—A—
a=y-bx)
(3)科技升級后,“麒麟”芯片的效率X大幅提高,經(jīng)實際試驗得X大致服從正態(tài)分布N(0.52,0.012).公
司對科技升級團隊的獎勵方案如下:若芯片的效率不超過50%,不予獎勵;若芯片的效率超過50%但
不超過53%,每部芯片獎勵2元;若芯片的效率超過53%,每部芯片獎勵4元,記丫為每部芯片獲得
的獎勵,求E(V)(精確到0.01).
(附:若隨機變量X~NQ,,/)(。>0),則尸3一<T<XW〃+。)=0.6827,Pa-2b<XW〃+2。)=0.9545)
10.解析⑴由表格中的數(shù)據(jù),182.4>79.2,
.182.4_______79.2,182.4,79.2
?_>_7_=1_~_<1_~_*
工(y1-VAXy)2工(yt-y)2工(y,—y)2
模型①的相關(guān)指數(shù)心小于模型②的相關(guān)指數(shù)咫,
回歸模型②的擬合效果更好,
...當(dāng)x=17億時,科技升級直接收益的預(yù)測值為£=21.3?萬一14.4=72.93(億元).
,,匚一4三河一21+22+23+24+25-68.5+68+67.5+66+66
⑵當(dāng)x>17時,由已知可得x=---------;---------=23,y=-----------;----------=67.2,
55
A——
:.a=y+0.7x=67.2+0.7x23=83.3,
...當(dāng)x>17時,y與x滿足的線性回歸方程為f=-0.7x+83.3,
當(dāng)x=20億元,科技升級直接收益的預(yù)測值為£=-0.7x20+83.3=69.3(億元),
當(dāng)x=20億元時,實際收益的預(yù)測值為69.3+5=74.3億元>72.93億元.
技術(shù)升級投入20億元時,公司的實際收益更大.
(3)—2a—0.50,/z+cr—0.53,
???P(0.50vXW0.53)=Pa—2KX%+O)=P(/L2KX&LO)+P(/LKX3,+。)
0.9545-0.6827
240.6827=0.8186.
11-0.6827
P(X>0.53)=P(X邛+o)=-------------
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年環(huán)保廢棄物處理服務(wù)合同
- 2025年度航空航天研發(fā)設(shè)備采購合同解除書3篇
- 2025年度空運貨物出口運輸與國際航空運輸協(xié)會會員服務(wù)協(xié)議3篇
- 2024貿(mào)促會指定下載專區(qū)計算機硬件買賣合同3篇
- 一宅一物金銀銅專屬定制配送合同版
- 2024智能無人機研發(fā)與銷售服務(wù)合同
- 2024無房產(chǎn)離婚協(xié)議書制作指南與注意事項3篇
- 2025年度鏟車租賃與設(shè)備租賃組合服務(wù)合同2篇
- 手衛(wèi)生相關(guān)知識培訓(xùn)課件
- 2024微信小程序用戶體驗設(shè)計服務(wù)合同3篇
- 《士兵突擊》PPT課件(PPT 43頁)
- AHP層次分析法-EXCEL表格自動計算
- 團代會工作流程圖
- 身心康中醫(yī)經(jīng)絡(luò)檢測儀—報告解讀
- 電力工程承裝(修、試)資質(zhì)管理辦法
- 急診科烏頭堿中毒課件
- 混凝土攪拌站污水處理方案精編版
- 2013天津中考滿分作文
- 醫(yī)院安保人員錄用上崗管理辦法
- 公共政策分析簡答題
- 加熱爐溫度控制系統(tǒng)_畢業(yè)論文
評論
0/150
提交評論