突破2023年高考數(shù)學(xué)題型之2022年數(shù)學(xué)高考真題(全國通用)專題37 成對數(shù)據(jù)的統(tǒng)計問題(解析版)_第1頁
突破2023年高考數(shù)學(xué)題型之2022年數(shù)學(xué)高考真題(全國通用)專題37 成對數(shù)據(jù)的統(tǒng)計問題(解析版)_第2頁
突破2023年高考數(shù)學(xué)題型之2022年數(shù)學(xué)高考真題(全國通用)專題37 成對數(shù)據(jù)的統(tǒng)計問題(解析版)_第3頁
突破2023年高考數(shù)學(xué)題型之2022年數(shù)學(xué)高考真題(全國通用)專題37 成對數(shù)據(jù)的統(tǒng)計問題(解析版)_第4頁
突破2023年高考數(shù)學(xué)題型之2022年數(shù)學(xué)高考真題(全國通用)專題37 成對數(shù)據(jù)的統(tǒng)計問題(解析版)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

專題37成對數(shù)據(jù)的統(tǒng)計問題

【高考真題】

1.(2022.全國乙理)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總

材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:|蠟)和材積量(單位:m,得

到如下數(shù)據(jù):

樣本號i12345678910總和

根部橫截面積不0.040.060.040.080.080.050.050.070.070.060.6

材積量當(dāng)0.250.400.220.540.510.340.360.460.420.403.9

101010

并計算得工累=0038,Zy\=1-6158,Zx/=0.2474.

i=li=li=l

(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;

(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);

(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為

186m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材

積量的估計值.

附:相關(guān)系數(shù)1=,,頡,1.377.

、區(qū)(X「于之(y「寸

Vi=li=l

1.解析(1)樣本中10棵這種樹木的根部橫截面積的平均值彳=辭=0.06

樣本中10棵這種樹木的材積量的平均值尸=3轉(zhuǎn)9=0.39

據(jù)此可估計該林區(qū)這種樹木平均一棵的根部橫截面積為0.06m2,平均一棵的材積量為O.39m3

1010

⑵'g"用厝-。鏟?2")

0.2474-10x0.06x0.390.01340.01343

=―/=~/~-------~0.9/r??八Q7

7(0.038-10x0.062)(1.6158-10x0.392)V0.00018960.01377

(3)設(shè)該林區(qū)這種樹木的總材積量的估計值為yn?,

又已知樹木的材積量與其根部橫截面積近似成正比,可得黑=竿,解之得y=1209m3.

則該林區(qū)這種樹木的總材積量估計為1209m3.

2.(2022.新高考I)一醫(yī)療團隊為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好

不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機調(diào)查了100例(稱為病例組),同時在未患該疾病

的人群中隨機調(diào)查了100人(稱為對照組),得到如下數(shù)據(jù):

不夠良好良好

病例組4060

對照組1090

(1)能否有99%的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異?

(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習(xí)慣不夠良好”,B表示事件“選到的人患有該

?(B|A).P(B\A)

疾病-的比值是衛(wèi)生習(xí)慣不夠良好對患該疾病風(fēng)險程度的一項度量指標(biāo),記該指標(biāo)

?(B|A)P(B|A)

為R.

P(A\B)P(A\B)

(i)證明:K=---=--------------=-

P(A|B)P(A\B)

(ii)利用該調(diào)查數(shù)據(jù),給出P(AIB),P(A|豆)的估計值,并利用(i)的結(jié)果給出R的估計值.

n(ad-hc)2

附犬尸(心“)0.0500.0100.001

(a+b)(c4-d)(a+c)(b+d)'

2.解析(1)由已知k3.8416.63510.828

n(ad-bc)2_200(40x90-60x10)2

(〃+b)(c+d)(a+c)(b+d)50x150x100x100

又尸(片26.635)=0.01,24>6.635,

所以有99%的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異.

P(8|A)P(B\A)P(48)P(A)P(而)P(A)

(2)⑴因為R=

P(B\A)P(B\A)P(A)P(AB)P(A)P(AB)

P(AB)P(B)P(AB)P(B)所以R=.小40

所以R=(ii)由已知P(A|8)=而

P(B)P(AB)P(B)P(AB)P(A|B)P(A|B)

10-60--90

P(.A\B)=——,又尸(A|B)=——,P(A|B)=——,

100100100

P(A\B)P(^lg)_

所以R=6

P(A|8)P(A|B)~

【知識總結(jié)】

1.變量的相關(guān)關(guān)系

(1)相關(guān)關(guān)系

兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)

系.

(2)相關(guān)關(guān)系的分類:正相關(guān)和負(fù)相關(guān).

(3)線性相關(guān)

一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附近,我們就稱這兩個變

量線性相關(guān).

一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相

關(guān).

2.樣本相關(guān)系數(shù)

(1)相關(guān)系數(shù)r的計算

變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:

n____

Z(X,—X)(y,—y)

i=l

二二二二

2

A/Z(XLX)X(y,—y)2

I=Iri

(2)相關(guān)系數(shù)r的性質(zhì)

①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)K0時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時,成對樣本數(shù)據(jù)間

沒有線性相關(guān)關(guān)系.

②樣本相關(guān)系數(shù)/?的取值范圍為[-1,1J.

當(dāng)K越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;

當(dāng)|r|越接近。時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.

3.一元線性回歸模型

(1)經(jīng)驗回歸方程與最小二乘法

AAA

我們將稱為¥關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗

回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的2,1叫做6,。的最小二乘估計,

£(kx)Gi-y)ixiyi-nx~

=

A/=1l\A____A____

其中》==,a=y—bx

£(XT)2

i=li=\

(2)利用決定系數(shù)R?刻畫回歸效果

£(?-)j

/?2=1---------------,R2越大,即擬合效果越好,R2越小,模型擬合效果越差.

I(9-y)2

戶1

4.列聯(lián)表與獨立性檢驗

(1)2X2列聯(lián)表

一般地,假設(shè)有兩個分類變量X和匕它們的取值分別為{XI,洶}和{M,/},其2X2列聯(lián)表為

y

X合計

y=yiy=y2

X=X\aba+b

X=X2cdc+d

合計a+cb+dn=a+b+c+d

(2)臨界值

一=(°+份(;鬻%)(6+4忽略爐的實際分布與該近似分布的誤差后’對于任何小概率值a,可以

找到相應(yīng)的正實數(shù)X.,使得P仍落尸a成立.我們稱x.為a的臨界值,這個臨界值就可作為判斷x2大

小的標(biāo)準(zhǔn).

(3)獨立性檢驗

基于小概率值a的檢驗規(guī)則是:

當(dāng)X22/時,我們就推斷Ho不成立,即認(rèn)為X和Y不獨立,該推斷犯錯誤的概率不超過a;

當(dāng)/〈羽時,我們沒有充分證據(jù)推斷為不成立,可以認(rèn)為X和y獨立.

這種利用犬的取值推斷分類變量X和Y是否獨立的方法稱為爐獨立性檢驗,讀作“卡方獨立性檢驗”,

簡稱獨立性檢驗.

下表給出了/獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值

a0.10.050.010.0050.001

xa2.7063.8416.6357.87910.828

【題型突破】

考向一概率與回歸分析綜合問題

1.(2020?全國H)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)

某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20

個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(小y;)(i=l,2,…,20),其中x,,和y,?分別表示第i個樣區(qū)的植物覆蓋

202020_

面積(單位:公頃)和這種野生動物的數(shù)量,并計算得官=60,?產(chǎn)1200,Z(為一x)2=80,

1=1<=1i=i

20_20__

E(yi~y產(chǎn)=9000,z(Xi—X)(y,—y)=800.

I=Ii=i

(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平

均數(shù)乘以地塊數(shù));

(2)求樣本(知》)"=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);

(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大,為提高樣本的代表性以獲得該地區(qū)這種野生

動物數(shù)量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.

n____

E(Xi-X)(y,—y)

附:樣本相關(guān)系數(shù)r=-----/,也21.414.

A/X(?-x8-y)2

\1尸1<=1

-120

1.解析⑴由已知得樣本平均數(shù)為y==?產(chǎn)60,

%

從而該地區(qū)這種野生動物數(shù)量的估計值為60x200=12000.

20__

ZXLxy-y

⑵…"、.JLL2-一一一"_=瑞嬴/

”/£XLx2Xyi-y2

i=li=l

=0.94.

(3)分層隨機抽樣,根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層隨機抽樣.

理由如下:由(2)知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強的正相關(guān)關(guān)系.由于各地塊間植

物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異也很大,采用分層隨機抽樣的方法較好地

保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量

更準(zhǔn)確的估計.

2.如圖給出了根據(jù)我國2012年?2018年水果人均占有量y(單位:kg)和年份代碼x繪制的散點圖和經(jīng)驗

回歸方程的殘差圖(2012年?2018年的年份代碼x為1?7).

(8^-a我國2012年~2018年水果人均占有量散點圖

7u

elo-

6o-

il-我國2012年~2018年水果人均占有最殘差圖

^%lo

145o-

3o-

2o-車份

1234567年份代碼^0-2代碼x(l)根據(jù)散

77

點圖分析y與x之間的相關(guān)關(guān)系;(2)根據(jù)散點圖相應(yīng)數(shù)據(jù)計算得074,弘必=4517,求y關(guān)于

/=!;=1

x的經(jīng)驗回歸方程(精確到0.01);

(3)根據(jù)經(jīng)驗回歸方程的殘差圖,分析經(jīng)驗回歸方程的擬合效果.

n____

Ex)(y,—y)

附:經(jīng)驗回歸直線:=展+晨中斜率和截距的最小二乘估計公式分別為;=2---------------二=3-

Z(即一X)2

/=!

A__

hx.

2.解析(1)根據(jù)散點圖可知y與x呈正線性相關(guān).

(2)由所給數(shù)據(jù)計算得x=1x(l+2+…+7)=4,

7__7_____

Z(Xi-X)(>',—y)Hxtyi-nXy

"尸?Z=1221A—A—1074

b=---------------------------=---------------------=TTT^7.893,a—y~bx~~~z——7.893><4~121.86.

7—,7,287

Z(x,—x)2?x2

<=ii=i

故所求經(jīng)驗回歸方程為j=7.89x+121.86.

(3)由題中給出的殘差圖知歷年數(shù)據(jù)的殘差均在一2到2之間,說明經(jīng)驗回歸方程的擬合效果較好.

3.小區(qū)門口有一個熟食攤位,經(jīng)過一段時間的統(tǒng)計,發(fā)現(xiàn)菜品種類和日銷售收入之間有一定關(guān)系,具體

統(tǒng)計數(shù)據(jù)如下表:

菜品種類145678910

日銷售收入了147159171184197210221

(1)建立y關(guān)于i的線性回歸方程;(y保留整數(shù))

(2)根據(jù)所求線性回歸方程,預(yù)測如果希望日銷售收入超過300元,則菜品種類至少多少種?

X(。-t)8-y)

A尸1A—A—

附:線性回歸直線的斜率和截距的最小二乘估計公式分別為b=----------------,a=y—bt,

ZU—t)2

/=i

7__7_

參考數(shù)據(jù):z(ti—t)8—y)=350,Z(6—t)2=28.

i=li=l

..[目工土/口—4+5+6+7+8+9+10—147+159+171+184+197+210+221

3.解析(1)由磔意付=7,二184,

t—yy—7

E(ti-t)(v,—y)

A尸IA_A_

b=----------------=12.5,a=y—bt=184-12.5x7=96.5,

£(A-ty

尸1

所以線性回歸方程為f=12.5/+96.5.(2)由£=12.5f+96.5>300,解得/>16.28,所以菜品種類至少17種.

4.配速是馬拉松運動中常使用的一個概念,是速度的一種,是指每千米所需要的

時間,相比配速,把心率控制在一個合理水平是安全理性跑馬拉松的一個重要策略.圖①是一個馬拉

松跑者的心率y(單位:次/分鐘)和配速N單位:分鐘/千米)的散點圖,圖②是一次馬拉松比賽(全程約42

千米)前3000名跑者成績(單位:分鐘)的頻率分布直方圖.

(1)由散點圖看出,可用線性回歸模型擬合

y與x的關(guān)系,求y與x的線性回歸方程;

(2)該跑者如果參加本次比賽,將心率控制在160左右跑完全程,估計他跑完全程花費的時間,并估計

他能獲得的名次.

AAA"Zxiyi-nx-yI:(x,-x)(j,—y)

參考公式:用最小二乘法求線性回歸方程),=以+”的系數(shù):---------------------二----

£甫一〃X2£(為-x產(chǎn)

A——A——

a=y—bx.

參考數(shù)據(jù):y=135.

—45+5+6+7+75—

4.解析(1)由散點圖中數(shù)據(jù)和參考數(shù)據(jù)得x------=6,y=135,

5__

E(Xi-x)(y,—y)

A_________________一1.5x36+(-l)x30+0x(-5)+lx(-26)+1.5x(-35)

b=jZ=(-1.5)2+(-l)2+02+l2+1.52

E(XLX)2

a=y-^7=135-(-25)x6=285,

所以y與x的線性回歸方程為£=-25x4-285.

(2)將y=160代入回歸方程得x=5,所以該跑者跑完馬拉松全程所花的時間為42x5=210(分鐘).從馬拉

松比賽前3000名跑者成績的頻率分布直方圖可知成績好于210分鐘的累計頻率為0.0008x50

4-0.0024x(210-200)=0.064,有6.4%的跑者成績超過該跑者,

則該跑者在本次比賽獲得的名次大約是0.064x3000=192.

5.某機構(gòu)為研究某種圖書每冊的成本費M單位:元)與印刷數(shù)量M單位:千冊)的關(guān)系,收集了一些數(shù)據(jù)

并進(jìn)行了初步處理,得到了下面的散點圖及一些統(tǒng)計量的值.

20

15

10

O51()152()253(135404550

印刷數(shù)量X/千冊

8-8-

Z(XLX)y(出一

8―8-u)

£(Xi—X)21=1X(%—w)2產(chǎn)i

X)'U

i=\/=!

?(y)-y)?⑴-y)

15.253.630.2692085.5一230.30.7877.049

1—18

表中Ui——,U

XiV1

(1)根據(jù)散點圖判斷y=a+bx與),=c+j哪一個模型更適合作為該圖書每冊的成本費y(單位:元)與印

刷數(shù)量M單位:千冊)的經(jīng)驗回歸方程?(只要求給出判斷,不必說明理由)

(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立),關(guān)于x的經(jīng)驗回歸方程(回歸系數(shù)的結(jié)果精確到0.01).

(3)若該圖書每冊的定價為10元,則至少應(yīng)該印刷多少冊才能使銷售利潤不低于78840元?(假設(shè)能夠

全部售出.結(jié)果精確到1)

附:對于一組數(shù)據(jù)(<01,D|),(<02,。2),…,(必,,"),其經(jīng)驗回歸直線t>=a+£<y的斜率和截距的最小

Z(co,—COV)

Al_\A____A______

二乘估計分別為/?=------------------,a=v一夕a>.

y.(@-co)2

產(chǎn)?

5.解析(1)由散點圖判斷,y=c+:更適合作為該圖書每冊的成本費y(單位:元)與刷數(shù)量x(單位:千

冊)的經(jīng)驗回歸方程.

⑵令”,先建立y關(guān)于〃的經(jīng)臉回歸方程,

X

8__

Z(Ui-u)8—y)

人尸]7()49a一A一

由于d=----------------=:擊心8.96,所以c=y-du=3.63—8.96X0.26921.22,所以y關(guān)于“

8___v./o/

E(小一w)2

(=i

A

的經(jīng)驗回歸方程為y=1.22+8.96“,

Aoqs

所以y關(guān)于x的非線性經(jīng)驗回歸方程為)=1.22+第.

⑶假設(shè)印刷x千冊,依題意得10x—(1.22+手%》78.840,所以應(yīng)10,所以至少印刷10000冊才能使

銷售利潤不低于78840元.

6.艾滋病是一種危害性極大的傳染病,由感染艾滋病病毒(HIV病毒)引起,它把人體免疫系統(tǒng)中最重要

的CD4-T淋巴細(xì)胞作為主要攻擊目標(biāo),使人體喪失免疫功能.下表是近八年來我國艾滋病病毒累計

(1)請根據(jù)該統(tǒng)計表,畫出這八年我國艾滋病病毒累計感染人數(shù)的折線圖;

(2)請用相關(guān)系數(shù)說明:能用線性回歸模型擬合y與x的關(guān)系;

(3)建立y關(guān)于x的回歸方程(系數(shù)精確到0.01),預(yù)測2024年我國艾滋病病毒累計感染人數(shù).

,-88/-8—.—fl—

2

參考數(shù)據(jù):45^6.48;區(qū)v=449.6,£孫=2319.5,\l(x,-x)=y/42f弋百⑴-y產(chǎn)=46.2,

n__n__

T.(Xi-x)(y,—j)AAAA石(XLX)8-y)A

參考公式:相關(guān)系數(shù)r=/“,回歸方程:y=%x+a中,h=——--------二----,a

(kx產(chǎn)£](yt-y)2,5,(XLx)2

——A—

=y—bx.

6.解析(I)所求折線圖如圖所示:

9

--8--8

56工XV

-y-XyI=

/A

2,2,te

8__

X(為一x)(y,—y)

說明y與x的線性相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合y與x的關(guān)系.

8__

zN(kx)(y,-y)2963A_A_

⑶---------------------=-^-^1.05,。=),~bx=56.2-7.05x4.5-24.48,

(?-x)2

AA

.??y=7.05x+24.48.當(dāng)x=ll時,y=7.05xl1+24.48=102.03.

預(yù)測2024年我國艾滋病累計感染人數(shù)為102.03萬人.

7.近年來,高鐵的發(fā)展逐漸改變了人們的出行方式,我國2016?2020年高鐵運營里程的數(shù)據(jù)如下表所

示.

年份20162017201820192020

年份代碼X12345

高鐵運營里程M萬千米)1.92.22.52.93.5

(1)若X與y具有線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程;

(2)每一年與前一年的高鐵運營里程之差即為該年新增的里程,根據(jù)這五年的數(shù)據(jù),若用2017?2020年

每年新增里程的頻率代替之后每年新增相應(yīng)里程的概率,求2024年中國高鐵運營里程大于或等于5萬

千米的概率.

n__

AAA-Y..xtyi-nxy

附:線性回歸方程中斜率和截距的最小二乘估計公式分別為:力=々-----

Ex?-nx2

Z=1

A—A一

a=y-bx.

7.解析(1)JC=|X(|+2+3+4+5)=3,y=1x(l.9+2.2+2.5+2.9+3.5)=2.6.

55

X孫?=1x1.9+2x2.2+3x2.5+4x2.9+5x3.5=42.9,萬=1+4+9+16+25=55,

「石孫―5xy42.9-5x3x2.6A

所以b=1------=刀—=0.39,4=2.6-0.39x3=1.43,

W755—5x3/

所以y關(guān)于x的線性回歸方程為;=0.39x+1.43.

相應(yīng)概率為自4+?(界4+3(凱凱=a,

所以2024年中國高鐵運營里程大于或等于5萬千米的概率為1—七=||.

8.每年春天,婺源的油菜花海吸引數(shù)十萬游客紛至沓來,油菜花成為“中國最美鄉(xiāng)村”的特色景觀,三

月,婺源篁嶺油菜花海進(jìn)入最佳觀賞期.現(xiàn)統(tǒng)計了近七年每年(2015年用x=l表示,2016年用x=2表

示)來篁嶺旅游的人次y(單位:萬人次)相關(guān)數(shù)據(jù),如下表所示:

Xi234567

y29333644485259

AAA

(1)若y關(guān)于x具有較強的線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程y=fcc+“,并預(yù)測2022年來篁嶺

旅游的人次;

(2)為維持旅游秩序,今需4,B,C,。四位公務(wù)員去各景區(qū)值班,已知A,B,C去篁嶺值班的概率均

為。去篁嶺值班的概率為小且每位公務(wù)員是否去篁嶺值班不受影響,用X表示此4人中去篁嶺值

班的人數(shù),求X的分布列與均值.

Z(X,-X)8—y)

八尸]A-----A-----

參考公式:b=-----------------,a=y-Z?x.

Z(XLx)2

i=\

77_—

參考數(shù)據(jù):Z>/=301,Z8-x)8—y)=140.

i=li=\

8.解析(1)由表知T=;X(1+2+3+4+5+6+7)=4,~=|x(29+33+36+44+48+52+59)=43,

7__

Z(Xi—x)8-y)

A產(chǎn)[140A—A——

則6=-----------------=9+4+1+0+1+4+9=5,a=y-"43—5x4=23,

7_

E(樂一X)2

所以f=5x+23,

A

因為2015年用x=l表示,所以2022年時x=8,得y=5x8+23=63(萬人次).

(2)X的可能取值是0,1,2,3,4,

尸(X=l)=c4x(l—§2號號+c5x(l—|)3x|=11,

P(X=2)=CML|X§2X,+CM1一|卜基=得=募

P(X=3)=CM|>號+0x(1_|乂|居=||,

P(X=4)=C§,x(<j2y\x§1=酉8.

則X的分布列為

X01234

21310288

P8787278?81

4c2,13,10,28,87

故E(X)=0x^-j-+lx^j-+2x—+3x—+4x—=-.

9.研究機構(gòu)對某校學(xué)生往返校時間的統(tǒng)計資料表明:該校學(xué)生居住地到學(xué)校的距離x(單位:千米)和學(xué)生

花費在上學(xué)路上的時間y(單位:分鐘)有如下的統(tǒng)計數(shù)據(jù):

到學(xué)校的距離x(千米)1.82.63.14.35.56.1

花費的時間M分鐘)17.819.627.531.336.043.2

由統(tǒng)計資料表明y與x具有線性相關(guān)關(guān)系.

(1)判斷y與x的相關(guān)程度;(相關(guān)系數(shù)r的絕對值大于0.75時,認(rèn)為兩個變量相關(guān)程度很強,精確到0.01)

AAA

⑵求線性回歸方程y=〃x+a(精確至IJ0.01);

AAA

(3)將),<27的時間數(shù)據(jù)v稱為美麗數(shù)據(jù),現(xiàn)從這6個時間數(shù)據(jù)M中任取2個,求抽取的2個數(shù)據(jù)全部為

美麗數(shù)據(jù)的概率.

n__n__

AAA“Lxiyt-nx-yE(為-x)(y<—y)

參考公式:用最小二乘法求線性回歸方程y=6x+a的系數(shù):b=一,---------------------二----

£甫一〃X2,£(XL%)2

A—A一

a=y-bx?

6-6-

Z(XLx)2=i4.3o,zu,—y)2

尸1i=l

9.

____166____6__

⑵由題意得x=3.9,y=7Xy^29.23,Z(x—x)(y,—y)=8030,Z(x—x)2=14.30,

I=I尸i尸i

6____

X(XLX)8-y)

“尸?8030A—A—

所以6=----------------=77^7=5.62,a=y~hx~29.23-5.62x3.9~7.31,

6__14.JU

E(.Xi—X)2

i=l

所以線性回歸方程為f=5.62x+7.31.

(3)由(2)可知,當(dāng)x=3.1時,)=24.732<27,當(dāng)x=4.3時,立=31.476>27,

所以滿足;<27的美麗數(shù)據(jù)共有3個.從這6個數(shù)據(jù)中任取2個共有CW=15(種)情況,其中,抽取的2

個數(shù)據(jù)全部為美麗數(shù)據(jù)的有0=3(種)情況,

所以從這6個數(shù)據(jù)£中任取2個,抽取的2個數(shù)據(jù)全部為美麗數(shù)據(jù)的概率為*

10.隨著中美貿(mào)易戰(zhàn)的不斷升級,越來越多的國家科技巨頭加大了科技研發(fā)投入的力度.中華技術(shù)有限公

司擬對“麒麟”手機芯片進(jìn)行科技升級,根據(jù)市場調(diào)研與模擬,得到科技升級投入M億元)與科技升級

直接收益),(億元)的數(shù)據(jù)統(tǒng)計如下:

序號123456789101112

X2346810132122232425

y1322314250565868.56867.56666

A八L

當(dāng)0<xW17時,建立了y與x的兩個回歸模型:模型①:y=4.1x+11.8;模型②:>-=21.3^—14.4;

AA

當(dāng)x>17時,確定y與x滿足的線性回歸方程為y=-0.7x+a.

⑴根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)04W17時模型①、②的相關(guān)指數(shù)R2的大小,并選擇擬合精度更

高、更可靠的模型,預(yù)測對“麒麟”手機芯片科技升級的投入為17億元時的直接收益

回歸模型模型①模型②

回歸方程y=4.1x+11.8>=21.3寸一14.4

7A

篙(yr)2182.479.2

nA

高(yi-y:)2

(附:刻畫回歸效果的相關(guān)指數(shù)------,4萬比4.1)

,5,8-y)2

(2)為鼓勵科技創(chuàng)新,當(dāng)科技升級的投入不少于20億元時,國家給予公司補貼5億元,以回歸方程為

預(yù)測依據(jù),比較科技升級投入17億元與20億元時公司實際收益的大??;

n__n__

AAA入Lxiyi-nx-ygx)&「y)

(附:用最小二乘法求線性回歸方程的系數(shù):6=號---------------------二——,

^xr-nx2玄(X)-x>

A—A—

a=y-bx)

(3)科技升級后,“麒麟”芯片的效率X大幅提高,經(jīng)實際試驗得X大致服從正態(tài)分布N(0.52,0.012).公

司對科技升級團隊的獎勵方案如下:若芯片的效率不超過50%,不予獎勵;若芯片的效率超過50%但

不超過53%,每部芯片獎勵2元;若芯片的效率超過53%,每部芯片獎勵4元,記丫為每部芯片獲得

的獎勵,求E(V)(精確到0.01).

(附:若隨機變量X~NQ,,/)(。>0),則尸3一<T<XW〃+。)=0.6827,Pa-2b<XW〃+2。)=0.9545)

10.解析⑴由表格中的數(shù)據(jù),182.4>79.2,

.182.4_______79.2,182.4,79.2

?_>_7_=1_~_<1_~_*

工(y1-VAXy)2工(yt-y)2工(y,—y)2

模型①的相關(guān)指數(shù)心小于模型②的相關(guān)指數(shù)咫,

回歸模型②的擬合效果更好,

...當(dāng)x=17億時,科技升級直接收益的預(yù)測值為£=21.3?萬一14.4=72.93(億元).

,,匚一4三河一21+22+23+24+25-68.5+68+67.5+66+66

⑵當(dāng)x>17時,由已知可得x=---------;---------=23,y=-----------;----------=67.2,

55

A——

:.a=y+0.7x=67.2+0.7x23=83.3,

...當(dāng)x>17時,y與x滿足的線性回歸方程為f=-0.7x+83.3,

當(dāng)x=20億元,科技升級直接收益的預(yù)測值為£=-0.7x20+83.3=69.3(億元),

當(dāng)x=20億元時,實際收益的預(yù)測值為69.3+5=74.3億元>72.93億元.

技術(shù)升級投入20億元時,公司的實際收益更大.

(3)—2a—0.50,/z+cr—0.53,

???P(0.50vXW0.53)=Pa—2KX%+O)=P(/L2KX&LO)+P(/LKX3,+。)

0.9545-0.6827

240.6827=0.8186.

11-0.6827

P(X>0.53)=P(X邛+o)=-------------

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論