高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計(jì)案例新課標(biāo)試卷_第1頁(yè)
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計(jì)案例新課標(biāo)試卷_第2頁(yè)
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計(jì)案例新課標(biāo)試卷_第3頁(yè)
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計(jì)案例新課標(biāo)試卷_第4頁(yè)
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計(jì)案例新課標(biāo)試卷_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三節(jié)統(tǒng)計(jì)案例

學(xué)習(xí)要求-公眾號(hào):新課標(biāo)試卷:1,會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變

量間的相關(guān)關(guān)系,

2,了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.

3.了解獨(dú)立性檢驗(yàn)(只要求2X2列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用,了解回歸分析的

基本思想、方法及其簡(jiǎn)單應(yīng)用,在本小節(jié)中,需要了解一些常見(jiàn)的統(tǒng)計(jì)方法,并能應(yīng)用這些方法

解決一些實(shí)際問(wèn)題.

必備知識(shí)?整合

L兩個(gè)變量的線性相關(guān)

(1)正相關(guān):

在散點(diǎn)圖中,點(diǎn)散布在從①左下角到②右上角的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)

系,我們將它稱為正相關(guān).

(2)負(fù)相關(guān):

在散點(diǎn)圖中,點(diǎn)散布在從③左二角到⑷右下角的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)

系,我們將它稱為負(fù)相關(guān).

(3)線性相關(guān)關(guān)系、回歸直線:

如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在⑤.一條直線附近,那么就稱這兩個(gè)變量之間

具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.

(4)最小二乘法:

求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的⑥.距離的平方和最小的方法叫做最小二乘法.

(5)回歸方程:

方程y功肝。是具有線性相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)(打%),(心④,…,(即人)的回歸

方程,其中a”是待定參數(shù).

n

E(xrx)(yry)

b=

nQ

L(片9)2MJ卜戒

1=1

a=?y-bx,

2.回歸分析

⑴回歸分析是對(duì)具有⑧」的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.

(2)樣本點(diǎn)的中心:

nn

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(為加,(勒必),…,(及外茂工£孫歹二工£如⑨

^i=ii=i

為樣本點(diǎn)的中心.

Zxiyrnxy

(3)相關(guān)系數(shù):r=

當(dāng)r>0時(shí),表明兩個(gè)變量⑩正相關(guān);

當(dāng)2<0時(shí),表明兩個(gè)變量?負(fù)相關(guān),

廠的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性?越強(qiáng).2的絕對(duì)值越接近于0,表明

兩個(gè)變量之間?幾乎不存在線性相關(guān)關(guān)系,通常如大于或等于?0.75時(shí),認(rèn)為兩個(gè)變量

有很強(qiáng)的線性相關(guān)性,

3.獨(dú)立性檢驗(yàn)

⑴分類變量:變量的不同“值”表示個(gè)體所屬的?不同類別,像這樣的變量稱為分類變

量.

⑵列聯(lián)表:列出的兩個(gè)分類變量的?頻數(shù)表,稱為列聯(lián)表,一般地,假設(shè)有兩個(gè)分類變量

才和K它們的可能取值分別為{打而}和{y.,同,其樣本頻數(shù)列聯(lián)表(稱為2X2列聯(lián)表)為

總計(jì)

X\ab升b

照Cdc^d

總計(jì)卅CKd

則可構(gòu)造一個(gè)隨機(jī)變量〃=?,…,其中爐?外加Nd.

一(a+b)(c+d)(a+c)(b+d)-----------

(3)獨(dú)立性檢驗(yàn):

利用獨(dú)立性假設(shè)、隨機(jī)變帚?K來(lái)確定是否有一定的把握認(rèn)為“兩個(gè)分類變量?有

關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).

OSM

1,判斷正誤(正確的打“J”,錯(cuò)誤的打“X”),

(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的成績(jī)成正相關(guān)關(guān)系.()

(2)通過(guò)回歸直線方程y%戶a可以估計(jì)預(yù)報(bào)變量的取值和變化趨勢(shì).()

(3)因?yàn)橛扇魏我唤M觀測(cè)值都可以求得一個(gè)線性回歸方程,所以沒(méi)有必要進(jìn)行相關(guān)性檢驗(yàn).

()

⑷事件4關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的尤的觀測(cè)值越大.()

答案⑴J⑵J(3)X⑷J

2.根據(jù)如下樣本數(shù)據(jù);

X34567

y4.02.5-0.50.5-2.0

得到的回歸方程為尸力代出若折7.9,則x每增加一個(gè)單位,y就()

A.增加1.4個(gè)單位B.減少1.4個(gè)單位

C.增加1.2個(gè)單位D.減少1.2個(gè)單位

答案B根據(jù)樣本數(shù)據(jù)可得,專5,聲0.9,由于樣本點(diǎn)的中心伉力滿足尸6代&,所以

0.9二6X5+7.9,可得IF-\.4.故選B.

3.(人教A版選修2-3P97習(xí)題3.2T1改編)在研究吸煙是否對(duì)患肺癌有影響的案例中,通過(guò)

對(duì)列聯(lián)表的數(shù)據(jù)進(jìn)行處理,計(jì)算得到隨機(jī)變量『的觀測(cè)值左056,632,在犯錯(cuò)誤的概率不超過(guò)

0.0C1的前提下,下面說(shuō)法正確的是()

下表供參考:

P/2睛0.0250.0100.0050.001

標(biāo)5.0246.6357.87910.828

A.由于隨機(jī)變量V的觀測(cè)值力10.828,所以“吸煙與患肺癌有關(guān)系并且這個(gè)結(jié)論犯錯(cuò)誤的

概率不超過(guò)0.001

B.由于隨機(jī)變量斤的觀測(cè)值828,所以“吸煙與患肺癌有關(guān)系”:并且這個(gè)結(jié)論犯錯(cuò)誤的

概率不低于0.001

C.由于隨機(jī)變量^的觀測(cè)值力10.828,所以“吸煙與患肺癌沒(méi)有關(guān)系”,并且這個(gè)結(jié)論犯錯(cuò)誤

的概率不超過(guò)0.001

D.由于隨機(jī)變量/的觀測(cè)值010.828,所以“吸煙與患肺癌沒(méi)有關(guān)系”,并且這個(gè)結(jié)論犯錯(cuò)誤

的概率不低于0.001

答案A因?yàn)殡S機(jī)變量〃的觀測(cè)值妗56.632〉10.828,

所以在犯錯(cuò)誤的概率不超過(guò)0.001的前提下,認(rèn)為“吸煙與患肺癌有關(guān)系”.

故選A.

4.(人教B版選修2-3P94A5改編)己知兩個(gè)變量為y的關(guān)系可以近似地用函數(shù)萬(wàn)a爐來(lái)表示,

通過(guò)兩邊取自然對(duì)數(shù)變換后得到一個(gè)線性函數(shù),利用最小二乘法得到的線性回歸方程為

下2+0.5匕則乂y的近似函數(shù)關(guān)系式為.

答案y=exi

解析令z=ln7=ln(a/)=lna+Mnx,

對(duì)照回歸方程r2+0.5右

毗/"礙

???My的近似函數(shù)關(guān)系式為片。小.

5,(易錯(cuò)題)為了考察某種病毒疫苗的效果,現(xiàn)隨機(jī)抽取100只小鼠進(jìn)行試驗(yàn),得到如下列聯(lián)表:

感染未感染合計(jì)

服用104050

未服用203050

合計(jì)3070100

附,OK?

P(冷L)0.1000.0500.0250.010

k02.7063.8415.0246.635

根據(jù)上表,有的把握認(rèn)為“小鼠是否被感染與服用疫苗有關(guān)”.

答案95舟

解析根據(jù)列聯(lián)表中數(shù)據(jù),計(jì)算出駕端哼*4.762>3.841,

對(duì)照數(shù)表知,有95微把握認(rèn)為“小最是否被感染與服用疫苗有關(guān)”.

。易錯(cuò)分析由于對(duì)2X2列聯(lián)表中國(guó)Ac、d的位置不清楚,在代入公式時(shí)代錯(cuò)了數(shù)值導(dǎo)致計(jì)

算結(jié)果錯(cuò)誤.

關(guān)鍵能力,突破

考點(diǎn)=相關(guān)關(guān)系的判斷值既

1.在一組樣本數(shù)據(jù)(鳥(niǎo)凹),(羯血,…,(島%)(廬2,xh及,…,兒不全相等)的散點(diǎn)圖中,若

所有樣本點(diǎn)(居7.)(7=1,2,…,〃)都在直線吁戶1上,則這組樣本數(shù)據(jù)的相關(guān)系數(shù)為()

A.-lB.0

C.-D.1

2

答案I)所有樣本點(diǎn)均在同一條斜率為正數(shù)的直線上,則樣本的相關(guān)系數(shù)最大,為1,所以

選D.

2.(2020湖南張家界月考)對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的

比較,正確的是)

35

30

25

20

15

105

0

相關(guān)系敢為。相關(guān)系數(shù)為,:

(D②

相關(guān)系數(shù)為。和關(guān)系數(shù)為。

③④

A.打<匕<0<舄<丁1

B.司5<0"1您

C.水水0〈水石

D.冰水0<水舄

答案A易知題中圖①與圖③是正相關(guān),圖②與圖④是負(fù)相關(guān),且圖①與圖②中的樣本點(diǎn)

集中分布在一條直線附近,則小水0(費(fèi)",故選A.

3.某公司的科研人員在7塊并排、形狀和大小相同的試驗(yàn)田上對(duì)某棉花的新品種進(jìn)行施化

肥量>對(duì)產(chǎn)量y影響的試驗(yàn),得到如下表所示的一組數(shù)據(jù)(單位:kg):

施化肥量X15202530354045

棉花產(chǎn)量y330345365405445450455

⑴畫(huà)出散點(diǎn)圖;

(2)判斷施化肥量x與棉花產(chǎn)量y是否具有相關(guān)關(guān)系.

解析(D散點(diǎn)圖如圖所示:

梅花產(chǎn)餐”kg

500

450

400

200

01020304050隨化肥fitx/ka

(2)由散點(diǎn)圖知,各組數(shù)據(jù)的對(duì)應(yīng)點(diǎn)大致都在一條直線附近,所以施化肥量x與棉花產(chǎn)量y

具有線性相關(guān)關(guān)系.

名師點(diǎn)評(píng)

判斷相關(guān)關(guān)系的方法:

(1)回歸方程法:利用回歸方程中x的系數(shù)b的正負(fù)判斷.

(2)散點(diǎn)圖法;如果所有的樣本點(diǎn)都落在某一曲線附近,那么變量之間就有相關(guān)關(guān)系;如果所

有的樣本點(diǎn)都落在某一直線附近,那么變量之間就有線性相關(guān)關(guān)系.

(3)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判斷,|「越趨近于1,相關(guān)性越強(qiáng).

考點(diǎn)且回歸分析,多元分析‘

角度一線性回歸方程及應(yīng)用

典例1(2020山西長(zhǎng)治模擬)《中國(guó)詩(shī)詞大會(huì)》是中央電視臺(tái)于2016年推出的原創(chuàng)文化

類電視節(jié)目,中央電視臺(tái)為了解該節(jié)目的收視情況,抽查北方與南方各5個(gè)城市,得到觀看該節(jié)

目的人數(shù)(單位:千人)如莖葉圖所示,但其中一個(gè)數(shù)字被污損.

北方南方

897378

210806

(1)若將被污損的數(shù)字視為0十中10個(gè)數(shù)字中的一個(gè),求北方觀眾平均人數(shù)超過(guò)南方觀眾

平均人數(shù)的概率;

(2)該節(jié)目的播出極大激發(fā)了觀眾學(xué)習(xí)詩(shī)詞的熱情,現(xiàn)在隨機(jī)統(tǒng)計(jì)了4位觀眾每周學(xué)習(xí)詩(shī)詞

的平均時(shí)間y(單位:小時(shí))與年齡爪單位:歲),并制作了對(duì)照表(如表所示):

年齡x(單位:歲)20304050

每周學(xué)習(xí)詩(shī)詞的

33.53.54

平均時(shí)間y(單位:小時(shí))

由表中數(shù)據(jù)分析,x與y成線性相關(guān)關(guān)系,試求線性回歸方程,并預(yù)測(cè)年齡為60歲的觀眾每

周學(xué)習(xí)詩(shī)詞的平均時(shí)間.

£位

1

Qb

n

22=y-

E-_

X.一nX

I1

=l

解析(1)設(shè)被污損的數(shù)字為X,由北方觀眾平均人數(shù)超過(guò)南方觀眾平均人數(shù)得

78+79+82+81+80.73+77+78+86+80+X”

〉=>Kb,

5--------------5

即A=0,1,2,3,4,5,

二所求概率嘮

(2)x=ix(20+30+40+50)=35,

4

歹[x(3+3.5+3.5+4)=3.5,

A4r升490,

44

又£xy=20X3+30X3.5+40X3.5+50X4=505,£x?=202+302+402+502=5400,

i=ii=i

?,?1b=--5-0-5-4-9-0-r=0.03,

5400-4x35?

Aa=3.5-0.03X35=2.45,

Ay=0.03外2,45,

.當(dāng)戶60時(shí),y二4.25.

故年齡為60歲的觀眾每周學(xué)習(xí)誓詞的平均時(shí)間大約為4.25小時(shí),

角度二非線性回歸方程及應(yīng)用

典例2(2020安徽黃山二模)某苗圃基地?cái)M選用某種植物支援荒山綠化,在相同種植條件

下,對(duì)該種植物幼苗從種植之日起,第x天的高度y(單位:cm)進(jìn)行觀測(cè),下表是某株幼苗的觀測(cè)

數(shù)據(jù):

第才/p>

高度y/fem0479111213

作出如下散點(diǎn)圖:

⑴請(qǐng)根據(jù)散點(diǎn)圖判斷尸3戶人與尸6&+d中哪一個(gè)更適宜作為幼苗高度/關(guān)于時(shí)間x的回

歸方程類型;(給出判斷即可,不必說(shuō)明理由)

(2)根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程.已知幼苗的高度達(dá)到29cm

才可以移植,預(yù)測(cè)苗圃基地需要培育多長(zhǎng)時(shí)間.

777777

Ex:

EXjEXiYiE同

rJ1

i=l營(yíng)湎1?=1中<=i1=1i=i

140285615674676283

解析(1)由散點(diǎn)圖可知,產(chǎn)Sr更適宜作為幼苗高度y關(guān)于時(shí)間x的回歸方程類型.

⑵令〃二爪,則尸川G+d構(gòu)造新的成對(duì)數(shù)據(jù),如下表所示:

/p>

P=Vx1234567

y0479111213

求得百4,7=8.

£-

M〃

-r

iy埠UV

-283-7X4X859

i=7l-2U

£-1407X1628,

』17rg

3

平-

.

r-c-7

,?.y關(guān)于〃的回歸方程為蟾

Zo7

則y關(guān)于x的回歸方程為胃岳年

3

-

取尸29,可得29二?7解得g195天.

Zb

???預(yù)測(cè)苗圃基地需要培育195天.

角度三相關(guān)系數(shù)及其應(yīng)用

典例3(2020課標(biāo)全國(guó)〃,18,12分)某沙漠地區(qū)經(jīng)過(guò)治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)

物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些

地塊中用簡(jiǎn)單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)3,z)(;=1,2,…,20),其

中>和乂分別表示第/個(gè)樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得

2020202020

Zx=60,Zyp\200,£(J-X)2=80,£(必-歹尸二9000,Z(y-y)=800.

i=li=li=li=li=l

(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這種野生動(dòng)

物數(shù)量的平均數(shù)乘地塊數(shù));

⑵求樣本u,yj(7=1,2,…,20)的相關(guān)系數(shù)(精確到求01);

(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地

區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣方法,并說(shuō)明理由.

n

附:相關(guān)系數(shù)廣2n2,V2^1.414.

££心

-X)

=l(=1

20

解析⑴由己知得樣本平均數(shù)方1卷與匕*。,從而該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值為

60X200=12000.

⑵樣本(檢入)(凡2,…,20)的相關(guān)系數(shù)

20

廠¥產(chǎn)田(力爭(zhēng)____2*o94

J2020V80X90003

(3)分層抽樣:根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層抽樣.

理由如下:由⑵知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān).由于各地塊間

植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異也很大,采用分層抽樣的方法較好

地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致也提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)

物數(shù)量更準(zhǔn)確的估計(jì),

名師點(diǎn)評(píng)

L線性回歸分析問(wèn)題:

(1)求線性回歸方程:

結(jié)合公式和已知數(shù)據(jù),求出取歹等數(shù)據(jù),再求回歸系數(shù)b,a.

(2)利用回歸方程進(jìn)行預(yù)測(cè),把線性回歸方程看作一次函數(shù),求函數(shù)值.

(3)利用回歸直線判斷正、負(fù)相關(guān),系數(shù)匕決定是正相關(guān)還是負(fù)相關(guān),

2.模型擬合效果的判斷:

⑴殘差平方和越小,模型的擬合效果越好.

(2)相關(guān)指數(shù)〃越大,模型的擬合效果越好.

3,非線性回歸方程的求法:

⑴根據(jù)原始數(shù)據(jù)(>/)作出散點(diǎn)圖,

(2)根據(jù)散點(diǎn)圖選擇恰當(dāng)?shù)臄M合函數(shù).

(3)作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程.

(4)在(3)的基礎(chǔ)上通過(guò)相應(yīng)變換,即可得到非線性回歸方程.

哥對(duì)訓(xùn)練

1.已知某企業(yè)近3年的前7個(gè)月的月利潤(rùn)(單位:百萬(wàn)元)如下面的折線圖所示:

⑴試問(wèn)這3年的前7個(gè)月中哪個(gè)月的月平均利潤(rùn)最高;

⑵通過(guò)計(jì)算判斷這3年的前7個(gè)月的總利潤(rùn)的發(fā)展趨勢(shì);

⑶第3年的前4個(gè)月的數(shù)據(jù)如'F表,用線性回歸的擬合模型估計(jì)第3年8月份的利潤(rùn).

月份x1234

利潤(rùn)y(單位:百萬(wàn)元)4466

由?八Tu£蟲(chóng)㈤仇-y)^xnxy

相關(guān)公式:b土、----廣寧--i-y-r---1

ET廠后2£%卜府2

1=1i=i1

a=y-bx.

解析(1)由折線圖可知這3年的5月和6月的平均利潤(rùn)最高.

(2)第1年的前7個(gè)月的總利潤(rùn)為

1+2+3+5+6+7+4=28(百萬(wàn)元),

第2年的前7個(gè)月的總利潤(rùn)為2+5+5+4+5+5+5=31(百萬(wàn)元),

第3年的前7個(gè)月的總利澗為4+4+6+6+7+6+8=41(百萬(wàn)元),

故這3年的前7個(gè)月的總利潤(rùn)呈上升趨勢(shì).

2222

(3)Vx=2.5,y=5,,Sx?=l+2+3+4=30,X4+2X4+3X6+4X6=54,二吟治簧。8,

a-5-2.5X0.8=3,/.y=0.8x+3,

當(dāng)齊8時(shí),y=0,8X8+3=9,4.

,估計(jì)第3年8月份的利潤(rùn)為9.4百萬(wàn)元.

2.(2019廣西聯(lián)考)某公司為了準(zhǔn)確地把握市場(chǎng),做好產(chǎn)品生產(chǎn)計(jì)劃,對(duì)過(guò)去四年的數(shù)據(jù)進(jìn)行整理

得到了第x年與年銷售量「(單位:萬(wàn)件)之間的關(guān)系如表:

X1234

y12284256

⑴在圖中畫(huà)出表中數(shù)據(jù)的散點(diǎn)圖;

兩件

60

50

40

30

20

10

―01~123^1/4

(2)根據(jù)(1)中的散點(diǎn)圖判斷y與x的回歸模型的類型,并用相關(guān)系數(shù)加以說(shuō)明;

⑶建立y關(guān)于>的回歸方程,預(yù)測(cè)第5年的銷售量約為多少.

I44£(x--x)(y.-y)

附力r(y廣力2^327,遙石2.24,£幾片418.相關(guān)系數(shù)「"藍(lán)'{回歸方程飛出

N1=11=1

£片力中才y_—

的斜率和截距的最小二乘估計(jì)分別為如二---------,spy-bx.

Lxf-nx2

解析(1)作出的散點(diǎn)圖如圖:

0I234〃年

(2)由⑴散點(diǎn)圖可知,各點(diǎn)大致分布在一條直線附近,故可用線性回歸模型擬合y與x的關(guān)系.

又打,爐*£*=30,

//i=i

£](后動(dòng)(必-歹)二*0=&y=418-4x|Xy=73,

J?]?療)2=Jg*4.2=卜0-4乂(|)二帆、2,24,

4

S(xrx)(yry)

一i=i73

1_r二七一--七0.9966.

2.24X32.7

2

_E(xrx).L(yry)

,?)與》的相關(guān)系數(shù)近似為0.9966,說(shuō)明y與丫的線性相關(guān)程度相當(dāng)強(qiáng),,可以用線性回歸模

型擬合y與x的關(guān)系.

..4____

£XiVi-4xy

⑶由⑵知設(shè)y=b^Q,b=氣-----=-

£備4連5

i=i123

a于位:2.故y關(guān)于*的回歸方程為y號(hào)尸2,當(dāng)尸5時(shí),y—X5-2二71,

預(yù)測(cè)第5年的銷售量約為71萬(wàn)件.

3.(2020福建南平三模)千百年來(lái),人們一直在通過(guò)不同的方式傳遞信息.在古代,烽火狼煙、飛

鴿傳書(shū)、快馬驛站等通信方式被人們廣泛傳知;第二次工業(yè)革命后,科技的進(jìn)步帶動(dòng)了電訊事業(yè)

的發(fā)展,電報(bào)、電話的發(fā)明讓通信領(lǐng)域發(fā)生了翻天覆地的變化;之后,計(jì)算機(jī)和互聯(lián)網(wǎng)的出現(xiàn)則

使得“千里眼”“順風(fēng)耳”變?yōu)楝F(xiàn)實(shí),……,此時(shí)此刻,5G的到來(lái)即將給人們的生活帶來(lái)顛覆性

的變革.某科技創(chuàng)新公司基于領(lǐng)先的技術(shù)水平,豐富的移動(dòng)互聯(lián)網(wǎng)應(yīng)用等明顯優(yōu)勢(shì),該公司的5G

經(jīng)濟(jì)收入在短期內(nèi)逐月攀升,業(yè)內(nèi)預(yù)測(cè),該創(chuàng)新公司在第1個(gè)月至第7個(gè)月的5G經(jīng)濟(jì)收入y(單

(1)為了更充分運(yùn)用大數(shù)據(jù)、人工智能、5G等技術(shù),公司需要派出員工實(shí)地考察,檢測(cè)產(chǎn)品性能

和使用狀況,公司領(lǐng)導(dǎo)要從報(bào)名的五名科技人員從B、C、D、£中隨機(jī)抽取3個(gè)人前往,則/、B

同時(shí)被抽到的概率為多少?

⑵根據(jù)散點(diǎn)圖判斷,尸己盧6與片c?人由c,d均為大于零的常數(shù))哪一個(gè)更適宜作為5G經(jīng)濟(jì)

收入y關(guān)于月份x的回歸方程類型?(給出判斷即可,不必說(shuō)明理由)并根據(jù)你的判斷結(jié)果及表中

的數(shù)據(jù),求出y關(guān)于x的回歸方程;

⑶請(qǐng)你預(yù)測(cè)該公司8月份的5G經(jīng)濟(jì)收入.

參考數(shù)據(jù):

其中設(shè)v=igy,右igy(-

參考公式:對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(檢匕)(41,2,3,…,力,其回歸直線〃邛ea的斜率

.n_八

Lx;v;-n5cv?

和截距的最小二乘估計(jì)公式分別為用耳「廣a行邛x.

a/,nx

解析(1)從爾氏C、〃、£中隨機(jī)抽取3個(gè)人,其基本事件為

(44。,(44〃),(4氐£),(4C〃),(4C£),(4〃£),(&C;鹵,(&CQ,(4〃"),匕〃£),共

10個(gè),48同時(shí)被抽到的事件為(45,0,UB,。),(4&£),共3個(gè),則48同時(shí)被抽到的概率為

3

10,

⑵根據(jù)散點(diǎn)圖判斷,產(chǎn)。?"更適宜作為5G經(jīng)濟(jì)收入y關(guān)于月份x的回歸方程類型.

對(duì)六c,〃兩邊同時(shí)取常用對(duì)數(shù),得1g片lg(c?(/)=lgc+xlgd./.rigc+jlgd,

Vx=y=4,萬(wàn)二產(chǎn)?L54,_£xf=140,

.7

J^V_50-12-7X4X1.54,^^

d2

.L?-7X140-7X4228

把樣本中心點(diǎn)(4,1.54)代入尸1gc+0,25?茍得1g北0.54,

,折0.54+0.25*,即1g發(fā)0.54+0.25*,?'.y關(guān)于》的回歸方程為

y二1嚴(yán)電25n0°"X(IO025)-3.47X10*25;

⑶由⑵得力二3.47X10產(chǎn)

把年8代入上式得,y=3.47X10°25XM47,

故預(yù)測(cè)該公司8月份的5G經(jīng)濟(jì)收入為347百萬(wàn)元.

整直目獨(dú)立性檢驗(yàn)葡頻

典例4某工廠有25周歲以上(含25周歲)的工人300名,25周歲以下的工人200名,為研

究工人的日平均生產(chǎn)件數(shù)是否與年齡有關(guān),現(xiàn)采用分層抽樣的方法,從中選取了100名工人,先

統(tǒng)計(jì)了他們某月的日平均生產(chǎn)件數(shù),然后按工人的年齡分為“25周歲以上(含25周歲)”和“25

周歲以下”兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5

組:[50,60),[60,70),[70,80),[80,90),[90,100],分別加以統(tǒng)計(jì),得到如圖所示的頻率分布直

方圖.

典率

組距

0.0330.....................[―

0.0200.....................

QXX1S0----------?

<)-1mloo.4的0平

25則歲以的25周歲聞均生產(chǎn)的k

⑴根據(jù)“25周歲以上(含25周歲)組”的頻率分布直方圖,求25周歲以上(含25周歲)組

的工人的日平均生產(chǎn)件數(shù)的中位數(shù)的估計(jì)值(四舍五入保留整數(shù));

(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80的工人為生產(chǎn)能手,請(qǐng)你根據(jù)己知條件完成2X2列聯(lián)表,

并判斷是否有90黜把握認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”.

生產(chǎn)能手非生產(chǎn)能手合計(jì)

25周歲以上(含25周歲)組

25周歲以下組

合計(jì)

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

P(儲(chǔ)]%)0.1000.0500.0100.001

kn2.7063.8416.63510.828

解析采用分層抽樣的方法,從“25周歲以上(含25周歲)組”應(yīng)選取工人

100X正抵=60(名),從“25周歲以下組”應(yīng)選取工人100X正巖:40(名).

(1)由“25周歲以上(含25周歲〕組”的頻率分布直方圖可知,其中位數(shù)為

70+iox空牌吧三73(件),

綜上,25周歲以上(含25周歲)組的工人日平均生產(chǎn)件數(shù)的中位數(shù)的估計(jì)值為73件.

(2)由頻率分布直方圖可知,25周歲以上(含25周歲)組的生產(chǎn)能手共有60X[(0,020

0+0,0050)X10kl5(名),25周歲以下組的生產(chǎn)能手共有40X[(0,0325+0,005

0)X10]=15(名),則2X2列聯(lián)表如下:

生產(chǎn)非生產(chǎn)

合計(jì)

能手能手

25周歲以上

154560

(含25周歲)組

25周歲以下組152540

合計(jì)3070100

冰型蒜絮手書(shū)司.786〈2.706,所以沒(méi)有90嫡把握認(rèn)為“生產(chǎn)能手與工人所在的

年齡組有關(guān)”.

方法技巧

獨(dú)立性檢驗(yàn)的一般步驟

1.求“有多大把握”“犯錯(cuò)誤的概率”的題型:

(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;

(2)計(jì)算隨機(jī)變量片的觀測(cè)值k,查表確定臨界值心(符合42外的最大Ab);

(3)推斷有口-戶(筋X100軸)把握認(rèn)為有關(guān)系,或在犯錯(cuò)誤的概率不超過(guò)P(r2禽)的前

提下認(rèn)為有關(guān)系,

2.判斷是否有回舶<)把握的題型:

(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;

⑵計(jì)算隨機(jī)變量尸的觀測(cè)值k,根據(jù)川粉[1-尸(/》左)]X100%求產(chǎn)(左2%)),查表確定臨界

值均,比較北與4的大小;

(3)判斷是否有用轆]把握認(rèn)為有關(guān)系.

哥對(duì)訓(xùn)練

(202()課標(biāo)〃健,18,12分)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣質(zhì)量等級(jí)和當(dāng)

天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):

鍛煉人次

[0,200](200,400](400,600]

空氣質(zhì)量等級(jí)

1(優(yōu))21625

2(良)51012

3(輕度污染)678

4(中度污染)720

(1)分別估計(jì)該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率;

(2)求一天中到該公園鍛煉的平均人次的估計(jì)值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表);

⑶若某天的空氣質(zhì)量等級(jí)為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級(jí)為3或4,

則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否

有95輛把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).

人次W400人次》400

空氣質(zhì)量好

空氣質(zhì)量不好

附?/二____…兒)_____

叩…(a+b)(c+d)(a+c)(b+d)'

0.0500.0100.001

Ao3.8416.63510,828

彳解析(1)由所給數(shù)據(jù),該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率的估計(jì)值如下表:

空氣質(zhì)量等級(jí)1234

概率的估計(jì)值0.430.270.210.09

(2)一天中到該公園鍛煉的平均人次的估計(jì)值為京X(100X20+300X35+500X45),350.

⑶根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:

人次W400人次>400

空氣質(zhì)量好3337

空氣質(zhì)量不好228

根據(jù)列聯(lián)表得“00X(33X8-22X37)工£

55x45x70x30

由于5.820〉3,841,故有95舶勺把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).

I夯基提能作亞|

A組基礎(chǔ)達(dá)標(biāo)

1.(2020安徽淮南月考)變量X與y相對(duì)應(yīng)的一組數(shù)據(jù)為

(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量〃與『相對(duì)應(yīng)的一組數(shù)據(jù)為

(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).△表示變量?與X之間的線性相關(guān)系數(shù),不表示

變量/與〃之間的線性相關(guān)系數(shù),則()

A.涼水0B.0<*QC."0"D.r2=r1

答案C對(duì)于變量Y與4而言,HfiX的增大而增大,故Y與X成正相關(guān),即石〉0;對(duì)于變量「與

〃而言"/隨〃的增大而減小,故,與U成負(fù)相關(guān),即水0,故選C.

2.(2020課標(biāo)全國(guó)I,5,5分)某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單

位:t)的關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)(必必)(;=1,2,…,20)

得到下面的散點(diǎn)圖;

由此散點(diǎn)圖,在10℃至4(TC之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率y和溫度X的

回歸方程類型的是()

A.y=a^bxB.六肝加C.片行6e'D.y=a^blnx

答案D觀察題中散點(diǎn)圖可知,散點(diǎn)圖用光滑曲線連接起來(lái)比較接近對(duì)數(shù)型函數(shù)的圖象,故選D.

3.(2020江西南昌大學(xué)附中模擬)某公司在2015-2019年的收入與支出情況如下表所示:

收入4億元)2.22.64.05.35.9

支出y(億元)0.21.52.02.53.8

根據(jù)表中數(shù)據(jù)可得回歸方程為尸0.8Ha,依此估計(jì)該公司收入為8億元時(shí)的支出為()

A.4.2億元B.4.4億元C.5.2億元口.5.4億元

答案C

4.為了解某社區(qū)居民購(gòu)買水果和牛奶的年支出費(fèi)用與購(gòu)買食品的年支出費(fèi)用的關(guān)系,隨機(jī)調(diào)查

了該社區(qū)5戶家庭,得到如下統(tǒng)計(jì)表:

購(gòu)買食品的年支

2.092.152.502.842.92

出費(fèi)用"萬(wàn)元

購(gòu)買水果和牛奶的

1.251.301.501.701.75

年支出費(fèi)用"萬(wàn)元

根據(jù)上表可得回歸方程y%戶Q,其中加0.59,a-y-bxf據(jù)此估計(jì),該社區(qū)一戶購(gòu)買食品的年支出

費(fèi)用為3.00萬(wàn)元的家庭購(gòu)買水果和牛奶的年支出費(fèi)用約為()

A.1.795萬(wàn)元B.2.555萬(wàn)元

C.1.915萬(wàn)元D.1.945萬(wàn)元

2,09十2,15十2,50十2,84+2.92_250(萬(wàn)元)

答案AX'

-1.25+1.30+1.50+1.70+1.75.「“十一、

y=---------------------=L50(77兀)

匕二0.59,則好片加口).025,y=0.59Ao.025,故該社區(qū)購(gòu)買食品的年支出費(fèi)用為3.00萬(wàn)元的家庭

購(gòu)買水果和牛奶的年支出費(fèi)用約為y=0.59X3.00+0.025=1.795(萬(wàn)元).

5.為了研究某班學(xué)生的腳長(zhǎng)x(單位:用米)和身高y(單位:厘米)的關(guān)系,從該班隨機(jī)抽取10名

學(xué)生,根據(jù)測(cè)量數(shù)據(jù)的散點(diǎn)圖可以看出y與>之間有線性相關(guān)關(guān)系,設(shè)其回歸直線方程為點(diǎn)

1010

已知E出=225,Ey尸1600,加4.該班某學(xué)生的腳長(zhǎng)為24,據(jù)此估計(jì)其身高為()

i=li=l

A.ieoB.163C.166D.170

答案C由題意可知工二22.5,尸160,?',160=4X22.5+a,解得Q=70,?',尸4肝70,?'.當(dāng)產(chǎn)24

時(shí),發(fā)4X24+70=166,故選C.

6.某單位為了了解用電量y(千瓦時(shí))與氣溫x(C)之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了某4天的用電量與當(dāng)

天氣溫,并制作了如下對(duì)照表:

氣溫(℃)181310-1

用電量(千瓦時(shí))24343864

由表中數(shù)據(jù)得回歸直線方程度從葉。中的爐-2,預(yù)測(cè)當(dāng)氣溫為-4c時(shí),用電量為千瓦

時(shí).

答案68

解析回歸直線過(guò)樣本點(diǎn)的中心區(qū)》),由已知得*吧產(chǎn)二10,歹二2.34:38+64二10,將(4,物)

代入y二-2戶a,解得a=60,則/-2m'60、當(dāng)行-4時(shí),盧(-2)X(-4)+60=68,即當(dāng)氣溫為-4℃時(shí),用

電量約為68千瓦時(shí).

7.一個(gè)車間為了規(guī)定工時(shí),需要確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了10次試驗(yàn)來(lái)收集數(shù)據(jù),

由第,.次試驗(yàn)零件個(gè)數(shù)元(單位:個(gè))與加工零件所花費(fèi)的時(shí)間匕(單位:小時(shí))的數(shù)據(jù)資料,得

10101010

L%r80,Z%二20,Lx^=184,X壯二720,那么加工零件所花費(fèi)的時(shí)向y與零件個(gè)數(shù)¥之間的線

i=li=li=li=l

性回歸方程為.

答案y=0.3六0.4

解析爐10,所以工二二£々=£=8,歹=二£=個(gè)=2,又Exf-/]J2=720-

nf=i10"i=l10[=i

n*

10X82=80,E即%-麗=184-10X8X2=24,由此得b=-=0.3,a=y-hx=2-0,3X8=-0,4,

i=l80

故所求線性回歸方程為y=0.3J-0.4.

8.(2019河北名校聯(lián)考)某企業(yè)有兩個(gè)分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在

[29.94,30.06)內(nèi)的零件為優(yōu)質(zhì)品,從兩個(gè)分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得

如下統(tǒng)計(jì)表:

甲廠:

分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)

頻數(shù)126386182

分組[30.02,30.06)[30.06,30.10)[30.10,30.14]

頻數(shù)92614

乙廠:

分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)

頻數(shù)297185159

分組[30.02,30.06)[30.06,30.10)[30.10,30.14]

頻數(shù)766218

(1)試分別估計(jì)兩個(gè)分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;

⑵由以上統(tǒng)計(jì)數(shù)據(jù)完成下面2X2列聯(lián)表,并判斷是否有99血把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件

的質(zhì)量有差異”.

甲廠乙廠總計(jì)

優(yōu)質(zhì)品

非優(yōu)質(zhì)品

總計(jì)

附:鼠宙窗然

0.0500.0250.0100.0050.001

k3.8415.0246.6357.87910.828

解析⑴從甲廠抽查的500件產(chǎn)品中有360件優(yōu)質(zhì)品,從而估計(jì)甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率為

夢(mèng)1。眸72%;

從乙廠抽查的500件產(chǎn)品中有320件優(yōu)質(zhì)品,從而估計(jì)乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率為

320

薪X10。依64%

(2)完成的2X2列聯(lián)表如下:

甲廠乙廠總計(jì)

優(yōu)質(zhì)品360320680

非優(yōu)質(zhì)品140180320

總計(jì)5005001000

由表得禰號(hào)恐鬻等?,353>6,635,所以有9網(wǎng)把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件

的質(zhì)量有差異”.

B組能力拔高

9.某公司為了了解廣告投入對(duì)銷售收益的影響,在若干地區(qū)各投入4萬(wàn)元廣告費(fèi)用,并將各地的

銷售收益繪制成頻率分布直方圖(如圖所示).由于工作人員操作失誤,橫軸的數(shù)據(jù)丟失,但可以

確定橫軸是從0開(kāi)始計(jì)數(shù)的.

(1)根據(jù)頻率分布直方圖計(jì)算圖中各小長(zhǎng)方形的寬度;

(2)估計(jì)該公司投入4萬(wàn)元廣告費(fèi)用之后,對(duì)應(yīng)的銷售收益的平均值(以各組的區(qū)間中點(diǎn)值代表

該組的取值);

(3)該公司按照類似的研究方法,測(cè)得另外一些數(shù)據(jù),并整理得到下表:

廣告投入>(單位:萬(wàn)元)12345

銷售收益y(單位:萬(wàn)元)2327

表中的數(shù)據(jù)顯示,X與y之間存在線性相關(guān)關(guān)系,請(qǐng)將⑵中的結(jié)果填入空白欄,并求出y關(guān)于

彳的線性回歸方程.

_n__n__

£(xrx)(yry)£x^-nxy

相關(guān)公式:加3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論