考點28-統(tǒng)計(核心考點講與練新高考專用)(解析版)_第1頁
考點28-統(tǒng)計(核心考點講與練新高考專用)(解析版)_第2頁
考點28-統(tǒng)計(核心考點講與練新高考專用)(解析版)_第3頁
考點28-統(tǒng)計(核心考點講與練新高考專用)(解析版)_第4頁
考點28-統(tǒng)計(核心考點講與練新高考專用)(解析版)_第5頁
已閱讀5頁,還剩34頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

考點28統(tǒng)計(核心考點講與練)

,考點考若')

一、抽樣與統(tǒng)計圖表

1.獲取數(shù)據(jù)的基本途徑

獲取數(shù)據(jù)的基本途徑包括:統(tǒng)計報表和年鑒、社會調(diào)查、試驗設計、普查和抽樣、互聯(lián)網(wǎng)等.

(1)統(tǒng)計報表是指各級企事業(yè)、行政單位按規(guī)定的表格形式、內(nèi)容、時間要求報送程序,自上而下統(tǒng)一布置,

提供統(tǒng)計資料的一種統(tǒng)計調(diào)查方式.

(2)年鑒是以全面、系統(tǒng)、準確地記述上年度事物運動、發(fā)展狀況為主要內(nèi)容的資料性工具書.匯輯一年內(nèi)的

重要時事、文獻和統(tǒng)計資料,按年度連續(xù)出版的工具書.

2.總體、樣本、樣本容量

要考察的對象的全體叫做總便,每一個考察對象叫做個體,從總體中被抽取的考察對象的集體叫做總體的

一個樣本,樣本中個體的數(shù)目叫做樣本容量.

3.簡單隨機抽樣

(1)定義:從元素個數(shù)為N的總體中不放回地抽取容量為〃的樣本,如果每一次抽取時總體中的各個個體有

粗包的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.

(2)最常用的簡單隨機抽樣的方法:抽簽法和隨機數(shù)法.

(3)應用范圍:總體中的個體數(shù)較少.

4.分層抽樣

(1)定義:在抽樣時,將總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各

層中按層在總體中所占比例進行簡單隨機抽樣或系統(tǒng)抽樣,這種抽樣方法叫做分層抽樣.

(2)應用范圍:當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.

5.頻率分布直方圖

(1)頻率分布表的畫法:

第一步:求極差,決定組數(shù)和組距,組距=箍極差;

第二步:分組,通常對組內(nèi)數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間;

第三步:登記頻數(shù),計算頻率,列出頻率分布表.

(2)頻率分布直方圖:反映樣本頻率分布的直方圖(如圖)

橫軸表示樣本數(shù)據(jù),縱軸表示就,每個小矩形的面積表示樣本落在該組內(nèi)的頻莖.

6.頻率分布折線圖和總體密度曲線

(1)頻率分布折線圖:連接頻率分布直方醫(yī)中各小長方形上端的中點,就得到頻率分布折線圖.

(2)總體密度曲線:隨著樣本容量的增加,作圖時所分的組教增加,組距減小,相應的頻率分布折線圖就會

越來越接近于一條光滑曲線,統(tǒng)計中稱這條光滑曲線為總體密度曲線.

7.樣本的數(shù)字特征

數(shù)字特征定義

眾數(shù)在一組數(shù)據(jù)中,出現(xiàn)次數(shù)量多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù)

將一組數(shù)據(jù)按大小依次排列,把處在最空回位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)

中位數(shù)

的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)

平均數(shù)樣本數(shù)據(jù)的算術平均數(shù),即4理;

1

方差52=-f(Xi-X)2+(X2-X)2+-+(Xn-X)2],其中5為標準差

8.百分位數(shù)

如果將一組數(shù)據(jù)從小到大排序,并計算相應的累計百分位,則某一百分位所對應數(shù)據(jù)的值就稱為這一百分

位的百分位數(shù).可表示為:一組〃個觀測值按數(shù)值大小排列.如,處于0%位置的值稱第P百分位數(shù).

二、統(tǒng)計案例

1.變量間的相關關系

(1)常見的兩變量之間的關系有兩類:一類是函數(shù)關系,另一類是相關關系;與函數(shù)關系不同,相關關系是

一種豐確定性關系.

(2)從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關關系稱為正相差,點散布在

左上角到右下角的區(qū)域內(nèi),兩個變量的相關關系為魚膽去.

2.回歸分析

對具有相關關系的兩個變量進行統(tǒng)計分析的方法叫回歸分析.其基本步驟是:(i)畫散點圖:(ii)求回歸直線

方程;(出)用回歸直線方程作預報.

(1)回歸直線:如果散點圖中點的分布從整體上看大致在二1直線附近,就稱這兩個變量之間具有線性相關

關系,這條直線叫做回歸直線.

(2)回歸直線方程的求法一一最小二乘法.

設具有線性相關關系的兩個變量x,y的一組觀察值為(劉,y)(i=l,2,…,〃),則回歸直線方程y=ar+6的

系數(shù)為:

其中亍=上小為萬=工汽y,(五歹)3生母*匕M,、

n〃,-1稱為樣本點的中心.

(3)相關系數(shù)

①計算相關系數(shù),?,7?有以下性質(zhì):Id<h并且bi越接近1,線性相關程度越強;H越接近0,線性相關程度

越弱;②歷>為。5,表明有95%的把握認為變量x與y之間具有線性相關關系,回歸直線方程有意義;否則尋

找回歸直線方程毫無意義.

3.獨立性檢驗

(1)2X2列聯(lián)表

BB總計

Anwn\i川+

Ani\"22〃2+

總計n+\n+2n

其中,!1+=〃1|+川2,〃2+=〃2l+〃22,〃+1=叨1+〃21,〃+2=〃12+"22,〃=〃11+〃21+川2+〃22.

Q)/2統(tǒng)計量

〃(四心一絲如2

町+〃2+〃+J/Z+2

(3)兩個臨界值:3.841與6.635

當作>3.841時,有95%的把握說事件A與8有關;

當/>6.635時,有99%的把握說事件A與B有關;

當/W3.841時,認為事件A與8是無關的.

1.解決分層抽樣的常用公式

先確定抽樣比,然后把各層個體數(shù)乘以抽樣比,即得各層要抽取的個體數(shù).

(I)抽樣比=一=一;

⑵層1的容量:層2的容量:層3的容量=樣本中層1的容量:樣本中層2的容量:樣本中層3的容量.

2.統(tǒng)計圖表人類辨識影像的能力要優(yōu)於辨識文字與數(shù)字的能力,因此我們采用圖形的方式來展現(xiàn)數(shù)據(jù)時,常常

不我們直接觀察數(shù)據(jù)要來的快.

3.平均數(shù)反映了數(shù)據(jù)取值的平均水平;標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小.標準差、方

差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標準差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.

4.獨立性檢驗的一般步驟

①根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表;

②根據(jù)公式爛=計算X的值;

abcdacbd

③查表比較心與臨界值的大小關系,作出統(tǒng)計判斷.

1.(2。22?福建莆田?三模)已知某校有教取工560人,其中女職工240人,現(xiàn)按性別用分層抽樣的方法從該

校教職工中抽取28人,則抽取的男職工人數(shù)與抽取的女職工人數(shù)之差是()

A.2B.4C.6D.8

【答案】B

【分析】根據(jù)分層抽樣的抽取比例計算方法,分別求出抽取人數(shù)中的男女職工人數(shù)即可求解.

【詳解】抽取的女職工人數(shù)為:會240x28=12人

560

抽取的男職工人數(shù)為:28-12=16人

則抽取的男職工人數(shù)與抽取的女職工人數(shù)之差為:16-12=4人

故選:B.

2.(2022?安徽?蕪湖一中三模(文))某學校對高三年級800名學生進行系統(tǒng)抽樣編號分別為001,002,

800,若樣本相鄰的兩個編號為028,068,則樣本中編號最大的為()

A.778B.780C.782D.788

【答案】D

【分析】根據(jù)樣本中兩個相鄰編號求出組距和分組數(shù),再根據(jù)系統(tǒng)抽樣方法即可求出樣本編號最大的一個.

【詳解】???樣本相鄰的兩個編號為028和068,故組距為68—28=40,

由80(—40=20知樣本容量為20,

系統(tǒng)抽樣時分為20組:001-040,041-080,760-800,

???從第I組抽出的數(shù)據(jù)為028????從第20組抽出的數(shù)據(jù)為760+28=788.

故選:D.

3.(2021北京市通州區(qū)高三上期中)某單位有男職工56人,女職工42人,按性別分層,用分層隨機抽樣的

方法從全體職工中抽出一個樣本,如果樣本按比例分配,男職工抽取的人數(shù)為16人,則女職工抽取的人數(shù)

為()

A.12B.20C.24D.28

【答案】A

【分析】根據(jù)題意,結合分層抽樣的計算方法,即可求解.

【詳解】根據(jù)題意,設抽取的樣本人數(shù)為〃,

因男職工抽取的人數(shù)為一迎一=16,所以〃=28,因此女職工抽取的人數(shù)為28—16=12(人).

56+42

故選:A.

4.(多選題)(2022?福建南平?三模)支氣管炎患者會咳嗽失眠,給患者日常生活帶來嚴重的影響.某醫(yī)院老

年患者治愈率為20%,中年患者治愈率為30%,青年患者治愈率為40%.該醫(yī)院共有600名老年患者,500

名中年患者,400名青年患者,則()

A.若從該醫(yī)院所有患者中抽取容量為30的樣本,老年患者應抽取12人

B.該醫(yī)院青年患者所占的頻率為1

C.該醫(yī)院的平均治愈率為28.7%

D.該醫(yī)院的平均治愈率為31.3%

【答案】ABC

【分析】由分層抽樣即可判斷A選項;直接計算頻率即可判斷B選項;直接計算平均治愈率即可判斷C、

D選項.

600

【詳解】對于A,由分層抽樣可得,老年患者應抽取30x=12人,正確:

600+500+400

4004

對于B,青年患者所占的頻率為—,正確:

600+500+40015

600x20%+500x30%+400x40%

對于C,平均治愈率為=28.7%,正確;

600+500+400

對于D,由C知錯誤.

故選:ABC.

統(tǒng)計圖表

1.(2021廣東省廣雅中學高三上10月月考)小張一星期的總開支分布如圖①所示,一星期的食品開支如圖

②所示,則以下說法正確的是()

阮)②

D.肉類開支占總開支的;

C.娛樂開支比通信開支多50元

【答案】ABC

【分析】根據(jù)圖表信息一一分析可得;

【詳解】解:由食品開支圖,可知食品開支有30+40+1(X)+80+50=300元,所以一星期的總開支

300-30%=1000元,其中儲蓄金額為1000x30%=300元,故A正確;

日常開支為1000x20%=200元,故日常開支比食品中的其他開支多150元.故B正確;

娛樂開支比通信開支多1000x(10%_5%)=50元,故C正確;

肉類開支占總開支的100+1000=,,故D錯誤;

故選:ABC

2.(2021四川省資陽市高三第一次診斷)我國在2020年如期完成了新時代脫貧攻堅目標任務,脫貧攻堅戰(zhàn)

取得全面勝利,歷史性地解決了絕對貧困問題,并全面建成了小康社會.現(xiàn)就2013—2019年年末全國農(nóng)村

貧困人口數(shù)進行了統(tǒng)計,制成如下散點圖:

y/萬人2013-2019年年末全國農(nóng)村貧困人II數(shù)

8COO?

6000?

4000?

2(X)0?

0123456781/年份代碼

據(jù)此散點圖,下面4個回歸方程類型中最適宜作為年末貧困人數(shù))'和年份代碼工的回歸方程類型的是()

A.y=a+bxB.y=a+—C.y=a+bexD.y=a+b\nx

x

【答案】A

【分析】結合散點圖中點的分布特征即可得出結果.

【詳解】由散點圖可知所有的點幾乎分布在一條直線上,結合選項可知選A,

故選:A.

3.(2021廣東省部分學校高三上11月大聯(lián)考)中國互聯(lián)網(wǎng)絡信息中心(CNWC)發(fā)布了第46次《中國互

聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》,報告公布了截至2020年6月的中國互聯(lián)網(wǎng)狀況數(shù)據(jù)與對比數(shù)據(jù),根據(jù)下圖,下

A.2020年6月我國網(wǎng)民規(guī)模接近9.4億,相比2020年3月新增網(wǎng)民3625萬

B.2020年6月我國互聯(lián)網(wǎng)普及率達到67%,相比2020年3月增長2.5%

C.2018年12月我國互聯(lián)網(wǎng)普及率不到60%,經(jīng)過半年后普及率超過60%

D.2018年6月我國網(wǎng)民規(guī)模比2017年6月我國網(wǎng)民規(guī)模增加的百分比大于7%

【答案】D

【分析】結合圖表直接判斷和計算即可.

【詳解】對A,由圖可知,新增網(wǎng)民數(shù)為:93984-90359=3625萬,正確;

對B,讀圖可直接判斷正確;

對C,讀圖可直接判斷正確;

對D,2018年6月我國網(wǎng)民規(guī)模比2017年6月我國網(wǎng)民規(guī)模增加的比例為:

80166-75116_5050<-^2_=—?0.067<7%,故D錯誤.

75116-75116750001500

故選:D

4.(2021山西省長治市第八中學高三上階段性測評)隨著2022年北京冬奧會臨近,中國冰雪產(chǎn)業(yè)快速發(fā)展,

冰雪運動人數(shù)快速上升,冰雪運動市場需求得到釋放,將引領相關戶外用品行業(yè)市場增長.下面是2013年

至2020年中國雪場滑雪人次(萬人次)與同比增長率(與上一年相比)的統(tǒng)計情況,則下面結論中正確的

是()

30.00%

20.00%

10.00%

0.00%

-10.00%

-20.00%

-30.00%

-40.00%

-50.00%

20132014201520162017201820192020

口中國雪場滑雪人次(萬人次)一同比增長率

A.2013年至2020年,中國雪場滑雪人次的同比增長率逐年減少

B.233年至2020年,中國雪場滑雪人次逐年增加

C.233年至2020年,中國雪場滑雪人次的年增加量相近

D.2013年到2020年,中國雪場滑雪人次在2020年首次出現(xiàn)負增長

【答案】D

【分析】根據(jù)圖中條形統(tǒng)計圖和折線圖的實際意義分析逐個判定即可.

【詳解】對于A,由折線圖可知,2013年至2020年,中國雪場滑雪人次的同比增長率先增長再減小,故A

錯誤;

對于B,由條形統(tǒng)計圖知,2013年至2019年,中國雪場滑雪人次逐年增加,但2020年減少了,故B錯誤;

對于C,由條形圖知,2013年至2020年,中國雪場滑雪人次的年增加量不相近,故C錯誤;

對于D,由條形圖和折線圖,明顯看出2013年到2020年,中國雪場滑雪人次在2020年首次出現(xiàn)負增長,

故D正確.

故選:D

5.(2021河南省重點中學高三上模擬調(diào)研)茶葉源于中國,至今中國仍然是茶葉最大生產(chǎn)國,下圖為

2019—2020年全球主要茶葉生產(chǎn)國調(diào)查數(shù)據(jù).

2019—2020年全球主要茶葉生產(chǎn)國產(chǎn)量分布

單位:萬噸

350.0

300.0

250.0

200.0

150.0

100.0

50.0

0.0

中國印度肯尼亞土耳其斯里蘭卡

□2020B2019

根據(jù)該圖,下列結論中不正確的是()

A.2019年圖中5個國家茶葉產(chǎn)量的中位數(shù)為45.9

B.2020年圖中5個國家茶葉產(chǎn)量比2019年增幅最大的是中國

C.2020年圖中5個國家茶葉總產(chǎn)量超過2019年

D.2020年中國茶葉產(chǎn)量超過其他4個國家之和

【答案】B

【分析】根據(jù)統(tǒng)計圖表提供的數(shù)據(jù)判斷各選項.

【詳解】圖中,2019年的數(shù)據(jù)中間的一個是45.9,A正確;

2020年圖中5個國家茶葉產(chǎn)量比2019年增幅最大的是肯尼亞£xl00%,B錯;

45.9

2020年圖中5個國家茶葉總產(chǎn)量比2019年總產(chǎn)量的差是18.7-13.4+11-2+1=14.4>0,

C正確;

2020年圖中125.6+56.9+28+27.8=238.3<298.6,D正確,

故選:B.

瘦叁著樣本的數(shù)字特征

1.(2021江蘇蘇州模擬)高鐵、掃碼支付、共享單車、網(wǎng)購并稱中國“新四大發(fā)明“,近日對全國100個城市的

共享單車和掃碼支付的使用人數(shù)進行大數(shù)據(jù)分析,其中共享單車使用的人數(shù)分別為幻,及,4,…,xioo,

它們的平均數(shù)為X,方差為其中掃碼支付使用的人數(shù)分別為3xi+2,3X2-F2,3x3+2,...?3MOO+2,

它們的平均數(shù)為亞.,方差為則仃?,力分別為()

A.31+2,3s2+2B.31,3/

C.3x+2,9s2D.3工+2,9J2+2

【答案】C

【解析】由平均數(shù)的計算公式,可得數(shù)據(jù)用,電…,R00的平均數(shù)為1=+3+x2+x3+…+箝00),

數(shù)據(jù)lri+2,3也+2,…,3xioo+2的平均數(shù)為:

11_

I。j[(3彳1+2)+(342+2)+…+(3xioo+2)]=—[3(XI+X2+…+xioo)+2x1OO]=3x+2,

1___

數(shù)據(jù)為,X2,…,MOO的方差為?=X產(chǎn)+⑴一x)2+…+(為00—工產(chǎn)],

數(shù)據(jù)3xi+2,33+2,…,3xioo+2的方差為:

{[(3x1+2)—(3x+2)]2+](3也+2)—(3工+2)]2+...+[(3xioo+2)—(3x+2)p}

1___

=100伊3-X"93-x尸+…+%為的-x)4=9s故選C.

2.(2D21河南省湘豫名校聯(lián)盟高三上11月聯(lián)考)某校為了解學生體能素質(zhì),隨機抽取了50名學生,進行

體能測試.并將這50名學生成績整理得如下頻率分布直方圖.根據(jù)此頻率分布直方圖.下列結論中不正確的是

()

A.這50名學生中成績在[80,100]內(nèi)的人數(shù)占比為20%

B.這50名學生中成績在[60,80)內(nèi)的人數(shù)有26人

C.這50名學生成績的中位數(shù)為70

D.這50名學生的平均成績4=68.2(同一組中的數(shù)據(jù)用該組區(qū)間的中點值做代表)

【答案】C

【分析】利用頻率分布直方圖求解判斷.

【詳解】根據(jù)此頻率分布直方圖,成績在[80,100]內(nèi)的頻率為(0.008+0.012)x10=0.20,所以A正確;

這50名學生中成績在[60,80)內(nèi)的人數(shù)為(0.032+0.020)x10x50=26,所以B正確;

根據(jù)此頻率分布直方圖,(0.008+0.02)x10=0.28<0.5,(0.008+0.02+0.032)x10=0.6>0.5,

可得這50名學生成績的中位數(shù)w(60,70),所以C錯誤:

根據(jù)頻率分布直方圖的平均數(shù)的計算公式,可得:

x=45x0.08+55x0.2+65x0.32+75x0.2+85x0.12+95x0.08=68.2,所以D正確.

故選:C.

受g會線性回歸方程

1.(多選題)(2021山東師范大學附中高三上期中)已知變量X,y之間的經(jīng)驗回歸方程為》=7.6-0.4x,

且變量x,y的數(shù)據(jù)如表所示,則下列說法正確的是()

X681012

y6m32

A.變量工,y之間呈正相關關系B.變量x,y之間呈負相關關系

C.6的值等于5D.該回歸直線必過點(9,4)

【答案】BCD

【分析】將樣本點中心代入回歸直線方程,得出陽的值,再逐一判斷即可.

_6+8+10+12__6+皿+3+2\\+m

【詳解】x=------------=9,y=-----------

444

因為了=7.6—().4亍,所以=7.6—0.4x9,=5,故C正確;

4

因為-o.4<o,所以變量工,y之間呈負相關關系,故A錯誤,B正確;

因為(月9)=(9,4),所以該回歸直線必過點(9,4),故D正確:

故選:BCD

2.(2021福建省寧德市高二上期中聯(lián)考)某電子產(chǎn)品的成本價格由兩部分組成,一是固定成本,二是可變

成本,為確定該產(chǎn)品的成本,進行5次試驗,收集到的數(shù)據(jù)如表:

產(chǎn)品數(shù)X個1020304050

產(chǎn)品總成本(元)6268a8189

由最小二乘法得到回歸方程》=0.67%+54.9,則。=,

【答案】75

【分析】根據(jù)線性回歸方程過樣本中心點進行求解即可.

10+20+30+40+5062+68+4+81+89

【詳解】x==30y=60+0.2。,

55

因為線性回歸方程過樣本中心點,

所以60+0.勿=0.67x30+54.9=4=75,

故答案為:75

3.(“超級全能生”2022屆高三全國卷地區(qū)11月聯(lián)考)自動駕駛汽車依靠5G、人工智能、視覺計算、雷達、

監(jiān)控裝置和全球定位系統(tǒng)協(xié)同合作,讓電腦可以在沒有任何人類主動的操作下,自動安全地操作機動車輛.

近年來全球汽車行業(yè)達成共識,認為自動駕駛代表了未來汽車行業(yè)的發(fā)展方向.實現(xiàn)自動駕駛是一個漸進過

程,國際通用的自動駕駛標準根據(jù)自動駕駛程度逐步提升可以分為5級.L3級自動駕駛也是整個自動駕駛技

術的分水嶺.2016—2020年全球L3滲透率(%)統(tǒng)計表及散點圖如下.

年份20162017201820192020

滲透率(%)0.20.40.61.01.4

.淮透率以%)

1.6

1.4---------------------------------------------?--------

1.2-------------------------------------------------------

1.0.

0.8-------------------------------------------------------

0.6.

0.4-----------------?------------------------------------

0.2.

0____________________________________________

2015201620172018201920202021年份

(1)利用散點圖判斷,y=初和(其中’C,d為大于0的常數(shù))哪一個更適合作為滲透率y和

年份I的回歸方程模型(只要給出判斷即可,不必說明理由);

(2)令x=f—2018,求y關于X的回歸方程;

(3)根據(jù)(2)中回歸模型回答下列問題:

(i)估計2022年全球L3滲透率是多少?

(ii)預計至少要到哪一年,全球£3滲透率能超過10%?

附:回歸直線g=?中斜率和截距的最小二乘估計公式為5

a=yhx-

【答案】(1)>初更適合

⑵y=0.3x+0.72

(3)⑴1.92%;(ii)2049

【分析】(1)根據(jù)散點圖,即可得到丁二。+初更適合作為滲透率y和年份,的回歸方程模型;

(2)由x=f-2018,得5組的對應數(shù)據(jù),利用公式,求得R々的值,即可得到回歸方程;

(3)Ci),=2022,求得y=1.92,即可得到2022年全球£3滲透率;

(ii)令y=0.3x+0.72>10,即可求得到2049年,全球L3滲透率能超過10%.

【小問1詳解】解:根據(jù)散點圖,可知y=〃+4更適合作為滲透率y和年份,的回歸方程模型.

【小問2詳解】解:由4=/—2018,得5組的對應數(shù)據(jù)為(-2,0.2),(-1,0.4),(0,0.6),(1,1.0),(2,1.4),

_55

所以;=0,5=0.72,2七"=3,Zx;=l°,

i=\i=l

9y廠記3-5x0x0,72”?--

所以力=--------=-10—5x02-二°3,則a=y—bx=0.72—0.3X0=0.72,

Vx2i-nx

所以y關于X的線性回歸方程為y=o.3x+0.72.

【小問3詳解】解:(i)令r=2022,可得%=2022-2018—4,此時y=0,3x4+0.72=1.92,

所以估計2022年全球L3滲透率是1.92%.

(ii)令y=0.3x+0.72>10,解得x>30.9*31,r=31+2018=2049,

所以預計至少要到2049年,全球L3滲透率能超過10%.

個亙寶>獨立性檢驗

1.春節(jié)期間,”厲行節(jié)約,反對浪費”之風悄然吹開,某市通過隨機詢問100名性別不同的居民是否能做到“光

盤”行動,得到列聯(lián)表:

分類做不到“光盤”能做到“光盤”

男4510

女3015

由此列聯(lián)表得到正確結論是()

A.在犯錯誤概率不超過1%的前提下,認為“該市居民能否做到‘光盤'與性別有關“

B.在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到‘光盤'與性別無關”

C.在犯錯誤的概率不超過0.1的前提下,認為“該市居民能否做到,光盤'與性別有關“

D.在犯錯誤的概率不超過0.1的前提下,認為“該市居民能否做到,光盤'與性別無關”

【答案】C

【分析】作出列聯(lián)表,求得K?,再與臨界值表對比判斷.

【詳解】列聯(lián)表如下:

分類做不到“光盤”能做到“光盤”總“

男451055

女301545

總計7525100

所以六嘰3。-,且〃(心2.706卜?!?。,

所以在犯錯誤的概率不超過0.1的前提下,認為“該市居民能否做到‘光盤'與性別有關”.

故選:C

2.單位:人

數(shù)學成績

學校合計

不優(yōu)秀(y=o)優(yōu)秀(y=i)

甲校(x=o)331043

乙校(x=l)38745

合計711788

對列聯(lián)表中的數(shù)據(jù),依據(jù)a=0.1的獨立性檢驗,我們已經(jīng)知道獨立性檢驗的結論是學校和成績無關.如果

表中所有數(shù)據(jù)都擴大為原來的10倍,在相同的檢驗標準下,再用獨立性檢驗推斷學校和數(shù)學成績之間的關

聯(lián)性,結論還一樣嗎?請你試著解釋其中的原因.

附:臨界值表:

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

【分析】列出數(shù)據(jù)擴大10倍的2x2列聯(lián)表,計算出/的觀測值,結合獨立性檢驗的基本思想可出結論.

【詳解】數(shù)據(jù)擴大10倍的2x2列聯(lián)表為:

數(shù)學成績

學校合計

不優(yōu)秀(y=o)優(yōu)秀(y=i)

甲校(x=0)330100430

乙校(x=l)38070450

合11710170880

假設”0:學校與數(shù)學成績無關,

由列聯(lián)表數(shù)據(jù)得V2=88°X(33()X70-38()>d()0)

4p8.365>2.706,

430x450x710x170

根據(jù)小概率值a=O.l的獨立性檢驗,我們推斷假設“o不成立,即認為學校與數(shù)學成績有關,

又因為甲校成績優(yōu)秀和不優(yōu)秀的概率分別為攔=0.2326,黑x0.7674,

430430

70380

乙校成績優(yōu)秀和不優(yōu)秀的概率分別為Ka0.1556,?0.8444,

450450

又因為0.2326>0.1556,所以,從甲校、乙校各抽取一個學生,甲校學生數(shù)學成績優(yōu)秀的概率比乙校學

生優(yōu)秀的概率大.

所以,結論不一樣,不一樣的原因在于樣本容量,

當樣本容量越大時,用樣本估計總體的準確性會越高.

1.(2。21年全國高考甲卷)為了解某地農(nóng)村經(jīng)濟情況,對該地農(nóng)戶家庭年收入進行抽樣調(diào)查,將農(nóng)戶家庭

年收入的調(diào)查數(shù)據(jù)整理得到如下頻率分布直方圖:

八墀

根據(jù)此頻率分布直方圖,下面結論中不正確的是()

A.該地農(nóng)戶家庭年收入低于4.5萬元的農(nóng)戶比率估計為6%

B.該地農(nóng)戶家庭年收入不低于1U.5萬元的農(nóng)戶比率估計為10%

C.估計該地農(nóng)戶家庭年收入的平均值不超過6.5萬元

D.估計該地有一半以上的農(nóng)戶,其家庭年收入介于4.5萬元至8.5萬元之間

【答案】C

【分析】根據(jù)直方圖的意義直接計算相應范圍內(nèi)的頻率,即可判定ABD,以各組的中間值作為代表乘以相應

的頻率,然后求和即得到樣本的平均數(shù)的估計值,也就是總體平均值的估計值,計算后即可判定C.

【詳解】因為頻率直方圖中的組距為1,所以各組的直方圖的高度等于頻率樣本頻率直方圖中的頻率即可

作為息體的相應比率的估計值.

該地農(nóng)戶家庭年收入低于4.5萬元的農(nóng)戶的比率估計值為0.02+0.04=0.06=6%,故A正確;

該地農(nóng)戶家庭年收入不低于10.5萬元的農(nóng)戶比率估計值為0.04+0.02x3=0.10=10%、故B正確;

該地農(nóng)戶家庭年收入介于4.5萬元至8.5萬元之間的比例估計值為

0.10+0.14+0.20x2=0.64=64%>50%.故D正確;

該地農(nóng)戶家庭年收入的平均值的估計值為

3x0.02+4x0.04+5x0.10+6x0.14+7x0.20+8x0.20+9x0.10+10x0.10+11x0.04+12x0.02+13x0.02+14x0.02=7.68(737U)?超過

6.5萬元,故C錯誤.

綜上,給出結論中不正確的是C.

故選:C.

【點睛】本題考查利用樣本頻率直方圖估計總體頻率和平均值,屬基礎題,樣本的頻率可作為總體的頻率

的估計值,樣本的平均值的估計值是各組的中間值乘以其相應頻率然后求和所得值,可以作為總體的平均

值的估計值.注意各組的頻率等于集X組距.

組距

2.(2020年全國統(tǒng)一高考(新課標I))某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單

位:℃)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(心切)(,=1,2,,20)得到下面

的散點圖:

由此散點圖,在10。(2至40。(2之間,下面四個回歸方程類型中最適宜作為發(fā)芽率),和溫度x的回歸方程類

型的是()

A.y=a+bxB.y=a+bx2

C.y=a+bexD.y=a+b\nx

【答案】D

【分析】根據(jù)散點圖的分布可選擇合適的函數(shù)模型.

【詳解】由散點圖分布可知,散點圖分布在一個對數(shù)函數(shù)的圖象附近,

因此,最適合件為發(fā)芽率y和溫度x的回歸方程類型的是y=a+h\nx.

故選:D.

【點睛】本題考查函數(shù)模型的選擇,主要觀察散點圖的分布,屬于基礎題.

3.(多選題)(2021年全國新高考I卷)有一組樣本數(shù)據(jù)為,…,乙,在這組數(shù)據(jù)得到新樣本數(shù)據(jù)y,

力,…,L,其中V=%+c(,=l,2,…,〃),c為非零常數(shù),則()

A.兩組樣本數(shù)據(jù)的樣本平均數(shù)相同

B.兩組樣本數(shù)據(jù)的樣本中位數(shù)相同

C.兩組樣本數(shù)據(jù)的樣本標準差相同

D.兩組樣本數(shù)據(jù)的樣本極差相同

【答案】CD

【分析】A、C利用兩組數(shù)據(jù)的線性關系有E(y)=E(x)+c、5y)=5%),即可判斷正誤;根據(jù)中位數(shù)、

極差的定義,結合已知線性關系可判斷B、D的正誤.

【詳解】A:E(y)=E(x+c)=E(x)+c且CHO,故平均數(shù)不相同,錯誤;

B:若第一組中位數(shù)為七,則第二組的中位數(shù)為y=W+c,顯然不相同,錯誤;

C:ZX),)=O(x)+£>(c)=O(x),故方差相同,正確:

D:由極差的定義知:若第一組的極差為%ax-/而,則第二組的極差為

%ax-Xnin="max+。)-&min+。)=蒼皿一%min,故極差相同,正確;

故選:CD

4.(2021年全國高考乙卷)某廠研制了一種生產(chǎn)高精產(chǎn)品的設備,為檢驗新設備生產(chǎn)產(chǎn)品的某項指標有無

提高,用一臺舊設備和一臺新設備各生產(chǎn)了10件產(chǎn)品,得到各件產(chǎn)品該項指標數(shù)據(jù)如下:

舊設備9.810310.010.29.99.810.010.110.29.7

新設備10.110.410.110.010.110.310.610.510.410.5

舊設備和新設備生產(chǎn)產(chǎn)品的該項指標的樣本平均數(shù)分別記為最和亍,樣本方差分別記為s;和

(1)求X9y9S],,2;

/2~

(2)判斷新設備生產(chǎn)產(chǎn)品的該項指標的均值較舊設備是否有顯著提高(如果干一了之2,五芳■,則認為

新設備生產(chǎn)產(chǎn)品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).

【答案】(1)7=1O,G=1O.3,S;=0.036,s;=0.04;(2)新設備生產(chǎn)產(chǎn)品的該項指標的均值較舊設備有顯

著提高.

【分析】(1)根據(jù)平均數(shù)和方差的計算方法,計算出平均數(shù)和方差.

(2)根據(jù)題目所給判斷依據(jù),結合(1)的結論進行判斷.

……-9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.79

【洋解】(1)x=---------------------------------------------------=10,

10

-10.1+10.4+10.1+104-10.1+10.34-10.6+10.5+10.4+10.5…

y=--------------------------------------------------------=10.3,

10

2"+0.32+0+"+0.%"+0+01+0.22+0.32=0C6,

s「=

10

0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.22八八,

--------------------------------------------------------=0.04.

10

(2)依題意,G—嚏=0.3=2x0.15=2而正=2血質(zhì)X,20.036+0.04=2^0.0076,

10

亍_工之2后薩,所以新設備生產(chǎn)產(chǎn)品的該項指標的均值較舊設備有顯著提高.

5.(2021年全國高考甲卷)甲、乙兩臺機床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和二級品,為了比較兩

臺機床產(chǎn)品的質(zhì)量,分別用兩臺機床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計如下表:

一級品二級品合計

甲機床15050200

乙機床12080200

合計270130400

(1)甲機床、乙機床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?

(2)能否有99%的把握認為甲機床的產(chǎn)品質(zhì)量與乙機床的產(chǎn)品質(zhì)量有差異?

n(ad-bc)2

附:K2=

(a+b)(c+d)(a+c)(Z?+d)

P(K2>k)0.0500.0100.001

k3.8416.63510.828

【答案】(1)75%;60%;(2)能.

【分析】根據(jù)給出公式計算即可

【詳解】(1)甲機床生產(chǎn)的產(chǎn)品中的一級品的頻率為鐺=75%,

200

19()

乙機床生產(chǎn)的產(chǎn)品中的一級品的頻率為一=60%.

200

2

⑵^=400(150X80-120X50)=400>I0>6J63S

?.70xl30x?00x?0039

故能有99%的把握認為甲機床的產(chǎn)品與乙機床的產(chǎn)品質(zhì)量有差異.

6.(2020年全國統(tǒng)一高考(新課標II))某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所

增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣

的方法抽取20個作為樣區(qū),調(diào)杳得到樣本數(shù)據(jù)?,y/)(/=l,2,…,20),其中樂和y,?分別表示第i個樣區(qū)的

2()2020

植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得2七=6。,W>,=1200,2(七一幻2=80,

/-Ir-1f-1

2020

£(y-?=9000,£(X/.-x)(x-y)=800.

1=1f=l

(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均

數(shù)乘以地塊數(shù));

(2)求樣本(孫y)(i=l,2,...?20)的相關系數(shù)(精確到0.01);

(3)艱據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物

數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.

附:相關系數(shù)尸I/〃,JSH.414.

住a-君吃

Vr=li=l

【答案】(1)12000;(2)0.94;(3)詳見解析

【分析】(1)利用野生動物數(shù)量的估計值等于樣區(qū)野生動物平均數(shù)乘以地塊數(shù),代入數(shù)據(jù)即可;

20__

Z(x7)(凹一))

(2)利用公式—=下尹-----------------?計算即可;

Vi=li=l

(3)各地塊間植物覆蓋面積差異較大,為提高樣本數(shù)據(jù)的代表性,應采用分層抽樣.

1201

【詳解】(1)樣區(qū)野生動物平均數(shù)為7;E>=7;X12()()=6(),

2Uj=i2U

地塊數(shù)為200,該地區(qū)這種野生動物的估計值為200x60=12000

(2)樣本(七,凹.)(,=1,2,...?20)的相關系數(shù)為

20

?斗-無)(凹-刃

800

0.94

Ho20-一*

780x9000

心a-亍花(%-刃2

(3)由(2)知各樣區(qū)的這種野生動物的數(shù)量與植物覆蓋面積有很強的正相關性,

由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物的數(shù)量差異很大,

采用分層抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,

從而可以獲得該地區(qū)這種野生動物數(shù)量更準確的估計.

【點睛】本題主要考查平均數(shù)的估計值、相關系數(shù)的計算以及抽樣方法的選取,考查學生數(shù)學運算能力,

是一道容易題.

一、單選題

1.(2022?湖南岳陽?三模)已知一組數(shù)據(jù):牛法看的平均數(shù)是5,方差是4,則由。+1,2g+1,2&+1和U

這四個數(shù)據(jù)組成的新數(shù)據(jù)組的方差是()

A.16B.14C.12D.11

【答案】C

【分析】根據(jù)平均數(shù)、方差公式計算可得;

【詳解】解:由已知得%+9+七=15,(%-5)2+(電-5)2+(b-5)2=12,

則新數(shù)據(jù)的平均數(shù)為;3+1+2^+1+2/-1+11)=2?…=

所以方差為;[(2%+171)2+(2馬+1-11)2+(久+1-11)2+(11—11)2],

=-[4(.r-5)2+4(x,-5)2+4(妙-5)2]=(x)-5)2+(x,-5)2+(^-5)2=12,

41

故選:C.

2.(2022?遼寧遼陽?二模)為了解某地高三學生的期末語文考試成績,研究人員隨機抽取了100名學生對其

進行調(diào)查,根據(jù)所得數(shù)據(jù)制成如圖所示的頻率分布直方圖,已知不低于90分為及格,則這100名學生期末

語文成績的及格率為()

A.40%B.50%C.60%D.65%

【答案】C

【分析】利用直方圖求頻率即得.

【詳解】依題意可得及格率為1—20x(0.006+0.014)=0.6=60%.

故選:C.

3.(2022?天津河北?二模)為了解中學生的身高情況,某部門隨機抽取了某學校的學牛,將他們的身高數(shù)據(jù)

(單位:cm)^[150,160),[160,170),[170,180),[180,190]分組,繪制成如圖所示的頻率分布直方

圖,其中身高在區(qū)間[170,180)內(nèi)的人數(shù)為300,身高在區(qū)間[160,170)內(nèi)的人數(shù)為180,則a的值為()

A.0.03B.0.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論