2025年新高考數(shù)學復習壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第1頁
2025年新高考數(shù)學復習壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第2頁
2025年新高考數(shù)學復習壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第3頁
2025年新高考數(shù)學復習壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第4頁
2025年新高考數(shù)學復習壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

專題03概率與統(tǒng)計下的新定義

【題型歸納目錄】

題型一:二項式定理新定義

題型二:排列組合新定義

題型三:概率新定義

題型四:統(tǒng)計方法新定義

題型五:信息端問題

【方法技巧與總結(jié)】

解概率與統(tǒng)計下的新定義題,就是要細讀定義關鍵詞,理解本質(zhì)特征,適時轉(zhuǎn)化為“熟悉”問題.總

之,解決此類問題,取決于己有知識、技能、數(shù)學思想的掌握和基本活動經(jīng)驗的積累,還需要不斷的實踐

和反思,不然就談不上“自然”的、完整的解題.

【典型例題】

題型一:二項式定理新定義

【典例1-1】(2024?湖南衡陽?二模)莫比烏斯函數(shù)在數(shù)論中有著廣泛的應用.所有大于1的正整數(shù)”都可以

被唯一表示為有限個質(zhì)數(shù)的乘積形式:九=可席…優(yōu)(左為”的質(zhì)因數(shù)個數(shù),P,為質(zhì)數(shù),

=例如:90=2X32X5>對應1=3,R=2,%=3,2=5,==1,2=2,,=1.現(xiàn)對任意

l,n=l

〃eN*,定義莫比烏斯函數(shù)〃⑺=<(一球,4=4=,,,=〃=1

0,存在01

⑴求〃(78),〃075);

(2)若正整數(shù)%〉互質(zhì),證明:〃(孫)=〃(耳〃(耳;

⑶若〃>1且〃(〃)=1,記〃的所有真因數(shù)(除了1和"以外的因數(shù))依次為如出,…,4”,證明:

〃(《)+〃(出)+…+〃(%)=—2?

【解析】(1)因為78=2x3x13,易知左=3,0=2,p2=3,p3=13,z;=1,^=1,^=1,

所以〃(78)=(—1)3=—1;

又375=3x53,因為5的指數(shù)3>1,所以〃(375)=0;

⑵①若x=l或。=1,因為〃⑴=1,所以〃(孫)=

②若尤,ywi,且存在質(zhì)數(shù)。,使得x或y的質(zhì)因數(shù)分解中包含//(廠>1),則w的質(zhì)因數(shù)分解中一定也包含

p',

所以〃(孫)==°,

③若羽ywl,且不存在②中的P,可設x=“02…=…%,

其中P1,P2…口1,4"%…%均為質(zhì)數(shù),則?=P|P?…040…4,

因為尤,y互質(zhì),所以Pi,p『5""%…p互不相等,

所以M孫)=(一1戶=(T>(T)'=〃(*)〃(y),

綜上可知M盯)=〃(力〃3

(3)由于〃(")=1,所以可設“="。2…P”k為偶數(shù),

”的所有因數(shù),除了1之外都是R,P2,…,"中的若干個數(shù)的乘積,從%個質(zhì)數(shù)中任選《,=1,2,…,女)個數(shù)的

乘積一共有C;種結(jié)果,

所以〃⑴+〃(%)+4(%)+…+4(4)+〃(〃)

=〃(l)+[〃(Pl)+〃(〃)+…+〃(〃)]+[〃(。1。2)+〃(。2。3)+…+〃(PlPj]+…+〃(〃)

=I+C1(T)+C(T)2+…+優(yōu)(一1廣+(一以=(1一1)*=。,

所以…=O_"(l)_M(n)=—2.

【典例1-2】(2024.安徽合肥?一模)“4-數(shù)”在量子代數(shù)研究中發(fā)揮了重要作用.設q是非零實數(shù),對任意

〃cN*,定義“4-數(shù)”(嘰=1+4++/T利用“4-數(shù)”可定義“4-階乘"("/二⑴涅山(初,且(0兒=1.和

“4—組合數(shù)”,即對任意上eN,附eN*,kW力

⑴計算:

(2)證明:對于任意左,〃wN*,左+1?〃,

n+m+l\(〃\C

⑶證明:對于任意%,加£N,〃6N*,左+1<〃,

【解析】(1)由定義可知,

[5)=⑸!2⑴2⑵2⑶式4)2(5)2

【31一(3)!2(2)C[(1)2(2)2(3)2][(1)2(2)2]

_(4)式5)2_(1+2+22+23乂1+2+22+23+2,).⑶

⑴2⑵21X0+2))

(磯5)/(1/

(左)!“〃一女兒[k}\q{n-k)\q

n-1n-1n八5

+qk?q+?q

k-1k傳T)!“〃_女兒。兒("%T兒

qq

=(小

kklknkx

又(k)q+q\n-k)q=l+q++q~+q(\+q++q~~)

=l+q++/i=(心

所以m+1

(3)由定義得:

對任意keN,weN*,后

結(jié)合(2)可知

n+m+1n+m\n+m-kn+m

所以

z+1k+1k

qqq

n+m

\Jn+m-\\=,_Jn+m-1

k+1k

k+1[I)qI

上述加+i個等式兩邊分別相加得:

([n+%m+1+l\(n「孕工’Ink+i:\

【變式1-1](2024?高三.江蘇蘇州?階段練習)甲、乙、丙三人以正四棱錐和正三棱柱為研究對象,設棱長為

”,若甲從其中一個底面邊長和高都為2的正四棱錐的5個頂點中隨機選取3個點構(gòu)成三角形,定義隨機變

量X的值為其三角形的面積;若乙從正四棱錐(和甲研究的四棱錐一樣)的8條棱中任取2條,定義隨機變量

4的值為這兩條棱的夾角大小(弧度制);若丙從正三棱柱的9條棱中任取2條,定義隨機變量”的值為這兩

條棱的夾角大?。ɑ《戎疲?

(1)比較三種隨機變量的數(shù)學期望大?。唬▍⒖紨?shù)據(jù)

arctan^5?0.3661,arctan?0.2677,arctan2^2?0.3918)

(2)現(xiàn)單獨研究棱長",記(x+l)x(x+gjx+且〃eN*),其展開式中含x項的系數(shù)為S“,含

f項的系數(shù)為T”.

①若*a/+b"+c,對"=2,3,4成立,求實數(shù)b,c的值;

②對①中的實數(shù)。,b,c用數(shù)字歸納法證明:對任意〃22且“eN*,3=M2+加+。都成立.

【解析】(1)如圖所示:

由題意設。/為正四棱錐。-ABCE的高,G為A3中點,

由于正四棱錐的底面邊長和高都是2,

所以AC=BE=2&,£>B=2,所以=

由對稱性以及三線合一可知DG=后斤=V5,

若甲從其中一個底面邊長和高都為2的正四棱錐的5個頂點中隨機選取3個點構(gòu)成三角形,

則X的所有可能取值為]x2x2=2,x2x岔=6,x2&x2=2近,

222

且P(X=2)="=|,尸(X=2碼=,.中=&)=卷=|,

所以個)=(>2+“應+|x如=4+22+2占>4+2X;+2X2=2,

若乙從正四棱錐(和甲研究的四棱錐一樣)的8條棱中任取2條,

則4的所有可能取值為"I,。,arctan君,arctan]g,arctan272,

廠/八714c22

E<)=—x-----i-Ox-----1-arctan一+arctan2^2x

v7228282828

代入?yún)⒖紨?shù)據(jù)arctan#i?0.3661,arctanX0.2677,arctan2V2?0.3918,得1.0890,

M

若丙從正三棱柱的9條棱中任取2條,

則力的所有可能取值為1TT*TT0,

兀187112c613KY……

磯〃)=—x-----1——x-----FOX——=——?1.1345

2363363636

所以E(X)>磯叼〉E?.

(2)①因為(x+l)x[x+g]xx[x+)]中x項的系數(shù)為S",

一般地,從(x+l)x(x+;卜x[x+:]中的第七個因式中取一個x,其余因式中取常數(shù)即可得到一個x

項,

知在k1+2++nn(n+1)

而這一項的系數(shù)為一;,S=---------------=———-)

n\nn\2-nl

因為(尤+l)x(x+g)x+中f項的系數(shù)為T“,

一般地,從(x+l)x[x+g]xx[x+:]中的第個因式中各取一個x,其余因式中取常數(shù)即可得到

一個/項,

,,]

而這一項的系數(shù)為之,從而Eij,

n\^\<i<j<n

2x333x44x55

從而S==1,S4=

22x2!22x3!2x4!"12?

旦1X2+1X3+2X3JIx2+lx3+lx4+2x3+2x4+3x435

22!33!644!"24

4a+2b+c=—=—

S23

由題意中+3"W解得“4,八-5c=J

16a+4b+c=—=—

邑2

—T,3ra2-n-2+Z

②用數(shù)學歸納法證明:“22且〃eN*時,-^=an2+bn+c=---=~卷——

7^__j__2_

--

當〃=2時,s233-4126,故結(jié)論對〃=2成立,

2

假設結(jié)論對n=k22,keN*成立,即今=合爐=(1譬+2),

、k1/iz

k\Tk/x

幾I+_%!看+信+1)(1+2++%)_人工+化+1"!&_聽+1+)

IJI11=----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

加優(yōu)+1)!加(左+1)!%45+優(yōu)+1)1+A±1

黑+化+1)--1)"+2)+%+1

k+i-_

i+---------------i+—

1+2+…+左k

_("0(3左+2)+12左+12_3/+11)+10_信+2乂3左+5)

[(A+1)-1工3(左+1)+2]

12

所以結(jié)論對〃=左+1也成立,

故?=?!?+bw+c=^---------------,對任意"22,”eN”成立.

S.12

題型二:排列組合新定義

【典例2-1】(2024.高三.北京.階段練習)設"為正整數(shù),集合A={a|a=外,*{01},左=1,2,,n.

對于集合A中的任意元素£=(玉,々,…,%)和分=定義

1(%月)=|%一乂|+卜一對++\xn-yn\-

⑴當”=4時,若以=(0,1,0,1),若=(1,1,0,1),直接寫出所有使d(a,7)=2,d(Q,7)=3同時成立的A的元素

⑵當〃=3時,設3是A的子集,且滿足:對于3中的任意兩個不同元素a,回北%夕)22.求集合3中元素

個數(shù)的最大值;

⑶給定不小于2的“,設8是A的子集,且滿足:對于3中的任意兩個不同的元素以£,〃(0,022,寫出

一個集合8,使其元素個數(shù)最多,并說明理由.

【解析】⑴?.?=(0,l,0,l),J(a,y)=2

???滿足條件的/有

a0101

Y0000

ye{(0,0,0,。),(0,0,1,1),(0,1,1,0)}(2)列出集合4的元素

000

001

010

011

100

101

110

111

B是A的子集,且滿足:對于B中的任意兩個不同元素a,p,d(a,£巨2

滿足條件的集合8的元素的個數(shù)的最大值為4.

001

010

100

111

(3).d(a,夕巨2

???8中的元素應該含有奇數(shù)個1

若"=2,則含有奇數(shù)個1的元素有C;=2個;

若n=3,則含有奇數(shù)個1的元素有1+優(yōu)=4個;

若n=4,則含有奇數(shù)個1的元素有《+優(yōu)=8個;

若"=5,則含有奇數(shù)個1的元素有《+《+雋=16個;

當〃=3時,B={(0,0,1),(0,1,0),(1,0,0),(1,1,1))

【典例2-2】(2024?高三?浙江?開學考試)一般地,〃元有序?qū)崝?shù)對(%,%,,、耳)稱為“維向量.對于兩個〃維

向量。=(4,出,,%),6=(4也,也),定義:兩點間距離d=J(4-aJ?+色一的J+…+(X-%利用

“維向量的運算可以解決許多統(tǒng)計學問題.其中,依據(jù)“距離”分類是一種常用的分類方法:計算向量與每個

標準點的距離4,,與哪個標準點的距離4最近就歸為哪類.某公司對應聘員工的不同方面能力進行測試,

得到業(yè)務能力分值(卬)、管理能力分值(%)、計算機能力分值(%)、溝通能力分值(%)(分值

%eN*,^e{l,2,3,4}代表要求度,l分最低,5分最高)并形成測試報告.不同崗位的具體要求見下表:

業(yè)務能力分值管理能力分值計算機能力分值溝通能力分值合計分

崗位

(4)(%)3)(%)值

會計⑴215412

業(yè)務員

523515

后勤⑶235313

管理員

454417

(4)

對應聘者的能力報告進行四維距離計算,可得到其最適合的崗位.設四種能力分值分別對應四維向量

"=的四個坐標.

(1)將這四個崗位合計分值從小到大排列得到一組數(shù)據(jù),直接寫出這組數(shù)據(jù)的第三四分位數(shù);

(2)小剛與小明到該公司應聘,已知:只有四個崗位的擬合距離的平方力均小于20的應聘者才能被招錄.

⑴小剛測試報告上的四種能力分值為4=(4,3,2,5),將這組數(shù)據(jù)看成四維向量中的一個點,將四種職業(yè)

123、4的分值要求看成樣本點,分析小剛最適合哪個崗位;

(ii)小明已經(jīng)被該公司招錄,其測試報告經(jīng)公司計算得到四種職業(yè)1、2、3、4的推薦率(0分別為

而14石13石9‘熱7(?"行"試d2求小明]的各項能力分信

【解析】⑴將四個崗位合計分值從小到大排列得到數(shù)據(jù)12,13,15,17,

又,="0=4x0.75=3,所以這組數(shù)據(jù)的第三四分位數(shù)為號2=16.

(2)⑴由圖表知,會計崗位的樣本點為4=(2』,5,4),則葉=(2-4)2+(1-3)2+(5-2)2+(4-5)2=18,

業(yè)務員崗位的樣本點為分=(5,2,3,5),則d;=(5-4>+(2-3>+(3-2)2+(5-5)2=3,

后勤崗位的樣本點為鳳=(2,3,5,3),則d;=(2-4>+(3-3>+(5-2f+(3-=17,

管理員崗位的樣本點為力,=(4,5,4,4),則/=(4-4)2+(5-3)2+(4-2>+(4-5)2=9,

所以&<&<&<4,故小剛最適合業(yè)務員崗位.

?四種職業(yè)1234的推薦率⑺分別為m,。且。"力+小?廠

力14

14T幺+++

d;+d;+d;+d:43-

43

d;_1341332逍4

=一I+++

+d;++d;4343

9

所以■j2,得到

一d&

dl9-+++

d;+d;+d;+d:4343

7

4T成d2*

d;_7-++3+

d;+d;+d;+d;4343

又d:(ne{1,2,3,4})均小于20,所以#+召+存+或<80,且/eN*(海{1,2,3,4}),

故可得到片=14,以=13,據(jù)=9,或=7,

設小明業(yè)務能力分值、管理能力分值、計算機能力分值、溝通能力分值分別為a,》,Gd,且a,b,c,deN*,

l<a,b,c.d<5,

依題有(〃-2)2+(b—I)?+(c-5)2+(d-4)2=d;=14①,

(a-5)2+(b-2)2+(c-3)2+(d-5)2=dl=13(2),

(a-2y+S-3y+(c-5y+(d-3>=d;=9③,

(a—4/+S—5)2+(c—4/+(d—4)2=d:=7④,

由①一③得,

(a-2)2+(Z?-1)2+(c-5)2+(rf-4)2-[(a-2)2+(b-3)2+(c-5)2+(^-3)2]=14-9=5,

整理得:2b—d=3,

b=2,d=l

故有<0=3,d=3三組正整數(shù)解,

b=4,d=5

對于第一組解,代入④式有(a-4)2+9+(c-4)2+9=7,不成立;

對于第二組解,代入①式有(。-2)2+(c-5)2=4,

缶=4[a—1

解得「或。,代入②④式均不成立;

[c=51c=3

對于第三組解,代入②式有5-5)2+(c-3)2=9,

4=2

\a=1…………b=4

解得,,代入①②③④均成立,故,;

[c=3c=3

d=5

故小明業(yè)務能力分值、管理能力分值、計算機能力分值、溝通能力分值分別為2,4,3,5.

題型三:概率新定義

【典例3-1】(2024?浙江?一模)混管病毒檢測是應對單管病毒檢測效率低下的問題,出現(xiàn)的一個創(chuàng)新病毒檢

測策略,混管檢測結(jié)果為陰性,則參與該混管檢測的所有人均為陰性,混管檢測結(jié)果為陽性,則參與該混

管檢測的人中至少有一人為陽性.假設一組樣本有N個人,每個人患病毒的概率相互獨立且均為

目前,我們采用K人混管病毒檢測,定義成本函數(shù)/(Xjut+XX,這里X指該組樣本N

個人中患病毒的人數(shù).

⑴證明:E[〃X)]Z2JF.N;

(2)若OvpvlOr104KW20.證明:某混管檢測結(jié)果為陽性,則參與該混管檢測的人中大概率恰有一人

為陽性.

【解析】⑴由題意可得X滿足二項分布XB(N,p),

由E(aX+6)=aE(X)+。知,E\_f(X)l=—+K-E(X)=—+K-pN>2^-N,當且僅當,=&時取等

KKK

號;

(2)記A=p(混管中恰有1例陽性|混管檢測結(jié)果為陽性),

4=p(混管中恰有i例陽性尸C,KP’(1一p廣,i=0,1,,K,

令/z(x)=e-_2/]0-3<彳<2乂]0-3,

則=

當xe(-2xl(F3,0)時,/z(x)為單調(diào)遞減,

當xe(0,2x10-3)時,〃")>o,為單調(diào)遞增,所以〃(x)N〃(O)=O,

2xlo-3-32xl-3

且〃(-2x10-3)=e--(-2xlO^-l-O,/z(2xl0)=e°-(2x10^)-1~0,

所以當—2xl(f3<x<2xl(f3,e,-尤—IBO即e,~x+l,兩邊取自然對數(shù)可得%句110+1),

所以當0<P<1()Y,10WKV20時,

所以(1_?>=6.。切?e7Kp?1—Kp,

4_"(1-廣&[1-伍一1)同

貝”=

i-]-(1-域Kp

故某混管檢測結(jié)果為陽性,則參與該混管檢測的人中大概率恰有一人為陽性.

【典例3-2】(2024?遼寧?模擬預測)條件概率與條件期望是現(xiàn)代概率體系中的重要概念.近年來,隨著人們對

隨機現(xiàn)象的不斷觀察和研究,條件概率和條件期望已經(jīng)被廣泛的利用到日常生產(chǎn)生活中.定義:設X,Y是

離散型隨機變量,則X在給定事件丫=》條件下的期望為

P(X=x^Y=y}(、

E(XW=y)=,P(X=尤/y=y)=>再■l',其中{4%,…,當}為X的所有可能取值集合,

i=li=lrv-y)

p(X=x,y=y)表示事件“x=x”與事件“Y=y”都發(fā)生的概率.某射擊手進行射擊訓練,每次射擊擊中目

標的概率均為p(0<〃<l),射擊進行到擊中目標兩次時停止.設J表示第一次擊中目標時的射擊次數(shù),"表

示第二次擊中目標時的射擊次數(shù).

⑴求尸仁=2,〃=5),尸(〃=5);

(2)求E(的=5),22).

【解析】(1)由題設,P值=2,〃=5)=(1—。>,(1一。>(1—。)/=(1一。)3/,

尸何=5)=C(1一。只/=縱1一pFp2.

(2)由題設,夙目〃=5)=1[%><?(J=x,,〃=5)

i=l尸(〃=5)

P(〃=5)4442

同(1),PS=n)=2P2=(n_1)(1_pr-2p2,P(Ji〃=")=(i_pyTp2,

x

3尸(《,〃=〃)12n-25T廠l+D

所以項目"")?印〉P(L)^^+百+…+”產(chǎn)

22

【變式3-1](2024.福建漳州.一模)在數(shù)字通信中,信號是由數(shù)字。和1組成的序列,發(fā)送每個信號數(shù)字之間

相互獨立.由于隨機因素的干擾,發(fā)送的信號0或1有可能被錯誤地接收為1或0.

⑴記發(fā)送信號變量為x,接收信號變量為「且滿足P(X=O)=;,p(y=i|x=o)=|,

p(y=0|X=l)=|,求尸(y=0);

an

(2)當發(fā)送信號0時,接收為0的概率為J,定義隨機變量7的“有效值”為“(〃)=-=x,)lgP(〃=x;)

4z=i

(其中天是〃的所有可能的取值,,=1,2,…發(fā)送信號“000”的接收信號為“%力%”,記4為%,%,%

三個數(shù)字之和,求4的“有效值”.(1g3?0.48,1g2?0.30)

i2

【解析】⑴由題意可知:p(x=i)=i-p(x=0)=-,p(y=oix=o)=i-p(y=i|x=o)=-,

所以尸(y=o)=尸(y=0|X=0)尸(x=o)+尸(y=0|X=l)尸(X=l)=gx:+;x;=H

(2)由題意可知:當發(fā)送信號0時,接收為0的概率為3:,接收為1的概率為1:,

44

可知:4的可能取值有0,1,2,3,

則尸("°)=03=葛尸(9)=叫

…心盜[吟吟3)二審$,

—小片山—+〃/八(27、2727.279.9

'/16464646464646464)

54QA-|45

=——(31g3-61g2)+—(21g3-61g2)-—1g2=——-Ig3+61g2

_o4o4o4Jlo

45

?——x0.48+6x0.30=0.45,

16

即J的“有效值”約為0.45.

題型四:統(tǒng)計方法新定義

【典例4-1](2024?全國?模擬預測)某校20名學生的數(shù)學成績%0=1,2,.,,20)和知識競賽成績%。=1,2,,20)

如下表:

學生編號i12345678910

數(shù)學成績W100999693908885838077

知識競賽成績B29016022020065709010060270

學生編號i11121314151617181920

數(shù)學成績X,75747270686660503935

知識競賽成績%4535405025302015105

20

計算可得數(shù)學成績的平均值是元=75,知識競賽成績的平均值是9=90,并且元)丁6464

Z=1

2020

£(X-J)2=149450,£(x,.-x)(y,-y)=21650.

上1Z=1

(1)求這組學生的數(shù)學成績和知識競賽成績的樣本相關系數(shù)(精確到0.01).

(2)設NeN*,變量x和變量丁的一組樣本數(shù)據(jù)為{(%,?)1,=1,2,,,N},其中x,(i=l,2,,N)兩兩不相同,

%(i=l,2,,N)兩兩不相同.記尤,在卜|“=1,2,,N}中的排名是第4位,%在舊舊=1,2,,N}中的排

名是第S,位,1=1,2,,N.定義變量x和變量y的“斯皮爾曼相關系數(shù),,(記為夕)為變量x的排名和變量y的

排名的樣本相關系數(shù).

6N

⑴記4=4f,i=i,2,,N.證明:N(N?一余與.

(ii)用⑴的公式求這組學生的數(shù)學成績和知識競賽成績的“斯皮爾曼相關系數(shù)”(精確到0。1).

(3)比較(1)和(2)(ii)的計算結(jié)果,簡述“斯皮爾曼相關系數(shù)”在分析線性相關性時的優(yōu)勢.

ZU-元n

i=ln(n+l)(2n+l)

注:參考公式與參考數(shù)據(jù).;ILK=;76464x149450?31000.

£(^-^)2£(x-y)2k=l6

/=1Z=1

【解析】(1)

由題意,這組學生數(shù)學成績和知識競賽成績的樣本相關系數(shù)為

20

Z&-元)(y-9)

2165021650…

i=l?--------?0.70

2020

£(x..-x)2£(x-y)276464x1495031000

i=li=l

(2)⑴證明:因為{4}和{Sj都是1,2,LN的一個排列,所以

fN44Ns,.=N(N+1)

Z=1Z=12

NNN(N+1)(2N+1)

=£s;=

1=11=16

N+l

從而{?}和{S}的平均數(shù)都是R=S=2

NQNNNN2N(N+1)(2N+1)N(N+1yN(N+1)(N-1)

因此,f(K-R)=£&-2應史=^R;-NR

i=lZ=1?=1Z=16412

N_

2N(N+1)(N-1)

同理可得E(s,-?y=

Z=112

NcN

NNcR,_R)_(S「用2

由于fd;本(R「s)-==2(兄-R)+2(E-s可-2t(6-Q(s,「子)

1=1Z=1Z=1i=\?=1

N

一2±(4一用母一目,

12i=l

NWV+IXN-l)」0

-司(E-于)

126lNx;

i=l2日—i_

所以夕二=(

N(N+1)(N—1)NN2-1)Z=1

12

(ii)由題目數(shù)據(jù),可寫出與與S,的值如下:

同學編號i12345678910

數(shù)學成績排名%12345678910

知識競賽成績排名S/p>

同學編號i11121314151617181920

數(shù)學成績排名&11121314151617181920

知識競賽成績排名S,12141311161517181920

N

所以N=20,并且£力=9xO2+4xl2+3x22+2x32+lx42+lx82=114.

i=l

因此這組學生的數(shù)學成績和知識競賽成績的斯皮爾曼相關系數(shù)是

p=\——7—-~~X114~O.91

20(202-1)7

(3)答案①:斯皮爾曼相關系數(shù)對于異常值不太敏感,如果數(shù)據(jù)中有明顯的異常值,那么用斯皮爾曼相關系

數(shù)比用樣本相關系數(shù)更能刻畫某種線性關系;

答案②:斯皮爾曼相關系數(shù)刻畫的是樣本數(shù)據(jù)排名的樣本相關系數(shù),與具體的數(shù)值無關,只與排名有

關.如果一組數(shù)據(jù)有異常值,但排名依然符合一定的線性關系,則可以采用斯皮爾曼相關系數(shù)刻畫線性關

系.

【典例4-2】(2024?全國?模擬預測)冰雪運動是深受學生喜愛的一項戶外運動,為了研究性別與學生是否喜

愛冰雪運動之間的關系,從某高校男、女生中各隨機抽取100名進行問卷調(diào)查,得到如下列聯(lián)表

(m<40,/7/eN).

喜愛不喜愛

男生80-m20+m

女生60+m40-m

(1)當相=0時,從樣本中不喜愛冰雪運動的學生中,按性別采用分層抽樣的方法抽取6人,再從這6人中

隨機抽取3人調(diào)研不喜愛的原因,記這3人中女生的人數(shù)為求4的分布列與數(shù)學期望.

(2淀義/=Z(%一%)(2ViV3,2V其中%為列聯(lián)表中第i行第,列的實際數(shù)據(jù),如

%

為列聯(lián)表中第i行與第?;列的總頻率之積再乘以列聯(lián)表的總額數(shù)得到的理論頻數(shù),如4.2=8。-",

功,2=黑乂黑x200=70.基于小概率值a的檢驗規(guī)則:首先提出零假設變量X,F相互獨立),然后

計算六的值,當K?、五時,我們推斷“0不成立,即認為X和y不獨立,該推斷犯錯誤的概率不超過a;

否則,我們沒有充分證據(jù)推斷“。不成立,可以認為X和y獨立.根據(jù)K2的計算公式,求解下面問題:

①當機=0時,依據(jù)小概率值1=0.005的獨立性檢驗,分析性別與是否喜愛冰雪運動有關?

②當機<10時,依據(jù)小概率值&=0.1的獨立性檢驗,若認為性別與是否喜愛冰雪運動有關,則至少有多少

名男生喜愛冰雪運動?

附:

a0.10.0250.005

Xa2.7065.0247.879

【解析】(1)當m=0時,用分層抽樣的方法抽取的不喜愛冰雪運動的6人中,男生有2人,女生有4人,

由題意可知,J的可能取值為1,2,3.

「2cl3

2信=1)=罟.1,%=2)=罟=|3,P(1)=罟c°C1

(2)①零假設為H。:性別與是否喜愛冰雪運動獨立,即性別與是否喜愛冰雪運動無關聯(lián).

當m=0時,42=80,B22=70,43=20,B23=0.5x0.3x200=30,

A32=60,B32=0.5x0.7x200=70,A33=40,B33=0.5x0.3x200=30,

(4,2一區(qū)2,2)+(4,3-82,3)+(4,2-員,2)+(&3-四,3)

K2=

°2,243員2B33

22

(80—70)2(20—30)2(60-70)(40-30)200八…

=-----x9.524?

70-3070-3021

9.524>7.879=x0005,

,根據(jù)小概率值。=0.005的獨立性檢驗,我們推斷“。不成立,即認為性別與是否喜愛冰雪運動有關聯(lián),

此推斷犯錯誤的概率不超過0.005.

②如_(80一機―70『+.(J+機—30)2+(60+機一70)2+(40-m-30)2_2(10-m)2

'—70307030—21

由題意可知,>2,706,整理得(10-帆)2228.413.

又m<10,m<4,加的最大值為4.

X80-4=76,,至少有76名男生喜愛冰雪運動.

【變式3(2024.高三北京.期末)在測試中‘客觀題難度的計算公式為月吟,其中為第i題的難度,

(2)從抽樣的20名學生中隨機抽取2名學生,記這2名學生中第5題答對的人數(shù)為X,求X的分布列和數(shù)

學期望;

⑶定義統(tǒng)計量5=匕(尸;-6)2+(只-£)2++(尸;-月,溝,其中P'為第i題的實測難度,耳為第i題的預估難度

n1

。=1,2,,〃).規(guī)定:若S<Q05,則稱該次測試的難度預估合理,否則為不合理.判斷本次測試的難度預

估是否合理.

【解析】(1)因為20人中答對第5題的人數(shù)為4人,因此第5題的實測難度為4=0.2,

所以估計240人中有240x0.2=48人實測答對第5題.

(2)X的可能取值是0,1,2.

C1C132C23

p(X=l)=^A=2_.P(X=2)=W=3

C;o9595

⑶第1題的實測難度為*0.8,同理可得:第2題的實測難度為*0.8,

1414

第3題的實測難度為三二0.7,第4題的實測難度為三二0.7,第5題的實測難度為0.2,

故S=J(0.8-0.9)2+(0.8-0.8)2+(0.7-0.7)2+(0.7-0.6)2+(0.2-0.4)2]=0,012.

因為5=0.012<0.05,

所以,該次測試的難度預估是合理的.

題型五:信息燧問題

【典例5-1】(2024.高三.河北?階段練習)信息燧是信息論之父香農(nóng)(S/2G"[o〃)定義的一個重要概念,香農(nóng)在

1948年發(fā)表的論文《通信的數(shù)學理論》中指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息

量稱為“信息蠟”,并給出了計算信息嫡的數(shù)學表達式:設隨機變量X所有可能的取值為1,2,,n(neN*),

且尸(X=i)=p,>0(』,2,-,*£p,=1,定義X的信息嫡H(X)=-J>JogzP,.

i=li=l

(1)當”=1時,計算a(x);

⑵若口J(i=l,2,.判斷并證明當〃增大時,"(X)的變化趨勢;

n

(3)若"=2〃M"[eN*),隨機變量¥所有可能的取值為1,2.加,且尸(¥=/)=0+。2,=1,2,,m),證

明:H(x)>H(r).

【解析】⑴當〃=1時,則i=l,R=l,所以〃(X)=_(lxlog21)=0

⑵”(X)隨著"的增大而增大.

當口=1,2,㈤,則H(X)=-(L]og2qx〃=_k>g2,=log2",

n\nnJn

設/⑺=log2〃,〃£N*,則/(n+l)-/(n)=log2(n+l)-log2n=log2^l>0,

n

因此a(X)隨著n的增大而增大.

(3)證明:若九=2m(meN*),隨機變量y所有可能的取值為1,2,,根,且

P(y=力=Pj+P2m+l-jU=1,2,,m).

2m2mi

“(X)=-£p,?1唯Pi=£P,」題2—

z=li=lPi

i1i1i1i1

+

=Pl.l°g2—+夕2.l°g2—++P2fn-1?l°g2----P21n,---.

PlPlPlm-XPim

]

HK

()=(A+P2nl).l°g2---+(0+必m-1).l°g2---------++(P"+Pm+i>bg2

+

A+PirnP”P2mTP,nPm+1

因為0<P,+P2,“+iT<l(i=l,2m),故l°g2丁一---->0

Pi十Plm+l-i

故H(y)>P「l°g2---+。2.10g2---------+-+必m-1.l°g2---------+Pzjlogz-'—

Pl+P2,nPl+Plm-lPl+Plm-XP/Pl"

/、11八

由于p,,0(i=l,2,,2m),所以一>二------>0,

PiPi+Plm+\-i

,1,1,11

所以l°g2—>logo----------,所以P,Tog?一〉p,?log?----------,

++

PiPiP2,n+l-iPiPiPlm+X-i

所以刀(x)>H(y).

【典例5-2】(2024?高三?河北?期末)在信息論中,崎(entropy)是接收的每條消息中包含的信息的平均量,又

被稱為信息燧、信源嫡、平均自信息量.這里,“消息”代表來自分布或數(shù)據(jù)流中的事件、樣本或特征.(嫡最好理

解為不確定性的量度而不是確定性的量度,因為越隨機的信源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論