2024一輪收尾之統(tǒng)計(jì)模塊講義及練習(xí)_第1頁(yè)
2024一輪收尾之統(tǒng)計(jì)模塊講義及練習(xí)_第2頁(yè)
2024一輪收尾之統(tǒng)計(jì)模塊講義及練習(xí)_第3頁(yè)
2024一輪收尾之統(tǒng)計(jì)模塊講義及練習(xí)_第4頁(yè)
2024一輪收尾之統(tǒng)計(jì)模塊講義及練習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024一輪收尾——統(tǒng)計(jì)模塊講義及練習(xí)(解析版)目錄1.1隨機(jī)抽樣1.1.1簡(jiǎn)單隨機(jī)抽樣1.簡(jiǎn)單隨機(jī)抽樣的定義2.簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)3.兩種常用的簡(jiǎn)單隨機(jī)抽樣方法1.1.2系統(tǒng)抽樣1.系統(tǒng)抽樣的定義2.抽樣概念的性質(zhì)1.1.3分層抽樣1.為何要進(jìn)行分層抽樣2.分層抽樣的步驟1.2用樣本估計(jì)總體1.2.1樣本與總體全面調(diào)查和抽樣調(diào)查1.2.2樣本頻率分布估計(jì)總體取值規(guī)律1.條形/扇形與折線統(tǒng)計(jì)圖2.頻率分布直方圖及特征3.密度曲線與頻率折線圖4.利用頻率直方圖估計(jì)統(tǒng)計(jì)量.1.2.3樣本特征值估計(jì)總體數(shù)據(jù)1.常用統(tǒng)計(jì)量及定義2.各統(tǒng)計(jì)量特征與對(duì)比3.第p百分位數(shù)4.標(biāo)準(zhǔn)差與方差1.3成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析1.3.1相關(guān)系數(shù)與一元線性回歸1.最小二乘法求回歸直線2.相關(guān)系數(shù)3.相關(guān)關(guān)系與函數(shù)關(guān)系異同點(diǎn)1.3.2獨(dú)立性檢驗(yàn)列聯(lián)表與獨(dú)立性檢驗(yàn)18.簡(jiǎn)單隨機(jī)抽樣(1)定義:一般地,設(shè)一個(gè)總體含有N(N為正整數(shù))個(gè)個(gè)體,從中逐個(gè)不放回地抽取n()個(gè)個(gè)體作為樣本,如果每次抽取時(shí)各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.(2)19.分層抽樣(1)定義:一般地,在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法是分層抽樣.(2)應(yīng)用范圍:總體是由差異明顯的幾個(gè)部分組成的.(3)1.1隨機(jī)抽樣1.1.1簡(jiǎn)單隨機(jī)抽樣知識(shí)點(diǎn)引入與思路分析:簡(jiǎn)單隨機(jī)抽樣的定義一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)特點(diǎn)如下:有限性:總體個(gè)體數(shù)有限;逐個(gè)性:每次只抽取一個(gè)個(gè)體;不放回:抽取樣本不放回,樣本無(wú)重復(fù)個(gè)體;等概率:每個(gè)個(gè)體被抽到的機(jī)會(huì)相等.適用于總體中個(gè)數(shù)較少的情況.隨機(jī)抽樣不是隨意或隨便抽取,隨意或隨便抽取都會(huì)帶有主觀或客觀的影響因素.兩種常用的簡(jiǎn)單隨機(jī)抽樣方法最常用的簡(jiǎn)單隨機(jī)抽樣方法有兩種:隨機(jī)數(shù)法和抽簽法.抽簽法:先把總體中的個(gè)體編號(hào),然后把所有編號(hào)寫在外觀、質(zhì)地等無(wú)差別的小紙片(也可以是卡片、小球等)上作為號(hào)簽,并將這些小紙片放在一個(gè)⑤不透明的盒里,充分?jǐn)嚢?最后從盒中不放回地逐個(gè)抽取號(hào)簽,使與號(hào)簽上的編號(hào)對(duì)應(yīng)的個(gè)體進(jìn)入樣本,直到抽足樣本所需要的個(gè)體數(shù).隨機(jī)數(shù)法:先把總體中的個(gè)體編號(hào),用隨機(jī)數(shù)工具產(chǎn)生已編號(hào)范圍內(nèi)的整數(shù)隨機(jī)數(shù),把產(chǎn)生的隨機(jī)數(shù)作為抽中的編號(hào),使與編號(hào)對(duì)應(yīng)的個(gè)體進(jìn)入樣本,重復(fù)上述過程,直到抽足樣本所需要的個(gè)體數(shù).產(chǎn)生隨機(jī)數(shù)的方法:(i)用隨機(jī)試驗(yàn)生成隨機(jī)數(shù);(ii)用信息技術(shù)生成隨機(jī)數(shù).典例及真題:例.下列關(guān)于簡(jiǎn)單隨機(jī)抽樣的敘述不正確的是()A.—定要逐個(gè)抽取B.它是一種最簡(jiǎn)單、最基本的抽樣方法C.總體中的個(gè)數(shù)必須是有限的D.先被抽取的個(gè)體被抽到的可能性較大【解析】答案D由簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)可以判斷A,B,C都正確,并且在抽樣過程中,每個(gè)個(gè)體被抽到的可能性都相等,不分先后.知識(shí)點(diǎn)練習(xí):1.一個(gè)總體的60個(gè)個(gè)體編號(hào)為00,01,…,59,現(xiàn)需從中抽取一個(gè)容量為6的樣本,請(qǐng)從下面給出的隨機(jī)數(shù)表的第10列開始向右讀取,直到取足樣本,則抽取的第五個(gè)樣本的號(hào)碼是________.95339522001874720018387958693281768026928280842539【解析】讀取的數(shù)字兩個(gè)一組為01,87,47,20,01,83,87,95,86,93,28,17,68,02,…,由于抽取的號(hào)碼不能超過59,且不能重復(fù),則抽取的樣本號(hào)碼是01,47,20,28,17,02,…,第五個(gè)是17.1.1.2系統(tǒng)抽樣知識(shí)點(diǎn)引入與思路分析:1.系統(tǒng)抽樣的定義系統(tǒng)抽樣:將總體均勻分成幾個(gè)部分,按事先確定的規(guī)則在各部分抽取。在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣 總體均分幾段,每段T個(gè),第一段取a1,第二段取a1+T,第三段取a1+2T,……適用于總體中的個(gè)體數(shù)較多的情況2.抽樣概念的性質(zhì)抽樣過程是不放回抽樣,每個(gè)個(gè)體被抽到的機(jī)會(huì)均等,總體容量N,樣本容量n,每個(gè)個(gè)體被抽到的概率典例及真題:例.采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調(diào)查,為此將他們隨機(jī)編號(hào)為1,2,…,960,分組后在第一組采用簡(jiǎn)單隨機(jī)抽樣的方法抽到的號(hào)碼為9。抽到的32人中,編號(hào)落入?yún)^(qū)間[1,450]的人做問卷A,編號(hào)落入?yún)^(qū)間[451,750]的人做問卷B,其余的人做問卷C。則抽到的人中,做問卷B的人數(shù)為()A.7 B.9 C.10 D.15【解析】解析由題意可知,抽取號(hào)碼的間隔為,所以抽取的號(hào)碼依次為9,39,69,…,939,落入?yún)^(qū)間的有459,489,…,729,這些數(shù)構(gòu)成首項(xiàng)為459,公差為30的等差數(shù)列,設(shè)有n項(xiàng),顯然有,解得n=10,所以做問卷B的有10人,故選C.知識(shí)點(diǎn)練習(xí):1.高三某班有學(xué)生56人,現(xiàn)將所有同學(xué)隨機(jī)編號(hào),用系統(tǒng)抽樣的方法,抽取一個(gè)容量為4的樣本,已知5號(hào)、33號(hào)、47號(hào)學(xué)生在樣本中,則樣本中還有一個(gè)學(xué)生的編號(hào)為()A.13 B.17C.19 D.21【解析】因?yàn)?7-33=14,所以由系統(tǒng)抽樣的定義可知樣本中的另一個(gè)學(xué)生的編號(hào)為5+14=19.1.1.3分層抽樣知識(shí)點(diǎn)引入與思路分析:1.為何要進(jìn)行分層抽樣總體中的個(gè)體數(shù)較多當(dāng)已知總體由差異明顯的幾部分組成時(shí),為了使樣本更客觀地反映總體的情況,常將總體按不同的特點(diǎn)分成層次比較分明的幾部分,然后按各部分在總體中所占的比例進(jìn)行抽樣,這種抽樣叫做分層抽樣,其中所分的各部分叫“層”.2.分層抽樣的步驟分層抽樣的關(guān)鍵是根據(jù)樣本特征的差異進(jìn)行分層,實(shí)質(zhì)是等比例抽樣,抽樣比.典例及真題:例.防疫站對(duì)學(xué)生進(jìn)行身體健康調(diào)查,欲采用分層隨機(jī)抽樣的辦法抽取樣本.某中學(xué)共有學(xué)生2000名,抽取了一個(gè)容量為200的樣本,樣本中男生103人,則該中學(xué)共有女生()A.1030人 B.97人C.950人 D.970人【解析】由題意,知該中學(xué)共有女生2000×eq\f(200-103,200)=970(人).知識(shí)點(diǎn)練習(xí):1.為了解某地區(qū)的中小學(xué)生視力情況,擬從該地區(qū)的中小學(xué)生中抽取部分學(xué)生進(jìn)行調(diào)查,事先已了解到該地區(qū)小學(xué)、初中、高中三個(gè)學(xué)段學(xué)生的視力情況有較大差異,而男女生視力情況差異不大,在下面的抽樣方法中,最合理的抽樣方法是()A.簡(jiǎn)單隨機(jī)抽樣B.按性別分層抽樣QUOTEC.按學(xué)段分層抽樣 D.系統(tǒng)抽樣【解析】因該地區(qū)小學(xué)、初中、高中三個(gè)學(xué)段學(xué)生的視力情況有較大差異,故最合理的抽樣方法是按學(xué)段分層抽樣,故選C.1.2用樣本估計(jì)總體1.2.1樣本與總體知識(shí)點(diǎn)引入與思路分析:1.全面調(diào)查和抽樣調(diào)查全面調(diào)查(普查)對(duì)每一個(gè)調(diào)查對(duì)象都進(jìn)行調(diào)查的方法,稱為全面調(diào)查,又稱普查。在一個(gè)調(diào)查中,我們把調(diào)查對(duì)象的全體稱為總體。組成總體的每一個(gè)調(diào)查對(duì)象稱為個(gè)體抽樣調(diào)查根據(jù)一定目的,從總體中①抽取一部分個(gè)體進(jìn)行調(diào)查,并以此為依據(jù)對(duì)總體的情況作出估計(jì)和推斷的調(diào)查方法,稱為抽樣調(diào)查,把從總體中抽取的那部分個(gè)體稱為樣本.樣本中包含的個(gè)體數(shù)稱為樣本量1.2.1樣本頻率分布估計(jì)總體取值規(guī)律1.條形/扇形與折線統(tǒng)計(jì)圖條形統(tǒng)計(jì)圖可以清楚地呈現(xiàn)各種數(shù)量的多少。但是條形統(tǒng)計(jì)圖不容易看出各部分量與總量的關(guān)系;扇形統(tǒng)計(jì)圖可以清楚地呈現(xiàn)各部分?jǐn)?shù)量同總量之間的關(guān)系,即百分比或分?jǐn)?shù)比;折線統(tǒng)計(jì)圖表示數(shù)量變化情況2.頻率分布直方圖及特征頻率分布直方圖:在直角坐標(biāo)系中,橫軸表示樣本數(shù)據(jù),縱軸表示頻率與組距的比值,將頻率分布表中的各組頻率的大小用相應(yīng)矩形面積的大小來(lái)表示,由此畫成的統(tǒng)計(jì)圖叫做頻率分布直方圖.頻率分布表與頻率分布直方圖的繪制步驟如下:a.求極差,即求一組數(shù)據(jù)中最大值與最小值的差;b.決定組距與組數(shù);c.將數(shù)據(jù)分組;d.列頻率分布表,落在各小組內(nèi)的數(shù)據(jù)的個(gè)數(shù)叫做頻數(shù),每小組的頻數(shù)與樣本容量的比值叫做這一小組的頻率,計(jì)算各小組的頻率,列出頻率分布表;e.畫頻率分布直方圖,依據(jù)頻率分布表畫出頻率分布直方圖,其中縱坐標(biāo)(小長(zhǎng)方形的高)表示頻率與組距的比值,其相應(yīng)組距上的頻率等于該組上的小長(zhǎng)方形的面積,即每個(gè)小長(zhǎng)方形的面積.各個(gè)小長(zhǎng)方形面積的總和等于1頻率分布直方圖的特征:①圖中各個(gè)長(zhǎng)方形的面積等于相應(yīng)各組的頻率的數(shù)值,所有小矩形面積和為1.②從頻率分布直方圖可以清楚地看出數(shù)據(jù)分布的總體趨勢(shì).③從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息被抹掉.3.密度曲線與頻率折線圖總體分布的密度曲線:如果將樣本容量取得足夠大,分組的組距取得足夠小,則相應(yīng)的頻率分布折線圖將趨于一條光滑曲線,我們稱這條光滑曲線為總體分布的密度曲線.如果將頻率分布直方圖中各相鄰的矩形的上底邊的中點(diǎn)順次連結(jié)起來(lái),就得到頻率分布折線圖,簡(jiǎn)稱頻率折線圖.4.利用頻率直方圖估計(jì)統(tǒng)計(jì)量利用頻率分布直方圖估計(jì)眾數(shù):頻率分布直方圖面積最大的方條的橫軸中點(diǎn)數(shù)字.(最高矩形的中點(diǎn))估計(jì)中位數(shù):中位數(shù)把頻率分布直方圖分成左右兩邊面積相等.估計(jì)平均數(shù):頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.平均數(shù)是頻率分布直方圖的“重心”.典例及真題:例.200輛汽車通過某一段公路時(shí)的時(shí)速的頻率分布直方圖如圖所示,則時(shí)速的眾數(shù)、中位數(shù)的估計(jì)值分別為()A.62,62.5B.65,62C.65,62.5D.62.5,62.5【解析】∵最高的矩形為第三個(gè)矩形,∴時(shí)速的眾數(shù)的估計(jì)值為65.前兩個(gè)矩形的面積為(0.01+0.03)×10=0.4.∵0.5-0.4=0.1,eq\f(0.1,0.4)×10=2.5,∴中位數(shù)的估計(jì)值為60+2.5=62.5.知識(shí)點(diǎn)練習(xí):1.某城市在進(jìn)行創(chuàng)建文明城市的活動(dòng)中,為了解居民對(duì)“創(chuàng)建文明城”的滿意程度,組織居民給活動(dòng)打分(分?jǐn)?shù)為整數(shù),滿分100分),從中隨機(jī)抽取一個(gè)容量為120的樣本,發(fā)現(xiàn)所給數(shù)據(jù)均在[40,100]內(nèi).現(xiàn)將這些分?jǐn)?shù)分成以下6組并畫出樣本的頻率分布直方圖,但不小心污損了部分圖形,如圖所示.觀察圖形,則下列說法錯(cuò)誤的是()A.第三組的頻數(shù)為18人B.根據(jù)頻率分布直方圖估計(jì)眾數(shù)為75分C.根據(jù)頻率分布直方圖估計(jì)樣本的平均數(shù)為75分D.根據(jù)頻率分布直方圖估計(jì)樣本的中位數(shù)為75分【解析】對(duì)于A項(xiàng),因?yàn)楦鹘M的頻率之和等于1,所以分?jǐn)?shù)在[60,70)內(nèi)的頻率為f=1-10×(0.005+0.015+0.030+0.025+0.010)=0.15,所以第三組[60,70)的頻數(shù)為120×0.15=18(人),故A項(xiàng)正確;對(duì)于B項(xiàng),因?yàn)楸姅?shù)的估計(jì)值是頻率分布直方圖中最高矩形的中點(diǎn),從圖中可看出眾數(shù)的估計(jì)值為75分,故B項(xiàng)正確;對(duì)于C項(xiàng),又根據(jù)頻率分布直方圖,樣本的平均數(shù)的估計(jì)值為45×(10×0.005)+55×(10×0.015)+65×(10×0.015)+75×(10×0.03)+85×(10×0.025)+95×(10×0.01)=73.5(分),故C項(xiàng)錯(cuò)誤;對(duì)于D項(xiàng),因?yàn)?0.05+0.15+0.15)×10=0.35<0.5,(0.05+0.15+0.15+0.3)×10>0.5,所以中位數(shù)位于[70,80)上,所以中位數(shù)的估計(jì)值為70+eq\f(0.5-0.35,0.030)=75,故D項(xiàng)正確.故選C項(xiàng)2.某調(diào)查機(jī)構(gòu)對(duì)全國(guó)互聯(lián)網(wǎng)行業(yè)進(jìn)行調(diào)查統(tǒng)計(jì),得到整個(gè)互聯(lián)網(wǎng)行業(yè)從業(yè)者年齡分布餅狀圖、90后從事互聯(lián)網(wǎng)行業(yè)崗位分布條形圖,則下列結(jié)論正確的是()注:90后指1990年及以后出生,80后指1980-1989年之間出生,80前指1979年及以前出生.A.互聯(lián)網(wǎng)行業(yè)從業(yè)人員中從事技術(shù)和運(yùn)營(yíng)崗位的人數(shù)占總?cè)藬?shù)的三成以上B.互聯(lián)網(wǎng)行業(yè)中從事技術(shù)崗位的人數(shù)超過總?cè)藬?shù)的20%C.互聯(lián)網(wǎng)行業(yè)中從事運(yùn)營(yíng)崗位的人數(shù)90后比80前多D.互聯(lián)網(wǎng)行業(yè)中從事技術(shù)崗位的人數(shù)90后比80后多【解析】選項(xiàng)A,因?yàn)榛ヂ?lián)網(wǎng)行業(yè)從業(yè)人員中,“90后”占比為56%,其中從事技術(shù)和運(yùn)營(yíng)崗位的人數(shù)占的比分別為39.6%和17%,則“90后”從事技術(shù)和運(yùn)營(yíng)崗位的人數(shù)占總?cè)藬?shù)的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有從事技術(shù)和運(yùn)營(yíng)崗位的人,則總的占比一定超過三成,故選項(xiàng)A正確;選項(xiàng)B,因?yàn)榛ヂ?lián)網(wǎng)行業(yè)從業(yè)人員中,“90后”占比為56%,其中從事技術(shù)崗位的人數(shù)占的比為39.6%,則“90后”從事技術(shù)崗位的人數(shù)占總?cè)藬?shù)的56%×39.6%≈22.2%.“80前”和“80后”中必然也有從事技術(shù)崗位的人,則總的占比一定超過20%,故選項(xiàng)B正確;選項(xiàng)C,“90后”從事運(yùn)營(yíng)崗位的人數(shù)占總?cè)藬?shù)的比為56%×17%≈9.5%,大于“80前”的總?cè)藬?shù)所占比3%,故選項(xiàng)C正確;選項(xiàng)D,“90后”從事技術(shù)崗位的人數(shù)占總?cè)藬?shù)的56%×39.6%≈22.2%,“80后”的總?cè)藬?shù)所占比為41%,條件中未給出“80后”從事技術(shù)崗位的占比,故不能判斷,所以選項(xiàng)D錯(cuò)誤.3.下表是某電器銷售公司2018年度各類電器營(yíng)業(yè)收入占比和凈利潤(rùn)占比統(tǒng)計(jì)表:空調(diào)類冰箱類小家電類其它類營(yíng)業(yè)收入占比90.10%4.98%3.82%1.10%凈利潤(rùn)占比95.80%﹣0.48%3.82%0.86%則下列判斷中正確的是()A.該公司2018年度冰箱類電器銷售虧損B.該公司2018年度小家電類電器營(yíng)業(yè)收入和凈利潤(rùn)相同C.該公司2018年度凈利潤(rùn)主要由空調(diào)類電器銷售提供D.剔除冰箱類電器銷售數(shù)據(jù)后,該公司2018年度空調(diào)類電器銷售凈利潤(rùn)占比將會(huì)降低【解析】根據(jù)表中數(shù)據(jù)知,該公司2018年度冰箱類電器銷售凈利潤(rùn)所占比為﹣0.48,是虧損的,A正確;小家電類電器營(yíng)業(yè)收入所占比和凈利潤(rùn)所占比是相同的,但收入與凈利潤(rùn)不一定相同,B錯(cuò)誤;該公司2018年度凈利潤(rùn)空調(diào)類電器銷售所占比為95.80%,是主要利潤(rùn)來(lái)源,C正確;所以剔除冰箱類電器銷售數(shù)據(jù)后,該公司2018年度空調(diào)類電器銷售凈利潤(rùn)占比將會(huì)降低,D正確.故選:ACD.1.2.3樣本特征值估計(jì)總體數(shù)據(jù)知識(shí)點(diǎn)引入與思路分析:1.常用統(tǒng)計(jì)量及定義眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢(shì)的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù);中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù);平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù).2.各統(tǒng)計(jì)量特征與對(duì)比樣本眾數(shù)通常用來(lái)表示分類變量的中心值,比較容易計(jì)算,但是它只能表示樣本數(shù)據(jù)中的很少一部分信息.中位數(shù)不受少數(shù)幾個(gè)極端值的影響,容易計(jì)算,它僅利用了數(shù)據(jù)排在中間的數(shù)據(jù)的信息.樣本平均數(shù)與每個(gè)樣本數(shù)據(jù)有關(guān),所以,任何一個(gè)樣本數(shù)據(jù)的改變都會(huì)引起平均數(shù)的改變.這是中位數(shù),眾數(shù)都不具有的性質(zhì),也正因?yàn)檫@個(gè)原因,與眾數(shù),中位數(shù)比較起來(lái),平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息.如果樣本平均數(shù)大于樣本中位數(shù),說明數(shù)據(jù)中存在許多較大的極端值;反之,說明數(shù)據(jù)中存在許多較小的極端值.3.第p百分位數(shù)第p百分位數(shù):一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有①p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100p)%的數(shù)據(jù)大于或等于這個(gè)值.計(jì)算一組n個(gè)數(shù)據(jù)的第p百分位數(shù)的步驟:第1步,按從小到大排列原始數(shù)據(jù).第2步,計(jì)算i=③n×p%.第3步,若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項(xiàng)數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項(xiàng)與第(i+1)項(xiàng)數(shù)據(jù)的平均數(shù).4.標(biāo)準(zhǔn)差與方差對(duì)標(biāo)準(zhǔn)差和方差概念的理解:標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小.標(biāo)準(zhǔn)差、方差的取值范圍:[0,+∞).標(biāo)準(zhǔn)差、方差為0時(shí),樣本各數(shù)據(jù)全相等,表明數(shù)據(jù)沒有波動(dòng)幅度,數(shù)據(jù)沒有離散性.因?yàn)榉讲钆c原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏差的程度,所以雖然方差與標(biāo)準(zhǔn)差在刻畫樣本數(shù)據(jù)的離散程度上是一樣的,但在解決實(shí)際問題時(shí),一般多采用標(biāo)準(zhǔn)差.典例及真題:例.某社區(qū)通過公益講座以普及社區(qū)居民的垃圾分類知識(shí).為了解講座效果,隨機(jī)抽取10位社區(qū)居民,讓他們?cè)谥v座前和講座后各回答一份垃圾分類知識(shí)問卷,這10位社區(qū)居民在講座前和講座后問卷答題的正確率如下圖:則(

)A.講座前問卷答題的正確率的中位數(shù)小于B.講座后問卷答題的正確率的平均數(shù)大于C.講座前問卷答題的正確率的標(biāo)準(zhǔn)差小于講座后正確率的標(biāo)準(zhǔn)差D.講座后問卷答題的正確率的極差大于講座前正確率的極差防疫站對(duì)學(xué)生進(jìn)行身體健康調(diào)查,欲采用分層隨機(jī)抽樣的辦法抽取樣本.某中學(xué)共有學(xué)生2000名,抽取了一個(gè)容量為200的樣本,樣本中男生103人,則該中學(xué)共有女生()A.1030人 B.97人C.950人 D.970人【解析】講座前中位數(shù)為,所以錯(cuò);講座后問卷答題的正確率只有一個(gè)是個(gè),剩下全部大于等于,所以講座后問卷答題的正確率的平均數(shù)大于,所以B對(duì);講座前問卷答題的正確率更加分散,所以講座前問卷答題的正確率的標(biāo)準(zhǔn)差大于講座后正確率的標(biāo)準(zhǔn)差,所以C錯(cuò);講座后問卷答題的正確率的極差為,講座前問卷答題的正確率的極差為,所以錯(cuò).故選:B.知識(shí)點(diǎn)練習(xí):1.演講比賽共有9位評(píng)委分別給出某選手的原始評(píng)分,評(píng)定該選手的成績(jī)時(shí),從9個(gè)原始評(píng)分中去掉1個(gè)最高分、1個(gè)最低分,得到7個(gè)有效評(píng)分.7個(gè)有效評(píng)分與9個(gè)原始評(píng)分相比,發(fā)生改變的數(shù)字特征是()A.中位數(shù) B.平均數(shù) C.方差 D.極差【解析】根據(jù)中位數(shù)、平均數(shù)、極差、方差各自的含義即可判斷.中位數(shù)是將9個(gè)數(shù)據(jù)從小到大或從大到小排列后,處于中間位置的數(shù)據(jù),因而去掉1個(gè)最高分和1個(gè)最低分,不變的是中位數(shù),平均數(shù)、方差、極差均受影響.故選:BCD.2.已知隨機(jī)變量X的分布列是X123Peq\f(1,4)ab若E(X)=2,則D(X)的值是()A.eq\f(17,36)B.eq\f(1,2)C.eq\f(1,4)D.eq\f(17,18)【解析】由題意得eq\b\lc\{\rc\(\a\vs4\al\co1(\f(1,4)+a+b=1,,\f(1,4)+2a+3b=2,))解得eq\b\lc\{\rc\(\a\vs4\al\co1(a=\f(1,2),,b=\f(1,4),))所以D(X)=(1-2)2×eq\f(1,4)+(2-2)2×eq\f(1,2)+(3-2)2×eq\f(1,4)=eq\f(1,2).3.某廠為比較甲、乙兩種工藝對(duì)橡膠產(chǎn)品伸縮率的處理效應(yīng),進(jìn)行次配對(duì)試驗(yàn),每次配對(duì)試驗(yàn)選用材質(zhì)相同的兩個(gè)橡膠產(chǎn)品,隨機(jī)地選其中一個(gè)用甲工藝處理,另一個(gè)用乙工藝處理,測(cè)量處理后的橡膠產(chǎn)品的伸縮率,甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為,試驗(yàn)結(jié)果如下試驗(yàn)序號(hào)12345678910伸縮率545533551522575544541568596548伸縮率536527543530560533522550576536記,記的樣本平均數(shù)為,樣本方差為,

(1)求,.

(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果,則認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否則不認(rèn)為有顯著提高)【解析】(1)由得12345678910968151119182012..(2)因?yàn)?,?故可以認(rèn)為甲工藝對(duì)伸縮率有顯著提高.1.3變量間的相關(guān)關(guān)系1.3.1相關(guān)系數(shù)與一元線性回歸知識(shí)點(diǎn)引入與思路分析:1.最小二乘法求回歸直線從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過散點(diǎn)圖中心的一條直線附近,稱兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.回歸方程為,其中.通過求的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小,這一方法叫做最小二乘法.2.相關(guān)系數(shù)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng).r的絕對(duì)值越接近于0時(shí),表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性.相關(guān)指數(shù)與相關(guān)系數(shù)在含有一個(gè)解釋變量的線性回歸模型中是等價(jià)的量,都是用來(lái)判斷線性回歸模型擬合效果好不好的量.判斷兩組數(shù)據(jù)是否具有線性相關(guān)關(guān)系的方法:散點(diǎn)圖,相關(guān)系數(shù).3.相關(guān)關(guān)系與函數(shù)關(guān)系異同點(diǎn)共同點(diǎn):二者都是指兩個(gè)變量間的關(guān)系.不同點(diǎn):函數(shù)關(guān)系是一種確定性關(guān)系,體現(xiàn)的是因果關(guān)系;而相關(guān)關(guān)系是一種非確定性關(guān)系,體現(xiàn)的不一定是因果關(guān)系,可能是伴隨關(guān)系.①回歸直線必過樣本點(diǎn)的中心,這個(gè)結(jié)論既是檢驗(yàn)所求回歸直線方程是否準(zhǔn)確的依據(jù),也是求參數(shù)的一個(gè)依據(jù).②r的符號(hào)表明兩個(gè)變量是正相關(guān)還是負(fù)相關(guān);|r|的大小表示線性相關(guān)性的強(qiáng)弱.獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)變量有關(guān)系的可信程度的判斷,而不是對(duì)其是否有關(guān)系的判斷.典例及真題:例.下列命題:①相關(guān)指數(shù)R2越小,則殘差平方和越大,模型的擬合效果越好.②對(duì)分類變量X與Y的隨機(jī)變量K2的觀測(cè)值k來(lái)說,k越小,“X與Y有關(guān)系”可信程度越大.③殘差點(diǎn)比較均勻地落在水平帶狀區(qū)域內(nèi),帶狀區(qū)域越寬,說明模型擬合精度越高.④兩個(gè)隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對(duì)值越接近0.其中錯(cuò)誤命題的個(gè)數(shù)為4.【解析】解:對(duì)于①,相關(guān)指數(shù)R2越小,則殘差平方和越大,此時(shí)模型的擬合效果越差,所以①錯(cuò)誤;對(duì)于②,對(duì)分類變量X與Y的隨機(jī)變量K2的觀測(cè)值k來(lái)說,k越小,“X與Y有關(guān)系”可信程度越小,所以②錯(cuò)誤;對(duì)于③,殘差點(diǎn)比較均勻地落在水平帶狀區(qū)域內(nèi),帶狀區(qū)域越寬,說明模型擬合精度越低,所以③錯(cuò)誤;對(duì)于④,兩個(gè)隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對(duì)值越接近1,所以④錯(cuò)誤.綜上知,錯(cuò)誤命題的序號(hào)是①②③④,共4個(gè).故答案為:4.知識(shí)點(diǎn)練習(xí):某公司為了了解廣告投入對(duì)銷售收益的影響,在若干地區(qū)各投入3.5萬(wàn)元廣告費(fèi)用,并將各地的銷售收益繪制成頻率分布直方圖,如圖所示,由于工作人員操作失誤,橫軸的數(shù)據(jù)丟失,但可以確定橫軸是從0開始計(jì)數(shù)的.(1)根據(jù)頻率分布直方圖計(jì)算圖中各小長(zhǎng)方形的寬度;(2)估計(jì)該公司投入3.5萬(wàn)元廣告費(fèi)用之后,對(duì)應(yīng)銷售收益的平均值(以各組的區(qū)間中點(diǎn)值代表該組的取值);(3)該公司按照類似的研究方法,測(cè)得另外一些數(shù)據(jù),并整理得到下表:廣告投入x(單位:萬(wàn)元)12345銷售收益y(單位:萬(wàn)元)2327表中的數(shù)據(jù)顯示,x與y之間存在線性相關(guān)關(guān)系,請(qǐng)將(2)中的結(jié)果填入空白欄,并計(jì)算y關(guān)于x的線性回歸方程.【解析】(1)設(shè)各小長(zhǎng)方形的寬度為m,由頻率分布直方圖中各小長(zhǎng)方形面積總和為1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m=0.5m=1,故m=2.(2)由(1)知,各分組依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中點(diǎn)值分別為1,3,5,7,9,11,對(duì)應(yīng)的頻率分別為0.16,0.20,0.28,0.24,0.08,0.04,故可估計(jì)平均值為1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)空白欄中填5.由題意可知,eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(2+3+2+5+7,5)=3.8,eq\o(∑,\s\up11(5),\s\do4(i=1))xiyi=1×2+2×3+3×2+4×5+5×7=69,eq\o(∑,\s\up11(5),\s\do4(i=1))xeq\o\al(2,i)=12+22+32+42+52=55.根據(jù)公式可求得eq\o(b,\s\up6(^))=eq\f(69-5×3×3.8,55-5×32)=eq\f(12,10)=1.2,eq\o(a,\s\up6(^))=3.8-1.2×3=0.2,即線性回歸方程為eq\o(y,\s\up6(^))=1.2x+0.2.1.3.2獨(dú)立性檢驗(yàn)知識(shí)點(diǎn)引入與思路分析:獨(dú)立性檢驗(yàn)y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表稱為2×2列聯(lián)表為K2=(其中n=a+b+c+d為樣本容量).典例及真題:例.通過隨機(jī)詢問某中學(xué)110名中學(xué)生是否愛好跳繩,得到如下列聯(lián)表:跳繩性別合計(jì)男女愛好402060不愛好203050合計(jì)6050110已知,,根據(jù)小概率值的獨(dú)立性檢驗(yàn),以下結(jié)論正確的為()A.愛好跳繩與性別有關(guān)B.愛好跳繩與性別有關(guān),這個(gè)結(jié)論犯錯(cuò)誤的概率不超過0.001C.愛好跳繩與性別無(wú)關(guān)D.愛好跳繩與性別無(wú)關(guān),這個(gè)結(jié)論犯錯(cuò)誤的概率不超過0.001【解析】,,,,,,故,愛好跳繩與性別無(wú)關(guān),這個(gè)結(jié)論犯錯(cuò)誤的概率不超過0.001故選:D知識(shí)點(diǎn)練習(xí):1.某公司為了為了解中學(xué)生課余觀看某檔熱門綜藝節(jié)目是否與性別有關(guān),某中學(xué)一研究性學(xué)習(xí)小組從該校學(xué)生中隨機(jī)抽取了n人進(jìn)行問卷調(diào)查.調(diào)查結(jié)果表明:女生中喜歡觀看該節(jié)目的人數(shù)占女生總?cè)藬?shù)的eq\f(3,4),男生中喜歡看該節(jié)目的人數(shù)占男生總?cè)藬?shù)的eq\f(1,3).隨后,該小組采用分層隨機(jī)抽樣的方法從這n份問卷中繼續(xù)抽取了5份進(jìn)行重點(diǎn)分析,知道其中喜歡看該節(jié)目的有3人,(1)現(xiàn)從重點(diǎn)分析的5人中隨機(jī)抽取了2人進(jìn)行現(xiàn)場(chǎng)調(diào)查,求這兩人都喜歡看該節(jié)目的概率;(2)依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),我們認(rèn)為“

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論