13.3 統(tǒng)計與統(tǒng)計案例_第1頁
13.3 統(tǒng)計與統(tǒng)計案例_第2頁
13.3 統(tǒng)計與統(tǒng)計案例_第3頁
13.3 統(tǒng)計與統(tǒng)計案例_第4頁
13.3 統(tǒng)計與統(tǒng)計案例_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

/第三節(jié)統(tǒng)計與統(tǒng)計案例考綱解讀1.理解隨機抽樣的必要性和重要性。2.會用簡單隨機抽樣方法從總體中抽取樣本;了解分層抽樣和系統(tǒng)抽樣方法。3.了解分布的意義和作用,會列頻率分布表,會畫出頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點。4.理解樣本數(shù)據(jù)標準差的意義和作用,會計算數(shù)據(jù)標準差。5.能從樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字牲估計總體的基本數(shù)字特征,理解用樣本估計總體的思想。6.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題。7.會作兩個有關聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系。8.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程。9.了解常見的統(tǒng)計方法,并能應用這些方法解決一些實際問題。(1)獨立性檢驗了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及其簡單應用。(2)回歸分析了解回歸分析的基本思想、方法及其簡單應用。命題趨勢探究1.本節(jié)內容是高考必考內容,以選擇題、填空題為主。2.命題內容為:(1)三種抽樣(以分層抽樣為主);(2)頻率分布表和頻率分布直方圖的制作、識圖及運用。(1)(2)有結合趨勢,考題難度中下。3.統(tǒng)計案例為新課標教材新增內容,考查考生解決實際問題的能力。知識點精講一、抽樣方法三種抽樣方式的對比,如表13-7所示。類型共同點各自特點相互關系使用范圍簡單隨機抽樣抽樣過程都是不放回抽樣,每個個體被抽到的機會均等,總體容量N,樣本容量n,每個個體被抽到的概率從總體中隨機逐個抽取總體容量較小系統(tǒng)抽樣總體均分幾段,每段T個,第一段取a1,第二段取a1+T,第三段取a1+2T,……第一段簡單隨機抽樣總體中的個體個數(shù)較多分層抽樣將總體分成n層,每層按比例抽取每層按簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成二、樣本分析(1)樣本平均值:。(2)樣本眾數(shù):樣本數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)。(3)樣本中位數(shù):將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù)或中間兩個數(shù)據(jù)的平均數(shù)。(4)樣本方差:。眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量,方差是用來描述一組數(shù)據(jù)波動情況的特征數(shù)。三、頻率分布直方圖的解讀(1)頻率分布直方圖的繪制①由頻率分布表求出每組頻數(shù)ni;②求出每組頻率(n為樣本容量);③列出樣本頻率分布表;④畫出樣本頻率分布直方圖,直方圖橫坐標表示各組分組情況,縱坐標為每組頻率與組距比值,各小長方形的面積即為各組頻率,各小長方形的面積總和為1。(2)樣本估計總體步驟:總體→抽取樣本→頻率分布表→頻率分布直方圖→估計總體頻率分布。樣本容量越大,估計越精細,樣本容量無限增大,頻率分布直方圖無限無限趨近概率分布密度曲線。(3)用樣本平均數(shù)估計總體平均數(shù),用樣本標準差估計總體標準差。公式:,s2(aX+b)=a2s2(X)。四、線性回歸線性回歸是研究不具備確定的函數(shù)關系的兩個變量之間的關系(相關關系)的方法。對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為其中,,,(,)稱為樣本點的中心。步驟:畫散點圖,如散點圖中的點基本分布在一條直線附近,則這條直線叫這兩個變量的回歸直線,直線斜率k>0,稱兩個變量正相關;k<0,稱兩個變量負相關。五、獨立性獨立性檢驗是判斷兩個分類變量是否存在相關關系的案例分析方法。步驟為列出22列聯(lián)表(如表13-8所示),求出,并判斷: 表13-8A1A2合計B1aca+cB2bdb+d合計a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握稱“A取A1或A2”對“B取B1,B2”有關系;若10.828K2>6.635,有99%把握稱“A取A1或A2”對“B取B1,B2”有關系;若6.635K2>3.841,有95%把握稱“A取A1或A2”對“B取B1,B2”有關系;若K23.841,沒有把握稱A與B相關。題型歸納及思路提示題型181抽樣方式思路提示根據(jù)所抽取的對象與要求,若抽取的對象中有明顯差異,考慮用分層抽樣,否則選擇簡單隨機抽樣或系統(tǒng)抽樣。當總體中的個體較少時,常采用簡單隨機抽樣;當總體中的個體較多時,常采用系統(tǒng)抽樣。例13.16(2012天津理9)某地區(qū)有小學150所,中學75所,大學25所?,F(xiàn)采用分層抽樣的方法從這些學校中抽取30所學校對學生進行視力調査,應從小學中抽取所學校,中學中抽取所學校。解析:本地區(qū)共有學校150+75+25=250(所),所以從小學中應抽取(所),從中學中抽取(所)。變式1(2012山東理4)采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調查,為此將他們隨機編號為1,2,…,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為9。抽到的32人中,編號落入?yún)^(qū)間[1,450]的人做問卷A,編號落入?yún)^(qū)間[451,750]的人做問卷B,其余的人做問卷C。則抽到的人中,做問卷B的人數(shù)為()。A.7 B.9 C.10 D.15變式2某校共有學生2000名,各年級男、女生人數(shù)如表13-9所示,已知在全校學生中任取一名,抽到二年級女生的概率為0.19,現(xiàn)用分層抽樣的方法,在全校抽取64名學生,則應在三年級抽取的學生人數(shù)為()。表13-9一年級二年級三年級女生373xy男生377370z變式3某企業(yè)三月中旬生產(chǎn)A,B,C三種產(chǎn)品其3000件,根據(jù)分層抽樣的結果,企業(yè)統(tǒng)計員制作了統(tǒng)計表格,如表13-10所示,由于不小心,表格中的A,C產(chǎn)品的有的有關數(shù)據(jù)被污染看不清楚,統(tǒng)計員記得A產(chǎn)品樣本容量比C產(chǎn)品的樣本容量多10,由此可得C產(chǎn)品數(shù)量為_______。表13-10產(chǎn)品類型ABC產(chǎn)品數(shù)量(件)1300產(chǎn)品樣本數(shù)量(件)130題型182樣本分析——用樣本估計總體思路提示對樣本進行分析并用樣本估計總體,包括用樣本數(shù)字特征估計總體數(shù)字特征和用樣本的頻率分布估計總體的頻率分布。在進行樣本分析時,應從統(tǒng)計圖表中獲取數(shù)據(jù)。體現(xiàn)在以下幾個方面:(1)在頻率分布直方圖中,長方形面積=組距eq\f(頻率,組距)=頻率,即隨機變量的概率;(2)對于頻數(shù)、頻率、樣本容量,已知其二必可求第三個;(3)隨機變量在各組數(shù)據(jù)內的頻數(shù)之和為樣本容量。例13.17(2013廣東理17)某車間共有12名工人,隨機抽取6名,他們某日加工零件個數(shù)的莖葉圖如圖13-16所示,其中莖為十位數(shù),葉為個位數(shù)。(1)根據(jù)莖葉圖計算樣本均值;(2)日加工零件個數(shù)大于樣本均值的工人為優(yōu)秀工人,根據(jù)莖葉圖推斷該車間12名工人中有幾名優(yōu)秀工人;(3)從該車間12名工人中,任取2人,求恰有1名優(yōu)秀工人的概率。分析:閱讀莖葉圖得出樣本數(shù)據(jù),利用平均數(shù)公式計算出樣本均值。(2)根據(jù)樣本算出優(yōu)秀工人的比例,再估計12人中優(yōu)秀工人的個數(shù)。(3)用組合數(shù)公式求出所有可能的組合的個數(shù)和符合條件“恰有1名優(yōu)秀工人”的組合的個數(shù),利用古典概型概率公式進行計算。解析:(1)由莖葉圖可知,樣本數(shù)據(jù)為17,19,20,21,25,30,則樣本均值,故樣本均值為22。(2)日加工零件個數(shù)大于樣本均值的工人有2名,故優(yōu)秀工人的頻率為,該車間12名工人中優(yōu)秀工人大約有(名),故該車間約有4名優(yōu)秀工人。(3)記“恰有1名優(yōu)秀工人”為事件A,其包含的基本事件個數(shù)為CC=32,所有基本事件的總數(shù)為C=66,由古典概型概率公式,得。所以恰有1名優(yōu)秀工人的概率為。變式1(2012陜西理6)從甲乙兩個城市分別隨機抽取16臺自動售貨機,對其銷售額進行統(tǒng)計,統(tǒng)計數(shù)據(jù)用莖葉圖表示(如圖13-17所示),設甲乙兩組數(shù)據(jù)的平均數(shù)分別為甲,乙,中位數(shù)分別為m甲,m乙,則()。 A. 甲<乙,m甲>m乙 B.甲<乙,m甲<m乙C.甲>乙,m甲>m乙 D.甲>乙,m甲<m乙變式2某農場計劃種植某種新作物,為此對這種作物的兩個品種(分別稱為品種甲和品種乙)進行田間試驗。選取兩大塊地,每大塊地分成n小塊地,在總共2n小塊地中,隨機選n小塊地種植品種甲,另外n小塊地種植品種乙。(1)假設n=4,在第一大塊地中,種植品種甲的小塊地的數(shù)目記為X,求X的分布列和數(shù)學期望;(2)試驗時每大塊地分成8小塊,即n=8,試驗結束后得到品種甲和品種乙在各小塊地上的每公頃產(chǎn)量(單位:kg/hm2)如表13-11所示。表13-11品種甲403397390404388400412406品種乙419403412418408423400413分別求品種甲和品種乙的每公頃產(chǎn)量的樣本平均數(shù)和樣本方差;根據(jù)試驗結果你認為應該種植哪一品種?附:樣本數(shù)據(jù)x1,x2,…,xn的樣本方差,其中為樣本平均數(shù)。例13.18某次有1000人參加的數(shù)學摸底考試,其成績的頻率分布直方圖如圖13-18所示,規(guī)定85分及其以上為優(yōu)秀。(1)表13-12所示的是這次考試成績的頻數(shù)分布表,求正整數(shù)a,b的值;表13-12區(qū)間[75,80)[80,85)[85,90)[90,95)[95,100]人數(shù)50a350300b(2)現(xiàn)在要用分層抽樣的方法從這1000人中抽取40人的成績進行分析,求其中成績?yōu)閮?yōu)秀的學生人數(shù);(3)在(2)中抽取的40名學生中,要隨機選取2名學生參加座談會,記“其中成績?yōu)閮?yōu)秀的人數(shù)”為X,求X的分布列與數(shù)學期望。0.070.070.060.050.040.030.020.0107580859095100分數(shù)圖13-18頻率組距解析:(1)由頻率分布直方圖可知,a=0.451000=200,b=0.0251000=100。(2)設抽取的40人中成績?yōu)閮?yōu)秀的學生人數(shù)為x,則,解得x=30,即其中成績?yōu)閮?yōu)秀的學生人數(shù)為30名。(3)依題意,隨機變量X的可能取值為:0,1,2。且,,,所以X的分布列為:X012P數(shù)學期望為。變式1某班50名同學在一次百米測試中的成績全部介于13秒和19秒之間,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;……第六組,成績大于等于18且小于19秒。如圖13-19所示是由上述分組方法得到的頻率分布直方圖,設成績小于17秒的學生占全班總人數(shù)的百分比為x,成績大小等于15秒且小于17秒的學生人數(shù)為y,則從頻率分布直方圖中可分析出x和y分別為()。 A.0.9,35 B.0.9,45 C.0.1,35 D.0.1,45頻率/組距頻率/組距0.360.340.180.060.040.02013141516171819(秒)圖13-19變式2(2012安徽理5)甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統(tǒng)計圖如圖13-20所示,則()。0345678910環(huán)數(shù)0345678910環(huán)數(shù)(乙)3210345678910環(huán)數(shù)(甲)321圖13-20頻數(shù)頻數(shù)A.甲的成績的平均數(shù)小于乙的成績的平均數(shù)B.甲的成績的中位數(shù)等于乙的成績的中位數(shù)C.甲的成績的方差小于乙的成績的方差D.甲的成績的極差小于乙的成績的極差題型183線性回歸方程思路提示首先通過對散點圖觀察分析是否為線性回歸,若為線性回歸則利用最小二乘法求出回歸直線方程。具體步驟為:(1)求,,,;(2)求;(3);(4)代入公式,求;(5)代入公式求,,代入直線方程得。這里要注意的是回歸直線恒過樣本中心點(,)。例13.19如表13-13所示,其中提供了某廠節(jié)能降耗技術改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應的生產(chǎn)耗能y(噸)標準煤的幾組對照數(shù)據(jù)。表13-13x3456y2.53.44.5(1)請畫出表示數(shù)據(jù)的散點圖;(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的線性回歸方程;(3)已知該廠技改前100噸產(chǎn)品的生產(chǎn)耗能為90號標準煤,試根據(jù)(2)求得的回歸方程,預測生產(chǎn)100噸甲產(chǎn)品耗能比技改前降低多少噸標準煤?(參考數(shù)值:32.5+43+54+64.5=66.5)。解析:(1)由題設所給數(shù)據(jù),可得散點圖(如圖13-21所示)上的點基本在一條直線附近,數(shù)據(jù)正相關,存在回歸方程。554.5432.521y(噸標準煤)O123456x(噸甲產(chǎn)品)圖13-21(2)由表13-14所示可知,,=0.35,即x,y的回歸方程為。表13-14xixi-(xi-)2(xi-)(yi-)yi-yi3-1.52.251.5-12.54-0.50.250.25-0.5350.50.250.250.5461.52.251.514.5=4.5=5=3.5=3.5(3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)耗能,得節(jié)省的生產(chǎn)耗能為90-(0.7100+0.35)=19.5(噸)標準煤。評注:(1)兩個變量是否具有相關關系,主要依據(jù)散點圖加以判斷,看變量對應的點是否分布在一條直線附近,若是,則具有相關關系;否則不具有相關關系;(2)用公式計數(shù)為,,的值時,要先算的值,然后才能算。變式1某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如表13-15所示。表13-15廣告費用x(萬元)4235銷售額y(萬元)49263954根據(jù)表13-15可得回歸方程中的為9.4,據(jù)此模型預報首先費用為6萬元時銷售額為()。 A.63.6萬元 B.65.5萬元 C.67.7萬元 D.72.0萬元變式2調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并出調查數(shù)據(jù)得到y(tǒng)對x的回歸直線方程:=0.254x_0.321。由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加_______萬元。變式3(2012湖南理4)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列結論中不正確的是A.y與x具有正的線性相關關系B.回歸直線過樣本點的中心(,)C.若該大學某女生身高增加1cm,則其體重約增加0.85kgD.若該大學某女生身高為170cm,則可斷定其體重比為58.79kg題型184獨立性檢驗思路提示獨立性檢驗是判斷兩個分類變量是否存在相關關系的案例分析方法,它與概率中事件的獨立性不同,具體步驟為:(1)列出22列聯(lián)表;(2)求;(3)最后根據(jù)臨界值作出判斷。例13.20為調查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣調查了500位老人,結果如表13-16所示。男女需要4030不需要160270(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人比例;(2)能否有99%的把握認為該地區(qū)的老年人是否需要志愿者幫助與性別相關?(3)根據(jù)(2)的結論,能否提出更好的調查方法估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例?說明理由。解析:(1)調查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要幫助的老年人的比例估計值為。(2)列出22列聯(lián)表(如表13-17所示)。表13-17男女合計需要403070不需要160270430合計200300500。由于9.967>6.635,所以有99%的把握認為該地區(qū)的老年人是否需要志愿者幫助與性別有關。(3)由(2)的結論知,該地區(qū)老年人是否需要幫助與性別有關,并且從樣本數(shù)據(jù)能看出,該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調查中,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法比采用簡單隨機抽樣方法更好。變式1為比較注射A,B兩種藥物產(chǎn)生的皮膚皰疹的面積,選200只家兔作試驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B。表13-18和表13-19所示的分別是注射藥物A和藥物B后皮膚皰疹面積的頻率分布(皰疹面積單位:mm2)。表13-18皰疹[60,65)[65,70)[70,75)[75,80]頻數(shù)30402010表13-19皰疹面積[60,65)[65,70)[70,75)[75,80][80,85)頻數(shù)1025203015(1)完成圖13-22和圖13-23所示的分別注射藥物A,B后皮膚皰疹面積的頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數(shù)大??;0.080.080.070.060.050.040.030.020.01頻率/組距0606570758085皰疹面積圖13-220.080.070.060.050.040.030.020.01頻率/組距0606570758085皰疹面積圖13-23(2)完成表13-20所示的2×2列聯(lián)表,并回答能否有99.9%的把握認為注射藥物A后的皰疹面積與注射藥物B的皰疹面積有差異.皰疹面積小于70mm2皰疹面積不小于70mm2合計注射藥物Aa=b=注射藥物Bc=d=合計附:.變式2(2012遼寧理19)電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調查.下面是根據(jù)調查結果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖:將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”(1)根據(jù)已知條件完成下面的列聯(lián)表,并據(jù)此資料你是否認為“體育迷“與性別有關?非體育迷體育迷合計男女1055合計(2)將上述調查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷“人數(shù)為.若每次抽取的結果是相互獨立的,求的分布列,期望和方差附:,0.050.013.8416.635最有效訓練55(限時40分鐘)1.變量X與Y的卡方統(tǒng)計量K2的值,下列說法正確的是()A.K2越大,“X與Y有關系”可信度越小B.K2越小,“X與Y有關系”可信度越小C.K2越接近0,“X與Y無關”程度越小D.K2越大,“X與Y無關”程度越大2.甲乙兩名同學在5次體育測試中的成績如圖13-25所示,則有()A.,乙比甲穩(wěn)定 B.,甲比乙穩(wěn)定C.,乙比甲穩(wěn)定 D.,甲比乙穩(wěn)定3.為了了解某地區(qū)高三學生的身體狀況,抽查了該地區(qū)100名17.5~18歲的男生體重(千克),得到頻率分布直方圖(如圖13-26所示).由圖知這100名學生在的學生人數(shù)為()A.20 B.30 C.40 D.504.設兩個變x和y之間具有線性相關關系,它們的相關系數(shù)是r,y關于x的回歸直線的斜率是b,縱截距是a,那么必有()A.b與r符號相同 B.a(chǎn)與r符號相同 C.b與r符號相反 D.a(chǎn)與r符號相反5.通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到臺表13-23所示的2×2列聯(lián)表.表13-23男女總計愛好402060不愛好203050總計6050100由算得:.附表13-24:P()0.0500.0100.001k3.8416.63510.828參照表13-24,得到正確的結論是()A.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”B.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”C.有99%以上的把握認為“愛好該項運動與性別有關”D.有99%以上的把握認為“愛好該項運動與性別無關”6.設是孌量x和y的n個樣本點,直線l是由這些樣本點通過最小二乘法得到的線性回歸直線(如圖13-27所示),以下結論中正確的是()

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論