




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十模塊概率與統(tǒng)計(jì)第四十八講隨機(jī)抽樣?用樣本估計(jì)總體?變量間的相互關(guān)系?統(tǒng)計(jì)案例 第十模塊概率與統(tǒng)計(jì)回歸課本回歸課本1.樣本及抽樣的定義(1)在數(shù)理統(tǒng)計(jì)中稱研究對象的全體為總體,組成總體的每一個(gè)基本單元為個(gè)體,從總體中抽取若干個(gè)個(gè)體x1,x2,…,xn,這樣的n個(gè)個(gè)體x1,x2,…,xn稱為大小為n(容量為n)的一個(gè)樣本.(2)抽樣:抽樣是為了獲取總體的信息,特別在客觀實(shí)際中對總體的全部個(gè)體逐一進(jìn)行研究,有的是不適宜?不可能或不必要的.因此,抽樣調(diào)查是獲取總體信息的重要方法.1.樣本及抽樣的定義2.隨機(jī)抽樣(1)簡單隨機(jī)抽樣:從一個(gè)總體中通過逐個(gè)抽取的方法從中抽取一個(gè)樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率相等,這樣的抽樣稱為簡單隨機(jī)抽樣.這樣抽出的樣本稱為簡單隨機(jī)樣本.簡單隨機(jī)抽樣的基本方法有抽簽法和隨機(jī)數(shù)表法.2.隨機(jī)抽樣
(2)系統(tǒng)抽樣:系統(tǒng)抽樣被稱為等距抽樣或機(jī)械抽樣.它按照時(shí)間或空間的等距間隔抽取樣本,即將總體分成幾個(gè)部分,然后按照預(yù)先定出的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本,這種抽樣稱為系統(tǒng)抽樣.系統(tǒng)抽樣與簡單隨機(jī)抽樣的聯(lián)系在于:將總體均分后的每一部分進(jìn)行抽樣時(shí),采用的是簡單隨機(jī)抽樣.(2)系統(tǒng)抽樣:系統(tǒng)抽樣被稱為等距抽樣或機(jī)械抽樣.它按照時(shí)
(3)分層抽樣:當(dāng)總體中一部分個(gè)體與另一部分個(gè)體有明顯的差異且易于區(qū)別時(shí),常將相近的個(gè)體歸成一組,然后按照各部分所占的比例進(jìn)行抽樣,這種抽樣稱為分層抽樣.其中所分成的各部分稱為層.分層抽樣時(shí),每一個(gè)個(gè)體被抽到的概率都是相等的.(3)分層抽樣:當(dāng)總體中一部分個(gè)體與另一部分個(gè)體有明顯的差3.頻率分布表?頻率分布直方圖與莖葉圖(1)頻率分布樣本中所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻數(shù)和樣本容量的比,就是該數(shù)據(jù)的頻率.所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻率的分布變化規(guī)律叫做頻率分布,可以用頻率分布表?頻率分布直方圖?頻率分布折線圖?莖葉圖等來表示.(2)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點(diǎn),就得到頻率分布折線圖.3.頻率分布表?頻率分布直方圖與莖葉圖
(3)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實(shí)際上越來越接近于總體在各小組內(nèi)所取值的個(gè)數(shù)與總數(shù)比值的大小,它可以用一光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線.(4)莖葉圖表示數(shù)據(jù)有兩個(gè)突出的優(yōu)點(diǎn),其一是統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)的損失,所有信息都可以從這個(gè)莖葉圖中得到,其二是在比賽時(shí)隨時(shí)記錄,方便記錄與表示.(3)總體密度曲線4.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征(1)眾數(shù),中位數(shù),平均數(shù)在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個(gè)數(shù)據(jù)(或中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).4.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征如果n個(gè)數(shù),x1,x2,…,xn,那么
(x1+x2+…+xn)叫做這n個(gè)數(shù)的平均數(shù).總體中所有個(gè)體的平均數(shù)叫做總體平均數(shù).樣本中所有個(gè)體的平均數(shù)叫做樣本平均數(shù),如果在n個(gè)數(shù)據(jù)中,x1出現(xiàn)了f1次,x2出現(xiàn)f2次,…,xk出現(xiàn)fk次(這里f1+f2+…+fk=n),那么
(x1f1+x2f2+…+xkfk),叫做這n個(gè)數(shù)的加權(quán)平均數(shù).如果n個(gè)數(shù),x1,x2,…,xn,那么概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件5.兩個(gè)變量的相關(guān)關(guān)系(1)當(dāng)自變量的取值一定時(shí),因變量的取值帶有隨機(jī)性,這兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系.如果一個(gè)變量的值由小變大時(shí),另一個(gè)變量的值也在由小到大,這種相關(guān)稱為正相關(guān);反之,如果一個(gè)變量的值由小變大時(shí),另一個(gè)變量的值在由大到小,這種關(guān)系稱為負(fù)相關(guān).變量間的這種關(guān)系與函數(shù)關(guān)系不同,它是一種非確定關(guān)系.5.兩個(gè)變量的相關(guān)關(guān)系
(2)散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖.(2)散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫6.回歸直線方程(1)一般地,設(shè)x和y是具有相關(guān)關(guān)系的兩個(gè)變量,且對應(yīng)于n個(gè)觀測值的n個(gè)點(diǎn)大致分布在一條直線的附近,若所求的直線方程為6.回歸直線方程我們將這個(gè)方程叫做回歸直線方程,a,b叫做回歸系數(shù),相應(yīng)的直線叫做回歸直線.(2)最小二乘法使離差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2為最小的方法,叫做最小二乘法.我們將這個(gè)方程叫做回歸直線方程,a,b叫做回歸系數(shù),相應(yīng)的直7.回歸分析(1)回歸直線方程=bx+a中,上述方程對應(yīng)的直線叫做回歸直線,而對兩個(gè)變量所進(jìn)行的上述統(tǒng)計(jì)分析叫做線性回歸分析.相關(guān)系數(shù)7.回歸分析用相關(guān)系數(shù)來描述線性相關(guān)關(guān)系的強(qiáng)弱.當(dāng)r>0時(shí),兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),兩個(gè)變量負(fù)相關(guān),r的絕對值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng),r的絕對值接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)|r|大于r0.05時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系,因而求回歸直線方程才有意義.用相關(guān)系數(shù)來描述線性相關(guān)關(guān)系的強(qiáng)弱.當(dāng)r>0時(shí),兩個(gè)變量正相數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異(y1-i)是隨機(jī)誤差效應(yīng),稱i=yi-i為殘差,將所得值平方后加起來,用數(shù)學(xué)符號表示為
(yi-i)2稱為殘差平方和,它代表了隨機(jī)誤差的效應(yīng).數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異(y1-i)是8.獨(dú)立性檢驗(yàn)(1)分類變量的定義如果某種變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.8.獨(dú)立性檢驗(yàn)
(2)2×2列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為(2)2×2列聯(lián)表概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件K2=用它的大小可以決定是否拒絕原來的統(tǒng)計(jì)假設(shè)H0,如果K2值較大,就拒絕H0,即拒絕事件A與B無關(guān).K2=考點(diǎn)陪練考點(diǎn)陪練1.(2010·重慶)某單位有職工750人,其中青年職工350人,中年職工250人,老年職工150人,為了了解該單位職工的健康情況,用分層抽樣的方法從中抽取樣本.若樣本中的青年職工為7人,則樣本容量為()A.7 B.15C.25 D.35解析:設(shè)樣本容量為n,則依題意有×n=7,n=15,選B.答案:B1.(2010·重慶)某單位有職工750人,其中青年職工352.(2010·湖北)將參加夏令營的600名學(xué)生編號為:001,002,…,600.采用系統(tǒng)抽樣方法抽取一個(gè)容量為50的樣本,且隨機(jī)抽得的號碼為003.這600名學(xué)生分住在三個(gè)營區(qū),從001到300的第Ⅰ營區(qū),從301到495在第Ⅱ營區(qū),從496到600在第Ⅲ營區(qū),三個(gè)營區(qū)被抽中的人數(shù)依次為()A.26,16,8B.25,17,8C.25,16,9D.24,17,92.(2010·湖北)將參加夏令營的600名學(xué)生編號為:00解析:依題意及系統(tǒng)抽樣的意義可知,將這600名學(xué)生按編號依次分成50組,每一組各有12名學(xué)生,第k(k∈N*)組抽中的號碼是3+12(k-1).令3+12(k-1)≤300,得k≤,因此第Ⅰ營區(qū)被抽中的人數(shù)是25;令300<3+12(k-1)≤495得<k≤42,因此第Ⅱ營區(qū)被抽中的人數(shù)是42-25=17.結(jié)合各選項(xiàng)知,選B.答案:B解析:依題意及系統(tǒng)抽樣的意義可知,將這600名學(xué)生按編號依次3.(2010·山東)在某項(xiàng)體育比賽中,七位裁判為一選手打出的分?jǐn)?shù)如下:90899095939493去掉一個(gè)最高分和一個(gè)最低分后,所剩數(shù)據(jù)的平均值和方差分別為()A.92,2B.92,2.8C.93,2D.93,2.83.(2010·山東)在某項(xiàng)體育比賽中,七位裁判為一選手打出解析:去掉一個(gè)最高分95分與一個(gè)最低分89分后,所得的5個(gè)數(shù)分別為90?90?93?94?93,所以故選B.答案:B解析:去掉一個(gè)最高分95分與一個(gè)最低分89分后,所得的5個(gè)數(shù)4.(2010·福建)若某校高一年級8個(gè)班參加合唱比賽的得分如莖葉圖所示,則這組數(shù)據(jù)的中位數(shù)和平均數(shù)分別是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和924.(2010·福建)若某校高一年級8個(gè)班參加合唱比賽的得分解析:中位數(shù)為
(91+92)=91.5;平均數(shù)為
(87+89+90+91+92+93+94+96)=91.5.答案:A解析:中位數(shù)為(91+92)=91.5;平均數(shù)5.(2010·湖南)某商品銷售量y(件)與銷售價(jià)格x(元/件)負(fù)相關(guān),則其回歸方程可能是()A.
=-10x+200B.
=10x+200C.
=-10x-200D.
=10x-200解析:由圖象知選項(xiàng)B?D為正相關(guān),選項(xiàng)C不符合實(shí)際意義,故選A.答案:A5.(2010·湖南)某商品銷售量y(件)與銷售價(jià)格x(元/類型一 抽樣方法的綜合應(yīng)用解題準(zhǔn)備:1.簡單隨機(jī)抽樣:抽簽法:攪拌均勻后逐一抽取.隨機(jī)數(shù)表法:注意編號的靈活性,如對100個(gè)個(gè)體可用00,01,01,02,…,99來編號.2.系統(tǒng)抽樣:對多余個(gè)體的剔除不影響總體中每個(gè)個(gè)體被抽到的等可能性,仍然能保證抽樣的公平性.例如從1002個(gè)體中利用系統(tǒng)抽樣抽取容量為20的樣本,剔除2個(gè)個(gè)體后,每個(gè)個(gè)體被抽到的可能性仍為類型一 抽樣方法的綜合應(yīng)用3.分層抽樣:當(dāng)總體中個(gè)體差異較大時(shí),往往采用分層抽樣的方法,若有某些層面應(yīng)抽取的個(gè)體數(shù)目不是整數(shù)時(shí),可作適當(dāng)?shù)募?xì)微調(diào)整.3.分層抽樣:當(dāng)總體中個(gè)體差異較大時(shí),往往采用分層抽樣的方法【典例1】為了考察某校的教學(xué)水平,將抽查這個(gè)學(xué)校高三年級的部分學(xué)生本年度的考試成績.為了全面反映實(shí)際情況,采取以下三種方式進(jìn)行抽查(已知該校高三年級共有20個(gè)班,并且每個(gè)班內(nèi)的學(xué)生已經(jīng)按隨機(jī)方式編好了學(xué)號,假定該校每班學(xué)生的人數(shù)相同):①從高三年級20個(gè)班中任意抽取一個(gè)班,再從該班中任意抽取20名學(xué)生,考察他們的學(xué)習(xí)成績;②每個(gè)班抽取1人,共計(jì)20人,考察這20名學(xué)生的成績;【典例1】為了考察某校的教學(xué)水平,將抽查這個(gè)學(xué)校高三年級③把學(xué)生按成績分成優(yōu)秀、良好、普通三個(gè)級別,從其中共抽取100名學(xué)生進(jìn)行考察(已知該校高三學(xué)生共1000人,若按成績分,其中優(yōu)秀生共150人,良好生共600人,普通生共250人).根據(jù)上面的敘述,試回答下列問題:(1)上面三種抽取方式的總體、個(gè)體、樣本分別是什么?每一種抽取方式抽取的樣本中,樣本容量分別是多少?(2)上面三種抽取方式各自采用的是何種抽取樣本的方法?(3)試分別寫出上面三種抽取方式各自抽取樣本的步驟.③把學(xué)生按成績分成優(yōu)秀、良好、普通三個(gè)級別,從其中共抽取10
[分析]本題主要考查基本概念和三種抽樣方法的聯(lián)系與區(qū)別,準(zhǔn)確把握三種抽樣方法的概念與特點(diǎn)是解此題的關(guān)鍵;另外要注意敘述的完整性和條理性.[解](1)這三種抽取方式的總體都是指該校高三全體學(xué)生本年度的考試成績,個(gè)體都是指高三年級每個(gè)學(xué)生本年度的考試成績.其中第一種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績,樣本容量為20;第二種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績,樣本容量為20;第三種抽取方式的樣本為所抽取的100名學(xué)生本年度的考試成績,樣本容量為100.[分析]本題主要考查基本概念和三種抽樣方法的聯(lián)系與區(qū)別
(2)三種抽取方式中,第一種采用的是簡單隨機(jī)抽樣法;第二種采用的是系統(tǒng)抽樣法和簡單隨機(jī)抽樣法;第三種采用的是分層抽樣法和簡單隨機(jī)抽樣法.(3)第一種方式抽樣的步驟如下:第一步,用抽簽法在這20個(gè)班中任意抽取一個(gè)班;第二步,從這個(gè)班中按學(xué)號用隨機(jī)數(shù)表法或抽簽法抽取20名學(xué)生,考察其考試成績.第二種方式抽樣的步驟如下:第一步,用簡單隨機(jī)抽樣法從第一個(gè)班中任意抽取一名學(xué)生,記其學(xué)號為a;第二步,在其余的19個(gè)班中,選取學(xué)號為a的學(xué)生,加上第一個(gè)班的一名學(xué)生,共計(jì)20人.(2)三種抽取方式中,第一種采用的是簡單隨機(jī)抽樣法;第二種第三種方式抽樣的步驟如下:第一步,分層.因?yàn)槿舭闯煽兎?其中優(yōu)秀生共150人,良好生共600人,普通生共250人,所以在抽取樣本時(shí),應(yīng)該把全體學(xué)生分成三個(gè)層次;第二步,確定各個(gè)層次抽取的人數(shù).因?yàn)闃颖救萘颗c總體的個(gè)數(shù)之比為100:1000=1:10,所以在每個(gè)層次中抽取的個(gè)體數(shù)依次為即15,60,25;第三步,按層次分別抽取.在優(yōu)秀生中用簡單隨機(jī)抽樣法抽15人;在良好生中用簡單隨機(jī)抽樣法抽取60人;在普通生中用簡單隨機(jī)抽樣法抽取25人.第三種方式抽樣的步驟如下:第一步,分層.因?yàn)槿舭闯煽兎?其中類型二 頻率分布直方圖和莖葉圖解題準(zhǔn)備:1.作頻率分布直方圖的步驟:(1)求極差,即一組數(shù)據(jù)中最大值和最小值的差.(2)決定組距與組數(shù).將數(shù)據(jù)分組時(shí),組數(shù)應(yīng)力求合適,以使數(shù)據(jù)的分布規(guī)律能較清楚的呈現(xiàn)出來.這時(shí)應(yīng)注意:①一般樣本容量越大,所分組數(shù)越多;②為方便起見,組距的選擇應(yīng)力求“取整”;③當(dāng)樣本容量不超過100時(shí),按照數(shù)據(jù)的多少,通常分成5~12組.類型二 頻率分布直方圖和莖葉圖
(3)將數(shù)據(jù)分組.(4)計(jì)算各小組的頻率,作頻率分布表.各小組的頻率(5)畫頻率分布直方圖.(3)將數(shù)據(jù)分組.2.莖葉圖的制作步驟如下:(1)將所有兩位數(shù)的十位數(shù)字作為“莖”,莖按從小到大順序排列,莖相同者共用一個(gè)莖,再畫上豎線作為分界線.(2)在分界線的一側(cè)對應(yīng)“莖”處,記錄下“葉”——個(gè)位數(shù)字,一般共莖的葉按從小到大(或從大到小)的順序同行列出.2.莖葉圖的制作步驟如下:【典例2】為了解某校初中畢業(yè)男生的體能狀況,從該校初中畢業(yè)班學(xué)生中抽取若干名男生進(jìn)行鉛球測試,把所得數(shù)據(jù)(精確到0.1米)進(jìn)行整理后,分成6組畫出頻率分布直方圖的一部分(如下圖),已知從左到右前5個(gè)小組的頻率分布為0.04,0.10,0.14,0.28,0.30.第6小組的頻數(shù)是7.【典例2】為了解某校初中畢業(yè)男生的體能狀況,從該校初中畢(1)請將頻率分布直方圖補(bǔ)充完整;(1)請將頻率分布直方圖補(bǔ)充完整;
(2)該校參加這次鉛球測試的男生有多少人?(3)若成績在8.0米以上(含8.0米)的為合格,試求這次鉛球測試的成績的合格率;(4)在這次測試中,你能確定該校參加測試的男生鉛球成績的眾數(shù)和中位數(shù)各落在哪個(gè)小組內(nèi)嗎?[解](1)由頻率分布直方圖的意義可知,各小組頻率之和為1,故第6小組的頻率為:1-(0.04+0.10+0.14+0.28+0.30)=0.14,易知第6小組與第3小組的頻率相等,故兩個(gè)小長方形等高.(2)該校參加這次鉛球測試的男生有多少人?概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件
(2)由(1)知,第6小組的頻率是0.14.又因?yàn)榈?小組的頻數(shù)是7,現(xiàn)設(shè)參加這次測試的男生有x人,根據(jù)頻率定義,得即x=50(人).(3)由圖可知,第4?5?6小組成績在8.0米以上,其頻率之和為:0.28+0.30+0.14=0.72,故合格率為72%.(4)能確定中位數(shù)落在第4小組,而眾數(shù)落在第5小組.(2)由(1)知,第6小組的頻率是0.14.
[反思感悟]解決該類問題時(shí)應(yīng)正確理解圖表中各個(gè)量的意義,識圖掌握信息是解決該類問題的關(guān)鍵.頻率分布指的是一個(gè)樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占的比例的大小.一般用頻率分布直方圖反映樣本的頻率分布.其中,①頻率分布直方圖中縱軸表示頻率②頻率分布直方圖中,各小長方形的面積之和為1,因此在頻率分布直方圖中,組距是一個(gè)固定值,所以各個(gè)長方形高的比也就是頻率之比;
[反思感悟]解決該類問題時(shí)應(yīng)正確理解圖表中各個(gè)量的意義③頻率分布表和頻率分布直方圖是一組數(shù)據(jù)頻率分布的兩種形式,前者準(zhǔn)確,后者直觀;④眾數(shù)為最高矩形的中點(diǎn);⑤中位數(shù)為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點(diǎn)的橫坐標(biāo).③頻率分布表和頻率分布直方圖是一組數(shù)據(jù)頻率分布的兩種形式,前
[探究]某化肥廠甲?乙兩個(gè)車間包裝肥料,在自動(dòng)包裝傳送帶上每隔30min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個(gè)車間產(chǎn)品較穩(wěn)定.[探究]某化肥廠甲?乙兩個(gè)車間包裝肥料,在自動(dòng)包裝傳送
[解](1)因?yàn)殚g隔時(shí)間相同,故是系統(tǒng)抽樣.(2)莖葉圖如下:[解](1)因?yàn)殚g隔時(shí)間相同,故是系統(tǒng)抽樣.(3)甲車間:平均值:
(102+101+99+98+103+98+99)=100,方差:[(102-100)2+(101-100)2+…+(99-100)2]≈3.4286.(3)甲車間:概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件[反思感悟](1)莖葉圖的優(yōu)點(diǎn)是保留了原始數(shù)據(jù),便于記錄及表示,能反映數(shù)據(jù)在各段上的分布情況.(2)莖葉圖不能直接反映總體的分布情況,這就需要通過莖葉圖給出的數(shù)據(jù)求出數(shù)據(jù)的數(shù)字特征,進(jìn)一步估計(jì)總體情況.[反思感悟](1)莖葉圖的優(yōu)點(diǎn)是保留了原始數(shù)據(jù),便于記類型三 線性回歸的應(yīng)用解題準(zhǔn)備:求線性回歸方程的步驟為:(1)列表xi,yi,xiyi;(2)計(jì)算
(3)代入公式計(jì)算b,a的值;(4)寫出回歸方程.類型三 線性回歸的應(yīng)用【典例3】以下是某地搜集到的新房屋的銷售價(jià)格y和新房屋的面積x的數(shù)據(jù):(1)畫出數(shù)據(jù)對應(yīng)的散點(diǎn)圖;(2)求線性回歸方程,并在散點(diǎn)圖中加上回歸直線;(3)據(jù)(2)的結(jié)果估計(jì)當(dāng)新房屋面積為150m2時(shí)的銷售價(jià)格.【典例3】以下是某地搜集到的新房屋的銷售價(jià)格y和新房屋的[解](1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示:[解](1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示:概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件
(3)據(jù)(2),當(dāng)x=150時(shí),銷售價(jià)格的估計(jì)值為:=0.1962×150+1.8166=31.2466(萬元).(3)據(jù)(2),當(dāng)x=150時(shí),銷售價(jià)格的估計(jì)值為:類型四 獨(dú)立性檢驗(yàn)解題準(zhǔn)備:獨(dú)立性檢驗(yàn)的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.(2)根據(jù)公式K2=計(jì)算K2的值.(3)比較K2與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷.類型四 獨(dú)立性檢驗(yàn)【典例4】(2009·江蘇模擬題)利用統(tǒng)計(jì)變量K2的觀測值來判斷兩個(gè)分類變量之間的關(guān)系的可信程度.考查小麥種子經(jīng)滅菌與否跟發(fā)生黑穗病的關(guān)系,經(jīng)試驗(yàn)觀察,得到數(shù)據(jù)如下表所示:【典例4】(2009·江蘇模擬題)利用統(tǒng)計(jì)變量K2的觀測試按照原試驗(yàn)?zāi)康淖鹘y(tǒng)計(jì)分析推斷.[分析]利用已知條件來判斷兩個(gè)分類變量是否具有關(guān)系,可以先假設(shè)兩個(gè)變量之間有關(guān)系,再計(jì)算K2的值,K2的值越大說明兩個(gè)變量間有關(guān)系的可能性越大,再參考臨界值,從而判斷兩個(gè)變量有關(guān)系的可信程度.試按照原試驗(yàn)?zāi)康淖鹘y(tǒng)計(jì)分析推斷.
[解]由列表知,a=26,b=184,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.∴有95%的把握認(rèn)為種子滅菌與否與小麥發(fā)生黑穗病是有關(guān)系的.[解]由列表知,∴有95%的把握認(rèn)為種子滅菌與否與小麥
[反思感悟](1)獨(dú)立性檢驗(yàn)的關(guān)鍵是準(zhǔn)確的計(jì)算K2,在計(jì)算時(shí),要充分利用2×2列聯(lián)表.(2)學(xué)習(xí)相關(guān)和無關(guān)的判定一定要結(jié)合實(shí)際問題,從現(xiàn)實(shí)中尋找例子,從而增強(qiáng)學(xué)習(xí)數(shù)學(xué)的興趣.[反思感悟](1)獨(dú)立性檢驗(yàn)的關(guān)鍵是準(zhǔn)確的計(jì)算K2,在錯(cuò)源一 對簡單隨機(jī)抽樣的理解不到位【典例1】下面的抽樣中,是簡單隨機(jī)抽樣的個(gè)數(shù)是()①從無數(shù)個(gè)個(gè)體中抽取20個(gè)個(gè)體作為樣本;②從50臺(tái)冰箱中一次性抽取5臺(tái)冰箱進(jìn)行質(zhì)量檢查;③某班有40名同學(xué),指定個(gè)子最高的5名同學(xué)參加學(xué)校組織的籃球賽;④一彩民選號,從裝有36個(gè)大小?形狀都相同的號簽的盒子中無放回地抽取6個(gè)號簽錯(cuò)源一 對簡單隨機(jī)抽樣的理解不到位A.4 B.3C.2 D.1[錯(cuò)解]①②③④都是簡單隨機(jī)抽樣,故選A.[剖析]不清楚簡單隨機(jī)抽樣有以下四個(gè)特點(diǎn):(1)總體個(gè)數(shù)有限;(2)逐個(gè)抽取;(3)不放回;(4)公平性.每個(gè)個(gè)體被抽到的可能性相同.因此,要深刻理解概念,深挖其內(nèi)涵.A.4 B.3
[正解]①總體個(gè)數(shù)無限,故不是簡單隨機(jī)抽樣;②雖然“一次性”抽取和“逐個(gè)”抽取不影響個(gè)體被抽到的可能性,但不滿足簡單隨機(jī)抽樣的定義;③因?yàn)橹付?名同學(xué)參賽,每個(gè)個(gè)體被抽到的可能性不相同,不是等可能抽樣;④是簡單隨機(jī)抽樣.故選D.[答案]D[正解]①總體個(gè)數(shù)無限,故不是簡單隨機(jī)抽樣;②雖然“一錯(cuò)源二頻率分布直方圖中小長方形高的含義模糊不清【典例2】如圖是一個(gè)容量為200的樣本頻率分布直方圖,請根據(jù)圖形中的數(shù)據(jù)填空:錯(cuò)源二頻率分布直方圖中小長方形高的含義模糊不清(1)樣本數(shù)據(jù)落在[5,9)的頻率為________;(2)樣本數(shù)據(jù)落在[9,13)的頻率為________.[錯(cuò)解](1)落在[5,9)的頻率為0.08.(2)落在[9,13)的頻率為0.09.(1)樣本數(shù)據(jù)落在[5,9)的頻率為________;
[剖析]頻率分布直方圖中縱軸表示,而不直接表示頻率.[正解](1)落在[5,9)的頻率為0.08×4=0.32;(2)落在[9,13)的頻率為0.09×4=0.36.[答案]0.320.36[剖析]頻率分布直方圖中縱軸表示技法一 構(gòu)造2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn)【典例1】為觀察藥物A,B治療某病的療效,某醫(yī)生將100例該病病人隨機(jī)的分成兩組,一組40人,服用A藥;另一組60人,服用B藥.結(jié)果發(fā)現(xiàn):服用A藥的40人中有30人治愈;服用B藥的60人中有11人治愈.問A,B兩藥對該病的治愈率之間是否有顯著差別?技法一 構(gòu)造2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn)
[解題切入點(diǎn)]首先應(yīng)考察該資料取自什么樣的試驗(yàn)設(shè)計(jì).由于100個(gè)病人完全隨機(jī)地被分成2組,而且,事先不知道任何一個(gè)病人的治療結(jié)果是治愈還是不能治愈,故該資料取自完全隨機(jī)統(tǒng)計(jì),符合2×2列聯(lián)表的要求.[解題切入點(diǎn)]首先應(yīng)考察該資料取自什么樣的試驗(yàn)設(shè)計(jì).由
[解]為便于將數(shù)據(jù)代入公式計(jì)算,先列出2×2列聯(lián)表:[解]為便于將數(shù)據(jù)代入公式計(jì)算,先列出2×2列聯(lián)表:因?yàn)?1.859>10.828,所以我們有99.9%的把握說,A,B兩藥對該病的治愈率之間有顯著差別.[方法與技巧]上述結(jié)論是對所有服用A藥或B藥的病人而言的,絕不要誤以為只對100個(gè)病人成立.這就體現(xiàn)了統(tǒng)計(jì)的意義,即由樣本推斷出全體.因?yàn)?1.859>10.828,所以我們有99.9%的把握說技法二 數(shù)形結(jié)合思想【典例2】為了了解中學(xué)生的身高情況,對某中學(xué)同齡的若干女生的身高進(jìn)行測量,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖如圖所示,已知圖中從左到右1~5組的頻率分別為0.05,0.10,0.15,0.15,0.30,6~8組的頻數(shù)分別為7,5,3,第二小組的頻數(shù)為6.技法二 數(shù)形結(jié)合思想概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件
(1)畫出頻率分布表;(2)試問這組數(shù)據(jù)中的中位數(shù)在哪個(gè)身高的范圍內(nèi)?(3)如果本次測試身高在157cm以上(包括157cm)的為良好,試估計(jì)該校女生身高良好率是多少?(1)畫出頻率分布表;[解題切入點(diǎn)]通過第二組的頻數(shù)和頻率先求出學(xué)生總數(shù),其他問題就十分容易解決了,主要考查同學(xué)們對頻率分布表和頻率分布直方圖的掌握情況,考查識圖?讀圖的能力,以及靈活運(yùn)用圖?表解決實(shí)際問題的能力.[解題切入點(diǎn)]通過第二組的頻數(shù)和頻率先求出學(xué)生總數(shù),其
[解](1)因?yàn)榈诙M的頻數(shù)是6,頻率是0.1,所以學(xué)生總數(shù)為6÷0.1=60,所以1~5組的頻數(shù)分別為3,6,9,9,18;6~8組的頻率分別為[解](1)因?yàn)榈诙M的頻數(shù)是6,頻率是0.1,所以學(xué)頻率分布表如下表所示:頻率分布表如下表所示:(2)中位數(shù)在157cm~160cm之間.(3)因?yàn)?-0.05-0.1-0.15-0.15=0.55,所以良好率是0.55.[方法與技巧]數(shù)形結(jié)合的思想是重要的思想方法之一,具有直觀性?靈活性,有較強(qiáng)的綜合性.數(shù)形結(jié)合的思想的實(shí)質(zhì)就是把抽象的數(shù)學(xué)語言與直觀的圖形結(jié)合起來,使抽象思維與形象思維結(jié)合起來.(2)中位數(shù)在157cm~160cm之間.
第十模塊概率與統(tǒng)計(jì)第四十八講隨機(jī)抽樣?用樣本估計(jì)總體?變量間的相互關(guān)系?統(tǒng)計(jì)案例 第十模塊概率與統(tǒng)計(jì)回歸課本回歸課本1.樣本及抽樣的定義(1)在數(shù)理統(tǒng)計(jì)中稱研究對象的全體為總體,組成總體的每一個(gè)基本單元為個(gè)體,從總體中抽取若干個(gè)個(gè)體x1,x2,…,xn,這樣的n個(gè)個(gè)體x1,x2,…,xn稱為大小為n(容量為n)的一個(gè)樣本.(2)抽樣:抽樣是為了獲取總體的信息,特別在客觀實(shí)際中對總體的全部個(gè)體逐一進(jìn)行研究,有的是不適宜?不可能或不必要的.因此,抽樣調(diào)查是獲取總體信息的重要方法.1.樣本及抽樣的定義2.隨機(jī)抽樣(1)簡單隨機(jī)抽樣:從一個(gè)總體中通過逐個(gè)抽取的方法從中抽取一個(gè)樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率相等,這樣的抽樣稱為簡單隨機(jī)抽樣.這樣抽出的樣本稱為簡單隨機(jī)樣本.簡單隨機(jī)抽樣的基本方法有抽簽法和隨機(jī)數(shù)表法.2.隨機(jī)抽樣
(2)系統(tǒng)抽樣:系統(tǒng)抽樣被稱為等距抽樣或機(jī)械抽樣.它按照時(shí)間或空間的等距間隔抽取樣本,即將總體分成幾個(gè)部分,然后按照預(yù)先定出的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本,這種抽樣稱為系統(tǒng)抽樣.系統(tǒng)抽樣與簡單隨機(jī)抽樣的聯(lián)系在于:將總體均分后的每一部分進(jìn)行抽樣時(shí),采用的是簡單隨機(jī)抽樣.(2)系統(tǒng)抽樣:系統(tǒng)抽樣被稱為等距抽樣或機(jī)械抽樣.它按照時(shí)
(3)分層抽樣:當(dāng)總體中一部分個(gè)體與另一部分個(gè)體有明顯的差異且易于區(qū)別時(shí),常將相近的個(gè)體歸成一組,然后按照各部分所占的比例進(jìn)行抽樣,這種抽樣稱為分層抽樣.其中所分成的各部分稱為層.分層抽樣時(shí),每一個(gè)個(gè)體被抽到的概率都是相等的.(3)分層抽樣:當(dāng)總體中一部分個(gè)體與另一部分個(gè)體有明顯的差3.頻率分布表?頻率分布直方圖與莖葉圖(1)頻率分布樣本中所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻數(shù)和樣本容量的比,就是該數(shù)據(jù)的頻率.所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻率的分布變化規(guī)律叫做頻率分布,可以用頻率分布表?頻率分布直方圖?頻率分布折線圖?莖葉圖等來表示.(2)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點(diǎn),就得到頻率分布折線圖.3.頻率分布表?頻率分布直方圖與莖葉圖
(3)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實(shí)際上越來越接近于總體在各小組內(nèi)所取值的個(gè)數(shù)與總數(shù)比值的大小,它可以用一光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線.(4)莖葉圖表示數(shù)據(jù)有兩個(gè)突出的優(yōu)點(diǎn),其一是統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)的損失,所有信息都可以從這個(gè)莖葉圖中得到,其二是在比賽時(shí)隨時(shí)記錄,方便記錄與表示.(3)總體密度曲線4.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征(1)眾數(shù),中位數(shù),平均數(shù)在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個(gè)數(shù)據(jù)(或中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).4.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征如果n個(gè)數(shù),x1,x2,…,xn,那么
(x1+x2+…+xn)叫做這n個(gè)數(shù)的平均數(shù).總體中所有個(gè)體的平均數(shù)叫做總體平均數(shù).樣本中所有個(gè)體的平均數(shù)叫做樣本平均數(shù),如果在n個(gè)數(shù)據(jù)中,x1出現(xiàn)了f1次,x2出現(xiàn)f2次,…,xk出現(xiàn)fk次(這里f1+f2+…+fk=n),那么
(x1f1+x2f2+…+xkfk),叫做這n個(gè)數(shù)的加權(quán)平均數(shù).如果n個(gè)數(shù),x1,x2,…,xn,那么概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件5.兩個(gè)變量的相關(guān)關(guān)系(1)當(dāng)自變量的取值一定時(shí),因變量的取值帶有隨機(jī)性,這兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系.如果一個(gè)變量的值由小變大時(shí),另一個(gè)變量的值也在由小到大,這種相關(guān)稱為正相關(guān);反之,如果一個(gè)變量的值由小變大時(shí),另一個(gè)變量的值在由大到小,這種關(guān)系稱為負(fù)相關(guān).變量間的這種關(guān)系與函數(shù)關(guān)系不同,它是一種非確定關(guān)系.5.兩個(gè)變量的相關(guān)關(guān)系
(2)散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖.(2)散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫6.回歸直線方程(1)一般地,設(shè)x和y是具有相關(guān)關(guān)系的兩個(gè)變量,且對應(yīng)于n個(gè)觀測值的n個(gè)點(diǎn)大致分布在一條直線的附近,若所求的直線方程為6.回歸直線方程我們將這個(gè)方程叫做回歸直線方程,a,b叫做回歸系數(shù),相應(yīng)的直線叫做回歸直線.(2)最小二乘法使離差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2為最小的方法,叫做最小二乘法.我們將這個(gè)方程叫做回歸直線方程,a,b叫做回歸系數(shù),相應(yīng)的直7.回歸分析(1)回歸直線方程=bx+a中,上述方程對應(yīng)的直線叫做回歸直線,而對兩個(gè)變量所進(jìn)行的上述統(tǒng)計(jì)分析叫做線性回歸分析.相關(guān)系數(shù)7.回歸分析用相關(guān)系數(shù)來描述線性相關(guān)關(guān)系的強(qiáng)弱.當(dāng)r>0時(shí),兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),兩個(gè)變量負(fù)相關(guān),r的絕對值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng),r的絕對值接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)|r|大于r0.05時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系,因而求回歸直線方程才有意義.用相關(guān)系數(shù)來描述線性相關(guān)關(guān)系的強(qiáng)弱.當(dāng)r>0時(shí),兩個(gè)變量正相數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異(y1-i)是隨機(jī)誤差效應(yīng),稱i=yi-i為殘差,將所得值平方后加起來,用數(shù)學(xué)符號表示為
(yi-i)2稱為殘差平方和,它代表了隨機(jī)誤差的效應(yīng).數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異(y1-i)是8.獨(dú)立性檢驗(yàn)(1)分類變量的定義如果某種變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.8.獨(dú)立性檢驗(yàn)
(2)2×2列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為(2)2×2列聯(lián)表概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件K2=用它的大小可以決定是否拒絕原來的統(tǒng)計(jì)假設(shè)H0,如果K2值較大,就拒絕H0,即拒絕事件A與B無關(guān).K2=考點(diǎn)陪練考點(diǎn)陪練1.(2010·重慶)某單位有職工750人,其中青年職工350人,中年職工250人,老年職工150人,為了了解該單位職工的健康情況,用分層抽樣的方法從中抽取樣本.若樣本中的青年職工為7人,則樣本容量為()A.7 B.15C.25 D.35解析:設(shè)樣本容量為n,則依題意有×n=7,n=15,選B.答案:B1.(2010·重慶)某單位有職工750人,其中青年職工352.(2010·湖北)將參加夏令營的600名學(xué)生編號為:001,002,…,600.采用系統(tǒng)抽樣方法抽取一個(gè)容量為50的樣本,且隨機(jī)抽得的號碼為003.這600名學(xué)生分住在三個(gè)營區(qū),從001到300的第Ⅰ營區(qū),從301到495在第Ⅱ營區(qū),從496到600在第Ⅲ營區(qū),三個(gè)營區(qū)被抽中的人數(shù)依次為()A.26,16,8B.25,17,8C.25,16,9D.24,17,92.(2010·湖北)將參加夏令營的600名學(xué)生編號為:00解析:依題意及系統(tǒng)抽樣的意義可知,將這600名學(xué)生按編號依次分成50組,每一組各有12名學(xué)生,第k(k∈N*)組抽中的號碼是3+12(k-1).令3+12(k-1)≤300,得k≤,因此第Ⅰ營區(qū)被抽中的人數(shù)是25;令300<3+12(k-1)≤495得<k≤42,因此第Ⅱ營區(qū)被抽中的人數(shù)是42-25=17.結(jié)合各選項(xiàng)知,選B.答案:B解析:依題意及系統(tǒng)抽樣的意義可知,將這600名學(xué)生按編號依次3.(2010·山東)在某項(xiàng)體育比賽中,七位裁判為一選手打出的分?jǐn)?shù)如下:90899095939493去掉一個(gè)最高分和一個(gè)最低分后,所剩數(shù)據(jù)的平均值和方差分別為()A.92,2B.92,2.8C.93,2D.93,2.83.(2010·山東)在某項(xiàng)體育比賽中,七位裁判為一選手打出解析:去掉一個(gè)最高分95分與一個(gè)最低分89分后,所得的5個(gè)數(shù)分別為90?90?93?94?93,所以故選B.答案:B解析:去掉一個(gè)最高分95分與一個(gè)最低分89分后,所得的5個(gè)數(shù)4.(2010·福建)若某校高一年級8個(gè)班參加合唱比賽的得分如莖葉圖所示,則這組數(shù)據(jù)的中位數(shù)和平均數(shù)分別是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和924.(2010·福建)若某校高一年級8個(gè)班參加合唱比賽的得分解析:中位數(shù)為
(91+92)=91.5;平均數(shù)為
(87+89+90+91+92+93+94+96)=91.5.答案:A解析:中位數(shù)為(91+92)=91.5;平均數(shù)5.(2010·湖南)某商品銷售量y(件)與銷售價(jià)格x(元/件)負(fù)相關(guān),則其回歸方程可能是()A.
=-10x+200B.
=10x+200C.
=-10x-200D.
=10x-200解析:由圖象知選項(xiàng)B?D為正相關(guān),選項(xiàng)C不符合實(shí)際意義,故選A.答案:A5.(2010·湖南)某商品銷售量y(件)與銷售價(jià)格x(元/類型一 抽樣方法的綜合應(yīng)用解題準(zhǔn)備:1.簡單隨機(jī)抽樣:抽簽法:攪拌均勻后逐一抽取.隨機(jī)數(shù)表法:注意編號的靈活性,如對100個(gè)個(gè)體可用00,01,01,02,…,99來編號.2.系統(tǒng)抽樣:對多余個(gè)體的剔除不影響總體中每個(gè)個(gè)體被抽到的等可能性,仍然能保證抽樣的公平性.例如從1002個(gè)體中利用系統(tǒng)抽樣抽取容量為20的樣本,剔除2個(gè)個(gè)體后,每個(gè)個(gè)體被抽到的可能性仍為類型一 抽樣方法的綜合應(yīng)用3.分層抽樣:當(dāng)總體中個(gè)體差異較大時(shí),往往采用分層抽樣的方法,若有某些層面應(yīng)抽取的個(gè)體數(shù)目不是整數(shù)時(shí),可作適當(dāng)?shù)募?xì)微調(diào)整.3.分層抽樣:當(dāng)總體中個(gè)體差異較大時(shí),往往采用分層抽樣的方法【典例1】為了考察某校的教學(xué)水平,將抽查這個(gè)學(xué)校高三年級的部分學(xué)生本年度的考試成績.為了全面反映實(shí)際情況,采取以下三種方式進(jìn)行抽查(已知該校高三年級共有20個(gè)班,并且每個(gè)班內(nèi)的學(xué)生已經(jīng)按隨機(jī)方式編好了學(xué)號,假定該校每班學(xué)生的人數(shù)相同):①從高三年級20個(gè)班中任意抽取一個(gè)班,再從該班中任意抽取20名學(xué)生,考察他們的學(xué)習(xí)成績;②每個(gè)班抽取1人,共計(jì)20人,考察這20名學(xué)生的成績;【典例1】為了考察某校的教學(xué)水平,將抽查這個(gè)學(xué)校高三年級③把學(xué)生按成績分成優(yōu)秀、良好、普通三個(gè)級別,從其中共抽取100名學(xué)生進(jìn)行考察(已知該校高三學(xué)生共1000人,若按成績分,其中優(yōu)秀生共150人,良好生共600人,普通生共250人).根據(jù)上面的敘述,試回答下列問題:(1)上面三種抽取方式的總體、個(gè)體、樣本分別是什么?每一種抽取方式抽取的樣本中,樣本容量分別是多少?(2)上面三種抽取方式各自采用的是何種抽取樣本的方法?(3)試分別寫出上面三種抽取方式各自抽取樣本的步驟.③把學(xué)生按成績分成優(yōu)秀、良好、普通三個(gè)級別,從其中共抽取10
[分析]本題主要考查基本概念和三種抽樣方法的聯(lián)系與區(qū)別,準(zhǔn)確把握三種抽樣方法的概念與特點(diǎn)是解此題的關(guān)鍵;另外要注意敘述的完整性和條理性.[解](1)這三種抽取方式的總體都是指該校高三全體學(xué)生本年度的考試成績,個(gè)體都是指高三年級每個(gè)學(xué)生本年度的考試成績.其中第一種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績,樣本容量為20;第二種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績,樣本容量為20;第三種抽取方式的樣本為所抽取的100名學(xué)生本年度的考試成績,樣本容量為100.[分析]本題主要考查基本概念和三種抽樣方法的聯(lián)系與區(qū)別
(2)三種抽取方式中,第一種采用的是簡單隨機(jī)抽樣法;第二種采用的是系統(tǒng)抽樣法和簡單隨機(jī)抽樣法;第三種采用的是分層抽樣法和簡單隨機(jī)抽樣法.(3)第一種方式抽樣的步驟如下:第一步,用抽簽法在這20個(gè)班中任意抽取一個(gè)班;第二步,從這個(gè)班中按學(xué)號用隨機(jī)數(shù)表法或抽簽法抽取20名學(xué)生,考察其考試成績.第二種方式抽樣的步驟如下:第一步,用簡單隨機(jī)抽樣法從第一個(gè)班中任意抽取一名學(xué)生,記其學(xué)號為a;第二步,在其余的19個(gè)班中,選取學(xué)號為a的學(xué)生,加上第一個(gè)班的一名學(xué)生,共計(jì)20人.(2)三種抽取方式中,第一種采用的是簡單隨機(jī)抽樣法;第二種第三種方式抽樣的步驟如下:第一步,分層.因?yàn)槿舭闯煽兎?其中優(yōu)秀生共150人,良好生共600人,普通生共250人,所以在抽取樣本時(shí),應(yīng)該把全體學(xué)生分成三個(gè)層次;第二步,確定各個(gè)層次抽取的人數(shù).因?yàn)闃颖救萘颗c總體的個(gè)數(shù)之比為100:1000=1:10,所以在每個(gè)層次中抽取的個(gè)體數(shù)依次為即15,60,25;第三步,按層次分別抽取.在優(yōu)秀生中用簡單隨機(jī)抽樣法抽15人;在良好生中用簡單隨機(jī)抽樣法抽取60人;在普通生中用簡單隨機(jī)抽樣法抽取25人.第三種方式抽樣的步驟如下:第一步,分層.因?yàn)槿舭闯煽兎?其中類型二 頻率分布直方圖和莖葉圖解題準(zhǔn)備:1.作頻率分布直方圖的步驟:(1)求極差,即一組數(shù)據(jù)中最大值和最小值的差.(2)決定組距與組數(shù).將數(shù)據(jù)分組時(shí),組數(shù)應(yīng)力求合適,以使數(shù)據(jù)的分布規(guī)律能較清楚的呈現(xiàn)出來.這時(shí)應(yīng)注意:①一般樣本容量越大,所分組數(shù)越多;②為方便起見,組距的選擇應(yīng)力求“取整”;③當(dāng)樣本容量不超過100時(shí),按照數(shù)據(jù)的多少,通常分成5~12組.類型二 頻率分布直方圖和莖葉圖
(3)將數(shù)據(jù)分組.(4)計(jì)算各小組的頻率,作頻率分布表.各小組的頻率(5)畫頻率分布直方圖.(3)將數(shù)據(jù)分組.2.莖葉圖的制作步驟如下:(1)將所有兩位數(shù)的十位數(shù)字作為“莖”,莖按從小到大順序排列,莖相同者共用一個(gè)莖,再畫上豎線作為分界線.(2)在分界線的一側(cè)對應(yīng)“莖”處,記錄下“葉”——個(gè)位數(shù)字,一般共莖的葉按從小到大(或從大到小)的順序同行列出.2.莖葉圖的制作步驟如下:【典例2】為了解某校初中畢業(yè)男生的體能狀況,從該校初中畢業(yè)班學(xué)生中抽取若干名男生進(jìn)行鉛球測試,把所得數(shù)據(jù)(精確到0.1米)進(jìn)行整理后,分成6組畫出頻率分布直方圖的一部分(如下圖),已知從左到右前5個(gè)小組的頻率分布為0.04,0.10,0.14,0.28,0.30.第6小組的頻數(shù)是7.【典例2】為了解某校初中畢業(yè)男生的體能狀況,從該校初中畢(1)請將頻率分布直方圖補(bǔ)充完整;(1)請將頻率分布直方圖補(bǔ)充完整;
(2)該校參加這次鉛球測試的男生有多少人?(3)若成績在8.0米以上(含8.0米)的為合格,試求這次鉛球測試的成績的合格率;(4)在這次測試中,你能確定該校參加測試的男生鉛球成績的眾數(shù)和中位數(shù)各落在哪個(gè)小組內(nèi)嗎?[解](1)由頻率分布直方圖的意義可知,各小組頻率之和為1,故第6小組的頻率為:1-(0.04+0.10+0.14+0.28+0.30)=0.14,易知第6小組與第3小組的頻率相等,故兩個(gè)小長方形等高.(2)該校參加這次鉛球測試的男生有多少人?概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件
(2)由(1)知,第6小組的頻率是0.14.又因?yàn)榈?小組的頻數(shù)是7,現(xiàn)設(shè)參加這次測試的男生有x人,根據(jù)頻率定義,得即x=50(人).(3)由圖可知,第4?5?6小組成績在8.0米以上,其頻率之和為:0.28+0.30+0.14=0.72,故合格率為72%.(4)能確定中位數(shù)落在第4小組,而眾數(shù)落在第5小組.(2)由(1)知,第6小組的頻率是0.14.
[反思感悟]解決該類問題時(shí)應(yīng)正確理解圖表中各個(gè)量的意義,識圖掌握信息是解決該類問題的關(guān)鍵.頻率分布指的是一個(gè)樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占的比例的大小.一般用頻率分布直方圖反映樣本的頻率分布.其中,①頻率分布直方圖中縱軸表示頻率②頻率分布直方圖中,各小長方形的面積之和為1,因此在頻率分布直方圖中,組距是一個(gè)固定值,所以各個(gè)長方形高的比也就是頻率之比;
[反思感悟]解決該類問題時(shí)應(yīng)正確理解圖表中各個(gè)量的意義③頻率分布表和頻率分布直方圖是一組數(shù)據(jù)頻率分布的兩種形式,前者準(zhǔn)確,后者直觀;④眾數(shù)為最高矩形的中點(diǎn);⑤中位數(shù)為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點(diǎn)的橫坐標(biāo).③頻率分布表和頻率分布直方圖是一組數(shù)據(jù)頻率分布的兩種形式,前
[探究]某化肥廠甲?乙兩個(gè)車間包裝肥料,在自動(dòng)包裝傳送帶上每隔30min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個(gè)車間產(chǎn)品較穩(wěn)定.[探究]某化肥廠甲?乙兩個(gè)車間包裝肥料,在自動(dòng)包裝傳送
[解](1)因?yàn)殚g隔時(shí)間相同,故是系統(tǒng)抽樣.(2)莖葉圖如下:[解](1)因?yàn)殚g隔時(shí)間相同,故是系統(tǒng)抽樣.(3)甲車間:平均值:
(102+101+99+98+103+98+99)=100,方差:[(102-100)2+(101-100)2+…+(99-100)2]≈3.4286.(3)甲車間:概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件[反思感悟](1)莖葉圖的優(yōu)點(diǎn)是保留了原始數(shù)據(jù),便于記錄及表示,能反映數(shù)據(jù)在各段上的分布情況.(2)莖葉圖不能直接反映總體的分布情況,這就需要通過莖葉圖給出的數(shù)據(jù)求出數(shù)據(jù)的數(shù)字特征,進(jìn)一步估計(jì)總體情況.[反思感悟](1)莖葉圖的優(yōu)點(diǎn)是保留了原始數(shù)據(jù),便于記類型三 線性回歸的應(yīng)用解題準(zhǔn)備:求線性回歸方程的步驟為:(1)列表xi,yi,xiyi;(2)計(jì)算
(3)代入公式計(jì)算b,a的值;(4)寫出回歸方程.類型三 線性回歸的應(yīng)用【典例3】以下是某地搜集到的新房屋的銷售價(jià)格y和新房屋的面積x的數(shù)據(jù):(1)畫出數(shù)據(jù)對應(yīng)的散點(diǎn)圖;(2)求線性回歸方程,并在散點(diǎn)圖中加上回歸直線;(3)據(jù)(2)的結(jié)果估計(jì)當(dāng)新房屋面積為150m2時(shí)的銷售價(jià)格.【典例3】以下是某地搜集到的新房屋的銷售價(jià)格y和新房屋的[解](1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示:[解](1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示:概率與統(tǒng)計(jì)隨機(jī)抽樣用樣本估計(jì)總體變量間的相互課件
(3)據(jù)(2),當(dāng)x=150時(shí),銷售價(jià)格的估計(jì)值為:=0.1962×150+1.8166=31.2466(萬元).(3)據(jù)(2),當(dāng)x=150時(shí),銷售價(jià)格的估計(jì)值為:類型四 獨(dú)立性檢驗(yàn)解題準(zhǔn)備:獨(dú)立性檢驗(yàn)的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.(2)根據(jù)公式K2=計(jì)算K2的值.(3)比較K2與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷.類型四 獨(dú)立性檢驗(yàn)【典例4】(2009·江蘇模擬題)利用統(tǒng)計(jì)變量K2的觀測值來判斷兩個(gè)分類變量之間的關(guān)系的可信程度.考查小麥種子經(jīng)滅菌與否跟發(fā)生黑穗病的關(guān)系,經(jīng)試驗(yàn)觀察,得到數(shù)據(jù)如下表所示:【典例4】(2009·江蘇模擬題)利用統(tǒng)計(jì)變量K2的觀測試按照原試驗(yàn)?zāi)康淖鹘y(tǒng)計(jì)分析推斷.[分析]利用已知條件來判斷兩個(gè)分類變量是否具有關(guān)系,可以先假設(shè)兩個(gè)變量之間有關(guān)系,再計(jì)算K2的值,K2的值越大說明兩個(gè)變量間有關(guān)系的可能性越大,再參考臨界值,從而判斷兩個(gè)變量有關(guān)系的可信程度.試按照原試驗(yàn)?zāi)康淖鹘y(tǒng)計(jì)分析推斷.
[解]由列表知,a=26,b=184,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.∴有95%的把握認(rèn)為種子滅菌與否與小麥發(fā)生黑穗病是有關(guān)系的.[解]由列表知,∴有95%的把握認(rèn)為種子滅菌與否與小麥
[反思感悟](1)獨(dú)立性檢驗(yàn)的關(guān)鍵是準(zhǔn)確的計(jì)算K2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 包裝工程與設(shè)計(jì)作業(yè)指導(dǎo)書
- 跨境電商貨運(yùn)險(xiǎn)
- 企業(yè)合規(guī)經(jīng)營實(shí)踐指南
- 安全專項(xiàng)整治三年行動(dòng)方案
- 江西雨水收集系統(tǒng)
- 新能源汽車充電保護(hù)
- 醫(yī)療行業(yè)醫(yī)療器械采購指南
- 智能家居控制系統(tǒng)展覽會(huì)
- 三農(nóng)政策背景下農(nóng)業(yè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整方案
- 母嬰護(hù)理中級練習(xí)測試卷
- 實(shí)用參考從合規(guī)到績效:宋志平談央企學(xué)習(xí)型董事會(huì)建設(shè)
- 常用漢字3000個(gè)按使用頻率排序
- GB/T 912-2008碳素結(jié)構(gòu)鋼和低合金結(jié)構(gòu)鋼熱軋薄鋼板和鋼帶
- GB/T 26480-2011閥門的檢驗(yàn)和試驗(yàn)
- 中共一大會(huì)址
- 云南省煙草買賣合同(標(biāo)準(zhǔn)版)
- 2023個(gè)人獨(dú)資企業(yè)清算報(bào)告(精選4篇)
- 衛(wèi)生統(tǒng)計(jì)學(xué)(全套課件)
- 2021年6月浙江省高考讀后續(xù)寫課件-高考英語復(fù)習(xí)備考
- 小學(xué)古詩詞80首(硬筆書法田字格)
-
評論
0/150
提交評論