高考總復習走向清華北大48概率與統(tǒng)計課件_第1頁
高考總復習走向清華北大48概率與統(tǒng)計課件_第2頁
高考總復習走向清華北大48概率與統(tǒng)計課件_第3頁
高考總復習走向清華北大48概率與統(tǒng)計課件_第4頁
高考總復習走向清華北大48概率與統(tǒng)計課件_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第十模塊第十模塊 概率與統(tǒng)計概率與統(tǒng)計第四十八講第四十八講 隨機抽樣隨機抽樣 用樣本估計用樣本估計總體總體 變量間的相互關系變量間的相互關系 統(tǒng)計案例統(tǒng)計案例回歸課本回歸課本1.樣本及抽樣的定義樣本及抽樣的定義(1)在數(shù)理統(tǒng)計中稱研究對象的全體為在數(shù)理統(tǒng)計中稱研究對象的全體為總體總體,組成總體的每一組成總體的每一個個基本單元基本單元為個體為個體,從總體中抽取若干個個體從總體中抽取若干個個體x1,x2,xn,這這樣的樣的n個個體個個體x1,x2,xn稱為稱為大小為大小為n(容量為容量為n)的一個樣本的一個樣本.(2)抽樣抽樣:抽樣是為了抽樣是為了獲取總體的信息獲取總體的信息,特別在客觀實際中對特

2、別在客觀實際中對總總體體的全部個體逐一進行研究的全部個體逐一進行研究,有的是不適宜有的是不適宜 不可能或不不可能或不必要的必要的.因此因此,抽樣調(diào)查抽樣調(diào)查是獲取總體信息的重要方法是獲取總體信息的重要方法.2.隨機抽樣隨機抽樣(1)簡單隨機抽樣簡單隨機抽樣:從一個總體中通過從一個總體中通過逐個抽取的方法逐個抽取的方法從中抽從中抽取一個樣本取一個樣本,且每次抽取時各個個體被抽到的概率且每次抽取時各個個體被抽到的概率相等相等,這這樣的抽樣稱為樣的抽樣稱為簡單隨機抽樣簡單隨機抽樣.這樣抽出的樣本稱為簡單隨這樣抽出的樣本稱為簡單隨機樣本機樣本.簡單隨機抽樣的基本方法有簡單隨機抽樣的基本方法有抽簽法和隨

3、機數(shù)表法抽簽法和隨機數(shù)表法. (2)系統(tǒng)抽樣系統(tǒng)抽樣:系統(tǒng)抽樣被稱為系統(tǒng)抽樣被稱為等距抽樣或機械抽樣等距抽樣或機械抽樣.它按照時它按照時間或空間的間或空間的等距間隔等距間隔抽取樣本抽取樣本,即將總體分成幾個部分即將總體分成幾個部分,然然后按照預先定出的規(guī)則后按照預先定出的規(guī)則,從每一部分從每一部分抽取一個個體抽取一個個體,得到所得到所需要的樣本需要的樣本,這種抽樣稱為系統(tǒng)抽樣這種抽樣稱為系統(tǒng)抽樣.系統(tǒng)抽樣與簡單隨機系統(tǒng)抽樣與簡單隨機抽樣的聯(lián)系在于抽樣的聯(lián)系在于:將總體均分后的每一部分進行抽樣時將總體均分后的每一部分進行抽樣時,采采用的是用的是簡單隨機抽樣簡單隨機抽樣. (3)分層抽樣分層抽樣:

4、當總體中一部分個體與另一部分個體有當總體中一部分個體與另一部分個體有明顯的明顯的差異且易于區(qū)別差異且易于區(qū)別時時,常將相近的個體歸成一組常將相近的個體歸成一組,然后按照各然后按照各部分所占的部分所占的比例比例進行抽樣進行抽樣,這種抽樣稱為這種抽樣稱為分層抽樣分層抽樣.其中所其中所分成的各部分稱為分成的各部分稱為層層.分層抽樣時分層抽樣時,每一個個體被抽到的概每一個個體被抽到的概率都是率都是相等相等的的.3.頻率分布表頻率分布表 頻率分布直方圖與莖葉圖頻率分布直方圖與莖葉圖(1)頻率分布頻率分布樣本中所有數(shù)據(jù)樣本中所有數(shù)據(jù)(或者數(shù)據(jù)組或者數(shù)據(jù)組)的頻數(shù)和樣本容量的比的頻數(shù)和樣本容量的比,就是該就

5、是該數(shù)據(jù)的數(shù)據(jù)的頻率頻率.所有數(shù)據(jù)所有數(shù)據(jù)(或者數(shù)據(jù)組或者數(shù)據(jù)組)的頻率的分布變化規(guī)律的頻率的分布變化規(guī)律叫做叫做頻率分布頻率分布,可以用可以用頻率分布表頻率分布表 頻率分布直方圖頻率分布直方圖 頻頻率分布折線圖率分布折線圖 莖葉圖等來表示莖葉圖等來表示.(2)頻率分布折線圖頻率分布折線圖:連接頻率分布直方圖中各小長方形上端連接頻率分布直方圖中各小長方形上端的的中點中點,就得到頻率分布折線圖就得到頻率分布折線圖. (3)總體密度曲線總體密度曲線如果樣本容量不斷增大如果樣本容量不斷增大,分組的組距不斷縮小分組的組距不斷縮小,則頻率分布直則頻率分布直方圖實際上越來越接近于方圖實際上越來越接近于總體

6、在各小組內(nèi)所取值的個數(shù)與總體在各小組內(nèi)所取值的個數(shù)與總數(shù)比值的大小總數(shù)比值的大小,它可以用一它可以用一光滑曲線光滑曲線來描繪來描繪,這條這條光滑曲光滑曲線線就叫做總體密度曲線就叫做總體密度曲線.(4)莖葉圖表示數(shù)據(jù)有兩個突出的優(yōu)點莖葉圖表示數(shù)據(jù)有兩個突出的優(yōu)點,其一是統(tǒng)計圖上沒有其一是統(tǒng)計圖上沒有原始數(shù)據(jù)原始數(shù)據(jù)的損失的損失,所有信息都可以從這個莖葉圖中得到所有信息都可以從這個莖葉圖中得到,其其二是在比賽時隨時記錄二是在比賽時隨時記錄,方便記錄與表示方便記錄與表示.4.用樣本的數(shù)字特征估計總體的數(shù)字特征用樣本的數(shù)字特征估計總體的數(shù)字特征(1)眾數(shù)眾數(shù),中位數(shù)中位數(shù),平均數(shù)平均數(shù)在一組數(shù)據(jù)中在一

7、組數(shù)據(jù)中,出現(xiàn)次數(shù)出現(xiàn)次數(shù)最多最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù)的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).將一組數(shù)據(jù)按大小依次排列將一組數(shù)據(jù)按大小依次排列,把處在把處在中間中間位置的一個數(shù)據(jù)位置的一個數(shù)據(jù)(或或中間兩個數(shù)據(jù)的平均數(shù)中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)叫做這組數(shù)據(jù)的中位數(shù).如果如果n個數(shù)個數(shù),x1,x2,xn,那么那么 (x1+x2+xn)叫做這叫做這n個數(shù)的平均數(shù)個數(shù)的平均數(shù).總體中所有個體的平均數(shù)叫做總體中所有個體的平均數(shù)叫做總體平均數(shù)總體平均數(shù).樣本中所有個體的平均數(shù)叫做樣本中所有個體的平均數(shù)叫做樣本平均數(shù)樣本平均數(shù),如果在如果在n個數(shù)據(jù)個數(shù)據(jù)中中,x1出現(xiàn)了出現(xiàn)了f1次次,x2出現(xiàn)出現(xiàn)f

8、2次次,xk出現(xiàn)出現(xiàn)fk次次(這里這里f1+f2+fk=n),那么那么 (x1f1+x2f2+xkfk),叫做這叫做這n個數(shù)的加權(quán)平均數(shù)個數(shù)的加權(quán)平均數(shù).1xn1xn 12n2222122221221,()()() ,1()()() , 2,x ,x ,x ,ss,s.nnxxxxxxxnsxxxxxxn樣本方差 標準差設樣本的元素為樣本的平均數(shù)為定義其中 表示樣本方差 表示樣本標準差5.兩個變量的相關關系兩個變量的相關關系(1)當自變量的取值當自變量的取值一定一定時時,因變量的取值帶有因變量的取值帶有隨機性隨機性,這兩個這兩個變量之間的關系叫做相關關系變量之間的關系叫做相關關系.如果一個變量

9、的值由小變大時如果一個變量的值由小變大時,另一個變量的值也在由小到大另一個變量的值也在由小到大,這種相關稱為這種相關稱為正相關正相關;反之反之,如果一個變量的值由小變大時如果一個變量的值由小變大時,另一個變量的值在由大到小另一個變量的值在由大到小,這種關系稱為這種關系稱為負相關負相關.變量間變量間的這種關系與函數(shù)關系不同的這種關系與函數(shù)關系不同,它是一種非確定關系它是一種非確定關系. (2)散點圖散點圖:表示具有表示具有相關關系相關關系的兩個變量的一組數(shù)據(jù)的圖形的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖叫做散點圖.6.回歸直線方程回歸直線方程(1)一般地一般地,設設x和和y是具有相關關系的兩個變量是

10、具有相關關系的兩個變量,且對應于且對應于n個個觀測值的觀測值的n個點大致分布在一條直線的附近個點大致分布在一條直線的附近,若所求的直線若所求的直線方程為方程為 ,yabx則我們將這個方程叫做我們將這個方程叫做回歸直線方程回歸直線方程,a,b叫做叫做回歸系數(shù)回歸系數(shù),相應的相應的直線叫做直線叫做回歸直線回歸直線. (2)最小二乘法最小二乘法使離差平方和使離差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2為最為最小的方法小的方法,叫做最小二乘法叫做最小二乘法.7.回歸分析回歸分析(1)回歸直線方程回歸直線方程 =bx+a中中, 上述方程對應的直線叫做上述方程對應的

11、直線叫做回歸直線回歸直線,而對兩個變量所進行的上而對兩個變量所進行的上述統(tǒng)計分析叫做述統(tǒng)計分析叫做線性回歸分析線性回歸分析.相關系數(shù)相關系數(shù)y1221,niiiniix ynxybaybxxnx1222211niiiiiinix ynxyrxnxyny用用相關系數(shù)相關系數(shù)來描述線性相關關系的強弱來描述線性相關關系的強弱.當當r0時時,兩個變量兩個變量正正相關相關;當當r0時時,兩個變量兩個變量負相關負相關,r的絕對值越接近的絕對值越接近1,表明兩表明兩個變量的線性相關性越個變量的線性相關性越強強,r的絕對值接近于的絕對值接近于0,表明兩個變表明兩個變量之間幾乎量之間幾乎不存在不存在線性相關關系

12、線性相關關系.通常當通常當|r|大于大于r0.05時時,認為認為兩個變量有很強的線性相關關系兩個變量有很強的線性相關關系,因而求回歸直線方程才因而求回歸直線方程才有意義有意義.數(shù)據(jù)點和它在回歸直線上相應位置的差異數(shù)據(jù)點和它在回歸直線上相應位置的差異(y1- i)是隨機誤是隨機誤差效應差效應,稱稱 i=yi- i為為殘差殘差,將所得值平方后加起來將所得值平方后加起來,用數(shù)用數(shù)學符號表示為學符號表示為 (yi- i)2稱為稱為殘差平方和殘差平方和,它代表了隨它代表了隨機誤差的效應機誤差的效應.yey1niy8.獨立性檢驗獨立性檢驗(1)分類變量的定義分類變量的定義如果某種變量的不同如果某種變量的不

13、同“值值”表示個體所屬的不同類別表示個體所屬的不同類別,像這樣像這樣的變量稱為的變量稱為分類變量分類變量. (2)22列聯(lián)表列聯(lián)表一般地一般地,假設有兩個分類變量假設有兩個分類變量X和和Y,它們的值域分別為它們的值域分別為x1,x2和和y1,y2,其樣本頻數(shù)列聯(lián)表其樣本頻數(shù)列聯(lián)表(稱為稱為22列聯(lián)表列聯(lián)表)為為y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+dK2= 用它的大小可以決定是否拒絕原用它的大小可以決定是否拒絕原來的統(tǒng)計假設來的統(tǒng)計假設H0,如果如果K2值較大值較大,就拒絕就拒絕H0,即拒絕即拒絕事件事件A與與B無關無關.2()()()()()n adbcab c

14、d ac bd考點陪練考點陪練1.(2010重慶重慶)某單位有職工某單位有職工750人人,其中青年職工其中青年職工350人人,中中年職工年職工250人人,老年職工老年職工150人人,為了了解該單位職工的健康為了了解該單位職工的健康情況情況,用分層抽樣的方法從中抽取樣本用分層抽樣的方法從中抽取樣本.若樣本中的青年職若樣本中的青年職工為工為7人人,則樣本容量為則樣本容量為( )A.7 B.15C.25 D.35解析解析:設樣本容量為設樣本容量為n,則依題意有則依題意有 n=7,n=15,選選B.答案答案:B3507502.(2010湖北湖北)將參加夏令營的將參加夏令營的600名學生編號為名學生編號

15、為:001,002,600.采用系統(tǒng)抽樣方法抽取一個容量為采用系統(tǒng)抽樣方法抽取一個容量為50的的樣本樣本,且隨機抽得的號碼為且隨機抽得的號碼為003.這這600名學生分住在三個營名學生分住在三個營區(qū)區(qū),從從001到到300的第的第營區(qū)營區(qū),從從301到到495在第在第營區(qū)營區(qū),從從496到到600在第在第營區(qū)營區(qū),三個營區(qū)被抽中的人數(shù)依次為三個營區(qū)被抽中的人數(shù)依次為( )A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9解析解析:依題意及系統(tǒng)抽樣的意義可知依題意及系統(tǒng)抽樣的意義可知,將這將這600名學生按編號依名學生按編號依次分成次分成50組組,每一組各有每一組各有1

16、2名學生名學生,第第k(kN*)組抽中的號組抽中的號碼是碼是3+12(k-1).令令3+12(k-1)300,得得k ,因此第因此第營區(qū)營區(qū)被抽中的人數(shù)是被抽中的人數(shù)是25;令令3003+12(k-1)495得得 10.828,所以我們有所以我們有99.9%的把握說的把握說,A,B兩藥對兩藥對該病的治愈率之間有顯著差別該病的治愈率之間有顯著差別.方法與技巧方法與技巧 上述結(jié)論是對所有服用上述結(jié)論是對所有服用A藥或藥或B藥的病人而言藥的病人而言的的,絕不要誤以為只對絕不要誤以為只對100個病人成立個病人成立.這就體現(xiàn)了統(tǒng)計的這就體現(xiàn)了統(tǒng)計的意義意義,即由樣本推斷出全體即由樣本推斷出全體.技法二技

17、法二數(shù)形結(jié)合思想數(shù)形結(jié)合思想【典例典例2】 為了了解中學生的身高情況為了了解中學生的身高情況,對某中學同齡的若對某中學同齡的若干女生的身高進行測量干女生的身高進行測量,將所得數(shù)據(jù)整理后將所得數(shù)據(jù)整理后,畫出頻率分布畫出頻率分布直方圖如圖所示直方圖如圖所示,已知圖中從左到右已知圖中從左到右15組的頻率分別為組的頻率分別為0.05,0.10,0.15,0.15,0.30,68組的頻數(shù)分別為組的頻數(shù)分別為7,5,3,第二第二小組的頻數(shù)為小組的頻數(shù)為6. (1)畫出頻率分布表畫出頻率分布表;(2)試問這組數(shù)據(jù)中的中位數(shù)在哪個身高的范圍內(nèi)試問這組數(shù)據(jù)中的中位數(shù)在哪個身高的范圍內(nèi)?(3)如果本次測試身高在

18、如果本次測試身高在157 cm以上以上(包括包括157 cm)的為良好的為良好,試估計該校女生身高良好率是多少試估計該校女生身高良好率是多少? 解題切入點解題切入點 通過第二組的頻數(shù)和頻率先求出學生總數(shù)通過第二組的頻數(shù)和頻率先求出學生總數(shù),其其他問題就十分容易解決了他問題就十分容易解決了,主要考查同學們對頻率分布表主要考查同學們對頻率分布表和頻率分布直方圖的掌握情況和頻率分布直方圖的掌握情況,考查識圖考查識圖 讀圖的能力讀圖的能力,以以及靈活運用圖及靈活運用圖 表解決實際問題的能力表解決實際問題的能力. 解解 (1)因為第二組的頻數(shù)是因為第二組的頻數(shù)是6,頻率是頻率是0.1,所以學生總數(shù)為所以學生總數(shù)為60.1=60,所以所以15組的頻數(shù)分別為組的頻數(shù)分別為3,6,9,9,18;68組的頻率分別為組的頻率分別為71,0.05,60 12頻率分布表如下表所示頻率分布表如下表所示:分組分組頻數(shù)頻數(shù)頻率頻率145,148)30.05148,151)60.10151,154)90.15154,157)90.15157,160)180.30160

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論