《數(shù)理統(tǒng)計》(浙大四版)-第6章 - 樣本及抽樣分布_第1頁
《數(shù)理統(tǒng)計》(浙大四版)-第6章 - 樣本及抽樣分布_第2頁
《數(shù)理統(tǒng)計》(浙大四版)-第6章 - 樣本及抽樣分布_第3頁
《數(shù)理統(tǒng)計》(浙大四版)-第6章 - 樣本及抽樣分布_第4頁
《數(shù)理統(tǒng)計》(浙大四版)-第6章 - 樣本及抽樣分布_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、高等學校數(shù)學專業(yè)課程數(shù)理統(tǒng)計數(shù)學教研室主講:黃新仁課程簡介 概率論的特點是什么?假定隨機變量的概率分布已知,以此來討論其各種特性。一、數(shù)理統(tǒng)計學的任務如:概率、期望、方差、協(xié)方差、相關系數(shù)等。 實際中,如何確定隨機變量的概率分布未知或數(shù)字特征?【例】確定某燈泡廠年產(chǎn)燈泡的次品率。燈泡的質(zhì)量通常用其壽命來衡量,若規(guī)定壽命不足3000小時為次品,那么確定該廠年產(chǎn)燈泡的次品率可歸結為求燈泡壽命X這個隨機變量的概率分布函數(shù)F(x),因為當F(x)已知時,P(x3000)=F(3000)即為所求。 F(x)如何求?測量所有燈泡,確定次品率。不可行!破壞性不經(jīng)濟課程簡介 F(x)如何求?抽測一部分燈泡如何

2、由部分來推斷整體?數(shù)理統(tǒng)計的主要任務:上一頁下一頁返回研究怎樣以有效的方式收集、整理和分析帶有隨機性的數(shù)據(jù),對所考察的問題作出推斷和預測,為決策和行動提供依據(jù)和建議.課程簡介二、課程內(nèi)容及學時分配第六章:樣本及抽樣分布理論第七章:參數(shù)估計第八章:假設檢驗第九章:方差分析與回歸分析(9學時)(9學時)(12學時)(12學時)三、預備知識概率論、數(shù)學分析、線性代數(shù)課程簡介四、數(shù)理統(tǒng)計發(fā)展簡史上一頁下一頁返回英國是數(shù)理統(tǒng)計的發(fā)源地和研究中心,從第二次世界大戰(zhàn)開始,美國也發(fā)展得很快,并且在生物、農(nóng)業(yè)、醫(yī)學、社會、經(jīng)濟、工業(yè)和科技等方面得到愈來愈廣泛的應用,如教學評價、調(diào)查統(tǒng)計、經(jīng)濟評估、銷售預測、質(zhì)量

3、控制、天氣預報、地震預報、疾病分析、產(chǎn)量估計等。課程簡介 發(fā)展歷史短; 應用性很強; 涉及領域廣。(一)古典時期(19世紀前) 高斯等:誤差理論,正態(tài)分布,最小二乘法與國家實施的統(tǒng)治有關, 描述性統(tǒng)計學數(shù)理統(tǒng)計學的萌芽期 收集數(shù)據(jù)、簡單計算、作圖表等;Status(國家)Statista(政治家)Statistics(統(tǒng)計學)課程簡介課程簡介這一時期的主要理論與成就:伯努利(瑞士,1654-1705)系統(tǒng)論證了大數(shù)定律;貝葉斯(英國,1702-1763)提出了歸納推理理論,后被發(fā)展為一種統(tǒng)計推斷方法;棣莫佛(法國,1667-1754)發(fā)現(xiàn)了正態(tài)分布的密度函數(shù),為大樣本理論奠定基礎;高斯(法國,

4、1667-1754)、勒讓德(法國,1752-1883)在誤差理論中引進正態(tài)分布,并用最小二乘法進行計算;(二)近代時期(19世紀末至二戰(zhàn)結束)概率論的發(fā)展,工農(nóng)業(yè)生產(chǎn)迫切需要,促使數(shù)理統(tǒng)計的主要分支建立,是數(shù)理統(tǒng)計的形成時期. 皮爾遜(英國,1857-1936)1889年,提出了矩估計理論;戈塞特(英國,1876-1937)1908年,發(fā)現(xiàn)了t分布和t檢驗法;費希爾(英國,1890-1962)1912年,推廣了t檢驗法,發(fā)展了顯著性檢驗及方差分析;假設檢驗、回歸分析、方差分析等有決定其面貌的內(nèi)容和理論,數(shù)理統(tǒng)計成為應用廣泛、方法獨特的一門數(shù)學學科. 課程簡介(三)現(xiàn)代時期(二戰(zhàn)以后)瓦你德(

5、美籍羅馬尼亞,1902-1950)致力于用數(shù)學方法使統(tǒng)計學精確化、嚴密化. 計算機及其軟件的應用,如EXCEL、MATLAB、SAS、SPSS推動了數(shù)理統(tǒng)計在理論研究和應用方面不斷地向縱深發(fā)展,并產(chǎn)生一些新的分支和邊緣性的新學科,如最優(yōu)設計和非參數(shù)統(tǒng)計推斷等。課程簡介課程簡介五、統(tǒng)計學的兩大學派社會統(tǒng)計學&數(shù)理統(tǒng)計學 社會統(tǒng)計學派始于19世紀末,首創(chuàng)人物是德國的克尼斯。德國統(tǒng)計學家恩格爾提出的“恩格爾系數(shù)” ,英國經(jīng)濟學家斯通等人研究的國民收入和國內(nèi)生產(chǎn)總值的核算方法等,都是偉大的貢獻高等學校數(shù)學專業(yè)課程數(shù)理統(tǒng)計樣本及抽樣分布第六章數(shù)學教研室本章目錄6.1 隨機樣本6.2 箱線圖和直方圖6.3

6、 抽樣分布上一頁下一頁返回6.1 隨機樣本6.2 箱線圖和直方圖6.3 抽樣分布【定義1】研究的問題所涉及的對象的全體稱為總體, 總體中的每個成員稱為個體.一、總體與個體例如:燈泡廠年產(chǎn)的所有燈泡是總體,每一個燈泡是個體?!締枴咳藗冴P心的是燈泡(即總體或個體)本身嗎?關心的是燈泡的某個數(shù)量指標壽命!【定義2】研究對象的某項指標的全體稱為總體,而把每個成員的指標稱為個體.上一頁下一頁返回6.1 隨機樣本1、總體與個體的概念又如:研究2000名學生的年齡, 學生年齡的全體就構成一個總體, 每個學生的年齡就是個體. 有限總體總體所包含的個體數(shù)量是有限。 無限總體總體所包含的個體數(shù)量是無限的。對一個總

7、體,如果我們用X 表示它的數(shù)量指標,那么對不同的個體X 取不同的值。因此,如果隨機地抽取個體,則X的值也就隨著抽取的個體的不同而不同.X 的分布稱為總體的分布X 是一個隨機變量,總體的特性是由總體的分布來刻畫。因此, 常把總體和總體分布視為同義語,即以后常將X 稱為總體X。有概率分布上一頁下一頁返回6.1 隨機樣本【例】考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則總體=由0或1組成的一堆數(shù),若以 p 表示這堆數(shù)中1的比例(不合格品率),則該總體對應于一個具有參數(shù)p的(0-1)分布:該總體叫(0-1)分布總體類似還有:正態(tài)(分布)總體、指數(shù)分布總體等。2. 總體分布【定義3】從總體中抽取

8、的一部分樣品稱為樣本,樣本中個體的個數(shù)稱為樣本容量,樣本的觀察值稱為樣本值。二、樣本例如,從一批燈泡中抽取了n個燈泡,測其壽命分別記為X1,X2,Xn, 其觀察值分別為x1,x2,xn,則(X1,X2,Xn)是樣本,n是樣本容量,(x1,x2,xn)是樣本值。上一頁下一頁返回6.1 隨機樣本【定義4】若樣本X1,X2,Xn間相互獨立,且與總體X具有相同的分布,則成其為簡單隨機樣本,簡稱樣本。 對于有限總體,采取有放回抽樣。但是使用不方便。當個體總數(shù)比樣本容量大得多時,在實際中可采用不放回抽樣 對于無限總體,總是采用無放回抽樣。三、樣本的分布假設總體X具有概率密度f(x), X1,X2 ,Xn

9、為來自總體X的樣本,于是它們的聯(lián)合概率密度為 設總體X具有分布函數(shù)F(x), 則樣本聯(lián)合分布函數(shù)為上一頁下一頁返回6.1 隨機樣本本章目錄6.1 隨機樣本6.2 箱線圖和直方圖6.3 抽樣分布上一頁下一頁返回6.1 隨機樣本6.2 箱線圖和直方圖6.3 抽樣分布6.2 直方圖與箱線圖一、直方圖(histogram)橫坐標表示數(shù)據(jù),縱坐標有三種表示方法:頻數(shù)、頻率、頻率/組距。三種直方圖的差別僅在于縱軸刻度的選擇,直方圖形狀本身并無變化。直方圖又稱柱狀圖,它是表示數(shù)據(jù)變化情況的一種主要工具。用直方圖可以解析出數(shù)據(jù)的規(guī)則性,比較直觀地看出數(shù)據(jù)特性的分布狀態(tài),便于判斷其總體質(zhì)量分布情況?!纠?】6.

10、2 直方圖與箱線圖(1)對樣本分組:組數(shù)通常在520個;(2)確定組距:組距 = (最大觀測值 最小觀測值)/組數(shù);(3)確定組限:各組區(qū)間端點為a0, a1=a0+, a2=a0+2, , ak=a0+k, 形成如下的分組區(qū)間(a0, a1 , (a1, a2, , (ak-1, ak,對這84個數(shù)據(jù)(樣本)進行整理,具體步驟如下:其中a0 略小于最小觀測值, ak 略大于最大觀測值.(4)統(tǒng)計樣本數(shù)據(jù)落入每個區(qū)間的個數(shù)頻數(shù)fi,并計算出頻率fi / n.6.2 直方圖與箱線圖【解】取區(qū)間a0,ak=124.5,159.5,組距d=(159.5-124.5)/7=5,確定組限,數(shù)出落在各區(qū)間

11、內(nèi)的數(shù)據(jù)的頻數(shù),計算出相應頻率,得到下表:于是得到頻率直方圖如下:6.2 直方圖與箱線圖于是得到頻率直方圖如下:當n 很大時,頻率直方圖的外輪廓曲線接近于總體X的概率密度曲線。正態(tài)總體0.01190.04760.11910.39290.28570.10710.0357估計:51.2%的人最大頭顱寬度落在區(qū)間134.5,144.5之間等。6.2 直方圖與箱線圖6.2 直方圖與箱線圖二、箱線圖(Box-plot ) 箱線圖也叫“盒式圖”或“箱形圖”,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖,因其形狀類似箱子而得名,它被應用于各種領域,常見于品質(zhì)管理。 最適宜提供有關數(shù)據(jù)的位置和分散的參考,尤其在

12、不同的母體數(shù)據(jù)時更可表現(xiàn)其差異。 6.2 直方圖與箱線圖1、樣本分位數(shù)【定義】于是有6.2 直方圖與箱線圖【例2】【解】6.2 直方圖與箱線圖2、箱線圖的做法數(shù)據(jù)集的性質(zhì):6.2 直方圖與箱線圖【例3】【解】6.2 直方圖與箱線圖【例4】6.2 直方圖與箱線圖【解】箱線圖如下圖:本章目錄6.1 隨機樣本6.2 箱線圖和直方圖6.3 抽樣分布上一頁下一頁返回6.1 隨機樣本6.2 箱線圖和直方圖6.3 抽樣分布6.3 抽樣分布一、基本概念1、統(tǒng)計量的定義【定義1】 設 X1, X2, , Xn 為取自某總體的樣本,若樣本的函數(shù)g = g(X1, X2, , Xn)中不含有任何未知參數(shù),則稱g是一

13、個統(tǒng)計量,g(x1, x2, , xn)稱為統(tǒng)計值。 、經(jīng)驗分布函數(shù)Fn(x)如:是統(tǒng)計量(值)不是統(tǒng)計量(值) 當, 2 未知時,x1, x1/2.幾個常用統(tǒng)計量的定義(1)樣本均值(2)樣本方差其觀察值設 X1, X2, , Xn 為取自某總體的樣本,x1, x2, , xn是其觀察值其觀察值6.3 抽樣分布(3)樣本標準差(4)樣本k 階原點矩其觀察值(5)樣本k階中心矩樣本均值樣本方差一階原點矩二階中心矩其觀察值6.3 抽樣分布由以上定義得下述結論:由第五章關于依概率收斂的序列的性質(zhì)知矩估計法的理論6.3 抽樣分布3.經(jīng)驗分布函數(shù)6.3 抽樣分布【例1】一般地,6.3 抽樣分布格里汶科

14、定理6.3 抽樣分布有很多統(tǒng)計推斷是基于正態(tài)分布的假設的,以標準正態(tài)變量為基石而構造的三個著名統(tǒng)計量在實際中有廣泛的應用,它們被稱為統(tǒng)計中的“三大分布” 。統(tǒng)計量的分布叫做“抽樣分布” 。6.3 抽樣分布二、常見的分布1、2 分布(卡方分布)【定義2】 設 X1, X2, Xn, 是來自總體N(0,1)的樣本 ,則稱統(tǒng)計量 2 = X12+ X22 + +Xn2 (1)服從自由度為n 的2分布,記為 2 2(n) 。指(1)中右端包含的獨立變量的個數(shù)。2(n) 分布的概率密度為:6.3 抽樣分布2 分布的性質(zhì)性質(zhì)1:設 來自正態(tài)總體則性質(zhì)2:設則有分布的可加性.性質(zhì)3:若 ,則有6.3 抽樣分

15、布2 分布分位數(shù)(點)分位數(shù) 2(n) 可以從附表4 中查到?!径x3】 對給定的正數(shù) (01),稱滿足條件 的2(n) 是自由度為n卡方分布的上 分位數(shù)(點).如:請同學們求解:28.84531.4106.3 抽樣分布附表2-1根據(jù)正態(tài)分布的對稱性知附表2-2【例2】6.3 抽樣分布附表2-3附表4只詳列到 n=45 為止.附表2-4附表2-5【例3】6.3 抽樣分布例如利用上面公式,而查詳表可得費舍爾(R.A.Fisher)證明:6.3 抽樣分布【定義4】 對給定的正數(shù) (01),稱滿足條件 的1-2(n) 是自由度為卡方分布的下1- 分位數(shù)(點).思考?6.3 抽樣分布2、t 分布 【定

16、義5】 設隨機變量X 與Y 獨立,且X N(0,1), Y 2(n), 則稱的分布為自由度為n 的t 分布,記為t t(n) 。 t 分布的密度函數(shù)為: t分布是英國統(tǒng)計學家戈塞特(Gosset)于1908年在一篇以“學生”(student)為筆名的論文中首先提到的,因此又稱為學生分布。它在小樣本實驗分析中有重要應用。 6.3 抽樣分布2.當n充分大時,其圖形類似于標準正態(tài)變量概率密度的圖形.6.3 抽樣分布t 分布分位數(shù)(點)【定義6】對給定的正數(shù) (01),若滿足條件 則稱 為t分布的上 分位數(shù)(點).附表2-6附表2-7【例3】6.3 抽樣分布請同學們求解:1.7531若:問?求滿足的6

17、.3 抽樣分布3、F 分布【定義7】設X 2(m), Y 2(n), X1與X2獨立,則稱 是自由度為m與n的 F分布,記為F F(m, n) 。yf(y)on1=10,n2=25n1=10,n2=56.3 抽樣分布【定義8】 對給定 (01) ,稱滿足條件P(F F(m,n) = 的F(m,n) 是自由度為m 與 n 的F 分布的上 分位數(shù)。F分布分位數(shù)(點)【例4】6.3 抽樣分布定理1 設 x1, x2, xn 是來自N(, 2) 的樣本,則有(上講中已證明)(利用正交變換證明,請參看其他教材)(利用正交變換證明,請參看其他教材)推論6.3 抽樣分布定理2 設 x1, x2, xn 是來

18、自N(, 2) 的樣本,則有證明:由定理1及其推論知與 相互獨立.從而由t分布的生成定義 知6.3 抽樣分布定理3 設 x1, x2, xm 和y1, y2, yn分別來自兩個相互獨立的正態(tài)總體N(a1, 12) 和N(a2, 22) ,則有證明:由定理1知由于兩個總體相互獨立,所以 獨立于是故有結論成立(一般正態(tài)變量的標準化).6.3 抽樣分布定理4 設 x1, x2, xm 和y1, y2, yn分別來自兩個相互獨立的正態(tài)總體N(a1, 2) 和N(a2, 2) ,則有證明:由定理3知又由定理1知且 相互獨立,于是6.3 抽樣分布定理4 設 x1, x2, xm 和y1, y2, yn分別

19、來自兩個相互獨立的正態(tài)總體N(a1, 2) 和N(a2, 2) ,則有證明:(續(xù))于是由t分布的生成定義 知結論成立.相互獨立6.3 抽樣分布定理5 設 x1, x2, xn 是來自N(1, 12) 的樣本,y1, y2, yn 是來自N(2, 22) 的樣本,且此兩樣本相互獨立,則有特別,若12 =22 ,則因為證明:于是由F 分布的生成定義 知結論成立.6.3 抽樣分布Karl.Pearson(1857-1936) 卡方分布是海爾墨特(Hermert)和皮爾遜(K.Person)分別于1875和1900年導出的。皮爾遜是英國著名統(tǒng)計學家,1879年畢業(yè)于劍 橋大學,1901年,他與高爾頓、

20、韋爾登創(chuàng)辦的生物統(tǒng)計學雜志, 使數(shù)理統(tǒng)計有了自己的陣地。皮爾遜的最大貢獻是在1900年發(fā)表的一篇文章中引進的擬合優(yōu)度的卡方檢驗。不少人把這視為近代統(tǒng)計學的開端。關于卡方分布附錄:附表2-11.645附表2-2標準正態(tài)分布表z01234567891.61.71.81.92.02.12.22.32.42.52.62.72.82.93.00.94520.95540.96410.97130.97720.98210.98610.98930.99180.99380.99530.99650.99740.99810.99870.94630.95640.96480.97190.97780.98260.98640

21、.98960.99200.99400.99550.99660.99750.99820.99900.94740.95730.96560.97260.97830.98300.98680.98980.99220.99410.99560.99670.99760.99820.99930.94840.95820.96640.97320.97880.98340.98710.99010.99250.99430.99570.99680.99770.99830.99950.94950.95910.96710.97380.97930.98380.98710.99040.99270.99450.99590.99690

22、.99770.99840.99970.95050.95990.96780.97440.97980.98420.98780.99060.99290.99460.99600.99700.99780.99840.96980.95150.96080.96860.97500.98030.98460.98810.99090.99310.99480.99610.99710.99790.99850.99980.95250.96160.96930.97560.98080.98500.98840.99110.99320.99490.99620.99720.99790.99850.99990.95350.96250

23、.97000.97620.98120.98540.98870.99130.99340.99510.99630.99730.99800.99860.99990.95450.96330.97060.97670.98170.98530.98900.99160.99360.99520.99640.99740.99810.99861.00001.96附表2-3分布表17.535=0.250.100.050.0250.010.005123456789101112131415161.3232.7734.1085.3856.6267.8419.03710.21911.38912.54913.70114.845

24、15.98417.11718.24519.3692.7064.6056.2517.7799.23610.64512.01713.36214.68415.98717.27518.54919.81220.06422.30723.5423.8415.9917.8159.48811.07112.59214.06715.50716.91918.30719.67521.02622.36223.68524.99626.2965.0247.3789.34811.14312.83314.44916.01317.53519.02320.48321.92023.33724.73626.11927.48828.845

25、6.6359.21011.34513.27715.08616.81218.47520.09021.66623.20924.72526.21727.68829.14130.57832.0007.87910.59712.83814.86016.75018.54820.27821.95523.58925.18826.75728.29929.89131.31932.80134.267=0.9950.990.9750.950.900.75123456789101112131415160.0100.0720.2070.4120.6760.9891.3441.7352.1562.6033.0743.5654

26、.0754.6015.1420.0200.1150.2970.5540.8721.2391.6462.0882.5583.0533.5714.1074.6605.2295.8120.0010.0510.2160.4840.8311.2371.6902.1802.7003.2473.8164.4045.0095.6296.2626.9080.0040.1030.3520.7111.1451.6352.1672.7333.3253.9404.5755.2265.8926.5717.2617.9620.0160.2110.5841.0641.6102.2042.8333.4904.1684.8655

27、.5786.3047.0427.7908.5479.3120.1020.5751.2131.9232.6753.4554.2555.0715.8996.7377.5848.4389.29910.16511.03711.9123.247附表2-4分布表=0.250.100.050.0250.010.0051718192021222324252627282930313220.48921.60522.71823.82824.93526.03927.14128.24129.33930.43531.52832.62033.71134.80035.88736.97324.76925.98927.20428

28、.41229.61530.81332.00733.19634.38235.56336.74137.91639.08740.25641.42242.58527.58728.86930.14431.41032.67133.92435.17236.41537.65238.88540.11341.33742.55743.77344.98546.19430.19131.52632.85234.17035.47936.78138.07639.36440.64641.92343.19444.46145.71246.97948.23249.48033.40934.80536.19137.56638.93240

29、.28941.63842.98044.31445.64246.96348.27849.58850.89252.19153.48635.71837.15638.58239.99741.40142.79644.18145.55946.92848.29049.64550.99352.33653.67255.00356.32834.382附表2-5分布表附表2-6 =0.250.100.050.0250.010.005123456789101112131415161.00000.81650.76490.74070.72670.71760.71110.70640.70270.69980.69740.69550.69380.69240.69120.69013.07771.88561.63771.53321.47591.43981.41491.39681.38301.37221.36341.35621.35021.34501.34061.33686.31382.92002.35342.13182.01501.94321.89461.85951.83311.81251.79591.78231.77091.76131.75311.745912.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.364

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論