概率論 第六章精品課件_第1頁
概率論 第六章精品課件_第2頁
概率論 第六章精品課件_第3頁
概率論 第六章精品課件_第4頁
概率論 第六章精品課件_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、概率論 第六章第1頁,共63頁,2022年,5月20日,6點6分,星期四第六章 樣本及抽樣分布引言隨機樣本抽樣分布第2頁,共63頁,2022年,5月20日,6點6分,星期四本章轉(zhuǎn)入課程的第二部分?jǐn)?shù)理統(tǒng)計 數(shù)理統(tǒng)計的特點是應(yīng)用面廣,分支較多. 社會的發(fā)展不斷向統(tǒng)計提出新的問題. 計算機的誕生與發(fā)展,為數(shù)據(jù)處理提供了強有力的技術(shù)支持,數(shù)理統(tǒng)計與計算機的結(jié)合是必然的發(fā)展趨勢.引言第3頁,共63頁,2022年,5月20日,6點6分,星期四 學(xué)習(xí)統(tǒng)計無須把過多時間化在計算上,可以更有效地把時間用在基本概念、方法原理的正確理解上. 國內(nèi)外著名的統(tǒng)計軟件包: SAS,SPSS,MATLAB, STAT等,都

2、可以讓你快速、簡便地進行數(shù)據(jù)處理和分析.第4頁,共63頁,2022年,5月20日,6點6分,星期四 從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計的工作 . 但是當(dāng)時的統(tǒng)計,只是對有關(guān)事實的簡單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.第5頁,共63頁,2022年,5月20日,6點6分,星期四 到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計學(xué)這門學(xué)科. 數(shù)理統(tǒng)計學(xué)是一門應(yīng)用性很強的學(xué)科. 它是研究怎樣以有效的方式收集、 整理和分析帶有隨機性的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)測,直至為采取

3、一定的決策和行動提供依據(jù)和建議.第6頁,共63頁,2022年,5月20日,6點6分,星期四目前地震預(yù)測研究有3種不同的思路:地震地質(zhì)。地震統(tǒng)計。對過去已發(fā)生的地震,運用數(shù)理統(tǒng)計方法,從中發(fā)現(xiàn)地震發(fā)生的規(guī)律,特別是時間序列的規(guī)律,根據(jù)過去以推測未來。此法把地震問題歸結(jié)為數(shù)學(xué)問題。因需要對大量地震資料作統(tǒng)計,研究的區(qū)域往往過大,所以判定地震的地點有困難,而且外推常常不準(zhǔn)確。地震前兆。第7頁,共63頁,2022年,5月20日,6點6分,星期四 數(shù)理統(tǒng)計不同于一般的資料統(tǒng)計,它更側(cè)重于應(yīng)用隨機現(xiàn)象本身的規(guī)律性進行資料的收集、整理和分析. 由于大量隨機現(xiàn)象必然呈現(xiàn)出它的規(guī)律性,因而從理論上講,只要對隨機

4、現(xiàn)象進行足夠多次觀察,被研究的隨機現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來. 但客觀上只允許我們對隨機現(xiàn)象進行次數(shù)不多的觀察試驗,也就是說, 我們獲得的只是局部觀察資料.第8頁,共63頁,2022年,5月20日,6點6分,星期四 在概率論中所研究的隨機變量,它的分布都是假設(shè)已知的,在這一前提下去研究它的性質(zhì)、特點和規(guī)律性,例如求出它的數(shù)字特征,討論隨機變量函數(shù)的分布,介紹常用的各種分布等。 而在數(shù)理統(tǒng)計中的隨機變量,它的分布是未知的,或者不完全知道,人們通過對所研究的隨機變量進行重復(fù)、獨立的觀察,得到許多觀察值,對這些數(shù)據(jù)進行分析,從而對隨機變量的分布作出種種判斷。第9頁,共63頁,2022年,5月2

5、0日,6點6分,星期四 現(xiàn)實世界中存在著形形色色的數(shù)據(jù),分析這些數(shù)據(jù)需要多種多樣的方法. 因此,數(shù)理統(tǒng)計中的方法和支持這些方法的相應(yīng)理論是相當(dāng)豐富的.概括起來可以歸納成兩大類: 參數(shù)估計根據(jù)數(shù)據(jù),用一些方法對分布的未知參數(shù)進行估計. 假設(shè)檢驗根據(jù)數(shù)據(jù),用一些方法對分布的未知參數(shù)進行檢驗. 它們構(gòu)成了統(tǒng)計推斷的兩種基本形式.這兩種推斷滲透到了數(shù)理統(tǒng)計的每個分支.第10頁,共63頁,2022年,5月20日,6點6分,星期四6.1 隨機樣本總體和樣本第11頁,共63頁,2022年,5月20日,6點6分,星期四 在數(shù)理統(tǒng)計中,不是對所研究的對象全體 (稱為總體)進行觀察,而是抽取其中的部分(稱為樣本)

6、進行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進行推斷.數(shù)理統(tǒng)計方法具有“部分推斷整體”的特征 .第12頁,共63頁,2022年,5月20日,6點6分,星期四 實際上,我們真正關(guān)心的并不是研究對象本身,而是其某項數(shù)量指標(biāo). 比如某家工廠的一種產(chǎn)品的使用壽命這樣一項數(shù)量指標(biāo).1.總體某批燈泡的壽命該批燈泡壽命的全體就是總體國產(chǎn)轎車每公里的耗油量國產(chǎn)轎車每公里耗油量的全體就是總體第13頁,共63頁,2022年,5月20日,6點6分,星期四 對研究對象上的某項數(shù)量指標(biāo)進行觀察。 試驗的全部可能的觀察值稱為總體. 這些值不一定各不相同(可能重復(fù)),數(shù)目上也不一定有限. 每一個可能的觀察值稱為個體. 總

7、體中所包含的個體的個數(shù)稱為總體的容量.總體有限總體無限總體第14頁,共63頁,2022年,5月20日,6點6分,星期四 例1 研究某地區(qū)N個農(nóng)戶的年收人. 在上面的例子中,總體是很直觀的,是看得見摸得著的.但是客觀情況并不總是這樣.注意總體指他們的年收入的N個數(shù)字.例2 用一把尺子去量一個物體的長度.總體應(yīng)該理解為一切所有可能的測量值的全體.第15頁,共63頁,2022年,5月20日,6點6分,星期四 對一個總體, 如果我們用X表示它的數(shù)量指標(biāo),那么X的值對不同的個體取不同的值. 因此, 如果我們隨機地抽取個體, 則X的值也就隨著抽取的個體的不同而不同. 所以X是一個隨機變量!2、總體的分布

8、既然總體是隨機變量X, 自然就有其概率分布.我們把X的分布稱為總體的分布. 總體的特性是由總體分布來刻畫的. 因此, 我們常把總體和總體分布視為同義語.第16頁,共63頁,2022年,5月20日,6點6分,星期四 例l中,若農(nóng)戶年收入以萬元計, 假定N戶中收入X為以下幾種取值: 0.5, 0.8, l, 1.2和1.5. 取這些值的農(nóng)戶個數(shù)分別為:n1, n2, n3, n4, n5,(這里n1+n2+n3+n4+n5=N).例3 (例l續(xù)) 則總體X的分布為離散型分布, 其分布律為:第17頁,共63頁,2022年,5月20日,6點6分,星期四 例如:研究某批燈泡的壽命時,關(guān)心的數(shù)量指標(biāo)就是壽

9、命,那么,此總體就可以用隨機變量X表示,或用其分布函數(shù)F(x)表示 . 壽命 X 可用指數(shù)分布來刻劃 鑒于此,常用隨機變量的記號或用其分布函數(shù)表示總體. 如說總體X或總體F(x) .某批燈泡的壽命總體 壽命總體是指數(shù)分布總體第18頁,共63頁,2022年,5月20日,6點6分,星期四 類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時 ,若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X 和Y 分別表示身高和體重,那么此總體就可用二維隨機變量(X,Y)或其聯(lián)合分布函數(shù) F(x,y)來表示.第19頁,共63頁,2022年,5月20日,6點6分,星期四 總體分布一般是未知, 或只知道是包含未知參數(shù)的分布, 為推斷總體分布

10、及各種特征, 按一定規(guī)則從總體中抽取若干個體進行觀察試驗, 以獲得有關(guān)總體的信息 , 這一抽取過程稱為 “抽樣”, 所抽取的部分個體稱為樣本. 樣本中所包含的個體數(shù)目稱為樣本容量.3. 樣本從國產(chǎn)轎車中抽5輛進行耗油量試驗樣本容量為5第20頁,共63頁,2022年,5月20日,6點6分,星期四當(dāng)n次觀察一經(jīng)完成, 得到n個具體的數(shù) x1, x2, xn , 稱為樣本X1, , Xn的一次觀察值, 簡稱樣本值 .1. 代表性: X1, X2, Xn中每一個與所考察的總體有 相同的分布.2. 獨立性: X1, X2, Xn是相互獨立的隨機變量. 對總體X在相同的條件下, 進行n次重復(fù)、獨立觀察,

11、其結(jié)果依次記為X1, X2, , Xn, 這樣得到的隨機變量X1, X2, , Xn是來自總體X的一個簡單隨機樣本, 與總體隨機變量具有相同的分布. n是樣本的容量.這種抽樣, 叫作“簡單隨機抽樣”, 其特點:第21頁,共63頁,2022年,5月20日,6點6分,星期四 對有限總體, 采用放回抽樣可得簡單隨機樣本, 但放回抽樣使用起來不方便, 當(dāng)個體總數(shù)N比要得到的樣本的容量n大得多時, 在實際中可將不放回抽樣近似當(dāng)作放回抽樣來處理. 對無限總體, 因抽取一個個體不影響它的分布,所以總是采用不放回抽樣.第22頁,共63頁,2022年,5月20日,6點6分,星期四定義: 設(shè)X是具有分布函數(shù)F的隨

12、機變量,若X1, X2, , Xn是具有同一分布函數(shù)的、相互獨立的隨機變量,則稱X1, X2, , Xn為從分布函數(shù)F(或總體F、或總體X) 得到的容量為n的簡單隨機樣本,簡稱樣本,它們的觀察值x1, x2, xn稱為樣本值,又稱為X的n個獨立的觀察值. 簡單隨機樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到“X1, X2, Xn是取自某總體的樣本”時,若不特別說明,就指簡單隨機樣本.第23頁,共63頁,2022年,5月20日,6點6分,星期四 既然樣本 X1,X2 , ,Xn 被看作隨機變量,自然就需要研究它們的分布4. 樣本的分布=F(x1) F(x2) F(xn) 若總體的分布函數(shù)為F(x)、概

13、率密度函數(shù)為f(x), 則其簡單隨機樣本的聯(lián)合分布函數(shù)為其簡單隨機樣本的聯(lián)合概率密度函數(shù)為=f(x1) f(x2) f(xn) 第24頁,共63頁,2022年,5月20日,6點6分,星期四 假設(shè)某大城市居民的收入服從正態(tài)分布 N(, 2), 其概率密度函數(shù)為: 例5設(shè)X1,X2 , , Xn是來自總體的一個樣本. 則 Xi N(, 2), i1, 2, n.于是樣本 X1, X2 , , Xn的聯(lián)合概率密度為第25頁,共63頁,2022年,5月20日,6點6分,星期四 事實上我們抽樣后得到的資料都是具體的、確定的值. 如我們從某班大學(xué)生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不

14、是樣本. 我們只能觀察到隨機變量取的值而見不到隨機變量.4. 總體、樣本、樣本值的關(guān)系第26頁,共63頁,2022年,5月20日,6點6分,星期四總體(理論分布) ? 樣本 樣本值 統(tǒng)計是從手中已有的資料樣本值,去推斷總體的情況-總體分布F(x)的性質(zhì). 總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體. 樣本是聯(lián)系二者的橋梁第27頁,共63頁,2022年,5月20日,6點6分,星期四休息片刻繼續(xù)下一講第28頁,共63頁,2022年,5月20日,6點6分,星期四6.2 抽樣分布統(tǒng)計量與經(jīng)驗分布函數(shù)統(tǒng)計三大抽樣分布幾個重要的抽樣分布定理課堂練習(xí)布置作業(yè)第2

15、9頁,共63頁,2022年,5月20日,6點6分,星期四 由樣本值去推斷總體情況,需要對樣本值進行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.1. 統(tǒng)計量 這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計量. 它是完全由樣本決定的量.一、統(tǒng)計量與經(jīng)驗分布函數(shù)第30頁,共63頁,2022年,5月20日,6點6分,星期四定義:設(shè)X1, , Xn 是來自總體X的一個樣本, g(X1, , Xn )是X1, , Xn的函數(shù), 若g中不含未知參數(shù), 則稱g(X1, ,Xn )是總體X的一個統(tǒng)計量. 設(shè)X1, , Xn 是來自總體X的一個樣本, x1, , xn 是樣本X1,

16、, Xn的一個觀察值, 則 g(x1, , xn ) 是統(tǒng)計量g(X1, ,Xn )的觀察值. 例:設(shè)X1, , Xn 是總體X的一個樣本, XN(m, s2), 令T=X1- , 若為已知的, 則T為統(tǒng)計量; 若未知, T就不是統(tǒng)計量.第31頁,共63頁,2022年,5月20日,6點6分,星期四幾個常用的統(tǒng)計量及其觀察值 : 1.樣本均值 2.樣本方差 樣本標(biāo)準(zhǔn)差 它反映了總體均值的信息它反映了總體方差的信息第32頁,共63頁,2022年,5月20日,6點6分,星期四3.樣本k階原點矩4.樣本k階中心矩它反映了總體k 階矩的信息它反映了總體k 階中心矩的信息第33頁,共63頁,2022年,5

17、月20日,6點6分,星期四統(tǒng)計量的觀察值第34頁,共63頁,2022年,5月20日,6點6分,星期四結(jié)論: 若總體X的k階原點矩存在, 則當(dāng)n趨于時證明: 辛欽定理 及依概率收斂的序列的性質(zhì) .第七章矩估計法的理論根據(jù)第35頁,共63頁,2022年,5月20日,6點6分,星期四經(jīng)驗分布函數(shù)是與總體X的分布函數(shù)F(x)相應(yīng)的統(tǒng)計量. 設(shè)X1, X2, Xn, 是總體F的一個樣本, 令S(x)表示X1, X2, Xn中不大于x的隨機變量的個數(shù). 定義經(jīng)驗分布函數(shù)Fn(x)為: 對于一個樣本值 x1, x2, xn, 經(jīng)驗分布函數(shù)Fn(x)的觀察值仍記為Fn(x). 2. 經(jīng)驗分布函數(shù)第36頁,共6

18、3頁,2022年,5月20日,6點6分,星期四例1:設(shè)總體F具有一個樣本1, 2, 3, 則經(jīng)驗分布函數(shù)F3(x)的觀察值為例2:若樣本值為1, 1, 2, 則經(jīng)驗分布函數(shù)F3(x)的觀察值為第37頁,共63頁,2022年,5月20日,6點6分,星期四 一般地,設(shè)x1, x2, xn, 是總體F的一個容量為n的樣本值, 要求經(jīng)驗分布函數(shù)的觀察值. 首先將 x1, x2, xn, 按由小到大的順序排列, 并重新編號, 設(shè)為x(1)x(2) x(n) , 則經(jīng)驗分布函數(shù)Fn (x)的觀察值為, 對不同的樣本值, 得到的經(jīng)驗分布函數(shù)不同.但當(dāng)樣本容量較大時, 經(jīng)驗分布函數(shù)Fn(x)是總體分布函數(shù)F(

19、x)的良好近似.第38頁,共63頁,2022年,5月20日,6點6分,星期四 統(tǒng)計量的分布稱為抽樣分布。數(shù)理統(tǒng)計中常用到來自正態(tài)總體的三個分布: 2分布、 t 分布和F分布。 第39頁,共63頁,2022年,5月20日,6點6分,星期四1. 定義: 設(shè)X1, X2, Xn相互獨立, 都服從正態(tài)分布N(0,1), 則稱隨機變量: 所服從的分布為自由度為 n 的2分布. 二、三大抽樣分布記為2 分布第40頁,共63頁,2022年,5月20日,6點6分,星期四2. 2 分布的密度函數(shù) f(y) 曲線第41頁,共63頁,2022年,5月20日,6點6分,星期四3. 分位點 設(shè)X 2(n),若對于:03

20、4.382的值; 2)若 P 2b=0.975, 求b的值.b. 分布可加性 若X 2(n1), Y 2(n2 ), X,Y相互獨立, 則 X + Y 2(n1+n2 ).第43頁,共63頁,2022年,5月20日,6點6分,星期四c. 期望與方差 若X 2(n),則E(X)= n,D(X)=2n.d若X 2(n),則當(dāng)n充分大時,近似正態(tài)分布N(0,1).第44頁,共63頁,2022年,5月20日,6點6分,星期四定義 若XN(0, 1), Y2(n), X與Y獨立,則 t(n) 稱為自由度為n的t 分布.t 分布第45頁,共63頁,2022年,5月20日,6點6分,星期四t(n) 的概率密

21、度為第46頁,共63頁,2022年,5月20日,6點6分,星期四2. 性質(zhì)第47頁,共63頁,2022年,5月20日,6點6分,星期四分位點 設(shè)tt(n), 若對:00, 滿足Pt t(n)=,則稱t(n)為 t(n)的上分位點.第48頁,共63頁,2022年,5月20日,6點6分,星期四 注:第49頁,共63頁,2022年,5月20日,6點6分,星期四第50頁,共63頁,2022年,5月20日,6點6分,星期四定義 若U 2(n1), V2(n2),U,V獨立,則 稱為第一自由度為n1 ,第二自由度為n2的F分布。F 分布注: 若FF(n1, n2), 則1/FF(n2, n1).第51頁,共63頁,2022年,5月20日,6點6分,星期四F分布的概率密度函數(shù)若FF(n1,n2), F的概率密度為第52頁,共63頁,2022年,5月20日,6點6分,星期四2. F分布的分位點對于:00,滿足PFF(n1, n2)=, 則稱F(n1, n2)為F(n1, n2) 的上分位點;注:第53頁,共63頁,2022年,5月20日,6點6分,星期四第54頁,共63頁,2022年,5月20日,6點6分,星期四三、正態(tài)總體的樣本均值和樣本方差的分布 設(shè)總體X的均值為m, 方差為s 2,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論