




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章 樣本及抽樣分布【授課對(duì)象】理工類本科二年級(jí)【授課時(shí)數(shù)】8學(xué)時(shí)【授課方法】課堂講授與提問(wèn)相結(jié)合【基本要求】1、理解總體、個(gè)體和樣本的概念;2、了解經(jīng)驗(yàn)分布函數(shù)和直方圖的作法,知道格林汶科定理;3、理解樣本均值、樣本方差和樣本矩的概念并會(huì)計(jì)算;4、理解統(tǒng)計(jì)量的概念,掌握幾種常用統(tǒng)計(jì)量的分布及其結(jié)論;5、理解分位數(shù)的概念,會(huì)計(jì)算幾種重要分布的分位數(shù)?!颈菊轮攸c(diǎn)】樣本均值、樣本方差和樣本矩的計(jì)算;抽樣分布分布,分布,分布;分位數(shù)的理解和計(jì)算?!颈菊码y點(diǎn)】對(duì)樣本、統(tǒng)計(jì)量及分位數(shù)概念的理解;樣本矩的計(jì)算?!臼谡n內(nèi)容及學(xué)時(shí)分配】§6.0 前 言 5分鐘前面五章我們研究了概率論的基本內(nèi)容,從
2、中得知:概率論是研究隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性的一門數(shù)學(xué)分支。它是從一個(gè)數(shù)學(xué)模型出發(fā)(比如隨機(jī)變量的分布)去研究它的性質(zhì)和統(tǒng)計(jì)規(guī)律性;而我們下面將要研究的數(shù)理統(tǒng)計(jì),也是研究大量隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性,并且是應(yīng)用十分廣泛的一門數(shù)學(xué)分支。所不同的是數(shù)理統(tǒng)計(jì)是以概率論為理論基礎(chǔ),利用觀測(cè)隨機(jī)現(xiàn)象所得到的數(shù)據(jù)來(lái)選擇、構(gòu)造數(shù)學(xué)模型(即研究隨機(jī)現(xiàn)象)。對(duì)研究對(duì)象的客觀規(guī)律性做出種種合理性的估計(jì)、判斷和預(yù)測(cè),為決策者和決策行動(dòng)提供理論依據(jù)和建議。數(shù)理統(tǒng)計(jì)的內(nèi)容很豐富,這里我們主要介紹數(shù)理統(tǒng)計(jì)的基本概念,重點(diǎn)研究參數(shù)估計(jì)和假設(shè)檢驗(yàn)。§6.1 隨機(jī)樣本 25分鐘一、總體與樣本1.總體、個(gè)體在數(shù)理統(tǒng)計(jì)學(xué)中,我們
3、把所研究的全部元素組成的集合稱為總體;而把組成總體的每個(gè)元素稱為個(gè)體。例如:在研究某批燈泡的平均壽命時(shí),該批燈泡的全體就組成了總體,而其中每個(gè)燈泡就是個(gè)體;在研究華北工學(xué)院男大學(xué)生的身高和體重的分布情況時(shí),該校的全體男大學(xué)生組成了總體,而每個(gè)男大學(xué)生就是個(gè)體。但在數(shù)理統(tǒng)計(jì)里,由于我們關(guān)心的不是每個(gè)個(gè)體的種種具體特性,而僅僅是它的某一項(xiàng)或幾項(xiàng)數(shù)量指標(biāo)(可以是向量)和該數(shù)量指標(biāo)X在總體的分布情況。在上述例子中X是表示燈泡的壽命或男大學(xué)生的身高和體重。在實(shí)驗(yàn)中,抽取了若干個(gè)個(gè)體就觀察到了的這樣或那樣的數(shù)值,因而這個(gè)數(shù)量指標(biāo)是一個(gè)隨機(jī)變量(或向量),而的分布就完全描寫了總體中我們所關(guān)心的那個(gè)數(shù)量指標(biāo)的
4、分布狀況。由于我們關(guān)心的正是這個(gè)數(shù)量指標(biāo),因此我們以后就把總體和數(shù)量指標(biāo)可能取值的全體組成的集合等同起來(lái)。我們對(duì)總體的研究,就是對(duì)相應(yīng)的隨機(jī)變量的分布的研究,所謂總體的分布也就是數(shù)量指標(biāo)的分布,因此,的分布函數(shù)和數(shù)字特征分別稱為總體的分布函數(shù)和數(shù)字特征。定義1:把研究對(duì)象的某項(xiàng)或幾項(xiàng)數(shù)量指標(biāo)的值的全體稱為總體;總體中的每個(gè)元素稱為個(gè)體。根據(jù)總體中所包括個(gè)體的總數(shù),將總體分為:有限總體和無(wú)限總體。Ex1:考察一塊試驗(yàn)田中小麥穗的重量: =所有小麥穗重量的全體(無(wú)限總體);個(gè)體每個(gè)麥穗重對(duì)應(yīng)的分布: Ex2:考察一位射手的射擊情況:=此射手反復(fù)地?zé)o限次射下去所有射擊結(jié)果全體;每次射擊結(jié)果都是一個(gè)個(gè)
5、體(對(duì)應(yīng)于靶上的一點(diǎn))個(gè)體數(shù)量化1在總體中的比例為命中率0在總體中的比例為非命中率總體由無(wú)數(shù)個(gè)0,1構(gòu)成,其分布為兩點(diǎn)分布 2.樣本與樣本空間。為了對(duì)總體的分布進(jìn)行各種研究,就必需對(duì)總體進(jìn)行抽樣觀察。抽樣從總體中按照一定的規(guī)則抽出一部分個(gè)體的行動(dòng)。一般地,我們都是從總體中抽取一部分個(gè)體進(jìn)行觀察,然后根據(jù)觀察所得數(shù)據(jù)來(lái)推斷總體的性質(zhì)。按照一定規(guī)則從總體中抽取的一組個(gè)體稱為總體的一個(gè)樣本,顯然,樣本為一隨機(jī)向量。 為了能更多更好的得到總體的信息,需要進(jìn)行多次重復(fù)、獨(dú)立的抽樣觀察(一般進(jìn)行次),若對(duì)抽樣要求代表性:每個(gè)個(gè)體被抽到的機(jī)會(huì)一樣,保證了的分布相同,與總體一樣。獨(dú)立性:相互獨(dú)立。那么,符合“
6、代表性”和“獨(dú)立性”要求的樣本稱為簡(jiǎn)單隨機(jī)樣本。易知,對(duì)有限總體而言,有放回的隨機(jī)樣本為簡(jiǎn)單隨機(jī)樣本,無(wú)放回的抽樣不能保證的獨(dú)立性;但對(duì)無(wú)限總體而言,無(wú)放回隨機(jī)抽樣也得到簡(jiǎn)單隨機(jī)樣本,我們本書則主要研究簡(jiǎn)單隨機(jī)樣本。對(duì)每一次觀察都得到一組數(shù)據(jù)(),由于抽樣是隨機(jī)的,所以觀察值()也是隨機(jī)的。為此,給出如下定義:定義2:設(shè)總體的分布函數(shù)為,若是具有同一分布函數(shù)的相互獨(dú)立的隨機(jī)變量,則稱()為從總體(從分布函數(shù))中得到的容量為的簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱樣本。把它們的觀察值()稱為樣本值。定義3:把樣本()的所有可能取值構(gòu)成的集合稱為樣本空間,顯然一個(gè)樣本值()是樣本空間的一個(gè)點(diǎn)。二、樣本的分布:設(shè)總體的
7、分布函數(shù)為,密度函數(shù)為,()是的一個(gè)樣本,則其分布函數(shù)(聯(lián)合分布)、概率密度函數(shù)(聯(lián)合概率密度函數(shù))分別為:=; =()Ex3:設(shè)總體為其一個(gè)簡(jiǎn)單隨機(jī)樣本,則 樣本空間 樣本聯(lián)合分布§6.2 分布函數(shù)與概率密度函數(shù)的近似解 20分鐘在概率論中,我們介紹了幾種常用的分布函數(shù)與密度函數(shù)以及它們的性質(zhì),當(dāng)時(shí)我們總假定它們都是先給定的,而在實(shí)際中,所遇到的用于描述隨機(jī)現(xiàn)象的隨機(jī)變量,事先并不知道其分布函數(shù)與概率密度函數(shù),甚至連其分布類型也一無(wú)所知,那么,怎么樣才能確定它的分布函數(shù)與密度函數(shù)呢?一般地,利用樣本及樣本值,建立一定的概率模型,用由此獲得的概率統(tǒng)計(jì)信息來(lái)對(duì)總體的和進(jìn)行估計(jì)和推斷,這
8、就是:一、 經(jīng)驗(yàn)分布函數(shù)。設(shè)()是來(lái)自總體的樣本,()是樣本的一個(gè)觀察值,設(shè)這個(gè)數(shù)值由小到大的順序排列后為:,對(duì)R 定義: 稱是總體的經(jīng)驗(yàn)分布函數(shù)。顯然,是單調(diào)非降右連續(xù)的跳躍函數(shù)(階梯函數(shù)),在點(diǎn)處有間斷,在每個(gè)間斷點(diǎn)的躍度為,(=1,2,3,)且,=0,=1,它滿足分布函數(shù)的三個(gè)性質(zhì),所以必是一個(gè)分布函數(shù)。一般地,隨著的增大,越來(lái)越接近的分布函數(shù),關(guān)于這一點(diǎn),格列汶科(Gilvenko)在1953年給了理論上的論證,即:定理1.(Gilvenko-Th):若總體的分布函數(shù)為,經(jīng)驗(yàn)分布函數(shù)為,則對(duì)R,有:定理表明,以概率1致收斂于,即:可以用來(lái)近似,這也是利用樣本來(lái)估計(jì)和判斷總體的基本理論和
9、依據(jù)。Eg4:某廠從一批熒光燈中抽出10個(gè),測(cè)其壽命的數(shù)據(jù)(單位千時(shí))如下:95.5, 18.1, 13.1, 26.5, 31.7, 33.8, 8.7, 15.0, 48.8, 48.3解:將數(shù)據(jù)由小到大排列得:8.7,13.1,15.0,18.1,26.5,31.7,33.8,48.8,49.3,95.5則經(jīng)驗(yàn)分布函數(shù)為: 二、利用直方圖求密度函數(shù)的近似解:設(shè)()為來(lái)自總體的一個(gè)樣本,其樣本觀察值為(),將該組數(shù)值分成組,可作分點(diǎn):(各組距可以不相等),則各組為:(,(,,(,,若樣本觀察值中每個(gè)數(shù)值落在各組中的頻數(shù)分別為,則頻率分別為:,;以各組為底邊,以相應(yīng)組的頻率除以組距為高,建立
10、個(gè)小矩形,即得總體的直方圖。由上分析可知:直方圖中每一矩形的面積等于相應(yīng)組的頻率設(shè)總體的密度函數(shù)為,則:總體(真實(shí)值)落在第組(,的概率為:。由Bernoulli大數(shù)定理可知:當(dāng)n很大時(shí),樣本觀察值(單個(gè))落在該區(qū)間的頻率趨近于此概率;即:( ,上矩形的面積接近于在此區(qū)間上曲邊梯形的面積,當(dāng)n無(wú)限增大時(shí),分組組距越來(lái)越小,直方圖就越接近總體的密度函數(shù)的圖象。(這與定積分的意義具有同樣的道理)。§6.3 樣本的數(shù)字特征 40分鐘0、引言由第三章節(jié)知:隨機(jī)變量的數(shù)字特征,能夠反映隨機(jī)事件的某些重要的概率特征,從第一節(jié)可知,樣本也是一組隨機(jī)變量(隨機(jī)向量),為了詳細(xì)刻劃樣本觀察值中所包含總
11、體的信息及樣本值的分布情況,下面我們研究樣本的數(shù)字特征。一、樣本均值與樣本方差(隨機(jī)變量)設(shè)()是來(lái)自總體的一個(gè)樣本,()是相應(yīng)的樣本觀察值。定義1,稱為樣本均值。稱為樣本方差。稱為樣本標(biāo)準(zhǔn)差。樣本均值與樣本方差分別刻劃了樣本的位置特征及樣本的離散性特征。二、樣本矩設(shè)總體的分布函數(shù)為,密度為,若,則稱為總體的階原點(diǎn)矩;若,則稱為總體的階中心矩。把總體的各階中心矩和原點(diǎn)矩統(tǒng)稱為總體矩(數(shù)值)表示總體的數(shù)字特征。特別地:=;是總體的期望和方差。仿此,下面給出樣本矩的定義:定義2:設(shè)()是來(lái)自總體的一個(gè)樣本,()為其樣本值,則樣本的階原點(diǎn)矩(隨機(jī)變量)定義為:,=1,2,3;樣本值的階中心矩(隨機(jī)變
12、量)定義為:,=1,2,3;由上述定義可知:樣本均值、樣本方差、樣本均方差、樣本矩都是關(guān)于樣本的函數(shù),而樣本本身又是隨機(jī)變量(隨機(jī)向量),因此,上述關(guān)于樣本的數(shù)字特征也是隨機(jī)變量,其值分別為:;=; ;=1,2,3;這些值也分別稱為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本階原點(diǎn)矩、樣本階中心矩。特別地, ,但與卻不同,由與的計(jì)算式可知:,當(dāng)時(shí),=,所以常把記為。并常利用來(lái)計(jì)算S(標(biāo)準(zhǔn)差)。Eg5:從某班級(jí)的期末考試成績(jī)中,隨機(jī)抽取10名同學(xué)的成績(jī)分別為:100,85,70,65,90,95,63,50,77,86(1)試寫出總體,樣本,樣本值,樣本容量;(2)求樣本均值,樣本方差及二階原點(diǎn)矩解:(
13、1)總體:該班級(jí)的期末考試成績(jī);樣本:(,)樣本值:(100,85,70,65,90,95,63,50,77,86)樣本容量: =10(2)(100+85+86)=78.1【注】本例作為學(xué)生使用計(jì)算器計(jì)算樣本矩的練習(xí)。 10分鐘三、課后作業(yè):1、仔細(xì)閱讀P122-132; 2、作業(yè):P146 3,43、預(yù)習(xí):抽樣分布§6.4 抽 樣 分 布 100分鐘0、引言有了總體和樣本的概念,能否直接利用樣本來(lái)對(duì)總體進(jìn)行推斷呢?一般來(lái)說(shuō)是不能的,需要根據(jù)研究對(duì)象的不同,構(gòu)造出樣本的各種不同函數(shù),然后利用這些函數(shù)對(duì)總體的性質(zhì)進(jìn)行統(tǒng)計(jì)推斷,為此,我們首先介紹數(shù)理統(tǒng)計(jì)的另一重要概念統(tǒng)計(jì)量。一、統(tǒng)計(jì)量(
14、隨機(jī)變量)定義1:設(shè)()是來(lái)自總體的一個(gè)樣本,()是的函數(shù),若為實(shí)值函數(shù),且中不含任何未知參數(shù),則稱()是一個(gè)統(tǒng)計(jì)量。事實(shí)上§6.3中的樣本均值、樣本方差、樣本矩都是統(tǒng)計(jì)量;再如是來(lái)自總體的一個(gè)樣本,則都是統(tǒng)計(jì)量,而就不是統(tǒng)計(jì)量。由§6.1知:()是隨機(jī)變量,而統(tǒng)計(jì)量是樣本()的函數(shù),所以統(tǒng)計(jì)量也是隨機(jī)變量(隨機(jī)變量的函數(shù)為隨機(jī)變量)。我們把統(tǒng)計(jì)量的分布稱為抽樣分布。而統(tǒng)計(jì)量是我們對(duì)總體的分布函數(shù)或數(shù)字特征進(jìn)行統(tǒng)計(jì)推斷的最重要的基本概念,所以尋求統(tǒng)計(jì)量的分布成為數(shù)理統(tǒng)計(jì)的基本問(wèn)題之一。然而要求出一個(gè)統(tǒng)計(jì)量的精確分布是十分困難的。而在實(shí)際問(wèn)題中,大多總體都服從正態(tài)分布:而對(duì)于
15、正態(tài)分布,我們可以求出一些重要統(tǒng)計(jì)量的精確分布,這就是:二、幾種常用的抽樣分布:(正態(tài)分布中的幾種統(tǒng)計(jì)量的分布)把分布,分布,分布,統(tǒng)稱為“統(tǒng)計(jì)三大分布”。1、正態(tài)分布由正態(tài)分布的性質(zhì),可得如下結(jié)論:定理:設(shè)相互獨(dú)立,,是關(guān)于的任一確定的線性函數(shù)(), 則也服從正態(tài)分布,即:。從而有:若()是來(lái)自總體的一個(gè)樣本,為樣本均值,則,由上述結(jié)論可知:的期望與的期望相同,而的方差卻比的方差小的多,即的取值將更向集中。2、 分布1)、定義:設(shè)()是來(lái)自總體 的一個(gè)樣本,則稱統(tǒng)計(jì)量:所服從的分布是自由度為(指上式中所含獨(dú)立變量的個(gè)數(shù))的分布。記作:的概率密度函數(shù)為: ,其中:,顯然, ,且,即符合密度函數(shù)
16、性質(zhì)。事實(shí)上,2) 分布的性質(zhì)I、分布的可加性:設(shè),且與相互獨(dú)立,則:+II、若,則,事實(shí)上,因?yàn)?,則:,所以:;3) 結(jié)論:設(shè)()為來(lái)自總體的一個(gè)樣本,,為已知常數(shù),則:I ) 統(tǒng)計(jì)量 (當(dāng)=0時(shí)也成立)II) 樣本均值與樣本方差相互獨(dú)立,且統(tǒng)計(jì)量。對(duì)I,事實(shí)上若,則,所以;對(duì)II,參閱有關(guān)數(shù)理統(tǒng)計(jì)的課本。3、分布1) 定義:設(shè),且與相互獨(dú)立,則稱隨機(jī)變量:所服從的分布是自由度為的分布,記為,分布又稱為學(xué)生氏(Student)分布。分布的概率密度函數(shù)為: 。2) 分布的特點(diǎn)(性質(zhì))。I、關(guān)于=0對(duì)稱;II、在=0達(dá)最大值;III、的軸為水平漸近線;IV、;即時(shí),分布,一般地,當(dāng)>30時(shí)
17、,分布與非常接近。V、當(dāng)較小時(shí),分布與有較大的差異,且對(duì)有,其中。即分布的尾部比的尾部具有更大的概率。VI、若,則 時(shí),3) 結(jié)論:I)設(shè)()是來(lái)自總體的一個(gè)樣本,則統(tǒng)計(jì)量:,事實(shí)上,由,又,且與相互獨(dú)立,則與相互獨(dú)立,由分布的定義,所以 II)設(shè)()是來(lái)自總體的一個(gè)樣本,(是來(lái)自總體的一個(gè)樣本,且它們是相互獨(dú)立的,則統(tǒng)計(jì)量,其中, 事實(shí)上,且與相互獨(dú)立,所以:,即:;又,且它們相互獨(dú)立,由分布的可加性,則 。由分布的定義:4、分布1) 定義:設(shè),且與相互獨(dú)立,則稱隨機(jī)變量所服從的分布是自由度為的分布,記作:,其中:為第一自由度,為第二自由度。由定義,顯然有:;若,則。的概率密度函數(shù)為: 說(shuō)明:先求出 的聯(lián)合密度函數(shù),再令,求出()的聯(lián)合,注意到獨(dú)立,所以的邊緣密度函數(shù),也即的密度函數(shù)。2) 分布的性質(zhì)(特點(diǎn))I. 密度曲線不對(duì)稱(偏態(tài))II. 若,且與獨(dú)立,則:III. 若,則IV. 當(dāng)時(shí),當(dāng)時(shí),注:(利用)3) 結(jié)論:設(shè)()是來(lái)自總體的一個(gè)樣本,(是來(lái)自總體的一個(gè)樣本,且它們是相互獨(dú)立,則,事實(shí)上,由分布的定義,則:,其中,;四、分位數(shù):定義:設(shè)為某變量的分布函數(shù), 若有使,則稱為此概率分布的分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧環(huán)衛(wèi)系統(tǒng)建設(shè)方案
- 竹筒酒行業(yè)研究報(bào)告
- 《會(huì)計(jì)信息系統(tǒng)應(yīng)用》課件 學(xué)習(xí)情境7 應(yīng)收款系統(tǒng)應(yīng)用
- 數(shù)字信號(hào)處理與通信技術(shù)指南
- 美食廣場(chǎng)裝修合同解除
- 健康飲食烹飪方法入門指南
- 現(xiàn)代農(nóng)業(yè)經(jīng)營(yíng)管理策略方案
- 綠化專項(xiàng)施工方案
- 電商產(chǎn)業(yè)園可行性研究報(bào)告
- 施工方案和安全專項(xiàng)施工方案的區(qū)別
- 希沃白板與初中數(shù)學(xué)教學(xué)深度融合的現(xiàn)狀及案例開(kāi)發(fā)
- 中國(guó)古代文學(xué)的人文關(guān)懷與社會(huì)責(zé)任
- 飾面人造板產(chǎn)品質(zhì)量
- 北京市校外教育機(jī)構(gòu)工作規(guī)程實(shí)施細(xì)則
- 2024屆高考物理備考策略
- 說(shuō)課的技巧和方法專題講座
- 教師專業(yè)發(fā)展與教育教學(xué)質(zhì)量提升的關(guān)系研究
- 《周南桃夭》教學(xué)設(shè)計(jì)
- 招投標(biāo)專員績(jī)效考核表
- 醫(yī)院心臟導(dǎo)管檢查手術(shù)知情同意書
- 物資投標(biāo)(碎石、砂)
評(píng)論
0/150
提交評(píng)論