數(shù)理統(tǒng)計學(xué)的基本概念_第1頁
數(shù)理統(tǒng)計學(xué)的基本概念_第2頁
數(shù)理統(tǒng)計學(xué)的基本概念_第3頁
數(shù)理統(tǒng)計學(xué)的基本概念_第4頁
數(shù)理統(tǒng)計學(xué)的基本概念_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章 數(shù)理統(tǒng)計的基本概念一、教學(xué)要求 1理解總體、個體、簡單隨機樣本和統(tǒng)計量的概念,掌握樣本均值、樣本方差及樣本矩的計算。 2了解 分布、t分布和F分布的定義和性質(zhì),了解分位數(shù)的概念并會查表計算。 3掌握正態(tài)總體的某些常用統(tǒng)計量的分布。 4了解最大次序統(tǒng)計量和最小次序統(tǒng)計量的分布。 本章重點:統(tǒng)計量的概念及其分布。二、主要內(nèi)容 1總體與個體 我們把研究對象的全體稱為總體(或母體),把組成總體的每個成員稱為個體。在實際問題中,通常研究對象的某個或某幾個數(shù)值指標(biāo),因而常把總體的數(shù)值指標(biāo)稱為總體。設(shè)x為總體的某個數(shù)值指標(biāo),常稱這個總體為總體X。X的分布函數(shù)稱為總體分布函數(shù)。當(dāng)X為離散型隨機變量時,

2、稱X的概率函數(shù)為總體概率函數(shù)。當(dāng)X為連續(xù)型隨機變量時,稱X的密度函數(shù)為總體密度函數(shù)。當(dāng) X服從正態(tài)分布時,稱總體X為正態(tài)總體。正態(tài)總體有以下三種類型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2簡單隨機樣本 數(shù)理統(tǒng)計方法實質(zhì)上是由局部來推斷整體的方法,即通過一些個體的特征來推斷總體的特征。要作統(tǒng)計推斷,首先要依照一定的規(guī)則抽取n個個體,然后對這些個體進行測試或觀察得到一組數(shù)據(jù),這一過程稱為抽樣。由于抽樣前無法知道得到的數(shù)據(jù)值,因而站在抽樣前的立場上,設(shè)有可能得到的值為,n維隨機向量()稱為樣本。n稱為樣本容量。 ()稱為樣本觀測值。 如果樣本()滿足 (1)相互獨立;(2

3、) 服從相同的分布,即總體分布; 則稱()為簡單隨機樣本。簡稱樣本。 設(shè)總體X的概率函數(shù)(密度函數(shù))為,則樣本( )的聯(lián)合概率函數(shù)(聯(lián)合密度函數(shù)為) 3. 統(tǒng)計量 完全由樣本確定的量,是樣本的函數(shù)。即:設(shè)是來自總體X的一個樣本,是一個n元函數(shù),如果中不含任何總體的未知參數(shù),則稱為一個統(tǒng)計量,經(jīng)過抽樣后得到一組樣本觀測值,則稱為統(tǒng)計量觀測值或統(tǒng)計量值。4. 常用統(tǒng)計量(1)樣本均值: (2)樣本方差: (3)樣本標(biāo)準(zhǔn)差:它們的觀察值分別為:這些觀察值仍分別稱為樣本均值、樣本方差和樣本標(biāo)準(zhǔn)差。(4)樣本(階)原點矩 (5)樣本(階)中心矩 其中樣本二階中心矩又稱為未修正樣本方差。(6)順序統(tǒng)計量

4、將樣本中的各個分量由小到大的重排成則稱為樣本順序統(tǒng)計量,為樣本的極差。 (7)樣本相關(guān)系數(shù):其中:分別為數(shù)據(jù)的樣本均值,分別為樣本a標(biāo)準(zhǔn)差。5、直方圖與箱線圖 (1)直方圖 先將所有采集的數(shù)據(jù)進行整理,得到順序統(tǒng)計量,找出其中的最小值,最大值,即所有的數(shù)據(jù)都落在區(qū)間上,現(xiàn)取區(qū)間(其中可取等),該區(qū)間能覆蓋區(qū)間,將區(qū)間等分為個小區(qū)間(先取一個區(qū)間,其下限比最小的數(shù)據(jù)稍小,其上限比最大的數(shù)據(jù)稍大,然后將這一區(qū)間等分為個小區(qū)間,通常較大時取,當(dāng)時則取。若取得過大,則會出現(xiàn)某些區(qū)間內(nèi)頻數(shù)為零,分點通常取比數(shù)據(jù)精度高一位,以避免數(shù)據(jù)落在分點上),小區(qū)間的長度記為,稱為組距,小區(qū)間的端點稱為組限,數(shù)出數(shù)據(jù)

5、落在每個小區(qū)間內(nèi)的數(shù)據(jù)的頻數(shù),算出頻率,然后自左至右依次在各個小區(qū)間上做以為高的小矩形,這樣的圖形就稱其為頻率直方圖。顯然這種小矩形的面積就等于數(shù)據(jù)落在該小區(qū)間的頻率,直方圖的外廓曲線接近于總體的概率密度曲線。 (2)分位數(shù)定義 設(shè)有容量為的樣本觀察值,樣本分為數(shù)記為,它具有以下性質(zhì):(1)至少有個觀察值小于或等于;(2)至少有個觀察值大于或等于樣本分位數(shù)可按以下法則求得: 將按從小到大的順序排成 ,若不是整數(shù),則只有一個數(shù)據(jù)滿足定義中的兩點要求,這一數(shù)據(jù)位于大于的最小整數(shù)處,即為位于處的數(shù)。 ,若是整數(shù),則都符合性質(zhì)要求,故取的平均值。 綜上可得: 特別的: 0.25分位數(shù)又稱為第一四分位數(shù)

6、,又記為;0.75分位數(shù)又稱為第三四分位數(shù),又記為 (3)箱線圖: 數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,它是在基于以下5個數(shù)據(jù)的圖形概括:最小值最大值,做法如下:(1)畫一水平數(shù)軸,在軸上標(biāo)記最小值最大值,在數(shù)軸上方畫一個上下側(cè)平行于數(shù)軸的矩形箱子,箱子的左右兩側(cè)分別位于的上方,在點的上方畫一條垂直線段,線段位于箱子的內(nèi)部;(2)自箱子的左側(cè)中點引一條水平線直至最小值上方;在同一水平高度自箱子右側(cè)引一條水平線直至最大值上方。箱線圖完成。在數(shù)據(jù)集中某一個觀察值不尋常的大于或小于該數(shù)集中的其他數(shù)據(jù),稱為疑似異常值。 第一四分位數(shù)與第三四分位數(shù)之間的距離:稱為四分位數(shù)間距,若數(shù)據(jù)小于,就認(rèn)為他是

7、疑似異常值。將上述箱線圖的做法修改如下:(1)同(1)(2)計算,若一個數(shù)據(jù)小于,則認(rèn)為它是一個異常值,并以表示;(3) 自箱子的左側(cè)中點引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最小值上方,再自箱子的右側(cè)中點引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最大值上方; 這樣做出的箱線圖稱為修正箱線圖。6關(guān)于分布(1)(Gamma)函數(shù) 它具有以下運算性質(zhì): 特別地: 令 令 所以 (2)設(shè)隨機變量服從分布,即:,其密度函數(shù)為: 定理:設(shè)隨機變量,都服從分布且相互獨立,即:,其密度函數(shù)分別為: 則服從參數(shù)為分布,即:7、經(jīng)驗分布函數(shù) 設(shè)是總體的一個樣本,用表示中不大于的隨機變量的個數(shù),定義經(jīng)驗分布函

8、數(shù)為: 例題1:設(shè)總體有一個樣本值1,2,3,則經(jīng)驗分布函數(shù)為: 例題2:設(shè)總體有一個樣本值1,1,2,則經(jīng)驗分布函數(shù)為: 格里汶科定理:(1933年)對于任意一實數(shù),當(dāng)時,以概率1收斂于分布函數(shù) 8. 三個重要分布(1)分布設(shè)為獨立標(biāo)準(zhǔn)正態(tài)變量,稱隨機變量的分布為自由度為n的分布,記為。其密度函數(shù)為: 性質(zhì):(1)若則因為 所以: 又 其中:(2)分布的可加性 設(shè),并且相互獨立,則有: (3)分布的分位點 對于給定的正數(shù),稱滿足條件 的點為分布的上分位點。(2)t分布設(shè)隨機變量X與Y獨立,則稱的分布為自由度n的t分布,記為。分布又稱為學(xué)生氏分布,其密度函數(shù)為: 分布的分位點:對于給定的正數(shù),

9、稱滿足條件 的點為分布的上分位點。其中:(3)F分布設(shè)隨機變量U與V相互獨立,則稱的分布為自由度的F分布,記為。密度函數(shù)為: 由定義知:若 則 分布的分位點對于給定的正數(shù),稱稱滿足:的點為F分布的上分位點,且有9.抽樣分布(1)有限總體的抽樣分布 定理1、設(shè)總體中個體總數(shù)(也稱總體大小)為,樣本容量為且總體有有限均值,方差,則 當(dāng)抽樣是有放回時 當(dāng)抽樣是無放回時 其中即為的標(biāo)準(zhǔn)差。(2)單正態(tài)總體的抽樣分布設(shè)總體(不管服從什么分布,只要均值和方差存在)的均值為,方差為,是來自的一個樣本,分別是樣本均值和樣本方差,則有: 而 定理2、設(shè)是來自正態(tài)總體的一個樣本,是樣本均值,則有: 定理3、設(shè)是來自正態(tài)總體的一個樣本,分別是樣本均值和樣本方差,則有: 相互獨立。 定理4、設(shè)是來自正態(tài)總體的一個樣本,分別是樣本均值和樣本方差,則有: 注:(3)雙正態(tài)總體的抽樣分布 定理5、設(shè)分別是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論