數(shù)理統(tǒng)計的基本概念課件

上傳人：石*** IP屬地：廣東上傳時間：2022-02-02 格式：PPT 頁數(shù)：29 大小：336KB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩24頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)理統(tǒng)計的基本概念第六章數(shù)理統(tǒng)計的基本概念緒言數(shù)理統(tǒng)計包括兩大內(nèi)容：一、試驗的設(shè)計和研究-研究更合理、更有效、更精確地獲取觀察資料的方法。二、統(tǒng)計推斷-研究如何利用一定的資料對所關(guān)心的問題作出盡可能精確、可靠的結(jié)論。數(shù)理統(tǒng)計的基本概念例為了解南京市民2002年收入情況，現(xiàn)抽樣調(diào)查10000人的收入。問題：1. 怎樣從10000人的收入情況去估計全體南京市民的平均收入？怎樣估計所有南京市民的收入與平均收入的偏離程度？2. 若市政府提出了全體南京市民平均收入應(yīng)達到的標準，從抽查得到的10000人收入數(shù)據(jù)，如何判斷全體南京市民的平均收入與收入標準有無差異？差異是否顯著？3. 抽查得到的10000

2、人的收入有多有少，若這10000人來自不同的行業(yè)，那么，收入的差異是由于行業(yè)不同引起的，還是僅由隨機因素造成的？4. 假設(shè)收入與年齡有關(guān)，從抽查得到的10000人收入和年齡的對應(yīng)數(shù)據(jù)，如何表述全體南京市民的收入與年齡之間的關(guān)系？數(shù)理統(tǒng)計的基本概念問題1實質(zhì)：從10000人的收入出發(fā)，估計全體南京市民收入分布的某些數(shù)字特征(此處是期望和方差)。-在數(shù)理統(tǒng)計中，解決這類問題的方法稱為參數(shù)估計。問題2實質(zhì)：根據(jù)抽查得到的數(shù)據(jù)，去檢驗總體收入的某個數(shù)字特征(此處是期望)與給定值的差異。-在數(shù)理統(tǒng)計中，解決這類問題的方法稱為假設(shè)檢驗。問題3實質(zhì)：分析數(shù)據(jù)誤差的原因(此處是行業(yè))。當有多個因素起作用時，還

3、要分析哪些因素起主要作用。-在數(shù)理統(tǒng)計中，解決這類問題的方法稱為方差分析。問題4實質(zhì)：根據(jù)觀察數(shù)據(jù)研究變量間(此處是收入與年齡間)的關(guān)系。-在數(shù)理統(tǒng)計中，解決這類問題的方法稱為回歸分析。數(shù)理統(tǒng)計的基本概念第一節(jié) 隨機樣本一、總體在數(shù)理統(tǒng)計中，將所研究的對象的某項指標值的全體稱為總體(或母體)，而將構(gòu)成總體的每個單位稱為一個個體。當總體中包含的個體總數(shù)是有限的，就稱總體為有限總體，否則稱總體為無限總體。設(shè)待研究的指標為X，由于X的取值是對隨機抽取的個體觀察得到的，因而可將X視為隨機變量，并設(shè)其分布函數(shù)為F(x)。定義6.1 一個隨機變量X(或其分布函數(shù)F(x)叫做一個總體，X的每個可能值叫

4、做一個個體。二、樣本從總體X中，隨機地抽取n個個體進行觀察，可得到n個觀察值，將其依抽取的順序記為。，)(21nxxx數(shù)理統(tǒng)計的基本概念若將總體在進行第 i 次抽樣時對應(yīng)的隨機變量記為，則就是的觀察值。iXixiX我們提出以下要求：與X同分布；1. 2. 相互獨立。iXnXXX，21抽樣方式為重復(fù)抽樣實際應(yīng)用中，一般當有限總體中包含個體數(shù)目 N10n 時，即使采用不重復(fù)抽樣，也認為要求滿足。定義6.2 若相互獨立，且均與總體X有相同分布，則稱隨機向量( )為總體X的一個容量為n 的簡單隨機樣本(簡稱樣本)，稱 n 為樣本容量。設(shè) 的觀察值為，稱( )為X的一個樣本觀察值(樣

5、本點)，稱=( )為樣本空間。niXi，21nXXX，21iXixnxxx，21nxxx，21說明：1. 是樣本觀察值全體所成集合，是 n 維空間上的點集，它不是總體X的樣本空間。數(shù)理統(tǒng)計的基本概念在一次抽樣之前，我們只知道樣本( )(n 維隨機變量)，而在抽樣之后，則得到一個具體的 n 維實向量( )，它是中的一個點，故稱其為樣本點。nXXX，21nxxx，21注意：對任何總體X，其容量為 n 的樣本是唯一的，而每次抽樣得到的樣本觀察值一般說來是不同的。設(shè)X的分布函數(shù)為 F(x)，由定義6.2，X的容量為n 的樣本的第i 個分量的分布函數(shù)為 )(21nXXX，iX.21)(nixFi，

6、因相互獨立，故分布函數(shù)為)(21nXXX，nXXX，21).()(121niinxFxxxF，數(shù)理統(tǒng)計的基本概念若X是離散型隨機變量，其分布律為 P(X= )，i=1，2，.則的分布律為ix)(21nXXX，).()(12211iniinnxXPxXxXxXP，若X 是連續(xù)型隨機變量，其密度函數(shù)為 f(x)，則的密度函數(shù)為 )(21nXXX，).()(121niinxfxxxf，三、樣本分布函數(shù)問題：用樣本觀察值推斷總體，其結(jié)論可靠嗎？解決問題的途徑：根據(jù)抽樣得到的樣本觀察值構(gòu)造一個函數(shù)-樣本分布函數(shù)，再證明當n很大時，樣本分布函數(shù)近似于總體的分布函數(shù)。數(shù)理統(tǒng)計的基本概念定義6.

7、3 設(shè)總體X的一組樣本觀察值為，將這組值依大小順序重排成。構(gòu)造函數(shù))(21nxxx，nxxx21.11210)(11nkknxxnkxxxnkxxxF當，當，當，稱為樣本分布函數(shù)(或稱經(jīng)驗分布函數(shù))。)(xFn說明：1. 在定義6.3中，k/n 是不大于x的樣本觀察值出現(xiàn)的頻率。2. 對總體進行兩次抽樣，會得到兩組不同的樣本觀察值，因而就會產(chǎn)生兩個不同的樣本分布函數(shù)。3. 樣本分布函數(shù)是一個階梯函數(shù)：設(shè)，lklkkkkxxxxx111數(shù)理統(tǒng)計的基本概念則當，有kkxxx1，nkxFn1)(當，有l(wèi)kkxxx，nlkxFn1)(即：在處有的躍度。)(xFnkxxnl /5. 當

8、n 越大，的圖形與總體分布函數(shù) F(x) 的圖形越近似。)(xFn6. 由貝努利大數(shù)定律或 W. 格列汶科定理(1953) 可從理論上證明：當n 很大時，有).()(xFxFn4. 容易證明：確是某隨機變量的分布函數(shù)，且有)(xFnn.)(1)(1)(121niinniinxxnDxxnE，數(shù)理統(tǒng)計的基本概念第二節(jié) 抽樣分布一、統(tǒng)計量定義6.4 (教材p159) 設(shè) 是總體X 的一個樣本，是不含任何未知參數(shù)的連續(xù)函數(shù)，則稱是一個統(tǒng)計量。)(21nXXX，)(21nyyyg，)(21nXXXg，若是一個統(tǒng)計量，是一組樣本觀察值，則稱是的一個觀察值。)(21nXXXg，)(21

9、nXXXg，)(21nxxxg，)(21nxxx，二、樣本數(shù)字特征定義6.5 (教材p160)設(shè) 是總體X 的一個樣本，稱以下統(tǒng)計量為樣本數(shù)字特征：)(21nXXX，數(shù)理統(tǒng)計的基本概念為樣本均值； 11niiXnX為樣本方差； )(11122niiXXnS為樣本標準差； )(1112niiXXnS當k 為正整數(shù)，稱階原點矩，為樣本k 11nikikXnA階中心矩。為樣本k )(11nikikXXnB數(shù)理統(tǒng)計的基本概念設(shè) 為來自總體X的樣本，為來自總體Y的樣本，稱)(21nXXX，)(21nYYY，為樣本協(xié)方差， )(11niiiYYXXnk為樣本相關(guān)系數(shù)。 )()()(12121niinii

10、niiiYYXXYYXXr說明：1. 樣本原點矩反映樣本的平均特征，樣本中心矩反映樣本的離散特征，樣本協(xié)方差反映兩個樣本的相關(guān)程度。2. 樣本數(shù)字特征是隨機變量，但對一組樣本觀察值，得到的樣本數(shù)字特征觀察值是一個具體的數(shù)，我們通常把這個數(shù)也稱為樣本均值、樣本方差、樣本相關(guān)系數(shù)等。數(shù)理統(tǒng)計的基本概念3. 使用最多的樣本數(shù)字特征是樣本均值、樣本標準差和樣本相關(guān)系數(shù)。三、順序統(tǒng)計量說明：1.對兩次抽樣，盡管觀察值由小到大的排列順序可能改變，但對順序統(tǒng)計量來說，改變的僅是其取值，其形式不變。2. 順序統(tǒng)計量是樣本的函數(shù)，因而是隨機變量。問題：順序統(tǒng)計量的表達式是什么？定義6.6 設(shè) ( ) 是樣本 (

11、 ) 的一組觀察值，將按由小到大的順序排列成。設(shè) ，記 k=1，2，n.稱( ) 為( )的順序統(tǒng)計量。nxxx，21nXXX，21nxxx，21)()2()1(nxxxknkxx)()()(kkxX)()2()1(nXXX，nXXX，21kknnxX數(shù)理統(tǒng)計的基本概念 max min21)(21) 1 (nnnXXXXXXXX，. 132minmax121121)()(nkXXXXknkniiiiiik，結(jié)論1. 是統(tǒng)計量。nkXk，21)(定義6.7 設(shè) 為的順序統(tǒng)計量，稱)()()2()1(nXXX，)(21nXXX，為偶數(shù)。當，為奇數(shù)，當，nXXnXmnnn21) 12()2()

12、21(為樣本中位數(shù)。稱為樣本極差。)1()(XXRn數(shù)理統(tǒng)計的基本概念引入樣本矩的意義：稱為總體X 的k階原點矩對樣本，因與 X 同分布，有)(21nXXX，iX，mkXEkk21)(.2121)(mkniXEkki，；，由辛欽大數(shù)定律，對樣本k階原點矩，有.21mkAkk，kAP利用依概率收斂的性質(zhì)，對任何連續(xù)函數(shù)有，)(21mxxxg).()(2121mmgAAAg，P結(jié)論2. 只要總體的k階矩存在，則樣本k階矩的任何連續(xù)函數(shù)依概率收斂于總體k階矩的同一函數(shù)。說明：結(jié)論2 正是我們進行參數(shù)估計的理論基礎(chǔ)。數(shù)理統(tǒng)計的基本概念四、的分布X1. 設(shè) ，是X的一個樣本，則)(2，N

13、X)(21nXXX，)(2nNX，2. 若X的分布類型未知，僅知 E(X)=，D(X)= ，則2)(2nNX，.五、分布2定義6.8 （教材p162-163）設(shè)總體XN(0，1)，是總體的一個樣本，則稱服從自由度為n的分布，記為。niiX1222)(22n)(21nXXX，數(shù)理統(tǒng)計的基本概念注：1. ；， )212()(2nn2. 的密度函數(shù)表達式和曲線見教材p163(不用掌握)。)(2n性質(zhì)1. 設(shè)XN(0,1)，則).1 (22X性質(zhì)2. 設(shè) ，是X的一個樣本，則)(2，NX)(21nXXX，niinX1222).()(1性質(zhì)3. 設(shè) ，則)(22nX.2)( )(22nDnE

14、，定理6.1. ). )( )( 2122221222122221221n(nnn則相互獨立，和且，設(shè)推論.).( 21)(1122222kikiiiiiinkin則相互獨立，且諸，設(shè)數(shù)理統(tǒng)計的基本概念定理6.2. 設(shè) ，則對任何x，有)(22n.21)2(lim2 22xtndtexnnP說明：定理6.2保證了當 n 很大時，可近似地用正態(tài)分布代替，即，其中 XN(0，1)。2nXn22).10(2 2，即NXnnL 分布的用途：分布在正態(tài)總體方差的估計和檢驗問題和非參數(shù)檢驗中起重要作用。22六、t-分布定義6.9. (教材p165) 設(shè)XN(0，1)，，且X與Y相互獨立，則稱服從

15、自由度為 n 的 t-分布，nYXT/)(2nY記為 Tt(n)。數(shù)理統(tǒng)計的基本概念注：1. t-分布的密度函數(shù)表達式見教材p165 (不用掌握)；2. t-分布的密度函數(shù)曲線見教材p165，曲線關(guān)于x=0對稱，和標準正態(tài)分布的密度函數(shù)曲線圖形類似，但當 n 較小時，t-分布與標準正態(tài)分布的差異較大。t-分布在尾部比標準正態(tài)分布在尾部有較大的概率。定理6.3 設(shè) ，且X與Y相互獨立，則)(/ )(222nYNX，).(/ntnYX定理6.4 設(shè) Tt(n)，則當 n1，E(T)=0；當 n2，D(T)=n/(n-2)。定理6.5 設(shè) Tt(n)，t(n；x) 為T的密度函數(shù)，則. )(21)(

16、lim2 2xexntxn；數(shù)理統(tǒng)計的基本概念說明：一般當n30，取 t(n) N(0，1)。t-分布的用途：t-分布主要用于小樣本情形正態(tài)總體的均值估計和檢驗，以及正態(tài)線性模型可估函數(shù)的推斷。七、F-分布定義6.10 (教材166) 設(shè) ，且X與Y相互獨立，則稱)()(22nYmX，nYmXF/服從第一自由度為m，第二自由度為n 的 F-分布，記為FF(m，n)。注：F-分布的密度函數(shù)表達式及其曲線見教材p166-167(不用掌握)。數(shù)理統(tǒng)計的基本概念性質(zhì)6 設(shè) FF(m，n)，則當 n2，E(F)=n/(n-2)；當n4， D(F)= 。)4()2()422(22nnmnmn).1 (2n

17、FT，性質(zhì)5 設(shè) Tt(n)，則F-分布的用途： F-分布在對兩個正態(tài)總體的未知參數(shù)進行假設(shè)檢驗中及在方差分析理論中起重要作用。性質(zhì)4 對F-分布，若 FF(m，n)，則1/FF(n，m)。數(shù)理統(tǒng)計的基本概念八、抽樣分布的幾個重要結(jié)論定理6.6 (教材p168定理二、三) 設(shè)總體為來自總體的樣本，為樣本均值，為樣本方差，則有1.2. 相互獨立；3.)( )(212nXXXNX，X2S；) 1()(1) 1(212222nXXSnnii2SX與).1(ntnSXT推論設(shè) ，為其樣本方差，則 )(2，NX2S.)(22SE注：證明見教材p172-174附錄(可不掌握)。數(shù)理統(tǒng)計的基本概

18、念定理6.7 (教材p169定理四) 設(shè) ，和分別為來自總體X和Y的樣本，且兩樣本相互獨立，設(shè) 分別為兩樣本的樣本均值，分別為兩樣本的樣本方差，則有 )( )(222211，NYNX)(21mXXX，)(21nYYY，YX、2221SS 、；， ) 10()()(222121NnmYXU1.；)2()2/() 1() 1()()(22222121222121nmtnmSnSmnmYXT2.數(shù)理統(tǒng)計的基本概念特別，當，有 21；)2()2/() 1() 1( 11)()(222121nmtnmSnSmnmYXT).1, 1(22212122nmFSSF3.特別，當，有 21).1,

19、1(2221nmFSSF說明：1. 證明見教材p170(可不掌握)；2. 這幾個結(jié)論在參數(shù)估計、假設(shè)檢驗等統(tǒng)計問題的推斷中具有重要意義，也是考研內(nèi)容之一，要注意對結(jié)論的理解，并會簡單應(yīng)用。數(shù)理統(tǒng)計的基本概念例1 設(shè) 是來自泊松分布()的一個樣本，分別為樣本均值、樣本方差，求)(21nXXX，、X2S).()()(2SEXDXE、說明：本題求的方法值得重視，因為在參數(shù)估計的無偏性討論中要用到這種方法。)(2SE思考題1(2001年數(shù)學三考研試題填空題) 設(shè)總體X服從正態(tài)分布，而是來自總體X的簡單隨機樣本，則隨機變量)20(2，N1521XXX，)(22152112102221XXXXXY服從 _ 分布，參數(shù)為_ 。數(shù)理統(tǒng)計的基本概念思考題2(2003年數(shù)學一考研試題選擇題) 設(shè)隨機變量Xt(n)，n1，，則( )Y (n). B. Y (n-1).A. C. YF(n，1). D. YF(1，n).2/1 XY 22例2.(2001年數(shù)學一考研試題十二題) 設(shè)總體X服從正態(tài)分布，(0)，從該總體中抽取簡單隨機樣本，其

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)理統(tǒng)計的基本概念課件

文檔簡介

溫馨提示

最新文檔

評論

數(shù)理統(tǒng)計的基本概念課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔