




已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第六章 數(shù)理統(tǒng)計的基本概念,緒言,數(shù)理統(tǒng)計包括兩大內(nèi)容:,一、試驗的設計和研究-研究更合理、更有效、更精確地獲取觀察資料的方法。,二、統(tǒng)計推斷-研究如何利用一定的資料對所關心的問題作出盡可能精確、可靠的結論。,例 為了解南京市民2002年收入情況,現(xiàn)抽樣調(diào)查10000人的收入。,問題:,1. 怎樣從10000人的收入情況去估計全體南京市民的平均收入?怎樣估計所有南京市民的收入與平均收入的偏離程度?,2. 若市政府提出了全體南京市民平均收入應達到的標準,從抽查得到的10000人收入數(shù)據(jù),如何判斷全體南京市民的平均收入與收入標準有無差異?差異是否顯著?,3. 抽查得到的10000人的收入有多有少,若這10000人來自不同的行業(yè),那么,收入的差異是由于行業(yè)不同引起的,還是僅由隨機因素造成的?,4. 假設收入與年齡有關,從抽查得到的10000人收入和年齡的對應數(shù)據(jù),如何表述全體南京市民的收入與年齡之間的關系?,問題1實質(zhì):從10000人的收入出發(fā),估計全體南京市民收入分布的某些數(shù)字特征(此處是期望和方差)。,-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為參數(shù)估計。,問題2實質(zhì):根據(jù)抽查得到的數(shù)據(jù),去檢驗總體收入的某個數(shù)字特征(此處是期望)與給定值的差異。,-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為假設檢驗。,問題3實質(zhì):分析數(shù)據(jù)誤差的原因(此處是行業(yè))。當有多個因素起作用時,還要分析哪些因素起主要作用。,-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為方差分析。,問題4實質(zhì):根據(jù)觀察數(shù)據(jù)研究變量間(此處是收入與年齡間)的關系。,-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為回歸分析。,第一節(jié) 隨機樣本,一、總體,在數(shù)理統(tǒng)計中,將所研究的對象的某項指標值的全體稱為總體(或母體),而將構成總體的每個單位稱為一個個體。,當總體中包含的個體總數(shù)是有限的,就稱總體為有限總體,否則稱總體為無限總體。,設待研究的指標為X,由于X的取值是對隨機抽取的個體觀察得到的,因而可將X視為隨機變量,并設其分布函數(shù)為F(x)。,定義6.1 一個隨機變量X(或其分布函數(shù)F(x)叫做一個總體,X的每個可能值叫做一個個體。,二、樣本,從總體X中,隨機地抽取n個個體進行觀察,可得到n個觀察值,將其依抽取的順序記為,若將總體在進行第 i 次抽樣時對應的隨機變量記為 ,則 就是 的觀察值。,我們提出以下要求: 與X同分布; 2. 相互獨立。,抽樣方式為重復抽樣,實際應用中,一般當有限總體中包含個體數(shù)目 N10n 時,即使采用不重復抽樣,也認為要求滿足。,定義6.2 若 相互獨立,且均與總體X有相同分布,則稱隨機向量( )為總體X的一個容量為n 的簡單隨機樣本(簡稱樣本),稱 n 為樣本容量。 設 的觀察值為 ,稱( )為X的一個樣本觀察值(樣本點),稱=( )為樣本空間。,說明:1. 是樣本觀察值全體所成集合,是 n 維空間上的點集,它不是總體X的樣本空間。,在一次抽樣之前,我們只知道樣本( )(n 維 隨機變量),而在抽樣之后,則得到一個具體的 n 維實向量 ( ),它是中的一個點,故稱其為樣本點。,注意:對任何總體X,其容量為 n 的樣本是唯一的,而每次抽樣得到的樣本觀察值一般說來是不同的。,設X的分布函數(shù)為 F(x),由定義6.2,X的容量為n 的樣本 的第i 個分量 的分布函數(shù)為,因 相互獨立,故 分布函數(shù)為,若X是離散型隨機變量,其分布律為 P(X= ),i=1,2,. 則 的分布律為,若X 是連續(xù)型隨機變量,其密度函數(shù)為 f(x),則 的密度函數(shù)為,三、樣本分布函數(shù),問題:用樣本觀察值推斷總體,其結論可靠嗎?,解決問題的途徑:根據(jù)抽樣得到的樣本觀察值構造一個函數(shù)-樣本分布函數(shù),再證明當n很大時,樣本分布函數(shù)近似于總體的分布函數(shù)。,說明:1. 在定義6.3中,k/n 是不大于x的樣本觀察值出現(xiàn)的頻率。,2. 對總體進行兩次抽樣,會得到兩組不同的樣本觀察值,因而就會產(chǎn)生兩個不同的樣本分布函數(shù)。,3. 樣本分布函數(shù)是一個階梯函數(shù):設,則當 ,有,當 , 有,即: 在 處有 的躍度。,5. 當n 越大, 的圖形與總體分布函數(shù) F(x) 的圖形越近似。,6. 由貝努利大數(shù)定律或 W. 格列汶科定理(1953) 可從理論上證明:當n 很大時,有,4. 容易證明: 確是某隨機變量 的分布函數(shù),且有,第二節(jié) 抽樣分布,一、統(tǒng)計量,定義6.4 (教材p159) 設 是總體X 的一個樣本, 是不含任何未知參數(shù)的連續(xù)函數(shù),則稱 是一個統(tǒng)計量。,若 是一個統(tǒng)計量, 是一組樣本觀察值,則稱 是 的一個觀察值。,二、樣本數(shù)字特征,定義6.5 (教材p160) 設 是總體X 的一個樣本,稱以下統(tǒng)計量為樣本數(shù)字特征:,當k 為正整數(shù),稱,設 為來自總體X的樣本, 為來自總體Y的樣本,稱,說明:1. 樣本原點矩反映樣本的平均特征,樣本中心矩反映樣本的離散特征,樣本協(xié)方差反映兩個樣本的相關程度。,2. 樣本數(shù)字特征是隨機變量,但對一組樣本觀察值,得到的樣本數(shù)字特征觀察值是一個具體的數(shù),我們通常把這個數(shù)也稱為樣本均值、樣本方差、樣本相關系數(shù)等。,3. 使用最多的樣本數(shù)字特征是樣本均值、樣本標準差和樣本相關系數(shù)。,三、順序統(tǒng)計量,說明:1.對兩次抽樣,盡管觀察值由小到大的排列順序可能改變,但對順序統(tǒng)計量來說,改變的僅是其取值,其形式不變。,2. 順序統(tǒng)計量是樣本的函數(shù),因而是隨機變量。,問題:順序統(tǒng)計量的表達式是什么?,定義6.6 設 ( ) 是樣本 ( ) 的 一組觀察值,將 按由小到大的順序排列成 。設 ,記 k=1,2,n.稱( ) 為( )的順序統(tǒng)計量。,結論1. 是統(tǒng)計量。,引入樣本矩的意義:,稱 為總體X 的k階原點矩 對樣本 ,因 與 X 同分布,有,結論2. 只要總體的k階矩存在,則樣本k階矩的任何連續(xù)函數(shù)依概率收斂于總體k階矩的同一函數(shù)。,說明:結論2 正是我們進行參數(shù)估計的理論基礎。,四、 的分布,1. 設 , 是X的一個樣本,則,五、 分布,定義6.8 (教材p162-163)設總體XN(0,1), 是總體的一個樣本,則稱 服從自由度為n的 分布,記為 。,注:1.,2. 的密度函數(shù)表達式和曲線見教材p163(不用掌握)。,性質(zhì)1. 設XN(0,1),則,性質(zhì)2. 設 , 是X的一個樣本,則,性質(zhì)3. 設 ,則,定理6.1.,推論.,定理6.2. 設 ,則對任何x,有,說明:定理6.2保證了當 n 很大時, 可近似地用正態(tài)分布代替,即 ,其中 XN(0,1)。,L,分布的用途: 分布在正態(tài)總體方差的估計和檢驗問題和非參數(shù)檢驗中起重要作用。,六、t-分布,注:1. t-分布的密度函數(shù)表達式見教材p165 (不用掌握);,2. t-分布的密度函數(shù)曲線見教材p165,曲線關于x=0對稱,和標準正態(tài)分布的密度函數(shù)曲線圖形類似,但當 n 較小時,t-分布與標準正態(tài)分布的差異較大。t-分布在尾部比標準正態(tài)分布在尾部有較大的概率。,定理6.3 設 ,且X與Y相互獨立,則,定理6.4 設 Tt(n),則當 n1,E(T)=0;當 n2,D(T)=n/(n-2)。,定理6.5 設 Tt(n),t(n;x) 為T的密度函數(shù),則,說明:一般當n30,取 t(n) N(0,1)。,t-分布的用途:t-分布主要用于小樣本情形正態(tài)總體的均值估計和檢驗,以及正態(tài)線性模型可估函數(shù)的推斷。,七、F-分布,性質(zhì)6 設 FF(m,n),則當 n2,E(F)=n/(n-2); 當n4, D(F)= 。,性質(zhì)5 設 Tt(n),則,F-分布的用途: F-分布在對兩個正態(tài)總體的未知參數(shù)進行假設檢驗中及在方差分析理論中起重要作用。,性質(zhì)4 對F-分布,若 FF(m,n),則1/FF(n,m)。,八、抽樣分布的幾個重要結論,定理6.6 (教材p168定理二、三) 設總體 為來自總體的樣本, 為樣本均值, 為樣本方差, 則有 1. 2. 相互獨立; 3.,推論 設 , 為其樣本方差, 則,注:證明見教材p172-174附錄(可不掌握)。,定理6.7 (教材p169定理四) 設 , 和 分別為來自總體X和Y的樣本,且兩樣本相互獨立,設 分別為兩樣本的樣本均值, 分別為兩樣本的樣本方差, 則有,1.,2.,特別,當 ,有,3.,特別,當 ,有,說明:1. 證明見教材p170(可不掌握);,2. 這幾個結論在參數(shù)估計、假設檢驗等統(tǒng)計問題的推斷中具有重要意義,也是考研內(nèi)容之一,要注意對結論的理解,并會簡單應用。,例1 設 是來自泊松分布()的一個樣本, 分別為樣本均值、樣本方差,求,說明:本題求 的方法值得重視,因為在參數(shù)估計的無偏性討論中要用到這種方法。,思考題2(2003年數(shù)學一考研試題選擇題) 設隨機變量Xt(n),n1, ,則( ) Y (n). B. Y (n-1). C. YF(n,1). D. YF(1,n).,九、概率分布的分位數(shù),定義6.11 設X為隨機變量,對任何0 )= 的數(shù) 為X的上側分位數(shù);稱滿足 P(X )= 的數(shù) 為X的雙側分位數(shù)。,1. N(0,1)的上側分位數(shù),設 XN(0,1),對任何0 )= , =?,由 ( )=1- ,查標準正態(tài)分布表(p439表2)即可求出 。,公式:對任何0 1,,2. N(0,1)的雙側分位數(shù),設 XN(0,1),對任何0 )= , =?,,即 P(X )= ,,其中 由( )=1- /2 求出。,3. -分布的上側分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年軟考網(wǎng)絡管理員考試復習指導試題及答案
- 2025年網(wǎng)絡管理員考試心得試題及答案
- 第二次月考提升卷(Unit 4、Unit 5)(含答案)-2024-2025學年人教精通版英語六年級下冊
- 學習云原生技術考試考題及答案解析
- 2025合同范本 租房協(xié)議書
- 2025法學概論考試的常見問題及試題及答案
- 學期重點項目與計劃推進
- 保安人員心理素質(zhì)提升的實踐方案計劃
- 2025帶薪休假合同「下載」
- 信息處理技術員商務溝通題及答案
- 貴陽2024年貴州貴陽貴安事業(yè)單位招聘599人筆試歷年典型考題及考點附答案解析
- 成都市2022級(2025屆)高中畢業(yè)班摸底測試(零診)化學試卷(含答案)
- 老年期發(fā)育(人體發(fā)育學)
- 修理廠員工安全合同協(xié)議書
- 術后吻合口瘺
- 陜西延安通和電業(yè)有限責任公司招聘筆試真題2021
- HYT 075-2005 海洋信息分類與代碼(正式版)
- 建筑用砂石料采購 投標方案(技術方案)
- 融于教學的形成性評價讀書分享
- 廣東省廣州市八區(qū)聯(lián)考2024年高一數(shù)學第二學期期末考試模擬試題含解析
- 體質(zhì)外貌鑒定
評論
0/150
提交評論