




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計學第四章統(tǒng)計推斷的理論基礎學習目標理解概率及概率分布的意義;掌握抽樣的基本概念以及抽樣分布的概念;本章內容概率與概率分布隨機變量的數值特征與隨機向量大數定理與正態(tài)分布定理抽樣分布隨機事件與概率隨機現(xiàn)象的特點:
在基本條件不變的情況下,一系列的試驗或觀測會得到不同的結果,并且在試驗或觀測前不能預見何種結果將出現(xiàn)。了解隨機現(xiàn)象的方法:隨機試驗隨機實驗(簡稱實驗)的特點:
每次試驗的可能結果不是惟一的;每次試驗之前不能確定何種結果會出現(xiàn);試驗在相同條件下重復進行隨機現(xiàn)象與確定現(xiàn)象隨機試驗與事件隨機事件:隨機試驗中可能出現(xiàn)也可能不出現(xiàn)的結果,簡稱為事件簡單事件:也稱為基本事件,它是不可以再分解的事件,其也被稱為樣本點。復雜事件:也稱為復合事件,由簡單事件組合而成的事件?;臼录脖环Q為樣本點。設試驗有n個基本事件,分別記為i,(i=1,2,…,n),集合={1,2,…,n}稱為樣本空間,中的元素就是樣本點。隨機事件與概率隨機試驗與事件例:投擲骰子的實驗基本事件:
出現(xiàn)點數為1,2,3,4,5或6的事件復雜事件:出現(xiàn)點數是奇數的事件出現(xiàn)點數是偶數的事件我們常用A、B、……來表示隨機事件。設A表示“出現(xiàn)點數是奇數”,則A={1,3,5}隨機事件與概率隨機試驗與事件必然事件——必然出現(xiàn)的實驗結果
用樣本空間表示。不可能事件——不可能出現(xiàn)的試驗結果
用空集表示。A發(fā)生或B發(fā)生事件記為A∪B;A與B同時發(fā)生事件記為A∩B,或AB;前面的例子中,A∪B=是必然事件;AB=是不可能事件。如果AB=
,稱為A與B不相容隨機事件與概率隨機試驗與事件定義:概率也稱為機率,是指隨機事件發(fā)生的可能性,或者說對隨機事件發(fā)生可能性的度量隨機事件與概率概率概率的計算:進行重復試驗,通過試驗的頻率來計算概率。例如,不斷重復地投擲一枚均勻的硬幣,出現(xiàn)正面的頻率會穩(wěn)定在0.5附近。歷史上,有人為此做過實驗,結果如下:表:頻率試驗結果實驗者投擲硬幣的次數(n)正面朝上的次數(m)頻率(=m/n)DemorganBuffonPearson(1)Pearson(2)204840401200024000106120486019120120.5180.50690.50160.5005隨機事件與概率概率概率的統(tǒng)計定義:進行n次重復試驗,隨機事件A發(fā)生的次數是m次,發(fā)生的頻率是m/n,當試驗的次數n很大時,如果頻率在某一數值p附近擺動時,而且隨著試驗次數n的不斷增加,頻率的擺動幅度越來越小,則稱p為事件A發(fā)生的概率,記為:
P(A)=p,0p1隨機事件與概率概率如果隨機試驗的樣本空間是有限集合,所有樣本點出現(xiàn)的可能性相同,則事件A的概率可根據以下公式計算:樣本點總數A包含的樣本點個數nmP(A)=—=——————————隨機事件與概率概率概率的性質:性質1(非負性):P(A)0
性質2(規(guī)范性):P()=1
推論:不可能事件的概率為0,即:P()=0
性質3(可加性):若事件A與事件B互不相容,則有:P(A∪B)=P(A)+P(B)
推論:設A表示A的對立事件,則有:
P(A)=1-P(A)獨立事件:對事件A和B,若p(AB)=p(A)p(B)隨機變量隨機變量:產生于對隨機試驗的結果進行量化處理的需要。隨機變量X是定義在樣本空間上的一個函數,這個函數的取值隨試驗的結果不同而變化。對任意實數x,X<x是隨機事件,且概率存在。隨機變量離散型隨機變量的概率分布設離散型隨機變量X的所有可能取值為x1,x2,…,xn,…,,相應的概率為p(x1),p(x2),…,p(xn),…,稱為離散型隨機變量X的概率分布。簡記為:p(X=xi)=p(xi)(i=1,2,…)概率分布的性質:0p(xi)1(i=1,2,…),p(xi)=1Xx1x2…xn…Pp(x1)p(x2)…p(xn)…隨機變量連續(xù)型隨機變量的概率分布分布函數:對任意實數x,X<x是一隨機事件,可求其概率。記F(x)=p(X<x),該函數就是隨機變量的分布函數。密度函數:對分布函數求導,可得密度函數,記為f(x)通過對密度函數積分,可得到隨機變量X在點x附近或一個區(qū)間上取值的概率。注:連續(xù)型隨機變量取一個固定值的概率為0隨機變量連續(xù)型隨機變量的概率分布密度函數的性質:表示隨機變量X的取值在區(qū)間(a,b)內的概率。隨機變量連續(xù)型隨機變量的概率分布正態(tài)分布:如果連續(xù)型隨機變量X的密度函數為則稱隨機變量X服從均值為,方差為2的正態(tài)分布,記為X~N(,2)=0.6=1=2隨機變量連續(xù)型隨機變量的概率分布標準正態(tài)分布:如果正態(tài)分布的密度函數中,=0,=1,則這樣的正態(tài)分布稱為標準正態(tài)分布。標準正態(tài)隨機變量在區(qū)間[-Z,Z]取值的概率F(Z)可通過查標準正態(tài)分布概率表獲得。隨機變量連續(xù)型隨機變量的概率分布例:設隨機變量Z服從標準正態(tài)分布,求以下概率的大?。?1)p(-1<Z<1)(2)p(0<Z<1.25)(3)p(1<Z<1.25)(4)p(Z>1)隨機變量連續(xù)型隨機變量的概率分布正態(tài)分布的標準化變換:設隨機變量X服從正態(tài)分布N(,2),則隨機變量Z=(X-)/服從標準正態(tài)分布,即Z~N(0,1)例:假定學生某門學科的考試成績服從均值為60分,標準差為12分的正態(tài)分布,問某一學生的成績在60分到75分之間的概率應為多少?解:隨機變量連續(xù)型隨機變量的概率分布【例】
:設隨機變量X服從正態(tài)分布N(,2),試分別求X落在以為中心,以,1.96,2,3為半徑的區(qū)間內的。解:本章內容概率與概率分布隨機變量的數值特征與隨機向量大數定理與正態(tài)分布定理抽樣分布隨機變量的數值特征分布函數完整地描述了隨機變量的統(tǒng)計規(guī)律性,但實際上,一方面常常不知道隨機變量的分布函數,另一方面也可能不需要知道它,而只需要知道隨機變量的某些特征。討論隨機變量的數值特征對于了解隨機變量有重要意義。隨機變量的數值特征隨機變量的(數學)期望離散型隨機變量X的數學期望(也即均值):
=E(X)=xip(xi)
連續(xù)型隨機變量的數學期望:如果Y=g(X),則:隨機變量數學期望的性質:E(X1+X2)=E(X1)+E(X2)該性質可推廣到多個隨機變量的情形貝努里試驗:只有兩種結果的試驗n重貝努里試驗:設A出現(xiàn)的概率為p,重復進行n次貝努里試驗二項分布以Bk表示n重貝努里試驗中事件A正好出現(xiàn)k次這一事件,則有:K012…nP(Bk)…隨機變量的數值特征隨機變量的(數學)期望離散型隨機變量的方差:
2=var(X)=E(X-)2=(xi-)2p(xi)連續(xù)型隨機變量的方差:方差的性質:Var(X)=2Var(X)Var(X)=E(X2)-[E(X)]2隨機變量的數值特征隨機變量的方差與標準差方差開平方即為標準差。二元(維)隨機向量離散型隨機向量的概率分布連續(xù)型隨機向量的概率分布隨機向量的數值特征二元正態(tài)分布其他常用的連續(xù)型隨機變量的分布隨機變量與獨立性其它常用的連續(xù)型隨機變量的分布:2-分布:設X1,X2,…,Xn是相互獨立且服從標準正態(tài)分布的隨機變量,則稱隨機變量2=Xi2所服從的分布為自由度為n的2-分布。t-分布:設X服從標準正態(tài)分布,Y服從自由度為n的分布,且它們相互獨立,則隨機變量T=X/Y/n所服從的分布為自由度為n的t-分布。當n30時,t-分布與標準正態(tài)分布的差別非常小,可用標準正態(tài)分布代替。F-分布:設X和Y是相互獨立的分布,自由度分別是m和n,則稱隨機變量F=(X/Y).(n/m)所服從的分布為F-分布,稱為它的自由度。本章內容概率與概率分布隨機變量的數值特征與隨機向量大數定理與正態(tài)分布定理抽樣分布大數定理與正態(tài)分布定理大數定理大數定理又稱作大數法則。人們在觀察個別事物時,是連同一切個別的特性來觀察的。個別現(xiàn)象受偶然因素影響,有各自不同的表現(xiàn)。但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,消除由個別偶然因素引起的極端性影響,從而使總體平均數穩(wěn)定下來,反映出事物變化的一般規(guī)律,這就是大數定理的意義。大數定理與正態(tài)分布定理大數定理大數定理:獨立同分布的隨機變量X1,X2,…,Xn,…設它們的平均數為,方差為2。則對任意正數,有:大數定理與正態(tài)分布定理中心極限定理與正態(tài)逼近
正態(tài)分布的再生定理相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布,這就是正態(tài)分布的再生性。因此,從服從正態(tài)分布的總體中抽出一個容量是n的樣本,則樣本平均數也服從正態(tài)分布。如果總體的平均是,標準差是(X),則樣本平均數所服從的正態(tài)分布的中心仍是,標準差是抽樣平均誤差。
大數定理與正態(tài)分布定理中心極限定理:隨機變量X1,X2,…,Xn,…相互獨立,且服從同一分布,該分布存在有限的期望和方差:E(Xi)=,Var(Xi)=2,(i=1,2,…)。令則中心極限定理與正態(tài)逼近大數定理與正態(tài)分布定理也就是說,當n趨于無窮大時,Yn近似服從標準正態(tài)分布。中心極限定理與正態(tài)逼近大數定理與正態(tài)分布定理推論1:均值的分布趨向于正態(tài)分布推論2:n項和的分布趨向于正態(tài)分布中心極限定理與正態(tài)逼近例:4-19(P107)本章內容概率與概率分布隨機變量的數值特征與隨機向量大數定理與中心極限定理抽樣分布統(tǒng)計推斷與簡單隨機抽樣推斷統(tǒng)計:就是通過抽取樣本,并利用樣本信息來推斷總體的各種性質或特征。推斷統(tǒng)計包括:參數估計和假設檢驗。推斷統(tǒng)計的基本內容抽樣推斷涉及的基本概念:
1.總體與樣本
2.樣本容量與樣本個數
3.總體參數與樣本統(tǒng)計量
4.重復抽樣與不重復抽樣統(tǒng)計推斷與簡單隨機抽樣推斷統(tǒng)計的基本內容樣本容量:指樣本包含的總體單位數,一般用n表示。一般地說,樣本容量大,抽樣誤差會小,但調查費用會增加,反之,樣本容量過小,又將導致抽樣誤差增大,甚至失去抽樣推斷的價值。因此,在抽樣設計中應根據調查目的和要求認真考慮合適的樣本容量。樣本個數:樣本個數又稱樣本可能數目,它是指從一個總體中可能抽取多少個樣本。樣本個數的多少與抽樣方法有關。關于樣本個數的計算我們將在“重復抽樣與不重復抽樣”中介紹。注意:
這個概念只是對有限總體有意義,對無限總體沒有意義!
若總體X的樣本X1,…,Xn滿足:Xi與X同分布,Xi與Xj相互獨立,則稱它為簡單隨機樣本。如果總體X的密度函數為f(x),則簡單隨機樣本的聯(lián)合分布的密度函數為:統(tǒng)計推斷與簡單隨機抽樣簡單隨機樣本例:設Xi(i=1,…,n)是來自指數分布總體X的簡單隨機樣本。求它的聯(lián)合分布密度。解:指數分布密度為:故該樣本的聯(lián)合分布密度為:總體參數:總體分布的參數往往是總體的數量特征,也是統(tǒng)計推斷的對象。常見的總體參數有:總體平均數指標,總體成數(比率)指標,總體分布的方差、標準差,等等。它們都是反映總體分布特征的重要指標??傮w成數(也稱總體比率)指標是指總體中具有某性質的單位數目在總體中所占的比重,它反映了總體的結構特征。統(tǒng)計量與統(tǒng)計分布樣本統(tǒng)計量樣本統(tǒng)計量:通俗地說,樣本統(tǒng)計量是樣本的函數。由于樣本是從總體中隨機地抽出來的,因此,樣本統(tǒng)計量也是隨機變量。我們利用樣本統(tǒng)計量來估計或推斷總體的參數和數量特征。設已有樣本(X1,X2,…,Xn),常見的統(tǒng)計量有:樣本統(tǒng)計量統(tǒng)計量與統(tǒng)計分布樣本統(tǒng)計量樣本平均數樣本成數樣本方差樣本標準差樣本極差統(tǒng)計量與統(tǒng)計分布例:從一批瓷器中隨機抽取10件,測得其重量如下,求這組樣本值的均值和方差。123456789102.102.431.852.402.152.281.962.352.001.99解:重復抽樣(或重置抽樣)是指從總體中抽出一個樣本單位,記錄其標志值后,又將其放回總體中繼續(xù)參加下一輪抽樣。
重復抽樣的特點:
n個單位構成的樣本是n次試驗的結果;每次試驗是獨立的,即其試驗的結果與前次、后次的結果無關;每次試驗是在相同條件下進行的,每個單位在每次試驗中選中的機會(概率)是相同的。在重復試驗中,樣本可能的個數是Nn,N為總體單位數,n為樣本容量。抽樣分布統(tǒng)計量與統(tǒng)計分布關于重復抽樣與不重復抽樣不重復抽樣亦稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。
不重復抽樣的特點:
n個單位的樣本由n次試驗結果構成,但由于每次抽出不重復,所以實質上相當于從總體中同時抽取n個樣本單位。如果考慮順序,其樣本可能個數為如果不考慮順序,其樣本可能個數為抽樣分布統(tǒng)計量與統(tǒng)計分布關于重復抽樣與不重復抽樣
一個統(tǒng)計量的抽樣分布就是該統(tǒng)計量的概率分布,尋求抽樣分布是統(tǒng)計學的基本任務之一。只有知道了統(tǒng)計量的抽樣分布,才能對該統(tǒng)計量做全面的了解和掌握。抽樣分布統(tǒng)計量與統(tǒng)計分布抽樣分布重復抽樣分布
設從總體中抽出的樣本為X1,X2,…,Xn,由于是重復抽樣,每個Xi,(i=1,2,…,n)都是從總體中隨機抽出的,都是與總體同分布的隨機變量,并且是相互獨立的。我們設總體的平均數為,方差為2,則樣本平均數的期望值與方差分別是:樣本平均數的抽樣分布抽樣分布重復抽樣分布
由概率論知,如果總體是正態(tài)分布的,則樣本平均數的抽樣分布是如下正態(tài)分布這是一個非常重要的結論,有廣泛的應用。樣本樣本平均數樣本樣本平均數34,3434,3834,4234,4634,5038,3438,3838,4238,4638,5042,3442,3842,4242,4642,5034363840423638404244384042444646,3446,3846,4246,4646,5050,3450,3850,4250,4650,5040424446484244464850例:某班組5個工人的日工資為34、38、42、46、50元?,F(xiàn)用重置抽樣的方法從5人中隨機抽2個構成樣本。共有52=25個樣本。樣本平均數頻數343638404244464850123454321合計25結論(重復抽樣):
此指標(抽樣平均數的標準差)反映所有的樣本平均數與總體平均數的平均誤差,稱為抽樣平均誤差,用表示。抽樣分布重復抽樣分布
總體成數p是指具有某種特征的單位在總體中的比重。在前面我們已經知道,成數是一個特殊平均數,設總體單位總數目是N,總體中有該特征的單位數是N1。設X是0、1變量,即:總體單位有該特征,則X取1,否則取0,則有:樣本成數的抽樣分布抽樣分布重復抽樣分布樣本成數的抽樣分布
現(xiàn)從總體中抽出n個單位,如果其中有相應特征的單位數是n1,則樣本成數是:
P也是一個隨機變量,利用樣本平均數的分布性質結論,即有:
E(P)=p抽樣分布不重復抽樣分布樣本平均數的抽樣分布
某班組5個工人的日工資為34、38、42、46、50元。
現(xiàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國傳媒大學《國際市場營銷A》2023-2024學年第二學期期末試卷
- 《商品DEF操作指南》課件
- 武夷山職業(yè)學院《影視非線性編輯》2023-2024學年第二學期期末試卷
- 江西信息應用職業(yè)技術學院《GPS測量原理及應用實驗》2023-2024學年第二學期期末試卷
- 魚塘堤壩規(guī)劃方案范本
- 荊門職業(yè)學院《中國古代文學作品選(二)》2023-2024學年第一學期期末試卷
- 城市鉆孔樁施工方案
- 2025合同樣本個人借款合同范本管理資料
- 電梯門板保養(yǎng)方案范本
- 2025至2031年中國全自動門行業(yè)投資前景及策略咨詢研究報告
- 簡約喜慶元宵節(jié)介紹模板 教學課件
- TCCIAT 0043-2022 建筑工程滲漏治理技術規(guī)程
- 西藏林芝嘉園小區(qū)項目可研(可研發(fā))
- GB∕T 14527-2021 復合阻尼隔振器和復合阻尼器
- 航運系統(tǒng)組成和航運企業(yè)組織結構及特點
- 喪假證明模板
- 隧道二襯、仰拱施工方案
- 按期取得畢業(yè)證和學位證承諾書
- Q∕GDW 12106.4-2021 物聯(lián)管理平臺技術和功能規(guī)范 第4部分:邊緣物聯(lián)代理與物聯(lián)管理平臺交互協(xié)議規(guī)范
- 第五章 學校教育的主要活動形式:課堂教學
- 大會—冠脈微循環(huán)障礙
評論
0/150
提交評論