《應(yīng)用統(tǒng)計(jì)學(xué)》第3章 用概率分布描述隨機(jī)變量_第1頁
《應(yīng)用統(tǒng)計(jì)學(xué)》第3章 用概率分布描述隨機(jī)變量_第2頁
《應(yīng)用統(tǒng)計(jì)學(xué)》第3章 用概率分布描述隨機(jī)變量_第3頁
《應(yīng)用統(tǒng)計(jì)學(xué)》第3章 用概率分布描述隨機(jī)變量_第4頁
《應(yīng)用統(tǒng)計(jì)學(xué)》第3章 用概率分布描述隨機(jī)變量_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2008年5月應(yīng)用統(tǒng)計(jì)應(yīng)

統(tǒng)

計(jì)

學(xué)

AppliedStatistics2008年5月數(shù)學(xué)定律不能百分之百確切地用在現(xiàn)實(shí)生活里;能百分之百確切地用數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活

AlberEinstein統(tǒng)計(jì)名言2008年5月想過下面的問題嗎?購(gòu)買一張彩票中獎(jiǎng)的可能性有多大?購(gòu)買一只股票明天上漲的可能性有多大?你投資一個(gè)餐館盈利的可能性有多大?一項(xiàng)工程按期完成的可能性有多大?明天降水的可能性有多大?第3章用概率分布描述隨機(jī)變量3.1度量事件發(fā)生的可能性3.2隨機(jī)變量概率分布3.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布3.4樣本統(tǒng)計(jì)量的抽樣分布3.1度量事件發(fā)生的可能性—概率第3

章用概率分布描述隨機(jī)變量2008年5月什么是概率?

(probability)概率是對(duì)事件發(fā)生的可能性大小的度量你購(gòu)買一只股票明天上漲的可能性有多大明天降水的概率是80%。這里的80%就是對(duì)降水這一事件發(fā)生的可能性大小的一種數(shù)值度量一個(gè)介于0和1之間的一個(gè)值事件A的概率記為P(A)2008年5月怎樣獲得概率?重復(fù)試驗(yàn)獲得概率當(dāng)試驗(yàn)的次數(shù)很多時(shí),概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來逼近在相同條件下,重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為

用類似的比例來逼近一家餐館將生存5年的概率,可以用已經(jīng)生存了5年的類似餐館所占的比例作為所求概率一個(gè)近似值主觀概率2008年5月理解概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右試驗(yàn)的次數(shù)正面/試驗(yàn)次數(shù)1.000.000.250.500.7502550751001253.2隨機(jī)變量的概率分布

3.2.1隨機(jī)變量及其概括性度量

3.2.2離散型概率分布

3.2.3連續(xù)型概率分布第3

章用概率分布描述隨機(jī)變量3.2.1隨機(jī)變量及其概括性度量3.2隨機(jī)變量的概率分布2008年5月隨機(jī)變量

(randomvariables)事先不知道會(huì)出現(xiàn)什么結(jié)果投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫字樓,每平方米的出租價(jià)格一個(gè)消費(fèi)者對(duì)某一特定品牌飲料的偏好一般用X,Y,Z來表示根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量2008年5月離散型隨機(jī)變量

(discreterandomvariables)隨機(jī)變量X

取有限個(gè)值或所有取值都可以逐個(gè)列舉出來x1,x2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營(yíng)業(yè)一天電腦公司一個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為12008年5月連續(xù)型隨機(jī)變量

(continuousrandomvariables)可以取一個(gè)或多個(gè)區(qū)間中任何值所有可能取值不可以逐個(gè)列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測(cè)量一個(gè)產(chǎn)品的長(zhǎng)度使用壽命(小時(shí))半年后工程完成的百分比測(cè)量誤差(cm)X00

X100X02008年5月離散型隨機(jī)變量的期望值

(expectedvalue)描述離散型隨機(jī)變量取值的集中程度離散型隨機(jī)變量X的所有可能取值xi與其取相對(duì)應(yīng)的概率pi乘積之和記為

或E(X)計(jì)算公式為2008年5月離散型隨機(jī)變量的方差

(variance)隨機(jī)變量X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望,記為2

或D(X)描述離散型隨機(jī)變量取值的分散程度計(jì)算公式為方差的平方根稱為標(biāo)準(zhǔn)差,記為

或D(X)2008年5月離散型數(shù)學(xué)期望和方差

(例題分析)【例】一家電腦配件供應(yīng)商聲稱,他所提供的配件100個(gè)中擁有次品的個(gè)數(shù)及概率如下表次品數(shù)X=xi0123概率P(X=xi)pi0.750.120.080.05每100個(gè)配件中的次品數(shù)及概率分布

求該供應(yīng)商次品數(shù)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差

2008年5月連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的期望值方差3.2.2離散型概率分布3.2隨機(jī)變量的概率分布2008年5月離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值及取這些值的概率通常用下面的表格來表示X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pn

P(X=xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)pi0;有二項(xiàng)分布、泊松分布以及超幾何分布等

2008年5月離散型隨機(jī)變量的概率分布

(例題分析)【例】投擲一顆骰子后出現(xiàn)的點(diǎn)數(shù)是一個(gè)離散型隨機(jī)變量。寫出擲一枚骰子出現(xiàn)點(diǎn)數(shù)的概率分布

X=xi123456P(X=xi)pi1/61/61/61/61/61/6概率分布2008年5月二項(xiàng)試驗(yàn)

(伯努利試驗(yàn))

二項(xiàng)分布與伯努利試驗(yàn)有關(guān)貝努里試驗(yàn)滿足下列條件一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗(yàn)“成功”的概率為p,失敗的概率為q=1-p,且概率p對(duì)每次試驗(yàn)都是相同的

試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次

在n次試驗(yàn)中,“成功”的次數(shù)對(duì)應(yīng)一個(gè)離散型隨機(jī)變量X

2008年5月二項(xiàng)分布

(Binomialdistribution)重復(fù)進(jìn)行

n

次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為X~B(n,p)設(shè)X為n次重復(fù)試驗(yàn)中出現(xiàn)成功的次數(shù),X取x

的概率為2008年5月二項(xiàng)分布

(期望值和方差)期望值

=E(X)=np方差

2

=D(X)=npq0.00.20.40.6012345XP(X)n=5p=0.50.20.40.6012345XP(X)n=5p=0.12008年5月二項(xiàng)分布

(例題分析)【例】已知一批產(chǎn)品的次品率為4%,從中任意有放回地抽取5個(gè)。求5個(gè)產(chǎn)品中

(1)沒有次品的概率是多少?

(2)恰好有1個(gè)次品的概率是多少?

(3)有3個(gè)以下次品的概率是多少?2008年5月二項(xiàng)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel工作表中,直接點(diǎn)擊【fx】(粘貼函數(shù))命令

第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),在“函數(shù)名”中點(diǎn)擊【BINOMDIST】選項(xiàng),然后確定第4步:在【Number_s】后填入試驗(yàn)成功次數(shù)(本例為1)

在【Trials】后填入總試驗(yàn)次數(shù)(本例為5)

在【Probability_s】后填入試驗(yàn)的成功概率(本例為

0.04)

在【Cumulative】后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或

TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計(jì)算概率2008年5月泊松分布

(Poissondistribution)1837年法國(guó)數(shù)學(xué)家泊松(D.Poisson,1781—1840)首次提出用于描述在一指定時(shí)間范圍內(nèi)或在一定的長(zhǎng)度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時(shí)間段內(nèi),某航空公司接到的訂票電話數(shù)一定時(shí)間內(nèi),到車站等候公共汽車的人數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一定時(shí)間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點(diǎn)個(gè)數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯(cuò)別字個(gè)數(shù)

2008年5月泊松分布

(概率分布函數(shù))—給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的平均數(shù)e=2.71828x—給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的次數(shù)2008年5月泊松分布

(期望值和方差)期望值

E(X)=方差

D(X)=

0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)l

=6l

=0.52008年5月泊松分布

(例題分析)【例】假定某航空公司預(yù)訂票處平均每小時(shí)接到42次訂票電話,那么10分鐘內(nèi)恰好接到6次電話的概率是多少?解:設(shè)X=10分鐘內(nèi)航空公司預(yù)訂票處接到的電話次數(shù)

2008年5月泊松分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊【f(x)】命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【POISSON】選項(xiàng),然后【確定】第4步:在【X】后填入事件出現(xiàn)的次數(shù)(本例為6)

在【Means】后填入泊松分布的均值(本例為7)

在【Cumulative】后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計(jì)算概率2008年5月超幾何分布

(hypergeometricdistribution)采用不重復(fù)抽樣,各次試驗(yàn)并不獨(dú)立,成功的概率也互不相等總體元素的數(shù)目N很小,或樣本容量n相對(duì)于N來說較大時(shí),樣本中“成功”的次數(shù)則服從超幾何概率分布概率分布函數(shù)為2008年5月超幾何分布

(例題分析)【例】假定有10支股票,其中有3支購(gòu)買后可以獲利,另外7支購(gòu)買后將會(huì)虧損。如果你打算從10支股票中選擇4支購(gòu)買,但你并不知道哪3支是獲利的,哪7支是虧損的。求

(1)有3支能獲利的股票都被你選中的概率有多大?

(2)3支可獲利的股票中有2支被你選中的概率有多大?解:設(shè)N=10,M=3,n=42008年5月超幾何分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel工作表中,直接點(diǎn)擊【f(x)】(插入函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【HYPGEOMDIST】選項(xiàng),然后【確定】第4步:在【Sample_s

】后填入樣本中成功的次數(shù)x(本例為3)

在【Number_sample】后填入樣本容量n(本例為4)

在【Population_s】后填入總體中成功的次數(shù)M(本例為3)

在【Number_pop】后填入總體中的個(gè)體總數(shù)N

(本例為10)

用Excel計(jì)算概率3.2.3連續(xù)型概率分布3.2隨機(jī)變量的概率分布2008年5月連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值它取任何一個(gè)特定的值的概率都等于0不能列出每一個(gè)值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述2008年5月常用連續(xù)型概率分布2008年5月正態(tài)分布

(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)xf(x)2008年5月概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)

=正態(tài)隨機(jī)變量X的均值=正態(tài)隨機(jī)變量X的方差

=3.1415926;e=2.71828x=隨機(jī)變量的取值(-<x<+)2008年5月正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=處均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個(gè)方向無限延伸時(shí),曲線的兩個(gè)尾端也無限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

2008年5月

和對(duì)正態(tài)曲線的影響xf(x)CAB=1/212=12008年5月正態(tài)分布的概率概率是曲線下的面積!abxf(x)2008年5月標(biāo)準(zhǔn)正態(tài)分布

(standardizenormaldistribution)

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)2008年5月標(biāo)準(zhǔn)正態(tài)分布Xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布2008年5月正態(tài)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊【f(x)】(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【NORMDIST】選項(xiàng),然后【確定】第4步:在【X】后填入正態(tài)分布函數(shù)計(jì)算的區(qū)間點(diǎn)(本例為40)

在【Mean】后填入正態(tài)分布的均值

(本例為50)

在【PStandard_dev】后填入標(biāo)準(zhǔn)差

(本例為10)

在【Cumulative】后填入1(或TRUE)表示計(jì)算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累積概率值2008年5月正態(tài)分布

(例題分析)【例】計(jì)算以下概率

(1)

X~N(50,102),求和

(2)

Z~N(0,1),求和

(3)正態(tài)分布概率為0.05時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)值z(mì)

用Excel的統(tǒng)計(jì)函數(shù)計(jì)算概率

2008年5月數(shù)據(jù)正態(tài)性的評(píng)估對(duì)數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似求出樣本數(shù)據(jù)的四分位差Qd和標(biāo)準(zhǔn)差s,然后計(jì)算比值Qd/s

。若數(shù)據(jù)近似服從正態(tài)分布,則有

Qd/s1.3繪制正態(tài)概率圖2008年5月正態(tài)概率圖的繪制

(normalprobabilityplots)正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟第1步:將樣本觀察值從小到大排列第2步:求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi

。標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)滿足第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為標(biāo)準(zhǔn)正態(tài)概率圖2008年5月正態(tài)概率圖的繪制

(例題分析)【例】一家電腦公司連續(xù)10天的銷售額(單位:萬元)分表為176,191,214,,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷該組數(shù)據(jù)是否服從正態(tài)分布2008年5月用SPSS繪制正態(tài)概率圖

用SPSS繪制正態(tài)概率圖第1步:選擇【Graphs】下拉菜單,并選擇【Q-Q】選項(xiàng)進(jìn)入主對(duì)話框第2步:在主對(duì)話框中將變量選入【Variables】

,點(diǎn)擊【OK】2008年5月正態(tài)概率圖的繪制

(例題分析)電腦公司銷售額的正態(tài)概率圖

2008年5月正態(tài)概率圖的繪制

(SPSS繪制的例2.3的正態(tài)概率圖)2008年5月正態(tài)概率圖的分析

(normalprobabilityplots)正態(tài)概率圖有時(shí)也稱為分位數(shù)—分位數(shù)圖,或稱Q-Q圖實(shí)際應(yīng)用中,只有樣本數(shù)據(jù)較多時(shí)正態(tài)概率圖的效果才比較好。當(dāng)然也可以用于小樣本,但此時(shí)可能會(huì)出現(xiàn)與正態(tài)性有較大偏差的情況在分析正態(tài)概率圖時(shí),最好不要用嚴(yán)格的標(biāo)準(zhǔn)去衡量數(shù)據(jù)點(diǎn)是否在一條直線上,只要近似在一條直線上即可對(duì)于樣本點(diǎn)中數(shù)值最大或最小的點(diǎn)也可以不用太關(guān)注,除非這些點(diǎn)偏離直線特別遠(yuǎn),因?yàn)檫@些點(diǎn)通常會(huì)與直線有偏離。如果某個(gè)點(diǎn)偏離直線特別遠(yuǎn),而其他點(diǎn)又基本上在直線上時(shí),這個(gè)點(diǎn)可能是離群點(diǎn),可不必考慮3.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布

3.3.12

分布

3.3.2t

分布

3.3.3F

分布第3

章用概率分布描述隨機(jī)變量3.3.1c2-分布3.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布分布2008年5月由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則y服從自由度為1的2分布,即對(duì)于n個(gè)正態(tài)隨機(jī)變量y1

,y2

,yn,則隨機(jī)變量稱為具有n個(gè)自由度的2分布,記為c2-分布

(2-distribution)2008年5月分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布c2-分布

(性質(zhì)和特點(diǎn))2008年5月不同自由度的c2-分布c2n=1n=4n=10n=202008年5月c2-分布

(用Excel計(jì)算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計(jì)函數(shù),計(jì)算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x,是隨機(jī)變量的取值利用【CHIINV】函數(shù)則可以計(jì)算給定右尾概率和自由度時(shí)相應(yīng)的反函數(shù)值

語法:CHIINV(probability,degrees_freedom)

用Excel計(jì)算c2

分布的概率3.3.2t-分布3.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布分布2008年5月t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對(duì)稱分布,通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z2008年5月t-分布

(用Excel生成t分布的臨界值表)利用Excel中的【TDIST】統(tǒng)計(jì)函數(shù),可以計(jì)算給定值和自由度時(shí)分布的概率值語法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計(jì)算給定概率和自由度時(shí)的相應(yīng)

語法:TINV(probability,degrees_freedom)

用Excel生成t分布的臨界值表3.3.3F-分布3.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布分布2008年5月為紀(jì)念統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)

以其姓氏的第一個(gè)字母來命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為F-分布

(F

distribution)2008年5月不同自由度的F分布

(圖示)F(1,10)(5,10)(10,10)2008年5月F-分布

(用Excel計(jì)算F分布的概率)利用Excel提供的【FDIST】統(tǒng)計(jì)函數(shù),計(jì)算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計(jì)算給定單尾概率和自由度時(shí)的相應(yīng)

語法:

FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel計(jì)算F分布的概率3.4樣本統(tǒng)計(jì)量的抽樣分布

3.4.1樣本均值的抽樣分布

3.4.2其他統(tǒng)計(jì)量的抽樣分布

3.4.3統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差第3

章用概率分布描述隨機(jī)變量2008年5月樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取樣本量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布

隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)

抽樣分布

(samplingdistribution)3.4.1樣本均值的抽樣分布3.4樣本統(tǒng)計(jì)量的抽樣分布2008年5月在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ)

樣本均值的抽樣分布2008年5月樣本均值的抽樣分布

(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差2008年5月樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))2008年5月樣本均值的抽樣分布

(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.52008年5月樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x2008年5月樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論