《統(tǒng)計(jì)學(xué)-基于SPSS》第4章-隨機(jī)變量的概率分布(S3)_第1頁
《統(tǒng)計(jì)學(xué)-基于SPSS》第4章-隨機(jī)變量的概率分布(S3)_第2頁
《統(tǒng)計(jì)學(xué)-基于SPSS》第4章-隨機(jī)變量的概率分布(S3)_第3頁
《統(tǒng)計(jì)學(xué)-基于SPSS》第4章-隨機(jī)變量的概率分布(S3)_第4頁
《統(tǒng)計(jì)學(xué)-基于SPSS》第4章-隨機(jī)變量的概率分布(S3)_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)—基于SPSS課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他常用方法使用軟件SPSS學(xué)分與課時(shí)3學(xué)分,1~17周,每周3課時(shí)第4

章隨機(jī)變量的概率分布4.1度量事件發(fā)生的可能性4.2隨機(jī)變量概率分布4.3樣本統(tǒng)計(jì)量的概率分布probability2019-5-5學(xué)習(xí)目標(biāo)度量事件發(fā)生的可能性—概率離散型概率分布二項(xiàng)分布連續(xù)型概率分布正態(tài)分布由正態(tài)分布導(dǎo)出的幾個(gè)重要分布t-分布,c2-分布,F(xiàn)-分布樣本統(tǒng)計(jì)量的概率分布2019-5-5問題與思考

彩票中獎(jiǎng)的可能性有多大很多想在彩票市場上賺大錢,這可以理解,但贏得大獎(jiǎng)的人總是少數(shù)。山東的一打工者為了碰運(yùn)氣,半個(gè)小時(shí)花去了1000元錢,買了500張即開型福利彩票,結(jié)果也沒撞上大獎(jiǎng)。有人曾做過統(tǒng)計(jì),最賺錢的彩票,中彩的概率最高是500萬分之一,有的達(dá)到1000萬分之一甚至更低假定每張彩票面值是2元,大獎(jiǎng)的獎(jiǎng)金額是500萬元,中將概率是500萬分之一,你花掉1000萬元購買500萬張彩票,即使中了500萬的大獎(jiǎng),你仍然虧損500萬。況且,從概率的意義上看,即使你購買500萬張彩票,也不能肯定就中大獎(jiǎng)法國人就有這樣的俗語:“中彩的機(jī)會比空難還少。”對于多數(shù)人來說,彩票只是一種數(shù)字游戲,是社會籌集閑散資金的一種方式,而不是一種投資,更不是賭博。相信有了本章介紹的概率方面的知識,你就不會再跟彩票較勁4.1什么是概率概率是什么?怎樣獲得概率?怎樣理解概率?第4章隨機(jī)變量的概率分布2019-5-5什么是概率?

(probability)概率是對事件發(fā)生的可能性大小的度量明天降水的概率是80%。這里的80%就是對降水這一事件發(fā)生的可能性大小的一種數(shù)值度量你購買一只股票明天上漲的可能性是30%,這也是一個(gè)概率一個(gè)介于0和1之間的一個(gè)值事件A的概率記為P(A)2019-5-5怎樣獲得概率?重復(fù)試驗(yàn)獲得概率當(dāng)試驗(yàn)的次數(shù)很多時(shí),概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來逼近在相同條件下,重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫為

用類似的比例來逼近一家餐館將生存5年的概率,可以用已經(jīng)生存了5年的類似餐館所占的比例作為所求概率一個(gè)近似值主觀概率2019-5-5怎樣理解概率?

投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右(注意:拋擲完成后,其結(jié)果就是一個(gè)數(shù)據(jù),要么一定是正面,要么一定是反面,就不是概率問題了)4.2隨機(jī)變量的概率分布

4.2.1隨機(jī)變量及其概括性度量

4.2.2隨機(jī)變量的概率分布

4.2.3其他幾個(gè)重要的統(tǒng)計(jì)分布

第4章隨機(jī)變量的概率分布4.2.1隨機(jī)變量及其概括性度量4.2隨機(jī)變量的概率分布2019-5-5什么是隨機(jī)變量?

(randomvariables)事先不知道會出現(xiàn)什么結(jié)果投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫字樓,每平方米的出租價(jià)格一個(gè)消費(fèi)者對某一特定品牌飲料的偏好一般用X,Y,Z來表示根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量2019-5-5離散型隨機(jī)變量

(discreterandomvariables)隨機(jī)變量X

取有限個(gè)值或所有取值都可以逐個(gè)列舉出來x1,x2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營業(yè)一天電腦公司一個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為12019-5-5連續(xù)型隨機(jī)變量

(continuousrandomvariables)可以取一個(gè)或多個(gè)區(qū)間中任何值所有可能取值不可以逐個(gè)列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個(gè)產(chǎn)品的長度使用壽命(小時(shí))半年后完工的百分比測量誤差(cm)X

00

X100X

02019-5-5離散型隨機(jī)變量的期望值

(expectedvalue)描述離散型隨機(jī)變量取值的集中程度離散型隨機(jī)變量X的所有可能取值xi與其取相對應(yīng)的概率pi乘積之和記為

或E(X),計(jì)算公式為2019-5-5離散型隨機(jī)變量的方差

(variance)隨機(jī)變量X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望,記為

2

或D(X)描述離散型隨機(jī)變量取值的分散程度計(jì)算公式為方差的平方根稱為標(biāo)準(zhǔn)差,記為

D(X)2019-5-5離散型數(shù)學(xué)期望和方差

(例題分析)

【例4—1】一家手機(jī)制造商聲稱,它們所生產(chǎn)的手機(jī)100個(gè)中擁有次品的個(gè)數(shù)及相應(yīng)的概率如下表所示。求該手機(jī)次品數(shù)的期望值和標(biāo)準(zhǔn)差次品數(shù)X=xi0123概率P(X=xi)

pi0.750.120.080.052019-5-5連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的期望值方差4.2.2隨機(jī)變量的概率分布4.2隨機(jī)變量的概率分布2019-5-5離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率通常用下面的表格來表示X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pn

P(X=xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)pi0;常用的有二項(xiàng)分布、泊松分布、超幾何分布等2019-5-5二項(xiàng)試驗(yàn)

(Bernoulli試驗(yàn))

二項(xiàng)分布建立在Bernoulli試驗(yàn)基礎(chǔ)上貝努里試驗(yàn)滿足下列條件一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗(yàn)“成功”的概率為p,失敗的概率為q=1-p,且概率p對每次試驗(yàn)都是相同的

試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次

在n次試驗(yàn)中,“成功”的次數(shù)對應(yīng)一個(gè)離散型隨機(jī)變量X

2019-5-5二項(xiàng)分布

(Binomialdistribution)重復(fù)進(jìn)行

n

次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為X~B(n,p)設(shè)X為n次重復(fù)試驗(yàn)中出現(xiàn)成功的次數(shù),X取x

的概率為2019-5-5二項(xiàng)分布

(例題分析)

【例4-2】已知一批產(chǎn)品的次品率為4%,從中任意有放回地抽取5個(gè)。求5個(gè)產(chǎn)品中

(1)沒有次品的概率是多少?

(2)恰好有1個(gè)次品的概率是多少?

(3)有3個(gè)以下次品的概率是多少?2019-5-5二項(xiàng)分布

(用SPSS函數(shù)計(jì)算概率)計(jì)算二項(xiàng)分布的概率SPSS2019-5-5連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值它取任何一個(gè)特定的值的概率都等于0不能列出每一個(gè)值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述2019-5-5正態(tài)分布

(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)2019-5-5概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)

=正態(tài)隨機(jī)變量X的均值

=正態(tài)隨機(jī)變量X的方差

=3.1415926;e=2.71828x=隨機(jī)變量的取值(-

<x<+

)2019-5-5正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=

對稱鐘形曲線,且峰值在x=

處均值

和標(biāo)準(zhǔn)差

一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值

可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。

越大,正態(tài)曲線扁平;

越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個(gè)方向無限延伸時(shí),曲線的兩個(gè)尾端也無限漸近橫軸,理論上永遠(yuǎn)不會與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

2019-5-5

對正態(tài)曲線的影響2019-5-5正態(tài)分布的概率2019-5-5標(biāo)準(zhǔn)正態(tài)分布

(standardizenormaldistribution)

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)2019-5-5正態(tài)分布

(用SPSS計(jì)算正態(tài)分布的概率)2019-5-5正態(tài)分布

(例題分析)【例4-5】計(jì)算以下概率

(1)

X~N(50,102),求和

(2)

Z~N(0,1),求和

(3)正態(tài)分布概率為0.05時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)值z

計(jì)算正態(tài)分布的概率SPSS2019-5-5數(shù)據(jù)正態(tài)性的評估對數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似繪制正態(tài)概率圖。有時(shí)也稱為分位數(shù)—分位數(shù)圖或稱Q-Q圖或稱為P-P圖用于考察觀測數(shù)據(jù)是否符合某一理論分布,如正態(tài)分布、指數(shù)分布、t分布等等P-P圖是根據(jù)觀測數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的Q-Q圖則是根據(jù)觀測值的實(shí)際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的使用非參數(shù)檢驗(yàn)中的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn))2019-5-5用SPSS繪制正態(tài)概率圖

第1步:選擇【Graphs】下拉菜單,并選擇【P-P】

或【Q-Q】選項(xiàng)進(jìn)入主對話框第2步:在主對話框中將變量選入【Variables】

,點(diǎn)擊【OK】繪制正態(tài)概率圖SPSS2019-5-5正態(tài)概率圖的繪制

(例題分析)P-P圖Q-Q圖

【例4-4】判斷大學(xué)生的月生活費(fèi)支出是否服從正態(tài)分布4.2.3其他幾個(gè)重要的統(tǒng)計(jì)分布4.2隨機(jī)變量的概率分布2019-5-5t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布2019-5-5由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則y服從自由度為1的

2分布,即對于n個(gè)正態(tài)隨機(jī)變量y1

,y2

,yn,則隨機(jī)變量稱為具有n個(gè)自由度的

2分布,記為c2-分布

(

2-distribution)2019-5-5分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(

2)=n,方差為:D(

2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的

2分布隨機(jī)變量,U~

2(n1),V~

2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的

2分布c2-分布

(性質(zhì)和特點(diǎn))2019-5-5不同自由度的c2

分布2019-5-5為紀(jì)念統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)

以其姓氏的第一個(gè)字母來命名則設(shè)若U為服從自由度為n1的

2分布,即U~

2(n1),V為服從自由度為n2的

2分布,即V~

2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為F-分布

(F

distribution)2019-5-5不同自由度的F分布4.3樣本統(tǒng)計(jì)量的概率分布

4.3.1統(tǒng)計(jì)量及其分布

4.3.2樣本均值的分布

4.3.3其他統(tǒng)計(jì)量的分布

4.3.4統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差第4章隨機(jī)變量的概率分布4.3.1統(tǒng)計(jì)量及其分布4.3樣本統(tǒng)計(jì)量的概率分布2019-5-5參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值一個(gè)總體的參數(shù):總體均值(

)、標(biāo)準(zhǔn)差(

)、總體比例(

);兩個(gè)總體參數(shù):(

1-2)、(

1-2)、(

1/2)總體參數(shù)通常用希臘字母表示統(tǒng)計(jì)量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量,是樣本的函數(shù)一個(gè)總體參數(shù)推斷時(shí)的統(tǒng)計(jì)量:樣本均值(

x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等兩個(gè)總體參數(shù)推斷時(shí)的統(tǒng)計(jì)量:(

x1-

x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計(jì)量通常用小寫英文字母來表示2019-5-5樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對頻數(shù)分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)4.3.2樣本均值的分布4.3樣本統(tǒng)計(jì)量的概率分布2019-5-5在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值

的理論基礎(chǔ) 樣本均值的分布2019-5-5樣本均值的分布

(例題分析),2019-5-5樣本均值的分布

(例題分析)2019-5-5樣本均值的分布與總體分布的比較

(例題分析)總體分布樣本均值分布2019-5-5樣本均值的分布

與中心極限定理當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值

x也服從正態(tài)分布,

x

的期望值為μ,方差為σ2/n。即

x~N(μ,σ2/n)從均值為

,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布2019-5-5樣本均值的分布與中心極限定理模擬#中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論