數(shù)據(jù)的統(tǒng)計(jì)描述及其分析課件_第1頁
數(shù)據(jù)的統(tǒng)計(jì)描述及其分析課件_第2頁
數(shù)據(jù)的統(tǒng)計(jì)描述及其分析課件_第3頁
數(shù)據(jù)的統(tǒng)計(jì)描述及其分析課件_第4頁
數(shù)據(jù)的統(tǒng)計(jì)描述及其分析課件_第5頁
已閱讀5頁,還剩163頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)的統(tǒng)計(jì)描述和分析皖西學(xué)院數(shù)理系袁國(guó)軍12/23/20221數(shù)理系袁國(guó)軍數(shù)據(jù)的統(tǒng)計(jì)描述和分析皖西學(xué)院數(shù)理系袁國(guó)軍12/20/202一個(gè)有趣的現(xiàn)象在全球最大的零售業(yè)巨頭沃爾瑪連鎖商店里,就有這么一個(gè)有趣的現(xiàn)象,啤酒與嬰幼兒尿布是擺設(shè)在一塊的。這是什么原因呢?原來美國(guó)太太們總是要求其先生下班后給兒女們買尿布,而美國(guó)男士們又特愛喝啤酒,下班時(shí)總忘不了要到商店中買幾罐啤酒,而這兩樣?xùn)|西放在一塊,既提醒做父親的不要忘了買尿布同時(shí)又順便把自己喜愛的啤酒帶回了家。沃爾瑪連鎖商店通過周密的調(diào)查與細(xì)心的統(tǒng)計(jì)發(fā)現(xiàn)這兩樣看似毫無關(guān)系的東西卻有著如此神奇的聯(lián)系,從而把這兩樣表面看似毫不搭界的東西擺在了一起,結(jié)果,啤酒與尿布的銷量雙雙大增??梢姡诩?xì)微之處入手,是會(huì)有意想不到的效果的。12/23/20222數(shù)理系袁國(guó)軍一個(gè)有趣的現(xiàn)象在全球最大的零售業(yè)巨頭沃爾瑪連鎖商統(tǒng)計(jì)的基本概念參數(shù)估計(jì)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)描述和分析12/23/20223數(shù)理系袁國(guó)軍統(tǒng)計(jì)的基本概念參數(shù)估計(jì)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)描述和分析12/20一、統(tǒng)計(jì)量統(tǒng)計(jì)的基本概念12/23/20224數(shù)理系袁國(guó)軍一、統(tǒng)計(jì)量統(tǒng)計(jì)的基本概念12/20/20224數(shù)理系袁國(guó)12/23/20225數(shù)理系袁國(guó)軍12/20/20225數(shù)理系袁國(guó)軍二、分布函數(shù)的近似求法12/23/20226數(shù)理系袁國(guó)軍二、分布函數(shù)的近似求法12/20/20226數(shù)理系袁國(guó)軍三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41.正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp,

分布函數(shù)12/23/20227數(shù)理系袁國(guó)軍三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布-4-2024600.050.12/23/20228數(shù)理系袁國(guó)軍12/20/20228數(shù)理系袁國(guó)軍12/23/20229數(shù)理系袁國(guó)軍12/20/20229數(shù)理系袁國(guó)軍F分布F(10,50)的密度函數(shù)曲線12/23/202210數(shù)理系袁國(guó)軍F分布F(10,50)的密度函數(shù)曲線12/20/202210參數(shù)估計(jì)12/23/202211數(shù)理系袁國(guó)軍參數(shù)估計(jì)12/20/202211數(shù)理系袁國(guó)軍一、點(diǎn)估計(jì)的求法(一)矩估計(jì)法12/23/202212數(shù)理系袁國(guó)軍一、點(diǎn)估計(jì)的求法(一)矩估計(jì)法12/20/202212數(shù)理系(二)極大似然估計(jì)法12/23/202213數(shù)理系袁國(guó)軍(二)極大似然估計(jì)法12/20/202213數(shù)理系袁國(guó)軍二、區(qū)間估計(jì)的求法12/23/202214數(shù)理系袁國(guó)軍二、區(qū)間估計(jì)的求法12/20/202214數(shù)理系袁國(guó)軍1、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置信區(qū)間(一)數(shù)學(xué)期望的置信區(qū)間(二)方差的區(qū)間估計(jì)12/23/202215數(shù)理系袁國(guó)軍1、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置Matlab統(tǒng)計(jì)工具箱的使用之一一、常見統(tǒng)計(jì)量的Matlab命令1.輸出頻數(shù)表:[n,y]=hist(x,k),k為等分區(qū)間數(shù),n為頻數(shù)行向量,x為原始數(shù)據(jù)行向量。2.輸出直方圖:hist(x,k),k為等分區(qū)間數(shù),默認(rèn)值為10。3.基本統(tǒng)計(jì)量:對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)k階中心矩:monment(x,order),order是階數(shù)12/23/202216數(shù)理系袁國(guó)軍Matlab統(tǒng)計(jì)工具箱的使用之一一、常見統(tǒng)計(jì)量的Matlab二、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機(jī)數(shù)生成:rnd(當(dāng)需要一種分布的某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)12/23/202217數(shù)理系袁國(guó)軍二、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:1、密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省)例求正態(tài)分布N(1,22),x=1.8處的密度函數(shù)值y=normpdf(1.8,1,2),得y=0.1841在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)12/23/202218數(shù)理系袁國(guó)軍如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:1、12/23/202219數(shù)理系袁國(guó)軍12/20/202219數(shù)理系袁國(guó)軍2、概率分布(分布函數(shù)):P=normcdf(x,mu,sigma)求正態(tài)分布N(0,22),x=1.2處的分布函數(shù)值,即F(1.2)的值P=normcdf(1.2,0,2),得p=0.7257求二項(xiàng)分布B(20,0.3),x=6處的分布函數(shù)值P=binocdf(6,20,0.3),得p=0.608012/23/202220數(shù)理系袁國(guó)軍2、概率分布(分布函數(shù)):P=normcdf(x,mu,si3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù)(下側(cè))求p=0.999的tf分布(自由度n=10)的分位數(shù)y=tinv(0.999,10),得y=4.143712/23/202221數(shù)理系袁國(guó)軍3、逆概率分布:x=norminv(P,mu,sigma).4、均值與方差:例5求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=25計(jì)算F(2,5)的期望與方差命令:[m,v]=fstat(2,5)結(jié)果為:m=1.6667,v=13.888912/23/202222數(shù)理系袁國(guó)軍4、均值與方差:例5求正態(tài)分布N(3,52)的均值與方差5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.例6命令:M=normrnd([123;456],0.1,2,3)結(jié)果為:M=0.95672.01252.88543.83345.02886.1191此命令產(chǎn)生了2×3的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)M=normrnd([123;456],[0.123;246])請(qǐng)思考此命令生成的是什么樣的隨機(jī)矩陣呢?12/23/202223數(shù)理系袁國(guó)軍5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).二、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).12/23/202224數(shù)理系袁國(guó)軍二、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正例如:有一批糖果,從中隨機(jī)的取16袋,稱得重量如下:506508499503504510497512514505493496506502509496,假設(shè)糖果的重量近似服從正態(tài)分布,求總體均值、標(biāo)準(zhǔn)差的估計(jì)值和置信水平為0.95的置信區(qū)間。x=[506508499503504510497512514505493496506502509496];[mu,sigma,muci,sigmaci]=normfit(x,0.05)得到mu=503.7500sigma=6.2022muci=[500.4451,507.0549]sigmaci=[4.5816,9.5990]12/23/202225數(shù)理系袁國(guó)軍例如:有一批糖果,從中隨機(jī)的取16袋,稱得重量如下:得到mu2.常見的幾種分布數(shù)據(jù)的點(diǎn)估計(jì)和區(qū)間估計(jì)的matlab命令格式1.均勻分布:[ahat,bhat,aci,bci]=unifit(x,alpha),在顯著性水平alpha下,求均勻分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).2.指數(shù)分布:[muhat,muci,]=expfit(x,alpha)在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).3.正態(tài)分布:[mu,sigma,muci,sigmaci]=normfit(x,alpha),在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).12/23/202226數(shù)理系袁國(guó)軍2.常見的幾種分布數(shù)據(jù)的點(diǎn)估計(jì)和區(qū)間估計(jì)1.均勻分布:[ah4.泊松分布:[lambdahat,lambdaci]=poissfit(x,alpha)在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).5.二項(xiàng)分布:[phat,pci]=binofit(x,n,alpha)在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).其中x是樣本數(shù)組,alpha是顯著性水平,輸出有關(guān)參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)。12/23/202227數(shù)理系袁國(guó)軍4.泊松分布:[lambdahat,lambdaci]=po例如假設(shè)下面的數(shù)據(jù)近似服從泊松分布,請(qǐng)求出分布的參數(shù)及0.95的置信區(qū)間。106533105357386575855x=[6106533105357386575855];[muhat,muci]=poissfit(x,0.05)12/23/202228數(shù)理系袁國(guó)軍例如假設(shè)下面的數(shù)據(jù)近似服從泊松分布,請(qǐng)求出分布12/20/練習(xí):某校60名學(xué)生的一次考試成績(jī)?nèi)缦?9375839391858482777677959489918886839681799778756769688483817566857094848382807874737670867690897166867380947978776353551)計(jì)算均值、標(biāo)準(zhǔn)差、極差、偏度、峰度,畫出直方圖;2)若成績(jī)近似服從正態(tài)分布,估計(jì)正態(tài)分布的參數(shù).12/23/202229數(shù)理系袁國(guó)軍練習(xí):某校60名學(xué)生的一次考試成績(jī)?nèi)缦?1)計(jì)算均值、標(biāo)準(zhǔn)差1.參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類型已知,這時(shí)構(gòu)造出的統(tǒng)計(jì)量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn).參數(shù)檢驗(yàn)的目的往往是對(duì)總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷.

對(duì)總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).2.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對(duì)某個(gè)參數(shù)作出明確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計(jì)量的分布函數(shù)不依賴于觀測(cè)值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn).如要求判斷總體分布類型的檢驗(yàn)就是非參數(shù)檢驗(yàn).假設(shè)檢驗(yàn)12/23/202230數(shù)理系袁國(guó)軍1.參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類型已知,這時(shí)構(gòu)造出的假設(shè)檢驗(yàn)的一般步驟是:12/23/202231數(shù)理系袁國(guó)軍假設(shè)檢驗(yàn)的一般步驟是:12/20/202231數(shù)理系袁國(guó)(一)單個(gè)正態(tài)總體均值檢驗(yàn)一、參數(shù)檢驗(yàn)12/23/202232數(shù)理系袁國(guó)軍(一)單個(gè)正態(tài)總體均值檢驗(yàn)一、參數(shù)檢驗(yàn)12/20/2022312/23/202233數(shù)理系袁國(guó)軍12/20/202233數(shù)理系袁國(guó)軍(二)單個(gè)正態(tài)總體方差檢驗(yàn)12/23/202234數(shù)理系袁國(guó)軍(二)單個(gè)正態(tài)總體方差檢驗(yàn)12/20/202234數(shù)理系(三)兩個(gè)正態(tài)總體均值檢驗(yàn)12/23/202235數(shù)理系袁國(guó)軍(三)兩個(gè)正態(tài)總體均值檢驗(yàn)12/20/202235數(shù)理系(四)兩個(gè)正態(tài)總體方差檢驗(yàn)12/23/202236數(shù)理系袁國(guó)軍(四)兩個(gè)正態(tài)總體方差檢驗(yàn)12/20/202236數(shù)理系二、非參數(shù)檢驗(yàn)前面討論的是分布已知時(shí)的參數(shù)假設(shè)檢驗(yàn)問題,稱為參數(shù)假設(shè)檢驗(yàn)。一般說來,在進(jìn)行參數(shù)假設(shè)檢驗(yàn)之前,要對(duì)總體的分布進(jìn)行推斷,即為總體分布的擬合檢驗(yàn)問題,它屬于非參數(shù)檢驗(yàn)。已知總體X的樣本分布函數(shù)Fn(x),若選用某個(gè)分布函數(shù)F0(x)去擬合,則無論選擇,F(xiàn)0(x)與Fn(x)之間總會(huì)存在差異。這些差異是由于試驗(yàn)的有限性而導(dǎo)致的隨機(jī)性產(chǎn)生的呢,還是所選擇的分布函數(shù)F0(x)與樣本函數(shù)Fn(x之間存在實(shí)質(zhì)性差異而產(chǎn)生的呢?12/23/202237數(shù)理系袁國(guó)軍二、非參數(shù)檢驗(yàn)前面討論的是分布已知時(shí)的參數(shù)假設(shè)檢驗(yàn)此種方法主要是通過各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)差異性的大小來推斷經(jīng)驗(yàn)分布是否服從任何一個(gè)預(yù)先給定的理論分布。其理論依據(jù)就是用各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)的差異構(gòu)造一個(gè)服從分布的統(tǒng)計(jì)量,并用次統(tǒng)計(jì)量來進(jìn)行假設(shè)檢驗(yàn)。使用此法時(shí)要求樣本容量較大,并且在進(jìn)行分組時(shí),每組的理論頻數(shù)不小于5。具體的內(nèi)容請(qǐng)參見有關(guān)概率論與數(shù)理統(tǒng)計(jì)教材12/23/202238數(shù)理系袁國(guó)軍此種方法主要是通過各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)差異性的大小12概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多,以正態(tài)概率紙最為常見。正態(tài)概率紙的橫坐標(biāo)是均勻刻度,縱坐標(biāo)是按正態(tài)分布律刻度,表示概率。(二)概率紙檢驗(yàn)法12/23/202239數(shù)理系袁國(guó)軍概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計(jì)量3.常見概率分布的函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計(jì)6.假設(shè)檢驗(yàn)7.綜合實(shí)例12/23/202240數(shù)理系袁國(guó)軍統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令12/23/202241數(shù)理系袁國(guó)軍一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會(huì)1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4];y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0];3、將變量t、x、y的數(shù)據(jù)保存在文件data中。savedatatxy4、進(jìn)行統(tǒng)計(jì)分析時(shí),調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。loaddataToMATLAB(txy)方法112/23/202242數(shù)理系袁國(guó)軍1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。2、分別以x和1、輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data3、進(jìn)行統(tǒng)計(jì)分析時(shí),先用命令:loaddata1

調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:data(:,j)方法2ToMATLAB(data)12/23/202243數(shù)理系袁國(guó)軍1、輸入矩陣:2、將矩陣data的數(shù)據(jù)保存在文件data1中二、基本統(tǒng)計(jì)量對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)例對(duì)例1中的職工工資總額x,可計(jì)算上述基本統(tǒng)計(jì)量。To

MATLAB(tjl)12/23/202244數(shù)理系袁國(guó)軍二、基本統(tǒng)計(jì)量對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:例三、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機(jī)數(shù)生成:rnd(當(dāng)需要一種分布的某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)12/23/202245數(shù)理系袁國(guó)軍三、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1、密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省)ToMATLAB(liti2)如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:12/23/202246數(shù)理系袁國(guó)軍在Matlab中輸入以下命令:1、密度函數(shù):p=normpd12/23/202247數(shù)理系袁國(guó)軍12/20/202247數(shù)理系袁國(guó)軍x=-6:0.01:6;y=normpdf(x);z=normpdf(x,1,2);plot(x,y,x,z)12/23/202248數(shù)理系袁國(guó)軍x=-6:0.01:6;12/20/202248數(shù)理系ToMATLAB(liti3)3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù).2、概率分布:P=normcdf(x,mu,sigma)ToMATLAB(liti4)12/23/202249數(shù)理系袁國(guó)軍ToMATLAB(liti3)3、逆概率分布:x=normToMATLAB(liti5)4、均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=255、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生m╳n階的正態(tài)分布隨機(jī)數(shù)矩陣.例6命令:M=normrnd([123;456],0.1,2,3)結(jié)果為:M=0.95672.01252.88543.83345.02886.1191ToMATLAB(liti6)

此命令產(chǎn)生了2╳3的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,0.12),N(3,0.12),N(4,0.12),N(5,0.12),N(0.1,32)返回12/23/202250數(shù)理系袁國(guó)軍ToMATLAB(liti5)4、均值與方差:[m,v]=1、給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)此命令將區(qū)間[min(data),max(data)]分為k個(gè)小區(qū)間(缺省為10),返回?cái)?shù)組data落在每一個(gè)小區(qū)間的頻數(shù)N和每一個(gè)小區(qū)間的中點(diǎn)X.2、描繪數(shù)組data的頻數(shù)直方圖的命令為:

hist(data,k)例如:loaddatahist(x)四、頻數(shù)直方圖的描繪12/23/202251數(shù)理系袁國(guó)軍1、給出數(shù)組data的頻數(shù)表的命令為:2、描繪數(shù)組da12/23/202252數(shù)理系袁國(guó)軍12/20/202252數(shù)理系袁國(guó)軍五、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).12/23/202253數(shù)理系袁國(guó)軍五、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正2、其它分布的參數(shù)估計(jì)有兩種處理辦法:一.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計(jì)命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).(2)[lambdahat,lambdaci]=poissfit(X,alpha)-----在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).(3)[phat,pci]=weibfit(X,alpha)-----在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).12/23/202254數(shù)理系袁國(guó)軍2、其它分布的參數(shù)估計(jì)有兩種處理辦法:(1)[muha六、假設(shè)檢驗(yàn)在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).1、總體方差sigma2已知時(shí),總體均值的檢驗(yàn)使用z-檢驗(yàn)

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕原假設(shè),h=0表示不可以拒絕原假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.12/23/202255數(shù)理系袁國(guó)軍六、假設(shè)檢驗(yàn)在總體服從正態(tài)分布的情況下,可用以

例7Matlab統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國(guó)1993年一月份和二月份的汽油平均價(jià)格(price1,price2分別是一,二月份的油價(jià),單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價(jià)的標(biāo)準(zhǔn)偏差是一加侖四分幣(=4),試檢驗(yàn)一月份油價(jià)的均值是否等于115.解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:loadgas然后用以下命令檢驗(yàn)[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)均值115是合理的.2.sig-值為0.8668,遠(yuǎn)超過0.05,不能拒絕零假設(shè)3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..

ToMATLAB(liti7)12/23/202256數(shù)理系袁國(guó)軍例7Matlab統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.練習(xí)1有一批糖果,從中隨機(jī)的取16袋,稱得重量如下:506508499503504510497512514505493496506502509496,假設(shè)糖果的重量近似服從正態(tài)分布、標(biāo)準(zhǔn)差為4,請(qǐng)問該批糖果每袋的平均重量是否為500?(置信水平為0.05)x=[506508499503504510497512514505493496506502509496];[h,sig,muci]=ztest(x,500,4,0.05,0)得到h=1,sig=1.7683e-004muci=[501.7900,505.7100]h=1,因此拒絕原假設(shè),即平均重量不等于50012/23/202257數(shù)理系袁國(guó)軍練習(xí)1x=[5065084995035045102、總體方差sigma2未知時(shí),總體均值的檢驗(yàn)使用t-檢驗(yàn)[h,sig,ci]=ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.12/23/202258數(shù)理系袁國(guó)軍2、總體方差sigma2未知時(shí),總體均值的檢驗(yàn)使用t-檢驗(yàn)返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)油價(jià)均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括115,故不能接受假設(shè).3.sig-值為4.9517e-004,遠(yuǎn)小于0.05,不能接受零假設(shè).

ToMATLAB(liti8)例8試檢驗(yàn)例8中二月份油價(jià)Price2的均值是否等于115.解作假設(shè):m=115,price2為二月份的油價(jià),不知其方差,故用以下命令檢驗(yàn)[h,sig,ci]=ttest(price2,115)12/23/202259數(shù)理系袁國(guó)軍返回:h=1,sig=4.9517e-004,ci練習(xí)正常人的脈搏為每分鐘72次,測(cè)得10例慢性中毒者的脈搏為:54676568787066706967設(shè)中毒者的脈搏為正態(tài)分布,問中毒者和正常人的脈搏有無顯著性差異?12/23/202260數(shù)理系袁國(guó)軍練習(xí)12/20/202260數(shù)理系袁國(guó)軍3、兩總體均值的假設(shè)檢驗(yàn)使用t-檢驗(yàn)

[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù)x,y的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于y的均值”tail=1,檢驗(yàn)假設(shè)“x的均值大于y的均值”tail=-1,檢驗(yàn)假設(shè)“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.12/23/202261數(shù)理系袁國(guó)軍3、兩總體均值的假設(shè)檢驗(yàn)使用t-檢驗(yàn)[h,sig,ci返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)“油價(jià)均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價(jià)比二月份油價(jià)約低1至6分.3.sig-值為0.0083,遠(yuǎn)小于0.5,不能接受“油價(jià)均相同”假設(shè).ToMATLAB(liti9)例9試檢驗(yàn)例8中一月份油價(jià)Price1與二月份的油價(jià)Price2均值是否相同.解用以下命令檢驗(yàn)[h,sig,ci]=ttest2(price1,price2)12/23/202262數(shù)理系袁國(guó)軍返回:h=1,sig=0.0083,ci=[-5.練習(xí)112/23/202263數(shù)理系袁國(guó)軍練習(xí)112/20/202263數(shù)理系袁國(guó)軍練習(xí)2設(shè)某產(chǎn)品的生產(chǎn)工藝發(fā)生了變化,在改變前后分別測(cè)得若干產(chǎn)品的技術(shù)指標(biāo):改變前:21.622.822.121.220.521.921.4改變后:24.123.824.724.023.724.324.523.9設(shè)技術(shù)指標(biāo)數(shù)服從正態(tài)分布,方差未知且在改變前后不變。工藝改變前后對(duì)該指標(biāo)有無顯著性影響(顯著性水平為0.05);試估計(jì)工藝改變后,該技術(shù)指標(biāo)的置信水平為0.95的平均值的變化范圍?!?3.832824.4172】12/23/202264數(shù)理系袁國(guó)軍練習(xí)212/20/202264數(shù)理系袁國(guó)軍4.單正態(tài)總體方差的假設(shè)檢驗(yàn)M文件function[chi21,chi2,chi22]=chi2test(x,sigma,alpha)n=length(x);[xbar,S]=normfit(x);chi2=(n-1)*S^2/sigma^2;chi21=chi2inv(alpha/2,n-1);chi22=chi2inv(1-alpha/2,n-1);fprintf('chi21=%.4fchi2=%.4f,chi22=%.4f',chi21,chi2,chi22);12/23/202265數(shù)理系袁國(guó)軍4.單正態(tài)總體方差的假設(shè)檢驗(yàn)12/20/202265數(shù)理系function[h,sig,ci]=chi23test(x,sigma,alpha)n=length(x);[xbar,S]=normfit(x);chi20=(n-1)*S^2/sigma^2;chi21=chi2inv(alpha/2,n-1);chi22=chi2inv(1-alpha/2,n-1);ifchi21<chi20<chi22h=0;elseh=1;endsig=chi2cdf(chi20,n-1);ci=[(n-1)*S^2/chi22,(n-1)*S^2/chi21];fprintf('h=%.4fsig=%.4f,ci=%.4f',h,sig,ci);12/23/202266數(shù)理系袁國(guó)軍function[h,sig,ci]=chi23test(命令格式:x=[…];[chi21,chi2,chi22]=chi2test(x,sigma,alpha)若chi21>chi2或chi22<chi2,則拒絕原假設(shè)否則,不能拒絕原假設(shè)例從某一批保險(xiǎn)絲中隨機(jī)抽取10根,測(cè)試其融化時(shí)間,得如下數(shù)據(jù):42657578715957685554假設(shè)保險(xiǎn)絲的融化時(shí)間服從正態(tài)分布,檢驗(yàn)總體方差是否等于122。12/23/202267數(shù)理系袁國(guó)軍命令格式:例從某一批保險(xiǎn)絲中隨機(jī)抽取10根,測(cè)試其融化時(shí)間5.雙正態(tài)總體方差的假設(shè)檢驗(yàn)(F檢驗(yàn))M文件function[F1,F,F2]=ftest(x,y,alpha)m=length(x);n=length(y);[xbar,Sx]=normfit(x);[ybar,Sy]=normfit(y);F=Sx^2/Sy^2;F1=finv(alpha/2,m-1,n-1);F2=finv(1-alpha/2,m-1,n-1);fprintf('F1=%.4fF=%.4f,F2=%.4f',F1,F,F2);12/23/202268數(shù)理系袁國(guó)軍5.雙正態(tài)總體方差的假設(shè)檢驗(yàn)(F檢驗(yàn))M文件12/20/function[h,sig,ci]=ftest2(x,y,alpha)m=length(x);n=length(y);[xbar,Sx]=normfit(x);[ybar,Sy]=normfit(y);F=Sx^2/Sy^2;F1=finv(alpha/2,m-1,n-1);F2=finv(1-alpha/2,m-1,n-1);ifF1<F<F2h=0;elseh=1;endsig=fcdf(F,m-1,n-1);ci=[F/F2,F/F1];12/23/202269數(shù)理系袁國(guó)軍function[h,sig,ci]=ftest2(x,y命令格式:x=[…];y=[…];[h,sig,ci]=ftest2(x,y,alpha)若h=1,則拒絕原假設(shè),否則,不能拒絕原假設(shè)。例題12/23/202270數(shù)理系袁國(guó)軍命令格式:12/20/202270數(shù)理系袁國(guó)軍未知,請(qǐng)問試驗(yàn)前后鋼得率的方差是否發(fā)生了變化?(顯著性水平為0.05)x=[…];y=[…];[h,sig,ci]=ftest2(x,y,alpha)得到:h=0,所以試驗(yàn)前后的方差沒有發(fā)生變化12/23/202271數(shù)理系袁國(guó)軍未知,請(qǐng)問試驗(yàn)前后鋼得率的方差5、非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)Matlab工具箱提供了兩個(gè)對(duì)總體分布進(jìn)行檢驗(yàn)的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回12/23/202272數(shù)理系袁國(guó)軍5、非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)Matlab工具箱提供了兩個(gè)對(duì)12/23/202273數(shù)理系袁國(guó)軍12/20/202273數(shù)理系袁國(guó)軍另外還有:1.總體是否服從正態(tài)分布的檢驗(yàn)Jarque-Bera檢驗(yàn),是近似檢驗(yàn),適合大樣本的情形[h,p,jbstat,cv]=jbtest(x,alpha)返回值h=1,則拒絕總體是正態(tài)分布的假設(shè),h=0,則不能拒絕總體是正態(tài)分布的假設(shè);還有三個(gè)附加輸出:檢驗(yàn)的p值,檢驗(yàn)統(tǒng)計(jì)量的值jbstat,cv是判斷是否拒絕假設(shè)的關(guān)鍵值。2.總體是否服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn),Kolmogorov-Smirnov檢驗(yàn),即K-S檢驗(yàn)h=kstest(x)H=1,則拒絕總體是標(biāo)準(zhǔn)正態(tài)分布的假設(shè),h=0,則不能拒絕總體是標(biāo)準(zhǔn)正態(tài)分布的假設(shè)。12/23/202274數(shù)理系袁國(guó)軍另外還有:12/20/202274數(shù)理系袁國(guó)軍3.總體是否服從正態(tài)分布的檢驗(yàn),Lilliefors檢驗(yàn),適合小樣本的情形[h,p,jstat,cv]=lillietest(x,alpha)返回值h=1,則拒絕總體是正態(tài)分布的假設(shè),h=0,則不能拒絕總體是正態(tài)分布的假設(shè);4.雙樣本同分布的Kolmogorov-Smirnov檢驗(yàn),即K-S檢驗(yàn)h=kstest(x1,x2)H=1,則拒絕兩個(gè)樣本具有相同連續(xù)分布的假設(shè),h=0,則不能拒絕兩個(gè)樣本具有相同連續(xù)分布的假設(shè)。12/23/202275數(shù)理系袁國(guó)軍3.總體是否服從正態(tài)分布的檢5.雙樣本同分布的Wilcoxon秩和檢驗(yàn)適合離散數(shù)據(jù)的情形[p,h]=ranksum(x,y,alpha)當(dāng)p>alpha時(shí),h=0,代表檢驗(yàn)的結(jié)果接受原假設(shè),即兩個(gè)總體不是同分布的。12/23/202276數(shù)理系袁國(guó)軍5.雙樣本同分布的Wilcoxon秩和檢驗(yàn)12/20/202例10一道工序用自動(dòng)化車床連續(xù)加工某種零件,由于刀具損壞等會(huì)出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時(shí)出現(xiàn)故障機(jī)會(huì)均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時(shí)該刀具完成的零件數(shù)如下:459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時(shí)完成的零件數(shù)屬于哪種分布.12/23/202277數(shù)理系袁國(guó)軍12/20/202277數(shù)理系袁國(guó)軍解1、數(shù)據(jù)輸入Toliti101.mMATLAB(liti101)2、作頻數(shù)直方圖hist(x,10)3、分布的正態(tài)性檢驗(yàn)normplot(x)4、參數(shù)估計(jì):[muhat,sigmahat,muci,sigmaci]=normfit(x)(看起來刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計(jì)出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為[553.4962,634.5038],方差的0.95置信區(qū)間為[179.2276,237.1329].ToMATLAB(liti104)ToMATLAB(liti102)ToMATLAB(liti103)12/23/202278數(shù)理系袁國(guó)軍解1、數(shù)據(jù)輸入Toliti101.mMATLAB(li2、作頻數(shù)直方圖hist(x,10)12/23/202279數(shù)理系袁國(guó)軍12/20/202279數(shù)理系袁國(guó)軍3、分布的正態(tài)性檢驗(yàn)normplot(x)12/23/202280數(shù)理系袁國(guó)軍3、分布的正態(tài)性檢驗(yàn)12/20/202280數(shù)理系袁國(guó)4、參數(shù)估計(jì):

[muhat,sigmahat,muci,sigmaci]=normfit(x)muhat=594,sigmahat=204.1301,muci=[553.4962,634.5038],(muhat95%的置信區(qū)間)Sigmaci=[179.2276,237.1329](sigmahat95%的置信區(qū)間)12/23/202281數(shù)理系袁國(guó)軍4、參數(shù)估計(jì):

[muhat,sigmahat,muci,s5、假設(shè)檢驗(yàn)ToMATLAB(liti105)已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值m是否等于600.[h,sig,ci]=ttest(x,600)結(jié)果:h=0,sig=0.7694,ci=[553.4962,634.5038].檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)壽命均值600是合理的.2.95%的置信區(qū)間為[553.5,634.5],它完全包括594,且精度很高.3.sig-值為1,遠(yuǎn)超過0.05,不能拒絕零假設(shè).

12/23/202282數(shù)理系袁國(guó)軍5、假設(shè)檢驗(yàn)ToMATLAB(liti105)已知刀1、某校60名學(xué)生的一次考試成績(jī)?nèi)缦?9375839391858482777677959489918886839681799778756769688483817566857094848382807874737670867690897166867380947978776353551)計(jì)算均值、標(biāo)準(zhǔn)差、極差、偏度、峰度,畫出直方圖;2)檢驗(yàn)分布的正態(tài)性;3)若檢驗(yàn)符合正態(tài)分布,估計(jì)正態(tài)分布的參數(shù)并檢驗(yàn)參數(shù).綜合練習(xí)12/23/202283數(shù)理系袁國(guó)軍1、某校60名學(xué)生的一次考試成績(jī)?nèi)缦?1)計(jì)算均值、標(biāo)準(zhǔn)差、2、據(jù)說某地汽油的價(jià)格是每加侖115美分,為了驗(yàn)證這種說法,一位學(xué)者開車隨機(jī)選擇了一些加油站,得到某年一月和二月的數(shù)據(jù)如下:一月:119117115116112121115122116118109112119112117113114109109118二月:1181191151221181211201221281161201231211191171191281261181251)分別用兩個(gè)月的數(shù)據(jù)驗(yàn)證這種說法的可靠性;2)分別給出1月和2月汽油價(jià)格的置信區(qū)間;3)給出1月和2月汽油價(jià)格差的置信區(qū)間.12/23/202284數(shù)理系袁國(guó)軍2、據(jù)說某地汽油的價(jià)格是每加侖115美分,為了驗(yàn)證這種說法,數(shù)據(jù)的統(tǒng)計(jì)描述和分析皖西學(xué)院數(shù)理系袁國(guó)軍12/23/202285數(shù)理系袁國(guó)軍數(shù)據(jù)的統(tǒng)計(jì)描述和分析皖西學(xué)院數(shù)理系袁國(guó)軍12/20/202一個(gè)有趣的現(xiàn)象在全球最大的零售業(yè)巨頭沃爾瑪連鎖商店里,就有這么一個(gè)有趣的現(xiàn)象,啤酒與嬰幼兒尿布是擺設(shè)在一塊的。這是什么原因呢?原來美國(guó)太太們總是要求其先生下班后給兒女們買尿布,而美國(guó)男士們又特愛喝啤酒,下班時(shí)總忘不了要到商店中買幾罐啤酒,而這兩樣?xùn)|西放在一塊,既提醒做父親的不要忘了買尿布同時(shí)又順便把自己喜愛的啤酒帶回了家。沃爾瑪連鎖商店通過周密的調(diào)查與細(xì)心的統(tǒng)計(jì)發(fā)現(xiàn)這兩樣看似毫無關(guān)系的東西卻有著如此神奇的聯(lián)系,從而把這兩樣表面看似毫不搭界的東西擺在了一起,結(jié)果,啤酒與尿布的銷量雙雙大增??梢?,在細(xì)微之處入手,是會(huì)有意想不到的效果的。12/23/202286數(shù)理系袁國(guó)軍一個(gè)有趣的現(xiàn)象在全球最大的零售業(yè)巨頭沃爾瑪連鎖商統(tǒng)計(jì)的基本概念參數(shù)估計(jì)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)描述和分析12/23/202287數(shù)理系袁國(guó)軍統(tǒng)計(jì)的基本概念參數(shù)估計(jì)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)描述和分析12/20一、統(tǒng)計(jì)量統(tǒng)計(jì)的基本概念12/23/202288數(shù)理系袁國(guó)軍一、統(tǒng)計(jì)量統(tǒng)計(jì)的基本概念12/20/20224數(shù)理系袁國(guó)12/23/202289數(shù)理系袁國(guó)軍12/20/20225數(shù)理系袁國(guó)軍二、分布函數(shù)的近似求法12/23/202290數(shù)理系袁國(guó)軍二、分布函數(shù)的近似求法12/20/20226數(shù)理系袁國(guó)軍三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41.正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp,

分布函數(shù)12/23/202291數(shù)理系袁國(guó)軍三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布-4-2024600.050.12/23/202292數(shù)理系袁國(guó)軍12/20/20228數(shù)理系袁國(guó)軍12/23/202293數(shù)理系袁國(guó)軍12/20/20229數(shù)理系袁國(guó)軍F分布F(10,50)的密度函數(shù)曲線12/23/202294數(shù)理系袁國(guó)軍F分布F(10,50)的密度函數(shù)曲線12/20/202210參數(shù)估計(jì)12/23/202295數(shù)理系袁國(guó)軍參數(shù)估計(jì)12/20/202211數(shù)理系袁國(guó)軍一、點(diǎn)估計(jì)的求法(一)矩估計(jì)法12/23/202296數(shù)理系袁國(guó)軍一、點(diǎn)估計(jì)的求法(一)矩估計(jì)法12/20/202212數(shù)理系(二)極大似然估計(jì)法12/23/202297數(shù)理系袁國(guó)軍(二)極大似然估計(jì)法12/20/202213數(shù)理系袁國(guó)軍二、區(qū)間估計(jì)的求法12/23/202298數(shù)理系袁國(guó)軍二、區(qū)間估計(jì)的求法12/20/202214數(shù)理系袁國(guó)軍1、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置信區(qū)間(一)數(shù)學(xué)期望的置信區(qū)間(二)方差的區(qū)間估計(jì)12/23/202299數(shù)理系袁國(guó)軍1、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置Matlab統(tǒng)計(jì)工具箱的使用之一一、常見統(tǒng)計(jì)量的Matlab命令1.輸出頻數(shù)表:[n,y]=hist(x,k),k為等分區(qū)間數(shù),n為頻數(shù)行向量,x為原始數(shù)據(jù)行向量。2.輸出直方圖:hist(x,k),k為等分區(qū)間數(shù),默認(rèn)值為10。3.基本統(tǒng)計(jì)量:對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)k階中心矩:monment(x,order),order是階數(shù)12/23/2022100數(shù)理系袁國(guó)軍Matlab統(tǒng)計(jì)工具箱的使用之一一、常見統(tǒng)計(jì)量的Matlab二、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機(jī)數(shù)生成:rnd(當(dāng)需要一種分布的某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)12/23/2022101數(shù)理系袁國(guó)軍二、常見概率分布的函數(shù)Matlab工具箱對(duì)每一種分布都提供五如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:1、密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省)例求正態(tài)分布N(1,22),x=1.8處的密度函數(shù)值y=normpdf(1.8,1,2),得y=0.1841在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)12/23/2022102數(shù)理系袁國(guó)軍如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:1、12/23/2022103數(shù)理系袁國(guó)軍12/20/202219數(shù)理系袁國(guó)軍2、概率分布(分布函數(shù)):P=normcdf(x,mu,sigma)求正態(tài)分布N(0,22),x=1.2處的分布函數(shù)值,即F(1.2)的值P=normcdf(1.2,0,2),得p=0.7257求二項(xiàng)分布B(20,0.3),x=6處的分布函數(shù)值P=binocdf(6,20,0.3),得p=0.608012/23/2022104數(shù)理系袁國(guó)軍2、概率分布(分布函數(shù)):P=normcdf(x,mu,si3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù)(下側(cè))求p=0.999的tf分布(自由度n=10)的分位數(shù)y=tinv(0.999,10),得y=4.143712/23/2022105數(shù)理系袁國(guó)軍3、逆概率分布:x=norminv(P,mu,sigma).4、均值與方差:例5求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=25計(jì)算F(2,5)的期望與方差命令:[m,v]=fstat(2,5)結(jié)果為:m=1.6667,v=13.888912/23/2022106數(shù)理系袁國(guó)軍4、均值與方差:例5求正態(tài)分布N(3,52)的均值與方差5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.例6命令:M=normrnd([123;456],0.1,2,3)結(jié)果為:M=0.95672.01252.88543.83345.02886.1191此命令產(chǎn)生了2×3的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)M=normrnd([123;456],[0.123;246])請(qǐng)思考此命令生成的是什么樣的隨機(jī)矩陣呢?12/23/2022107數(shù)理系袁國(guó)軍5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).二、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).12/23/2022108數(shù)理系袁國(guó)軍二、參數(shù)估計(jì)1、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正例如:有一批糖果,從中隨機(jī)的取16袋,稱得重量如下:506508499503504510497512514505493496506502509496,假設(shè)糖果的重量近似服從正態(tài)分布,求總體均值、標(biāo)準(zhǔn)差的估計(jì)值和置信水平為0.95的置信區(qū)間。x=[506508499503504510497512514505493496506502509496];[mu,sigma,muci,sigmaci]=normfit(x,0.05)得到mu=503.7500sigma=6.2022muci=[500.4451,507.0549]sigmaci=[4.5816,9.5990]12/23/2022109數(shù)理系袁國(guó)軍例如:有一批糖果,從中隨機(jī)的取16袋,稱得重量如下:得到mu2.常見的幾種分布數(shù)據(jù)的點(diǎn)估計(jì)和區(qū)間估計(jì)的matlab命令格式1.均勻分布:[ahat,bhat,aci,bci]=unifit(x,alpha),在顯著性水平alpha下,求均勻分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).2.指數(shù)分布:[muhat,muci,]=expfit(x,alpha)在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).3.正態(tài)分布:[mu,sigma,muci,sigmaci]=normfit(x,alpha),在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).12/23/2022110數(shù)理系袁國(guó)軍2.常見的幾種分布數(shù)據(jù)的點(diǎn)估計(jì)和區(qū)間估計(jì)1.均勻分布:[ah4.泊松分布:[lambdahat,lambdaci]=poissfit(x,alpha)在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).5.二項(xiàng)分布:[phat,pci]=binofit(x,n,alpha)在顯著性水平alpha下,求正態(tài)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).其中x是樣本數(shù)組,alpha是顯著性水平,輸出有關(guān)參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)。12/23/2022111數(shù)理系袁國(guó)軍4.泊松分布:[lambdahat,lambdaci]=po例如假設(shè)下面的數(shù)據(jù)近似服從泊松分布,請(qǐng)求出分布的參數(shù)及0.95的置信區(qū)間。106533105357386575855x=[6106533105357386575855];[muhat,muci]=poissfit(x,0.05)12/23/2022112數(shù)理系袁國(guó)軍例如假設(shè)下面的數(shù)據(jù)近似服從泊松分布,請(qǐng)求出分布12/20/練習(xí):某校60名學(xué)生的一次考試成績(jī)?nèi)缦?9375839391858482777677959489918886839681799778756769688483817566857094848382807874737670867690897166867380947978776353551)計(jì)算均值、標(biāo)準(zhǔn)差、極差、偏度、峰度,畫出直方圖;2)若成績(jī)近似服從正態(tài)分布,估計(jì)正態(tài)分布的參數(shù).12/23/2022113數(shù)理系袁國(guó)軍練習(xí):某校60名學(xué)生的一次考試成績(jī)?nèi)缦?1)計(jì)算均值、標(biāo)準(zhǔn)差1.參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類型已知,這時(shí)構(gòu)造出的統(tǒng)計(jì)量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn).參數(shù)檢驗(yàn)的目的往往是對(duì)總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷.

對(duì)總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).2.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對(duì)某個(gè)參數(shù)作出明確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計(jì)量的分布函數(shù)不依賴于觀測(cè)值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn).如要求判斷總體分布類型的檢驗(yàn)就是非參數(shù)檢驗(yàn).假設(shè)檢驗(yàn)12/23/2022114數(shù)理系袁國(guó)軍1.參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類型已知,這時(shí)構(gòu)造出的假設(shè)檢驗(yàn)的一般步驟是:12/23/2022115數(shù)理系袁國(guó)軍假設(shè)檢驗(yàn)的一般步驟是:12/20/202231數(shù)理系袁國(guó)(一)單個(gè)正態(tài)總體均值檢驗(yàn)一、參數(shù)檢驗(yàn)12/23/2022116數(shù)理系袁國(guó)軍(一)單個(gè)正態(tài)總體均值檢驗(yàn)一、參數(shù)檢驗(yàn)12/20/2022312/23/2022117數(shù)理系袁國(guó)軍12/20/202233數(shù)理系袁國(guó)軍(二)單個(gè)正態(tài)總體方差檢驗(yàn)12/23/2022118數(shù)理系袁國(guó)軍(二)單個(gè)正態(tài)總體方差檢驗(yàn)12/20/202234數(shù)理系(三)兩個(gè)正態(tài)總體均值檢驗(yàn)12/23/2022119數(shù)理系袁國(guó)軍(三)兩個(gè)正態(tài)總體均值檢驗(yàn)12/20/202235數(shù)理系(四)兩個(gè)正態(tài)總體方差檢驗(yàn)12/23/2022120數(shù)理系袁國(guó)軍(四)兩個(gè)正態(tài)總體方差檢驗(yàn)12/20/202236數(shù)理系二、非參數(shù)檢驗(yàn)前面討論的是分布已知時(shí)的參數(shù)假設(shè)檢驗(yàn)問題,稱為參數(shù)假設(shè)檢驗(yàn)。一般說來,在進(jìn)行參數(shù)假設(shè)檢驗(yàn)之前,要對(duì)總體的分布進(jìn)行推斷,即為總體分布的擬合檢驗(yàn)問題,它屬于非參數(shù)檢驗(yàn)。已知總體X的樣本分布函數(shù)Fn(x),若選用某個(gè)分布函數(shù)F0(x)去擬合,則無論選擇,F(xiàn)0(x)與Fn(x)之間總會(huì)存在差異。這些差異是由于試驗(yàn)的有限性而導(dǎo)致的隨機(jī)性產(chǎn)生的呢,還是所選擇的分布函數(shù)F0(x)與樣本函數(shù)Fn(x之間存在實(shí)質(zhì)性差異而產(chǎn)生的呢?12/23/2022121數(shù)理系袁國(guó)軍二、非參數(shù)檢驗(yàn)前面討論的是分布已知時(shí)的參數(shù)假設(shè)檢驗(yàn)此種方法主要是通過各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)差異性的大小來推斷經(jīng)驗(yàn)分布是否服從任何一個(gè)預(yù)先給定的理論分布。其理論依據(jù)就是用各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)的差異構(gòu)造一個(gè)服從分布的統(tǒng)計(jì)量,并用次統(tǒng)計(jì)量來進(jìn)行假設(shè)檢驗(yàn)。使用此法時(shí)要求樣本容量較大,并且在進(jìn)行分組時(shí),每組的理論頻數(shù)不小于5。具體的內(nèi)容請(qǐng)參見有關(guān)概率論與數(shù)理統(tǒng)計(jì)教材12/23/2022122數(shù)理系袁國(guó)軍此種方法主要是通過各組試驗(yàn)數(shù)據(jù)頻數(shù)與理論頻數(shù)差異性的大小12概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多,以正態(tài)概率紙最為常見。正態(tài)概率紙的橫坐標(biāo)是均勻刻度,縱坐標(biāo)是按正態(tài)分布律刻度,表示概率。(二)概率紙檢驗(yàn)法12/23/2022123數(shù)理系袁國(guó)軍概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計(jì)量3.常見概率分布的函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計(jì)6.假設(shè)檢驗(yàn)7.綜合實(shí)例12/23/2022124數(shù)理系袁國(guó)軍統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令12/23/2022125數(shù)理系袁國(guó)軍一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會(huì)1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4];y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0];3、將變量t、x、y的數(shù)據(jù)保存在文件data中。savedatatxy

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論