2021第九講基本統(tǒng)計分析推薦資料_第1頁
2021第九講基本統(tǒng)計分析推薦資料_第2頁
2021第九講基本統(tǒng)計分析推薦資料_第3頁
2021第九講基本統(tǒng)計分析推薦資料_第4頁
2021第九講基本統(tǒng)計分析推薦資料_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第九講基本(jīběn)統(tǒng)計分析第一頁,共17頁。我們利用(lìyòng)MATLAB中的函數(shù)來計算正態(tài)分布的分布函數(shù)、概率密度函數(shù)值、做出密度函數(shù)曲線、分位數(shù).在MATLAB中計算上述(shàngshù)分布函數(shù)的命令為:P=NORMCDF(x,mu,sigma)DefaultvaluesforMUandSIGMAare0and1respectively.例1已知試求:解:normcdf(3,2,0.5)=0.9772;normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.47721.計算(jìsuàn)分布函數(shù)與概率密度函數(shù)值:2.做出密度函數(shù)曲線、求分位數(shù)第二頁,共17頁。已知X的均值和標準差及概率(gàilǜ)p=P{X<x},求x的命令為:X=NORMINV(P,MU,SIGMA)例2.X~N(1,0.04),p{X<x}=0.6827求x解:x=norminv(0.6827,1,0.2)=

1.0951NORMSPEC([a,b],MU,SIGMA)用于做出隨機變量在區(qū)間[a,b]上的正態(tài)密度(mìdù)曲線例3.若X~N(2,4),作出X在[-1,3]上的曲線(qūxiàn)解:normspec([-1,3],2,2)圖形如右圖所示(圖7.1)第三頁,共17頁。二.數(shù)據(jù)(shùjù)特征設是取自總體X的一個簡單隨機樣本,在n次抽樣以后得到樣本的一組觀測值我們通過對數(shù)據(jù)的分析研究可以得到總體X的有關信息,在MATLAB中有專門的函數(shù)分析數(shù)據(jù)特征,如下表所示.位置特征MATLAB函數(shù)變異特征MATLAB函數(shù)算術平均mean極差range中位數(shù)median方差var切尾平均trimmean標準差std幾何平均geomean四分位極差iqr調(diào)和平均harmmean平均絕對偏差mad第四頁,共17頁。例4.已知數(shù)據(jù):4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851計算(jìsuàn)該數(shù)據(jù)特征.解:a=[4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851];b=a(:);%將矩陣(jǔzhèn)變成數(shù)列T=[mean(b),median(b),trimmean(b,10),geomean(b),harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)]第五頁,共17頁。位置特征計算結(jié)果變異特征計算結(jié)果算術平均600極差1069中位數(shù)599.5方差38663.03切尾平均600.64標準差196.629幾何平均559.68四分位極差243.5調(diào)和平均499.06平均絕對偏差150.86計算結(jié)果如下(rúxià):例5.已知數(shù)據(jù):1,1,1,1,1,1,100;計算(jìsuàn)其數(shù)據(jù)特征,由此你有何發(fā)現(xiàn)?解:x=[1,1,1,1,1,1,100];y=[mean(x),median(x),geomean(x),harmmean(x),trimmean(x,25);range(x),var(x),std(x),iqr(x),mad(x)]第六頁,共17頁。二者峰度都小于3屬于平闊峰.從圖7.Q1=(x(25)+x(26))/2=485.y=[42,54,60,42,1.或[n,x]=hist(data,nb),變異系數(shù)用于刻畫數(shù)據(jù)的變化大小,不同(bùtónɡ)指標的變異系數(shù)常用來計算客觀性權重.或[n,x]=hist(data,k),直方圖與概率(gàilǜ)紙檢驗函數(shù)偏度系數(shù)s等于3階中心矩與標準差的3次冪的比,用于刻畫數(shù)據(jù)分布的對稱性,當s>0時稱正偏,當s<0時稱負偏,當s接近于零時,可以認為分布是對稱的.位于(wèiyú)以外的點第九講基本(jīběn)統(tǒng)計分析P=NORMCDF(x,mu,sigma)normcdf(2,2,0.計算結(jié)果如下(rúxià):b=a(:);%將矩陣(jǔzhèn)變成數(shù)列為了直觀地了解隨機變量的分布(fēnbù)特征,如對稱性,峰值等,直方圖是廣泛使用的方法.計算結(jié)果為:y=15.14311.93071.16471991400.137.418024.245如果例5的數(shù)據(jù)全部為1,則各種(ɡèzhǒnɡ)平均值都應等于1,所有的變異特征全部為零,由于有一個異常值100,于是導致上述的一些特征受影響(不穩(wěn)?。?,但是中位數(shù)、切尾平均與四分位極差沒有改變,它們對異常值是穩(wěn)健的.三.異常(yìcháng)值的判別在探索性數(shù)據(jù)分析時,有一種(yīzhǒnɡ)判別異常值的簡單方法,首先計算數(shù)據(jù)的下、上截斷點,數(shù)據(jù)中小于下截斷點的數(shù)據(jù)為特小值,大于上截斷點的數(shù)據(jù)為特大值,二者都是異常值.1.數(shù)據(jù)的下、上截斷點第七頁,共17頁。計算上、下截斷點的公式(gōngshì)如下:其中,R為四分位極差,分別稱為下四分位數(shù)與上四分位數(shù).對于0≤p<1,和樣本容量為n的樣本其次序(cìxù)統(tǒng)計量記為:于是計算樣本的P分位數(shù)的公式為:顯然(xiǎnrán)第八頁,共17頁。例6.判別(pànbié)例4中的數(shù)據(jù)有無異常值.解:由x=sort(a(:))得到(dédào)原數(shù)據(jù)從小到大的次序統(tǒng)計量,因為np為整數(shù),故有:Q1=(x(25)+x(26))/2=485.5,Q3=(x(75)+x(76))/2=729,R=243.5于是,Q1-1.5R=120.25,Q3+1.5R=1094.25,由此可知:80,120,1153是異常值.2.位于(wèiyú)以外的點若數(shù)據(jù)服從正態(tài)分布,則稱位于以外的點

為異常點.第九頁,共17頁。四.矩統(tǒng)計(tǒngjì)量在MATLAB中給出了計算矩統(tǒng)計量、峰度、偏度和變異系數(shù)的函數(shù)命令(mìnglìng),如下表所示:名稱n階中心矩峰度系數(shù)偏度系數(shù)變異系數(shù)命令moment(x,n)kurtosis(x)Skewness(x)Std(x)./abs(mean(x))其中,x為數(shù)據(jù),n為階數(shù),若x為矩陣可得矩陣各列的矩、峰度、偏度和變異系數(shù),注意(zhùyì)計算變異系數(shù)的公式應為:Std(x)./abs(mean(x))(同維向量應該點除).偏度系數(shù)s等于3階中心矩與標準差的3次冪的比,用于刻畫數(shù)據(jù)分布的對稱性,當s>0時稱正偏,當s<0時稱負偏,當s接近于零時,可以認為分布是對稱的.峰度系數(shù)k等于4階中心矩與標準差的4次冪的比,它反映了分布曲線的陡緩程度,正態(tài)分布的峰度為3,若k>3則表明數(shù)據(jù)分布有較厚的尾部.第十頁,共17頁。變異系數(shù)用于刻畫數(shù)據(jù)的變化大小,不同(bùtónɡ)指標的變異系數(shù)常用來計算客觀性權重.例7.下表給出了15種資產(chǎn)的收益率ri(%)和風險(fēngxiǎn)損失率qi(%),計算峰度與偏度.Siri(%)qi(%)Siri(%)qi(%)S19.642S933.653.3S218.554S1036.840S349.460S1111.831S423.942S1295.5S58.11.2S133546S61439S149.45.3S740.768S151523S831.233.4第十一頁,共17頁。解:x=[9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15];y=[42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23];sx=skewness(x)=0.4624,kx=kurtosis(x)=1.8547,sy=skewness(y)=-0.4215,ky=kurtosis(y)=2.2506從計算結(jié)果可知(kězhī):收益率是正偏,而風險損失率為負偏;二者峰度都小于3屬于平闊峰.五.直方圖與概率(gàilǜ)紙檢驗函數(shù)1.直方圖:為了直觀地了解隨機變量的分布(fēnbù)特征,如對稱性,峰值等,直方圖是廣泛使用的方法.格式:hist(data,k).說明:data是原始數(shù)據(jù),該命令將區(qū)間(min(data),max(data))分成k等份,并描繪出頻數(shù)直方圖,k的缺省值為10.第十二頁,共17頁。如果需要(xūyào)事先給出小區(qū)間,則將區(qū)間的中點存放在向量nb然后用命令:[n,x]=hist(data),或[n,x]=hist(data,k),或[n,x]=hist(data,nb),其中,n返回k個小區(qū)間的頻數(shù),x返回小區(qū)間的中點.2.MATLAB中的概率(gàilǜ)紙檢驗函數(shù).格式:normplot(data)%如果數(shù)據(jù)data服從正態(tài)分布,則做出的圖形基本上都位于一條直線上.weibplot(data)%如果數(shù)據(jù)data服從威布爾分布,則做出的圖形基本上都位于一條直線上,例8.作出例4數(shù)據(jù)的直方圖,該數(shù)據(jù)服從正態(tài)分布還是(háishi)威布爾分布?第十三頁,共17頁。解:輸入(shūrù)命令hist(a(:),30)得到圖7.2從圖7.2所示的直方圖發(fā)現(xiàn)數(shù)據(jù)(shùjù)比較接近于正態(tài)分布,我們用命令normplot(a(:))進行檢驗.從圖7.3中可見數(shù)據(jù)點基本上都位于(wèiyú)直線上,故可認為該數(shù)據(jù)服從正態(tài)分布,由于已經(jīng)計算出該數(shù)據(jù)的均值為600,標準差為196.629,所以數(shù)據(jù)服從圖7.2圖7.3第十四頁,共17頁。正態(tài)分布的檢驗(jiǎnyàn):1.大樣本(yàngběn)h=jbtest(x),h=0,接受(jiēshòu)正態(tài)分布,h=1拒絕正態(tài)分布2.小樣本h=lillietest(x),h=0,接受正態(tài)分布,h=1拒絕正態(tài)分布第十五頁,共17頁。作業(yè):1.根據(jù)(gēnjù)下表計算七項指標的均值、方差、偏度與峰度表7.6各地區(qū)“三資”工業(yè)企業(yè)主要經(jīng)濟效益指標(2001年)工業(yè)增加值率總資產(chǎn)貢獻率資產(chǎn)負債率流動資產(chǎn)周轉(zhuǎn)次數(shù)成本費用全員勞動生產(chǎn)率產(chǎn)品

銷售率(次/年)利潤率(元/人/年)全國26.199.8354.871.895.857591397.64北京22.4212.2359.972.015.6313288797.94天津23.7511.1750.531.898.159734299.01河北28.808.1962.901.675.505080198.07山西34.554.7568.801.480.507291094.50內(nèi)蒙古30.528.2343.410.887.2562099100.88遼寧26.708.3250.321.915.028277996.70吉林29.4625.2952.292.6513.7516123396.52黑龍江31.946.5570.181.003.407514392.41上海26.2310.4348.391.687.0912231099.16江蘇25.0710.0657.532.055.238888397.66浙江23.8011.2555.092.006.685601697.01安徽31.659.2756.431.735.648146098.97福建26.927.2454.601.983.935581696.79江西27.539.2758.141.604.095225698.03山東29.6311.2357.062.046.236375597.36湖南33.089.4755.591.248.298028796.43第十六頁,共17頁。工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論