matlab第8章數(shù)據(jù)分析_第1頁
matlab第8章數(shù)據(jù)分析_第2頁
matlab第8章數(shù)據(jù)分析_第3頁
matlab第8章數(shù)據(jù)分析_第4頁
matlab第8章數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第8章數(shù)據(jù)分析

8.1數(shù)據(jù)的讀入和預(yù)處理

8.2統(tǒng)計(jì)數(shù)據(jù)分析

8.3數(shù)據(jù)的曲線擬合

8.4數(shù)據(jù)插值

8.5綜合實(shí)例

8.1數(shù)據(jù)的讀入和預(yù)處理

8.1.1利用函數(shù)讀取數(shù)據(jù)MATLAB提供了在主窗口(命令窗口、編輯窗口等)直接輸入和利用xlsread、textread等函數(shù)直接讀取數(shù)據(jù)等方式。由于大部分?jǐn)?shù)據(jù)來自各種機(jī)構(gòu)提供的數(shù)據(jù)庫,這些數(shù)據(jù)庫數(shù)據(jù)的輸出大多會(huì)支持Excel和文本文件(txt)的輸出格式。因此本節(jié)介紹如何利用MATLAB提供的xlsread和textread函數(shù)來讀取*.xls和*.txt數(shù)據(jù)文件。首頁

1.Excel數(shù)據(jù)文件的讀取格式num=xlsread('filename')[num,txt,raw]=xlsread('filename')[num,txt,raw]=xlsread('filename',sheet,range)說明filename:Excel文件名(*.xls);sheet:工作表名,可用字符串名稱或直接用數(shù)字表示;range:單元格區(qū)域;num:返回xls中的數(shù)值型數(shù)據(jù);txt:返回xls中的文本(字符串),raw:返回未處理的形式(字符串)。首頁【例8-1】建立2012年6月4日至6月15日上證指數(shù)文件名為shzhindex.xls的Excel文件,如圖8-1所示,并將此文件存放在MATLAB自動(dòng)搜索文件夾下,比如:C:\ProgramFiles\MATLAB\R2012a\bin\shzhindex.xls。

圖8-1上證指數(shù)Excel數(shù)據(jù)表(一)(1)在MATLAB命令窗口輸入:>>num=xlsread('shzhindex')num'=%顯示num的轉(zhuǎn)置num1'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.2998(2)若在Excel文件shzhindex中打開sheet2表(屬于第2張表),如圖8-2所示。圖8-2上證指數(shù)Excel數(shù)據(jù)表(二)由于sheet2表排在第2張表的位置,所以輸入命令:>>[num,txt,raw]=xlsread('shzhindex',2)num=1.0e+03*2.34702.30862.31372.31192.31562.30962.32472.29312.30622.28152.28292.30592.29512.28982.28972.31892.30682.29592.29982.3068首頁txt='日期''開盤價(jià)''收盤價(jià)''2012-6-4''''''2012-6-5''''''2012-6-6''''''2012-6-7''''''2012-6-8''''''2012-6-11''''''2012-6-12''''''2012-6-13''''''2012-6-14''''''2012-6-15'''''raw='日期''開盤價(jià)''收盤價(jià)''2012-6-4'[2.3470e+03][2.3086e+03]'2012-6-5'[2.3137e+03][2.3119e+03]'2012-6-6'[2.3156e+03][2.3096e+03]'2012-6-7'[2.3247e+03][2.2931e+03]'2012-6-8'[2.3062e+03][2.2814e+03]'2012-6-11'[2.2829e+03][2.3059e+03]'2012-6-12'[2.2951e+03][2.2898e+03]'2012-6-13'[2.2897e+03][2.3189e+03]'2012-6-14'[2.3068e+03][2.2959e+03]'2012-6-15'[2.2998e+03][2.3068e+03]首頁(3)若只選取數(shù)值,可輸入命令:>>num=xlsread('shzhindex',2,'B2:C11')num=1.0e+03*2.34702.30862.31372.31192.31562.30962.32472.29312.30622.28152.28292.30592.29512.28982.28972.31892.30682.29592.29982.3068(4)如果Excel表中某張表的名字給定,如將圖8-1中的“Sheet1”改為名稱“Index”,如圖8-3所示,則可直接運(yùn)行命令:首頁圖8-3上證指數(shù)Excel數(shù)據(jù)表(三)>>[num,txt]=xlsread('shzhindex','Index')num’=%這里顯示num的轉(zhuǎn)置num1'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.2998txt’=%這里顯示txt的轉(zhuǎn)置txt''2012-6-4''2012-6-5''2012-6-6''2012-6-7''2012-6-8''2012-6-11''2012-6-12''2012-6-13''2012-6-14''2012-6-15'格式[A,B,C,…]=textread(filename,format)

[A,B,C,…]=textread(filename,format,N)

[A,B,C,…]=textread(filename,format,'param',value,…)說明filename:文件名(*.txt);format:每行要讀取數(shù)據(jù)類型的格式;

N:每N行具有相同格式的數(shù)據(jù)。

“'param',value”:表示輸入變量的屬性和屬性值,如'delimiter'指出分隔符,讀數(shù)據(jù)的時(shí)候會(huì)自動(dòng)跳過分隔符;“'headerlines',1”表示文件的第一行為標(biāo)題,不需要讀入。

“A,B,C,…”:從文件中讀取到的數(shù)據(jù),且變量組[A,B,C,…]的個(gè)數(shù)必須和format中定義的個(gè)數(shù)相同。首頁2.文本數(shù)據(jù)文件的讀取【例8-2】建立上證指數(shù)數(shù)據(jù)的文本文件shzhzhishu.txt,如圖8-4所示,該數(shù)據(jù)文件包含5列的數(shù)據(jù),分別為日期、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià),數(shù)據(jù)包含了2012年6月4日至6月15日綜合指數(shù)行情。并將此文本文件存放在:C:\ProgramFiles\MATLAB\R2012a\bin\shzhzhishu.txt。首頁圖8-4上證指數(shù)文本數(shù)據(jù)(一)在MATLAB命令窗口下輸入以下命令:>>[A,B,C,D,E]=textread('shzhzhishu.txt','%s%f%f%f%f','headerlines',1)其中,輸出變量A、B、C、D、E分別表示日期、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)的列向量。A為表示時(shí)間的字符型變量,其對應(yīng)的控制格式為%s,表示以字符型方式讀入變量;B、C、D、E對應(yīng)的是數(shù)值型變量,都有格式%f控制,表示以浮點(diǎn)數(shù)值型方式讀入變量;'headerlines',1表示文件的第一行為標(biāo)題,不需要讀入。首頁注意:文件名的后綴“.txt”不能省略,否則MATLAB會(huì)給出不能找到該文件的提醒。這樣就將數(shù)組A、B保存在文件名為xyz的數(shù)據(jù)文件,即xyz.mat文件。

運(yùn)行結(jié)果如下(只寫出A、B兩項(xiàng),其余略):A'=%這里顯示A的轉(zhuǎn)置A''2012-6-4''2012-6-5''2012-6-6''2012-6-7''2012-6-8''2012-6-11''2012-6-12''2012-6-13''2012-6-14''2012-6-15'B'=%這里顯示B的轉(zhuǎn)置B'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.29988.1.2利用菜單導(dǎo)入數(shù)據(jù)首頁1.Excel數(shù)據(jù)文件的導(dǎo)入(1)打開MATLAB主界面中的菜單“File”,在下拉菜單中點(diǎn)擊“ImportData”,顯示的界面如圖8-5所示。圖8-5Excel導(dǎo)入界面(一)(2)選擇所要讀入的Excel文件,譬如我們選擇shzhindex文件(即圖8-3數(shù)據(jù)),點(diǎn)擊【打開】,顯示的界面如圖8-6所示。圖8-6Excel導(dǎo)入界面(二)(3)在圖8-6中,“Importas”選項(xiàng)欄中提供了“Matrix”(矩陣式數(shù)值型數(shù)據(jù))、“Columnvectors”(列向量數(shù)值型數(shù)據(jù))和“CellArray”(單元數(shù)組數(shù)據(jù))三種數(shù)據(jù)形式。首頁若我們直接選擇“Matrix”,點(diǎn)擊“Import”選項(xiàng),從彈出的菜單中選擇“ImportData”,則將數(shù)據(jù)結(jié)果導(dǎo)入工作空間Workspace中,默認(rèn)名稱為“untitled”,只要在命令窗口輸入untitled,即可顯示出所要導(dǎo)入的數(shù)據(jù)。例如:>>untitleduntitled=1.0e+05*7.35020.02357.35030.02317.35030.02327.35030.02327.35030.02317.35030.02287.35030.02307.35030.02297.35030.02317.35030.0230若我們選擇【CellArray】,則對應(yīng)的結(jié)果如圖8-7所示。首頁圖8-7Excel導(dǎo)入界面(三)點(diǎn)擊“Import”,從彈出的菜單中選擇“ImportData”,則將數(shù)據(jù)結(jié)果導(dǎo)入工作空間Workspace中,默認(rèn)名稱也為“untitled”,只要在命令窗口輸入untitled,即可顯示出所要導(dǎo)入的數(shù)據(jù)。例如:首頁>>untitleduntitled='2012-6-4'[2.3470e+03]'2012-6-5'[2.3137e+03]'2012-6-6'[2.3156e+03]'2012-6-7'[2.3247e+03]'2012-6-8'[2.3062e+03]'2012-6-11'[2.2829e+03]'2012-6-12'[2.2951e+03]'2012-6-13'[2.2897e+03]'2012-6-14'[2.3068e+03]'2012-6-15'[2.2998e+03](4)為了保存數(shù)據(jù),我們可將默認(rèn)文件名“untitled”重新命名,只需將鼠標(biāo)移到Workspace中untitled處,點(diǎn)擊右鍵彈出活動(dòng)菜單,選中“Rename”項(xiàng),點(diǎn)擊左鍵即可輸入新的名稱,譬如鍵入“shuju”,即將數(shù)據(jù)保存在文件shuju中。若直接雙擊shuju,其數(shù)值可顯示在如圖8-8所示的表格中。圖8-8Excel導(dǎo)入界面(四)2.文本數(shù)據(jù)文件的導(dǎo)入(1)先將【例8-2】文本文件shzhzhishu中的“日期”格式改寫為如圖8-9所示的形式(數(shù)值型),改寫后的數(shù)據(jù)保存為shzhzhishu2文件。圖8-9文本數(shù)據(jù)導(dǎo)入(一)(2)打開MATLAB主界面中的菜單“File”,在下拉菜單中點(diǎn)擊“ImportData”,選擇文本“shzhzhishu2“文件,點(diǎn)擊“打開”,出現(xiàn)如圖8-10所示的界面。圖8-10文本數(shù)據(jù)導(dǎo)入(二)(3)圖8-10將所要導(dǎo)入的內(nèi)容全部顯示出來,其中data顯示的是全部數(shù)字?jǐn)?shù)據(jù),再點(diǎn)擊“Next”,即得界面如圖8-11所示。圖8-11文本數(shù)據(jù)導(dǎo)入(三)(4)圖8-11中的data即為所要導(dǎo)入的數(shù)據(jù),點(diǎn)擊“Finish”按鈕,則數(shù)據(jù)結(jié)果導(dǎo)入工作空間Workspace中,只要在命令窗口輸入data,即可顯示出所要導(dǎo)入的數(shù)據(jù)。例如:>>datadata=1.0e+07*2.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.0002或直接雙擊Workspace中的data,即可顯示如圖8-12的數(shù)據(jù)表。圖8-12文本數(shù)據(jù)導(dǎo)入(四)8.1.3非數(shù)值數(shù)據(jù)處理1.含非數(shù)值(NaN)的計(jì)算在MATLAB中遇到超出范圍的數(shù)據(jù)時(shí)均用NaN(非數(shù)值)表示,而且在任何運(yùn)算中,只要包含NaN,就將它傳遞到結(jié)果中。

【例8-3】給出一個(gè)含非數(shù)值的矩陣,求其每一列的和。首頁

>>A=[3579;2468;101112NaN]>>S=sum(A)S=152025NaN(2)在矩陣X中刪除NaN所在的列,可執(zhí)行命令:X(:,any(isnan(X)))=[]例如,在【例8-3】中對矩陣A輸入命令:>>A(:,any(isnan(A)))=[]A=357246101112首頁(3)在矩陣X中刪除NaN所在的行,可執(zhí)行命令:X(any(isnan(X)'),:)=[]例如,在【例8-3】中對矩陣A輸入命令:>>A(any(isnan(A)'),:)=[]A=35792468經(jīng)過這種預(yù)處理后的數(shù)據(jù),可進(jìn)行各種分析和統(tǒng)計(jì)操作。8.2統(tǒng)計(jì)數(shù)據(jù)分析

8.2.1基本統(tǒng)計(jì)量函數(shù)1.算術(shù)平均值或樣本均值格式mean(X)%X為向量,返回X中各元素的平均值;X為矩陣,返回X中各列元素的平均值構(gòu)成的向量2.中值(中位數(shù))格式median(X)%X為向量,返回X中各元素的中位數(shù);X為矩陣,返回X中各列元素的中位數(shù)構(gòu)成的向量3.幾何平均值格式geomean(X)%X為向量,返回X中各元素的幾何平均值;X為矩陣,返回X中各列元素的幾何平均值構(gòu)成的向量4.調(diào)和平均值格式harmmean(X)%X為向量,返回X中各元素的調(diào)和平均值;X為矩陣,返回X中各列元素的調(diào)和平均值構(gòu)成的向量5.樣本方差格式var(X)%若X為向量,則返回向量X的樣本方差;X為矩陣,則返回X的列向量的樣本方差構(gòu)成的向量首頁首頁6.樣本標(biāo)準(zhǔn)差格式std(X)%若X為向量,則返回向量X的標(biāo)準(zhǔn)差;X為矩陣,則返回X的列向量的標(biāo)準(zhǔn)差構(gòu)成的向量例如:用X表示從1到99的數(shù)字組成的向量:>>X=1:99;>>mean(X)ans=50>>median(X)ans=50>>geomean(X)ans=37.6231>>harmmean(X)ans=19.1216>>var(X)ans=825>>std(X)ans=28.72287.平均絕對差格式mad(X)%若X為向量,則返回向量X與其算術(shù)均值的平均絕對偏差,即用mean(abs(X-mean(X)))計(jì)算,與

mad(X,0)命令相同mad(X,1)%若X為向量,則返回向量X與其中值的平均絕對偏差,即用median(abs(X-median(X)))計(jì)算例如:>>X=[326514367];>>Y1=mad(X)Y1=1.6790>>Y2=mad(X,1)Y2=28.k階中心距格式moment(X,k)%若X為向量,則返回向量X的k階中心距;X為矩陣,則返回%X的列向量的k階中心距構(gòu)成的向量9.樣本偏斜度格式skewness(X)%X為向量,返回X的元素的偏斜度;X為矩陣,返回X各列元素的偏斜度構(gòu)成的向量skewness(X,flag)%flag=0表示偏斜糾正,flag=1(默認(rèn))表示偏斜不糾正10.樣本峰度格式kurtosis(X)%X為向量,返回X的元素的峰度;X為矩陣,返回X各列元素的峰度構(gòu)成的向量kewness(X,flag)%flag=0表示峰度糾正,flag=1(默認(rèn))表示峰度不糾正例如,在【例8-2】中用B表示開盤價(jià)數(shù)據(jù)(見圖8-4),則有>>B=[2346.982313.742315.562324.672306.222282.892295.072289.712306.782299.78]';>>moment(B,1)ans=0>>moment(B,2)ans=309.1681>>skewness(B)ans=0.7084>>skewness(B,0)ans=0.840011.協(xié)方差格式cov(X,Y)%返回向量X、Y的協(xié)方差,X、Y為等長列向量

cov(A)%返回矩陣A的協(xié)方差矩陣,其中對角線元素是A的各列的方差12.相關(guān)系數(shù)格式corrcoef(X,Y)%返回列向量X與Y的相關(guān)系數(shù),等同于corrcoef([XY])corrcoef(A)%返回矩陣A的列向量的相關(guān)系數(shù)矩陣>>kurtosis(B)ans=3.0448>>kurtosis(B,0)ans=4.043413.最值及其所在的位置格式[Y,U]=max(X)%如果X是向量,返回向量X的最大值Y、最大值Y所在的%位置序號(hào)U;如果X是矩陣,則Y向量記錄矩陣X的每列最大值,U向量記錄每列最大值的行號(hào)[Y,U]=min(X)%同max(X),只是將注釋中的最大值全部換為最小值14.極差格式range(X)%X為向量,返回X中的最大值與最小值之差;X為矩陣,返回X中各列元素的最大值與最小值之差15.徑向距離格式iqr(X)%X為向量,返回X中的第75%與第25%之間的距離;X為矩陣,返回X中各列元素的第75%與第25%

之間的距離16.百分位數(shù)格式prctile(X,p)%X為向量,計(jì)算X中數(shù)據(jù)大于p%的值,p的取值范圍為[0,100],返回X中p百分位數(shù);X

為矩陣,返回各列元素的p百分位數(shù)>>X=1:25;>>prctile(X,[255075])ans=6.750013.000019.250017.忽略丟失數(shù)據(jù)的計(jì)算格式nanmean(X)%忽略X中丟失數(shù)據(jù)的均值nanmedian(X)%忽略X中丟失數(shù)據(jù)的中值nanmax(X)%忽略X中丟失數(shù)據(jù)的最大值nanmin(X)%忽略X中丟失數(shù)據(jù)的最小值nansum(X)%忽略X中丟失數(shù)據(jù)的和18.期望及方差由分布律計(jì)算期望和方差:若已知離散型隨機(jī)變量X的分布律,則期望公式為,故求期望和方差的命令分別為:EX=sum(X.*P),DX=sum((X-EX).^2.*P)其中X表示離散取值向量,P為其對應(yīng)的概率向量。19.差分格式Y(jié)=diff(X)%如果X是一個(gè)向量,則返回[X(2)-X(1)X(3)-X(2)...X(n)-X(n-1)];如果X是一個(gè)矩陣則返回

[X(2:m,:)-X(1:m-1,:)]Y=diff(X,k)%返回k階差分,例如diff(X,2),與語句

diff(diff(X))效果相同例如:>>X=1:2:20X=135791113151719>>Y=diff(X)Y=222222222>>Y=diff(X,2)Y=000000008.2.2概率分布函數(shù)Matlab統(tǒng)計(jì)工具箱包含的概率分布及其命令字符有:正態(tài)分布:norm;對數(shù)正態(tài)分布:logn;泊松分布:poiss;指數(shù)分布:exp;連續(xù)均勻分布:unif;離散均勻分布:unid;β分布:beta;二項(xiàng)分布:bino;幾何分布:geo;超幾何分布:hyge;韋伯分布:wbl(weib);瑞利分布:rayl;F分布:f;T分布:t;分布:gam;卡方分布:chi2。對每一種分布都提供五類函數(shù),其命令字符為:概率密度函數(shù):pdf;概率分布函數(shù):cdf;逆概率分布函數(shù):inv;均值與方差:stat;隨機(jī)數(shù)生成:rnd。當(dāng)需要一種分布的某一類函數(shù)時(shí),只需將分布命令字符與函數(shù)命令字符連接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可。1.概率密度函數(shù)格式normpdf(x,mu,sigma)%計(jì)算參數(shù)為μ=mu,σ=sigma的正態(tài)分布密度函數(shù)在x的值,當(dāng)mu=0,sigma=1時(shí)可缺省binopdf(k,n,p)%參數(shù)為n、p,事件發(fā)生k次的二項(xiàng)分布的概率密度函數(shù)值poisspdf(k,Lambda)%參數(shù)為Lambda的泊松分布的概率密度函數(shù)值unifpdf(x,a,b)%[a,b]上均勻分布(連續(xù))概率密度在X=x處的函數(shù)值2.分布函數(shù)格式normcdf(x,mu,sigma)%參數(shù)為mu,sigma的正態(tài)分布的分布函數(shù)

F(x)=P{X≤x}expcdf(x,Lambda)%參數(shù)為Lambda的指數(shù)分布的分布函數(shù)F(x)=P{X≤x}chi2cdf(x,n)%自由度為n的卡方分布的分布函數(shù)F(x)=P{X≤x}tcdf(x,n)%自由度為n的t分布的分布函數(shù)F(x)=P{X≤x}fcdf(x,n1,n2)%第一自由度為n1,第二自由度為n2的F分布的分布函數(shù)3.逆分布函數(shù)MATLAB中的逆累積分布函數(shù)是已知,求x。格式x=norminv(p,mu,sigma)%p為概率值,mu為均值,sigma

為標(biāo)準(zhǔn)差,x為臨界值,滿足:

p=P{X≤x}x=betainv(p,a,b)%分布逆分布函數(shù)x=weibinv(p,a,b)%韋伯分布逆分布函數(shù)例如:>>x=norminv(0.8,0,1)x=0.8416>>x=betainv(0.8,6,7)x=0.57794.均值與方差格式[M,V]=normstat(mu,sigma)%返回參數(shù)為mu和sigma的正態(tài)分布均值和方差[M,V]=poisstat(Lambda)%返回參數(shù)為Lambda的泊松分布的均值和方差[M,V]=expstat(Lambda)%返回參數(shù)為Lambda的指數(shù)分布的均值和方差[M,V]=fstat(n1,n2)%返回自由度為n1、n2的f分布的均值M和方差V例如:>>[M,V]=poisstat(8)M=8V=8>>[M,V]=fstat(4,6)M=1.5000V=4.5000

5.隨機(jī)數(shù)生成格式unifrnd(A,B,m,n)%產(chǎn)生[A,B]上m行n列均勻分布(連續(xù))隨機(jī)數(shù)unidrnd(N,m,n)%產(chǎn)生[1,N]上m行n列均勻分布(離散)隨機(jī)數(shù)binornd(N,P,m,n)%產(chǎn)生參數(shù)為N、P的二項(xiàng)分布m×n隨機(jī)數(shù)矩陣normrnd(mu,sigma,m,n)%參數(shù)為mu,sigma的正態(tài)分布m×n隨機(jī)數(shù)矩陣lognrnd(mu,sigma,m,n)%參數(shù)為mu,sigma的對數(shù)正態(tài)分布m×n隨機(jī)數(shù)矩陣exprnd(Lambda,m,n)%參數(shù)為Lambda的指數(shù)分布m×n隨機(jī)數(shù)矩陣poissrnd(Lambda,m,n)%參數(shù)為Lambda的泊松分布m×n隨機(jī)數(shù)矩陣betarnd(a,b,m,n)%參數(shù)為a,b的β分布m×n隨機(jī)數(shù)矩陣gamrnd(a,b,m,n)%參數(shù)為a,b的分布m×n隨機(jī)數(shù)矩陣geornd(p,m,n)%參數(shù)為p的幾何分布m×n隨機(jī)數(shù)矩陣hygernd(A,B,C,m,n)%參數(shù)為A,B,C的超幾何分布m×n隨機(jī)數(shù)矩陣wblrnd(A,B,m,n)%參數(shù)為A,B的weibull分布m×n隨機(jī)數(shù)矩陣raylrnd(B,m,n)%參數(shù)為B的瑞利分布m×n隨機(jī)數(shù)矩陣也可用下面命令生成隨機(jī)數(shù):格式rand(n)%生成n×n隨機(jī)矩陣,其元素在(0,1)內(nèi)均勻分布rand(m,n)%生成m×n隨機(jī)矩陣rand(size(A))%生成與矩陣A相同大小的隨機(jī)矩陣randn(n)%生成n×n階N(0,1)正態(tài)分布隨機(jī)矩陣randn(m,n)%生成m×n正態(tài)分布隨機(jī)矩陣randn(size(A))%生成與矩陣A相同大小的正態(tài)分布隨機(jī)矩陣8.2.3統(tǒng)計(jì)作圖1.盒狀圖盒狀圖用于描述數(shù)據(jù)樣本,或比較不同樣本的均值。格式boxplot(X)%繪制單個(gè)樣本X的盒狀圖boxplot(X,notch)%notch=1,顯示有凹口的盒狀圖notch=0,顯示一個(gè)矩形盒狀圖boxplot(X,notch,’sym’)%sym是繪圖符號(hào)標(biāo)志boxplot(X,notch,’sym’,vert)%vert=1,顯示垂直盒狀圖(默認(rèn)值)

vert=0,顯示水平盒狀圖例如,生成三個(gè)列向量的正態(tài)分布隨機(jī)數(shù),并組成一個(gè)矩陣X:>>x1=normrnd(0,1,600,1);>>x2=normrnd(1,2,600,1);>>x3=normrnd(2,1,600,1);>>X=[x1x2x3];>>boxplot(X,1)%生成帶凹口的垂直盒狀圖運(yùn)行結(jié)果如圖8-13所示。圖8-13帶凹口的垂直盒狀圖>>boxplot(X,1,'*',0)%生成帶凹口的水平盒狀圖運(yùn)行結(jié)果如圖8-14所示。8-14帶凹口的水平盒狀圖注:盒的上下邊界線對應(yīng)樣本的第25個(gè)和75個(gè)百分點(diǎn)處;盒中間的直線是樣本的中值,如果中值不在盒的中間,表明存在傾斜度;盒的凹口是樣本中值置信區(qū)間的圖形化表示。2.頻數(shù)直方圖(1)正整數(shù)的頻率表格式tabulate(X)%X為正整數(shù)構(gòu)成的向量,返回3列:第1列中包含X的值,第

2列為這些值的個(gè)數(shù),第3列為這些值的頻率。例如:>>X=[13564331653423426134];>>tabulate(X)運(yùn)行結(jié)果如下:

ValueCountPercent1315.00%2210.00%3630.00%4420.00%5210.00%6315.00%(2)頻數(shù)直方圖的命令格式hist(X,k)%畫出將區(qū)間[min(X),max(X)]分為k(缺省為10)個(gè)小區(qū)間的直方圖例如:>>X=randn(1,1000);>>hist(X)運(yùn)行結(jié)果如圖8-15所示。圖8-15頻數(shù)直方圖(3)附加有正態(tài)密度曲線的直方圖格式histfit(X)%X為向量,返回直方圖和正態(tài)曲線圖8-16附加正態(tài)密度曲線的直方圖例如:>>X=normrnd(6,3,1000,1);>>histfit(X)運(yùn)行結(jié)果如圖8-16所示。3.經(jīng)驗(yàn)累積分布函數(shù)圖形格式cdfplot(X)%做樣本X(向量)的累積分布函數(shù)圖形[h,stats]=cdfplot(X)%h表示曲線的環(huán)柄,stats表示樣本的一些特征圖8-17經(jīng)驗(yàn)累積分布函數(shù)圖形例如:>>X=poissrnd(10,1,100);>>[h,stats]=cdfplot(X)h=174.0044stats=min:4max:19mean:9.6700median:9std:3.5931

4.繪制正態(tài)分布概率圖形格式normplot(X)%若X為向量,則顯示正態(tài)分布概率圖形;若X為矩陣,則顯示每一列的正態(tài)分布概率圖形h=normplot(X)%返回繪圖直線的句柄說明用于圖形化檢驗(yàn)正態(tài)分布,樣本數(shù)據(jù)在圖中用“+”顯示;如果數(shù)據(jù)來自正態(tài)分布,則圖形顯示為直線,而其它分布可能在圖中產(chǎn)生彎曲。例如:>>X=normrnd(0,1,1000,1);>>normplot(X)運(yùn)行結(jié)果如圖8-18所示,,并可看出X服從正態(tài)分布。首頁圖8-18正態(tài)分布概率圖形5.繪制Weibull分布概率圖形格式weibplot(X)%若X為向量,則顯示W(wǎng)eibull分布概率圖形;若X為矩陣,則顯示每一列的正態(tài)分布概率圖形h=normplot(X)%返回繪圖直線的句柄說明用于圖形化檢驗(yàn)Weibull分布,樣本數(shù)據(jù)在圖中用“+”顯示;如果數(shù)據(jù)來自Weibull分布,則圖形顯示為直線,而其它分布可能在圖中產(chǎn)生彎曲。例如:>>X=weibrnd(2,1,200,1);>>weibplot(X)運(yùn)行結(jié)果如圖8-19所示。圖8-19Weibull分布概率圖形6.繪制Quantile-Quantile圖格式qqplot(X)%顯示X的樣本值與服從正態(tài)分布的理論數(shù)據(jù)之間的Q-Q圖。若X為正態(tài)分布向量,圖中數(shù)據(jù)點(diǎn)呈一條近似于直線qqplot(X,Y)%顯示X,Y兩個(gè)樣本值的Q-Q圖,若X,Y為來自同一分布的向量,則圖中數(shù)據(jù)點(diǎn)呈一條直線;否則為曲線關(guān)系說明顯示一個(gè)或兩個(gè)樣本的Quantile-Quantile圖,用來檢驗(yàn)一個(gè)樣本是否正態(tài)分布,或者兩個(gè)樣本是否來自于同一分布。(1)繪制正態(tài)分布的Q-Q圖。>>X=normrnd(3,2,100,1);>>qqplot(X)運(yùn)行結(jié)果如圖8-20所示,并可看出X服從正態(tài)分布。圖8-20正態(tài)分布Q-Q圖

(2)繪制均勻分布的Q-Q圖。>>X=rand(100,1);>>qqplot(X)運(yùn)行結(jié)果如圖8-21所示,并可看出X不服從正態(tài)分布。圖8-21均勻分布的Q-Q圖(3)繪制來自兩個(gè)正態(tài)分布的Q-Q圖。>>X=normrnd(0,1,100,1);>>Y=normrnd(1,2,50,1);>>qqplot(X,Y)運(yùn)行結(jié)果如圖8-22所示,并可看出X和Y服從同分布。圖8-22兩個(gè)正態(tài)分布的Q-Q圖(4)繪制來自兩個(gè)不同總體的Q-Q圖。>>X=normrnd(6,2,100,1);>>Y=weibrnd(2,1,100,1);>>qqplot(X,Y)運(yùn)行結(jié)果如圖8-23所示,并可看出X和Y不服從同分布。圖8-23兩個(gè)不同總體的Q-Q圖8.2.4參數(shù)估計(jì)

1.常用分布參數(shù)估計(jì)格式[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)說明命令在顯著性水平alpha下,估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì)。首頁例如:>>X=normrnd(0,1,80,1);>>[muhat,sigmahat,muci,sigmaci]=normfit(X)muhat=0.0076sigmahat=1.0176muci=-0.21890.2340sigmaci=0.88061.2053格式[muhat,muci]=expfit(X,alpha)說明在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì)。

2.利用mle函數(shù)進(jìn)行參數(shù)估計(jì)格式phat=mle

%返回用dist指定分布的最大似然估計(jì)值[phat,pci]=mle

%置信度為95%[phat,pci]=mle%置信度由alpha確定[phat,pci]=mle%僅用于二項(xiàng)分布,pl為試驗(yàn)次數(shù)說明dist為分布函數(shù)名,如beta(分布)、bino(二項(xiàng)分布)等,X為數(shù)據(jù)樣本,alpha為顯著水平α,為置信度。首頁例如:>>X=betarnd(3,5,1,100)>>[phat,pci]=mle('beta',X)phat=2.75774.8805pci=1.97953.49813.53596.2629>>X=binornd(10,0.7,1,30)>>[phat,pci]=mle('bino',X,0.05,10)phat=0.7033pci=0.64810.75458.2.5假設(shè)檢驗(yàn)

1.正態(tài)總體均值的檢驗(yàn)(1)單個(gè)正態(tài)總體均值的檢驗(yàn)。格式h=ztest(x,m,sigma,alpha)%方差已知,x為正態(tài)總體的樣本,

m為均值,sigma為標(biāo)準(zhǔn)差,顯著性水平為alpha(默認(rèn)值為0.05)[h,sig,ci,zval]=ztest(x,m,sigma,alpha,tail)%方差已知h=ttest(x,m,alpha)%方差未知[h,sig,ci]=ttest(x,m,alpha,tail)%方差未知說明若h=0,表示在顯著性水平alpha下,不能拒絕原假設(shè);若h=1,表示在顯著性水平alpha下,可以拒絕原假設(shè)。

sig為觀察值的概率,當(dāng)sig為小概率時(shí)則對原假設(shè)提出質(zhì)疑。ci為真正均值μ的1-alpha置信區(qū)間。zval為統(tǒng)計(jì)量的值。原假設(shè):,若tail=0,表示備擇假設(shè):(默認(rèn));tail=1,表示備擇假設(shè):;tail=-1,表示備擇假設(shè):。首頁

(2)兩個(gè)正態(tài)總體均值差的檢驗(yàn)。格式[h,sig,ci,stats]=ttest2(X,Y,alpha)%X,Y為兩個(gè)正態(tài)總體的樣本,其方差未知但相等,顯著性水平為alpha,默認(rèn)值為

0.05[h,sig,ci,stats]=ttest2(X,Y,alpha,tail)說明若h=0,表示在顯著性水平alpha下,不能拒絕原假設(shè);若h=1,表示在顯著性水平alpha下,可以拒絕原假設(shè)。

sig為當(dāng)原假設(shè)為真時(shí)觀察值的概率,當(dāng)sig為小概率時(shí)則對原假設(shè)提出質(zhì)疑。ci為真正均值μ的1-alpha置信區(qū)間。stats包含t統(tǒng)計(jì)量、自由度和標(biāo)準(zhǔn)差。原假設(shè):,(為X為期望值,為Y的期望值)若tail=0,表示備擇假設(shè):;tail=1,表示備擇假設(shè):;tail=-1,表示備擇假設(shè):。首頁2.正態(tài)分布檢驗(yàn)

(1)大樣本的Jarque-Bera測試。格式h=jbtest(X,alpha)%對輸入向量X進(jìn)行正態(tài)分布擬合優(yōu)度測試[h,p,jbstat,cv]=jbtest(X,alpha)%p為接受假設(shè)的概率值,p越接近于

0,則可以拒絕是正態(tài)分布的原假設(shè);jbstat為測試統(tǒng)計(jì)量的值,cv為是否拒絕原假設(shè)的臨界值說明h為測試結(jié)果,若h=0,則可以認(rèn)為X是服從正態(tài)分布的;若h=1,則可以否定X服從正態(tài)分布。首頁

(2)小樣本的Lilliefors測試。格式h=lillietest(X,alpha)%對輸入向量X進(jìn)行正態(tài)分布擬合優(yōu)度測試[h,p,lstat,cv]=lillietest(X,alpha)%p為接受假設(shè)的概率值,p越接近于0,則可以拒絕是正態(tài)分布的原假設(shè);lstat為測試統(tǒng)計(jì)量的值,cv為是否拒絕原假設(shè)的臨界值說明h為測試結(jié)果,若h=0,則可以認(rèn)為X是服從正態(tài)分布的;若h=1,則可以否定X服從正態(tài)分布。

3.兩個(gè)總體一致性的檢驗(yàn)——秩和檢驗(yàn)格式p=ranksum(X,Y,alpha)%X、Y為兩個(gè)總體的樣本,可以不等長[p,h]=ranksum(X,Y,alpha)[p,h,stats]=ranksum(X,Y,alpha)說明p為兩個(gè)總體樣本X和Y為一致的顯著性概率,若p接近于0,則不一致較明顯;h為檢驗(yàn)結(jié)果,h=0表示X與Y的總體差別不顯著,h=1表示X與Y的總體差別顯著;stats包括:ranksum為秩和統(tǒng)計(jì)量的值以及zval為過去計(jì)算p的正態(tài)統(tǒng)計(jì)量的值。首頁

4.兩個(gè)總體中位數(shù)相等的檢驗(yàn)——符號(hào)秩檢驗(yàn)格式p=signrank(X,Y,alpha)%X、Y為兩個(gè)總體的樣本,必須等長[p,h]=signrank(X,Y,alpha)[p,h,stats]=signrank(X,Y,alpha)說明p表兩個(gè)總體樣本X、Y的中位數(shù)相等的顯著性概率。h=0表示兩個(gè)樣本中位數(shù)之差幾乎為0,表明兩樣本總體中位數(shù)沒有顯著差異;h=1表示兩樣本總體中位數(shù)有顯著差異。

5.兩個(gè)總體中位數(shù)相等的檢驗(yàn)——符號(hào)檢驗(yàn)格式p=signtest(X,Y,alpha)%樣本X、Y等長[p,h]=signtest(X,Y,alpha)[p,h,stats]=signtest(X,Y,alpha)說明p表兩個(gè)等長樣本X、Y的中位數(shù)相等的顯著性概率。h=0表兩樣本總體中位數(shù)沒有顯著差異;h=1表兩樣本總體中位數(shù)有顯著差異。首頁例如,檢驗(yàn)兩個(gè)正態(tài)分布的樣本子樣中位數(shù)(均值)是否相等。>>X=normrnd(0,1,20,1);>>Y=normrnd(0,2,20,1);>>[p,h,stats]=signtest(X,Y,0.05)p=1h=0stats=sign:10h=0表示兩個(gè)X、Y總體沒有顯著差異。8.2.6統(tǒng)計(jì)工具窗口

1.概率密度函數(shù)的圖形用戶界面在MATLAB命令窗口執(zhí)行命令:>>disttool就可啟動(dòng)概率密度函數(shù)的圖形用戶界面,如圖8-24所示,此窗口默認(rèn)狀態(tài)顯示的圖形是正態(tài)分布的分布函數(shù)圖。首頁圖8-24默認(rèn)分布函數(shù)圖我們可以選擇分布類型“Distribution”和函數(shù)類型“Functiontype”,譬如顯示泊松分布的密度函數(shù)曲線,只要在“Distribution”處選擇“Poisson”,在“Functiontype”處選擇“PDF”,則顯示的是泊松分布的密度函數(shù)圖,如圖8-25所示。首頁圖8-25泊松分布密度函數(shù)圖2.隨機(jī)數(shù)的圖形用戶界面在命令窗口執(zhí)行命令:>>randtool即可啟動(dòng)隨機(jī)數(shù)的圖形用戶界面,如圖8-26所示,此窗口默認(rèn)狀態(tài)顯示正態(tài)分布隨機(jī)數(shù)的分布直方圖。首頁圖8-26默認(rèn)隨機(jī)數(shù)分布直方圖我們可以選擇分布類型“Distribution”和樣本數(shù)目“Samples”。譬如,顯示二項(xiàng)分布隨機(jī)數(shù)的直方圖,只要在“Distribution”處選擇“Binomial”,在“Samples”處選擇“500”,則顯示的圖形如圖8-27所示,近似服從正態(tài)分布。首頁圖8-27二項(xiàng)分布隨機(jī)數(shù)的直方圖8.3數(shù)據(jù)的曲線擬合

8.3.1多項(xiàng)式1.多項(xiàng)式的表達(dá)和創(chuàng)建(1)多項(xiàng)式的一般形式表示為:(8-1)在MATLAB中,多項(xiàng)式表示成向量的形式,x的冪次方是按降序排列的。只需將按降冪次序的多項(xiàng)式的每個(gè)系數(shù)填入向量中,就可以在MATLAB中建立一個(gè)多項(xiàng)式。故(8-1)多項(xiàng)式表成的向量為:(8-2)反之,給出的(8-2)式的向量,我們也可寫出(8-1)式的多項(xiàng)式。首頁

(2)MATLAB中用函數(shù)sym2poly將多項(xiàng)式形式轉(zhuǎn)化成向量表示法。格式p=sym2poly(f)%將多項(xiàng)式表示式f轉(zhuǎn)化為向量表達(dá)式p例如:>>symsx>>f=5*x^4-3*x^2+x-1>>p=sym2poly(f)p=50-31-1

3.多項(xiàng)式求根格式x=roots(p)%p為系數(shù)多項(xiàng)式組成的行向量,x為由根組成的列向量例如,求解多項(xiàng)式的根。>>p=[1-7240];>>x=roots(p)x=5.00004.0000-2.0000首頁4.將向量變成符號(hào)多項(xiàng)式格式f=poly2sym(p)%將系數(shù)多項(xiàng)式組成的向量p變成符號(hào)多項(xiàng)式f例如:>>p=[13021];>>f=poly2sym(p)f=x^4+3*x^3+2*x+1

5.用多項(xiàng)式的根構(gòu)造多項(xiàng)式格式p=poly(r)%r為多項(xiàng)式根組成向量,返回系數(shù)多項(xiàng)式向量p例如:>>r=[12-1];>>p=poly(r)p=1-2-12>>y=poly2sym(p)y=x^3-2*x^2-x+2首頁8.3.2多項(xiàng)式曲線擬合法1.一元多項(xiàng)式的基本形式一元多項(xiàng)式的基本形式可以表示為:其中,系數(shù)是需要擬合的未知參數(shù)。

2.多項(xiàng)式擬合的命令格式p=polyfit(x,y,n)%x、y是同維向量,n擬合多項(xiàng)式次數(shù),p

擬合系數(shù)Y=polyval(p,x)%Y是polyfit所得的擬合多項(xiàng)式在x處的預(yù)測值[p,S]=polyfit(x,y,n)%S是一結(jié)構(gòu)數(shù)組,包括R、df和normr[Y,DELTA]=polyconf(p,x,S,alpha)%預(yù)測值Y的顯著性為1-alpha的置信區(qū)間為%Y±DELTA;alpha缺省時(shí)為0.5[p,S,mu]=polyfit(x,y,n)%mu=[mean(x);std(x)],p中心化后的擬合系數(shù)[Y,DELTA]=polyconf(p,X,S,param1,val1,param2,val2,…)%預(yù)測值

param選項(xiàng)為‘a(chǎn)lpha’、‘mu’、‘predopt’、

‘simopt’

,val為其對應(yīng)的值說明結(jié)構(gòu)數(shù)組S:R是根據(jù)輸入向量x構(gòu)建范德蒙矩陣V,然后進(jìn)行QR分解,得到的上三角矩陣;df為自由度,計(jì)算公式為df=length(y)-(n+1);normr為殘差范數(shù),公式為normr=norm(y-V*p)。mu值的作用是通過xhat=(x-mu(1))/mu(2)進(jìn)行中心化和比例縮放,可以改善多項(xiàng)式及擬合算法的數(shù)值特征。首頁

【例8-4】經(jīng)測量某人從出生到成年之間的體重,得到年齡與體重的數(shù)據(jù)如表8-1所示,試建立年齡與體重之間的關(guān)系。首頁(1)MATLAB程序如下:x=[00.51368121518]';y=[3.55691418264060]';p=polyfit(x,y,3)%三次擬合Y=polyval(p,x)%計(jì)算在x處的預(yù)測值plot(x,y,'o',x,Y)xlabel('年齡')ylabel('體重')年齡(周歲)00.51368121518體重(千克)3.55691418264060表8-1年齡與體重?cái)?shù)據(jù)表運(yùn)行結(jié)果如下:p=0.0141-0.22302.58093.5313Y'=%顯示Y的轉(zhuǎn)置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234所以所建立的多項(xiàng)式模型為:其對應(yīng)擬合曲線圖如圖8-28所示。首頁圖8-28擬合曲線圖

(2)若對上述數(shù)據(jù)x、y執(zhí)行命令:>>[p,S]=polyfit(x,y,3)>>[Y,DELTA]=polyconf(p,x,S)運(yùn)行結(jié)果如下:p=0.0141-0.22302.58093.5313S=R:[4x4double]df:5normr:1.3904Y'=%顯示Y的轉(zhuǎn)置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234DELTA'=%顯示DELTA的轉(zhuǎn)置DELTA'1.93821.82971.78111.85101.89321.84831.95291.93842.2226從(2)的結(jié)果來看擬合系數(shù)p、預(yù)測值Y都與(1)的結(jié)果相同。首頁

(3)若對上述數(shù)據(jù)x、y執(zhí)行命令:>>[p,S,mu]=polyfit(x,y,3)>>[Y,DELTA]=polyconf(p,x,S,'mu',mu)運(yùn)行結(jié)果如下:p=4.17503.359510.269915.5951S=R:[4x4double]df:5normr:1.3904mu=7.05566.6635Y'=%顯示Y的轉(zhuǎn)置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234DELTA'=%顯示DELTA的轉(zhuǎn)置DELTA'1.93821.82971.78111.85101.89321.84831.95291.93842.2226從(3)的結(jié)果來看,p值與(1)、(2)的結(jié)果都不同,但預(yù)測值Y和DELTA的結(jié)果都與(1)、(2)的結(jié)果一致。若要找出預(yù)測值的置信區(qū)間,只需執(zhí)行命令A(yù)=[Y-DELTA,Y+DELTA]即可。

8.3.3多元線性回歸法

1.多元線性方程的一般形式(8-3)其中,系數(shù)是需要求的未知參數(shù)。為求方程(8-3)中的參數(shù),我們給出觀察值和y的n個(gè)樣本點(diǎn)和(),并用矩陣表示如下:首頁則得到k元線性回歸模型矩陣形式:(8-4)其中,,(為單位矩陣)。利用最小二乘法原理求出矩陣方程(8-4)的估計(jì)值,即為未知參數(shù)的值。,,,

2.多元線性回歸法的命令格式b=regress(Y,X)%確定回歸系數(shù)的點(diǎn)估計(jì)值[b,bint,r,rint,stats]=regress(Y,X,alpha)%求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)并檢驗(yàn)回歸模型Z=[ones(size(x1)),x1,x2,…,xk]*b%預(yù)測值Z=X*b%預(yù)測值說明Y=[y1,y2,…,yn]',X=[ones(size(x1)),x1,x2,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論