matlab第8章數(shù)據分析

上傳人：0*** IP屬地：湖北上傳時間：2023-02-03 格式：PPT 頁數(shù)：78 大?。?.65MB 積分：28 舉報 版權申訴

已閱讀5頁，還剩73頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第8章數(shù)據分析

8.1數(shù)據的讀入和預處理

8.2統(tǒng)計數(shù)據分析

8.3數(shù)據的曲線擬合

8.4數(shù)據插值

8.5綜合實例

8.1數(shù)據的讀入和預處理

8.1.1利用函數(shù)讀取數(shù)據MATLAB提供了在主窗口（命令窗口、編輯窗口等）直接輸入和利用xlsread、textread等函數(shù)直接讀取數(shù)據等方式。由于大部分數(shù)據來自各種機構提供的數(shù)據庫，這些數(shù)據庫數(shù)據的輸出大多會支持Excel和文本文件（txt）的輸出格式。因此本節(jié)介紹如何利用MATLAB提供的xlsread和textread函數(shù)來讀取*.xls和*.txt數(shù)據文件。首頁

1．Excel數(shù)據文件的讀取格式num=xlsread('filename')[num,txt,raw]=xlsread('filename')[num,txt,raw]=xlsread('filename',sheet,range)說明filename：Excel文件名（*.xls）；sheet：工作表名，可用字符串名稱或直接用數(shù)字表示；range：單元格區(qū)域；num：返回xls中的數(shù)值型數(shù)據；txt：返回xls中的文本（字符串），raw：返回未處理的形式（字符串）。首頁【例8-1】建立2012年6月4日至6月15日上證指數(shù)文件名為shzhindex.xls的Excel文件，如圖8-1所示，并將此文件存放在MATLAB自動搜索文件夾下，比如：C:\ProgramFiles\MATLAB\R2012a\bin\shzhindex.xls。

圖8-1上證指數(shù)Excel數(shù)據表（一）（1）在MATLAB命令窗口輸入：>>num=xlsread('shzhindex')num'=%顯示num的轉置num1'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.2998（2）若在Excel文件shzhindex中打開sheet2表（屬于第2張表），如圖8-2所示。圖8-2上證指數(shù)Excel數(shù)據表（二）由于sheet2表排在第2張表的位置，所以輸入命令：>>[num,txt,raw]=xlsread('shzhindex',2)num=1.0e+03*2.34702.30862.31372.31192.31562.30962.32472.29312.30622.28152.28292.30592.29512.28982.28972.31892.30682.29592.29982.3068首頁txt='日期''開盤價''收盤價''2012-6-4''''''2012-6-5''''''2012-6-6''''''2012-6-7''''''2012-6-8''''''2012-6-11''''''2012-6-12''''''2012-6-13''''''2012-6-14''''''2012-6-15'''''raw='日期''開盤價''收盤價''2012-6-4'[2.3470e+03][2.3086e+03]'2012-6-5'[2.3137e+03][2.3119e+03]'2012-6-6'[2.3156e+03][2.3096e+03]'2012-6-7'[2.3247e+03][2.2931e+03]'2012-6-8'[2.3062e+03][2.2814e+03]'2012-6-11'[2.2829e+03][2.3059e+03]'2012-6-12'[2.2951e+03][2.2898e+03]'2012-6-13'[2.2897e+03][2.3189e+03]'2012-6-14'[2.3068e+03][2.2959e+03]'2012-6-15'[2.2998e+03][2.3068e+03]首頁（3）若只選取數(shù)值，可輸入命令：>>num=xlsread('shzhindex',2,'B2:C11')num=1.0e+03*2.34702.30862.31372.31192.31562.30962.32472.29312.30622.28152.28292.30592.29512.28982.28972.31892.30682.29592.29982.3068（4）如果Excel表中某張表的名字給定，如將圖8-1中的“Sheet1”改為名稱“Index”，如圖8-3所示，則可直接運行命令：首頁圖8-3上證指數(shù)Excel數(shù)據表（三）>>[num,txt]=xlsread('shzhindex','Index')num’=%這里顯示num的轉置num1'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.2998txt’=%這里顯示txt的轉置txt''2012-6-4''2012-6-5''2012-6-6''2012-6-7''2012-6-8''2012-6-11''2012-6-12''2012-6-13''2012-6-14''2012-6-15'格式[A,B,C,…]=textread（filename,format）

[A,B,C,…]=textread（filename,format,N）

[A,B,C,…]=textread（filename,format,'param',value,…）說明filename：文件名（*.txt）；format：每行要讀取數(shù)據類型的格式；

N：每N行具有相同格式的數(shù)據。

“'param',value”：表示輸入變量的屬性和屬性值，如'delimiter'指出分隔符，讀數(shù)據的時候會自動跳過分隔符；“'headerlines',1”表示文件的第一行為標題，不需要讀入。

“A,B,C,…”：從文件中讀取到的數(shù)據，且變量組[A,B,C,…]的個數(shù)必須和format中定義的個數(shù)相同。首頁2．文本數(shù)據文件的讀取【例8-2】建立上證指數(shù)數(shù)據的文本文件shzhzhishu.txt，如圖8-4所示，該數(shù)據文件包含5列的數(shù)據，分別為日期、開盤價、最高價、最低價、收盤價，數(shù)據包含了2012年6月4日至6月15日綜合指數(shù)行情。并將此文本文件存放在：C:\ProgramFiles\MATLAB\R2012a\bin\shzhzhishu.txt。首頁圖8-4上證指數(shù)文本數(shù)據（一）在MATLAB命令窗口下輸入以下命令：>>[A,B,C,D,E]=textread('shzhzhishu.txt','%s%f%f%f%f','headerlines',1)其中，輸出變量A、B、C、D、E分別表示日期、開盤價、最高價、最低價、收盤價的列向量。A為表示時間的字符型變量，其對應的控制格式為%s，表示以字符型方式讀入變量；B、C、D、E對應的是數(shù)值型變量，都有格式%f控制，表示以浮點數(shù)值型方式讀入變量；'headerlines'，1表示文件的第一行為標題，不需要讀入。首頁注意：文件名的后綴“.txt”不能省略，否則MATLAB會給出不能找到該文件的提醒。這樣就將數(shù)組A、B保存在文件名為xyz的數(shù)據文件，即xyz.mat文件。

運行結果如下（只寫出A、B兩項，其余略）：A'=%這里顯示A的轉置A''2012-6-4''2012-6-5''2012-6-6''2012-6-7''2012-6-8''2012-6-11''2012-6-12''2012-6-13''2012-6-14''2012-6-15'B'=%這里顯示B的轉置B'1.0e+03*2.34702.31372.31562.32472.30622.28292.29512.28972.30682.29988.1.2利用菜單導入數(shù)據首頁1．Excel數(shù)據文件的導入（1）打開MATLAB主界面中的菜單“File”，在下拉菜單中點擊“ImportData”，顯示的界面如圖8-5所示。圖8-5Excel導入界面（一）（2）選擇所要讀入的Excel文件，譬如我們選擇shzhindex文件（即圖8-3數(shù)據），點擊【打開】，顯示的界面如圖8-6所示。圖8-6Excel導入界面（二）（3）在圖8-6中，“Importas”選項欄中提供了“Matrix”（矩陣式數(shù)值型數(shù)據）、“Columnvectors”（列向量數(shù)值型數(shù)據）和“CellArray”（單元數(shù)組數(shù)據）三種數(shù)據形式。首頁若我們直接選擇“Matrix”，點擊“Import”選項，從彈出的菜單中選擇“ImportData”，則將數(shù)據結果導入工作空間Workspace中，默認名稱為“untitled”，只要在命令窗口輸入untitled，即可顯示出所要導入的數(shù)據。例如：>>untitleduntitled=1.0e+05*7.35020.02357.35030.02317.35030.02327.35030.02327.35030.02317.35030.02287.35030.02307.35030.02297.35030.02317.35030.0230若我們選擇【CellArray】，則對應的結果如圖8-7所示。首頁圖8-7Excel導入界面（三）點擊“Import”，從彈出的菜單中選擇“ImportData”，則將數(shù)據結果導入工作空間Workspace中，默認名稱也為“untitled”，只要在命令窗口輸入untitled，即可顯示出所要導入的數(shù)據。例如：首頁>>untitleduntitled='2012-6-4'[2.3470e+03]'2012-6-5'[2.3137e+03]'2012-6-6'[2.3156e+03]'2012-6-7'[2.3247e+03]'2012-6-8'[2.3062e+03]'2012-6-11'[2.2829e+03]'2012-6-12'[2.2951e+03]'2012-6-13'[2.2897e+03]'2012-6-14'[2.3068e+03]'2012-6-15'[2.2998e+03]（4）為了保存數(shù)據，我們可將默認文件名“untitled”重新命名，只需將鼠標移到Workspace中untitled處，點擊右鍵彈出活動菜單，選中“Rename”項，點擊左鍵即可輸入新的名稱，譬如鍵入“shuju”，即將數(shù)據保存在文件shuju中。若直接雙擊shuju，其數(shù)值可顯示在如圖8-8所示的表格中。圖8-8Excel導入界面（四）2．文本數(shù)據文件的導入（1）先將【例8-2】文本文件shzhzhishu中的“日期”格式改寫為如圖8-9所示的形式（數(shù)值型），改寫后的數(shù)據保存為shzhzhishu2文件。圖8-9文本數(shù)據導入（一）（2）打開MATLAB主界面中的菜單“File”，在下拉菜單中點擊“ImportData”，選擇文本“shzhzhishu2“文件，點擊“打開”，出現(xiàn)如圖8-10所示的界面。圖8-10文本數(shù)據導入（二）（3）圖8-10將所要導入的內容全部顯示出來，其中data顯示的是全部數(shù)字數(shù)據，再點擊“Next”，即得界面如圖8-11所示。圖8-11文本數(shù)據導入（三）（4）圖8-11中的data即為所要導入的數(shù)據，點擊“Finish”按鈕，則數(shù)據結果導入工作空間Workspace中，只要在命令窗口輸入data，即可顯示出所要導入的數(shù)據。例如：>>datadata=1.0e+07*2.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.00022.01210.00020.00020.00020.0002或直接雙擊Workspace中的data，即可顯示如圖8-12的數(shù)據表。圖8-12文本數(shù)據導入（四）8.1.3非數(shù)值數(shù)據處理1．含非數(shù)值（NaN）的計算在MATLAB中遇到超出范圍的數(shù)據時均用NaN（非數(shù)值）表示，而且在任何運算中，只要包含NaN，就將它傳遞到結果中。

【例8-3】給出一個含非數(shù)值的矩陣，求其每一列的和。首頁

>>A=[3579;2468;101112NaN]>>S=sum(A)S=152025NaN（2）在矩陣X中刪除NaN所在的列，可執(zhí)行命令：X(:,any(isnan(X)))=[]例如，在【例8-3】中對矩陣A輸入命令：>>A(:,any(isnan(A)))=[]A=357246101112首頁（3）在矩陣X中刪除NaN所在的行，可執(zhí)行命令：X(any(isnan(X)'),:)=[]例如，在【例8-3】中對矩陣A輸入命令：>>A(any(isnan(A)'),:)=[]A=35792468經過這種預處理后的數(shù)據，可進行各種分析和統(tǒng)計操作。8.2統(tǒng)計數(shù)據分析

8.2.1基本統(tǒng)計量函數(shù)1．算術平均值或樣本均值格式mean(X)%X為向量，返回X中各元素的平均值；X為矩陣，返回X中各列元素的平均值構成的向量2．中值（中位數(shù)）格式median(X)%X為向量，返回X中各元素的中位數(shù)；X為矩陣，返回X中各列元素的中位數(shù)構成的向量3．幾何平均值格式geomean(X)%X為向量，返回X中各元素的幾何平均值；X為矩陣，返回X中各列元素的幾何平均值構成的向量4．調和平均值格式harmmean(X)%X為向量，返回X中各元素的調和平均值；X為矩陣，返回X中各列元素的調和平均值構成的向量5．樣本方差格式var(X)%若X為向量，則返回向量X的樣本方差；X為矩陣，則返回X的列向量的樣本方差構成的向量首頁首頁6．樣本標準差格式std(X)%若X為向量，則返回向量X的標準差；X為矩陣，則返回X的列向量的標準差構成的向量例如：用X表示從1到99的數(shù)字組成的向量：>>X=1:99;>>mean(X)ans=50>>median(X)ans=50>>geomean(X)ans=37.6231>>harmmean(X)ans=19.1216>>var(X)ans=825>>std(X)ans=28.72287．平均絕對差格式mad(X)%若X為向量，則返回向量X與其算術均值的平均絕對偏差，即用mean(abs(X-mean(X)))計算，與

mad(X,0)命令相同mad(X,1)%若X為向量，則返回向量X與其中值的平均絕對偏差，即用median(abs(X-median(X)))計算例如：>>X=[326514367];>>Y1=mad(X)Y1=1.6790>>Y2=mad(X,1)Y2=28．k階中心距格式moment(X,k)%若X為向量，則返回向量X的k階中心距；X為矩陣，則返回%X的列向量的k階中心距構成的向量9．樣本偏斜度格式skewness(X)%X為向量，返回X的元素的偏斜度；X為矩陣，返回X各列元素的偏斜度構成的向量skewness(X,flag)%flag=0表示偏斜糾正，flag=1（默認）表示偏斜不糾正10．樣本峰度格式kurtosis(X)%X為向量，返回X的元素的峰度；X為矩陣，返回X各列元素的峰度構成的向量kewness(X,flag)%flag=0表示峰度糾正，flag=1（默認）表示峰度不糾正例如，在【例8-2】中用B表示開盤價數(shù)據（見圖8-4），則有>>B=[2346.982313.742315.562324.672306.222282.892295.072289.712306.782299.78]';>>moment(B,1)ans=0>>moment(B,2)ans=309.1681>>skewness(B)ans=0.7084>>skewness(B,0)ans=0.840011．協(xié)方差格式cov(X,Y)%返回向量X、Y的協(xié)方差，X、Y為等長列向量

cov(A)%返回矩陣A的協(xié)方差矩陣，其中對角線元素是A的各列的方差12．相關系數(shù)格式corrcoef(X,Y)%返回列向量X與Y的相關系數(shù)，等同于corrcoef([XY])corrcoef(A)%返回矩陣A的列向量的相關系數(shù)矩陣>>kurtosis(B)ans=3.0448>>kurtosis(B,0)ans=4.043413．最值及其所在的位置格式[Y,U]=max(X)%如果X是向量，返回向量X的最大值Y、最大值Y所在的%位置序號U；如果X是矩陣，則Y向量記錄矩陣X的每列最大值，U向量記錄每列最大值的行號[Y,U]=min(X)%同max(X)，只是將注釋中的最大值全部換為最小值14．極差格式range(X)%X為向量，返回X中的最大值與最小值之差；X為矩陣，返回X中各列元素的最大值與最小值之差15．徑向距離格式iqr(X)%X為向量，返回X中的第75%與第25%之間的距離；X為矩陣，返回X中各列元素的第75%與第25%

之間的距離16．百分位數(shù)格式prctile(X,p)%X為向量，計算X中數(shù)據大于p%的值，p的取值范圍為[0,100]，返回X中p百分位數(shù)；X

為矩陣，返回各列元素的p百分位數(shù)>>X=1:25;>>prctile(X,[255075])ans=6.750013.000019.250017．忽略丟失數(shù)據的計算格式nanmean(X)%忽略X中丟失數(shù)據的均值nanmedian(X)%忽略X中丟失數(shù)據的中值nanmax(X)%忽略X中丟失數(shù)據的最大值nanmin(X)%忽略X中丟失數(shù)據的最小值nansum(X)%忽略X中丟失數(shù)據的和18．期望及方差由分布律計算期望和方差：若已知離散型隨機變量X的分布律，則期望公式為，故求期望和方差的命令分別為：EX=sum(X.*P)，DX=sum((X-EX).^2.*P)其中X表示離散取值向量，P為其對應的概率向量。19．差分格式Y=diff(X)%如果X是一個向量，則返回[X(2)-X(1)X(3)-X(2)...X(n)-X(n-1)]；如果X是一個矩陣則返回

[X(2:m,:)-X(1:m-1,:)]Y=diff(X,k)%返回k階差分，例如diff(X,2)，與語句

diff(diff(X))效果相同例如：>>X=1:2:20X=135791113151719>>Y=diff(X)Y=222222222>>Y=diff(X,2)Y=000000008.2.2概率分布函數(shù)Matlab統(tǒng)計工具箱包含的概率分布及其命令字符有：正態(tài)分布：norm；對數(shù)正態(tài)分布：logn；泊松分布：poiss；指數(shù)分布：exp；連續(xù)均勻分布：unif；離散均勻分布：unid；β分布：beta；二項分布：bino；幾何分布：geo；超幾何分布：hyge；韋伯分布：wbl（weib）；瑞利分布：rayl；F分布：f；T分布：t；分布：gam；卡方分布：chi2。對每一種分布都提供五類函數(shù)，其命令字符為：概率密度函數(shù)：pdf；概率分布函數(shù)：cdf；逆概率分布函數(shù)：inv；均值與方差：stat；隨機數(shù)生成：rnd。當需要一種分布的某一類函數(shù)時，只需將分布命令字符與函數(shù)命令字符連接起來，并輸入自變量（可以是標量、數(shù)組或矩陣）和參數(shù)即可。1．概率密度函數(shù)格式normpdf(x,mu,sigma)%計算參數(shù)為μ=mu，σ=sigma的正態(tài)分布密度函數(shù)在x的值，當mu=0，sigma=1時可缺省binopdf(k,n,p)%參數(shù)為n、p，事件發(fā)生k次的二項分布的概率密度函數(shù)值poisspdf(k,Lambda)%參數(shù)為Lambda的泊松分布的概率密度函數(shù)值unifpdf(x,a,b)%[a,b]上均勻分布(連續(xù))概率密度在X=x處的函數(shù)值2．分布函數(shù)格式normcdf(x,mu,sigma)%參數(shù)為mu，sigma的正態(tài)分布的分布函數(shù)

F(x)=P{X≤x}expcdf(x,Lambda)%參數(shù)為Lambda的指數(shù)分布的分布函數(shù)F(x)=P{X≤x}chi2cdf(x,n)%自由度為n的卡方分布的分布函數(shù)F(x)=P{X≤x}tcdf(x,n)%自由度為n的t分布的分布函數(shù)F(x)=P{X≤x}fcdf(x,n1,n2)%第一自由度為n1,第二自由度為n2的F分布的分布函數(shù)3．逆分布函數(shù)MATLAB中的逆累積分布函數(shù)是已知，求x。格式x=norminv(p,mu,sigma)%p為概率值，mu為均值，sigma

為標準差，x為臨界值，滿足：

p=P{X≤x}x=betainv(p,a,b)%分布逆分布函數(shù)x=weibinv(p,a,b)%韋伯分布逆分布函數(shù)例如：>>x=norminv(0.8,0,1)x=0.8416>>x=betainv(0.8,6,7)x=0.57794．均值與方差格式[M,V]=normstat(mu,sigma)%返回參數(shù)為mu和sigma的正態(tài)分布均值和方差[M,V]=poisstat(Lambda)%返回參數(shù)為Lambda的泊松分布的均值和方差[M,V]=expstat(Lambda)%返回參數(shù)為Lambda的指數(shù)分布的均值和方差[M,V]=fstat(n1,n2)%返回自由度為n1、n2的f分布的均值M和方差V例如：>>[M,V]=poisstat(8)M=8V=8>>[M,V]=fstat(4,6)M=1.5000V=4.5000

5．隨機數(shù)生成格式unifrnd(A,B,m,n)%產生[A,B]上m行n列均勻分布（連續(xù)）隨機數(shù)unidrnd(N,m,n)%產生[1,N]上m行n列均勻分布（離散）隨機數(shù)binornd(N,P,m,n)%產生參數(shù)為N、P的二項分布m×n隨機數(shù)矩陣normrnd(mu,sigma,m,n)%參數(shù)為mu，sigma的正態(tài)分布m×n隨機數(shù)矩陣lognrnd(mu,sigma,m,n)%參數(shù)為mu，sigma的對數(shù)正態(tài)分布m×n隨機數(shù)矩陣exprnd(Lambda,m,n)%參數(shù)為Lambda的指數(shù)分布m×n隨機數(shù)矩陣poissrnd(Lambda,m,n)%參數(shù)為Lambda的泊松分布m×n隨機數(shù)矩陣betarnd(a,b,m,n)%參數(shù)為a，b的β分布m×n隨機數(shù)矩陣gamrnd(a,b,m,n)%參數(shù)為a，b的分布m×n隨機數(shù)矩陣geornd(p,m,n)%參數(shù)為p的幾何分布m×n隨機數(shù)矩陣hygernd(A,B,C,m,n)%參數(shù)為A，B，C的超幾何分布m×n隨機數(shù)矩陣wblrnd(A,B,m,n)%參數(shù)為A，B的weibull分布m×n隨機數(shù)矩陣raylrnd(B,m,n)%參數(shù)為B的瑞利分布m×n隨機數(shù)矩陣也可用下面命令生成隨機數(shù)：格式rand(n)%生成n×n隨機矩陣，其元素在（0，1）內均勻分布rand(m,n)%生成m×n隨機矩陣rand(size(A))%生成與矩陣A相同大小的隨機矩陣randn(n)%生成n×n階N(0,1)正態(tài)分布隨機矩陣randn(m,n)%生成m×n正態(tài)分布隨機矩陣randn(size(A))%生成與矩陣A相同大小的正態(tài)分布隨機矩陣8.2.3統(tǒng)計作圖1．盒狀圖盒狀圖用于描述數(shù)據樣本，或比較不同樣本的均值。格式boxplot(X)%繪制單個樣本X的盒狀圖boxplot(X,notch)%notch=1，顯示有凹口的盒狀圖notch=0，顯示一個矩形盒狀圖boxplot(X,notch,’sym’)%sym是繪圖符號標志boxplot(X,notch,’sym’,vert)%vert=1，顯示垂直盒狀圖（默認值）

vert=0，顯示水平盒狀圖例如，生成三個列向量的正態(tài)分布隨機數(shù)，并組成一個矩陣X：>>x1=normrnd(0,1,600,1);>>x2=normrnd(1,2,600,1);>>x3=normrnd(2,1,600,1);>>X=[x1x2x3];>>boxplot(X,1)%生成帶凹口的垂直盒狀圖運行結果如圖8-13所示。圖8-13帶凹口的垂直盒狀圖>>boxplot(X,1,'*',0)%生成帶凹口的水平盒狀圖運行結果如圖8-14所示。8-14帶凹口的水平盒狀圖注：盒的上下邊界線對應樣本的第25個和75個百分點處；盒中間的直線是樣本的中值，如果中值不在盒的中間，表明存在傾斜度；盒的凹口是樣本中值置信區(qū)間的圖形化表示。2．頻數(shù)直方圖（1）正整數(shù)的頻率表格式tabulate(X)%X為正整數(shù)構成的向量，返回3列：第1列中包含X的值，第

2列為這些值的個數(shù)，第3列為這些值的頻率。例如：>>X=[13564331653423426134];>>tabulate(X)運行結果如下：

ValueCountPercent1315.00%2210.00%3630.00%4420.00%5210.00%6315.00%（2）頻數(shù)直方圖的命令格式hist(X,k)%畫出將區(qū)間[min(X),max(X)]分為k（缺省為10）個小區(qū)間的直方圖例如：>>X=randn(1,1000);>>hist(X)運行結果如圖8-15所示。圖8-15頻數(shù)直方圖（3）附加有正態(tài)密度曲線的直方圖格式histfit(X)%X為向量，返回直方圖和正態(tài)曲線圖8-16附加正態(tài)密度曲線的直方圖例如：>>X=normrnd(6,3,1000,1);>>histfit(X)運行結果如圖8-16所示。3．經驗累積分布函數(shù)圖形格式cdfplot(X)%做樣本X（向量）的累積分布函數(shù)圖形[h,stats]=cdfplot(X)%h表示曲線的環(huán)柄,stats表示樣本的一些特征圖8-17經驗累積分布函數(shù)圖形例如：>>X=poissrnd(10,1,100);>>[h,stats]=cdfplot(X)h=174.0044stats=min:4max:19mean:9.6700median:9std:3.5931

4．繪制正態(tài)分布概率圖形格式normplot(X)%若X為向量，則顯示正態(tài)分布概率圖形；若X為矩陣，則顯示每一列的正態(tài)分布概率圖形h=normplot(X)%返回繪圖直線的句柄說明用于圖形化檢驗正態(tài)分布，樣本數(shù)據在圖中用“+”顯示；如果數(shù)據來自正態(tài)分布，則圖形顯示為直線，而其它分布可能在圖中產生彎曲。例如：>>X=normrnd(0,1,1000,1);>>normplot(X)運行結果如圖8-18所示,，并可看出X服從正態(tài)分布。首頁圖8-18正態(tài)分布概率圖形5．繪制Weibull分布概率圖形格式weibplot(X)%若X為向量，則顯示Weibull分布概率圖形；若X為矩陣，則顯示每一列的正態(tài)分布概率圖形h=normplot(X)%返回繪圖直線的句柄說明用于圖形化檢驗Weibull分布，樣本數(shù)據在圖中用“+”顯示；如果數(shù)據來自Weibull分布，則圖形顯示為直線，而其它分布可能在圖中產生彎曲。例如：>>X=weibrnd(2,1,200,1);>>weibplot(X)運行結果如圖8-19所示。圖8-19Weibull分布概率圖形6．繪制Quantile-Quantile圖格式qqplot(X)%顯示X的樣本值與服從正態(tài)分布的理論數(shù)據之間的Q-Q圖。若X為正態(tài)分布向量，圖中數(shù)據點呈一條近似于直線qqplot(X,Y)%顯示X，Y兩個樣本值的Q-Q圖，若X，Y為來自同一分布的向量，則圖中數(shù)據點呈一條直線；否則為曲線關系說明顯示一個或兩個樣本的Quantile-Quantile圖，用來檢驗一個樣本是否正態(tài)分布，或者兩個樣本是否來自于同一分布。（1）繪制正態(tài)分布的Q-Q圖。>>X=normrnd(3,2,100,1);>>qqplot(X)運行結果如圖8-20所示，并可看出X服從正態(tài)分布。圖8-20正態(tài)分布Q-Q圖

（2）繪制均勻分布的Q-Q圖。>>X=rand(100,1);>>qqplot(X)運行結果如圖8-21所示，并可看出X不服從正態(tài)分布。圖8-21均勻分布的Q-Q圖（3）繪制來自兩個正態(tài)分布的Q-Q圖。>>X=normrnd(0,1,100,1);>>Y=normrnd(1,2,50,1);>>qqplot(X,Y)運行結果如圖8-22所示，并可看出X和Y服從同分布。圖8-22兩個正態(tài)分布的Q-Q圖（4）繪制來自兩個不同總體的Q-Q圖。>>X=normrnd(6,2,100,1);>>Y=weibrnd(2,1,100,1);>>qqplot(X,Y)運行結果如圖8-23所示，并可看出X和Y不服從同分布。圖8-23兩個不同總體的Q-Q圖8.2.4參數(shù)估計

1．常用分布參數(shù)估計格式[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)說明命令在顯著性水平alpha下，估計數(shù)據X的參數(shù)（alpha缺省時設定為0.05），返回值muhat是X的均值的點估計值，sigmahat是標準差的點估計值，muci是均值的區(qū)間估計，sigmaci是標準差的區(qū)間估計。首頁例如：>>X=normrnd(0,1,80,1);>>[muhat,sigmahat,muci,sigmaci]=normfit(X)muhat=0.0076sigmahat=1.0176muci=-0.21890.2340sigmaci=0.88061.2053格式[muhat,muci]=expfit(X,alpha)說明在顯著性水平alpha下，求指數(shù)分布的數(shù)據X的均值的點估計及其區(qū)間估計。

2．利用mle函數(shù)進行參數(shù)估計格式phat=mle

%返回用dist指定分布的最大似然估計值[phat,pci]=mle

%置信度為95%[phat,pci]=mle%置信度由alpha確定[phat,pci]=mle%僅用于二項分布，pl為試驗次數(shù)說明dist為分布函數(shù)名，如beta（分布）、bino（二項分布）等，X為數(shù)據樣本，alpha為顯著水平α，為置信度。首頁例如：>>X=betarnd(3,5,1,100)>>[phat,pci]=mle('beta',X)phat=2.75774.8805pci=1.97953.49813.53596.2629>>X=binornd(10,0.7,1,30)>>[phat,pci]=mle('bino',X,0.05,10)phat=0.7033pci=0.64810.75458.2.5假設檢驗

1．正態(tài)總體均值的檢驗（1）單個正態(tài)總體均值的檢驗。格式h=ztest(x,m,sigma,alpha)%方差已知，x為正態(tài)總體的樣本，

m為均值，sigma為標準差，顯著性水平為alpha（默認值為0.05）[h,sig,ci,zval]=ztest(x,m,sigma,alpha,tail)%方差已知h=ttest(x,m,alpha)%方差未知[h,sig,ci]=ttest(x,m,alpha,tail)%方差未知說明若h=0，表示在顯著性水平alpha下，不能拒絕原假設；若h=1，表示在顯著性水平alpha下，可以拒絕原假設。

sig為觀察值的概率，當sig為小概率時則對原假設提出質疑。ci為真正均值μ的1-alpha置信區(qū)間。zval為統(tǒng)計量的值。原假設：，若tail=0，表示備擇假設：（默認）；tail=1，表示備擇假設：；tail=-1，表示備擇假設：。首頁

（2）兩個正態(tài)總體均值差的檢驗。格式[h,sig,ci,stats]=ttest2(X,Y,alpha)%X，Y為兩個正態(tài)總體的樣本，其方差未知但相等，顯著性水平為alpha，默認值為

0.05[h,sig,ci,stats]=ttest2(X,Y,alpha,tail)說明若h=0，表示在顯著性水平alpha下，不能拒絕原假設；若h=1，表示在顯著性水平alpha下，可以拒絕原假設。

sig為當原假設為真時觀察值的概率，當sig為小概率時則對原假設提出質疑。ci為真正均值μ的1-alpha置信區(qū)間。stats包含t統(tǒng)計量、自由度和標準差。原假設：，(為X為期望值，為Y的期望值)若tail=0，表示備擇假設：；tail=1，表示備擇假設：；tail=-1，表示備擇假設：。首頁2．正態(tài)分布檢驗

（1）大樣本的Jarque-Bera測試。格式h=jbtest(X,alpha)%對輸入向量X進行正態(tài)分布擬合優(yōu)度測試[h,p,jbstat,cv]=jbtest(X,alpha)%p為接受假設的概率值，p越接近于

0，則可以拒絕是正態(tài)分布的原假設；jbstat為測試統(tǒng)計量的值，cv為是否拒絕原假設的臨界值說明h為測試結果，若h=0，則可以認為X是服從正態(tài)分布的；若h=1，則可以否定X服從正態(tài)分布。首頁

（2）小樣本的Lilliefors測試。格式h=lillietest(X,alpha)%對輸入向量X進行正態(tài)分布擬合優(yōu)度測試[h,p,lstat,cv]=lillietest(X,alpha)%p為接受假設的概率值，p越接近于0，則可以拒絕是正態(tài)分布的原假設；lstat為測試統(tǒng)計量的值，cv為是否拒絕原假設的臨界值說明h為測試結果，若h=0，則可以認為X是服從正態(tài)分布的；若h=1，則可以否定X服從正態(tài)分布。

3．兩個總體一致性的檢驗——秩和檢驗格式p=ranksum(X,Y,alpha)%X、Y為兩個總體的樣本，可以不等長[p,h]=ranksum(X,Y,alpha)[p,h,stats]=ranksum(X,Y,alpha)說明p為兩個總體樣本X和Y為一致的顯著性概率，若p接近于0，則不一致較明顯；h為檢驗結果，h=0表示X與Y的總體差別不顯著，h=1表示X與Y的總體差別顯著；stats包括：ranksum為秩和統(tǒng)計量的值以及zval為過去計算p的正態(tài)統(tǒng)計量的值。首頁

4．兩個總體中位數(shù)相等的檢驗——符號秩檢驗格式p=signrank(X,Y,alpha)%X、Y為兩個總體的樣本，必須等長[p,h]=signrank(X,Y,alpha)[p,h,stats]=signrank(X,Y,alpha)說明p表兩個總體樣本X、Y的中位數(shù)相等的顯著性概率。h=0表示兩個樣本中位數(shù)之差幾乎為0，表明兩樣本總體中位數(shù)沒有顯著差異；h=1表示兩樣本總體中位數(shù)有顯著差異。

5．兩個總體中位數(shù)相等的檢驗——符號檢驗格式p=signtest(X,Y,alpha)%樣本X、Y等長[p,h]=signtest(X,Y,alpha)[p,h,stats]=signtest(X,Y,alpha)說明p表兩個等長樣本X、Y的中位數(shù)相等的顯著性概率。h=0表兩樣本總體中位數(shù)沒有顯著差異；h=1表兩樣本總體中位數(shù)有顯著差異。首頁例如，檢驗兩個正態(tài)分布的樣本子樣中位數(shù)（均值）是否相等。>>X=normrnd(0,1,20,1);>>Y=normrnd(0,2,20,1);>>[p,h,stats]=signtest(X,Y,0.05)p=1h=0stats=sign:10h=0表示兩個X、Y總體沒有顯著差異。8.2.6統(tǒng)計工具窗口

1．概率密度函數(shù)的圖形用戶界面在MATLAB命令窗口執(zhí)行命令：>>disttool就可啟動概率密度函數(shù)的圖形用戶界面，如圖8-24所示，此窗口默認狀態(tài)顯示的圖形是正態(tài)分布的分布函數(shù)圖。首頁圖8-24默認分布函數(shù)圖我們可以選擇分布類型“Distribution”和函數(shù)類型“Functiontype”，譬如顯示泊松分布的密度函數(shù)曲線，只要在“Distribution”處選擇“Poisson”，在“Functiontype”處選擇“PDF”，則顯示的是泊松分布的密度函數(shù)圖，如圖8-25所示。首頁圖8-25泊松分布密度函數(shù)圖2．隨機數(shù)的圖形用戶界面在命令窗口執(zhí)行命令：>>randtool即可啟動隨機數(shù)的圖形用戶界面，如圖8-26所示，此窗口默認狀態(tài)顯示正態(tài)分布隨機數(shù)的分布直方圖。首頁圖8-26默認隨機數(shù)分布直方圖我們可以選擇分布類型“Distribution”和樣本數(shù)目“Samples”。譬如，顯示二項分布隨機數(shù)的直方圖，只要在“Distribution”處選擇“Binomial”，在“Samples”處選擇“500”，則顯示的圖形如圖8-27所示，近似服從正態(tài)分布。首頁圖8-27二項分布隨機數(shù)的直方圖8.3數(shù)據的曲線擬合

8.3.1多項式1．多項式的表達和創(chuàng)建（1）多項式的一般形式表示為：（8-1）在MATLAB中，多項式表示成向量的形式，x的冪次方是按降序排列的。只需將按降冪次序的多項式的每個系數(shù)填入向量中，就可以在MATLAB中建立一個多項式。故（8-1）多項式表成的向量為：（8-2）反之，給出的（8-2）式的向量，我們也可寫出（8-1）式的多項式。首頁

（2）MATLAB中用函數(shù)sym2poly將多項式形式轉化成向量表示法。格式p=sym2poly(f)%將多項式表示式f轉化為向量表達式p例如：>>symsx>>f=5*x^4-3*x^2+x-1>>p=sym2poly(f)p=50-31-1

3．多項式求根格式x=roots(p)%p為系數(shù)多項式組成的行向量，x為由根組成的列向量例如，求解多項式的根。>>p=[1-7240];>>x=roots(p)x=5.00004.0000-2.0000首頁4．將向量變成符號多項式格式f=poly2sym(p)%將系數(shù)多項式組成的向量p變成符號多項式f例如：>>p=[13021];>>f=poly2sym(p)f=x^4+3*x^3+2*x+1

5．用多項式的根構造多項式格式p=poly(r)%r為多項式根組成向量，返回系數(shù)多項式向量p例如：>>r=[12-1];>>p=poly(r)p=1-2-12>>y=poly2sym(p)y=x^3-2*x^2-x+2首頁8.3.2多項式曲線擬合法1．一元多項式的基本形式一元多項式的基本形式可以表示為：其中，系數(shù)是需要擬合的未知參數(shù)。

2．多項式擬合的命令格式p=polyfit(x,y,n)%x、y是同維向量，n擬合多項式次數(shù)，p

擬合系數(shù)Y=polyval(p,x)%Y是polyfit所得的擬合多項式在x處的預測值[p,S]=polyfit(x,y,n）%S是一結構數(shù)組，包括R、df和normr[Y,DELTA]=polyconf(p,x,S,alpha)%預測值Y的顯著性為1－alpha的置信區(qū)間為%Y±DELTA；alpha缺省時為0.5[p,S,mu]=polyfit(x,y,n)%mu=[mean(x);std(x)]，p中心化后的擬合系數(shù)[Y,DELTA]=polyconf(p,X,S,param1,val1,param2,val2,…)%預測值

param選項為‘alpha’、‘mu’、‘predopt’、

‘simopt’

，val為其對應的值說明結構數(shù)組S：R是根據輸入向量x構建范德蒙矩陣V，然后進行QR分解，得到的上三角矩陣；df為自由度，計算公式為df=length(y)-(n+1)；normr為殘差范數(shù)，公式為normr=norm（y-V*p）。mu值的作用是通過xhat=(x-mu(1))/mu(2)進行中心化和比例縮放，可以改善多項式及擬合算法的數(shù)值特征。首頁

【例8-4】經測量某人從出生到成年之間的體重，得到年齡與體重的數(shù)據如表8-1所示，試建立年齡與體重之間的關系。首頁（1）MATLAB程序如下：x=[00.51368121518]';y=[3.55691418264060]';p=polyfit(x,y,3)%三次擬合Y=polyval(p,x)%計算在x處的預測值plot(x,y,'o',x,Y)xlabel('年齡')ylabel('體重')年齡（周歲）00.51368121518體重（千克）3.55691418264060表8-1年齡與體重數(shù)據表運行結果如下：p=0.0141-0.22302.58093.5313Y'=%顯示Y的轉置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234所以所建立的多項式模型為：其對應擬合曲線圖如圖8-28所示。首頁圖8-28擬合曲線圖

（2）若對上述數(shù)據x、y執(zhí)行命令：>>[p,S]=polyfit(x,y,3)>>[Y,DELTA]=polyconf(p,x,S)運行結果如下：p=0.0141-0.22302.58093.5313S=R:[4x4double]df:5normr:1.3904Y'=%顯示Y的轉置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234DELTA'=%顯示DELTA的轉置DELTA'1.93821.82971.78111.85101.89321.84831.95291.93842.2226從（2）的結果來看擬合系數(shù)p、預測值Y都與（1）的結果相同。首頁

（3）若對上述數(shù)據x、y執(zhí)行命令：>>[p,S,mu]=polyfit(x,y,3)>>[Y,DELTA]=polyconf(p,x,S,'mu',mu)運行結果如下：p=4.17503.359510.269915.5951S=R:[4x4double]df:5normr:1.3904mu=7.05566.6635Y'=%顯示Y的轉置Y'3.53134.76785.90339.647814.036017.130126.770939.689560.0234DELTA'=%顯示DELTA的轉置DELTA'1.93821.82971.78111.85101.89321.84831.95291.93842.2226從（3）的結果來看，p值與（1）、（2）的結果都不同，但預測值Y和DELTA的結果都與（1）、（2）的結果一致。若要找出預測值的置信區(qū)間，只需執(zhí)行命令A=[Y-DELTA,Y+DELTA]即可。

8.3.3多元線性回歸法

1．多元線性方程的一般形式（8-3）其中，系數(shù)是需要求的未知參數(shù)。為求方程（8-3）中的參數(shù)，我們給出觀察值和y的n個樣本點和（），并用矩陣表示如下：首頁則得到k元線性回歸模型矩陣形式：（8-4）其中，，（為單位矩陣）。利用最小二乘法原理求出矩陣方程（8-4）的估計值，即為未知參數(shù)的值。，，，

2．多元線性回歸法的命令格式b=regress(Y,X)%確定回歸系數(shù)的點估計值[b,bint,r,rint,stats]=regress(Y,X,alpha)%求回歸系數(shù)的點估計和區(qū)間估計并檢驗回歸模型Z=[ones(size(x1)),x1,x2,…,xk]*b%預測值Z=X*b%預測值說明Y=[y1,y2,…,yn]'，X=[ones(size(x1)),x1,x2,

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

matlab第8章數(shù)據分析

文檔簡介

溫馨提示

最新文檔

評論

matlab第8章數(shù)據分析

文檔簡介

溫馨提示

最新文檔

評論

相關文檔