matlab數(shù)據(jù)的統(tǒng)計分析與描述_第1頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述_第2頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述_第3頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述_第4頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)建模與數(shù)學(xué)實驗 數(shù)據(jù)的統(tǒng)計描述和分析 實驗?zāi)康?實驗內(nèi)容 2 掌握用數(shù)學(xué)軟件包求解統(tǒng)計問題 1 直觀了解統(tǒng)計基本內(nèi)容 1 統(tǒng)計的基本理論 3 實驗作業(yè) 2 用數(shù)學(xué)軟件包求解統(tǒng)計問題 統(tǒng)計的基本概念 參數(shù)估計 假設(shè)檢驗 數(shù)據(jù)的統(tǒng)計描述和分析 一 統(tǒng)計量 二 分布函數(shù)的近似求法 三 幾個在統(tǒng)計中常用的概率分布 1 正態(tài)分布 密度函數(shù) 分布函數(shù) 其中 m 為均值 為方差 標(biāo)準(zhǔn)正態(tài)分布 N 0 1 密度函數(shù) 分布函數(shù) 返回 F 10 50 分布的密度函數(shù)曲線 參數(shù)估計 一 點估計的求法 一 矩估計法 二 極大似然估計法 二 區(qū)間估計的求法 1 已知DX 求EX的置信區(qū)間 2 未知方差DX 求EX的置信區(qū)間 一 數(shù)學(xué)期望的置信區(qū)間 二 方差的區(qū)間估計 返回 1 參數(shù)檢驗 如果觀測的分布函數(shù)類型已知 這時構(gòu)造出的統(tǒng)計量依賴于總體的分布函數(shù) 這種檢驗稱為參數(shù)檢驗 參數(shù)檢驗的目的往往是對總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷 對總體X的分布律或分布參數(shù)作某種假設(shè) 根據(jù)抽取的樣本觀察值 運用數(shù)理統(tǒng)計的分析方法 檢驗這種假設(shè)是否正確 從而決定接受假設(shè)或拒絕假設(shè) 假設(shè)檢驗 2 非參數(shù)檢驗 如果所檢驗的假設(shè)并非是對某個參數(shù)作出明確的判斷 因而必須要求構(gòu)造出的檢驗統(tǒng)計量的分布函數(shù)不依賴于觀測值的分布函數(shù)類型 這種檢驗叫非參數(shù)檢驗 如 要求判斷總體分布類型的檢驗就是非參數(shù)檢驗 假設(shè)檢驗的一般步驟 一 單個正態(tài)總體均值的檢驗 一 參數(shù)檢驗 二 單個正態(tài)總體方差的檢驗 三 兩個正態(tài)總體均值的檢驗 四 兩個正態(tài)總體方差的檢驗 二 非參數(shù)檢驗 二 概率紙檢驗法 概率紙是一種判斷總體分布的簡便工具 使用他們 可以很快地判斷總體分布的類型 概率紙的種類很多 返回 統(tǒng)計工具箱中的基本統(tǒng)計命令 1 數(shù)據(jù)的錄入 保存和調(diào)用 2 基本統(tǒng)計量 3 常見的概率分布函數(shù) 4 頻數(shù)直方圖的描繪 5 參數(shù)估計 6 假設(shè)檢驗 7 綜合實例 返回 一 數(shù)據(jù)的錄入 保存和調(diào)用 例1上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下 統(tǒng)計工具箱中的基本統(tǒng)計命令 1 年份數(shù)據(jù)以1為增量 用產(chǎn)生向量的方法輸入 命令格式 x a h bt 78 87 2 分別以x和y代表變量職工工資總額和商品零售總額 x 23 8 27 6 31 6 32 4 33 7 34 9 43 2 52 8 63 8 73 4 y 41 4 51 8 61 7 67 9 68 7 77 5 95 9 137 4 155 0 175 0 3 將變量t x y的數(shù)據(jù)保存在文件data中 savedatatxy 4 進(jìn)行統(tǒng)計分析時 調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù) loaddata ToMATLAB txy 方法1 1 輸入矩陣 data 78 79 80 81 82 83 84 85 86 87 88 23 8 27 6 31 6 32 4 33 7 34 9 43 2 52 8 63 8 73 4 41 4 51 8 61 7 67 9 68 7 77 5 95 9 137 4 155 0 175 0 2 將矩陣data的數(shù)據(jù)保存在文件data1中 savedata1data 3 進(jìn)行統(tǒng)計分析時 先用命令 loaddata1調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù) 再用以下命令分別將矩陣data的第一 二 三行的數(shù)據(jù)賦給變量t x y t data 1 x data 2 y data 3 若要調(diào)用矩陣data的第j列的數(shù)據(jù) 可用命令 data j 方法2 ToMATLAB data 返回 二 基本統(tǒng)計量 對隨機變量x 計算其基本統(tǒng)計量的命令如下 均值 mean x 中位數(shù) median x 標(biāo)準(zhǔn)差 std x 方差 var x 偏度 skewness x 峰度 kurtosis x 例對例1中的職工工資總額x 可計算上述基本統(tǒng)計量 ToMATLAB tjl 返回 三 常見概率分布的函數(shù) MATLAB工具箱對每一種分布都提供5類函數(shù) 其命令字符為 概率密度 pdf概率分布 cdf逆概率分布 inv均值與方差 stat隨機數(shù)生成 rnd 當(dāng)需要一種分布的某一類函數(shù)時 將以上所列的分布命令字符與函數(shù)命令字符接起來 并輸入自變量 可以是標(biāo)量 數(shù)組或矩陣 和參數(shù)即可 在MATLAB中輸入以下命令 x 6 0 01 6 y normpdf x z normpdf x 0 2 plot x y x z 1 密度函數(shù) p normpdf x mu sigma 當(dāng)mu 0 sigma 1時可缺省 ToMATLAB liti2 如對均值為mu 標(biāo)準(zhǔn)差為sigma的正態(tài)分布 舉例如下 ToMATLAB liti3 3 逆概率分布 x norminv P mu sigma 即求出x 使得P X x P 此命令可用來求分位數(shù) 2 概率分布 P normcdf x mu sigma ToMATLAB liti4 ToMATLAB liti5 4 均值與方差 m v normstat mu sigma 例5求正態(tài)分布N 3 52 的均值與方差 命令為 m v normstat 3 5 結(jié)果為 m 3 v 25 5 隨機數(shù)生成 normrnd mu sigma m n 產(chǎn)生m n階的正態(tài)分布隨機數(shù)矩陣 例6命令 M normrnd 123 456 0 1 2 3 結(jié)果為 M 0 95672 01252 88543 83345 02886 1191 ToMATLAB liti6 此命令產(chǎn)生了2 3的正態(tài)分布隨機數(shù)矩陣 各數(shù)分別服從分布 N 1 0 12 N 2 22 N 3 32 N 4 0 12 N 5 22 N 6 32 返回 1 給出數(shù)組data的頻數(shù)表的命令為 N X hist data k 此命令將區(qū)間 min data max data 分為k個小區(qū)間 缺省為10 返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X 2 描繪數(shù)組data的頻數(shù)直方圖的命令為 hist data k 四 數(shù)直方圖的描繪 返回 五 參數(shù)估計 1 正態(tài)總體的參數(shù)估計 設(shè)總體服從正態(tài)分布 則其點估計和區(qū)間估計可同時由以下命令獲得 muhat sigmahat muci sigmaci normfit X alpha 此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù) alpha缺省時設(shè)定為0 05 返回值muhat是X的均值的點估計值 sigmahat是標(biāo)準(zhǔn)差的點估計值 muci是均值的區(qū)間估計 sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計 2 其它分布的參數(shù)估計 有兩種處理辦法 一 取容量充分大的樣本 n 50 按中心極限定理 它近似地服從正態(tài)分布 二 使用MATLAB工具箱中具有特定分布總體的估計命令 1 muhat muci expfit X alpha 在顯著性水平alpha下 求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計 2 lambdahat lambdaci poissfit X alpha 在顯著性水平alpha下 求泊松分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計 3 phat pci weibfit X alpha 在顯著性水平alpha下 求Weibull分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計 返回 六 假設(shè)檢驗 在總體服從正態(tài)分布的情況下 可用以下命令進(jìn)行假設(shè)檢驗 1 總體方差已知時 總體均值的檢驗使用z檢驗 h sig ci ztest x m sigma alpha tail 檢驗數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立 其中sigma為已知方差 alpha為顯著性水平 究竟檢驗什么假設(shè)取決于tail的取值 tail 0 檢驗假設(shè) x的均值等于m tail 1 檢驗假設(shè) x的均值大于m tail 1 檢驗假設(shè) x的均值小于m tail的缺省值為0 alpha的缺省值為0 05 返回值h為一個布爾值 h 1表示可以拒絕假設(shè) h 0表示不可以拒絕假設(shè) sig為假設(shè)成立的概率 ci為均值的1 alpha置信區(qū)間 例7MATLAB統(tǒng)計工具箱中的數(shù)據(jù)文件gas mat 中提供了美國1993年1月份和2月份的汽油平均價格 price1 price2分別是1 2月份的油價 單位為美分 它是容量為20的雙樣本 假設(shè)1月份油價的標(biāo)準(zhǔn)偏差是每加侖4分幣 4 試檢驗1月份油價的均值是否等于115 解作假設(shè) m 115 首先取出數(shù)據(jù) 用以下命令 loadgas然后用以下命令檢驗 h sig ci ztest price1 115 4 返回 h 0 sig 0 8668 ci 113 3970116 9030 檢驗結(jié)果 1 布爾變量h 0 表示不拒絕零假設(shè) 說明提出的假設(shè)均值115是合理的 2 sig值為0 8668 遠(yuǎn)超過0 5 不能拒絕零假設(shè)3 95 的置信區(qū)間為 113 4 116 9 它完全包括115 且精度很高 ToMATLAB liti7 2 總體方差未知時 總體均值的檢驗使用t檢驗 h sig ci ttest x m alpha tail 檢驗數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立 其中alpha為顯著性水平 究竟檢驗什么假設(shè)取決于tail的取值 tail 0 檢驗假設(shè) x的均值等于m tail 1 檢驗假設(shè) x的均值大于m tail 1 檢驗假設(shè) x的均值小于m tail的缺省值為0 alpha的缺省值為0 05 返回值h為一個布爾值 h 1表示可以拒絕假設(shè) h 0表示不可以拒絕假設(shè) sig為假設(shè)成立的概率 ci為均值的1 alpha置信區(qū)間 返回 h 1 sig 4 9517e 004 ci 116 8120 2 檢驗結(jié)果 1 布爾變量h 1 表示拒絕零假設(shè) 說明提出的假設(shè)油價均值115是不合理的 2 95 的置信區(qū)間為 116 8120 2 它不包括115 故不能接受假設(shè) 3 sig值為4 9517e 004 遠(yuǎn)小于0 5 不能接受零假設(shè) ToMATLAB liti8 例8試檢驗例8中2月份油價price2的均值是否等于115 解作假設(shè) m 115 price2為2月份的油價 不知其方差 故用以下命令檢驗 h sig ci ttest price2 115 3 兩總體均值的假設(shè)檢驗使用t檢驗 h sig ci ttest2 x y alpha tail 檢驗數(shù)據(jù)x y的關(guān)于均值的某一假設(shè)是否成立 其中alpha為顯著性水平 究竟檢驗什么假設(shè)取決于tail的取值 tail 0 檢驗假設(shè) x的均值等于y的均值 tail 1 檢驗假設(shè) x的均值大于y的均值 tail 1 檢驗假設(shè) x的均值小于y的均值 tail的缺省值為0 alpha的缺省值為0 05 返回值h為一個布爾值 h 1表示可以拒絕假設(shè) h 0表示不可以拒絕假設(shè) sig為假設(shè)成立的概率 ci為與x與y均值差的的1 alpha置信區(qū)間 返回 h 1 sig 0 0083 ci 5 8 0 9 檢驗結(jié)果 1 布爾變量h 1 表示拒絕零假設(shè) 說明提出的假設(shè) 油價均值相同 是不合理的 2 95 的置信區(qū)間為 5 8 0 9 說明一月份油價比二月份油價約低1至6分 3 sig 值為0 0083 遠(yuǎn)小于0 5 不能接受 油價均相同 假設(shè) ToMATLAB liti9 例9試檢驗例8中1月份油價price1與2月份的油價price2均值是否相同 解用以下命令檢驗 h sig ci ttest2 price1 price2 4 非參數(shù)檢驗 總體分布的檢驗 MATLAB工具箱提供了兩個對總體分布進(jìn)行檢驗的命令 1 h normplot x 2 h weibplot x 此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖 如果數(shù)據(jù)來自于正態(tài)分布 則圖形顯示出直線性形態(tài) 而其它概率分布函數(shù)顯示出曲線形態(tài) 此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖 如果數(shù)據(jù)來自于Weibull分布 則圖形將顯示出直線性形態(tài) 而其它概率分布函數(shù)將顯示出曲線形態(tài) 返回 例10一道工序用自動化車床連續(xù)加工某種零件 由于刀具損壞等會出現(xiàn)故障 故障是完全隨機的 并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同 工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的 現(xiàn)積累有100次故障紀(jì)錄 故障出現(xiàn)時該刀具完成的零件數(shù)如下 459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布 解1 數(shù)據(jù)輸入 ToMATLAB liti101 2 作頻數(shù)直方圖hist x 10 3 分布的正態(tài)性檢驗normplot x 4 參數(shù)估計 muhat sigmahat muci sigmaci normfit x 看起來刀具壽命服從正態(tài)分布 刀具壽命近似服從正態(tài)分布 估計出該刀具的均值為594 方差204 均值的0 95置信區(qū)間為 553 4962 634 5038 方差的0 95置信區(qū)間為 179 2276 237 1329 ToMATLAB liti104 ToMATLAB liti102 ToMATLAB liti103 5 假設(shè)檢驗 ToMATLAB liti105 已知刀具的壽命服從正態(tài)分布 現(xiàn)在方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論