版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、東北石油大學(xué)畢業(yè)設(shè)計(jì)(論文)任務(wù)書題目 應(yīng)用統(tǒng)計(jì)方法求解典型數(shù)學(xué)模型主要內(nèi)容、基本要求、主要參考資料等:主要內(nèi)容:本文擬首先簡(jiǎn)單介紹應(yīng)用統(tǒng)計(jì)方法基本理論,再通過實(shí)例來掌握如何應(yīng)用統(tǒng)計(jì)方法求解典型數(shù)學(xué)模型?;疽螅?、查閱不少于10篇參考文獻(xiàn),其中至少2篇外文文獻(xiàn);2、完成不少于1萬5千字的論文,其中中文摘要300字左右,并寫出相應(yīng)的英文摘要;3、完成與課題相關(guān)的外文資料翻譯,字?jǐn)?shù)不少于5000字。主要參考資料: 1、張志涌 楊祖櫻等編著.MATLAB教程M.北京:北京航空航天大學(xué)出版社.2006年8月 2、謝中華 編著.MATLAB統(tǒng)計(jì)分析與應(yīng)用:40個(gè)案例分析M.北京:北京航空航天大學(xué)出版
2、社.2010年6月 3、韓中庚 著.數(shù)學(xué)建模方法及應(yīng)用M.北京:高等教育出版社.2000年完成期限: 指導(dǎo)教師簽名: 專業(yè)負(fù)責(zé)人簽名: 年 月 日摘 要 現(xiàn)實(shí)生活中, 由于客觀事物內(nèi)部規(guī)律的復(fù)雜性及人們認(rèn)識(shí)程度的限制, 人們常搜集大量的數(shù)據(jù), 基于數(shù)據(jù)的統(tǒng)計(jì)分析建立合乎機(jī)理規(guī)律的數(shù)學(xué)模型, 然后通過計(jì)算得到的模型結(jié)果來解釋實(shí)際問題。而隨著社會(huì)的不斷發(fā)展,統(tǒng)計(jì)的知識(shí)越來越重要,運(yùn)用抽樣數(shù)據(jù)進(jìn)行推斷已經(jīng)成為現(xiàn)代社會(huì)一種普遍適用并且強(qiáng)有力的思考方式。 本文在論述統(tǒng)計(jì)思想的廣泛應(yīng)用和簡(jiǎn)介MATLAB工具箱的基礎(chǔ)上,通過介紹方差分析、判別分析、主成分分析三種常見統(tǒng)計(jì)分析方法的基礎(chǔ)原理及其應(yīng)用性實(shí)例,結(jié)合
3、MATLAB編程,歸納總結(jié)了較為簡(jiǎn)便的計(jì)算機(jī)求解方法,并給出了具體答案。 最后,本文著重的探討了典型數(shù)學(xué)模型應(yīng)用統(tǒng)計(jì)方法的MATLAB求解,無論是DNA序列分類模型中運(yùn)用的主成分分析法、FISHER判別分析法,還是在解決葡萄酒評(píng)價(jià)問題中所用的單因素方差分析思想,都很好的體現(xiàn)了統(tǒng)計(jì)思想方法在解決典型數(shù)學(xué)模型問題時(shí)應(yīng)用的廣泛性和有效性。關(guān)鍵詞:數(shù)學(xué)模型;方差分析;判別分析;主成分分析;MatlabAbstractIn real life, because of the complexity of the internal law of objective things and people kno
4、w the degree of restriction, it is often to collect a large amount of data, based on statistical analysis of data create the mechanism mathematical model of the law, and then through the calculated model results to explain the practical problems.And with the continuous development of society, the kn
5、owledge of statistics is more and more important, using the sampling data to infer that has become a modern society widely used and powerful ways of thinking.This paper discusses the widely used of statistical thinking and on the basis of introduction to MATLAB toolbox , by introducing the variance
6、analysis, discriminant analysis, principal component analysis based on analysis of three common statistical principle and its application examples, combining with the MATLAB programming, summarized the simple computer solving method, and presents a concrete answers.Finally, this paper discusses the
7、typical statistical method of MATLAB to solve the mathematical model of the application, whether in the DNA sequence classification model using principal component analysis , Fisher discriminant analysis method, is used in solving for the evaluation of wine, the single factor analysis of variance of
8、 thoughts, all good embodies the statistical thinking method in solving mathematical model for a typical application of universality and effectiveness.Key words:Mathematical model; Analysis of variance; Discriminant analysis; Principal component analysis; MATLAB目 錄第1章 緒 論11.1 統(tǒng)計(jì)分析相關(guān)介紹11.2 MATLAB相關(guān)介紹
9、11.3 本章小結(jié)3第2 章 三類常見統(tǒng)計(jì)方法及其解決典型數(shù)學(xué)模型實(shí)例42.1 方差分析42.2 判別分析122.3 主成分分析162.4 本章小結(jié)21第3章 典型數(shù)學(xué)模型應(yīng)用統(tǒng)計(jì)方法求解223.1 葡萄酒的評(píng)價(jià)223.2 DNA序列分類313.3 本章小結(jié)38結(jié) 論39參考文獻(xiàn)40致 謝42附 錄43第1章 緒 論1.1 統(tǒng)計(jì)分析相關(guān)介紹統(tǒng)計(jì)是隨著概率論的發(fā)展而發(fā)展起來的。只有當(dāng)人們認(rèn)識(shí)到必須把數(shù)據(jù)視為來自具有一定概率分布的總體,所研究的對(duì)象是這個(gè)總體而不能局限于數(shù)據(jù)本身的時(shí)候,統(tǒng)計(jì)誕生了。統(tǒng)計(jì)分析作為一項(xiàng)長(zhǎng)期的社會(huì)實(shí)踐活動(dòng),在歷史的發(fā)展中已有幾千年?!敖y(tǒng)而計(jì)之”就是人們對(duì)數(shù)據(jù)統(tǒng)計(jì)分析的最樸
10、素的認(rèn)識(shí)。隨著社會(huì)生產(chǎn)力的不斷進(jìn)步,社會(huì)經(jīng)濟(jì)的不斷發(fā)展,當(dāng)代的數(shù)據(jù)統(tǒng)計(jì)分析已不圄于“統(tǒng)而計(jì)之”的范疇。從高斯(Gauss)與勒讓德(Legendre)關(guān)于觀測(cè)數(shù)據(jù)的誤差分析和最小二乘估計(jì)方法的研究成果,到克拉默的統(tǒng)計(jì)學(xué)的數(shù)學(xué)方法,統(tǒng)計(jì)才真正的發(fā)展為一門成熟的科學(xué)?;仡櫢怕式y(tǒng)計(jì)的發(fā)展歷史,大致可分為如下三個(gè)階段:古典時(shí)期(10世紀(jì)末以前):主要是描述性的統(tǒng)計(jì)學(xué)的形成和發(fā)展,也可以說是數(shù)理統(tǒng)計(jì)的萌芽時(shí)期。近代時(shí)期(19世紀(jì)末至1945年):小樣本理論形成,數(shù)理統(tǒng)計(jì)的主要分支廷立,可以說是數(shù)理統(tǒng)計(jì)的形成時(shí)期?,F(xiàn)代時(shí)期(1945年以后):這個(gè)時(shí)期,由于計(jì)算機(jī)的發(fā)明和使用,推動(dòng)著數(shù)理統(tǒng)計(jì)在理論研究和應(yīng)用
11、方面都不斷地向縱深發(fā)展,并產(chǎn)生一些新的分支和邊緣性的新學(xué)科,如最優(yōu)設(shè)計(jì)和非參數(shù)統(tǒng)計(jì)推斷等。隨著社會(huì)的不斷發(fā)展,統(tǒng)計(jì)的知識(shí)越來越重要,運(yùn)用抽樣數(shù)據(jù)進(jìn)行推斷已經(jīng)成為現(xiàn)代社會(huì)一種普遍適用并且強(qiáng)有力的思考方式。目前,統(tǒng)計(jì)的很多原理方法已被越來越多地應(yīng)用到交通、經(jīng)濟(jì)、醫(yī)學(xué)、氣象等各種與人們生活息息相關(guān)的領(lǐng)域。本文將就統(tǒng)計(jì)的常用方法與思想,在經(jīng)典數(shù)學(xué)模型的應(yīng)用中展開一些討論,推導(dǎo)出某些表面上并非直觀的結(jié)論,從中可以看出統(tǒng)計(jì)思想方法在解決問題中的實(shí)用性、簡(jiǎn)捷性和高效性。1.2 MATLAB相關(guān)介紹MATLAB (Matrix & Laboratory)是美國(guó)MathWorks公司自20世紀(jì)80年代中期推出的
12、數(shù)學(xué)軟件,優(yōu)秀的數(shù)值計(jì)算能力和卓越的數(shù)據(jù)可視化能力使其很快在數(shù)學(xué)軟件中脫穎而出.目前,MATLAB已經(jīng)發(fā)展成為多學(xué)科、多種工作平臺(tái)的功能強(qiáng)大的大型軟件,是涵括線性代數(shù)、自動(dòng)控制理論、概率論及數(shù)理統(tǒng)計(jì)、數(shù)字信號(hào)處理、時(shí)間序列分析、動(dòng)態(tài)系統(tǒng)仿真等高級(jí)課程的基本教學(xué)工具。MATLAB用法簡(jiǎn)易、靈活、程式結(jié)構(gòu)強(qiáng)又兼具延展性.以下為其幾個(gè)特色: 數(shù)值計(jì)算和符號(hào)計(jì)算功能(1)數(shù)值計(jì)算功能包括:矩陣運(yùn)算、多項(xiàng)式和有理分式運(yùn)算、數(shù)據(jù)統(tǒng)計(jì)分析、數(shù)值積分、優(yōu)化處理等。(2)符號(hào)計(jì)算將得到問題的解析解。 MATLAB語言除了命令行的交互式操作以外,還可以程序方式工作。使用MATLAB很容易地實(shí)現(xiàn)C或FORTRAN語
13、言的幾乎全部功能。圖形功能 兩個(gè)層次的圖形命令:一種是對(duì)圖形句柄進(jìn)行的低級(jí)圖形命令,另一種是建立在低級(jí)圖形命令之上的高級(jí)圖形命令。利用MATLAB的高級(jí)圖形命令可以輕而易舉地繪制二維、三維乃至四維圖形,并可進(jìn)行圖形和坐標(biāo)的標(biāo)識(shí)、視角和光照設(shè)計(jì)、色彩精細(xì)控制等等。如今,MATLAB廣泛應(yīng)用于:數(shù)值計(jì)算、圖形處理、符號(hào)運(yùn)算、數(shù)學(xué)建模、系統(tǒng)辨識(shí)、小波分析、實(shí)時(shí)控制、動(dòng)態(tài)仿真等領(lǐng)域.MATLAB包括擁有數(shù)百個(gè)內(nèi)部函數(shù)的主包和三十幾種工具包.工具包又可以分為功能性工具包和學(xué)科工具包.功能型工具箱主要用來擴(kuò)充MATLAB的符號(hào)計(jì)算功能、圖形建模仿真功能、文字處理功能以及與硬件實(shí)時(shí)交互功能,能用于多種學(xué)科.
14、而領(lǐng)域型工具箱是專業(yè)性很強(qiáng)的,如控制系統(tǒng)工具箱(Control System Toolbox)、財(cái)政金融工具箱(Financial Toolbox)等.在統(tǒng)計(jì)問題上,我們能用到的最基礎(chǔ)的工具箱就是統(tǒng)計(jì)工具箱.它包括下面幾個(gè)方面的內(nèi)容:概率分布.給出了常見的20 種概率分布類型的概率密度函數(shù)、累加分布函數(shù)、逆累加分布函數(shù)、參數(shù)估計(jì)函數(shù)、隨機(jī)數(shù)生成函數(shù)和統(tǒng)計(jì)量計(jì)算函數(shù).參數(shù)估計(jì).提供了多種分布類型分布參數(shù)及其置信區(qū)間的估計(jì)方法. 樣本描述.中心趨勢(shì)和離中趨勢(shì)的統(tǒng)計(jì)量函數(shù),及統(tǒng)計(jì)量計(jì)算函數(shù). 方差分析.包括單因子方差分析、雙因子方差分析和多因子方差分析. 回歸分析.包括線性回歸、多項(xiàng)式擬合、非線性回
15、歸等.假設(shè)檢驗(yàn)、分布的檢驗(yàn)、非參數(shù)檢驗(yàn).判別分析、聚類分析、因子分析.統(tǒng)計(jì)過程控制.提供了常用的過程管理圖和過程性能圖.統(tǒng)計(jì)圖.箱形圖、誤差條圖、q-q 圖、交互插值等值線圖和威布爾圖等.試驗(yàn)設(shè)計(jì).包括完全析因設(shè)計(jì)、不完全析因設(shè)計(jì)和D-優(yōu)化設(shè)計(jì).1.3 本章小結(jié)本章主要探討了統(tǒng)計(jì)問題的背景及應(yīng)用,并概述了統(tǒng)計(jì)思想在各個(gè)領(lǐng)域的廣泛應(yīng)用。此外,本章還簡(jiǎn)單介紹了MATLAB軟件的特色和本文重點(diǎn)應(yīng)用的MATLAB統(tǒng)計(jì)工具箱。第2 章 三類常見統(tǒng)計(jì)方法及其解決典型數(shù)學(xué)模型實(shí)例2.1 方差分析2.1.1 單因素一元方差分析.1 Anova1函數(shù) MATLAB統(tǒng)計(jì)工具箱中提供了anova1函數(shù),用來作單因素
16、一元方差分析,其調(diào)用格式為:(1) p = anova1(X)根據(jù)樣本觀測(cè)值矩陣X進(jìn)行均衡試驗(yàn)的單因素一元方差分析,檢驗(yàn)矩陣X的各列所對(duì)應(yīng)的總體是否具有相同的均值,原假設(shè)是X的各列所對(duì)應(yīng)的總體具有相同的均值。矩陣X的列數(shù)表示因素的水平數(shù),X的每一列對(duì)應(yīng)因素的一個(gè)水平,矩陣X的行數(shù)表示因素的每個(gè)水平下重復(fù)試驗(yàn)的次數(shù)(即樣本容量),所謂均衡試驗(yàn)是指因素的每個(gè)水平下重復(fù)試驗(yàn)次數(shù)相同的試驗(yàn)。anova1函數(shù)的輸出參數(shù)p是檢驗(yàn)的p值,對(duì)于給定的顯著性水平,若p,則拒絕原假設(shè),認(rèn)為X的各列所對(duì)應(yīng)的總體具有不完全相同的均值,否則接受原假設(shè),認(rèn)為X的各列所對(duì)應(yīng)的總體具有相同的均值。anova1函數(shù)還生成兩個(gè)圖
17、形。第1個(gè)圖為方差分析表,它將X中數(shù)據(jù)的誤差分成兩部分:由于列值的差異導(dǎo)致的誤差(組間差);由于每一列數(shù)據(jù)與該列均值的差異導(dǎo)致的誤差(組內(nèi)差)。方差分析表中有6列:第1列顯示誤差的來源;第2列顯示每一個(gè)誤差來源的平方和(SS);第3列顯示與每一個(gè)誤差來源相關(guān)的自由度(df);第4列顯示均值平方和(MS),它是誤差來源平方和與自由度的比值,即SS/df;第5列顯示F統(tǒng)計(jì)量,它是均值平方和的比值;第6列顯示p值,p值是F函數(shù)(fcdf);當(dāng)F增加時(shí)p值減小。第2個(gè)圖顯示X的每一列的箱形圖。箱形圖中心線上較大的差異對(duì)應(yīng)于較大的F值和較小的p值。(2) p = anova1(X,group) 當(dāng)X是一
18、個(gè)矩陣時(shí),這種調(diào)用只適合于均衡試驗(yàn),anova1函數(shù)把X的每一列作為一個(gè)獨(dú)立的組,檢驗(yàn)各組多對(duì)應(yīng)總體是否具有相同的均值。輸入?yún)?shù)group可以是字符數(shù)組或者字符串元胞數(shù)組,用來指定每組的組名,X的每一列對(duì)應(yīng)一個(gè)組名字符串,在箱線圖中,組名字符串被作為箱線圖的標(biāo)簽。如果不需要指定組名,可以輸入空數(shù)組()或者忽略group這個(gè)輸入。當(dāng)X是一個(gè)向量,這種調(diào)用不僅適用于均衡試驗(yàn),還適用于非均衡試驗(yàn)。anova1函數(shù)對(duì)X中的樣本進(jìn)行單因素方差分析,通過輸入變量group來標(biāo)識(shí)X中的每個(gè)元素的水平,所以,group與X的長(zhǎng)度必須相等。group中包含的標(biāo)簽同樣用于箱形圖的標(biāo)注。anova1函數(shù)的矢量輸入形
19、式不需要每個(gè)樣本中的觀測(cè)值個(gè)數(shù)相同,所以它適用于不平衡數(shù)據(jù)。(3) p = anova1(X,group,displayopt)當(dāng)displayopt參數(shù)設(shè)置為on(默認(rèn)設(shè)置)時(shí),激活A(yù)NOVA表和箱形圖的顯示;displayopt參數(shù)設(shè)置為off時(shí),不予顯示。(4) p,table = anova1(.)返回單元數(shù)組表中的ANOVA表(包含列標(biāo)簽和行標(biāo)簽)。(使用“Edit”菜單中的“Copy Text”選項(xiàng)可以將ANOVA表以文本形式復(fù)制到記事本中。)(5) p,table,table = anova1(.)返回stats結(jié)構(gòu),用于進(jìn)行多重比較檢驗(yàn)。anova1檢驗(yàn)評(píng)價(jià)所有樣本均值相等的零
20、假設(shè)和均值不等的備擇假設(shè)。有時(shí)進(jìn)行檢驗(yàn),決定哪對(duì)均值差異顯著,哪對(duì)均值差異不顯著是很有效的。提供stats結(jié)構(gòu)作為輸入,使用multcompare函數(shù)可以進(jìn)行此項(xiàng)檢驗(yàn)。注意:方差分析要求樣本數(shù)據(jù)滿足下面的假設(shè)條件:所有樣本數(shù)據(jù)滿足正態(tài)分布條件;所有樣本數(shù)據(jù)具有相等的方差;所有觀測(cè)值相互獨(dú)立。在基本滿足前二個(gè)假設(shè)條件的情況下,一般認(rèn)為ANOVA檢驗(yàn)是穩(wěn)健的。.2 Multcompare函數(shù) MTALAB統(tǒng)計(jì)工具箱中提供了Multcompare函數(shù),用來作多重比較,其調(diào)用格式如下:(1) c = multcompare(stats) 根據(jù)結(jié)構(gòu)體變量stats中的信息進(jìn)行多重比較,返回兩兩比較的結(jié)果
21、矩陣c。c是一個(gè)5列的矩陣,它的每一行對(duì)應(yīng)一次兩兩比較的檢驗(yàn),每一行上的元素包括作比較的兩個(gè)組的組標(biāo)號(hào)、兩個(gè)組的均值差、均值差的置信區(qū)間。例如c的某行元素為:2.0000 5.0000 1.9442 8.2206 14.4971表示對(duì)第二組和第五組進(jìn)行兩兩比較的檢驗(yàn),兩組的均值(即第二組的均值減去第五組的均值)為8.2206,均值差的95%置信區(qū)間為1.9442,14.4971,這個(gè)區(qū)間不包含0,說明在顯著性0.05下,兩組間均值的差異是顯著的。(2) c = multcompare(stats,param1,val1,param2,val2,.)指定一個(gè)或多個(gè)成對(duì)出現(xiàn)的參數(shù)名與參數(shù)值來控制多
22、重比較。(3) c,m = multcompare(.)還返回一個(gè)多行2列的矩陣m,第一列為每一組組均值的估計(jì)值,第二列為相應(yīng)的標(biāo)準(zhǔn)誤差。(4) c,m,h = multcompare(.)還返回交互式多重比較的圖形的句柄值h,可通過h修改圖形屬性,如圖形標(biāo)題和X軸標(biāo)等。(5) c,m,h,games = multcompare(.)還返回組名變量gnames,它是一個(gè)元胞數(shù)組,每一行對(duì)應(yīng)一個(gè)組名。.3應(yīng)用實(shí)例例2-1:將四種工藝下生產(chǎn)的燈泡進(jìn)行壽命測(cè)試,得到數(shù)據(jù):表2-1燈泡壽命測(cè)試表 試驗(yàn) 工藝116201580146015002167016001540155031700164016201
23、610417501720168051800試檢驗(yàn)工藝對(duì)壽命有無顯著影響。(=0.05)解答:程序:clear;X=1620,1670,1700,1750,1800,1580,1600,1640,1720,1460,1540,1620,1500,1550,1610,1680;group=1,1,1,1,1,2,2,2,2,3,3,3,4,4,4,4;p,tab,stats=anova1(X,group,on)運(yùn)行結(jié)果:p = 0.0331tab = Source SS df MS F ProbF Groups 62820 3 20940 4.0608 0.0331 Error 61880 12
24、5.1567e+003 Total 124700 15 stats = gnames: 4x1 cell n: 5 4 3 4 source: anova1 means: 1708 1635 1540 1585 df: 12 s: 71.8099圖2-1燈泡壽命測(cè)試運(yùn)行結(jié)果圖圖2-2燈泡壽命測(cè)試水箱平衡圖例2-2:研究6種農(nóng)藥對(duì)殺蟲效果的影響,試驗(yàn)所得數(shù)據(jù)如下表:表2-2農(nóng)藥殺蟲量表農(nóng)藥編號(hào)殺蟲量12345687.485.080.290.588.587.394.356.262.455.048.292.099.295.391.575.272.381.3設(shè)該試驗(yàn)的線性統(tǒng)計(jì)模型為:其中,。解答:程序
25、:y1=87.4 85.0 80.2;y2=90.5 88.5 87.3 94.3;y3=56.2 62.4;y4=55.0 48.2;y5=92.0 99.2 95.3 91.5;y6=75.2 72.3 81.3;y=y1 y2 y3 y4 y5 y6;A1=ones(numel(y1),1);A2=2*ones(numel(y2),1);A3=3*ones(numel(y3),1);A4=4*ones(numel(y4),1);A5=5*ones(numel(y5),1);A6=6*ones(numel(y6),1);A=A1;A2;A3;A4;A5;A6;p,table,stats=a
26、nova1(y,A)B=multcompare(stats,0.05)運(yùn)行結(jié)果:p = 1.0671e-007table = Source SS df MS F ProbF Groups 3.8177e+003 5 763.5487 51.5921 1.0671e-007 Error 177.5967 12 14.7997 Total 3.9953e+003 17 stats = gnames: 6x1 cell n: 3 4 2 2 4 3 source: anova1 means: 84.2000 90.1500 59.3000 51.6000 94.5000 76.2667 df: 12
27、 s: 3.8470B = 1.0000 2.0000 -15.8193 -5.9500 3.9193 1.0000 3.0000 13.1040 24.9000 36.6960 1.0000 4.0000 20.8040 32.6000 44.3960 1.0000 5.0000 -20.1693 -10.3000 -0.4307 1.0000 6.0000 -2.6174 7.9333 18.4840 2.0000 3.0000 19.6593 30.8500 42.0407 2.0000 4.0000 27.3593 38.5500 49.7407 2.0000 5.0000 -13.4
28、872 -4.3500 4.7872 2.0000 6.0000 4.0141 13.8833 23.7526 3.0000 4.0000 -5.2219 7.7000 20.6219 3.0000 5.0000 -46.3907 -35.2000 -24.0093 3.0000 6.0000 -28.7627 -16.9667 -5.1706 4.0000 5.0000 -54.0907 -42.9000 -31.7093 4.0000 6.0000 -36.4627 -24.6667 -12.8706 5.0000 6.0000 8.3641 18.2333 28.1026:圖2-3運(yùn)行結(jié)
29、果圖圖2-4分布示意圖 雙因素一元方差分析.1 Anova2函數(shù)MATLAB統(tǒng)計(jì)工具箱中提供了anova2函數(shù),用來作雙因素一元方差分析,其調(diào)用格式如下:(1) p=anova2(X,reps) 進(jìn)行平衡雙因子方差分析,不同列中的數(shù)據(jù)代表一個(gè)因子A的變化。不同行中的數(shù)據(jù)代表另一因子B的變化。若在每一個(gè)行列匹配點(diǎn)上有一個(gè)以上的觀測(cè)值,則變量reps指示每一個(gè)單元中觀測(cè)值的個(gè)數(shù)。當(dāng)reps=1 (默認(rèn)值可省略)時(shí),anova2函數(shù)返回兩個(gè)p值到p矢量中:零假設(shè)H0A的p值。零假設(shè)為源于因子A的所有樣本(如X中的所有列樣本)取自相同的總體。零假設(shè)H0B的p值。零假設(shè)為源于因子B的所有樣本(如X中的所
30、有行樣本)取自相同的總體。當(dāng)reps1時(shí),anova2在矢量中返回第3個(gè)值:零假設(shè)H0AB的p值。零假設(shè)為因子A和因子B之間沒有交互效應(yīng)。如果任意一個(gè)p值接近于0,則認(rèn)為相關(guān)的零假設(shè)不成立。對(duì)于零假設(shè)H0A,一個(gè)足夠小的p值表示至少有一個(gè)列樣本均值明顯地不同于其他列樣本均值,即因子A存在主效應(yīng);對(duì)于零假設(shè)H0B,一個(gè)足夠小的p值表示至少有一個(gè)行樣本均值明顯地不同于其他行樣本均值,即因子B存在主效應(yīng);對(duì)于零假設(shè)H0AB,一個(gè)足夠小的p值表示因子A與因子B之間存在交互效應(yīng)。為了決定結(jié)果是否是“統(tǒng)計(jì)上顯著的”,需要確定p值。一般地,當(dāng)p值小于0.05或0.01時(shí),認(rèn)為結(jié)果是顯著的。anova2函數(shù)還
31、顯示一個(gè)含方差分析表的圖形。它將X中數(shù)據(jù)的誤差根據(jù)reps的值分為3部分或4部分:由于列均值差異引起的誤差;由于行均值差異引起的誤差;由于行列交互作用引起的誤差(如果reps大于它的默認(rèn)值1);剩下的誤差為不能被任何系統(tǒng)因素解釋的誤差。該方差分析表中包含6列:第1列顯示誤差的來源;第2列顯示來源于每一個(gè)誤差來源的平方和(SS);第3列為與每一個(gè)誤差來源相關(guān)的自由度(df);第4列為均值平方和(MS),它是誤差平方和與自由度的比值,即SS/df;第5列為F統(tǒng)計(jì)量,它是均值平方和的比值;第6列為p值,它是F函數(shù)(fcdf);當(dāng)F增加時(shí)p值減小。(2) p=anova2(X,group,displa
32、yopt) 當(dāng)displayopt參數(shù)設(shè)置為on(默認(rèn)設(shè)置)時(shí),激活A(yù)NOVA表和箱形圖的顯示;displayopt參數(shù)設(shè)置為off時(shí),不予顯示。(3) p,table=anova2() 返回單元數(shù)組表中的ANOVA表(包含列標(biāo)簽和行標(biāo)簽)。(使用Edit菜單中的Copy Text選項(xiàng)可以將ANOVA表以文本形式復(fù)制到剪貼板中。)(4) p,table,stats=anova2() 返回stats結(jié)構(gòu),用于進(jìn)行列因子均值的多重比較檢驗(yàn)。.2應(yīng)用實(shí)例例2-3:為了考察某種電池的最大輸出電壓受板極材料與使用電池的環(huán)境溫度的影響,材料類型(因子)取3個(gè)水平(即3種不同的材料),溫度(因子)也取3個(gè)水
33、平,每個(gè)水平組合下重復(fù)4次試驗(yàn),數(shù)據(jù)如下:表2-3電池最大輸出電壓受板極材料與環(huán)境溫度的影響試驗(yàn)數(shù)據(jù)表溫度152535材料類型1130 155 174 18034 40 80 7520 70 82 582150 188 159 126136 122 106 11525 70 58 453138 110 168 160174 120 150 13996 104 82 60解答:程序:%兩因子等重復(fù)試驗(yàn)(方差分析)y1=130 155 174 18034 40 80 7520 70 82 58;y2=150 188 159 126136 122 106 11525 70 58 45;y3=138
34、110 168 160174 120 150 13996 104 82 60;y=y1 y2 y3;p=anova2(y,4)運(yùn)行結(jié)果:p =0.0043 0.0000 0.0008圖2-5運(yùn)行結(jié)果圖2.2 判別分析 判別分析是用于判別個(gè)體所屬群體的一種統(tǒng)計(jì)方法,判別分析的特點(diǎn)是根據(jù)已掌握的、歷史上每個(gè)類別的若干樣本的數(shù)據(jù)信息,總結(jié)出客觀事物分類的規(guī)律性,建立判別公式和判別準(zhǔn)則。然后,當(dāng)遇到新的樣本點(diǎn)時(shí),只要根據(jù)總結(jié)出來的判別公式和判別準(zhǔn)則,就能判別該樣本點(diǎn)所屬的類別。判別分析是一種應(yīng)用性很強(qiáng)的統(tǒng)計(jì)數(shù)據(jù)分析方法。判別分析的原理:為了能識(shí)別待判斷的對(duì)象x =是屬于已知類中的哪一類?事先必須要有一
35、個(gè)一般規(guī)則, 一旦知道了x的值, 便能根據(jù)這個(gè)規(guī)則立即作出判斷, 稱這樣的一個(gè)規(guī)則為判別規(guī)則.判別規(guī)則往往通過的某個(gè)函數(shù)來表達(dá), 把它稱為判別函數(shù), 記作W(i; x).一旦知道了判別函數(shù)并確定了判別規(guī)則,最好將已知類別的對(duì)象代入檢驗(yàn),這一過程稱為回代檢驗(yàn),以便檢驗(yàn)?zāi)愕呐袆e函數(shù)和判別規(guī)則是否正確。 相關(guān)函數(shù).1 classify函數(shù) 用classify函數(shù)進(jìn)行線性判別分析,其調(diào)用格式如下。(1)class=classify(sample,training,group)將sample數(shù)據(jù)中的每一行分到training參數(shù)中的某一個(gè)類中。sample和training必須為列數(shù)相同的矩陣。grou
36、p 參數(shù)為training參數(shù)的分類變量。它的唯一值定義不同的組,每個(gè)元素定義training的對(duì)應(yīng)行屬于哪一類。group可以是數(shù)值矢量、字符串?dāng)?shù)組成或字符串單元數(shù)組。group和training必須具有相同的行數(shù)。classify函數(shù)將group中的NaN或空字符串視為缺失值,并忽略training的對(duì)應(yīng)行。該函數(shù)返回class,它是一個(gè)與sample具有相同行數(shù)的矢量。class的每個(gè)元素指定sample中每行元素的類別。(2)class,err=classify(.)返回錯(cuò)判誤差率的估計(jì)。該函數(shù)返回trainin中被錯(cuò)判的觀測(cè)量的百分比。.2 mahal函數(shù) 用mahal函數(shù)計(jì)算馬氏距
37、離,其調(diào)用格式如下。(1)mahal(Y,X)計(jì)算X矩陣中的樣本至Y矩陣中每個(gè)點(diǎn)(行)的馬氏距離。Y的列數(shù)必須等于X的列數(shù),但它們的行數(shù)可以不同。X的行數(shù)必須大于列數(shù)。馬氏距離是一個(gè)將數(shù)據(jù)集與空間點(diǎn)分隔開來的多變量度量。在線性判別分析中,使它最小化。 距離判別法 距離判別方法:判別函數(shù)W(i; x) = d (x, ), 其中d (x, )為待判別對(duì)象x到第i類的距離. 判別規(guī)則為若W(k; x) = minW(i; x)| i =1, 2, , r , 則x . 2.2.3 貝葉斯判別法 判別函數(shù)W(i; x ) = 其中為待判別對(duì)象x的概率,如果沒有任何這種附加的先驗(yàn)信息,通常取pi =
38、1/r。為已知類別的分布密度判別規(guī)則為若W(k; x ) = maxW(i; x )| i =1, 2, , r ,則x. Fisher判別法 Fisher判別法是一種線性判別的方法。它的工作思路是對(duì)原數(shù)據(jù)系統(tǒng)進(jìn)行坐標(biāo)變換,尋求能將總體盡可能分開的方向。具體的作法是先引入一個(gè)與樣本同維的待定向量u,再將y取為x坐標(biāo)的線性組合y=而u的選取,要使同一類別產(chǎn)生的y盡量聚攏,不同類別產(chǎn)生的y盡量拉開。 這樣,我們便可將樣品x到某一類G的距離定義為y=與 之間的歐氏距離: 其中c為G的幾何中心Fisher分類的判據(jù)為: 1若 ,則判定義為A類; 2若 ,則判定又為B類; 3若 ,則判定又為不可判類。
39、應(yīng)用實(shí)例例2-4:某地大氣樣品污染分類如下:表2-4大氣樣品污染分類表氣體氯硫化氫二氧化硫碳4環(huán)氧氯丙烷環(huán)己烷污染分類10.0560.0840.0310.0380.00810.022120.0400.0550.1000.1100.02200.0073130.0500.0740.0410.0480.00710.020140.0450.0590.1100.1000.02500.0063150.0380.1300.0790.1700.05800.043260.0300.1100.0700.1600.05000.046270.0340.0950.0580.1600.2000.029180.0300.0
40、900.0680.1800.2200.039190.0840.0660.0290.3200.0120.0412100.0850.0760.0190.3000.0100.0402110.0640.0720.0200.2500.0280.0382120.0540.0650.0220.2800.0210.0402130.0480.0890.0620.2600.0380.0362140.0450.0920.0720.2000.0350.0322150.0690.0870.0270.0500.0890.0211在此地某大型化工廠的廠區(qū)及鄰近地區(qū)挑選4個(gè)有代表性的大氣樣本取樣,獲得數(shù)據(jù)如下:表2-5大氣樣
41、本取樣污染分類表氣體氯硫化氫二氧化硫碳4環(huán)氧氯丙烷環(huán)己烷污染分類樣品10.0520.0840.0210.0370.00710.022樣品20.0410.0550.1100.1100.02100.0073樣品30.0300.1120.0720.1600.0560.021樣品40.0740.0830.1050.1900.0201.000求它們的污染分類。解答:程序:training=0.056 0.084 0.031 0.038 0.0081 0.022; 0.040 0.055 0.100 0.110 0.0220 0.0073; 0.050 0.074 0.041 0.048 0.0071 0
42、.020; 0.045 0.050 0.110 0.100 0.0250 0.0063; 0.038 0.130 0.079 0.170 0.0580 0.043; 0.030 0.110 0.070 0.160 0.0500 0.046; 0.034 0.095 0.058 0.160 0.200 0.029; 0.030 0.090 0.068 0.180 0.220 0.039; 0.084 0.066 0.029 0.320 0.012 0.041; 0.085 0.076 0.019 0.300 0.010 0.040; 0.064 0.072 0.020 0.250 0.028 0
43、.038; 0.054 0.065 0.022 0.280 0.021 0.040; 0.048 0.089 0.062 0.260 0.038 0.036; 0.045 0.092 0.072 0.200 0.035 0.032; 0.069 0.087 0.027 0.050 0.089 0.021; group=1;1 ;1 ;1 ;2 ;2 ;1; 1; 2 ;2 ;2 ;2 ;2 ;2 ;1; sample=0.052 0.084 0.021 0.037 0.0071 0.022; 0.041 0.055 0.110 0.110 0.0210 0.0073; 0.030 0.112
44、0.072 0.160 0.056 0.021; 0.074 0.083 0.105 0.190 0.020 1.000; class,err=classify(sample,training,group,mahalanobis)運(yùn)行結(jié)果:class = 1 1 2 2err = 02.3 主成分分析 主成分分析方法原理主成分分析是把原來多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來看,這是一種降維處理技術(shù)。假定有n個(gè)地理樣本,每個(gè)樣本共有p個(gè)變量描述,這樣就構(gòu)成了一個(gè)np階的地理數(shù)據(jù)矩陣: (21)如何從這么多變量的數(shù)據(jù)中抓住地理事物的內(nèi)在規(guī)律性呢?要解決這一問題,自然要在p維
45、空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進(jìn)行降維處理,即用較少的幾個(gè)綜合指標(biāo)來代替原來較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來較多指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。那么,這些綜合指標(biāo)(即新變量)應(yīng)如何選取呢?顯然,其最簡(jiǎn)單的形式就是取原來變量指標(biāo)的線性組合,適當(dāng)調(diào)整組合系數(shù),使新的變量指標(biāo)之間相互獨(dú)立且代表性最好。如果記原來的變量指標(biāo)為,它們的綜合指標(biāo)新變量指標(biāo)為,(mp)。則 (22)在(2)式中,系數(shù)lij由下列原則來決定:(1)zi與zj(ij;i,j=1,2,m)相互無關(guān);(2)z1是x1,x2,xp的一切線性組合中方差最大者;z2是與z
46、1不相關(guān)的x1,x2,xp的所有線性組合中方差最大者;zm是與z1,z2,zm-1都不相關(guān)的x1,x2,xp的所有線性組合中方差最大者。這樣決定的新變量指標(biāo)z1,z2,分別稱為原變量指標(biāo)x1,x2,xp的第一,第二,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,zm的方差依次遞減。在實(shí)際問題的分析中,常挑選前幾個(gè)最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡(jiǎn)化了變量之間的關(guān)系。從以上分析可以看出,找主成分就是確定原來變量xj(j=1,2,p)在諸主成分zi(i=1,2,m)上的載荷lij(i=1,2,m;j=1,2,p),從數(shù)學(xué)上容易知道,它們分別是x1,x2,xp的相
47、關(guān)矩陣的m個(gè)較大的特征值所對(duì)應(yīng)的特征向量。 主成分分析的計(jì)算步驟(1)計(jì)算相關(guān)系數(shù)矩陣 (23) 在公式(3)中,(i,j=1,2,p)為原來變量與的相關(guān)系數(shù),其計(jì)算公式為: (24)因?yàn)镽是實(shí)對(duì)稱矩陣(即rij=rji),所以只需計(jì)算其上三角元素或下三角元素即可。(2)計(jì)算特征值與特征向量首先解特征方程I-R=0求出特征值i(i=1,2,p),并使其按大小順序排列,即12,p0;然后分別求出對(duì)應(yīng)于特征值i的特征向量ei(i=1,2,p)。(3)計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率。一般取累計(jì)貢獻(xiàn)率達(dá)85-95的特征值,所對(duì)應(yīng)的第一,第二,第m(mp)個(gè)主成分。(4)計(jì)算主成分載荷 (2-5)由此可以
48、進(jìn)一步計(jì)算主成分得分:Z= (2-6) 主成分分析相關(guān)函數(shù)調(diào)用MATLAB工具箱princomp函數(shù)進(jìn)行主成分分析:格式: PC = princomp(X) PC,SCORE,latent,tsquare = princomp(X)說明: PC,SCORE,latent,tsquare=princomp(X)對(duì)數(shù)據(jù)矩陣X進(jìn)行主成分分析,給出各主成分 (PC)、所謂的Z-得分(SCORE)、X的方差矩陣的特征值(latent)和每個(gè)數(shù)據(jù)點(diǎn)的Hotelling統(tǒng)計(jì)量(tsquare)。 應(yīng)用實(shí)例例2-5:城市環(huán)境生態(tài)化是城市發(fā)展的必然趁勢(shì),表現(xiàn)為社會(huì)、經(jīng)濟(jì)、環(huán)境與生態(tài)全方位的現(xiàn)代化水平,一個(gè)符合生
49、態(tài)規(guī)律的生態(tài)城市應(yīng)該是結(jié)構(gòu)合理、功能高效和關(guān)系協(xié)調(diào)的城市生態(tài)系統(tǒng)。所謂結(jié)構(gòu)合理是指適度的人口密度,合理的土地利用,良好的環(huán)境質(zhì)量,充足的綠地系統(tǒng),完善的基礎(chǔ)設(shè)施,有效的自然保護(hù);功能高效是指資源的優(yōu)化配置、物力的經(jīng)濟(jì)投入、人力的充分發(fā)揮、物流的暢通有序、信息流的快捷;關(guān)系協(xié)調(diào)是指人和自然協(xié)調(diào)、社會(huì)關(guān)系協(xié)調(diào)、城鄉(xiāng)協(xié)調(diào)、資源利用和更新協(xié)調(diào)。一個(gè)城市要實(shí)現(xiàn)生態(tài)城市的發(fā)展目標(biāo),關(guān)鍵是在市場(chǎng)經(jīng)濟(jì)的體制下逐步改善城市的生態(tài)環(huán)境質(zhì)量,防止生態(tài)環(huán)境質(zhì)量惡化,因此,對(duì)城市的生態(tài)環(huán)境水平調(diào)查評(píng)價(jià)很有必要。我們對(duì)江蘇省十個(gè)城市的生態(tài)環(huán)境狀況進(jìn)行了調(diào)查,得到生態(tài)環(huán)境指標(biāo)的指數(shù)值。表2-6生態(tài)環(huán)境水平分析和評(píng)價(jià)表解答:
50、利用Matlab中的princomp命令實(shí)現(xiàn)。具體程序如下:x = 0.7883 0 .7391 0.8111 0.6587 0.6543 0.8259 0.8486 0.6834 0.8495 0.7846 0.7633 0.7287 0.7629 0.8552 0.7564 0.7455 0.7800 0.9490 0.8918 0.8954 0.4745 0.5126 0.8810 0.8903 0.8288 0.7850 0.8032 0.8862 0.3987 0.3970 0.8246 0.7603 0.6888 0.8977 0.7926 0.7856 0.6509 0.8902
51、 0.6799 0.9877 0.8791 0.8736 0.8183 0.9446 0.9202 0.9263 0.9185 0.9505 0.8620 0.8873 0.9538 0.9257 0.9285 0.9434 0.9154 0.8871 0.9357 0.8760 0.9579 0.9741 0.8785 0.8542 0.8537 0.9027 0.8729 0.8485 0.8473 0.9044 0.8866 0.9035 0.6305 0.6187 0.6313 0.7415 0.6398 0.6142 0.5734 0.8980 0.6186 0.7382 0.8928 0.7831 0.5608 0.8419 0.8464 0.7616 0.8234 0.6384 0.9604 0.8514x = ;stdr = std(x); %求各變量標(biāo)準(zhǔn)差n,m = size(x);sddata = x./stdr(ones(n,1),:); %標(biāo)準(zhǔn)化變換p,princ,egenvalue = princomp(sddata) %調(diào)用主成分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度瓷磚環(huán)保技術(shù)研發(fā)與轉(zhuǎn)讓合同4篇
- 2025年度智能駕駛培訓(xùn)中心個(gè)人雇傭司機(jī)合同范本4篇
- 二零二五版滅火器產(chǎn)品認(rèn)證與標(biāo)準(zhǔn)制定合同4篇
- 二零二五年酒店管理服務(wù)合同附加員工培訓(xùn)協(xié)議2篇
- 2025年度自動(dòng)化打磨設(shè)備操作工勞動(dòng)合同與技能培訓(xùn)服務(wù)合同4篇
- 二零二五版?zhèn)€人藝術(shù)品居間經(jīng)紀(jì)合同范本2篇
- 二零二五年科研機(jī)構(gòu)勞動(dòng)合同及項(xiàng)目成果歸屬合同3篇
- 二零二四年企業(yè)會(huì)計(jì)債務(wù)重組操作規(guī)范及合同樣本3篇
- 二零二五版酒店住宿+商務(wù)洽談服務(wù)全面合同3篇
- 二零二五年度苗木產(chǎn)業(yè)綠色認(rèn)證與推廣合同4篇
- 寒假作業(yè)一年級(jí)上冊(cè)《數(shù)學(xué)每日一練》30次打卡
- 2024-2025學(xué)年九年級(jí)化學(xué)上冊(cè) 第二單元 單元測(cè)試卷(人教版)
- 2024年公共衛(wèi)生基本知識(shí)考試題庫(附含答案)
- 2024多級(jí)AO工藝污水處理技術(shù)規(guī)程
- 2024年江蘇省鹽城市中考數(shù)學(xué)試卷真題(含答案)
- DZ∕T 0287-2015 礦山地質(zhì)環(huán)境監(jiān)測(cè)技術(shù)規(guī)程(正式版)
- 2024年合肥市廬陽區(qū)中考二模英語試題含答案
- 質(zhì)檢中心制度匯編討論版樣本
- 藥娘激素方案
- 提高靜脈留置使用率品管圈課件
- GB/T 10739-2023紙、紙板和紙漿試樣處理和試驗(yàn)的標(biāo)準(zhǔn)大氣條件
評(píng)論
0/150
提交評(píng)論