版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)學實驗計算機科學與技術(shù)成員:xxx學號:xxxxxxxxxx葡萄酒的評價摘要本文主要研究的是如何對葡萄酒進行評價的問題。通過對評酒員的評分與釀酒葡萄的理化指標和葡萄酒的理化指標等原始數(shù)據(jù)進行統(tǒng)計、分析和處理,我們得出了一個較為合理地評價葡萄酒質(zhì)量優(yōu)劣的模型。在問題一中,我們采用T檢驗法,首先進行正態(tài)分布擬合檢驗,判斷出它們服從正態(tài)分布。之后,我們通過T檢驗法判斷出了兩組評酒員的評價結(jié)果具有顯著性差異。而對于如何判斷哪一組評酒員的評價結(jié)果更可信,由于評酒員評分的客觀性,我們通過計算評酒員評分均值的置信區(qū)間,利用置信區(qū)間的長短來判斷評分的可信程度。置信區(qū)間越窄,說明其越可信。利用Matlab軟件
2、求出了第二組評酒員的評分均值的置信區(qū)間更窄,所以第二組評酒員的評價結(jié)果更可信。在問題二中,我們采用主成分分析法,把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量再按照方差依次遞減的順序排列。在數(shù)學變換中保持變量的總方差不變,使第一變量具有最大的方差。第二變量的方差次大,并且和第一變量不相關(guān)。由于變量較多,雖然每個變量都提供了一定的信息,但其重要性有所不同。依次類推,最后我們將釀酒葡萄分為了四個等級:優(yōu)質(zhì)、次優(yōu)、中等、下等。在問題三中,我們通過多項式曲線擬合的方法,構(gòu)造一個以葡萄酒的理化指標為自變量,釀酒葡萄的理化指標為因變量的函數(shù),并利用Matlab軟件進行曲線擬合,最后得
3、出釀酒葡萄與葡萄酒的理化指標之間的關(guān)系為呈線性正相關(guān)。在問題四中,我們用無交互作用的雙因素試驗的方差分析方法,通過對觀測、比較、分析實驗數(shù)據(jù)的結(jié)果,鑒別出了兩個因素在水平發(fā)生變化時對實驗結(jié)果產(chǎn)生顯著性影響的大小程度。最后,我們認為能用釀酒葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量,且釀酒葡萄的理化指標對葡萄酒質(zhì)量影響相對葡萄酒的理化指標更顯著。關(guān)鍵詞:T檢驗法,Matlab,正態(tài)分布,主成分分析法,多項式曲線擬合,方差分析一 問題的重述確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞
4、與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量。附件1給出了某一年份一些葡萄酒的評價結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據(jù)。請嘗試建立數(shù)學模型討論下列問題:1. 分析附件1中兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信?2. 根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量?附件1:葡萄酒品嘗評分表(含4個表格)附件2:葡萄和葡萄酒的理化指標(
5、含2個表格)附件3:葡萄和葡萄酒的芳香物質(zhì)(含4個表格)二 基本假設(shè)與符號說明2.1 基本假設(shè)(1)評酒員的評分是客觀公正的,不受任何外界因素影響。(2)用來檢驗的葡萄都是剛采摘的新鮮葡萄,葡萄酒也沒有遭受任何污染。(3)在檢測釀酒葡萄和葡萄酒的理化指標的過程中,忽略由于人為操作不當帶來的誤差。(4)由于不是每組數(shù)據(jù)都對葡萄酒的質(zhì)量產(chǎn)生很大影響,所以在處理數(shù)據(jù)過程中,忽略那些影響不是很明顯的理化指標。2.2 符號說明 第組評酒員對各品種紅葡萄酒的評分均值的期望 第組評酒員對各品種紅葡萄酒的評分均值的方差 問題一的假設(shè) 第個主成分 第個評酒員對第種酒的評分三 問題的分析針對問題一,如何判斷兩組評
6、酒員的評價結(jié)果有無顯著性差異,我們采用T檢驗法進行判斷。但采用T檢驗法的前提是其必須服從正態(tài)分布,方差未知且相等。所以我們先對那些數(shù)據(jù)進行正態(tài)分布檢驗,判斷其是否服從正態(tài)分布。驗證服從正態(tài)分布后,我們利用T檢驗法判斷兩組評酒員評價結(jié)果的顯著性差異。對于如何判斷哪一組評酒員的評價結(jié)果更可信,由于評酒員評分的客觀性,我們通過計算評酒員評分均值的置信區(qū)間,利用置信區(qū)間的長短來判斷評分的可信程度。置信區(qū)間越窄,說明其越可信。針對問題二中如何根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對釀酒葡萄進行分級,我們采用主成分分析法。因為在實際問題的研究中,往往會涉及眾多有關(guān)的變量。但是,變量太多不但會增加計算的復雜性
7、,而且也會給合理地分析問題和解釋問題帶來困難。一般說來,雖然每個變量都提供了一定的信息,但其重要性有所不同,而在很多情況下,變量間有一定的相關(guān)性,從而使得這些變量所提供的信息在一定程度上有所重疊。因而人們希望對這些變量加以“改造”,用為數(shù)極少的互補相關(guān)的新變量來反映原變量所提供的絕大部分信息,通過對新變量的分析達到解決問題的目的。解決這個問題的過程中,我們用Matlab軟件實現(xiàn)主成分分析,我們對那些理化指標進行重新整理,求出各個理化指標的之間的相關(guān)系數(shù)、特征值及特征向量和貢獻率等。針對問題三中如何分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系,我們想到了用多項式曲線擬合的方法,根據(jù)兩者理化指標實測樣
8、本,用統(tǒng)計分析的方法,找出一種適當?shù)暮瘮?shù)關(guān)系從而達到處理釀酒葡萄與葡萄酒之間相關(guān)關(guān)系的目的。實際的操作過程中,我們首先構(gòu)造一個關(guān)于釀酒葡萄與葡萄酒的理化指標的函數(shù),以葡萄酒的理化指標為自變量,釀酒葡萄的理化指標為因變量,利用Matlab軟件進行曲線擬合,得出釀酒葡萄與葡萄酒的理化指標之間的關(guān)系。針對問題四中如何分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,以及能否用釀酒葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量,我們采用無交互作用的雙因素試驗的方差分析方法。用方差分析,可以將影響葡萄酒的主要因素和次要因素區(qū)分開來,還可以分別算出釀酒葡萄的理化指標和葡萄酒的理化指標與葡萄酒質(zhì)量之間的誤差,如果
9、誤差在可接受范圍之內(nèi),即說明可以用釀酒葡萄和葡萄酒的理化指標來評價葡萄酒質(zhì)量。四 模型的建立與求解4.1 問題一的模型建立與求解4.1.1 T檢驗法的模型建立與求解T檢驗是用T分布理論來推論差異發(fā)生的概率,從而比較兩個均值的差異是否顯著。由于檢驗紅葡萄酒與白葡萄酒的方法和模型一樣,這里我們只給出檢驗紅葡萄酒的模型。1. 正態(tài)分布的檢驗由于使用T檢驗法的前提是兩個總體分布都服從正態(tài)分布,我們先利用Excel軟件計算出:第一組評酒員對各品種紅葡萄酒的評分均值為:62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,5
10、8.7,74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73第二組評酒員對各品種紅葡萄酒的評分均值為:68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5然后我們利用Matlab軟件里的正態(tài)分布擬合函數(shù)進行曲線擬合,得出其正態(tài)分布的擬合曲線圖為圖一:圖一、正態(tài)分布擬合曲線圖 從圖中我們知道其曲線近似為一條直線,因此我們認為評酒員對紅葡
11、萄酒以及白葡萄酒的評分均值都服從正態(tài)分布。2. T檢驗法模型的建立與求解設(shè),分別為第一組、第二組評酒員對各品種紅葡萄酒的評分均值,且,其中均未知。(1) 作出統(tǒng)計假設(shè)。(2) 選取統(tǒng)計量(3) 對于給定的顯著性水平,我們利用Matlab軟件進行計算求解。結(jié)果如下表所示: 葡萄酒的品種H值P值差異顯著程度第一組紅葡萄酒00.9396差異不顯著第二組紅葡萄酒第一組白葡萄酒11.4077e-006差異非常顯著第二組白葡萄酒 H=0,表示接受原假設(shè);H=1,表示接受背擇假設(shè)。由上表可知:紅葡萄酒之間不存在顯著性差異,白葡萄酒之間存在顯著性差異。4.1.2 可信度的判定由于樣本的置信區(qū)間與其可信度是呈負
12、相關(guān)的,即置信區(qū)間越小,其可信度越大。我們利用Matlab軟件求解得出第一組、第二組紅葡萄酒和白葡萄酒的置信區(qū)間,見下表:葡萄酒的置信區(qū)間紅葡萄酒的置信區(qū)間白葡萄酒的置信區(qū)間第一組70.3377,75.773472.3342,76.1872第二組69.6890,71.960775.3788,77.6855顯然第二組的置信區(qū)間長度小于第一組,所以第二組評酒員的評價結(jié)果可信度更高。4.2 問題二的模型建立與求解主成分分析法是一種數(shù)學變換的方法, 它把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量按照方差依次遞減的順序排列。在數(shù)學變換中保持變量的總方差不變,使第一變量具有最大的方
13、差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關(guān),稱為第二主成分。依次類推,I個變量就有I個主成分。1.計算相關(guān)系數(shù)矩陣 (1)在(1)式中,為原變量的與之間的相關(guān)系數(shù),其計算公式為 (2)因為R是實對稱矩陣(即),所以只需計算上三角元素或下三角元素即可。2.計算特征值與特征向量首先解特征方程,通常用雅可比法求出特征值,并使其按大小順序排列,即。然后分別求出對應于特征值的特征向量。這里要求=1,即,其中表示向量的第個分量。3.計算主成分貢獻率及累計貢獻率貢獻率:第個主成分方差在全部方差中所占的比重稱為貢獻率。這個值越大,表明第個主成分綜合信息的能力越強。主成分的貢獻率為 (3)累積
14、貢獻率:前個主成分共有多大的綜合能力,用這個主成分的方差和在全部方差中所占的比重來描述,表明取前個主成分基本包含了全部測量指標所具有信息的百分率。累計貢獻率為 (4)一般取累計貢獻率達的特征值所對應的第一、第二,第個主成分。4.計算主成分載荷主成分載荷是反映主成分與元變量之間的相互關(guān)聯(lián)程度。其計算公式為 (5)于是Matlab軟件求解,分別得出紅葡萄與白葡萄所分的主成分、特征值、貢獻率以及累計貢獻率,結(jié)果見下表一及表二:表一 紅葡萄主成分的特征值、貢獻率及累計貢獻率主成分特征值貢獻率/%累計貢獻率/%25.332893.83%93.83%0.90493603.35%97.18%0.642733
15、2.38%99.56%0.07179380.27%99.83%0.02378080.09%99.92%0.01096010.04%99.96%0.006848440.03%99.99%0.003760270.01%100%由上表可看出,主成分所占的累計貢獻率已高達93.83%(大于85%),故只需求出第一主成分即可。對于特征值 25.3328求出其特征向量,再用公式計算各變量,在主成分上的載荷為:0.9351,0.9791,0.9611,0.9878,0.9830,0.9812,0.9920,0.9101,0.9958,0.9837,0.9873,0.9877,0.9828,0.8736,0.
16、9924,0.9834,0.9837,0.9911,0.9925,0.9877,0.9661,0.9921,0.9981,0.9781,0.9866,0.7914,0.9420第一主成分與都呈現(xiàn)正相關(guān)性。因此我們認為:載荷=0.9981的(即果穗質(zhì)量)與主成分有極強的正相關(guān)。所以,我們根據(jù)的含量水平為葡萄進行排名:排名如下樣品編號果穗質(zhì)量/g紅葡萄樣品26793.47紅葡萄樣品24517.45紅葡萄樣品5515.46紅葡萄樣品17446.64紅葡萄樣品20307.14紅葡萄樣品25288.69紅葡萄樣品27282.09紅葡萄樣品23278.75紅葡萄樣品10255.44紅葡萄樣品8213.09
17、紅葡萄樣品14209.11紅葡萄樣品6202.24紅葡萄樣品18196.01紅葡萄樣品12191.95紅葡萄樣品9186.62紅葡萄樣品1182.93紅葡萄樣品11177.83紅葡萄樣品19173.09紅葡萄樣品13159.97紅葡萄樣品15159.31紅葡萄樣品21147.66紅葡萄樣品4137.97紅葡萄樣品16119.17紅葡萄樣品22106.61紅葡萄樣品383.13紅葡萄樣品281.62紅葡萄樣品763.61因此依據(jù)以果穗質(zhì)量的含量水平為重要指標,我們得出紅葡萄品質(zhì)級別如下表:紅葡萄等級排名紅萄萄品質(zhì)級別果穗質(zhì)量/g優(yōu)質(zhì)紅葡萄300.00以上次優(yōu)紅葡萄300.00以下,200.00以
18、上中等紅葡萄200.00以下,100.00以上下等紅葡萄100.00以下同理,我們也可以得到白葡萄所分的主成分、特征值、貢獻率以及累計貢獻率,結(jié)果見下表: 表二 白葡萄主成分的特征值、貢獻率及累計貢獻率主成分特征值貢獻率/%累計貢獻率/%26.595994.99%94.99%0.6436692.30%97.29%0.5295171.89%99.18%0.1689120.6%99.78%0.04917270.18%99.96%0.007006920.03%99.99%0.002075360.01%100%由上表可看出,主成分所占的累計貢獻率已高達94.99%(大于85%),故只需求出第一主成分即
19、可。對于特征值 26.5959求出其特征向量,再用公式計算各變量在主成分上的載荷為:0.8815,0.9947,0.9679,0.9898,0.9870,0.9974,0.9961,0.9912,0.9925,0.9965,0.9956,0.9977,0.9044,0.9769,0.9876,0.9786,0.9958,0.9865,0.9590,0.9962,0.8611,0.9926,0.9269,0.9899,0.9940,0.9895,0.9702,0.9738第一主成分與都呈現(xiàn)正相關(guān)性。因此我們認為:載荷=0.9977的(即單寧含量)與主成分有極強的正相關(guān)。所以,我們根據(jù)的含量水平為
20、葡萄進行排名結(jié)果如下白葡萄單寧(mmol/kg)葡萄樣品248.506 葡萄樣品106.781 葡萄樣品226.463 葡萄樣品276.251 葡萄樣品185.783 葡萄樣品265.517 葡萄樣品74.729 葡萄樣品284.583 葡萄樣品64.502 葡萄樣品94.434 葡萄樣品233.389 葡萄樣品113.312 葡萄樣品123.212 葡萄樣品43.148 葡萄樣品203.141 葡萄樣品32.990 葡萄樣品12.947 葡萄樣品252.757 葡萄樣品152.751 葡萄樣品52.626 葡萄樣品142.388 葡萄樣品172.247 葡萄樣品22.239 葡萄樣品162.
21、228 葡萄樣品192.217 葡萄樣品132.129 葡萄樣品211.952 葡萄樣品81.672 因此我們規(guī)定白葡萄品質(zhì)級別如下表:白葡萄等級排名白葡萄品質(zhì)級別單寧含量(mmol/kg)優(yōu)質(zhì)白葡萄5.000以上次優(yōu)白葡萄5.000以下,3.000以上中等白葡萄3.000一下,2.000以上下等白葡萄2.000以下4.3 問題三的模型建立與求解如果一個被解釋變量(因變量)有個解釋變量(自變量), 同時,不僅是的線性函數(shù),而且是參數(shù)和(通常未知)的線性函數(shù),隨即誤差項為,那么多元線性回歸模型可以表示為: 這里為總體多元線性回歸方程,簡稱總體回歸方程。其中,k表示解釋變量個數(shù),稱為截距項,是總體
22、回歸系數(shù)。表示在其他自變量保持不變的情況下,自變量變動一個單位所引起的因變量Y平均變動的數(shù)量,因而也稱之為偏回歸系數(shù)。當給定一個樣本時,上述模型可以表示為:此時,與已知,與未知。其相應的矩陣表達式為:可以簡化為:通過Matlab軟件進行多項式擬合,得出如下圖所示的結(jié)果:白葡萄的擬合誤差圖白葡萄酒的擬合圖紅葡萄的擬合誤差圖紅葡萄酒的擬合圖由圖表得出:釀酒葡萄與葡萄酒的理化指標呈線性正相關(guān)。4.4 問題四的模型建立與求解在實際應用中,一個試驗結(jié)果(試驗指標)往往受多個因素的影響。不僅這些因素會影響試驗結(jié)果,而且這些因素的不同水平的搭配也會影響試驗結(jié)果。統(tǒng)計學上把多因素不同水平搭配對試驗指標的影響稱
23、為交互作用。交互作用在多因素的方差分析中,把它當成一個新因素來處理。4.1.1 無交互作用的雙因素試驗的方差分析的模型建立假設(shè)某個試驗中,有兩個可控因素在變化,因素有個水平,記作;因素有個水平,記作;則與的不同水平組合。共有個,每個水平組合稱為一個處理,每個處理只作一次試驗,得個觀測值,得雙因素無重復實驗表:因素因素同時假設(shè):(1)相互獨立; (2),(方差齊性)。線性統(tǒng)計模型:其中所有期望值的總平均:水平對試驗結(jié)果的效應:水平對試驗結(jié)果的效應:滿足的性質(zhì):要分析因素A,B的差異對試驗結(jié)果是否有顯著影響,即為檢驗如下假設(shè)是否成立:總離差平方和的分解定理:仿單因素方差分析的方法,考察總離差平方和
24、:稱為因素A的離差平方和,反映因素 A 對試驗指標的影響。稱為因素B的離差平方和,反映因素 B 對試驗指標的影響。稱為誤差平方和,反映試驗誤差對試驗指標的影響。若假設(shè)成立,則:可推得: 將的自由度分別記作,則對給定的檢驗水平,當時,拒絕,即因素的影響有統(tǒng)計意義。當時,拒絕,即因素的影響有統(tǒng)計意義。雙因素(無交互作用)試驗的方差分析表方差來源平方和自由度均方和F值F值臨界值因素A因素B誤差總和注意 : 各因素離差平方和的自由度為水平數(shù)減一,總平方和的自由度為試驗總次數(shù)減一。,,的簡便計算式為:其中:于是通過matlab軟件計算得到ANOVA表格如下: ANOVA表Source SS df MS
25、F Prob>F-Columns 10084 1 10084 0.46 0.0355Rows 43679 2 21839.5 1 0.0074Interaction 6289.4 2 3144.7 Error 131291 6 21881.8Total 191343.4 11所以,由結(jié)果知第一個p值代表列樣本均值相同的假設(shè)值,反映了釀酒葡萄的理化指標的影響。由于<0.05,故可得葡萄酒的理化指標對葡萄酒質(zhì)量的影響顯著。同理,因為,所以可知釀酒葡萄的理化指標對葡萄酒質(zhì)量影響相對葡萄酒的理化指標更顯著。六參考文獻【1】 劉超,MATLAB基礎(chǔ)與實踐教程,機械工業(yè)出版社,2011年。【2
26、】 戴朝壽,數(shù)理統(tǒng)計簡明教程,高等教育出版社,2009年?!?】 陽明盛,熊西文,林建華,MATLAB基礎(chǔ)與數(shù)學軟件,大連理工大學出版社,2003年。【4】 韓中庚,數(shù)學建模方法及其應用,高等教育出版社,2005年?!?】 費業(yè)泰,誤差理論與數(shù)據(jù)處理,機械工業(yè)出版社,2005年。附錄MATLAB程序問題一:A1=62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73;H,P,JBSTAT,CV=
27、jbtest(A1,0.04)H =0P =0.1589JBSTAT =3.6795CV =6.4378A2=68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8, 72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5;H,P,JBSTAT,CV=jbtest(A2,0.04)H =0P =0.7696JBSTAT =0.5239CV =6.4378B1=82,74.2,85.3,79.4,71,68.4,77.5,71.4,72.9,74.3
28、,72.3,63.3,65.9,72, 72.4,74,78.8,73.1,72.2,77.8,76.4,71,75.9,73.3,77.1,81.3,64.8,81.3;H,P,JBSTAT,CV=jbtest(B1,0.04)H =0P =0.9124JBSTAT =0.1834CV =6.4378B2=77.9,75.8,75.6,76.9,81.5,75.5,74.2,72.3,80.4,79.8,71.4,72.4,73.9,77.178.4,67.3,80.3,76.7,76.4,76.6,79.2,79.4,77.4,76.1,79.5,74.3,77,79.6;H,P,JBST
29、AT,CV=jbtest(B2,0.04)H =0P =0.1684JBSTAT =3.5625CV =6.4378X=A1,A2;subplot 121;normplot(X);legend('A1 check','A2 check');Y=B1,B2;subplot 122;normplot(Y);legend('B1 check','B2 check');alpha=0.05P,H=ranksum(A1,B1,0.05)P =0.9396H =0P,H=ranksum(A2,B2,0.05)P =1.4077e-006H =
30、1sigma=sqrt(51.91728);ex=73.05556;p=1-0.05/2;u=norminv(p,0,1)u =1.9600mu=ex-u*sigma/sqrt(n1),ex+u*sigma/sqrt(n1)mu =70.3377 75.7734sigma=sqrt(15.2383);ex=70.51481;p=1-0.05/2;u=norminv(p,0,1)u =1.9600mu=ex-u*sigma/sqrt(n2),ex+u*sigma/sqrt(n2)mu =69.689 71.9607sigma=sqrt( 26.08667);ex=74.26071;p=1-0.0
31、5/2;u=norminv(p,0,1)u =1.9600mu=ex-u*sigma/sqrt(n1),ex+u*sigma/sqrt(n1)mu =72.3342 76.1872sigma=sqrt(9.695753 );ex=76.53214;p=1-0.05/2;u=norminv(p,0,1)u =1.9600mu=ex-u*sigma/sqrt(n2),ex+u*sigma/sqrt(n2)mu = 75.3788 77.6855問題二:%cwfac.mfunction result=cwfac(vector);fprintf(' 相關(guān)系數(shù)矩陣:n')std=CORR
32、COEF(vector) %計算相關(guān)系數(shù)矩陣fprintf('特征向量(vec)及特征值(val):n')vec,val=eig(std) %求特征值(val)及特征向量(vec)newval=diag(val) ;y,i=sort(newval) ; %對特征根進行排序,y為排序結(jié)果,i為索引fprintf('特征根排序:n')for z=1:length(y) newy(z)=y(length(y)+1-z);endfprintf('%gn',newy)rate=y/sum(y);fprintf('n貢獻率:n')newrat
33、e=newy/sum(newy)sumrate=0;newi=;for k=length(y):-1:1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=i(k); if sumrate>0.85 break; end end %記下累積貢獻率大85%的特征值的序號放入newi中fprintf('主成分數(shù):%gnn',length(newi);fprintf('主成分載荷:n')for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval(newi(p
34、)*vec(q,newi(p); endend %計算載荷disp(result)%cwprint.mfunction print=cwprint(filename,a,b); %filename為文本文件文件名,a為矩陣行數(shù)(樣本數(shù)),b為矩陣列數(shù)(變量指標數(shù))fid=fopen(filename,'r')vector=fscanf(fid,'%g',a b);fprintf('標準化結(jié)果如下:n')v1=cwstd(vector)result=cwfac(v1);cwscore(v1,result);%cwscore.m,計算得分functi
35、on score=cwscore(vector1,vector2);sco=vector1*vector2;csum=sum(sco,2);newcsum,i=sort(-1*csum);newi,j=sort(i);fprintf('計算得分:n')score=sco,csum,j %得分矩陣:sco為各主成分得分;csum為綜合得分;j為排序結(jié)果%cwstd.m, function std=cwstd(vector)cwsum=sum(vector,1); % a,b=size(vector); % for i=1:a for j=1:b std(i,j)= vector(
36、i,j)/cwsum(j); endend問題三:利用多項式曲線擬合 來對葡萄酒及葡萄進行擬合wine=8,7.286,6.271,4.914,3.6304,0.224;putao=273.1,237.303,35.4449,24.478,6.724,1.101; n=1:3;p1=polyfit(wine,putao,n(1)p2= polyfit(wine,putao,n(2)p3=polyfit(wine,putao,n(3)putao1=polyval(p1,wine);putao2=polyval(p2,wine);putao3=polyval(p3,wine);plot(wine,
37、putao,'ko',wine,putao1,'-k*',wine,putao2,'-kx',wine,putao3,':kd');xlabel('wine');ylabel('putao');legend('原始數(shù)據(jù)','1次曲線','2次曲線','3次曲線');p1 = 33.5390 -73.1553p2 = 10.0945 -49.2906 19.4525p3 = Columns 1 through 3 2.3094 -18.9
38、459 41.5641 Column 4 -6.7461各次擬合曲線與原數(shù)據(jù)的比較結(jié)果如圖所示,。由p3可得3次擬合曲線多項式函數(shù)為:F=p3(1)x3+p3(2)x2+p3(3)x+p3(4)=2.3094x3-18.9459x2+41.5641x-6.7461接著求的y的3次擬合的曲線機器預測誤差范圍+-deltay代碼如下:p,s=polyfit(wine,putao,3);putao3,deltay=polyval(p,wine,s);putaolo=putao3-deltay;putaoup=putao3+deltay;plot(wine,putao,'ko',wine,putao2,'-k*',wine,putaolo,'-.bs',wine,putaoup,'-.bd');xlabel('w
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度養(yǎng)殖場與科研機構(gòu)合作研發(fā)合同3篇
- 二零二五年度CNG儲能系統(tǒng)設(shè)計安裝合同2篇
- 2024年電氣設(shè)備安裝協(xié)議8篇
- 2024門面承包經(jīng)營合同書
- 2024試用期電子商務平臺網(wǎng)絡(luò)主播勞動合同3篇
- 2024美容院美容項目管理及用工合作協(xié)議3篇
- 2025年度石材翻新施工項目風險評估與應急預案合同3篇
- 2024正規(guī)借款合同模板范本
- 2024年電氣設(shè)備行業(yè)市場調(diào)查與分析合同
- 二零二五年度農(nóng)村土地經(jīng)營權(quán)流轉(zhuǎn)服務平臺合作協(xié)議3篇
- 《數(shù)學課程論》課件
- 初中必背古詩文138首
- 車站調(diào)度員(技師)技能鑒定理論考試題庫(含答案)
- 2024年房屋交接確認書
- 【深信服】PT1-AF認證考試復習題庫(含答案)
- 反芻動物消化道排泄物原蟲診斷技術(shù)規(guī)范
- 開放系統(tǒng)10861《理工英語(4)》期末機考真題及答案(第102套)
- 2024年國家能源集團招聘筆試參考題庫含答案解析
- 藝術(shù)留學作品集合同模板
- 2024-2025年上海中考英語真題及答案解析
- 新疆喀什地區(qū)巴楚縣2023-2024學年九年級上學期1月期末化學試題
評論
0/150
提交評論