6、葡萄酒的評價模型(2012年A題)_第1頁
6、葡萄酒的評價模型(2012年A題)_第2頁
6、葡萄酒的評價模型(2012年A題)_第3頁
6、葡萄酒的評價模型(2012年A題)_第4頁
6、葡萄酒的評價模型(2012年A題)_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、葡萄酒的評價模型摘要如今,葡萄酒被越來越多的人所熱愛,不僅因為它博大精深的酒文化及其上等的品質(zhì),更多的是由于葡萄酒的營養(yǎng)價值。葡萄酒質(zhì)量的鑒別主要靠感官分析和理化指標分析的方法來確定,本文主要討論了葡萄酒質(zhì)量與釀酒葡萄理化指標、葡萄酒理化指標之間的聯(lián)系,分析了葡萄酒人工品評中存在的不足,建立了科學的葡萄酒質(zhì)量評價模型,對葡萄酒市場的穩(wěn)定發(fā)展以及更好地釀造出高質(zhì)量的葡萄酒有著實際的應用價值。對于問題一,本文將兩組品酒員的打分結(jié)果看作兩個配對樣本,采取了配對樣本T檢驗的方法,分別對紅葡萄酒與白葡萄酒的打分情況進行顯著性差異分析。根據(jù)結(jié)果可知,紅、白葡萄酒的打分結(jié)果均存在顯著性差異,且第二組品酒員打

2、分結(jié)果的系統(tǒng)誤差更小,更為可信。對于問題二,本文首先用置信區(qū)間法,將品酒員的打分結(jié)果進行轉(zhuǎn)化處理,得到新的葡萄酒評分。接著,綜合釀酒葡萄的理化指標并運用聚類分析法,分別以紅葡萄酒與白葡萄酒的酒樣作為研究對象,各項指標作為變量,對酒樣進行分級。再通過酒樣類別推出釀酒葡萄的分級情況。對于問題三,為了探尋釀酒葡萄理化指標與葡萄酒理化指標之間的聯(lián)系,本文運用典型相關(guān)的分析方法,將釀酒葡萄的理化指標作為影響因子,試圖找到葡萄酒理化指標對應的少量主要因子。運用SAS軟件對相應的因子進行回歸分析,得出相應因子的系數(shù)方程,以此判斷因子的正負相關(guān)性,從而建立釀酒葡萄與葡萄酒理化指標之間的關(guān)系。對于問題四,分析了

3、釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響。釀酒葡萄的理化指標是葡萄酒的理化指標的主要影響因素,在一定程度上,兩個指標對葡萄酒質(zhì)量的影響可以看作是相似甚至相等,于是本文選取葡萄酒的理化指標進行分析。接著,本文將乙醇與花色苷、單寧、酚類的比值作為新的理化指標,重新建立葡萄酒質(zhì)量評價體系,進而分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響。結(jié)果證明,僅僅用釀酒葡萄和葡萄酒的理化指標,并不能評價葡萄酒的質(zhì)量。關(guān)鍵字:葡萄酒 理化指標 配對T檢驗 聚類分析 典型相關(guān) 多元回歸1、 問題重述葡萄酒的評價確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指

4、標打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量。附件1給出了某一年份一些葡萄酒的評價結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據(jù)。請嘗試建立數(shù)學模型討論下列問題: 1. 分析附件1中兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信? 2. 根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對這些釀酒葡萄進行分級。 3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4. 分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)

5、量?2、 符號說明與模型假設2.1符號說明品酒員i 對酒樣j 的評價第j種酒樣的第i項指標在標準化后的數(shù)值 乙醇/花色苷 乙醇/單寧 乙醇/總酚 酒總黃酮 白藜蘆醇 DPPH半抑制體積 L*(D65) a*(D65) b*(D65) 質(zhì)量2.2模型假設1. 品酒員不帶地區(qū)主觀性,評判公正。2. 葡萄酒樣品的品評得分合理、客觀、全面。2.葡萄酒的制作過程、制作方法不會影響葡萄酒的質(zhì)量。3、 問題分析3.1問題一:品評往往受到評酒人員的嗜好、習慣、情緒、年齡、經(jīng)驗等因素的影響,因為評定常有一定程度的主觀性和不確定性,這是評分的可靠性受到影響。問題要求對兩組品酒員的打分情況進行顯著性差異分析,并得出

6、哪一組的結(jié)果更為可信。首先,我們需要對題給數(shù)據(jù)進行處理簡化,計算每一個酒品樣本的平均得分,在一定程度下減小了主觀打分的誤差。接著,考慮運用配對樣本T檢驗方法,得到較為直觀的分析結(jié)果。3.2問題二:題目要求根據(jù)釀酒葡萄的理化指標和葡萄的質(zhì)量來對葡萄進行分級。一方面,針對問題一用置信區(qū)間法得出的對葡萄酒的評分,我們將其作為葡萄酒的質(zhì)量指標值;另一方面,由于葡萄本身的理化指標過多且復雜,每項理化指標對于葡萄生產(chǎn)成葡萄酒的影響也過于繁雜,故我們利用葡萄酒的理化指標來對葡萄進行分類。在進行聚類分析時,我們以酒樣作為研究對象,各項指標作為變量對酒樣進行聚類分析,再通過酒樣得到的類別大致推出葡萄的分級情況,

7、在此需說明的是紅、白葡萄酒因葡萄品種不同分開討論。3.3問題三:葡萄酒的酒釀過程是一個復雜的化學物理過程,葡萄與葡萄酒的理化指標在一定程度上顯示了這一復雜的變化;但由于數(shù)據(jù)過于龐大繁雜,我們需要建立適當?shù)哪P蛠磉M行數(shù)據(jù)挖掘,從而分析理化指標之間的聯(lián)系。首先,我們要對理化指標進行簡化處理,并通過調(diào)閱文獻,對各理化指標進行全面的理解。這樣的準備工作有助于我們對理化指標的相互關(guān)系作出初步的判斷。隨后,通過建立模型對理化指標進行定量分析,將得到的結(jié)果與實際物化性質(zhì)進行比較分析,得到全面、科學的結(jié)論。理化指標的相關(guān)性分析可采用典型相關(guān)性模型。3.4問題四:問題四需要分析釀酒葡萄和葡萄酒的理化指標對葡萄酒

8、質(zhì)量的影響,而題目中所說“釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系”,恰恰表明釀酒葡萄的理化指標是葡萄酒的理化指標的主要影響因素,在一定程度上兩個指標對葡萄酒質(zhì)量的影響可以看做是相似甚至相等,于是可以選取指標較少的葡萄酒,以他的理化指標來分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響。根據(jù)化學知識,花色苷、單寧、酚類均溶于乙醇,我們以乙醇/花色苷,乙醇/單寧,乙醇/總酚作為新的指標,處理數(shù)據(jù)。對于多個影響因素,本文以紅葡萄酒作為實驗對象,白葡萄酒作為檢驗對象,并將第一問中品酒員對酒評分的平均數(shù)作為某種葡萄酒的真實質(zhì)量,采用多元線性回歸方程,來線性描繪各指標對葡萄酒質(zhì)量的影響,并通過圖形檢

9、驗及白葡萄酒檢驗,來判別上述回歸方程的準確性。其中白葡萄酒的檢驗即為以多元回歸方程估計28種葡萄酒的估計質(zhì)量,并與真實質(zhì)量相比較。對于第二問論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量,本文以指標影響排名(即估計質(zhì)量排名)與真實質(zhì)量排名相比較,若在一定的誤差允許范圍內(nèi),排名有所波動,可以認為能夠用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量,反之,若誤差較大,則不可以。4、 模型的建立與求解4.1問題一4.1.1利用T檢驗分析兩組品酒員的評價差異性對于問題一,要求對兩組品酒員的打分情況進行顯著性差異分析。本文考慮運用多元統(tǒng)計學里的配對樣本T檢驗方法。4.1.1.1配對T檢驗的基本實現(xiàn)思路配對

10、樣本是指對同一樣本進行兩次測試所獲得的兩組數(shù)據(jù),或?qū)蓚€完全相同的樣本在不同條件下進行測試所得的兩組數(shù)據(jù)。根據(jù)題給數(shù)據(jù),兩組品酒員均對27個紅葡萄酒樣本、28個白葡萄酒樣本進行了打分評估,故可以將兩組品酒員的打分結(jié)果看作兩個配對樣本(紅葡萄酒與白葡萄酒),且樣本打分的兩個總體服從正態(tài)分布。兩個獨立樣本的T檢驗,是根據(jù)樣本數(shù)據(jù),對兩個配對樣本來源總體的均值是否有顯著性差異進行推斷。因此,本文先根據(jù)附件一提供的品酒員對葡萄酒的評價結(jié)果,將每位品酒員對每種酒樣的各項指標的得分相加,即可得到兩組品酒員對紅葡萄酒和白葡萄酒的評價總分及平均分(詳見附錄1)。在進行配對T檢驗分析顯著性差異的時候,我們先引進

11、一個新的隨機變量對應的樣本值為其中,。這樣,檢驗的問題就轉(zhuǎn)化為單樣本t檢驗問題(即轉(zhuǎn)化為檢驗Y的均值是否與0有顯著差異)。第二步,建立零假設,第三步,構(gòu)造t統(tǒng)計量第四步,運用Spss自動計算t值和對應的P值。第五步,作出判斷:若P值<顯著水平,則拒絕零假設,即認為兩總體均值存在顯著差異。若P值>顯著水平,則不能拒絕零假設,即認為兩總體均值不存在顯著差異。4.1.1.2 模型的求解接下來我們用兩組品酒員對兩種葡萄酒樣品(包括27種紅葡萄酒和28種白葡萄酒)的平均分通過SPSS軟件做顯著性分析。可得如下: (1)紅葡萄酒:成對樣本統(tǒng)計量均值N標準差均值的標準誤對 1第一組平均分73.0

12、56277.34261.4131第二組平均分70.515273.9780.7656成對樣本相關(guān)系數(shù)N相關(guān)系數(shù)Sig.對 1第一組平均分 & 第二組平均分27.700.000成對樣本檢驗成對差分tdfSig.(雙側(cè))均值標準差均值的標準誤差分的 95% 置信區(qū)間下限上限對 1第一組平均分 - 第二組平均分2.54075.37191.0338.41574.66582.45826.021(2)白葡萄酒:成對樣本統(tǒng)計量均值N標準差均值的標準誤對 1第一組平均分74.011284.8040.9079第二組平均分76.532283.1709.5993成對樣本相關(guān)系數(shù)N相關(guān)系數(shù)Sig.對 1第一組平

13、均分 & 第二組平均分28.240.220成對樣本檢驗成對差分tdfSig.(雙側(cè))均值標準差均值的標準誤差分的 95% 置信區(qū)間下限上限對 1第一組平均分 - 第二組平均分-2.52145.0828.9606-4.4923-.5505-2.62527.014由以上圖分析可知,在紅葡萄酒中的評價中,對應達概率P值sig(雙側(cè))=0.021<0.05拒絕原假設,可認為兩配對變量存在明顯區(qū)別。即第一組品酒員和第二組品酒員的打分存在顯著性差異。同理,白葡萄酒的評價中,sig(雙側(cè))=0.014<0.05同樣存在顯著性差異。而通過分析標準差,第二組的標準差較小點,故第二組的評價結(jié)果

14、更可信。4.1.2 利用置信區(qū)間法進一步優(yōu)化葡萄酒評價為了降低品酒員的異質(zhì)性,可以計算所有品酒員對同一酒樣的平均值() 及其標準差(),則有品酒員i(i=1,2,.10) 對酒樣j(j=1,2,.27或28) 評價的置信區(qū)間為。其中,酒樣j 的平均值,酒樣j 的標準差。如果品酒員i 對酒樣j 的評價()在其置信區(qū)間范圍內(nèi)就可以直接使用;如果其評價() 不在置信區(qū)間范圍內(nèi), 則將品酒員的評價進行逐步調(diào)整, 使不同品酒員對同一酒樣的評價值都處于范圍內(nèi), 即:若,則(為調(diào)整后在置信區(qū)間內(nèi)的酒樣評價);若,則。根據(jù)以上算法,我們可以利用可信度較高的第二組品酒員的得分算出兩種葡萄酒經(jīng)置信區(qū)間轉(zhuǎn)換后的數(shù)據(jù)

15、(見附錄2)。由以上置信區(qū)間法,我們可以大致得到一個關(guān)于紅酒質(zhì)量的評估(由優(yōu)到劣排序):紅葡萄酒:酒樣9、酒樣23、酒樣20、酒樣3、酒樣17、酒樣4、酒樣2、酒樣19、酒樣21、酒樣14、酒樣5、酒樣26、酒樣27、酒樣24、酒樣22、酒樣16、酒樣1、酒樣12、酒樣10、酒樣13、酒樣25、酒樣6、酒樣15、酒樣7、酒樣8、酒樣18、酒樣11白葡萄酒: 酒樣9、酒樣25、酒樣5、酒樣21、酒樣10、酒樣28、酒樣15、酒樣17、酒樣22、酒樣1、酒樣23、酒樣19、酒樣4、酒樣3、酒樣14、酒樣18、酒樣6、酒樣27、酒樣26、酒樣24、酒樣20、酒樣2、酒樣7、酒樣13、酒樣12、酒樣1

16、1、酒樣8、酒樣16在對葡萄酒的感官評價中, 由于品酒員間存在評價尺度、評價位置和評價方向等方面的差異,導致不同品酒員對同一酒樣的評價差異很大,從而不能真實地反映不同酒樣間的差異。因此,在對感官評價結(jié)果進行統(tǒng)計分析時,必須對品酒員的原始數(shù)據(jù)進行相應的處理,以真實反映樣品間的差異。而置信區(qū)間法對原始數(shù)據(jù)進行調(diào)整,能有效地降低品酒員間的差異,真實地反映酒樣間的客觀差異。4.2問題二(聚類分析模型)4.2.1聚類分析模型原理簡介聚類分析(又稱群分析)是研究樣品分類(或指標)問題的一種多元統(tǒng)計方法。聚類分析有多種,這里主要介紹系統(tǒng)聚類法(Hierarchical Cluster)和快速聚類法(K-Me

17、ans Cluster)。系統(tǒng)聚類法是根據(jù)事物本身的特征研究個體分類的方法,原則是同一類中的個體有較大的相似性,不同類中的個體差異很大。而快速聚類法是非系統(tǒng)聚類法中最常用聚類法,優(yōu)點是占內(nèi)存少、計算量小、處理速度快,適合大樣本的聚類分析,但是其只能對觀測量(樣本)聚類,而不能對變量聚類,且使用的聚類變量必須都是連續(xù)變量。所謂聚類分析就是根據(jù)樣品或指標的“相似”特征進行分類的一種多元統(tǒng)計分析方法,這里指的類就是“相似”元素的集合。進行聚類分析需要知道待分類的若干樣品及其指標值,然后通過每一類指標數(shù)據(jù)的分析,進一步對各個結(jié)構(gòu)進行優(yōu)化。聚類分析的基本思想是定義樣品之間的距離(或相似系數(shù))和類與類之間

18、的距離。一按開始將n個樣品各自自成一類,這時類間的距離與樣品間的距離是一致的,然后將距離最近的兩個類進行合并形成一個新類,并計算新類與其他類之間的距離,再按距離最小準則并類。每并類一次,類的個數(shù)就減少。這個過程持續(xù)到所有樣品都被歸為一類為止。需要在此說明,聚類分析中距離的計算有多種方法,譬如,最短距離法、最遠距離法、中間距離法、重心法、類平均法、離差平方法等,可根據(jù)各自不同特點在建模時自行選擇特定的距離計算法,這里不再具體闡述。4.2.2數(shù)據(jù)處理在問題二中,題目要求用附件2所給的有關(guān)釀酒葡萄的理化指標和葡萄酒的質(zhì)量來對葡萄進行分級。然而實際操作中我們無法知曉有關(guān)葡萄本身性質(zhì)的理化指標對葡萄酒的

19、影響(即正面影響或負面影響),故我們采用葡萄酒的理化指標和葡萄酒的質(zhì)量對葡萄進行分級。在處理葡萄酒的理化指標時我們對進行過多次測試的指標值取平均值,并且將二級指標剔除在外,同時用問題一所得出的紅、白兩種葡萄酒的在置信區(qū)間內(nèi)的平均分作為兩種葡萄酒的質(zhì)量指標值,因此我們對紅、白葡萄進行聚類分析時,共有10或9個指標作為聚類的標準。但是由于各指標值在數(shù)量級上差異較大,并且在單位上均有不同,當作為指標變量來對酒樣進行聚類時容易導致有較大的偏差,故我們先對數(shù)據(jù)進行標準化處理,標準化的公式為(i=1,2,.27或28,j=1,2,.10或9)在上述公式中,表示第j種酒樣的第i項指標在標準化后的數(shù)值,即可得

20、到處理后的數(shù)據(jù)(詳見附錄3)。在SPSS里進行聚類分析后,可得到酒樣品的分類,從而推出出葡萄的分類或分級。4.2.3模型的求解在上述知識的基礎(chǔ)上,我們通過SPSS軟件求解上述問題,可得如下數(shù)據(jù)分析列表:有關(guān)紅葡萄酒的相關(guān)數(shù)據(jù):樹狀圖: * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 La

21、bel Num +-+-+-+-+-+ 酒樣品15 15 -+ 酒樣品16 16 -+ 酒樣品18 18 -+-+ 酒樣品13 13 -+ +-+ 酒樣品10 10 -+-+ | 酒樣品25 25 -+ | | 酒樣品27 27 -+ +-+ 酒樣品19 19 -+-+ | 酒樣品24 24 -+ | | 酒樣品4 4 -+ | | 酒樣品22 22 -+-+ | +-+ 酒樣品5 5 -+ | | | | 酒樣品6 6 -+-+ | | 酒樣品17 17 -+ | | 酒樣品7 7 -+-+ | +-+ 酒樣品12 12 -+ +-+ | | 酒樣品14 14 -+-+ | | 酒樣品26

22、26 -+ | | 酒樣品11 11 -+-+ | 酒樣品20 20 -+ | 酒樣品1 1 -+-+ | 酒樣品8 8 -+ | | 酒樣品3 3 -+-+ +-+ 酒樣品9 9 -+ +-+ | 酒樣品2 2 -+ +-+ | 酒樣品21 21 -+ +-+ 酒樣品23 23 -+根據(jù)以上的樹狀圖,我們可以根據(jù)葡萄酒的分類推出釀酒葡萄的分級(分類),即大致可將紅葡萄分為四大類:第一類23,21,2,9,3,第二類8,1第三類20,11,26第四類14,12,7,17,6,5,22,4,24,19,27,25,10,13,18,16,15上面四大類的等級分別由優(yōu)到劣。同理可得白葡萄酒的相關(guān)數(shù)

23、據(jù):樹狀圖:* * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 酒樣品2 2 -+ 酒樣品6 6 -+ 酒樣品1 1 -+ 酒樣品21 21 -+-+ 酒樣品19 19 -+ | 酒樣品11 11 -+-+-+ 酒樣品25 25 -+ | |

24、酒樣品10 10 -+ | 酒樣品12 12 -+-+ | 酒樣品15 15 -+ +-+-+ 酒樣品20 20 -+ | | 酒樣品13 13 -+-+ | | 酒樣品18 18 -+ +-+ +-+ 酒樣品3 3 -+ | | 酒樣品7 7 -+ | | 酒樣品8 8 -+-+ | 酒樣品16 16 -+ +-+ 酒樣品4 4 -+ | | 酒樣品9 9 -+-+ | | 酒樣品23 23 -+ +-+ | +-+ 酒樣品5 5 -+ +-+ | | 酒樣品28 28 -+ | +-+ 酒樣品17 17 -+ | | 酒樣品14 14 -+-+ | | 酒樣品22 22 -+ +-+ |

25、酒樣品26 26 -+ | 酒樣品24 24 -+-+ 酒樣品27 27 -+根據(jù)以上的樹狀圖,我們可以根據(jù)葡萄酒的分類推出釀酒葡萄的分級(分類),即大致可將白葡萄分為三大類:第一類27,24第二類26,22,14第三類17,28,5,23,9,4,16,8,7,3,18,13,20,15,12,10,25,11,19,21,1,6,2上述三大類的等級分別由優(yōu)到劣。4.3問題三(典型相關(guān)性分析模型) 為了探尋釀酒葡萄理化指標與葡萄酒理化指標之間的聯(lián)系,由于數(shù)據(jù)量大而繁雜,若單純使用統(tǒng)計回歸模型,擬合度將會很低,不能真實地反應回歸函數(shù)。本文考慮運用典型相關(guān)的分析方法,試圖找到單一理化指標對應的少

26、量主要因子,運用SAS軟件對相應的因子進行回歸分析,得出相應因子的系數(shù)方程,以此判斷因子的正負相關(guān)性,從而建立釀酒葡萄與葡萄酒理化指標之間的關(guān)系。4.3.1 模型的準備4.3.1.1典型相關(guān)分析 典型相關(guān)分析是統(tǒng)計方法家族中的年輕成員,是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。典型相關(guān)分析的基本思想類似于主成分分析,首先在每組變量中找出變量的線性組合,使其具有最大相關(guān)性,而從同一組內(nèi)部提取的各主成分之間互不相關(guān),用從兩組之間分別提取的主成分的相關(guān)性來描述兩組變量整體的線性相關(guān)關(guān)系。這樣,討論兩組變量之間的相關(guān)就轉(zhuǎn)化為只研究這些線性組合的最大相關(guān),從而減少研究變量的個數(shù)。4.3.1.2典型相

27、關(guān)分析計算步驟(一)根據(jù)分析目的建立原始矩陣一般,原始數(shù)據(jù)矩陣為(二)對原始數(shù)據(jù)進行標準化變化并計算相關(guān)系數(shù)矩陣 = 其中,分別為第一組變量和第二組變量的相關(guān)系數(shù)陣,= 為第一組變量和第二組變量的相關(guān)系數(shù)。(三)求典型相關(guān)系數(shù)和典型變量 計算矩陣以及矩陣的特征值和特征向量,分別得典型相關(guān)系數(shù)和典型變量。最后,檢驗各典型相關(guān)系數(shù)的顯著性在步驟(一)中,與是兩個相互關(guān)聯(lián)的隨機向量,利用主成分分析,分別在兩組變量中選取若干有代表性的綜合變量,使每一綜合變量都是原變量的一個線性組合,即我們只考慮方差為1的,的線性函數(shù),求使它們相關(guān)系數(shù)達到最大的這一組。若存在常向量,使得則稱,是,的第一對典型相關(guān)變量。

28、求出第一對典型相關(guān)變量之后,可以類似地去求第二對,第三對這些典型相關(guān)變量就反映了,之間的線性相關(guān)的情況。也可以按照相關(guān)系數(shù)絕對值的大小來排列各對典型相關(guān)變量之間的先后次序,使得第一對典型相關(guān)變量相關(guān)系數(shù)的絕對值最大,第二對次之判斷各對典型相關(guān)變量相關(guān)系數(shù)的絕對值是否顯著大于零,如果是,這一對綜合變量就真的具有代表性;否則,這一對變量就不具有代表性,可以忽略。對于釀酒葡萄和葡萄酒的理化指標的分析,可以通過對少數(shù)典型相關(guān)變量的研究,代替原來兩組之間的相關(guān)關(guān)系的研究,從而容易抓住關(guān)系的本質(zhì),盡可能給出較為深刻的分析結(jié)果。數(shù)據(jù)處理與結(jié)果分析 首先,我們將釀酒葡萄與葡萄酒的理化指標進行簡化分類。本文在進

29、行典型相關(guān)性分析時,保留了氨基酸總量、白藜蘆醇(mg/kg)、黃酮醇(mg/kg)、總糖g/L、還原糖g/L等藍色一級指標。一級指標已具有代表性,在釀酒過程中起到?jīng)Q定性作用。剔除了各類氨基酸、果糖g/L、葡萄糖g/L等若干紅色二級指標,并不會對典型分析結(jié)果造成太大影響;若一個指標項目下有幾列測量數(shù)據(jù),取各列數(shù)據(jù)的平均值代替該理化指標;在進行典型分析的時候,暫不考慮果皮顏色與葡萄酒色澤兩個理化指標,這兩個理化指標影響著葡萄酒的色調(diào),將作為色澤物理因素單獨考慮。4.3.1.3釀酒葡萄與紅葡萄酒的理化指標關(guān)系首先,模型將對紅葡萄酒與對應的釀酒葡萄的理化指標進行分析。 典型相關(guān)分析可以通過SPSS和S

30、AS實現(xiàn),本文使用功能強大的SAS軟件來實現(xiàn)理化指標的相關(guān)分析。SAS/STAT中的CANCORR模塊是用來實現(xiàn)典型相關(guān)分析的。樣本程序見表:讀取數(shù)據(jù),這里的一組變量表示釀酒紅葡萄的理化指標,分別為氨基酸總量mg/100gfw(X1),蛋白質(zhì)mg/100g(X2),VC含量(mg/L)(X3),花色苷mg/100g鮮重(X4),總酸(g/L)(X5),多酚氧化酶活力E(A/min·g·ml)(X6),褐變度A/g*g*min*ml(X7),DPPH自由基1/IC50(g/L)(X8),總酚(mmol/kg)(X9),單寧(mmol/kg)(X10),葡萄總黃酮(mmol/k

31、g)(X11),白藜蘆醇(mg/kg)(X12), 黃酮醇(mg/kg)( X13), 總糖g/L(X14), 還原糖g/L(X15), 可溶性固形物g/l(X16), PH值(X17), 可滴定酸(g/l)(X18), 固酸比(X19), 干物質(zhì)含量g/100g(X20), 果穗質(zhì)量/g(X21), 百粒質(zhì)量/g(X22), 果梗比(%)(X23), 出汁率(%)(X24), 果皮質(zhì)量(g)(X25)。另外一組變量表示紅葡萄酒的理化指標,分別為花色苷(mg/L)(Y1),單寧(mmol/L)(Y2),總酚(mmol/L)(Y3),酒總黃酮(mmol/L)(Y4),白藜蘆醇(mg/L)(Y5)

32、,DPPH半抑制體積(IV50)1/IV50(uL)(Y6)。得到部分輸出結(jié)果如下:SAS系統(tǒng)對釀酒紅葡萄、紅葡萄酒理化指標的分析Canonical StructureCorrelations Between the 'VAR Variables and the CanonicalVariables of the 'WITH'VaricablesV1V2V3V4V5V6x10.1587-0.31160.40390.48-0.2373-0.1282x20.41560.03510.26710.24690.1359-0.1344x3-0.0712-0.15860.0334-0

33、.0817-0.0188-0.0202x40.09610.72020.48460.27560.22870.0362x50.35180.460.27650.02350.0649-0.1412x6-0.02290.49620.24710.4140.04940.0562x70.10420.63650.405-0.05840.21040.1679x80.17510.28780.64430.28960.2546-0.0529x90.12810.29340.71670.31840.30870.0888x100.10650.38490.40590.47040.22020.0079x110.10180.249

34、40.80520.07960.26760.0282x120.0431-0.0562-0.0860.09690.5711-0.0454x130.633-0.0350.17620.2109-0.0384-0.0271x140.0113-0.25030.2478-0.0230.32990.0384x150.1011-0.20870.47510.15260.05510.1409x160.1405-0.20570.14890.47240.55280.1391x17-0.2688-0.23660.28550.21690.17380.1424x180.0677-0.2632-0.00590.0579-0.2

35、751-0.0407x19-0.02150.21990.16160.02660.32330.1325x200.1643-0.09960.40030.19080.00750.0161x21-0.03930.1235-0.226-0.1048-0.2809-0.009x22-0.3451-0.06130.0574-0.1099-0.1490.0781x230.14650.2801-0.08290.5342-0.0244-0.1736x24-0.12260.21350.3420.15360.17960.1885x250.0814-0.0495-0.0076-0.0702-0.19270.2127Co

36、rrelations Between the 'with' variablesand the canonical variables of the 'var' variablesW1W2W3W4W5W6Y10.22060.74650.18360.57430.12730.0916Y20.29090.20140.60650.67360.21780.0047Y30.29740.43120.72890.3750.2174-0.0215Y40.08210.3360.71520.30290.43580.2088Y5-0.27570.1654-0.4074-0.04460.8

37、379-0.0652Y60.27650.26820.79290.38810.1520.1779 輸出結(jié)果表示原始變量間的相關(guān)關(guān)系。變量經(jīng)過計算機的成分分析,被分為W2、W3、W4、W5四個典型相關(guān)變量,分別對應著各自的Xi典型相關(guān)因子。下面我們就根據(jù)模型的計算結(jié)果,對各個理化指標進行定量、定性的分析。葡萄酒中的花色苷(mg/L) 根據(jù)典型相關(guān)性分析的結(jié)果可知,花色苷(mg/L)(Y1)與釀酒葡萄中的VC含量(mg/L)(X3)、花色苷mg/100g鮮重(X4)、總酸(g/L)(X5),多酚氧化酶活力E(A/min·g·ml)(X6),褐變度A/g*g*min*ml(X7)、

38、可滴定酸(g/l)(X18)有較強的相關(guān)性。根據(jù)文獻,葡萄組織中的酶可以破壞葡萄與葡萄酒中花色素苷,在花色苷降解過程中,涉及到的酶有糖苷酶和多酚氧化酶這兩大類。維生素C 在氧化中可以產(chǎn)生H2O2,對2-苯基苯并吡喃陽離子的2位碳進行親核進攻,從而產(chǎn)生無色的酯和香豆素等衍生物,最終產(chǎn)生褐色沉淀物(即褐變反應)。模型的結(jié)果與現(xiàn)實是高度符合的。葡萄酒中的總酚(mmol/L)、酒總黃酮(mmol/L)與 DPPH半抑制體積(IV50) 1/IV50(uL) 在第二對典型相關(guān)變量中,葡萄酒中的總酚(mmol/L)(Y3),酒總黃酮(mmol/L)(Y4),DPPH自由基1/IC50(g/L)(Y6)與釀

39、酒葡萄中的DPPH自由基1/IC50(g/L)(X8),總酚(mmol/kg)(X9),葡萄總黃酮(mmol/kg)(X11),還原糖g/L(X15),PH值(X17),干物質(zhì)含量g/100g(X20),出汁率(%)(X24)具有較強的相關(guān)性。 輸出結(jié)果直觀地體現(xiàn)了第二對典型相關(guān)變量之間相互聯(lián)系。我們通過調(diào)閱文獻,并結(jié)合化學知識可知,對結(jié)果進行進一步分析:酚類物質(zhì)在一般條件下較難實現(xiàn)氧化還原,故本文判斷:影響葡萄酒中總酚含量的主要因子為葡萄中的總酚含量,多酚氧化酶活力對酚類物質(zhì)的影響并不顯著。而對于酒總黃酮,在一般情況下,酸類物質(zhì)難以被還原為酮類物質(zhì),且葡萄酒發(fā)酵過程為氧化反應,故酒總黃酮大部

40、分為葡萄中原有的黃酮類物質(zhì),當然也不排除在有還原糖的情況下酸類物質(zhì)可被還原為酮類。 考慮到DPPH自由基主要在多酚氧化酶作用下與酚類物質(zhì)進行反應,在判斷DPPH半抑制體積的影響因素時,我們?nèi)PPH自由基、總酚作為影響因子。葡萄酒中的單寧(mmol/L) 第三對典型相關(guān)變量是一組復相關(guān)系數(shù)分析。根據(jù)輸出結(jié)果可以判斷,葡萄酒中的單寧(mmol/L)(Y2)與氨基酸總量mg/100gfw(X1)、單寧(mmol/kg)(X10)、可溶性固形物g/l(X16)、 果梗比(%)(X23)有著顯著的相關(guān)性。 通過調(diào)閱文獻我們可知,單寧是一類結(jié)構(gòu)復雜的多元酚類的物質(zhì)。單寧可溶于水和乙醇中, 生成膠狀溶液,

41、具有不穩(wěn)定性。因此紅葡萄在發(fā)酵時采用連皮帶肉成為果漿時發(fā)酵, 其目的是為了獲取更多的單寧和色素, 使葡萄果實的梗因含單寧星最高, 因此在果實破碎時必須除梗, 主要是果梗中的單寧粗糙且澀口, 會破壞酒質(zhì)。模型的輸出結(jié)果梗比(%)的影響系數(shù)達到了0.5342,為理化指標的聯(lián)系提供了很好的依據(jù)。葡萄酒中的白藜蘆醇(mg/L) 最后,我們找出第四對典型相關(guān)變量。葡萄酒中的白藜蘆醇與釀酒葡萄中白藜蘆醇(mg/kg)(X12)、總糖g/L(X14)、果穗質(zhì)量/g(X21)含量有關(guān),顯示如下:已有的研究表明, 葡萄中白藜蘆醇的生物合成途徑同苯丙氨酸代謝途徑密切相關(guān)。白藜蘆醇原本是葡萄等植物受到逆境脅迫產(chǎn)生的

42、次生代謝產(chǎn)物,用以抵抗逆境對自身的進一步破壞。由于植物防御體系的作用,它的出現(xiàn)往往伴隨著植物體內(nèi)多種與抗病相關(guān)的生物酶被激活。根據(jù)模型的分析結(jié)果可知,釀酒葡萄中的白藜蘆醇直接影響著葡萄酒中的白藜蘆醇含量。紅葡萄酒中的色澤L 色澤作為一個較特殊的物理因素,極大影響著專業(yè)品酒員對葡萄酒外觀色澤地評定。為了探究色澤理化指標與釀酒葡萄部分理化指標的聯(lián)系,我們首先做出初步的相關(guān)性判斷,對相應的因子進行回歸分析,得出相應因子的系數(shù)。調(diào)閱文獻可知,研究指出花色苷和單寧為葡萄酒色澤的最重要影響成分。紅葡萄酒中的呈色物質(zhì)主要是花色苷,它是決定紅葡萄酒品質(zhì)和感官質(zhì)量的重要因素之一;褐變反應也是葡萄酒成色的一大原因

43、;我們判斷,影響葡萄酒色澤的主要因子有:花色苷、果梗比、果皮顏色、單寧、褐變度。本文運用SPSS軟件,對色澤有關(guān)的理化指標進行分析,結(jié)果如下:模型匯總模型RR 方調(diào)整 R 方標準 估計的誤差1.856a.733.67012.276484a. 預測變量: (常量), 果皮顏色L, 果梗比, 單寧, 褐變度, 花色苷。系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版1(常量)25.00258.136.430.672花色苷-.141.054-.592-2.592.017褐變度.002.011.027.162.873單寧.620.519-.188-1.194.246果梗比-2.7192.68

44、9-.143-1.011.324果皮顏色L1.8962.232.124.850.405a. 因變量: 色澤L得到葡萄酒中色澤L指數(shù)的對應函數(shù): 4.3.1.4釀酒葡萄與白葡萄酒的理化指標關(guān)系運用典型相關(guān)性分析模型,我們可以對白葡萄酒與釀酒葡萄的理化指標進行相關(guān)性分析。通過比對數(shù)據(jù)我們發(fā)現(xiàn),白葡萄酒中去除了花色苷(mg/L)這一與色澤顯著相關(guān)的理化指標,且釀酒葡萄樣品中,花色苷指標最大值僅為4.103mg/100g,固可以剔除這一指標的影響;其他理化指標的處理與紅葡萄酒相同。運用SAS軟件,計算得到白葡萄酒與釀酒葡萄的理化指標之間的函數(shù)關(guān)系。由于計算過程與數(shù)據(jù)分析方法與4.3.1.3相同,這里就

45、不再累述。(見附錄4)綜合4.3.1.3,我們得出結(jié)論:釀酒葡萄與葡萄酒的理化指標之間存在顯著聯(lián)系,典型相關(guān)性模型的計算結(jié)果清晰地顯現(xiàn)了這些特征,模型為葡萄酒的酒釀過程的科學分析提供了理論依據(jù)。4.4問題四(多元線性回歸)問題四需要分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,而題目中所說“釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系”,釀酒葡萄的理化指標是葡萄酒的理化指標的主要影響因素,在一定程度上兩個指標對葡萄酒質(zhì)量的影響可以看作是相似甚至相等,于是本文選取葡萄酒的理化指標,對指標做出必要的處理,來求出釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響程度。4.4.1數(shù)據(jù)處理就常識而言,高質(zhì)

46、量的葡萄酒中酒精(即乙醇)的含量至關(guān)重要,但是這并不表示酒精的含量越多越好。查閱資料,我們知道,花色苷,單寧,酚類均溶于乙醇,若是乙醇過多必會導致花色苷,單寧,酚類的流失,進而對葡萄酒的色,香,味均會產(chǎn)生重要的影響。于是,本文選取乙醇與花色苷、單寧、酚類的比值作為新的理化指標,重新建立葡萄酒的理化指標與葡萄酒的質(zhì)量關(guān)系(質(zhì)量為題目所給的品酒員的打分的平均分)。數(shù)據(jù)處理(見附錄5):4.4.2 預估計各因素與質(zhì)量的關(guān)系(多元回歸模型)由上述已處理的數(shù)據(jù),本文運用SPSS進行多元回歸方程的分析,得出各個理化指標對葡萄酒質(zhì)量的影響。所以,各項指標x1,x2,x3,x4,x5,x6,x7,x8,x9對

47、葡萄酒質(zhì)量y的影響可以用多元回歸方程表示,如下: 4.4.3 檢驗上述多元回歸方程的可靠性及準確性 根據(jù)上述方程,本文以白葡萄酒作為檢驗項,來檢驗方程的可靠性,有方程求出各酒樣品的估計質(zhì)量,并與真實質(zhì)量相比較,檢驗準確性。數(shù)據(jù)如下:品種編號估計質(zhì)量實際質(zhì)量酒樣品161.4649577.9酒樣品261.127175.8酒樣品363.0908976.79369酒樣品462.4907776.9酒樣品555.6296180.47476酒樣品658.3368476.45336酒樣品773.5028974.2酒樣品855.6142172.3酒樣品940.0395981.43086酒樣品1064.43649

48、79.8酒樣品1156.0797572.33714酒樣品1267.4573773.5834酒樣品1368.0344173.9酒樣品1435.281676.70153酒樣品1565.0788479.13515酒樣品1680.5117267.3酒樣品1759.4771579.05975酒樣品1869.745776.7酒樣品1961.9987476.91034酒樣品2059.4317375.89258酒樣品2154.6467980.0025酒樣品2259.6770578.66788酒樣品2355.5860477.4酒樣品2470.9387776.1酒樣品2560.9079880.53199酒樣品26

49、59.7269576.32879酒樣品2771.5907676.40372酒樣品2857.4269679.6圖表三:白葡萄酒的估計質(zhì)量與實際質(zhì)量 由上表可知,估計質(zhì)量與實際質(zhì)量有著相同的趨勢,基本符合一定的規(guī)律,說明該回歸方程具有一定的準確性。然后,以估計質(zhì)量作為自變量,實際質(zhì)量作為因變量,建立二者關(guān)系,并通過一系列檢驗驗證他們是否滿足一定的關(guān)系。即證明上述的多元回歸方程的準確性。通過上述檢驗,我們可以認為釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響滿足改多元方程,即 所以各指標對質(zhì)量的影響程度就可以通過該方程式反應出來。4.4.4論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量要論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量,即可以用指標影響程度方程做出的預估計葡萄酒質(zhì)量的排名和真實品酒員品評出來的葡萄酒的排名

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論