基于數(shù)理分析的葡萄評(píng)價(jià)體系數(shù)學(xué)建模A題優(yōu)秀論文_第1頁(yè)
基于數(shù)理分析的葡萄評(píng)價(jià)體系數(shù)學(xué)建模A題優(yōu)秀論文_第2頁(yè)
基于數(shù)理分析的葡萄評(píng)價(jià)體系數(shù)學(xué)建模A題優(yōu)秀論文_第3頁(yè)
基于數(shù)理分析的葡萄評(píng)價(jià)體系數(shù)學(xué)建模A題優(yōu)秀論文_第4頁(yè)
基于數(shù)理分析的葡萄評(píng)價(jià)體系數(shù)學(xué)建模A題優(yōu)秀論文_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于數(shù)理分析的葡萄評(píng)價(jià)體系摘要葡萄酒質(zhì)量的好壞主要依賴于評(píng)酒員的感觀評(píng)價(jià),由于人為主觀因素的影響,對(duì)于酒質(zhì)量的評(píng)價(jià)總會(huì)存在隨機(jī)差異,為此找到一種簡(jiǎn)單有效的客觀方法來(lái)評(píng)酒,就顯得尤為重要了。本文通過(guò)研究釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量的關(guān)系,以及葡萄酒和釀酒葡萄檢測(cè)的理化指標(biāo)的關(guān)系,以及葡萄酒理化指標(biāo)與葡萄酒質(zhì)量的關(guān)系,旨在通過(guò)客觀數(shù)據(jù)建立數(shù)學(xué)模型,用客觀有效的方法來(lái)評(píng)價(jià)葡萄酒質(zhì)量。對(duì)于問(wèn)題一,我們首先用配對(duì)樣品t 檢驗(yàn)方法研究?jī)山M評(píng)酒員評(píng)價(jià)差異的顯著性,將紅葡萄酒與白葡萄酒進(jìn)行分類處理,用SPSS 軟件對(duì)兩組評(píng)酒員的評(píng)分的各個(gè)指標(biāo)以及總評(píng)分進(jìn)行了配對(duì)樣本t 檢驗(yàn)。得到的部分結(jié)果顯示:紅葡萄酒外

2、觀色調(diào)、香氣質(zhì)量的評(píng)價(jià)存在顯著性差異,其他單指標(biāo)的評(píng)價(jià)不存在顯著差異, 白葡萄、紅葡萄以及整體的評(píng)價(jià)存在顯著性差異。 接著我們建立了數(shù)據(jù)可信度評(píng)價(jià)模型比較兩組數(shù)據(jù)的可信性,將數(shù)據(jù)的可信度評(píng)價(jià)轉(zhuǎn)化成對(duì)兩組評(píng)酒員評(píng)分的穩(wěn)定性評(píng)價(jià)。首先我們對(duì)單個(gè)評(píng)酒員評(píng)分與該組所有評(píng)酒員評(píng)分的均值的偏差進(jìn)行了分析,偏差不穩(wěn)定的點(diǎn)就成為噪聲點(diǎn),表明此次評(píng)分不穩(wěn)定。然后我們用兩組評(píng)酒員評(píng)分的偏差的方差衡量評(píng)酒員的穩(wěn)定性。得到第2 組的方差明顯小于第1 組的,從而得出了第2 組評(píng)價(jià)數(shù)據(jù)的可信度更高的結(jié)論。 對(duì)于問(wèn)題二,我們根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒質(zhì)量對(duì)葡萄進(jìn)行了分級(jí)。一方面,我們對(duì)釀酒葡萄的一級(jí)理化指標(biāo)的數(shù)據(jù)進(jìn)行標(biāo)

3、準(zhǔn)化,基于主成分分析法對(duì)其進(jìn)行了因子分析,并且得到了27 種葡萄理化指標(biāo)的綜合得分及其排序。另一方面,我們又對(duì)附錄給出的各單指標(biāo)百分制評(píng)分的權(quán)重進(jìn)行評(píng)價(jià),并用信息熵法重新確定了權(quán)重,用新的權(quán)重計(jì)算出27 種葡萄酒質(zhì)量的綜合得分并排序。最后我們對(duì)兩個(gè)排名次序用基于模糊數(shù)學(xué)評(píng)價(jià)方法將葡萄的等級(jí)劃分為1-5 級(jí)。 對(duì)于問(wèn)題三,首先我們將眾多的葡萄理化指標(biāo)用主成分分析法綜合成6 個(gè)主因子,并將葡萄等級(jí)也列為主因子之一。對(duì)葡萄的6 個(gè)主因子,以及葡萄酒的10 個(gè)指標(biāo)用SPSS 軟件進(jìn)行偏相關(guān)分析,得到酒黃酮與葡萄的等級(jí)正相關(guān)性較強(qiáng)等結(jié)論。之后對(duì)相關(guān)性較強(qiáng)的主因子和指標(biāo)作多元線性回歸。得到了葡萄酒10 個(gè)

4、單指標(biāo)與主因子之間的多元回歸方程,該回歸方程定量表示兩者之間的聯(lián)系。 對(duì)于問(wèn)題四,我們首先將葡萄酒的理化指標(biāo)標(biāo)準(zhǔn)化處理,對(duì)葡萄酒的質(zhì)量與葡萄的6 個(gè)主因子和葡萄酒的10 個(gè)單指標(biāo)作偏相關(guān)分析,并求出多元線性回歸方程。該方程就表示了葡萄和葡萄酒理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響。之后,我們通過(guò)通徑分析方法中的逐步回歸分析得到葡萄與葡萄酒的理化指標(biāo)只確定了葡萄酒質(zhì)量信息的47%。從而得出了不能用葡萄和葡萄酒的理化指標(biāo)評(píng)價(jià)葡萄酒的質(zhì)量的結(jié)論。接著我們還采用通徑分析中的間接通徑系數(shù)分析求出各自變量之間通過(guò)傳遞作用對(duì)應(yīng)變量的影響,得到單寧與總酚傳遞性影響較強(qiáng)等結(jié)論。 最后,我們對(duì)模型的改進(jìn)方向以及優(yōu)缺點(diǎn)進(jìn)行了討

5、論。 關(guān)鍵詞:配對(duì)樣本t檢驗(yàn) 主成分分析 模糊數(shù)學(xué)評(píng)價(jià) 多元線性回歸1問(wèn)題重述葡萄酒的感官質(zhì)量是評(píng)價(jià)葡萄酒質(zhì)量?jī)?yōu)劣的重要標(biāo)志。確定葡萄酒質(zhì)量時(shí)一般是通過(guò)聘請(qǐng)一批有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)。每個(gè)評(píng)酒員在對(duì)葡萄酒進(jìn)行品嘗后對(duì)其分類指標(biāo)打分,然后求其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測(cè)的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量,可輔助感官檢查。附件中給出了某一年份一些葡萄酒的評(píng)價(jià)結(jié)果,并分別給出了該年份這些葡萄酒的和釀酒葡萄的成分?jǐn)?shù)據(jù),我們需要建立數(shù)學(xué)問(wèn)題解決以下問(wèn)題:1. 分析附件1中兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無(wú)顯著性差異,哪一組結(jié)果更可信?2

6、. 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。3. 分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的質(zhì)量?2問(wèn)題分析1.1. 問(wèn)題的重要性分析(社會(huì)背景) 眾所周知,葡萄酒質(zhì)量的好壞,主要靠感官品嘗和理化指標(biāo)分析的方法來(lái)確定。目前我國(guó)規(guī)定,對(duì)葡萄酒的感官品嘗主要從色澤,香氣,口味,風(fēng)格四個(gè)方面進(jìn)行品評(píng),而品評(píng)往往受到評(píng)酒人員的嗜好,習(xí)慣, 情緒,年齡,經(jīng)驗(yàn)等因素的影響,評(píng)定常有一定程度的主觀性和不確定性,這使評(píng)分的可靠性受到影響。如何解決以上一系列問(wèn)題變得非常重要。 1.2. 有關(guān)方

7、面在這個(gè)問(wèn)題上做過(guò)的研究現(xiàn)有文獻(xiàn)中大部分都從葡萄酒和釀酒葡萄的物理化學(xué)屬性方面進(jìn)行研究,一般只得到定性結(jié)果,很少見(jiàn)到定量具體分析,不利于葡萄酒質(zhì)量的控制與提高。本文基于對(duì)所給三個(gè)附件數(shù)據(jù)的處理和分析,針對(duì)各具體問(wèn)題提出了若干數(shù)學(xué)模型得到了較為滿意的解答。3問(wèn)題假設(shè)1. 假設(shè)各樣本能真實(shí)客觀地反映釀酒葡萄與葡萄酒的情況; 2. 葡萄酒的質(zhì)量只與釀酒葡萄的好壞有關(guān),忽略釀造過(guò)程中的溫度、濕度、人為干擾等其他因素的影響; 3. 不考慮理化性質(zhì)的二級(jí)指標(biāo); 4. 每組評(píng)酒員的打分不受上個(gè)酒樣品的影響,即各評(píng)分?jǐn)?shù)據(jù)間獨(dú)立;5.假設(shè)20 名評(píng)酒員的評(píng)價(jià)尺度在同一區(qū)間,個(gè)人偏好影響可以忽略。4模型符號(hào)解釋紅

8、葡萄的樣品號(hào) i=1、227白葡萄的樣品號(hào) i=1、228評(píng)酒員對(duì)紅葡萄指標(biāo)的各種評(píng)分 i=1、2 j=0、19評(píng)酒員對(duì)白葡萄指標(biāo)的各種評(píng)分 i=1、2 j=0、19,紅,白釀酒葡萄的各種理化指標(biāo) i=0、1,紅,白葡萄酒的各種理化指標(biāo) i=0、1評(píng)酒員評(píng)出的紅葡萄樣品的總分 i=1、2 j=0、127評(píng)酒員評(píng)出的白葡萄樣品的總分 i=1、2 j=0、128評(píng)酒員對(duì)10個(gè)樣品的評(píng)分的總分每組中兩樣本各對(duì)數(shù)據(jù)之差5模型的建立與分析5.1數(shù)據(jù)的預(yù)處理 經(jīng)過(guò)對(duì)數(shù)據(jù)的查找,我們發(fā)現(xiàn)部分原始數(shù)據(jù)存在異常,另外有些類型數(shù)據(jù)存在缺失, 在此我們將其正常化處理。 缺失數(shù)據(jù)的處理 對(duì)于數(shù)據(jù)中存在的缺失現(xiàn)象,本文

9、采用均值替換法對(duì)這種缺失數(shù)據(jù)進(jìn)行處理。 均值替換法就是將該項(xiàng)目剔除異常數(shù)據(jù)后取整剩余數(shù)據(jù)的平均值來(lái)替換異?;蛉笔?shù)據(jù)的方法,即: 其中, 為缺失值。 由于不同品酒師對(duì)同一樣本相同項(xiàng)目的打分值差別不大,所以認(rèn)為采用均值替換法來(lái)處理缺失數(shù)據(jù)是可行的。以“酒樣品20”色調(diào)數(shù)據(jù)為例進(jìn)行修補(bǔ),得到修正后的數(shù)據(jù)如下表所示。 由于不同品酒師對(duì)同一樣本相同項(xiàng)目的打分值差別不大,所以認(rèn)為采用均值替換法來(lái)處理缺失數(shù)據(jù)是可行的。以“酒樣品20”色調(diào)數(shù)據(jù)為例進(jìn)行修補(bǔ),得到修正后的數(shù)據(jù)如下表所示。 5.2.1葡萄酒配對(duì)樣品的t 檢驗(yàn) 問(wèn)題一中配對(duì)樣品為27 組兩個(gè)完全相同的酒樣品在兩組不同評(píng)酒員的檢測(cè)下得到的兩組數(shù)據(jù),

10、其中兩組中各個(gè)指標(biāo)的數(shù)據(jù)為各組10 個(gè)評(píng)酒員對(duì)該指標(biāo)打分的平均值。該問(wèn)題中的10 個(gè)指標(biāo)分別為:外觀澄清度、外觀色調(diào)、香氣純正度、香氣濃度、香氣質(zhì)量、口感純正度、口感濃度、口感持久性、口感質(zhì)量、平衡/總體評(píng)價(jià)。 根據(jù)t 檢驗(yàn)的原理,對(duì)葡萄酒配對(duì)樣品進(jìn)行t 檢驗(yàn)之前我們要對(duì)樣品進(jìn)行正態(tài)性檢驗(yàn)。首先我們根據(jù)附件一并處理表格中的數(shù)據(jù),得到配對(duì)樣品的兩組數(shù)據(jù), 繪制紅葡萄酒配對(duì)樣品表格部分?jǐn)?shù)據(jù)如表1: 白葡萄酒配對(duì)樣品表格部分?jǐn)?shù)據(jù)如表2: 從上表中我們能看出,將白葡萄酒和紅葡萄酒中的每個(gè)指標(biāo)分別進(jìn)行樣品的配對(duì)后,每一個(gè)指標(biāo)的配對(duì)結(jié)果有27 對(duì),每一對(duì)的雙方分別是1 組和2 組的評(píng)酒員對(duì)該指標(biāo)的評(píng)分的平

11、均值。 5.2.2樣本總體的K-S 正態(tài)性檢驗(yàn) 配對(duì)樣品的t 檢驗(yàn)要求兩對(duì)應(yīng)樣品的總體滿足正態(tài)分布,則總體中的樣品應(yīng)該滿足正態(tài)性或者近似正態(tài)性,樣本的正態(tài)性檢驗(yàn)如下: 以紅葡萄酒的澄清度的27 組數(shù)據(jù)為例分析:利用SPSS 軟件繪制兩樣品的直方圖和趨勢(shì)圖如圖1 所示: 我們假設(shè)兩組總體數(shù)據(jù)都服從正態(tài)分布,利用SPSS 軟件進(jìn)行K-S 正態(tài)性檢驗(yàn)的具體結(jié)果見(jiàn)附錄2.3。兩組數(shù)據(jù)的近似相伴概率值P 分別為0.239 和0.329, 大于我們一般的顯著水平0.05 則接受原來(lái)假設(shè),即兩組紅葡萄酒的澄清度數(shù)據(jù)符合近似正態(tài)分布。 同理可用SPSS 軟件對(duì)其他指標(biāo)的正態(tài)性進(jìn)行檢驗(yàn),得到結(jié)果符合實(shí)際猜想都服

12、從近似正態(tài)分布。 5.2.3 葡萄酒配對(duì)樣品t 檢驗(yàn)步驟 兩種葡萄酒的處理過(guò)程類似,這里我們以對(duì)紅葡萄酒評(píng)價(jià)結(jié)果的差異的顯著性分析為例。 5.2.4紅葡萄酒各指標(biāo)差異顯著性分析 由SPSS 軟件對(duì)紅葡萄酒各指標(biāo)的配對(duì)樣品t 檢驗(yàn)后,得到各指標(biāo)的顯著性概率分布表。(結(jié)果如表3 所示) 由統(tǒng)計(jì)學(xué)知識(shí),如果顯著性概率P顯著水平a ,則不能拒絕零假設(shè),即認(rèn)為兩總體樣本的均值不存在顯著差異。則根據(jù)表3 可得:兩組評(píng)酒員對(duì)紅葡萄酒各項(xiàng)指標(biāo)的評(píng)價(jià)中除外觀色調(diào)、香氣質(zhì)量存在顯著性差異以外,其他8 項(xiàng)指標(biāo)都無(wú)顯著性差異。5.2.5白葡萄酒各指標(biāo)差異顯著性分析代入白葡萄酒的評(píng)價(jià)數(shù)據(jù),重復(fù)以上步驟,得到白葡萄酒各指

13、標(biāo)的顯著性概率P 分布表。(結(jié)果如表4 所示)5.2.6葡萄酒總體差異顯著性分析 (1)紅葡萄酒總體差異顯著性分析 該問(wèn)題的附件中已經(jīng)給出了10 項(xiàng)指標(biāo)的權(quán)重,因此將10 項(xiàng)指標(biāo)利用加權(quán)合并成總體評(píng)價(jià)。對(duì)于紅葡萄酒兩組評(píng)價(jià)結(jié)果構(gòu)造兩組配對(duì)t 檢驗(yàn)。得到顯著性概率P=0.030。即紅葡萄酒整體評(píng)價(jià)結(jié)果有顯著性差異。 (2)白葡萄酒總體差異顯著性分析 同理對(duì)于白葡萄酒兩組評(píng)價(jià)結(jié)果構(gòu)造兩組配對(duì)t 檢驗(yàn)。得到顯著性概率P=0.02。即白葡萄酒整體評(píng)價(jià)結(jié)果有顯著性差異。 (3)葡萄酒總體差異顯著性分析 對(duì)于白葡萄酒和紅葡萄酒總體評(píng)價(jià)結(jié)果配對(duì)t 檢驗(yàn)。得到顯著性概率P=0.002。即兩組對(duì)整葡萄酒的評(píng)價(jià)有

14、顯著性差異。 5.2.7 數(shù)據(jù)可信度評(píng)價(jià)指標(biāo)建立 由于整體評(píng)價(jià)數(shù)據(jù)無(wú)顯著性差異,我們可以認(rèn)為20 名評(píng)酒員的水平在一個(gè)區(qū)間內(nèi)。因此評(píng)酒員的評(píng)價(jià)結(jié)果的穩(wěn)定性將決定該評(píng)酒員評(píng)價(jià)的數(shù)據(jù)的可信度。若某一評(píng)酒員的評(píng)價(jià)數(shù)據(jù)不穩(wěn)定,則其所評(píng)數(shù)據(jù)可信度較低,其所在組別的數(shù)據(jù)評(píng)價(jià)可信度也將相應(yīng)降低。 因此,我們將數(shù)據(jù)的可信度比較轉(zhuǎn)化為兩組評(píng)酒員評(píng)論水平的穩(wěn)定性比較。 查閱相關(guān)資料獲知,評(píng)酒員的評(píng)價(jià)尺度是有一定的系統(tǒng)誤差的。如不同評(píng)酒員對(duì)色調(diào)的敏感度或許是不同的,如果某一評(píng)酒員評(píng)價(jià)的色調(diào)稍高于標(biāo)準(zhǔn)色調(diào), 但他每次評(píng)價(jià)的色調(diào)都稍高,而且一直很穩(wěn)定。雖然與均值間始終存在誤差,由于其穩(wěn)定性,這樣的評(píng)酒員的評(píng)價(jià)數(shù)據(jù)仍然是

15、可信的。 所以,我們建立的數(shù)據(jù)可信度評(píng)價(jià)指標(biāo)為評(píng)酒員評(píng)價(jià)的穩(wěn)定性。評(píng)酒員的評(píng)價(jià)數(shù)據(jù)越穩(wěn)定,數(shù)據(jù)越可信。 5.2.8數(shù)據(jù)可信度評(píng)價(jià)模型的建立與求解 通過(guò)對(duì)數(shù)據(jù)的初步觀察處理,發(fā)現(xiàn)每位評(píng)酒員的系統(tǒng)偏差都較小,20 位評(píng)酒員的評(píng)價(jià)尺度近似處在同一區(qū)間,因此我們不對(duì)附件中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,認(rèn)為附件中的數(shù)據(jù)的系統(tǒng)偏差可以忽略。 (1) 首先作出觀察評(píng)酒員穩(wěn)定性的偏差圖,其中偏差為評(píng)酒員對(duì)同一個(gè)單指標(biāo)的評(píng)分值與該組評(píng)論員評(píng)分的平均值之差。下面利用matlab 軟件作出第2 組中1 號(hào)和2 號(hào)評(píng)酒員對(duì)27 種紅葡萄酒的澄清度評(píng)分與組內(nèi)平均值的偏差如下 圖2 第2 組中1(左)、2 號(hào)評(píng)酒員對(duì)澄清度評(píng)分與

16、組內(nèi)平均值偏差圖 分析上圖可以看出,1 號(hào)評(píng)酒員在對(duì)27 種酒的澄清度評(píng)分時(shí),出現(xiàn)了3 個(gè)噪聲點(diǎn),(即偏離自己的平均水平較大的點(diǎn))。2 號(hào)評(píng)酒員在評(píng)分的時(shí)候只出現(xiàn)了91 個(gè)噪聲點(diǎn)。因而可以初步判定2 號(hào)評(píng)酒員的穩(wěn)定性比1 號(hào)評(píng)酒員的穩(wěn)定性好。 (2)各指標(biāo)偏差的方差計(jì)算基于以上分析:要評(píng)價(jià)一個(gè)評(píng)酒員評(píng)價(jià)的穩(wěn)定性,我們可以觀察該評(píng)論員在評(píng)價(jià)時(shí)具有的噪聲點(diǎn)的個(gè)數(shù)。噪聲點(diǎn)的個(gè)數(shù)也可用評(píng)酒員的評(píng)酒數(shù)據(jù)與該組所評(píng)數(shù)據(jù)平均值的偏差的方差進(jìn)行計(jì)算衡量。在此問(wèn)中我們?nèi)匀贿x擇兩組紅葡萄酒的評(píng)分求解偏差的方差。評(píng)酒員評(píng)價(jià)數(shù)據(jù)中包含10 個(gè)評(píng)價(jià)指標(biāo),分別為外觀澄清度、外觀色調(diào)平衡整體評(píng)價(jià)等。我們給它們分別標(biāo)號(hào)為從1

17、-10。在第1 組中,10 位評(píng)酒員對(duì)n 號(hào)酒樣品的j 項(xiàng)指標(biāo)評(píng)分的平均分為:(1)第i 號(hào)評(píng)酒員對(duì)n 號(hào)酒樣品第j 項(xiàng)指標(biāo)評(píng)分與平均值的偏差為:(2)第i 號(hào)評(píng)酒員對(duì)酒樣品的j 項(xiàng)指標(biāo)評(píng)分與平均值的偏差的平均值為:(3)第i 號(hào)評(píng)酒員對(duì)酒樣品的j 項(xiàng)指標(biāo)評(píng)分與平均值的偏差的方差為:同理,第2 組中第i 號(hào)評(píng)酒員對(duì)酒樣品j 項(xiàng)指標(biāo)評(píng)分與平均值的偏差的方差為:(3)總體的偏差的方差計(jì)算問(wèn)題1 的附件中應(yīng)經(jīng)給出了10 項(xiàng)單指標(biāo)的權(quán)重w j (每項(xiàng)指標(biāo)的滿分值),利用該權(quán)重可得到第2 組總體指標(biāo)偏差的方差為:(6)第2 組10 名評(píng)酒員的27 個(gè)酒樣品的10 項(xiàng)單指標(biāo)的總體的偏差的方差為:第1 組1

18、0 名評(píng)酒員的27 個(gè)酒樣品的10 項(xiàng)單指標(biāo)的總體的偏差的方差為:(8)5.2.9數(shù)據(jù)可信度評(píng)價(jià)結(jié)果分析由附件中的數(shù)據(jù)求得:1 組的10 名評(píng)酒員的27 個(gè)酒品的10 項(xiàng)單指標(biāo)的總體的偏差的方差 =33.;2組的10名評(píng)酒員的27個(gè)酒品的10項(xiàng)單指標(biāo)的總體的偏差的方差=10.;因此,我們認(rèn)定2 組的評(píng)酒員的評(píng)價(jià)的穩(wěn)定性較高,第2 組的數(shù)據(jù)更可信。5.2.10問(wèn)題1的結(jié)果分析 在本問(wèn)中,我們通過(guò)對(duì)兩組評(píng)酒員的品酒打分情況統(tǒng)計(jì)數(shù)據(jù)按照指標(biāo)進(jìn)行配對(duì)t 檢驗(yàn),發(fā)現(xiàn)有部分指標(biāo)存在顯著性差異。接著,我們又對(duì)樣本總體做了一次t 檢驗(yàn),發(fā)現(xiàn)兩組評(píng)酒員之間的評(píng)分已經(jīng)不存在顯著性差異。隨后,我們把對(duì)每組數(shù)據(jù)可靠性

19、的評(píng)價(jià)轉(zhuǎn)化為對(duì)每組各個(gè)評(píng)酒員穩(wěn)定性的評(píng)價(jià),最后得出了第二組數(shù)據(jù)更加可靠的結(jié)論。 5.3模型二分析葡萄酒是一種成分復(fù)雜的酒精飲料,不同產(chǎn)地、年份和品種的葡萄酒成分不同。成分與葡萄酒的質(zhì)量關(guān)系密切,是劃分葡萄酒等級(jí)的重要依據(jù)。對(duì)于問(wèn)題二的求解,可通過(guò)葡萄酒的等級(jí)和釀酒葡萄的理化指標(biāo)來(lái)對(duì)釀酒葡萄進(jìn)行分級(jí)。5.3.1.1 葡萄酒數(shù)據(jù) 葡萄酒數(shù)據(jù)包括27個(gè)紅葡萄酒樣本和28個(gè)白葡萄樣本,輸入的變量包括客觀的測(cè)試(如花色苷),輸出變量基于感覺(jué)數(shù)據(jù)(葡萄酒專家提出的至少3個(gè)評(píng)價(jià)的均值)。每位專家的葡萄酒質(zhì)量分級(jí)介于 0 (極壞的) 和 10 (非常優(yōu)秀)。極好的和極差的葡萄酒的樣本都是少數(shù), 評(píng)價(jià)為中間的葡

20、萄酒樣本最多,因此可以從葡萄酒專家的評(píng)分來(lái)確定葡萄酒的質(zhì)量。由問(wèn)題一的求解已經(jīng)確定第二組品酒師的評(píng)分顯著性差異較小,所以對(duì)葡萄酒的質(zhì)量評(píng)價(jià)可借助于第二組評(píng)酒師的評(píng)分作為依據(jù)建立模型。5.3.1.2 釀酒葡萄理化指標(biāo)數(shù)據(jù) 根據(jù)對(duì)釀酒葡萄理化測(cè)試得到的輸入變量為30個(gè),包括氨基酸總量(mg/100gfw),蛋白質(zhì)(mg/100g),VC含量(mg/L),花色苷(mg/100g),鮮重(g),酒石酸(g/L),蘋(píng)果酸(g/L),檸檬酸(g/L),多酚氧化酶活力((A/mingml)),褐變度(A/g*g*min*ml),DPPH自由基1/IC50(g/L),總酚(mmol/kg),單寧(mmol/k

21、g),葡萄總黃酮(mmol/kg),白藜蘆醇(mg/kg),黃酮醇(mg/kg),總糖(g/L),還原糖(g/L),可溶性固形物(g/l),PH值,可滴定酸(g/l),可滴定酸,干物質(zhì)含量g/100g,果穗質(zhì)量/g,百粒質(zhì)量/g,果梗比(%),出汁率(%),果皮質(zhì)量(g),果皮顏色。借助各項(xiàng)理化指標(biāo)可對(duì)釀酒葡萄的質(zhì)量進(jìn)行評(píng)分。5.3.1.3 質(zhì)量評(píng)估方法 數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、機(jī)器學(xué)習(xí)等技術(shù)都能在葡萄酒分類中應(yīng)用。 復(fù)雜的模型容易過(guò)擬合導(dǎo)致泛化能力減弱, 模型太簡(jiǎn)單導(dǎo)致學(xué)習(xí)能力有限。神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)兩種方法均有參數(shù)可以調(diào)整,能獲得令人滿意的效果。由于釀酒葡萄的理化指標(biāo)參數(shù)為多元數(shù)據(jù)

22、,因此采用圖表示的可視化分類方法可取得比較好的效果。 采用圖表示的可視化分類方法,一般使用星點(diǎn)圖 ,是目前應(yīng)用最廣泛的對(duì)多元數(shù)據(jù)進(jìn)行作圖的方法。由于星點(diǎn)圖是將正交坐標(biāo)軸重新安排為非正交的坐標(biāo)軸,即相交于圓心的徑向坐標(biāo)軸,因此可以在二維平面上同時(shí)顯示多維數(shù)據(jù)。 從星點(diǎn)圖的圖表示可以看出,特征排序很重要外,相鄰維之間的角度的作用也重要。星點(diǎn)圖之所以能可視化,就是因?yàn)樾屈c(diǎn)圖要求所有相鄰維之間的角度的總和等于。 多維數(shù)據(jù)用圖來(lái)表示,可能會(huì)形成有利于視覺(jué)上分類或聚類的很有特色的圖形特征。這與傳統(tǒng)的三大特征 相對(duì)應(yīng)。重心是星點(diǎn)圖多邊形提供的一種圖形特征。從幾何角度看,一個(gè)樣本的星點(diǎn)圖中的每一個(gè)三角形都產(chǎn)生

23、一個(gè)重心。從幾何上講三角形三條中線相交于一點(diǎn),這個(gè)交點(diǎn)叫做三角形的重心,而且三角形的重心與頂點(diǎn)的距離等于它與對(duì)邊中點(diǎn)的距離的2倍。當(dāng)然也可以利用三角形的重心坐標(biāo)是 3個(gè)頂點(diǎn)坐標(biāo)的平均值的性質(zhì),計(jì)算的結(jié)果是一樣的??梢园讶切沃匦姆Q為重心圖形特征 (維數(shù)與原始特征維數(shù)一樣)。星點(diǎn)圖的重心圖形特征提取方法如下: 其中,和表示詭異化特征樣本的第i維變量和第i+1維變量的值,一般由預(yù)處理計(jì)算得到:弧度為第i維變量和第i+1維變量間的夾角弧度。因此一個(gè)維特征的樣本就會(huì)產(chǎn)生一個(gè)對(duì)應(yīng)的維圖形特征的樣本。這樣特征排序影響重心圖形特征的問(wèn)題就能夠解決,它轉(zhuǎn)化為一個(gè)特征選擇問(wèn)題。 因此,應(yīng)用貝葉斯理論,這個(gè)規(guī)則表

24、述如下:如果,所有的,那么指定屬于類。這里是類概率密度函數(shù),是類的先驗(yàn)概率。一般是未知的,需要從訓(xùn)練樣本中估計(jì)。那么第個(gè)樣本得到的結(jié)果就是一個(gè)回歸值,一般這個(gè)回歸值和那個(gè)類別標(biāo)簽距離近,第個(gè)樣本就屬于哪個(gè)類別。提出一種新的方法如下:對(duì)于第個(gè)樣本,利用分類方法得到一個(gè)類別標(biāo)簽,利用回歸方法得到一個(gè)排序的預(yù)測(cè)值 ,如果和 的絕對(duì)值小于閾值 1,那么樣本屬于類;否則樣本屬于距離預(yù)測(cè)值最近的類。例如,第個(gè)樣本的分類標(biāo)簽=5,排序的預(yù)測(cè)值=5.2,那么第個(gè)樣本屬于類別5;第個(gè)樣本的分類標(biāo)簽=5,排序的預(yù)測(cè)值=6.2,那么第個(gè)樣本屬于類別6?;谝陨侠碚?,可用圖表示的可視化分類方法對(duì)釀酒葡萄的理化指標(biāo)進(jìn)行

25、分類,從而達(dá)到對(duì)葡萄的分級(jí),進(jìn)而來(lái)確定釀酒葡萄的理化指標(biāo)與葡萄酒的理化指標(biāo)間的關(guān)系。5.3.2 模型的應(yīng)用與求解對(duì)釀酒葡萄的30種理化指標(biāo)分別編號(hào),以該編號(hào)和釀酒葡萄理化指標(biāo)的含量建立二維直角坐標(biāo)系,并以理化指標(biāo)的編號(hào)為輸入變量,釀酒葡萄理化指標(biāo)的含量為變量值,借助matlab軟件(相應(yīng)的matlab程序見(jiàn)附錄),做出27個(gè)紅葡萄樣本和28個(gè)白葡萄樣本的數(shù)據(jù)可視化平行坐標(biāo)圖。如圖5 紅葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖和圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖。圖5 紅葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖從圖5和圖6分析所得,對(duì)于同一種葡萄,這幾類數(shù)據(jù)在很多理化性質(zhì)上幾乎相同,只有第

26、1個(gè)變量氨基酸總量和第9個(gè)變量褐變度不同,這說(shuō)明這兩大理化性質(zhì)大大影響口味。因此要根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí),還需結(jié)合第二組品酒師對(duì)葡萄酒樣本的打分和葡萄中氨基酸總量和褐變度來(lái)進(jìn)一步對(duì)釀酒葡萄進(jìn)行分級(jí)。相應(yīng)的數(shù)據(jù)見(jiàn)附錄中葡萄中氨基酸與褐變度及相應(yīng)葡萄酒的評(píng)分?jǐn)?shù)據(jù)。依以上數(shù)據(jù),分別作出以葡萄中氨基酸含量(褐變度)和葡萄酒相應(yīng)的評(píng)分建立直角坐標(biāo)系,作出分布圖,如圖7 紅葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖,圖8紅葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖,圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖,圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖圖7 紅葡萄酒

27、中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖圖8 紅葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖 通過(guò)對(duì)圖5.3和圖5.4的分析,當(dāng)紅葡萄中氨基酸和褐變度含量比較低時(shí),對(duì)葡萄酒的影響比較低,當(dāng)含量較高時(shí),可以依據(jù)褐變度(t)對(duì)紅葡萄質(zhì)量()進(jìn)行分類如下: 其中-1代表釀酒葡萄質(zhì)量較差,0代表釀酒葡萄質(zhì)量中等,1代表釀酒葡萄質(zhì)量較好。圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖 通過(guò)對(duì)圖5.5和圖5.6的分析,得到對(duì)于白葡萄,氨基酸的含量對(duì)其所釀的葡萄的質(zhì)量影響較大,因此可用白葡萄中氨基酸的含量()來(lái)衡量所釀的葡萄酒的質(zhì)量(),具體分類如下: 其中-1代表釀酒

28、葡萄質(zhì)量較差,0代表釀酒葡萄質(zhì)量中等,1代表釀酒葡萄質(zhì)量較好。5.3.3模型二評(píng)價(jià)應(yīng)用以上圖表示可視化分類模型,雖能對(duì)葡萄等級(jí)進(jìn)行分級(jí),但由于其并沒(méi)有考慮釀酒葡萄中各成分理化指標(biāo)的相互關(guān)系及對(duì)所釀葡萄質(zhì)量的影響,所以其模型人具有許多不足之處,需對(duì)釀酒葡萄與葡萄酒的理化指標(biāo)之間聯(lián)系的進(jìn)一步研究來(lái)完善該模型。5.4問(wèn)題三的求解 在分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系時(shí),本文使用了層次聚類分析和典型相關(guān)分析。5.4.1層次聚類分析 根據(jù)聚類分析的原理可知,它的實(shí)質(zhì)是建立一種分類方法,將一批樣本數(shù)據(jù)按照它們?cè)谛再|(zhì)上的親密程度在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行自動(dòng)分類。這種類就是一個(gè)具有相似性的個(gè)體的集合,

29、不同類之間具有明顯的區(qū)別。層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對(duì)象結(jié)合在一起,以逐次聚合的方式將觀察值分類,直到最后所有樣本都聚成一類。由第三問(wèn)可知,要想分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,必然要用到附件2-指標(biāo)總表中的大量數(shù)據(jù),如果不先對(duì)這些樣本進(jìn)行簡(jiǎn)化,就很難找到它們之間的內(nèi)在關(guān)系。而R型聚類分析使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個(gè)數(shù)。對(duì)于附件二指數(shù)總表,我們根據(jù)其中的一級(jí)指標(biāo)(即標(biāo)記為藍(lán)色的)先大致把釀酒葡萄的理化指標(biāo)分為30個(gè),其中,1為氨基酸總量,2為蛋白質(zhì),3為VC含量,定義430依次為:花色苷、

30、酒石酸、蘋(píng)果酸、檸檬酸、多酚氧化酶活力、褐變度、DPPH自由基、總酚、單寧、葡萄總黃酮、白藜蘆醇、黃酮醇、總糖、還原糖、可溶性固形物、PH值、可滴定酸、干物質(zhì)含量、果穗質(zhì)量、百粒質(zhì)量、果梗比、出汁率、果皮質(zhì)量、果皮顏色。定性考察釀酒葡萄的理化指標(biāo),可以看出,某些指標(biāo)之間可能存在較強(qiáng)的相關(guān)性。比如紅(白)葡萄中的總糖、還原糖與可溶性固行物之間可能存在較強(qiáng)的相關(guān)性,總酚、單寧與葡萄總黃酮之間也可能存在較強(qiáng)的相關(guān)性。為了驗(yàn)證這種想法,運(yùn)用MATLAB軟件計(jì)算紅葡萄30個(gè)一級(jí)指標(biāo)之間的相關(guān)系數(shù),得到的相關(guān)系數(shù)矩陣如表所示:(因樣本的指標(biāo)太多,在此只列出了前十個(gè)指標(biāo)的相關(guān)系數(shù)矩陣,具體完整的相關(guān)系數(shù)矩陣

31、參見(jiàn)附件一中的表格 (3)可以看出某些指標(biāo)之間確實(shí)存在很強(qiáng)的相關(guān)性,因此可以考慮從這些指標(biāo)中選取幾個(gè)有代表性的指標(biāo)進(jìn)行聚類分析。為此,把三十個(gè)指標(biāo)根據(jù)其相關(guān)性進(jìn)行R型聚類,再?gòu)拿總€(gè)類中選取代表性的指標(biāo)。因?yàn)樵诰垲惙治鲋腥绻麉⑴c聚類的變量的量綱不同,就會(huì)導(dǎo)致錯(cuò)誤的聚類結(jié)果。因此在聚類過(guò)程進(jìn)行之前必須對(duì)每個(gè)理化指標(biāo)的數(shù)據(jù)分別進(jìn)行標(biāo)準(zhǔn)化處理,以消除量綱的影響。指標(biāo)間相近性度量采用相關(guān)系數(shù),類間相近性度量的計(jì)算選用類平均法。聚類樹(shù)形圖如下圖圖 11 紅葡萄指標(biāo)類聚樹(shù)形圖 從紅葡萄指標(biāo)聚類圖中可以看出,可以將紅葡萄的30個(gè)理化指標(biāo)分為八類,分類結(jié)果如下( 中的代表聚為一類)2、10、11、12、13、2

32、6、4、6、8、9、15、25、5、7、19、21、1、16、17、18、20、22、3、14、28、29、30、23、24、27同理可得,白葡萄的前十個(gè)指標(biāo)的相關(guān)系數(shù)矩陣如下表所示:(見(jiàn)附錄)圖12 白葡萄指標(biāo)類聚樹(shù)形圖依據(jù)白葡萄指標(biāo)聚類圖中,同樣可以將白葡萄30個(gè)理化指標(biāo)分為以下八類2、9、11、12、13、15、1、6、10、16、17、18、20、22、28、30、3、5、2514、23、24、26、27、4、8、29、7、19、21對(duì)比以上得到的兩種釀酒葡萄的指標(biāo)類聚樹(shù)形圖和由它們將各自的30種理化指標(biāo)的分類結(jié)果,我們不難發(fā)現(xiàn),通過(guò)對(duì)兩組指標(biāo)分別用R型聚類分析歸類之后,兩種釀酒葡萄的

33、歸類區(qū)間有著明顯的相似度,再結(jié)合它們內(nèi)部的聯(lián)系和所歸的類與類之間的差異,可以得到如下的對(duì)應(yīng)關(guān)系:表5:主成分列表糖類 酚類 持久度 酸度 酒精度微量元素色度果皮質(zhì)地 1、16、17、18、20、222、11、12、134、8、9、155、6、719、21314、2829、30 23、24、26、27再通過(guò)兩組理化指標(biāo)的相關(guān)系數(shù)可以得出各類的主要指標(biāo):依次為糖類中的總糖,酚類中的總酚,持久度的酚氧化酶活性,酸度中的蘋(píng)果酸,酒精度中的PH值,微量元素VC含量,色度中的白蘆藜醇,果皮質(zhì)地中的果硬比。5.4.2典型相關(guān)分析 通常情況下,為了研究?jī)山M變量, 的相關(guān)關(guān)系,可以用最原始的方法,分別計(jì)算兩組變

34、量之間的全部相關(guān)系數(shù),一共有個(gè)簡(jiǎn)單相關(guān)系數(shù),這樣又繁瑣又不能抓住問(wèn)題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個(gè)線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡(jiǎn)捷。 為此,我們可以分別在每組變量中找出第一對(duì)線性組合,使其具有最大相關(guān)性, 然后再在每組變量中找出第二對(duì)線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對(duì)本身具有次大的相關(guān)性。 與,與不相關(guān),但和相關(guān)。如此繼續(xù)下去,直到進(jìn)行到步,兩組變量的相關(guān)性提取完為止,可以得到組變量,這里。 研究?jī)山M隨機(jī)變量之間的相關(guān)關(guān)系,可用復(fù)相關(guān)系數(shù)(也稱全相關(guān)系數(shù))。 復(fù)相關(guān)系數(shù)描述兩組隨機(jī)變量與之間的相關(guān)程度。其思想是先將每一組隨

35、機(jī)變量作線性組合,成為兩個(gè)隨機(jī)變量: , 再研究與的相關(guān)系數(shù)。由于,的投影與向量,有關(guān),所以與,有關(guān),。我們?nèi)≡诤偷臈l件下使達(dá)到最大的,作為投影向量,這樣得到的相關(guān)系數(shù)為復(fù)相關(guān)系數(shù):。 將兩組變量的協(xié)方差矩陣分塊得: , 此時(shí) 因此問(wèn)題轉(zhuǎn)化為在和的條件下求的極大值。 根據(jù)條件極值的求法引入Lagrange乘數(shù),可將問(wèn)題轉(zhuǎn)化為求 的極大值,其中, 是Lagrange乘數(shù)。由極值的必要條件得方程組: 將上二式分別左乘與,則得 注意,所以 代入方程組得: 以左乘第二式得,所以 代入第一式得 同理可得 記 , 則得 ,說(shuō)明既是又是的特征根,就是其相應(yīng)于和的特征向量。和的特征跟非負(fù),非零特征跟的個(gè)數(shù)等于

36、,不妨設(shè)為。設(shè)的特征跟排序?yàn)?,其余個(gè)特征根為0,我們稱為典型相關(guān)系數(shù)。相應(yīng)解出的特征向量為從解出的特征向量為從而可得對(duì)線性組合: 稱每一對(duì)變量為典型變量。求典型相關(guān)系數(shù)和典型變量歸結(jié)為求和的特征根和特征向量。 又因?yàn)?,?dāng) 時(shí), 表示一切典型變量都是不相關(guān)的,并且其方差為一,其中與的同一對(duì)典型變量和之間的相關(guān)系數(shù)為,不同對(duì)的典型變量和()之間不相關(guān),即協(xié)方差為0: 當(dāng)總體的均值向量和協(xié)差陣未知時(shí),無(wú)法求總體的典型相關(guān)系數(shù)和典型變量,因而需要給出樣本的典型相關(guān)系數(shù)和典型變量。 設(shè)和為來(lái)自總體容量為的樣本,這時(shí),協(xié)差陣的無(wú)偏估計(jì)為 其中,用代替并按 和 求出和,稱為樣本典型相關(guān)系數(shù),稱,為樣本的典型

37、變量。計(jì)算時(shí)也可從樣本的相關(guān)系數(shù)矩陣出發(fā)求樣本的典型相關(guān)系數(shù)和典型變量,將相關(guān)系數(shù)矩陣取代協(xié)方差陣,計(jì)算過(guò)程是一樣的。如果復(fù)相關(guān)系數(shù)中一個(gè)變量是一維的,那么也可稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是描述一個(gè)隨機(jī)變量與多個(gè)隨機(jī)變量(一組隨機(jī)變量)之間的關(guān)系。其思想是先將那一組隨機(jī)變量作線性組合,成為一個(gè)隨機(jī)變量: 再研究和的相關(guān)系數(shù)。由于和投影向量有關(guān),所以與有關(guān),。我們?nèi)≡诘臈l件下使達(dá)到最大的作為投影向量得到的相關(guān)系數(shù)為偏相關(guān)系數(shù): 其余推導(dǎo)與計(jì)算過(guò)程與復(fù)相關(guān)系數(shù)類似。5.4.3原始變量與典型變量之間的相關(guān)性(1)原始變量與典型變量之間的相關(guān)系數(shù)設(shè)原始變量相關(guān)系數(shù)矩陣 典型變量系數(shù)矩陣 典型變量系數(shù)矩陣

38、 則有 和的相關(guān)系數(shù) 同理可計(jì)算得 (2) 各組原始變量被 典型變量所解釋的方差組原始變量被解釋的方差比例 組原始變量被解釋的方差比例 組原始變量被解釋的方差比例 組原始變量被解釋的方差比例 5.4.4理化指標(biāo)典型相關(guān)分析結(jié)合以上的理論的推導(dǎo)結(jié)果,我們嘗試用典型相關(guān)分析來(lái)分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。有關(guān)變量見(jiàn)下表表6 兩組樣本中的主成分X組總糖 總酚 酚氧化酶活性 蘋(píng)果酸 PH值 VC含量 白蘆藜醇 果硬比() () () () () () () () Y組花色苷 單寧 總酚 酒總黃酮 白蘆藜醇 DPPH半抑制體積 色澤(細(xì)化為三類)() () () () () () () 由以

39、上可以看出,所有九個(gè)表示釀酒紅葡萄理化指標(biāo)的變量都與有大致相同的相關(guān)系數(shù),因此可以視為形容葡萄理化特性的指標(biāo)。X組的原始變量被解釋的比例為1.(即100%)Y組的原始變量被解釋的比例為0.(即92.4%)由此可知,用典型相關(guān)分析來(lái)分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系具有較強(qiáng)的說(shuō)服性和較好的準(zhǔn)確性。5.5問(wèn)題四模型的建立與求解5.5.1多元線性回歸模型的建立要求解釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,分別將釀酒葡萄和葡萄酒的各理化指標(biāo)作為自變量,葡萄酒質(zhì)量作為因變量,建立多元線性回歸模型,求解各指標(biāo)的系數(shù),即權(quán)重。從而研究各指標(biāo)對(duì)葡萄酒質(zhì)量的影響。多元線性回歸模型: 5.5.2模型求

40、解在第二問(wèn)中已經(jīng)求解出了釀酒葡萄的主要理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響如下:紅葡萄線性回歸模型: 白葡萄線性回歸模型: 對(duì)葡萄酒的理化指標(biāo)進(jìn)行相同的分析,分別表示花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積、色澤(L*(D65))、色澤(a*(D65))、色澤(b*(D65))求出葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響:紅葡萄酒各理化指標(biāo)回歸模型: 白葡萄酒各理化指標(biāo)回歸模型: 用葡萄和葡萄酒的理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的質(zhì)量是有一定道理的。葡萄酒質(zhì)量屬性主要指:復(fù)雜性、協(xié)調(diào)性以及能夠激發(fā)消費(fèi)者感情的能力。復(fù)雜性,意味著葡萄酒有濃郁的、令人愉快的香氣與滋味,及它的潛力與精巧性;協(xié)調(diào)性,指各種感官

41、成分的結(jié)合是平衡的,每一種成分與其他成分相比,它的存在及其含量是非常適宜的。同時(shí),它的復(fù)雜性、顏色強(qiáng)度、香氣、滋味、后味是穩(wěn)定一致的。理化指標(biāo)各物質(zhì)比例合適,達(dá)到一種平衡,葡萄酒的質(zhì)量就高,而求出的各理化指標(biāo)的系數(shù)正是近似合理的搭配比例。物質(zhì)含量使得值越大葡萄酒的質(zhì)量就是越好的,通過(guò)所求出的線性相關(guān)關(guān)系,就可近似評(píng)價(jià)酒的質(zhì)量,所以是可以用葡萄和葡萄酒的理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的質(zhì)量。當(dāng)然,感官指標(biāo)是評(píng)價(jià)葡萄酒質(zhì)量的一個(gè)很重要指標(biāo),但感官指標(biāo)是由附表三中給出的芳香類物質(zhì)造成的,而這些芳香類物質(zhì)也是來(lái)源于理化指標(biāo)中的,這樣就可以利用理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的好壞,評(píng)酒師感官的效果是由芳香類物質(zhì)造成的,這樣

42、就建立了理化指標(biāo)和感官指標(biāo)之間的聯(lián)系,就可以直接用理化指標(biāo)來(lái)判斷葡萄酒的質(zhì)量。5.5.3 模型的評(píng)價(jià)與分析:運(yùn)用多元線性回歸模型,求解出了主要量化指標(biāo)的系數(shù),解決了主要指標(biāo)對(duì)葡萄酒的影響,模型簡(jiǎn)單,易于求解,總體上能體現(xiàn)量化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,但有些指標(biāo)被忽略,不能全面的求出各個(gè)指標(biāo)對(duì)葡萄酒質(zhì)量的影響,造成求解出的函數(shù)關(guān)系并不夠準(zhǔn)確。 在論證用葡萄和葡萄酒的理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的質(zhì)量中,能夠很好的指出量化指標(biāo)與感官指標(biāo)之間的聯(lián)系,但沒(méi)有用確切的函數(shù)關(guān)系來(lái)表示出來(lái),沒(méi)有充分利用起芳香物質(zhì)的橋梁作用,求解出量化指標(biāo)與感官指標(biāo)的函數(shù)關(guān)系。6模型的評(píng)價(jià)與推廣模型的優(yōu)點(diǎn)在于將評(píng)價(jià)葡萄酒質(zhì)量評(píng)價(jià)的各個(gè)

43、指標(biāo)影響因素都考慮在內(nèi),給各個(gè)指標(biāo)賦以權(quán)重,綜合考慮這些指標(biāo)對(duì)葡萄酒質(zhì)量的影響。在顯著性和可靠性分析中,充分考慮了各個(gè)指標(biāo)對(duì)葡萄酒質(zhì)量的影響,選取了符合題意的雙因素多重方差分析和信度檢驗(yàn)方法,可知模型是合理有效的。在對(duì)釀酒葡萄進(jìn)行分級(jí)中,合理借用分析軟件做聚類分析,將性質(zhì)相似的成分聚為一類,簡(jiǎn)化變量,是處理數(shù)據(jù)的有效手段,再采用主成分分析法,找出影響葡萄酒質(zhì)量的主要類別因素,進(jìn)而根據(jù)聚類分析中使用最廣泛的歐式距離對(duì)釀酒葡萄進(jìn)行分級(jí),使模型具有很好的適度性。在分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系時(shí),采用了相關(guān)性分析法和多元線性回歸,很有效地建立了兩者間的聯(lián)系。模型的缺點(diǎn)是在釀酒葡萄分級(jí)中,歐

44、氏距離與各變量的量綱有關(guān),沒(méi)有考慮指標(biāo)間的相關(guān)性,也沒(méi)有考慮各變量方差的不同。在尋求葡萄酒理化指標(biāo)和葡萄酒的外觀分析、香氣分析、口感分析以及整體評(píng)價(jià)的函數(shù)關(guān)系,回歸只用了線性回歸,分析過(guò)程中,依然得知其若干相關(guān)性很強(qiáng)的指標(biāo)不具有線性相關(guān)。模型的改進(jìn) 針對(duì)問(wèn)題三釀酒葡萄與葡萄酒聯(lián)系的研究,可以使用雙重篩選逐步回歸分析,其結(jié)果會(huì)更好。對(duì)于葡萄酒理化指標(biāo)和葡萄的外觀分析、香氣分析、口感分析以及整體評(píng)價(jià)做回歸分析,應(yīng)嘗試多種非線性回歸分析進(jìn)行比較,選擇回歸程度最好的一種。模型的推廣本文所涉及的模型主要建立在多元統(tǒng)計(jì)分析上,適用于統(tǒng)計(jì)量龐大,多變量對(duì)因變量、多變量對(duì)多變量的問(wèn)題解答。7參考文獻(xiàn)1 肖宇谷

45、,數(shù)學(xué),北京:中國(guó)財(cái)經(jīng)經(jīng)濟(jì)出版社,2010年2 于秀林 任雪松,多元統(tǒng)計(jì)分析,北京:中國(guó)統(tǒng)計(jì)出版社,1999年3 柴菊花,昌黎產(chǎn)區(qū)7個(gè)單品種干紅葡萄酒氨基酸分析,中國(guó)釀造,2010年4 孫沛杰 孫立穎,葡萄中單寧對(duì)生產(chǎn)葡萄酒的影響,釀酒,1998年5 李運(yùn) 李記明 姜忠軍,統(tǒng)計(jì)分析在葡萄酒質(zhì)量評(píng)價(jià)中的應(yīng)用,釀酒科技,2009年6 李記明,關(guān)于葡萄品質(zhì)的評(píng)價(jià)指標(biāo),中外葡萄與葡萄酒,1999年7 李記明 李華,葡萄酒成分分析與質(zhì)量研究,食品與發(fā)酵工業(yè),1994年8 馬騰 趙麗 李軍,2008年份昌黎原產(chǎn)地葡萄酒理化特性的統(tǒng)計(jì)分析,河北科技師范學(xué)院學(xué)報(bào),2012年9 許鳳華 李述山 張英,基于雙重篩

46、選的多因變量偏最小二乘逐步回歸法,統(tǒng)計(jì)與決策,2008年附錄1.表1: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 1.00 1.00 0.02 -0.12 0.08 0.36 -0.07 0.08 -0.12 -0.15 0.11 2.00 0.02 1.00 -0.01 0.43 0.47 -0.17 0.17 0.11 0.20 0.75 3.00 -0.12 -0.01 1.00 -0.11 -0.23 -0.14 -0.23 -0.27 0.07 0.00 4.00 0.08 0.43 -0.11

47、1.00 0.09 0.63 0.28 0.40 0.70 0.65 5.00 0.36 0.47 -0.23 0.09 1.00 -0.11 0.52 -0.13 -0.06 0.28 6.00 -0.07 -0.17 -0.14 0.63 -0.11 1.00 0.42 0.33 0.64 0.05 7.00 0.08 0.17 -0.23 0.28 0.52 0.42 1.00 0.20 0.39 0.00 8.00 -0.12 0.11 -0.27 0.40 -0.13 0.33 0.20 1.00 0.56 0.10 9.00 -0.15 0.20 0.07 0.70 -0.06 0

48、.64 0.39 0.56 1.00 0.30 10.000.11 0.75 0.00 0.65 0.28 0.05 0.00 0.10 0.30 1.00 表4: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣1 2 3 4 5 6 7 8 9 10 1 1.00 0.12 -0.30 -0.06 0.39 0.51 0.07 -0.33 -0.12 0.21 2 0.12 1.00 -0.23 -0.45 -0.34 0.21 -0.05 -0.28 0.46 0.10 3 -0.30 -0.23 1.00 0.08 0.04 -0.19 -0.34 0.12 0.15 0.07 4 -0.06 -0.45

49、 0.08 1.00 0.21 0.02 0.01 0.35 -0.33 -0.30 5 0.39 -0.34 0.04 0.21 1.00 0.18 0.33 -0.02 0.02 -0.15 6 0.51 0.21 -0.19 0.02 0.18 1.00 0.20 -0.24 -0.07 -0.02 7 0.07 -0.05 -0.34 0.01 0.33 0.20 1.00 0.14 0.01 -0.03 8 -0.33 -0.28 0.12 0.35 -0.02 -0.24 0.14 1.00 -0.06 -0.43 9 -0.12 0.46 0.15 -0.33 0.02 -0.0

50、7 0.01 -0.06 1.00 0.05 10 0.21 0.10 0.07 -0.30 -0.15 -0.02 -0.03 -0.43 0.05 1.00 2、問(wèn)題三的聚類法求相關(guān)系數(shù)和繪制聚類樹(shù)狀圖的程序:M=load(G:hptzb.txt); %把原始數(shù)據(jù)保存到純文本hptzb.txt中r=corrcoef(M) %計(jì)算相關(guān)系數(shù)矩陣d=1-r; %進(jìn)行數(shù)據(jù)變換,吧相關(guān)系數(shù)轉(zhuǎn)化為距離d=tril(d); %取出d的下三角元素d=nonzeros(d); %取出非零元素d=d; %化為行向量z=linkage(d,average); %按類平均法聚類dendrogram(z); %畫(huà)類

51、聚圖T=cluster(z,maxclust,8) %把變量劃分為9類for i=1:8 tm=find(T=i) %求第i類的對(duì)象 tm=reshape(tm,1,length(tm); %變成行向量 fprintf(第%d類的有%sn,i,int2str(tm); %顯示分類結(jié)果end3、問(wèn)題三的典型相關(guān)分析求兩組樣本的相關(guān)系數(shù)及解釋率的程序:M=load (G:r.txt); %把原始矩陣保存在純文本文件r.txt中M=zscore(M); %把原始矩陣進(jìn)行標(biāo)準(zhǔn)化fprintf(相關(guān)系數(shù)矩陣:n)r=corrcoef(M) %計(jì)算相關(guān)系數(shù)矩陣n1=8;n2=9;num=min(n1,n2);s1=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論