版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、白葡萄酒的質量綜合評價模型摘要時代在進步,人類的對生活品味的追求不斷增加,這使得葡萄酒的需求日益增加。在現(xiàn)今的大數(shù)據(jù)時代,人們運用數(shù)據(jù)資料定量研究葡萄酒的品質,加快建立葡萄酒市場指標規(guī)則成為人們關注的焦點。本文中主要研究了葡萄酒的品質以及與釀酒葡萄的理化指標的關系。合理運用葡萄釀出好酒。首先基于兩組白葡萄酒的評分差異性做出判斷,運用wilcoxon符號秩檢驗方法檢驗出兩組白葡萄酒的評分存在顯著性差異,再合理的運用兩組評分的組內方差的波動性及其大小來評判出第二組的評分可靠性更高。接下來我們結合釀酒葡萄的理化指標和可信組評酒員的打分所刻畫的葡萄酒的質量對釀酒葡萄進行分級,用聚類分析的方法將白葡萄酒
2、和釀酒葡萄各分成了5 類,然后對分好的葡萄類所釀造的葡萄酒進行統(tǒng)計,最后得到各類釀酒葡萄對應的級別關鍵字:假設檢驗、符號秩檢驗、聚類分析一、問題分析題目為我們提供了白葡萄酒的感官評價指標,白葡萄和葡萄酒的各種理化指標的信息。本文的關鍵就是通過分析處理已給的數(shù)據(jù),建立數(shù)學模型來研究白葡萄酒質量的確立。為此,我們要依次達到題目給出的以下幾個目標:1.1兩組評價結果差異性和可信性研究問題一給出了兩組評酒員對白葡萄酒的評價分數(shù),本文采用假設檢驗中的t 檢驗法建立評估兩組數(shù)據(jù)差異的模型,研究兩組評價員的評價結果是否存在差異,判斷是否能接受它們有顯著性差異的假設。若判斷的結果是這兩組數(shù)據(jù)存在差異,我們就進
3、入第二步,可靠性研究。我們分別對兩組數(shù)據(jù)求方差,方差小的那組說明波動比較小,評酒員的評定比較穩(wěn)定,數(shù)據(jù)比較可靠。1.2 釀酒葡萄的分級首先,我們利用第一題的結果,用置信區(qū)間法對可信組的原始數(shù)據(jù)進行處理,降低評酒員之間的差異,提高酒樣品之間的差異【1】李華等. 葡萄酒感官評價結果的統(tǒng)計分析方法研究. 中國食品學報. 第6 卷,第2期,2006 年4 月.;利用處理后的數(shù)據(jù)(總分)對葡萄酒進行分級;然后,用初步處理后的釀酒葡萄的理化指標對葡萄進行聚類分析,將葡萄分成了若干類;分析每類葡萄對應的葡萄酒大都屬于哪一級別,從而得出葡萄的級別;最后,分析每一級葡萄理化指標的特點,建立起葡萄指標識別葡萄級別
4、的模型幫助果農更好地利用好葡萄釀好酒。二、問題假設1、同種葡萄酒在一組評酒員下的得分成正態(tài)分布。2、一種葡萄對應釀制一種葡萄酒。3、葡萄的成分充分轉換成葡萄酒里的成分,不存在意外的浪費和揮發(fā)。4、假設葡萄和葡萄酒芳香物質中沒有檢測到的成分不存在于該樣本中,數(shù)據(jù)處理前將其置為零。三、符號說明Xi第i個白葡萄酒樣品評分Qij第i個白葡萄酒樣品的第j個釀酒葡萄的理化指標四、模型的建立與求解4.1 模型一:基于wilcoxon符號秩檢驗【2】王星等.非參數(shù)統(tǒng)計.清華大學出版社2006年.第三章單一樣本的推斷問題.建立差異評估模型我們采用假設性檢驗驗證是否能接受兩組評酒員評價結果無差異的假設。然后用方差
5、分析兩組評酒員組內數(shù)據(jù)的波動,認為較平穩(wěn)的一組數(shù)據(jù)比較可靠。4.1.1 數(shù)據(jù)預處理我們在整理數(shù)據(jù)的時候發(fā)現(xiàn)幾個比較顯著的異常數(shù)據(jù):1)第一組白酒數(shù)據(jù)樣品3持久性品酒員7 號數(shù)據(jù)明顯有問題,懷疑是多敲了一個7;2)第一組白酒數(shù)據(jù)樣品8口感分析濃度品酒員2 號數(shù)據(jù)明顯異常。因為隨機樣本在均值附近振蕩,所以我們選用均值來代替異常數(shù)據(jù)以求誤差最小。表格 1白葡萄酒的數(shù)據(jù)初步處理白葡萄酒樣品1234567891011121314第一組評分8274.285.379.47168.477.571.472.974.372.363.365.972第二組評分77.975.875.676.981.575.574.27
6、2.380.479.871.472.473.977.1D4.1-1.69.72.5-10.5-7.13.3-0.9-7.5-5.50.9-9.1-8-5.1白葡萄酒樣品1516171819202122232425262728第一組評分72.47478.873.172.277.876.47175.973.377.181.364.881.3第二組評分78.467.380.376.776.476.679.279.477.476.179.574.37779.6D-66.7-1.5-3.6-4.21.2-2.8-8.4-1.5-2.8-2.47-12.21.7圖表 1差值的密度直方圖及正態(tài)QQ圖根據(jù)圖1
7、白葡萄酒樣品評分差值密度直方圖,易知該分布是單峰對稱分布,以及正態(tài)QQ圖可知,差值近似服從正態(tài)分布。在對其進行檢驗時,可以選擇符號檢驗和符號秩檢驗,但結合兩種檢驗的優(yōu)缺點,為了取得更好的檢驗效果應選擇符號秩檢驗。4.1.2 基于成對數(shù)據(jù)的符號秩檢驗1)wilcoxon符號秩檢驗簡介在wilcoxon符號秩檢驗中,它把觀測值和零假設的中心位置之差的絕對值的秩分別按照不同的符號相加作為其檢驗統(tǒng)計量。它適用于參數(shù)檢驗中t檢驗的成對比較,但并不要求成對數(shù)據(jù)之差服從正態(tài)分布,只要求服從對稱分布即可。檢驗成對觀測數(shù)據(jù)之差是否來自均值為0的總體(產生數(shù)據(jù)的總體是否具有相同的均值)。2)模型的建立在白葡萄酒的
8、wilcoxon符號秩檢驗過程中。假設28個樣本點Xi(i=1,2,28),來自連續(xù)對稱總體分布,則總體的中位數(shù)等于均值。wilcoxon符號秩檢驗的步驟如下:(1)對i=1,2, ,28,計算| Xi-M0 |;它們表示這樣樣本點到M0的距離。(2)將上面28個絕對值排序,并找出它們的28個秩;如果有相同的樣本點,每個點取平均秩。(3)令W1等于Xi-M0 0的|Xi-M0|的秩的和,W2等于Xi-M0 0的|Xi-M0|秩的和。(4)對雙邊檢驗H0 :M = M0 H1:M M0,在零假設下,W1和W2應差不多。因而,當其中之一很小時,應懷疑零假設。在此,取檢驗統(tǒng)計量W=min(W1,W2
9、)。(5)根據(jù)得到的W值,利用統(tǒng)計軟件或查wilcoxon符號秩檢驗的分布表以得到在零假設下的P值。如果n很大要用正態(tài)近似:得到一個與W有關的正態(tài)隨機變量Z的值,再用軟件或查正態(tài)分布表得到P值。(6)如果P值較?。ū热缧∮诨虻扔诮o定的顯著性水平,譬如0.05)則可以拒絕零假設。如果P值較大則沒有充分的證據(jù)來拒絕零假設,但不意味著接受零假設。3)模型的求解數(shù)據(jù)經(jīng)過sas軟件處理得下圖:圖表 2差值的位置檢驗由圖2白葡萄酒樣品評分差值的位置檢驗,在符號秩檢驗的p值為0.0345,其小于顯著性水平=0.05,因此得出拒絕原假設,接受備擇假設的結論,即兩組白葡萄酒樣品評分存在顯著性差異。4.1.3 可
10、信度定量分析1)模型的建立:記第一組10 位品酒員對白葡萄酒樣品Xi(i=1,2,28)的 評 分 為Aij(j=1,2,10),Ai=110j=110Ai , S1i=110j=110(Aij-Ai),其中, Ai 表示第一組品酒員對白葡萄酒樣品Xi的評分均值,S1i 表示Xi的評分方差;同樣,第二組對白葡萄酒樣品的評分均值和方差分別為Bi=110j=110Bi , S2i=110j=110(Bij-Bi)從而對每一組品酒員得到一個評分方差向量S12=(S122,S132S1282)S22=(S212,S222S2282)用方差和對比得到對于白葡萄兩組不同的評價水平。方差和小的穩(wěn)定性好,相對
11、來說比另一組的評價結果是更可信的。2)模型的求解:運用sas軟件進行求解,容易得到S12,S22,具體附錄一對白葡萄酒而言:S12元素的和為3297.7,S22元素的和為1577.2。第一組的方差和總是遠遠大于第二組。為了更直觀的看到這個結果,下圖即為兩組評酒員對兩種葡萄酒的方差圖像,可以直觀的看到第二組的波動程度比第一組的小,第二組更可信。圖表 3兩組評酒員對白葡萄酒的評分方差圖4.2 模型二:基于聚類分析建立釀酒葡萄分級模型我們根據(jù)可信組評酒員給每種白葡萄酒樣品的打分來確定白葡萄酒的質量;再用聚類分析對釀酒葡萄進行分類,對每類的葡萄釀造的白葡萄酒進行統(tǒng)計,對應地得到這類葡萄所對應的級別。4
12、.2.1 葡萄酒的分級1)置信區(qū)間法置信區(qū)間法能有效的降低評酒員之間的差異,提高酒樣品之間的差異,雖然我們在第一問中分辨出第二組評酒員評判出的數(shù)據(jù)更可靠,但是我們不能排除第一組評酒員的專業(yè)性,為了最可靠的樣本,我們應該綜合兩組評價的分數(shù)。所以本文先采用置信區(qū)間法分別處理第一,二組數(shù)據(jù),處理之后對同種葡萄酒的分數(shù)做一個平均。用白蒲萄酒的第一組數(shù)據(jù)做置信區(qū)間處理,計算評酒員對酒樣品Xi(i=1,2,28)評價的置信區(qū)間為i-i,i+i,其中i 為酒樣Xi的平均值;i為酒樣Xi的標準差。如果評酒員j 對酒樣Xi的評價ij在其置信區(qū)間范圍內就可以直接使用; 如果其評價ij 不在置信區(qū)間范圍內, 則做如
13、下變換:若ijij,則ij=ij-i若變換之后的ij仍不在置信區(qū)間范圍內,再重復上面的變換,這樣逐步調整,直至不同評酒員對同一酒樣的評價值都處于ij-i,ij+i范圍內。對第二組數(shù)據(jù)做同樣處理,再對同種酒樣Xi兩組數(shù)據(jù)做平均。2)葡萄酒分級通過分析所有白葡萄酒樣品的總分的平均分,我們借鑒羅伯特的分級【3】張哲,羅伯特帕克是如何評分的, 月8 日.標準制定本文的對葡萄酒的分級標準,以更好的體現(xiàn)酒樣之間的差異。葡萄酒樣品的分級標準:8085 分:高級葡萄酒7580 分:中上級葡萄酒7075 分:中級葡萄酒6570 分:中下級葡萄酒6065 分:下級葡萄酒以下是根據(jù)1)的數(shù)據(jù)求得的葡萄酒總分的平均分
14、表格 2白葡萄酒的評分結果(從高到底)1組2821125172610420239155781.1480.5780.5279.6278.7378.4778.277.8377.6576.9876.7776.7176.5676.142組23221814241981162716131276.0675.8275.7975.5375.0874.774.4773.7871.6571.3170.370.269.969.03白葡萄酒樣品的分級:高級白葡萄酒:28、21、1中上級白葡萄酒:25、17、26、10、4、20、23、9、15、5、7、2、3、22、18、14中級白葡萄酒:24、19、8、11、6、27
15、、16中下級白葡萄酒:13、12下級白葡萄酒:無4.2.2 對釀酒葡萄的Q 型聚類分析【4】薛毅,陳立萍統(tǒng)計建模與R 軟件(下冊)清華大學出版社2006 年466頁聚類分析方法是基于數(shù)值分類法的思想建立起來的,又稱為系統(tǒng)聚類法。這里只基于釀酒葡萄樣本進行聚類,成為Q 型聚類,其步驟為:步驟一:數(shù)據(jù)標準化以釀酒紅葡萄和紅葡萄酒為例,由于釀酒葡萄Xi(i=1,2,28) 的各理化指標Qij(j=1,2,30)使用了不同的量綱及數(shù)據(jù)的大小差距很大,對理化指標數(shù)據(jù)矩陣的處理采用標準化,處理方式為Qij=Qij-QjSj其中Qj,Sj是矩陣Xi=(Qij)28*30每一列的均值和標準差。步驟二:樣本的相
16、似性度量在對釀酒紅葡萄的理化指標進行聚類分析時,首先要確定理化指標樣本的相似性度量,本文采用相關系數(shù)來衡量兩個指標樣本的相似性。記樣本Qj 的取值(Q1j,Q2j,Q28j)TRn(j=1,2,30),則兩個樣本的相關系數(shù)Rjk=i=030Qij-Qj(Qik-Qk)i=030Qij-Qj2i=030(Qik-Qk)2相似性度量中Rjk越接近1,Qj與Qk越相關;Rjk越接近0,Qj與Qk的相關性越弱。步驟三:樣本的距離定義在對釀酒葡萄的聚類分析中,定義兩類理化指標樣本的距離(類平均法)為:DG1,G2=1n1n2QjG1QjG2d(Qj,Qk)它等于G1,G2中兩兩樣本點距離的平均,試中n1
17、,n2分別為G1,G2中的樣本點個數(shù)其中dQj,Qk=1-Rjk或者 dQj,Qk=1-Rjk2。步驟四:Q 型聚類分析求解模型使用sas軟件中的cluster函數(shù)(本文所有程序均用sas 軟件處理),對數(shù)據(jù)進行處理,樣本間相似性度量采用相關系數(shù),類間距離的度量計算采用類平均法,對兩種釀酒葡萄進行Q 型聚類分析,畫出聚類圖,對釀酒葡萄劃分類別。1) 白葡萄的聚類分析圖如下:圖表 4白葡萄酒的聚類圖2) 聚類結果分析白葡萄劃分成6 類的結果如下:屬于第1 類的樣本有:葡萄樣品1、13、6、18、7、15屬于第2 類的樣本有:葡萄樣品2、25、19、8、11、16屬于第3 類的樣本有:葡萄樣品3、5、20屬于第4 類的樣本有:葡萄樣品4、14、21、9、28、23、26、17、22屬于第5 類的樣本有:葡萄樣品10、24、12屬于第6 類的樣本有:葡萄樣品27對于每類葡萄中的元素(單個葡萄樣本),結合其釀造出的葡萄酒的品質,既該葡萄樣本所釀造的葡萄酒的級別,來確定該葡萄的級別。然后再根據(jù)每類葡萄中葡萄樣本級別的比例來確定該類葡萄的級別。對應葡萄酒的分級,我們也將葡萄分成高級,中上,中級,中下,下級。3) 根據(jù)以上聚類分的結果再綜合葡萄酒的分級(葡萄酒的質量)我們得出如下結論:白葡萄分級結果高級白葡萄:2、2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 黃河文化的豐富內涵與時代價值
- 2025新譯林版英語七年級下單詞默寫單
- 北海2024年01版小學6年級上冊英語第6單元測驗卷
- 2024年洗煤項目資金申請報告代可行性研究報告
- 2024年超高分子量聚乙烯項目投資申請報告代可行性研究報告
- 《緊密紡精梳棉紗制備技術規(guī)范》
- Python程序設計實踐- 習題及答案 ch02 問題求解與計算思維
- 組織部工作總結15篇
- 讀書交流會專題討論發(fā)言稿
- 廣西景點導游詞1000字(14篇)
- 咨詢咨詢合同三篇
- 師范大學學術規(guī)范測試
- 福建師范大學《數(shù)字攝像》2023-2024學年第一學期期末試卷
- 2023阿里云ACA大數(shù)據(jù)復習題題庫及答案
- 基于PLC的物料分揀系統(tǒng)設計
- 國開(內蒙古)2024年《創(chuàng)新創(chuàng)業(yè)教育基礎》形考任務1-3終考任務答案
- 手工木工(技師)技能認定理論考試題庫大全-上(單選題)
- 2024-2030年國內水產飼料行業(yè)市場發(fā)展分析及競爭格局與發(fā)展策略研究報告
- 2023年中國鐵路國際有限公司招聘筆試真題
- 《護理管理學》期末考試復習題庫(含答案)
- 學習通尊重學術道德遵守學術規(guī)范課后習題答案
評論
0/150
提交評論