




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2012高教社杯全國大學(xué)生數(shù)學(xué)建模競(jìng)賽承諾書我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競(jìng)賽的競(jìng)賽規(guī)則.我們完全明白,在競(jìng)賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競(jìng)賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們授權(quán)全國大學(xué)生數(shù)學(xué)建模競(jìng)賽組委會(huì),可將我們的論文以任何形式進(jìn)行公開展示(包括進(jìn)行網(wǎng)上公示,在書籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等)。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫):A 我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話):20121193所屬學(xué)校(請(qǐng)?zhí)顚懲暾娜簠①愱?duì)員(打印并簽名):1.2.3.指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人(打印并簽名):日期:2012年09月10日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2012高教社杯全國大學(xué)生數(shù)學(xué)建模競(jìng)賽編號(hào)專用頁賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國前編號(hào)):全國評(píng)閱編號(hào)(由全國組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2012高教社杯全國大學(xué)生數(shù)學(xué)建模競(jìng)賽題目葡萄酒的評(píng)價(jià)摘要葡萄酒是人們?nèi)粘I钪械某S蔑嬈?,本文?duì)葡萄酒的評(píng)價(jià)做了較為詳盡的分析和研究。對(duì)于問題一:數(shù)據(jù)是成對(duì)的,即對(duì)同一酒樣品打出兩組分?jǐn)?shù)。我們利用參數(shù)檢驗(yàn)中的獨(dú)立樣本t檢驗(yàn)[1]來檢驗(yàn)兩序列均值差異是否顯著。在顯著性水平0.05下,對(duì)于紅葡萄酒:酒樣本2、11、12、13、16、23兩組評(píng)酒員打分差異顯著,整體上差異不顯著。白葡萄酒:樣本5、27兩組評(píng)酒員打分差異顯著,整體上差異不顯著。同時(shí)我們又利用逐對(duì)比較法[2],用單樣本t檢驗(yàn)來進(jìn)行顯著性檢驗(yàn)。紅葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有16組數(shù)據(jù)無顯著性差異;白葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有24組數(shù)據(jù)無顯著性差異。接下來計(jì)算兩組打分結(jié)果均值的置信區(qū)間[2],區(qū)間長度越短,結(jié)果越可信。計(jì)算表明第二組絕大部分得分置信區(qū)間長度小于第一組,所以整體上第二組得分更可信。對(duì)于問題二:利用SPSS[3]進(jìn)行主成分分析對(duì)釀酒葡萄理化指標(biāo)數(shù)據(jù)進(jìn)行降維、分類,并用聚類分析加以檢驗(yàn),證實(shí)主成分分析結(jié)果合理。我們?cè)谒玫降闹鞒煞种刑暨x能夠反映主成分的代表理化指標(biāo)[5]并與葡萄酒得分一起作為聚類變量,運(yùn)用k-means聚類方法[1]將紅、白葡萄各聚成5類。葡萄酒的質(zhì)量在一定程度上反映了對(duì)應(yīng)葡萄的質(zhì)量,分級(jí)結(jié)果具體結(jié)果見表13,14.對(duì)于問題三,我們建立典型相關(guān)分析模型分析釀酒葡萄與葡萄酒理化指標(biāo)間的一些定性關(guān)系。為了更精確地描述指標(biāo)間聯(lián)系,又建立了多元線性逐步回歸模型[6],給出了紅葡萄酒各理化指標(biāo)關(guān)于紅葡萄指標(biāo)的定量關(guān)系,根據(jù)殘差分析去除了一部分壞點(diǎn)使得改善,達(dá)到較好的回歸效果。與典型相關(guān)分析比較,結(jié)果相符,說明兩指標(biāo)間聯(lián)系分析比較可靠。對(duì)于白葡萄未得到較好的多元線性回歸方程,說明白葡萄和白葡萄酒兩理化指標(biāo)間存在復(fù)雜非線性關(guān)系。對(duì)于問題四:先利用問題三中的典型相關(guān)分析,得到了部分釀酒葡萄、葡萄酒理化指標(biāo)對(duì)葡萄酒質(zhì)量的定性影響。同時(shí)建立BP神經(jīng)網(wǎng)絡(luò)模型,以釀酒葡萄、葡萄酒理化指標(biāo)為輸入節(jié)點(diǎn),葡萄酒質(zhì)量得分為輸出節(jié)點(diǎn),訓(xùn)練網(wǎng)絡(luò)函數(shù)。迭代多次后達(dá)到預(yù)設(shè)目標(biāo)。以紅葡萄酒為例,酒樣本1-20作為樣本訓(xùn)練,21-27來檢測(cè)網(wǎng)絡(luò)的預(yù)測(cè)效果,相對(duì)誤差如下:樣本編號(hào)21222324252627實(shí)際得分72.271.677.171.568.27271.5網(wǎng)絡(luò)預(yù)測(cè)得分63.410171.013674.611969.762473.397972.064271.1569相對(duì)誤差0.1217440.008190.0322710.0243020.0762160.0008920.004799我們認(rèn)為釀酒葡萄和葡萄酒理化指標(biāo)在一定程度上可以評(píng)價(jià)葡萄酒的質(zhì)量,但并不完備。理化指標(biāo)中未包含芳香類物質(zhì),應(yīng)該研究芳香類物質(zhì)與理化指標(biāo)之間的聯(lián)系。而且葡萄酒的質(zhì)量還與釀造工藝、地理環(huán)境等息息相關(guān)。應(yīng)該把以上的因素都加以考慮才能得到更為滿意的結(jié)果。關(guān)鍵詞:獨(dú)立樣本t檢驗(yàn)因子分析聚類分析典型相關(guān)分析逐步回歸BP神經(jīng)網(wǎng)絡(luò)問題重述確定葡萄酒質(zhì)量時(shí)一般是通過聘請(qǐng)一批有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)。每個(gè)評(píng)酒員在對(duì)葡萄酒進(jìn)行品嘗后對(duì)其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測(cè)的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量。附件1給出了某一年份一些葡萄酒的評(píng)價(jià)結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分?jǐn)?shù)據(jù)。請(qǐng)嘗試建立數(shù)學(xué)模型討論下列問題:1.分析附件1中兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無顯著性差異,哪一組結(jié)果更可信?2.根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。3.分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。4.分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量?問題分析問題1要求我們進(jìn)行顯著性分析。首先我們想到方差分析,但是方差大的數(shù)據(jù)不一定就有顯著性差異,利用方差分析得到的結(jié)果不可靠,該方法不可取。然后我們想到利用獨(dú)立樣本t檢驗(yàn)來進(jìn)行顯著性分析,其前提是方差具有齊性、服從正態(tài)分布的相互獨(dú)立,所以還要判斷數(shù)據(jù)是否服從正態(tài)分布和齊性檢驗(yàn),未通過齊性檢驗(yàn)的數(shù)據(jù)還需另外考慮。由于數(shù)據(jù)是成對(duì)出現(xiàn),而且為了結(jié)果的可靠性,我們還考慮利用逐對(duì)比較法進(jìn)行分析。最后將兩種方法的到的結(jié)果進(jìn)行比較分析,得出顯著性分析的結(jié)果。對(duì)于哪一組數(shù)據(jù)更可靠,我們考慮在相同的置信水平下,置信區(qū)間更小的數(shù)據(jù)更為可靠。問題2要求我們根據(jù)葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)釀酒葡萄分級(jí)。附件2給出的葡萄理化指標(biāo)多達(dá)30種,首先需要進(jìn)行簡化降維,我們想到主成份分析。為了得到更可靠的分類結(jié)果,我們還采用聚類分析來輔助驗(yàn)證分類的可靠性。最后要得到葡萄的分級(jí),本文利用分出的八類主成份的代表理化指標(biāo)并與葡萄酒得分一起作為聚類變量,分成五個(gè)類,然后根據(jù)評(píng)酒師的評(píng)分高低將分出的五類排序,從而將釀酒葡萄分級(jí)。問題3要求我們分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。由于理化指標(biāo)數(shù)很多,為了簡化問題抓住問題本質(zhì),我們采用典型相關(guān)分析對(duì)理化指標(biāo)之間的聯(lián)系進(jìn)行分析,該方法得到的結(jié)果不是具體的表達(dá)式;所以,我們還利用回歸的方法,得到更具體的聯(lián)系,并將兩種方法得到的結(jié)果比較。問題4要求我們分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響。本文首先采用典型相關(guān)性分析得到簡單的定性關(guān)系,然后嘗試進(jìn)行多元逐步線性回歸,從結(jié)果上看,回歸的擬合優(yōu)度并不高。它們的關(guān)系是非線性的,所以采用神經(jīng)網(wǎng)絡(luò)算法比較好?;炯僭O(shè)假設(shè)各個(gè)評(píng)酒員的評(píng)分?jǐn)?shù)據(jù)相互獨(dú)立,不考慮外界因素對(duì)評(píng)酒員打分的影響;葡萄酒的質(zhì)量在一定程度上可以反映葡萄的質(zhì)量;符號(hào)說明符號(hào)說明附在具體小問內(nèi)模型的建立與求解問題1的模型建立與求解1.1問題1的模型1的建立1.1.1問題1的模型1準(zhǔn)備該題要求我們分析附件1中兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無顯著性差異,并確定哪一組更可信。方法選擇:單樣本t檢驗(yàn)用來檢驗(yàn)樣本均值和總體均值是否有顯著性差異,而獨(dú)立樣本t檢驗(yàn)利用來自某兩個(gè)總體的獨(dú)立樣本,推斷兩個(gè)總體的均值是否存在顯著性差異。根據(jù)題目要求,我們選擇采用獨(dú)立樣本t檢驗(yàn)來分析評(píng)價(jià)結(jié)果有無顯著性差異。獨(dú)立樣本t檢驗(yàn)的結(jié)論很大程度上取決于兩個(gè)總體的方差是否相等,在檢驗(yàn)兩總體均值是否相等前,需要進(jìn)行方差齊性檢驗(yàn)。獨(dú)立樣本t檢驗(yàn)的前提是樣本來自的總體應(yīng)服從或近似服從正態(tài)分布,且兩組樣本相互獨(dú)立。所以,我們首先判斷兩組評(píng)酒員的評(píng)價(jià)結(jié)果總體是否服從正態(tài)分布。1.1.2獨(dú)立樣本t檢驗(yàn)原理[1]簡介在假設(shè)成立的條件下,獨(dú)立樣本t檢驗(yàn)使用統(tǒng)計(jì)量,分兩種情況:樣本方差相等時(shí),(1)為兩樣本容量,,為兩樣本標(biāo)準(zhǔn)差。樣本方差不相等時(shí),(2)獨(dú)立樣本t檢驗(yàn)的結(jié)論很大程度上取決于兩個(gè)總體的方差是否相等,在檢驗(yàn)兩總體均值是否相等前,需要進(jìn)行方差齊性檢驗(yàn)。獨(dú)立樣本t檢驗(yàn)的前提是樣本來自的總體應(yīng)服從或近似服從正態(tài)分布,且兩組樣本相互獨(dú)立。所以,我們首先判斷兩組評(píng)酒員的評(píng)價(jià)結(jié)果總體是否服從正態(tài)分布。1.1.3K-S檢驗(yàn)步驟簡述[1]K-S檢驗(yàn)利用樣本數(shù)據(jù)推斷樣本數(shù)據(jù)是否服從某一制定分布,是一種擬合優(yōu)度檢驗(yàn)方法,適用于探索連續(xù)性隨機(jī)變量的分布。因此,我們選擇K-S檢驗(yàn)來判斷兩組評(píng)酒員的評(píng)價(jià)結(jié)果總體是否服從正態(tài)分布。具體步驟如下:1.1.4利用獨(dú)立樣本t檢驗(yàn)?zāi)P瓦M(jìn)行顯著性分析為了能夠得到較為準(zhǔn)確的分析結(jié)果,我們首先分別對(duì)兩種酒的每一個(gè)樣品的兩組評(píng)酒員評(píng)分結(jié)果進(jìn)行顯著性分析;然后再對(duì)總體進(jìn)行顯著性分析,對(duì)每個(gè)樣品的10個(gè)評(píng)酒員品嘗評(píng)分求均值,得到兩組評(píng)酒員評(píng)分的均值,然后對(duì)這兩組均值數(shù)據(jù)進(jìn)行顯著性分析。1.2問題1的模型1求解下面以紅葡萄酒為例闡述求解過程:1.2.1紅葡萄酒評(píng)價(jià)結(jié)果顯著性分析第一步,判斷評(píng)分是否服從正態(tài)分布;根據(jù)K-S檢驗(yàn)步驟,編寫MATLAB程序,判斷紅葡萄酒每個(gè)樣品的兩組評(píng)酒員品嘗評(píng)分是否服從正態(tài)分布,運(yùn)行程序,得到所有的都等于0,即兩組評(píng)酒員的各27個(gè)樣品評(píng)分結(jié)果都服從正態(tài)分布。第二步,進(jìn)行方差齊性檢驗(yàn);根據(jù)F檢驗(yàn)的原理編寫MATLAB程序判斷兩總體方差是否相等,當(dāng)H=0時(shí)表示該組樣品評(píng)分結(jié)果滿足方差齊性檢驗(yàn),得到的結(jié)果如下:表1紅葡萄酒評(píng)分方差齊性檢驗(yàn)結(jié)果H=1H=0樣品編號(hào)5、17、24其它第三步,對(duì)通過方差齊性檢驗(yàn)的24組數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn);取顯著性水平=0.05。根據(jù)P值決策:如果P值,拒絕原假設(shè);如果P值,不拒絕原假設(shè)。假設(shè)::兩組評(píng)酒員評(píng)分無顯著性差異;:兩組評(píng)酒員評(píng)分有顯著性差異;利用MATLAB程序計(jì)算得到結(jié)果如下:表2紅葡萄酒評(píng)分通過方差齊性檢驗(yàn)組的顯著性差異分析結(jié)果酒樣品編號(hào)1234678910111213P值0.2130.0160.0500.5100.0530.1460.0730.1900.0510.0190.0000.030是否接受原假設(shè)接受拒絕接受接受接受接受接受接受接受拒絕拒絕拒絕酒樣品編號(hào)141516181920212223252627P值0.8710.0650.0200.0950.0770.2870.2240.0560.0020.7650.5130.578是否接受原假設(shè)接受接受拒絕接受接受接受接受接受拒絕接受接受接受對(duì)于3組未通過方差齊性檢驗(yàn)和27組每組的均值數(shù)據(jù),利用樣本方差不相等時(shí)的計(jì)算式,對(duì)其進(jìn)行顯著性分析,得到的結(jié)果如下:表3紅葡萄酒評(píng)分未通過方差齊性檢驗(yàn)組的顯著性差異分析結(jié)果酒樣品編號(hào)51724總體P值0.6700.1520.0470.120是否接受原假設(shè)接受接受拒絕接受1.2.2白葡萄酒評(píng)價(jià)結(jié)果顯著性分析用同樣的方法對(duì)白葡萄酒進(jìn)行分析,兩組評(píng)酒員的各28個(gè)樣品評(píng)分結(jié)果都服從正態(tài)分布,有7組未通過齊性檢驗(yàn),對(duì)通過方差齊性檢驗(yàn)的21組數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn),得到結(jié)果如下:表4白葡萄酒評(píng)分通過方差齊性檢驗(yàn)組的顯著性差異分析結(jié)果酒樣品編號(hào)13479101112131516P值0.2480.1900.4070.2620.1100.3150.8630.0890.1030.1810.206是否接受原假設(shè)接受接受接受接受接受接受接受接受接受接受接受酒樣品編號(hào)17192021222324252628P值0.7300.1360.7270.5720.0710.5310.4790.5300.1120.608是否接受原假設(shè)接受接受接受接受接受接受接受接受接受接受對(duì)于7組未通過方差齊性檢驗(yàn)的數(shù)據(jù)和28組每組的均值數(shù)據(jù),利用樣本方差不相等時(shí)的計(jì)算式,其進(jìn)行顯著性分析,得到的結(jié)果如下:表5白葡萄酒評(píng)分未通過方差齊性檢驗(yàn)組的顯著性差異分析結(jié)果酒樣品編號(hào)2568141827總體P值0.7540.0190.1260.5660.1840.3560.0130.055是否接受原假設(shè)接受拒絕接受接受接受接受拒絕接受1.3.問題1模型2的建立上述獨(dú)立樣本t檢驗(yàn)需要進(jìn)行方差齊性檢驗(yàn),對(duì)于那些未通過方差齊性檢驗(yàn)的數(shù)據(jù)還需另外考慮。對(duì)于這樣的成對(duì)數(shù)據(jù)檢驗(yàn),我們還考慮采用逐對(duì)比較法[2]。本題中的數(shù)據(jù)是成對(duì)的,即對(duì)同一酒樣品打出十對(duì)分?jǐn)?shù)。同一對(duì)中兩個(gè)數(shù)據(jù)的差異可以看成是僅由評(píng)酒師的評(píng)分標(biāo)準(zhǔn)差異所引起的,這樣,局限于各對(duì)中兩個(gè)數(shù)據(jù)來比較就能排除種種其他因素,而單獨(dú)考慮由評(píng)酒師產(chǎn)生的影響,從而比較兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無顯著性差異。一般,設(shè)有n對(duì)相互獨(dú)立的觀察結(jié)果:令,則相互獨(dú)立,又由于是由同一因素引起的,可認(rèn)為他們服從同一分布。今假設(shè),其中未知,建立基于樣本的假設(shè)檢驗(yàn):分別計(jì)的樣本均值和樣本方差的觀察值為,關(guān)于單個(gè)正態(tài)總體均值的t檢驗(yàn),拒絕域?yàn)椋@著性水平為):1.4.問題1模型2的求解現(xiàn)在回過來討論本題的檢驗(yàn)問題,以紅葡萄酒1號(hào)評(píng)酒師的打分為例(如表6所示):表6第一組x51664954776172617462第二組y68718052537671737067-17-5-31224-151-124-5取顯著性水平為=0.05,利用MATLAB程序tteset函數(shù),解得H=0,即接受原假設(shè),第一對(duì)數(shù)據(jù)無顯著性差異。對(duì)所有27對(duì)紅葡萄酒評(píng)分?jǐn)?shù)據(jù)進(jìn)行同樣的處理,得到的結(jié)果如下:表7紅葡萄酒評(píng)分顯著性差異分析結(jié)果酒樣品編號(hào)123456789P值0.2790.0260.0200.5400.6690.0790.0890.1300.279是否接受原假設(shè)接受拒絕拒絕接受接受接受接受接受接受酒樣品編號(hào)101112131415161718P值0.0100.0040.0010.0490.8840.0740.0290.1450.164是否接受原假設(shè)拒絕拒絕拒絕拒絕接受接受拒絕接受接受酒樣品編號(hào)192021222324252627P值0.0080.3060.2400.0560.0200.0510.7150.5200.609是否接受原假設(shè)拒絕接受接受接受拒絕接受接受接受接受由表可見,有16對(duì)數(shù)據(jù)接受原假設(shè),無顯著性差異。對(duì)白葡萄酒的評(píng)分?jǐn)?shù)據(jù)做相同的處理,得到的結(jié)果如下:表8白葡萄酒評(píng)分顯著性差異分析結(jié)果酒樣品編號(hào)12345678910P值0.1850.7560.1780.4410.0230.1270.0270.8650.1980.335是否接受原假設(shè)接受接受接受接受拒絕接受拒絕接受接受接受酒樣品編號(hào)11121314151617181920P值0.8670.0960.1420.1880.1490.1470.6590.4690.0460.591是否接受原假設(shè)接受接受接受接受接受接受接受接受拒絕接受酒樣品編號(hào)2122232425262728P值0.5590.0820.4830.5510.5850.1270.0220.535是否接受原假設(shè)接受接受接受接受接受接受拒絕接受由表可見,有24對(duì)數(shù)據(jù)接受原假設(shè),無顯著性差異。1.5.顯著性差異分析的結(jié)果說明第一種利用獨(dú)立樣本T檢驗(yàn)。紅葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有20組數(shù)據(jù)無顯著性差異,兩組總體評(píng)分均值也無顯著性差異;白葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有26組數(shù)據(jù)無顯著性差異,兩組總體評(píng)分均值也無顯著性差異。第二種利用逐對(duì)比較法,紅葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有16組數(shù)據(jù)無顯著性差異;白葡萄酒的評(píng)分?jǐn)?shù)據(jù)中有24組數(shù)據(jù)無顯著性差異。兩種方法得到的結(jié)果基本符合,說明了顯著性分析結(jié)果的可靠性。各組評(píng)分?jǐn)?shù)據(jù)中只有少數(shù)幾組有顯著性差異,可認(rèn)為兩組評(píng)酒員的評(píng)價(jià)結(jié)果無顯著性差異。1.6.評(píng)分結(jié)果可信性分析對(duì)于每個(gè)葡萄酒樣品,我們先計(jì)算出每個(gè)評(píng)酒員對(duì)每個(gè)酒樣品所打的總分,對(duì)這些總分進(jìn)行分析。評(píng)分?jǐn)?shù)據(jù)的方差是未知的,且可以認(rèn)為數(shù)據(jù)服從正態(tài)分布。我們希望分別給出兩組評(píng)分?jǐn)?shù)據(jù)均值真值所在的范圍,同時(shí)給出該范圍包含均值真值的可信程度;所以我們選擇方差未知時(shí),正態(tài)總體均值的區(qū)間估計(jì)[2]來判斷哪一組數(shù)據(jù)更可信,在相同的置信水平下,置信區(qū)間越短,數(shù)據(jù)越可信。 現(xiàn)以紅葡萄酒樣品1的第一組評(píng)分結(jié)果為例計(jì)算,求評(píng)分?jǐn)?shù)據(jù)的均值對(duì)于給定的置信水平為的置信區(qū)間。第一組評(píng)分?jǐn)?shù)據(jù)如下:51,66,49,54,77,61,72,61,74,62。這是方差未知,求正態(tài)總體均值的置信區(qū)間的問題。所對(duì)應(yīng)的置信區(qū)間為又,由樣本觀察值算得,帶入計(jì)算得置信區(qū)間為,置信區(qū)間長度為13.79。利用MATLAB計(jì)算所有組數(shù)據(jù)在置信水平為的置信區(qū)間長度,得到如下結(jié)果:表9紅葡萄酒各樣品兩組數(shù)據(jù)置信區(qū)間長度值樣品編號(hào)1234567891011121314一組13.89.09.714.911.311.114.69.58.27.912.012.89.68.6二組12.95.87.99.25.36.611.311.57.38.68.87.25.66.9樣品編號(hào)15161718192021222324252627一組13.26.113.49.89.87.315.410.28.212.411.58.010.1二組9.26.44.310.110.68.98.57.07.14.79.59.26.5圖1紅葡萄酒各樣品兩組數(shù)據(jù)置信區(qū)間長度比較表10白葡萄酒各樣品兩組數(shù)據(jù)置信區(qū)間長度值樣品編號(hào)1234567891011121314一組13.720.327.39.616.118.29.019.413.820.919.015.418.715.3二組7.310.017.19.37.36.89.38.014.712.013.416.99.85.7樣品編號(hào)1516171819202122232425262728一組16.419.117.217.99.711.518.816.89.515.18.312.217.212.8二組10.513.08.97.97.310.111.510.54.98.914.814.58.57.21.7.比較結(jié)果分析說明由以上結(jié)果可以看出,紅、白葡萄酒各組數(shù)據(jù)的置信區(qū)間長度有相同的規(guī)律,除了個(gè)別酒樣品評(píng)分?jǐn)?shù)據(jù)的置信區(qū)間長度是第二組大于第一組,幾乎所有的樣品都是第一組的置信區(qū)間長度大于第二組。根據(jù)前面所述理論,相同置信水平下,置信區(qū)間長度越短,可信性越高,所以兩種葡萄酒的評(píng)分結(jié)果都是第二組更可信。2.問題2的模型建立與求解該問題要求我們根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。附件2給出的數(shù)據(jù)中變量非常多,為了從大量數(shù)據(jù)中分解原始變量,從中歸納出潛在的“類別”,我們采用主成份分析將釀酒葡萄的30個(gè)理化指標(biāo)簡化為多個(gè)主成份因子,并確定每個(gè)主成份的主要影響因子,通過聚類分析對(duì)主成份分析出的結(jié)果進(jìn)行分析與驗(yàn)證[4]。最后根據(jù)確定的主要影響因子對(duì)釀酒葡萄進(jìn)行分級(jí)。以下的分析過程都以紅葡萄酒釀酒葡萄為例。圖22.1.影響葡萄品質(zhì)的主成份的確定數(shù)據(jù)標(biāo)準(zhǔn)化由于數(shù)據(jù)為釀酒葡萄的各成分的含量、PH值、出汁率等,量綱不相同,因此首先要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,然后再進(jìn)行主成份分析。求解特征根及相應(yīng)特征向量利用SPSS求特征根及相應(yīng)特征向量,得到如下的碎石圖:圖3通過此圖可以明顯看出前八個(gè)主成分可以解釋大部分的方差,到第九個(gè)主成分以后,線逐漸平緩,解釋能力不強(qiáng)。因此我們提取8個(gè)主成份。選擇8個(gè)主成份,從方差貢獻(xiàn)率(方差貢獻(xiàn)率表見附錄)可以看出,8個(gè)主成份的累計(jì)方差貢獻(xiàn)率為83.017%,可以較好的解釋總體方差。旋轉(zhuǎn)成份矩陣旋轉(zhuǎn)成份矩陣a成份12345678氨基酸總量.136.622-.331-.330.031-.063.412.137蛋白質(zhì).569-.260-.128-.009-.087.451.282.335VC.056-.470-.134-.161.123-.139.130-.454花色苷.705.059.566-.130-.112.167.094.071酒石酸.206.105-.284-.174.093.226.101.794蘋果酸.167.168.830-.219.266-.027-.159.025檸檬酸-.026-.001.410-.085.208.033.113.770多酚氧化酶活力-.042.169.678.154-.297.106.284.053褐變度.260-.105.826-.180-.092.113.274.014DPPH自由基.839-.170-.029.032.025.221.337.048總酚.887.135.058-.115-.113.186.165.006單寧.811.009.232-.052-.085-.206.237.068葡萄總黃酮.892.015-.049.053-.032.106.094.031白藜蘆醇.010-.217-.064-.235.836.210.280-.035黃酮醇.225.170.143.010.010.032.875.105總糖.057.922-.011-.101.074.053.010-.074還原糖-.148.783.017-.113.015-.059-.037.085可溶性固形物.067.908.082-.002-.040-.059.013-.073PH值.325.044-.513-.067-.029.667.042-.120可滴定酸-.071.350-.117.120-.092-.849-.116-.146固酸比.115.106.257-.047.116.806-.043.185干物質(zhì)含量.113.905.133-.164.022-.146.039.176果穗質(zhì)量-.043-.259-.110.807-.062.171-.179.095百粒質(zhì)量-.093-.193-.198.772-.108-.161-.216-.238果梗比.247-.187.233-.378-.117.096.698-.004出汁率.741.042.043-.032-.126.055-.174-.087果皮質(zhì)量-.010-.027.048.881-.214-.231.136-.066L-.555-.363-.142.282.188.273.184-.239a-.322.009-.085-.105.895.047-.078.028b-.148.240.093-.047.870-.035-.230.237提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。a.旋轉(zhuǎn)在7次迭代后收斂。通過上表中的結(jié)果,我們可以看出:第一個(gè)主成分在L,蛋白質(zhì),花色苷,自由基,總酚,單寧,葡萄總黃,出汁率上有較大的載荷。第二個(gè)主成分在氨基酸,總糖,還原糖,可溶固,干物質(zhì),VC上有較大的載荷。第三個(gè)主成分在多酚氧化,蘋果酸,褐變度,PH上有較大的載荷。第四個(gè)主成分在果穗,百粒,果皮質(zhì)量上載荷較大。第五個(gè)主成分在白藜蘆醇,a,b,上有較大的載荷。第六個(gè)主成分在可滴定酸,固酸比上有較大的載荷。第七個(gè)主成分在黃酮醇上有較大的載荷。第八個(gè)主成分在酒石酸,檸檬酸上有較大的載荷。2.2.采用聚類方法對(duì)30個(gè)指標(biāo)聚類對(duì)釀酒葡萄理化指標(biāo)進(jìn)行聚類分析,依據(jù)因子分析的結(jié)果將30項(xiàng)理化指標(biāo)聚成8類,聚類之后觀察發(fā)現(xiàn)得到的聚類結(jié)果與事實(shí)明顯不符,這說明聚成八類是不合理的。因此,我們將30項(xiàng)理化指標(biāo)聚成10類為了比較兩種分類方法的分類情況,將各個(gè)理化指標(biāo)的兩種分類結(jié)果放到同一張表格中:表11主成分分類與聚類分類對(duì)比理化指標(biāo)氨基酸總糖還原糖可溶固干物質(zhì)果穗百粒果皮質(zhì)量VC白藜蘆醇Lab可滴定酸固酸比所屬主成分222224442515566聚類類別111112223444456理化指標(biāo)酒石酸檸檬酸多酚氧化黃酮醇果梗比蛋白質(zhì)花色苷蘋果酸褐變度自由基總酚單寧葡萄總黃PH出汁率所屬主成分883771133111131聚類類別7789910101010101010101010注:表格中的數(shù)字只是分類的編號(hào),幾類指標(biāo)對(duì)應(yīng)的編號(hào)相同,表示屬于同一類別。由上表可看出,屬于同一主成份的理化指標(biāo)大多同屬于一個(gè)聚類類別。經(jīng)過驗(yàn)證,主成份分析的分類結(jié)果是可靠的,結(jié)合主成分分析和聚類分析結(jié)果,抽取8個(gè)釀酒葡萄的原始理化指標(biāo)作為衡量主成份的主要影響因子[5]:表12各主成分與主要影響因子主成分主要影響因子第一主成分氨基酸第二主成分總酚第三主成分固酸比第四主成分VC第五主成分白藜蘆醇第六主成分第七主成分百粒第八主成分褐變度用以上八種主要影響因子的數(shù)據(jù)作為釀酒葡萄分級(jí)的八個(gè)指標(biāo)。2.3釀酒葡萄的分級(jí)我們首先決定將釀酒葡萄分為五個(gè)等級(jí)。利用聚類的方法將釀酒葡萄分為五類,由于聚類只是將葡萄分為五類,而不能確定每一類的好壞程度,所以要參考評(píng)酒師的評(píng)分均值將聚類得到的五類葡萄分成五個(gè)等級(jí);又由問題1的分析可知,第二組的評(píng)分結(jié)果更可靠,所以這里的評(píng)分均值用的是第二組的數(shù)據(jù)。首先用聚類分析將葡萄分為五類;當(dāng)要聚成的類數(shù)已知時(shí),適合用K-均值聚類。具體步驟如下:圖4聚類得到如下的結(jié)果:表12紅葡萄聚類結(jié)果評(píng)分均值61.665.365.465.76666.368.168.268.368.868.869.971.271.5聚類結(jié)果413樣品編號(hào)11718158612512101316424評(píng)分均值71.571.67272.172.272.672.67474.574.675.877.178.2聚類結(jié)果35352樣品編號(hào)2722265211419217320239根據(jù)上面表格的聚類結(jié)果,結(jié)合評(píng)酒師的評(píng)分均值,可以得到釀酒葡萄的分級(jí)(由好到差)如下:表13紅葡萄分級(jí)結(jié)果葡萄等級(jí)(由好到差)樣品編號(hào)一級(jí)9、23二級(jí)17、20三級(jí)16、4、24、27、22、26、5、21、14、19、2、3四級(jí)7、18、15、8、6、1、25、12、10、13五級(jí)4對(duì)白葡萄酒釀酒葡萄作相同的處理,得到白葡萄酒釀酒葡萄的分級(jí):表14白葡萄分級(jí)結(jié)果葡萄等級(jí)(由好到差)樣品編號(hào)一級(jí)20、4、23、21、22、25、28、10、17、9、5二級(jí)15三級(jí)1四級(jí)11、8、12、13、7、26、6、3、2、24、19、18、27五級(jí)163.問題3的模型建立與求解3.1模型的建立與準(zhǔn)備本問要求得出兩種理化指標(biāo)之間的聯(lián)系,灰色關(guān)聯(lián)度優(yōu)勢(shì)分析受初始數(shù)據(jù)處理方式影響很大,為了得到相對(duì)準(zhǔn)確的結(jié)果,我們采用典型相關(guān)分析。3.2釀酒葡萄與葡萄酒的理化指標(biāo)之間的典型相關(guān)分析限于篇幅,本文只對(duì)紅葡萄酒的釀酒葡萄與葡萄酒的理化指標(biāo)之間進(jìn)行典型相關(guān)分析。①典型相關(guān)系數(shù)及其檢驗(yàn)典型相關(guān)系數(shù)及其檢驗(yàn)如表所示表15相關(guān)系數(shù)及其檢驗(yàn)205.503138.32499.76669.21647.67827.63514.8548.8774.645臨界值(0.05)0.0000.0460.2490.5710.7480.9310.9710.9180.703典型相關(guān)系數(shù)0.9970.9720.9480.8970.8790.7820.6090.5070.461由上表可知,前六個(gè)典型相關(guān)系數(shù)均較高,表明相應(yīng)典型變量之間密切相關(guān)。但要確定典型變量相關(guān)性的顯著程度,尚需判斷與臨界值的相對(duì)大小。從上表可得看這8對(duì)典型變量均通過了統(tǒng)計(jì)量檢驗(yàn),表明相應(yīng)典型變量之間相關(guān)關(guān)系顯著,為了簡化分析,我們這里選取前兩組典型相關(guān)系數(shù)很大的典型相關(guān)變量進(jìn)行分析。②典型相關(guān)模型鑒于原始變量的計(jì)量單位不同,不宜直接比較,本文采用標(biāo)準(zhǔn)化的典型系數(shù),給出:表16典型相關(guān)系數(shù)0.820.060.030.14-0.21-0.01-0.220.190.19-0.150.410.14-0.03-0.20-0.170.94-0.28-0.03-0.63-0.260.150.720.21-0.57-0.230.090.240.161.24-0.980.400.130.27-0.560.63-0.11-1.040.050.150.50-0.270.200.400.56-0.250.310.18-0.39-0.850.84-0.050.270.060.200.450.110.250.161.78-1.63-0.59-0.921.11-0.50-0.250.730.670.25-0.08-0.011.07-0.25-1.29-0.230.650.070.400.511.280.55-1.890.200.25-0.280.43-0.640.61-0.441.65-2.091.680.72-0.910.08-0.570.32③典型結(jié)構(gòu)結(jié)構(gòu)分析是依據(jù)原始變量與典型變量之間的相關(guān)系數(shù)給出的,如下表所示。表17結(jié)構(gòu)分析(相關(guān)系數(shù))y1-0.9187-0.20940.91550.2035x10.89680.2850-0.8937-0.2769y2-0.76470.10860.7621-0.1055x20.1338-0.3720-0.13330.3615y3-0.6861-0.09860.68370.0958x30.72030.2545-0.7179-0.2473y4-0.6228-0.28200.62070.2740x40.54750.1067-0.5457-0.1037y5-0.09900.01260.0986-0.0123x50.61740.1193-0.6153-0.1159y6-0.6230-0.04120.62090.0400x60.60990.1371-0.6078-0.1332y70.8625-0.1275-0.85950.1239x70.37670.1873-0.3754-0.1820y80.24850.4571-0.2477-0.4442x8-0.09110.21490.0908-0.2088y90.11190.6754-0.1115-0.6563x90.5665-0.4586-0.56460.4456x100.1700-0.3045-0.16940.2959x110.2884-0.3147-0.28740.3058x120.40010.2250-0.3987-0.2187x13-0.40280.11640.4014-0.1131x14-0.44010.21840.4386-0.2122x15-0.23400.11740.2331-0.1141變量說明:3.3釀酒葡萄與葡萄酒的理化指標(biāo)之間聯(lián)系結(jié)論紅葡萄:總體上釀酒葡萄理化指標(biāo)的主要因素按重要程度依次是、,反映葡萄酒理化指標(biāo)的主要指標(biāo)是、、。由第一組典型相關(guān)方程可知,,,,與,之間影響較大;對(duì)于影響指標(biāo),,,的因素,按重要程度依次是、。對(duì)于影響指標(biāo)、的因素,按重要程度依次是,,,.由第二組典型相關(guān)方程可知,,與,,,,,之間影響較大;對(duì)于影響指標(biāo),的因素,按重要程度依次是,,,,,.對(duì)于影響,,,,,的因素,按重要程度依次是,。白葡萄:第一組典型相關(guān)方程可知,,,,,與,,,,,之間影響較大,對(duì)于影響指標(biāo),,,,的因素,按重要程度依次是,,,,,.對(duì)于影響,,,,,的因素,按重要程度依次是y2,y9,y3,y5,y4。第二組典型相關(guān)方程可知,,,與,,,,,,,之間影響較大;對(duì)于影響指標(biāo),,的因素,按重要程度依次是,,,,,,,對(duì)于影響,,,,,,,的因素,按重要程度依次是,,.3.4典型冗余分析與解釋能力分析典型相關(guān)系數(shù)的平方的實(shí)際意義是一對(duì)典型變量之間的共享方差在兩個(gè)典型變量各自方差中的比例。典型冗余分析用來表示各典型變量對(duì)原始變量組整體的變差解釋程度,分為組內(nèi)變差解釋和組間變差解釋,典型冗余分析的結(jié)果見表18和表19。表18被本組的典型變量解釋被對(duì)方Y(jié)組典型變量解釋比例累計(jì)比例比例累計(jì)比例0.23650.23650.23490.23490.06250.29900.25900.49390.15020.44920.03500.52890.07810.52730.06290.5918表19被本組的典型變量解釋被對(duì)方X組典型變量解釋比例累計(jì)比例比例累計(jì)比例0.38930.38930.38660.38660.09200.48130.18690.57350.17570.65700.05800.63150.07730.73430.06220.6937從上表和表可以看出,兩對(duì)典型變量、和、均較好地預(yù)測(cè)了對(duì)應(yīng)的那組變量,而且交互解釋能力也比較強(qiáng)。來自“葡萄酒理化指標(biāo)組”的方差被“釀酒葡萄理化指標(biāo)組”典型變量、解釋的比例和為57.35%;來自“釀酒葡萄理化指標(biāo)組”的方差被“葡萄酒理化指標(biāo)組”典型變量、解釋的方差比例和為49.39%。葡萄酒理化指標(biāo)變量組被其自身及其對(duì)立典型變量解釋的百分比、釀酒葡萄理化指標(biāo)變量組被其自身及其對(duì)立典型變量解釋的百分比均較高,尤其是第一對(duì)典型變量具有較高的解釋百分比,反映兩者之間較高的相關(guān)性。3.5多元線性逐步回歸模型[6]的建立與求解知道變量之間定性的聯(lián)系后,我們還希望能建立函數(shù)聯(lián)系。我們認(rèn)為釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系主要為釀酒葡萄的理化指標(biāo)對(duì)葡萄酒的理化指標(biāo)的影響。這里我們嘗試用SPSS軟件對(duì)數(shù)據(jù)進(jìn)行多元線性回歸。回歸之后我們進(jìn)行了多元線性回歸模型的檢驗(yàn):(1)擬合優(yōu)度檢驗(yàn):,接近1,表明回歸方程的擬合程度很好。(2)回歸方程的顯著性檢驗(yàn):F統(tǒng)計(jì)量的觀測(cè)值問64.003,顯著性概率為0.000,即檢驗(yàn)假設(shè)“:回歸系數(shù)B=0”成立的概率為0.000,從而應(yīng)拒絕原假設(shè),說明自變量和因變量的線性關(guān)系是非常顯著的,可建立線性模型。(3)回歸系數(shù)的顯著性檢驗(yàn):回歸系數(shù)的顯著性水平為0.000,明顯小于0.05,故應(yīng)拒絕T檢驗(yàn)的原假設(shè),說明了回歸系數(shù)的顯著性,也說明建立線性模型是恰當(dāng)?shù)摹z查所得參數(shù)的置信區(qū)間發(fā)現(xiàn),只有常量的置信區(qū)間包含零點(diǎn),表明常數(shù)項(xiàng)不顯著。(4)殘差分析:一般情況下,借助標(biāo)準(zhǔn)化殘差或?qū)W生化殘差來進(jìn)行異常值的檢驗(yàn),如果標(biāo)準(zhǔn)化殘差或?qū)W生化殘差小于-2或大于+2,就可以將其所對(duì)應(yīng)的觀測(cè)值識(shí)別為異常值。圖5可以得到第四中葡萄和葡萄酒的標(biāo)準(zhǔn)化殘差為2.34915,大于+2,可能由于測(cè)量失誤導(dǎo)致偏離較大,為“壞點(diǎn)”,應(yīng)舍去。我們將壞點(diǎn)舍去后重新進(jìn)行回歸,得到,,可知去除“壞點(diǎn)”后,回歸方程的擬合優(yōu)度值增大,更加接近1;F值增大,并且通過顯著性檢驗(yàn)。所以去除壞點(diǎn)后的回歸方程更加合適。最終得到回歸方程為同理,通過殘差分析去除“壞點(diǎn)”,利用回歸分析,得到27種釀酒葡萄與紅葡萄酒的理化指標(biāo)之間的函數(shù)聯(lián)系,如下表:變量說明:再嘗試以同樣的方法對(duì)白葡萄與白葡萄酒的理化指標(biāo)之間的函數(shù)聯(lián)系建立多元線性方程時(shí),我們發(fā)現(xiàn)即使通過殘差分析去除“壞點(diǎn)”也無法改善擬合優(yōu)度,所以我們認(rèn)為白葡萄與白葡萄酒的理化指標(biāo)之間的聯(lián)系是非線性的,函數(shù)聯(lián)系也不再是簡單的線性關(guān)系。由典型相關(guān)模型分析結(jié)果可知,紅葡萄酒的理化指標(biāo)總酚和單寧受紅葡萄的理化指標(biāo)可溶性固體和花色苷影響較明顯,與回歸方程較符合。以此再通過多組例子證明了兩個(gè)模型的合理性。4問題四模型的建立與求解以白葡萄酒釀酒葡萄理化性指標(biāo)與葡萄酒質(zhì)量的典型相關(guān)分析為例①典型相關(guān)系數(shù)及其檢驗(yàn)典型相關(guān)系數(shù)及其檢驗(yàn)如表20所示表2012.4431臨界值(0.05)0.1895典型相關(guān)系數(shù)0.6629由上表可知,典型相關(guān)系數(shù)較高,表明相應(yīng)典型變量之間密切相關(guān)。但要確定典型變量相關(guān)性的顯著程度,尚需判斷與臨界值的相對(duì)大小。從上表可得看這對(duì)典型變量通過了統(tǒng)計(jì)量檢驗(yàn),表明相應(yīng)典型變量之間相關(guān)關(guān)系顯著。②典型相關(guān)模型鑒于原始變量的計(jì)量單位不同,不宜直接比較,本文采用標(biāo)準(zhǔn)化的典型系數(shù),給出:表21典型相關(guān)系數(shù)0.2780.4800.2200.3881.5540.128-1.2850.037-0.4550.305-0.137-0.3730.3270.7940.749由上表得到典型相關(guān)方程:典型相關(guān)方程:由典型相關(guān)方程可知,釀酒葡萄理化指標(biāo)的第一典型變量與、呈高度相關(guān),說明在釀酒葡萄理化指標(biāo)中影響葡萄酒理化指標(biāo)的主要因素是總酚()和黃總黃酮();與、典型相關(guān)系數(shù)較大,說明在釀酒葡萄理化指標(biāo)中影響葡萄酒理化指標(biāo)的次要因素是a()和b();總體上釀酒葡萄理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響的主要因素按重要程度依次是、、、。對(duì)于紅葡萄酒釀酒葡萄理化性指標(biāo)及紅、白葡萄酒理化性指標(biāo)對(duì)葡萄酒質(zhì)量的影響分析同樣用以上方法,這里不再贅述。得到的結(jié)果如下:表22各項(xiàng)指標(biāo)對(duì)于葡萄酒質(zhì)量影響指標(biāo)項(xiàng)主要因素按重要程度降序紅葡萄酒釀酒葡萄理化性指標(biāo)總酚、可溶性固體、固酸比紅葡萄酒理化性指標(biāo)花色苷、L*(D65)白葡萄酒釀酒葡萄理化性指標(biāo)總酚、黃總黃酮、a*(D65)、b*(D65)白葡萄酒理化性指標(biāo)DPPH半抑制體積(IV50)、黃總黃酮、L*(D65)為了論證能否用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量,我們首先嘗試進(jìn)行多元逐步線性回歸,將葡萄和葡萄酒的共近40個(gè)理化指標(biāo)作為自變量,葡萄酒的質(zhì)量作為因變量進(jìn)行逐步線性回歸。從結(jié)果上看,回歸的擬合優(yōu)度并不高,尤其對(duì)于白葡萄和白葡萄酒,擬合優(yōu)度很小,說明在這里使用多元線性回歸不是很好,它們之間的關(guān)系應(yīng)該是非線性的,所以接著我們選擇了比較適合分析非線性關(guān)系的人工神經(jīng)網(wǎng)絡(luò)模型。人工神經(jīng)網(wǎng)絡(luò)是一種用大量處理單元廣泛連接組成的人工網(wǎng)絡(luò),來模擬人的大腦神經(jīng)系統(tǒng)直觀思維方式。作為一個(gè)非線性動(dòng)力學(xué)系統(tǒng),其特色在于信息的分布式存儲(chǔ)和并行協(xié)同處理。雖然每個(gè)神經(jīng)元的結(jié)構(gòu)和功能都不復(fù)雜,但整個(gè)神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)行為十分豐富。BP神經(jīng)網(wǎng)絡(luò)最為典型的神經(jīng)網(wǎng)絡(luò)模型具有初步的自適應(yīng)與自組織能力,泛化能力,高度并行性,并且具有高度魯棒性和容錯(cuò)能力,能充分逼近復(fù)雜的非線性關(guān)系,可以克服傳統(tǒng)定量預(yù)測(cè)方法的許多局限以及面臨的困難,同時(shí)也能避免許多人為因素的影響。多層神經(jīng)網(wǎng)絡(luò)模型如下(如圖6所示):圖6圖中最下面單元,即由?所示的一層稱為輸入層,用以輸入已知測(cè)量值,用于表示每一個(gè)可能影響輸出的因素;中間一層為隱單元層,用于存放各個(gè)隱藏狀態(tài);最上面一層稱為輸出層,用于輸出目標(biāo)值,并與實(shí)際值相比較,從而做出合理的預(yù)測(cè)。為了敘述上的方便,此處引入如下記號(hào)上的約定:令s表示一個(gè)確定的已知樣品標(biāo)號(hào)(),分別表示學(xué)習(xí)樣本中的m個(gè)樣品;當(dāng)將第s個(gè)樣品的原始數(shù)據(jù)輸入網(wǎng)絡(luò)時(shí),相應(yīng)的輸出單元狀態(tài)記為,隱單元狀態(tài)記為,輸入單元取值記為。在這一約定下,從中間層到輸出層的權(quán)記為,從輸入層到中間層的權(quán)記為。如果、均已給定,那么,對(duì)應(yīng)于任意一組確定的輸入,網(wǎng)絡(luò)中所有單元的取值不難確定。事實(shí)上,對(duì)樣品s而言,隱單元j的輸入是相應(yīng)的輸出狀態(tài)是由此,輸出單元i所接收到的迭加信號(hào)是網(wǎng)絡(luò)的最終輸出是接下來我們以紅葡萄和紅葡萄酒為例進(jìn)行說明。本題中在對(duì)紅葡萄和紅葡萄酒的理化指標(biāo)和葡萄酒的質(zhì)量關(guān)系的研究時(shí),我們將紅葡萄和紅葡萄酒共39個(gè)理化指標(biāo)作為輸入層的39個(gè)因素,而輸出層則對(duì)應(yīng)的是葡萄酒的質(zhì)量。在對(duì)該BP神經(jīng)網(wǎng)絡(luò)分析中,我們先把1~20種紅葡萄和紅葡萄酒的輸入層數(shù)據(jù)與輸出層數(shù)據(jù)帶入神經(jīng)網(wǎng)絡(luò)的模型中,然后通過BP網(wǎng)絡(luò)多次訓(xùn)練使輸出誤差達(dá)到而接受的要求,此BP網(wǎng)絡(luò)包含了所有可能的影響因素。接著,我們?cè)賹?1~27的5組數(shù)據(jù)作為檢測(cè),檢驗(yàn)通過我們建立的模型輸出的數(shù)據(jù)值是不是與實(shí)際的真實(shí)值相吻合或控制在較小誤差下。如果輸出的數(shù)據(jù)值與實(shí)際的真實(shí)值相吻合或控制在較小誤差下,我們認(rèn)為在一定程度下能用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量。首先理化指標(biāo)未包含芳香類物質(zhì),沒考慮芳香類物質(zhì)對(duì)葡萄酒質(zhì)量的影響。而且葡萄酒的質(zhì)量還與釀造工藝、地理環(huán)境等息息相關(guān)。所以僅僅利用理化指標(biāo)只是一種對(duì)葡萄酒質(zhì)量的參考式的評(píng)價(jià),具有一定參考意義。圖7紅葡萄預(yù)測(cè)值、實(shí)際值圖表23紅葡萄預(yù)測(cè)結(jié)果相對(duì)誤差樣本編號(hào)21222324252627實(shí)際得分72.271.677.171.568.27271.5網(wǎng)絡(luò)預(yù)測(cè)得分63.410171.013674.611969.762473.397972.064271.1569相對(duì)誤差0.1217440.008190.0322710.0243020.0762160.0008920.004799表24白葡萄預(yù)測(cè)結(jié)果相對(duì)誤差樣本編號(hào)22232425262728實(shí)際得分79.279.477.476.179.574.377網(wǎng)絡(luò)預(yù)測(cè)得分77.275578.204977.339167.603876.357169.985776.5189相對(duì)誤差0.0242990.0150520.0007870.1116450.0395330.0580660.006248模型的評(píng)價(jià)、改進(jìn)與推廣第一問判斷哪一組數(shù)據(jù)更可信也可以采用信度(測(cè)量的可靠性)分析,可以通過計(jì)算Cronbach’s系數(shù)、Kendall和諧系數(shù)等,信度高的數(shù)據(jù)組往往更可信。第二問如果可以知道葡萄各項(xiàng)理化指標(biāo)的合理或是不同級(jí)別的范圍,就可以通過綜合評(píng)價(jià)得到葡萄的質(zhì)量好壞。第四問利用BP神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)葡萄酒質(zhì)量,雖然誤差較小,但并不意味著可以用葡萄和葡萄酒的理化指標(biāo)評(píng)價(jià)葡萄酒質(zhì)量。同時(shí),葡萄酒的質(zhì)量應(yīng)該是由理化指標(biāo)、感官指標(biāo)共同確定的。理化指標(biāo)中未包含芳香類物質(zhì),應(yīng)該研究芳香類物質(zhì)與理化指標(biāo)之間的聯(lián)系。而且葡萄酒的質(zhì)量還與釀造工藝、地理環(huán)境等息息相關(guān)。應(yīng)該把以上的因素都加以考慮才能得到更為滿意的結(jié)果。優(yōu)點(diǎn):建立多種模型相互佐證分析可信度較高。模型分析細(xì)致,大多進(jìn)行了檢驗(yàn)。缺點(diǎn):因子分析未進(jìn)行KMO和Bartlet球形度檢驗(yàn)。參考文獻(xiàn)[1]鄧維斌胡大權(quán),SPSS19統(tǒng)計(jì)分析實(shí)用教程,北京:電子工業(yè)出版社,2012。[2]盛驟謝式千,概率論與數(shù)理統(tǒng)計(jì)第四版,北京:高等教育出版社,2008。[3]謝龍漢尚濤,SPSS統(tǒng)計(jì)分析與數(shù)據(jù)挖掘,北京:電子工業(yè)出版社,2012。[4]孫建軍,應(yīng)用數(shù)理統(tǒng)計(jì),南京:東南大學(xué)出版社,2007。[5]謝輝樊丁宇,統(tǒng)計(jì)方法在葡萄理化指標(biāo)簡化中應(yīng)用,新疆農(nóng)業(yè)科學(xué),48(8):1434-1437,2011。[6]李運(yùn),李記明,姜忠軍,統(tǒng)計(jì)分析在葡萄酒質(zhì)量評(píng)價(jià)中的應(yīng)用,釀酒科技,Vol.4,79-82,2009附錄MATLAB源程序典型相關(guān)性分析典型相關(guān)系數(shù)、相關(guān)系數(shù)計(jì)算代碼clc,clearx=load('rp1.txt');%原始的x組的數(shù)據(jù)保存在純文本文件x.txt中y=load('rj.txt');%原始的y組數(shù)據(jù)保存在純文本文件y.txt中p=size(x,2);q=size(y,2);x=zscore(x);y=zscore(y);%標(biāo)準(zhǔn)化數(shù)據(jù)n=size(x,1);%觀測(cè)數(shù)據(jù)個(gè)數(shù)%下面做典型相關(guān)分析,a、b返回的是典型變量的系數(shù),r返回的是典型相關(guān)系數(shù)%u,v返回的是典型變量的值,stats返回的是假設(shè)檢驗(yàn)的一些統(tǒng)計(jì)量的值[a1,b1,r,u1,v1,stats]=canoncorr(x,y)%下面修正a,b每一列的正負(fù)號(hào),使得a,b每一列的系數(shù)和為正%對(duì)應(yīng)的,典型變量取值的正負(fù)號(hào)也要修正a=a1.*repmat(sign(sum(a1)),size(a1,1),1)b=b1.*repmat(sign(sum(b1)),size(b1,1),1)u=u1.*repmat(sign(sum(a1)),size(u1,1),1)v=v1.*repmat(sign(sum(b1)),size(v1,1),1)x_u_r=x'*u/(n-1)%計(jì)算x,u的相關(guān)系數(shù)y_v_r=y'*v/(n-1)%計(jì)算x,v的相關(guān)系數(shù)x_v_r=x'*v/(n-1)%計(jì)算x,v的相關(guān)系數(shù)yy_u_r=y'*u/(n-1)%計(jì)算y,u的相關(guān)系數(shù)ux=sum(x_u_r.^2)/p%x組原始變量被u_i解釋的方差比例ux_cum=cumsum(ux)%x組原始變量被u_i解釋的方差累計(jì)比例vx=sum(x_v_r.^2)/p%x組原始變量被v_i解釋的方差比例vx_cum=cumsum(vx)%x組原始變量被v_i解釋的方差累計(jì)比例vy=sum(y_v_r.^2)/q%y組原始變量被v_i解釋的方差比例vy_cum=cumsum(vy)%y組原始變量被v_i解釋的方差累計(jì)比例uy=sum(y_u_r.^2)/q%y組原始變量被u_i解釋的方差比例uy_cum=cumsum(uy)%y組原始變量被u_i解釋的方差累計(jì)比例val=r.^2%典型相關(guān)系數(shù)的平方,M1或M2矩陣的非零特征根正態(tài)分布檢驗(yàn)&方差齊性檢驗(yàn)代碼%CSRUANclearclcw2red=[68 71 80 52 53 76 71 73 70 6775 76 76 71 68 74 83 73 73 7182 69 80 78 63 75 72 77 74 7675 79 73 72 60 77 73 73 60 7066 68 77 75 76 73 72 72 74 6865 67 75 61 58 66 70 67 67 6768 65 68 65 47 70 57 74 72 6771 70 78 51 62 69 73 59 68 5981 83 85 76 69 80 83 77 75 7367 73 82 62 63 66 66 72 65 7264 61 67 62 50 66 64 51 67 6467 68 75 58 63 73 67 72 69 7174 64 68 65 70 67 70 76 69 6571 71 78 64 67 76 74 80 73 7262 60 73 54 59 71 71 70 68 6971 65 78 70 64 73 66 75 68 6972 73 75 74 75 77 79 76 76 6867 65 80 55 62 64 62 74 60 6572 65 82 61 64 81 76 80 74 7180 75 80 66 70 84 79 83 71 7080 72 75 72 62 77 63 70 73 7877 79 75 62 68 69 73 71 69 7379 77 80 83 67 79 80 71 81 7466 69 72 73 73 68 72 76 76 7068 68 84 62 60 66 69 73 66 6668 67 83 64 73 74 77 78 63 7371 64 72 71 69 71 82 73 73 69]';w2white=[84 78 82 75 79 84 81 69 75 7279 76 77 85 77 79 80 59 76 7085 74 71 87 79 79 80 45 83 7384 78 74 83 69 82 84 66 77 7283 79 79 80 77 87 82 73 84 9183 75 74 69 75 77 80 67 77 7878 79 74 69 69 82 80 61 72 7874 78 74 67 73 77 79 66 73 6277 78 89 88 84 89 85 54 79 8186 77 77 82 81 87 84 61 73 9079 83 78 63 60 73 81 61 60 7673 81 73 79 67 79 80 44 64 8468 78 79 81 78 72 75 62 65 8175 77 76 76 78 82 79 68 78 8283 77 88 80 84 83 80 63 76 7068 63 75 60 67 86 67 71 52 6477 69 79 83 79 87 88 75 78 8875 83 82 79 74 84 78 71 74 6776 75 78 70 81 80 83 66 78 7786 74 75 78 85 81 78 61 73 7581 80 79 85 83 76 80 58 85 8580 76 82 88 75 89 80 66 72 8674 80 80 80 74 79 75 73 83 7667 80 77 77 79 78 83 65 72 8379 76 79 86 83 88 83 52 85 8480 72 75 83 71 83 83 53 62 8172 79 84 79 76 83 77 63 79 7875 82 81 81 78 84 79 71 76 89]';w1white=[85 80 88 61 76 93 83 80 95 7978 47 86 54 79 91 85 68 73 8185 67 89 75 78 75 136 79 90 7975 77 80 65 77 83 88 78 85 8684 47 77 60 79 62 74 74 79 7461 45 83 65 78 56 80 67 65 8484 81 83 66 74 80 80 68 77 8275 46 81 54 81 59 73 77 85 8379 69 81 60 70 55 73 81 76 8575 42 86 60 87 75 83 73 91 7179 46 85 60 74 71 86 62 88 7264 42 75 52 67 62 77 56 68 7082 42 83 49 66 65 76 62 65 6978 48 84 67 79 64 78 68 81 7374 48 87 71 81 61 79 67 74 8269 49 86 65 70 91 87 62 84 7781 54 90 70 78 71 87 74 92 9186 44 83 71 72 71 85 64 74 8175 66 83 68 73 64 80 63 73 7780 68 82 71 83 81 84 62 87 8084 49 85 59 76 86 83 70 88 8465 48 90 58 72 77 76 70 80 7471 66 80 69 80 82 78 71 87 7582 56 79 73 67 59 68 78 86 8586 80 82 69 74 67 77 78 77 8175 66 82 75 93 91 81 76 90 8458 40 79 67 59 55 66 74 73 7766 75 89 69 88 87 85 76 88 90]';w1red=[51 66 49 54 77 61 72 61 74 6271 81 86 74 91 80 83 79 85 7380 85 89 76 69 89 73 83 84 7652 64 65 66 58 82 76 63 83 7774 74 72 62 84 63 68 84 81 7172 69 71 61 82 69 69 64 81 8463 70 76 64 59 84 72 59 84 8464 76 65 65 76 72 69 85 75 7677 78 76 82 85 90 76 92 80 7967 82 83 68 75 73 75 68 76 7573 60 72 63 63 71 70 66 90 7354 42 40 55 53 60 47 61 58 6969 84 79 59 73 77 77 76 75 7770 77 70 70 80 59 76 76 76 7669 50 50 58 51 50 56 60 67 7672 80 80 71 69 71 80 74 78 7470 79 91 68 97 82 69 80 81 7663 65 49 55 52 57 62 58 70 6876 84 84 66 68 87 80 78 82 8178 84 76 68 82 79 76 76 86 8173 90 96 71 69 60 79 73 86 7473 83 72 68 93 72 75 77 79 8083 85 86 80 95 93 81 91 84 7870 85 90 68 90 84 70 75 78 7060 78 81 62 70 67 64 62 81 6773 80 71 61 78 71 72 76 79 7770 77 63 64 80 76 73 67 85 75]';fori=1:27ix1=w1red(:,i);x2=w2red(:,i);%正態(tài)分布檢驗(yàn)%figure;%subplot(2,3,1);hist(x1);ylabel('x1');%subplot(2,3,2);histfit(x1);%subplot(2,3,3);normplot(x1);%subplot(2,3,4);hist(x2);ylabel('x2');%subplot(2,3,5);histfit(x2);%subplot(2,3,6);normplot(x2);[muhat_1,sigmahat_1,ci_1,stats_1]=normfit(x1);[muhat_2,sigmahat_2,ci_2,stats_2]=normfit(x2);[h1,p1,ci1,stats1]=ttest2(x1,muhat_1);%h=0,符合正態(tài)分布;h=1,不符合正態(tài)分布[h2,p2,ci2,stats2]=ttest2(x2,muhat_2);[h3,p3,jbstat3,cv4]=kstest(x1);%與正態(tài)分布N(0,1)比較,(均值為0,方差為1);%h=0,符合正態(tài)分布;h=1,不符合正態(tài)分布[h4,p4,jbstat3,cv4]=kstest(x2);[h5,p5,istat5,cv5]=lillietest(x1);%與正態(tài)分布N(mu,sigma2)比較(與樣本相同均值和方差的正態(tài)分布);%h=0,符合正態(tài)分布;h=1,不符合正態(tài)分布[h6,p6,istat6,cv6]=lillietest(x2);%[h,p,jbstat,cv]=jbtest(x);%與正態(tài)分布N(mu,sigma2)比較,(與樣本相同均值和方差的正態(tài)分布).與Lillieforstest類似,但不適用于小樣本的情況;Normal_distribution_test=[{'H'}{'Pvalue'}{'Testmethod'};h1p1{'normfit'};h2p2{'normfit'};h3p3{'kstest'};h4p4{'kstest'};h5p5{'lillietest'};h6p6{'lillietest'}]%方差齊性檢驗(yàn)(F檢驗(yàn))[h7,p7,ci7,stats7]=vartest2(x1,x2);%h=0,方差齊(p=);h=1,方差不齊(p=);Homogeneity_of_variance=[{'H'}h7;{'Pvalue'}p7]End置信區(qū)間求解代碼(w2white數(shù)據(jù)同上)[muhat,sig,muci,sigmaci]=normfit(w2white,0.05)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 考點(diǎn)28化學(xué)反應(yīng)的方向、化學(xué)反應(yīng)的調(diào)控(核心考點(diǎn)精講精練)-備戰(zhàn)2025年高考化學(xué)一輪復(fù)習(xí)考點(diǎn)幫(新高考)(原卷版)
- 考點(diǎn)09鈉及其重要化合物(核心考點(diǎn)精講精練)-備戰(zhàn)2025年高考化學(xué)一輪復(fù)習(xí)考點(diǎn)幫(新高考)(原卷版)
- 文化融合2024年國際物流師試題與答案
- 中班防溺水課件及教案
- 中班防溺水游戲課件教案
- 國際物流結(jié)算與支付知識(shí)試題及答案
- 2024年CPSM考生必須掌握的技能試題及答案
- 2024年CPMM有效策略試題及答案
- 云南省曲靖市宣威市民中2025屆高考化學(xué)二模試卷含解析
- 2025年高品質(zhì)H酸項(xiàng)目合作計(jì)劃書
- 簡支梁、懸臂梁撓度計(jì)算程序(自動(dòng)版)
- 2022年園林綠化養(yǎng)護(hù)技術(shù)標(biāo)
- 聚合物的高彈性和黏彈性(鳳山書屋)
- 物理人教版(2019)必修第二冊(cè)5.2運(yùn)動(dòng)的合成與分解(共19張ppt)
- 中國航信離港系統(tǒng)講義
- 6000m3內(nèi)浮頂油罐設(shè)計(jì)
- 食堂管理考核評(píng)分表
- 滕啟剛事跡PPT
- 企業(yè)信息安全培訓(xùn)課件
- 喚醒護(hù)理讀書報(bào)告會(huì)ppt
- 公安機(jī)關(guān)通用告知書模板
評(píng)論
0/150
提交評(píng)論