SAS軟件之單因素方差分析在香水主觀評價中的應用_第1頁
SAS軟件之單因素方差分析在香水主觀評價中的應用_第2頁
SAS軟件之單因素方差分析在香水主觀評價中的應用_第3頁
SAS軟件之單因素方差分析在香水主觀評價中的應用_第4頁
SAS軟件之單因素方差分析在香水主觀評價中的應用_第5頁
免費預覽已結束,剩余13頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、燈由/至上摩概率論與數(shù)理統(tǒng)計課程報告院系名稱:信息科學與工程學院專業(yè)班級:學生姓名:理金龍學號:2017年10月30日單因素方差分析在香水主觀評價中的應用摘要:通過調研用戶真實的使用感受,對香水進行主觀評價,是一種基于用戶觀點的評價方法。運用SAS統(tǒng)計學軟件,以不同品牌的香水使用的主觀評價為例,闡述了單因素方差分析方法在香水主觀評價中的應用。單因素方差分析方法適用于所有涉及對香水的造型美學、色彩、香味、品質感知的評價,該方法既避免了只比較平均值的誤區(qū),又相對于Z檢驗和T檢驗提高了分析效率和可靠性。關鍵詞:SAS;單因素方差分析;香水主觀評價ApplicationofUnivariateAnal

2、ysisofVarianceinSubjectiveEvaluationofPerfumeAbstract:Itisanevaluationmethodbasedonuser'sviewbyinvestigatingtheuser'srealuseexperienceandsubjectiveevaluationofperfume.Theapplicationofsinglefactoranalysisofvariance(ANOVA)inthesubjectiveevaluationofperfumewasdescribedbyusingSASstatisticalsoftw

3、areandsubjectiveevaluationofdifferentperfumesofperfume.Theone-wayvarianceanalysismethodisapplicabletoalltheevaluationoftheaesthetic,color,fragranceandqualityperceptionofperfume.Thismethodnotonlyavoidsthemisunderstandingoftheaveragevalue,butalsoimprovestheefficiencyandreliabilityoftheanalysiscompared

4、withtheZtestandTtestSex.Keywords:SAS;singlefactoranalysisofvariance;perfumesubjectiveevaluation1研究背景國內香水市場競爭日趨激烈,每個細分市場都有多款香水參與競爭。用戶選擇的余地很大,眼光也越來越挑剔。在此背景下,用戶的喜好成為香水生產企業(yè)設計新香水和改款香水的重要參考指標。主觀評價方法從用戶實際使用的感受出發(fā),由用戶的打分來評價香水。這種方法的優(yōu)勢在于關注用戶的實際使用需求和感受。評價的結果通常用平均值來表示,平均值較高的香水品質較好。在實際應用中,常常出現(xiàn)兩個誤區(qū):一種是簡單化的比較平均值,而不

5、考慮平均值的置信區(qū)間;一種是對多個品牌的香水進行比較時,缺乏合適的方法,結論也很模糊。單因素方差分析是一種比較來自多個總體的樣本平均值的統(tǒng)計學方法。該方法在主觀評價中的應用可以顯著提高評價結果分析的速度和準確性。本文采用SAS軟件,以多款中高級香水品質為例,闡述了單因素分析方法在香水品質主觀評價中的應用。2香水品質主觀評價及數(shù)據(jù)主觀評價是一種以用戶體驗和評價為基礎的方法,通過設定一定的評價環(huán)境和條件,模擬真實的用戶在使用香水時對香水的造型美學、色彩、香味、品質等各方面的感受和評價。這種方法在香水設計前期可以用來作為香水的設計參考指標,在香水量產階段可以用于與對手的比較,確定香水的定位和市場宣傳

6、亮點。此次主觀評價選擇1120個具有使用香水的豐富經(jīng)歷的人來模擬實際的用戶,主觀評價過程也被嚴格的控制,要求同一批人在同樣的環(huán)境下,按照同樣的評價指標,對不同的品牌的香水進行評價。評價結果通常采用分數(shù)計量。此次調查的規(guī)模很大,進行了上千個用戶的調查,大量的數(shù)據(jù)會抵消奇異值的影響,數(shù)據(jù)也有較好的質量。在對評價結果的分析中,通常的做法是直接將平均值進行比較,沒有考慮置信區(qū)間。平均值是根據(jù)樣本數(shù)據(jù)對總體均值的估計,在不同香水的品質相差較大時簡單有效。但是平均值無法判斷對總體進行估計的準確性,而且平均值會因為樣本不同而有所差異,也就是說用平均值無法代表樣本點的分布情況,比如無法反映分布類型和數(shù)據(jù)的離散

7、情況。另外還有一些調研考慮了平均值的置信區(qū)間,運用Z檢驗或者T檢驗進行不同香水之間的均值比較。但是Z檢驗和T檢驗都只能進行兩兩比較,當同時進行三款或更多香水品牌的評價時,運用Z檢驗和T檢驗將十分繁瑣。本文選用了某第三方調研機構對中高級香水的用戶調查,包含了ajayebajmal、amreaj、aood、asgar_ali、bukhoor、burberrry、dehenalaodjunaid、kausarrosesolidmusk、TeaTreeOikraspberry、RoseMusk、strawberry、constrected2carolina_herreraoudh_maialattar

8、constrected共計20款香水。每款香水調查了56位用戶,調研項目涉及香水的造型美學、色彩、香味、持續(xù)時間等多個項目。用戶的評分采用百分制量表。本文選擇了香水品質綜合評價這一個項目來闡述方法的應用,這種應用也可以推廣到其他幾個項目的分析中。方差分析是20世紀20年代發(fā)展起來的一種統(tǒng)計方法,廣泛應用于社會學、工程技術、醫(yī)藥的試驗分析領域。單因素方差分析是方差分析的一種,通過對數(shù)據(jù)誤差來源的分析來比較多個總體的均值是否相等,并且判斷分類型自變量對數(shù)值型因變量的顯著性影響。與Z檢驗和T檢驗方法相比,該方法可以提高分析的效率,同時由于它是將所有的樣本信息結合在一起,還增加了分析的可靠性。方差分析

9、一般要求滿足3個基本假設:各個總體應該服從正態(tài)分布;各個總體的方差應該相同;觀測值之間是獨立的。其中,對正態(tài)分布的要求不是很嚴格,但是對方差齊性的要求很嚴格。根據(jù)上述3個基本假設,方差分析對各個總體的顯著性差異的推斷就可以轉化為對各個總體的均值是否相等的推斷了。假設從k個總體中分別抽取包括含有n1,n2,nk個觀測值的獨立隨機樣本,將k組樣本的士勺(直記為?,?2,,?將總體均值記為?定義n=n1+n2+nk,并且定義下面的均方:222s組內:J心心乂上匕一A£電.產組間.,k-需要檢驗的原假設是:H0:卜12=-'=k其備擇假設為:H1:%nZ,仙k不全相等一999999.

10、、如果???n-k,a,則拒絕原假設。?2?-1,n-k服從分子自由度為k-1,分母自由度為n-k的F分布。4.1 數(shù)據(jù)展列本次調研共涉及20種香水,共計1120名用戶,屬于大規(guī)模調研。表1中列出了20款香水品質評價的均值、標準差、最值等信息如圖4.1所示MEANSPROCEDURE分析變星:Evaluationperfunie5M呻個題N均值標準差最小值最大值AID5B56G4.487U280.262364998,580000061G600000All5EbhGO,78000000.4559266G0.4COOQODG1.5300000M25S5E57,02571430.414039357,

11、0400000S9.04000005B5671.91107140,594020?71,080000073,1000000A14565668.115口00D0.3128927G7.2200000G8.2300000M5565670.3W00o.mooai69.O50QQQQ71,0500000奸6565660.44920570466403?60,090000061,1000000Al7565668.81821昭0,4717785G8.1300000G9.14BOOOO565$72.20821430.483173371,560000072,5900000A19565673.9S1J2060.600

12、297973.580000074,6700000A20585G62.85714290.353083962.DOOOQOO63,0000000A21565E46.010214304003364646.0100004C.0200000出56就電您母舶D.1S6S127電瓶岫的03.3600000您585679.42BE7140,499350273.000000080.0000000A24585685.0600000085.0600000BE.0600000陋56股7L8428571CM腕聯(lián)7i.oooom72.0000000A2656展6S.67600000.52248B285.7700000S7

13、.7400000踮58杯64,1&78571D.9B3Q541C3.DEOOQOO66.0600000盛585$84185710.48429666.200050067,2200000監(jiān)95B5685.65000000.5045250£5.1500(100眥1500000圖4.2Evaluation的頻數(shù)分布單因素試驗設計的均值比較procanovadata=li.perfume;classperfume;modelEvaluation=perfume;meansperfume;meansperfume/hovtest;run;程序說明:因為數(shù)據(jù)僅僅是按照perfume值分類,

14、所以在class語句中這是僅有的一個變量。變量Evaluation是被分析的因變量,故Evaluation出現(xiàn)在model語句等號的左邊。在方差分析表中,除了總方差和誤差外,方差的來源僅僅是由于各種不同perfume值的變異造hovtest計算不同香水品牌組方差齊性的假設檢驗。輸出的結果見圖4.3所示:主效應perfume不同水平所對應的因變量均值,選項-5丁費丁”丁山工的日星星日中舉朧時H為短FTh»胖OVAPrg«dur«ClassLevelTnferii0tisClassLevelsVbIues"Hum1&AidMlAl2AllA14AIS

15、AL£A17AL8AL9德A2142J心3n4AISA26A27AlfiA29悵fiberofObrvdtioinsRsd1L2SNLnberpfQbserviticinsU5M11押圖4.3(a)分類變量信息結果分析:anova過程總是輸出兩個基本的方差分析表。一個是總體模型的方差分析表,一個是包含模型中各個變量的方差分析。首先輸出class語句中規(guī)定的每個變量(perfume)、分類變量的取值數(shù)(20)、具體取值:(A10A11A12A13A14A15A16A17A18A19A20A21A22A23A24A25A26A27A28A29)以及數(shù)據(jù)集中的觀察個數(shù)(1120)SAS聚班

16、2比?隼1®=2,且星明日下午就TheAMOUAProc#dur#Iriablq:Ev#lu3七ion括:因變量的總平方和(82870.76608)、屬于模型部分的平方和SourceDFSubcfSquaresMeanSquareFValueFr>F19«2616,S6012434«.24eei1B915.7<,0001Firror11000.23110CsrrecttdTotdl111962870.76660-SquareCoeffVarRootMSEEvaluationWeant?.707Z460.AB072557.971J&Sdu廣工鋰A

17、nevd55Midili口卜hl川dPr>Fperfunf*1982616.56012434S,240011881S/7一翻1(82616.56012)、屬于誤差部分的平方和(254.20596)、自由度DF(19、1100、1119)、模型的均方MS(4348.24001=82616.56012/19、誤差的均方MSE(0.23110=254.20596/1100、模型的F值(18815.7=4348.24001/0.23110)、分布大于18815.7的概率(<0.0001)、R2(0.996933=82616.56012/82870.76608)、變異系數(shù)CV(0.70724

18、6=100X;0.23110/67.97138)、因變量的標準差(0.480725=J0.23110)、因變量均值(67.97138)。對模型中的每個效應,anova過程還輸出方差分析表。perfume自由度DF(19)、平方和(82616.56012)、均方MS(4348.24001=82616.56012/19)、F值(18815.7=4348.24001/0.23110、分布大于7.40的概率(<0.0001)。總體F檢驗是顯著的(<0.0001<0.05),表明模型是有意義的。品牌perfume的F檢驗也是顯著的(<0.0001<0.05),表明不同品牌的

19、均值不全相等。這里兩個F檢驗是完全相同的,這僅僅是因為在模型中只有一項perfume。注意,我們可以用glm過程替代這個anova過程,能得到相同的方差分析結果。最大區(qū)別是glm過程將計算每個效應的類型1和類型3平方和,而anova只計算類型1的平方和。對于單因素和多因素平衡數(shù)據(jù)來說,anova過程的SS1、glm過程的SS1和SS3都相同。TheANOVAProcedureLevene15TestforHomogeneityofEvaluationVarianceANOVAofSquaredDeviationsfromGroupMeansSourceDFSumofSquare5MeanSqu

20、areFValuePr>Fperfume1942.95092.260626.19<.0001Error110094.93680.0863圖4.3(d)Levene的方差齊性檢驗結果Levene的方差齊性檢驗結果表明:可以拒絕(<0.0001<0.05)不同品牌組里觀察值的方差是相等的原假設。SAS系統(tǒng)20L7年月29日星期1LevelofTheANOVAProcedure-Evaluation-perfjmeNMeanStdDev566406714299.26236487All5666.780&06e0.45592663A12弓657.82571430.4140

21、3934Al?5671.81107140.59402a75A145668.115&00e31289266A155670.3003063.63960215A165668.44923570.4S640371A175668.81821430.4717784SA185672.20821430.48及7927A195673.98142B60.56923787A295662.85714290.35角9393A215646.61821430.00386459A225682,42392860.18661266A235679.42857140.49935&2SA245685.060日駝g0.00

22、000000A255671.64285710,4334937B260656-57539。白0.5224G6iaA275$54.1678571日,州北54州A285666.84785710.48428B60A295665.65既找白包59452498最后輸出的是每種品牌的觀察數(shù)、均值和標準差。例如,A10品牌的觀察數(shù)為56,均值為64.4671429,標準差為0.26236487。4.2 均值的多重比較和置信區(qū)間由于品牌perfume的F檢驗是顯著的(<0.0001<0.05),表明20種不同品牌的均值不全相等,但可能存在某2個或某3個或某更多個品牌的均值相同。因此,常需要進一步的均

23、值多重比較和置信區(qū)間分析。程序如下:procanovadata=li.perfume;classperfume;modelEvaluation=perfume;meansperfume/duncan;meansperfume/lsdclmcldiff;run;程序說明:第一個means語句選用了ducan選項,要求計算輸出組間均值比較的新多重極差檢驗,結果見圖4.4。第二個means語句選用了lsdclm選項,對所有組均值進行兩兩t檢驗,輸出各組均值的置信區(qū)間,結果見圖4.5。第二個means語句還選用了lsdcldiff選項,將對各組間均值之差采用最小顯著差檢驗,輸出各組間均值之差的置信區(qū)間

24、,結果見圖4.6。埼”軍I電月封m星期E下斗0注時"上看1十少9ThrWOVAPrwEduEDuntCian1zHuli:iplsaRjan.g,aTow七farEvaluui'tionNOTE:Thiftoi-tciDHtnogth«TypoIratoj,nottheokparin#ntwii-isorrerrjto.Alpha9.日5ErrnrDEg.reeaofFreedcmHQfl4Error-%*i£牛附收O.1310O&Nulfibe/OfMB13rl£234S67Bg1011ErlticalMange:_17S3_1S7?.

25、1-949.19S6.2B23.工日53.2011.2099.211731341NofHeini!121314li1617181»20心可B.2149,2161,2173,21M強.2293.2211«221»門226Hefirns-m1ththebaneletter<arenotAignitiLAntlydift-M即fun5AHS.H*陽SS4M882,«393S6A22C79,42857S6A23D73,9814356A1956A1HF71.0111756Al3FE7EM2M56A15圖4.4Duncan的新多重極差檢驗圖4.4中結果分析:注

26、意到各組均值按大到小排列(85.06000,82.42393,79.42857,73.98143.),在標題“DuncanGrouping干是一系列字母A、B、C等字母,如果均值間差異不顯著標上相同的字母,否則標上不同的字母。對于Duncan多重極差檢驗來說,20個均值之間的比較,只要看最大的均值與最小的均值之差的是否大于臨界值0.2226,因為85.06000-46.01821>0.2226,則為顯著,所以品牌A24的均值不同與A21,應該標識不同的字母。因為存在20個均值之間最大差的顯著性,接下來就需要比較19個均值之間差的顯著性,臨界值為0.2219。85.0600057.8257

27、1>0.2219,顯著,82.42393-46.01821>0.2219,顯著,只要存在一個顯著性,就需要繼續(xù)比較20個均值之間差的顯著性。以此類推直至兩兩比較結束。SAS系笠2凱7軍明月29日OH下午08吃TheAHOVAProceduretConfidenceIntervalsforEvaluationAlpha人越ErrorDegreesofFreedon1160ErrorMeanSquare0.231095CriticalValueoft1.96212HalfWidthofConfidenceInterval0.126046胃pfurne忸E95XConfidenceLim

28、itsA24568546匏eM知9585J860556B2.4239382.2978882.54997K35679.4285779,3025379.55462A195673,9814373.8553E74.19747A185672.2&82172陽21772J3426AB5671,81107門.哪電71.93712A255671,6428671.5168171,76890A155679,3006070,1739570,42665Al?5668,8182168.6921768.94426A14轉68,1150667.9B89568J41B5W856近8478666J218166.973%

29、A265666.57500礫邨9566.7的眄095665.6506065.5239565.77605A105664,4671464.34110$4,59319A275664.16786M318164.2的%£05662,8571462,7311052.98319All5660,7890060.65395曲.99685A1656M.4492960.3231460.57533A125657,82571S7.6996757.95176All5646.0182145.892174MM26圖4.5各組均值的t檢驗置信區(qū)間圖4.5中結果分析:均值t分布的95%置信區(qū)間的一半寬度為0.12604

30、6,因止匕A24品牌均值置信區(qū)間的下限為85.06000-0.126046,上限為85.06000+0.126046。其他品牌均值的置信區(qū)間計算,同樣是均值加減0.126046而得至U的tTests(LSO)forEvaluationMOTE;Thi5testcontr'olsth?TypeIccnwparisonw£seerrorratepnottheesperiHiEntwiseerrorrate-Alniha0.05ErrorDegreedofifreedoo11-00Err&rSquar*043ng白Critic#1Vjilueoft1.9E212tSigni

31、ficjintDifference習Cornparisonssignificantatthe005areindicatecby*,pf,ftimeCompiriscHiA24-A22Differefite修小七用呼野力2,6360795KConfid«nc«Liaits2.457B22,81431勤9-A235,6式435_453175.SM6B由*立Ali-A.1911.07B5710.5603211.25683AZ4一41512,0517912.6/35313.63094U.4.271KA24-Al413.24K9i13.VM7A2d-A2513.41714L3.238

32、S913.S954enA24AIS14*6翻。14fe581?414.93826心a-A1716,24179lfi.M353U?一*1*苴M-w16卜馴5崎16.7M7417.12326Hb,»范M-AZO10,212141B.033B910.39040A2618.46500IE.30*7418.&g3Z6A24-A2919.4Ld0»19.2317419.5SS26配眄*Ala-Al電26.5923620.414G白20.77111A27上目.融工147130921,0040*A24工Ajea9靦2工必后22.38111*Aid-All24.28&0d24

33、.1017424.4&S2GHitodA24-川冷241610171M.4324424.7B097ttt*財-41217.3刊祥37.A1J1A肘*AMAll39,0417938.8635339.2264W4圖4.6lsd最小顯著差檢驗圖4.6中結果分析:注意在顯著水平為0.05上,兩兩比較的最小顯著差為0.1783,如果顯著則被標上“*:例如,A24均值減A22均值=85.06000-82.42393=2.63607>0.1783,顯著。綜合分析的結果表明,A21品牌均值顯著與其他品牌均值不同,且為最小的均值;A24品牌均值也顯著與其他品牌均值不同,且為最大的均值;A13、A2

34、5兩個品牌均值之間無顯著差異。4.3 有計劃的均值比較和參數(shù)估計在實際情況中,多重比較要按某種分類標準來進行,我們現(xiàn)在還知道20種品牌的制造商情況,品牌A22、A23和A24三個品牌的香水來自法國(France)制造商,而其他品牌的香水來自非法國(non-France)制造商。我們比較法國香水品牌的均值與非法國香水品牌的均值是否有差異。程序如下:procglmdata=li.perfume;classperfume;modelEvaluation=perfume;contrastFranceVSNON-France'perfume-3-3-3-3-3-3-3-3-3-3-3-31717

35、17-3-3-3-3-3;estimateFranceVSNON-France'perfume-3-3-3-3-3-3-3-3-3-3-3-3171717-3-3-3-3-3;run;程序說明:使用contrast語句來產生有計劃的均值比較分析和使用estimate語句進行參數(shù)估計。注意在anova過程中沒有這兩條語句,必須使用glm過程。使用contrast語句前,應該首先表達出所關心的均值線性組合的原假設,如H0:1/3(-A22:"1-A23:"1-A24)=1/di:!'1-A29)等價于H。:1772,73.74)-3(%11,,A29)=。contrast語句的三個基本參數(shù),一是標簽('FranceVSNON-France'),二是效應名(perfume),三是效應的數(shù)字系數(shù)表(-3-3-3-3-3-3-3-3-3-3-3-3171717-3-3-3-3-3)。應特別注意的是,數(shù)字系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論