淺析大數(shù)據(jù)條件下質(zhì)量管理中病態(tài)數(shù)據(jù)的管理研究_第1頁
淺析大數(shù)據(jù)條件下質(zhì)量管理中病態(tài)數(shù)據(jù)的管理研究_第2頁
淺析大數(shù)據(jù)條件下質(zhì)量管理中病態(tài)數(shù)據(jù)的管理研究_第3頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

淺析大數(shù)據(jù)條件下質(zhì)量管理中病態(tài)數(shù)據(jù)的管理研究大數(shù)據(jù)條件下,正確完成數(shù)據(jù)的判別,明確病態(tài)性數(shù)據(jù),是大數(shù)據(jù)質(zhì)量管理的基礎(chǔ)和前提。首先,對(duì)大數(shù)據(jù)條件下中病態(tài)數(shù)據(jù)的定義與來源進(jìn)行了論述;然后,結(jié)合病態(tài)數(shù)據(jù)的產(chǎn)生經(jīng)過,歸納總結(jié)了病態(tài)數(shù)據(jù)的重要特點(diǎn);再次,結(jié)合質(zhì)量管理的需求,分析了病態(tài)數(shù)據(jù)的管理需求;最后,基于統(tǒng)計(jì)方法,對(duì)病態(tài)數(shù)據(jù)的判別提出了對(duì)策建議。1引言隨著計(jì)算機(jī)技術(shù)、、網(wǎng)絡(luò)技術(shù)、云技術(shù)等的發(fā)展,在質(zhì)量管理領(lǐng)域,數(shù)據(jù)采集的類型和數(shù)量呈現(xiàn)出爆炸性的發(fā)展趨勢(shì),大數(shù)據(jù)的特點(diǎn)愈發(fā)明顯。如購物網(wǎng)站的產(chǎn)品質(zhì)量評(píng)價(jià)數(shù)據(jù)、體檢中心的健康檢測(cè)數(shù)據(jù)、4S店的車輛維護(hù)數(shù)據(jù)等。這些數(shù)據(jù)不僅數(shù)量大,而且具體表現(xiàn)出出了總體性、壽命周期性、復(fù)雜性等大數(shù)據(jù)的特點(diǎn)[1]。但由于數(shù)據(jù)采集技術(shù)、數(shù)據(jù)提供者自己的問題等原因,使得采集到的一部分?jǐn)?shù)據(jù)呈現(xiàn)出病態(tài)性的特點(diǎn),如評(píng)價(jià)數(shù)據(jù)中非常類似的差評(píng)、好評(píng)數(shù)據(jù)的大量出現(xiàn),健康監(jiān)測(cè)、4S店產(chǎn)品維護(hù)數(shù)據(jù)中數(shù)值長(zhǎng)期堅(jiān)持不變的數(shù)據(jù)、學(xué)生成就中非常低的成就數(shù)值大量出現(xiàn)等。病態(tài)數(shù)據(jù)的出現(xiàn),使得對(duì)質(zhì)量的評(píng)價(jià)會(huì)出現(xiàn)評(píng)價(jià)不精確、問題定位不精到準(zhǔn)確等誤導(dǎo)性結(jié)果。為實(shí)現(xiàn)對(duì)質(zhì)量的精到準(zhǔn)確分析,有需要對(duì)質(zhì)量管理中病態(tài)數(shù)據(jù)的概念進(jìn)行論述,分析其特點(diǎn)、產(chǎn)生的源頭,并研究病態(tài)數(shù)據(jù)的分析方法,進(jìn)而實(shí)現(xiàn)對(duì)質(zhì)量數(shù)據(jù)的精細(xì)化管理。質(zhì)量管理作為一個(gè)主要研究方向,國內(nèi)外已經(jīng)進(jìn)行了長(zhǎng)期的研究,出版了大量的專著,典型的如〔QualityControlHandbook〕、〔TheManagementAndControlofQuality〕等。而作為當(dāng)下研究的熱門領(lǐng)域,國內(nèi)外對(duì)大數(shù)據(jù)也進(jìn)行了大量的研究,出版了大量的論著,如〔BigData:ARevolutionThatWillTransformHowWeLive,WorkandThink〕、〔DataScienceandBigDataAnalytics:Discovering,Analyzing,VisualizingandPresentingData〕、〔醫(yī)療大數(shù)據(jù)〕等。而對(duì)于大數(shù)據(jù)條件下質(zhì)量管理中病態(tài)數(shù)據(jù)的管理研究,該方面的闡述還比較少,現(xiàn)有的研究重要集中于闡述數(shù)據(jù)質(zhì)量研究的需要性、研究方法等。如Rao等[2]指出在大數(shù)據(jù)分析中,基于低質(zhì)量數(shù)據(jù)進(jìn)行分析,隱藏的后果可能是災(zāi)難性和蔓延性的,并提出了從大數(shù)據(jù)背景分析數(shù)據(jù)質(zhì)量的方法。Becker等[3]指出大數(shù)據(jù)分析中,數(shù)據(jù)質(zhì)量是所有數(shù)據(jù)分析問題中極其主要的方面,并從數(shù)據(jù)的采集、描繪敘述、存儲(chǔ)等方面分析了不同因素對(duì)大數(shù)據(jù)質(zhì)量的影響。Immonen等[4]則針對(duì)大數(shù)據(jù)框架下的社會(huì)媒體數(shù)據(jù)質(zhì)量評(píng)估構(gòu)建了評(píng)估的架構(gòu)。國內(nèi),宗威等[5]梳理了大數(shù)據(jù)的基本特征,并從流程、技術(shù)和管理視角討論了大數(shù)據(jù)時(shí)代下企業(yè)保證數(shù)據(jù)質(zhì)量的挑戰(zhàn)、主要性及應(yīng)對(duì)辦法。程平等[6]對(duì)數(shù)據(jù)的質(zhì)量提出了完好性、及時(shí)性、可靠性等關(guān)鍵數(shù)據(jù)質(zhì)量特征。黃冬梅等[7]對(duì)基于塊嵌套循環(huán)的大數(shù)據(jù)的數(shù)據(jù)質(zhì)量檢驗(yàn)方案進(jìn)行了研究。在基于大數(shù)據(jù)的質(zhì)量管理分析方面,Huang等[8]在對(duì)暫態(tài)電能的質(zhì)量評(píng)價(jià)方法中,基于大數(shù)據(jù)的處理構(gòu)造完成了樸素Bayes分類,在該構(gòu)造中,將數(shù)據(jù)源擴(kuò)展為電網(wǎng)監(jiān)控?cái)?shù)據(jù)、用戶數(shù)據(jù)和公共數(shù)據(jù)三種類型。詳細(xì)到對(duì)病態(tài)數(shù)據(jù)的分析,當(dāng)下的研究比較偏向于詳細(xì)技術(shù)的分析,如Liu等[9]在對(duì)生物醫(yī)學(xué)圖像和疾病預(yù)測(cè)的多維數(shù)據(jù)分析中,設(shè)計(jì)了可對(duì)病態(tài)數(shù)據(jù)對(duì)象探測(cè)的信息處理算法。Joon-Hong等[10]則對(duì)短期供水需求分析與預(yù)測(cè)中,病態(tài)數(shù)據(jù)細(xì)化的置信區(qū)間方法和誤差百分比校正方法進(jìn)行了闡述。國內(nèi)對(duì)于病態(tài)數(shù)據(jù)的研究重要集中在對(duì)病態(tài)數(shù)據(jù)處理的詳細(xì)算法分析上,如王晶[11]對(duì)電力系統(tǒng)中異常數(shù)據(jù)的影響進(jìn)行了論述,并對(duì)多種電力系統(tǒng)異常數(shù)據(jù)檢測(cè)辨識(shí)方法的優(yōu)缺點(diǎn)進(jìn)行了比照分析。費(fèi)歡等[12]采取K-Means算法思想,基于歐式間隔進(jìn)行數(shù)據(jù)的類似性分析,并實(shí)現(xiàn)異常數(shù)據(jù)的檢測(cè)。從現(xiàn)有的研究情況以及大數(shù)據(jù)和質(zhì)量管理的需求情況看,對(duì)大數(shù)據(jù)條件下的質(zhì)量管理進(jìn)行研究,已是質(zhì)量管理的一個(gè)主要研究方向,但對(duì)于大數(shù)據(jù)中病態(tài)數(shù)據(jù)的研究,當(dāng)前還處于初始的研究探尋求索階段。因而,需要加強(qiáng)這方面的研究,對(duì)病態(tài)數(shù)據(jù)的定義、特點(diǎn)、來源、管理需求、判別技術(shù)等進(jìn)行分析,為大數(shù)據(jù)條件下的質(zhì)量管理提供精確的數(shù)據(jù)支撐。2病態(tài)數(shù)據(jù)的定義與重要來源病態(tài)數(shù)據(jù)也稱為“不良數(shù)據(jù)〞、“異常數(shù)據(jù)〞,翻譯為AbnormalData,是相對(duì)于總體的主導(dǎo)性數(shù)據(jù)或者正常數(shù)據(jù)而言的。在大數(shù)據(jù)管理中,質(zhì)量管理中的病態(tài)數(shù)據(jù)是指:由于數(shù)據(jù)采集記錄毛病、不良信息傳播、惡意評(píng)價(jià)、反復(fù)引用等原因,使得采集到的部分難以反映產(chǎn)品總體的實(shí)際質(zhì)量狀態(tài)的數(shù)據(jù)。病態(tài)數(shù)據(jù)在統(tǒng)計(jì)分布上表現(xiàn)為:與主導(dǎo)性或真實(shí)性質(zhì)量數(shù)據(jù)(稱為主流數(shù)據(jù))的分布存在差別,總體的分布存在不連續(xù)、多峰、鋸齒等特點(diǎn)。病態(tài)數(shù)據(jù)的來源重要包含如下類型:(1)誤導(dǎo)性質(zhì)量評(píng)價(jià)數(shù)據(jù)。指在質(zhì)量分析與評(píng)價(jià)中,通過物質(zhì)、精神等方面的手段誤導(dǎo)調(diào)查者,使得質(zhì)量評(píng)價(jià)數(shù)據(jù)偏離實(shí)際質(zhì)量的情況。該類數(shù)據(jù)包含購物網(wǎng)站對(duì)產(chǎn)品質(zhì)量評(píng)價(jià)、效勞窗口對(duì)效勞質(zhì)量評(píng)價(jià)方面。如某寶的部分產(chǎn)品在其包裝中附帶好評(píng)卡,該類卡片的出現(xiàn),容易誤導(dǎo)消費(fèi)者,使得采集到的部分質(zhì)量數(shù)據(jù)難以反映質(zhì)量評(píng)價(jià)的客觀性。而效勞窗口的誤導(dǎo)性則具體表現(xiàn)出在其評(píng)價(jià)標(biāo)準(zhǔn)的不全面,如某些效勞窗口,其評(píng)價(jià)標(biāo)準(zhǔn)僅包含非常滿意、滿意、不滿意三個(gè)方面。(2)惡意評(píng)價(jià)數(shù)據(jù)。指由于調(diào)查者自己的偏激、認(rèn)識(shí)不全面等原因,在對(duì)質(zhì)量評(píng)價(jià)中不能做出客觀評(píng)價(jià)的數(shù)據(jù)。該方面的數(shù)據(jù)不僅在購物網(wǎng)站上有相關(guān)表現(xiàn),而且在日常生活中的表現(xiàn)也較為突出,如對(duì)效勞窗口的評(píng)價(jià),由于被效勞者的一時(shí)激憤,對(duì)相關(guān)管理機(jī)構(gòu)的不滿等,就可能在某些場(chǎng)所發(fā)布較為偏激的評(píng)價(jià),以至?xí)M(jìn)行一定水平的造謠、傳謠等。(3)反復(fù)性采集數(shù)據(jù)。指由于數(shù)據(jù)記錄、剽竊等原因,造成的采集到的數(shù)據(jù)出現(xiàn)大量反復(fù)或者高度類似數(shù)據(jù)。該類數(shù)據(jù)如問卷調(diào)查中由于被調(diào)查者、調(diào)查者有意造假等在調(diào)查中剽竊已有數(shù)據(jù),考試中題目泄露、剽竊等構(gòu)成的數(shù)據(jù),數(shù)據(jù)記錄設(shè)備間歇性故障造成數(shù)據(jù)反復(fù)記錄等。(4)不作為數(shù)據(jù)。指在生產(chǎn)、效勞、研究中由于相關(guān)人員的不努力、不作為等原因,進(jìn)而使得在質(zhì)量分析與評(píng)價(jià)中,采集到的難以表現(xiàn)真本質(zhì)量狀態(tài)的數(shù)據(jù)。這方面,比較容易說明問題的是農(nóng)產(chǎn)品的質(zhì)量數(shù)據(jù)、醫(yī)療美容產(chǎn)品質(zhì)量數(shù)據(jù)等。作為影響國計(jì)民生的日用產(chǎn)品,市場(chǎng)上缺乏監(jiān)管或者監(jiān)管不力,使得部分具有毒副作用以及功能缺失的產(chǎn)品進(jìn)入人們的日常生活,這方面只要關(guān)注CCTV-13的〔每周質(zhì)量報(bào)告〕,就能從一個(gè)側(cè)面看出產(chǎn)品的質(zhì)量在某種水平上并不像廣告宣傳的那樣優(yōu)質(zhì)。造成這種問題在很大水平上是由于某些監(jiān)管部門的不作為,進(jìn)而導(dǎo)致質(zhì)量檢驗(yàn)方法與內(nèi)容的缺失。(5)片面宣傳數(shù)據(jù)。指生產(chǎn)方、銷售方在產(chǎn)品的宣傳中利用名人效應(yīng)、專家效應(yīng)等片面的擴(kuò)大產(chǎn)品或效勞的部分功能或質(zhì)量效應(yīng),而有意屏蔽部分不良特性或短板質(zhì)量問題,這類對(duì)產(chǎn)品或效勞的片面宣傳或理解就稱為片面宣傳數(shù)據(jù)。3病態(tài)數(shù)據(jù)的重要特點(diǎn)相對(duì)于大數(shù)據(jù)條件下正常的質(zhì)量數(shù)據(jù),病態(tài)數(shù)據(jù)重要表現(xiàn)有如下特點(diǎn):(1)非主流性。相對(duì)于產(chǎn)品正常的質(zhì)量數(shù)據(jù),病態(tài)數(shù)據(jù)是非主流的數(shù)據(jù),無論其表現(xiàn)怎樣,病態(tài)數(shù)據(jù)都不能代表產(chǎn)品質(zhì)量的真實(shí)水平,在生產(chǎn)、效勞經(jīng)過透明,監(jiān)管部門質(zhì)量報(bào)告數(shù)據(jù)透明的條件下,這類數(shù)據(jù)將會(huì)從數(shù)量上、表現(xiàn)上呈現(xiàn)出其非主流性,較為容易判定分析。(2)異總體性。從病態(tài)數(shù)據(jù)的定義與來源看,病態(tài)數(shù)據(jù)與主流質(zhì)量數(shù)據(jù)反映的質(zhì)量主題是有一定的差別的,這就使得兩方面的數(shù)據(jù)在總體分布形態(tài)會(huì)出現(xiàn)一定的差別,在統(tǒng)計(jì)分布形式上,若將所有的數(shù)據(jù)在同一坐標(biāo)軸上表現(xiàn),則質(zhì)量數(shù)據(jù)會(huì)具體表現(xiàn)出出多峰分布的特點(diǎn)。這種異總體性重要是由病態(tài)數(shù)據(jù)的非主流性造成的。(3)易擴(kuò)散性。由于名人效應(yīng)、廣告效應(yīng)、消費(fèi)者的獵奇心理等,使得在某種水平上非主流的質(zhì)量數(shù)據(jù)比一般的質(zhì)量數(shù)據(jù)更容易擴(kuò)散。易擴(kuò)散性在某種水平上還可造成病態(tài)數(shù)據(jù)反復(fù)性和關(guān)鍵性的特點(diǎn)。(4)關(guān)鍵性。指病態(tài)數(shù)據(jù)在某種水平上會(huì)誤導(dǎo)消費(fèi)者、擾亂市場(chǎng)秩序、降低質(zhì)量評(píng)價(jià)的精確性等,使得病態(tài)數(shù)據(jù)必需重點(diǎn)處理,以消除其晦氣影響。(5)少量性。相對(duì)于產(chǎn)品正常的質(zhì)量數(shù)據(jù),尤其是大數(shù)據(jù)條件下的質(zhì)量監(jiān)控,病態(tài)數(shù)據(jù)在產(chǎn)品壽命周期中,僅僅是少數(shù)的一部分。相比生產(chǎn)經(jīng)過的監(jiān)測(cè)數(shù)據(jù)、大量消費(fèi)者的評(píng)價(jià)數(shù)據(jù)等而言,病態(tài)數(shù)據(jù)是少量的。(6)反復(fù)性。與主流質(zhì)量數(shù)據(jù)不同,主流數(shù)據(jù)由于調(diào)查單位的獨(dú)立性和調(diào)查者的責(zé)任感,使得采集到的數(shù)據(jù)通常具體表現(xiàn)出出隨機(jī)性的特點(diǎn)。而病態(tài)數(shù)據(jù)由于采集者或提供者的不作為,就可能使得部分質(zhì)量數(shù)據(jù)出現(xiàn)反復(fù)性的特點(diǎn)。上述僅對(duì)病態(tài)數(shù)據(jù)的一些顯性的特點(diǎn)進(jìn)行分析。這些顯性特點(diǎn)的分析,有利于科技工作者歸納總結(jié)病態(tài)數(shù)據(jù)的判別方法,完成對(duì)病態(tài)數(shù)據(jù)的歸類與統(tǒng)計(jì)分析。4病態(tài)數(shù)據(jù)的管理需求質(zhì)量管理中病態(tài)數(shù)據(jù)的出現(xiàn),會(huì)在很大水平上影響消費(fèi)者對(duì)產(chǎn)品質(zhì)量的評(píng)價(jià),并在一定水平上造成民眾對(duì)某些產(chǎn)品質(zhì)量自信心的缺失,進(jìn)而可能造成不可估量的影響,如消費(fèi)對(duì)象的轉(zhuǎn)移、企業(yè)的倒閉,以至是類似產(chǎn)業(yè)的瓦解(如典型的三鹿奶粉現(xiàn)象)等。因而,在大數(shù)據(jù)條件下,有需要加強(qiáng)質(zhì)量數(shù)據(jù)的管理,減少以至避免病態(tài)數(shù)據(jù)的出現(xiàn)。其管理需求重要包含:(1)明確質(zhì)量管理機(jī)構(gòu)的主體地位。各級(jí)的質(zhì)量技術(shù)監(jiān)督局是產(chǎn)品質(zhì)量的監(jiān)督與管理機(jī)構(gòu),其工作態(tài)度和工作方法決定了產(chǎn)品質(zhì)量的好壞。在質(zhì)量管理中,明確質(zhì)量管理機(jī)構(gòu)的主體地位,賦予其質(zhì)量管理方面的相關(guān)權(quán)利,有利于相關(guān)質(zhì)量管理工作的開展。(2)施行質(zhì)量準(zhǔn)入制度。是在明確質(zhì)量管理機(jī)構(gòu)主體地位的基礎(chǔ)上,嚴(yán)格要求進(jìn)入市場(chǎng)的產(chǎn)品具備相關(guān)的具有權(quán)威性的質(zhì)量標(biāo)準(zhǔn)和質(zhì)量標(biāo)記。該制度的履行可在較大水平上保證產(chǎn)品質(zhì)量,而且準(zhǔn)入制度和責(zé)任制的配合,能夠抑制病態(tài)數(shù)據(jù)的產(chǎn)生和擴(kuò)散。(3)施行質(zhì)量數(shù)據(jù)責(zé)任制。有責(zé)任才會(huì)有質(zhì)量。責(zé)任制是對(duì)于數(shù)據(jù)的發(fā)布方、名人效應(yīng)的代言方、廣告的發(fā)布者、質(zhì)量標(biāo)記的發(fā)布者等,在發(fā)布其數(shù)據(jù)的同時(shí),必需承當(dāng)相應(yīng)的責(zé)任,而且應(yīng)出臺(tái)相關(guān)的法律,進(jìn)而保證所發(fā)布的質(zhì)量數(shù)據(jù)的真實(shí)性。(4)加強(qiáng)質(zhì)量管理的法制建設(shè)。“有法可依、有法必依〞,強(qiáng)有力的法制是確保產(chǎn)品質(zhì)量的有利保障。法制建設(shè)不僅包含質(zhì)量管理相關(guān)法律條文的建設(shè),而且包含相關(guān)法律落實(shí)履行的機(jī)構(gòu)、設(shè)備建設(shè),只要真正得到貫徹履行的法律才是有效的法律。(5)加強(qiáng)質(zhì)量教育。在這里,質(zhì)量教育是指針對(duì)全民進(jìn)行相關(guān)的質(zhì)量意識(shí)和質(zhì)量判別教育,讓廣闊消費(fèi)者明確質(zhì)量的主要性和產(chǎn)品質(zhì)量的簡(jiǎn)單判別方法。質(zhì)量只要得到社會(huì)的廣泛關(guān)注,能力減少質(zhì)量問題的產(chǎn)生,能力抑制病態(tài)數(shù)據(jù)的出現(xiàn)。(6)加強(qiáng)質(zhì)量的信息化。是在質(zhì)量管理方面引入信息的回溯機(jī)制,通過信息技術(shù)(包含數(shù)據(jù)庫技術(shù)、二維碼技術(shù)等)將產(chǎn)品質(zhì)量信息植入產(chǎn)品的關(guān)鍵奪目標(biāo)記中,使得消費(fèi)者能夠快速、便捷地獲得產(chǎn)品質(zhì)量的相關(guān)信息、責(zé)任者。質(zhì)量信息化是大數(shù)據(jù)條件下質(zhì)量數(shù)據(jù)管理的一個(gè)主要方向,也是保證產(chǎn)品質(zhì)量的關(guān)鍵技術(shù)環(huán)節(jié)。5病態(tài)數(shù)據(jù)的判別技術(shù)在大數(shù)據(jù)條件下,結(jié)合病態(tài)數(shù)據(jù)的來源和特點(diǎn),可從如下方面完成病態(tài)數(shù)據(jù)的判別:(1)基于統(tǒng)計(jì)分布的病態(tài)數(shù)據(jù)判別。與主流數(shù)據(jù)相比,病態(tài)數(shù)據(jù)在一定水平上表現(xiàn)出與主流數(shù)據(jù)之間的異總體性,因而,可通過對(duì)總體分布的簡(jiǎn)單分析完成病態(tài)數(shù)據(jù)的判別。如若總體分布出現(xiàn)多峰的情況,則可在一定水平上說明數(shù)據(jù)中存在病態(tài)數(shù)據(jù),而峰值之間的間隔越遠(yuǎn)說明病態(tài)數(shù)據(jù)的病態(tài)性越嚴(yán)重。一維數(shù)據(jù)基于統(tǒng)計(jì)分布的病態(tài)數(shù)據(jù)判別示意如此圖1所示。(2)基于類似性檢驗(yàn)的病態(tài)數(shù)據(jù)判別。當(dāng)數(shù)據(jù)中出現(xiàn)反復(fù)數(shù)據(jù)或者類似性非常強(qiáng)的評(píng)價(jià)數(shù)據(jù)時(shí),需要通過類似性分析方法驗(yàn)證數(shù)據(jù)之間的一致性。這方面,國內(nèi)外對(duì)于研究論文的已有具體標(biāo)準(zhǔn)與方法,可將其借鑒到這方面。(3)基于聚類分析的病態(tài)數(shù)據(jù)判別。聚類分析是統(tǒng)計(jì)學(xué)的一個(gè)主要分支,該方法基于樣品之間的統(tǒng)計(jì)間隔描繪敘述樣品之間的類似性。而對(duì)于病態(tài)數(shù)據(jù)分析而言,可知主流數(shù)據(jù)之間類似性強(qiáng),而病態(tài)數(shù)據(jù)與主流數(shù)據(jù)之間類似性較弱,相反,病態(tài)數(shù)據(jù)之間有較強(qiáng)的類似性。通過聚類分析可將數(shù)據(jù)根據(jù)類似性分為不同的類型,進(jìn)而較為容易的區(qū)分出病態(tài)數(shù)據(jù)。對(duì)于二維數(shù)據(jù),在平面直角坐標(biāo)軸上,能夠較為容易的描繪敘述其分布特點(diǎn),進(jìn)而能夠較為容易的區(qū)分?jǐn)?shù)據(jù)的類型,其聚類分析的示意圖如此圖2所示。(4)基于判別分析的病態(tài)數(shù)據(jù)歸類。判別分析是統(tǒng)計(jì)學(xué)的一個(gè)主要研究領(lǐng)域,該方法基于已有的分類,然后基于統(tǒng)計(jì)間隔完成樣品的歸類判別。在質(zhì)量分析中,當(dāng)質(zhì)量數(shù)據(jù)難以進(jìn)行病態(tài)性判別時(shí),可事先結(jié)合國內(nèi)外類似產(chǎn)品的質(zhì)量信息完成數(shù)據(jù)的分類分析,然后基于判別分析方法對(duì)需要?dú)w類的質(zhì)量數(shù)據(jù)進(jìn)行判別,完成病態(tài)數(shù)據(jù)的歸類。6結(jié)束語大數(shù)據(jù)條件下,病態(tài)數(shù)據(jù)的判別、修正、剔除等是一項(xiàng)長(zhǎng)期而且復(fù)雜的數(shù)據(jù)管理工作,該文對(duì)質(zhì)量數(shù)據(jù)中病態(tài)數(shù)據(jù)的定義、來源、特點(diǎn)和判別技術(shù)進(jìn)行了初步的研究,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論