櫥柜工程項目數(shù)據(jù)分析與挖掘(工程管理)_第1頁
櫥柜工程項目數(shù)據(jù)分析與挖掘(工程管理)_第2頁
櫥柜工程項目數(shù)據(jù)分析與挖掘(工程管理)_第3頁
櫥柜工程項目數(shù)據(jù)分析與挖掘(工程管理)_第4頁
櫥柜工程項目數(shù)據(jù)分析與挖掘(工程管理)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、泓域咨詢/櫥柜工程項目數(shù)據(jù)分析與挖掘櫥柜工程項目數(shù)據(jù)分析與挖掘xx有限責(zé)任公司一、 邏輯框架矩陣的編制邏輯框架的編制過程,同時也是對項目各要素的不斷分析和加深認識的過程,按照因果關(guān)系進行邏輯分析,理順項目的層次,找出問題的關(guān)鍵,提出解決問題的方案和對策。在邏輯框架的分析過程中,應(yīng)重點解決以下問題:1為什么要進行這一項目,如何度量項目的宏觀目標;2項目要達到什么具體目標,不同層次的具體目標和宏觀目標之間有何聯(lián)系;3怎樣達到這些具體目標;4有哪些外部因素在項目具體目標的取得上是必須考慮的;5項目成功與否的測量指標是什么,如何進行檢測;6驗證項目指標的數(shù)據(jù)從哪里得到;7項目實施中要求投入哪些資源,需

2、要的費用是多少;8項目計劃的內(nèi)容及實施的主要外部條件是什么;9如何檢查項目的進度。(一)邏輯框架的編制步驟邏輯框架矩陣表的編制,可以按照以下步驟進行:1確定項目的具體目標;2確定為實現(xiàn)項目具體目標所要實現(xiàn)的產(chǎn)出成果;3確定為達到每項產(chǎn)出成果所需要投入的活動;4確定項目的宏觀目標;5用“如果,那么”的邏輯關(guān)系自下而上檢驗縱向邏輯關(guān)系;6確定每一層次目標的實現(xiàn)所需要的重要假設(shè)和外部條件;7依次確定項目的直接目標、產(chǎn)出成果和宏觀目標的可驗證的指標;8確定指標的客觀驗證方法;9確定各項投入活動的預(yù)算成本和驗證指標及方法;10對整個邏輯框架的設(shè)計進行對照檢查和核對。(二)目標層次的邏輯關(guān)系表述目標層次的

3、邏輯關(guān)系表述,目的是要確定各層次的目標關(guān)系,分析項目的宏觀目標、具體目標和產(chǎn)出成果及其邏輯關(guān)系。主要做法是:1宏觀目標構(gòu)成項目邏輯框架的最上層次,其他項目也可能為此目標做出貢獻。要對項目進行目標體系的分解和分析,可借助目標樹的方法進行分析,確定項目的宏觀目標和具體目標。項目宏觀目標的分析表述要盡量做到具體化。2項目具體目標是達到宏觀目標的分目標之一,也是該項目希望達到的目標,是用以評價某一項目最后是否取得成功的判斷依據(jù)。項目規(guī)劃的使命就是要努力保證項目具體目標的實現(xiàn)。3各項產(chǎn)出成果是為實現(xiàn)項目具體目標必須達到的結(jié)果。它們從其效果來看應(yīng)是合適的、必要的、足夠的。4項目必要的投入活動的表述,應(yīng)注意

4、簡潔明了,不要列舉太多的具體活動,只要使項目的基本結(jié)構(gòu)和方案能夠得到清晰表達就足夠了。5將各項投入活動和產(chǎn)出成果逐一編號,表示時間順序或優(yōu)先順序。6項目概述應(yīng)有嚴密的邏輯性:為了達到產(chǎn)出成果而開展相應(yīng)的投入活動各項產(chǎn)出成果是達到項目直接目標所必需的條件,與重要假設(shè)及外部條件結(jié)合構(gòu)成項目具體目標的先決條件;項目具體目標是達到宏觀目標的條件之一。(三)重要假設(shè)的表述邏輯框架矩陣中的“重要假設(shè)”,是由外部條件即項目之外的影響因素轉(zhuǎn)化而來的。項目之外的影響因素指在項目的控制范圍以外但對項目的成功有影響的條件。在確定重要假設(shè)時,一般要回答這樣的問題,即“哪些外部因素對項目的實施顯得特別重要,但項目本身又

5、不能加以控制?”一旦發(fā)現(xiàn)上述這些外部條件或項目之外的影響因素存在,就要進行認真分析,并放入邏輯框架矩陣表內(nèi),提醒項目管理者注意監(jiān)視此類條件的變化。如有可能,應(yīng)施加一定的影響,使其盡可能向有利于項目實施的方向轉(zhuǎn)變。重要假設(shè)條件的存在,是由多種原因造成的。首先是項目所在地的特定自然環(huán)境及其變化。例如農(nóng)業(yè)項目,管理者無法控制的一個主要外部因素是氣候,變化無常的天氣可能使莊稼顆粒無收,計劃徹底失敗。這類風(fēng)險還包括地震、干旱、洪水、臺風(fēng)、病蟲等自然災(zāi)害。其次,政府在政策、計劃、發(fā)展戰(zhàn)略等方面的失誤或變化給項目帶來嚴重影響。例如,一些發(fā)展中國家的產(chǎn)品價格極不合理,農(nóng)產(chǎn)品價格很低,那么即使項目的設(shè)計和實施完

6、成得再好,仍然逃脫不了經(jīng)濟上的失敗。另外,管理體制也是項目無法控制的因素。僵化的管理體制往往造成項目投入產(chǎn)出與其具體目標和宏觀目標的分離。例如,一些國家的農(nóng)田灌溉設(shè)施由水資源部門管理,一個具體的農(nóng)業(yè)項目(包括良種、化肥、農(nóng)藥、農(nóng)機設(shè)施、農(nóng)技服務(wù)、水利灌溉等多項內(nèi)容)可能因為水資源部門不合理的水量分配而大大降低效益。列入邏輯框架矩陣表的重要假設(shè)條件要具備3個條件:對項目的成功很重要項目本身無法對之進行控制;有可能發(fā)生。重要假設(shè)可以描述自然條件,如保證一定期間范圍內(nèi)的降水量是多少、糧食價格保持穩(wěn)定、農(nóng)民愿意采納新技術(shù)、農(nóng)民愿意使用新的信貸系統(tǒng)等;也可以描述與此項目有關(guān)的其他項目,如世界銀行灌溉項目

7、一定要按時完成,或者施肥項目屆時結(jié)束等。這里需要強調(diào)的是“可能發(fā)生的”這一點,即不確定的程度,例如我們假定將有充足的降雨量,沒有這個條件,新的品種就不會達到增產(chǎn)的目標。如果你想測定這種不確定性的程度,仍要了解這種假設(shè)變成現(xiàn)實的可能性有多大。(四)客觀驗證指標和驗證方法的表述邏輯框架法要求,項目的每一個要素都應(yīng)是可以測定的,包括投入、產(chǎn)出、具體目標和宏觀目標,以及重要假設(shè)和外部條件。因此,項目的評價指標及其檢驗方法在邏輯框架分析中占有重要位置。1客觀驗證指標邏輯框架垂直各層次目標,應(yīng)有相對應(yīng)的客觀且可度量的驗證指標,包括數(shù)量、質(zhì)量、時間及人員等,來說明層次目標的結(jié)果,驗證每一個目標的實現(xiàn)程度,這

8、種指標的確立應(yīng)該是客觀的,不能憑主觀臆斷,同時又是可以被驗證的。為了驗證層次目標實現(xiàn)的程度,邏輯框架采用的驗證指標應(yīng)具備下列條件:(1)清晰的量化指標,以測定項目目標的實現(xiàn)程度;(2)必須針對項目主要具體目標,突出重點指標;(3)驗證指標與對應(yīng)目標的關(guān)系明確合理;(4)驗證指標與層次目標一一對應(yīng),是唯一的、單獨的;(5)驗證指標必須是完整的、充分的、定義準確的;(6)驗證指標必須是客觀的,不是人為可以變動的;(7)間接指標的采用。有時項目很難找到直接的驗證指標,需要采用間接指標。間接指標與驗證對象的關(guān)系必須是明確的,如一個衛(wèi)生項目的目的是降低嬰死亡率,但在較短時間內(nèi)很難驗證這個比例,那么只能用

9、家長受過專門訓(xùn)練的比例和醫(yī)療衛(wèi)生設(shè)施的使用比例作為間接指標。(8)驗證指標的準確性。準確的指標應(yīng)該包括明確的定義、定量和定性的數(shù)據(jù)以及規(guī)定的時間。確定指標時,要盡可能選擇簡易可行、成本較低的信息收集途徑。如要了解農(nóng)民收入,可能需要很復(fù)雜的調(diào)查研究,但有時通過對一個村農(nóng)戶電視機、自行車擁有量調(diào)查便可有所了解。如果發(fā)現(xiàn)所確定的指標不足以準確的說明宏觀目標、具體目標或產(chǎn)出成果,就應(yīng)該以其他指標來代替。2客觀驗證方法某項指標被作為檢驗?zāi)硞€目標層次的標準,它來源于哪本書、哪個統(tǒng)計報表或文件,必須提出明確的驗證方法。這里所指的統(tǒng)計報表或文件應(yīng)該具有權(quán)威性。此外,也可在此注明驗證指標的具體形式。主要資料來源

10、(監(jiān)測和監(jiān)督)和驗證方法可按照數(shù)據(jù)收集的類型、信息的來源渠道和收集方法進行劃分(1)數(shù)據(jù)收集類型。數(shù)據(jù)收集應(yīng)符合驗證指標的要求,每個層次的指標都有不同的數(shù)據(jù)收集要求,因此數(shù)據(jù)收集必須有針對性,簡明扼要。(2)咨詢信息來源。驗證方法需要說明資料信息來源的可靠性,找出省錢省時的途徑。一般的信息來自建設(shè)單位、當?shù)厝罕姾凸俜轿募?個方面。(3)數(shù)據(jù)收集技巧。在數(shù)據(jù)類型和來源明確之后,要確定是否符合信息管理的數(shù)據(jù)質(zhì)量要求,再編制表格。如果采用抽樣調(diào)查的方法,應(yīng)對取樣規(guī)模、內(nèi)容、統(tǒng)計標準等進行充分考慮和安排。簡單的抽樣調(diào)查或案例分析是不夠的,驗證指標一般都有一些比較常用的數(shù)據(jù)收集和處理方法與技巧,可根據(jù)

11、要求和條件加以選擇。(五)確定項目的投入形式和投入量項目投入是項目計劃的重要組成部分。投入形式和投入數(shù)量體現(xiàn)了項目規(guī)模,直接影響到項目的效果。認真做好這項工作是項目成功的重要保證。確定項目投入形式和投入數(shù)量的具體做法如下1根據(jù)邏輯框架內(nèi)所列出的每項投入活動,確定所需要的人、財、物的數(shù)量;2明確投資者和受益者;3人員投入以人月為計算單位;4對所投入的設(shè)備、物資應(yīng)登記清楚,并要注明所指的具體投入活動;5計算投入總量;6計算每個產(chǎn)出成果的投入總量;7在效益風(fēng)險分析的基礎(chǔ)上估計可能附加的投入量以及邏輯框架內(nèi)反映不出來的隱性投入(如組建辦公室、秘書及司機等的費用負擔),并通過討論加以落實;8當資金提供單

12、位限定了資金數(shù)量時,項目設(shè)計必須從量化方面考慮,計劃要說明多少投入量能夠取得什么結(jié)果??傊?,應(yīng)根據(jù)實際可能性和必要性來計算投入量,其結(jié)果應(yīng)能反映出不同層次的利益和責(zé)任。最后將研究和估算結(jié)果填入邏輯框架表內(nèi)。(六)最后的復(fù)查項目的投入形式和投入量確定后,邏輯框架矩陣表至此已全部完成。這時需要進行通盤檢查。應(yīng)包括如下內(nèi)容:1垂直邏輯關(guān)系(目標層次)是否完善、準確;2客觀驗證指標和驗證方法是否可靠,所需信息是否可以獲得;3前提條件是否真實,符合實際;4重要假設(shè)是否合理;5項目的風(fēng)險是否可以接受;6成功的把握是否很大;7是否考慮了持續(xù)性問題,這種持續(xù)性是否反映在成果、活動或重要假設(shè)當中;8效益是否遠遠

13、高于成本;9是否需要輔助性研究。為保證邏輯框架各項內(nèi)容表述的準確性,還要對所制定的邏輯框架進行進一步核實。核實的內(nèi)容包括:1項目具有一個宏觀目標;2項目具體目標不是對產(chǎn)出成果的重復(fù)描述;3項目具體目標是項目的管理責(zé)任(與產(chǎn)出是相對的),項目產(chǎn)出實現(xiàn)之后,項目的具體目標應(yīng)該能夠?qū)崿F(xiàn)。這里的管理責(zé)任是指項目直接目標的客觀性;4項目的具體目標應(yīng)描述清楚;5所有產(chǎn)出成果都是完成具體目標的必要條件;6各項產(chǎn)出成果描述清楚;7各項產(chǎn)出成果描述為投入活動的結(jié)果;8所設(shè)計的投入活動都是完成某項產(chǎn)出的必要條件;9宏觀目標應(yīng)描述清楚;10宏觀目標與具體目標之間具備“如果,那么”的邏輯相關(guān)性,沒有忽略重要的步驟;1

14、1投入層重要假設(shè)不包括任何前提條件,因為前提條件是活動開始之前已經(jīng)開展的工作;12在同一層次上,產(chǎn)出加上重要假設(shè)構(gòu)成達到項目直接目標的必要及充分條件;13項目直接目標加上重要假設(shè)構(gòu)成實現(xiàn)宏觀目標的關(guān)鍵條件;14投入與產(chǎn)出之間的關(guān)系是真實的;15產(chǎn)出與項目具體目標之間的關(guān)系是真實的;16投入、產(chǎn)出、項目具體目標和宏觀目標的縱向邏輯關(guān)系是真實的;17項目具體目標的指標獨立于產(chǎn)出。它們不是產(chǎn)出的總結(jié),而是檢測具體目標的尺度;18項目具體目標的測定指標能夠恰當?shù)胤从稠椖烤唧w目標的重要內(nèi)容;19項目具體目標的指標可以檢測數(shù)量、質(zhì)量和時間標準;20產(chǎn)出的指標在數(shù)量、質(zhì)量和時間上是客觀可驗證的;21宏觀目標

15、的指標在數(shù)量、質(zhì)量和時間上客觀可驗證的;22在投入層所描述的投入能夠反映完成項目的所需的資源;23驗證方法應(yīng)說明在哪里可獲得驗證每個指標的信息;24整個邏輯框架矩陣的內(nèi)容,可以據(jù)以確定項目的評價計劃。二、 項目名稱及項目單位項目名稱:櫥柜工程項目項目單位:xx有限責(zé)任公司三、 項目建設(shè)地點本期項目選址位于xxx(以選址意見書為準),占地面積約49.00畝。項目擬定建設(shè)區(qū)域地理位置優(yōu)越,交通便利,規(guī)劃電力、給排水、通訊等公用設(shè)施條件完備,非常適宜本期項目建設(shè)。四、 建設(shè)規(guī)模該項目總占地面積32667.00(折合約49.00畝),預(yù)計場區(qū)規(guī)劃總建筑面積49617.11。其中:主體工程35366.1

16、9,倉儲工程7197.58,行政辦公及生活服務(wù)設(shè)施5080.58,公共工程1972.76。五、 項目建設(shè)進度結(jié)合該項目建設(shè)的實際工作情況,xx有限責(zé)任公司將項目工程的建設(shè)周期確定為12個月,其工作內(nèi)容包括:項目前期準備、工程勘察與設(shè)計、土建工程施工、設(shè)備采購、設(shè)備安裝調(diào)試、試車投產(chǎn)等。六、 建設(shè)投資估算(一)項目總投資構(gòu)成分析本期項目總投資包括建設(shè)投資、建設(shè)期利息和流動資金。根據(jù)謹慎財務(wù)估算,項目總投資18677.44萬元,其中:建設(shè)投資15107.08萬元,占項目總投資的80.88%;建設(shè)期利息165.73萬元,占項目總投資的0.89%;流動資金3404.63萬元,占項目總投資的18.23%

17、。(二)建設(shè)投資構(gòu)成本期項目建設(shè)投資15107.08萬元,包括工程費用、工程建設(shè)其他費用和預(yù)備費,其中:工程費用13439.02萬元,工程建設(shè)其他費用1271.36萬元,預(yù)備費396.70萬元。七、 項目主要技術(shù)經(jīng)濟指標(一)財務(wù)效益分析根據(jù)謹慎財務(wù)測算,項目達產(chǎn)后每年營業(yè)收入38000.00萬元,綜合總成本費用29580.28萬元,納稅總額3890.93萬元,凈利潤6167.32萬元,財務(wù)內(nèi)部收益率26.76%,財務(wù)凈現(xiàn)值12536.47萬元,全部投資回收期5.01年。(二)主要數(shù)據(jù)及技術(shù)指標表主要經(jīng)濟指標一覽表序號項目單位指標備注1占地面積32667.00約49.00畝1.1總建筑面積49

18、617.11容積率1.521.2基底面積19926.87建筑系數(shù)61.00%1.3投資強度萬元/畝301.382總投資萬元18677.442.1建設(shè)投資萬元15107.082.1.1工程費用萬元13439.022.1.2工程建設(shè)其他費用萬元1271.362.1.3預(yù)備費萬元396.702.2建設(shè)期利息萬元165.732.3流動資金萬元3404.633資金籌措萬元18677.443.1自籌資金萬元11913.113.2銀行貸款萬元6764.334營業(yè)收入萬元38000.00正常運營年份5總成本費用萬元29580.286利潤總額萬元8223.097凈利潤萬元6167.328所得稅萬元2055.77

19、9增值稅萬元1638.5310稅金及附加萬元196.6311納稅總額萬元3890.9312工業(yè)增加值萬元13125.1413盈虧平衡點萬元12782.61產(chǎn)值14回收期年5.01含建設(shè)期12個月15財務(wù)內(nèi)部收益率26.76%所得稅后16財務(wù)凈現(xiàn)值萬元12536.47所得稅后八、 項目背景分析整體櫥柜使廚房建設(shè)由功能型、配套型向生活舒適藝術(shù)型發(fā)展。整體櫥柜起源于歐美,于20世紀80年代末、90年代初傳入我國。隨著改革開放深入以及市場經(jīng)濟和城市化進程不斷發(fā)展,整體櫥柜在我國逐漸形成了龐大的產(chǎn)業(yè)市場,并成為我國的朝陽行業(yè)之一。作為現(xiàn)代家居的一個重要因素,整體櫥柜滿足了人們追求時尚、愜意廚房生活的要求

20、,使得廚房已演變成一種情感空間以及與人們居家生活息息相關(guān)的生活文化。經(jīng)過多年來的發(fā)展,國內(nèi)傳統(tǒng)櫥柜逐漸飽和,而整體櫥柜則在快速增長中。整體櫥柜組件分為“金木水火土”五大類,是家居中唯一涉及五種品類的產(chǎn)品。整體櫥柜是將灶具、櫥柜、冷藏、冷凍、洗滌等廚房各大功能組合起來形成的櫥柜組合。與普通櫥柜相比,整體櫥柜更強調(diào)整體的配置、協(xié)調(diào)、設(shè)計和施工。與整體衣柜相比,整體櫥柜在生產(chǎn)階段涉及的產(chǎn)品更多,例如五金制品、排水系統(tǒng)及臺面等,對公司供應(yīng)鏈管理能力要求更高,龍頭企業(yè)規(guī)?;a(chǎn)可在一定程度上降低庫存,提高效率,縮短生產(chǎn)與交貨周期,從而降低生產(chǎn)成本。自2000年以來,從平米報價到套裝,再到整裝,整裝企業(yè)在

21、市場里快速的崛起,整體櫥柜逐步成為櫥柜消費的主要方式,這充分說明了消費者對整裝家居快速增長的需求,我國櫥柜行業(yè),尤其是整體櫥柜行業(yè)前景十分廣闊。2018年整體櫥柜的產(chǎn)銷量分別達到1810萬套和1705萬套,行業(yè)規(guī)模達1216億元,其中省會和直轄市等一線城市是消費主力。當下,國人消費能力不斷提升,新興中產(chǎn)階級崛起,以80、90后為主的消費者成為櫥柜行業(yè)的主體消費人群,消費結(jié)構(gòu)從生存型消費向享受型、發(fā)展型消費轉(zhuǎn)變。對于櫥柜企業(yè)來說,覆蓋80、90后的廣泛人群,全方位了解新一代年輕人的家居消費主張以及生活態(tài)度十分關(guān)鍵。九、 數(shù)據(jù)分析與挖掘概述(一)信息分析信息分析是根據(jù)咨詢問題的具體需要,對與之有關(guān)

22、的信息進行整理、鑒別、評價、分析和綜合,以便取得咨詢所需新信息的過程。信息分析有如下幾種用途:1跟蹤。所謂跟蹤,就是及時了解各領(lǐng)域新動向、新發(fā)展,從而發(fā)現(xiàn)問題、提出問題。2比較。比較各種事物的內(nèi)部矛盾之后,把握事物間的聯(lián)系,認識事物的本質(zhì),從而提出問題、確定目標、擬定方案并作出選擇。3預(yù)測。利用已掌握的信息、知識和手段,推斷事物的未來或未知方面。4評價。進行評價時應(yīng)選擇合適的變量和評價指標,應(yīng)當考慮評價對象之間的可比性。信息分析所用方法,可分為定性和定量分析兩種。定性方法主要靠邏輯推理;而定量方法涉及數(shù)據(jù)間的數(shù)量關(guān)系,要建立數(shù)學(xué)模型,計算、求解。如今,信息越來越復(fù)雜,定性與定量分析已無法單獨奏

23、效,只能越來越多地結(jié)合起來。(二)數(shù)據(jù)分析數(shù)據(jù)分析是信息分析的一部分,數(shù)據(jù)分析是對收集數(shù)據(jù)進行系統(tǒng)的分析,建立適當?shù)哪P?,揭示?shù)據(jù)中隱含的技術(shù)、經(jīng)濟、社會和其他關(guān)系,以及發(fā)展趨勢,為有關(guān)的咨詢活動提交的有用的數(shù)字、信息或建議。數(shù)據(jù)分析的對象可分為時間序列和截面數(shù)據(jù)。如企業(yè)歷年的咨詢收入、利潤總額等就是時間序列。截面數(shù)據(jù)是在同一時間的數(shù)據(jù),如企業(yè)同一年咨詢業(yè)務(wù)數(shù)目、營業(yè)額、費用、收入、人工耗費等。兩種數(shù)據(jù)都要注意樣本容量大小。對于截面數(shù)據(jù),常用線性或非線性回歸模型體現(xiàn)數(shù)據(jù)之間的各種關(guān)系。數(shù)據(jù)分析屬定量分析,包括數(shù)據(jù)統(tǒng)計分析、時間數(shù)據(jù)分析、空間數(shù)據(jù)分析。(三)數(shù)據(jù)挖掘數(shù)據(jù)挖掘就是從數(shù)據(jù)中挖掘出隱含

24、、先前未知、有潛在用途,最終可為人理解的關(guān)系、模式、趨勢和其他有用信息,并建立模型,用于預(yù)測、判斷或決策,幫助企業(yè)更好地適應(yīng)變化并做出更明智的決策的過程。數(shù)據(jù)挖掘廣泛應(yīng)用于制造、金融、零售、保健、中醫(yī)藥及電信等行業(yè)的客戶關(guān)系管理、風(fēng)險防范、供應(yīng)鏈管理、競爭優(yōu)勢分析、部門分析等領(lǐng)域。數(shù)據(jù)挖掘要用到統(tǒng)計分析、人工智能、數(shù)據(jù)庫和神經(jīng)網(wǎng)絡(luò)等方面的知識,如記憶推理、聚類分析、關(guān)聯(lián)分析、決策樹、神經(jīng)網(wǎng)絡(luò)、基因算法等。數(shù)據(jù)挖掘需要用戶參與,并非某種單一工具、技術(shù)或軟件即可獨自完成。另一方面,并非所有信息查詢都可視為數(shù)據(jù)挖掘。例如,使用數(shù)據(jù)庫管理系統(tǒng)查找個別記錄,或用搜索引擎查找互聯(lián)網(wǎng)特定的網(wǎng)頁,屬于信息檢索

25、,不能視為數(shù)據(jù)挖掘。當然,數(shù)據(jù)挖掘技術(shù)也有強大的信息檢索能力。十、 大數(shù)據(jù)系統(tǒng)和數(shù)據(jù)挖掘技術(shù)(一)數(shù)據(jù)挖掘概述1大數(shù)據(jù)大數(shù)據(jù)是指超過既往數(shù)據(jù)庫系統(tǒng)規(guī)模、傳輸速度和處理能力,或者既往數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)無法容納的數(shù)據(jù)。大數(shù)據(jù)常以萬億或eb衡量,且種類多、實時性強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎(chǔ)設(shè)施、工具和技術(shù)可用來開發(fā)和利用大數(shù)據(jù)中蘊藏的價值。大數(shù)據(jù)有各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章、買賣記錄、網(wǎng)絡(luò)日志、病歷、事監(jiān)控、視頻和圖像檔案,及大型電子商務(wù)。大數(shù)據(jù)是數(shù)據(jù)挖掘產(chǎn)生與生存發(fā)展的土壤。如今數(shù)據(jù)每五年翻一番,面對前所未有的海量數(shù)據(jù),為了從中發(fā)現(xiàn)有用的信息必

26、須進行數(shù)據(jù)挖掘。此外,計算機存儲、處理大量數(shù)據(jù),以及運算的能力大為增強,為數(shù)據(jù)挖掘創(chuàng)造了條件,使其成為一門獨特的學(xué)科和技術(shù)。2數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別在于:(1)處理工作量。數(shù)據(jù)分析的數(shù)據(jù)量可能并不大,而數(shù)據(jù)挖掘的數(shù)據(jù)量極大。(2)制約條件。數(shù)據(jù)分析是從某些假設(shè)出發(fā),建立方程或模型,而數(shù)據(jù)挖掘不作假設(shè),可以自動建立方程。(3)處理對象。數(shù)據(jù)分析往往是針對數(shù)字型數(shù)據(jù),而數(shù)據(jù)挖掘?qū)ο箢愋头倍?,例如圖像、聲音、文本等。(4)處理結(jié)果。數(shù)據(jù)分析可以解釋結(jié)果的含義;數(shù)據(jù)挖掘的結(jié)果不易解釋,著眼于預(yù)測未來,并提出決策建議。想要從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律(即認知),往往需將數(shù)據(jù)分析和數(shù)據(jù)挖

27、掘結(jié)合起來。(二)數(shù)據(jù)挖掘步驟按挖掘?qū)ο螅瑪?shù)據(jù)挖掘分為數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘和網(wǎng)絡(luò)挖掘兩種,各自步驟分述如下。1數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘數(shù)據(jù)挖掘一般有信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估和知識表示8個步驟。(1)信息收集。從確定的挖掘?qū)ο笾刑崛√卣?,然后選擇合適的收集方法,將收集到的信息存入數(shù)據(jù)庫。對于海量數(shù)據(jù),必須選擇合適的數(shù)據(jù)倉庫。(2)數(shù)據(jù)集成。把來源、格式、特點、性質(zhì)不同的數(shù)據(jù)按邏輯或物理屬性加以編排,以便以后使用。(3)數(shù)據(jù)規(guī)約。多數(shù)數(shù)據(jù)挖掘算法耗時很長,商業(yè)數(shù)據(jù)往往較多,數(shù)據(jù)挖掘更耗時間。數(shù)據(jù)規(guī)約就是簡化已有可用數(shù)據(jù)集的表示,規(guī)約后數(shù)量大減,但仍能保持原數(shù)據(jù)的完整性,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論