



免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
淺析數(shù)據(jù)挖掘技術(shù)在信息化建設(shè)中的應(yīng)用 邱旭君 惠州市第三人民醫(yī)院廣東惠州516002 摘要在信息化高速發(fā)展的今天,信息化建設(shè)飛速發(fā)展,在改革與發(fā)展過程中扮演著至關(guān)重要的角色。面對(duì)過程中產(chǎn)生的大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)可以從中分析出有效的信息,為提升管理效率起到了重要作用,財(cái)務(wù)系統(tǒng)、ERP系統(tǒng)、辦公系統(tǒng)等,都大大提升了管理的效率,并且為企業(yè)管理者決策提供了支持。 本文從數(shù)據(jù)挖掘的重要性出發(fā),介紹了數(shù)據(jù)挖掘的主要方法及關(guān)鍵技術(shù),數(shù)據(jù)挖掘在信息化建設(shè)中的作用,以及信息化建設(shè)的目標(biāo)。 關(guān)鍵詞數(shù)據(jù)挖掘;信息化建設(shè);數(shù)據(jù)挖掘技術(shù) 一、數(shù)據(jù)挖掘的概念和主要方法 數(shù)據(jù)挖掘是指從大量不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含的、的且潛在有用的知識(shí)和模式的過程。它綜合運(yùn)用計(jì)算機(jī)科學(xué)、人工智能、統(tǒng)計(jì)學(xué)、信息管理、認(rèn)知科學(xué)等領(lǐng)域的先進(jìn)理論與技術(shù),研究如何從海量信息資源中快速準(zhǔn)確地獲取潛在的知識(shí),是一種信息資源深層開發(fā)的新型信息處理技術(shù)。 數(shù)據(jù)挖掘的主要方法有以下七種: 分類:就是建立分類模式,對(duì)數(shù)據(jù)庫里面的數(shù)據(jù)進(jìn)行分類。 估計(jì):對(duì)連續(xù)值的輸出進(jìn)行處理并且估計(jì)的量是無法確定的;分類卻是對(duì)離散型變量輸出的描述且數(shù)目是確定的。 預(yù)測(cè):分類和估計(jì)所得出來的模型,可以通過預(yù)測(cè)來對(duì)其模型進(jìn)行預(yù)測(cè)。 預(yù)測(cè)是需要經(jīng)過長(zhǎng)時(shí)間來進(jìn)行驗(yàn)證的,所以在通過預(yù)測(cè)后,不要立即否決該模型,要過一段時(shí)間再來觀察預(yù)測(cè)的準(zhǔn)確性。 相關(guān)性分組或關(guān)聯(lián)規(guī)則:是決定哪些事情將會(huì)一起發(fā)生。 描述和可視性:是將數(shù)據(jù)挖掘結(jié)果用某些方式表達(dá)出來。 聚類:是將一些相似的數(shù)據(jù)記錄在同一個(gè)聚集里面。 復(fù)雜數(shù)據(jù)類型挖掘。 二、數(shù)據(jù)挖掘的流程 數(shù)據(jù)挖掘的一般流程如下(圖1): (1)確定對(duì)象。在數(shù)據(jù)挖掘中,我們首先要做的是將問題弄清楚,認(rèn)清挖掘的目的是什么。數(shù)據(jù)挖掘所得的結(jié)果不是確定的,但我們研究的問題是一定的,所以在這個(gè)過程中研究對(duì)象起到引導(dǎo)作用,分析人員可將對(duì)象作為檢驗(yàn)結(jié)果的重要依據(jù)。(2)數(shù)據(jù)準(zhǔn)備。就是通過程序?qū)?shù)據(jù)庫中所需的數(shù)據(jù)分撿出來,然后合成數(shù)據(jù)挖掘的數(shù)據(jù)包的過程。首先要選擇與對(duì)象相關(guān)的所有的內(nèi)部與外部數(shù)據(jù)信息,并從中選擇適當(dāng)?shù)男畔⒆鳛橥诰蛐畔?;其次根?jù)對(duì)象選擇必要的數(shù)據(jù)挖掘類型,為下一步的數(shù)據(jù)轉(zhuǎn)換與驗(yàn)算作預(yù)處理準(zhǔn)備;最后進(jìn)行數(shù)據(jù)轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換成特殊的針對(duì)數(shù)據(jù)挖掘算法模型的過程,這也是實(shí)現(xiàn)數(shù)據(jù)成功挖掘的必要步驟。(3)尋找規(guī)律。通過建立的已有模型或算法,對(duì)數(shù)據(jù)庫中具有一定規(guī)律特點(diǎn)的數(shù)據(jù)進(jìn)行挖掘,這也是整個(gè)挖掘過程的核心所在。(4)知識(shí)表示與運(yùn)用。知識(shí)表示就是將最科學(xué)、最直觀的方式呈現(xiàn)給用戶,便于他們的理解,找出規(guī)律進(jìn)行科學(xué)直觀的表達(dá)的過程。另外,我們的最終目的是將所挖掘的數(shù)據(jù)應(yīng)用,所以還要將挖掘結(jié)果分配到用戶系統(tǒng)中去。 三、數(shù)據(jù)挖掘在信息化建設(shè)中的作用 信息化社會(huì)產(chǎn)生大量數(shù)據(jù),可以將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)可以廣泛用于各種應(yīng)用,包括商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索等。 信息化建設(shè)中各應(yīng)用系統(tǒng)通過數(shù)據(jù)集合已經(jīng)形成了一個(gè)龐大的信息數(shù)據(jù)庫,但這些數(shù)據(jù)沒有被有效的利用起來,在現(xiàn)代信息化的條件下,應(yīng)對(duì)這些長(zhǎng)期積累的海量數(shù)據(jù)進(jìn)行分析和挖掘,可以輔助管理者決策,提高工作質(zhì)量,優(yōu)化綜合實(shí)力資源提供可靠的數(shù)據(jù)依據(jù),信息化建設(shè)能夠切實(shí)的幫助企業(yè)在各種關(guān)鍵決策中發(fā)揮作用。 數(shù)據(jù)挖掘最直接的作用就是提升企業(yè)核心競(jìng)爭(zhēng)力,對(duì)所搜集到的信息利用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,有助于企業(yè)在關(guān)鍵領(lǐng)域建立獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)。應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠充分利用企業(yè)數(shù)據(jù)倉庫中的海量數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題,從而提高企業(yè)管理過程中決策的能力。 四、信息化建設(shè)的目標(biāo) 1、構(gòu)建一個(gè)全面的信息溝通平臺(tái) 實(shí)現(xiàn)網(wǎng)絡(luò)的高速互聯(lián)和全面覆蓋,使企業(yè)的各個(gè)部門把所有的信息在平臺(tái)上進(jìn)行共享,既提高了工作效率,又提供了決策的依據(jù)。 2、提高企業(yè)信息化價(jià)值 企業(yè)信息化建設(shè)的深入應(yīng)圍繞著如何降低成本、提高利潤(rùn)這一主線開展。在企業(yè)全員中推,讓大家都有一個(gè)明確的目標(biāo),通過企業(yè)信息化的應(yīng)用讓效果公開化,通過績(jī)效管理的配合切實(shí)的在企業(yè)中貫徹起來。 3、完善企業(yè)信息化機(jī)制 不管是完善管理制度還是提高工作效率,企業(yè)都應(yīng)該納入規(guī)范管理的軌道,這才是企業(yè)全面管理的基礎(chǔ)。 4、利用企業(yè)信息化為領(lǐng)導(dǎo)層提供決策依據(jù) 企業(yè)需要發(fā)現(xiàn)問題并解決問題,但更需要預(yù)防問題。通過企業(yè)信息化系統(tǒng)的建立,將企業(yè)存在的問題以數(shù)據(jù)的形式反映出來,為領(lǐng)導(dǎo)層的決策提供有力的依據(jù)。 5、知識(shí)管理 建立企業(yè)以及部門、崗位的專業(yè)知識(shí)體系,全力推動(dòng)知識(shí)資源的形成、儲(chǔ)存、共享、交流及應(yīng)用;知識(shí)管理可以使企業(yè)全員貢獻(xiàn)和分享自己所掌握的專業(yè)知識(shí)從而積少成多,聚沙成塔。創(chuàng)建企業(yè)知識(shí)地圖,將知識(shí)和人有效的聯(lián)系起來,提高大家獲取知識(shí)的效率,使大家能清晰了解企業(yè)知識(shí)分布狀況。最終達(dá)到擁有企業(yè)創(chuàng)新能力的“學(xué)習(xí)型”組織。隨著數(shù)據(jù)信息的增多,人們?yōu)榱四軌蛟诤棋绾5臄?shù)據(jù)信息中以最少的時(shí)間找到自己想要的數(shù)據(jù),并提高數(shù)據(jù)信息的利用率,就要應(yīng)用數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)可以讓人們更加便利的進(jìn)行信息提取,為各個(gè)領(lǐng)域平臺(tái)提供有價(jià)值的數(shù)據(jù)信息,以促進(jìn)企業(yè)的發(fā)展。信息化建設(shè)的進(jìn)一步發(fā)展,積累在數(shù)據(jù)庫中的信息量快速增加,都要求數(shù)據(jù)挖掘在管理領(lǐng)域的應(yīng)用以及管理數(shù)據(jù)資源的挖掘逐步完善起來。 參考
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年瑞幸考試試題及答案
- 2025年雙奧之城面試題及答案
- 2025年單招面試題及答案云南
- 2025年助產(chǎn)技術(shù)理論考試題及答案
- 2025年文化項(xiàng)目面試試題及答案
- 2025年工廠檢驗(yàn)考試題及答案
- 2025年初中專業(yè)知識(shí)試題及答案
- 2025年期中統(tǒng)計(jì)學(xué)試題及答案
- 2025年糖栗子趣味測(cè)試題及答案
- 2025年幼兒教師大賽試題及答案
- 自動(dòng)販賣機(jī)方案
- 《莖和葉》名師課件
- 電網(wǎng)公司QC小組太陽能光伏發(fā)電降溫增效裝置的研制
- 混流式水輪發(fā)電機(jī)組導(dǎo)水機(jī)構(gòu)A級(jí)檢修作業(yè)指導(dǎo)書
- GB/T 15622-2023液壓缸試驗(yàn)方法
- 110kV升壓站構(gòu)支架組立施工方案
- 2014年林產(chǎn)化工松香深加工行業(yè)分析報(bào)告
- 前廳月工作計(jì)劃
- wav2lip-288的預(yù)訓(xùn)練模型
- 2023機(jī)場(chǎng)海關(guān)旅檢崗位練兵練習(xí)試題及答案
- 沉淀滴定法-沉淀滴定法原理
評(píng)論
0/150
提交評(píng)論