數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究可復(fù)制黏貼 優(yōu)秀畢業(yè)論文.pdf_第1頁
數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究可復(fù)制黏貼 優(yōu)秀畢業(yè)論文.pdf_第2頁
數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究可復(fù)制黏貼 優(yōu)秀畢業(yè)論文.pdf_第3頁
數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究可復(fù)制黏貼 優(yōu)秀畢業(yè)論文.pdf_第4頁
數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究可復(fù)制黏貼 優(yōu)秀畢業(yè)論文.pdf_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

揚(yáng)州大學(xué) 碩士學(xué)位論文 數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 姓名:朱錫亮 申請學(xué)位級別:碩士 專業(yè):計(jì)算機(jī)技術(shù) 指導(dǎo)教師:李斌 20100401 摘要 高校的固定資產(chǎn)是教學(xué)、科研、生活后勤及產(chǎn)業(yè)的物資保障。隨著高校固定 資產(chǎn)規(guī)模的擴(kuò)大,固定資產(chǎn)管理也處在不斷的改進(jìn)之中,管理模式由原來的手工 管理發(fā)展到現(xiàn)在的計(jì)算機(jī)輔助管理。近年來由于學(xué)校合并使得學(xué)校分區(qū)辦校、校 區(qū)分散,同時學(xué)校的學(xué)科體系調(diào)整較大,固定資產(chǎn)的變動較大,再則隨著政府投 資力度的加大以及科研經(jīng)費(fèi)的增多,使得學(xué)校固定資產(chǎn)尤其是儀器設(shè)備急劇增加, j 天i 而在固定資產(chǎn)管理巾常常需露處理大帚的數(shù)據(jù)信鼠。另外,隨著學(xué)校宴聆室的 開放,教學(xué)、科研j :俸罾與對外交演的增加,裁j 泉越多的校內(nèi)外師牛與研究人員 希犖了解學(xué)校教學(xué)、科研儀器設(shè)備的簡萼情況,為教學(xué)科研j :作提供幫助,從而 對學(xué)校的鼴備資產(chǎn)信息共享提 f 了r 益迫切的要求。 高校的快速發(fā)展促使學(xué)校內(nèi)部收集了大爺?shù)臄?shù)據(jù),并臣迫切需要將這些數(shù)據(jù) 轉(zhuǎn)攙成有用的信鼠和資料,為資產(chǎn)的管理提供有效的僳障,本文筑數(shù)據(jù)挖掘技術(shù) t l 次簧樹學(xué)習(xí)算法運(yùn)甩于資產(chǎn)的優(yōu)佬管理分配闖疆進(jìn)行了探過。 第一郭分概述了高校資產(chǎn)管理漯題研究的意義及當(dāng)前國內(nèi)外研究的現(xiàn)狀,并 簡耍評述了我國高校資產(chǎn)管琿的現(xiàn)狀;第_ 挪分描述了數(shù)據(jù)摻掘技術(shù):第二三部分 對圃定資產(chǎn)爺理系統(tǒng)進(jìn)行需要分析,設(shè)計(jì)并寞琨了固定資產(chǎn)管理系統(tǒng);第網(wǎng)郝分 對圈j 量資產(chǎn)鎊理的資產(chǎn)熬擺進(jìn)行頂處理描述了決筐樹算滲硬在馥棱資產(chǎn)簿理的 應(yīng)用。 關(guān)鍵詞:數(shù)據(jù)挖掘;資產(chǎn)管理;管理信息系統(tǒng);決策樹算法 a b s t r a c t t h ef i x e da s s e t so fu n i v e r s i t ya r et h em a t e r i a ls u p p o r to ft e a c h i n g , s c i e n t i f i c r e s e a r c h , l o g i s t i c sa n di n d u s t r i a ll i f e w i t ht h ee x p a n s i o no ft h es c a l eo ff i x e da s s e t s , i t s m a n a g e m e n ti sa l s oi nc o n t i n u o u si m p r o v e m e n t ,a n dt h em a n a g e m e n tm o d e li sf r o mt h e m a n u a lt ot h ec o m p u t e r - a i d e dm a n a g e m e n t ,i nr e c e n ty e a r s , t h es c h o o lm e r g e rm a k e s t h ec a m p u ss c a t t e r e da n dd i s c i p l i n a r ys y s t e ma d j u s tm o r e m e a n w h i l e , t h eg o v e r n m e n t i n c r e a s e st h ei n v e s t m e n ta n dt h er e s e a r c hf u n d i n gs ot h a ts c h o o l e q u i p m e n th a s i n c r e a s e ds h a r p l y , a n dag r e a td e a lo fd a t an e e d sa n a l y z i n g i na d d i t i o n , w i t ht h e o p e n i n go fs c h o o ll a b o r a t o r i e sa n dt h ei n c r e a s i n go ft h ee x c h a n g ei nt e a c h i n g , r e s e a r c h a n d 謝t hf o r e i g nc o u n t r i e s , m o r ea n dm o r et e a c h e r s , s t u d e n t sa n dr e s e a r c h e r sh o p et o u n d e r s t a n dt h et e a c h i n ga n ds c i e n t i f i cr e s e a r c he q u i p m e n tt op r o v i d eh e l pf o rr e s e a r c h a n du r g e n td e m a n d sf o rs h a r i n gi n f o r m a t i o n t h er a p i dd e v e l o p m e n to fu n i v e r s i t i e sp r o m o t e st h ec o l l e c t i o no fag r e a td e a lo f d a t aa n du r g e n t l yn e e dt oc o n v e r tt h e s ed a t ai n t ou s e f u li n f o r m a t i o ns oa st os e c u r ef o r a s s e tm a n a g e m e n t t h i sp a p e rd i s c u s s e st h ed a t am i n i n gt e c h n o l o g yu s e di nt h ed e c i s i o n t r e ei nl e a r n i n ga l g o r i t h mf o ro p t i m mm a n a g e m e n to fd i s t r i b u t i o na s s e t s t h ef i r s tp a r to u t l i n e st h es i g n i f i c a n c eo fa s s e tm a n a g e m e n ta tu n i v e r s i t i e sa n dt h e c u r r e n ts t a t u so f d o m e s t i ca n df o r e i g nr e s e a r c h , a n db r i e f l yr e v i e w st h es t a t u so fa s s e t m a n a g e m e n ti nc h i n e s eu n i v e r s i t i e s t h es e c o n dp a r td e s c r i b e st h ed a t am i n i n g t h e t h i r dp a r tm a k e sa n a l y s i s0 1 1t h ef i x e da s s e t sm a n a g e m e n ts y s t e m , d e s i g n sa n d i m p l e m e n t st h e f i x e da s s e t s m a n a g e m e n ts y s t e m t h e f o u r t h p a r t m a k e sa p r e p r o c e s s i n gt ot h ef i x e da s s e td a t am a n a g e m e n t ,a n dd e s c r i b e st h ed e c i s i o nt r e e a l g o r i t h ma n da s s e tm a n a g e m e n ti nt h ea p p l i c a t i o no f o u rs c h 0 0 1 k e y w o r d s :d a t am i n i n g ;a s s e tm a n a g e m e n t ;m a n a g e m e n ti n f o r m a t i o ns y s t e m s ;d e c i s i o n t r e ea l g o r i t h m 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 8 3 揚(yáng)州大學(xué)學(xué)位論文原創(chuàng)性聲明和版權(quán)使用授權(quán)書 學(xué)位論文原創(chuàng)性聲明 本人聲明:所呈交的學(xué)位論文是在導(dǎo)師指導(dǎo)下獨(dú)立進(jìn)行研究工作所取得的研 究成果。除文中已經(jīng)標(biāo)明引用的內(nèi)容外,本論文不包含其他個人或集體己經(jīng)發(fā)表 的研究成果。對本文的研究做出貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。 本聲明的法律結(jié)果由本人承擔(dān)。 學(xué)位論文作者簽名: 簽字日期:年月 日 學(xué)位論文版權(quán)使用授權(quán)書 本人完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留并向 國家有關(guān)部門或機(jī)構(gòu)送交學(xué)位論文的復(fù)印件和電子文檔,允許論文被查閱和借閱。 本人授權(quán)揚(yáng)州大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索, 可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。同時授權(quán)中國科學(xué) 技術(shù)信息研究所將本學(xué)位論文收錄到中國學(xué)位論文全文數(shù)據(jù)庫 ,并通過網(wǎng)絡(luò)向 社會公眾提供信息服務(wù) 學(xué)位論文作者簽名:導(dǎo)師簽名: 簽字日期:年月日簽字日期:年月日 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 第1 章引言 隨著經(jīng)濟(jì)全球化進(jìn)程的加速和高等教育的大眾化,教育越來越成為人們關(guān)注 的焦點(diǎn),高??冃降奶岣邔?jīng)濟(jì)和文化的基礎(chǔ)作用日益顯著。隨著國家公共 財(cái)政體制改革的進(jìn)行,市場經(jīng)濟(jì)體條件下所有權(quán)和經(jīng)營權(quán)的分離,經(jīng)過大量的理 論研究和實(shí)踐探索,我國國有資產(chǎn)管理理論基本確立,傳統(tǒng)的資產(chǎn)管理已經(jīng)不能 適應(yīng)實(shí)際需要,在管理工作中存在著體制不順、配置不公、產(chǎn)權(quán)不清、監(jiān)管不嚴(yán)、 隱性流失的問題。研究高校資產(chǎn)管理問題,建立健全資產(chǎn)管理體制,創(chuàng)新資產(chǎn)管 理模式,探索現(xiàn)代化的管理方式,成為高校財(cái)務(wù)管理的重要課題。 1 1 研究背景 目前,各普通高職校都經(jīng)歷著教育部的校區(qū)合并重組工作,在固定資產(chǎn)的管 理過程中存在著諸多實(shí)際問題由于我國高校大部分是公辦性質(zhì),屬于事業(yè)單位 管理體制,高校的固定資產(chǎn)主要通過國家財(cái)政投資建設(shè)而成。長期以來高校無償 地使用固定資產(chǎn),不計(jì)提固定資產(chǎn)折舊也不需要進(jìn)行成本核算導(dǎo)致了部分高 校、職業(yè)院校負(fù)責(zé)人對財(cái)務(wù)管理特別是固定資產(chǎn)管理和教育成本核算的重要性認(rèn) 識不足;其次,不少高校領(lǐng)導(dǎo)忙于學(xué)校的教學(xué)、科研和行政工作。忽視了高校固定 資產(chǎn)管理工作,導(dǎo)致高校固定資產(chǎn)管理機(jī)制不健全、管理手段落后、管理工作缺 乏科學(xué)性從而造成高校普遍存在著重錢輕物、重購建輕管理、公物私用、重復(fù) 建設(shè)、資源浪費(fèi)的現(xiàn)象。使固定資產(chǎn)難以發(fā)揮其在高校教學(xué)科研中應(yīng)有的作用, 影響了學(xué)校的可持續(xù)發(fā)展。在我國,國有資產(chǎn)流失不僅是國有企業(yè)存在的個重大 問題,在高校中也有類似現(xiàn)象特別是隨著近幾年高校擴(kuò)招,辦學(xué)規(guī)模的不斷擴(kuò) 大,使得這一闖題變得越來越嚴(yán)重。 2揚(yáng)州大學(xué)碩士學(xué)位論文 由于固定資產(chǎn)管理體制沒有理順管理制度不完善和執(zhí)行監(jiān)督不力,高校固 定資產(chǎn)流失狀況令人擔(dān)憂。某些部門對轉(zhuǎn)為經(jīng)營性資產(chǎn)的固定資產(chǎn)不按有關(guān)規(guī)定 進(jìn)行評估檢查,對出租、出借、轉(zhuǎn)讓的固定資產(chǎn)不按規(guī)定辦理資產(chǎn)出租、出借、 轉(zhuǎn)人手續(xù),甚至也不收取使用費(fèi)用,使得固定資產(chǎn)被經(jīng)營單位無償占有和使用, 高校資產(chǎn)投入得不到合理的補(bǔ)償,資產(chǎn)的安全性、完整性也得不到保證,更談不 上資產(chǎn)的保值增值,造成國有資產(chǎn)的流失。目前,大部分高校對固定資產(chǎn)管理實(shí) 行的是以賬物分管為原則的分類歸口管理模式。如后勤管理部門管理房屋、建筑 物;圖書館管理圖書雜志;設(shè)備處管理設(shè)備器:財(cái)務(wù)處負(fù)責(zé)固定資產(chǎn)價值核算。 而各職能部門又分別歸不同學(xué)校領(lǐng)導(dǎo)分管,學(xué)校的固定資產(chǎn)管理缺乏個統(tǒng)一領(lǐng) 導(dǎo)、統(tǒng)一管理、權(quán)力集中的綜合監(jiān)督協(xié)調(diào)部門,造成固定資產(chǎn)實(shí)物流動與財(cái)務(wù)核 算相脫節(jié),職能管理部門與各教學(xué)、科研等占有使用部門相分離的狀態(tài)。這種條 塊分割的管理模式晟終導(dǎo)致高校固定資產(chǎn)普遍存在賬實(shí)不符、家底不清、資源 浪費(fèi)、資產(chǎn)流失等問題。目前我國大部分高校仍用收付實(shí)現(xiàn)制會計(jì)核算方法, 在固定資產(chǎn)核算中還存在著一些不合理的地方,造成高校財(cái)務(wù)報表中普遍存在著 虛增資產(chǎn)、成本核算不真、資產(chǎn)更新資金不足等問題。根據(jù)高等學(xué)校會計(jì)制度規(guī) 定,固定資產(chǎn)只核算原值,不計(jì)提折1 日。固定資產(chǎn)的賬面價值除了清理報廢外, 入賬后數(shù)據(jù)一直不變。由于固定資產(chǎn)的賬面價值只反映歷史成本,使固定資產(chǎn)的 賬面價值與實(shí)際價值相背離。并使資產(chǎn)負(fù)債表中的賬面余額不能反映其客觀情況, 從而導(dǎo)致虛增凈資產(chǎn)。這種會計(jì)核算方法既違背了會計(jì)核算的配比原則也違背 了會計(jì)核算的真實(shí)性原則。 二十世紀(jì),數(shù)據(jù)庫技術(shù)取得了決定性的成果并且已經(jīng)得到廣泛的應(yīng)用。這表 明,我們已具備將這些“數(shù)據(jù)洪流 轉(zhuǎn)換為“整齊有序捧但卻“堆積如山打數(shù)據(jù) 集合的能力。但是,面對“堆積如山露的數(shù)據(jù)集合,數(shù)據(jù)庫所能做到的只是對數(shù) 據(jù)庫中己有的數(shù)據(jù)進(jìn)行存取和簡單的操作,通過這些數(shù)據(jù)所獲得的信息量僅僅是 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 整個數(shù)據(jù)庫中信息量的很少一部分,隱藏在這些數(shù)據(jù)之后的關(guān)于這些數(shù)據(jù)的更重 要的整體特征的描述及對其發(fā)展趨勢預(yù)測的信息卻無法得到,而這些信息在決定 制定過程中具有重要的參考價值。在需要對大量數(shù)據(jù)分析之后才能做出正確決策 的領(lǐng)域中,這己是普遍存在的問題。這樣,快速的數(shù)據(jù)產(chǎn)生與搜索技術(shù)和拙劣的 數(shù)據(jù)分析方法之間形成了鮮明的對照,需要新的技術(shù)來“智能地 和“自動地 分析這些原始數(shù)據(jù),面對這一挑戰(zhàn),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并顯示出強(qiáng)大的生 命力。數(shù)據(jù)挖掘技術(shù)可以高度自動地和智能地分析原有的數(shù)據(jù),從大量的數(shù)據(jù)中 發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)問的關(guān)系,從中挖掘出潛在的模式獲取有意義的信 息,歸納出有用的結(jié)構(gòu),幫助決策者做出正確的決策,它通常采用機(jī)器自動識別 的方式,不需要更多的人工干預(yù),是目前國際上在數(shù)據(jù)庫、數(shù)據(jù)倉庫和信息決策 領(lǐng)域最前沿的研究方向之一,也是計(jì)算機(jī)科學(xué)和技術(shù)應(yīng)用的一大研究熱點(diǎn)。如今, 越來越多的研究投向了數(shù)據(jù)挖掘。在現(xiàn)有技術(shù)中,數(shù)據(jù)挖掘主要應(yīng)用于科學(xué)研究、 市場營銷、金融投資、真假甄別、產(chǎn)品制造、通信網(wǎng)絡(luò)管理以及i n t e m e t 應(yīng)用等方 面。從以上應(yīng)用來看,數(shù)據(jù)挖掘的研究主要是面向商業(yè)應(yīng)用尤其是電子商務(wù)的, 很少應(yīng)用于非商業(yè)機(jī)構(gòu),尤其是與校園信息網(wǎng)的結(jié)合還不夠廣泛。本課題將數(shù)據(jù) 挖掘技術(shù)應(yīng)用到固定資產(chǎn)管理系統(tǒng)中 1 2 主要研究現(xiàn)狀 由于歷史原因,學(xué)校的數(shù)據(jù)庫不少是分布、異構(gòu)的。大量信息必須通過數(shù)據(jù) 庫系統(tǒng)才能有效管理。那么,如何建立合理高效的數(shù)據(jù)庫,成為我校迫切需要解 決的問題。 而數(shù)據(jù)倉庫【1 捌和數(shù)據(jù)挖掘技術(shù)1 3 川正好為上述問題提供了一種很好的解決方 法【”l ,我們可以用資產(chǎn)數(shù)據(jù)系統(tǒng)中的各種類型數(shù)據(jù)集中建立起資產(chǎn)數(shù)據(jù)倉庫 4 揚(yáng)州大學(xué)碩士學(xué)位論文 ( d w s ) ,主管部門的人員可以通過聯(lián)機(jī)分析( o l a p ) o o - 1 3 1 中靈活多變的多維分 析查詢,從不同角度分析整個校區(qū)的資產(chǎn)情況,預(yù)測未來的資產(chǎn)出入情況;監(jiān)察 人員通過報表( r e p o r t i n g ) 工具獲得其需要的報表。資產(chǎn)管理各個部門通過數(shù)據(jù) 倉庫和數(shù)據(jù)挖掘技術(shù),以真正實(shí)現(xiàn)數(shù)據(jù)的共享,實(shí)現(xiàn)全面有效的分析和預(yù)測。 1 。3 研究的主要內(nèi)容 本文研究工作的目的是以學(xué)校固定資產(chǎn)數(shù)據(jù)為分析對象,采用已有數(shù)據(jù)挖掘 算法進(jìn)行適應(yīng)性研究開發(fā),并為今后的研究工作打下舉實(shí)的基礎(chǔ),我們將在以下 幾方面開展具體工作: ( 1 ) 對學(xué)?,F(xiàn)有固定資產(chǎn)管理系統(tǒng)相關(guān)數(shù)據(jù)進(jìn)行集成,并進(jìn)行必要的預(yù)處理, 形成用于挖掘的數(shù)據(jù)倉庫系統(tǒng)。 ( 2 ) 剖析固定資產(chǎn)管理系統(tǒng)相關(guān)數(shù)據(jù)可能挖掘的知識【1 4 1 。 ( 3 ) 重點(diǎn)探討決策樹i d 3 1 1 5 - 2 0 ! 算法,以及對資產(chǎn)分類、資產(chǎn)采購、資產(chǎn)折舊、 資產(chǎn)報損等各項(xiàng)特征等給出分析結(jié)果,對資產(chǎn)管理部門與學(xué)校主管部門給予輔助 性決策。 1 4 論文組織結(jié)構(gòu) 論文以下章節(jié)的組織結(jié)構(gòu)如下: 第一章,引言。首先介紹了本文的課題背景,闡述了本課題的研究目的以及 意義,然后簡單介紹了本課題研究的主要內(nèi)容,以及本文的組織結(jié)構(gòu)。 第二章,基本理論。本章主要介紹數(shù)據(jù)倉庫以及數(shù)據(jù)挖掘技術(shù)技術(shù),包含數(shù) 據(jù)倉庫概念,數(shù)據(jù)倉庫的組成,數(shù)據(jù)挖掘的方法與步驟等。 第三章,對固定資產(chǎn)管理系統(tǒng)進(jìn)行需要分析以及總體框架設(shè)計(jì)。 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 5 第四章,固定資產(chǎn)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),構(gòu)建具體功能,分析其功能與操 作流程。 第五章,固定資產(chǎn)管理系統(tǒng)的數(shù)據(jù)預(yù)處理分析,合理構(gòu)建數(shù)據(jù)倉庫。 第六章,探討決策樹i d 3 算法在固定資產(chǎn)管理中的應(yīng)用。 第七章,總結(jié)與未來的工作。介紹本文討論的主要成果,以及未來的研究方 向。 6揚(yáng)州大學(xué)碩士學(xué)位論文 第二章相關(guān)理論技術(shù) 本章主要討論數(shù)據(jù)倉庫的理論知識,包括數(shù)據(jù)倉庫的定義1 2 1 捌、數(shù)據(jù)倉庫( d a t a w a r e h o u s e ) 與數(shù)據(jù)庫( d a t a b a s e ) 的區(qū)別、數(shù)據(jù)倉庫的組成、數(shù)據(jù)倉庫的設(shè)計(jì)方 法,數(shù)據(jù)倉庫的建立步驟等相關(guān)理論。 2 1 數(shù)據(jù)倉庫 2 1 1 數(shù)據(jù)倉庫的定義 自從數(shù)據(jù)倉庫口1 1 概念出現(xiàn)以來,不同學(xué)者從不同的角度為數(shù)據(jù)倉庫下了不同 的定義。h f o r m i x 公司的定義:數(shù)據(jù)倉庫將分布在企業(yè)網(wǎng)絡(luò)中不同信息島上的業(yè)務(wù) 數(shù)據(jù)集成到一起,存儲在一個單一的集成關(guān)系型數(shù)據(jù)庫1 2 2 倒中,利用這種集成信 息,可方便用戶對信息的訪問,更可使決策人員對一段時間內(nèi)的歷史數(shù)據(jù)進(jìn)行分 析,研究事務(wù)發(fā)展走勢。 s a s 軟件研究所的定義:數(shù)據(jù)倉庫是一種管理技術(shù),旨在通過通暢、合理、全 面的信息管理,達(dá)到有效的決策支持。 斯坦福大學(xué)數(shù)據(jù)倉庫研究小組的定義:數(shù)據(jù)倉庫是集成信息的存儲中心,這 些信息可用于查詢或分析。數(shù)據(jù)倉庫公司r e d b r i c k s y s t e m 的定義是:數(shù)據(jù)倉庫是特 別為信息檢索而設(shè)計(jì)的關(guān)系數(shù)據(jù)庫管理系統(tǒng)。 我國著名數(shù)據(jù)庫專家王珊將其定義為:數(shù)據(jù)倉庫是一個用以更好地支持企業(yè) 或組織的決策分析處理的、面向主題的、集成的、不可更新的、隨時間不斷變化 的數(shù)據(jù)集合。 目前,大家公認(rèn)的數(shù)據(jù)倉庫之父w h 1 n m o n 在1 9 9 2 年所著( b u i l d i n gt h e d a t a w a r e h o u s e 書中對數(shù)據(jù)倉庫的定義最具權(quán)威性,他認(rèn)為數(shù)據(jù)倉庫是一個面向 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 7 主題的( s u b j e c to r i e n t e d ) 、集成的( i n t e g r a t e d ) 、非易失的( n o n v o l a t ij e ) h 隨時間變化 ( t i m e - - v a r i a n t ) 的數(shù)據(jù)集合,用來支持管理人員的決策分析。對于數(shù)據(jù)倉庫的概念 我們可以從兩個層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù) 處理。它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù) 源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉 庫中的數(shù)據(jù)一般不再修改。 隨著入們對數(shù)據(jù)系統(tǒng)研究、管理、維護(hù)等方面的深刻識認(rèn)和不斷完善,在總 結(jié)、豐富、集中多行企業(yè)信息的經(jīng)驗(yàn)之后,為數(shù)據(jù)倉庫給出了更為精確的定義, 即“數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時間相關(guān)的、不可 修改的數(shù)據(jù)集合”。數(shù)據(jù)倉庫并沒有嚴(yán)格的數(shù)據(jù)理論基礎(chǔ),也沒有成熟的基本模式, 且更偏向于工程,具有強(qiáng)烈的工程性。通常按其關(guān)鍵技術(shù)分為數(shù)據(jù)的抽取、存儲 與管理以及數(shù)據(jù)的表現(xiàn)等三個基本方面。 數(shù)據(jù)倉庫的重點(diǎn)與要求是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng) 過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。數(shù)據(jù)倉庫主要是應(yīng) 用于決策支持系統(tǒng),其主要目的是“提取 信息并加以擴(kuò)展,用來進(jìn)行處理基于 數(shù)據(jù)倉庫的決策支持系統(tǒng)( o s s ) 的應(yīng)用。 2 1 2 數(shù)據(jù)倉庫的特征 從w h i n m o n 對數(shù)據(jù)倉庫的定義中,我們可以發(fā)現(xiàn)數(shù)據(jù)倉庫具有這樣一些重要 的特征:面向主題性、集成性、時變性、非易失性、集合性。 1 面向主題性 面向主題性是數(shù)據(jù)倉庫中數(shù)據(jù)組織的基本原則,數(shù)據(jù)倉庫中的所有圍繞著某 一主題組織、展開的。主題是與傳統(tǒng)數(shù)據(jù)庫的面向應(yīng)用相對應(yīng)的,是一個抽象的 8揚(yáng)州大學(xué)碩士學(xué)位論文 概念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合歸類并進(jìn)行分析利用的抽象。 在邏輯意義上,它是對應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象。從信息管 理角度看,主題就是在一個較高的管理層次上對信息系統(tǒng)中的數(shù)據(jù)按照某一具體 的管理對象進(jìn)行綜合、歸類所形成的分析對象。 2 集成性 數(shù)據(jù)倉庫的集成性是指根據(jù)決策分析的要求,將分散于各處的源數(shù)據(jù)進(jìn)行抽 取、篩選、清理、綜合等集成工作,使數(shù)據(jù)倉庫中的數(shù)據(jù)具有集成性。數(shù)據(jù)倉庫 所需要的數(shù)據(jù)通常來源于不同的數(shù)據(jù)源( 如關(guān)系數(shù)據(jù)庫、一般文件和聯(lián)機(jī)事務(wù)處理 記錄) ,這些數(shù)據(jù)只為業(yè)務(wù)的日常處理服務(wù),而不是為決策分析服務(wù)。所以,首先 要從源數(shù)據(jù)庫中挑選出數(shù)據(jù)倉庫所需要的數(shù)據(jù),將這些數(shù)據(jù)按照標(biāo)準(zhǔn)進(jìn)行統(tǒng)一, 確保命名約定。編碼結(jié)構(gòu)。屬性度量的一致性,然后在將原始數(shù)據(jù)結(jié)構(gòu)做一個從 面向應(yīng)用向面向主題的轉(zhuǎn)變。 3 非易失性 在數(shù)據(jù)倉庫中,數(shù)據(jù)是從事務(wù)操作型數(shù)據(jù)中抽取出來,反映段相當(dāng)長時間 內(nèi)的歷史數(shù)據(jù),是不同時間點(diǎn)的數(shù)據(jù)庫快照的集合,以及基于快照的統(tǒng)計(jì)、綜合 和重組。數(shù)據(jù)倉庫中的數(shù)據(jù)主要提供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要 是數(shù)據(jù)查詢,一旦數(shù)據(jù)迸入數(shù)據(jù)倉庫只要數(shù)據(jù)沒有超過數(shù)據(jù)倉庫的數(shù)據(jù)存儲期 限,一般不對數(shù)據(jù)進(jìn)行更新操作,只進(jìn)行查詢。 4 時變性 數(shù)據(jù)倉庫中的數(shù)據(jù)不可更新是針對應(yīng)用來說的,也即數(shù)據(jù)倉庫的用戶在進(jìn)行 分析處理時是不進(jìn)行數(shù)據(jù)更新操作的。但是,數(shù)據(jù)倉庫的數(shù)據(jù)是隨時間的變化而 不斷變似這一特征表現(xiàn)在以下三個方面: ( 1 ) 數(shù)據(jù)倉庫隨時問變化不斷增加新的數(shù)據(jù)內(nèi)容。 ( 2 ) 數(shù)據(jù)倉庫隨時問變化不斷刪除舊的數(shù)據(jù)內(nèi)容。 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 9 ( 3 ) 數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)中很多是與時間有關(guān), 并要隨時間的變化不斷地進(jìn)行重新綜合。 5 集合性 數(shù)據(jù)倉庫的集合性意味著數(shù)據(jù)倉庫必須以某種數(shù)據(jù)集合的形式存儲起來。目 前數(shù)據(jù)倉庫所采用的數(shù)據(jù)集合方式是以多維數(shù)據(jù)庫方式進(jìn)行存儲的多維模式,以 關(guān)系數(shù)據(jù)庫方式進(jìn)行存儲的關(guān)系模式或是以兩者結(jié)合的方式進(jìn)行存儲的混合模 扛 氏。 概言之,數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)集合,它是決策支持?jǐn)?shù)據(jù)模型的 物理實(shí)現(xiàn),并存放企業(yè)戰(zhàn)略決策所需信息。它也常常被看作決策支持系統(tǒng)的一種 體系結(jié)構(gòu),通過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一起,支持結(jié)構(gòu)化的和專門的查詢 與分析,支持決策過程。 1 0揚(yáng)州大學(xué)碩士學(xué)位論文 2 1 3 數(shù)據(jù)倉庫的體系結(jié)構(gòu) 數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)1 2 7 - 3 1 如圖2 1 所示。 外部數(shù)據(jù) i | 業(yè)務(wù)數(shù)據(jù) 日日日 陌司 i 應(yīng)用l l l 一 甸音圜 :數(shù)據(jù)集市: : 數(shù)據(jù)源 ;卜數(shù)據(jù)存儲于管理叫;- o u 心服務(wù)器一+ 前端工具 圖2 1 數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu) 1 中心數(shù)據(jù)倉庫 是整個數(shù)據(jù)倉庫系統(tǒng)的核心,是數(shù)據(jù)存放的地方。其突出的特點(diǎn)是對海量數(shù) 據(jù)的支持和快速的檢索技術(shù)。 2 。數(shù)據(jù)抽取工具 把數(shù)據(jù)從各種各樣的數(shù)據(jù)源,進(jìn)行必要的轉(zhuǎn)化、整理,再存放到數(shù)據(jù)倉庫內(nèi)。 對各種不同數(shù)據(jù)存儲方式的訪問能力是數(shù)據(jù)抽取工具 3 0 l 的關(guān)鍵,應(yīng)能生成c o b o l 程序、m v s 作業(yè)控制語言( i c l ) 、u n i x 腳本和s q l 語句等,以訪問不同的數(shù)據(jù)。 3 元數(shù)據(jù) 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 l l 元數(shù)據(jù)p 1 1 是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)??蓪⑵浒从猛镜?不同分為兩類,技術(shù)元數(shù)據(jù)和商業(yè)元數(shù)據(jù)。 技術(shù)元數(shù)據(jù)是數(shù)據(jù)倉庫的設(shè)計(jì)和管理人員用于開發(fā)和日常管理數(shù)據(jù)倉庫是用 的數(shù)據(jù)。包括:數(shù)據(jù)源信息;數(shù)據(jù)轉(zhuǎn)換的描述:數(shù)據(jù)倉庫內(nèi)對象和數(shù)據(jù)結(jié)構(gòu)的定 義;數(shù)據(jù)清理和數(shù)據(jù)更新時用的規(guī)則;源數(shù)據(jù)到目的數(shù)據(jù)的映射;用戶訪問權(quán)限, 數(shù)據(jù)備份歷史記錄,數(shù)據(jù)導(dǎo)入歷史記錄,信息發(fā)布?xì)v史記錄等。 商業(yè)元數(shù)據(jù)從商業(yè)業(yè)務(wù)的角度描述了數(shù)據(jù)倉庫中的數(shù)據(jù)。包括:業(yè)務(wù)主題的 描述,包含的數(shù)據(jù)、查詢、報表。 元數(shù)據(jù)為訪問數(shù)據(jù)倉庫提供了一個信息目錄( i n f o r m a t i o nd i r e c t o r y ) ,這個目 錄全面描述了數(shù)據(jù)倉庫中都有什么數(shù)據(jù)、這些數(shù)據(jù)怎么得到的、和怎么訪問這些 數(shù)據(jù)。是數(shù)據(jù)倉庫運(yùn)行和維護(hù)的中心,數(shù)據(jù)倉庫服務(wù)器利用他來存貯和更新數(shù)據(jù), 用戶通過他來了解和訪問數(shù)據(jù)。 4 數(shù)據(jù)倉庫分析工具 數(shù)據(jù)倉庫分析工具1 3 2 - 3 4 1 是為用戶分析數(shù)據(jù)倉庫中數(shù)據(jù)提供手段。主要有數(shù)據(jù) 查詢和報表工具、應(yīng)用開發(fā)工具、管理信息系統(tǒng)( e i s ) 工具、在線分析( o l a p ) 工具、數(shù)據(jù)挖掘工具等。 5 數(shù)據(jù)集市( d a t a m a r t s ) 為了特定的應(yīng)用目的或應(yīng)用范圍,而從數(shù)據(jù)倉庫中獨(dú)立出來的一部分?jǐn)?shù)據(jù), 也可稱為部門數(shù)據(jù)或主題數(shù)據(jù)( s u b j e c ta r e a ) 1 3 5 1 。在數(shù)據(jù)倉庫的實(shí)施過程中往往可 以從一個部門的數(shù)據(jù)集市著手,以后再用幾個數(shù)據(jù)集市組成一個完整的數(shù)據(jù)倉庫。 需要注意的就是再實(shí)施不同的數(shù)據(jù)集市時,同一含義的字段定義一定要相容,這 樣再以后實(shí)施數(shù)據(jù)倉庫時才不會造成大麻煩。 6 數(shù)據(jù)倉庫管理 數(shù)據(jù)倉庫管理主要包括安全和特權(quán)管理,跟蹤數(shù)據(jù)的更新,數(shù)據(jù)質(zhì)量檢查, 1 2揚(yáng)州大學(xué)碩士學(xué)位論文 管理和更新元數(shù)據(jù),審計(jì)和報告數(shù)據(jù)倉庫的使用和狀態(tài),刪除數(shù)據(jù),復(fù)制、分割 和分發(fā)數(shù)據(jù),備份和恢復(fù),存儲管理等功能。 7 信息發(fā)布系統(tǒng) 把數(shù)據(jù)倉庫中的數(shù)據(jù)或其他相關(guān)的數(shù)據(jù)發(fā)送給不同的地點(diǎn)或用戶。 2 1 4 數(shù)據(jù)倉庫的建立步驟 數(shù)據(jù)倉庫的設(shè)計(jì)是一個循環(huán)反復(fù)的過程,大體上可以分為以下幾個步驟: 1 概念模型設(shè)計(jì) a 界定系統(tǒng)邊界 雖然無法在數(shù)據(jù)倉庫設(shè)計(jì)的初期就得到詳細(xì)而明確的需求,但有些方向性的 需求需要解決,比如要做的決策類型有哪些,決策者感興趣的是什么問題,這些 問題需要什么樣的信息,要得到這些信息需要包含哪些數(shù)據(jù)源 b 確定主要的主題域及其內(nèi)容 要確定系統(tǒng)所包含的主題,即數(shù)據(jù)倉庫的分析對象,然后對每個主題的內(nèi)容 進(jìn)行較明確的描述,包括:確定主題及其屬性信息,確定主題的公共碼鍵,主題 間聯(lián)系及其屬性等等。 c o l a p 設(shè)計(jì) 根據(jù)用戶的分析處理要求,設(shè)計(jì)系統(tǒng)所采用的o l a p 數(shù)據(jù)模型,如:星型模 型、雪花模型、數(shù)據(jù)立方體1 3 6 1 等。 2 邏輯模型設(shè)計(jì) 本階段的任務(wù)主要是對每個當(dāng)前要裝載的主題的邏輯實(shí)現(xiàn)進(jìn)行定義,并將相 關(guān)內(nèi)容記錄在數(shù)據(jù)倉庫的元數(shù)據(jù)中。 由于目前的數(shù)據(jù)倉庫系統(tǒng)的實(shí)現(xiàn)般采用關(guān)系數(shù)據(jù)庫 3 7 1 系統(tǒng),所以數(shù)據(jù)倉庫 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 1 3 的邏輯設(shè)計(jì)就是將在概念設(shè)計(jì)階段得到的e r 圖轉(zhuǎn)換成關(guān)系模式。 3 物理模型設(shè)計(jì) 該階段的任務(wù)是確定數(shù)據(jù)倉庫中數(shù)據(jù)的存儲結(jié)構(gòu),確定索引策略,確定數(shù)據(jù) 存放位置,確定存儲分配。 4 數(shù)據(jù)倉庫生成 根據(jù)數(shù)據(jù)倉庫元數(shù)據(jù)中的定義信息,利用相關(guān)的數(shù)據(jù)抽取工具收取生成數(shù)據(jù) 倉庫中的數(shù)據(jù),并將其加載到數(shù)據(jù)倉庫中去;統(tǒng)計(jì)生成o l a p 數(shù)據(jù)。在這個階段, 可能也需要設(shè)計(jì)和編制一些數(shù)據(jù)抽取程序。 這一步的工作成果是:數(shù)據(jù)已經(jīng)裝載到數(shù)據(jù)倉庫中,可以在其上建立數(shù)據(jù)倉 庫的應(yīng)用,如o l a p 分析處理、數(shù)據(jù)挖掘、d s s 應(yīng)用等。 5 數(shù)據(jù)倉庫運(yùn)行與維護(hù) 這個階段的任務(wù)是建立數(shù)據(jù)倉庫的應(yīng)用,并在應(yīng)用過程中理解需求,改善和 完善系統(tǒng),維護(hù)數(shù)據(jù)倉庫中的數(shù)據(jù)。 由于數(shù)據(jù)倉庫主題的不穩(wěn)定性,因此數(shù)據(jù)倉庫系統(tǒng)的建立與使用有一個穩(wěn)定 的過程,在應(yīng)用過程中根據(jù)用戶的反饋信息來修改與完善數(shù)據(jù)倉庫的需求。 在系統(tǒng)的運(yùn)行過程中,隨著數(shù)據(jù)源中數(shù)據(jù)的不斷變化,需要通過數(shù)據(jù)刷新操 作來維護(hù)數(shù)據(jù)倉庫中數(shù)據(jù)的一致性,即重新生成數(shù)據(jù)倉庫中的數(shù)據(jù)。 2 2 數(shù)據(jù)挖掘技術(shù) 2 2 1 數(shù)據(jù)挖掘的定義 數(shù)挖掘( d a t a m i n i n g ) 3 羽,也叫數(shù)據(jù)開采,數(shù)據(jù)采掘等,就是從大量的、不完 全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事 先不知道的、但又是潛在有用的信息和知識的過程?,F(xiàn)存的信息系統(tǒng)的數(shù)據(jù)量非 1 4 揚(yáng)州大學(xué)碩士學(xué)位論文 常大,而其中真正有價值的信息卻很少,因此從大量的數(shù)據(jù)中經(jīng)過深層分析,獲 得有利于業(yè)務(wù)運(yùn)作、提高競爭力的信息。這種新式的信息處理技術(shù),可以按既定 業(yè)務(wù)目標(biāo),對大量的數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證己知的規(guī) 律性,并進(jìn)一步將其模型化。 在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫管理系統(tǒng)的查詢、檢索及報表功能,與 多維分析、統(tǒng)計(jì)分析方法相結(jié)合,進(jìn)行聯(lián)機(jī)分析處理( o l a p ) ,從而得出可供決策 參考的統(tǒng)計(jì)分析數(shù)據(jù)。在深層次上,則從數(shù)據(jù)庫中發(fā)現(xiàn)前所未有的、隱含的知識。 o l a p 的出現(xiàn)早于數(shù)據(jù)挖掘,它們都是從數(shù)據(jù)庫中抽取有用信息的方法,就決策支 持的需要而言兩者是相輔相成的。 數(shù)據(jù)挖掘基于的數(shù)據(jù)庫類型主要有:關(guān)系型數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、事務(wù) 數(shù)據(jù)庫、演繹數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、主動數(shù)據(jù)庫、空間數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、 文本型、i n t e r n e t 信息庫以及薪興的數(shù)據(jù)倉庫( d a t a w a r e h a u s e ) 等。而挖掘后獲得的 知識包括關(guān)聯(lián)規(guī)則、特征規(guī)則、區(qū)分規(guī)則、分類規(guī)則、總結(jié)規(guī)則、偏差規(guī)則、聚 類規(guī)則、模式分析及趨勢分析等。 數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提 升到從數(shù)據(jù)中挖掘知識,提供決策支持。隨著d 1 m 研究逐步走向深入,數(shù)據(jù)挖 掘和知識發(fā)現(xiàn)的研究已經(jīng)形成了三根強(qiáng)大的技術(shù)支柱:數(shù)據(jù)庫、人工智能和數(shù)理 統(tǒng)計(jì)。 2 2 2 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別 數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析( 如查詢、報表、聯(lián)機(jī)應(yīng)用分析o l a p ) 的本質(zhì)區(qū)別 是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到 的信息應(yīng)具有先前未知,有效和可實(shí)用三個特征。先前未知的信息是指該信息是 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究1 5 預(yù)先未曾預(yù)料到的,即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚 至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。最 典型的案例就是通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系。 數(shù)據(jù)挖掘和o l a p 是完全不同的工具,所基于的技術(shù)也大相徑庭。o l a p 是決 策支持領(lǐng)域的一部分。傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么 ( w h a t h a p p e n c x l ) ,o l a p 則更迸一步告訴你下一步會怎么樣( w h a t n e x t ) 、和如果我采 取這樣的措施又會怎么樣f w h a t i f ) 。用戶首先建立一個假設(shè),然后用o l a p 檢索數(shù) 據(jù)庫來驗(yàn)證這個假設(shè)是否正確,數(shù)據(jù)挖掘與o l a p 不同的地方是,數(shù)據(jù)挖掘不是用 于驗(yàn)證某個假定的模式( 模型) 的正確性,而是在數(shù)據(jù)庫中自己尋找模型。它在本質(zhì) 上是一個歸納的過程。 數(shù)據(jù)挖掘和o l a p 具有一定的互補(bǔ)性。在利用數(shù)據(jù)挖掘出來的結(jié)論采取行動之 前,你也許要驗(yàn)證一下如果采取這樣的行動會給公司帶來什么樣的影響,那么 o l a p 工具能回答你的這些問題。而且在知識發(fā)現(xiàn)的早期階段,o l a p 工具還有其 他一些用途??梢詭湍闾剿鲾?shù)據(jù),找到哪些是對一個問題比較重要的變量,發(fā)現(xiàn) 異常數(shù)據(jù)和互相影響的變量。這都能幫你更好的理解你的數(shù)據(jù),加快知識發(fā)現(xiàn)的 過程。 2 2 3 數(shù)據(jù)挖掘的特點(diǎn) 數(shù)據(jù)挖掘技術(shù)具有以下特點(diǎn): 1 處理的數(shù)據(jù)規(guī)模十分龐大,達(dá)到g b 、t b 數(shù)量級,甚至更大。 2 查詢一般是決策制定者( 用戶) 提出的即時隨機(jī)查詢,往往不能形成精確的 查詢要求,需要靠系統(tǒng)本身尋找其可能感興趣的東西。 3 在一些應(yīng)用中,由于數(shù)據(jù)變化迅速,因此要求數(shù)據(jù)挖掘能快速做出相應(yīng)反 1 6揚(yáng)州大學(xué)碩士學(xué)位論文 應(yīng)以隨時提供決策支持。 4 數(shù)據(jù)挖掘中,規(guī)則的發(fā)現(xiàn)基于統(tǒng)計(jì)規(guī)律。因此,所發(fā)現(xiàn)的規(guī)則不必適用于 所有數(shù)據(jù),麗是當(dāng)達(dá)到某一臨界值時,即認(rèn)為有效。因此,利用數(shù)據(jù)挖掘技術(shù)可 能會發(fā)現(xiàn)大量的規(guī)則。 5 數(shù)據(jù)挖掘所發(fā)現(xiàn)的規(guī)則是動態(tài)的,它只反映了當(dāng)前狀態(tài)的數(shù)據(jù)庫具有的規(guī) 則,隨著不斷地向數(shù)據(jù)庫中加入新數(shù)據(jù),需要隨時對其進(jìn)行更新。 2 2 4 描述型數(shù)據(jù)挖掘 1 統(tǒng)計(jì)和可視化 要想建立一個好的預(yù)言模型,必須了解自己的數(shù)據(jù)。最基本的方法是計(jì)算各 種統(tǒng)計(jì) 變量( 平均值、方差等) 和察看數(shù)據(jù)的分布情況。也可以用數(shù)據(jù)透視表察看多維 數(shù)據(jù)。數(shù)據(jù)的種類可分為連續(xù)的,有一個用數(shù)字表示的值( 比如銷售量) 或離散的, 分成一個個的類別( 如紅、綠、藍(lán)) 。離散數(shù)據(jù)可以進(jìn)一步分為可排序的,數(shù)據(jù)問可 以比較大小( 如,高、中、低) 和標(biāo)稱的,不可排序( 如郵政編碼) :圖形和可視化工 具在數(shù)據(jù)準(zhǔn)備階段尤其重要,它能讓使用者快速直觀的分析數(shù)據(jù),而不是只給出 枯燥乏味的文本和數(shù)字。它不僅使用者看到整個森林,還允許使用者拉近每一棵 樹來察看細(xì)節(jié)。在圖形模式下我們很容易找到數(shù)據(jù)中可能存在的模式、關(guān)系、異 常等,直接看數(shù)字則很難。 可視化工具的問題是模型可能有很多維或變量,但是我們只能在2 維的屏幕或 紙上展示它。比如,我們可能要看的是信用風(fēng)險與年齡、性別、婚姻狀況、參加 工作時間的一關(guān)系。因此,可視化工具必須用比較巧妙的方法在兩維空間內(nèi)展示 維空間的數(shù)據(jù)。雖然目前有了一些這樣的工具,但它們都要用戶“訓(xùn)練 過他們 的眼睛后才能理解圖中畫的到底是什么東西。在使用這些工具時可能會遇到困難。 對于眼睛有色盲或空間感不強(qiáng)的人,在使用這些工具時可能會遇到困難。 2 聚類 聚類( c i u s t c r i n g ) 3 1 1 是一個將數(shù)據(jù)集劃分為若干組( c l a s s ) 或類( c l u s t 砷的過 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 1 7 程,并使得同一個組內(nèi)的數(shù)據(jù)對象具有較高的相似度;而不同組中的數(shù)據(jù)對象是 不相的。相似或不相似的描述是基于數(shù)據(jù)描述屬性的取值來確定的。通常就是利 用( 各對象問) 距離來進(jìn)行表示的。許多領(lǐng)域,包括數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)都 有聚類研究和應(yīng)用。 目前在文獻(xiàn)中存在大量的聚類算法。算法的選擇取決于數(shù)據(jù)的類型,聚類的 目的和應(yīng)用。如果聚類分析被用作描述或探查的工具,可以對同樣的數(shù)據(jù)嘗試多 種算法,以發(fā)現(xiàn)數(shù)據(jù)可能揭示的結(jié)果。 大體上,主要的聚類算法可以劃分為如下幾類: 劃分方法( p a r t i t i o n i n gm e t h o d s ) :給定一個1 1 個對象或元組的數(shù)據(jù)庫,一個劃分 方法構(gòu)建數(shù)據(jù)的k 個劃分,每個劃分表示一個聚類,并且k 大 土 使用 1 r 設(shè)備維修,內(nèi)部借用, 設(shè)備購置 設(shè)備購置調(diào)撥 總務(wù)處進(jìn)行設(shè)備采購 政府采購 土 | 報廢 設(shè)備超出保修,一定 周期內(nèi)報廢 圖3 - 3 主要設(shè)計(jì)流程圖 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 l 第四章固定資產(chǎn)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 4 1 固定資產(chǎn)管理系統(tǒng)的功能結(jié)構(gòu) 該系統(tǒng)功能主要包括數(shù)據(jù)管理、設(shè)備的采購管理、申報審批管理、驗(yàn)收管理、 設(shè)備交動管理、低值耐用品管理等,每一部分具相對獨(dú)立和完整的功能。 4 1 1 數(shù)據(jù)管理 數(shù)據(jù)管理主要包含用戶管理、報表統(tǒng)計(jì)和系統(tǒng)維護(hù)3 個功能模塊。報表統(tǒng)計(jì)實(shí) 現(xiàn)對維修、調(diào)撥、報廢數(shù)據(jù)定期匯總,生成相應(yīng)的統(tǒng)計(jì)報表。用戶管理主要負(fù)責(zé) 用戶注冊,用戶注銷、用戶口令的修改、用戶分配權(quán)限。系統(tǒng)數(shù)據(jù)維護(hù)完成使用 單位、使用專業(yè)方向、設(shè)備分類等數(shù)據(jù)的維護(hù)。功能如下圖4 1 圖4 1 數(shù)據(jù)管理圖 3 2揚(yáng)槲大學(xué)碩士學(xué)位論文 4 1 2 設(shè)備的采購管理 設(shè)備采購管理是指申請系部上報設(shè)備采購計(jì)劃,由相關(guān)審批領(lǐng)導(dǎo)審核簽字, 然后總務(wù)處匯總整理數(shù)據(jù),并根據(jù)設(shè)備價格決定招標(biāo)購買或直接自行購買。 業(yè)務(wù)流程圖如圖4 - 2 所示。 i 系部上報采購計(jì)劃 i 審批領(lǐng)導(dǎo)簽字 1r 否 圖4 - 2 設(shè)備采購流程圖 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 3 4 1 3 設(shè)備驗(yàn)收 設(shè)備驗(yàn)收是指對單位購買的儀器設(shè)備進(jìn)行審核、驗(yàn)收、建賬和報銷。 其業(yè)務(wù)流程如下圖所示。 i 經(jīng)辦人到財(cái)務(wù)部門領(lǐng)取設(shè)備驗(yàn)收單并簽字 l 提示相關(guān)人員簽字 l 相關(guān)人員驗(yàn)收 l 經(jīng)辦人到財(cái)務(wù)處報銷 圖4 - 3 設(shè)備驗(yàn)收流程圖 揚(yáng)州大學(xué)碩士學(xué)位論文 4 1 4 設(shè)備變動管理 設(shè)備的變動管理主要包括設(shè)備的借出歸還、調(diào)撥調(diào)劑、維修報損、報廢等 1 設(shè)備的借出與歸還 圖4 - 4 設(shè)備借出歸還流程圖 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 5 4 1 5 設(shè)備調(diào)n 調(diào)撥 設(shè)備的調(diào)劑調(diào)撥是指校屬行政、教學(xué)、科研設(shè)備等校內(nèi)使用單位發(fā)生變更或 調(diào)至校外。 填寫調(diào)劑調(diào)撥申請單 上 使用部門審批 主管領(lǐng)導(dǎo)審批 1r 計(jì)算機(jī)做變更處理 通知雙方進(jìn)行設(shè)備行調(diào) n 調(diào)撥 圖4 - 5 設(shè)備調(diào)劑調(diào)撥流程圖 3 6揚(yáng)州大學(xué)碩士學(xué)位論文 4 1 6 設(shè)備維修 固定資產(chǎn)的維修需要填寫維修單。固定資產(chǎn)管理檢索到需要維修的設(shè)備,將 該設(shè)備的使用狀況修改為維修,撤銷單據(jù)時,再將該設(shè)備的使用狀況修改為正常。 1 一般設(shè)備維修 l 資產(chǎn)管理員填寫維修單 1 l 聯(lián)系維修單位 i 填寫維修記錄 圖4 - 6 設(shè)備維修流程圖 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 7 2 貴重設(shè)備維修 i i 填寫貴重設(shè)備維修申請單 l 主管領(lǐng)導(dǎo)審批簽字 l 設(shè)備維修 1 支付維修費(fèi)用 圖4 7 貴重設(shè)備維修流程圖 3 8揚(yáng)州大學(xué)碩士學(xué)位論文 4 ,1 。7 設(shè)備報損 設(shè)備管理員提出設(shè)備報損申請,由分管校長審批,資產(chǎn)管理處審批后打 印耀損清單。 使用單位填寫報損申請表 說明設(shè)備情況 i 調(diào)查設(shè)備情況并提出處理 f 意見 1分管校長審批 土 通知使用單位 l 審核報損設(shè)備,打印報損 清單 l 賬目調(diào)整 圖4 8 設(shè)備報損流程圖 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 3 9 2 低值耐用設(shè)備管理 低值耐用設(shè)備指教學(xué)、科研使用的單價在2 0 0 8 0 0 之問的儀器設(shè)備和行政、后 勤使用的單價在2 0 0 - 5 0 0 之問的儀器設(shè)備。其設(shè)備的驗(yàn)收、調(diào)撥、報損與儀器設(shè)備 管理的過程基本相同,由于其價值較低,故進(jìn)行各項(xiàng)處理時無需校領(lǐng)導(dǎo)的審核簽 字,由總務(wù)處負(fù)責(zé)人直接管理。 4 0 揚(yáng)州大學(xué)碩士學(xué)位論文 4 2 資產(chǎn)數(shù)據(jù)庫設(shè)計(jì) 主機(jī)表4 1 。 o r 啦rn 曩e 址, - t j l 9 e1 e 砒髓e l 1 c ) r e c l s l o i礎(chǔ)e r l c s c a l ei 1 4 d hl s 弛i s l i e n t l y8 e f 池d e s c li j 繇識) b i g i n t l qo硇 船y e s 2巧帆纈用單位號)c h 盯1 0耵 目砷 3y 枇( 儀器編號) c h 口 8 船i e s拋 4m ( 勢磐)r h r8砷m舶 5y q , c h ( 髏鏑)v i r 岫勘勘 舶 6玨( 型號)掰益l l 刃硇 t稚( 規(guī)格) v i t a e目m舶 80 j ( 靴) l o n 眄 1 94d耵舶 9c 0 8 e 涸鵬)c l i 缸3兩 船舶 1 0;c o t r y ( 酬)丫a c h 盯1 0璐 鄹舶 重1如艨) 掰曲缸硇朋舶 1 2 h l l c l l l l 吐舟)缸血籃璐 船舶 1 3玨口q ( 出朋期)d a e t i m e3勘舶 弱 1 4g 血z ( 贍日期)h l e t i s e器3耵耵舶 1 5f j 虹( 附件熬量)i n t1 00t e s 鄹舶 1 5蛹( 附髓價) _ 強(qiáng)盱 1 941 e s船 舶 1 7x z h ( 現(xiàn)捷)c ki耶耵舶 1 8( 麟別)c ki船舶舶 i 9矗( 勰人y a r c a 缸i 0璐砷舶 加皿( 纈髑) c h 盯 l 砷舶舶 2 ls y 缸( 鯽方自代碼)c h rl雨舶舶 趁拙隘手人)附矗缸1 0倦鄹砸 2 3b 扛4 度動日期) 扭e t i h 2 3 3i e s鼬舶 2 4s 研8 1 j | h 懂用單位號)c h i rl o璐 弱舶 2 6乃丑h 衢分類號)c k 6璐田舶 珂z c h l 茁薩矧)吐盯 2璐弱舶 2 8強(qiáng)蜘射閽)d a l e t i t e2 33璐舶舶 鸚蛐礴4 聘)佑吐虹拋璐鄹舶 h 潑鸛)v i r a e i ,璐 廂孤 朱錫亮:數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究 4 l 3 i啦彈鴉)丫a r e k 2 0 1 1 5舶砷 爻觥如v 昌r 矗瑟l o i 豁砷 粥 站v a r c j l 缸1 ( 可選宇符)咐c l i 玎卯 璐舶舶 3 41 r 毫r c h 毫r 2憎c h 奸i e 5砷舶 3 5 r a r c h a r 3娜c ks b1 1 5舶粥 薔鋤l ( 可逢字符) 砌e r l c磁舶麗 3 i 嘲2n 礬e r l ci e 5 舶那 5 l i 【瀋接) c h a r l1 1 5舶砷 3 9h h o 庫號j& t e t i mh 5 舶舶 8 z l l 話恚)婦ii e 3舶舶 4 l蚴供稍)掰c h i r3 0璐 舶舶 4 2c f a d 晦煎地點(diǎn)) v + r d mi e 5舯舯 4 3確瞄口債) m o n e y i e 5 舶 “n f 淺積) m o 她y i e 5砷 4 5l e f i h n 皤注)哪c 婦2 0 0 i e 5舶勘 4 6x 州姻h a rl! 1 5砸 硇 4 t5 址豳( 磁髑)幽婦e2 33強(qiáng)弱 期 4 85 l | e 血嘞( 彈人)婦

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論