基于數(shù)據(jù)關聯(lián)規(guī)則的醫(yī)藥管理系統(tǒng)的分析與設計_第1頁
基于數(shù)據(jù)關聯(lián)規(guī)則的醫(yī)藥管理系統(tǒng)的分析與設計_第2頁
基于數(shù)據(jù)關聯(lián)規(guī)則的醫(yī)藥管理系統(tǒng)的分析與設計_第3頁
基于數(shù)據(jù)關聯(lián)規(guī)則的醫(yī)藥管理系統(tǒng)的分析與設計_第4頁
基于數(shù)據(jù)關聯(lián)規(guī)則的醫(yī)藥管理系統(tǒng)的分析與設計_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目 錄1. 概述11.1 課題的研究意義11.2 課題的研究背景1 我國醫(yī)藥零售企業(yè)的發(fā)展現(xiàn)狀1 關聯(lián)規(guī)則技術在數(shù)據(jù)挖掘中的應用現(xiàn)狀2 電子信息技術在醫(yī)藥零售企業(yè)中的應用現(xiàn)狀31.3 課題的研究內(nèi)容32. 系統(tǒng)分析42.1 醫(yī)藥管理信息系統(tǒng)分析4 醫(yī)藥管理信息系統(tǒng)需求分析4 數(shù)據(jù)流程分析5 數(shù)據(jù)字典72.2 基于關聯(lián)規(guī)則的醫(yī)藥零售數(shù)據(jù)挖掘方法分析9 數(shù)據(jù)挖掘流程9 基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘算法9 數(shù)據(jù)關聯(lián)規(guī)則在醫(yī)藥零售數(shù)據(jù)中的應用分析133. 系統(tǒng)設計153.1 醫(yī)藥信息管理系統(tǒng)開發(fā)平臺設計16 系統(tǒng)開發(fā)軟件平臺16 系統(tǒng)開發(fā)硬件平臺163.2 醫(yī)藥信息管理系統(tǒng)功能模塊設計16 功能結(jié)構設計.1

2、6 功能模塊說明173.3 數(shù)據(jù)庫設計18 邏輯設計19 數(shù)據(jù)庫表設計193.3.3 數(shù)據(jù)庫連接代碼設計233.4 代碼設計233.5 系統(tǒng)界面設計243.6 安全性設計274 系統(tǒng)實現(xiàn)284.1 程序設計284.2 系統(tǒng)測試335. 總結(jié)331 概述1.1 課題的研究意義許多醫(yī)藥零售企業(yè)因為不能記錄藥品銷往單位,無需填制銷售憑證,在手工管理下無法分類統(tǒng)計客戶群。另外還有些大型零售醫(yī)藥公司的藥品銷售,由于品種種類較多,庫存數(shù)量及結(jié)構變動性較強,在手工操作條件下,營業(yè)員不僅經(jīng)銷藥品,同時經(jīng)營貨款,極容易出現(xiàn)款貨黑洞1。針對以上手工管理醫(yī)藥零售企業(yè)普遍存在的問題,課題開發(fā)的騰龍醫(yī)藥管理系統(tǒng)可分類統(tǒng)

3、計客戶群,可對某類客戶做一標識。對大流量的數(shù)據(jù)進行收集,既可收款迅速準確,又強化了前后臺管理;同時收款機作為銷售前哨,可為后臺提供準確無誤的信息;后臺軟件進行加工、處理、分析、統(tǒng)計,從而實現(xiàn)人、財、物、購、銷、存一體化管理。醫(yī)藥零售企業(yè)對于銷售品種、貨源單位的選擇極為重視, 騰龍醫(yī)藥管理系統(tǒng)將每種藥品的經(jīng)營狀況與貨源單位對應,將每筆業(yè)務各環(huán)節(jié)的處理對應到各崗位的每位員工。騰龍醫(yī)藥管理系統(tǒng)提供的不僅僅是一套收款系統(tǒng),同時也是一套智能考核貨源單位和員工業(yè)績的管理型軟件。在企業(yè)引入管理信息系統(tǒng)的背景下,我們同時也意識到企業(yè)信息化的最大效益來自信息的最廣泛共享、最快捷的流通和對信息進行深層次的挖掘。因

4、此, 信息化建設中的根本性問題, 不是通信網(wǎng)絡、計算機選型、建設網(wǎng)站等問題, 而是如何將分散、孤立的各類信息變成網(wǎng)絡化的信息資源并進行整合, 實現(xiàn)信息的快捷流通和共享2。信息資源是企業(yè)最重要的資源之一,開發(fā)信息資源既是企業(yè)信息化的出發(fā)點, 又是企業(yè)信息化的歸宿。在信息化建設過程中, 建設高質(zhì)量的數(shù)據(jù)體系, 是開發(fā)企業(yè)信息資源、建立全面支持企業(yè)信息化運行的IT資源平臺的基本工作。因此數(shù)據(jù)分析技術已經(jīng)成為企業(yè)應用關注的一個焦點,但由于歷史原因,大部分人對傳統(tǒng)的統(tǒng)計分析和新的數(shù)據(jù)挖掘技術都不太了解, 存在著許多模糊認識3。數(shù)據(jù)體系的設計目標是規(guī)范、標準、可控、支持高效數(shù)據(jù)處理和深層數(shù)據(jù)分析的數(shù)據(jù)結(jié)構

5、以及穩(wěn)定、統(tǒng)一的數(shù)據(jù)應用體系及管理架構。近年來,隨著信息產(chǎn)業(yè)的急劇發(fā)展, 數(shù)據(jù)大量地產(chǎn)生和被搜集, 使得傳統(tǒng)的數(shù)據(jù)管理方法不能有效地使用這些數(shù)據(jù)為企業(yè)服務。因此本課題基于騰龍醫(yī)藥管理系統(tǒng)介紹的關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術將會啟發(fā)更多的醫(yī)藥零售企業(yè)利用已有數(shù)據(jù)為自己服務。1.2 課題的研究背景1.2.1 我國醫(yī)藥零售企業(yè)的發(fā)展現(xiàn)狀長期以來,由于藥品的特殊性,我國醫(yī)藥流通領域一直采用“統(tǒng)購包銷、逐級調(diào)撥”的流通管理模式,嚴格控制藥品的流通。醫(yī)療體制僵化使醫(yī)院成為藥品銷售的終端4。進入20世紀90 年代末以后,隨著改革開放的進一步深化,醫(yī)藥零售行業(yè)的嚴格管制開始松動,這些為國內(nèi)醫(yī)藥零售業(yè)帶來了難得的發(fā)展機

6、遇。2000年以來,我國針對醫(yī)藥零售業(yè)出臺了幾大政策:處方藥和非處方藥分類管理辦法的出臺,百姓的用藥消費從醫(yī)院向藥店分流,使得在藥品零售中,醫(yī)院所占市場份額約85 % ,藥店所占市場份額約為15 %;我國對外資放開醫(yī)藥分銷服務業(yè),外商可以在我國從事采購、倉儲、配送、批發(fā)、零售及售后服務;國家有關部門首次取消了對跨省市辦醫(yī)藥連鎖店的限制,連鎖藥店成為眾多醫(yī)藥零售企業(yè)開展服務的基本途徑;藥店定址“零距離”的規(guī)定,藥店之間可以緊挨著開,有實力的藥店可以憑借其服務質(zhì)量等優(yōu)勢開展平等競爭5。時代在進步,社會在發(fā)展,居民生活水平不斷提高的同時健康意識也有了十足的進步,人們開始追求健康、便利、實惠。公費醫(yī)療

7、并不能全民普及的今天,自費醫(yī)療的公眾更愿意在大中型藥店、連鎖店,他們認為在醫(yī)院購買除了要交納藥品費用之外,還要交納其他的費用,如:掛號費、處方費、處置費等,附加費用較高。為了了解目前公眾購買藥品的場所及考慮的因素,中國消費報社和中國社會調(diào)查所在全國范圍內(nèi)聯(lián)合進行了一項全國藥品銷售的調(diào)查,發(fā)現(xiàn)人們對藥品的售后服務也提出了更高的要求:送藥上門、健康講座、家庭醫(yī)生等6。藥品零售市場作為我國醫(yī)藥健康產(chǎn)業(yè)中,市場化程度最高的板塊,十多年來發(fā)展迅速。醫(yī)院已不再是人們購買藥品的首選,這為醫(yī)藥零售企業(yè)提供了前所未有的機遇與挑戰(zhàn),改革開放的逐步推進,同時也給我國醫(yī)藥零售企業(yè)帶來了來自全世界的挑戰(zhàn),信息化不足,經(jīng)

8、營理念落后,利潤太低等7。1.2.2 關聯(lián)規(guī)則技術在數(shù)據(jù)挖掘中的應用現(xiàn)狀數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中提取或挖掘知識,就是應用一系列技術從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取人們感興趣的信息和知識。這些知識或信息是隱含的,事先未知而潛在有用的,提取的知識表示為概念、規(guī)則、規(guī)律、模式等形式8。也可以說,數(shù)據(jù)挖掘是一類深層次的數(shù)據(jù)分析,數(shù)據(jù)挖掘應該更正確地命名為從數(shù)據(jù)中挖掘知識。關聯(lián)規(guī)則是如下形式的邏輯蘊涵: A B ,其中A. B是項集, A I, B I, A B = 。一般用兩個參數(shù)描述關聯(lián)規(guī)則的屬性。關聯(lián)規(guī)則數(shù)據(jù)挖掘的一個典型例子是購物籃分析。市場分析員要從大量的數(shù)據(jù)中發(fā)現(xiàn)顧客放入其購物籃中的不同商品之

9、間的關系。如果顧客買牛奶,他也購買面包的可能性有多大? 什么商品組或集合顧客多半會在一次購物時同時購買?例如,買牛奶的顧客有80%也同時買面包,或買鐵錘的顧客中有70%的人同時也買鐵釘,這就是從購物籃數(shù)據(jù)中提取的關聯(lián)規(guī)則。關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘研究的一個重要分支,關聯(lián)規(guī)則是數(shù)據(jù)挖掘的眾多知識類型中最為典型的一種9。自從提出關聯(lián)規(guī)則挖掘的概念之后,人們對它的研究從來沒有停止過,不但在理論上對它進行了卓有成效的分析和研究,而且在實踐上也提出了不少有效的算法,為關聯(lián)規(guī)則挖掘的理論和應用奠定了基礎。主要研究的關聯(lián)規(guī)則算法有:搜索算法、多循環(huán)力式的挖掘算法、深度優(yōu)先算法,其中最為經(jīng)典的算法是Aprior

10、i算法10。關聯(lián)規(guī)則挖掘在數(shù)據(jù)挖掘中是一個重要的課題,從大量商務事務中發(fā)現(xiàn)有趣的相關聯(lián)系,有助于許多商務決策的制定,如分類設計、交叉銷售和顧客購買習慣分析等。近幾年隨著電子信息技術的廣泛應用,關聯(lián)規(guī)則挖掘已經(jīng)廣泛應用于如:企業(yè)銷售管理系統(tǒng),通過一定的關聯(lián)規(guī)則制定營銷策略;超級市場銷售管理系統(tǒng),進行商品貨架設計、貨存安排以及根據(jù)購買模式對用戶進行分類;圖書管理系統(tǒng),從讀者的大量借閱信息中挖掘出各學科之間的關聯(lián)程度,從而科學地進行建議借閱和圖書推薦等服務,在一定程度上可以輔助圖書館的購書工作、教師的教學工作以及優(yōu)化圖書館藏布局11。 1.2.3電子信息技術在醫(yī)藥零售企業(yè)中的應用現(xiàn)狀“創(chuàng)造在市場競爭

11、中不可取代位置”的企業(yè)才能夠生存下來。而企業(yè)要建立不可取代的位置,很重要的一點就是要有比別人更快獲取和處理資訊的能力12。正是意識到這一點,在競爭如此激烈的醫(yī)藥零售業(yè)中,不少醫(yī)藥零售企業(yè)采用了電子信息技術。電子商務成為企業(yè)展開競爭的一種手段與競爭優(yōu)勢,醫(yī)藥產(chǎn)業(yè)作為國民經(jīng)濟的支柱產(chǎn)業(yè),與互聯(lián)網(wǎng)經(jīng)濟相結(jié)合,即開展電子商務已是必不可擋的趨勢。全球最大的20家制藥業(yè)現(xiàn)已開展電子商務,通過電子商務醫(yī)藥零售企業(yè)可以減少其在采購、銷售環(huán)節(jié)中的交易層次,減少尋找交易信息的時間,大幅度降低交易成本13。例如,我國成功的民生醫(yī)藥電子商務網(wǎng),通過這種方式企業(yè)拓寬了銷售渠道。同時,傳統(tǒng)的制藥企業(yè)面對電子商務的滾滾大潮

12、,發(fā)展企業(yè)自身信息化是首要任務。在中國有這樣一個特點,電子商務名詞概念先于電子商務的應用和發(fā)展,是先進的網(wǎng)絡和電子技術推動企業(yè)電子商務的應用與發(fā)展。實際上,企業(yè)的電子商務的發(fā)展程度很大一部分取決于企業(yè)自身信息化的程度,有相應的信息化水平,才能應用相應的電子商務。信息化水平并不取決于企業(yè)擁有多少臺計算機,而是企業(yè)通過計算機能夠得到多少有用的信息14。因此很多醫(yī)藥零售企業(yè)內(nèi)部也采用了管理信息系統(tǒng),來進行藥品、人員、客戶信息管理。1.3 課題的研究內(nèi)容在本課題中主要探討的內(nèi)容是醫(yī)藥零售企業(yè)內(nèi)部管理信息系統(tǒng)的設計與實現(xiàn)以及基于數(shù)據(jù)關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術在此醫(yī)藥管理系統(tǒng)中的應用分析。通過分析醫(yī)藥零售企業(yè)

13、獨特的營銷特點來設計出合適的管理信息系統(tǒng)。本課題為騰龍企業(yè)設計實用的管理系統(tǒng),完成銷售管理、進貨管理、庫房管理、財務管理、客戶信息管理、企業(yè)人員信息管理、藥品信息管理、供應商信息管理。以設計出來的騰龍醫(yī)藥管理系統(tǒng)的事務數(shù)據(jù)庫為基本,應用關聯(lián)規(guī)則的數(shù)據(jù)挖掘算法,通過數(shù)據(jù)預處理、設置數(shù)據(jù)源等有序步驟,得到概率和正確性較高的一些關聯(lián)規(guī)則,幫助醫(yī)藥零售企業(yè)進行合適的藥品貨架設計、貨存安排以及根據(jù)購買信息對用戶進行分類。2 系統(tǒng)分析2.1 醫(yī)藥管理信息系統(tǒng)分析 醫(yī)藥管理信息系統(tǒng)需求分析醫(yī)藥零售企業(yè)分為兩種形式,一是純正的零售藥店,另外一種是連鎖企業(yè)下屬的零售分店15,醫(yī)藥零售企業(yè)的業(yè)務流程如圖2-1所示

14、??蛻艄衽_開票系統(tǒng)進行庫存藥品審核銷售登記銷售報表返還交款單客戶庫存信息返還收款單查詢銷售記錄質(zhì)量檢查退貨登記退貨報表銷售信息庫存信息選定商品退貨未通過go庫存有通過通過未通過go未通過圖2-1 業(yè)務流程圖顧客購貨顧客選中所要購買的商品后,由柜臺營業(yè)員開出小票,顧客持單到收款處交款。計算機系統(tǒng)記錄下此次銷售信息。顧客憑POS機上打印出的交款單到柜臺取貨。顧客購貨過程結(jié)束。如果柜臺上的同一種藥品具有兩個不同的批號,營業(yè)員在售貨時應該嚴格按照批次在先的藥品先銷售的原則。顧客退貨一般情況下,退貨時,顧客要聲明退貨原因并出示POS機上打出的“收款單”,憑此“收款單”查找歷史銷售記錄,確認貨物是本店售出

15、的,并對藥品進行質(zhì)量檢查。同意退貨后,在計算機系統(tǒng)中做一筆負銷售。對退回來的貨,無論其質(zhì)量情況如何,均按負出庫處理,有 質(zhì)量問題的再作報廢或退貨處理。通過對以上兩種醫(yī)藥零售企業(yè)形式的銷售業(yè)務流程考察后,需要了解企業(yè)的應用需求,表2-1列出了醫(yī)藥零售企業(yè)主要的功能需求。表2-1 主要功能需求序號名稱主要內(nèi)容輸入數(shù)據(jù)輸出數(shù)據(jù)1藥品管理藥品名稱、標識、產(chǎn)地等其他相關的信息;藥品進、銷、存明細賬;藥品在后庫的上下限控制;藥品在貨架的補貨臨界;藥品消費對象的采集、管理;藥品銷售以及入庫記錄;等等查詢關鍵字藥品列表2供應商的管理藥品供應商單位的檔案信息; 從各供應單位購進藥品的銷售、庫存情況; 供應單位的

16、應付款及結(jié)算明細賬;等等。查詢關鍵字供應商信息列表3員工管理各員工的檔案資料維護與管理; 各員工定崗、定責與系統(tǒng)處理權限的對應關系; 各員工在組織機構中的隸屬關系; 各員工工作業(yè)績的統(tǒng)計、考核;等等。查詢關鍵字員工信息列表4財務管理藥品銷售總額; 藥品退貨總額; 藥品入庫總額;核算報表制作與打??;藥品銷售支出財務報表2.1.2 數(shù)據(jù)流程分析銷售藥品提供藥品回執(zhí)回執(zhí)圖2-2 騰龍醫(yī)藥管理信息系統(tǒng)頂層DFD醫(yī)藥管理信息系統(tǒng)客戶X供應商由以上的業(yè)務流程分析得出醫(yī)藥管理信息系統(tǒng)的頂層數(shù)據(jù)流程圖如圖2-2: 騰龍醫(yī)藥管理信息系統(tǒng)第一層DFD如圖2-3:客戶X1庫房管理庫存信息入庫登記D1D2庫存信息藥品

17、信息X2銷售管理X4財務管理D3D4D5供應商信息客戶信息員工信息X3基礎信息管理員工圖2-3 騰龍醫(yī)藥管理信息系統(tǒng)第一層DFD供應商信息供應商騰龍醫(yī)藥管理信息系統(tǒng)第二層DFD庫房管理DFD如圖2-4:藥品訂購藥品X1.1X1.2倉庫名稱訂單處理D6庫存管理供應商入庫單D7客戶D8出庫單庫存D9X1.3訂單D10結(jié)算管理報表D11圖2-4 騰龍醫(yī)藥管理信息系統(tǒng)第二層DFD騰龍醫(yī)藥管理信息系統(tǒng)底層DFD如圖2-5:X入庫管理供應商反饋X倉位查詢倉庫名稱D6X入庫單D7庫存查詢X庫存盤點出庫單D8D9X庫存入庫退貨管理圖2-5 騰龍醫(yī)藥管理信息系統(tǒng)底層DFD2.1.3 數(shù)據(jù)字典數(shù)據(jù)字典是關于數(shù)據(jù)的

18、信息集合,也就是對數(shù)據(jù)流程圖中包含所有元素定義的集合。具體來講,它是對數(shù)據(jù)流程圖中的數(shù)據(jù)項、數(shù)據(jù)結(jié)構、數(shù)據(jù)流、數(shù)據(jù)存儲、處理邏輯的定義和描述。數(shù)據(jù)項的描述:數(shù)據(jù)項是數(shù)據(jù)的最小單位,具有邏輯不可再分性。表2-2表示對數(shù)據(jù)元素“倉庫名稱”的描述。表2-2 倉庫名稱描述編號dm-01標識符SPDJ名稱倉庫名稱別名庫名含義存儲藥品的倉庫識別標志類型數(shù)值型長度20值域099999999999.9數(shù)據(jù)結(jié)構的描述:數(shù)據(jù)元素在系統(tǒng)中以滿足某種應用的要求組合在一起,構成了一定的數(shù)據(jù)結(jié)構。例如將藥品信息的組合以“藥品標識”來命名,表2-3表示“藥品標識”的數(shù)據(jù)結(jié)構。表2-3 藥品標識描述編號S-01名稱藥品標識含

19、義標識藥品實體組成藥品名稱+藥品編號+簡稱+單位相關數(shù)據(jù)流藥品入庫單、藥品出庫單、藥品銷售信息相關處理邏輯藥品信息管理、藥品銷售管理、財務統(tǒng)計數(shù)據(jù)流描述:在數(shù)據(jù)字典中,可以對數(shù)據(jù)流程圖中由外部項輸入到系統(tǒng)中的數(shù)據(jù)流和從系統(tǒng)輸入到外部項的數(shù)據(jù)流進行描述,表2-4表示對“藥品入庫單”的描述。表2-4 藥品入庫單描述編號L-01名稱藥品入庫單含義倉庫藥品的入庫信息數(shù)據(jù)流來源庫房管理模塊數(shù)據(jù)流去向藥品入庫單組成倉庫名稱、藥品名稱、數(shù)量、金額流通量2份/天高峰流通量10份/天數(shù)據(jù)存儲描述:在數(shù)據(jù)字典中,只描述數(shù)據(jù)存儲的邏輯存儲結(jié)構,而不涉及其物理結(jié)構。表2-5表示對“藥品信息”的描述。表2-5 商品信息

20、描述編號C-01名稱藥品信息含義存儲藥品的基本信息組成藥品基本信息、藥品入庫日期關鍵字入庫日期、藥品編號、藥品名稱備注填表人:楊江濤 日期:2006年5月18日處理邏輯的定義與描述:數(shù)據(jù)字典對數(shù)據(jù)流程圖中的處理邏輯進行了簡單的描述。表2-6表示對“庫房管理”的描述。表2-6 訂單管理描述編號XS02.1名稱庫房管理簡述管理庫房藥品情況,包括庫存藥品查詢、庫房盤點、庫房報表輸入出入庫藥品信息與出入庫藥品數(shù)量、庫房名稱處理1) 根據(jù)輸入庫房名稱進行庫房盤點2) 根據(jù)輸入的藥品名稱進行各倉庫內(nèi)藥品查詢,進行采購與銷售決策3) 管理員可以根據(jù)庫房盤點生成庫房報表輸出庫存藥品信息、庫房報表2.2 基于關

21、聯(lián)規(guī)則的醫(yī)藥零售數(shù)據(jù)挖掘方法分析 數(shù)據(jù)挖掘流程數(shù)據(jù)挖掘是指從存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中的大量數(shù)據(jù)中挖掘有用知識的過程。對數(shù)據(jù)挖掘的理論研究主要在以下六個方面:OLAP 技術、面向?qū)傩缘臍w納法、關聯(lián)規(guī)則、分類和預測、聚類和與數(shù)據(jù)倉庫的集成技術16。數(shù)據(jù)挖掘分為描述性和預測性兩類。描述性數(shù)據(jù)挖掘提供數(shù)據(jù)的一般規(guī)律;預測性數(shù)據(jù)挖掘產(chǎn)生關于數(shù)據(jù)的預測。數(shù)據(jù)挖掘的五項主要內(nèi)容有17:關聯(lián)分析:尋找數(shù)據(jù)項之間的關聯(lián)關系18。演變分析:描述時間序列數(shù)據(jù)隨時間變化的數(shù)據(jù)的規(guī)律或趨勢,并對其建模。包括時間序列趨勢分析、周期模式匹配等。聚類分析:根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性的原則將數(shù)據(jù)對象

22、聚類或分組。分類分析:找出描述并區(qū)分數(shù)據(jù)類的模型,以便能夠使用模型預測給定數(shù)據(jù)所屬的數(shù)據(jù)類。異常分析:一個數(shù)據(jù)集中往往包含一些特別的數(shù)據(jù),其行為和模式與一般的數(shù)據(jù)不同,這些數(shù)據(jù)稱為“異常”。對“異?!睌?shù)據(jù)的分析稱為“異常分析”。數(shù)據(jù)挖掘的過程一般由五個步驟組成19,具體過程如圖2-6 所示。目標數(shù)據(jù)預處理數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)模式選擇轉(zhuǎn)換預處理數(shù)據(jù)開采數(shù)據(jù)圖2-6 數(shù)據(jù)挖掘過程 基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘算法關聯(lián)規(guī)則作為數(shù)據(jù)挖掘中的一種技術,描述了交易數(shù)據(jù)集DB中兩組不同項目之間存在的某種關聯(lián)關系20。關聯(lián)規(guī)則定義的形式化描述如下:給定一個交易數(shù)據(jù)庫DB,I=I1,I2,Im為DB中m個不同交易事務集合,其

23、中每個事務T是項的集合,使得TI。每一個交易事務有一個唯一的標識,記作TID。定義1 k項集定義為項集中包含的項的個數(shù),集合A1,A2,Ak稱為k項集。定義2 若A,B為項集,AI,BI,并且AB=。則形如AB的表達式稱為關聯(lián)規(guī)則。定義3 支持度S。即任務相關的事務占總交易事務的百分比,表達為:S(AB)=P(AB)。定義4 規(guī)則AB具有可信度C, 即在DB中包含A的事務同時也包含B的百分比,表達為C(AB)=P(B A)=P(AB)/P(A)。如買面包又買牛奶的顧客占買面包顧客中的90%,可信度C為90%。定義5 設最小支持度為Smin,k頻繁模式集和k非頻繁模式集分別定義為:Lk=A1,A

24、2AkAii,(i=1,2,k),S(A1A2Ak/DB)Smin;Lk=AlA2AkAii,(i=1,2,k),S(A1A2Ak/DB)= minConf) / 這里,m + k = n,其中k m是一個關聯(lián)規(guī)則 AR = AR (km); return AR;下面以挖掘最簡單的關聯(lián)規(guī)則(即單維、單層、布爾關聯(lián)規(guī)則)為例說明尋找頻繁項集的方法,用某一鮮菜超市某天內(nèi)14位顧客購買的情況進行實例介紹24,如表2-7 所示(“0”表示某時刻未購買,“1”表示某時刻購買)。表2-7 鮮菜超市某天某時段銷售記錄事務項 蘆筍 大豆 卷心菜 雞蛋 青椒 黃瓜 番茄1 0 0 1 1 1 0 02 1 0

25、0 1 0 1 03 0 1 0 1 0 1 14 0 1 0 1 1 0 05 1 1 1 0 0 0 06 1 1 0 0 0 1 17 0 0 0 1 0 0 18 0 0 1 1 0 0 19 1 1 0 0 1 0 110 0 1 0 0 0 1 011 0 1 1 1 0 0 012 1 1 0 0 0 1 013 1 1 0 1 0 1 014 0 1 1 1 1 0 1假定支持度閾值為4/14,則支持度記數(shù)為4 ,則滿足支持度的一元頻繁項集如表2-8所示。若無法形成關聯(lián)規(guī)則,如何找出二元頻繁項集?我們可以先由一元頻繁項集得出二元候選集,如表2-9所示。結(jié)合表2-7銷售情況及由一

26、元頻繁項集得出二元候選集, 找出滿足支持度的二元頻繁項集如表2-10所示。以上信息,可用于生成二元關聯(lián)規(guī)則,同時可用于生成三元頻繁項集。但不能通過連接一、二元頻繁項集生成三元頻繁項集的候選項集,可以利用自連接二元頻繁項集生成三元頻繁項集的候選項集如表2-11所示,繼而采用上述方法生成三元頻繁項集及三元關聯(lián)規(guī)則。三元候選項集要成為頻繁項集,必須滿足支持檢測各個三元候選項集的每一個子集是否滿足支持度。三元頻繁項集為蘆筍、大豆、黃瓜及大豆、雞蛋、番茄。表2-8 一元頻繁項集 表2-9 二元候選項集蘆筍6 大豆10卷心菜5雞蛋8 青椒5黃瓜7番茄6蘆筍、大豆卷心菜、雞蛋蘆筍、卷心菜卷心菜、青椒蘆筍、雞

27、蛋卷心菜、黃瓜蘆筍、青椒卷心菜、番茄蘆筍、黃瓜雞蛋、青椒蘆筍、番茄雞蛋、黃瓜大豆、卷心菜雞蛋、番茄大豆、雞蛋青椒、黃瓜大豆、青椒青椒、番茄大豆、黃瓜黃瓜、番茄大豆、番茄 表2-10 滿足支持度的二元頻繁項集蘆筍、大豆5蘆筍、黃瓜5大豆、雞蛋5大豆、青椒6大豆、番茄4卷心菜、青椒4雞蛋、番茄4蘆筍、大豆、黃瓜蘆筍、大豆、雞蛋蘆筍、大豆、番茄大豆、雞蛋、黃瓜大豆、雞蛋、番茄大豆、黃瓜、番茄表2-11 三元候選項集 數(shù)據(jù)關聯(lián)規(guī)則在醫(yī)藥零售數(shù)據(jù)中的應用分析關聯(lián)分析法廣泛應用于零售行業(yè)事務分析中,可以找出哪些藥品可能隨某些藥品一同被購買,通過從銷售記錄挖掘關聯(lián)信息,可以發(fā)現(xiàn)買某一類藥品的顧客很可能購買其

28、他商品,這類信息可用于形成一定的購買推薦,幫助顧客選擇合適的醫(yī)藥品,增加銷售額,如某些藥房或藥店貨架上的合適的藥品擺放,可以達到促銷的目的25。醫(yī)藥零售業(yè)與其他行業(yè)一樣,關鍵是信息的獲取及其有效利用, 數(shù)據(jù)挖掘可以幫助醫(yī)藥零售企業(yè)提高市場份額和增加利潤,了解顧客群的特點,進行價格與進貨庫存的調(diào)整決策來提高企業(yè)利潤26。關聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關聯(lián)或相關聯(lián)系,關聯(lián)規(guī)則挖掘的一個典型例子是購物籃分析(Market Basket Analysis),該過程通過發(fā)現(xiàn)顧客放入其購物籃中不同商品之間的聯(lián)系,分析顧客的購物習慣。通過了解哪些商品頻繁地被顧客同時購買,這種關聯(lián)地發(fā)現(xiàn)可以幫助零售

29、商制定營銷策略27。例如,在同一個藥店內(nèi),如果顧客購買了銀翹片,他同時購買板藍根的可能性有多大? 通過分析,零售商有選擇地經(jīng)銷和安排貨架,這種信息可以引導銷售。例如,將這兩類藥品盡可能放近一些,可以進一步刺激顧客同時購買這些商品。以我們開發(fā)的騰龍醫(yī)藥管理系統(tǒng)為例,由前面提到的關聯(lián)規(guī)則技術知道,為了在醫(yī)藥管理系統(tǒng)的后臺事務數(shù)據(jù)庫中挖掘有效的關聯(lián)規(guī)則,必須首先定義最小支持度和最小可信度,關聯(lián)規(guī)則的挖掘就是在數(shù)據(jù)庫中尋找滿足SSmin和CCmin的所有關聯(lián)規(guī)則28。挖掘關聯(lián)規(guī)則關鍵在于尋找頻繁項集。結(jié)合數(shù)據(jù)挖掘的基本步驟和關聯(lián)規(guī)則的Apriori算法,Apriori算法的設計可以分解為兩步驟來執(zhí)行挖

30、掘:求出事務集D中滿足最小支持度min_sup 的所有頻繁集;利用頻繁集生成滿足最小可信度min_conf 的所有關聯(lián)規(guī)則。關聯(lián)規(guī)則在醫(yī)藥管理系統(tǒng)中應用的基本過程如圖2-7所示: 關聯(lián)分析算法事務數(shù)據(jù)庫預處理醫(yī)藥銷售數(shù)據(jù)關聯(lián)規(guī)則挖掘圖2-7 關聯(lián)規(guī)則在醫(yī)藥管理系統(tǒng)中的應用過程在進行關聯(lián)分析前,首先要進行數(shù)據(jù)準備工作,將醫(yī)藥品銷售數(shù)據(jù)進行預處理,形成關聯(lián)分析所需的事務數(shù)據(jù)庫,然后應用算法進行關聯(lián)分析,最后挖掘出有效的關聯(lián)規(guī)則。數(shù)據(jù)選取:數(shù)據(jù)源來自騰龍醫(yī)藥管理系統(tǒng)數(shù)據(jù)庫文件,本系統(tǒng)主要是對藥品銷售記錄進行關聯(lián)數(shù)據(jù)挖掘。該數(shù)據(jù)庫的信息見圖2-8。圖2-8 藥品銷售記錄數(shù)據(jù)預處理:數(shù)據(jù)源中的數(shù)據(jù)可能不

31、完整(如某些屬性的值不確定或空缺)、含噪聲和不一致(如同一個屬性在不同表中的名稱不同)。在這些不完整、含噪聲、不一致的數(shù)據(jù)在進行數(shù)據(jù)挖掘,其質(zhì)量難以得到保證,而且數(shù)據(jù)源中的數(shù)據(jù)量大,可能包含冗余,數(shù)據(jù)狀況分散,不易綜合查詢訪問等問題。這些都會影響數(shù)據(jù)挖掘的效率。因此可以在數(shù)據(jù)挖掘前使用清理、集成、變換、歸約等預處理方法改善數(shù)據(jù)質(zhì)量,從而提高數(shù)據(jù)挖掘的效率和質(zhì)量。數(shù)據(jù)的連接與導入:數(shù)據(jù)的連接是在Excel 環(huán)境下進行的,連接成一個文檔后在SQL Server 2000環(huán)境下進行數(shù)據(jù)的導入及提取,導入后的數(shù)據(jù)庫結(jié)構和內(nèi)容見圖2-9。圖2-9 數(shù)據(jù)庫表數(shù)據(jù)篩選:選取所需的信息,即姓名和所購藥品。查詢

32、語言為:use 醫(yī)藥管理系統(tǒng) select 姓名,藥品名稱 into JSJ 藥品銷售登記表 from 藥品銷售登記表 where length(khqc)(客戶全稱) 4 執(zhí)行后,得到所需的個體客戶藥品購買記錄表,見圖2-10。圖2-10 個體客戶藥品購買記錄表從圖2-10中可以看出:數(shù)據(jù)庫(表)的每一行只描述了個體客戶某次購買行為,將項目信息分散了,這種格式的數(shù)據(jù)不符合關聯(lián)規(guī)則算法的輸入要求,是不能直接進行關聯(lián)規(guī)則采掘的。其解決方法是使用SQL Server所帶的DTS工具可將數(shù)據(jù)轉(zhuǎn)換成算法所需要的布爾型事務數(shù)據(jù)庫。數(shù)據(jù)轉(zhuǎn)換:建立所需的事務數(shù)據(jù)庫,例如,在本系統(tǒng)實例中,形成的布爾型事務數(shù)據(jù)

33、庫,如表2-12所示:表2-12 藥品銷售事務庫姓名阿司匹林銀翹片板藍根周秦FTF李三TTF夏爽F(xiàn)TT基于Apriori 算法的藥品銷售關聯(lián)規(guī)則的挖掘:本系統(tǒng)是基于Apriori 算法的關聯(lián)規(guī)則挖掘,它將數(shù)據(jù)預處理后所得到的文本文件作為參數(shù)入口,對布爾型事務數(shù)據(jù)庫進行挖掘。挖掘分為兩個步驟,先選擇最小支持度與可信度,然后實現(xiàn)算法。支持度與可信度的選擇:在Apriori 算法中,選擇恰當?shù)闹С侄扰c可信度是挖掘有效關聯(lián)規(guī)則的關鍵。由于個人購買者和團體購買者的藥品購買信息之間的關聯(lián)程度有很大的不同,因此本系統(tǒng)中是通過對個人藥品購買信息進行數(shù)據(jù)挖掘,并將結(jié)果進行分析、比較,最后確定相對精確的支持度和可

34、信度的值。例如,在本系統(tǒng)中,對個人購買者的購買記錄進行挖掘后,可以得出支持度、可信度以及關聯(lián)規(guī)則數(shù)目的對比關系表。一般來說,隨著支持度和可信度的增加,規(guī)則的數(shù)目在逐漸減小。通過多次試驗后,選擇并確定最小支持度和最好可信度。Apriori 算法可由VC+,Java,C等來實現(xiàn),其中通過VC+在與系統(tǒng)的結(jié)合是封裝成組件的形式嵌入,通過ADO連接數(shù)據(jù)庫,最后輸出關聯(lián)規(guī)則。生成關聯(lián)規(guī)則表:掃描數(shù)據(jù)庫得出各類藥品的支持計數(shù)信息,從而得出關聯(lián)規(guī)則。在完成對關聯(lián)規(guī)則的描述后,與其實際銷售情況,調(diào)查結(jié)果比較,證實關聯(lián)規(guī)則的有效性。在本系統(tǒng)實例中,由于銷售記錄數(shù)據(jù)量的限制以及算法實現(xiàn)相關技術知識的不足,未能生成

35、關聯(lián)規(guī)則表。但通過此例可以看出,關聯(lián)規(guī)則在零售業(yè)中的廣泛的應用前景以及其可行性。Apriori算法實現(xiàn)后可以幫助諸如騰龍醫(yī)藥零售企業(yè)的廣大企業(yè)進行藥房的貨架設計。3. 系統(tǒng)設計3.1 醫(yī)藥信息管理系統(tǒng)開發(fā)平臺設計 系統(tǒng)開發(fā)軟件平臺本課題中的醫(yī)藥管理系統(tǒng)主要通過powerbuilder9.0以及后臺sql sever2000數(shù)據(jù)庫開發(fā)。采用PowerBuilder9.0開發(fā)工具。選擇PowerBuilder9.0是因為它是一種優(yōu)秀的數(shù)據(jù)庫應用開發(fā)工具之一,尤其令人贊嘆的是其專利產(chǎn)品DataWindow。它擁護很多種數(shù)據(jù)接口,可以非常方便地連接到各種數(shù)據(jù)源。它是一個可視化的、完全面向?qū)ο蟮目焖賾?/p>

36、開發(fā)工具,支持當前軟件開發(fā)中的重要技術,如JSP、Web Service、XML。用于開發(fā)應用程,可以提高開發(fā)效率、降低開發(fā)成本。通過PFC和DataWindow以及Web組件可以輕松筑建大型應用程序,降低開發(fā)難度,增強重用性,進而有效的保護了開發(fā)投資并促進增值29。系統(tǒng)的后臺數(shù)據(jù)維護和用戶端的查詢用PB開發(fā)工具編程實現(xiàn)。SQL Server 是一個關系數(shù)據(jù)庫管理系統(tǒng),它最初是由Microsoft Sybase 和Ashton-Tate三家公司共同開發(fā)的。它的主要特點是30:高性能設計,可充分利用WindowsNT的優(yōu)勢;系統(tǒng)管理先進,支持Windows圖形化管理工具,支持本地和遠程的系統(tǒng)管理

37、和配置;強壯的事務處理功能,采用各種方法保證數(shù)據(jù)的完整性;支持對稱多處理器結(jié)構、存儲過程、ODBC,并具有自主的SQL語言。 SQLServer以其內(nèi)置的數(shù)據(jù)復制功能、強大的管理工具、與Internet的緊密集成和開放的系統(tǒng)結(jié)構為廣大的用戶、開發(fā)人員和系統(tǒng)集成商提供了一個出眾的數(shù)據(jù)庫平臺。 3.1.2 系統(tǒng)開發(fā)硬件平臺在硬件方面,服務器的要求是:賽揚2.8及以上處理器,內(nèi)存為512MB以上,硬盤容量為40GB以上;客戶機的要求是:CPU為賽揚2.0以上,內(nèi)存128MB以上,硬盤容量10GB以上。3.2 醫(yī)藥信息管理系統(tǒng)功能模塊設計功能結(jié)構設計根據(jù)醫(yī)藥零售企業(yè)的業(yè)務流程和功能需求分析可知,騰龍醫(yī)

38、藥管理信息系統(tǒng)結(jié)構由系統(tǒng)登錄、進貨管理、銷售管理、庫房管理、財務管理、基礎信息管理、系統(tǒng)管理七大基本模塊組成。系統(tǒng)的功能結(jié)構具體如圖3-1所示。入庫登記系統(tǒng)登錄醫(yī)藥管理信息系統(tǒng)入庫退貨庫房盤點入庫報表入庫登記查詢?nèi)霂焱素洸樵儙旆坎樵冞M貨管理銷售管理庫房管理系統(tǒng)管理財務管理基礎信息管理銷售登記銷售退貨銷售登記查詢銷售退貨查詢銷售報表庫房報表財務結(jié)賬財務報表客戶信息管理員工信息管理藥品信息管理供應商信息操作員管理權限管理數(shù)據(jù)管理數(shù)據(jù)備份數(shù)據(jù)恢復當月結(jié)賬當月報表圖3-1 系統(tǒng)功能結(jié)構圖3.2.2功能模塊說明系統(tǒng)中有系統(tǒng)登錄、進貨管理、銷售管理、庫房管理、財務管理、基礎信息管理、系統(tǒng)管理七個功能模型。

39、每個功能模型對應有一個功能模塊詳細設計的說明書。前面的功能結(jié)構圖給出了各個模塊基本功能,下面對銷售管理、庫房管理、財務管理、基礎信息管理三個模塊做詳細說明。分別如表3-1至表3-4所示。表3-1 銷售管理模塊說明模塊標識XSGL01相關數(shù)據(jù)表khxx_tab.xsth_tab模塊名稱銷售管理主要功能系統(tǒng)操作員通過此模塊進行銷售記錄與銷售退貨記錄及其查詢調(diào)用模塊進貨管理、庫房管理輸入藥品名稱、客戶名稱、購買或退貨數(shù)量、經(jīng)手人輸出銷售記錄信息表、銷售退貨信息記錄算法1) 根據(jù)顧客的購買情況,在客戶信息管理中增加客戶基本信息;2) 根據(jù)顧客購買的藥品,進行銷售登記,同時調(diào)用進貨管理與庫房管理模塊,查

40、詢是否有藥品入庫;3) 根據(jù)購買信息,自動生成銷售信息列表,提供查詢服務。表3-2 庫房管理模塊說明模塊標識KFGL01相關數(shù)據(jù)表kc_tab.模塊名稱庫房管理主要功能庫存查詢、庫存盤點、庫存報表調(diào)用模塊進貨管理、銷售管理、藥品信息管理輸入藥品編號、藥品名稱、倉庫名稱輸出庫存信息算法1) 根據(jù)藥品編號、藥品名稱、倉庫名稱進行庫存查詢;2) 進行庫存查詢同時可以查看庫存信息列表;3) 進行庫存盤點;4) 查看庫存報表,根據(jù)條件進行查詢,并可打印。表3-3 財務管理模塊模塊標識CWGL01相關數(shù)據(jù)表xsth_tab.ypxx_tab模塊名稱財務管理主要功能財務結(jié)賬、財務報表、當月結(jié)賬、當月報表調(diào)用

41、模塊銷售管理、藥品信息管理輸入操作員姓名、銷售總額、銷售退貨總額、入庫總額入庫退貨總額輸出顯示日財務表、月財務報表、結(jié)賬表算法1) 調(diào)用銷售信息表與藥品信息表,結(jié)賬后得到財務日結(jié)賬表;2) 根據(jù)財務結(jié)賬表,通過查詢條件,如日期,查看選定日期內(nèi)的財務報表信息并打??;3) 操作員根據(jù)銷售記錄和入庫以及退貨登記,進行當日或當月的結(jié)賬。表3-4 基礎信息管理模塊說明模塊標識JCXXGL01相關數(shù)據(jù)表ypxx_模塊名稱基礎信息管理模塊主要功能本模塊進行藥品、員工、客戶、供應商基本信息管理,如添加、修改、刪除調(diào)用模塊進貨管理輸入藥品、員工、客戶、供應商基本信息輸出藥品、員工、客戶、供應商基本信息表算法4) 根據(jù)藥品、員工、客戶、供應商基本信息,添加進入基本信息表;5) 修改藥品、員工、客戶、供應商基本信息;6) 刪除藥品、員工、客戶、供應商基本信息。3.3 數(shù)據(jù)庫設計 邏輯設計系統(tǒng)設計使用SQLServer2000數(shù)據(jù)庫。SQLServer2000數(shù)據(jù)庫具有完善的關系數(shù)據(jù)庫管理機制。SQLServer2000數(shù)據(jù)庫支持并發(fā)連接,允許多個用戶同時訪問數(shù)據(jù),支持大規(guī)模的數(shù)據(jù)運算,完全能夠滿足系統(tǒng)的數(shù)據(jù)處理需求31。系統(tǒng)中包含藥品、員工、客戶、供應商、操作員、倉庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論