醫(yī)院數(shù)據(jù)挖掘管理運用_第1頁
醫(yī)院數(shù)據(jù)挖掘管理運用_第2頁
醫(yī)院數(shù)據(jù)挖掘管理運用_第3頁
醫(yī)院數(shù)據(jù)挖掘管理運用_第4頁
醫(yī)院數(shù)據(jù)挖掘管理運用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)院數(shù)據(jù)挖掘管理運用1數(shù)據(jù)挖掘技術(shù)綜述1.1數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(DataMining[1])是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程。數(shù)據(jù)挖掘可粗略地理解為三部分:數(shù)據(jù)準備(DataPreparation)、數(shù)據(jù)挖掘,以及結(jié)果的解釋評估(InterpretationandEvaluation)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到醫(yī)學信息數(shù)據(jù)庫中,可以發(fā)現(xiàn)其中的醫(yī)學診斷規(guī)則和模式,從而輔助醫(yī)生進行疾病診斷,實現(xiàn)臨床決策支持的效果。1.2數(shù)據(jù)挖掘的功能[2-6]1.2.1關(guān)聯(lián)分析數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。1.2.2分類分類就是找出一組能夠描述數(shù)據(jù)集合典型特征的模型(或函數(shù)),以便能夠分類識別未知數(shù)據(jù)的歸屬或類別,即將未知事例映射到某種離散類別之一。1.2.3聚類數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。1.2.4概念描述對含有大量數(shù)據(jù)的數(shù)據(jù)集合進行概述性的總結(jié)并獲得簡明、準確的描述,這種描述就稱為概念描述。1.2.5預(yù)測數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。1.2.6異常檢測一個數(shù)據(jù)庫中的數(shù)據(jù)一般不可能都符合分類預(yù)測或聚類分析所獲得的模型,那些不符合大多數(shù)數(shù)據(jù)對象所構(gòu)成的規(guī)律的數(shù)據(jù)對象就被稱為異常數(shù)據(jù)。1.3數(shù)據(jù)挖掘的過程數(shù)據(jù)挖掘過程[7-9]是在設(shè)計者的主動參與下進行的知識發(fā)現(xiàn)過程,是在積累了大量的數(shù)據(jù)后,從中識別出有效的、新穎的、潛在的、最終可以理解并加以有目的運用的知識。一般分為以下步驟:問題定義:清晰地定義出業(yè)務(wù)問題,認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。數(shù)據(jù)準備:①數(shù)據(jù)理解---將數(shù)據(jù)轉(zhuǎn)換成一個分析模型。這個分析模型是針對挖掘算法建立的。②數(shù)據(jù)的選擇及簡化—是根據(jù)用戶的需要從原始數(shù)據(jù)庫中抽取的一組數(shù)據(jù)。③數(shù)據(jù)的預(yù)處理--研究數(shù)據(jù)的質(zhì)量,為進一步的分析做準備。數(shù)據(jù)挖掘:對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。結(jié)果分析:解釋并評估結(jié)果。知識的優(yōu)化:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。2醫(yī)院信息系統(tǒng)中數(shù)據(jù)挖掘的研究2.1醫(yī)療數(shù)據(jù)挖掘主要分類2.1.1從數(shù)據(jù)挖掘的處理過程、功能模型、算法研究,可以將醫(yī)用數(shù)據(jù)挖掘按功能模型和挖掘?qū)ο髢蓚€方面進行如下分類[10-14]。2.1.1.1按照功能模型分類:常用的數(shù)據(jù)挖掘技術(shù)可以分成統(tǒng)計分析類、知識發(fā)現(xiàn)類、和其他類型的數(shù)據(jù)挖掘技術(shù)三大類。①統(tǒng)計分析類:統(tǒng)計是數(shù)據(jù)搜集和描述數(shù)學的一個分支。在醫(yī)療數(shù)據(jù)挖掘中的應(yīng)用如:聚類分析方法可以對DNA分析、醫(yī)學影像數(shù)據(jù)自動分析、多生理參數(shù)監(jiān)護數(shù)據(jù)分析、中醫(yī)診斷和方劑的研究、疾病危險因素分析等。②知識發(fā)現(xiàn)類:知識發(fā)現(xiàn)是用一種間接的方式從數(shù)據(jù)中抽取信息的一種技術(shù),而這些信息是隱含的、未知的,并且具有潛在應(yīng)用價值。其中可分為:a.關(guān)聯(lián)規(guī)則型知識挖掘技術(shù),是醫(yī)用數(shù)據(jù)挖掘的一種主要形式。b.神經(jīng)網(wǎng)絡(luò)型知識挖掘技術(shù)。c.遺傳算法型知識挖掘技術(shù)。d.粗糙集型知識挖掘技術(shù)。如關(guān)聯(lián)分析可以用來分析預(yù)測手術(shù)術(shù)后和藥物治療的效果,可以對某種疾病的相關(guān)發(fā)病因素進行分析以指導患者如何預(yù)防該疾病;可以對帶病DNA和健康組織的DNA基因序列進行比較,以識別出兩類基因的差別,從而得出致病因素;可以對患者的生理參數(shù)進行分析,分析各種生理參數(shù)之間的關(guān)系進而得出有意義預(yù)防與治療方案等。e.機器學習類,歸納學習方法又可分為決策樹、規(guī)則歸納等。如決策樹用于前庭區(qū)與頭暈有關(guān)的疾病診斷規(guī)則的提取。③其他類型:除以上陳述的數(shù)據(jù)挖掘技術(shù)外,近年來,隨著各種數(shù)據(jù)處理工具、先進的數(shù)據(jù)庫技術(shù)與因特網(wǎng)技術(shù)的迅速發(fā)展,還出現(xiàn)了一些其他數(shù)據(jù)挖掘技術(shù)。如文本挖掘技術(shù)、Web挖掘技術(shù)、分類分析技術(shù)、地理信息系統(tǒng)與空間數(shù)據(jù)挖掘技術(shù)以及分布式數(shù)據(jù)挖掘技術(shù)等。2.1.1.2按照挖掘?qū)ο蠓诸悾喊凑詹煌臄?shù)據(jù)類型,數(shù)據(jù)挖掘研究在時間序列數(shù)據(jù)、空間數(shù)據(jù)、文本數(shù)據(jù)、多媒體數(shù)據(jù)等方面展開。①時間序列數(shù)據(jù)(TimeSeriesData)是與時間有關(guān)的一系列數(shù)據(jù)。對時間序列數(shù)據(jù)的挖掘主要是發(fā)現(xiàn)序列中事物出現(xiàn)的周期和規(guī)律,以及不同時間序列間的同步關(guān)系。如應(yīng)用時間序列預(yù)測方法可以對醫(yī)院藥品進、銷、存產(chǎn)生的數(shù)據(jù)進行統(tǒng)計分析。②序列(Sequential)模式序列模式與關(guān)聯(lián)模式相仿,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但是序列模式分析的側(cè)重點在于分析數(shù)據(jù)之間的前因后果。如:對醫(yī)院門診和住院患者量進行預(yù)測,可以分析某種疾病發(fā)病率的變化趨勢,病死率預(yù)測等。③文本數(shù)據(jù)(TextData)就是我們一般的文字,如報刊雜志、設(shè)備維護手冊、故障描述等的內(nèi)容。④多媒體數(shù)據(jù)(MultimediaData)是隨著多媒體技術(shù)而日益涌現(xiàn)的聲音、圖形、圖像、超文本等數(shù)據(jù)。應(yīng)用領(lǐng)域例如針對大量CT、MR圖像的存儲和查詢問題而興起的基于內(nèi)容的圖像問題。由于與傳統(tǒng)的文本數(shù)據(jù)不同,因此必須采用新的挖掘手段來發(fā)現(xiàn)內(nèi)容和形式間的內(nèi)在聯(lián)系。2.1.2按應(yīng)用層面可醫(yī)院數(shù)據(jù)挖掘可分為診療信息挖掘和管理信息挖掘。診療應(yīng)用如:中山大學腫瘤防治中心的研究人員通過腫瘤分子信息和數(shù)據(jù)挖掘方法可以預(yù)測早期非小細胞肺癌5年內(nèi)是否死亡,這一預(yù)測的總正確率達87.2%,該技術(shù)一旦成熟,今后每個肺癌患者開刀做完手術(shù)后,可借此預(yù)測其5年存活情況,而且檢測費用遠比國外的基因檢測便宜;上海同濟大學附屬醫(yī)院分析糖尿病患者肌肉組織和脂肪含量與骨密度之間的聯(lián)系,得出高肌肉和高脂肪含量可以降低患者髖骨骨折的危險性;第四軍醫(yī)大利用數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù)建立了惡性血液病數(shù)據(jù)庫分析系統(tǒng)等。管理應(yīng)用如:北京協(xié)和醫(yī)院開展數(shù)據(jù)挖掘在臨床醫(yī)療管理上的研究,為醫(yī)院業(yè)務(wù)管理等提供支撐,并輔助領(lǐng)導決策;廣州南方醫(yī)院采用數(shù)據(jù)挖掘查詢系統(tǒng)查詢醫(yī)生有否開大處方,患者是否花了不該花的醫(yī)藥費,且患者有望提前治愈出院。2.2醫(yī)療數(shù)據(jù)挖掘的應(yīng)用研究2.2.1診療信息挖掘診療信息挖掘主要目的是通過患者信息分析,提供有參考作用的醫(yī)療方案。①建立患者隨訪信息庫。②臨床疾病分析、輔助診斷:如:a.判別分析:用于心臟疾病的分類;用于闌尾炎4種不同類型的判別。b.人工神系統(tǒng)網(wǎng)絡(luò):用于顱內(nèi)星形膠質(zhì)細胞瘤良、惡性的影像診斷;用于肺內(nèi)孤立結(jié)節(jié)的影像鑒別診斷。c.決策樹:糖尿病分類規(guī)則建立;前庭區(qū)與頭暈有關(guān)的疾病診斷規(guī)則的提取。2.2.2管理信息挖掘2.2.2.1財務(wù)管理[15,16]①患者費用構(gòu)成分析:患者費用由藥品、治療、檢查、手術(shù)、化驗等組成。利用數(shù)據(jù)挖掘技術(shù)可以分析醫(yī)院、科室乃至各個病區(qū)??苾?nèi)的患者費用構(gòu)成,從而能有針對性地控制費用比例,探究醫(yī)療費用項目結(jié)構(gòu)的合理性,使醫(yī)院管理者有針對性的控制醫(yī)療費用。②同期費用對比分析:利用數(shù)據(jù)挖掘技術(shù)可以按不同的時間對各個科室或各個病區(qū)同期的各種費用進行對比分析,并以各種專業(yè)報表、視圖的形式反映給醫(yī)院管理者,分析變化趨勢及可能原因。③成本效益分析:利用數(shù)據(jù)挖掘技術(shù)可以把各個不同系統(tǒng)如物資設(shè)備系統(tǒng)、財務(wù)系統(tǒng)等的數(shù)據(jù)匯總到數(shù)據(jù)倉庫,然后對醫(yī)院的成本效益情況進行全面分析,以便能真正把握醫(yī)院的經(jīng)營狀況,提高醫(yī)院的經(jīng)濟效益。例如:對醫(yī)院資金運轉(zhuǎn)情況作財務(wù)分析,了解醫(yī)院財務(wù)狀況和資金流向,分析醫(yī)院運營風險,利用數(shù)據(jù)挖掘中的環(huán)基比和定基比技術(shù)分析醫(yī)院財務(wù)資金的增長速度,并用曲線擬合來預(yù)測未來的資金需求量,為管理者決策和促進資源的有效配置提供依據(jù)。④醫(yī)保費用構(gòu)成分析:利用醫(yī)院業(yè)務(wù)數(shù)據(jù)結(jié)合醫(yī)保中心返還數(shù)據(jù)對醫(yī)保分科的定額結(jié)算進行分析,指導醫(yī)院各科室合理、高效的利用醫(yī)保資源,在醫(yī)保定額下提供更好的醫(yī)療服務(wù)。2.2.2.2醫(yī)療質(zhì)量管理[17-19]①單病種分析:以ICDlO疾病分類為標準,利用數(shù)據(jù)挖掘技術(shù)對單病種進行分析,包括住院費用、住院天數(shù)、轉(zhuǎn)歸、病情、治療方案等方面,為醫(yī)療質(zhì)量管理提供依據(jù),使醫(yī)生能夠及時總結(jié)經(jīng)驗,找出最佳治療手段,既縮短了患者的就診住院時間,減輕了患者的負擔,同時提高了醫(yī)療工作效率,增加了醫(yī)院經(jīng)濟效益。②手術(shù)室感染管理:a.手術(shù)室無菌物品及一次性用品智能備庫系統(tǒng);b.總結(jié)消毒滅菌工作與消毒效果的規(guī)律;c.預(yù)測術(shù)后切口感染合理安排手術(shù)并防止抗生素的濫用;d.利用HIS中知識解決消毒滅菌難點并杜絕差錯;e.對參觀手術(shù)人員和進修生實習生的管理;f.對手術(shù)室消毒滅菌和醫(yī)院感染常規(guī)工作動態(tài)監(jiān)測。③藥學管理:a.備藥量預(yù)測:用時間序列預(yù)測方法,對HIS中現(xiàn)有的藥品用量信息進行計算模擬,得出藥品消耗模型。b.制劑最佳批生產(chǎn)量預(yù)測:在分析醫(yī)院制劑歷年用量及近期消耗趨勢下,得出該制劑效期內(nèi)用量,并通過計算得出該制劑的最佳批生產(chǎn)量預(yù)測模型。c.治療藥物監(jiān)測:對藥物監(jiān)測(TDM)歷史數(shù)據(jù)分析、提取、加工、整合,更深層次挖掘(或發(fā)現(xiàn))一些新知識,如開展藥物群體藥動學研究、藥物濃度影響因素相關(guān)度分析等,為臨床提供更多有價值的資料,實現(xiàn)給藥個體化、提高藥物療效、降低藥物毒副反應(yīng)等。d.抗生素合理應(yīng)用自動監(jiān)控:對HIS中相關(guān)信息進行提取、分析、挖掘,對抗生素的用量、耐藥性、聯(lián)合用藥、療程、圍手術(shù)期用藥、預(yù)防用藥、用藥途徑及治療效果等指標實行自動監(jiān)控,從而實時、有效地監(jiān)測抗生素使用情況。2.2.2.3醫(yī)院經(jīng)營目標管理[20]①患者構(gòu)成分析:運用數(shù)據(jù)挖掘技術(shù)中的秩和比法對醫(yī)院門診和住院患者的地區(qū)分布、性別分布、身份分布、職業(yè)分布、年齡分布等方面進行分析,從而得到不同類型患者的經(jīng)濟狀況、需求的主要醫(yī)療服務(wù)類型等信息,了解患者差異對醫(yī)院收益的影響,從而能夠有針對性的采取措施來提高服務(wù)質(zhì)量,增加門診量和住院量。②患者流動情況分析:該功能可以分析門診患者從掛號到取藥再到離開醫(yī)院的時間分布以及住院患者從入院到出院各個就醫(yī)環(huán)節(jié)的時間分布。分析出患者的就醫(yī)瓶頸,掌握影響患者診療效率的因素,以便能針對這些因素采取措施來幫助醫(yī)院管理者進行業(yè)務(wù)流程的更新和改進,提高患者的就診效率。2.2.2.4經(jīng)營決策管理[21]①患者就診時間分析:由于患者的入院季節(jié)性較強,可以通過分析每月、每季度的門診人次、住院人次、床位周轉(zhuǎn)率,通過時間維度分析,建立灰色預(yù)測模型,來預(yù)測下一時期的門診和住院人次。根據(jù)預(yù)測信息,醫(yī)院管理者可以提出有針對性的措施,確定最優(yōu)的服務(wù)項目時間表,從而作出終止或開拓某種醫(yī)療服務(wù)項目的決定,實現(xiàn)對人力資源、醫(yī)療設(shè)施、醫(yī)療設(shè)備的適當配置。②醫(yī)療工作量影響分析:科學合理地評價醫(yī)療工作量,找出影響醫(yī)療工作量變化的主要因素,是進行醫(yī)療工作量影響分析的目的。例如:醫(yī)院收治患者數(shù)是醫(yī)院工作量的重要指標之一,直接影響醫(yī)院的經(jīng)濟效益和社會效益。利用數(shù)據(jù)挖掘技術(shù)中的灰色關(guān)聯(lián)分析方法對醫(yī)院收治患者數(shù)的影響因素進行分析:病床周轉(zhuǎn)次數(shù)、住院患者手術(shù)人次、年收治患者人數(shù)、平均開放病床數(shù)和年平均醫(yī)生人數(shù)與年收治患者數(shù)關(guān)聯(lián)程度等。2.2.2.5醫(yī)院資源管理①科室綜合評價分析:利用數(shù)據(jù)挖掘技術(shù)對醫(yī)院各科室進行綜合評價分析,選出代表性強、獨立性好,能反映科室工作效率、治療質(zhì)量、經(jīng)濟效益、綜合管理等的多項指標進行綜合評價分析,找到科室的薄弱環(huán)節(jié),并采取相應(yīng)的措施,以提高科室的綜合水平。②醫(yī)療設(shè)備績效預(yù)測分析:從HIS中的患者信息中提取病種、數(shù)量、診療類別等信息后與醫(yī)療設(shè)備使用信息相關(guān)聯(lián),利用數(shù)據(jù)挖掘技術(shù)對所得到的信息進行深層次的數(shù)據(jù)挖掘,構(gòu)建數(shù)據(jù)挖掘模型,利用已建立的數(shù)據(jù)挖掘模型,在醫(yī)療設(shè)備購置前對其績效進行預(yù)測,使醫(yī)院領(lǐng)導的決策更為準確、科學;在醫(yī)療設(shè)備投入使用后,對其績效進行準確評價,提高醫(yī)療設(shè)備的完好率和使用率。通過進一步的數(shù)據(jù)挖掘,實現(xiàn)對醫(yī)療設(shè)備從購置前的可行性論證到淘汰報廢的全程決策支持,使醫(yī)療設(shè)備的全壽命期都納入管理者的統(tǒng)籌管理之中,較好地解決醫(yī)療設(shè)備效益、代價、風險等互相制約的管理難題,充分發(fā)揮醫(yī)療設(shè)備的社會效益和經(jīng)濟效益。因此本研究具有明確的推廣應(yīng)用前景及重大應(yīng)用意義。2.3醫(yī)療數(shù)據(jù)挖掘的熱點及前景當前,數(shù)據(jù)挖掘的研究方興未艾,其研究與開發(fā)的總體水平相當于數(shù)據(jù)庫技術(shù)在20世紀70年代所處的地位,迫切需要類似于關(guān)系模式、數(shù)據(jù)挖掘系統(tǒng)和SQL查詢語言等理論和方法的指導,才能使數(shù)據(jù)挖掘的應(yīng)用得以普遍推廣。其研究可能會集中到幾個方面,而生物信息或基因的數(shù)據(jù)挖掘則是熱點之一。數(shù)據(jù)挖掘在醫(yī)院管理中的應(yīng)用將會涉及醫(yī)療及管理的各個部分及層面,數(shù)據(jù)挖掘?qū)⑿纬上到y(tǒng),并通過廣泛深入的數(shù)據(jù)挖掘產(chǎn)生醫(yī)療方案數(shù)據(jù)庫,為合理診斷、完善臨床路徑,提供有效幫助;通過數(shù)據(jù)挖掘分析達到人力資源合理配置;通過數(shù)據(jù)挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論