




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第六章第六章 醫(yī)學決策支持系統(tǒng)與數(shù)據(jù)挖掘醫(yī)學決策支持系統(tǒng)與數(shù)據(jù)挖掘第一節(jié)第一節(jié) 概述概述一、基本概念v 決策支持系統(tǒng):以管理學、運籌學、控制論和行為科學為基礎(chǔ),以計算機技術(shù)、仿真技術(shù)和信息技術(shù)為手段,針對半結(jié)構(gòu)化的決策問題,支持決策活動的具有智能作用的人機系統(tǒng)。v 醫(yī)學決策支持系統(tǒng):指將醫(yī)學知識應(yīng)用到某一患者的特定問題,提出具有最佳費用/效果比的解決方案的計算機系統(tǒng)v 醫(yī)院信息系統(tǒng)的決策支持 醫(yī)學決策支持:醫(yī)療工作中的計算機輔助決策支持 管理決策支持:計算機輔助管理決策支持v 決策支持基礎(chǔ) 統(tǒng)計學 數(shù)據(jù)倉庫 人工智能v 醫(yī)學決策支持:臨床醫(yī)生經(jīng)常為病人的診斷、治療作出決定。這些臨床決定亦即臨床
2、決策(clinical decision)。v 決策(decision making)就是為達到同一目標在眾多可以采取的方案中選擇最佳方案。v 臨床決策支持系統(tǒng):指幫助醫(yī)務(wù)人員制定臨床決策的計算機程序。二、醫(yī)學決策基本過程二、醫(yī)學決策基本過程v 邏輯推理: 如A能推出B、B能推出C,則A一定能推出C。 由于醫(yī)學中沒有嚴格的規(guī)則,所以用得少。v 歸納推理:v 啟發(fā)式推理: 上一次推理得出的結(jié)論,做為第二次循環(huán)推理的前提,循環(huán)推理,逐步求精。v 臨床上的鑒別診斷: 不同的疾病為不同的概念集合,而不同疾病之間有很多交集。 鑒別診斷:區(qū)分交集部分的不同集合。疾病A疾病B交集交集劃分非確定性的交集劃分疾
3、病A疾病B交集v 決策分析的基本步驟: 供臨床選擇的治療方法有時很多,此時要篩除一些“劣”的決策,有利于下一步的分析。 確定各決策可能的后果,并設(shè)置各種后果發(fā)生的概率。 確定決策人的偏愛,并對效用賦值。 在以上三步基礎(chǔ)上去選擇決策人最滿意的決策,即期望效用最大的決策。三、醫(yī)學決策支持系統(tǒng)的類型三、醫(yī)學決策支持系統(tǒng)的類型v 建立目的劃分: 更好了解患者狀況的系統(tǒng) 試圖提供最佳的治療決策的系統(tǒng)v 工作方式劃分 被動系統(tǒng) 半自動系統(tǒng) 主動系統(tǒng)四、醫(yī)學決策系統(tǒng)的功能四、醫(yī)學決策系統(tǒng)的功能v 用藥指導v 傳遞行政信息v 醫(yī)師指令的餓自動評價v 自動報警、提示和警戒v 診斷幫助五、五、 醫(yī)學決策支持的基本
4、方法醫(yī)學決策支持的基本方法(一)貝葉斯公式和決策理論1)事件及其相互關(guān)系v 必然事件:必然事件:在一定條件下必須出觀的現(xiàn)象 v 不可能事件:不可能事件:在一定條件下必然不出現(xiàn)的現(xiàn)象。v 隨機事件:隨機事件:在一定條件下,可能出現(xiàn)也可能不出現(xiàn)。 v “兩事件A,B中至少有一個出現(xiàn)”也是一事件,稱此事件為A,B的和,記作AUB; v 事件“A1,A2,A3,.An中至少有一出現(xiàn)稱為Al,A2An的和,記為Al UA2Un。v 若“n個事件A1,A2,A3,.An都出現(xiàn)也是一事件,則稱為A1,A2,An的交,記作:A1A2A n。2)概率與頻率v 概率概率: :可用一個小于或等于1的正數(shù)P(A)來表
5、示事件A出現(xiàn)的可能性,P(A)就稱為事件A的概率。 較大的可能性用較大的數(shù)字來標志 較小可能性的就用較小的數(shù)字來標志v 頻率頻率: :當概率值不易求出時我們往往取頻率作為概率的近似值,頻率的概念比較簡單可以很方便地求出。 3)貝葉斯定理v 條件概率條件概率: : 有時除了要知道事件的概率P(A)外,還需要知道在“事件B已出現(xiàn)”的條件下,事件A出現(xiàn)的條件概率P(A|B)。例如,我們需要知道在某疾病B發(fā)生條件下,癥狀A(yù)出現(xiàn)的概率時就要計算條件概率 P(A|B)。貝葉斯定理貝葉斯定理 nP(Di|S)=P(Di )P(S|Di)/ P(Di )P(S|Di) i=1v D1,D2,Dn分別表示n種互
6、斥的疾病,Di為第i個疾病;v P(Di)為Di的先驗概率(疾病發(fā)生的概率)。v S為用于這些疾病鑒別診斷的某一臨床表現(xiàn)或檢驗結(jié)果的組合(癥候)v P(S|Di)為疾病Di的癥狀S發(fā)生的概率;v P(Di|S)為癥狀S提示疾病Di發(fā)生的概率(后驗概率)v 先驗概率,表示醫(yī)生在具體診斷某患者前所掌握的疾病Di的發(fā)病情況。v P(S|Di)為在已知疾病Di條件下,各癥狀S出現(xiàn)的“條件概率”,即某臨床癥候A的可能性,它可以通過收集足夠數(shù)量的病例容易地得到。v P(Di|S)稱為后驗概率,表示在患者癥狀S出現(xiàn)時,患疾病Di的可能性。v 對于兩個或更多個癥狀存在的情況,仍可用貝葉斯(Bayes)公式計算
7、。在各個癥狀彼此獨立前提下,則各個癥狀同時出現(xiàn)的概率是各自單獨出現(xiàn)時其概率的乘積。因此假設(shè)各癥狀互相獨立,貝葉斯(Bayes)公式可寫為:v 在運用貝葉斯模型時須要注意的問題 模型中j種疾病互斥,先驗概率之和要為l(即要構(gòu)成一個完整的疾病群). 先驗概率的確定。參考文獻報道和歷史資料統(tǒng)計頻率作為近似估計。 條件概率的確定。 用于鑒別診斷的癥候指標是互相獨立無關(guān)的。 當計算出各后驗概率P(Hj|A)后,作為臨床判斷的依據(jù)只有當P(Hj|A)(jl,2,,n)間差距達五倍以上時方可下結(jié)論,或是當某一后驗概率值達085才下結(jié)論。 應(yīng)用舉例一: 如對某地區(qū)1207位闌尾炎思考的資料統(tǒng)計為表3-1。按慢
8、性闌尾炎、急性闌尾炎、闌尾炎穿孔三類統(tǒng)計癥候頻率(腹痛開始部位、惡心嘔吐、大便、體溫、體征及體檢結(jié)果)。 若已知慢性闌尾炎H1、急性闌尾炎H2、闌尾炎穿孔H3發(fā)生的先驗概率分別為:P(H1)0.391 P(H2)0.493 P(H3)0.116 現(xiàn)有一闌尾炎患者、開始上腹痛,之后嘔吐,腹瀉,人院體溫37全身腹肌緊張,壓痛,WBC(白細胞)數(shù)達19350。 顯然其癥侯為顯然其癥侯為B BB B1313BB2323BB3333BB4242BB5151BB6161BB73 73 , ,則則其其P(Hj|B)(jP(Hj|B)(jl l,2 2,3 3,4)4)的大小可通過公式算得。的大小可通過公式算
9、得。 v 其中,P(B|Hj)P(B13B23B33B42B51B61B73 |Hj) P(B13 | Hj) P(B23 | Hj) P(B33 | Hj) P(B42 | Hj) P(B51 | Hj) P(B61 | Hj) P(B73 | Hj) (j=l,2,3) P(B|H1) 94510-8 P(H1)P(B|H1)0351945 10-8 3695 10-8 同理P(H2) P(B|H2) =5.53 10-5 P(H3) P(B|H3) =1.136 10-4得:P(H1|B)=0.02%P(H2|B)=32.2%P(H3|B)=67.76%所以:診斷為闌尾炎穿孔(H3).
10、得:P(H1|B)=0.02%P(H2|B)=32.2%P(H3|B)=67.76%所以:診斷為闌尾炎穿孔(H3). 3、貝葉斯臨床決策系統(tǒng)設(shè)計實現(xiàn)v 貝葉斯模型與傳統(tǒng)醫(yī)生診斷的差異 貝葉斯條件概率決策診斷模型及最大似然診斷模型使用時必須預(yù)先知道所規(guī)定的全部征候表現(xiàn),然后再進行綜合分析、判斷。 臨床醫(yī)師的診斷過程常是根據(jù)已掌握的病人的臨床表現(xiàn),結(jié)合自己的知識與經(jīng)驗進行分析、判斷和逐步問診、檢查后再分析及再判斷,直至有足夠把握作出結(jié)論。 貝葉斯逐步問診模型就是仿效這種過程,進行逐步提問和逐步分析的計量診斷模型。 v舉例二:中風部位診斷?;A(chǔ)資料:在因中風造成死亡的病例中選擇發(fā)作后24小時仍處于昏
11、迷狀態(tài)的47例為對象(62歲-87歲)。 方法:在中風即刻到24小時內(nèi)患者所表現(xiàn)的癥狀中選擇六項癥狀進行研究:S1:嘔吐S2:陳施氏呼吸S3:發(fā)作后血壓上升到200mmHg以上S4:單側(cè)麻痹S5:對光反射減弱或消失S6:心房顫動 診斷疾病分類: G1:大腦前、中動脈支配區(qū)域的出血與下丘腦出血 G2:小腦出血與蛛網(wǎng)膜下腔出血 G3:大腦中動脈支配區(qū)域的栓塞 診斷表編制步驟:對47例病人按G1,G2,G3三類分組,計算出各組內(nèi)每一癥狀出現(xiàn)的頻率。由于標本數(shù)不太多,所以癥狀出現(xiàn)率為0時以0.01表示,出現(xiàn)率為1時以0.99表示。 某患者出現(xiàn)的癥狀為S1,S3,S4,S5,而S2和S6癥狀沒有出現(xiàn),根
12、據(jù)表2-7可分別計算出該患者分屬三類的似然函數(shù)。于是,LG10.83(1-0.08)0.540.830.79(1-0.01)=0.27LG20.83(1-0.01) 0.170.330.83(1-0.01)=0.04LG30.29(1-0.18) 0.010.990.24(1-0.35)=0.0005比較上面三個似然函數(shù)的大小,最大函數(shù)為LG1,因而可以判斷患者所得的病名屬于G1類:大腦前、中動脈支配區(qū)域出血。v 判斷實驗結(jié)果v 在驗證實驗結(jié)果時除了上述47例外,還利用了原來沒有考慮的腦干出血3例,腦干栓塞1例,其結(jié)果見表2-8,由表可知:病理診斷為G1類計24例,計量診斷符合20例;病理診斷
13、為G2類計6例,計量診斷符合4例;病理診斷為G3類計17例,計量診斷符合16例。v 若將病理診斷G1與G2合并后分為出血類(G1+G2)和栓塞類(G3)二大類,則病理診斷G1+G2類計30例計量診斷符合28例;栓塞17例中符合16例;同時,3例腦于出血全部符合,只有l(wèi)例腦干栓塞誤分在G1類中。 v Byes理論的局限: 難估計先驗概率與條件概率 條件之間線性無關(guān) 早期醫(yī)學決策使用(二)決策樹與決策分析(二)決策樹與決策分析v 啟發(fā)式推理形成樹型決策樹(p170)v 決策樹(decision tree)是一種能夠有效地表達復雜決策問題的數(shù)學模型主訴腹部疼痛左上腹疼痛右上腹疼痛膽囊炎右下腹疼痛左下
14、腹疼痛闌尾炎宮外孕卵巢囊腫扭轉(zhuǎn)闌尾炎闌尾炎v 決策樹由一些決策點、機會點和決策枝、機會枝組成。一般用圓圈“”表示機會點,發(fā)生的結(jié)果不在醫(yī)師的控制之下;小方框“”表示決策點,在決策點,醫(yī)師必須在幾種方案中選取一種;決策點相應(yīng)的分枝稱為決策枝;機會點相應(yīng)的分枝稱為機會枝。(P171圖8-1)v 舉例:決策樹的應(yīng)用: 最可能患胰腺癌者包括40歲以上,中腹部疼痛持續(xù)13周的人。假設(shè)這類人中胰腺癌的發(fā)生率為12。如有一種不冒什么風險的早期診斷方法對胰腺癌的檢出率為80(敏感度),但對有類似癥狀的非胰腺癌患者的假陽性率為5,用此法診斷確診的胰腺癌患者手術(shù)死亡率為10,治愈率為45。 根據(jù)上述疾病概率,診斷
15、概率和死亡、治愈概率,如對1000人進行診斷、治療,其所獲得的益處,是否比不進行診斷檢查和手術(shù)更大?可以用一個決策樹(下圖)進行分析比較。由JC Sisson等人的一個關(guān)于胰腺癌的決策樹模型 從以上決策樹可見,不作該項檢查的死亡者為12例,均為胰腺癌病人。用該項檢查手術(shù)后死亡12.5人,其中有5例為非胰腺癌病人。而且新的檢查使44例非胰腺癌患者的胰腺功能因手術(shù)而可能受到損害。因此這項檢查對病人是弊大于利,不宜使用。(三)人工智能和專家系統(tǒng)技術(shù)(三)人工智能和專家系統(tǒng)技術(shù)v 人工智能是用機器來模擬推理,學習與聯(lián)想的功能。 v 專家系統(tǒng)是指運用一個或多個專家提供的特殊領(lǐng)域知識進行推理和判斷, 以求
16、解那些需要專家才能解決的復雜問題的一種智能計算機程序。 v 以專業(yè)知識專業(yè)知識來解決困難問題的計算機程序v 以邏輯演繹或?qū)<业慕?jīng)驗法則經(jīng)驗法則來模擬人類的推理v 其過程是透過對問題特征的了解,進而向系統(tǒng)中的專家知識庫知識庫咨詢,并藉由經(jīng)驗法則的應(yīng)用,產(chǎn)生所需的答案v 專家系統(tǒng)是一種具邏輯性推理能力推理能力,以其儲存某特定領(lǐng)域或?qū)<抑R來解決現(xiàn)實問題的計算機系統(tǒng)專家系統(tǒng)的優(yōu)點(1)具有高度的針對性:)具有高度的針對性:(2)具有啟發(fā)性:)具有啟發(fā)性:(3)透明性:)透明性:(4)靈活性:)靈活性:專家系統(tǒng)的組成 (1)知識庫)知識庫v 細菌感染病治療專家系統(tǒng)細菌感染病治療專家系統(tǒng)MYCIN 的一
17、條規(guī)則如下的一條規(guī)則如下:v 如果如果: v 1) 有機體的本性不知道有機體的本性不知道,且且v 2) 有機體的染色是革蘭氏陰性有機體的染色是革蘭氏陰性,且且v 3) 有機體的形態(tài)是桿狀的有機體的形態(tài)是桿狀的,且且v 4) 有機體的需氧性是需氧的有機體的需氧性是需氧的,v 則則: 存在強有力的啟發(fā)性證據(jù)說明有機體的類別是腸細菌科。存在強有力的啟發(fā)性證據(jù)說明有機體的類別是腸細菌科。專家系統(tǒng)的組成(2)數(shù)據(jù)庫)數(shù)據(jù)庫v 在醫(yī)療專家系統(tǒng)中在醫(yī)療專家系統(tǒng)中, 數(shù)據(jù)庫中存放的是當前患者的姓名、數(shù)據(jù)庫中存放的是當前患者的姓名、年齡、癥狀等以及推理而得的結(jié)果、病情等年齡、癥狀等以及推理而得的結(jié)果、病情等 。
18、專家系統(tǒng)的組成(3)推理機)推理機v 在專家系統(tǒng)中在專家系統(tǒng)中, 推理方式有推理方式有 :v 正向推理正向推理 :v 反向推理:反向推理: v 正反向混合推理正反向混合推理 :專家系統(tǒng)的組成v 知識獲取模塊知識獲取模塊 v 它應(yīng)具有下列功能: v (1)根據(jù)實踐結(jié)果, 發(fā)現(xiàn)知識庫中不合理或錯誤的知識( 規(guī)則) , 并予以刪除。v (2) 根據(jù)實踐結(jié)果, 總結(jié)出新知識,并加入知識庫中 。專家系統(tǒng)的組成(5) 解釋接口解釋接口 v 如MYCIN中用戶與系統(tǒng)的對答:v 用戶問:你怎么知道培養(yǎng)基是從無菌源取得的?MYCIN 答:RULE 001 和RULE 002 提供了證據(jù)。v 用戶問: RULE
19、001 是如何觸發(fā)的?MYCIN 答: 已知培養(yǎng)基的無菌性取決于對該培養(yǎng)基進行檢驗的方法, 并且不知道是否小心地加以操作, 所以有很大的可能性證明培養(yǎng)基是從無菌源取得的。 專家系統(tǒng)的架構(gòu)知識庫知識擷取副系統(tǒng)推理機解釋副系統(tǒng)自然語言介面使用者問題狀況問題敘述工作區(qū)專家或知識工程師國外的開發(fā)的醫(yī)學專家系統(tǒng)我國開發(fā)的專家系統(tǒng)的疾病覆蓋情況醫(yī)學專家系統(tǒng):醫(yī)學專家系統(tǒng):MYCINv 斯坦福大學 1975 年開發(fā)v 細菌感染的醫(yī)學診斷1)血液中的細菌感染2)腦膜炎感染v 輸入:與醫(yī)師訪談后所得診斷與治療法的建議v 輸出:診斷與治療的各種建議MYCIN的結(jié)構(gòu)咨詢程序咨詢程序解釋程序解釋程序提問提問/回答回答
20、程序程序知識獲取程序知識獲取程序.病人數(shù)病人數(shù)據(jù)庫據(jù)庫知識庫知識庫MYCIN 系統(tǒng) MYCIN主要用于協(xié)助醫(yī)生診斷腦膜炎一類的細菌感染疾病。在MYCIN的知識庫里,大約存放著450條判別規(guī)則和1000條關(guān)于細菌感染方面的醫(yī)學知識。它一邊與用戶進行對話,一邊進行推理診斷。 它的推理規(guī)則稱為“產(chǎn)生式規(guī)則”,類似于:“IF(打噴嚏)OR(鼻塞)OR(咳嗽),THEN(有感冒癥狀)”這種醫(yī)生診斷疾病的經(jīng)驗總結(jié),最后顯示出它“考慮”的可能性最高的病因,并以給出用藥的建議而結(jié)束。(四)神經(jīng)網(wǎng)絡(luò)和連接系統(tǒng)(四)神經(jīng)網(wǎng)絡(luò)和連接系統(tǒng)v 人工神經(jīng)網(wǎng)絡(luò)”(ARTIFICIAL NEURAL NETWORK,簡稱A.
21、N.N.)是在對人腦組織結(jié)構(gòu)和運行機智的認識理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng)。v 人工神經(jīng)網(wǎng)絡(luò)首先要以一定的學習準則進行學習,然后才能工作。v 現(xiàn)以人工神經(jīng)網(wǎng)絡(luò)對手寫“A”、“B”兩個字母的識別為例進行說明,規(guī)定當“A”輸入網(wǎng)絡(luò)時,應(yīng)該輸出“1”,而當輸入為“B”時,輸出為“0”。所以網(wǎng)絡(luò)學習的準則應(yīng)該是:如果網(wǎng)絡(luò)作出錯誤的的判決,則通過網(wǎng)絡(luò)的學習,應(yīng)使得網(wǎng)絡(luò)減少下次犯同樣錯誤的可能性。首先,給網(wǎng)絡(luò)的各連接權(quán)值賦予(0,1)區(qū)間內(nèi)的隨機值,將“A”所對應(yīng)的圖象模式輸入給網(wǎng)絡(luò),網(wǎng)絡(luò)將輸入模式加權(quán)求和、與門限比較、再進行非線性運算,得到網(wǎng)絡(luò)的輸出。在此情況下,網(wǎng)絡(luò)輸出為“1”和“0”
22、的概率各為50%,也就是說是完全隨機的。第二節(jié)第二節(jié) 醫(yī)學決策系統(tǒng)支持相關(guān)技術(shù)醫(yī)學決策系統(tǒng)支持相關(guān)技術(shù)v 決策支持系統(tǒng)(決策支持系統(tǒng)(DSSDSS):從數(shù)據(jù)庫中找出必要的數(shù)據(jù),并利用數(shù)學模):從數(shù)據(jù)庫中找出必要的數(shù)據(jù),并利用數(shù)學模型的功能,為用戶產(chǎn)生所需的信息。型的功能,為用戶產(chǎn)生所需的信息。一、數(shù)據(jù)倉庫技術(shù)一、數(shù)據(jù)倉庫技術(shù)v 數(shù)據(jù)倉庫概念:是一個面向主題的、集成的、與時間相關(guān)的、不可數(shù)據(jù)倉庫概念:是一個面向主題的、集成的、與時間相關(guān)的、不可修改的、包含歷史數(shù)據(jù)的數(shù)據(jù)集合。它用于支持經(jīng)營管理中的決策修改的、包含歷史數(shù)據(jù)的數(shù)據(jù)集合。它用于支持經(jīng)營管理中的決策制定過程。制定過程。 數(shù)據(jù)倉庫的概念對
23、收集不同來源的數(shù)據(jù)從新的角度提出了一種新數(shù)據(jù)倉庫的概念對收集不同來源的數(shù)據(jù)從新的角度提出了一種新的結(jié)構(gòu)方法的結(jié)構(gòu)方法 數(shù)據(jù)倉庫的根本任務(wù):把信息加以整理歸納并及時提供給管理決數(shù)據(jù)倉庫的根本任務(wù):把信息加以整理歸納并及時提供給管理決策人員。策人員。 主要作用:提供報表和圖表、支持多維分析、數(shù)據(jù)挖掘的基礎(chǔ)。主要作用:提供報表和圖表、支持多維分析、數(shù)據(jù)挖掘的基礎(chǔ)。 數(shù)據(jù)倉庫的主題:是指用戶使用數(shù)據(jù)倉庫進行決策時所關(guān)心的重點方面。 面向主題:數(shù)據(jù)倉庫內(nèi)的信息是按主題進行組織,為按主題進行決策的過程提供信息。 集成:指信息是經(jīng)過系統(tǒng)加工、匯總和整理。 時間性變化:數(shù)據(jù)進入數(shù)據(jù)倉庫后,將長期被保留。 包含
24、歷史數(shù)據(jù):從過去某一時點到目前的各個階段的信息。v 數(shù)據(jù)倉庫系統(tǒng)的四個層次體系結(jié)構(gòu):(1)數(shù)據(jù)源:整個系統(tǒng)的數(shù)據(jù)源泉(2)數(shù)據(jù)的存儲與管理:不同于傳統(tǒng)的數(shù)據(jù)庫,決定了外部數(shù)據(jù)的表現(xiàn)形式。 大部分情況下,數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉庫中拿到數(shù)據(jù)挖掘庫或數(shù)據(jù)集市中。數(shù)據(jù)源數(shù)據(jù)倉庫各分公司數(shù)據(jù)集市分析數(shù)據(jù)集市數(shù)據(jù)挖掘數(shù)據(jù)集市圖1:數(shù)據(jù)挖掘庫從數(shù)據(jù)倉庫中得出v 數(shù)據(jù)挖掘庫可能是你的數(shù)據(jù)倉庫的一個邏輯上的子集,而不一定非得是物理上單獨的數(shù)據(jù)庫。v 可以把一個或幾個事務(wù)數(shù)據(jù)庫導到一個只讀的數(shù)據(jù)庫中,就把它當作數(shù)據(jù)集市,然后在他上面進行數(shù)據(jù)挖掘。 數(shù)據(jù)源數(shù)據(jù)挖掘庫圖2:數(shù)據(jù)挖掘庫從事務(wù)數(shù)據(jù)庫中得出 (3 3
25、)聯(lián)機分析處理()聯(lián)機分析處理(OLAPOLAP):對分析需要的數(shù)):對分析需要的數(shù)據(jù)進行有效集成,按多維模型進行組織,以便據(jù)進行有效集成,按多維模型進行組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么(傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么(what happenedwhat happened),),OLAPOLAP則更進一步告訴你下一步會怎則更進一步告訴你下一步會怎么樣(么樣(What nextWhat next)、和如果我采取這樣的措施又會怎)、和如果我采取這樣的措施又會怎么樣(么樣(What ifW
26、hat if)。)。(4)前端工具:報表工具、數(shù)據(jù)分析工具、查詢工具、數(shù)據(jù)挖掘工具。(P173圖8-2)二、在線分析處理技術(shù)二、在線分析處理技術(shù)(一)關(guān)系聯(lián)機分析處理(二)多維聯(lián)機在線分析處理(三)混合聯(lián)機在線分析處理 P174 圖8-3三、數(shù)據(jù)挖掘技術(shù) 所謂數(shù)據(jù)挖掘,就是從數(shù)據(jù)庫中抽取隱含的、以前未知的、具有潛在應(yīng)用價值的信息的過程。數(shù)據(jù)挖掘是KDD最核心的部分。數(shù)據(jù)挖掘與傳統(tǒng)分析工具不同的是數(shù)據(jù)挖掘使用的是基于發(fā)現(xiàn)的方法,運用模式匹配和其它算法決定數(shù)據(jù)之間的重要聯(lián)系。(一)數(shù)據(jù)挖掘支持技術(shù)v數(shù)據(jù)庫技術(shù)和人工智能技術(shù)(二)數(shù)據(jù)挖掘方法與過程(二)數(shù)據(jù)挖掘方法與過程v 方法: 決策樹 關(guān)聯(lián)規(guī)則
27、 人工神經(jīng)網(wǎng)絡(luò) 粗糙集理論 遺傳算法v 過程: 對數(shù)據(jù)庫數(shù)據(jù)整理,抽取出用來完成特定挖掘目標的數(shù)據(jù)集。 選擇合適的挖掘方法和工具,在領(lǐng)域?qū)<抑笇逻M行知識獲取研究 對事物的發(fā)展進行預(yù)測v 數(shù)據(jù)采集與處理:從數(shù)據(jù)倉庫中選取相關(guān)的數(shù)據(jù)集合。v 知識庫:指導數(shù)據(jù)挖掘和評價挖掘結(jié)果。v 數(shù)據(jù)挖掘:對數(shù)據(jù)倉庫中提取的數(shù)據(jù)進行分析處理。v 知識評價:是以興趣度作為衡量標準來查找和選擇對最終決策活動友有益的的知識。HIS 中的數(shù)據(jù)處理模型 (四)數(shù)據(jù)挖掘在醫(yī)學決策支持系統(tǒng)中的應(yīng)用(四)數(shù)據(jù)挖掘在醫(yī)學決策支持系統(tǒng)中的應(yīng)用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)v例如根據(jù)數(shù)據(jù)庫挖掘出以下三條規(guī)則:va ) 不鍛煉 ( 43
28、 年齡 48 ) 不吸煙不喝酒 女性高血壓(s=1.6%,c=20%)vb ) 不鍛煉 ( 43 年齡 48 ) 不吸煙 喝酒 女性高血壓(s=2.3%,c=22%) vc ) 不鍛煉 ( 43 年齡 48 ) 吸煙 喝酒 女性高血壓(s=2.9%,c=26%)v規(guī)則a、b、c 表明不鍛煉、吸煙、喝酒這三個危險因素如果同時存在, 將明顯增加高血壓病的發(fā)生率( 22% 26% ) 。(2) 分類規(guī)則的發(fā)現(xiàn)v 在HIS應(yīng)用中, 可以通過決策樹方法、神經(jīng)網(wǎng)絡(luò)方法等算法對數(shù)據(jù)庫中的病歷記錄進行挖掘, 參照國際疾病的編碼(ICD 9) 標準, 根據(jù)系統(tǒng)中存在疾病的相應(yīng)特征, 構(gòu)造出相應(yīng)疾病的分類模型,
29、并對每種疾病尋找出一種效果較好的治療方案。臨床應(yīng)用時, 可以將病人的病癥數(shù)據(jù)與模型中的數(shù)據(jù)相比較, 確定出疾病的類型。(3) 序列模式的發(fā)現(xiàn)v 例如: 某疾病40% 的病人會發(fā)生在7、8、9 三個月內(nèi)。另外,為了發(fā)現(xiàn)序列模式, 不僅需要知道某事件是否發(fā)生,而且需要確定知道此時間發(fā)生的時間。在HIS中, 記錄有大量病人病情變化的時間記錄??梢允占瘜Σ∪俗兓闆r, 利用相關(guān)挖掘技術(shù)發(fā)現(xiàn)序列模式。發(fā)現(xiàn)序列模式便于醫(yī)療工作人員預(yù)測病人的病情發(fā)展趨勢, 確定病情的發(fā)展時間, 從而有針對性地防止某些疾病的發(fā)生(4) 聚類分析v 聚類分析不同于分類分析, 輸入的記錄是一組未分類的記錄, 在進行聚類之前并不知道將要劃分為哪幾種類別。聚類就是將數(shù)據(jù)分到不同的類中, 要求同類數(shù)據(jù)間具有很高的相似性, 而不同類間的數(shù)據(jù)盡量不相關(guān)。在醫(yī)學中, 一些特定癥狀的聚集可能預(yù)示某種特定的疾病。HIS 中數(shù)據(jù)挖掘?qū)嵗治鯤IS 中數(shù)據(jù)挖掘?qū)嵗治?( 1 ) IF (性別= 男) AND (體重= 肥胖)AND (47 年齡 55) AND (97 血糖 571 ) THEN 高血壓比率= 66. 20%( 2 ) IF (性別= 男) AND (體重= 肥胖) AND(50 年齡 55)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 八年級物理第4章第4節(jié):光的折射
- 太陽能發(fā)電站智能維護技術(shù)考核試卷
- 有機肥料在農(nóng)業(yè)可持續(xù)發(fā)展中的作用考核試卷
- 意外傷害保險與應(yīng)急救援體系的融合考核試卷
- 學術(shù)人才引進與培養(yǎng)考核試卷
- 醫(yī)療設(shè)備在精準醫(yī)療領(lǐng)域的創(chuàng)新應(yīng)用與挑戰(zhàn)解決策略考核試卷
- 醫(yī)療器械在跨學科協(xié)作中的價值考核試卷
- 文具行業(yè)品牌年輕化考核試卷
- 動物藥品零售企業(yè)財務(wù)管理考核試卷
- 收購農(nóng)村車庫合同范本
- 汽車坡道腳手架施工方案
- 2021中國靜脈血栓栓塞癥防治抗凝藥物的選用與藥學監(jiān)護指南(2021)解讀
- 部編版六年級下冊道德與法治全冊教案教學設(shè)計
- 民兵知識小常識
- 圖形的平移與旋轉(zhuǎn)壓軸題(7個類型55題)-【??級狠S題】2023-2024學年八年級數(shù)學下冊壓軸題攻略(解析版)
- TDALN 033-2024 學生飲用奶安全規(guī)范入校管理標準
- 2024至2030年全球及中國標準履帶挖掘機行業(yè)研究及十四五規(guī)劃分析報告
- 各地分布式光伏項目電價對比
- 2024年綠化工職業(yè)技能理論知識考試題庫(含答案)
- 醫(yī)學檢驗技術(shù)專業(yè)《血液學檢驗》課程標準
- 2024年江蘇食品藥品職業(yè)技術(shù)學院單招職業(yè)技能測試題庫有完整答案
評論
0/150
提交評論