基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究_第1頁
基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究_第2頁
基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究_第3頁
基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究_第4頁
基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療規(guī)律研究

1基于數(shù)據(jù)挖掘技術(shù)的中醫(yī)診斷與治療三大挑戰(zhàn)的研究背景與點(diǎn)中醫(yī)是中國(guó)的傳統(tǒng)醫(yī)學(xué),幾千年來為中華民族的繁榮做出了重要貢獻(xiàn),但現(xiàn)代中醫(yī)的發(fā)展也面臨許多挑戰(zhàn)。中醫(yī)在理論和臨床上是獨(dú)立的,疾病是由治療而治理的,重復(fù)是不佳的,這給中醫(yī)治療的應(yīng)用、傳承和發(fā)展帶來了很大困難。中醫(yī)文化中豐富而悠久的歷史,融合了許多著名中醫(yī)專家的學(xué)術(shù)和臨床醫(yī)學(xué)資源,運(yùn)用現(xiàn)代挖掘技術(shù)研究了中醫(yī)診斷和治療的規(guī)律。促進(jìn)中醫(yī)文化的學(xué)術(shù)研究和現(xiàn)代中醫(yī)的發(fā)展。數(shù)據(jù)挖掘是從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)現(xiàn)隱藏的、未知的和有用的信息的過程.近年來,從不斷膨脹的醫(yī)院數(shù)據(jù)庫(kù)提取有用信息為疾病的診斷和治療提供科學(xué)的決策,已成為人們關(guān)注的焦點(diǎn).本研究的基本思路是在收集眾多治療典型病例的醫(yī)案的基礎(chǔ)上,從不完整甚至不一致的數(shù)據(jù)中,利用數(shù)據(jù)挖掘技術(shù),挖掘出典型病例的用藥規(guī)律.2證候、證素的概念中醫(yī)診斷主要依靠望、聞、問、切四診收集脈象、舌像、神色形態(tài)、癥狀等的機(jī)體反應(yīng)來診察疾病,“辨證論治”是中醫(yī)的基本特征之一.在中醫(yī)的臨床診療過程中,患者所表現(xiàn)的各種癥狀和體征,是辨證的依據(jù),稱為“證候”;通過對(duì)證候的辨識(shí)而確定的病理本質(zhì),稱為“證素”;由病位、病性證素所構(gòu)成的診斷名稱,稱為“證名”.證候、證素和證名,共同組成了“證素辨證體系”.證素辨證研究的核心問題是證素的確認(rèn),即通過臨床收集到的信息尋找構(gòu)成證的基本元素.如果一組癥狀群呈現(xiàn)穩(wěn)定的相互關(guān)系,就可以確定病位與病性的最小單位.準(zhǔn)確地判斷證素,便抓住了疾病當(dāng)前的病理本質(zhì).臨床上收集的四診資料存在不完整性、含噪聲和不一致性等特點(diǎn),不能直接用于數(shù)據(jù)挖掘.在進(jìn)行數(shù)據(jù)挖掘之前,必須對(duì)中醫(yī)臨床上的數(shù)據(jù)進(jìn)行規(guī)范化的預(yù)處理,圖1是中醫(yī)臨床數(shù)據(jù)規(guī)范化預(yù)處理的流程圖.3關(guān)聯(lián)規(guī)則技術(shù)的應(yīng)用數(shù)據(jù)挖掘的方法有關(guān)聯(lián)規(guī)則、序列模式、神經(jīng)網(wǎng)絡(luò)、分類規(guī)則和聚類分析等,采用不同的技術(shù)可以發(fā)現(xiàn)不同類型的知識(shí).本文主要介紹關(guān)聯(lián)規(guī)則技術(shù)在肝病中醫(yī)診斷上的應(yīng)用,找出肝病的癥狀與處方、癥狀與辨證、辨證與處方之間的關(guān)聯(lián)規(guī)則.3.1d的挖掘過程設(shè)D是事務(wù)數(shù)據(jù)庫(kù),I=(i1,i2,…,im)是所有項(xiàng)目的集合,其中Ij,j=1,…,m是一個(gè)項(xiàng)目.每個(gè)事務(wù)Ti是一個(gè)項(xiàng)集,Ti?I.定義1設(shè)A,B為項(xiàng)集,則稱A→B為規(guī)則,其中A?I,B?I,且A∩B=φ.定義2設(shè)D是事務(wù)集,A,B為項(xiàng)集,且有規(guī)則A→B.如果D中包含A∪B事務(wù)的比例為s%,稱A→B有支持度s%,即概率P(A∪B).定義3設(shè)D是事務(wù)集,A,B為項(xiàng)集,且有規(guī)則A→B.若D中,c%的事務(wù)包含A的同時(shí)也包含B,則稱A→B有置信度,即條件概率P(B|A).定義4設(shè)D是事務(wù)集,A,B為項(xiàng)集,若A→B滿足最小置信度c和最小支持度s,則稱A→B為關(guān)聯(lián)規(guī)則.Support(A→B)=P(A∪B)Confidence(A→B)=P(B|A)關(guān)聯(lián)規(guī)則的挖掘過程主要包含2個(gè)階段:第一階段必須先從原始資料集合中找出所有的高頻項(xiàng)目組(FrequentItemsets),第二階段再由這些高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則(AssociationRules).3.2中醫(yī)臨床癥狀的預(yù)處理本文的數(shù)據(jù)來源為臨床和文獻(xiàn),共1128例肝病病例.這里所采用的每個(gè)病例數(shù)據(jù)都包含了癥狀、辨證、治法和處方等若干方面的信息,部分?jǐn)?shù)據(jù)如下:(1)某女,20歲癥狀:納差,惡心,厭油,口不苦,微渴喜熱飲,乏力,大便色黃,日行1~2次,尿黃而自利,皮膚瘙癢,有搔抓痕;舌質(zhì)暗,苔薄黃,舌下脈絡(luò)增粗延長(zhǎng),脈弦細(xì).辨證:濕熱血虛型.治法:清熱利濕活血.處方:茵陳15g,丹參15g,丹皮15g,杏仁15g,赤芍60g,葛根30g,瓜蔞30g,生大黃9g,半夏15g,川芎15g,梔子12g,黃苓15g.(2)某男,32歲癥狀:頻繁惡心,但無嘔吐;胸悶明顯,胸脘脹滿,納差,口黏;大便不爽,小便色黃不利,胃脘部有振水聲;舌質(zhì)紅,苔薄黃,脈弦.辨證:濕邪彌散三焦(黃疸).治法:宣暢三焦.處方:杏仁15g,蔻仁15g,生薏苡仁30g,黃芩15g,赤芍90g,葛根30g,滑石30g,茵陳15g,半夏15g,川樸15g,木通15g.…………從以上原始病例可以看出,癥狀、辨證、治法和處方都是一些中醫(yī)習(xí)慣用語,沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn).因此,在進(jìn)行研究之前,必須編制一些程序?qū)@些病歷中的癥狀術(shù)語、癥狀之間的邏輯關(guān)系、辨證、治法和方藥等做規(guī)范預(yù)處理.通過相關(guān)中醫(yī)書籍對(duì)所有的癥狀作了統(tǒng)計(jì)和歸類,得到了用于挖掘?qū)嶒?yàn)的癥狀描述,把每個(gè)癥狀用數(shù)字來表示.例如:1001代表納差,1002代表惡心……1025代表脈弦,1026代表肝掌……辨證論治是中醫(yī)認(rèn)識(shí)疾病和治療疾病的基本原則.辨證是決定治療的前提和依據(jù),論治是治療疾病的手段和方法.為了便于挖掘,把每種辨證也用數(shù)字來表示.例如:2001代表濕熱血瘀型,2002代表血瘀血熱型……2030代表營(yíng)衛(wèi)不和證,2031代表脾虛血瘀證……藥名的預(yù)處理相對(duì)比較簡(jiǎn)單,可以根據(jù)中藥庫(kù)的國(guó)家標(biāo)準(zhǔn)命名來對(duì)藥名進(jìn)行預(yù)處理.例如:3001代表萊菔子,3002代表姜半夏……3079代表茵陳,3080代表桂枝……經(jīng)過預(yù)處理的病例數(shù)據(jù)主要是用數(shù)字來表示的,并且包含了癥狀、辨證、治法、處方這四維數(shù)據(jù).根據(jù)表1所示的數(shù)據(jù)格式和內(nèi)容,這里需要挖掘癥狀與辨證、癥狀與處方、辨證與處方的制約關(guān)系的數(shù)據(jù),即:(1)基本癥狀和辨證之間的關(guān)聯(lián)規(guī)則:基本癥狀(x,Ai)→辨證(x,Bj);(2)基本癥狀和處方之間的關(guān)聯(lián)規(guī)則:基本癥狀(x,Ai)→處方(x,Dj);(3)辨證和處方之間的關(guān)聯(lián)規(guī)則:辨證(x,Bj)→處方(X,Dj).這是一個(gè)二維關(guān)聯(lián)規(guī)則挖掘模型,如果要得到癥狀與辨證、癥狀與處方、辨證與處方之間的關(guān)聯(lián)規(guī)則,可以將模型降為一維,再運(yùn)用關(guān)聯(lián)規(guī)則算法來挖掘這一維新的數(shù)據(jù),篩選挖掘結(jié)果,去掉不符合規(guī)則的,留下合適的規(guī)則,從而挖掘出癥狀與辨證、癥狀與處方、辨證與處方之間的關(guān)聯(lián)規(guī)則.本文采用頻繁模式增長(zhǎng)(frequent-Patterngrowth)的關(guān)聯(lián)算法,簡(jiǎn)稱FP-增長(zhǎng).將提供頻繁項(xiàng)集的數(shù)據(jù)庫(kù)壓縮成一棵頻繁模式樹(FP-tree),保留項(xiàng)集關(guān)聯(lián)信息;然后,將這種壓縮后的數(shù)據(jù)庫(kù)分成一組條件數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)關(guān)聯(lián)一個(gè)頻繁項(xiàng),并分別挖掘每個(gè)數(shù)據(jù)庫(kù).下面給出一個(gè)簡(jiǎn)單的例子說明基本的挖掘過程.表2是需要挖掘的事務(wù)數(shù)據(jù)庫(kù).假設(shè)現(xiàn)在要挖掘基本癥狀和處方之間的關(guān)聯(lián)規(guī)則,即基本癥狀(x,Ai)→處方(x,Dj),則需要將“基本癥狀”和“處方”這2項(xiàng)數(shù)據(jù)合并為一個(gè)新的維,設(shè)為x,合并后的病人數(shù)據(jù)如表3所示.取最小支持度為2、最小置信度為60%,運(yùn)用關(guān)聯(lián)規(guī)則得到的挖掘結(jié)果見圖2.具體步驟如下:(1)掃描合并后的病人事務(wù)數(shù)據(jù)庫(kù),收集頻繁項(xiàng)集和它們的支持度.按支持度降序排序,得到頻繁項(xiàng)表L=[3∶3,2∶3,5∶3,1∶2,4∶1].(2)創(chuàng)建FP-樹.事務(wù)數(shù)據(jù)庫(kù)中的第一條事務(wù){(diào)1,3,4},按照L中的排序?yàn)閧3,1,4},則先建立null結(jié)點(diǎn),然后依次有結(jié)點(diǎn)3、1、4,并把計(jì)數(shù)都置為l;第二條事務(wù){(diào)2,3,5},按照L中的排序?yàn)閧3,2,5},則把“3”結(jié)點(diǎn)的計(jì)數(shù)增加到2,在“3”分支下建立結(jié)點(diǎn)2和5;其余依次類推,就可以得到圖2所示的FP-tree.然后,對(duì)這個(gè)FP-tree進(jìn)行挖掘,對(duì)L中的項(xiàng)進(jìn)行倒序考慮:(1)先考慮“4”,它的路徑由分支<3,1,4∶1>形成,考慮“4”為后綴,它的對(duì)應(yīng)前綴路徑是<3,1>,但支持記數(shù)為1,小于設(shè)定的min-sup(2),所以該路徑不能產(chǎn)生頻繁模式.(2)再考慮“1”,它的路徑由分支<3,2,5,1∶1>和<3,1∶1>形成,考慮“l(fā)”為后綴,并考慮最小支持度為2,則這2個(gè)路徑均不能產(chǎn)生頻繁模式.(3)再考慮“5”,它的路徑由分支<3,2,5∶2>和<2,5∶l>形成,考慮“5”為后綴,并考慮最小支持度為2,則它的對(duì)應(yīng)前綴路徑只能是<3,2∶2>,則該路徑產(chǎn)生的頻繁模式為<3,2,5∶2>.(4)再考慮“2”,它的路徑由分支<3,2∶2>形成,考慮“2”為后綴,并考慮最小支持度為2,則它的對(duì)應(yīng)前綴路徑是<3,2>,則該路徑產(chǎn)生的頻繁模式為<3,2∶2>.挖掘過程到此結(jié)束,發(fā)現(xiàn)頻繁模式<3,2,5∶2>和<3,2∶2>,但2和3表示基本癥狀,5表示處方,則上述的2個(gè)頻繁模式只有<3,2,5∶2>符合要求,即挖掘基本癥狀和處方之間的關(guān)聯(lián)規(guī)則.因此,這個(gè)例子能得到一個(gè)頻繁集{2,3,5},非空真子集有{2},{3},{5},{2,3},{2,5},{3,5},從而得到的關(guān)聯(lián)規(guī)則及其置信度見表4.本例中1、2、3表示基本癥狀,4、5表示藥名,需要對(duì)上面的規(guī)則進(jìn)行篩選,保留含有這兩維數(shù)據(jù)并且是由基本癥狀推出藥名或由藥名推出基本癥狀的規(guī)則,最后得到2個(gè)規(guī)則見表5.表5中“5→2∧3”表示5這種藥有66%的可能性是用來治療2,3這2種病狀的;“2∧3→5”則表示2和3這2種病狀通常是用5這種藥來治的.這就是該模型的基本思想,其他幾維數(shù)據(jù)間的關(guān)聯(lián)規(guī)則也可以類似挖掘.3.2.1不同中醫(yī)知識(shí)的保肝利膽作用實(shí)驗(yàn)挖掘基本癥狀和處方之間的關(guān)聯(lián)規(guī)則,就是想得知哪些基本癥狀的組合一般是由哪些藥的組合來治療的.取最小支持度頻數(shù)為5、最小置信度為80%,得到表6中的一系列結(jié)果.從(1004,1006,1050,1002)→3079規(guī)則的置信度是100%,表明“皮膚黃”、“舌苔黃膩”、“尿黃”、“惡心”這4種癥狀同時(shí)出現(xiàn)的時(shí)候,必須要用茵陳這種藥.查閱中醫(yī)藥知識(shí)可以知道,黃疸就有“皮膚黃”、“舌苔黃膩”、“小便黃”、“惡心”這4種癥狀.黃疸是由于血清中的膽紅素升高所致,茵陳具有明顯的保肝利膽的作用,能夠促進(jìn)膽汁分泌,促進(jìn)膽酸和膽紅素排出,這說明這個(gè)關(guān)聯(lián)規(guī)則是符合中醫(yī)傳統(tǒng)知識(shí)的.3.2.2作為“納差”,一般認(rèn)為“清濕”,有“納差”,或“收縮張”,這4條主客觀上的“本說”,5.挖掘基本癥狀和辨證之間的關(guān)聯(lián)規(guī)則,就是想知道哪些癥狀的組合是何種辨證.取最小支持度頻數(shù)為3、最小置信度為60%,得到的結(jié)果見表7.從2018→(1001,1007,1049,1002),這條規(guī)則的置信度是100%,表示“脾虛濕困”這個(gè)辨證一般會(huì)有“納差”、“舌苔膩”、“大便溏瀉”、“惡心”這4種癥狀.中醫(yī)認(rèn)為脾主運(yùn)化水濕,脾虛則運(yùn)化功能低下,引起水濕停滯;水濕的停滯,反過來又影響脾的運(yùn)化,故飲食減少、胃脘滿悶、大便溏瀉,舌苔厚膩等.由此可見,這個(gè)關(guān)聯(lián)規(guī)則是符合中醫(yī)傳統(tǒng)知識(shí)的.3.2.3辨治“藥”挖掘中醫(yī)中辨證和處方之間的關(guān)聯(lián)規(guī)則可以得到對(duì)病因的用藥方法.取最小支持度頻數(shù)為5、最小置信度為80%,得到的結(jié)果見表8.關(guān)聯(lián)規(guī)則(3078,3087,3098,3013,3012)→2010的置信度為100%,表示白芍、橘皮、茯苓、木香和川楝子的組合可以用來治療“脾氣虛證”.根據(jù)傳統(tǒng)的中醫(yī)療法,脾氣虛證要用溫中健脾的方劑來治療,一般選用香砂六君子湯和黃芪建中湯加減.前方中,黨參、茯苓、白術(shù)、炙甘草為四君子湯健脾,橘皮、木香、砂仁和胃降逆;后方中,黃芪益氣補(bǔ)中,白芍、桂枝、炙甘草、生姜、大棗、怡糖為小建中湯.由上面的傳統(tǒng)經(jīng)典用藥可以知道,該規(guī)則的前4種藥都是治療脾氣虛證的必要中藥,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論