數(shù)據(jù)挖掘期末論文_第1頁(yè)
數(shù)據(jù)挖掘期末論文_第2頁(yè)
數(shù)據(jù)挖掘期末論文_第3頁(yè)
數(shù)據(jù)挖掘期末論文_第4頁(yè)
數(shù)據(jù)挖掘期末論文_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)數(shù)據(jù)挖掘期末論文數(shù)據(jù)挖掘技術(shù)在中醫(yī)方劑研究中應(yīng)用的探討學(xué)生姓名專(zhuān)業(yè)學(xué)院2016年6月數(shù)據(jù)挖掘技術(shù)在中醫(yī)方劑研究中應(yīng)用的探討湛薇摘要:現(xiàn)有的中醫(yī)方劑數(shù)據(jù)存在冗余大的、不一致的、無(wú)效的噪聲數(shù)據(jù),降低了中醫(yī)方劑數(shù)據(jù)的利用,且其方劑數(shù)據(jù)需要更加高效的存儲(chǔ)、查詢(xún)以及共享。而數(shù)據(jù)庫(kù)技術(shù)融匯了人工智能、模式識(shí)別、模糊數(shù)學(xué)、數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)等多種技術(shù)方法專(zhuān)門(mén)用于海量數(shù)據(jù)的處理1,從而解決中醫(yī)方劑研究中所存在的問(wèn)題,提高利用效率并且發(fā)掘潛在信息。本文利用關(guān)聯(lián)規(guī)則、聚類(lèi)分析、分類(lèi)模式等數(shù)據(jù)挖掘方法,揭示方劑配伍規(guī)律的研究,對(duì)中醫(yī)方劑信息的問(wèn)題進(jìn)行探討。關(guān)鍵詞:中醫(yī)方劑;數(shù)據(jù)挖掘技術(shù);關(guān)聯(lián)規(guī)則;聚類(lèi)分析;分類(lèi)模

2、式DataminingtechnologyappliedinthestudyofprescriptionoftraditionalChinesemedicineZhanWei【Absract:ExistingintraditionalChinesemedicineprescriptiondataredundancy,bignoise,inconsistent,invaliddata,reducestheuseoftraditionalChinesemedicineprescriptiondata,andtheprescriptiondataneedtobemoreefficientstorag

3、e,queryandsharing.Andthedatabasetechnologyofartificialintelligence,patternrecognition,fuzzymathematics,database,mathematicalstatisticsandsoonthemanykindsoftechnicalmethodsspecificallyformassdataprocessing1,soastosolvetheproblemsintheresearchofTCMprescriptionsandimprovetheutilizationefficiencyandexpl

4、orepotentialinformation.Basedonassociationrule,clusteringanalysisanddataminingmethodssuchasclassificationmodel,revealsthelawofherbalresearch,discussestheproblemofprescriptionoftraditionalChinesemedicineinformation.Keywords:PrescriptionsoftraditionalChinesemedicine;Dataminingtechnology;Associationrul

5、es;Clusteringanalysis;Classificationmodel1引言中醫(yī)學(xué)信息化在這幾年來(lái)發(fā)展迅速,大量中醫(yī)方劑數(shù)據(jù)庫(kù)已被構(gòu)建與完善,但中醫(yī)方劑的數(shù)據(jù)挖掘方面依然有很多亟待解決的問(wèn)題。雖然眾多已經(jīng)構(gòu)建的方劑數(shù)據(jù)庫(kù)都是經(jīng)過(guò)一系列的校正后的結(jié)構(gòu)化數(shù)據(jù)庫(kù),但由于在浩瀚的中醫(yī)歷史之中,其年代跨度實(shí)在太大、朝代變更下使用的文字、記敘方式與特點(diǎn)的差異懸殊,使得方劑信息依然不可避免的會(huì)出現(xiàn)方劑數(shù)據(jù)不一致、錯(cuò)誤、冗余等問(wèn)題。數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)中正規(guī)地發(fā)現(xiàn)有效的、新穎的、潛在有用的,并且最終可以被讀懂的模式的過(guò)程。具有善于挖掘超大型數(shù)據(jù)庫(kù)、非手工地發(fā)現(xiàn)隱含知識(shí)、增進(jìn)人類(lèi)知識(shí)的特點(diǎn)2,因此,數(shù)

6、據(jù)挖掘技術(shù)對(duì)于中醫(yī)方劑研究所存在冗余的、不一致的、錯(cuò)誤的等一系列噪聲數(shù)據(jù)的解決具有重大意義。另一方面,而中醫(yī)方劑配伍從本質(zhì)上來(lái)說(shuō)表現(xiàn)在方與方、藥與藥、方與藥、藥與劑量,以及方藥與病、癥之間的交叉錯(cuò)綜的關(guān)聯(lián)與對(duì)應(yīng)。數(shù)據(jù)挖掘正是通過(guò)數(shù)據(jù)特征、關(guān)系、聚類(lèi)、趨向、偏差和特例現(xiàn)象深層的多維分析,來(lái)揭示數(shù)據(jù)間復(fù)雜特殊的關(guān)系,發(fā)現(xiàn)隱含規(guī)則模式和規(guī)律。2方劑配伍研究中的數(shù)據(jù)挖掘方法2.1 關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中的一項(xiàng)重要技術(shù),反映大量數(shù)據(jù)中項(xiàng)目集之間的關(guān)聯(lián)和相關(guān)聯(lián)系。關(guān)聯(lián)規(guī)則也是目前用于中醫(yī)方劑配伍研究中最經(jīng)典的一種方法,一般通過(guò)降維處理將復(fù)雜的病、癥、方、藥關(guān)系分解,研究藥與藥、方與方、藥與癥狀等兩者

7、之間的關(guān)系?;陉P(guān)聯(lián)規(guī)則的研究呈現(xiàn)如下特點(diǎn):主要研究藥與藥之間的關(guān)聯(lián)關(guān)系,其他病癥、病方之間的關(guān)系研究得較少,研究對(duì)象包括某一類(lèi)方或者治療某一病癥的方劑。研究方法不能證明具有普遍適用性;關(guān)聯(lián)規(guī)則的算法參數(shù),即最小支持度大部分為10%£右,支持度偏小,使得發(fā)現(xiàn)的關(guān)聯(lián)關(guān)系的可信度不高。2.2 聚類(lèi)分析聚類(lèi)分析即按照相似性和差異性的分布,將數(shù)據(jù)對(duì)象按照不同的屬性特征聚集為不同的類(lèi),然后結(jié)合領(lǐng)域知識(shí)對(duì)方劑的配伍規(guī)律進(jìn)行分析。聚類(lèi)分析的算法有很多種,如基于劃分的聚類(lèi)算法、基于層次的聚類(lèi)算法、基于密度的聚類(lèi)算法、基于網(wǎng)格的聚類(lèi)算法等,不同算法在不同領(lǐng)域以及數(shù)據(jù)集上得到應(yīng)用。在方劑配伍規(guī)律分析領(lǐng)域

8、,使用較多的事層次聚類(lèi)方法,也可采用模糊聚類(lèi)方法建立模糊相似矩陣類(lèi)分析藥物之間的相似度。模糊聚類(lèi)方法以模糊數(shù)學(xué)中的聚類(lèi)方法為理論基礎(chǔ),通過(guò)建立模糊矩陣最終獲得聚類(lèi)結(jié)果,其方法簡(jiǎn)單易行,在處理小數(shù)據(jù)量上可以收到較好效果。層次聚類(lèi)算法可以對(duì)給定的數(shù)據(jù)集進(jìn)行層次的分解,直到某種條件滿(mǎn)足為止,具體分為凝聚和分裂兩種方法。該算法簡(jiǎn)單快捷而且能有效地處理大數(shù)據(jù)集,但是合并或者分裂點(diǎn)的選擇至關(guān)重要,直接決定了聚類(lèi)結(jié)果的質(zhì)量。采用模糊聚類(lèi)的研究對(duì)象多是古代經(jīng)典名方,研究?jī)?nèi)容是具體方劑的組成原則,即方中君臣佐使藥物的確定,驗(yàn)證結(jié)果的方法是中醫(yī)方劑的傳統(tǒng)理論,此種研究尚處于探索階段。而其結(jié)果的準(zhǔn)確性未被廣泛驗(yàn)證,

9、但是該方法對(duì)于方劑配伍規(guī)律的理解以及配伍規(guī)范化具有重要作用。層次聚類(lèi)算法的研究對(duì)象為治療某一病癥的復(fù)方,依據(jù)單味藥功效進(jìn)行聚類(lèi),獲得若干個(gè)藥物組合類(lèi)別,結(jié)合病的臨床癥狀推斷證型和用藥,這種研究方法在一定程度上研究了藥證與藥方之間的關(guān)系,并對(duì)臨床治療疾病具有指導(dǎo)意義。2.3 分類(lèi)模式分類(lèi)模式是根據(jù)數(shù)據(jù)集的特點(diǎn)構(gòu)造一個(gè)分類(lèi)器,利用分類(lèi)器對(duì)未知的樣本賦予類(lèi)別的一種技術(shù)。分類(lèi)算法主要有決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)等。不同分類(lèi)方法會(huì)產(chǎn)生不同的分類(lèi)器,分類(lèi)器的優(yōu)劣直接影響數(shù)據(jù)挖掘的效率與準(zhǔn)確性。通過(guò)分類(lèi)模式可以實(shí)現(xiàn)多角度的方劑分類(lèi)和方劑功效的判定。在方劑的分類(lèi)模式研究當(dāng)中,目前常用的分類(lèi)算法有人工神經(jīng)

10、網(wǎng)和支持向量機(jī)方法。運(yùn)用這些方法基于已知的方劑分類(lèi)標(biāo)準(zhǔn),可以將大量方劑按照組方藥物的功效、性味或歸經(jīng)等眾多維度、多角度分成若干類(lèi),或判定單個(gè)方劑的功效,從而對(duì)理解方劑中藥與藥、藥與法、藥與證等之間的關(guān)系奠定研究基礎(chǔ)。著方面的研究雖然取得某些成果,形成了多個(gè)方劑分析系統(tǒng),但是涉及的訓(xùn)練集僅是治療某些病癥或者一部著作記載的方劑,缺乏選取大量數(shù)據(jù)對(duì)這些系統(tǒng)的分析結(jié)果進(jìn)行驗(yàn)證。因此分類(lèi)模式研究方劑配伍規(guī)律有待選擇多種算法開(kāi)展深入研究。2.4 研究方法的分析首先,從采取的數(shù)據(jù)來(lái)源看,主要有三類(lèi)。一類(lèi)是以現(xiàn)有的中醫(yī)文獻(xiàn)數(shù)據(jù)庫(kù)或者辭典為基礎(chǔ)選取治療某類(lèi)疾病的方劑作為研究的數(shù)據(jù);一類(lèi)是以某段時(shí)期的文獻(xiàn)為基礎(chǔ)選

11、取治療某類(lèi)疾病的方劑作為研究的數(shù)據(jù);還有一類(lèi)是以一些名醫(yī)的臨床治療處方作為研究數(shù)據(jù)??傮w來(lái)看,方劑文獻(xiàn)的來(lái)源趨向于多樣性,這給方法的有效性和深入性地研究帶來(lái)了難度。其次,基于當(dāng)前的文獻(xiàn)研究,可以依據(jù)擬解決的問(wèn)題對(duì)前面提到的三種數(shù)據(jù)挖掘方法的適用范圍歸類(lèi)。關(guān)聯(lián)規(guī)則所解決的問(wèn)題包括:治療某一病癥的用藥規(guī)律,即藥物間的關(guān)系;癥狀間的關(guān)系;藥和癥狀的關(guān)系;藥和證的關(guān)系。聚類(lèi)分析所解決的問(wèn)題包括:方劑中藥物君臣佐使的配伍關(guān)系;治療某一病或證的基礎(chǔ)方法。分類(lèi)模式所解決的問(wèn)題包括:方劑的功效歸納,方劑的屬性歸納。最后,從挖掘?qū)ο髞?lái)看,呈現(xiàn)多樣性。從單味藥到一類(lèi)藥;從單個(gè)復(fù)方劑或治療某一病癥的復(fù)方。其中關(guān)聯(lián)規(guī)

12、則挖掘的對(duì)象包括治療某一病癥的復(fù)方、某一類(lèi)復(fù)方、某一類(lèi)藥等,分類(lèi)模式挖掘的對(duì)象包括某一類(lèi)方網(wǎng)。3數(shù)據(jù)挖掘以分類(lèi)關(guān)聯(lián)規(guī)則為例,在分類(lèi)關(guān)聯(lián)規(guī)則挖掘中,支持度和置信度是描述分類(lèi)關(guān)聯(lián)規(guī)則興趣度的兩項(xiàng)重要指標(biāo)。支持度反映規(guī)則的普遍性,置信度反映規(guī)則的可靠性4。若最小支持度閾值取2%猶豫傷寒雜病論中的方劑數(shù)量為286首,286X2%>5,意味著要選擇頻次大于5的要不進(jìn)行分析。綜合仲景標(biāo)準(zhǔn)DB數(shù)據(jù)庫(kù),認(rèn)為此最小支持度閾值的取值對(duì)研究可行。置信度白公式Confidence(A->B)=P(AIB),揭示了A出現(xiàn)時(shí),B是否也會(huì)出現(xiàn)或有多大的概率出現(xiàn)。如果置信度為100%W說(shuō)明A出現(xiàn)時(shí)B必定會(huì)出現(xiàn);如

13、果置信度太低,則說(shuō)明A的出現(xiàn)于B是否出現(xiàn)關(guān)系不大,故最小置信度閾值為50%數(shù)據(jù)挖掘部分結(jié)果如表1至3所示。技1Zf西己IHlhl內(nèi)關(guān)打工W見(jiàn)Ml表守趣則削忤次Mg后ft里歸度現(xiàn)刈中各類(lèi)n一(h-配伍(哂性(X>bAUtic"-'-5H令人什皎A杯楨)一131舊T-一»-+-*»*H7(為療八隨比)*1M1IOUMK11M3aa.-4口一105(人電八廣1術(shù)一<-*1<X)心<>13一一-F-r-.八21CM<'1A口l1ft卜一回|IM1機(jī)*1125-*-a-*-a-表之方劑配伍與炳仁E關(guān)聯(lián)現(xiàn)則較庠琳則面杵現(xiàn)M后

14、件M值度理則迎叫加件號(hào)t方刑配伍(病t毋)w散領(lǐng)政力劑數(shù),P-F«.»*-,pn*31H-卓門(mén)H8小蟀幀】一iMSQ714ISa-««WT+a+«a«««*s7半鴕卿華A短詠戶(hù)1iM比5710721-M-*a*-*-»-12ri.空八人跟四黃萼卜一<MUXIONBB24*a*-*-NBB-u-22f1&A附子>一(4>)72.7,K1155-X=-*-*-H4=-2Sf半旦人十美"兒荽f(哄門(mén))HHk775K-上-*-*-*-»a-表3方刑配伍L(zhǎng)同於左聯(lián)覘則表

15、仔規(guī)則的件規(guī)則后件置信度MM戰(zhàn)婚前件各類(lèi)號(hào)方劑配伍)f耦箝)(惴i二款頤數(shù)方劑粗111T草丸也枝兒大學(xué)立大黃ItL詡iao66他27,麻黃人細(xì)辛A黃連1一南明心100'1FTII回附于上耳樸1*1少用病】LOO66fi511自芍A人器人黃茶J一19同病1100I2.17)=+B-14-F*WPFIB»-i-P-F桂枝A阿腹1f【厥陰病1100447通過(guò)數(shù)據(jù)挖掘,發(fā)現(xiàn)以下規(guī)律:按病性歸類(lèi)時(shí),多選用麻黃、桂枝、生姜、大蔥等辛熱之品來(lái)治療寒證;多選用黃苓與其他補(bǔ)虛或?yàn)a火實(shí)藥配伍來(lái)治療熱證;多用茯苓、甘草、附子、白術(shù)等來(lái)治療虛證;多用甘草、麻黃、杏仁等藥來(lái)治療在表的疾病;病位在里的疾病,如治療病位在脾胃的疾病則多選用細(xì)辛、五味子、半夏、干姜等;治療病位在膽的則多選用柴胡、黃苓等。按病勢(shì)歸類(lèi)時(shí),發(fā)現(xiàn)治療太陽(yáng)病時(shí)一般選用桂枝、生姜、甘草、大棗、大黃;治療陽(yáng)明病一般選用黃連、柴胡等;治療少陽(yáng)病一般選用桂枝、白芍、大棗、甘草、厚樸等;治療少陰病一般選川烏、人參、白芍、黃茂等。綜上,得出傷寒雜病論中的條文在治療疾病時(shí)。多根據(jù)所治疾病的病性、病位和病勢(shì)的不同來(lái)選擇、搭配使用不同藥物。4總結(jié)本文分析了數(shù)據(jù)挖掘技術(shù)在中醫(yī)方劑研究中應(yīng)用的探討,對(duì)幾種方劑配伍研究中的數(shù)據(jù)挖掘方法進(jìn)行詳細(xì)的分析,也利用數(shù)據(jù)挖掘技術(shù)研究傷寒雜病論中的方劑藥物配伍規(guī)律,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論