基于數(shù)據(jù)挖掘的骨腫瘤診斷知識(shí)自動(dòng)獲取技術(shù)_第1頁(yè)
基于數(shù)據(jù)挖掘的骨腫瘤診斷知識(shí)自動(dòng)獲取技術(shù)_第2頁(yè)
基于數(shù)據(jù)挖掘的骨腫瘤診斷知識(shí)自動(dòng)獲取技術(shù)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于數(shù)據(jù)挖掘的骨腫瘤診斷知識(shí)自動(dòng)獲取技術(shù)

0快速、有效的建立不同的:mdrbr的數(shù)據(jù)挖掘方法隨著醫(yī)院信息基礎(chǔ)設(shè)施的加快,患者信息數(shù)據(jù)不斷積累,為建立疾病的輔助診斷專家體系奠定了基礎(chǔ)。如何快速有效地建立一個(gè)完整的數(shù)據(jù)庫(kù)是被公認(rèn)的專家系統(tǒng)的瓶頸。在本研究中,我們使用基于粗厚集理論的挖掘方法,使用mdrbr算法(最小分散理論的搜索方法)來(lái)探索受信任的規(guī)則,自動(dòng)獲取已知的數(shù)據(jù),并自動(dòng)獲得具有價(jià)值的信息。1壓縮和再提取對(duì)已確診病例數(shù)據(jù)庫(kù)進(jìn)行分析時(shí),在保留基本診斷知識(shí)對(duì)骨腫瘤疾病診斷的分類能力的基礎(chǔ)上,消除重復(fù)、冗余以及無(wú)用的知識(shí),實(shí)現(xiàn)對(duì)知識(shí)的壓縮和再提煉.2數(shù)據(jù)庫(kù)的簡(jiǎn)單數(shù)學(xué)模型2.1n矩陣中屬性組合數(shù)所謂的最佳屬性化簡(jiǎn)是指:在保持原有數(shù)據(jù)的分類能力不降低的情況下,使化簡(jiǎn)后得到的屬性數(shù)最少,或最終得到的規(guī)則最簡(jiǎn),或全部數(shù)據(jù)化簡(jiǎn)量最大.這一過(guò)程是基于可辨識(shí)矩陣完成的.可辨識(shí)矩陣定義為:令S={U,A}是一個(gè)信息系統(tǒng),U為定義域且U={x1,x2,...,xn},A是條件屬性集合,D是決策屬性,a(x)是記錄x在屬性a上的值,可辨識(shí)矩陣可表示為:(cij)=?????{a∈A:a(xi)≠a(xj)}0?1,a(xi)=a(xj)D(xi)≠D(xj)D(xi)=D(xj)D(xi)≠D(xj)(cij)={{a∈A:a(xi)≠a(xj)}D(xi)≠D(xj)0D(xi)=D(xj)-1,a(xi)=a(xj)D(xi)≠D(xj)其中i,j=1,2,3,...,n矩陣中屬性組合數(shù)為1時(shí)表明:除屬性外,其余條件屬性無(wú)法將信息表中決策不同的兩條記錄分出來(lái),核屬性之外的其余有用屬性應(yīng)從屬性組合數(shù)不為1的矩陣元素中分析取得.2.2信息過(guò)濾算法在決策系統(tǒng)中進(jìn)行分類規(guī)則挖掘時(shí),使用可信度來(lái)對(duì)一個(gè)規(guī)則進(jìn)行評(píng)估.但是一個(gè)具有正確的高可信度的規(guī)則并不能保證其是有效的.當(dāng)一個(gè)信息系統(tǒng)中的信息粒度較高時(shí)(規(guī)則的統(tǒng)計(jì)意義的值往往是很高的),這時(shí)我們采用一種基于粗糙集理論的信息過(guò)濾算法.下面給出具體的信息過(guò)濾算法:步驟1:對(duì)每一個(gè)信息表記錄q,計(jì)算其等價(jià)類集合P({q});步驟2:對(duì)每一個(gè)q的屬性值進(jìn)行排序,考慮其任意兩個(gè)相鄰的屬性值qi和qj,并假設(shè)其對(duì)應(yīng)的對(duì)象是ui和uj:如果[ui]q和[uj]q是決策屬性D確定的,并且存在Yi0∈P(D)有[ui]q=Yi0和[uj]q=Yi0,則將屬性值qi和qj合并,記為qij.步驟3:在上述處理后的信息系統(tǒng)中,如果存在有不同的屬性值qi和qj,并假設(shè)其對(duì)應(yīng)的對(duì)象是ui和uj:如果[ui]q和[uj]q是決策屬性D確定的,并且存在Yi0∈P(D)有[ui]q=Yi0和[uj]q=Yi0,則將屬性值qi和qj合并,記為qij.步驟4:結(jié)束.2.3至上的搜索策略由于屬性值的遺漏或噪聲,或還存在人們尚未使用的診斷屬性,確診病例中同樣的決策屬性并不能完全映象到同一分類,而是映象到兩個(gè)以上的決策類時(shí),這時(shí)就會(huì)產(chǎn)生默認(rèn)規(guī)則,默認(rèn)規(guī)則盡管不是百分之百正確,在大部分情況下都是可以正確使用的.在用粗糙集產(chǎn)生分類規(guī)則時(shí),我們既要考慮所產(chǎn)生規(guī)則的信賴度,也考慮規(guī)則的支持度.如果某條規(guī)則的支持度小于給定的閾值,就可以認(rèn)為這條規(guī)則為噪音干擾所致,不作為合理的規(guī)則提交,可以先放在備選案例數(shù)據(jù)庫(kù)中,供以后進(jìn)一步分析使用.醫(yī)生實(shí)際分析問(wèn)題的過(guò)程是一個(gè)從粗糙到精密的過(guò)程.即首先考慮較少量的屬性,再逐漸增加屬性,直至問(wèn)題的解決.基于上述分析,我們采用自下而上的搜索策略.具體算法如下:輸入:信息系統(tǒng)I,支持度閾值0≤μs≤1,信賴度閾值0≤μc≤1輸出:此信息系統(tǒng)上的確定性規(guī)則和默認(rèn)規(guī)則集合:第一步:CNi表示節(jié)點(diǎn)Ni上的屬性值;RNi表示節(jié)點(diǎn)Ni上產(chǎn)生的規(guī)則集;算法產(chǎn)生的規(guī)則集R=Ф;第二步:設(shè)底層節(jié)點(diǎn)N0所對(duì)應(yīng)的屬性集為CN0,在N0節(jié)點(diǎn)上產(chǎn)生的規(guī)則RN0=CreateRule(U,D,CN0,μs,μc);R=R+RN0第三步:①循環(huán):j從1到|D|,執(zhí)行:對(duì)第i層上的節(jié)點(diǎn)Nij上生成規(guī)則RNij=CreateRule(U,D,CNij,μs,μc);R=R+RNij;②生成第i-1層上產(chǎn)生的默認(rèn)規(guī)則的例外(blocks);第四步:結(jié)束.3數(shù)據(jù)庫(kù)設(shè)計(jì)與分析從唐都醫(yī)院全軍骨腫瘤研究所獲得已確診病例資料100份,使用SQLSERVER2000數(shù)據(jù)庫(kù)作為后臺(tái)數(shù)據(jù)庫(kù)系統(tǒng),建立患者通用信息表、臨床表現(xiàn)記錄表、化驗(yàn)檢查記錄表、X線平片圖像參數(shù)表、造影檢查記錄表、MRI及CT檢查表和病理檢查記錄表共7個(gè)基本數(shù)據(jù)表.使用BorlandC++6.0通用程序設(shè)計(jì)語(yǔ)言進(jìn)行編程.生成的知識(shí)庫(kù)的決策樹形式,在知識(shí)數(shù)據(jù)庫(kù)中存儲(chǔ).知識(shí)自動(dòng)獲取程序模塊運(yùn)行生成一個(gè)帶有29個(gè)節(jié)點(diǎn)的決策樹,將數(shù)據(jù)庫(kù)中的43個(gè)條件屬性簡(jiǎn)化為28個(gè),決策屬性為6個(gè).數(shù)據(jù)簡(jiǎn)約量為34.9%,在不明顯降低診斷正確率的條件下,大大縮小了生成的決策樹的大小,提高了后續(xù)推理程序的運(yùn)算速度,并為事后的推理解釋打下基礎(chǔ).4基于互聯(lián)網(wǎng)的解決困難的相關(guān)研究使用基于粗糙集理論的數(shù)據(jù)挖掘技術(shù),對(duì)已確診病例數(shù)據(jù)庫(kù)進(jìn)行分析,建立骨腫瘤輔助診

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論