版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
實(shí)驗四數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)一、目的掌握數(shù)據(jù)挖掘工具Clementine的基本方法與操作。二、任務(wù)利用Clementine對藥物數(shù)據(jù)進(jìn)行簡單的數(shù)據(jù)挖掘操作,熟悉數(shù)據(jù)挖掘的基本步驟。三、要求了解數(shù)據(jù)挖掘的基本步驟,完成針對給定數(shù)據(jù)的決策樹挖撤關(guān)聯(lián)規(guī)則分析/聚類分析,并寫出實(shí)驗報告。四、實(shí)驗內(nèi)容利用Clementine對Drug.txt中藥物研究數(shù)據(jù)進(jìn)行決策樹、關(guān)聯(lián)規(guī)則分析,觀察挖掘的結(jié)果,比較這些方法挖掘結(jié)果的異同,根據(jù)觀察的結(jié)果寫出實(shí)驗報告。注:藥物研究數(shù)據(jù)來源于對治療同一疾病病人的處方,這些病人服用不同藥物,取得了相同效果。其中所含數(shù)據(jù)項如下:Age:年齡Cholesterol:膽固醇(Normal\High)Sex:性別(M\F)Na:唾液中鈉元素含量Drug:病人所服藥物種類(A/B/C/X/Y)K:唾液中鉀元素含量BP:血壓(High\Normal\Low)希望通過數(shù)據(jù)挖掘發(fā)現(xiàn)這些處方中隱藏的規(guī)律,給出不同臨床特征病人更適合服務(wù)哪種藥物的建議,為未來醫(yī)生填寫處方提供參考。五、實(shí)驗環(huán)境1、硬件:P4/256MB臺式計算機(jī)2、軟件:Windows2000Professional/SQLServer2000/Clementine8.1及以上3、數(shù)據(jù):Drugs數(shù)據(jù)(文件Drug.txt)六、步驟(一)啟動clementine雙擊桌面數(shù)據(jù)挖掘工具“clementine8.1”圖標(biāo)或C:\Clementine8.1\bin\Clementine.exe,即可啟動該挖掘工具,界面如圖4-1所示。HepatitisFavoritesNeuralPCA/FactorLogisticServer:LocalSen/er(unsavedprojedMBusinessUiKohonenK-MeansTwoStepApriori=1旦|乂FileEditInsertViewToolsSuperNodeWindowHelpModelsStreamsOutputsHepatitisFavoritesNeuralPCA/FactorLogisticServer:LocalSen/er(unsavedprojedMBusinessUiKohonenK-MeansTwoStepApriori=1旦|乂FileEditInsertViewToolsSuperNodeWindowHelpModelsStreamsOutputs挖掘工具區(qū)classClassesCRISP-DM僉7主工作區(qū)?StrEaml*-匚1響已[1日[1已8.1^Clementine-挖掘流(stream)操作(1)新建:File菜單->NewStream命令(2)保存/另存:File菜單->SaveStream/SaveStreamAs..命令3指定保存位置、文件名稱3保存按鈕(3)打開:File菜單3OpenStream...命令3指定要打開流的位置、文件名稱3打開按鈕挖掘步驟(1)建立連接數(shù)據(jù)源1)在挖掘工具區(qū)選項卡"Sources”中將“Var.File”節(jié)點(diǎn)拖入到主工作區(qū)。2)右擊該節(jié)點(diǎn),選擇“Edit”命令,并選擇“File”選項卡,顯示如圖4-2所示界面圖4-2數(shù)據(jù)源編輯器3)指定數(shù)據(jù)來源的文件名,設(shè)定源數(shù)據(jù)存放格式(如是否從文件中讀取字段名、數(shù)據(jù)分隔符號、…)4)如需要對數(shù)據(jù)進(jìn)行過濾則可在圖4-2界面中選擇“Filter”選卡;如需要對數(shù)據(jù)類型進(jìn)行轉(zhuǎn)換則可在圖4-2界面中選擇“Types”選卡。設(shè)置完后,單擊“OK”/"Apply”按鈕,完成數(shù)據(jù)源連接。(2)指定挖掘模型在挖掘工具區(qū)中選擇“Modeling”選卡,將合適的挖掘模型拖到主工作區(qū)(如C5.0)。(3)將數(shù)據(jù)源與挖掘模型連接起來右擊主工作區(qū)中所建立的數(shù)據(jù)源,選擇“Connect...”命令,再單擊要與該數(shù)據(jù)源連接的挖掘模型。(4)設(shè)置挖掘模型右擊主工作區(qū)中的挖掘模型,選擇“Edit”命令,如圖4-3所示。圖4-3挖掘模型設(shè)置選擇“Fields”選項卡,選擇“Usecustomsettings”,并通過下拉菜單,選擇“Target”和“Inputs”數(shù)據(jù)列,單擊“OK”關(guān)閉對話框。選擇“Model”選卡可設(shè)置模型名稱、輸出類型等,選擇“Costs”選卡則可設(shè)置訓(xùn)練的代價。執(zhí)行挖掘執(zhí)行挖掘流中的所有挖掘模型,可單擊窗口上側(cè)工具欄中按鈕“Executethecurrentstream”;只執(zhí)行指定挖掘模型,則先單擊相應(yīng)模型,再單擊窗口上側(cè)工具欄按鈕“Executeselection”。瀏覽挖掘結(jié)果挖掘結(jié)束后,將在挖掘結(jié)果區(qū)中顯示挖掘結(jié)果圖標(biāo),右擊該圖標(biāo),選擇“Browse”即可瀏覽挖掘結(jié)果。如圖4-4、4-5所示。
圖4-5挖掘結(jié)果瀏覽窗口在瀏覽窗口中,可樹狀瀏覽,也層次結(jié)構(gòu)瀏覽,還可瀏覽有關(guān)挖掘過程的總結(jié)。模型準(zhǔn)確性評價1)在結(jié)果輸出區(qū),雙擊得到的模型,模型將會在主工作區(qū)顯示出來2)右擊用于測試的數(shù)據(jù)源,選擇“Connect”命令,再單擊1)步中在主工作區(qū)中顯示的圖標(biāo),這時會將測試數(shù)據(jù)連接到需要測試的模型上。3)在挖掘工具區(qū)的“output”選項卡中,將“Analysis”節(jié)點(diǎn)拖放到主工作區(qū),并將其連接到需要測試分析的節(jié)點(diǎn)上。4)執(zhí)行節(jié)點(diǎn)Analysis節(jié)點(diǎn),得到如圖4-6所示的界面。醫(yī)學(xué)決策支持系統(tǒng)實(shí)驗報告班級學(xué)號姓名實(shí)驗名稱實(shí)驗四數(shù)據(jù)挖掘指導(dǎo)老師日期2015-6-12醫(yī)藥信息系醫(yī)院信息系統(tǒng)教研室實(shí)驗四數(shù)據(jù)挖掘一、目的掌握數(shù)據(jù)挖掘的基本方法與操作。二、任務(wù)利用Clementine對藥物數(shù)據(jù)進(jìn)行簡單的數(shù)據(jù)挖掘操作,熟悉數(shù)據(jù)挖掘的基本步驟。三、要求了解數(shù)據(jù)挖掘的基本步驟,完成針對給定數(shù)據(jù)的決策樹挖掘/關(guān)聯(lián)規(guī)則挖掘,并寫出實(shí)驗報告。四、實(shí)驗內(nèi)容利用Clementine對Drug.txt中藥物研究數(shù)據(jù)進(jìn)行決策樹、關(guān)聯(lián)規(guī)則分析,觀察挖掘的結(jié)果,比較這些方法挖掘結(jié)果的異同,根據(jù)觀察的結(jié)果寫出實(shí)驗報告。注:藥物研究數(shù)據(jù)來源于對治療同一疾病病人的處方,這些病人服用不同藥物,取得了相同效果。其中所含數(shù)據(jù)項如下:Age:年齡Cholesterol:膽固醇(Normal\High)Sex:性別(M\F)Na:唾液中鈉元素含量Drug:病人所服藥物種類(A/B/C/X/Y)K:唾液中鉀元素含量BP:血壓(High\Normal\Low)五、希望通過數(shù)據(jù)挖掘發(fā)現(xiàn)這些處方中隱藏的規(guī)律,給出不同臨床特征病人更適合服務(wù)哪種藥物的建議,為未來醫(yī)生填寫處方提供參考。六、實(shí)驗環(huán)境硬件:P4/256MB臺式計算機(jī)軟件:Windows2000Professional/SQLServer2000/Clementine8.1數(shù)據(jù):Drugs數(shù)據(jù)(文件Drug.txt)七、實(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年商鋪買賣合同
- 債權(quán)收益權(quán)轉(zhuǎn)讓合同
- 生物醫(yī)藥科技與臨床試驗作業(yè)指導(dǎo)書
- 生產(chǎn)流程優(yōu)化與改進(jìn)作業(yè)指導(dǎo)書
- 易錯題專項:單元專項Unit 3 八 連詞成句 三年級英語上冊 譯林版(三起)含答案
- 環(huán)境友好型搪瓷涂料
- 2023-2024學(xué)年全國小學(xué)二年級上語文仁愛版期末試卷(含答案解析)
- 2024版重慶市榨菜原料種植訂購合同(參考文本)
- 2024版天幕合同合同
- 2024版政府采購供貨合同(網(wǎng)絡(luò)安全隔離卡)
- 學(xué)生學(xué)校退學(xué)證明模板
- 烏洛托品工藝技術(shù)規(guī)程
- 2023年中國鐵塔股份有限公司招聘筆試題庫及答案解析
- NB-T 10640-2021 風(fēng)電場運(yùn)行風(fēng)險管理規(guī)程
- 小學(xué)語文課程標(biāo)準(zhǔn)(2023年版)
- GB/T 24160-2022車用壓縮天然氣鋼質(zhì)內(nèi)膽環(huán)向纏繞氣瓶
- GB/T 13869-2017用電安全導(dǎo)則
- GB/T 13448-2006彩色涂層鋼板及鋼帶試驗方法
- GB/T 12807-2021實(shí)驗室玻璃儀器分度吸量管
- 財務(wù)流程介紹課件
- 機(jī)械通氣過程中的霧化治療
評論
0/150
提交評論