《數(shù)據(jù)挖掘》教學(xué)大綱范文_第1頁
《數(shù)據(jù)挖掘》教學(xué)大綱范文_第2頁
《數(shù)據(jù)挖掘》教學(xué)大綱范文_第3頁
《數(shù)據(jù)挖掘》教學(xué)大綱范文_第4頁
《數(shù)據(jù)挖掘》教學(xué)大綱范文_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘教學(xué)大綱1大綱文本一 課程內(nèi)容數(shù)據(jù)挖掘是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程。知識(shí)發(fā)現(xiàn)將信息變?yōu)橹R(shí),從數(shù)據(jù)礦山中找到蘊(yùn)藏的知識(shí)金塊,將為知識(shí)創(chuàng)新和知識(shí)經(jīng)濟(jì)的發(fā)展作出貢獻(xiàn)。 本課程全面而又系統(tǒng)地介紹了知識(shí)發(fā)現(xiàn)的方法和技術(shù),反映了當(dāng)前知識(shí)發(fā)現(xiàn)研究的最新成果。二 課外作業(yè)以教材中每章所附的習(xí)題為主三 實(shí)驗(yàn)實(shí)驗(yàn)一 關(guān)聯(lián)規(guī)則算法(Apriori算法)內(nèi)容:利用關(guān)聯(lián)規(guī)則算法,挖掘關(guān)聯(lián)知識(shí)。目的:了解關(guān)聯(lián)規(guī)則、頻繁集、置信度、支持度的概念。實(shí)驗(yàn)二 分類算法(C4.5算法、ID3算法)內(nèi)容: 程序?qū)崿F(xiàn)C4.5或ID3算法目的:了解信息熵的概念,掌握算法的基本設(shè)

2、計(jì)框架。實(shí)驗(yàn)三 聚類(K-means)內(nèi)容: 程序?qū)崿F(xiàn)K-means算法。目的: 了解距離、相似度等概念,掌握聚類算法的應(yīng)用實(shí)驗(yàn)四 神經(jīng)網(wǎng)絡(luò)分類(感知器算法)內(nèi)容: 使用MatLab實(shí)現(xiàn)多分類目的: 掌握神經(jīng)網(wǎng)絡(luò)的基本原理,熟悉神經(jīng)網(wǎng)絡(luò)的應(yīng)用實(shí)驗(yàn)五 遺傳算法的優(yōu)化(SGA算法)內(nèi)容:使用C+.net設(shè)計(jì)遺傳算法解決復(fù)雜函數(shù)的最優(yōu)解問題。 目的:初步掌握遺傳算法的概念實(shí)驗(yàn)要求:以上實(shí)驗(yàn),根據(jù)情況盡可能多的完成,至少選擇23個(gè)實(shí)驗(yàn)完成。四 主要參考書史忠植著,知識(shí)發(fā)現(xiàn) 清華大學(xué)出版社 2002.1各個(gè)學(xué)術(shù)刊物上的最新論文。2大綱說明一課程的目的和任務(wù) 面對(duì)日益龐大的數(shù)據(jù)資源,人們迫切需要強(qiáng)有力的工

3、具來“挖掘”其中的有用信息,數(shù)據(jù)挖掘就是針對(duì)這一需求而發(fā)展起來的一門匯集統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫、人工智能等學(xué)科內(nèi)容的新興的交叉學(xué)科,本課程深入探討數(shù)據(jù)挖掘原理,把信息科學(xué)、計(jì)算科學(xué)和統(tǒng)計(jì)學(xué)對(duì)數(shù)據(jù)挖掘的貢獻(xiàn)融合在一起,培養(yǎng)計(jì)算機(jī)專業(yè)高年級(jí)本科學(xué)生具備初步的科研能力和創(chuàng)造能力。二本課程的要求通過本課程的學(xué)習(xí),要求學(xué)生初步掌握數(shù)據(jù)挖掘的重要概念和任務(wù)、數(shù)據(jù)挖掘中的常用算法(決策樹、關(guān)聯(lián)規(guī)則、范例推理、模糊聚類法、粗糙集、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、隱馬爾科夫模型、進(jìn)化和遺傳算法、神經(jīng)網(wǎng)絡(luò)),以及數(shù)據(jù)挖掘當(dāng)前的研究動(dòng)向。三本課程與其它課程的聯(lián)系 本課程的是計(jì)算機(jī)專業(yè)的一門專業(yè)課程。學(xué)生在學(xué)習(xí)本課程之前應(yīng)

4、當(dāng)具備高等數(shù)學(xué)、線性代數(shù)、概率統(tǒng)計(jì)、程序設(shè)計(jì)語言、數(shù)據(jù)庫原理等方面的預(yù)備知識(shí)。四 各章主要講解內(nèi)容第1章 緒論1.1 知識(shí)1.2 知識(shí)發(fā)現(xiàn)1.3 知識(shí)發(fā)現(xiàn)的任務(wù)1.4 知識(shí)發(fā)現(xiàn)的方法1.5 知識(shí)發(fā)現(xiàn)的對(duì)象1.5.1 數(shù)據(jù)庫1.6 知識(shí)發(fā)現(xiàn)與創(chuàng)新第2章 決策樹2.1 歸納學(xué)習(xí)2.2 決策樹學(xué)習(xí)2.3 CLS學(xué)習(xí)算法2.4 ID3學(xué)習(xí)算法2.5 決策樹的改進(jìn)算法2.6 決策樹的評(píng)價(jià)2.7 簡化決策樹2.8 連續(xù)型屬性離散化2.9 基于偏置變換的決策樹學(xué)習(xí)算法BSDT2.10 歸納學(xué)習(xí)中的問題第3章 關(guān)聯(lián)規(guī)則3.1 關(guān)聯(lián)規(guī)則挖掘概述3.2 廣義模糊關(guān)聯(lián)規(guī)則的挖掘3.3 挖掘關(guān)聯(lián)規(guī)則的數(shù)組方法3.4

5、任意多表間關(guān)聯(lián)規(guī)則的并行挖掘3.5 基于分布式系統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法3.6 詞性標(biāo)注規(guī)則的挖掘算法與應(yīng)用第4章 基于范例的推理4.1 概述4.2 過程模型4.3 范例的表示4.4 范例的索引4.5 范例的檢索4.6 相似性關(guān)系4.7 范例的復(fù)用4.8 范例的保存4.9 基于例示的學(xué)習(xí)4.10 范例工程4.11 范例約簡算法第5章 模糊聚類5.1 概述5.2 傳遞閉包法5.3 FCMBP聚類法5.4 系統(tǒng)聚類法5.5 C均值聚類法5.6 聚類有效性5.7 聚類方法的比較第6章 粗糙集6.1 概述6.2 知識(shí)的約簡6.3 決策邏輯6.4 決策表的約簡6.5 粗糙集的擴(kuò)展模型6.6 粗糙集的實(shí)驗(yàn)系統(tǒng)

6、6.7 粗糙集的展望第7章 貝葉斯網(wǎng)絡(luò)7.1 概述7.2 貝葉斯概率基礎(chǔ)7.3 貝葉斯學(xué)習(xí)理論7.4 簡單貝葉斯學(xué)習(xí)模型7.5 貝葉斯網(wǎng)絡(luò)的建造7.6 貝葉斯?jié)撛谡Z義模型7.7 半監(jiān)督文本挖掘算法第8章 支持向量機(jī)8.1 統(tǒng)計(jì)學(xué)習(xí)問題8.2 學(xué)習(xí)過程的一致性8.3 結(jié)構(gòu)風(fēng)險(xiǎn)最小歸納原理8.4 支持向量機(jī)8.5 核函數(shù)8.6 基于分類超曲面的海量數(shù)據(jù)分類方法第9章 隱馬爾科夫模型9.1 馬爾科夫過程9.2 隱馬爾科夫模型9.3 似然概率和前反向算法9.4 學(xué)習(xí)算法9.5 基于狀態(tài)駐留時(shí)間的分段概率模型第10章 神經(jīng)網(wǎng)絡(luò)10.1 概述10.2 人工神經(jīng)元及感知機(jī)模型10.3 前向神經(jīng)網(wǎng)絡(luò)10.4

7、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)10.5 反饋神經(jīng)網(wǎng)絡(luò)10.6 隨機(jī)神經(jīng)網(wǎng)絡(luò)10.7 自組織特征映射神經(jīng)網(wǎng)絡(luò)第11章 進(jìn)化和遺傳算法11.1 概述11.2 基本遺傳算法11.3 遺傳算法的數(shù)學(xué)理論11.4 遺傳算法的基本實(shí)現(xiàn)技術(shù)11.5 遺傳算法的高級(jí)實(shí)現(xiàn)技術(shù)11.6 并行遺傳算法11.7 遺傳算法應(yīng)用第12章 知識(shí)發(fā)現(xiàn)平臺(tái)MSMiner12.1 概述12.2 數(shù)據(jù)倉庫12.3 MSMiner的體系結(jié)構(gòu)12.4 元數(shù)據(jù)管理12.5 數(shù)據(jù)倉庫管理器12.6 算法庫管理12.7 數(shù)據(jù)挖掘任務(wù)規(guī)劃12.8 關(guān)系數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)查詢語言KDSQI第13章 Web知識(shí)發(fā)現(xiàn)13.1 概述13.2 Web知識(shí)發(fā)現(xiàn)的任務(wù)13

8、.3 Web知識(shí)發(fā)現(xiàn)方法13.4 模型質(zhì)量評(píng)價(jià)13.5 文本分析功能13.6 文本特征的提取13.7 基于文本挖掘的漢語詞性自動(dòng)標(biāo)注研究13.8 文本分類13.9 文本聚類13.10 文本摘要13.11 用戶興趣挖掘第14章 生物信息知識(shí)發(fā)現(xiàn)14.1 概述14.2 基因的基本結(jié)構(gòu)14.3 生物信息數(shù)據(jù)庫與查詢14.4 序列比對(duì)14.5 核酸與蛋白質(zhì)結(jié)構(gòu)和功能的預(yù)測分析14.6 基因組序列信息分析14.7 功能基因組相關(guān)信息分析14.8 Internet資源和公共數(shù)據(jù)庫 五 實(shí)驗(yàn)要求認(rèn)真完成每個(gè)實(shí)驗(yàn),并寫出實(shí)驗(yàn)報(bào)告六學(xué)時(shí)分配表本課程大綱適用于計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),總學(xué)時(shí)為48學(xué)時(shí)第1章 緒論2學(xué)時(shí)第2章 決策樹4學(xué)時(shí)第3章 關(guān)聯(lián)規(guī)則4學(xué)時(shí)第4章 基于范例的推理4學(xué)時(shí)第5章 模糊聚類4學(xué)時(shí)第6章

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論