數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第1頁
數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第2頁
數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第3頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、本科課程設(shè)計(jì)及實(shí)驗(yàn)期末成績評(píng)估系統(tǒng)的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘設(shè)計(jì)課 課 學(xué) 學(xué) 學(xué) 系: 專 指 教 開稱號(hào)名號(hào) 院數(shù)據(jù)挖掘08060116cwl2008052251信息科學(xué)技術(shù)學(xué)院計(jì)算機(jī)科學(xué)系業(yè)師位間軟件工程lb信息學(xué)院計(jì)算機(jī)系20102011學(xué)年度第二 學(xué)期2011年06月20日第1章概述1.1應(yīng)用背景和問題的提出在大學(xué)生活中,我們大學(xué)生在某種程度上還是比擬重視自己的課程成績的。而有一個(gè)期末最終成績的評(píng)估系統(tǒng),無疑對(duì)同學(xué)們而言是很有用的。在這個(gè)系統(tǒng)中,只需輸入你估計(jì)的平時(shí)成績以及表現(xiàn)和期末考試的得分,就可以預(yù)測出最終的成績。而這個(gè)課程成績的組成以及得出是怎么樣的呢。這個(gè)最終的得分是受到什么影響呢

2、?本論文就以上問題進(jìn)展了探討和挖掘。1.2設(shè)計(jì)容的介紹本課程設(shè)計(jì)主要是探討和研究在教師給定成績時(shí)考慮的因素,以及這些因素所占的比例。數(shù)據(jù)倉庫為一份記錄著 600個(gè)同學(xué)的得分情況的數(shù)據(jù),數(shù)據(jù)挖掘那么采 用決策樹探究出影響結(jié)婚年齡的因素。第2章數(shù)據(jù)倉庫設(shè)計(jì)2.1概念模型設(shè)計(jì)數(shù)據(jù)倉庫里面有一個(gè)實(shí)體,也就是成績scoreo成績的決定因素有performanee也就平時(shí)表現(xiàn)情況,即根據(jù)其在課堂上的活潑程度以及認(rèn)真聽課的情況來給的分, 還有averscore就是同學(xué)平時(shí)的作業(yè)得分以及平時(shí)測試或者期中測試的平均成績,以及期末考試的成績lasttesto2.2邏輯模型設(shè)計(jì)2.3物理模型設(shè)計(jì)要解決數(shù)據(jù)的存儲(chǔ)構(gòu)造

3、、略、存儲(chǔ)分配優(yōu)化等問一是提高性能,二是更好本數(shù)據(jù)倉庫只有一個(gè)表,邏輯模型設(shè)計(jì)如下:在數(shù)據(jù)倉庫的物理設(shè)計(jì)中,主數(shù)據(jù)的索引策略、數(shù)據(jù)的存儲(chǔ)策題。物理設(shè)計(jì)的主要目的有兩個(gè),地管理存儲(chǔ)的數(shù)據(jù)。訪問的頻率、數(shù)據(jù)容量、選擇的RDBMS支持的特性和存儲(chǔ)介 質(zhì)的配置都會(huì)影響物理設(shè)計(jì)的最終結(jié)果。在本數(shù)據(jù)挖掘中,數(shù)據(jù)的索引策略采取的 并不是位圖索引而是按列索引2.4 OLAP模型設(shè)計(jì)在本設(shè)計(jì)中由于案例考慮的并不復(fù)雜,所以 OLAP模型設(shè)計(jì)也就比擬的簡單F面的數(shù)據(jù)是保存在ExceI中的。大概的模型設(shè)計(jì)也就如下列圖所示2.5 OLAP前端展示設(shè)計(jì)第3章數(shù)據(jù)挖掘分析3.1期末成績評(píng)估系統(tǒng)應(yīng)用挖掘概述在本系統(tǒng)中,數(shù)據(jù)倉

4、庫采用一個(gè)二維表來存儲(chǔ)和表示同學(xué)們的平時(shí)成績,平時(shí) 表現(xiàn)得分,以及期末成績等屬性。數(shù)據(jù)挖掘那么采用關(guān)聯(lián)分析來將二維表中的實(shí)例 分開,并探究這些數(shù)據(jù)所蘊(yùn)含的規(guī)律。3.2數(shù)據(jù)挖掘?qū)嶒?yàn)實(shí)驗(yàn)環(huán)境Win dows XPMicrosoft SQL Server 2008Microsoft Visual Studio 2008Microsoft Office 2003 Excel Access數(shù)據(jù)準(zhǔn)備及預(yù)處理首先選擇數(shù)據(jù)源,以下幾個(gè)截圖是在做實(shí)驗(yàn)時(shí)的幾個(gè)步驟A 1.1 id ibvat<* Lise */jndos A«jthenitieal'iohU se SU L 8 erve

5、i Amthert ictionijger name:Pass wardr廠Flffh e-ahti曰1曰匕!=!舊:OHockbu O er slHrmotifeoinSp&eifi ikm litre to 亡茲口并 d-ata to巨冃齊iiimcti onl 鯊QjL biJi MTivr lmi|Liii rl n ri ili t W iJ呂口1_ G&rve-r Malive aieiit 1 0 O< 且uGkErnii小1fie 皿 >ftSurvEJi- Drri pcji t <1 in cl EjM.pur ti cJ*Q>uy

6、需 «nc D 奇 tdlTH& exociuion wqs sugc»a ttful11 T otai Eiroi11 匸ili亡亡亡田皇 XA/arKirbgIn和ali己irg ID a冶 Flow 7sl-IrhitializH-ki 匸d 門廠ueuli口邛壬5 LUU匸鼻£5:Sehina SOL Com man dS uc=&esSetting Source 匚已ulham5uc=£essSett*n口 D eCtf-ialiQnt ConnectionS iLjcos&s/-ahcdatingPi epare fo

7、r E xectMeS nicoesPreexeicuiteSuecesiEMBoubri 口S uccesrECcMiy to d)bo.H:iSutGSM599 roL triisfezriedPcsLue skddMd呂 bDC.D 賀 Et| 旦i-tinfI ix廠五雹n尸BwoitCIOUQ323實(shí)驗(yàn)容輸入數(shù)據(jù)集,選擇算法,輸出結(jié)果,比擬分析1建立一個(gè) Analysis Services Projects工程,在數(shù)據(jù)源中輸入數(shù)據(jù)集:Kl廠 nmrk:5eL-U2!4Loo on to the- s«FverC: IIII III i» Mrink44U.

8、1;rl'Cr3 LJs Wlndo wfIcjstlo nJl Os-e- OL Sts* vuF 疤匸口I e- st <Zoniriectlo«-iOfcHelp-AH說明:以上實(shí)驗(yàn)室在實(shí)驗(yàn)室做的,由于時(shí)間不夠,回到宿舍自己安裝了中文版的SQL SERVE工具,并完成接下來的實(shí)驗(yàn)步驟。324算法選擇分類的任務(wù)是通過分析由類別數(shù)據(jù)對(duì)象組成的訓(xùn)練數(shù)據(jù)集,建立描述并區(qū)分?jǐn)?shù) 據(jù)對(duì)象類別的分類函數(shù)或分類模型也常常稱作分類器。分類算法有多種,例如,決策樹分類算法、神經(jīng)網(wǎng)絡(luò)分類算法、貝葉斯分類算 法等。這里需要用的是決策樹分類算法。在本挖掘中選擇是 關(guān)聯(lián)分析,分析過程和結(jié)果如以

9、下列圖所示:F面是挖掘模型:J型查看蠱廚 穂掘推確性團(tuán)叢挖捆模型預(yù)測TALastLestBUI“U1UII£J Illi, bill !< Jill M4. j f erferniaiiceS acreMi crcs oft_Assoc i ati on_RulftE Fr#di ciKsyPredictPredictPr edict項(xiàng)集:關(guān)聯(lián)規(guī)那么:財(cái)翊車匚工6££制提升圖:分類矩陣:依賴關(guān)系網(wǎng)絡(luò)圖:后來我用回歸預(yù)測法,得到了一個(gè)散點(diǎn)圖,說明預(yù)測值和實(shí)際值是有一定的關(guān)聯(lián)的:巨挖捉蚊神的數(shù)掘挖靈敬必圈:Tt通過以上的分析,我們得出一個(gè)結(jié)論,就是期末成績在最終得分中所占的比例 最大,平時(shí)成績和平時(shí)表現(xiàn)的權(quán)重差不多,在這個(gè)結(jié)論中,期末考試的成績的重要 性,不言而喻,增加期末考試的成績,最能提高最終成績,平時(shí)成績和表現(xiàn)的得分 也很重要,但相對(duì)權(quán)重沒有期末成績大。一個(gè)分?jǐn)?shù)高的學(xué)生,他的所有成績都應(yīng)該 是很高的。參考文獻(xiàn):1 Jamie MacLe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論