數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、收稿日期:2009209207作者簡介:蔣秀蓮(19682 , 女, 江蘇徐州人, 高級工程師, 碩士研究生, 主要從事智能信息系統(tǒng)研究.第24卷第4期徐州工程學(xué)院學(xué)報(自然科學(xué)版 2009年12月Vol. 24No. 4Journal of Xuzhou Institute of Technology (Natural Sciences Edition DEC 12009數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用蔣秀蓮1,2(1. 徐州工程學(xué)院, 江蘇徐州221008;2. 中國礦業(yè)大學(xué)計算機(jī)學(xué)院, 江蘇徐州221006摘要:, 門不同范圍的決策分析提供有力的支持. 掘工具對其進(jìn)行知識發(fā)現(xiàn),

2、, 提高辦學(xué)水平及管理水平.關(guān)鍵詞:; :A文章編號:16742358X (2009 0420053204隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展, 高校的教學(xué)管理系統(tǒng)也逐漸由單機(jī)版升級為網(wǎng)絡(luò)版, 基于網(wǎng)絡(luò)的教學(xué)管理系統(tǒng)在高校得到廣泛應(yīng)用, 各方面的信息已被詳細(xì)地記錄到系統(tǒng)中, 如人才培養(yǎng)方案、學(xué)生成績信息、學(xué)生選課信息、學(xué)生就業(yè)信息等等. 大部分高校只是簡單地將這些信息存儲在數(shù)據(jù)庫中, 隱藏在這些數(shù)據(jù)中的潛在信息沒有被挖掘利用. 在高校教學(xué)管理系統(tǒng)數(shù)據(jù)倉庫基礎(chǔ)上, 借助于相應(yīng)的數(shù)據(jù)挖掘工具合理地利用這些數(shù)據(jù)并從中挖掘出有用的常被人們忽視的重要信息, 發(fā)現(xiàn)隱藏在這些數(shù)據(jù)中的關(guān)聯(lián)規(guī)律, 發(fā)掘其中蘊(yùn)含的

3、規(guī)律, 把這些規(guī)律運用到教學(xué)管理中, 為管理人員和決策者提供更有價值的信息, 可以更合理地進(jìn)行教學(xué)決策.1數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)倉庫是在數(shù)據(jù)庫基礎(chǔ)上發(fā)展而來的, 它通常有三個部分:數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理及數(shù)據(jù)挖掘, 它們之間具有極強(qiáng)的互補(bǔ)關(guān)系, 數(shù)據(jù)倉庫是進(jìn)行數(shù)據(jù)分析的基礎(chǔ), 它的主要工作是將數(shù)據(jù)庫中的原始數(shù)據(jù)進(jìn)行歸納整理, 聚集成一個可供高層次使用的數(shù)據(jù)集合, 方便數(shù)據(jù)分析、查詢與數(shù)據(jù)挖掘1. 一般而言, 在操作型環(huán)境中, 系統(tǒng)設(shè)計人員能夠清晰了解應(yīng)用的需求和數(shù)據(jù)流程, 系統(tǒng)設(shè)計一般采用生命周期法, 而在分析型環(huán)境中, 設(shè)計人員要在與用戶不斷交流的基礎(chǔ)上, 逐步明確與完善系統(tǒng)要求, 因此

4、數(shù)據(jù)倉庫采用CLDS (Cycle Life Develop ment System 方法.數(shù)據(jù)挖掘, 是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的、人們事先未知的, 但又是潛在有用的并且最終可理解的信息和知識的非平凡過程. 挖掘獲得的模型能夠被用戶理解, 非平凡是指數(shù)據(jù)挖掘的過程不是線性的, 挖掘過程存在反復(fù)和循環(huán)的過程, 所挖掘的知識往往不是通過簡單的分析能夠得到的, 需要經(jīng)過大量的比較分析, 應(yīng)用一些專門的挖掘工具, 透過表面的現(xiàn)象來獲得其蘊(yùn)涵的內(nèi)部信息2.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用近年來, 數(shù)據(jù)挖掘引起了教育管理者的極大關(guān)注, 教務(wù)

5、處作為人才培養(yǎng)職能機(jī)構(gòu), 在高等教育中承擔(dān)著重要角色, 特別是在實現(xiàn)個性化人才培養(yǎng)和向?qū)W校領(lǐng)導(dǎo)決策提供信息支持的過程中, 迫切需要應(yīng)用分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web 頁挖掘等技術(shù)手段對信息進(jìn)行加工, 從中獲取一些反映規(guī)律性、傾向性的信息, 為學(xué)校決策提供更準(zhǔn)確的咨詢服務(wù), 以推動學(xué)校教學(xué)改革和建設(shè)的全面發(fā)展. 數(shù)據(jù)挖掘方法正被廣泛應(yīng)用到教學(xué)管理的方方面面. 數(shù)據(jù)挖掘在教學(xué)管理系統(tǒng)中的基本流程如圖1所示. 35 圖1數(shù)據(jù)挖掘在教學(xué)管理系統(tǒng)中的基本流程Fig. 1Base flow chat of DM in TMs2. 1分類分析法應(yīng)用于個性化人才培養(yǎng), 將數(shù)據(jù)庫中

6、的數(shù)據(jù)項映射到某個給定的類別. 以人為本 理念深入到高等教育領(lǐng)域, , 式, :、個人的學(xué)習(xí)興趣和學(xué)習(xí)行為、以及個體的學(xué)習(xí)情況, . 這些信息采集一方面可通過問卷調(diào)查的方式, . 通過對挖掘的信息數(shù)據(jù)建立一個量的模型、歸納和總結(jié), 找出它們共同的特點, 按照分類的模式將其進(jìn)行劃分、歸類, , 既可以為學(xué)生自主性個性化學(xué)習(xí)提供更為科學(xué)有效的指導(dǎo), 又可以對學(xué)校的學(xué)科課程設(shè)置提供建設(shè)性意見, 從而更好地實現(xiàn)培養(yǎng)多樣化、個性化、創(chuàng)新性人才的目標(biāo).2. 2聚類分析法應(yīng)用于試卷質(zhì)量分析聚類是根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性原則對海量數(shù)據(jù)進(jìn)行聚類或分組, 從而產(chǎn)生屬性相近的各個類. 聚類分析其實

7、是無監(jiān)督分類, 其目的在于實事求是地按被處理對象的特征分類, 有相同特征的對象被歸為一類. 聚類分析法的輸入集是一組未標(biāo)定的記錄, 即輸入的記錄沒有作任何處理. 目的是根據(jù)一定的規(guī)則, 合理地劃分記錄集合, 并用顯式或隱式的方法描述不同的類別. 測度學(xué)生考試成績分布可以對試題質(zhì)量進(jìn)行粗略的評價. 一般地, 學(xué)生學(xué)習(xí)成績呈正態(tài)分布. 當(dāng)考試成績分布呈正態(tài)分布時, 測量效果符合自然分布規(guī)律, 因此認(rèn)為測量編制得比較成功, 試題質(zhì)量較好. 雙峰型分布, 說明試題存在兩極分化現(xiàn)象, 即難度偏高的和難度偏低的項目較多, 而中等難度的項目偏少, 項目難度的分布缺乏梯度, 不夠合理. 呈這種分布的試題可以區(qū)

8、別中等程度的學(xué)生, 但不利于區(qū)別出成績優(yōu)秀的學(xué)生和成績較差的學(xué)生. 陡峭型分布, 說明試題中同等難度的項目較多, 梯度偏小. 呈這種分布的試題幾乎不能將不同程度的學(xué)生去分開, 分?jǐn)?shù)分布過于集中. 因此, 可通過對學(xué)生試卷成績的分析, 計算峰態(tài)系數(shù)和偏態(tài)系數(shù)這兩個試卷評價指標(biāo), 然后將試卷按如上的類型進(jìn)行分類, 以便進(jìn)行聚類分析, 進(jìn)一步提高試卷質(zhì)量.其中聚類過程中主要使用的方法的實現(xiàn)代碼如下:/計算聚類中心p ublic Point F newCenter (int m int N =0;for (int i =0;i 20;i +if (typei=m sum. X =unknowni.X

9、+sum. X ;sum. Y =unknowni.Y +sum. Y ;N +=1;sum. X =sum. X/N ;45徐州工程學(xué)院學(xué)報(自然科學(xué)版 2009年第4期 sum. Y =sum. Y/N ;ret urn sum ;/比較兩個聚類中心是否相等private bool compare (Point F a ,Point Fb if (int (a. X 310 =(int (b. X 310 &(int (a. X 310 =(int (b. X 310 ret urn t rue ;elseret urn false ;2. 3, 即根據(jù)一個事務(wù)中某些項的出現(xiàn), 挖掘出隱.

10、 學(xué)生的課程學(xué)習(xí)是循序漸進(jìn)的, 而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系. , 如果先行課程沒有學(xué)好, 勢必會影響后續(xù)課程的學(xué)習(xí). 另外, 同一年級學(xué)習(xí)同一課程的不同班級, 由于授課教師、班級學(xué)習(xí)氛圍的不同, 班內(nèi)學(xué)生的總體成績相差有時會較大. 利用學(xué)校教學(xué)數(shù)據(jù)庫中存放的歷屆學(xué)生各門學(xué)科的考試成績, 結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時間序列分析等相關(guān)功能, 就能從這些海量數(shù)據(jù)中挖掘出有用的信息, 幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì), 得出一些具有價值的規(guī)則和信息, 最終找到影響學(xué)生成績的原因. 在此基礎(chǔ)上, 對課程設(shè)置做出合理安排.可以從已經(jīng)建立的教學(xué)管理數(shù)據(jù)倉庫系統(tǒng)中學(xué)生課程維表里選取部分學(xué)生

11、成績記錄, 接下來將其轉(zhuǎn)化為事務(wù)數(shù)據(jù)庫D (t 1,t 2, ,t k , ,t n ,t k =i1,i 2, ,i m , ,i p , 其中i 1(計算機(jī)基礎(chǔ) ,i 2(管理學(xué) ,i 3(C 語言 ,i 4(VB ,i 5(C + ,i 6(數(shù)據(jù)結(jié)構(gòu) ,i 7(數(shù)據(jù)庫 ; 設(shè)定最小支持度閾值min -sup 為0. 2.應(yīng)用Ap riori 算法挖掘與結(jié)果分析3.輸入:事務(wù)數(shù)據(jù)庫D ; 最小支持度閾值min_sup.輸出:D中的頻繁項集L.部分代碼如下:L1=find_frequent_1-item set s (D ;for (k =2; L k -1; k + Ck =ap rior

12、i_gen(L k -1,min_sup ;for each t ransaction t D/scan D for count sCt =subset (Ck , t ; /get t he subset s of t t hat are candidatesfor each candidate c C tc co unt +;L k =cC k |c. count min_supret urn L =kL k ;從挖掘結(jié)果可以看出, 一些課程間存在一些聯(lián)系, 它們是相互影響的, 一些課程成績的好壞直接影響另一些課程成績的好壞. 計算機(jī)基礎(chǔ)課程學(xué)得好, C 語言課程也很可能學(xué)得好; C 語言

13、學(xué)得好, C +語言也很可能學(xué)得好, 數(shù)據(jù)結(jié)構(gòu)也可能學(xué)的好, 這說明在今后教學(xué)中要把計算機(jī)基礎(chǔ)課程和C 語言程序設(shè)計課程55蔣秀蓮:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用 教好, 這樣有利于學(xué)生學(xué)習(xí)其他計算機(jī)相關(guān)課程.2. 4Web 挖掘應(yīng)用于全面決策支持Web 挖掘是數(shù)據(jù)庫挖掘的一項重要應(yīng)用, 是一項綜合技術(shù), 涉及Web 、數(shù)據(jù)挖掘、計算機(jī)語言學(xué)、信息論等多個領(lǐng)域, 是從數(shù)據(jù)挖掘發(fā)展而來的. Web 挖掘可分為內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄挖掘. 內(nèi)容挖掘指從Web 文件的內(nèi)容信息中篩選知識; 結(jié)構(gòu)挖掘指的是從Web 文件的結(jié)構(gòu)信息中推導(dǎo)知識; 使用記錄挖掘是從Web 的存取模式中獲取有價

14、值的信息的過程, 主要是從網(wǎng)站的訪問日志記錄中獲取感興趣的模式4. 管理者在管理和決策過程中(如院系專業(yè)的設(shè)置和調(diào)整, 學(xué)科、課程的設(shè)置, 研究課題的申報等 需要大量的外部信息. 為此教務(wù)處可以利用Web 挖掘技術(shù)盡可能多地收集與學(xué)校發(fā)展相關(guān)的信息, 、經(jīng)濟(jì)、政策、科技、金融、人才供求信息、學(xué)科動態(tài)、課題研究等有關(guān)的信息, . 特別要集中精力息, , 從而抓住轉(zhuǎn)瞬即逝的機(jī)遇, 以推動學(xué)校事業(yè)持續(xù)、健康、3結(jié)語. 在高等教育管理領(lǐng)域里, 隨著數(shù)據(jù)信息的不斷增長, 把、技術(shù)應(yīng)用到教學(xué)管理系統(tǒng)中, 可以促進(jìn)教育管理的進(jìn)一步改革、完善和發(fā)展. 我國高校的教學(xué)管理長期沿用經(jīng)驗管理模式, 往往難以避免管理

15、滯后的弊端. 對數(shù)據(jù)挖掘工具的有效利用, 將較客觀地反映教學(xué)系統(tǒng)中存在的問題, 為決策提供重要依據(jù), 從而提高管理的科學(xué)性、針對性和高效率. 參考文獻(xiàn):1陳文偉. 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程M .北京:清華大學(xué)出版社,2006.2蘇新寧, 楊建林, 江念南, 等. 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘M .北京:清華大學(xué)出版社,2006.3趙文華, 張建林. 關(guān)聯(lián)規(guī)則在手機(jī)業(yè)務(wù)數(shù)據(jù)庫中的應(yīng)用J.微計算機(jī)信息, 2007,23(36 :117-118.4祁曼飛, 侯冬梅, 王萬森. 基于Web 和數(shù)據(jù)挖掘技術(shù)的智能教學(xué)系統(tǒng)研究J.計算機(jī)工程與設(shè)計,2008,29(17 :4571-4573.Application o

16、f Data W arehouse and Data Mining T echnologies inU niversity T eaching Management SystemJ IAN G Xiu 2lian 1,2(1. Xuzhou Institute of Technology , Xuzhou 221008, China ;2. School of Computer , China University of Mining &Technology , Xuzhou 221008, China ; Abstract :Data warehouse and data mining technologies are key factors for t he decision support system , and t he co mbinatio n of t hem can provide strong support to decision analysis. Currently university teaching management systems have accumulated a h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論