




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、收稿日期:2009209207作者簡(jiǎn)介:蔣秀蓮(19682 , 女, 江蘇徐州人, 高級(jí)工程師, 碩士研究生, 主要從事智能信息系統(tǒng)研究.第24卷第4期徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版 2009年12月Vol. 24No. 4Journal of Xuzhou Institute of Technology (Natural Sciences Edition DEC 12009數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用蔣秀蓮1,2(1. 徐州工程學(xué)院, 江蘇徐州221008;2. 中國(guó)礦業(yè)大學(xué)計(jì)算機(jī)學(xué)院, 江蘇徐州221006摘要:, 門不同范圍的決策分析提供有力的支持. 掘工具對(duì)其進(jìn)行知識(shí)發(fā)現(xiàn),
2、, 提高辦學(xué)水平及管理水平.關(guān)鍵詞:; :A文章編號(hào):16742358X (2009 0420053204隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展, 高校的教學(xué)管理系統(tǒng)也逐漸由單機(jī)版升級(jí)為網(wǎng)絡(luò)版, 基于網(wǎng)絡(luò)的教學(xué)管理系統(tǒng)在高校得到廣泛應(yīng)用, 各方面的信息已被詳細(xì)地記錄到系統(tǒng)中, 如人才培養(yǎng)方案、學(xué)生成績(jī)信息、學(xué)生選課信息、學(xué)生就業(yè)信息等等. 大部分高校只是簡(jiǎn)單地將這些信息存儲(chǔ)在數(shù)據(jù)庫(kù)中, 隱藏在這些數(shù)據(jù)中的潛在信息沒有被挖掘利用. 在高校教學(xué)管理系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上, 借助于相應(yīng)的數(shù)據(jù)挖掘工具合理地利用這些數(shù)據(jù)并從中挖掘出有用的常被人們忽視的重要信息, 發(fā)現(xiàn)隱藏在這些數(shù)據(jù)中的關(guān)聯(lián)規(guī)律, 發(fā)掘其中蘊(yùn)含的
3、規(guī)律, 把這些規(guī)律運(yùn)用到教學(xué)管理中, 為管理人員和決策者提供更有價(jià)值的信息, 可以更合理地進(jìn)行教學(xué)決策.1數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)倉(cāng)庫(kù)是在數(shù)據(jù)庫(kù)基礎(chǔ)上發(fā)展而來(lái)的, 它通常有三個(gè)部分:數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理及數(shù)據(jù)挖掘, 它們之間具有極強(qiáng)的互補(bǔ)關(guān)系, 數(shù)據(jù)倉(cāng)庫(kù)是進(jìn)行數(shù)據(jù)分析的基礎(chǔ), 它的主要工作是將數(shù)據(jù)庫(kù)中的原始數(shù)據(jù)進(jìn)行歸納整理, 聚集成一個(gè)可供高層次使用的數(shù)據(jù)集合, 方便數(shù)據(jù)分析、查詢與數(shù)據(jù)挖掘1. 一般而言, 在操作型環(huán)境中, 系統(tǒng)設(shè)計(jì)人員能夠清晰了解應(yīng)用的需求和數(shù)據(jù)流程, 系統(tǒng)設(shè)計(jì)一般采用生命周期法, 而在分析型環(huán)境中, 設(shè)計(jì)人員要在與用戶不斷交流的基礎(chǔ)上, 逐步明確與完善系統(tǒng)要求, 因此
4、數(shù)據(jù)倉(cāng)庫(kù)采用CLDS (Cycle Life Develop ment System 方法.數(shù)據(jù)挖掘, 是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的、人們事先未知的, 但又是潛在有用的并且最終可理解的信息和知識(shí)的非平凡過(guò)程. 挖掘獲得的模型能夠被用戶理解, 非平凡是指數(shù)據(jù)挖掘的過(guò)程不是線性的, 挖掘過(guò)程存在反復(fù)和循環(huán)的過(guò)程, 所挖掘的知識(shí)往往不是通過(guò)簡(jiǎn)單的分析能夠得到的, 需要經(jīng)過(guò)大量的比較分析, 應(yīng)用一些專門的挖掘工具, 透過(guò)表面的現(xiàn)象來(lái)獲得其蘊(yùn)涵的內(nèi)部信息2.2數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用近年來(lái), 數(shù)據(jù)挖掘引起了教育管理者的極大關(guān)注, 教務(wù)
5、處作為人才培養(yǎng)職能機(jī)構(gòu), 在高等教育中承擔(dān)著重要角色, 特別是在實(shí)現(xiàn)個(gè)性化人才培養(yǎng)和向?qū)W校領(lǐng)導(dǎo)決策提供信息支持的過(guò)程中, 迫切需要應(yīng)用分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web 頁(yè)挖掘等技術(shù)手段對(duì)信息進(jìn)行加工, 從中獲取一些反映規(guī)律性、傾向性的信息, 為學(xué)校決策提供更準(zhǔn)確的咨詢服務(wù), 以推動(dòng)學(xué)校教學(xué)改革和建設(shè)的全面發(fā)展. 數(shù)據(jù)挖掘方法正被廣泛應(yīng)用到教學(xué)管理的方方面面. 數(shù)據(jù)挖掘在教學(xué)管理系統(tǒng)中的基本流程如圖1所示. 35 圖1數(shù)據(jù)挖掘在教學(xué)管理系統(tǒng)中的基本流程Fig. 1Base flow chat of DM in TMs2. 1分類分析法應(yīng)用于個(gè)性化人才培養(yǎng), 將數(shù)據(jù)庫(kù)中
6、的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別. 以人為本 理念深入到高等教育領(lǐng)域, , 式, :、個(gè)人的學(xué)習(xí)興趣和學(xué)習(xí)行為、以及個(gè)體的學(xué)習(xí)情況, . 這些信息采集一方面可通過(guò)問(wèn)卷調(diào)查的方式, . 通過(guò)對(duì)挖掘的信息數(shù)據(jù)建立一個(gè)量的模型、歸納和總結(jié), 找出它們共同的特點(diǎn), 按照分類的模式將其進(jìn)行劃分、歸類, , 既可以為學(xué)生自主性個(gè)性化學(xué)習(xí)提供更為科學(xué)有效的指導(dǎo), 又可以對(duì)學(xué)校的學(xué)科課程設(shè)置提供建設(shè)性意見, 從而更好地實(shí)現(xiàn)培養(yǎng)多樣化、個(gè)性化、創(chuàng)新性人才的目標(biāo).2. 2聚類分析法應(yīng)用于試卷質(zhì)量分析聚類是根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性原則對(duì)海量數(shù)據(jù)進(jìn)行聚類或分組, 從而產(chǎn)生屬性相近的各個(gè)類. 聚類分析其實(shí)
7、是無(wú)監(jiān)督分類, 其目的在于實(shí)事求是地按被處理對(duì)象的特征分類, 有相同特征的對(duì)象被歸為一類. 聚類分析法的輸入集是一組未標(biāo)定的記錄, 即輸入的記錄沒有作任何處理. 目的是根據(jù)一定的規(guī)則, 合理地劃分記錄集合, 并用顯式或隱式的方法描述不同的類別. 測(cè)度學(xué)生考試成績(jī)分布可以對(duì)試題質(zhì)量進(jìn)行粗略的評(píng)價(jià). 一般地, 學(xué)生學(xué)習(xí)成績(jī)呈正態(tài)分布. 當(dāng)考試成績(jī)分布呈正態(tài)分布時(shí), 測(cè)量效果符合自然分布規(guī)律, 因此認(rèn)為測(cè)量編制得比較成功, 試題質(zhì)量較好. 雙峰型分布, 說(shuō)明試題存在兩極分化現(xiàn)象, 即難度偏高的和難度偏低的項(xiàng)目較多, 而中等難度的項(xiàng)目偏少, 項(xiàng)目難度的分布缺乏梯度, 不夠合理. 呈這種分布的試題可以區(qū)
8、別中等程度的學(xué)生, 但不利于區(qū)別出成績(jī)優(yōu)秀的學(xué)生和成績(jī)較差的學(xué)生. 陡峭型分布, 說(shuō)明試題中同等難度的項(xiàng)目較多, 梯度偏小. 呈這種分布的試題幾乎不能將不同程度的學(xué)生去分開, 分?jǐn)?shù)分布過(guò)于集中. 因此, 可通過(guò)對(duì)學(xué)生試卷成績(jī)的分析, 計(jì)算峰態(tài)系數(shù)和偏態(tài)系數(shù)這兩個(gè)試卷評(píng)價(jià)指標(biāo), 然后將試卷按如上的類型進(jìn)行分類, 以便進(jìn)行聚類分析, 進(jìn)一步提高試卷質(zhì)量.其中聚類過(guò)程中主要使用的方法的實(shí)現(xiàn)代碼如下:/計(jì)算聚類中心p ublic Point F newCenter (int m int N =0;for (int i =0;i 20;i +if (typei=m sum. X =unknowni.X
9、+sum. X ;sum. Y =unknowni.Y +sum. Y ;N +=1;sum. X =sum. X/N ;45徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版 2009年第4期 sum. Y =sum. Y/N ;ret urn sum ;/比較兩個(gè)聚類中心是否相等private bool compare (Point F a ,Point Fb if (int (a. X 310 =(int (b. X 310 &(int (a. X 310 =(int (b. X 310 ret urn t rue ;elseret urn false ;2. 3, 即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn), 挖掘出隱.
10、 學(xué)生的課程學(xué)習(xí)是循序漸進(jìn)的, 而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系. , 如果先行課程沒有學(xué)好, 勢(shì)必會(huì)影響后續(xù)課程的學(xué)習(xí). 另外, 同一年級(jí)學(xué)習(xí)同一課程的不同班級(jí), 由于授課教師、班級(jí)學(xué)習(xí)氛圍的不同, 班內(nèi)學(xué)生的總體成績(jī)相差有時(shí)會(huì)較大. 利用學(xué)校教學(xué)數(shù)據(jù)庫(kù)中存放的歷屆學(xué)生各門學(xué)科的考試成績(jī), 結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時(shí)間序列分析等相關(guān)功能, 就能從這些海量數(shù)據(jù)中挖掘出有用的信息, 幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì), 得出一些具有價(jià)值的規(guī)則和信息, 最終找到影響學(xué)生成績(jī)的原因. 在此基礎(chǔ)上, 對(duì)課程設(shè)置做出合理安排.可以從已經(jīng)建立的教學(xué)管理數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中學(xué)生課程維表里選取部分學(xué)生
11、成績(jī)記錄, 接下來(lái)將其轉(zhuǎn)化為事務(wù)數(shù)據(jù)庫(kù)D (t 1,t 2, ,t k , ,t n ,t k =i1,i 2, ,i m , ,i p , 其中i 1(計(jì)算機(jī)基礎(chǔ) ,i 2(管理學(xué) ,i 3(C 語(yǔ)言 ,i 4(VB ,i 5(C + ,i 6(數(shù)據(jù)結(jié)構(gòu) ,i 7(數(shù)據(jù)庫(kù) ; 設(shè)定最小支持度閾值min -sup 為0. 2.應(yīng)用Ap riori 算法挖掘與結(jié)果分析3.輸入:事務(wù)數(shù)據(jù)庫(kù)D ; 最小支持度閾值min_sup.輸出:D中的頻繁項(xiàng)集L.部分代碼如下:L1=find_frequent_1-item set s (D ;for (k =2; L k -1; k + Ck =ap rior
12、i_gen(L k -1,min_sup ;for each t ransaction t D/scan D for count sCt =subset (Ck , t ; /get t he subset s of t t hat are candidatesfor each candidate c C tc co unt +;L k =cC k |c. count min_supret urn L =kL k ;從挖掘結(jié)果可以看出, 一些課程間存在一些聯(lián)系, 它們是相互影響的, 一些課程成績(jī)的好壞直接影響另一些課程成績(jī)的好壞. 計(jì)算機(jī)基礎(chǔ)課程學(xué)得好, C 語(yǔ)言課程也很可能學(xué)得好; C 語(yǔ)言
13、學(xué)得好, C +語(yǔ)言也很可能學(xué)得好, 數(shù)據(jù)結(jié)構(gòu)也可能學(xué)的好, 這說(shuō)明在今后教學(xué)中要把計(jì)算機(jī)基礎(chǔ)課程和C 語(yǔ)言程序設(shè)計(jì)課程55蔣秀蓮:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)在教學(xué)管理中的應(yīng)用 教好, 這樣有利于學(xué)生學(xué)習(xí)其他計(jì)算機(jī)相關(guān)課程.2. 4Web 挖掘應(yīng)用于全面決策支持Web 挖掘是數(shù)據(jù)庫(kù)挖掘的一項(xiàng)重要應(yīng)用, 是一項(xiàng)綜合技術(shù), 涉及Web 、數(shù)據(jù)挖掘、計(jì)算機(jī)語(yǔ)言學(xué)、信息論等多個(gè)領(lǐng)域, 是從數(shù)據(jù)挖掘發(fā)展而來(lái)的. Web 挖掘可分為內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄挖掘. 內(nèi)容挖掘指從Web 文件的內(nèi)容信息中篩選知識(shí); 結(jié)構(gòu)挖掘指的是從Web 文件的結(jié)構(gòu)信息中推導(dǎo)知識(shí); 使用記錄挖掘是從Web 的存取模式中獲取有價(jià)
14、值的信息的過(guò)程, 主要是從網(wǎng)站的訪問(wèn)日志記錄中獲取感興趣的模式4. 管理者在管理和決策過(guò)程中(如院系專業(yè)的設(shè)置和調(diào)整, 學(xué)科、課程的設(shè)置, 研究課題的申報(bào)等 需要大量的外部信息. 為此教務(wù)處可以利用Web 挖掘技術(shù)盡可能多地收集與學(xué)校發(fā)展相關(guān)的信息, 、經(jīng)濟(jì)、政策、科技、金融、人才供求信息、學(xué)科動(dòng)態(tài)、課題研究等有關(guān)的信息, . 特別要集中精力息, , 從而抓住轉(zhuǎn)瞬即逝的機(jī)遇, 以推動(dòng)學(xué)校事業(yè)持續(xù)、健康、3結(jié)語(yǔ). 在高等教育管理領(lǐng)域里, 隨著數(shù)據(jù)信息的不斷增長(zhǎng), 把、技術(shù)應(yīng)用到教學(xué)管理系統(tǒng)中, 可以促進(jìn)教育管理的進(jìn)一步改革、完善和發(fā)展. 我國(guó)高校的教學(xué)管理長(zhǎng)期沿用經(jīng)驗(yàn)管理模式, 往往難以避免管理
15、滯后的弊端. 對(duì)數(shù)據(jù)挖掘工具的有效利用, 將較客觀地反映教學(xué)系統(tǒng)中存在的問(wèn)題, 為決策提供重要依據(jù), 從而提高管理的科學(xué)性、針對(duì)性和高效率. 參考文獻(xiàn):1陳文偉. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程M .北京:清華大學(xué)出版社,2006.2蘇新寧, 楊建林, 江念南, 等. 數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘M .北京:清華大學(xué)出版社,2006.3趙文華, 張建林. 關(guān)聯(lián)規(guī)則在手機(jī)業(yè)務(wù)數(shù)據(jù)庫(kù)中的應(yīng)用J.微計(jì)算機(jī)信息, 2007,23(36 :117-118.4祁曼飛, 侯冬梅, 王萬(wàn)森. 基于Web 和數(shù)據(jù)挖掘技術(shù)的智能教學(xué)系統(tǒng)研究J.計(jì)算機(jī)工程與設(shè)計(jì),2008,29(17 :4571-4573.Application o
16、f Data W arehouse and Data Mining T echnologies inU niversity T eaching Management SystemJ IAN G Xiu 2lian 1,2(1. Xuzhou Institute of Technology , Xuzhou 221008, China ;2. School of Computer , China University of Mining &Technology , Xuzhou 221008, China ; Abstract :Data warehouse and data mining technologies are key factors for t he decision support system , and t he co mbinatio n of t hem can provide strong support to decision analysis. Currently university teaching management systems have accumulated a h
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 反饋工作機(jī)制協(xié)議
- 美甲師職業(yè)發(fā)展規(guī)劃與二零二五年度勞動(dòng)合同
- 二零二五年度廣告?zhèn)髅焦締T工解除勞動(dòng)關(guān)系協(xié)議
- 二零二五年度順豐快遞員外包業(yè)務(wù)合作協(xié)議
- 互聯(lián)網(wǎng)門市出租合同示范
- 商品代理中介合同
- 2025年度智慧養(yǎng)老全新員工入職與養(yǎng)老服務(wù)合同
- 二零二五年度職業(yè)技能培訓(xùn)機(jī)構(gòu)與學(xué)員就業(yè)保障協(xié)議
- 二零二五年度海外名校國(guó)家公派留學(xué)合作框架協(xié)議
- 農(nóng)村新建房屋安全質(zhì)量監(jiān)督與保修服務(wù)合同
- 【課件】2.1.1植物細(xì)胞工程的基本技術(shù)課件-2021-2022學(xué)年高二下學(xué)期生物人教版選擇性必修3
- 35kV集電線路直埋施工組織設(shè)計(jì)方案
- 客戶來(lái)訪登記表
- 日產(chǎn)新軒逸電子手冊(cè)cvt
- 人教八年級(jí)下冊(cè)英語(yǔ)U5Do-you-remember-what-you-were-doing?課件
- 小學(xué)人教版四年級(jí)下冊(cè)數(shù)學(xué)租船問(wèn)題25題
- 大連市小升初手冊(cè)
- 醫(yī)療垃圾管理及手衛(wèi)生培訓(xùn)PPT課件
- 嚇數(shù)基礎(chǔ)知識(shí)共20
- 鋰電池安全知識(shí)培訓(xùn)-課件
- 電子產(chǎn)品高可靠性裝聯(lián)工藝下
評(píng)論
0/150
提交評(píng)論