數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述_第1頁
數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述_第2頁
數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述_第3頁
數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述_第4頁
數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述摘要:高校教務(wù)管理系統(tǒng)中積累大量的教學數(shù)據(jù), 其中蘊藏一些有用的信息。數(shù)據(jù)挖掘技術(shù)在教務(wù)管理中的應(yīng) 用主要是通過學生的成績、教學評價、教師科研教學等數(shù)據(jù) 的分析,發(fā)現(xiàn)其中隱藏的信息,從而為教務(wù)管理者制定相關(guān) 決策,例如人才培養(yǎng)方案的制定、課程安排、試卷命題提供 依據(jù)。關(guān)鍵詞:數(shù)據(jù)挖掘 教務(wù)管理應(yīng)用中圖分類號:tp311. 13文獻標識碼:a文章編號:1007-3973 (2013) 007-075-021引言近年來,隨著高校信息化建設(shè)的深入,高校內(nèi)部構(gòu)建了 豐富的信息系統(tǒng)并累積了海量數(shù)據(jù)。教務(wù)管理是高校日?;?動中的重要組成部分,對教務(wù)管理系統(tǒng)積累的大量數(shù)據(jù)

2、進行 分析和挖掘,將會發(fā)現(xiàn)一些潛在的知識,從而為提高教學質(zhì) 量,優(yōu)化教學資源提供可靠的數(shù)據(jù)依據(jù)。本從將對數(shù)據(jù)挖掘 技術(shù)在教務(wù)管理中的應(yīng)用進行論述。2數(shù)據(jù)挖掘概述2.1數(shù)據(jù)挖掘的概念與應(yīng)用隨著計算機硬件和信息技術(shù)的發(fā)展,使得海量數(shù)據(jù)的處 理已經(jīng)成為研究與生產(chǎn)中的一項重要工作,數(shù)據(jù)挖掘技術(shù)由 此而誕生。數(shù)據(jù)挖掘也叫知識發(fā)現(xiàn),指的是從大型數(shù)據(jù)集中 提取一些事先未知的、隱含的潛在知識的過程。這些知識的 表現(xiàn)形式可以是概念、規(guī)律、模式、規(guī)則等。如今,數(shù)據(jù)挖 掘目前已經(jīng)廣泛應(yīng)用于許多領(lǐng)域,比如生物醫(yī)學、金融數(shù)據(jù) 分析、零售業(yè)、電信行業(yè)等等。2. 2數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘除了具有查詢數(shù)據(jù)的功能,還能夠發(fā)現(xiàn)以

3、前未 發(fā)現(xiàn)的模式,并預(yù)測將來的趨勢和行為。概括起來,數(shù)據(jù)挖 掘主要有以下幾項功能,即概念描述、分類和預(yù)測、關(guān)聯(lián)分 析、聚類分析、和孤立點分析。(1) 概念描述。它是指描述某類對象具有的內(nèi)涵、并 概括這類對象的有關(guān)特征。概念描述的兩種方式分別是數(shù)據(jù) 特征化和數(shù)據(jù)區(qū)分。數(shù)據(jù)特征化是描述某類對象的共同特 征,而數(shù)據(jù)區(qū)分則是描述不同類對象之間的區(qū)別。(2) 分類和預(yù)測。首先,分類建立一個能夠描述并區(qū) 分數(shù)據(jù)類的模型,然后使用這個模型來預(yù)測類標記未知的對 象類。歸納分類的形式有多樣,比如分類規(guī)則、判定樹和神 經(jīng)網(wǎng)絡(luò)等等。當被預(yù)測的值是數(shù)值而不是類標記時,通常稱 之為預(yù)測。(3) 關(guān)聯(lián)分析。關(guān)聯(lián)分析的目的

4、是發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這 些規(guī)則展示的是兩個或兩個以上的數(shù)據(jù)項頻繁地在給定數(shù) 據(jù)集中一起出現(xiàn)的條件。若這些數(shù)據(jù)項是以某種規(guī)律共同出 現(xiàn)的話,這些數(shù)據(jù)項之間就可能存在某種關(guān)聯(lián),這種規(guī)律稱 之為關(guān)聯(lián)規(guī)則。其關(guān)聯(lián)類型主要有簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因 果關(guān)聯(lián)??尚哦染统蔀槭顷P(guān)聯(lián)分析生成的規(guī)則的一個重要衡 量指標。(4) 聚類分析。聚類指的是將待挖掘的數(shù)據(jù)分成多個 類或者簇,具有較高的相似度的數(shù)據(jù)會被分到同一個簇中, 而差距較大的數(shù)據(jù)則會處于不同的簇中。聚類分析是一種重 要的人類行為,它增強了人們對客觀現(xiàn)實的認識,是概念描 述和偏差分析的先決條件。傳統(tǒng)的模式識別方法和數(shù)學統(tǒng)計 法是聚類分析的主要技術(shù)。(5) 孤立

5、點分析。孤立點指的是數(shù)據(jù)庫中存在的一些 異常記錄,它們與數(shù)據(jù)的一般行為或者模型不一致。孤立點 可能會包括很多潛在的知識,如不滿足規(guī)則的特例、分類中 的反常實例,這些罕見的事件可能比正常出現(xiàn)的更有趣。孤 立點分析又稱作孤立點挖掘。2. 3數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟一般包括:確定待挖掘?qū)ο?、?shù)據(jù)預(yù)處 理、建立模型、數(shù)據(jù)挖掘、模式評估和與知識應(yīng)用這幾個階 段,其中數(shù)據(jù)預(yù)處理又包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇 與數(shù)據(jù)變換。3教務(wù)管理中的數(shù)據(jù)挖掘數(shù)據(jù)挖據(jù)在教務(wù)管理的應(yīng)用主要有以下項目:學生信息 管理、教學評價、成績分析、遠程教育、智能教學、個性化 培養(yǎng),其中教學評價、成績分析以及個性化學習方案都是教

6、務(wù)管理的重要環(huán)節(jié)。教務(wù)管理中存在大量的待處理數(shù)據(jù),比 如教師信息、學生信息、學校的所有課程信息、教學計劃信 息、管理部門的信息等等,使用數(shù)據(jù)挖掘技術(shù)能有效的提高 教務(wù)管理的效率。結(jié)合2. 2中提到的數(shù)據(jù)挖掘的功能,這里 主要介紹在教務(wù)管理系統(tǒng)中比較廣泛應(yīng)用到的以下四種數(shù) 據(jù)挖掘任務(wù)。3. 1分類和預(yù)測分類和預(yù)測在教務(wù)管理的應(yīng)用一般是用于針對學生制 訂個性化的人才培養(yǎng)方案。尊重學生的個性發(fā)展是現(xiàn)代高等 教育的重要理念,這就要求高校將體現(xiàn)學生的個性化特征當 作人才培養(yǎng)的工作重點,要制定不同的培養(yǎng)方式以適應(yīng)不同 的學生的個性發(fā)展。通過積累的一定數(shù)量的數(shù)據(jù),其內(nèi)容主 要包括學生個體信息,如性格特征、興

7、趣愛好、日常行為記 錄以及學習情況等,還要包括教學信息,如課程設(shè)置、教師 分配和學校教學資源調(diào)配情況等,由此建立若干個模型,在 此基礎(chǔ)上進行分析、歸納和總結(jié)。以共同之處為標準,按照 分類模式進行劃分、歸類,由此制訂出多個具有個性化特征 的培養(yǎng)方案。然后將某個給定范圍內(nèi)的學生劃分,使用某種 個性化的培養(yǎng)方案。將分類與預(yù)測應(yīng)用到制訂人才培養(yǎng)方案 的過程中,既對學校的學科課程設(shè)置提供了建設(shè)性意見,又 為學生自主性學習與個性化學習提供更為科學有效的指導, 有利于實現(xiàn)人才培養(yǎng)的多樣化、個性化、創(chuàng)新型人才的培養(yǎng) 目標。3. 2關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則是通過分析一個事務(wù)中某些項的出現(xiàn)規(guī)律,挖 掘出隱藏在數(shù)據(jù)間的關(guān)聯(lián)

8、或相互關(guān)系。目前在教務(wù)管理應(yīng)用 中研究得最多的就是關(guān)聯(lián)規(guī)則的挖掘,如'關(guān)聯(lián)規(guī)則在選課 系統(tǒng)中的應(yīng)用”和'關(guān)聯(lián)規(guī)則在高校學位預(yù)警中的應(yīng)用”, 兩篇文章所研究得都是對大量學生成績數(shù)據(jù)進行分析,前者 是發(fā)現(xiàn)不同課程設(shè)置順序?qū)W生成績的影響,由此可以更合 理的安排課程順序。后者則是挖掘高年級學生的成績數(shù)據(jù), 從中得到不能授予學位學生的不及格課程規(guī)律,從而達到學 位預(yù)警的目的。還有一些關(guān)于師資方面應(yīng)用的研究,比如關(guān) 聯(lián)規(guī)則在教務(wù)管理決策支持中的應(yīng)用,通過分析了教務(wù)管理 中教師信息之間的隱藏關(guān)系,并對數(shù)據(jù)進行了標準化、離散 化處理,通過事例分析了教師的教學與科研之間的隱含關(guān) 系,可為教務(wù)管

9、理提供決策支持。3.3聚類分析在教務(wù)管理中,聚類分析主要應(yīng)用于分析試卷質(zhì)量。首 先通過對學生考試成績的分布進行測量,從而對試卷質(zhì)量得 出一個大致評價。一般來說,在試卷編制得比較成功,試題 質(zhì)量較好的情況下,考試成績會呈正態(tài)分布,測量效果符合 自然分布規(guī)律。雙峰型如果考試成績分布呈雙峰型,則說明試題難度區(qū) 分不大,存在偏難或偏易的兩極分化現(xiàn)象,而中等難度的題 目太少。這種試題的難度分布缺乏區(qū)分度,不能將將成績優(yōu) 秀的學生與成績較差的學生進行區(qū)分,只能區(qū)分中等程度的 學生。陡峭型的成績分布則說明試題中的大部分是屬于同等 難度的,這樣的試題難度系數(shù)偏小,致使學生分數(shù)分布過于 集中,這樣也不能將學生的

10、學習成績進行區(qū)分。因此,可通 過對學生考試成績分布狀況的分析,計算出兩個判斷指標, 即峰態(tài)系數(shù)和偏態(tài)系數(shù),然后將成績分布情況類型進行分 類,再進行聚類分析。如此就能有效地提高試卷命題質(zhì)量。3. 4孤立點檢測孤立點指的是數(shù)據(jù)集中與大部分數(shù)據(jù)模型不一致的數(shù) 據(jù)對象。孤立點檢測又稱作異常檢測,目的在于識別出與其 他數(shù)據(jù)特征有明顯不同的觀測值。孤立點檢測算法的目標是 發(fā)現(xiàn)孤立點,還要避免將正常的對象標注為孤立點。孤立點 檢測算法的兩個標準是高檢測率和低誤報率。教務(wù)管理系統(tǒng) 中的數(shù)據(jù)挖掘大多利用關(guān)聯(lián)分析或者分類分析。在發(fā)現(xiàn)這些 規(guī)則的同時,也會忽略一些偶爾現(xiàn)象。偶爾現(xiàn)象也會包含一 些重要信息,更應(yīng)該引起關(guān)注。孤立點檢測的目的就是找出 教務(wù)管理信息中往往會被忽略的例外情況。例如選取學生各 個學期的平均成績作為特征值,如果該生平均成績呈上升趨 勢,說明該生進步較快,呈下降趨勢則成績下降明顯,成績 不穩(wěn)定的學生則有可能有作弊嫌疑。孤立點檢測還可以用于 課程分析,選取用各個學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論