




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上決策支持系統(tǒng)在成績分析中的應(yīng)用摘 要:本文主要應(yīng)用數(shù)據(jù)挖掘技術(shù)對教務(wù)系統(tǒng)數(shù)據(jù)庫中現(xiàn)存的學生成績進行統(tǒng)計分析,結(jié)合教育信息的特點,將決策樹算法中的ID3算法模型用于構(gòu)建成績分析的智能決策支持系統(tǒng),根據(jù)信息增益值的大小,全面反應(yīng)出影響學生某學科成績的各個因素,找出課程設(shè)置之間的關(guān)聯(lián)性,并從客觀層面上對教師的教學質(zhì)量予以綜合全面的評價,為高校課程培養(yǎng)方案的制定者提供決策策略。本研究對于發(fā)揮成績統(tǒng)計的正面導向作用,評定教學效果,反饋教學活動,服務(wù)教育決策具有重要的研究價值和實踐意義。關(guān)鍵詞:決策支持系統(tǒng);成績分析;決策樹;ID3算法1 引 言各高等院校始終把教師的教學效果和學
2、生的學習效果的評價作為一項重要工作,成績統(tǒng)計分析是進行教學與學習效果評價的重要工作?,F(xiàn)如今,各大高校擴招現(xiàn)象嚴重,然而無論是教務(wù)部行政人員還是高校教師們都未能找到現(xiàn)存數(shù)據(jù)庫中那些歷史數(shù)據(jù)之間的潛在關(guān)聯(lián)。那么在決策支持系統(tǒng)廣泛應(yīng)用于教育管理工作的今天,高校教務(wù)管理系統(tǒng)不斷的完善,我們可以利用教務(wù)系統(tǒng)中現(xiàn)存的大量學生成績歷史數(shù)據(jù),為數(shù)據(jù)挖掘和輔助決策提供基礎(chǔ)1。圖1.1為基于決策樹算法的成績分析系統(tǒng)與數(shù)據(jù)庫和用戶之間的交互模型圖: 圖1.1 成績分析系統(tǒng)與數(shù)據(jù)庫和用戶之間的交互模型圖上圖中,學校建立集中的數(shù)據(jù)庫,數(shù)據(jù)主要來源于人工輸入、文件導入、教學系統(tǒng)及其它應(yīng)用系統(tǒng)的數(shù)據(jù)庫,此外它還與其它部門的
3、數(shù)據(jù)庫進行交互。成績分析系統(tǒng)的功能模塊可以再具體細分,如圖1.2所示。其中,數(shù)據(jù)預(yù)處理主要是收集數(shù)據(jù),為數(shù)據(jù)挖掘做準備。首先是獲取數(shù)據(jù),這個數(shù)據(jù)是大量且雜亂無章的,然后再對獲取的數(shù)據(jù)進行取樣分析,篩選出有用的數(shù)據(jù),并且把這些數(shù)據(jù)轉(zhuǎn)換為決策支持系統(tǒng)可直接處理的格式。數(shù)據(jù)挖掘模塊主要是使用ID3算法對已經(jīng)經(jīng)過了預(yù)處理的數(shù)據(jù)進行挖掘,生成決策樹,找出它們的內(nèi)在聯(lián)系,并生成規(guī)則集直接運用。結(jié)果顯示模塊主要是對規(guī)則集的處理,使其在界面上顯示出來。 圖1.2 成績分析系統(tǒng)的功能結(jié)構(gòu)圖2 決策支持系統(tǒng)與成績分析2.1 決策支持系統(tǒng)與決策樹2.1.1 決策支持系統(tǒng)基本概念在Error! Reference s
4、ource not found.一書中認為,決策支持系統(tǒng)是按決策問題的需要,利用數(shù)據(jù)、模型和知識等決策資源,組合形成問題的多個方案,通過計算獲得輔助決策的依據(jù),達到支持科學決策的計算機程序系統(tǒng)。它具有如下特點:(1) 用定量方式輔助決策,而不是代替決策;(2) 使用大量的數(shù)據(jù)和多個模型;(3) 支持決策制定過程;(4) 為多個管理層次上的用戶提供決策支持;(5) 能支持相互獨立的決策和相互依賴的決策;(6) 用于半結(jié)構(gòu)化決策領(lǐng)域。2.1.2 決策支持系統(tǒng)的體系結(jié)構(gòu)圖2.1.2為決策支持系統(tǒng)的基本結(jié)構(gòu),從圖中可看出,DSS(決策支持系統(tǒng))主要由對話(人機交互)、模型和數(shù)據(jù)組成。 圖2.1.2 決
5、策支持系統(tǒng)的基本結(jié)構(gòu)Error! Reference source not found.2.1.3 基于決策樹算法的智能決策支持系統(tǒng)在決策支持系統(tǒng)的基礎(chǔ)上,隨著人工智能領(lǐng)域的快速發(fā)展,決策支持系統(tǒng)也有了很大的改進,進而出現(xiàn)了智能決策支持系統(tǒng)。本文主要介紹基于決策樹算法的智能決策支持系統(tǒng),它的基本結(jié)構(gòu)如圖2.1.3所示: 圖2.1.3 基于決策樹算法的智能決策支持系統(tǒng)結(jié)構(gòu)圖從上圖中可看出,一個完整的決策樹分類系統(tǒng)主要包括數(shù)據(jù)庫管理、挖掘前處理、挖掘?qū)嵤?、模式評估、知識輸出表示等模塊,各個模塊相互銜接、相互聯(lián)系,共同構(gòu)成了分類數(shù)據(jù)挖掘的體系結(jié)構(gòu)3。2.2 成績分析方法2.2.1 成績分析及其重要性
6、在傳統(tǒng)的教學模式中,一方面,學生所學知識的好壞程度主要取決于考試成績的高低;另一方面,學校檢驗教師的教學質(zhì)量和效果往往也是通過學生的成績指標來反映,或者通過教務(wù)系統(tǒng)中學生對于教師的網(wǎng)上評價來反映。無可否認,這種做法可以在一定程度上反應(yīng)教師的教學質(zhì)量。然而,這種做法的一個弊端就是,學生對于教師的評價往往取決于學生的主觀認知和評價,與教師本身的教學質(zhì)量并沒有必然聯(lián)系。學生的評價可能僅僅取決于任課教師是否點名、考試出題難度高低,考試成績給分高低。顯然,這對那些教學嚴謹認真教學的任課老師是極為不利的。那么,對于教務(wù)系統(tǒng)中已存的龐大的歷史數(shù)據(jù),除了對這些數(shù)據(jù)進行最基本的查詢、統(tǒng)計等功能外,利用數(shù)據(jù)挖掘技
7、術(shù),挖掘出影響學生成績的因素,無論是對教師還是學生,都是一種比較客觀全面的教學效果的評價。利用數(shù)據(jù)挖掘技術(shù)可以從定量的角度精確地展現(xiàn)學生成績分析的多個方面,故而把數(shù)據(jù)挖掘技術(shù)引入到學生成績分析中,以此來幫助教師和教學部制定相應(yīng)的措施,有利于提高教學質(zhì)量,增強教學效果4。本文就是研究數(shù)據(jù)挖掘中的ID3決策樹算法在成績分析中的應(yīng)用。2.2.2 學生成績的ID3決策樹算法處理ID3算法主要針對決策樹中分類時候的屬性選擇問題,是決策樹算法中最具影響和最為典型的算法5。該方法使用信息增益度來選擇測試屬性,其中所涉及的公式如下:(1)假設(shè)有n個互不相容的事件,它們中有且僅有一個發(fā)生,則其平均的信息量可如下
8、度量(其中,為事件發(fā)生的概率): 公式1(2)在決策樹分類中,假設(shè)是訓練樣本集合,是訓練樣本數(shù),樣本劃分為n個不同的類,,,這些類的大小分別標記為|,|,|,則任意樣本屬于類的概率為: 公式2(3)是屬性A的所有可能的值,是屬性A有值的子集,是中的元素的個數(shù);是中的元素的個數(shù),是根據(jù)公式2計算A取值的概率;為為屬性A在值下的信息量的大小,這個值是根據(jù)公式1計算得來;所以為屬性A的信息量大小的期望值。 公式3(4)那么屬性A在集合上的信息增益值的計算公式為: - 公式4其中集合總的信息量的大小,由公式1計算得出;的值越大,說明選擇測試屬性對分類提供的信息越多。ID3算法的建立基本流程為:首先對目
9、前的數(shù)據(jù)表,建立一個節(jié)點N;如果數(shù)據(jù)表中的數(shù)據(jù)都屬于同一個類,N就是樹葉,并在樹葉上標出所屬的類;如果數(shù)據(jù)表中沒有其他數(shù)據(jù)可以考慮,則N也是樹葉,按照少數(shù)服從多數(shù)的原則在樹葉上標出所屬類別;否則,根據(jù)平均信息期望值E或Gain值選出一個最佳屬性作為節(jié)點N的測試屬性;節(jié)點選定后,對于該屬性中的每個值,從N生成一個分支,并將數(shù)據(jù)表中與該分支有關(guān)的數(shù)據(jù)收集形成分支節(jié)點的數(shù)據(jù)表,在表中刪除節(jié)點屬性那一欄;如果分支數(shù)據(jù)表非空,則運用以上算法從該節(jié)點建立子樹7。在成績分析系統(tǒng)中,首先要將數(shù)據(jù)預(yù)處理去噪等操作后,將影響學生成績的各項屬性作為樣本屬性代入到ID3算法中進行處理,根據(jù)信息增益值的大小依次選擇分類
10、的節(jié)點屬性,最后得到一棵決策樹。3成績分析決策支持系統(tǒng)的應(yīng)用3.1 案例表3.1為某學校學生A課程的成績數(shù)據(jù)庫(訓練樣本集合),訓練樣本包含四個屬性,它們分別為A課程成績、任課教師、A課程的課程類別、是否修過B課程。樣本集合的類別屬性為是否通過C 課程。該屬性有2個取值,即為C課程合格和C課程不合格。 表3.1 某學校學生的成績數(shù)據(jù)庫序號A課程成績?nèi)握n教師A課程類別是否修過B課程C課程是否合格185甲核心無不合格254乙核心無不合格370丙核心無合格490甲專業(yè)選修無合格553丁通識選修有不合格687甲通識選修有不合格766丙通識選修有合格855乙專業(yè)選修無合格942丙通識選修有不合格1089
11、丁專業(yè)選修無不合格3.2 應(yīng)用上表中,首先將A成績這個屬性進行劃分區(qū)間處理,因為ID3算法主要針對的是離散取值,而成績屬性是一個連續(xù)取值的變量。將成績屬性進行求平均數(shù)等過程處理后,分為兩個區(qū)間,即成績大于等于54.5和小于54.5。其次,根據(jù)2.2.2節(jié)中的公式和算法思想,分別計算4個屬性對于C課程是否合格分類的信息增益值,計算結(jié)果可得成績屬性的信息增益值最大,所以根節(jié)點屬性為A課程成績;再次調(diào)用ID3算法,對成績中的每個值分別計算剩下屬性的信息增益值,如此循環(huán),直到分類得到C課程是否及格方可停止。最終得到的決策樹如圖3.2所示: 圖3.2 C課程是否合格的決策樹由上圖中的決策樹可得到下面的關(guān)
12、聯(lián)規(guī)則集:(1)C課程是否合格與B課程無關(guān);(2)如果A課程成績低于54.5分,那么C課程一定不合格;(3)如果A課程成績大于54.5,當A課程的任課教師為乙和丙時,C課程合格;A課程的任課教師為丁時,C課程不合格;(4)A課程成績大于54.5的情況下,當A課程的任課教師為甲時,如果A課程為專業(yè)選修,那么選C課程的學生成績合格;如果為核心課程或者同時選修課程,那么選C課程的學生成績不合格。4 結(jié) 論對上述決策樹和規(guī)則集挖掘的結(jié)果進行分析,可以得到如下結(jié)論:(1)A課程必須作為C課程的先修課程,并且,只有在A課程達到某個成績后,C課程的成績才能合格。這樣,A課程的成績對于教學管理者在課程設(shè)置,和
13、安排學生進行重新學習時,就得作為一個必須考量的因素。是否先對A課程先重新學習后再安排關(guān)于C 課程的學習。(2)不同的授課教師也影響著C課程的學生成績,當學生A課程成績高于54.5分時,乙老師和丙老師所教的學生C 課程均合格,而同樣的情況下,丁老師所教的學生并沒有取得合格的成績,這在一定程度上也能反應(yīng)某位教師的授課質(zhì)量。而在之前,我們判斷教師的授課質(zhì)量,只能從學生的打分及相對比較簡單的合格率上進行判斷。使用算法改進得到規(guī)則后,我們可以在比較平等的情況下,對教師的授課質(zhì)量進行比較綜合全面的評價。(3)在本例中,由于所列舉的數(shù)據(jù)不夠,最后一個分類的屬性A課程的修習類別,沒有作為分類屬性進行挖掘。而在
14、數(shù)據(jù)足夠多的情況下,我們可以容易的看出在課程設(shè)置的時候,A課程是否需要作為核心課程進行教學,如果不需作為核心課程,那么在學時和學分上的要求就可以相對降低,這對于學生的課程自主安排上也有指導意義。綜合本文的研究內(nèi)容來看,將基于決策樹的智能決策支持系統(tǒng)應(yīng)用于成績分析中,將會有很大的應(yīng)用前景。利用決策樹支持系統(tǒng)進行數(shù)據(jù)挖掘,不僅可以幫助分析課程設(shè)置的先后順序或者對教師教學質(zhì)量進行評價,還可以用于研究教師年齡、職稱、學歷與教學效果之間的關(guān)系,或者是對學生的心理素質(zhì)分析7,對學生的成績進行預(yù)測??傊?,將數(shù)據(jù)挖掘技術(shù)與決策支持系統(tǒng)相結(jié)合,關(guān)注教育領(lǐng)域中各種類型的數(shù)據(jù),將會極大地促進教育教學的發(fā)展。參考文獻1 張凌.ID3算法的研究以及在成績統(tǒng)計輔助決策系統(tǒng)中的應(yīng)用D.廈門:廈門大學,2007.36-37.2 陳文偉.決策支持系統(tǒng)及其開發(fā)M.第二版.北京:清華大學出版社,2014.5-67.3 劉海燕.基于決策樹分類算法的學習成績分析系統(tǒng)的設(shè)計與實現(xiàn)D.成都:電子科
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 催告續(xù)簽合同范本
- 賣二手摩托合同范本
- 單位茶葉采購合同范例
- 古城院落買賣合同范本
- 買賣泥土合同范本
- 醫(yī)療大數(shù)據(jù)合同范本
- 北京駕校學車合同范本
- 合作外包合同范本
- 合作養(yǎng)雞詐騙合同范本
- 基于博弈論的多綜合能源系統(tǒng)低碳經(jīng)濟優(yōu)化調(diào)度研究
- 《中小學科學教育工作指南》解讀與培訓
- 跨學科主題學習的意義與設(shè)計思路
- 2025年浙江國企臺州黃巖站場管理服務(wù)有限公司招聘筆試參考題庫附帶答案詳解
- 2025年湖南高速鐵路職業(yè)技術(shù)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- -人教版四年級下冊英語全冊教案-
- 教科版三年級下冊科學全冊單元教材分析
- 2025年國家鐵路局工程質(zhì)量監(jiān)督中心招聘歷年高頻重點提升(共500題)附帶答案詳解
- 部編版教科版三年級科學下冊全冊教案【統(tǒng)編教材】
- 加快形成農(nóng)業(yè)新質(zhì)生產(chǎn)力
- 2025年中糧集團招聘筆試參考題庫含答案解析
- 湖北省七市2025屆高考數(shù)學一模試卷含解析
評論
0/150
提交評論