版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中應(yīng)用綜述摘要:高校教務(wù)管理系統(tǒng)中積累大量的教學(xué)數(shù)據(jù), 其中蘊(yùn)藏一些有用的信息。數(shù)據(jù)挖掘技術(shù)在教務(wù)管理中的應(yīng) 用主要是通過學(xué)生的成績、教學(xué)評價(jià)、教師科研教學(xué)等數(shù)據(jù) 的分析,發(fā)現(xiàn)其中隱藏的信息,從而為教務(wù)管理者制定相關(guān) 決策,例如人才培養(yǎng)方案的制定、課程安排、試卷命題提供 依據(jù)。關(guān)鍵詞:數(shù)據(jù)挖掘 教務(wù)管理應(yīng)用中圖分類號:tp311. 13文獻(xiàn)標(biāo)識(shí)碼:a文章編號:1007-3973 (2013) 007-075-021引言近年來,隨著高校信息化建設(shè)的深入,高校內(nèi)部構(gòu)建了 豐富的信息系統(tǒng)并累積了海量數(shù)據(jù)。教務(wù)管理是高校日常活 動(dòng)中的重要組成部分,對教務(wù)管理系統(tǒng)積累的大量數(shù)據(jù)
2、進(jìn)行 分析和挖掘,將會(huì)發(fā)現(xiàn)一些潛在的知識(shí),從而為提高教學(xué)質(zhì) 量,優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)。本從將對數(shù)據(jù)挖掘 技術(shù)在教務(wù)管理中的應(yīng)用進(jìn)行論述。2數(shù)據(jù)挖掘概述2.1數(shù)據(jù)挖掘的概念與應(yīng)用隨著計(jì)算機(jī)硬件和信息技術(shù)的發(fā)展,使得海量數(shù)據(jù)的處 理已經(jīng)成為研究與生產(chǎn)中的一項(xiàng)重要工作,數(shù)據(jù)挖掘技術(shù)由 此而誕生。數(shù)據(jù)挖掘也叫知識(shí)發(fā)現(xiàn),指的是從大型數(shù)據(jù)集中 提取一些事先未知的、隱含的潛在知識(shí)的過程。這些知識(shí)的 表現(xiàn)形式可以是概念、規(guī)律、模式、規(guī)則等。如今,數(shù)據(jù)挖 掘目前已經(jīng)廣泛應(yīng)用于許多領(lǐng)域,比如生物醫(yī)學(xué)、金融數(shù)據(jù) 分析、零售業(yè)、電信行業(yè)等等。2. 2數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘除了具有查詢數(shù)據(jù)的功能,還能夠發(fā)現(xiàn)以
3、前未 發(fā)現(xiàn)的模式,并預(yù)測將來的趨勢和行為。概括起來,數(shù)據(jù)挖 掘主要有以下幾項(xiàng)功能,即概念描述、分類和預(yù)測、關(guān)聯(lián)分 析、聚類分析、和孤立點(diǎn)分析。(1) 概念描述。它是指描述某類對象具有的內(nèi)涵、并 概括這類對象的有關(guān)特征。概念描述的兩種方式分別是數(shù)據(jù) 特征化和數(shù)據(jù)區(qū)分。數(shù)據(jù)特征化是描述某類對象的共同特 征,而數(shù)據(jù)區(qū)分則是描述不同類對象之間的區(qū)別。(2) 分類和預(yù)測。首先,分類建立一個(gè)能夠描述并區(qū) 分?jǐn)?shù)據(jù)類的模型,然后使用這個(gè)模型來預(yù)測類標(biāo)記未知的對 象類。歸納分類的形式有多樣,比如分類規(guī)則、判定樹和神 經(jīng)網(wǎng)絡(luò)等等。當(dāng)被預(yù)測的值是數(shù)值而不是類標(biāo)記時(shí),通常稱 之為預(yù)測。(3) 關(guān)聯(lián)分析。關(guān)聯(lián)分析的目的
4、是發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這 些規(guī)則展示的是兩個(gè)或兩個(gè)以上的數(shù)據(jù)項(xiàng)頻繁地在給定數(shù) 據(jù)集中一起出現(xiàn)的條件。若這些數(shù)據(jù)項(xiàng)是以某種規(guī)律共同出 現(xiàn)的話,這些數(shù)據(jù)項(xiàng)之間就可能存在某種關(guān)聯(lián),這種規(guī)律稱 之為關(guān)聯(lián)規(guī)則。其關(guān)聯(lián)類型主要有簡單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因 果關(guān)聯(lián)。可信度就成為是關(guān)聯(lián)分析生成的規(guī)則的一個(gè)重要衡 量指標(biāo)。(4) 聚類分析。聚類指的是將待挖掘的數(shù)據(jù)分成多個(gè) 類或者簇,具有較高的相似度的數(shù)據(jù)會(huì)被分到同一個(gè)簇中, 而差距較大的數(shù)據(jù)則會(huì)處于不同的簇中。聚類分析是一種重 要的人類行為,它增強(qiáng)了人們對客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描 述和偏差分析的先決條件。傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)統(tǒng)計(jì) 法是聚類分析的主要技術(shù)。(5) 孤立
5、點(diǎn)分析。孤立點(diǎn)指的是數(shù)據(jù)庫中存在的一些 異常記錄,它們與數(shù)據(jù)的一般行為或者模型不一致。孤立點(diǎn) 可能會(huì)包括很多潛在的知識(shí),如不滿足規(guī)則的特例、分類中 的反常實(shí)例,這些罕見的事件可能比正常出現(xiàn)的更有趣。孤 立點(diǎn)分析又稱作孤立點(diǎn)挖掘。2. 3數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟一般包括:確定待挖掘?qū)ο蟆?shù)據(jù)預(yù)處 理、建立模型、數(shù)據(jù)挖掘、模式評估和與知識(shí)應(yīng)用這幾個(gè)階 段,其中數(shù)據(jù)預(yù)處理又包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇 與數(shù)據(jù)變換。3教務(wù)管理中的數(shù)據(jù)挖掘數(shù)據(jù)挖據(jù)在教務(wù)管理的應(yīng)用主要有以下項(xiàng)目:學(xué)生信息 管理、教學(xué)評價(jià)、成績分析、遠(yuǎn)程教育、智能教學(xué)、個(gè)性化 培養(yǎng),其中教學(xué)評價(jià)、成績分析以及個(gè)性化學(xué)習(xí)方案都是教
6、務(wù)管理的重要環(huán)節(jié)。教務(wù)管理中存在大量的待處理數(shù)據(jù),比 如教師信息、學(xué)生信息、學(xué)校的所有課程信息、教學(xué)計(jì)劃信 息、管理部門的信息等等,使用數(shù)據(jù)挖掘技術(shù)能有效的提高 教務(wù)管理的效率。結(jié)合2. 2中提到的數(shù)據(jù)挖掘的功能,這里 主要介紹在教務(wù)管理系統(tǒng)中比較廣泛應(yīng)用到的以下四種數(shù) 據(jù)挖掘任務(wù)。3. 1分類和預(yù)測分類和預(yù)測在教務(wù)管理的應(yīng)用一般是用于針對學(xué)生制 訂個(gè)性化的人才培養(yǎng)方案。尊重學(xué)生的個(gè)性發(fā)展是現(xiàn)代高等 教育的重要理念,這就要求高校將體現(xiàn)學(xué)生的個(gè)性化特征當(dāng) 作人才培養(yǎng)的工作重點(diǎn),要制定不同的培養(yǎng)方式以適應(yīng)不同 的學(xué)生的個(gè)性發(fā)展。通過積累的一定數(shù)量的數(shù)據(jù),其內(nèi)容主 要包括學(xué)生個(gè)體信息,如性格特征、興
7、趣愛好、日常行為記 錄以及學(xué)習(xí)情況等,還要包括教學(xué)信息,如課程設(shè)置、教師 分配和學(xué)校教學(xué)資源調(diào)配情況等,由此建立若干個(gè)模型,在 此基礎(chǔ)上進(jìn)行分析、歸納和總結(jié)。以共同之處為標(biāo)準(zhǔn),按照 分類模式進(jìn)行劃分、歸類,由此制訂出多個(gè)具有個(gè)性化特征 的培養(yǎng)方案。然后將某個(gè)給定范圍內(nèi)的學(xué)生劃分,使用某種 個(gè)性化的培養(yǎng)方案。將分類與預(yù)測應(yīng)用到制訂人才培養(yǎng)方案 的過程中,既對學(xué)校的學(xué)科課程設(shè)置提供了建設(shè)性意見,又 為學(xué)生自主性學(xué)習(xí)與個(gè)性化學(xué)習(xí)提供更為科學(xué)有效的指導(dǎo), 有利于實(shí)現(xiàn)人才培養(yǎng)的多樣化、個(gè)性化、創(chuàng)新型人才的培養(yǎng) 目標(biāo)。3. 2關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則是通過分析一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)規(guī)律,挖 掘出隱藏在數(shù)據(jù)間的關(guān)聯(lián)
8、或相互關(guān)系。目前在教務(wù)管理應(yīng)用 中研究得最多的就是關(guān)聯(lián)規(guī)則的挖掘,如'關(guān)聯(lián)規(guī)則在選課 系統(tǒng)中的應(yīng)用”和'關(guān)聯(lián)規(guī)則在高校學(xué)位預(yù)警中的應(yīng)用”, 兩篇文章所研究得都是對大量學(xué)生成績數(shù)據(jù)進(jìn)行分析,前者 是發(fā)現(xiàn)不同課程設(shè)置順序?qū)W(xué)生成績的影響,由此可以更合 理的安排課程順序。后者則是挖掘高年級學(xué)生的成績數(shù)據(jù), 從中得到不能授予學(xué)位學(xué)生的不及格課程規(guī)律,從而達(dá)到學(xué) 位預(yù)警的目的。還有一些關(guān)于師資方面應(yīng)用的研究,比如關(guān) 聯(lián)規(guī)則在教務(wù)管理決策支持中的應(yīng)用,通過分析了教務(wù)管理 中教師信息之間的隱藏關(guān)系,并對數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化、離散 化處理,通過事例分析了教師的教學(xué)與科研之間的隱含關(guān) 系,可為教務(wù)管
9、理提供決策支持。3.3聚類分析在教務(wù)管理中,聚類分析主要應(yīng)用于分析試卷質(zhì)量。首 先通過對學(xué)生考試成績的分布進(jìn)行測量,從而對試卷質(zhì)量得 出一個(gè)大致評價(jià)。一般來說,在試卷編制得比較成功,試題 質(zhì)量較好的情況下,考試成績會(huì)呈正態(tài)分布,測量效果符合 自然分布規(guī)律。雙峰型如果考試成績分布呈雙峰型,則說明試題難度區(qū) 分不大,存在偏難或偏易的兩極分化現(xiàn)象,而中等難度的題 目太少。這種試題的難度分布缺乏區(qū)分度,不能將將成績優(yōu) 秀的學(xué)生與成績較差的學(xué)生進(jìn)行區(qū)分,只能區(qū)分中等程度的 學(xué)生。陡峭型的成績分布則說明試題中的大部分是屬于同等 難度的,這樣的試題難度系數(shù)偏小,致使學(xué)生分?jǐn)?shù)分布過于 集中,這樣也不能將學(xué)生的
10、學(xué)習(xí)成績進(jìn)行區(qū)分。因此,可通 過對學(xué)生考試成績分布狀況的分析,計(jì)算出兩個(gè)判斷指標(biāo), 即峰態(tài)系數(shù)和偏態(tài)系數(shù),然后將成績分布情況類型進(jìn)行分 類,再進(jìn)行聚類分析。如此就能有效地提高試卷命題質(zhì)量。3. 4孤立點(diǎn)檢測孤立點(diǎn)指的是數(shù)據(jù)集中與大部分?jǐn)?shù)據(jù)模型不一致的數(shù) 據(jù)對象。孤立點(diǎn)檢測又稱作異常檢測,目的在于識(shí)別出與其 他數(shù)據(jù)特征有明顯不同的觀測值。孤立點(diǎn)檢測算法的目標(biāo)是 發(fā)現(xiàn)孤立點(diǎn),還要避免將正常的對象標(biāo)注為孤立點(diǎn)。孤立點(diǎn) 檢測算法的兩個(gè)標(biāo)準(zhǔn)是高檢測率和低誤報(bào)率。教務(wù)管理系統(tǒng) 中的數(shù)據(jù)挖掘大多利用關(guān)聯(lián)分析或者分類分析。在發(fā)現(xiàn)這些 規(guī)則的同時(shí),也會(huì)忽略一些偶爾現(xiàn)象。偶爾現(xiàn)象也會(huì)包含一 些重要信息,更應(yīng)該引起關(guān)注。孤立點(diǎn)檢測的目的就是找出 教務(wù)管理信息中往往會(huì)被忽略的例外情況。例如選取學(xué)生各 個(gè)學(xué)期的平均成績作為特征值,如果該生平均成績呈上升趨 勢,說明該生進(jìn)步較快,呈下降趨勢則成績下降明顯,成績 不穩(wěn)定的學(xué)生則有可能有作弊嫌疑。孤立點(diǎn)檢測還可以用于 課程分析,選取用各個(gè)學(xué)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 防溺水安全教育的演講稿參考5篇
- 電影《念書的孩子》觀后感8篇
- 2024至2030年中國自動(dòng)切腳計(jì)數(shù)機(jī)數(shù)據(jù)監(jiān)測研究報(bào)告
- 2024至2030年中國散熱量表數(shù)據(jù)監(jiān)測研究報(bào)告
- 2024至2030年酚醛泡沫保溫板項(xiàng)目投資價(jià)值分析報(bào)告
- 2024年中國電機(jī)保護(hù)控制器市場調(diào)查研究報(bào)告
- 2024至2030年焊劑磁選機(jī)項(xiàng)目投資價(jià)值分析報(bào)告
- 2024年金屬環(huán)項(xiàng)目可行性研究報(bào)告
- 2022軍訓(xùn)日記參考心得體會(huì)高中5篇
- 2022酒店管理培訓(xùn)參考心得體會(huì)五篇
- 《中醫(yī)基礎(chǔ)理論》體質(zhì)-課件
- 螃蟹奇遇記課件
- 數(shù)字化環(huán)境下的英語教學(xué)轉(zhuǎn)型教學(xué)課件
- GB 29743.1-2022機(jī)動(dòng)車?yán)鋮s液第1部分:燃油汽車發(fā)動(dòng)機(jī)冷卻液
- 涉密人員重大事項(xiàng)報(bào)告制度
- 辯論賽-結(jié)果比過程更重要
- (完整版)新概念英語青少版2B期末測試卷
- 工業(yè)數(shù)字化智能化2030白皮書
- 田徑競賽規(guī)則與裁判法課件
- 隧道高空作業(yè)安全要求
- 裝飾裝修技術(shù)標(biāo)范本
評論
0/150
提交評論