數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用_第1頁(yè)
數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用_第2頁(yè)
數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用_第3頁(yè)
數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用_第4頁(yè)
數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘在高校學(xué)生工作中的應(yīng)用摘要:數(shù)據(jù)挖掘技術(shù)是一種新的信息處理技術(shù),其目的是從海量數(shù)據(jù)中抽取潛在的、有價(jià)值的數(shù)據(jù)規(guī)律或數(shù)據(jù)模型。在討論目前高校學(xué)生管理中存在問(wèn)題的基礎(chǔ)上,簡(jiǎn)單介紹了數(shù)據(jù)挖掘技術(shù)。并對(duì)數(shù)據(jù)挖掘技術(shù)在高校學(xué)生工作中的幾個(gè)應(yīng)用進(jìn)行了討論,提出了新形勢(shì)下高校學(xué)生管理工作的新模式。關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;決策樹(shù);Web挖掘0引言目前,為了方便高校學(xué)生管理人員工作,各高校都建立了學(xué)生工作管理系統(tǒng)。然而,大多數(shù)管理系統(tǒng)在功能設(shè)計(jì)上偏重于學(xué)生信息的基礎(chǔ)性管理,對(duì)這些數(shù)據(jù)所隱藏的深層次的信息沒(méi)有充分地利用,不能很好地進(jìn)行數(shù)據(jù)綜合性分析與測(cè)算。因此,我們迫切希望能夠在現(xiàn)有學(xué)生工作管理系統(tǒng)的

2、基礎(chǔ)上,結(jié)合數(shù)據(jù)倉(cāng)庫(kù)知識(shí),實(shí)現(xiàn)數(shù)據(jù)挖掘功能,尋找和揭示隱藏在數(shù)據(jù)背后的秘密,從數(shù)據(jù)中挖掘出更有利于現(xiàn)實(shí)工作的有價(jià)值的信息,為整個(gè)學(xué)生管理工作提供科學(xué)有效的決策依據(jù)。1數(shù)據(jù)挖掘技術(shù)概述1.1數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘(DM,DataMining),又稱(chēng)知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)就是從大量的、不完全、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的,但又是潛在有用的信息和知識(shí)(模型或規(guī)則)的過(guò)程,是一類(lèi)深層次的數(shù)據(jù)分析方法。它的主要目的就是從大量的數(shù)據(jù)中發(fā)現(xiàn)知識(shí)或信息,提高已有數(shù)據(jù)的內(nèi)在價(jià)值,并且把數(shù)據(jù)提煉成知識(shí)。數(shù)據(jù)挖掘的任務(wù)主要包括

3、描述與預(yù)測(cè)。描述即挖掘搜索數(shù)據(jù)庫(kù)中數(shù)據(jù)的特性,預(yù)測(cè)即對(duì)當(dāng)前挖掘的數(shù)據(jù)或信息進(jìn)行推斷和評(píng)估從而對(duì)其進(jìn)行預(yù)測(cè)。數(shù)據(jù)挖掘的功能,根據(jù)挖掘任務(wù),可以分為概念描述、聚類(lèi)分析、關(guān)聯(lián)規(guī)則分析、分類(lèi)分析、回歸分析和序列模式分析等。1.2數(shù)據(jù)挖掘的主要技術(shù)數(shù)據(jù)挖掘是一門(mén)交叉學(xué)科,包括機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、模式識(shí)別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。下面介紹本論文涉及的主要技術(shù):關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是一種重要的數(shù)據(jù)挖掘方法,也是最活躍的一個(gè)研究分支。關(guān)聯(lián)規(guī)則挖掘主要是通過(guò)特定的搜索算法,挖掘出數(shù)據(jù)集中項(xiàng)集之間有價(jià)值的關(guān)聯(lián)關(guān)系,從而給出數(shù)據(jù)集的關(guān)聯(lián)特征描述。關(guān)聯(lián)規(guī)則最大的優(yōu)點(diǎn)就是能夠發(fā)現(xiàn)被大量日常操作行為所掩

4、蓋的,蘊(yùn)藏于大量業(yè)務(wù)數(shù)據(jù)下的事務(wù)之間的關(guān)聯(lián)關(guān)系。具體來(lái)說(shuō),關(guān)聯(lián)規(guī)則就是形如“AfB(support,confidenee)”的蘊(yùn)涵式,其中support是該規(guī)則的支持度,confidenee是該規(guī)則的可信度。決策樹(shù)決策樹(shù)(DecisionTree)方法主要用于數(shù)據(jù)分類(lèi)。它能夠?yàn)槲覀兿肓私獾男畔⑦M(jìn)行自動(dòng)分類(lèi),以便能一目了然地發(fā)現(xiàn)我們想要的信息。決策樹(shù)方法一般分成兩個(gè)階段:樹(shù)的構(gòu)造和樹(shù)的修剪。首先利用訓(xùn)練數(shù)據(jù)生成一個(gè)測(cè)試函數(shù),根據(jù)不同取值建立樹(shù)的分支;在每個(gè)分支子集中重復(fù)建立下層節(jié)點(diǎn)和分支,從而生成一棵決策樹(shù)。然后對(duì)決策樹(shù)進(jìn)行剪枝處理,最后把決策樹(shù)轉(zhuǎn)化為規(guī)則,利用這些規(guī)則可以對(duì)新事例進(jìn)行分類(lèi)。12

5、3Web挖掘Web挖掘是數(shù)據(jù)挖掘在Web上的應(yīng)用,它利用數(shù)據(jù)挖掘技術(shù)從與萬(wàn)維網(wǎng)相關(guān)的資源和行為中抽取感興趣的、有用的模式和隱含信息。Web挖掘技術(shù)根據(jù)挖掘內(nèi)容的不同可以分為Web結(jié)構(gòu)挖掘、Web內(nèi)容挖掘和Web日志挖掘三大類(lèi)。Web結(jié)構(gòu)挖掘主要對(duì)頁(yè)面的超鏈接進(jìn)行分析,若有較多的超鏈接指向它,則表明該頁(yè)面是重要的。Web內(nèi)容挖掘是指對(duì)Web頁(yè)面內(nèi)容及后臺(tái)交易數(shù)據(jù)庫(kù)進(jìn)行挖掘,從Web文檔內(nèi)容及其描述中的內(nèi)容信息中獲取有用知識(shí)的過(guò)程。Web日志挖掘主要是對(duì)用戶(hù)訪問(wèn)網(wǎng)站時(shí)在Web日志中留下的信息以及其它交互信息(包括:訪問(wèn)日期、時(shí)間、用戶(hù)IP地址、服務(wù)器IP地址、方法、所請(qǐng)求URL資源、用戶(hù)代理、發(fā)送

6、字節(jié)等)進(jìn)行控制,發(fā)現(xiàn)有用信息。2數(shù)據(jù)挖掘在學(xué)生工作中的應(yīng)用2.1關(guān)聯(lián)規(guī)則挖掘技術(shù)的應(yīng)用學(xué)生行為預(yù)測(cè)。在高校學(xué)生管理過(guò)程中,會(huì)建立起存儲(chǔ)學(xué)生各種信息的數(shù)據(jù)庫(kù)。我們可以通過(guò)數(shù)據(jù)庫(kù)的優(yōu)化和整合而得到一個(gè)學(xué)生管理工作的數(shù)據(jù)倉(cāng)庫(kù)。在庫(kù)中記錄著各屆學(xué)生的學(xué)習(xí)、工作、獎(jiǎng)勵(lì)、處罰等信息,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析,尋找學(xué)生各種信息之間的內(nèi)在聯(lián)系。如“當(dāng)存在A,B時(shí)可以推出C”這樣的規(guī)則,即當(dāng)有A行為和B行為發(fā)生時(shí),還會(huì)有C行為。在實(shí)際情境中,如果發(fā)現(xiàn)學(xué)生已有A,B行為時(shí),馬上可以分析其產(chǎn)生C行為的可能性,及時(shí)制定策略促進(jìn)或制止C行為的發(fā)生。這樣的行為預(yù)測(cè)如果能很好的運(yùn)用到學(xué)生心理健康教育、危機(jī)干預(yù)、素質(zhì)拓展等方

7、面,那么將可以給學(xué)生工作者提供非常有參考價(jià)值的信息。(2)招生管理。在高校招生方面,通過(guò)對(duì)學(xué)生的入學(xué)信息與在校期間的成績(jī)等一些指標(biāo)進(jìn)行相關(guān)性分析,分析出不同地區(qū)、不同科類(lèi)、不同錄取方式、不同入學(xué)成績(jī)水平以及不同素質(zhì)的學(xué)生入學(xué)后經(jīng)過(guò)大學(xué)的教育培養(yǎng)所產(chǎn)生的結(jié)果的關(guān)聯(lián)性或差異性。然后又可從人才培養(yǎng)結(jié)果的角度出發(fā),反向分析哪類(lèi)學(xué)生更有學(xué)習(xí)潛質(zhì)、更可能成為“優(yōu)秀畢業(yè)生”等,從而可總結(jié)出有實(shí)際參考價(jià)值的結(jié)論,指導(dǎo)學(xué)校招生計(jì)劃的制定、招生宣傳工作的開(kāi)展,為整個(gè)招生工作提供決策支持。(3)學(xué)生成績(jī)分析。在高等院校歷年來(lái)的學(xué)生成績(jī)是一個(gè)海量的數(shù)據(jù)存儲(chǔ),如何在海量的信息中發(fā)現(xiàn)學(xué)生管影響學(xué)生成績(jī)的因素是一個(gè)比較繁瑣

8、的工作。利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析,尋找學(xué)生的入校成績(jī)、家庭背景、參加社團(tuán)、出勤、學(xué)習(xí)態(tài)度、先修課程鄧因素與學(xué)生成績(jī)之間的內(nèi)在聯(lián)系。以便對(duì)考試不及格的學(xué)生根據(jù)原因提出警告,加強(qiáng)督學(xué),避免最終留級(jí)、退學(xué)的發(fā)生,從而體現(xiàn)出對(duì)學(xué)生的人性化教育。貧困生管理。目前,貧困生占高校學(xué)生人數(shù)的比例較大,貧困生的管理工作,已成為高校學(xué)生工作的重點(diǎn)工作。各高?;径冀⑵鸫鎯?chǔ)貧困生信息的數(shù)據(jù)庫(kù)。通過(guò)對(duì)貧困生信息進(jìn)行關(guān)聯(lián)規(guī)則挖掘,找到貧困生的成績(jī)信息,參與社會(huì)活動(dòng)信息,獲得獎(jiǎng)勵(lì)信息,食堂消費(fèi)信息等學(xué)習(xí)生活信息與貧困生基本信息,貧困生家庭勞動(dòng)力及家庭收入狀況,貧困生家庭成員及健康狀況,貧困生已獲資助情況之間的關(guān)聯(lián),有針對(duì)

9、性地開(kāi)展貧困生教育培養(yǎng)工作提供依據(jù),為貧困生認(rèn)定提供決策依據(jù)。(5)就業(yè)管理。在高校學(xué)生就業(yè)工作方面,各高校會(huì)建立起存儲(chǔ)學(xué)生各種就業(yè)信息的數(shù)據(jù)庫(kù)。通過(guò)對(duì)學(xué)生就業(yè)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,找到學(xué)生就業(yè)行業(yè)、就業(yè)地區(qū)、就業(yè)城市、學(xué)生籍貫、專(zhuān)業(yè)、專(zhuān)業(yè)成績(jī)、外語(yǔ)水平、計(jì)算機(jī)水平、實(shí)踐能力等屬性之間的關(guān)聯(lián),有助于學(xué)校教育目標(biāo)、教育方向、教育手段的定位與改進(jìn),有助于在校生明確加強(qiáng)學(xué)習(xí)與實(shí)踐的方向,有助于學(xué)校加強(qiáng)對(duì)學(xué)生就業(yè)指導(dǎo)的針對(duì)性,更好地進(jìn)行畢業(yè)生就業(yè)指導(dǎo)工作,提高學(xué)生就業(yè)率。2.2決策樹(shù)分類(lèi)技術(shù)的應(yīng)用(1)獎(jiǎng)學(xué)金評(píng)定。獎(jiǎng)學(xué)金評(píng)定是高校學(xué)生工作中比較特殊又比較復(fù)雜的一部分,而且是每年必須重復(fù)的工作。獎(jiǎng)學(xué)金的

10、評(píng)定,一方面要根掘?qū)W生各個(gè)科目的學(xué)習(xí)成績(jī),同時(shí)還要結(jié)合每位學(xué)生的具體表現(xiàn)和實(shí)際情況,包括學(xué)生的德育、體育及某方面的突出表現(xiàn)等,對(duì)于不同學(xué)生給與評(píng)定不同項(xiàng)目的獎(jiǎng)學(xué)金。其中涉及的范圍很廣,需要記錄和處理的數(shù)據(jù)也很龐大,所以要根據(jù)不同情況評(píng)定出不同的獎(jiǎng)學(xué)金獲得者并不是一件容易的事情。采用決策樹(shù)分類(lèi)方法對(duì)已收集的學(xué)生的學(xué)習(xí)成績(jī)、體育、德育和其他方面的突出表現(xiàn)的信息進(jìn)行分析處理,能夠?yàn)槲覀兿肓私獾莫?jiǎng)學(xué)金信息進(jìn)行自動(dòng)分類(lèi),以便能一目了然地發(fā)現(xiàn)我們想要的獎(jiǎng)學(xué)金信息。貧困生認(rèn)定。貧困生的認(rèn)定工作,已成為高校學(xué)生工作的重點(diǎn)工作。對(duì)貧困學(xué)生進(jìn)行分類(lèi)是貧困生認(rèn)定工作的關(guān)鍵,也是難度最大的。采用決策樹(shù)分類(lèi)方法對(duì)已收集

11、的貧困生信息進(jìn)行分析,再將學(xué)生的家庭信息進(jìn)行整理,即對(duì)學(xué)生信息進(jìn)行處理,提煉出我們需要的信息,在此處理的目的就是要讓我們知道學(xué)生的父母的基本情況、學(xué)生父母的經(jīng)濟(jì)情況、學(xué)生家庭的債務(wù)情況。經(jīng)過(guò)分析處理,我們能很容易分辨出哪種條件的學(xué)生屬于哪類(lèi)貧困。2.3Web挖掘在學(xué)生一些網(wǎng)絡(luò)行為規(guī)范與引導(dǎo)中的應(yīng)用在現(xiàn)在網(wǎng)絡(luò)信息時(shí)代BBS論壇成為了大學(xué)生們經(jīng)常活躍其中的一個(gè)典型的網(wǎng)絡(luò)陣地。在論壇里進(jìn)行交流的人多而雜,大學(xué)生經(jīng)常會(huì)在論壇里發(fā)表一些針對(duì)他們所關(guān)注或感興趣話(huà)題的觀點(diǎn)和言論,這些網(wǎng)絡(luò)行為就是我們高校學(xué)生工作管理者所應(yīng)該關(guān)注的焦點(diǎn)。在論壇上,經(jīng)過(guò)一段時(shí)間會(huì)積累大量的網(wǎng)絡(luò)信息(如注冊(cè)信息、交流信息、焦點(diǎn)信息

12、等)。利用Web挖掘技術(shù)對(duì)包括Web頁(yè)面結(jié)構(gòu)、Web頁(yè)面內(nèi)容、Web頁(yè)面日志在內(nèi)的各種Web數(shù)據(jù)進(jìn)行挖掘,可以提取抽象的、潛在的、有用的知識(shí),能夠很好地作為網(wǎng)絡(luò)行為規(guī)范與引導(dǎo)的參考需求。比如,利用Web結(jié)構(gòu)挖掘可以發(fā)現(xiàn)針對(duì)不同言論行為者在論壇中的搜索路徑,從搜索路徑找到對(duì)相關(guān)焦點(diǎn)問(wèn)題的關(guān)聯(lián)內(nèi)容;利用Web內(nèi)容挖掘可以發(fā)現(xiàn)頁(yè)面中內(nèi)容之間的密切關(guān)系,可提供對(duì)同一焦點(diǎn)問(wèn)題提出不同言論行為者的相關(guān)內(nèi)容;利用Web日志挖掘可以對(duì)網(wǎng)頁(yè)相關(guān)性、用戶(hù)訪問(wèn)模式等進(jìn)行分析。總之,將Web挖掘中發(fā)現(xiàn)的規(guī)則、模式和統(tǒng)計(jì)數(shù)據(jù)轉(zhuǎn)換為有用的知識(shí),進(jìn)而發(fā)現(xiàn)相似行為者群體、相似Web頁(yè)面和頻繁訪問(wèn)路徑等信息,在此基礎(chǔ)上進(jìn)行有針

13、對(duì)性的總結(jié)分析學(xué)生在論壇中的言論行為,便能夠及時(shí)發(fā)揮網(wǎng)絡(luò)行為規(guī)范與引導(dǎo)的作用,從而為占領(lǐng)好思想政治教育的網(wǎng)絡(luò)陣地提供有力支持。3結(jié)束語(yǔ)通過(guò)上述應(yīng)用的討論,可見(jiàn)數(shù)據(jù)挖掘技術(shù)在高校學(xué)生管理工作中能夠?yàn)楣芾碚咛峁┲匾摹⒏挥袃r(jià)值的信息或知識(shí),從而產(chǎn)生不可估量的作用。在高校學(xué)生管理工作中推廣應(yīng)用是有現(xiàn)實(shí)意義的。盡管?chē)?guó)內(nèi)目前對(duì)數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域中的應(yīng)用,尤其是學(xué)生管理工作中的應(yīng)用探索已經(jīng)有了一段時(shí)間,但研究較成熟的成果尚不多見(jiàn)。隨著數(shù)據(jù)挖掘技術(shù)應(yīng)用的不斷發(fā)展,相信其在今后的應(yīng)用研究將逐漸成為高校學(xué)生工作中的重點(diǎn)研究方向之一。為了規(guī)范日常工作和提高工作效率而開(kāi)發(fā)出具有數(shù)據(jù)挖掘功能的信息化平臺(tái)來(lái)服務(wù)學(xué)校各項(xiàng)管理工作,尤其是學(xué)生管理工作也是目前需要解決的主要技術(shù)問(wèn)題之一。參考文獻(xiàn):1何文秀數(shù)據(jù)挖掘技術(shù)在高校就業(yè)工作中的應(yīng)用研究J.開(kāi)發(fā)案例,2008(3).王欣.基于數(shù)據(jù)挖掘的高校學(xué)生培養(yǎng)及就業(yè)指導(dǎo)研究D.成都:西南交通大學(xué),2006.司曉梅數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的研究及應(yīng)用D.武漢:武漢理工大學(xué),2007.王偉鳴教育信息的關(guān)聯(lián)規(guī)則挖掘D.上海:上海海運(yùn)學(xué)院,2003.丁智斌,袁方董,賀偉.數(shù)據(jù)挖掘在高

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論