淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用_第1頁
淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用_第2頁
淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用_第3頁
淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用                        作者:惠向暉王亞偉蘇克勤韓坷 論文關(guān)鍵詞:數(shù)據(jù)挖掘高校教學(xué)教育信息化 論文摘要:數(shù)據(jù)挖掘技術(shù)目前在商業(yè)、金融業(yè)等方面都得到了廣泛的應(yīng)用,而在教育領(lǐng)域應(yīng)用較少。本文通過時數(shù)據(jù)挖掘在高校教學(xué)中的應(yīng)用分析,認(rèn)為數(shù)據(jù)挖掘技術(shù)可以幫助教學(xué)人員合理安排教學(xué)工作,協(xié)助輔導(dǎo)員對學(xué)生的管

2、理,對提高學(xué)校的教學(xué)管理水平起到指導(dǎo)作用 1引言 隨著12世紀(jì)信息化時代的到來,整個社會的信息總量呈幾何級數(shù)迅速增長,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,積累的數(shù)據(jù)越來越多,但缺乏挖掘數(shù)據(jù)中隱藏知識的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。隨著數(shù)據(jù)庫技術(shù)的成熟和數(shù)據(jù)應(yīng)用的普及,在過去的若干年中,人們積累了大量的數(shù)據(jù)資料,但數(shù)據(jù)庫中隱藏豐富的知識及有價值信息遠(yuǎn)遠(yuǎn)沒有得到充分地發(fā)掘和利用,隨著數(shù)據(jù)量以指數(shù)速度激增,人們渴求從數(shù)據(jù)汪洋中出現(xiàn)一個去粗存精、去偽存真的技術(shù),越來越希望系統(tǒng)能夠提供更高層次的數(shù)據(jù)分析功能,從中找出規(guī)律和模式,幫助決策者發(fā)現(xiàn)數(shù)據(jù)間重要但被忽略的因素,從而更好地支

3、持決策或科研工作。正是為了滿足這種要求,從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)及其核心技術(shù)數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。 2數(shù)據(jù)挖掘介紹 2.1概念及其特點 數(shù)據(jù)挖掘(DtaaMniing)是指從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的但又潛在有用的信息和知識的過程,提取的知識表示為概念、規(guī)則、模式等。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化工具表述所獲得的模式或規(guī)則。 數(shù)據(jù)挖掘有以下特點:(1)能發(fā)現(xiàn)反映系統(tǒng)局部特征和規(guī)律的模型;(2)自動趨勢預(yù)測,能發(fā)現(xiàn)“新”的知識;(3)比較容易獲得很多規(guī)則,并能及時更

4、新。數(shù)據(jù)挖掘方法具有開放性思維方法,它可以及時借鑒和引用模型法的很多成果,比如神經(jīng)網(wǎng)絡(luò)、粗糙集、樸素貝葉斯算法等方法都已被利用在數(shù)據(jù)挖掘方法中。 2.2數(shù)據(jù)挖掘目的及其過程 2.2.1目的 數(shù)據(jù)挖掘期望發(fā)現(xiàn)的知識有如下幾類:(1)反映同類事物共同性質(zhì)的泛化知識;(2)反映一事物和其他事物之間依賴或關(guān)聯(lián)的關(guān)聯(lián)型知識;(3)分類、聚類知識,是反映同類事物共同性質(zhì)的特征型知識和不同事物之間的差異型知識;(4)根據(jù)歷史和當(dāng)前的數(shù)據(jù)推測未來的預(yù)測型知識。 2.2.2挖掘的過程 挖掘過程是從大型庫中挖掘未知的、有效的、可實用的信息,并使用這些信息做出決策。通??梢苑譃闇?zhǔn)備、數(shù)據(jù)挖掘、評價階段以及運用階段等

5、四個階段。 (1)數(shù)據(jù)準(zhǔn)備階段。數(shù)據(jù)準(zhǔn)備階段是消除數(shù)據(jù)噪聲和與挖掘主題明顯無關(guān)的數(shù)據(jù),完成對數(shù)據(jù)的篩選、變換和預(yù)處理。經(jīng)處理過的數(shù)據(jù)一般存儲在數(shù)據(jù)倉庫中。數(shù)據(jù)準(zhǔn)備是否做得充分將影響到數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。包括:數(shù)據(jù)的選擇:選擇相關(guān)的數(shù)據(jù);數(shù)據(jù)的預(yù)處理:消除噪音、冗余數(shù)據(jù);數(shù)據(jù)的推測:推算缺失數(shù)據(jù);數(shù)據(jù)的轉(zhuǎn)化:離散值數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換、數(shù)據(jù)值的分組分類、數(shù)據(jù)項之間的計算組合等;數(shù)據(jù)的縮減:減少數(shù)據(jù)量。 (2)挖掘階段。該階段是數(shù)據(jù)挖掘的核心步驟,也是技術(shù)難點所在。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化

6、工具表述所獲得的模式或規(guī)則。 (3)評價階段。在數(shù)據(jù)挖掘中得到的模式可能是沒有實際意義或沒有使用價值的,也有可能不能準(zhǔn)確反映數(shù)據(jù)的真實意義,因此需要評估,確定有效的、有用的模式。評估可以根據(jù)用戶多年的經(jīng)驗,有些模式也可以直接用數(shù)據(jù)來檢驗其準(zhǔn)確性。如何將挖掘出的有用知識清楚易懂地提供給教育和管理工作者也是一項非常重要的工作,選擇合適的可視化工具,將結(jié)果以關(guān)系表或用量化特征規(guī)則表示給用戶。                  

7、60;          (4)運用階段。用戶理解的、并被認(rèn)為是符合實際和有價值的模式形成了知識。同時還要對知識進(jìn)行一致性檢查,解決與以前得到的知識互相沖突、矛盾的地方,使知識得到鞏固。運用知識有兩種方法:一種是只需看知識本身所描述的關(guān)系或結(jié)果,就可以對決策提供支持;另一種是要求運用知識對新的數(shù)據(jù)進(jìn)行分析,由此可能產(chǎn)生新的問題,而需要對知識作進(jìn)一步的優(yōu)化。 2.2.3數(shù)據(jù)挖掘的方法 在數(shù)據(jù)挖掘算法的理論基礎(chǔ)上,數(shù)據(jù)挖掘中的常用方法有:生物學(xué)方法,包括人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等;信息論方法包括決策樹

8、等;集合論方法包括約略集、模糊集、最鄰近技術(shù)等;統(tǒng)計學(xué)方法;可視化技術(shù)等方法。數(shù)據(jù)挖掘的各類算法包括預(yù)測模型、關(guān)聯(lián)規(guī)則挖掘算法、分類規(guī)則挖掘算法、序列模式分析算法、聚類分析算法、WEB數(shù)據(jù)挖掘等。 3數(shù)據(jù)挖掘在高等學(xué)校教學(xué)中的應(yīng)用 3.1學(xué)生的基本信息 利用數(shù)據(jù)挖掘技術(shù),比如可以對學(xué)生訪問情況進(jìn)行分析,跟蹤、了解學(xué)生出勤情況。還可對學(xué)生年齡等個人情況進(jìn)行分析,了解學(xué)生的組成、結(jié)構(gòu),為合理地安排課程設(shè)置提供依據(jù)。通過對學(xué)生考試情況的分析,并結(jié)合出勤情況,可作為考查學(xué)生學(xué)習(xí)的情況,為合理地評估學(xué)生綜合素質(zhì)提供依。對于挖掘出來的規(guī)則信息可以利用可視化技術(shù),以圖表或曲線等形式提供給教師,以使教師能充分

9、利用學(xué)生的問題資源,從而提高教學(xué)質(zhì)量。另外,數(shù)據(jù)挖掘可以應(yīng)用于網(wǎng)上的考試系統(tǒng),對考生情況和他取得的成績進(jìn)行挖掘,以幫助教師在以后的教學(xué)中更好地讓學(xué)生掌握知識。 3.2學(xué)生的學(xué)習(xí)特征 學(xué)生特征包括兩個方面:一是學(xué)習(xí)準(zhǔn)備,一是學(xué)習(xí)風(fēng)格。學(xué)習(xí)準(zhǔn)備包括初始能力和一般特征兩個方面。學(xué)生的初始能力是指學(xué)生在學(xué)習(xí)某一特定的課程內(nèi)容時,已經(jīng)具備的有關(guān)知識與技能的基礎(chǔ),以及他們對這些學(xué)習(xí)內(nèi)容的認(rèn)識和態(tài)度。學(xué)生的一般特征則是指在學(xué)習(xí)過程中影響學(xué)生的心理、生理和社會的特點,包括年齡、性別、年級、認(rèn)知成熟度、智力才能、學(xué)習(xí)動機、個人對學(xué)習(xí)的期望、生活經(jīng)驗、文化、社會、經(jīng)濟(jì)等背景因素。學(xué)生的學(xué)習(xí)風(fēng)格與學(xué)習(xí)活動有著密切的

10、關(guān)系。對學(xué)生感知不同事物、并對不同事物做出反應(yīng)這兩方面產(chǎn)生影響的所有心理特征構(gòu)成了學(xué)習(xí)風(fēng)格。 利用數(shù)據(jù)挖掘功能分析學(xué)生特征,并在此基礎(chǔ)上組織學(xué)習(xí)內(nèi)容、闡明學(xué)習(xí)目標(biāo)、確定教學(xué)策略、選擇教學(xué)媒體,為學(xué)生創(chuàng)造出一個適合其內(nèi)部條件的外部學(xué)習(xí)環(huán)境,使有效學(xué)習(xí)發(fā)生在每個學(xué)生的身上。 3.3預(yù)測學(xué)生和教師行為發(fā)生 管理信息系統(tǒng)中記錄著有關(guān)學(xué)生與教師在教學(xué)中發(fā)生的各種教學(xué)事故以及典型教學(xué)事例等教學(xué)運行信息,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與演變分析等功能,尋找?guī)熒鞣N行為活動之間的內(nèi)在聯(lián)系。如“當(dāng)存在A,B時可以推出C,這樣的規(guī)則,即當(dāng)有A行為和B行為發(fā)生時,還會有C行為。在教學(xué)過程中,如果發(fā)現(xiàn)學(xué)生或教師已有A,B行為

11、時,馬上可以分析其產(chǎn)生C行為的可能性,及時制定策略促進(jìn)或制止C行為的發(fā)生。 3.4合理設(shè)置課程 在學(xué)校,學(xué)生的課程學(xué)習(xí)是循序漸進(jìn)的,而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系。在學(xué)一門較高級課程之前必須先修一些先行課程,如果先行課程沒有學(xué)好,勢必會影響后續(xù)課程的學(xué)習(xí)。另外,同一年級學(xué)習(xí)同一課程的不同班級,由于授課教師、班級文化的不同,班內(nèi)學(xué)生的總體成績相差有時會很大。利用學(xué)校教學(xué)數(shù)據(jù)庫中存放的歷屆學(xué)生各門學(xué)科的考試成績,結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時間序列分析等相關(guān)功能,就能從這些海量數(shù)據(jù)中挖掘出有用的信息,幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì),得出一些具有價值的規(guī)則和信息,最終找到影響學(xué)生成績

12、的原因。在此基礎(chǔ)上,對課程設(shè)置做出合理安排。 3.5評價學(xué)生學(xué)習(xí)情況 學(xué)習(xí)評價是教育工作者的重要職責(zé)之一。評定學(xué)生的學(xué)習(xí)行為,既對學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異,便于因材施教的途徑。                             特別是

13、對成績管理數(shù)據(jù)庫進(jìn)行挖掘,其數(shù)據(jù)來源于成績管理數(shù)據(jù)庫,挖掘的任務(wù)就是從用戶指定的數(shù)據(jù)庫中以不同的角度或不同的層次上采掘出一系列的統(tǒng)計結(jié)果,如分布情況、關(guān)系,對比、顯著性檢驗等,采掘結(jié)果用交叉表,特征規(guī)則,關(guān)聯(lián)規(guī)則,統(tǒng)計的曲線、圖表等表示,所以采用統(tǒng)計分析方法具有簡單、方便、直觀等優(yōu)點,最為合適。 因此對學(xué)生學(xué)習(xí)行為和綜合素質(zhì)進(jìn)行評價,一般采用模糊論中的模糊綜合評判及模糊聚類的方法,對評價結(jié)果采用了對定性和定量指標(biāo)加權(quán)平均算出綜合素質(zhì)評價得分并排名的方法,而且由于學(xué)生綜合素質(zhì)的評價指標(biāo)是動態(tài)變化的,往往選用動態(tài)聚類法對評判結(jié)果進(jìn)行動態(tài)聚類分析。 3.6評價教學(xué)質(zhì)里 教學(xué)評價是根據(jù)教育目標(biāo)的要求,

14、按一定的規(guī)則對教學(xué)效果做出描述和確定,是教學(xué)各環(huán)節(jié)中必不可少的一環(huán)。教學(xué)評價可以通過校園網(wǎng)收集學(xué)生對任課教師所講授、輔導(dǎo)課程的意見、評價。有關(guān)學(xué)生座談意見、學(xué)生打分評價、平時各項教學(xué)檢查、相應(yīng)課程期末考試班級成績匯總等都是教學(xué)評價的內(nèi)容,把這些數(shù)據(jù)要作為教師教授相應(yīng)課程的檔案數(shù)據(jù)全部存人數(shù)據(jù)庫。 利用數(shù)據(jù)挖掘?qū)?shù)據(jù)庫中有關(guān)教學(xué)的各項評價進(jìn)行分析處理,可以確定教師的教學(xué)內(nèi)容的范圍和深度是否合適;選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對象;講解的時間是否恰到好處;教學(xué)策略是否得當(dāng)?shù)取亩梢约皶r的將挖掘出的規(guī)則信息反饋給教師,以期更好地提高其教學(xué)水平,更好地服務(wù)于學(xué)生。 4結(jié)束語 總之,隨著信息量的急

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論