DMS個性化遠程教育課程_第1頁
DMS個性化遠程教育課程_第2頁
DMS個性化遠程教育課程_第3頁
DMS個性化遠程教育課程_第4頁
DMS個性化遠程教育課程_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、DMS個性化遠程教育課程服務(wù)于個別學(xué)生的需要獨立的時間,地點,或任何其他限制。這意味著應(yīng)該服務(wù)的遠程教育系統(tǒng)數(shù)據(jù)挖掘系統(tǒng)(DMS)監(jiān)測、干預(yù),法律顧問教育學(xué)習(xí)的過程。DMS數(shù)據(jù)挖掘系統(tǒng)DMS是設(shè)計和實現(xiàn)分析兩種編程課程的學(xué)習(xí)記錄計算機科學(xué)的課程。各種數(shù)據(jù)挖掘方案,包括線性的回歸和概率模型,用于描述和預(yù)測學(xué)生的性能。結(jié)果表明,DMS可以幫助遠程教育老師,甚至在相對較少的課程的學(xué)生,介入一個學(xué)習(xí)的過程在幾個級別:提高練習(xí),調(diào)度過程和識別潛在的輟學(xué)者處于早期階段。粘膠絲(虛擬計算機科學(xué)的研究)是一個遠程教育項目最初打算為高中學(xué)生感興趣繼續(xù)在大學(xué)之后與計算機科學(xué)(CS)作為他們的主要主題1。提供與真正

2、的學(xué)習(xí)者探索設(shè)計一個實驗平臺技術(shù)教育的機會,吸引年輕人的選擇信息和通信技術(shù)(ICT)作為未來的職業(yè)。能調(diào)用這些利益招聘、學(xué)術(shù)和工業(yè)的分別。因此,粘膠絲項目的成功可以實現(xiàn)測量的三個期望,在某種程度上,數(shù)據(jù)挖掘可以用于分析和支持至少1和3。數(shù)據(jù)挖掘技術(shù)如何更好的促進學(xué)生成績,獲益我們招聘的目的?招聘的一個重要組成部分是學(xué)生通過粘膠絲來完成正向方式學(xué)業(yè)。我們的主要動機是構(gòu)造模型的數(shù)據(jù)。這需要描述性和預(yù)測性模型之間的交互,或者數(shù)據(jù)采礦和機器學(xué)習(xí)。智能輔導(dǎo)系統(tǒng)的范例這個想法智能輔導(dǎo)系統(tǒng)是適應(yīng)根據(jù)個人教學(xué)技能,知識,和需要,給個人及時的反饋。系統(tǒng)是一個家教的核心模塊,這是負責(zé)選擇合適的生成等操作測試和練習(xí)

3、,給予提示和解釋,表明學(xué)習(xí)主題、搜索和學(xué)習(xí)材料的合作伙伴。智能輔導(dǎo)系統(tǒng)的主要思想:他們應(yīng)該適應(yīng)即適應(yīng)個體學(xué)生的需求。但到目前為止,當(dāng)前信息技術(shù)服務(wù)標準遠非真正的自適應(yīng)性。相反,當(dāng)前系統(tǒng)非常穩(wěn)定:他們要么是基于一個完全確定性、基于規(guī)則的系統(tǒng)或即使使用一些不確定的規(guī)則,他們也是由專家預(yù)定義的。一個典型的由一個預(yù)定義的學(xué)習(xí)路徑,學(xué)生收益通過研究一個概念并通過測試進入下一個話題。所謂的貝葉斯學(xué)習(xí)模型也是固定的模型結(jié)構(gòu),老師分配概率通過一個測試,如果這個概念實際上是不清楚的,則這樣的模型是唯一的貝葉斯更新的方法概率的貝葉斯規(guī)則。例如目錄搜索方式程序提供了一個總體框架貝葉斯,那么老師可以自己取舍為她自己的

4、課程設(shè)置分配所需的參數(shù)。一般造型開發(fā)真正的范例自適應(yīng)的同期和測試某些技術(shù)與實際過程數(shù)據(jù)的適用性。采用了描述性和預(yù)測性模型的對偶原則相結(jié)合的數(shù)據(jù)挖掘和機器學(xué)習(xí)的經(jīng)典范例,其想法是在描述性階段,我們分析過程數(shù)據(jù)和搜索本地模式的相關(guān)性和關(guān)聯(lián)規(guī)則。這些結(jié)果指南,尤其是在選擇合適的建模范式確定預(yù)測模型的模型結(jié)構(gòu)。在預(yù)測階段,建模范式或范式(如線性回歸,貝葉斯網(wǎng)絡(luò))是固定的,我們定義了模型結(jié)構(gòu)(變量及其關(guān)系),然后得到了數(shù)據(jù)模型參數(shù)。由此產(chǎn)生的模型中應(yīng)用下一個課程和更新的新證據(jù)。這也是最后的測試模型的有效性和指導(dǎo)施工過程在接下來的周期。數(shù)據(jù)描述在我們使用兩種編程課程記錄(Prog.1和Prog.2),教下

5、粘膠絲遠程學(xué)習(xí)計劃的模型建設(shè)中,課程記錄標識符包含學(xué)生性別、鍛煉任務(wù)點19周,考試任務(wù)分,總分和成績、鍛煉任務(wù)劃分共分為六類,根據(jù)主題(表1),數(shù)據(jù)被收集在學(xué)術(shù)年2001 - 2002和2002 2002,在兩年里自課程開始一直都不變,我們只是將兩個相結(jié)合記錄經(jīng)過正?;纱水a(chǎn)生的數(shù)據(jù)集被分成兩組。計算方式:Parts:viscos1,這包含了所有的學(xué)生(122行),和viscos2,其中包含只有那些通過Prog.1的課程的學(xué)生。1課程(91行)。選擇屬性,其域名和描述列于表2。在原始數(shù)據(jù)集,所有屬性是數(shù)字的,但對于關(guān)聯(lián)規(guī)則概率模型,我們將其轉(zhuǎn)化為二進制值的定性屬性。在運動類,A,F,我們簡單

6、將數(shù)字域分為兩類:little=0,,max/2,lot=max/2+1,max.但是總得分,max/2=15通過限制,我們對于通過Prog.1的課程的學(xué)生很感興趣。當(dāng)TPF R2,需要從其他課程的最后信息(運動類F受歡迎的)才能使用。另一方面模型BF R2可以對基于對運動類B信息編程課程二次的結(jié)果做出很好的預(yù)測。模型在運動類F已使用的產(chǎn)量特別好的結(jié)果為成功與失敗的預(yù)測。這表明E意義重大。因此它可以用來事前為學(xué)生提供幫助的課程預(yù)測考試失敗。我們也看到F沒有屬性在模型的預(yù)測效果T P1,D,EF R2等于預(yù)測從T P1,D,E,FF R2,從而影響F課程的結(jié)果是最小的。關(guān)聯(lián)規(guī)則與概率模型關(guān)聯(lián)規(guī)則

7、提供了一個很好的方法來模擬屬性之間的非線性依賴關(guān)系。一般來說,關(guān)聯(lián)規(guī)則是形式XY,X是屬性集Y的單一屬性。該規(guī)則的信心,cf(zXY),告訴如何堅強規(guī)則是,和頻率或規(guī)則的支持,fr(XY),告訴覆蓋規(guī)則(即數(shù)據(jù)集的一部分)。我們正式定義:定義2設(shè)RA1Ak是一組二進制值的屬性,R和在R的關(guān)系。規(guī)則信心和頻率XY,XR,YR,YR被定義為cf(XY)P(X,Y)/P(X)P(YX)和fr(XY)P(X,Y)給定用戶定義的閾值cf,最小fr0,1,我們說規(guī)則是有信心的。如果cf(XY)最小cf。頻繁的說如果fr(XY)最小fr。在粘度數(shù)據(jù)我們發(fā)現(xiàn)了幾個有趣的關(guān)聯(lián)規(guī)則。在表6中列出了預(yù)測程序的最終結(jié)

8、果都頻繁的規(guī)則。1、2課程。最小頻率閾值最小fr定義根據(jù)x2試驗只抓那些規(guī)則,這是統(tǒng)計學(xué)上的顯著水平0.01(表5)。這個決定是至關(guān)重要的(相比,用戶定義的,恒定的頻率閾值),因為對于小數(shù)據(jù)集具有很少的屬性的頻率真的很高,之前的規(guī)則有任何統(tǒng)計值。此外,脫粒歲迅速減小,當(dāng)屬性的數(shù)目的增長。對于最小的信心我們用價值cf0.7閾值。 關(guān)聯(lián)規(guī)則已經(jīng)可以用于預(yù)測。我們可以預(yù)測學(xué)生已經(jīng)做了很多A和B任務(wù)將92%概率通過課程1。然而,頻繁的規(guī)則只覆蓋學(xué)生的子集,為了這個目的需要一個更平常的模型。對于程序1和程序2我們已經(jīng)構(gòu)建簡單樸素貝葉斯模型,NB1、NB2,。1、黃體酮2課程。在圖2中給出了模型結(jié)構(gòu),圖7

9、中給出了參數(shù)。 在樸素貝葉斯模型中,我們對葉節(jié)點進行了樸素貝葉斯假設(shè)僅依靠根節(jié)點。在現(xiàn)實中這個假設(shè)很少見,但在實踐中,樸素貝葉斯模型已經(jīng)證明了很好的工作。事實上,多明戈斯等鋁。 19 已經(jīng)表明,這是一個充分的,但不是必要條件。問題建模:球的顏色表示類別,這里有兩類,即C:Cr,Cy。球的特征有2個,分別表示小寫字符和數(shù)字,即F:F1,F2。現(xiàn)在的問題是:對于一個給定的特征變量f(比如),計算P(Cr|f)和P(Cy|f)哪個大。利用貝葉斯定理:P(Cr|f) = P(Crf) / P(f) = P(Cr)*P(f|Cr) / P(f) = P(Cr)*P(f1|Cr)*P(f2|Cr) / P

10、(f)最后一步的推理我們稍后來說。 通過那100個球的樣本集,我們可以很容易地得到等式最右邊的各個概率值,比如有48個黃球,52個紅球,則P(Cr)=52/100,其中有6個紅球的字符為b,有10個紅球的數(shù)字為7,則P(f1|Cr)=6/52,P(f2|Cr)=10/52。這樣,通過統(tǒng)計樣本的各類別先驗概率和“已知類別下各特征”的條件概率,通過上述公式推理,可以很容易地得到這個給定變量f所屬各類別的概率值。 現(xiàn)在再來說說上述推理中的最后一步是如何得到的,即P(f|Cr)是如何演化為P(f1|Cr)*P(f2|Cr)的?原因很簡單,因為樸素貝葉斯基于這樣一個假設(shè):特征集里的每個特征都是彼此獨立的

11、。由概率知識可知當(dāng)A,B彼此獨立時,P(AB)=P(A)P(B)。因此上述推理很自然地成立了。這個假設(shè)是樸素貝葉斯不同于貝葉斯網(wǎng)絡(luò)等其它貝葉斯分類算法的根本,也是樸素貝葉斯這個名稱的由來。雖然這個假設(shè)縮小了其使用場景,但是其形式上的簡單性對于解決一些特征彼此或近似獨立的問題時,有著非常好的表現(xiàn)。我們要謹慎地使用貝葉斯公式。一個更好的更接近的方法可能是在使用貝葉斯公式時,其屬性網(wǎng)之間的關(guān)聯(lián)度相對獨立,弗里德曼等人也指出,可以實現(xiàn)的達到最佳精度的方式是讓每個屬性最多與一個其他屬性相關(guān)聯(lián)。Dempster-Shafer理論提供了另一種選擇:我們可以通過強化關(guān)聯(lián)規(guī)則來及時更新(比如F=lotFR2=1

12、),但保持其他的預(yù)測不變。交叉驗證的預(yù)測能力評估當(dāng)沒有新的測試數(shù)據(jù)可以利用的時候,交叉驗證是一個標準的方法來評估模型的預(yù)測能力。方法是原始數(shù)據(jù)的大小設(shè)置為n,并將n分成k次做成一個訓(xùn)練集和一個測試集n-n/k和n/k。每一次一個新模型的誕源于訓(xùn)練集,以及測試集的測試。最后,總結(jié)得到的總的分類率(平均值)的分類。 對比此模型,我們發(fā)現(xiàn)LR模型作出更為悲觀的預(yù)測,例如LR模型認為失敗優(yōu)于通過,而NB模型更為積極。LR模型中分類率更優(yōu),因為NB模型建立的模型結(jié)構(gòu)較為簡單,不管學(xué)生在分類上得分多少,它只包含二進制信息。但是,當(dāng)我們只考慮一般的分類率時,NB模型較之LR模型可以利用新的信息(測試三中的E

13、點)。NB模型更為通用也被認為更適用于有不同任務(wù)與實現(xiàn)最大效率的新課程的設(shè)立。兩種預(yù)測模型范式的適用范圍取決于一些假設(shè),這些假設(shè)在描述性模型中體現(xiàn)。線性回歸模型以數(shù)值屬性的強相關(guān)性為前提。運動的點和總點數(shù)都非常滿足這個條件,而且值得注意,對于變化的不同類的屬性值,該模型可以容易擬合。為了最大限度地減少這種差異,我們建議相似特性進行分類。貝葉斯模型不只捕捉線性依賴關(guān)系,包括任何條件下的關(guān)系。他們可以很容易地應(yīng)用到任何離散數(shù)據(jù),但要限制模型的復(fù)雜度,從而過度擬合,我們獲得所有屬性值的二進制數(shù)值。這使得模型很通用化,但在另一方面,貝葉斯模型不像線性回歸那樣合適。重要的問題是貝葉斯的假設(shè),屬性應(yīng)該是獨立的類。它已經(jīng)表明,這種情況下是唯一的,但對于最優(yōu)性的貝葉斯分類是沒有必要的,我們的實驗表明,該模型有很強的相關(guān)性(即線性依賴)。這種情況經(jīng)常發(fā)生,某些主題是新主題的先決條件,且后者反映了前者。這就是為什么我們正在研究其他類似的范例,像一般的貝葉斯網(wǎng)絡(luò)和D-S證據(jù)的適用性理論。另一個有趣的問題是,相關(guān)性缺乏是否貝葉斯優(yōu)化的充分條件。 為了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論