數(shù)學(xué)建模—高等教育信息推薦模型_第1頁
數(shù)學(xué)建模—高等教育信息推薦模型_第2頁
數(shù)學(xué)建模—高等教育信息推薦模型_第3頁
數(shù)學(xué)建模—高等教育信息推薦模型_第4頁
數(shù)學(xué)建模—高等教育信息推薦模型_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、競賽題目(在AB上打勾): A B 競賽隊(duì)編號(參賽學(xué)生不填寫):_目 錄問題的提出3問題的分析與假設(shè)3模型的建立與求解6效績評價(jià)12預(yù)測評估13信息推薦方案13模型的評價(jià)與推廣14附:給有關(guān)部門的信15 參考文獻(xiàn)16高等院校教育信息化推薦模型摘 要本文針對當(dāng)前我國高等院校教育信息化過程關(guān)于信息推薦方面存在的問題,進(jìn)行了分析研究,建立了包含滿意度、準(zhǔn)確率、覆蓋率、實(shí)時(shí)性這四個(gè)方面的信息推薦評價(jià)指標(biāo)體系,通過問卷調(diào)查的方式收集相關(guān)數(shù)據(jù),確定了各指標(biāo)的權(quán)重因子。主要利用奇異值分解法和LSA方法建立了信息推薦模型,并利用相關(guān)算法對我們設(shè)計(jì)出的模型的效績進(jìn)行檢驗(yàn),最后給出了具體的信息推薦方案,并對我們

2、的模型進(jìn)行了評價(jià)推廣。問題一、我們對不同用戶的評測標(biāo)準(zhǔn)進(jìn)行了問卷調(diào)查,通過數(shù)據(jù)分析,給出了各個(gè)指標(biāo)的權(quán)重,滿意度是,準(zhǔn)確率是,覆蓋率是 ,實(shí)時(shí)性是。確定了外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè)。內(nèi)生變量:信息資源建設(shè)如學(xué)術(shù)網(wǎng)站、期刊雜志、選修綜合課。問題二、建立信息推薦模型,對奇異值分解后的矩陣進(jìn)行降維, 構(gòu)建潛在語義空間。通過計(jì)算得出表面上沒有關(guān)聯(lián)的關(guān)鍵詞和文章之間的相關(guān)性達(dá),驗(yàn)證了模型的效績,并對模型進(jìn)行了優(yōu)化,給出了信息聚類圖。問題三、提出了我國高等院校教育信息推薦的具體方案。奇異值分解和LSA方法建立信息推薦模型的優(yōu)勢:1、應(yīng)用條件易得;2、不在局限于計(jì)算方陣,可以適用于任意矩陣,更加具有

3、普適意義。3、相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關(guān)系更明確。4、低維空間表示可以刻畫同義詞,同義詞可對應(yīng)相同或相似的主題。5、降維可去除部分噪聲,使特征更明顯。關(guān)鍵詞:教育信息推薦模型、奇異值分解法、LSA方法、Spearman coefficient相關(guān)系數(shù)一、問題的提出1、問題背景:21世紀(jì)是信息時(shí)代,隨著信息技術(shù)越來越廣泛的應(yīng)用,互聯(lián)網(wǎng)已經(jīng)成為我們?nèi)粘I钪斜夭豢缮俚墓ぞ?,而傳統(tǒng)教育體系所暴露出來的弊端也日益明顯,例如嚴(yán)重受到地域限制,教育資源分配不均,相互之間交流不夠等,為使之適應(yīng)對教育發(fā)展的新要求,建設(shè)更好的教育信息平臺來滿足學(xué)生互聯(lián)網(wǎng)學(xué)習(xí)的需求,教育體系信息化改革刻不容

4、緩。由于教育信息化表現(xiàn)出快捷高效、節(jié)約成本,不受地域時(shí)間限制、資源共享,交流開放等優(yōu)勢,所以在教育教學(xué)及管理的各個(gè)領(lǐng)域都開始推出各種形式的信息教育平臺,例如遠(yuǎn)程教育,網(wǎng)站管理,網(wǎng)課、論壇等很大程度上促進(jìn)了教育信息化的發(fā)展,然而,目前的教育信息體系還是不夠完善的,例如信息推薦體系這一塊被嚴(yán)重忽略,而現(xiàn)有的推薦體系仍存在推薦準(zhǔn)確率不夠高,推薦方式單一等一系列的問題,因此建立出合理的數(shù)學(xué)模型來完善教育信息推薦體系是一項(xiàng)迫切等待解決的工作。2、需要解決的問題:(1)建立信息推薦的指標(biāo)體系,確定信息推薦的變量(2)建立高等學(xué)校信息推薦模型(3)就信息推薦模型設(shè)計(jì)推薦算法(4)給有關(guān)部門寫一封信,推介你們

5、的信息推薦模型。二、問題的分析及假設(shè)通過讀題可知,有效信息推薦是目前教育信息化的重要問題,我們需要明確信息推薦的指標(biāo)以及其推薦變量,然后為高等院校建立合理有效的信息推薦模型,設(shè)計(jì)其相應(yīng)的算法,最后向相關(guān)部門推介我們的模型。1、信息推薦的指標(biāo)體系為了提高信息推薦模型的準(zhǔn)確度,我們的評測指標(biāo)主要有包含以下四個(gè)方面的內(nèi)容:(1)滿意度O:即用戶的需求被滿足的程度。滿意度是用戶的一種心理狀態(tài),它能夠反映推薦的信息和用戶的期望之間的契合程度,用數(shù)學(xué)式量化表示如下:O= exp(a1*x1+ a2 *x2+ a3 *x3+ a4 *x4)(其中,x1是下載率、x2是點(diǎn)擊率、x3是停留時(shí)間、x4是分享率,a

6、1,a2,a3,a4分別是各自的權(quán)重,令a1=,a2=,a3=,a4=,這里我們假設(shè)用戶的行為無出錯(cuò)。)注:O值越大,用戶滿意度越高。(2)準(zhǔn)確率:信息推薦的準(zhǔn)確性也是評價(jià)此體系的一個(gè)重要指標(biāo),可以有效的提高用戶的搜索效率。我們這里用精確率P和召回率R來評測信息推薦的準(zhǔn)確性1。假設(shè):系統(tǒng)檢索到的相關(guān)信息(A)系統(tǒng)檢索到的不相關(guān)信息(B)相關(guān)但是系統(tǒng)沒有檢索到的信息(C)不相關(guān)且沒有被系統(tǒng)檢索到的信息(D)則:精確率P: P = A / ( A + B ),0P1召回率R: R = A / ( A + C ),0Rnum) z=z,i; endEnd通過這樣的選擇,就可以得到和第一篇文章相關(guān)性較

7、強(qiáng)的文章,而這些文章就是我們所要推薦給用戶的。6、模型優(yōu)化將第3部分中的矩陣U和V,投影到一個(gè)平面上,可以得到關(guān)鍵詞和文章的分布圖,代碼及結(jié)果如下: clearclclsi=0,0,1,1,0,0,0,0,0;0,0,0,0,0,1,0,0,1;0,1,0,0,0,0,0,1,0; 0,0,0,0,0,0,1,0,1;1,0,0,0,0,1,0,0,0; 1,1,1,1,1,1,1,1,1;1,0,1,0,0,0,0,0,0; 0,0,0,0,0,0,1,0,1;0,0,0,0,0,2,0,0,1; 1,0,1,0,0,0,0,1,0;0,0,0,1,1,0,0,0,0;U,S,V=svd(l

8、si);y=U(:,1:2)*S(1:2,1:2)*V(:,1:2);lu=size(U,1);lv=size(V,1);scatter(U(:,2),U(:,3)hold onscatter(V(:,2),V(:,3)legend(point1,point2)hold onfor i=1:lu circle(U(i,2),U(i,3),abs(U(i,3) hold onendfunction =circle(x,y;r) rectangle(Position,x-r,y-r,2*r,2*r,Curvature,1 1 ) axis equalend圖(三)圖(三)中,每一個(gè)紅色的點(diǎn),表示一

9、個(gè)關(guān)鍵詞,每一個(gè)藍(lán)色的點(diǎn),表示一篇文章,這樣我們可以對這些詞和文章進(jìn)行聚類。按聚類出現(xiàn)的效果,可以提取文章集合中的近義詞,這樣當(dāng)用戶檢索文章的時(shí)候,就可以用語義級別(近義詞集合)去檢索了。這樣一來就減少了檢索次數(shù)和存儲量。 (三)模型的總結(jié)在此模型中我們首先構(gòu)建了用戶行為(關(guān)鍵詞)與信息資源(文章)之間的關(guān)系矩陣,接下來利用奇異值分解法和LSA法得到了一個(gè)語義空間矩陣,該矩陣可以反映那些在表面上看起來沒有關(guān)系的關(guān)鍵詞與文章之間的相關(guān)性,進(jìn)一步的計(jì)算了Spearman coefficient系數(shù),并利用Spearman coefficient系數(shù)的大小判斷文章是否推薦給用戶,最后對模型進(jìn)行了優(yōu)化

10、。上述模型的具體過程都是以用戶輸入關(guān)鍵詞查找文章為例說明的,為了適用于高校教育信息化的其他方面,只需要將模型中的關(guān)鍵詞換為用戶的其他具體行為,文章?lián)Q為其它信息資源。下面給出了一般情形的模型算法流程圖:開始構(gòu)建用戶行為與信息資源的的關(guān)系矩陣計(jì)算Spearman coefficient相關(guān)系數(shù)Spearman coefficient相關(guān)系數(shù)相關(guān)系數(shù)a奇異值分解,構(gòu)建語義空間 coefficient相關(guān)系數(shù)計(jì)算Spearman coefficient相關(guān)系數(shù)Spearman coefficient相關(guān)系數(shù)相關(guān)系數(shù)a聚類分析Spearman coefficient相關(guān)系數(shù)進(jìn)行推薦Spearman co

11、efficient相關(guān)系數(shù)不推薦Spearman coefficient相關(guān)系數(shù)結(jié)束是否否是圖(四)上邊算法流程圖中,判斷相關(guān)系數(shù)時(shí)即“相關(guān)系數(shù)a”,其中a1,a的確定值根據(jù)具體情況給,理論上要求接近1。因?yàn)?,a的值越接近1,相關(guān)性越大,推薦的信息的質(zhì)量就越高。四、效績評價(jià)針對教育信息推薦體系待完善的問題,我們從滿意度、準(zhǔn)確率、覆蓋率、實(shí)時(shí)性四個(gè)方面建立了信息推薦指標(biāo)體系,然后通過問卷調(diào)查,做圖表匯總并分析相關(guān)數(shù)據(jù),得出了各個(gè)指標(biāo)的權(quán)重,滿意度是,準(zhǔn)確率是,覆蓋率是 ,實(shí)時(shí)性是。并且進(jìn)一步確定了外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè);內(nèi)生變量:信息資源建設(shè),如學(xué)術(shù)網(wǎng)站,期刊雜志,選修綜合課(包括校

12、內(nèi)課程與網(wǎng)絡(luò)公開課);決策變量:用戶需求。在此基礎(chǔ)上我們采用奇異值分解和LSA方法建立信息推薦模型,通過一系列算法得出了在字面上看起來沒有任何聯(lián)系的關(guān)鍵詞與文檔實(shí)際上其潛在的深層次相關(guān)性達(dá)到,驗(yàn)證了這一模型取的了顯著的效績,更加深入準(zhǔn)確的剖析出了搜索關(guān)鍵詞和期望文檔之間的潛在聯(lián)系,在很大程度上提高了信息模型的滿意度、準(zhǔn)確率、覆蓋率、適時(shí)地性等評價(jià)指標(biāo)。為進(jìn)一步完善模型,我們還對模型的功能做了優(yōu)化,使信息推薦模型的更好的滿足用戶的需求,促進(jìn)我過教育現(xiàn)代化的發(fā)展步伐。五、預(yù)測評估根據(jù)模型所取得的效績,在未來幾年,教育推薦體系的效率和準(zhǔn)確性將有很大的提高,而且其功能將會進(jìn)一步被完善,教育信息化將迎來

13、前所未有的創(chuàng)新性改革,大量的云計(jì)算將會運(yùn)用于教育信息化,為教育信息化提供更加廣闊的空間。有望形成“人人皆學(xué),處處能學(xué)、時(shí)時(shí)可學(xué)”的國家現(xiàn)代化教育發(fā)展目標(biāo)。更好的實(shí)現(xiàn)教育信息化對學(xué)生全面發(fā)展的促進(jìn)作用。對深化教育領(lǐng)域綜合改革的支撐作用和對教育創(chuàng)新發(fā)展、均衡發(fā)展、優(yōu)質(zhì)發(fā)展的提升作用。形成具有國際先進(jìn)水平、信息技術(shù)與教育融合創(chuàng)新發(fā)展的現(xiàn)代化教育信息體系。六、信息推薦方案針對目前教育信息化過程中的一些待解決的問題,我們對信息推薦這一模塊,通過收集數(shù)據(jù),數(shù)學(xué)計(jì)算等方式建立了一套可以完善信息推薦功能的模型,經(jīng)過算法檢驗(yàn),證明我們所建立的模型表現(xiàn)出很好的效績,并且形成了信息推薦方案如下:第一、嚴(yán)格規(guī)范評價(jià)指

14、標(biāo),全面提高信息推薦質(zhì)量。采用多種形式,從各個(gè)方面全面的對信息推薦體系進(jìn)行評價(jià),并且打分排名,這樣有利于規(guī)范這個(gè)網(wǎng)絡(luò)平臺的信息推薦體系的建設(shè),并且在競爭壓力的推動(dòng)下,也有利于促進(jìn)各網(wǎng)絡(luò)平臺信息推薦平臺不斷的創(chuàng)新完善其功能,從滿意度、準(zhǔn)確率、覆蓋率、實(shí)時(shí)性等各方面全面的提高信息推薦質(zhì)量。第二、加強(qiáng)用戶需求分析,進(jìn)一步提高信息推薦準(zhǔn)確率。對用戶需求的分析,不應(yīng)該知識停留在淺顯的字面分析,而應(yīng)該運(yùn)用我們上面建立的模型,運(yùn)用數(shù)學(xué)算法,客觀的用數(shù)據(jù)結(jié)果給出搜索關(guān)鍵字于用戶期望的文檔之間潛在的深層次聯(lián)系,并高效準(zhǔn)確的為用戶推薦其期望的文檔,提高信息推薦的準(zhǔn)確率,優(yōu)化信息推薦體系的功能。第三、拓寬信息推薦體

15、系的引用,提高教育信息現(xiàn)代化的整體水平。雖然教育信息推薦體系是主要針對教育信息的,在互聯(lián)網(wǎng)如此發(fā)達(dá)的時(shí)代,整個(gè)信息現(xiàn)代化的發(fā)展形成了一個(gè)巨大的網(wǎng)絡(luò),各個(gè)領(lǐng)域的信息發(fā)展又是相互之間緊密聯(lián)系,相互影響,榮辱共存的。所以應(yīng)該講此推薦體系的應(yīng)用進(jìn)一步推廣到社會發(fā)展的各個(gè)領(lǐng)域,只有整個(gè)社會的信息化水平總體提高了,教育信息化水平才能進(jìn)一步提高。不然,教育信息化水平仍然是受到社會總體信息化水平的制約。第四、做好信息推薦體系的監(jiān)督工作,營造健康嚴(yán)謹(jǐn)?shù)木W(wǎng)絡(luò)推薦環(huán)境。應(yīng)該對系統(tǒng)推薦的信息進(jìn)行初步過濾篩選,屏蔽不健康的、包含商業(yè)廣告的、正確性沒有權(quán)威保障的、以及娛樂八卦、頭條熱點(diǎn)等隨意推送的一些垃圾騷擾信息然后再推

16、送給用戶,這樣就提高了推送效率和質(zhì)量,并且保障了健康嚴(yán)謹(jǐn)?shù)木W(wǎng)絡(luò)推薦環(huán)境。七、模型的評價(jià)與推廣模型中采取的評價(jià)指標(biāo)及相關(guān)數(shù)據(jù)來源于問卷調(diào)查,有較高的可靠性和代表性,能夠全面的、客觀的、有效的評價(jià)各項(xiàng)指標(biāo)的權(quán)重。奇異值分解法和LSA方法的優(yōu)勢:1、應(yīng)用條件易得;2,不在局限于計(jì)算方陣,可以適用于任意矩陣,更加具有普適意義。3相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關(guān)系更明確。局限性:無法獲取用戶文章的評價(jià)值,僅僅是通過用戶檢索的關(guān)鍵詞來給用戶推薦文章,這樣的方法會導(dǎo)致用戶在下一次搜索時(shí),上一次就篩選過的文章又會出現(xiàn)在推薦選項(xiàng)中,若要對模型進(jìn)行優(yōu)化處理,首先要考慮的問題就是需要如何避免文章的重

17、復(fù)推薦,下一步對模型的構(gòu)思是利用其他算法,來對用戶行為進(jìn)行學(xué)習(xí),通過對用戶搜索行為的記錄,分析之后來推薦出更適合于用戶的文章。推廣:用奇異值分解法和LSA方法建立的模型,不僅可以解決高等學(xué)校教育信息化發(fā)展過程中推薦體系存在的一些問題,還可以解決商品購買推薦、旅游攻略、最佳路徑推薦、求職崗位推薦等問題,具有普適意義,應(yīng)用范圍廣泛,功能全面。附:給有關(guān)部門的信尊敬的各位領(lǐng)導(dǎo):您好!我們是西北師范大學(xué)的學(xué)生,在此向您推薦我們小組針對高等學(xué)校教育信息推薦體系所建立的數(shù)學(xué)模型并提出具體的信息推薦方案。首先,感謝您在繁忙之余能抽空來瀏覽我們的方案,也渴望您能夠提出寶貴的意見,對此我們將非常感謝。下面簡潔的

18、介紹下我們的方案。 十八大以來,信息化以成為重要的國家戰(zhàn)略,然而,目前的教育信息體系還是不夠完善的,還存在資源分配不均、資源共享較少,值得關(guān)注的是信息推薦體系這一塊被嚴(yán)重忽略,現(xiàn)有的推薦體系仍存在推薦準(zhǔn)確率不夠高,推薦方式單一等一系列的問題,因此建立出合理的數(shù)學(xué)模型來完善教育推薦體系是一項(xiàng)迫切等待解決的工作。我們從滿意度、準(zhǔn)確率、覆蓋率、實(shí)時(shí)性四個(gè)方面建立了信息推薦指標(biāo)體系,然后通過問卷調(diào)查,做圖表匯總并分析相關(guān)數(shù)據(jù),得出了各個(gè)指標(biāo)的權(quán)重,滿意度是,準(zhǔn)確率是,覆蓋率是 ,實(shí)時(shí)性是。并且進(jìn)一步確定了外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè);內(nèi)生變量:信息資源建設(shè)如學(xué)術(shù)網(wǎng)站、期刊雜志、選修綜合課(包括校內(nèi)課程與網(wǎng)絡(luò)公開課);決策變量:用戶需求。在此基礎(chǔ)上我們采用奇異值分解和LSA方法建立信息推薦模型,通過一系列算法挖掘出了在字面上看起

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論