數(shù)學(xué)建模—高等教育信息推薦模型_第1頁
數(shù)學(xué)建模—高等教育信息推薦模型_第2頁
數(shù)學(xué)建模—高等教育信息推薦模型_第3頁
數(shù)學(xué)建模—高等教育信息推薦模型_第4頁
數(shù)學(xué)建模—高等教育信息推薦模型_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選文檔競賽題目(在AB上打勾): A B 競賽隊(duì)編號(hào)(參賽同學(xué)不填寫):_目 錄問題的提出3問題的分析與假設(shè)3模型的建立與求解6效績?cè)u(píng)價(jià)12猜測評(píng)估13信息推舉方案13模型的評(píng)價(jià)與推廣14附:給有關(guān)部門的信15 參考文獻(xiàn)16高等院校教育信息化推舉模型摘 要本文針對(duì)當(dāng)前我國高等院校教育信息化過程關(guān)于信息推舉方面存在的問題,進(jìn)行了分析爭辯,建立了包含滿足度、精確率、掩蓋率、實(shí)時(shí)性這四個(gè)方面的信息推舉評(píng)價(jià)指標(biāo)體系,通過問卷調(diào)查的方式收集相關(guān)數(shù)據(jù),確定了各指標(biāo)的權(quán)重因子。主要利用奇異值分解法和LSA方法建立了信息推舉模型,并利用相關(guān)算法對(duì)我們?cè)O(shè)計(jì)出的模型的效績進(jìn)行檢驗(yàn),最終給出了具體的信息推舉方案,

2、并對(duì)我們的模型進(jìn)行了評(píng)價(jià)推廣。問題一、我們對(duì)不同用戶的評(píng)測標(biāo)準(zhǔn)進(jìn)行了問卷調(diào)查,通過數(shù)據(jù)分析,給出了各個(gè)指標(biāo)的權(quán)重,滿足度是0.243,精確率是0.265,掩蓋率是0.238 ,實(shí)時(shí)性是0.255。確定了外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè)。內(nèi)生變量:信息資源建設(shè)如學(xué)術(shù)網(wǎng)站、期刊雜志、選修綜合課。問題二、建立信息推舉模型,對(duì)奇異值分解后的矩陣進(jìn)行降維, 構(gòu)建潛在語義空間。通過計(jì)算得出表面上沒有關(guān)聯(lián)的關(guān)鍵詞和文章之間的相關(guān)性達(dá)0.9333,驗(yàn)證了模型的效績,并對(duì)模型進(jìn)行了優(yōu)化,給出了信息聚類圖。問題三、提出了我國高等院校教育信息推舉的具體方案。奇異值分解和LSA方法建立信息推舉模型的優(yōu)勢:1、應(yīng)用條

3、件易得;2、不在局限于計(jì)算方陣,可以適用于任意矩陣,更加具有普適意義。3、相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關(guān)系更明確。4、低維空間表示可以刻畫同義詞,同義詞可對(duì)應(yīng)相同或相像的主題。5、降維可去除部分噪聲,使特征更明顯。關(guān)鍵詞:教育信息推舉模型、奇異值分解法、LSA方法、Spearman coefficient相關(guān)系數(shù)一、問題的提出1、問題背景:21世紀(jì)是信息時(shí)代,隨著信息技術(shù)越來越廣泛的應(yīng)用,互聯(lián)網(wǎng)已經(jīng)成為我們?nèi)粘I钪斜夭恍猩俚墓ぞ?,而傳統(tǒng)教育體系所暴露出來的弊端也日益明顯,例如嚴(yán)峻受到地域限制,教育資源安排不均,相互之間溝通不夠等,為使之適應(yīng)信息化社會(huì)對(duì)教育進(jìn)展的新要求,建設(shè)

4、更好的教育信息平臺(tái)來滿足同學(xué)互聯(lián)網(wǎng)學(xué)習(xí)的需求,教育體系信息化改革刻不容緩。由于教育信息化表現(xiàn)出快捷高效、節(jié)省成本,不受地域時(shí)間限制、資源共享,溝通開放等優(yōu)勢,所以在教育教學(xué)及管理的各個(gè)領(lǐng)域都開頭推出各種形式的信息教育平臺(tái),例如遠(yuǎn)程教育,網(wǎng)站管理,網(wǎng)課、論壇等很大程度上促進(jìn)了教育信息化的進(jìn)展,然而,目前的教育信息體系還是不夠完善的,例如信息推舉體系這一塊被嚴(yán)峻忽視,而現(xiàn)有的推舉體系仍存在推舉精確率不夠高,推舉方式單一等一系列的問題,因此建立出合理的數(shù)學(xué)模型來完善教育信息推舉體系是一項(xiàng)迫切等待解決的工作。2、需要解決的問題:(1)建立信息推舉的指標(biāo)體系,確定信息推舉的變量(2)建立高等學(xué)校信息推舉

5、模型(3)就信息推舉模型設(shè)計(jì)推舉算法(4)給有關(guān)部門寫一封信,推介你們的信息推舉模型。二、問題的分析及假設(shè)通過讀題可知,有效信息推舉是目前教育信息化的重要問題,我們需要明確信息推舉的指標(biāo)以及其推舉變量,然后為高等院校建立合理有效的信息推舉模型,設(shè)計(jì)其相應(yīng)的算法,最終向相關(guān)部門推介我們的模型。1、信息推舉的指標(biāo)體系為了提高信息推舉模型的精確度,我們的評(píng)測指標(biāo)主要有包含以下四個(gè)方面的內(nèi)容:(1)滿足度O:即用戶的需求被滿足的程度。滿足度是用戶的一種心理狀態(tài),它能夠反映推舉的信息和用戶的期望之間的契合程度,用數(shù)學(xué)式量化表示如下:O= exp(a1*x1+ a2 *x2+ a3 *x3+ a4 *x4

6、)(其中,x1是下載率、x2是點(diǎn)擊率、x3是停留時(shí)間、x4是共享率,a1,a2,a3,a4分別是各自的權(quán)重,令a1=0.4,a2=0.2,a3=0.05,a4=0.35,這里我們假設(shè)用戶的行為無出錯(cuò)。)注:O值越大,用戶滿足度越高。(2)精確率:信息推舉的精確性也是評(píng)價(jià)此體系的一個(gè)重要指標(biāo),可以有效的提高用戶的搜尋效率。我們這里用精確率P和召回率R來評(píng)測信息推舉的精確性1。假設(shè):系統(tǒng)檢索到的相關(guān)信息(A)系統(tǒng)檢索到的不相關(guān)信息(B)相關(guān)但是系統(tǒng)沒有檢索到的信息(C)不相關(guān)且沒有被系統(tǒng)檢索到的信息(D)則:精確率P: P = A / ( A + B ),0<P<1召回率R: R =

7、A / ( A + C ),0<R<1精確率P越大,說明檢索到信息越精確,但檢索范圍相對(duì)較窄;召回率R越大,說明檢索到的信息比較全面,但精確度會(huì)降低。綜合考慮,我們用這兩個(gè)指標(biāo)進(jìn)行調(diào)和后的指標(biāo)F來反映信息推舉的精確率。F=(2+1)P*R2*(P+R) 當(dāng)=1時(shí),F(xiàn)=2*P*RP+R注:F越大,精確率越高。(3)掩蓋率:信息的掩蓋率可以驗(yàn)證資源是否有效的傳送給了用戶,我們接受信息熵H和基尼系數(shù)G來量化這一指標(biāo)2。假設(shè),信息i的流行度是已知的。p(i)=b(i)/ b(i) ,H=-p(i) log p(i) ,G=1n-1(2j-n-1)p(ij)(b(i)為信息i的流行度, ij

8、 是依據(jù)信息流行度p()從小到大排序的信息列表中的第j條信息)注:H和G越小,掩蓋率越高。(4)實(shí)時(shí)性T:因信息具有更新速度快的特點(diǎn),所以信息推舉的實(shí)時(shí)性更顯得尤為關(guān)鍵。實(shí)時(shí)性反映所推舉給用戶的信息是否是最新最有參考價(jià)值的。T=vf f=m/n(v是推舉列表的變化率,m是新信息的數(shù)量,n是全部推舉信息的總數(shù)量)注:T越大,實(shí)時(shí)性越高。以上的評(píng)測指標(biāo)可以通過在線或離線來計(jì)算。對(duì)于以上四個(gè)評(píng)測指標(biāo),我們對(duì)不同用戶的評(píng)測標(biāo)準(zhǔn)進(jìn)行了問卷調(diào)查,通過數(shù)據(jù)分析,給出了各個(gè)指標(biāo)的權(quán)重,滿足度是0.243,精確率是0.265,掩蓋率是0.238 ,實(shí)時(shí)性是0.255。 圖(一)各指標(biāo)的平均得分(5分制) 圖(二

9、)各指標(biāo)的比例2、信息推舉的變量外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè)用戶個(gè)體差異:由于用戶個(gè)人的文化水平,個(gè)人喜好,搜尋習(xí)慣,對(duì)搜尋內(nèi)容的生疏程度等的差異會(huì)對(duì)教育推舉的指標(biāo)體系造成一些影響。網(wǎng)站建設(shè):現(xiàn)在的掃瞄器五花八門、種類繁多,其網(wǎng)站建設(shè)質(zhì)量也良莠不齊,有好多網(wǎng)站為了追求商業(yè)利益,更是商業(yè)捆綁,推舉一些用戶不需要的廣告消遣八卦等垃圾推送信息,有些網(wǎng)站甚至其本身就存在著一些系統(tǒng)漏洞等問題,這無疑對(duì)用戶高校的獵取有用推送信息造成干擾,對(duì)教育信息推舉的指標(biāo)體系造成肯定負(fù)面影響。內(nèi)生變量:信息資源建設(shè),如學(xué)術(shù)網(wǎng)站,期刊雜志,選修綜合課(包括校內(nèi)課程與網(wǎng)絡(luò)公開課)學(xué)術(shù)網(wǎng)站:作為用戶獵取信息的直接來源,

10、其應(yīng)當(dāng)保持應(yīng)有的學(xué)術(shù)嚴(yán)謹(jǐn)性,直接打算著用戶獵取信息的滿足度、精確率、掩蓋率、實(shí)時(shí)性。對(duì)信息推舉體系起這至關(guān)重要的作用。期刊雜志:市場上形形色色的期刊雜志百花齊放,競爭激烈,彼此之間也拉開了檔次,用戶的認(rèn)可度也在很大程度上受到其知名度的影響,然而,無論是哪個(gè)檔次的期刊,其收納的文章都是層次不及的,只是比重有差異罷了,而由于認(rèn)可度所帶來的弊端暴露了出來,例如不能以批判理性的思維去辨別認(rèn)可度高的期刊,更簡潔對(duì)認(rèn)可度低的期刊產(chǎn)生偏見。另一方面,當(dāng)今社會(huì),期刊雜志已經(jīng)成為了人們茶余飯后,休閑消遣,候車等人時(shí)打發(fā)時(shí)間的不二之選,而且人們也樂于將自己寵愛的期刊雜志推舉給親朋好友,或是堅(jiān)持追某一系列的期刊雜志

11、,所以期刊雜志也是構(gòu)成信息推舉體系的重要組成部分。選修綜合課:選課系統(tǒng)作為高校教務(wù)管理系統(tǒng)中必不行少的一部分,然而,選修綜合課推舉系統(tǒng)還不夠完善,同學(xué)很難高效精確的找到與自己的愛好安好全都的課程,因此加強(qiáng)選修綜合管理系統(tǒng)建設(shè),會(huì)顯著影響到信息推舉體系的評(píng)價(jià)指標(biāo)。決策變量:用戶需求3、確定主要的信息推舉方式:網(wǎng)絡(luò)信息推舉。三、 模型的建立與求解(一)理論方法介紹1、奇異值分解法3特征值分解是一個(gè)有效提取矩陣特征的方法,但是它只是對(duì)方陣而言的。在現(xiàn)實(shí)的世界中,我們看到的大部分矩陣都不是方陣,而奇異值分解法能適用于任意的矩陣。分解方式如下: (1) 假設(shè)A是一個(gè)n *m的矩陣,那么得到的U是一個(gè)n

12、* m的方陣(U里面的向量是正交的,稱為左奇異向量),是一個(gè)n* m的矩陣(除對(duì)角線的元素外都是0,對(duì)角線上的元素稱為奇異值), VT(V的轉(zhuǎn)置)是一個(gè)n* m的矩陣(V里面的向量是正交的,稱為右奇異向量),即 (2)在很多狀況下,前10%甚至1%的奇異值的和就占了全部的奇異值之和的99%以上了。所以,我們也可以用前r個(gè)奇異值來近似描述矩陣,這里定義一下部分奇異值分解: (6)r是一個(gè)遠(yuǎn)小于m、n的數(shù),這樣矩陣的乘法形式如下: (7)右邊的三個(gè)矩陣相乘的結(jié)果將會(huì)是一個(gè)接近于A的矩陣,r越接近于n,相乘的結(jié)果越接近于A。2、LSA法4 LSA(latent semantic analysis)潛

13、在語義分析,也被稱為LSI(latent semantic index),是Scott Deerwester, Susan T. Dumais等人在1990年提出來的一種新的索引和檢索方法。該方法和傳統(tǒng)向量空間模型一樣使用向量來表示詞和文章,并通過向量間的關(guān)系(如夾角)來推斷詞及文檔間的關(guān)系。(二)模型的建立假設(shè):信息資源系統(tǒng)自動(dòng)獵取。接受奇異值分解法和LSA方法相結(jié)合建立模型,以用戶查找文章的行為為例,假設(shè)用戶需求為“文章”,其輸入為“關(guān)鍵詞”。1、分析關(guān)鍵詞與文章之間的關(guān)聯(lián)性,建立關(guān)鍵詞-文章矩陣X。假設(shè)有m個(gè)關(guān)鍵詞,n篇文章,X就是一個(gè)m*n的矩陣。其中,第i行、第j列的元素是Xij,是

14、第i個(gè)詞在第j篇文章中消滅的次數(shù)。下邊以m=12,n=9為例:X= 1 0 0 1 0 0 0 0 00 1 1 0 1 0 0 0 01 1 0 0 0 0 0 0 01 0 1 0 0 0 2 0 00 1 1 2 0 0 0 0 00 1 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 00 0 1 0 0 0 0 0 00 1 0 0 1 0 0 0 00 0 0 0 0 1 1 1 00 0 0 0 0 0 1 1 10 0 0 0 0 0 0 1 1 觀看這個(gè)矩陣,第一個(gè)詞(b1)和其次個(gè)詞(b2),他們沒有在某篇文檔中共同現(xiàn)過,他們的關(guān)系使用Spearman coef

15、ficient相關(guān)系數(shù)來計(jì)算。具體代碼及結(jié)果如下:即得到b1和b2的相關(guān)系數(shù)為-0.3780,說明它們兩者的相關(guān)性不大。2. 對(duì)X進(jìn)行奇異值分解。分解公式為X=USVT,代碼及結(jié)果如下:矩陣U的每一行代表的是一個(gè)關(guān)鍵詞,每一列表示一個(gè)語義相近的詞類,元素Uij表示的是第i個(gè)詞和第j個(gè)語義的相關(guān)性,數(shù)值越大越相關(guān)。矩陣V的每一行代表一篇文章,每一列表示一個(gè)主題,元素Vij表示的是第i個(gè)文章和第j個(gè)主題的相關(guān)性,數(shù)值越大越相關(guān)。矩陣S表示的是詞的語義和文章的主題的相關(guān)性,數(shù)值越大越相關(guān)。因此,通過奇異值分解,我們不但可以得到詞的語義分類和文章的分類,而且得到了每個(gè)詞的語義和文章每個(gè)主題之間的相關(guān)性

16、。3、對(duì)奇異值分解后的矩陣進(jìn)行降維, 構(gòu)建潛在語義空間。對(duì)關(guān)聯(lián)矩陣進(jìn)行重構(gòu),然后選取S矩陣中最大的兩個(gè)值,作為重構(gòu)矩陣的條件,即X=U(:,1:2)*S(1:2,1:2)*V(:,1:2)'。 U的第一列表示每一個(gè)詞的消滅頻繁程度,雖然不是線性的,但是可以認(rèn)為是一個(gè)或許的描述;V的第一行表示每一篇文章中的消滅詞的個(gè)數(shù)的近似;S表示的是U和V之間的重要程度,數(shù)字越大越重要。形成的潛在語義空間如下:4.計(jì)算語義空間的b1和b2的Spearman coefficient系數(shù)代碼及結(jié)果如下:可以看到b1和b2雖然在原始文章中并沒有共同消滅,但他們的相關(guān)聯(lián)程度竟然達(dá)到了0.9333。5、推斷是否

17、進(jìn)行推舉通過上面的分析,我們發(fā)覺表面上并沒有直接聯(lián)系的關(guān)鍵詞和文章可能也存在深層次的關(guān)聯(lián)。因此 ,我們接受上述模型計(jì)算關(guān)鍵詞和文章的語義相關(guān)系數(shù),通過這個(gè)數(shù)據(jù)對(duì)比,來打算文章是否進(jìn)行推舉。這里,我們?cè)O(shè)定相關(guān)系數(shù)大于0.8時(shí),就進(jìn)行推舉,算法如下:row=size(y,1);% 獵取重構(gòu)矩陣的大小x=1:row;num=0.8;z=0;%用來存儲(chǔ)相關(guān)性大于num的文章所代表的的行號(hào)coeff=zeros(1,row);for i=2:row coeff(i)=corr(y(1,:)' , y(i,:)' , 'type' , 'Spearman')

18、; if(coeff(i)>num) z=z,i; endEnd通過這樣的選擇,就可以得到和第一篇文章相關(guān)性較強(qiáng)的文章,而這些文章就是我們所要推舉給用戶的。6、模型優(yōu)化將第3部分中的矩陣U和V,投影到一個(gè)平面上,可以得到關(guān)鍵詞和文章的分布圖,代碼及結(jié)果如下: clearclclsi=0,0,1,1,0,0,0,0,0;0,0,0,0,0,1,0,0,1;0,1,0,0,0,0,0,1,0; 0,0,0,0,0,0,1,0,1;1,0,0,0,0,1,0,0,0; 1,1,1,1,1,1,1,1,1;1,0,1,0,0,0,0,0,0; 0,0,0,0,0,0,1,0,1;0,0,0,0,

19、0,2,0,0,1; 1,0,1,0,0,0,0,1,0;0,0,0,1,1,0,0,0,0;U,S,V=svd(lsi);y=U(:,1:2)*S(1:2,1:2)*V(:,1:2)'lu=size(U,1);lv=size(V',1);scatter(U(:,2),U(:,3)hold onscatter(V(:,2)',V(:,3)')legend('point1','point2')hold onfor i=1:lu circle(U(i,2),U(i,3),abs(U(i,3) hold onendfunction =c

20、ircle(x,y;r) rectangle('Position',x-r,y-r,2*r,2*r,'Curvature',1 1 ) axis equalend圖(三)圖(三)中,每一個(gè)紅色的點(diǎn),表示一個(gè)關(guān)鍵詞,每一個(gè)藍(lán)色的點(diǎn),表示一篇文章,這樣我們可以對(duì)這些詞和文章進(jìn)行聚類。按聚類消滅的效果,可以提取文章集合中的近義詞,這樣當(dāng)用戶檢索文章的時(shí)候,就可以用語義級(jí)別(近義詞集合)去檢索了。這樣一來就削減了檢索次數(shù)和存儲(chǔ)量。 (三)模型的總結(jié)在此模型中我們首先構(gòu)建了用戶行為(關(guān)鍵詞)與信息資源(文章)之間的關(guān)系矩陣,接下來利用奇異值分解法和LSA法得到了一個(gè)語義空

21、間矩陣,該矩陣可以反映那些在表面上看起來沒有關(guān)系的關(guān)鍵詞與文章之間的相關(guān)性,進(jìn)一步的計(jì)算了Spearman coefficient系數(shù),并利用Spearman coefficient系數(shù)的大小推斷文章是否推舉給用戶,最終對(duì)模型進(jìn)行了優(yōu)化。上述模型的具體過程都是以用戶輸入關(guān)鍵詞查找文章為例說明的,為了適用于高校教育信息化的其他方面,只需要將模型中的關(guān)鍵詞換為用戶的其他具體行為,文章?lián)Q為其它信息資源。下面給出了一般情形的模型算法流程圖:開頭構(gòu)建用戶行為與信息資源的的關(guān)系矩陣計(jì)算Spearman coefficient相關(guān)系數(shù)Spearman coefficient相關(guān)系數(shù)相關(guān)系數(shù)>a奇異值分

22、解,構(gòu)建語義空間 coefficient相關(guān)系數(shù)計(jì)算Spearman coefficient相關(guān)系數(shù)Spearman coefficient相關(guān)系數(shù)相關(guān)系數(shù)>a聚類分析Spearman coefficient相關(guān)系數(shù)進(jìn)行推舉Spearman coefficient相關(guān)系數(shù)不推舉Spearman coefficient相關(guān)系數(shù)結(jié)束是否否是圖(四)上邊算法流程圖中,推斷相關(guān)系數(shù)時(shí)即“相關(guān)系數(shù)>a”,其中a<1,a的確定值依據(jù)具體狀況給,理論上要求接近1。由于,a的值越接近1,相關(guān)性越大,推舉的信息的質(zhì)量就越高。四、效績?cè)u(píng)價(jià)針對(duì)教育信息推舉體系待完善的問題,我們從滿足度、精確率、掩

23、蓋率、實(shí)時(shí)性四個(gè)方面建立了信息推舉指標(biāo)體系,然后通過問卷調(diào)查,做圖表匯總并分析相關(guān)數(shù)據(jù),得出了各個(gè)指標(biāo)的權(quán)重,滿足度是0.243,精確率是0.265,掩蓋率是0.238 ,實(shí)時(shí)性是0.255。并且進(jìn)一步確定了外生變量: 用戶個(gè)體差異、網(wǎng)站建設(shè);內(nèi)生變量:信息資源建設(shè),如學(xué)術(shù)網(wǎng)站,期刊雜志,選修綜合課(包括校內(nèi)課程與網(wǎng)絡(luò)公開課);決策變量:用戶需求。在此基礎(chǔ)上我們接受奇異值分解和LSA方法建立信息推舉模型,通過一系列算法得出了在字面上看起來沒有任何聯(lián)系的關(guān)鍵詞與文檔實(shí)際上其潛在的深層次相關(guān)性達(dá)到0.9333,驗(yàn)證了這一模型取的了顯著的效績,更加深化精確的剖析出了搜尋關(guān)鍵詞和期望文檔之間的潛在聯(lián)系

24、,在很大程度上提高了信息模型的滿足度、精確率、掩蓋率、適時(shí)地性等評(píng)價(jià)指標(biāo)。為進(jìn)一步完善模型,我們還對(duì)模型的功能做了優(yōu)化,使信息推舉模型的更好的滿足用戶的需求,促進(jìn)我過教育現(xiàn)代化的進(jìn)展步伐。五、猜測評(píng)估依據(jù)模型所取得的效績,在將來幾年,教育推舉體系的效率和精確性將有很大的提高,而且其功能將會(huì)進(jìn)一步被完善,教育信息化將迎來前所未有的創(chuàng)新性改革,大量的云計(jì)算將會(huì)運(yùn)用于教育信息化,為教育信息化供應(yīng)更加寬敞的空間。有望形成“人人皆學(xué),處處能學(xué)、時(shí)時(shí)可學(xué)”的國家現(xiàn)代化教育進(jìn)展目標(biāo)。更好的實(shí)現(xiàn)教育信息化對(duì)同學(xué)全面進(jìn)展的促進(jìn)作用。對(duì)深化教育領(lǐng)域綜合改革的支撐作用和對(duì)教育創(chuàng)新進(jìn)展、均衡進(jìn)展、優(yōu)質(zhì)進(jìn)展的提升作用。

25、形成具有國際先進(jìn)水平、信息技術(shù)與教育融合創(chuàng)新進(jìn)展的現(xiàn)代化教育信息體系。六、信息推舉方案針對(duì)目前教育信息化過程中的一些待解決的問題,我們對(duì)信息推舉這一模塊,通過收集數(shù)據(jù),數(shù)學(xué)計(jì)算等方式建立了一套可以完善信息推舉功能的模型,經(jīng)過算法檢驗(yàn),證明我們所建立的模型表現(xiàn)出很好的效績,并且形成了信息推舉方案如下:第一、嚴(yán)格規(guī)范評(píng)價(jià)指標(biāo),全面提高信息推舉質(zhì)量。接受多種形式,從各個(gè)方面全面的對(duì)信息推舉體系進(jìn)行評(píng)價(jià),并且打分排名,這樣有利于規(guī)范這個(gè)網(wǎng)絡(luò)平臺(tái)的信息推舉體系的建設(shè),并且在競爭壓力的推動(dòng)下,也有利于促進(jìn)各網(wǎng)絡(luò)平臺(tái)信息推舉平臺(tái)不斷的創(chuàng)新完善其功能,從滿足度、精確率、掩蓋率、實(shí)時(shí)性等各方面全面的提高信息推舉

26、質(zhì)量。其次、加強(qiáng)用戶需求分析,進(jìn)一步提高信息推舉精確率。對(duì)用戶需求的分析,不應(yīng)當(dāng)學(xué)問停留在淺顯的字面分析,而應(yīng)當(dāng)運(yùn)用我們上面建立的模型,運(yùn)用數(shù)學(xué)算法,客觀的用數(shù)據(jù)結(jié)果給出搜尋關(guān)鍵字于用戶期望的文檔之間潛在的深層次聯(lián)系,并高效精確的為用戶推舉其期望的文檔,提高信息推舉的精確率,優(yōu)化信息推舉體系的功能。第三、拓寬信息推舉體系的引用,提高教育信息現(xiàn)代化的整體水平。雖然教育信息推舉體系是主要針對(duì)教育信息的,在互聯(lián)網(wǎng)如此發(fā)達(dá)的時(shí)代,整個(gè)信息現(xiàn)代化的進(jìn)展形成了一個(gè)巨大的網(wǎng)絡(luò),各個(gè)領(lǐng)域的信息進(jìn)展又是相互之間緊密聯(lián)系,相互影響,榮辱共存的。所以應(yīng)當(dāng)講此推舉體系的應(yīng)用進(jìn)一步推廣到社會(huì)進(jìn)展的各個(gè)領(lǐng)域,只有整個(gè)社會(huì)

27、的信息化水平總體提高了,教育信息化水平才能進(jìn)一步提高。不然,教育信息化水平仍舊是受到社會(huì)總體信息化水平的制約。第四、做好信息推舉體系的監(jiān)督工作,營造健康嚴(yán)謹(jǐn)?shù)木W(wǎng)絡(luò)推舉環(huán)境。應(yīng)當(dāng)對(duì)系統(tǒng)推舉的信息進(jìn)行初步過濾篩選,屏蔽不健康的、包含商業(yè)廣告的、正確性沒有權(quán)威保障的、以及消遣八卦、頭條熱點(diǎn)等任憑推送的一些垃圾騷擾信息然后再推送給用戶,這樣就提高了推送效率和質(zhì)量,并且保障了健康嚴(yán)謹(jǐn)?shù)木W(wǎng)絡(luò)推舉環(huán)境。七、模型的評(píng)價(jià)與推廣模型中實(shí)行的評(píng)價(jià)指標(biāo)及相關(guān)數(shù)據(jù)來源于問卷調(diào)查,有較高的牢靠性和代表性,能夠全面的、客觀的、有效的評(píng)價(jià)各項(xiàng)指標(biāo)的權(quán)重。奇異值分解法和LSA方法的優(yōu)勢:1、應(yīng)用條件易得;2,不在局限于計(jì)算方陣

28、,可以適用于任意矩陣,更加具有普適意義。3相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關(guān)系更明確。局限性:無法獵取用戶文章的評(píng)價(jià)值,僅僅是通過用戶檢索的關(guān)鍵詞來給用戶推舉文章,這樣的方法會(huì)導(dǎo)致用戶在下一次搜尋時(shí),上一次就篩選過的文章又會(huì)消滅在推舉選項(xiàng)中,若要對(duì)模型進(jìn)行優(yōu)化處理,首先要考慮的問題就是需要如何避開文章的重復(fù)推舉,下一步對(duì)模型的構(gòu)思是利用其他算法,來對(duì)用戶行為進(jìn)行學(xué)習(xí),通過對(duì)用戶搜尋行為的記錄,分析之后來推舉出更適合于用戶的文章。推廣:用奇異值分解法和LSA方法建立的模型,不僅可以解決高等學(xué)校教育信息化進(jìn)展過程中推舉體系存在的一些問題,還可以解決商品購買推舉、旅游攻略、最佳路徑推舉、求職崗位推舉等問題,具有普適意義,應(yīng)用范圍廣泛,功能全面。附:給有關(guān)部門的信敬重的各位領(lǐng)導(dǎo):您好!我們是西北師范高校的同學(xué),在此向您推舉我們小組針對(duì)高等學(xué)校教育信息推舉體系所建立的數(shù)學(xué)模型并提出具體的信息推舉方案。首先,感謝您在繁忙之余能抽空來掃瞄我們的方案,也渴望您能夠提出貴重的意見,對(duì)此我們將格外感謝。下面簡潔的介紹下我們的方案。 十八大以來,信息化以成為重要的國家戰(zhàn)略,然而,目前的教育信息體系還是不夠完善的,還存在資源安排

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論