




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、成績:自學(xué)考試畢業(yè)論文(設(shè)計)題目(中文):基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計(外文):DesignandRealizationofPersonalizedLearningSystemBasedonWEBMining院(系):專業(yè):學(xué)生姓名:準考證號:指導(dǎo)教師:2015年5月9日 畢業(yè)論文誠信聲明本人鄭重聲明:所呈交的畢業(yè)論文是本人在指導(dǎo)老師的指導(dǎo)下,獨立研究、寫作的成果。論文中所引用是他人的無論以何種方式的文字、研究成果,均在論文中以明確方式表明。本聲明的法律結(jié)果由本人獨自承擔(dān)。畢業(yè)論文作者簽名:年月日目錄TOC o 1-5 h z HYPERLINK l bookmark8 1引言4
2、HYPERLINK l bookmark10 研究背景及意義4 HYPERLINK l bookmark12 1.2國內(nèi)外研究現(xiàn)狀2 HYPERLINK l bookmark14 1.3主要研究內(nèi)容3 HYPERLINK l bookmark16 1.4論文結(jié)構(gòu)3 HYPERLINK l bookmark6 基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相關(guān)技術(shù)4 HYPERLINK l bookmark20 2.1體系結(jié)構(gòu)4 HYPERLINK l bookmark22 Web個性化技術(shù)5 HYPERLINK l bookmark24 Web挖掘的定義5 HYPERLINK l bookmark26
3、Web挖掘的分類5 HYPERLINK l bookmark32 Web挖掘中常用的技術(shù)6 HYPERLINK l bookmark34 Web內(nèi)容挖掘中常用的技術(shù)6 HYPERLINK l bookmark36 Web結(jié)構(gòu)挖掘中常用的技術(shù)6 HYPERLINK l bookmark40 Web使用挖掘中常用的技術(shù)7 HYPERLINK l bookmark42 個性化8 HYPERLINK l bookmark44 2.4.1改進系統(tǒng)性能和結(jié)構(gòu)8 HYPERLINK l bookmark46 2.4.2頁面推薦8 HYPERLINK l bookmark48 2.4.3個性化學(xué)習(xí)系統(tǒng)8 HY
4、PERLINK l bookmark50 2.4.4個性化服務(wù)系統(tǒng)的關(guān)鍵技術(shù)9 HYPERLINK l bookmark52 2.5基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)模型構(gòu)架9 HYPERLINK l bookmark54 Web挖掘的預(yù)處理9 HYPERLINK l bookmark56 Web挖掘的基本流程9 HYPERLINK l bookmark58 3.1.1數(shù)據(jù)采集103.1.2數(shù)據(jù)預(yù)處理103.1.3模式識別11 HYPERLINK l bookmark60 3.1.4模式分析11 HYPERLINK l bookmark62 個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的設(shè)計與實現(xiàn)11 HYPERLINK
5、l bookmark64 傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)11 HYPERLINK l bookmark66 基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)模型設(shè)計11 HYPERLINK l bookmark68 4.2.1系統(tǒng)的運行環(huán)境和主要開發(fā)環(huán)境114.2.2構(gòu)建個性化的網(wǎng)絡(luò)學(xué)習(xí)模型11 HYPERLINK l bookmark70 4.2.3網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)框架124.2.4網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)結(jié)構(gòu)分析12 HYPERLINK l bookmark72 總結(jié)12 HYPERLINK l bookmark74 參考文獻13基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計摘要:文章分析網(wǎng)上每個學(xué)習(xí)者的個性化
6、需求,提出基于Web挖掘技術(shù)的個性化系統(tǒng)框架。對Web使用挖掘關(guān)鍵算法進行了研究,設(shè)計了一種基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng),該系統(tǒng)給出了Web內(nèi)容挖掘、Web使用挖掘和Web結(jié)構(gòu)挖掘的結(jié)果并結(jié)合其推薦結(jié)果為學(xué)習(xí)者提供了個性化的服務(wù),并給出了推薦算法。關(guān)鍵詞:Web挖掘;個性化;學(xué)習(xí);系統(tǒng)模型1引言研究背景及意義目前我國采用的是傳統(tǒng)的教育制度,教育模式主要是老師講,學(xué)生聽。為了應(yīng)試,學(xué)校在授課過程中過分強調(diào)以知識的傳授為中心,只重視教師在課堂中的作用,遏制了學(xué)生的創(chuàng)造性,忽視了學(xué)生學(xué)習(xí)的主動性和學(xué)習(xí)潛力的開發(fā)。學(xué)生往往都是為考試聽課,為考試學(xué)習(xí),畢業(yè)后仍然茫然,例如計算機專業(yè)的學(xué)生所學(xué)知識已
7、經(jīng)或正在被淘汰,即使沒有被淘汰,因為實踐能力太弱所學(xué)知識不能很好的應(yīng)用于工作中。因此現(xiàn)代大學(xué)生需要一個開闊視野的平臺,如可以進行專業(yè)學(xué)習(xí)的網(wǎng)站的出現(xiàn)(這就是下面為大家講解基于Web挖掘的個性化學(xué)習(xí)網(wǎng)絡(luò))。作為計算機專業(yè)的學(xué)生因為計算機時代的來臨,其發(fā)展需求使計算機專業(yè)學(xué)生對就業(yè)很自信,但計算機技術(shù)發(fā)展速度飛快,專業(yè)迫使計算機專業(yè)學(xué)生必須走在時代前端,但所學(xué)知識越多到最后被淘汰的就越多,在這樣的教育體制下,學(xué)生不得不自己尋找新的學(xué)習(xí)模式,例如看計算機專業(yè)的新書或刊物,但昂貴的費用不是一個普通大學(xué)生所能承擔(dān)的。因此學(xué)生的學(xué)習(xí)因經(jīng)濟能力而閉塞,使學(xué)生十分焦急,求知心不能得到滿足更何況實踐能力的培養(yǎng)。
8、所以大學(xué)生需要借助網(wǎng)絡(luò),通過網(wǎng)上的各渠道來擴展知識面,學(xué)習(xí)新知識,知道最新的科技動向。國內(nèi)外研究現(xiàn)狀目前Web挖掘技術(shù)的應(yīng)用側(cè)重于商業(yè)領(lǐng)域的大數(shù)據(jù)量應(yīng)用,在教學(xué)領(lǐng)域應(yīng)用的起步相對較晚,并且數(shù)據(jù)挖掘技術(shù)在教學(xué)領(lǐng)域的應(yīng)用與在商業(yè)領(lǐng)域中的應(yīng)用既有相同點也有不同點。國際學(xué)術(shù)研究領(lǐng)域中,如何充分有效地隊Web數(shù)據(jù)進行存儲和查詢,分析提取用戶特性并向用戶提供個性化學(xué)習(xí)的網(wǎng)絡(luò)學(xué)習(xí)平臺已經(jīng)成為Web技術(shù)的一個研究熱點,并且已有一些研究著獲得了研究性和實踐性的成果。主要研究內(nèi)容Web挖掘的處理模型主要是由數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模式識別(數(shù)據(jù)挖掘算法實施)、模式分析四部分組成在本文的研究中,以目前國內(nèi)外的Web挖
9、掘已有的學(xué)術(shù)以及應(yīng)用成果為基礎(chǔ),以Web挖掘技術(shù)為出發(fā)點,結(jié)合世家的應(yīng)用對Web挖掘的數(shù)據(jù)預(yù)處理和模式識別進行研究分析,設(shè)計了一個基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)。論文主要展開了以下幾個方面的研究工作:研究Web特征提取中所有涉及的數(shù)據(jù)特征,對數(shù)據(jù)來源、數(shù)據(jù)類型進行分析,對Web日志進行數(shù)據(jù)預(yù)處理。分析現(xiàn)有的用戶訪問興趣的度量方法,基于注冊信息建立初始的擁有資源興趣評分矩陣,根據(jù)用戶對頁面的訪問時間進行用戶興趣度得度量,以此為基礎(chǔ)實時更行用戶資源評分矩陣,全局和近期局部相結(jié)合,體現(xiàn)用戶資源興趣度?;赪eb站點的拓撲結(jié)構(gòu),分析教學(xué)資源的組織結(jié)構(gòu),并通過和測試工具分析用戶的學(xué)習(xí)情況,以這些作為數(shù)據(jù)
10、源,進行基于內(nèi)容的過濾處理,產(chǎn)生基于內(nèi)容的信息推薦集。針對現(xiàn)有的協(xié)同過濾算法的可擴展性問題,系統(tǒng)采用了離線與在線兩部分處理方式,首先在離線狀態(tài)下,基于用戶資源評分矩陣采用K-means算法對用戶進行聚類,有效縮小協(xié)同過濾同過濾的相關(guān)性計算空間,以聚類結(jié)果為基礎(chǔ),在線時對目標用火在同一簇內(nèi)進行基于用戶的協(xié)同過濾處理,產(chǎn)生目標用戶的最近鄰居序列,通過最近鄰居對資源的評分來預(yù)測目標用戶對目標資源的預(yù)評分,以此為依據(jù)形成基于用戶端額協(xié)同過濾信息推薦集合。論文結(jié)構(gòu)本文共分為六段。第一段引言,對論文的研究背景、意義、現(xiàn)狀、挑戰(zhàn)以及研究的內(nèi)容和目的進行闡述。第二段基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相關(guān)技術(shù)
11、介紹。首先給出了Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的體系結(jié)構(gòu);在介紹了Web個性化技術(shù)、Web挖掘的分類模式、Web挖掘等內(nèi)容;在次將個性化服務(wù)引入到個性化學(xué)習(xí)中,介紹了個性化學(xué)習(xí)的涵義、推薦過程和技術(shù);最后分析了基于Web日志挖掘的個性化系統(tǒng)模型結(jié)構(gòu)。第三段Web挖掘的預(yù)處理研究。介紹了Web挖掘的數(shù)據(jù)來源、數(shù)據(jù)特點;分析了Web挖掘的數(shù)據(jù)預(yù)處理流程。第四段基于Web挖掘的個性化推薦模型。第五段總結(jié),對論文進行概括性總結(jié)簡述了系統(tǒng)的工作成果及需要完善的問題,對個性化學(xué)習(xí)系統(tǒng)給予美好的憧憬,還對Web挖掘技術(shù)寄于很高的使用前景。最后,列出了本文相關(guān)的參考文獻?;赪eb挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相
12、關(guān)技術(shù)2.1體系結(jié)構(gòu)基于Web挖掘的個性化網(wǎng)路學(xué)習(xí)系統(tǒng)的體系結(jié)構(gòu)如圖2所示。該系統(tǒng)主要分為兩大部分:離線部分和在線部分。離線部分由個性化處理模塊,各種教學(xué)資源和網(wǎng)路Web站點結(jié)構(gòu)及用戶使用信息組成。該部分主要對各種數(shù)據(jù)記性預(yù)處理并進行Web內(nèi)容挖掘(Webcontentmining)、Web使用挖掘(Webusagemining)、Web結(jié)構(gòu)挖掘(Webstrueturemining)來得到相應(yīng)特征。在線部分的功能主要是根據(jù)學(xué)習(xí)者的登錄信息和Web挖掘的結(jié)果向?qū)W習(xí)者推薦個性化學(xué)習(xí)資料。離線部分在線部分個性化推薦引擎推薦頁面用戶信學(xué)習(xí)者Ineternet圖2個性化處理模塊式實現(xiàn)個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)
13、的核心部分,主要有三部分組成:Web內(nèi)容挖掘模塊、Web使用挖掘模塊、Web結(jié)構(gòu)挖掘模塊Web內(nèi)容挖掘模塊主要是根據(jù)學(xué)習(xí)站點的各種資源進行聚類以獲得頁面的內(nèi)容特征。2.2Web個性化技術(shù)Web挖掘的定義Web挖掘是利用數(shù)據(jù)挖掘技術(shù)從Web文檔及Web服務(wù)器中自動發(fā)現(xiàn)并提前人們感興趣的信息。它是一門綜合性技術(shù),涉及到Internet技術(shù)、人工智能技術(shù)、計算機語言學(xué)、信息學(xué)、統(tǒng)計學(xué)等多個領(lǐng)域。Web挖掘的分類Web挖掘是一個具有挑戰(zhàn)性的課題,它實現(xiàn)對Web存取模式、Web結(jié)構(gòu)和規(guī)則以及動態(tài)的Web內(nèi)容的查找。一般地可分為三類:Web內(nèi)容挖掘、Web使用挖掘、Web結(jié)構(gòu)挖掘。在前面Web的體系結(jié)構(gòu)中
14、有介紹過。在這里我給大家具體介紹下這三種方法如圖4,并對其進行比較。圖4Web挖掘分類一、Web內(nèi)容挖掘Web內(nèi)容挖掘主要是針對組成頁面的各種非結(jié)構(gòu)化地數(shù)據(jù),如文本數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)、圖形、圖像數(shù)據(jù)等多種數(shù)據(jù)相融合的多媒體數(shù)據(jù)進行挖掘。Web內(nèi)容挖掘的重點是頁面分類和聚類。Web頁面的分類是根據(jù)頁面的不同特征,將其規(guī)劃為事先建立起來的不同的類。Web頁面的聚類是指在沒有給定主題類別的情況下,將Web頁面集合聚成若干個簇,并且同一簇的頁面內(nèi)容相似性盡可能大,而簇之間的相似度盡可能小。二、Web結(jié)構(gòu)挖掘Web結(jié)構(gòu)挖掘是從Web站點的組織結(jié)構(gòu)、Web文檔結(jié)構(gòu)及其鏈接關(guān)系中推導(dǎo)知識。由于超文本文
15、檔的關(guān)聯(lián)關(guān)系,使得WWW不僅可以揭示文檔中所包含的信息,同時也以揭示文檔間的關(guān)聯(lián)關(guān)系所代表的信息,反應(yīng)了文檔指間的額某種聯(lián)系,同時還能體現(xiàn)某個頁面的重要程度。三、Web使用挖掘除了Web結(jié)構(gòu)挖掘和Web內(nèi)容挖掘,Web挖掘的另一個重要任務(wù)是Web使用挖掘,它通過分析和探究用戶訪問記錄中的規(guī)律,可以識別遠程教育學(xué)習(xí)網(wǎng)站的潛在客戶,增強對最終學(xué)習(xí)用戶的遠程學(xué)習(xí)信息服務(wù)的質(zhì)量,并該進Web服務(wù)器系統(tǒng)的性能和結(jié)構(gòu)。2.3Web挖掘中常用的技術(shù)Web內(nèi)容挖掘中常用的技術(shù)就其方法而言,Web內(nèi)容挖掘可以分為兩大類:信息查詢(InformationRetrieve,IR)方法和數(shù)據(jù)庫方法IR方法主要應(yīng)用IR
16、技術(shù),評估和改進搜索信息的質(zhì)量,也可以處理無結(jié)構(gòu)化數(shù)據(jù)和HTML標記的半結(jié)構(gòu)化數(shù)據(jù),主要應(yīng)用于文本分類、聚類和模式發(fā)現(xiàn)等。數(shù)據(jù)庫方法和數(shù)據(jù)倉庫方法都是采用數(shù)據(jù)抽取和轉(zhuǎn)換的方法將非結(jié)構(gòu)化的Web信息轉(zhuǎn)換或映射為結(jié)構(gòu)化的數(shù)據(jù),再采用數(shù)據(jù)挖掘技術(shù)進行信息挖掘。Web結(jié)構(gòu)挖掘中常用的技術(shù)一、選擇鏈接策略在互聯(lián)網(wǎng)的海洋中,最重要的就是互聯(lián)互通,不被其他網(wǎng)站引用的網(wǎng)站就是“信息孤島”WEB結(jié)構(gòu)挖掘引擎所有算法都將網(wǎng)頁中的鏈接作為主要挖掘的對象,特別是實際應(yīng)用中,大多數(shù)用戶都是使用基于PageRank算法的Google,Yahoo,Baidu都搜索引擎,因此可以采取以下幾種策略,提高網(wǎng)站的排名。廣泛鏈接策略
17、來自其他網(wǎng)站的任何反相鏈接都是有用的。當(dāng)前常見的新搜索引擎已經(jīng)不再只是網(wǎng)站目錄的索引,而是更全面的網(wǎng)頁索引,所以無論來自其他網(wǎng)站任何地方的反相鏈接都是非常有價值的。同時如果一個網(wǎng)頁只有大量的進入鏈接,而缺乏導(dǎo)出鏈接,也會被搜索引擎認為是沒有價值的站點。2)高質(zhì)量鏈接策略被PageRank高的網(wǎng)站引用能更快地提高PageRank數(shù)量只是關(guān)鍵因素之一,來自PageRank高的頁面的鏈接還能更快的提高被鏈接目標的PageRank3)無空鏈接策略應(yīng)當(dāng)保持網(wǎng)站自身的健康,經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。同時保持網(wǎng)頁內(nèi)容/鏈接的穩(wěn)定性和持久性:在搜索引擎索引中網(wǎng)頁存在的歷史也是一個比較重要的因素
18、,而且歷史比較久的網(wǎng)頁被鏈接的幾率越高。二、構(gòu)建友好的網(wǎng)站結(jié)構(gòu)有了合適的鏈接,就可以在算法中取得一個比較理想的分值,但由于數(shù)據(jù)的挖掘過程中由機器Spider自動完成。因此還必須考慮讓引擎能完整的采集到所設(shè)計的鏈接,這就需要構(gòu)建友好的網(wǎng)站結(jié)構(gòu)。1)網(wǎng)站結(jié)構(gòu)扁平化網(wǎng)站目錄結(jié)構(gòu)要扁平,因為每深一級目錄,PAGERANK降低12個檔次。2)表現(xiàn)和內(nèi)容的分離遵循w3c的規(guī)范,使用更規(guī)范的XHTML和XML作為顯示格式,JavaScript和CSS盡可能和網(wǎng)頁分離,一方面提高代碼重用度(也方便頁面緩存),另外一方面,由于有效內(nèi)容占網(wǎng)頁長度的百分比高,也能提高相關(guān)關(guān)鍵詞在頁面中的比重也增加了。3)建立站點地
19、圖讓所有的頁面都有能夠快速入口:站點地圖,方便網(wǎng)頁爬蟲(spider)快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。233Web使用挖掘中常用的技術(shù)Web使用挖掘中常用的技術(shù)有Web使用的特有的路徑分析技術(shù)和數(shù)據(jù)挖掘領(lǐng)域中常用的分類、聚類、關(guān)聯(lián)規(guī)則、序列模式等。(1)路徑分析技術(shù)用路徑分析技術(shù)進行Web使用模式挖掘時,最常用的是圖,因為用圖可以清楚地表達定義在網(wǎng)站上的頁面之間的聯(lián)系。關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則主要用于從用戶訪問序列數(shù)據(jù)庫的序列項中挖掘出相關(guān)的規(guī)則。在Web數(shù)據(jù)挖掘中,關(guān)聯(lián)規(guī)則挖掘就是要挖掘出用戶在一個訪問期間從服務(wù)器上訪問的頁面/文件之間的聯(lián)系,這些頁面之間可能并不存在直接的參引關(guān)系。序列模式分析序列
20、模式分析技術(shù)試圖找出顧客選購商品或訪問購物商場的典型路徑,或者訪問Web網(wǎng)頁的先后順序。分類和聚類分類規(guī)則可以挖掘某些共同的特性。這個特性可以用來對新添到數(shù)據(jù)庫里的數(shù)據(jù)項進行分類。聚類將物理或抽象對象的集合分組為由類似的對象組成的多個類。個性化用戶的個性化分析可以為用戶提供定制服務(wù)。通過對日志文件中的存取事務(wù)進行用戶識別,發(fā)現(xiàn)用戶的個性化興趣模式,基于永恒的個性化特征為每個用戶定制符合其個人特色的Web服務(wù),提供符合用戶個性化要求的站點借口。改進系統(tǒng)性能和結(jié)構(gòu)網(wǎng)站的吸引力取決于內(nèi)容和組織結(jié)構(gòu)的合理設(shè)計。Web挖掘可以提供用戶站點訪問行為的詳細情況,分析網(wǎng)頁直間的訪問關(guān)聯(lián),從而能夠為網(wǎng)站設(shè)計者改
21、進網(wǎng)絡(luò)的設(shè)計提供決策依據(jù)。對所有用戶的瀏覽路徑、用戶訪問模式及趨向進行分析挖掘,發(fā)現(xiàn)其中某系頁面的邏輯關(guān)聯(lián),獲得用戶訪問模式信息。頁面推薦收集和統(tǒng)計活動用戶對站點的近期訪問信息,分析其瀏覽路徑,與挖掘的模式進行匹配,并根據(jù)匹配程度進行排序,為活動用戶預(yù)測下一步最有可能訪問的頁面,將排序結(jié)果附加在現(xiàn)在用戶請求頁面之后,從而進行頁面推薦。個性化學(xué)習(xí)系統(tǒng)個性化學(xué)習(xí)系統(tǒng)就是以學(xué)習(xí)者原有的知識經(jīng)驗和個性特征為基礎(chǔ),以學(xué)習(xí)者得內(nèi)在需求為核心,為不同的學(xué)習(xí)者提供不同的個性化學(xué)習(xí)服務(wù),根據(jù)學(xué)習(xí)者固有的特征信息提供不同的教學(xué)策略和學(xué)習(xí)內(nèi)容的服務(wù)模式。2.4.4個性化服務(wù)系統(tǒng)的關(guān)鍵技術(shù)個性化服務(wù)的關(guān)鍵技術(shù)在于個性
22、化的信息推薦,個性化推薦目前較多采用基于規(guī)則的技術(shù)、基于信息過濾的技術(shù),其中信息過濾的技術(shù)又包括基于內(nèi)容過濾的技術(shù)和協(xié)作過濾技術(shù)。下面對這三種技術(shù)進行介紹和比較。一、基于規(guī)則的技術(shù)基于規(guī)則的推薦技術(shù)是指基于用戶的相關(guān)統(tǒng)計數(shù)據(jù)和其他靜態(tài)的文檔來描述各種有意義的規(guī)則,基于規(guī)則進行推薦的技術(shù)。規(guī)則可以有用戶指定,也可以利用基于關(guān)聯(lián)規(guī)則的挖掘技術(shù)來發(fā)現(xiàn),利用規(guī)則產(chǎn)生推薦資源依賴與規(guī)則的質(zhì)量和數(shù)量,基于規(guī)則的推薦技術(shù)的一個重要不足在于隨著規(guī)則的數(shù)量的增加系統(tǒng)會變得越加的難以管理。二、基于內(nèi)容過濾的技術(shù)基于內(nèi)容過濾的推薦是當(dāng)前國內(nèi)學(xué)者研究的重點之一,它是用相關(guān)特征來定義所要推薦的項目或?qū)ο螅缓笙到y(tǒng)基于用
23、戶評價對象的特征學(xué)習(xí)用戶的興趣,依據(jù)用戶資料的項目或?qū)ο?,然后系統(tǒng)基于用戶評價對象的特征學(xué)習(xí)用戶的興趣,依據(jù)用戶資料與待預(yù)測項目的匹配程度進行推薦。三、基于協(xié)作過濾的技術(shù)基于協(xié)作過濾的推薦技術(shù)也是當(dāng)前國內(nèi)學(xué)者研究的重點之一。和基于內(nèi)容的過濾技術(shù)不一樣的是,基于內(nèi)容過濾的技術(shù)中比較的是資源和用戶的描述文件,基于協(xié)作過濾的技術(shù)中比較的是不同用戶的描述文件,根據(jù)用戶的相似性來推薦資源。2.5基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)模型構(gòu)架個性化服務(wù)系統(tǒng)應(yīng)用領(lǐng)域繁多,服務(wù)的方式也不盡相同,然而,通過對各種個性化服務(wù)系統(tǒng)的分析,可以歸納出個性化服務(wù)系統(tǒng)共性的模型構(gòu)架。Web挖掘的預(yù)處理3.1Web挖掘的基本流程將
24、Web挖掘應(yīng)用于學(xué)習(xí)網(wǎng)站個性化服務(wù),可以在海量的Web數(shù)據(jù)中發(fā)現(xiàn)用戶的興趣愛好、訪問習(xí)慣、學(xué)習(xí)趨勢等,以便更好地為讀者提供各種信息與服務(wù)。Web挖掘在數(shù)據(jù)采集的基礎(chǔ)上進行,主要步驟包括數(shù)據(jù)預(yù)處理、模式識別和模式分析(圖6)圖6數(shù)據(jù)采集按照主題相關(guān)的原則,數(shù)據(jù)采集完成從外部的Web環(huán)境中有選擇的獲取數(shù)據(jù),為后面的數(shù)據(jù)挖掘提供素材和資源。在Web挖掘中,數(shù)據(jù)可以從服務(wù)器端、客戶端或代理端中采集到。服務(wù)器端數(shù)據(jù)采集。在Web挖掘中,最直接的數(shù)據(jù)來源是Web服務(wù)器日志,它非常明確地記錄了訪問者的瀏覽行為,在日志挖掘中有很重要的地位。客戶端數(shù)據(jù)采集。客戶端收集信息的方法一般需要用戶的合作。網(wǎng)絡(luò)代理端數(shù)據(jù)
25、采集。一個網(wǎng)絡(luò)代理作為客戶端瀏覽器與網(wǎng)絡(luò)服務(wù)器之間的中介,不僅采集多個用戶的行為,還可以采集對多個網(wǎng)站的行為。數(shù)據(jù)預(yù)處理原始數(shù)據(jù)需要經(jīng)過處理后才能有效實施挖掘算法,數(shù)據(jù)預(yù)處理的質(zhì)量與Web挖掘的效率和結(jié)果緊密相關(guān),其內(nèi)容包括:數(shù)據(jù)凈化。其目的是從服務(wù)器日志文件中消除不相關(guān)的項,縮小被挖掘數(shù)據(jù)對象的范圍。用戶識別。包括如何在海量的數(shù)據(jù)中找到屬于同一用戶的記錄。用戶識別是后續(xù)步驟有效性的重要前提,也是Web挖掘的難點之一。會話識別。將用戶訪問的信息按照一定的時間段進行劃分,每一時間段內(nèi)的用戶訪問集合作為一個用戶會話。事務(wù)識別。將用戶會話分解成具有一定語義的訪問序列,可以看做對會話識別的進一步細化。
26、路徑補全。在Web日志中記錄的用戶訪問信息有些事不完整的。3.1.3模式識別模式識別階段就是對預(yù)處理后的數(shù)據(jù),利用挖掘算法挖掘出有效的,新穎的,潛在的,有用的及最終可以理解的信息和知識。3.1.4模式分析模式分析是Web數(shù)據(jù)挖掘中最后一項重要步驟。其通過選擇和觀察把發(fā)現(xiàn)的規(guī)則、模式和統(tǒng)計值轉(zhuǎn)換為知識,在經(jīng)過沒收你分析、評估和解釋得到有價值的模式,即感興趣的規(guī)則,模式,如用戶的訪問興趣、訪問頻度、訪問時間等等。最后可以采用可視化技術(shù),以圖形化界面的方式,將發(fā)現(xiàn)的有價值的用戶模式直觀地展示出來。個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的設(shè)計與實現(xiàn)4.1傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)是指教學(xué)總的歌環(huán)節(jié)(上課、作業(yè)、
27、考試、答疑等)以站點為結(jié)構(gòu)在各頁面進行物區(qū)別化地呈現(xiàn)。在傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中,站點是學(xué)習(xí)的中心,用戶必須依靠自身自覺性對Web站點按照網(wǎng)絡(luò)的拓撲結(jié)構(gòu)進行自適應(yīng)性的深入學(xué)習(xí),用戶在學(xué)習(xí)過程中完全自己選擇教學(xué)內(nèi)容、控制學(xué)習(xí)進度,系統(tǒng)知識負責(zé)將教學(xué)中的各環(huán)節(jié)整合起來,并提供一個統(tǒng)一的用戶界面,用戶界面只是提供了系統(tǒng)中個教學(xué)環(huán)節(jié)的鏈接,而并沒有把各個環(huán)節(jié)進行有機結(jié)合。4.2基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)模型設(shè)計4.2.1系統(tǒng)的運行環(huán)境和主要開發(fā)環(huán)境本系統(tǒng)是基于Web技術(shù)來實現(xiàn)的,所以在編碼設(shè)計中,各模塊應(yīng)該選擇相應(yīng)的技術(shù)來解決。運行環(huán)境為:Windows2003server、IIS6.0、Fram
28、eworkSDK、SQLSERVER2OOO、InternetExplorer等,支持ASP技術(shù),選擇后臺ADO模塊進行后臺數(shù)據(jù)看SQLServer2OOO,編譯語言可以采用javascript,vbscript。4.2.2構(gòu)建個性化的網(wǎng)絡(luò)學(xué)習(xí)模型“網(wǎng)絡(luò)學(xué)習(xí)個性化推薦”是一個給學(xué)習(xí)者推薦學(xué)習(xí)資源或者學(xué)習(xí)任務(wù)的推薦系統(tǒng),這些學(xué)習(xí)任務(wù)參考了其他“相似”學(xué)習(xí)者的學(xué)習(xí)模式。網(wǎng)絡(luò)學(xué)習(xí)個性化推薦系統(tǒng)能夠給學(xué)習(xí)者提供特定格式的學(xué)習(xí)資源建議,并最大程度地適應(yīng)學(xué)習(xí)者的個人偏好,學(xué)習(xí)經(jīng)歷和需求。網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)框架個性化數(shù)據(jù)收集來源于信衡息反饋系統(tǒng)。信息反饋系統(tǒng)主要由3個子系統(tǒng)組成:Web日志反饋子系統(tǒng)
29、、用戶數(shù)據(jù)反饋子系統(tǒng)、用戶調(diào)查子系統(tǒng)。個性化信息反饋包括:Web日志反饋、用戶數(shù)據(jù)反饋、用戶調(diào)查反饋。三個反饋子系統(tǒng)根據(jù)相應(yīng)的分析內(nèi)容分別反饋的部分信息,它們從各個角度反映了“個性化網(wǎng)絡(luò)推薦系統(tǒng)”的運行情況,揭示了個性化推薦在網(wǎng)絡(luò)教學(xué)中的重要作用,取得的成績,也揭示了它的不足和有待改善的地方,為個性化推薦的改進提供了重要的依據(jù)。4.2.4網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)結(jié)構(gòu)分析網(wǎng)絡(luò)學(xué)習(xí)個性化推薦系統(tǒng),運用Web使用挖掘技術(shù),通過分析學(xué)習(xí)者會話的特征以及學(xué)習(xí)者會話之間的相似性,向?qū)W習(xí)者提供個性化服務(wù)??偨Y(jié)個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)是信息技術(shù)飛速發(fā)展的體現(xiàn),是現(xiàn)代遠程教育的追求目標之一,同時也是對傳統(tǒng)教學(xué)方式
30、的改進。個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)不僅能滿足人們終身教育的需求,同時也在這個個性張揚的時代為學(xué)生提供了能夠滿足其個性化需求的學(xué)習(xí)環(huán)境,尊重個性差異,提供實時的、個性化的學(xué)習(xí)模式。本系統(tǒng)以個性化學(xué)習(xí)為基本思想,設(shè)計了一個具有個性化學(xué)習(xí)特點的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)。在系統(tǒng)的設(shè)計過程中,我們根據(jù)教學(xué)內(nèi)容的組織設(shè)計網(wǎng)站的拓撲結(jié)構(gòu),將學(xué)習(xí)者的興趣度量與站點拓撲結(jié)構(gòu)相結(jié)合。在此我們還有待進一步完善個性化服務(wù)功能模塊使得個性化學(xué)習(xí)效果進一步提高。同時還要注重網(wǎng)站內(nèi)容的充實和優(yōu)化,使得學(xué)習(xí)內(nèi)容更加豐富。總體上來說,個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的發(fā)展及應(yīng)用將是今后網(wǎng)絡(luò)課程發(fā)展的一個重要趨勢,對于它的研究和設(shè)計涉及程序開發(fā)、教學(xué)設(shè)計、媒
31、體應(yīng)用等多方面的理論和技能,這個領(lǐng)域還存在著廣闊的研究空間。所以基于Web挖掘技術(shù)開發(fā)學(xué)習(xí)系統(tǒng),有著明朗的前景,它和目前互聯(lián)網(wǎng)的發(fā)展方向是一致的,將融合Web和桌面兩個軟件領(lǐng)域的有點,是軟件技術(shù)發(fā)展的趨勢,它將導(dǎo)致一種新型軟件應(yīng)用的出現(xiàn),并且改變軟件的構(gòu)造模式。Web挖掘技術(shù)在網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中的應(yīng)用有效的提高了系統(tǒng)的個性化服務(wù)水平,學(xué)習(xí)系統(tǒng)能夠根據(jù)學(xué)生的知識結(jié)構(gòu)、學(xué)習(xí)風(fēng)格進行個性化內(nèi)容的推薦??梢蕴岣邔W(xué)習(xí)者的學(xué)習(xí)的積極性和主動性。隨著Web挖掘技術(shù)的日趨成熟,在個性化網(wǎng)絡(luò)學(xué)習(xí)中有著廣闊的使用前景。參考文獻游麗貞,郭宇春.Ajax引擎的原理和應(yīng)用J.微計算機信息.2006(2):205-207.段隆振,秦磊,黃龍軍一種基于用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級語文下冊期中考試試卷分析
- 中醫(yī)基礎(chǔ)學(xué)習(xí)題含答案
- 中級電工模擬試題及參考答案
- 廠里工序分包協(xié)議合同范本
- 債券抵押合同范本
- 一年級班主任的個人年底總結(jié)
- 一年級下學(xué)期體育教學(xué)計劃
- 廠家招商加盟合同范例
- 《黃帝內(nèi)經(jīng)》讀書心得體會
- 廠家飯盒供貨合同范本
- 2024年12月重慶大學(xué)醫(yī)院公開招聘醫(yī)生崗位2人(有編制)筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 主題班會:新學(xué)期 新起點 新期待
- 2024 河北公務(wù)員考試(筆試、省直、A類、C類)4套真題及答案
- 小學(xué)生雙擁活動國防教育
- 消防風(fēng)道風(fēng)管施工方案
- 和利時DCS系統(tǒng)課件
- 2.2 生態(tài)脆弱區(qū)的綜合治理 課件 【知識精研】高二地理人教版(2019)選擇性必修2
- 餐廳服務(wù)人員話術(shù)培訓(xùn)
- 遠程醫(yī)療創(chuàng)業(yè)計劃書
- 初中生心理健康教育講座課件
- 廣東省廣州市白云區(qū)2023-2024學(xué)年八年級上學(xué)期期末英語試題(答案)
評論
0/150
提交評論