web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計

上傳人：人*** IP屬地：天津上傳時間：2022-07-27 格式：DOCX 頁數(shù)：16 大小：100.32KB 積分：16 舉報 版權(quán)申訴

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計_第2頁

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計_第3頁

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計_第4頁

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計_第5頁

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、成績:自學(xué)考試畢業(yè)論文（設(shè)計）題目（中文）：基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計（外文）：DesignandRealizationofPersonalizedLearningSystemBasedonWEBMining院（系）：專業(yè)：學(xué)生姓名：準考證號：指導(dǎo)教師：2015年5月9日畢業(yè)論文誠信聲明本人鄭重聲明：所呈交的畢業(yè)論文是本人在指導(dǎo)老師的指導(dǎo)下，獨立研究、寫作的成果。論文中所引用是他人的無論以何種方式的文字、研究成果，均在論文中以明確方式表明。本聲明的法律結(jié)果由本人獨自承擔(dān)。畢業(yè)論文作者簽名：年月日目錄TOC o 1-5 h z HYPERLINK l bookmark8 1引言4

2、HYPERLINK l bookmark10 研究背景及意義4 HYPERLINK l bookmark12 1.2國內(nèi)外研究現(xiàn)狀2 HYPERLINK l bookmark14 1.3主要研究內(nèi)容3 HYPERLINK l bookmark16 1.4論文結(jié)構(gòu)3 HYPERLINK l bookmark6 基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相關(guān)技術(shù)4 HYPERLINK l bookmark20 2.1體系結(jié)構(gòu)4 HYPERLINK l bookmark22 Web個性化技術(shù)5 HYPERLINK l bookmark24 Web挖掘的定義5 HYPERLINK l bookmark26

3、Web挖掘的分類5 HYPERLINK l bookmark32 Web挖掘中常用的技術(shù)6 HYPERLINK l bookmark34 Web內(nèi)容挖掘中常用的技術(shù)6 HYPERLINK l bookmark36 Web結(jié)構(gòu)挖掘中常用的技術(shù)6 HYPERLINK l bookmark40 Web使用挖掘中常用的技術(shù)7 HYPERLINK l bookmark42 個性化8 HYPERLINK l bookmark44 2.4.1改進系統(tǒng)性能和結(jié)構(gòu)8 HYPERLINK l bookmark46 2.4.2頁面推薦8 HYPERLINK l bookmark48 2.4.3個性化學(xué)習(xí)系統(tǒng)8 HY

4、PERLINK l bookmark50 2.4.4個性化服務(wù)系統(tǒng)的關(guān)鍵技術(shù)9 HYPERLINK l bookmark52 2.5基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)模型構(gòu)架9 HYPERLINK l bookmark54 Web挖掘的預(yù)處理9 HYPERLINK l bookmark56 Web挖掘的基本流程9 HYPERLINK l bookmark58 3.1.1數(shù)據(jù)采集103.1.2數(shù)據(jù)預(yù)處理103.1.3模式識別11 HYPERLINK l bookmark60 3.1.4模式分析11 HYPERLINK l bookmark62 個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的設(shè)計與實現(xiàn)11 HYPERLINK

5、l bookmark64 傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)11 HYPERLINK l bookmark66 基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)模型設(shè)計11 HYPERLINK l bookmark68 4.2.1系統(tǒng)的運行環(huán)境和主要開發(fā)環(huán)境114.2.2構(gòu)建個性化的網(wǎng)絡(luò)學(xué)習(xí)模型11 HYPERLINK l bookmark70 4.2.3網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)框架124.2.4網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)結(jié)構(gòu)分析12 HYPERLINK l bookmark72 總結(jié)12 HYPERLINK l bookmark74 參考文獻13基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計摘要：文章分析網(wǎng)上每個學(xué)習(xí)者的個性化

6、需求，提出基于Web挖掘技術(shù)的個性化系統(tǒng)框架。對Web使用挖掘關(guān)鍵算法進行了研究，設(shè)計了一種基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)，該系統(tǒng)給出了Web內(nèi)容挖掘、Web使用挖掘和Web結(jié)構(gòu)挖掘的結(jié)果并結(jié)合其推薦結(jié)果為學(xué)習(xí)者提供了個性化的服務(wù)，并給出了推薦算法。關(guān)鍵詞：Web挖掘；個性化；學(xué)習(xí)；系統(tǒng)模型1引言研究背景及意義目前我國采用的是傳統(tǒng)的教育制度，教育模式主要是老師講，學(xué)生聽。為了應(yīng)試，學(xué)校在授課過程中過分強調(diào)以知識的傳授為中心，只重視教師在課堂中的作用，遏制了學(xué)生的創(chuàng)造性，忽視了學(xué)生學(xué)習(xí)的主動性和學(xué)習(xí)潛力的開發(fā)。學(xué)生往往都是為考試聽課，為考試學(xué)習(xí)，畢業(yè)后仍然茫然，例如計算機專業(yè)的學(xué)生所學(xué)知識已

7、經(jīng)或正在被淘汰，即使沒有被淘汰，因為實踐能力太弱所學(xué)知識不能很好的應(yīng)用于工作中。因此現(xiàn)代大學(xué)生需要一個開闊視野的平臺，如可以進行專業(yè)學(xué)習(xí)的網(wǎng)站的出現(xiàn)（這就是下面為大家講解基于Web挖掘的個性化學(xué)習(xí)網(wǎng)絡(luò)）。作為計算機專業(yè)的學(xué)生因為計算機時代的來臨，其發(fā)展需求使計算機專業(yè)學(xué)生對就業(yè)很自信，但計算機技術(shù)發(fā)展速度飛快，專業(yè)迫使計算機專業(yè)學(xué)生必須走在時代前端，但所學(xué)知識越多到最后被淘汰的就越多，在這樣的教育體制下，學(xué)生不得不自己尋找新的學(xué)習(xí)模式，例如看計算機專業(yè)的新書或刊物，但昂貴的費用不是一個普通大學(xué)生所能承擔(dān)的。因此學(xué)生的學(xué)習(xí)因經(jīng)濟能力而閉塞，使學(xué)生十分焦急，求知心不能得到滿足更何況實踐能力的培養(yǎng)。

8、所以大學(xué)生需要借助網(wǎng)絡(luò)，通過網(wǎng)上的各渠道來擴展知識面，學(xué)習(xí)新知識，知道最新的科技動向。國內(nèi)外研究現(xiàn)狀目前Web挖掘技術(shù)的應(yīng)用側(cè)重于商業(yè)領(lǐng)域的大數(shù)據(jù)量應(yīng)用，在教學(xué)領(lǐng)域應(yīng)用的起步相對較晚，并且數(shù)據(jù)挖掘技術(shù)在教學(xué)領(lǐng)域的應(yīng)用與在商業(yè)領(lǐng)域中的應(yīng)用既有相同點也有不同點。國際學(xué)術(shù)研究領(lǐng)域中，如何充分有效地隊Web數(shù)據(jù)進行存儲和查詢，分析提取用戶特性并向用戶提供個性化學(xué)習(xí)的網(wǎng)絡(luò)學(xué)習(xí)平臺已經(jīng)成為Web技術(shù)的一個研究熱點，并且已有一些研究著獲得了研究性和實踐性的成果。主要研究內(nèi)容Web挖掘的處理模型主要是由數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模式識別(數(shù)據(jù)挖掘算法實施)、模式分析四部分組成在本文的研究中，以目前國內(nèi)外的Web挖

9、掘已有的學(xué)術(shù)以及應(yīng)用成果為基礎(chǔ)，以Web挖掘技術(shù)為出發(fā)點，結(jié)合世家的應(yīng)用對Web挖掘的數(shù)據(jù)預(yù)處理和模式識別進行研究分析，設(shè)計了一個基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)。論文主要展開了以下幾個方面的研究工作：研究Web特征提取中所有涉及的數(shù)據(jù)特征，對數(shù)據(jù)來源、數(shù)據(jù)類型進行分析，對Web日志進行數(shù)據(jù)預(yù)處理。分析現(xiàn)有的用戶訪問興趣的度量方法，基于注冊信息建立初始的擁有資源興趣評分矩陣，根據(jù)用戶對頁面的訪問時間進行用戶興趣度得度量，以此為基礎(chǔ)實時更行用戶資源評分矩陣，全局和近期局部相結(jié)合，體現(xiàn)用戶資源興趣度?；赪eb站點的拓撲結(jié)構(gòu)，分析教學(xué)資源的組織結(jié)構(gòu)，并通過和測試工具分析用戶的學(xué)習(xí)情況，以這些作為數(shù)據(jù)

10、源，進行基于內(nèi)容的過濾處理，產(chǎn)生基于內(nèi)容的信息推薦集。針對現(xiàn)有的協(xié)同過濾算法的可擴展性問題，系統(tǒng)采用了離線與在線兩部分處理方式，首先在離線狀態(tài)下，基于用戶資源評分矩陣采用K-means算法對用戶進行聚類，有效縮小協(xié)同過濾同過濾的相關(guān)性計算空間，以聚類結(jié)果為基礎(chǔ)，在線時對目標用火在同一簇內(nèi)進行基于用戶的協(xié)同過濾處理，產(chǎn)生目標用戶的最近鄰居序列，通過最近鄰居對資源的評分來預(yù)測目標用戶對目標資源的預(yù)評分，以此為依據(jù)形成基于用戶端額協(xié)同過濾信息推薦集合。論文結(jié)構(gòu)本文共分為六段。第一段引言，對論文的研究背景、意義、現(xiàn)狀、挑戰(zhàn)以及研究的內(nèi)容和目的進行闡述。第二段基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相關(guān)技術(shù)

11、介紹。首先給出了Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的體系結(jié)構(gòu)；在介紹了Web個性化技術(shù)、Web挖掘的分類模式、Web挖掘等內(nèi)容；在次將個性化服務(wù)引入到個性化學(xué)習(xí)中，介紹了個性化學(xué)習(xí)的涵義、推薦過程和技術(shù)；最后分析了基于Web日志挖掘的個性化系統(tǒng)模型結(jié)構(gòu)。第三段Web挖掘的預(yù)處理研究。介紹了Web挖掘的數(shù)據(jù)來源、數(shù)據(jù)特點；分析了Web挖掘的數(shù)據(jù)預(yù)處理流程。第四段基于Web挖掘的個性化推薦模型。第五段總結(jié)，對論文進行概括性總結(jié)簡述了系統(tǒng)的工作成果及需要完善的問題,對個性化學(xué)習(xí)系統(tǒng)給予美好的憧憬，還對Web挖掘技術(shù)寄于很高的使用前景。最后，列出了本文相關(guān)的參考文獻?；赪eb挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)及相

12、關(guān)技術(shù)2.1體系結(jié)構(gòu)基于Web挖掘的個性化網(wǎng)路學(xué)習(xí)系統(tǒng)的體系結(jié)構(gòu)如圖2所示。該系統(tǒng)主要分為兩大部分：離線部分和在線部分。離線部分由個性化處理模塊，各種教學(xué)資源和網(wǎng)路Web站點結(jié)構(gòu)及用戶使用信息組成。該部分主要對各種數(shù)據(jù)記性預(yù)處理并進行Web內(nèi)容挖掘(Webcontentmining)、Web使用挖掘(Webusagemining)、Web結(jié)構(gòu)挖掘(Webstrueturemining)來得到相應(yīng)特征。在線部分的功能主要是根據(jù)學(xué)習(xí)者的登錄信息和Web挖掘的結(jié)果向?qū)W習(xí)者推薦個性化學(xué)習(xí)資料。離線部分在線部分個性化推薦引擎推薦頁面用戶信學(xué)習(xí)者Ineternet圖2個性化處理模塊式實現(xiàn)個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)

13、的核心部分，主要有三部分組成：Web內(nèi)容挖掘模塊、Web使用挖掘模塊、Web結(jié)構(gòu)挖掘模塊Web內(nèi)容挖掘模塊主要是根據(jù)學(xué)習(xí)站點的各種資源進行聚類以獲得頁面的內(nèi)容特征。2.2Web個性化技術(shù)Web挖掘的定義Web挖掘是利用數(shù)據(jù)挖掘技術(shù)從Web文檔及Web服務(wù)器中自動發(fā)現(xiàn)并提前人們感興趣的信息。它是一門綜合性技術(shù)，涉及到Internet技術(shù)、人工智能技術(shù)、計算機語言學(xué)、信息學(xué)、統(tǒng)計學(xué)等多個領(lǐng)域。Web挖掘的分類Web挖掘是一個具有挑戰(zhàn)性的課題，它實現(xiàn)對Web存取模式、Web結(jié)構(gòu)和規(guī)則以及動態(tài)的Web內(nèi)容的查找。一般地可分為三類：Web內(nèi)容挖掘、Web使用挖掘、Web結(jié)構(gòu)挖掘。在前面Web的體系結(jié)構(gòu)中

14、有介紹過。在這里我給大家具體介紹下這三種方法如圖4，并對其進行比較。圖4Web挖掘分類一、Web內(nèi)容挖掘Web內(nèi)容挖掘主要是針對組成頁面的各種非結(jié)構(gòu)化地數(shù)據(jù)，如文本數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)、圖形、圖像數(shù)據(jù)等多種數(shù)據(jù)相融合的多媒體數(shù)據(jù)進行挖掘。Web內(nèi)容挖掘的重點是頁面分類和聚類。Web頁面的分類是根據(jù)頁面的不同特征，將其規(guī)劃為事先建立起來的不同的類。Web頁面的聚類是指在沒有給定主題類別的情況下，將Web頁面集合聚成若干個簇，并且同一簇的頁面內(nèi)容相似性盡可能大，而簇之間的相似度盡可能小。二、Web結(jié)構(gòu)挖掘Web結(jié)構(gòu)挖掘是從Web站點的組織結(jié)構(gòu)、Web文檔結(jié)構(gòu)及其鏈接關(guān)系中推導(dǎo)知識。由于超文本文

15、檔的關(guān)聯(lián)關(guān)系，使得WWW不僅可以揭示文檔中所包含的信息,同時也以揭示文檔間的關(guān)聯(lián)關(guān)系所代表的信息，反應(yīng)了文檔指間的額某種聯(lián)系，同時還能體現(xiàn)某個頁面的重要程度。三、Web使用挖掘除了Web結(jié)構(gòu)挖掘和Web內(nèi)容挖掘，Web挖掘的另一個重要任務(wù)是Web使用挖掘，它通過分析和探究用戶訪問記錄中的規(guī)律，可以識別遠程教育學(xué)習(xí)網(wǎng)站的潛在客戶，增強對最終學(xué)習(xí)用戶的遠程學(xué)習(xí)信息服務(wù)的質(zhì)量，并該進Web服務(wù)器系統(tǒng)的性能和結(jié)構(gòu)。2.3Web挖掘中常用的技術(shù)Web內(nèi)容挖掘中常用的技術(shù)就其方法而言,Web內(nèi)容挖掘可以分為兩大類:信息查詢(InformationRetrieve,IR)方法和數(shù)據(jù)庫方法IR方法主要應(yīng)用IR

16、技術(shù)，評估和改進搜索信息的質(zhì)量,也可以處理無結(jié)構(gòu)化數(shù)據(jù)和HTML標記的半結(jié)構(gòu)化數(shù)據(jù)，主要應(yīng)用于文本分類、聚類和模式發(fā)現(xiàn)等。數(shù)據(jù)庫方法和數(shù)據(jù)倉庫方法都是采用數(shù)據(jù)抽取和轉(zhuǎn)換的方法將非結(jié)構(gòu)化的Web信息轉(zhuǎn)換或映射為結(jié)構(gòu)化的數(shù)據(jù)，再采用數(shù)據(jù)挖掘技術(shù)進行信息挖掘。Web結(jié)構(gòu)挖掘中常用的技術(shù)一、選擇鏈接策略在互聯(lián)網(wǎng)的海洋中，最重要的就是互聯(lián)互通，不被其他網(wǎng)站引用的網(wǎng)站就是“信息孤島”WEB結(jié)構(gòu)挖掘引擎所有算法都將網(wǎng)頁中的鏈接作為主要挖掘的對象，特別是實際應(yīng)用中，大多數(shù)用戶都是使用基于PageRank算法的Google,Yahoo,Baidu都搜索引擎，因此可以采取以下幾種策略，提高網(wǎng)站的排名。廣泛鏈接策略

17、來自其他網(wǎng)站的任何反相鏈接都是有用的。當(dāng)前常見的新搜索引擎已經(jīng)不再只是網(wǎng)站目錄的索引，而是更全面的網(wǎng)頁索引，所以無論來自其他網(wǎng)站任何地方的反相鏈接都是非常有價值的。同時如果一個網(wǎng)頁只有大量的進入鏈接，而缺乏導(dǎo)出鏈接，也會被搜索引擎認為是沒有價值的站點。2）高質(zhì)量鏈接策略被PageRank高的網(wǎng)站引用能更快地提高PageRank數(shù)量只是關(guān)鍵因素之一，來自PageRank高的頁面的鏈接還能更快的提高被鏈接目標的PageRank3）無空鏈接策略應(yīng)當(dāng)保持網(wǎng)站自身的健康，經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。同時保持網(wǎng)頁內(nèi)容/鏈接的穩(wěn)定性和持久性：在搜索引擎索引中網(wǎng)頁存在的歷史也是一個比較重要的因素

18、，而且歷史比較久的網(wǎng)頁被鏈接的幾率越高。二、構(gòu)建友好的網(wǎng)站結(jié)構(gòu)有了合適的鏈接，就可以在算法中取得一個比較理想的分值，但由于數(shù)據(jù)的挖掘過程中由機器Spider自動完成。因此還必須考慮讓引擎能完整的采集到所設(shè)計的鏈接，這就需要構(gòu)建友好的網(wǎng)站結(jié)構(gòu)。1）網(wǎng)站結(jié)構(gòu)扁平化網(wǎng)站目錄結(jié)構(gòu)要扁平，因為每深一級目錄，PAGERANK降低12個檔次。2）表現(xiàn)和內(nèi)容的分離遵循w3c的規(guī)范，使用更規(guī)范的XHTML和XML作為顯示格式，JavaScript和CSS盡可能和網(wǎng)頁分離，一方面提高代碼重用度（也方便頁面緩存），另外一方面，由于有效內(nèi)容占網(wǎng)頁長度的百分比高，也能提高相關(guān)關(guān)鍵詞在頁面中的比重也增加了。3）建立站點地

19、圖讓所有的頁面都有能夠快速入口：站點地圖，方便網(wǎng)頁爬蟲（spider）快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。233Web使用挖掘中常用的技術(shù)Web使用挖掘中常用的技術(shù)有Web使用的特有的路徑分析技術(shù)和數(shù)據(jù)挖掘領(lǐng)域中常用的分類、聚類、關(guān)聯(lián)規(guī)則、序列模式等。（1）路徑分析技術(shù)用路徑分析技術(shù)進行Web使用模式挖掘時，最常用的是圖，因為用圖可以清楚地表達定義在網(wǎng)站上的頁面之間的聯(lián)系。關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則主要用于從用戶訪問序列數(shù)據(jù)庫的序列項中挖掘出相關(guān)的規(guī)則。在Web數(shù)據(jù)挖掘中,關(guān)聯(lián)規(guī)則挖掘就是要挖掘出用戶在一個訪問期間從服務(wù)器上訪問的頁面/文件之間的聯(lián)系，這些頁面之間可能并不存在直接的參引關(guān)系。序列模式分析序列

20、模式分析技術(shù)試圖找出顧客選購商品或訪問購物商場的典型路徑，或者訪問Web網(wǎng)頁的先后順序。分類和聚類分類規(guī)則可以挖掘某些共同的特性。這個特性可以用來對新添到數(shù)據(jù)庫里的數(shù)據(jù)項進行分類。聚類將物理或抽象對象的集合分組為由類似的對象組成的多個類。個性化用戶的個性化分析可以為用戶提供定制服務(wù)。通過對日志文件中的存取事務(wù)進行用戶識別，發(fā)現(xiàn)用戶的個性化興趣模式，基于永恒的個性化特征為每個用戶定制符合其個人特色的Web服務(wù)，提供符合用戶個性化要求的站點借口。改進系統(tǒng)性能和結(jié)構(gòu)網(wǎng)站的吸引力取決于內(nèi)容和組織結(jié)構(gòu)的合理設(shè)計。Web挖掘可以提供用戶站點訪問行為的詳細情況，分析網(wǎng)頁直間的訪問關(guān)聯(lián)，從而能夠為網(wǎng)站設(shè)計者改

21、進網(wǎng)絡(luò)的設(shè)計提供決策依據(jù)。對所有用戶的瀏覽路徑、用戶訪問模式及趨向進行分析挖掘，發(fā)現(xiàn)其中某系頁面的邏輯關(guān)聯(lián)，獲得用戶訪問模式信息。頁面推薦收集和統(tǒng)計活動用戶對站點的近期訪問信息，分析其瀏覽路徑，與挖掘的模式進行匹配，并根據(jù)匹配程度進行排序，為活動用戶預(yù)測下一步最有可能訪問的頁面，將排序結(jié)果附加在現(xiàn)在用戶請求頁面之后，從而進行頁面推薦。個性化學(xué)習(xí)系統(tǒng)個性化學(xué)習(xí)系統(tǒng)就是以學(xué)習(xí)者原有的知識經(jīng)驗和個性特征為基礎(chǔ)，以學(xué)習(xí)者得內(nèi)在需求為核心，為不同的學(xué)習(xí)者提供不同的個性化學(xué)習(xí)服務(wù)，根據(jù)學(xué)習(xí)者固有的特征信息提供不同的教學(xué)策略和學(xué)習(xí)內(nèi)容的服務(wù)模式。2.4.4個性化服務(wù)系統(tǒng)的關(guān)鍵技術(shù)個性化服務(wù)的關(guān)鍵技術(shù)在于個性

22、化的信息推薦，個性化推薦目前較多采用基于規(guī)則的技術(shù)、基于信息過濾的技術(shù)，其中信息過濾的技術(shù)又包括基于內(nèi)容過濾的技術(shù)和協(xié)作過濾技術(shù)。下面對這三種技術(shù)進行介紹和比較。一、基于規(guī)則的技術(shù)基于規(guī)則的推薦技術(shù)是指基于用戶的相關(guān)統(tǒng)計數(shù)據(jù)和其他靜態(tài)的文檔來描述各種有意義的規(guī)則，基于規(guī)則進行推薦的技術(shù)。規(guī)則可以有用戶指定，也可以利用基于關(guān)聯(lián)規(guī)則的挖掘技術(shù)來發(fā)現(xiàn)，利用規(guī)則產(chǎn)生推薦資源依賴與規(guī)則的質(zhì)量和數(shù)量，基于規(guī)則的推薦技術(shù)的一個重要不足在于隨著規(guī)則的數(shù)量的增加系統(tǒng)會變得越加的難以管理。二、基于內(nèi)容過濾的技術(shù)基于內(nèi)容過濾的推薦是當(dāng)前國內(nèi)學(xué)者研究的重點之一，它是用相關(guān)特征來定義所要推薦的項目或?qū)ο螅缓笙到y(tǒng)基于用

23、戶評價對象的特征學(xué)習(xí)用戶的興趣，依據(jù)用戶資料的項目或?qū)ο?，然后系統(tǒng)基于用戶評價對象的特征學(xué)習(xí)用戶的興趣，依據(jù)用戶資料與待預(yù)測項目的匹配程度進行推薦。三、基于協(xié)作過濾的技術(shù)基于協(xié)作過濾的推薦技術(shù)也是當(dāng)前國內(nèi)學(xué)者研究的重點之一。和基于內(nèi)容的過濾技術(shù)不一樣的是，基于內(nèi)容過濾的技術(shù)中比較的是資源和用戶的描述文件，基于協(xié)作過濾的技術(shù)中比較的是不同用戶的描述文件，根據(jù)用戶的相似性來推薦資源。2.5基于Web挖掘的個性化學(xué)習(xí)系統(tǒng)模型構(gòu)架個性化服務(wù)系統(tǒng)應(yīng)用領(lǐng)域繁多，服務(wù)的方式也不盡相同，然而，通過對各種個性化服務(wù)系統(tǒng)的分析，可以歸納出個性化服務(wù)系統(tǒng)共性的模型構(gòu)架。Web挖掘的預(yù)處理3.1Web挖掘的基本流程將

24、Web挖掘應(yīng)用于學(xué)習(xí)網(wǎng)站個性化服務(wù)，可以在海量的Web數(shù)據(jù)中發(fā)現(xiàn)用戶的興趣愛好、訪問習(xí)慣、學(xué)習(xí)趨勢等，以便更好地為讀者提供各種信息與服務(wù)。Web挖掘在數(shù)據(jù)采集的基礎(chǔ)上進行，主要步驟包括數(shù)據(jù)預(yù)處理、模式識別和模式分析(圖6)圖6數(shù)據(jù)采集按照主題相關(guān)的原則，數(shù)據(jù)采集完成從外部的Web環(huán)境中有選擇的獲取數(shù)據(jù)，為后面的數(shù)據(jù)挖掘提供素材和資源。在Web挖掘中，數(shù)據(jù)可以從服務(wù)器端、客戶端或代理端中采集到。服務(wù)器端數(shù)據(jù)采集。在Web挖掘中，最直接的數(shù)據(jù)來源是Web服務(wù)器日志，它非常明確地記錄了訪問者的瀏覽行為，在日志挖掘中有很重要的地位。客戶端數(shù)據(jù)采集。客戶端收集信息的方法一般需要用戶的合作。網(wǎng)絡(luò)代理端數(shù)據(jù)

25、采集。一個網(wǎng)絡(luò)代理作為客戶端瀏覽器與網(wǎng)絡(luò)服務(wù)器之間的中介，不僅采集多個用戶的行為，還可以采集對多個網(wǎng)站的行為。數(shù)據(jù)預(yù)處理原始數(shù)據(jù)需要經(jīng)過處理后才能有效實施挖掘算法，數(shù)據(jù)預(yù)處理的質(zhì)量與Web挖掘的效率和結(jié)果緊密相關(guān)，其內(nèi)容包括：數(shù)據(jù)凈化。其目的是從服務(wù)器日志文件中消除不相關(guān)的項，縮小被挖掘數(shù)據(jù)對象的范圍。用戶識別。包括如何在海量的數(shù)據(jù)中找到屬于同一用戶的記錄。用戶識別是后續(xù)步驟有效性的重要前提，也是Web挖掘的難點之一。會話識別。將用戶訪問的信息按照一定的時間段進行劃分，每一時間段內(nèi)的用戶訪問集合作為一個用戶會話。事務(wù)識別。將用戶會話分解成具有一定語義的訪問序列，可以看做對會話識別的進一步細化。

26、路徑補全。在Web日志中記錄的用戶訪問信息有些事不完整的。3.1.3模式識別模式識別階段就是對預(yù)處理后的數(shù)據(jù)，利用挖掘算法挖掘出有效的，新穎的，潛在的，有用的及最終可以理解的信息和知識。3.1.4模式分析模式分析是Web數(shù)據(jù)挖掘中最后一項重要步驟。其通過選擇和觀察把發(fā)現(xiàn)的規(guī)則、模式和統(tǒng)計值轉(zhuǎn)換為知識，在經(jīng)過沒收你分析、評估和解釋得到有價值的模式，即感興趣的規(guī)則，模式，如用戶的訪問興趣、訪問頻度、訪問時間等等。最后可以采用可視化技術(shù)，以圖形化界面的方式，將發(fā)現(xiàn)的有價值的用戶模式直觀地展示出來。個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的設(shè)計與實現(xiàn)4.1傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)是指教學(xué)總的歌環(huán)節(jié)(上課、作業(yè)、

27、考試、答疑等)以站點為結(jié)構(gòu)在各頁面進行物區(qū)別化地呈現(xiàn)。在傳統(tǒng)的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中，站點是學(xué)習(xí)的中心，用戶必須依靠自身自覺性對Web站點按照網(wǎng)絡(luò)的拓撲結(jié)構(gòu)進行自適應(yīng)性的深入學(xué)習(xí)，用戶在學(xué)習(xí)過程中完全自己選擇教學(xué)內(nèi)容、控制學(xué)習(xí)進度，系統(tǒng)知識負責(zé)將教學(xué)中的各環(huán)節(jié)整合起來，并提供一個統(tǒng)一的用戶界面，用戶界面只是提供了系統(tǒng)中個教學(xué)環(huán)節(jié)的鏈接，而并沒有把各個環(huán)節(jié)進行有機結(jié)合。4.2基于Web挖掘的個性化網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)模型設(shè)計4.2.1系統(tǒng)的運行環(huán)境和主要開發(fā)環(huán)境本系統(tǒng)是基于Web技術(shù)來實現(xiàn)的，所以在編碼設(shè)計中，各模塊應(yīng)該選擇相應(yīng)的技術(shù)來解決。運行環(huán)境為：Windows2003server、IIS6.0、Fram

28、eworkSDK、SQLSERVER2OOO、InternetExplorer等，支持ASP技術(shù)，選擇后臺ADO模塊進行后臺數(shù)據(jù)看SQLServer2OOO，編譯語言可以采用javascript，vbscript。4.2.2構(gòu)建個性化的網(wǎng)絡(luò)學(xué)習(xí)模型“網(wǎng)絡(luò)學(xué)習(xí)個性化推薦”是一個給學(xué)習(xí)者推薦學(xué)習(xí)資源或者學(xué)習(xí)任務(wù)的推薦系統(tǒng)，這些學(xué)習(xí)任務(wù)參考了其他“相似”學(xué)習(xí)者的學(xué)習(xí)模式。網(wǎng)絡(luò)學(xué)習(xí)個性化推薦系統(tǒng)能夠給學(xué)習(xí)者提供特定格式的學(xué)習(xí)資源建議，并最大程度地適應(yīng)學(xué)習(xí)者的個人偏好，學(xué)習(xí)經(jīng)歷和需求。網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)框架個性化數(shù)據(jù)收集來源于信衡息反饋系統(tǒng)。信息反饋系統(tǒng)主要由3個子系統(tǒng)組成:Web日志反饋子系統(tǒng)

29、、用戶數(shù)據(jù)反饋子系統(tǒng)、用戶調(diào)查子系統(tǒng)。個性化信息反饋包括：Web日志反饋、用戶數(shù)據(jù)反饋、用戶調(diào)查反饋。三個反饋子系統(tǒng)根據(jù)相應(yīng)的分析內(nèi)容分別反饋的部分信息，它們從各個角度反映了“個性化網(wǎng)絡(luò)推薦系統(tǒng)”的運行情況，揭示了個性化推薦在網(wǎng)絡(luò)教學(xué)中的重要作用，取得的成績，也揭示了它的不足和有待改善的地方，為個性化推薦的改進提供了重要的依據(jù)。4.2.4網(wǎng)絡(luò)學(xué)習(xí)個性化推薦原型系統(tǒng)結(jié)構(gòu)分析網(wǎng)絡(luò)學(xué)習(xí)個性化推薦系統(tǒng)，運用Web使用挖掘技術(shù)，通過分析學(xué)習(xí)者會話的特征以及學(xué)習(xí)者會話之間的相似性，向?qū)W習(xí)者提供個性化服務(wù)?？偨Y(jié)個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)是信息技術(shù)飛速發(fā)展的體現(xiàn)，是現(xiàn)代遠程教育的追求目標之一，同時也是對傳統(tǒng)教學(xué)方式

30、的改進。個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)不僅能滿足人們終身教育的需求，同時也在這個個性張揚的時代為學(xué)生提供了能夠滿足其個性化需求的學(xué)習(xí)環(huán)境，尊重個性差異，提供實時的、個性化的學(xué)習(xí)模式。本系統(tǒng)以個性化學(xué)習(xí)為基本思想，設(shè)計了一個具有個性化學(xué)習(xí)特點的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)。在系統(tǒng)的設(shè)計過程中，我們根據(jù)教學(xué)內(nèi)容的組織設(shè)計網(wǎng)站的拓撲結(jié)構(gòu)，將學(xué)習(xí)者的興趣度量與站點拓撲結(jié)構(gòu)相結(jié)合。在此我們還有待進一步完善個性化服務(wù)功能模塊使得個性化學(xué)習(xí)效果進一步提高。同時還要注重網(wǎng)站內(nèi)容的充實和優(yōu)化，使得學(xué)習(xí)內(nèi)容更加豐富。總體上來說，個性化的網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的發(fā)展及應(yīng)用將是今后網(wǎng)絡(luò)課程發(fā)展的一個重要趨勢，對于它的研究和設(shè)計涉及程序開發(fā)、教學(xué)設(shè)計、媒

31、體應(yīng)用等多方面的理論和技能，這個領(lǐng)域還存在著廣闊的研究空間。所以基于Web挖掘技術(shù)開發(fā)學(xué)習(xí)系統(tǒng)，有著明朗的前景，它和目前互聯(lián)網(wǎng)的發(fā)展方向是一致的，將融合Web和桌面兩個軟件領(lǐng)域的有點，是軟件技術(shù)發(fā)展的趨勢，它將導(dǎo)致一種新型軟件應(yīng)用的出現(xiàn)，并且改變軟件的構(gòu)造模式。Web挖掘技術(shù)在網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中的應(yīng)用有效的提高了系統(tǒng)的個性化服務(wù)水平,學(xué)習(xí)系統(tǒng)能夠根據(jù)學(xué)生的知識結(jié)構(gòu)、學(xué)習(xí)風(fēng)格進行個性化內(nèi)容的推薦?？梢蕴岣邔W(xué)習(xí)者的學(xué)習(xí)的積極性和主動性。隨著Web挖掘技術(shù)的日趨成熟，在個性化網(wǎng)絡(luò)學(xué)習(xí)中有著廣闊的使用前景。參考文獻游麗貞，郭宇春.Ajax引擎的原理和應(yīng)用J.微計算機信息.2006(2):205-207.段隆振，秦磊，黃龍軍一種基于用戶

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計

文檔簡介

溫馨提示

最新文檔

評論

web網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)設(shè)計

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔