多源數(shù)據(jù)聚合系統(tǒng)及相關(guān)技術(shù)_第1頁
多源數(shù)據(jù)聚合系統(tǒng)及相關(guān)技術(shù)_第2頁
多源數(shù)據(jù)聚合系統(tǒng)及相關(guān)技術(shù)_第3頁
多源數(shù)據(jù)聚合系統(tǒng)及相關(guān)技術(shù)_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、多源數(shù)據(jù)聚合系統(tǒng)及相關(guān)技術(shù) 網(wǎng)絡(luò)技術(shù)的快速發(fā)展使得視頻分享技術(shù)也得到了進(jìn)步,由此在 社會上岀現(xiàn)了一批視頻分享網(wǎng)站。成功的視頻網(wǎng)站往往需要具 備節(jié)目 內(nèi)容豐富和節(jié)目播放流暢的特點(diǎn)。但是現(xiàn)階段一些視頻網(wǎng)站應(yīng)用的都 是B/S結(jié)構(gòu),服務(wù)器自身承載能力和視頻播出流暢性是有限的。為 了提升視頻播放質(zhì)量,在聚集互聯(lián)網(wǎng)各類視頻的基 礎(chǔ)上提出了一種新 型多源數(shù)據(jù)聚合系統(tǒng)。在這個系統(tǒng)上能夠讓用戶瀏覽更多網(wǎng)站的內(nèi) 容,幫助用戶聚合資源,提升視頻播放流暢性。 1多源數(shù)據(jù)聚合系統(tǒng)概述 1.1概要設(shè)計多源數(shù)據(jù)聚合系統(tǒng)建設(shè)的目的是為用戶提供高質(zhì) 量、能夠交互的的媒體播放服務(wù),并在此基礎(chǔ)航完成定向廣告、性化 搜索。多源數(shù)據(jù)聚

2、合p2p流媒體點(diǎn)播系統(tǒng) CloudMedia,是一 個視頻分享網(wǎng)站系統(tǒng),在視頻點(diǎn)播中添加了 p2p技術(shù)。CloudMedia 由爬蟲、視頻網(wǎng)站、客戶端、索引服務(wù)器、視頻網(wǎng)站等共同組成,以 網(wǎng)絡(luò)視頻的形式向用戶展現(xiàn)信息。其中,爬蟲服務(wù)器主要是針 對不 同網(wǎng)站采用不同的方式來播放視頻。索引服務(wù)器主要是用來 索引在線 peer ,實(shí)現(xiàn)對peer地點(diǎn)信息的有效管理。用戶(peer )主要負(fù) 責(zé)的是從其他節(jié)點(diǎn)和網(wǎng)站服務(wù)器中獲取媒體數(shù)據(jù),完成任 務(wù)的調(diào)度操 作、拓?fù)涞木S護(hù)以及緩沖地帶的管理。 1.2工作流程 (1) 爬蟲在視頻網(wǎng)站上獲取加載頁面以及一些相關(guān)節(jié)目的信 息,具體包括縮略圖、評論、簡介等。 (2

3、) 將獲取的數(shù)據(jù)信息在CloudMedia網(wǎng)站上進(jìn)行展現(xiàn)。 (3) 打開用戶客戶端口實(shí)現(xiàn)對網(wǎng)站的訪問。 (4) 用戶結(jié)合自己的需要來選擇播放視頻節(jié)目,F(xiàn)LASH播 放器 將視頻地址發(fā)送給客戶端。 (5) 在播放的時候,用戶點(diǎn)擊視頻節(jié)目,F(xiàn)lash播放器就 會自 動播放視頻。 (6) 客戶端向索引服務(wù)器匯報自己的信息。 (7) 索引服務(wù)器根據(jù)客戶端所在的位置來選擇信息,提升視頻 節(jié)目播放速度。 2多源數(shù)據(jù)聚合系統(tǒng)的詳細(xì)設(shè)計 2. 1系統(tǒng)模塊劃分 多源數(shù)據(jù)的聚合系統(tǒng)模塊劃分如圖1所示。根據(jù)圖發(fā)現(xiàn),爬蟲 和網(wǎng)站模塊公共完成了聚合功能,客戶端和索引服務(wù)器完成相應(yīng)的加 速功能。其中,爬蟲的工作流程是首先

4、輸入一些網(wǎng)頁地址作為起始 數(shù)據(jù)信息,對頁面中的內(nèi)容進(jìn)行分析,結(jié)合需要提取重要的網(wǎng)頁地 址,及時剔除掉和網(wǎng)頁分析算法不相關(guān)的鏈接,保留有意義的鏈 接。在爬蟲系統(tǒng)中,經(jīng)過改進(jìn)之后的系統(tǒng)針對不同的視頻網(wǎng)站設(shè)置 了不同過濾策略,最終獲取視頻播放網(wǎng)頁。門戶網(wǎng)站的工作主要是 將數(shù)據(jù)庫中的節(jié)目展現(xiàn)出來,并加以索引進(jìn)行管 理和引導(dǎo)。 2. 2視頻網(wǎng)站爬蟲模塊 CloudMedia網(wǎng)站會通過爬蟲來獲取網(wǎng)絡(luò)視頻節(jié)目,并實(shí)現(xiàn) 對這 些節(jié)目的分類管理。爬蟲級別低的劃分有以下幾種: 2. 2. 1輕量級爬蟲Spider 輕量級爬蟲Spider將輸入的鏈接作為起點(diǎn),并通過多線程分析 鏈接,最終將鏈接結(jié)果存入到數(shù)據(jù)庫中。S

5、pider是一種多線程的爬 蟲,每個線程操作都需要從等待的隊(duì)列中選擇一個分析隊(duì)列,在下 載文本信息鏈接之后從中獲取有價值的信息。這種爬蟲設(shè)計操作比較 簡單,分析線程數(shù)量無法自動調(diào)整。 2. 2. 2Heritage Heritage是一個開源的網(wǎng)絡(luò)爬蟲,具有很強(qiáng)的可拓展性,由此 在操作的過程中也顯示出其結(jié)構(gòu)的復(fù)雜。Heritage主要包 括數(shù)據(jù)采 集器、資源抽取器、邊界控制器、處理器鏈。其中,數(shù)據(jù)采集器主要 是用來解釋網(wǎng)絡(luò)傳輸協(xié)議。資源抽取器則是對采集 器信息內(nèi)容的一種 解析。 2. 3 Cloud Media 網(wǎng)站模塊 Cloud Media網(wǎng)站是一個動態(tài)化的網(wǎng)站,在應(yīng)用過程中主要是將 數(shù)據(jù)

6、庫中的視頻展現(xiàn)給用戶,并同時具備視頻的分類、搜索、登 錄、評論等功能。 2. 3. ICloud Media 網(wǎng)站設(shè)計 網(wǎng)站的設(shè)計需要應(yīng)用PHP吾言,對系統(tǒng)分類欄目、視頻播放、 用戶信息等都有著明確的顯示。 2.3.2數(shù)據(jù)庫的設(shè)計 Cloud Media網(wǎng)站模塊常見的數(shù)據(jù)表有Crawler和Video Info 表。前者主要是存放爬蟲獲得的鏈接,在表中有代表視頻序號、播放 頁面地址、圖片地址爬蟲下載的標(biāo)識。后者則主要是存放播放頁面的 信息。 2. 4 Cloud Media的客戶端模塊 2.4. 1設(shè)計 Cloud Media客戶端模塊向HTTP服務(wù)器請求數(shù)據(jù)信息,服 務(wù)器 在收到之后會將某一

7、時間點(diǎn)上的數(shù)據(jù)全部發(fā)送過來,并借助P2P的形 式實(shí)現(xiàn)數(shù)據(jù)信息的傳輸。Cloud Media客戶端模塊包括網(wǎng)絡(luò)視頻地 址、網(wǎng)絡(luò)視頻數(shù)據(jù)下載、網(wǎng)絡(luò)視頻壓縮包等??蛻舳嗽谙螺d視頻數(shù)據(jù) 之后,對數(shù)據(jù)視頻進(jìn)行打包操作處理,在打包操作之后將信息發(fā)送 給各個播放器進(jìn)行播放。經(jīng)過HTTP下載的數(shù) 據(jù)信息,需要確定估算時間點(diǎn),進(jìn)而開展P2P數(shù)據(jù)調(diào)度。 2.4.2實(shí)現(xiàn)用戶啟動客戶端的時候會向系統(tǒng)索引服務(wù)器發(fā)出請 求,在連接上索引服務(wù)器之后,向上級匯報自己的節(jié)目信息。如果 客戶端有能夠p2p加速節(jié)點(diǎn),則是可以向這個節(jié)點(diǎn)請求操作。在數(shù)據(jù) 下載的過程中需要檢查播放器操作,借助播放器來播放緩沖區(qū)數(shù)據(jù) 內(nèi)容。 2.5索引服務(wù)器模塊 Cloud Media媒體播放系統(tǒng)需要設(shè)定一個專門的索引服務(wù)器,將 所有的節(jié)點(diǎn)接入到p2p網(wǎng)絡(luò)初始點(diǎn)上。在節(jié)點(diǎn)登錄的時候相索引服 務(wù)器匯報節(jié)點(diǎn)本地緩沖區(qū)的視頻文件信息。在節(jié)點(diǎn)加入頻道觀看節(jié)目 的時候,系統(tǒng)會將所要觀看的節(jié)目信息和具體播放位置發(fā)送到索引服 務(wù)器上,進(jìn)而完成p2p的網(wǎng)絡(luò)過程。 3結(jié)束語 綜上所述,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論