分布式存儲 分布式計(jì)算 Java內(nèi)容倉庫標(biāo)準(zhǔn)接口 內(nèi)容管理系統(tǒng) 精準(zhǔn)分析平臺_第1頁
分布式存儲 分布式計(jì)算 Java內(nèi)容倉庫標(biāo)準(zhǔn)接口 內(nèi)容管理系統(tǒng) 精準(zhǔn)分析平臺_第2頁
分布式存儲 分布式計(jì)算 Java內(nèi)容倉庫標(biāo)準(zhǔn)接口 內(nèi)容管理系統(tǒng) 精準(zhǔn)分析平臺_第3頁
分布式存儲 分布式計(jì)算 Java內(nèi)容倉庫標(biāo)準(zhǔn)接口 內(nèi)容管理系統(tǒng) 精準(zhǔn)分析平臺_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 分布式存儲論文:Jackrabbit封裝Hadoop的研究及在內(nèi)容管理系統(tǒng)中的應(yīng)用【中文摘要】論文以目前計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域廣泛討論和應(yīng)用的分布式存儲、分布式計(jì)算和內(nèi)容倉庫標(biāo)準(zhǔn)接口為背景,結(jié)合內(nèi)容管理系統(tǒng)項(xiàng)目,研究如何用Java內(nèi)容倉庫封裝分布式文件系統(tǒng),實(shí)現(xiàn)海量數(shù)據(jù)的存儲與計(jì)算,并實(shí)際應(yīng)用到內(nèi)容管理系統(tǒng)中去。以Jackrabbit作為Java內(nèi)容倉庫的實(shí)現(xiàn),對外暴露統(tǒng)一標(biāo)準(zhǔn)接口,屏蔽底層存儲;存儲層用Hadoop Distributed File System(HDFS)來存取數(shù)據(jù),HDFS作為Hadoop的一部分,是一種分布式文件系統(tǒng),google DFS的Java實(shí)現(xiàn)。為了解決HDFS

2、處理小文件能力不佳的問題,引入HBase來存取小文件,HBase也是Hadoop的一部分,是一種分布式表結(jié)構(gòu),google Big Table的Java實(shí)現(xiàn)。通過一系列測試來確定大小文件的分界點(diǎn),以使系統(tǒng)的存儲性能趨近于最佳。封裝后的系統(tǒng)經(jīng)過性能測試,改進(jìn)了原存儲系統(tǒng)存儲小文件性能較低的情況。分布式計(jì)算框架采用MapReduce, MapReduce是Hadoop的一部分,google MapReduce的Java實(shí)現(xiàn),是一種簡化的分布式編程模式,讓程序自動(dòng)分布到一個(gè)由普通機(jī)器組成的超大集群上并發(fā)執(zhí).【英文摘要】This paper will present the widely discus

3、sed and applied of distributed file system and content repository in computer science and technology field as the background, study how to build the Jackrabbit on Hadoop module. This will be an important part of the realization of the mass data storagecontent management system.The system will use Ja

4、ckrabbit as the implementation of Java Content Repository, which provides standard interfaces to the upper layers, and people dont need to know what the storage laye.【關(guān)鍵詞】分布式存儲 分布式計(jì)算 Java內(nèi)容倉庫標(biāo)準(zhǔn)接口 內(nèi)容管理系統(tǒng) 精準(zhǔn)分析平臺【英文關(guān)鍵詞】HDFS(Hadoop Distributed File System) MapReduce Content Management System Precision A

5、nalysis Platform【索購全文】聯(lián)系Q1:138113721 Q2:139938848【目錄】Jackrabbit封裝Hadoop的研究及在內(nèi)容管理系統(tǒng)中的應(yīng)用摘要4-5ABSTRACT5-6第一章 論文背景9-131.1. 內(nèi)容管理系統(tǒng)9-101.2. 精準(zhǔn)分析平臺10-111.3. Java內(nèi)容倉庫標(biāo)準(zhǔn)接口11-13第二章 Jackrabbit封裝Hadoop的設(shè)計(jì)與實(shí)現(xiàn)13-342.1. 內(nèi)容倉庫標(biāo)準(zhǔn)接口13-152.1.1. JSR-17013-142.1.2. Jackrabbit14-152.2. Hadoop15-192.2.1. HDFS16-182.2.2. Ma

6、pReduce18-192.3. Jackrabbit對底層的封裝19-202.4. Jackrabbit對HDFS的封裝20-292.4.1. JCR內(nèi)容結(jié)構(gòu)20-212.4.2. JCR接口分析21-242.4.3. HBasePersistenceManager的實(shí)現(xiàn)24-262.4.4. HDFSDataStore的實(shí)現(xiàn)26-292.5. Jackrabbit對MapReduce的封裝29-342.5.1. MapReduceManager的實(shí)現(xiàn)29-322.5.2. Action接口的實(shí)現(xiàn)32-34第三章 封裝在內(nèi)容管理系統(tǒng)中的應(yīng)用34-603.1. 寫入文件34-363.2. 其余

7、文件操作36-403.2.1. 讀取文件363.2.2. 刪除文件363.2.3. 修改文件36-373.2.4. 搜索文件37-403.3. 內(nèi)容倉庫40-413.4. 內(nèi)容組織結(jié)構(gòu)41-433.4.1. 采集區(qū)423.4.2. 倉庫區(qū)42-433.4.3. 垃圾區(qū)433.5. 系統(tǒng)存儲性能43-443.6. 存儲層提供接口44-533.6.1. 接口結(jié)構(gòu)44-453.6.2. 元數(shù)據(jù)操作接口45-463.6.3. 內(nèi)容操作接口463.6.4. 內(nèi)容和元數(shù)據(jù)操作接口46-483.6.5. 目錄樹操作接口483.6.6. 產(chǎn)品信息操作接口48-493.6.7. SP信息文件操作接口49-503.6.8. CP信息文件操作接口503.6.9. 角色信息文件操作接口50-513.6.10. 權(quán)限信息文件操作接口513.6.11. 打包內(nèi)容操作接口51-523.6.12. 分發(fā)記錄文件操作接口523.6.13. 內(nèi)容訂單文件操作接口52-533.7. 精準(zhǔn)分析53-593.7.1. 數(shù)據(jù)抽取模塊54-553.7.2.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論