版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
虛擬化與云計(jì)算實(shí)驗(yàn)報(bào)告目錄一、實(shí)驗(yàn)?zāi)康?一、實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)一:1.掌握在Linux上配置iSCSItarget服務(wù)的方法。2.掌握在不同的操作系統(tǒng)平臺上使用iSCSIinitiator的方法。實(shí)驗(yàn)三:1.掌握在集群上(使用虛擬機(jī)模擬)安裝部署Hadoop-HDFS的方法。2.掌握在HDFS運(yùn)行MapReduce任務(wù)的方法3.理解MapReduce編程模型的原理,初步使用MapReduce模型編程。二、實(shí)驗(yàn)內(nèi)容實(shí)驗(yàn)一:配置和使用SAN存儲,設(shè)置連接IPSAN設(shè)備;實(shí)驗(yàn)三:安裝、部署、使用Hadoop-HDFS和配置運(yùn)行MapReduce程序,使用MapReduce編程。三、實(shí)驗(yàn)原理實(shí)驗(yàn)一:SAN(StorageAreaNetwork,存儲局域網(wǎng)絡(luò))的誕生,使存儲空間得到更加充分的利用以及管理更加有效。SAN是一種將存儲設(shè)備、連接設(shè)備和接口集成在一個(gè)高速網(wǎng)絡(luò)中的技術(shù)。SAN本身就是一個(gè)存儲網(wǎng)絡(luò),承擔(dān)了數(shù)據(jù)存儲任務(wù),SAN網(wǎng)絡(luò)與LAN業(yè)務(wù)網(wǎng)絡(luò)相隔離,存儲數(shù)據(jù)流不會占用業(yè)務(wù)網(wǎng)絡(luò)帶寬。在SAN網(wǎng)絡(luò)中,所有的數(shù)據(jù)傳輸在高速、高帶寬的網(wǎng)絡(luò)中進(jìn)行,SAN存儲實(shí)現(xiàn)的是直接對物理硬件的塊級存儲訪問,提高了存儲的性能和升級能力。早期的SAN采用的是光纖通道(FC,F(xiàn)iberChannel)技術(shù),所以,以前的SAN多指采用光纖通道的存儲局域網(wǎng)絡(luò),到了iSCSI協(xié)議出現(xiàn)以后,為了區(qū)分,業(yè)界就把SAN分為FCSAN和IPSAN。iSCSI(互聯(lián)網(wǎng)小型計(jì)算機(jī)系統(tǒng)接口)是一種在TCP/IP上進(jìn)行數(shù)據(jù)塊傳輸?shù)臉?biāo)準(zhǔn)。它是由Cisco和IBM兩家發(fā)起的,并且得到了各大存儲廠商的大力支持。iSCSI可以實(shí)現(xiàn)在IP網(wǎng)絡(luò)上運(yùn)行SCSI協(xié)議,使其能夠在諸如高速千兆以太網(wǎng)上進(jìn)行快速的數(shù)據(jù)存取備份操作。iSCSI標(biāo)準(zhǔn)在2003年2月11日由IETF(互聯(lián)網(wǎng)工程任務(wù)組)認(rèn)證通過。iSCSI繼承了兩大傳統(tǒng)技術(shù):SCSI和TCP/IP協(xié)議。這為iSCSI的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)?;趇SCSI在實(shí)際工作時(shí),是將SCSI命令和數(shù)據(jù)封裝到TCP/IP包中,然后通過IP網(wǎng)絡(luò)進(jìn)行傳輸,具體的工作流程如下:iSCSI系統(tǒng)由SCSI適配器發(fā)送一個(gè)SCSI命令;命令封裝到TCP/IP包中并送入到以太網(wǎng)絡(luò);接收方從TCP/IP包中抽取SCSI命令并執(zhí)行相關(guān)操作;把返回的SCSI命令和數(shù)據(jù)封裝到TCP/IP包中,將它們發(fā)回到發(fā)送方;系統(tǒng)提取出數(shù)據(jù)或命令,并把它們傳回SCSI子系統(tǒng)。實(shí)驗(yàn)三:1.HDFS指的是Hadoop分布式文件系統(tǒng),是根據(jù)Google的GFS的論文,由DougCutting使用Java開發(fā)的開源項(xiàng)目。HDFS本身是Hadoop項(xiàng)目的一部分,為Hadoop提供了底層的數(shù)據(jù)存儲,以供上層的各種實(shí)際應(yīng)用使用(如Map/Reduce)。HDFS是典型的Master/Slave集群架構(gòu),由一個(gè)NameNode和多個(gè)DataNode組成,NameNode只能是一個(gè),扮演著Master的角色,負(fù)責(zé)對具體存儲塊的元數(shù)據(jù)進(jìn)行保存,如某個(gè)存儲塊具體保存在哪個(gè)DataNode上;DataNode可以為多個(gè),扮演著Slave的角色,負(fù)責(zé)對具體的存儲塊進(jìn)行保存,一個(gè)相同的存儲塊根據(jù)配置可以保存到多個(gè)DataNode上,以保持?jǐn)?shù)據(jù)的高可用性??蛻舳伺cHDFS交互時(shí),典型的,會先詢問NameNode具體的存儲塊在哪個(gè)DataNode上,然后客戶端會直接聯(lián)系相應(yīng)的DataNode,來獲取或?qū)懭霐?shù)據(jù)。各個(gè)DataNode會定時(shí)發(fā)送心跳至NameNode,以便NameNode了解DataNode的可用狀態(tài)及存儲狀態(tài),這樣可以保證某一個(gè)DataNode掛掉,NameNode可以做相應(yīng)處理,以保證數(shù)據(jù)的高可用性。HDFS的目標(biāo)就是使用大量的廉價(jià)PC機(jī),來維護(hù)海量的大數(shù)據(jù)塊,并且保證數(shù)據(jù)的高可用性,并且HDFS集群會隨著更多PC機(jī)的加入,而提高數(shù)據(jù)的存儲量(當(dāng)然這與具體環(huán)境的硬盤相關(guān))與吞吐量(當(dāng)然這與具體環(huán)境的網(wǎng)卡帶寬相關(guān)),單個(gè)Hadoop集群一般最大可達(dá)2000個(gè)節(jié)點(diǎn)。2.MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。概念"Map(映射)"和"Reduce(化簡)",和他們的主要思想,都是從函數(shù)式編程語言里借來的,還有從矢量編程語言里借來的特性。他極大地方便了編程人員在不會分布式并行編程的情況下,將自己的程序運(yùn)行在分布式系統(tǒng)上。當(dāng)前的軟件實(shí)現(xiàn)是指定一個(gè)Map(映射)函數(shù),用來把一組鍵值對映射成一組新的鍵值對,指定并發(fā)的Reduce(化簡)函數(shù),用來保證所有映射的鍵值對中的每一個(gè)共享相同的鍵組。四、實(shí)驗(yàn)步驟及實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)一:實(shí)驗(yàn)場景:Linux環(huán)境(本次實(shí)驗(yàn)使用的是Ubuntu11.04操作系統(tǒng))安裝iSCSIinitiator軟件實(shí)驗(yàn)方式:兩人一組,我在小組中擔(dān)任客戶端角色。實(shí)驗(yàn)詳細(xì)步驟見實(shí)驗(yàn)一手冊,下面為實(shí)驗(yàn)關(guān)鍵結(jié)果截圖和實(shí)驗(yàn)中的新發(fā)現(xiàn):1.登錄到iSCSItarget上2.檢查硬盤情況,此時(shí)應(yīng)該增加了一塊新的硬盤:fdisk–l(結(jié)果)預(yù)期實(shí)驗(yàn)結(jié)果和實(shí)際結(jié)果相同,增加了一塊新的硬盤,只是中間在連接時(shí)出現(xiàn)了問題,后通過修改節(jié)點(diǎn)信息解決了問題,把之前的絕對路徑改為簡單的字符串,即圖中的my。實(shí)驗(yàn)三:實(shí)驗(yàn)場景:Linux環(huán)境(本次實(shí)驗(yàn)使用的是Ubuntu11.04操作系統(tǒng))JDK、Openssh-Cilent、Openssh-server、Hadoop、eclipse和hadooppluginforeclipse實(shí)驗(yàn)方式:兩人一組,部署多機(jī)Hadoop-HDFS,并且兩人之間變換Master、Slaver角色。實(shí)驗(yàn)詳細(xì)步驟見實(shí)驗(yàn)三手冊,下面為實(shí)驗(yàn)關(guān)鍵結(jié)果截圖和實(shí)驗(yàn)中的新發(fā)現(xiàn):1.配置SSH之后發(fā)現(xiàn)無法互聯(lián),通過查詢從網(wǎng)上搜到一些相關(guān)的文檔,操作如下:不僅解決了成員互聯(lián)問題,而且可以設(shè)置驗(yàn)證碼,完善了功能。2.安裝部署單機(jī)偽分布式模式Hadoop-HDFS格式化HDFS并啟動Hadoop,啟動后可使用命令jps查看已啟動進(jìn)程jps結(jié)果如下圖所示3.在單機(jī)偽分布模式下運(yùn)行wordcount例子(結(jié)果1)將輸出文件從分布式文件系統(tǒng)拷貝到本地文件系統(tǒng)查看4.安裝部署多機(jī)Hadoop-HDFS(2-3人為一組,每人需要變換Master、Slaver角色,假設(shè)2臺機(jī)器組成集群,Master節(jié)點(diǎn)為namenode,Slaver節(jié)點(diǎn)為datanode)首先簡要地介紹集群環(huán)境集群環(huán)境中有兩個(gè)結(jié)點(diǎn),其中1個(gè)namenode相當(dāng)于Master,1個(gè)datanode相當(dāng)于Slaver,它們之間分布在局域網(wǎng)中,相互之間可以ping通。具體的IP地址為:namenode:5datanode:30實(shí)驗(yàn)開始我是作為datanode,之后互換角色為namenode,為了節(jié)省篇幅,下面將兩次的配置歸并在一起,既包括namenode的配置也包括datanode的配置。配置jobtrackermasters文件配置:30(加入namenode的IP地址)slaves文件配置:5(加入datanode的IP地址)在多機(jī)模式下運(yùn)行wordcount例子,結(jié)果和單機(jī)偽并行一樣,可參照單機(jī)的結(jié)果。5.安裝eclipse和hadooppluginforeclipse建立wordcount工程,編譯示例程序wordcount.java,打包相關(guān)class文件,在Hadoop分布式環(huán)境下(偽分布模式或者多機(jī)模式均可)運(yùn)行自己打包的wordcount,結(jié)果如下(結(jié)果2):編寫的MapReduce程序執(zhí)行結(jié)果如下(結(jié)果3):選取頁面介紹頁面1(來自實(shí)驗(yàn)一):實(shí)現(xiàn)了客戶端和服務(wù)端共享存儲。頁面2(來自實(shí)驗(yàn)三):Master(namenode)和Slaver(datanode)在建立連接之后,Master向Slaver復(fù)制數(shù)據(jù)。頁面3(來自實(shí)驗(yàn)三):在namenode中執(zhí)行jps,分別列出JobTracker、Jps、SecondaryNamenode和Namenode的對應(yīng)進(jìn)程號;在datanode中執(zhí)行jps,分別列出Datanode、Jps和TaskTracker的進(jìn)程號。頁面4(來自實(shí)驗(yàn)三):運(yùn)行Hadoop自帶的wordcount例子實(shí)驗(yàn)一預(yù)期花費(fèi)時(shí)間3h,實(shí)際花費(fèi)時(shí)間5h實(shí)驗(yàn)三預(yù)期花費(fèi)時(shí)間6h,實(shí)際花費(fèi)時(shí)間12h五、實(shí)驗(yàn)遇到的問題及其解決方法實(shí)驗(yàn)一:客戶端在連接iSCSItarget時(shí)失敗,之后服務(wù)端通過修改/etc/iet/ietd.conf文件中節(jié)點(diǎn)的信息,把之前的絕對路徑改為簡單的字符串就解決了問題。實(shí)驗(yàn)三:1.在部署單機(jī)偽分布式模式Hadoop-HDFS時(shí),通過JPS指令未發(fā)現(xiàn)DataNode,通過上網(wǎng)查詢資料了解到,原因是由于進(jìn)行操作時(shí)使用的是Root身份,系統(tǒng)默認(rèn)會加上-jvm指令導(dǎo)致錯誤,可以通過切換至普通用戶或修改/bin/hadoop文件來解決問題。2.小組兩人無法通過SSH無密碼方式訪問對方,通過查詢上網(wǎng)查閱資料,發(fā)現(xiàn)對密鑰的指令認(rèn)識不夠全面,學(xué)習(xí)了一些新的指令操作,在解決問題之外還學(xué)會了設(shè)置用戶驗(yàn)證的方法,增強(qiáng)了訪問的安全性。3.我和同學(xué)經(jīng)過很多方法之后始終無法部署多機(jī)Hadoop-HDFS,后來發(fā)現(xiàn)原因是在之前的操作中,我們是通過新建一個(gè)共同的用戶名來保證所有參與集群的機(jī)器有相同的用戶名,但是實(shí)際上我們應(yīng)該在安裝Ubuntu時(shí)設(shè)置同一用戶名,這樣所有的集群部署問題就迎刃而解了。4.在設(shè)計(jì)mapreduce程序時(shí),遇到無法將key值按從大到小輸出以及無法將key和value交換位置輸出的問題,后來是通過InverseMapper.class可以交換key和value,并修改IntWritable.Comparator使得可以按從大到小輸出<key,value>對。六、實(shí)驗(yàn)結(jié)論實(shí)驗(yàn)感想:實(shí)驗(yàn)一相對而言步驟比較簡單,但是通過進(jìn)行實(shí)驗(yàn)一的操作,復(fù)習(xí)了linux的常用指令,為進(jìn)行實(shí)驗(yàn)三打下了基礎(chǔ)。實(shí)驗(yàn)三的步驟比較復(fù)雜,實(shí)現(xiàn)的模塊和功能也比較多,因此在操作中遇到了很多問題。由于對于實(shí)驗(yàn)內(nèi)容大家都不是特別了解,所以解決問題的方式主要是通過上網(wǎng)查閱資料。但是在嘗試不同解決方案后,導(dǎo)致系統(tǒng)出現(xiàn)混亂,使得已經(jīng)完成的結(jié)果也無法顯示,最后不得不重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 手足口病的癥狀預(yù)防和護(hù)理
- 汽車制造配件采購員招聘協(xié)議
- 醫(yī)院夜班醫(yī)師聘用合同
- 野外探險(xiǎn)用車租賃合同樣本
- 智能化工程合作合同協(xié)議書
- 科學(xué)實(shí)驗(yàn)室兼職講師合同
- 排球場維修圍擋施工合同
- 蘇寧租賃合同:辦公設(shè)備租賃協(xié)議
- 資產(chǎn)管理合同管理準(zhǔn)則文本
- 招投標(biāo)業(yè)務(wù)培訓(xùn)與合同管理課件
- 萬科物業(yè)崗位說明書2
- 音樂教學(xué)說課
- 邊坡噴錨施工方案全套資料
- 國家安全教育知到章節(jié)答案智慧樹2023年臨沂職業(yè)學(xué)院
- 檢驗(yàn)科生化項(xiàng)目臨床意義ppt課件-生化室項(xiàng)目臨床意義ppt
- 2023深圳中考英語試題及答案解析
- 精神病合并高血壓病人護(hù)理
- 新東方英語背誦美文30篇
- 新課標(biāo)人教統(tǒng)編版高中語文選擇性必修中冊第一單元全單元教案教學(xué)設(shè)計(jì)(含單元研習(xí)任務(wù))
- 自學(xué)考試-計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)(全國)
- 極地特快中英文臺詞打印版
評論
0/150
提交評論