版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
任務七實訓:MapReduce編程一、實驗目的1.1掌握MapReduce的編程方法二、實驗內容2.1在idea中新建一個Maven工程2.2在pom文件中添加依賴添加依賴<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId><version>2.9.2</version></dependency>2.3新建一個class命名為WordCount,importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.fs.Path;
importorg.apache.hadoop.io.IntWritable;
importorg.apache.hadoop.io.Text;
importorg.apache.hadoop.mapreduce.Job;
importorg.apache.hadoop.mapreduce.Mapper;
importorg.apache.hadoop.mapreduce.Reducer;
importorg.apache.hadoop.mapreduce.lib.input.FileInputFormat;
importorg.apache.hadoop.mapreduce.lib.input.TextInputFormat;
importorg.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
importorg.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
importjava.io.IOException;
importjava.util.StringTokenizer;publicclassWordCount{
publicstaticclassMyMapperextendsMapper<Object,Text,Text,IntWritable>{
privateTextword=newText();
privatefinalstaticIntWritableone=newIntWritable(1);
@Override
protectedvoidmap(Objectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{
StringTokenizeritr=newStringTokenizer(value.toString());
while(itr.hasMoreTokens()){
word.set(itr.nextToken());
context.write(word,one);
}
}
}
publicstaticclassMyReducerextendsReducer<Text,IntWritable,Text,IntWritable>{
privateIntWritableresult=newIntWritable();
@Override
protectedvoidreduce(Textkey,Iterable<IntWritable>values,Contextcontext)throwsIOException,InterruptedException{
intsum=0;
for(IntWritableval:values){
sum+=val.get();
}
result.set(sum);
context.write(key,result);
}
}
publicstaticvoidmain(String[]args)throwsIOException,InterruptedException,ClassNotFoundException{
Configurationconf=newConfiguration();
Jobjob=Job.getInstance(conf);
job.setJarByClass(WordCount.class);
job.setJobName("WordCount");
job.setInputFormatClass(TextInputFormat.class);
job.setOutputFormatClass(TextOutputFormat.class);
FileInputFormat.addInputPath(job,newPath(args[0]));
FileOutputFormat.setOutputPath(job,newPath(args[1]));
job.setMapperClass(MyMapper.class);
job.setReducerClass(MyReducer.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(IntWritable.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
job.waitForCompletion(true);
}
}2.4.配置hadoop環(huán)境變量Windows本地解壓Hadoop壓縮包,然后像配置JDK環(huán)境變量一樣在系統(tǒng)環(huán)境變量里配置HADOOP_HOME和path:%HADOOP_HOME\bin%環(huán)境變量。注意:hadoop安裝目錄盡量不要包含空格或者中文字符。2.5.下載hadoop對應版本補丁MapReduce程序在Linux、mac系統(tǒng)中可以直接運行,但無法直接在Windows下運行,因為MapReduce代碼在Windows下運行存在bug,需要添加hadoop補丁才可以。Hadoop補丁下載地址:/cdarlint/winutilsHadoop補丁文件為hadoop.dll和winutils.exe。2.6補丁添加hadoop安裝目錄hadoop補丁文件下載之后,解壓,然后將相應版本中的hadoop.dll和winutils.exe補丁文件,拷貝到{HADOOP_HOME}/bin目錄下(可能需要重啟IDEA)2.6補丁添加windowsc盤目錄如果1.3步驟操作完之后,還無法運行MapReduce程序,則需要將hadoop.dll和winutils.exe補丁文件,拷貝
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年行政車輛租賃合規(guī)合同樣本
- 2024年度健康養(yǎng)生產品銷售結算與市場拓展合同3篇
- 2024年特許經營合同詳細條款與標的
- 2024年版:房屋買賣違約金索賠協(xié)議
- 2024年貨車租賃合同(帶維修責任規(guī)定)
- 2024年紀錄片創(chuàng)作與制作服務合同版B版
- 2024年綠化工程苗木種植養(yǎng)護合同2篇
- 2025年度環(huán)保倉儲倉單質押反擔保服務協(xié)議3篇
- 2024年離婚合同書:女方放棄財產分割版版
- 運維服務能力指標體系
- 英語蘇教版譯林五年級下冊單詞默寫表
- 八年級體育教案(全冊)
- (完整版)非計劃性拔管魚骨圖
- 測繪工程測量技術數(shù)字測圖畢業(yè)設計論文
- 納米技術在中藥領域的應用
- 收貨確認單模版.docx
- 機械設備安裝工程施工和驗收通用規(guī)范標準
- 某火車站雨棚鋼結構施工方案
- 水泵水輪機結構介紹
- 20-5T雙梁橋式起重機設計(全套圖紙)
- 管道閉水試驗記錄表自動計算軟件
評論
0/150
提交評論