任務7實訓:MapReduce編程_第1頁
任務7實訓:MapReduce編程_第2頁
任務7實訓:MapReduce編程_第3頁
任務7實訓:MapReduce編程_第4頁
任務7實訓:MapReduce編程_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

任務七實訓:MapReduce編程一、實驗目的1.1掌握MapReduce的編程方法二、實驗內容2.1在idea中新建一個Maven工程2.2在pom文件中添加依賴添加依賴<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId><version>2.9.2</version></dependency>2.3新建一個class命名為WordCount,importorg.apache.hadoop.conf.Configuration;

importorg.apache.hadoop.fs.Path;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.mapreduce.Job;

importorg.apache.hadoop.mapreduce.Mapper;

importorg.apache.hadoop.mapreduce.Reducer;

importorg.apache.hadoop.mapreduce.lib.input.FileInputFormat;

importorg.apache.hadoop.mapreduce.lib.input.TextInputFormat;

importorg.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

importorg.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

importjava.io.IOException;

importjava.util.StringTokenizer;publicclassWordCount{

publicstaticclassMyMapperextendsMapper<Object,Text,Text,IntWritable>{

privateTextword=newText();

privatefinalstaticIntWritableone=newIntWritable(1);

@Override

protectedvoidmap(Objectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{

StringTokenizeritr=newStringTokenizer(value.toString());

while(itr.hasMoreTokens()){

word.set(itr.nextToken());

context.write(word,one);

}

}

}

publicstaticclassMyReducerextendsReducer<Text,IntWritable,Text,IntWritable>{

privateIntWritableresult=newIntWritable();

@Override

protectedvoidreduce(Textkey,Iterable<IntWritable>values,Contextcontext)throwsIOException,InterruptedException{

intsum=0;

for(IntWritableval:values){

sum+=val.get();

}

result.set(sum);

context.write(key,result);

}

}

publicstaticvoidmain(String[]args)throwsIOException,InterruptedException,ClassNotFoundException{

Configurationconf=newConfiguration();

Jobjob=Job.getInstance(conf);

job.setJarByClass(WordCount.class);

job.setJobName("WordCount");

job.setInputFormatClass(TextInputFormat.class);

job.setOutputFormatClass(TextOutputFormat.class);

FileInputFormat.addInputPath(job,newPath(args[0]));

FileOutputFormat.setOutputPath(job,newPath(args[1]));

job.setMapperClass(MyMapper.class);

job.setReducerClass(MyReducer.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

job.waitForCompletion(true);

}

}2.4.配置hadoop環(huán)境變量Windows本地解壓Hadoop壓縮包,然后像配置JDK環(huán)境變量一樣在系統(tǒng)環(huán)境變量里配置HADOOP_HOME和path:%HADOOP_HOME\bin%環(huán)境變量。注意:hadoop安裝目錄盡量不要包含空格或者中文字符。2.5.下載hadoop對應版本補丁MapReduce程序在Linux、mac系統(tǒng)中可以直接運行,但無法直接在Windows下運行,因為MapReduce代碼在Windows下運行存在bug,需要添加hadoop補丁才可以。Hadoop補丁下載地址:/cdarlint/winutilsHadoop補丁文件為hadoop.dll和winutils.exe。2.6補丁添加hadoop安裝目錄hadoop補丁文件下載之后,解壓,然后將相應版本中的hadoop.dll和winutils.exe補丁文件,拷貝到{HADOOP_HOME}/bin目錄下(可能需要重啟IDEA)2.6補丁添加windowsc盤目錄如果1.3步驟操作完之后,還無法運行MapReduce程序,則需要將hadoop.dll和winutils.exe補丁文件,拷貝

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論