TeRiTeRi

  1. 首页
  2. 大数据
  3. Hadoop
  4. 正文

Hadoop MapReduce 部分代码操作

2019年11月18日 1581点热度 1人点赞 0条评论

map中获取文件名

//获取数据所属文件名
FileSplit fis = (FileSplit) context.getInputSplit();
String fileName = fis.getPath().getName();
context.write(new Text(fileName), value); 

压缩文件snappy  Driver中Configuration按以下设置

//设置map使用的压缩算法
conf.set("mapreduce.map.output.compress","true");
conf.set("mapreduce.map.output.compress.codec","org.apache.hadoop.io.compress.SnappyCodec");
//设置reduce使用的压缩算法
conf.set("mapreduce.output.fileoutputformat.compress","true");
conf.set("mapreduce.output.fileoutputformat.compress.type","RECORD");
conf.set("mapreduce.output.fileoutputformat.compress.codec","org.apache.hadoop.io.compress.SnappyCodec");


标签: centos Hadoop Java linux
最后更新:2019年11月18日

kamisamak

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

razz evil exclaim smile redface biggrin eek confused idea lol mad twisted rolleyes wink cool arrow neutral cry mrgreen drooling persevering
取消回复

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang