post_img

mapreduce高级案例⑥

摘要

过滤日志及自定义日志输出路径(自定义OutputFormat) [infobox title=”需求分析”] 过滤输入的log日志 …

post_img

MapReduce高级案例⑤

摘要

共同好友计算 以下是好友列表数据,冒号前是一个用户,冒号后是该用户的所有好友(数据中的好友关系是单向的) [infobox tit …

post_img

MapReduce高级案例③

摘要

对数据流的压缩和解压缩 CompressionCodec 有两个方法可以用于轻松地压缩或解压缩数据。要想对正在被写入一个输出流的数 …

post_img

MapReduce高级案例②

摘要

日志清洗案例 [infobox title=”简单解析版”] 去除日志中字段长度小于等于11的日志。 [successbox ti …

post_img

MapReduce高级案例 ①

摘要

[infobox title=”倒排索引案例(多Job串联)”] 有大量的文本(文档、网页),需要建立搜索索引 [successb …