发布于 2020-06-15
摘要
[infobox title=”介绍”] Apache Druid是MetaMarket公司研发,分布式的、支持实时多维 OLAP …
过滤日志及自定义日志输出路径(自定义OutputFormat) [infobox title=”需求分析”] 过滤输入的log日志 …
共同好友计算 以下是好友列表数据,冒号前是一个用户,冒号后是该用户的所有好友(数据中的好友关系是单向的) [infobox tit …
TopN 输出流量使用量在前10的用户信息 [infobox title=”code”] [successbox title=”F …
对数据流的压缩和解压缩 CompressionCodec 有两个方法可以用于轻松地压缩或解压缩数据。要想对正在被写入一个输出流的数 …
日志清洗案例 [infobox title=”简单解析版”] 去除日志中字段长度小于等于11的日志。 [successbox ti …
[infobox title=”系统版本”] [root@iZzmul0jih2lenZ ~]# lsb_release -a L …
[infobox title=”倒排索引案例(多Job串联)”] 有大量的文本(文档、网页),需要建立搜索索引 [successb …