标签: Hadoop
-
MapReduce高级案例 ①
[infobox title=”倒排索引案例(多Job串联)”] 有大量的文本(文档、…
-
Apache Parquet 干货分享
Parquet 是一种面向分析的、通用的列式存储格式,兼容各种数据处理框架比如 Spark、Hive、Impa…
-
Centos7下Apache Hadoop 3.2.1伪分布式部署安装
[infobox title=”前置配置”] nmtui 静态IP配置,host配置 …
-
解决对HDFS文件系统操作权限不够的问题
HDFS文件系统的目录基本都属于supergroup用户组,所以就把用户添加到该用户组,即可解决很多权限问题,…
-
Yarn知识点整理
1、什么是Yarn 通用资源管理系统和调度平台 2、Yarn特点: 支持多计算框架 资源利用率高,运行成本低,…
-
Hadoop High Availability 高可用
一、 Hadoop High Availability HA(High Available), 高可用,是保证…
-
Hadoop Flume搭建
[dangerbox title=”flume是什么”] apache Flume 是…
-
Sqoop导入导出常见错误
[dangerbox title=”1.Sqoop导入数据到HDFS\HIVE报错 Hive ex…
-
Apache Sqoop搭建
一、简介 Apache Sqoop是在Hadoop生基金会提供 核心的功能有两个: 导入、迁入 导出、迁出 导…
-
hadoop MapReduce自定义分区
[successbox title=”背景”] 在Hadoop的MapReduce过程…