centos – TeRiTeRi

发布于 2020-05-19

1928 热度无~ linux

centos7上部署Spark 2.4.5集群

摘要

[infobox title=”集群规划”] 节点名称 IP Zookeeper Master Worker node21 19 …

发布于 2020-05-10

1829 热度 2 条评论 Hadoop

Centos7下Apache Hadoop 3.2.1伪分布式部署安装

摘要

[infobox title=”前置配置”] nmtui 静态IP配置，host配置 ssh本机免密登录 ssh-keygen s …

发布于 2020-04-15

1931 热度无~ Hadoop

解决对HDFS文件系统操作权限不够的问题

摘要

HDFS文件系统的目录基本都属于supergroup用户组，所以就把用户添加到该用户组，即可解决很多权限问题，例如连接Hive却无 …

发布于 2020-04-10

2118 热度无~ Hive

Hive入门详解

摘要

[successbox title=”什么是HIVE”] Hive是一个语句Hadoop的一个数据仓库工具，是将结构化数据文件映射 …

发布于 2020-04-10

2145 热度 1 评论 Spark

Spark 入门详解 α

摘要

[warningbox title=”什么是Spark”] spark是基于内存的用于大规模数据处理(离线计算、实时计算、快速查询 …

发布于 2020-03-30

1877 热度无~ Kafka

Kafka安装部署与代码

摘要

Kafka安装部署前置：jdk/zookeeper安装部署，并能正常启动。 #文件解压 tar zxvf kafka_2.11- …

发布于 2020-03-30

1838 热度无~ Kafka

Kafka笔记

摘要

企业中离线业务场景实时业务场景都需要使用到kafka Kafka具备数据的计算能力和存储能力，但是两个能力相对（MR/SPARK， …

发布于 2020-03-30

1702 热度无~ Kafka

Kafka知识点总结

摘要

Kafka知识点总结 Kafka生态系统四大角色，生产者(Producer)、kafka集群(Broker)、消费者(Consum …

发布于 2020-03-30

1721 热度无~ Hadoop

Yarn知识点整理

摘要

1、什么是Yarn 通用资源管理系统和调度平台 2、Yarn特点：支持多计算框架资源利用率高，运行成本低，数据共享。 &nbs …

发布于 2020-03-30

1939 热度无~ Java

Redis数据库操作

摘要

1、redis当中对字符串string的操作下表列出了常用的 redis 字符串命令 [success] CRUD 功能示例 …