TeRiTeRi

大数据
Oozie

群集中管理数据处理作业的工作流协调服务之Apache Oozie

2020年6月2日 0条评论 1598点热度 0人点赞 kamisamak 阅读全文
Hadoop

Apache Tez 编译、安装、配置、运行

[hide reply_to_this="true"][/hide]

2020年5月29日 0条评论 1606点热度 0人点赞 kamisamak 阅读全文
CDH

Cloudera CDH 6.3.2 Centos7离线安装

CDH,全称Cloudera's Distribution, including Apache Hadoop。是Hadoop众多分支中对应中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,提供了Hadoop的核心(可扩展存 储、分布式计算),最为重要的是提供基于web的用户界面。 CDH的优点:版本划分清晰,更新速度快,支持Kerberos安全认证,支持多种安装方式(如Yum、rpm等)。 CDH分为Cloudera Manager管理平台和CDH parcel(parcel包含各种组…

2020年5月22日 9条评论 5199点热度 0人点赞 kamisamak 阅读全文
linux

centos7上部署Spark 2.4.5集群

2020年5月19日 0条评论 1827点热度 0人点赞 kamisamak 阅读全文
Hadoop

Apache Parquet 干货分享

Parquet 是一种面向分析的、通用的列式存储格式,兼容各种数据处理框架比如 Spark、Hive、Impala 等,同时支持 Avro、Thrift、Protocol Buffers 等数据模型。Parquet 作为 HDFS 存储格式的事实标准,经常用在离线数仓、OLAP 等场景。本文整理于最近的一次公司内训,主要分四个部分:1、Parquet 简介 2、架构解析 3、基本操作 4、TPC-DS 基准测试介绍 Parquet 简介 第一部分内容介绍了此次 Parquet 分享的技术背景,行存与列存的区别,以及…

2020年5月19日 0条评论 1971点热度 0人点赞 kamisamak 阅读全文
SkyWalking

Apache SkyWalking 分布式追踪系统部署

2020年5月19日 0条评论 1611点热度 0人点赞 kamisamak 阅读全文
Kylin

Kylin 在cube Build时报错10020拒绝链接错误

org.apache.kylin.engine.mr.exception.MapReduceException: Exception: java.net.ConnectException: Call From node01/192.168.199.171 to node01:10020 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see: http://wiki.apache.org/hadoop…

2020年5月18日 0条评论 1360点热度 0人点赞 kamisamak 阅读全文
Spark

不会这20道基础题,能说了解Spark么

2020年5月16日 0条评论 1877点热度 0人点赞 kamisamak 阅读全文
Hive

Hive提高查询性能的方法

 

2020年5月14日 0条评论 1669点热度 0人点赞 kamisamak 阅读全文
Kylin

Apache Kylin麒麟 on hbase 入门安装

2020年5月14日 0条评论 2249点热度 0人点赞 kamisamak 阅读全文
12345…10
RevolverMaps

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang