TeRiTeRi

大数据
Hive

hive大量数据导入分区表时过慢优化

2019年12月25日 0条评论 1930点热度 2人点赞 kamisamak 阅读全文
Hadoop

使用bulkload的方式将数据直接生成HFile格式时报错异常问题

HBase与MapReduce的集成中使用bulkload的方式将数据直接生成HFile格式时报错  

2019年12月19日 0条评论 1923点热度 0人点赞 kamisamak 阅读全文
Hbase

HBase 搭建

2019年12月11日 0条评论 1848点热度 0人点赞 kamisamak 阅读全文
Impala

Apache Impala安装部署

 

2019年12月10日 0条评论 2044点热度 0人点赞 kamisamak 阅读全文
Zookeeper

Apache ZooKeeper 集群搭建

Zookeeper是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题。 ZooKeeper本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。    

2019年12月10日 0条评论 1937点热度 0人点赞 kamisamak 阅读全文
Azkaban

Azkaban solo-server模式 安装部署

2019年12月6日 0条评论 1803点热度 0人点赞 kamisamak 阅读全文
Hue

Apache Hue的安装

2019年12月6日 0条评论 1786点热度 1人点赞 kamisamak 阅读全文
Flume

Hadoop Flume搭建

     

2019年12月5日 0条评论 1251点热度 0人点赞 kamisamak 阅读全文
ETL

Sqoop导入导出常见错误

2019年12月5日 0条评论 1996点热度 0人点赞 kamisamak 阅读全文
ETL

Apache Sqoop搭建

一、简介 Apache Sqoop是在Hadoop生基金会提供 核心的功能有两个: 导入、迁入 导出、迁出 导入数据:MySQL,Oracle 导入数据到 Hadoop 的 HDFS、HIVE、HBASE 等数据存储系统 导出数据:从 Hadoop 的文件系统中导出数据到关系数据库 mysql 等 Sqoop 的本质还是一个命令行工具,和 HDFS,Hive 相比,并没有什么高深的理论 Sqoop工作机制: 是将导入或导出命令翻译成mapreduce程序来实现;在翻译出的mapreduce中主要是对inputfor…

2019年12月2日 0条评论 1845点热度 0人点赞 kamisamak 阅读全文
1…678910
RevolverMaps

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang