post_img

Hive提高查询性能的方法

摘要

[infobox title=”使用分区”] 通过创建分区表,数据存储在 HDFS 上的单独文件夹中。 Hive 将查询分区数据集 …

post_img

数据仓库维度模型设计

摘要

数据仓库维度模型设计 1 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工具箱》,是数 …

post_img

Spark-On-Hive

摘要

官网:http://spark.apache.org/docs/latest/sql-data-sources-hive-tabl …

post_img

Hive入门详解

摘要

[successbox title=”什么是HIVE”] Hive是一个语句Hadoop的一个数据仓库工具,是将结构化数据文件映射 …

post_img

HIVE HWI 搭建过程

摘要

众所周知,Hive有三种使用方式:CLI、HWI浏览器、Thrift客户端。安装配置完Hive后无需进行额外操作即可使用CLI。但 …

post_img

Hive中使用 with as 优化SQL

摘要

背景: 当我们书写一些结构相对复杂的SQL语句时,可能某个子查询在多个层级多个地方存在重复使用的情况,这个时候我们可以使用 wit …