post_img

Hive提高查询性能的方法

摘要

[infobox title=”使用分区”] 通过创建分区表,数据存储在 HDFS 上的单独文件夹中。 Hive 将查询分区数据集 …

post_img

什么是拉链表

摘要

在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址, …

post_img

Spark-On-Hive

摘要

官网:http://spark.apache.org/docs/latest/sql-data-sources-hive-tabl …

post_img

Hive入门详解

摘要

[successbox title=”什么是HIVE”] Hive是一个语句Hadoop的一个数据仓库工具,是将结构化数据文件映射 …

post_img

HIVE HWI 搭建过程

摘要

众所周知,Hive有三种使用方式:CLI、HWI浏览器、Thrift客户端。安装配置完Hive后无需进行额外操作即可使用CLI。但 …

post_img

Hive中使用 with as 优化SQL

摘要

背景: 当我们书写一些结构相对复杂的SQL语句时,可能某个子查询在多个层级多个地方存在重复使用的情况,这个时候我们可以使用 wit …