post_img

Apache Parquet 干货分享

摘要

Parquet 是一种面向分析的、通用的列式存储格式,兼容各种数据处理框架比如 Spark、Hive、Impala 等,同时支持 …

post_img

Hive提高查询性能的方法

摘要

[infobox title=”使用分区”] 通过创建分区表,数据存储在 HDFS 上的单独文件夹中。 Hive 将查询分区数据集 …