Article

post_img

Hive提高查询性能的方法

摘要

[infobox title=”使用分区”] 通过创建分区表,数据存储在 HDFS 上的单独文件夹中。 Hive 将查询分区数据集 …

post_img

MongoDB基本概念和原理

摘要

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展 的高性能数据存储解决方案。 Mong …

post_img

MongoDB基本概念和原理

摘要

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展 的高性能数据存储解决方案。 Mong …

post_img

什么是退化维度?(Degenerate Dimensions)

摘要

退化维度的维度表可以被剔除,从而简化维度数据仓库的模式。因为简单的模式比复杂的更容易理解,也有更好的查询性能。 当一个维度没有数据 …