post_img

什么是退化维度?(Degenerate Dimensions)

摘要

退化维度的维度表可以被剔除,从而简化维度数据仓库的模式。因为简单的模式比复杂的更容易理解,也有更好的查询性能。 当一个维度没有数据 …

post_img

什么是拉链表

摘要

在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址, …

post_img

数据仓库维度模型设计

摘要

数据仓库维度模型设计 1 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工具箱》,是数 …

post_img

SparkContext详解

摘要

[successbox title=”简介”] SparkContext是spark功能的主要入口。其代表与spark集群的连接, …

post_img

Kettle入门简单解析

摘要

[infobox title=”一、概述”] Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linu …

post_img

Spark-On-Hive

摘要

官网:http://spark.apache.org/docs/latest/sql-data-sources-hive-tabl …