Article

post_img

什么是拉链表

摘要

在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址, …

post_img

数据仓库维度模型设计

摘要

数据仓库维度模型设计 1 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工具箱》,是数 …

post_img

Scala&Java&Python&C# 实现稀疏数组

摘要

稀疏数组是一种压缩后的数组,把具有不同值的元素的行列及值记录在一个小规模的数组中,从而缩小程序的规模 原数组中存在大量的无效数据, …

post_img

SpringMVC概述

摘要

Spring web mvc是表现层的框架,它是Spring框架的一部分,我们可以从Spring的整体结构中看得出来: [info …

post_img

SparkContext详解

摘要

[successbox title=”简介”] SparkContext是spark功能的主要入口。其代表与spark集群的连接, …

post_img

Kettle入门简单解析

摘要

[infobox title=”一、概述”] Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linu …

post_img

Spark-On-Hive

摘要

官网:http://spark.apache.org/docs/latest/sql-data-sources-hive-tabl …