post_img

SparkSQL入门详解

摘要

[infobox title=”什么是SparkSQL?”] 用于处理结构化数据的Spark模块。 可以通过DataFrame和D …

post_img

Spark 入门详解 β

摘要

[successbox title=”rdd数据持久化”] redis数据持久化什么作用??(将内存中的数据写入到硬盘中,进行永久 …

post_img

Scala入门详解

摘要

[successbox title=”scala简介”] scala是运行在JVM上的多范式(多种编程方法)编程语言,同时支持面向 …

post_img

HBase的java代码开发

摘要

熟练掌握通过使用java代码实现HBase数据库当中的数据增删改查的操作,特别是各种查询,熟练运用 第一步:创建maven工程,导 …

post_img

Apache ZooKeeper 集群搭建

摘要

Zookeeper是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题。 ZooKeeper本质上是一个分 …

post_img

Apache Hue的安装

摘要

[dangerbox title=”Hue是什么”]HUE=Hadoop User Experience Hue是一个开源的Apa …

post_img

Hadoop Flume搭建

摘要

[dangerbox title=”flume是什么”] apache Flume 是一个从可以收集例如日志,事件等数据资源,并将 …