Article

post_img

SparkSQL入门详解

摘要

[infobox title=”什么是SparkSQL?”] 用于处理结构化数据的Spark模块。 可以通过DataFrame和D …

post_img

Spark 入门详解 β

摘要

[successbox title=”rdd数据持久化”] redis数据持久化什么作用??(将内存中的数据写入到硬盘中,进行永久 …

post_img

Hive入门详解

摘要

[successbox title=”什么是HIVE”] Hive是一个语句Hadoop的一个数据仓库工具,是将结构化数据文件映射 …

post_img

Spark 入门详解 α

摘要

[warningbox title=”什么是Spark”] spark是基于内存的用于大规模数据处理(离线计算、实时计算、快速查询 …

post_img

Scala入门详解

摘要

[successbox title=”scala简介”] scala是运行在JVM上的多范式(多种编程方法)编程语言,同时支持面向 …

post_img

Kafka安装部署与代码

摘要

Kafka安装部署 前置:jdk/zookeeper安装部署,并能正常启动。 #文件解压 tar zxvf kafka_2.11- …

post_img

Kafka笔记

摘要

企业中离线业务场景实时业务场景都需要使用到kafka Kafka具备数据的计算能力和存储能力,但是两个能力相对(MR/SPARK, …

post_img

Kafka知识点总结

摘要

Kafka知识点总结 Kafka生态系统四大角色,生产者(Producer)、kafka集群(Broker)、消费者(Consum …

post_img

Yarn知识点整理

摘要

1、什么是Yarn 通用资源管理系统和调度平台 2、Yarn特点: 支持多计算框架 资源利用率高,运行成本低,数据共享。 &nbs …