TeRiTeRi

Spark
Java

Spark 各项代码示例

           

2020年4月23日 0条评论 1488点热度 0人点赞 kamisamak 阅读全文
Spark

Spark 知识点总结

什么是Spark 基于内存的,用于大规模数据处理(离线计算、实时计算、快速查询(交互式查询))的统一分析引擎。 Spark特点 快: Spark计算速度是MapReduce计算速度的10-100倍 易用:(算法多) MR支持1种计算模型,Spsark支持更多的计算模型。 通用: Spark 能够进行离线计算、交互式查询(快速查询)、实时计算、机器学习、图计算等 兼容性: Spark支持大数据中的Yarn调度,支持mesos。可以处理hadoop计算的数据。 Spark运行模式 1.local本地模式(单机)--开发…

2020年4月20日 0条评论 985点热度 1人点赞 kamisamak 阅读全文
Scala

Spark Structured Streaming UDAF使用实例

class AreaClickUDAF extends UserDefinedAggregateFunction { // 输入数据的类型: 北京 String override def inputSchema: StructType = { StructType(StructField("city_name", StringType) :: Nil) // StructType(Array(StructField("city_name", StringType))) } // 缓存的数据的类型: 北京->1…

2020年4月19日 0条评论 1537点热度 0人点赞 kamisamak 阅读全文
mysql

Spark Structured Streaming从kafka读数据 并进行wordcount 更新写入mysql

def main(args: Array[String]): Unit = { val sparkSession: SparkSession = SparkSession.builder().master("local[*]").appName("wula").getOrCreate() val sparkContext: SparkContext = sparkSession.sparkContext sparkContext.setLogLevel("warn") val kafkaDF: DataFrame …

2020年4月18日 0条评论 1849点热度 1人点赞 kamisamak 阅读全文
Scala

Structured Streaming 入门详解

2020年4月16日 0条评论 1706点热度 0人点赞 kamisamak 阅读全文
Scala

Spark Streaming入门详解

2020年4月16日 0条评论 1722点热度 0人点赞 kamisamak 阅读全文
Spark

记录一次Spark-Task not serializable异常 2020.04.16

 

2020年4月16日 0条评论 1789点热度 0人点赞 kamisamak 阅读全文
Java

Spark基础练习题分享 ①

2020年4月15日 0条评论 1516点热度 0人点赞 kamisamak 阅读全文
Scala

SparkSQL入门详解

//--------------------------------------------------------------------------------------------------------------------- //--------------------------------------------------------------------------------------------------------------------- [collapse title="开窗函…

2020年4月11日 0条评论 1943点热度 0人点赞 kamisamak 阅读全文
Scala

Spark 入门详解 β

2020年4月11日 0条评论 1702点热度 0人点赞 kamisamak 阅读全文
123
RevolverMaps

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang