TeRiTeRi

本文为CSDN博主「初心江湖路」的原创文章，原文链接：https://blog.csdn.net/weixin_43878293/article/details/90020221

2020年4月27日 0条评论 1961点热度 0人点赞 kamisamak 阅读全文

2020年4月27日 0条评论 1882点热度 0人点赞 kamisamak 阅读全文

官网：http://spark.apache.org/docs/latest/sql-data-sources-hive-tables.html

2020年4月26日 0条评论 1016点热度 0人点赞 kamisamak 阅读全文

因为使用了笛卡尔积，但是在Spark2.x中是笛卡尔积操作是默认关闭，如果需要开启，则添加如下配置 val sparkSession = SparkSession.builder().master("local[*]").appName("wula") .config("spark.sql.crossJoin.enabled","true").getOrCreate()

2020年4月24日 0条评论 1512点热度 0人点赞 kamisamak 阅读全文

新增功能此版本的 VMware vSphere 7.0 包括 VMware ESXi 7.0 和 VMware vCenter Server 7.0。请阅读《vSphere 7.0 的新增功能》，了解有关此版本中的新功能和增强功能的信息。国际化 vSphere 7.0 提供以下语言的版本：英语法语德语西班牙语日语韩语简体中文繁体中文 vSphere 7.0 的组件（包括 vCenter Server、ESXi、vSphere Client 和 vSphere Host Client）不接受非 A…

2020年4月24日 0条评论 2190点热度 0人点赞 kamisamak 阅读全文

complete，把所有的DataFrame的内容输出，这种模式只能在做agg聚合操作的时候使用，比如ds.group.count，之后可以使用它 append，普通的dataframe在做完map或者filter之后可以使用。这种模式会把新的batch的数据输出出来， update，把此次新增的数据输出，并更新整个dataframe。有点类似之前的streaming的state处理。

2020年4月23日 0条评论 1563点热度 0人点赞 kamisamak 阅读全文

2020年4月23日 0条评论 2064点热度 0人点赞 kamisamak 阅读全文

常见端口汇总： Hadoop： 50070：HDFS WEB UI端口 9870：3.x HDFS WEB UI端口 8020 ：高可用的HDFS RPC端口 9000 ：非高可用的HDFS RPC端口 8088 ： Yarn 的WEB UI 接口 8485 ： JournalNode 的RPC端口 8019 ： ZKFC端口 Zookeeper: 2181 ：客户端连接zookeeper的端口 2888 ： zookeeper集群内通讯…

2020年4月23日 0条评论 2045点热度 1人点赞 kamisamak 阅读全文

2020年4月23日 0条评论 1524点热度 0人点赞 kamisamak 阅读全文

什么是Spark 基于内存的，用于大规模数据处理（离线计算、实时计算、快速查询（交互式查询））的统一分析引擎。 Spark特点快： Spark计算速度是MapReduce计算速度的10-100倍易用：（算法多） MR支持1种计算模型，Spsark支持更多的计算模型。通用： Spark 能够进行离线计算、交互式查询（快速查询）、实时计算、机器学习、图计算等兼容性： Spark支持大数据中的Yarn调度，支持mesos。可以处理hadoop计算的数据。 Spark运行模式 1.local本地模式(单机)--开发…

2020年4月20日 0条评论 1018点热度 1人点赞 kamisamak 阅读全文

1…12 131415 16…23

SparkContext详解

Kettle入门简单解析

Spark-On-Hive

记录一次Spark - org.apache.spark.sql.AnalysisException异常 2020.04.16

VMware vSphere 7.0 发行说明文档

Spark Structured Streaming： output Mode 输出模式（append，update，complete）

Spark连接Hbase&mysql

大数据常见端口汇总-hadoop、hbase、hive、spark、kafka、zookeeper等

Spark 各项代码示例

Spark 知识点总结