TeRiTeRi

本站域名已于2020.06.12 23:00将域名从https://www.kamisamak.com/更换为二级域名https://www.blog.kamisamak.com/

2020年6月12日 0条评论 1621点热度 0人点赞 kamisamak 阅读全文

2020年6月12日 0条评论 1441点热度 0人点赞 kamisamak 阅读全文

[hide reply_to_this="true"] [/hide]

2020年6月10日 0条评论 1945点热度 2人点赞 kamisamak 阅读全文

[hide reply_to_this="true"] [collapse title="!~!"] Sqoop学习之路（一） [/collapse] [collapse title="Sqoop快速入门"] [/collapse] [collapse title="常用命令列举"] [/collapse] [/hide] 官方参考资料:http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html

2020年6月10日 0条评论 1960点热度 0人点赞 kamisamak 阅读全文

import scala.collection.JavaConverters._ val javaList: java.util.List[Int] = Seq(1,2,3).asJava val scalaBuffer: scala.collection.mutable.Buffer[Int] = list.asScala

2020年6月10日 0条评论 1212点热度 0人点赞 kamisamak 阅读全文

import scala.collection.JavaConverters._ val javaList: java.util.List[Int] = Seq(1,2,3).asJava val scalaBuffer: scala.collection.mutable.Buffer[Int] = list.asScala

2020年6月10日 0条评论 1252点热度 0人点赞 kamisamak 阅读全文

Hive-Testbench:https://github.com/hortonworks/hive-testbench/ Tpcds-Kit:https://github.com/gregrahn/tpcds-kit 官网:http://www.tpc.org/ 针对数据库不同的使用场景TPC组织提供了多种数据集，主要的TPC数据集有如下几种 TPC-C：模拟一个库存-订单系统以及其上的多用户并发事务； TPC-DI：模拟多种类型的大数据源的ETL过程； TPC-DS：模拟大型零售业务的系统，该系统主要用于BI和…

2020年6月8日 0条评论 1846点热度 1人点赞 kamisamak 阅读全文

org.apache.spark.sql.functions是一个Object，提供了约两百多个函数。大部分函数与Hive的差不多。除UDF函数，均可在spark-sql中直接使用。经过import org.apache.spark.sql.functions._ ，也可以用于Dataframe，Dataset。大部分支持Column的函数也支持String类型的列名。这些函数的返回类型基本都是Column。

2020年6月8日 0条评论 1557点热度 0人点赞 kamisamak 阅读全文

py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext. : java.lang.IllegalArgumentException: Required executor memory (1024), overhead (384 MB), and PySpark memory (0 MB) is above the max threshold (1024 M…

2020年6月5日 0条评论 1426点热度 1人点赞 kamisamak 阅读全文

https://docs.cloudera.com/documentation/enterprise/latest/topics/spark_python.html python环境为3.7.2，通过Anaconda-5.3.1-el7.parcel部署安装在CM配置Spark的Python环境,并重启相关服务 if [ -z "${PYSPARK_PYTHON}" ]; then export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda-5.3.1/…

2020年6月5日 0条评论 1624点热度 0人点赞 kamisamak 阅读全文

1…7 8910 11…23

本站域名已更换

为wordpress更换域名

MySQL事务入门解析

Sqoop常用命令及参数

Java与Scala集合相互转换

Java与Scala集合相互转换

通过TPC-H生成测试数据集并导入HIVE

org.apache.spark.sql.functions汇总

Spark关于内存大小过低报错解决

CDH集群部署PySpark