TeRiTeRi

博客

本站域名已更换

本站域名已于2020.06.12 23:00将域名从https://www.kamisamak.com/更换为二级域名https://www.blog.kamisamak.com/

2020年6月12日 0条评论 1586点热度 0人点赞 kamisamak 阅读全文
博客

为wordpress更换域名

2020年6月12日 0条评论 1401点热度 0人点赞 kamisamak 阅读全文
mysql

MySQL事务入门解析

[hide reply_to_this="true"] [/hide]

2020年6月10日 0条评论 1899点热度 2人点赞 kamisamak 阅读全文
Sqoop

Sqoop常用命令及参数

[hide reply_to_this="true"] [collapse title="!~!"] Sqoop学习之路 (一) [/collapse] [collapse title="Sqoop快速入门"] [/collapse] [collapse title="常用命令列举"] [/collapse] [/hide] 官方参考资料:http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html

2020年6月10日 0条评论 1926点热度 0人点赞 kamisamak 阅读全文
Java

Java与Scala集合相互转换

import scala.collection.JavaConverters._ val javaList: java.util.List[Int] = Seq(1,2,3).asJava val scalaBuffer: scala.collection.mutable.Buffer[Int] = list.asScala

2020年6月10日 0条评论 1161点热度 0人点赞 kamisamak 阅读全文
Java

Java与Scala集合相互转换

import scala.collection.JavaConverters._ val javaList: java.util.List[Int] = Seq(1,2,3).asJava val scalaBuffer: scala.collection.mutable.Buffer[Int] = list.asScala

2020年6月10日 0条评论 1205点热度 0人点赞 kamisamak 阅读全文
Hive

通过TPC-H生成测试数据集并导入HIVE

Hive-Testbench:https://github.com/hortonworks/hive-testbench/ Tpcds-Kit:https://github.com/gregrahn/tpcds-kit 官网:http://www.tpc.org/ 针对数据库不同的使用场景TPC组织提供了多种数据集,主要的TPC数据集有如下几种 TPC-C:模拟一个库存-订单系统以及其上的多用户并发事务; TPC-DI:模拟多种类型的大数据源的ETL过程; TPC-DS:模拟大型零售业务的系统,该系统主要用于BI和…

2020年6月8日 0条评论 1780点热度 1人点赞 kamisamak 阅读全文
Spark

org.apache.spark.sql.functions汇总

org.apache.spark.sql.functions是一个Object,提供了约两百多个函数。 大部分函数与Hive的差不多。 除UDF函数,均可在spark-sql中直接使用。 经过import org.apache.spark.sql.functions._ ,也可以用于Dataframe,Dataset。 大部分支持Column的函数也支持String类型的列名。这些函数的返回类型基本都是Column。

2020年6月8日 0条评论 1508点热度 0人点赞 kamisamak 阅读全文
Spark

Spark关于内存大小过低报错解决

py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext. : java.lang.IllegalArgumentException: Required executor memory (1024), overhead (384 MB), and PySpark memory (0 MB) is above the max threshold (1024 M…

2020年6月5日 0条评论 1385点热度 1人点赞 kamisamak 阅读全文
Python

CDH集群部署PySpark

https://docs.cloudera.com/documentation/enterprise/latest/topics/spark_python.html python环境为3.7.2,通过Anaconda-5.3.1-el7.parcel部署安装   在CM配置Spark的Python环境,并重启相关服务 if [ -z "${PYSPARK_PYTHON}" ]; then export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda-5.3.1/…

2020年6月5日 0条评论 1575点热度 0人点赞 kamisamak 阅读全文
1…7891011…23
RevolverMaps

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang