TeRiTeRi

大数据
Kafka

Kafka Receiver错误 java.lang.IllegalArgumentException: requirement failed: No output operations registered, so nothing to execute

20/04/15 21:46:25 WARN KafkaUtils: overriding receive.buffer.bytes to 65536 see KAFKA-3135 org.apache.spark.streaming.kafka010.DirectKafkaInputDStream@108531c2 20/04/15 21:46:25 ERROR StreamingContext: Error starting the context, marking it as stopped java.lan…

2020年4月15日 0条评论 960点热度 0人点赞 kamisamak 阅读全文
ETL

kettle 连接Hive时报错Illegal Hadoop Version: Unknown

Error connecting to database: (using class org.apache.hive.jdbc.HiveDriver) Illegal Hadoop Version: Unknown (expected A.B.* format) 将自己hadoop对应版本的hadoop-common.jar(我的是hadoop-common-2.6.0-cdh5.14.0.jar)放到根目录的 lib目录下然后重启Kettle即可

2020年4月15日 0条评论 1849点热度 0人点赞 kamisamak 阅读全文
Java

Spark基础练习题分享 ①

2020年4月15日 0条评论 1516点热度 0人点赞 kamisamak 阅读全文
Hadoop

解决对HDFS文件系统操作权限不够的问题

HDFS文件系统的目录基本都属于supergroup用户组,所以就把用户添加到该用户组,即可解决很多权限问题,例如连接Hive却无法操作的创建库、表的问题等 1、在Linux执行如下命令增加supergroup groupadd supergroup 2、将用户增加到supergroup中 usermod -a -G supergroup root 3、同步系统的权限信息到HDFS文件系统 sudo -u hdfs hdfs dfsadmin -refreshUserToGroupsMappings 4、查看属于s…

2020年4月15日 0条评论 1841点热度 0人点赞 kamisamak 阅读全文
Scala

SparkSQL入门详解

//--------------------------------------------------------------------------------------------------------------------- //--------------------------------------------------------------------------------------------------------------------- [collapse title="开窗函…

2020年4月11日 0条评论 1945点热度 0人点赞 kamisamak 阅读全文
Scala

Spark 入门详解 β

2020年4月11日 0条评论 1703点热度 0人点赞 kamisamak 阅读全文
Hive

Hive入门详解

2020年4月10日 0条评论 2017点热度 0人点赞 kamisamak 阅读全文
Spark

Spark 入门详解 α

2020年4月10日 1条评论 2041点热度 0人点赞 kamisamak 阅读全文
Kafka

Kafka安装部署与代码

Kafka安装部署 前置:jdk/zookeeper安装部署,并能正常启动。 #文件解压 tar zxvf kafka_2.11-1.0.0.tgz  -C ../servers/ vim /export/servers/kafka_2.11-1.0.0/conf/server.properties #(每个节点不能相同) Broker.id=0 log.dirs=/export/servers/kafka_2.11-1.0.0/logs/ zookeeper.connect=node01:2181,node02:…

2020年3月30日 0条评论 1780点热度 0人点赞 kamisamak 阅读全文
Kafka

Kafka笔记

企业中离线业务场景实时业务场景都需要使用到kafka Kafka具备数据的计算能力和存储能力,但是两个能力相对(MR/SPARK,HDFS)较弱. Kafka角色的角色与hbase比较像,层级关系比较多。   消息:应用之间传送的数据,或点与点之间,点与多点之间传递的数据,传递的信息。 消息队列:是一种应用间的通信方式以队列的形式传递。   消息队列的应用场景 应用解耦合:多应用间通过消息队列对同一消息进行处理 异步处理:多应用对消息队列中同一消息进行处理 限流削峰:用于秒杀或抢购活动中,避免流…

2020年3月30日 0条评论 1716点热度 0人点赞 kamisamak 阅读全文
1…45678…10
RevolverMaps

COPYRIGHT © 2023 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang