TeRiTeRi

Hadoop
Hadoop

Hive中group by 提示Expression Not In Group By Key的解决办法

现象 hive中group by的时候 select stu.s_name,sum(sc.s_score) from score sc left join student stu on stu.s_id = sc.s_id group by sc.s_id; 会提示: Error: Error while compiling statement: FAILED: SemanticException [Error 10025]: Line 1:7 Expression not in GROUP BY key 's_n…

2019年11月22日 0条评论 2659点热度 0人点赞 kamisamak 阅读全文
Hadoop

Hadoop Hive 字段类型

2019年11月22日 0条评论 1824点热度 1人点赞 kamisamak 阅读全文
Hadoop

Hadoop HIVE 数据库表操作

创建数据库表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name …

2019年11月21日 0条评论 1855点热度 1人点赞 kamisamak 阅读全文
Hadoop

Hadoop mapreduce自定义inputFormat输入

在MR程序的开发过程中,经常会遇到输入数据不是HDFS或者数据输出目的地不是HDFS的,MapReduce的设计已经考虑到这种情况,它为我们提供了两个组建,只需要我们自定义适合的InputFormat和OutputFormat,就可以完成这个需求。  

2019年11月19日 1条评论 1782点热度 0人点赞 kamisamak 阅读全文
Hadoop

Hadoop mapreduce自定义outputFormat输出

在MR程序的开发过程中,经常会遇到输入数据不是HDFS或者数据输出目的地不是HDFS的,MapReduce的设计已经考虑到这种情况,它为我们提供了两个组建,只需要我们自定义适合的InputFormat和OutputFormat,就可以完成这个需求。 需求:根据数据的不同输出两类结果到不同目录    

2019年11月19日 0条评论 2030点热度 2人点赞 kamisamak 阅读全文
Hadoop

MapReduce开启压缩算法对结果进行压缩

 

2019年11月18日 0条评论 1636点热度 2人点赞 kamisamak 阅读全文
Hadoop

Hadoop MapReduce 部分代码操作

map中获取文件名 //获取数据所属文件名 FileSplit fis = (FileSplit) context.getInputSplit(); String fileName = fis.getPath().getName(); context.write(new Text(fileName), value); 压缩文件snappy  Driver中Configuration按以下设置 //设置map使用的压缩算法 conf.set("mapreduce.map.output.compress","true"…

2019年11月18日 0条评论 1651点热度 1人点赞 kamisamak 阅读全文
Hadoop

HDFS的JAVA的部分API操作代码

前置需求    

2019年11月13日 0条评论 1842点热度 1人点赞 kamisamak 阅读全文
Hadoop

hadoop集群中 退役旧数据节点

环境说明 192.168.100.101 node01 192.168.100.102 node02 192.168.100.103 node03 192.168.100.104 node04 四台Vmware Workstatuin中搭建的centos6.9主机,hadoop版本为2.6.0 ①创建etc/hadoop/dfs.hosts.exclude配置文件,并添加需要退役的节点 [root@node01 hadoop]# cat dfs.hosts.exclude node04 ②修改hdfs-site.x…

2019年11月11日 0条评论 1768点热度 2人点赞 kamisamak 阅读全文
Hadoop

SecondarynameNode如何辅助管理FSImage与Edits文件

SecondarynameNode工作原理 由于editlog记录了集群运行期间所有对HDFS的相关操作 所以这个文件会很大。 集群关闭后再次启动时会将Fsimage,editlog加载到内存中, 进行合并,恢复到集群的。 由于editlog文件很大,集群再次启动时会花费较长时间。 为了加快集群的启动时间,所以使用secondarynameNode辅助NameNode合并Fsimage,editlog。 1、 secnonaryNN通知NameNode切换editlog 2、secondaryNN从NameNode…

2019年11月7日 0条评论 3538点热度 5人点赞 kamisamak 阅读全文
1234
Clustrmaps
ForeverBlog 萌ICP备案 萌ICP备
最近评论
whoiscall 发布于 2 年前(09月06日) Thanks.
鸟叔 发布于 3 年前(04月24日) 鸟叔来串门,通过虫洞穿梭至此,期待回访!
鸟叔 发布于 3 年前(04月20日) 鸟叔来串门,通过虫洞穿梭至此,期待回访!
yzb666 发布于 4 年前(11月21日) 来个友情链接呗,地址dfblog.freela.ml
无心木 发布于 4 年前(11月10日) 大佬是做啥的呀! :jingku: 这网站好炫酷的样子!

COPYRIGHT © 2020 TeRiTeRi. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

萌ICP备20253336号