cenyuhai

cenyuhai

大数据工程师@滴滴快车

威望 : 21 积分 : 1930 赞同 : 28 感谢 : 1

擅长话题

更多 »回复

0

1、配置文件最好都同步,避免不必要的问题 2、这是hbase的毛问题了,一次启动没成功,后面再次启动的时候留有上一次的痕迹,导致启动不成功,这个问题从老版本的hbase就一直就有了,官方也一直没解决,只能靠自己了

0

分区字段确实不能和已有字段名字相重合,你这种情况都是只能分两步走,首先导入到一张只是按年分区的表里面,然后再用动态分区的动能写入到分区是城市+年的表当中

0

不停的ls某个文件,发现了就处理,处理完删除,写个死循环吧

1

var rdd = sc.textFile("/root/software/b.TXT").flatMap(_.split('\n')).filter{ line=>  var splits = line.split('\t') if...

0

zookeeper是用来做分布式协调的,千万别把它用来存比较大的数据,会造成同步的延迟!

更多 »发问

没有内容

发问

回复

文章

最新动态

详细资料

个人成就:

威望: 21 积分: 1930 赞同: 28 感谢: 1

最后活跃:
2016-03-11 00:12
擅长话题:
Spark 10   0
Java 2   0
Kafka 1   0
Git 2   0
SparkSQL 2   1
Hadoop 2   0
更多 » 关注 1

admin

更多 » 16066 人关注

Patrick_SZ 一个菜鸟 爱Fay _小小_程序员 jz20171231

关注 6 话题
主页访问量 : 4953 次访问