你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
大数据工程师@滴滴快车
1、配置文件最好都同步,避免不必要的问题 2、这是hbase的毛问题了,一次启动没成功,后面再次启动的时候留有上一次的痕迹,导致启动不成功,这个问题从老版本的hbase就一直就有了,官方也一直没解决,只能靠自己了
分区字段确实不能和已有字段名字相重合,你这种情况都是只能分两步走,首先导入到一张只是按年分区的表里面,然后再用动态分区的动能写入到分区是城市+年的表当中
不停的ls某个文件,发现了就处理,处理完删除,写个死循环吧
var rdd = sc.textFile("/root/software/b.TXT").flatMap(_.split('\n')).filter{ line=> var splits = line.split('\t') if...
zookeeper是用来做分布式协调的,千万别把它用来存比较大的数据,会造成同步的延迟!
没有内容
2016-03-04 cenyuhai 回答了问题, hbase-regionserver启动失败报错Region server exiting
2016-03-02 cenyuhai 回答了问题, hive可以完成自动partition吗
2016-02-29 cenyuhai 回答了问题, 如何自动识别一个新的文件并启动一个脚本来处理它
2016-01-23 cenyuhai 回答了问题, scala filter如何访问行数据中的每一列
2016-01-22 cenyuhai 回答了问题, zookeeper znode上的存储量
威望: 21 积分: 1930 赞同: 28 感谢: 1