日志格式:日志产生时间,appid,........flume采集日志落地到hdfs会有延迟,如何保证数据临界点的数据落地到对应分区?比如:2017-04-12 23:59:59 appid ,发送到hdfs时已经是 2017-04-13 00:00:01 ,本来数据是20170412的数据但是落地到了20170413,这种问题通过flume如何解决? 谢谢老师了

你好,请问你这个问题是如何解决的呢

fish - Hadooper

赞同来自: liuzhixin137

在数据源中后去时间,将信息放到flume的header中。

要回复问题请先登录注册