kafka+sparkstreaming开发问题

老师您好,新手想问下kafka缓存爬虫爬过来的json格式数据,spark streaming 进行消费后数据存放到hive
大概需要写哪几个步骤的代码呢?
是否是需要依次写以下几步:
1.kafka producer 如何生产数据
2.kafka consumer 如何消费数据进入spark streaming
3.spark streaming 如何流式计算,把结果存放到hive

要回复问题请先登录注册