spark 使用何种语言比较好?scala, java or others?

个人特别喜欢使用python,平常学习和工作用的较多。java大学期间也学过,只是多年不用,有些生疏。
目前spark,hadoop 这些大数据平台都是用scala, java开发的。但是也支持python ,比如pyspark。
请问一下,如果我希望深度研究一下spark,是否需要重新捡起来java,学习scala?还是说用python也够用?
 
 

fish - Hadooper

赞同来自: 那小子真帅

性能差别不大,如果只是使用,用Python就可以。 如果要研究原理,用Scala。

那小子真帅

赞同来自:

补充一下。 自己比较关注sql和数据挖掘方面知识。据我所知pyspark 也可以用。不知道pyspark和原生的spark的一些工具是否有些不足。比如性能,速度或者功能缺失之类。

要回复问题请先登录注册