hive的load数据分布及如何提交分布事务相关问题

各位老师好,
    最近在使用hive的时候想到几个问题网上搜了半天,没找到想要的答案:
 
1、本地load数据到hive上 数据是如何在各个节点上分布的,实现原理是什么?
2、什么情况下mapper阶段会出现数据倾斜?
3、本地数据文件导入hdfs上的时候数据是如何实现在节点上分布存在的,是namenode决定数据分布在哪个节点上的吗,是根据数据偏移值进行哈希计算决定的吗?
4、分布式事务怎么提交?及如何确保分布事事务ACID

要回复问题请先登录注册