一个datanode硬盘占用量总是过高,这怎么造成的

我CDH中有一个节点,我们一般用做对外节点,很多人在这上面操作.相当于一个接口节点了.
结果最近发现,它的硬盘占用率超过50%,其他节点都只有10%.
不知道为什么?
 
另外,HDFS有什么重新数据分布的指令.

derek_xiao

赞同来自: fish

HDFS的副本放置策略是首先在客户端的节点上放一个副本,然后在不同的机架上选一个节点放另外一个副本,第三个副本选择跟第二个副本同机架不同节点上放置。你拿其中个datanode作为节点,那所有使用这个接口节点上传文件的都会在这个节点存储一个副本。很有可能是这个原因引起的。

fish - Hadooper

赞同来自:

可以使用hdfs diskbalancer 启动重分布。

要回复问题请先登录注册