文件占用空间异常

hadoop fs -du -h /user/hive/warehouse/base_log/
1.6 G    4.9 G    /user/hive/warehouse/base_log/log_date=2017-03-01
 
我的集群副本数量是2  其他表也是正常的  唯独这个表 占用空间等于实际大小*3 而不是*2呢
 
这个表的文件是通过LOAD DATA INPATH进去的

fish - Hadooper

赞同来自:

执行load data操作的客户机上,hdfs-site.xml的配置中dfs.replication这个配置项是不是配置为3了?   如果希望客户端的配置不覆盖服务器端,可以将不希望被覆盖的服务器端配置的final属性设置为true,类似这样:  
    <property>
      <name>dfs.replication</name>
      <value>2</value>
      <final>true</final>
    </property>

要回复问题请先登录注册