Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架,程序猿在对它的日常运维有涉及到集群数据的删除 hadoop rm(hdfs dfs -rm) 操作。

1、直接删除
hdfs dfs -rm /path/to/file/you/want/to/remove/permanently
删除的目录会放入/user/hdfs/.Trash
中。如果加上-skipTrash 参数则不放入回收站。如下:
hdfs dfs -rm -skipTrash /path/to/file/you/want/to/remove/permanently
2、清空回收站
hdfs dfs -expunge # 输出 This should give you output similar to this. Basically in a minute the trash will be emptied.
执行完命令后,回收站的数据不会立即被清理,而是先打了一个checkpoint。显示的是一分钟后清除。