hadoop rm 程序猿删集群跑路 忘记怎么操作

Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架,程序猿在对它的日常运维有涉及到集群数据的删除 hadoop rm(hdfs dfs -rm) 操作。

hadoop 小象

1、直接删除

hdfs dfs -rm /path/to/file/you/want/to/remove/permanently

删除的目录会放入/user/hdfs/.Trash中。如果加上-skipTrash 参数则不放入回收站。如下:

hdfs dfs -rm -skipTrash /path/to/file/you/want/to/remove/permanently

2、清空回收站

hdfs dfs -expunge
# 输出 This should give you output similar to this. Basically in a minute the trash will be emptied.

执行完命令后,回收站的数据不会立即被清理,而是先打了一个checkpoint。显示的是一分钟后清除。

发表回复