Hadoop fs命令大全，常用操作有哪些？-菜鸟科技网

Hadoop fs命令是Hadoop分布式文件系统（HDFS）中最常用的命令行工具之一，用于与HDFS进行交互，如文件上传、下载、目录操作、权限管理、文件查看等，这些命令类似于Linux的文件系统命令，但针对分布式环境进行了优化，以下将详细介绍Hadoop fs命令的常用操作及具体用法，涵盖基本文件操作、高级功能及实用技巧。

（图片来源网络，侵删）

基本文件和目录操作

查看目录内容
使用ls命令可以列出指定目录下的文件和子目录。
```
hadoop fs -ls /user  # 查看/user目录下的内容
hadoop fs -ls -R /user  # 递归查看/user及其子目录内容
```
-R选项表示递归显示，-h选项以人类可读格式显示文件大小（如KB、MB）。

创建目录
mkdir命令用于创建目录，支持多级目录创建：

hadoop fs -mkdir /data  # 创建单级目录
hadoop fs -mkdir -p /data/input  # 创建多级目录（-p自动创建父目录）

上传文件到HDFS
put或copyFromLocal命令可将本地文件上传至HDFS：
（图片来源网络，侵删）
```
hadoop fs -put localfile.txt /data/  # 上传文件并重命名
hadoop fs -copyFromLocal localfile.txt /data/  # 功能与put类似
```
若需覆盖已存在文件,可使用-f选项。

从HDFS下载文件
get或copyToLocal命令可将HDFS文件下载到本地：

hadoop fs -get /data/file.txt ./  # 下载到当前目录
hadoop fs -copyToLocal /data/file.txt ./  # 功能与get类似

移动或重命名文件
mv命令用于移动文件或重命名：

hadoop fs -mv /data/file1.txt /data/backup/  # 移动文件
hadoop fs -mv /data/file1.txt /data/file2.txt  # 重命名文件

复制文件
cp命令用于复制文件或目录：

hadoop fs -cp /data/file1.txt /data/backup/  # 复制文件
hadoop fs -cp -r /data/input /data/output  # 复制整个目录（-r表示递归）

删除文件或目录
rm命令用于删除文件或目录：
```
hadoop fs -rm /data/file.txt  # 删除文件
hadoop fs -rm -r /data/input  # 递归删除目录
```
删除后可通过-skipTrash选项跳过回收站直接删除。

查看文件内容
cat、head、tail命令用于查看文件内容：

hadoop fs -cat /data/file.txt  # 查看整个文件
hadoop fs -head -n 100 /data/file.txt  # 查看文件前100行
hadoop fs -tail -f /data/log.txt  # 实时查看文件末尾内容（类似Linux的tail -f）

高级操作与实用功能

文件权限管理
HDFS支持Linux风格的权限控制，使用chmod和chown命令：

hadoop fs -chmod 755 /data  # 修改权限（rwxr-xr-x）
hadoop fs -chown user:group /data  # 修改所有者和所属组

文件块管理
查看文件块信息：

hadoop fs -du /data  # 显示目录下文件大小及总计
hadoop fs -du -h /data  # 以人类可读格式显示大小
hadoop fs -count /data  # 统计文件数量、目录数量和总大小

通过-setrep命令可以设置文件副本数：

hadoop fs -setrep 3 /data/file.txt  # 设置副本数为3

文件归档与压缩
使用archive命令将小文件归档为HAR（Hadoop Archive）文件，减少NameNode内存占用：
```
hadoop fs -archiveName input.har.har -p /data/small_files /data/input.har
```
检查文件完整性
通过checksum命令计算文件的校验和：
```
hadoop fs -checksum /data/file.txt
```
分布式合并文件
使用getmerge命令将多个文件合并为本地单个文件：
```
hadoop fs -getmerge /data/part-* ./merged_file.txt
```

常用命令速查表

命令	功能描述	示例
`ls`	列出目录内容	`hadoop fs -ls /user`
`mkdir`	创建目录	`hadoop fs -mkdir -p /data/input`
`put/copyFromLocal`	上传本地文件到HDFS	`hadoop fs -put local.txt /data/`
`get/copyToLocal`	从HDFS下载文件到本地	`hadoop fs -get /data/file.txt ./`
`mv`	移动或重命名文件	`hadoop fs -mv /data/f1.txt /f2.txt`
`cp`	复制文件或目录	`hadoop fs -cp -r /src /dst`
`rm`	删除文件或目录	`hadoop fs -rm -r /data/input`
`cat`	查看文件内容	`hadoop fs -cat /data/file.txt`
`head/tail`	查看文件开头/末尾内容	`hadoop fs -head -n 10 /data/file.txt`
`du`	显示文件大小	`hadoop fs -du -h /data`
`count`	统计文件数量、目录数和总大小	`hadoop fs -count /data`
`chmod`	修改文件权限	`hadoop fs -chmod 644 /data/file.txt`
`chown`	修改文件所有者/所属组	`hadoop fs -chown user:group /data`
`setrep`	设置文件副本数	`hadoop fs -setrep 3 /data/file.txt`
`getmerge`	合并HDFS文件到本地	`hadoop fs -getmerge /part-* ./merged`

实用技巧

使用通配符：部分命令支持通配符操作，如批量删除文件：
```
hadoop fs -rm /data/*.txt  # 删除/data目录下所有.txt文件
```
结合管道操作：将命令通过管道连接，例如结合grep过滤文件内容：
```
hadoop fs -cat /data/log.txt | grep "ERROR"
```
查看命令帮助：通过-help选项查看命令详细用法：
```
hadoop fs -help put
```

Hadoop fs命令大全，常用操作有哪些？

基本文件和目录操作

高级操作与实用功能

常用命令速查表

实用技巧

相关问答FAQs

tjadmin

ECShop自助建站系统如何快速上手？

CAD直线命令失效怎么办？

招聘为何要用DISC测评？

兼职Python招聘，要求与薪资如何？

Linux命令字典，如何快速查找命令用法？

织梦网站环境搭建

招聘评分卡如何科学制定？

58招聘怎么充值，58招聘怎么充值？

东莞网站搭建，东莞网站搭建，企业如何快速高效落地？

内容网站搭建，如何高效搭建内容网站？

库克为何在中国大举招聘？

辉县网站搭建，辉县网站搭建怎么选？报价多少？

apple watch如何用计算器，Apple Watch计算器怎么用？

如何设计网页中图片大小，网页图片大小如何设计更合理？

墙纸渲染招聘，墙纸渲染招聘，需要哪些技能与经验？

今日头条怎么招聘，今日头条招聘流程与条件是什么？

Hadoop fs命令大全，常用操作有哪些？

基本文件和目录操作

高级操作与实用功能

常用命令速查表

实用技巧

相关问答FAQs

相关推荐

织梦网站环境搭建