Linux awk常用命令有哪些核心技巧？-菜鸟科技网

Linux awk 是一种强大的文本处理工具，它允许用户对文本文件进行复杂的模式扫描和处理操作，awk 以其灵活性和强大的功能而闻名，特别适合处理结构化数据或日志文件，awk 的基本语法为 awk 'pattern {action}' file，pattern 是匹配模式，action 是执行的操作，file 是要处理的文件，如果没有指定文件，awk 会从标准输入读取数据。

（图片来源网络，侵删）

awk 的核心优势在于其字段处理能力，默认情况下，awk 将每行文本按空白字符（空格、制表符等）分割成字段，并用 $1、$2 等变量表示第一个、第二个字段，$0 表示整行。awk '{print $1, $3}' file 会打印文件中每行的第一个和第三个字段，awk 还支持自定义字段分隔符，通过 -F 选项指定，如 awk -F: '{print $1, $7}' /etc/passwd,其中字段分隔符为冒号。

awk 提供了丰富的内置变量，用于存储和处理数据。NF 表示当前行的字段数，NR 表示当前行的行号，FNR 表示当前文件的行号（处理多个文件时有用），RS 是记录分隔符（默认为换行符），OFS 是输出字段分隔符（默认为空格），这些变量使得 awk 能够更灵活地处理文本数据。awk 'NF > 3 {print NR, $0}' file 会打印字段数超过 3 的行及其行号。

awk 的模式匹配功能非常强大，支持正则表达式和关系运算符。awk '/error/ {print $0}' log.txt 会打印包含 "error" 的行，而 awk '$1 > 100 {print $1, $2}' data.txt 会打印第一个字段大于 100 的行的第一和第二个字段，awk 还支持复合模式，如 awk '$1 > 50 && $2 < 200 {print}' file,表示同时满足两个条件的行才会被处理。

awk 的 action 部分可以包含多个语句，用分号分隔或换行表示。awk '{sum += $1; count++} END {print "Average:", sum/count}' file 会计算第一个字段的平均值，这里的 BEGIN 和 END 是特殊的模式，BEGIN 在处理任何行之前执行，通常用于初始化变量，END 在处理完所有行之后执行，通常用于输出最终结果。awk 'BEGIN {print "Processing..."} {print $1} END {print "Done"}' file。

（图片来源网络，侵删）

awk 还支持条件语句和循环语句，使其能够处理更复杂的逻辑。awk '{if ($1 > 100) print "High:", $1; else print "Low:", $1}' file 会根据第一个字段的大小输出不同的信息，循环语句如 for 和 while 也可以在 awk 中使用，awk '{for (i=1; i<=NF; i++) print $i}' file 会打印每行的所有字段。

awk 的数组功能也非常强大，支持关联数组，即可以用字符串作为索引。awk '{count[$1]++} END {for (key in count) print key, count[key]}' file 会统计第一个字段出现的次数，awk 还支持删除数组元素，如 delete array[key]，以及检查数组是否存在某个键，如 key in array。

awk 的输出重定向功能允许用户将结果写入文件，awk '{print $1 > output.txt}' file，或者使用 >> 追加到文件，awk 还支持管道功能，awk '{print $1 | "sort"}' file，将第一个字段传递给 sort 命令进行排序。

以下是一些常用的 awk 命令示例及其功能说明：

（图片来源网络，侵删）

命令示例	功能描述
`awk '{print}' file`	打印文件的每一行（等同于 cat 命令）
`awk '{print $1, $3}' file`	打印每行的第一个和第三个字段
`awk -F: '{print $1, $7}' /etc/passwd`	以冒号为分隔符，打印 /etc/passwd 文件的第一和第七个字段
`awk 'NR >= 10 && NR <= 20 {print}' file`	打印第 10 到第 20 行的内容
`awk '/^root/ {print}' /etc/passwd`	打印以 "root" 开头的行
`awk '{sum += $1} END {print sum}' file`	计算并打印第一个字段的总和
`awk '{if (NF > 2) print "Multi-line:", $0}' file`	如果字段数大于 2，打印 "Multi-line:" 和整行
`awk 'BEGIN {OFS=","} {print $1, $2}' file`	将输出字段分隔符设置为逗号，并打印第一和第二个字段
`awk '{count[$2]++} END {for (key in count) print key, count[key]}' file`	统计第二个字段出现的次数并输出

awk 还可以与其他命令结合使用，例如通过管道将其他命令的输出传递给 awk。ls -l | awk '{print $9, $5}' 会列出文件的名称和大小，awk 的 -v 选项允许用户在命令行中传递变量给 awk，awk -v var=100 '$1 > var {print}' file，var 的值为 100。

awk 的性能通常比其他文本处理工具（如 sed）更高，特别是在处理大文件时，这是因为 awk 在读取文件时逐行处理，内存占用相对较低，awk 的脚本可以保存到文件中，通过 -f 选项调用，awk -f script.awk file，这样可以重复使用复杂的 awk 脚本。

需要注意的是，awk 的不同实现（如 gawk、mawk）可能存在一些功能上的差异，但基本的语法和功能是兼容的，在使用 awk 时，建议查看所使用版本的文档,以确保所有功能都能正常工作。

相关问答FAQs：

问：awk 和 sed 有什么区别？
答：awk 和 sed 都是 Linux 中的文本处理工具，但它们的侧重点不同，sed 主要用于流编辑，适合对文本进行替换、删除、插入等操作，而 awk 更适合对文本进行格式化、统计和复杂的数据处理，sed 以行为单位处理文本，而 awk 以字段为单位处理文本，awk 在处理结构化数据时更强大。
问：如何使用 awk 处理多个文件？
答：awk 可以同时处理多个文件，awk '{print FILENAME, NR, $0}' file1.txt file2.txt，FILENAME 表示当前处理的文件名，NR 表示当前的总行号，如果需要区分不同文件的行号，可以使用 FNR 变量，awk '{print FILENAME, FNR, $0}' file1.txt file2.txt，FNR 表示当前文件的行号。

Linux awk常用命令有哪些核心技巧？

tjadmin

网站动画制作的关键技巧有哪些？

招聘HP是招什么岗位？

yoozoo招聘有何新动态或岗位需求？

做客服如何快速赢得客户好感？

架构招聘，如何精准识才？

ipad如何创建网页连接不上，iPad创建网页为何连接不上？

CAD字母命令有哪些？

Google x招聘，具体是啥岗位？

原画外包招聘，原画外包招聘，靠谱渠道怎么找？

如何自己优化网站，自己如何优化网站？关键步骤有哪些？

乐山商城搭建，乐山商城如何高效搭建？

sketch搭建，Sketch如何快速搭建原型？

微信怎么打开微网站？

专业商城网站搭建费用，专业商城网站搭建费用多少？

锤子阅读招聘，具体岗位和要求是什么？

建站后地址解析如何正确配置？

Linux awk常用命令有哪些核心技巧？

相关推荐

ipad如何创建网页连接不上，iPad创建网页为何连接不上？